Tải bản đầy đủ (.doc) (49 trang)

Báo cáo NCKH: nghiên cứu về ứng dụng của các phần mềm trong giải các bài toán hồi quy tương quan

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.24 MB, 49 trang )

MỤC LỤC

MỞ ĐẦU.....................................................................................................................................3
1.Cơ sở lí luận về phân tích tương quan và hồi quy................................................................6
1.1.Khái niệm và mục tiêu phân tích tương quan và hồi quy.................................................6
1.2.Nội dung phân tích tương quan và hồi quy.......................................................................6
1.3.Mô hình phân tích.............................................................................................................7
1.4. Công cụ phân tích tương quan và hồi quy:....................................................................10
Có rất nhiều công cụ để phân tích hồi quy tương quan,nhóm tác giả đi sâu tìm hiểu,sử dụng
phương pháp bình phương tối thiểu để giải bài toán hồi quy tương quan............................10
1.5.Một ví dụ cụ thể về bài toán tương quan và hồi quy:......................................................10
2.Ứng dụng của phần mềm SPSS trong giải bài toán hồi quy và tương quan kinh tế..........11
2.1.Giới thiệu về phần mềm:.................................................................................................11
2.2. Ứng dụng của SPSS trong phân tích tương quan và hồi quy kinh tế.............................13
2.3. Phân tích kết quả:...........................................................................................................19
3.Ứng dụng Mfit 3 giải bài toán tương quan và hồi quy kinh tế...........................................21
3.1. Giới thiệu về mfit3.........................................................................................................21
3.2.Ứng dụng phần mềm Mfit3 trong phân tích tương quan và hồi quy kinh tế..................21
3.3. Phân tích kết quả............................................................................................................31
4.Ứng dụng phần mềm EViews giải bài toán tương quan và hồi quy kinh tế......................33
4.1.Giới thiệu về phần mềm EViews....................................................................................33
4.2.Ứng dụng phần mềm EViews giải bài toán tương quan và hồi quy kinh tế (ứng dụng
Eviews 8)...............................................................................................................................34
4.3.Phân tích kết quả:............................................................................................................38
5.ỨNG DỤNG PHẦN MỀM MICROSORT EXCEL GIẢI BÀI TOÁN TƯƠNG QUAN
VÀ HỒI QUY KINH TẾ......................................................................................................40
5.1.Giới thiệu phần mềm Microsoft Excel............................................................................40
5.2. Ứng dụng phần mềm Microsoft Excel trong phân tích tương quan và hồi quy kinh tế.41
5.3.Phân tích kết quả.............................................................................................................45
1



KẾT LUẬN...............................................................................................................................48
Tài liệu tham khảo:...................................................................................................................49

2


MỞ ĐẦU
Cùng với sự phát triển không ngừng của nền kinh tế, việc phân tích và dự báo,
thống kê kinh tế là vô cùng cần thiết. Tuy nhiên việc phân tích và dự báo vẫn gặp
nhiều khó khăn, phức tạp. Bởi vậy với sự ra đời của những phần mềm tin học hỗ trợ đã
phần nào giải quyết các khó khăn ấy. Đó chính là lý do nhóm tác giả thực hiện đề tài
nghiên cứu ứng dụng các phần mềm giải bài toán phân tích tương quan và hồi quy
trong kinh tế.
1. Tính cấp thiết của đề tài:

-

Sự phát triển như vũ bão của khoa học công nghệ thông tin với nhiều phần

mềm tiện ích ra đời giúp con người giảm đáng kể thời gian,giảm công thức cho các
phép tính toán và phân tích.Việc áp dụng những phần mềm hiện đại trở thành một nhu
cầu tất yếu trong thống kê nói chung và toán thống kê nói riêng.
- Hiện có rất nhiều phần mềm có thể được sử dụng trong phân tích tương quan và
hồi quy.Mỗi phần mềm có những nét đặc trưng riêng, cách sử dụng riêng, điều kiện áp
dụng riêng và ưu nhược điểm riêng.Vì vậy,nếu hệ thống hóa được các phần mềm này
sẽ giúp người sử dụng dễ dàng lựa chọn phần mềm phù hợp khi cần giải quyết các bài
toán phân tích tương quan và hồi quy.
- Một phần mềm có thể được sử dụng để giải quyết bài toán và ngược lại, một bài
toán có nhiều phần mềm có thể sử dụng để giải.Các phần mềm khi được cung cấp trên

thị trường đều đã có bản hướng dẫn sử dụng cũng như các tài liệu giáo trình hướng
dẫn ứng dụng cho giải bài toán cụ thể. Tuy nhiên, chưa có một công trình nghiên cứu
nào hệ thống hóa các phần mềm có thể sử dụng trong phân tích tương quan và hồi quy.
Chính vì tính cấp thiết trên của đề tài là lí do nhóm tác giả thực hiện nghiên cứu
về ứng dụng của các phần mềm trong giải các bài toán hồi quy tương quan. Mỗi phần
mềm có những tính năng riêng và có thể sử dụng cho tính toán, giải quyết nhiều vấn
đề khác nhau.Với việc giải bài toán phân tích tương quan và hồi quy,nhóm tác giả lựa
chọn nghiên cứu về các phần mềm như: MFIT3, SPSS, Microsoft Excel, E-View giúp
người sử dụng ứng dụng để giải bài toán nhanh và chính xác hơn.

3


2. Mục tiêu của đề tài:
Mục tiêu nghiên cứu của đề tài nhằm hệ thống hóa các phần mềm tiện ích có
thể sử dụng trong phân tích tương quan và hồi quy từ đó giúp người sử dụng dễ dàng
lựa chọn phần mềm phù hợp.
3. Đối tượng, phạm vi nghiên cứu:
3.1.Đối tượng nghiên cứu:
- Cơ sở lí luận của các bài toán tương quan và hồi quy
- Các phần mềm SPSS, MFIT3, Microsoft Excel, E-View.
3.2.Phạm vi nghiên cứu:
Các phần mềm trên tương đối lớn và nhiều công cụ khác nhau để có thể ứng dụng
trong nhiều lĩnh vực và giải nhiều bài toán khác nhau.Trong phạm vi nghiên cứu
của đề tài, nhóm tác giả chỉ tập trung nghiên cứu công cụ để giải bài toán phân tích
tương quan và hồi quy của các phần mềm đó.
4. Phương pháp nghiên cứu của đề tài:

+ Phương pháp nghiên cứu lí luận được sử dụng để nghiên cứu các vấn đề cơ sở lí luận
của bài toán phân tích tương quan và hồi quy: các bước giải bài toán, lập bài toán, xác

định các biến số và các tham số của bài toán, các kiểm định của bài toán.
+ Nghiên cứu cách thức sử dụng các công của các phần mềm tiện ích, sử dụng phương
pháp phân tích, so sánh để đánh giá ưu nhược điểm của mỗi phần mềm và điều kiện áp
dụng.
+ Sử dụng phương pháp tổng hợp các kết quả phân tích để giúp người sử dụng có
những lựa chọn tối ưu khi tìm kiếm công cụ cho giải bài toán phân tích tương quan và
hồi quy.
5. Nội dung nghiên cứu của bài toán:
Nội dung 1: Nghiên cứu cơ sở lí luận về phân tích tương quan và hồi quy: Dạng bài
toán, mô hình phân tích và các biến trong mô hình, các kiểm định của bài toán.
Nội dung 2: Nghiên cứu sử dụng công cụ phân tích tương quan và hồi quy của phần
mềm SPSS.
Nội dung 3: Nghiên cứu sử dụng công cụ phân tích tương quan và hồi quy của phần
mềm Mfit3.

4


Nội dung 4: Nghiên cứu sử dụng công cụ phân tích tương quan và hồi quy của phần
mềm EViews.
Nội dung 5: Nghiên cứu sử dụng công cụ phân tích tương quan và hồi quy của phần
mềm Microsoft Excel
Nội dung 6: Tổng hợp các công cụ phân tích tương quan và hồi quy của các phần
mềm trên, chỉ ra ưu nhược điểm và điều kiện áp dụng của mỗi phần mềm.

5


1.Cơ sở lí luận về phân tích tương quan và hồi quy
1.1.Khái niệm và mục tiêu phân tích tương quan và hồi quy

a) Khái niệm:

- Phân tích hồi quy là việc phân tích mối liên hệ phụ thuộc của một biến ( biến
phụ thuộc) với một hay nhiều biến khác( biến độc lập) nhằm ước lượng hoặc dự báo
giá trị trung bình của biến phụ thuộc hoặc sự biến động của biến phụ thuộc với sự thay
đổi của biến độc lập.
VD: Chi tiêu của người tiêu dùng đối với một hàng hóa phụ thuộc vào thu nhập của họ
và thị hiếu với hàng hóa đó…
- Nội dung của phân tích hồi quy:
+ Ước lượng giá trị trung bình của biến phụ thuộc với các giá trị cho trước của biến
độc lập.
+ Kiểm định giả thiết về bản chất của sự phụ thuộc
+ Dự báo giá trị tring bình và giá trị các biệt của biến phụ thuộc khi biết các giá trị của
biến độc lập
=> Tùy theo mục đích nghiên cứu có thể sử dụng một hoặc một số nội dung này.
-Phân tích tương quan là nghiên cứu mức độ kết hợp tuyến tính giữa hai biến có
tính chất đối xứng nhau.
VD: Mức độ quan hệ giữa nghiện thuốc lá và ung thư phổi, giữa số lượng sản phẩm
sản xuất thêm với chi phí cận biên để sản xuất thêm sản phẩm đó
b) Mục tiêu phân tích tương quan và hồi quy:
Để biết được mối quan hệ giữa các chỉ tiêu trong kinh tế,ước lượng được mức
độ phụ thuộc hay mức độ liên hệ giữa các chỉ tiêu thông qua việc xây dựng các mô
hình.
1.2.Nội dung phân tích tương quan và hồi quy
+ Từ các chỉ tiêu kinh tế- xã hội xây dựng mối quan hệ giữa các chỉ tiêu đó thông qua
các mô hình phân tích
+ Sử dụng phương pháp bình phương tối thiểu,tìm một đường nào đó phản ánh đúng
nhất xu thế biến động sao cho độ lệch của đường đó với điểm thực tế là nhỏ nhất.

6



1.3.Mô hình phân tích
Một chỉ tiêu kinh tế có thể có mối liên hệ với một hay nhiều chỉ tiêu kinh tế khác,vì
vậy ta có thể xây dựng nhiều mô hình với các biến khác nhau:
1.3.1.Các dạng mô hình hồi quy:
a) Mô hình hồi quy hai biến (mô hình hồi quy đơn): Khi chỉ tiêu Y phụ thuộc vào một
chỉ tiêu độc lập khác,mô hình có dạng:
E(Y/Xi)= β1 + β2Xi + Ui
Trong đó:
β1, β2 là các tham số chưa biết (hệ số hồi quy) với:
β1 là hệ số tự do,phản ánh giá trị trung bình của biến phụ thuộc Y khi không có
tác động của biến độc lập X.
β2 là hệ số góc, cho biết mức độ thay đổi về giá trị trung bình của biến phụ
thuộc Y khi biến độc lập X thay đổi 1 đơn vị.
E(Y/Xi) là giá tri trung bình của biến phụ thuộc Y với biến độc lập Xi.
Ui là sai số ngẫu nhiên,biểu thị ảnh hưởng của các biến độc lập khác.
Vấn đề là phải tìm

i

=

+

1

Xi ,xác định được các hệ số

2


,

1

2

là các ước

lượng gần đúng của β1, β2 vì trong thực tế chúng ta không thể xác định chính xác được
giá trị thực của các chỉ tiêu.
b)Mô hình hồi quy ba biến: Khi Y có mối liên hệ với 2 biến độc lập,mô hình có dạng:
E(Y/X2,X3)= β1+ β2X2+ β3X3
Các biến được giải thích tương tự như trên,cần xác định được các hệ số

,

1

,

2

3

c)Mô hình hồi quy tuyến tính k biến: chỉ tiêu Y phụ thuộc vào nhiều chỉ tiêu khác,mô
hình hồi quy có dạng:
Yi= β1+ β2X2i+…+ βkXki+ Ui

( với hàm là tuyến tính)


Trong đó:
Yi : là giá trị của biến phụ thuộc Y ở quan sát thứ i
β1 : hệ số tự do( hệ số chặn)
βj : j=

là các hệ số hồi quy riêng

X2i, X3i,..¸Xki : các biến độc lập
Ui : yếu tố ngẫu nhiên
-

Hàm hồi quy tổng quát có dạng:
7


=

1

Yi =

1

i

+

2


+

2

Trong đó:

X2i+ …+
X2+…+

Xki

k

Xki+ ei

k

, 2,…, k là các ước lượng của β1, β2,…,βk
ei là phần dư hay ước lượng của Ui
1

1.3.2. Hệ số tương quan .
- Để đánh giá mức độ chặt chẽ của mô hình hồi quy đơn với 2 biến ta tính hệ số tương
quan tuyến tính ( kí hiệu r).

r=
Hoặc:
r=
Tính chất: r nằm trong khoảng [-1;1], tức là:
+ Nếu r = 1 (hoặc r = -1): giữa X và Y có mối liên hệ hầm số.

+ Nếu r = 0: giữa X và Y không có mối liên hệ tương quan tuyến tính.
+ Nếu r → 1 (hoặc r→ -1): giữa X và Y có mối liên hệ càng chặt chẽ.
+ Nếu r dương: giữa X và Y có mối liên hệ thuận và nếu r âm thì giữa X và Y có mối
liên hệ nghịch.
- Hệ số tương quan bội (kí hiệu R) được sử dụng để đánh giá mức độ chặt chẽ mối liên
hệ tương quan tuyến tính giữa tất cả các tiêu thức nguyên nhân X1, X2, … Xk với biến

phụ thuộc Y và được tính theo công thức sau đây:
Tính chất: R nằm trong khoảng [0;1]
+ Nếu R= 1 : Giữa X1, X2,… Xk và Y có mối quan hệ hầm số.
+ Nếu R = 0: Giữa X1, X2,… Xk và Y không có mối liên hệ tương quan tuyến tính.
+ Nếu R → 1: Giữa X1, X2,… Xk và Y có mối liên hệ tương quan tuyến tính càng chặt
chẽ.
8


Trong trường hợp chỉ có 2 biến độc lập, ta có thể tính hệ số tương quan tuyến tính bội
theo công thức sau:

R=

Với:

,

,

là các hệ số tương quan tuyến tính đơn.

1.3.3.Các kiểm định của bài toán:

-

Kiểm định giả thuyết với các hệ số hồi quy βj

Loại giả thiết Giả thiết H0

Giả thiết H1

Miền bác bỏ

Hai phía

βj= βj*

βj # βj*

tα/2(n-k) <

Phía phải

βj ≤ βj*

βj > βj*

-tα (n-k) > tp/2

Phía trái

βj ≥ βj*


βj < βj*

tα (n-k) < tp/2

-

Kiểm định giả thiết đối với

Loại giả thiết

Giả thiết H0

2

Giả thiết H1

Miền bác bỏ
(n-k) 2/ б20> X2α/2(n-k)

Hai phía

б2= б20

б2 ≠ б20

Phía phải

б 2 ≤ б2 0

б2> б20


(n-k) 2/ б20> X2α(n-k)

Phía trái

б2 ≥ б20

б2< б20

(n-k) 2/ б20< X21-α(n-k)

-

p/2

Kiểm định sự phụ thuộc của hàm hồi quy ( kiểm định F)
F= (R2/1-R2)(
Giả thiết

H0: β2= β3= …=βk=0 ( hay R2=0)
H1: Có ít nhất một βj ≠ hay R2> 0

Nếu F > Fα(m,n-k) thì bác bỏ H0
Với: m: số biến bị loại khỏi mô hình ban đầu
n: số quan sát
9


k: số biến trong mô hình
+) Nếu H0 bị bác bỏ có nghĩa là có ít nhất một biến độc lập Xi ảnh hưởng đến biến phu

thuộc Y
+) Nếu chấp nhận H0 thì muốn kiểm định biến độc lập Xi không ảnh hưởng đến biến
phụ thuộc X
1.4. Công cụ phân tích tương quan và hồi quy:
Có rất nhiều công cụ để phân tích hồi quy tương quan,nhóm tác giả đi sâu tìm hiểu,sử
dụng phương pháp bình phương tối thiểu để giải bài toán hồi quy tương quan.
1.5.Một ví dụ cụ thể về bài toán tương quan và hồi quy:
a) Bài toán: Như chúng ta đã biết,lượng hàng bán của một loại hàng hóa nào đó
phụ thuộc vào nhiều yếu tố như thu nhập của người tiêu dùng,giá bán của hàng hóa
đó,giá của hàng hóa liên quan khác hay thị hiếu của người tiêu dùng về hàng hóa đó..
Trong điều kiện các yếu tố khác là không đổi, bài toán xét đến mối quan hệ giữa lượng
bán hàng hoá A với giá bán của hàng hóa đó và thu nhập của người tiêu dùng., Để xác
định mối quan hệ đó,qua khảo sát điều tra thu thập được số liệu gồm 10 quan sát được
cho trong bảng sau:
Q

14

13

12

10

8

9

8


7

6

6

P

2

2

3

4

5

5

6

7

8

9

I


7

6

7

6

5

6

4

5

4

5

Trong đó: Q là lượng hàng bán được của một loại hàng, đơn vị tính là tấn/tháng.
P là giá bán của mặt hàng này, đơn vị tính là ngàn đồng/kg.
I là thu nhập của người tiêu dùng, đơn vị tính là triệu đồng/tháng
b) Xây dựng mô hình của bài toán:
Các chỉ tiểu giá bán của hàng hóa A và thu nhập của người tiêu dùng có ảnh
hưởng đến lượng bán hàng hóa.Mối quan hệ của các chỉ tiêu trên là một hàm có dạng:
Q= f(P,I)
Giả sử mối quan hệ là tuyến tính,hàm tuyến tính có thể viết như sau:
Q= β1 + β2*P + β3*I
Trong đó:

• β2, β3 – là các hệ số hồi quy riêng,thể hiện mức độ quan hệ giữa giá bán
và thu nhập với lượng bán hàng hóa đó
10


• β1 – là hệ số chặn (hệ số tự do), chính là giá trị trung bình của lượng bán
khi chưa xét đến giá bán và thu nhập.
Vì trong thực tế chúng ta không thể xác định chính xác được giá trị thực của
các hệ số hồi quy tương quan,vì vậy,cần xác định các ước lượng của các hệ số trên để
biết được mối quan hệ giữa các chỉ tiêu là như thế nào,do đó ta cần xác định được hàm
hồi quy sau:
i

=

+

1

*P+

*I

2

3

Cần xác định được các hệ số
để tìm ra được giá trị của


với

1

,

2

,

3

là các ước lượng gần đúng của β 1, β2, β3

là ước lượng của biến phụ thuộc Q ( chỉ tiêu lượng

bán của hàng hóa A)
Để xác định được các hệ số

1

,

,

2

3

có thể dùng phương pháp bình phương nhỏ nhất


(OLS Method)
Với bài toán trên,chúng ta có thể giải bằng tay,tuy nhiên cách giải thủ công này
làm tốn rất nhiều thờ gian và phải sử dụng rất nhiều công thức mới có thể giải
được.Hiện nay, với sự phát triển của khoa học máy tính, có rất nhiều phần mềm có thể
sử dụng để xác định các hệ số

,

1

,

2

3

đồng thời giúp kiểm định độ tin cậy cũng như

giả thuyết của mô hình xây dựng được.
Trong khuôn khổ của báo cáo ,nhóm tác giả xin giới thiệu một số phần mềm
phổ biến hiện nay đang được sử dụng rộng rãi và ứng dụng vào giải bài toán trên là
những phần mềm: Mfit3, SPSS, EViews, Microsoft Excel.
2.Ứng dụng của phần mềm SPSS trong giải bài toán hồi quy và tương quan kinh
tế.
2.1.Giới thiệu về phần mềm:
SPSS (viết tắt của Statistical Package for the Social Sciences) là một phần mềm
máy tính phục vụ công tác phân tích thống kê.
SPSS là phần mềm thống kê được sử dụng phổ biến cho các nghiên cứu điều tra
xã hội học và kinh tế lượng. SPSS có giao diện thân thiện với người dùng, dễ sử dụng

bởi sử dụng chủ yếu các thao tác click chuột dựa trên các các công cụ (tool) mà rất ít
dùng lệnh (khác với R hay Stata). SPSS rất mạnh cho các phân tích như kiểm định phi
11


tham số (Chi-square, Phi, lamda….), thống kê mô tả, kiểm định sự tin cậy của thang
đo bằng Cronbach Alpha, phân tích tương quan,hồi quy tuyến tính đơn và bội, kiểm
định trung bình (T-test), kiểm định sự khác nhau giữa các biến phân loại (định danh)
bằng phân tích phương sai (ANOVA), vẽ bản đồ nhận thức (dùng trong marketing)
hay sử dụng biến giá (hồi quy với biến phân loại), hồi quy nhị thức (logistic), vv…
-

Nội dung chủ yếu của SPSS:
Nội dung của SPSS rất phong phú và đa dạng bao gồm từ việc thiết kế các bảng

biểu và sơ đồ thống kê, tính toán các đặc trưng mẫu trong thống kê mô tả, đến một hệ
thống đầy đủ các phương pháp thống kê phân tích như:
So sánh các mẫu bằng nhiều tiêu chuẩn tham số và phi tham số (Nonparametric



Test), các mô hình phân tích phương sai theo dạng tuyến tính tổng quát (General
Linear Models), các mô hình hồi quy đơn biến và nhiều biến, các hồi quy phi
tuyến tính (Nonlinear), các hồi quy Logistic;



Phân tích theo nhóm (Cluster Analysis);
Phân tích tách biệt (Discriminatory Analysis);




Và nhiều chuyên sâu khác (Advanced Statistics).
-

Một số ứng dụng chính của SPSS:
Những nội dung nói trên, SPSS có thể là đủ để giúp các nhà khoa học
thực hiện việc xử lý số liệu nghiên cứu nói chung và trong nghiên cứu các mảng
chuyên ngành khác nhau của mình, chẳng hạn:
Ứng dụng SPSS trong nghiên cứu tâm lý học: tâm lý tội phạm, tâm lý học sinhsinh viên…;



Ứng dụng SPSS trong nghiên cứu xã hội học: ý kiến của người dân trong việc
xây dựng lại khu chung cư, thống kê y tế…;



Ứng dụng SPSS trong nghiên cứu thị trường: nghiên cứu và định hướng phát
triển sản phẩm, mở rộng thị trường; sự hài lòng của khách hàng...;



Ứng dụng SPSS nghiên cứu đa dạng sinh học, trong phát triển nông lâm
nghiệp…
SPSS có thể phân tích được thực trạng, tìm ra nhân tố ảnh hưởng, dự đoán được

xu hướng xảy ra tiếp theo, giúp bạn đưa ra các quyết định một cách chính xác, giải
quyết các vấn đề một cách nhanh chóng và cải thiện kết quả tốt hơn
12



Hiện nay phần mềm SPSS đang được sử dụng rộng rãi trong thống kê phân tích
số liệu. Đặc biệt trong các trường đại học, việc sử dụng SPSS làm công cụ nghiên cứu
đang hết sức phổ biến.
SPSS là một bộ chương trình rất dễ sử dụng nên thu hút được nhiều người sử
dụng. SPSS cung cấp một giao diện giữa người và máy cho phép sử dụng các Menu
thả xuống để chọn các lệnh thực hiện. Khi thực hiện một phân tích chỉ đơn giản chọn
thủ tục cần thiết và chọn các biến phân tích rồi bấm OK là có kết quả ngay trên màn
hình để xem xét.
2.2. Ứng dụng của SPSS trong phân tích tương quan và hồi quy kinh tế.
 Trước tiên ta cần tải và cài đặt phần mềm để ứng dụng giải bài toán .
 Nhập dữ liệu
- Nhập dữ liệu vào bảng như sau :
• Ta vào trang Variable view :
- Nhập dữ liệu cột 1 là tên ‘Name’ chính là tên kí hiệu các biến : Lượng bán (Y) , giá
-

bán hàng (X1) ,thu nhập của người tiêu dùng(X2)
Sang cột ‘Decimails’ là phần số thập phân nếu trong bảng dữ liệu có số là số thập
phân thì ta đặt mũi tên vào ô đó rồi nhấn phần bên phải ô nếu ta muốn 2 hay bao

-

nhiêu số thập phân đứng sau thì ta nhấn hình mũi tên lên
Sang cột ‘Lable’ ta thiết lập kí tự giải thích của biến như Y là lượng bán , X1 là giá

-

bán hàng , X2 là thu nhập

Sang cột căn chỉnh ‘ Align’ ta nhấn vào các ô cần điền sẽ hiện ra các thanh như ‘

-

Right-Left-Center’ thì ta chọn Right.
Sang cột thanh đo ‘Measure’ ta nhấn vào các ô trong hàng của bảng trong đó có các
thanh ‘Scale-Nominal-Ordinal’ vì các biến của chúng ta là biến được định danh nên
ta chọn Nominal cho cả 3 biến.

13


Như vậy là ta đã hoàn thành việc nhập dữ liệu vào trong bảng và cho ta được bảng như
sau :
• Tiếp theo ta vào trang Data view để nhập dữ liệu thao tác như trong exel ta
nhập từng dữ liệu theo thứ tự theo hàng cho các biến

→ Khi đó ta đã thực hiện xong các thao tác nhập dữ liệu vào trong bảng SPSS để tính
(1)Phân tích tương quan.
• Trước tiên ta chọn manu Analyze rồi chọn Correlate rồi chọn Bivariate :

14


Tiếp theo ta được 1 bảng :

Khi đó ta chỉ chuột vào P(I-Q) rồi chỉ vào dấu
thì ta đã chuyển biến để tạo
bảng tương quan giữa các biến khi đó nhấn OK ta được bảng :


Giải thích :
-

Hàng chéo từ trên xuống là tự tương quan khi đó giá trị của nó bằng 1
N là số lượng mẫu của biến (=10)
15


-

Sig là phần ý nghĩa . Những Sig của phần biến phụ thuộc <10% thì kết quả
tương quan có ý nghĩa thống kê khi đó kết quả của chúng ta là 9% là đã có ý

-

nghĩa thống kê .
Ở dòng cuối là tương quan có ý nghĩa 1% lấy 2 đầu với độ ý nghĩa là 90%
Nhân tố Giá và nhân tố lượng bán không có tương quan vì tổng Sig của chúng
không qua 90% . Khi tổng của Sig > 90% thì phải xem xét lại biến độc lập vì

-

chúng có tương quan .
Bắt buộc ta phải phân tích hồi tương quan thì ta mới có thể đi đến việc phân
tích hồi quy đây là điều cần để thực hiện các phân tích bên dưới . Nếu phân tích
tương quan không có ý nghĩa thống kê thì khi đó các bước phân tích sau không

thể thực hiện được .
 Phân tích hồi quy .
• Ta chọn menu ‘Analyze’ sao đó chọn menu Regression rồi chọn Liner khi đó

chúng ta sẽ có một bảng để chọn như sau :

-

Ta cho biến Q vào ô biến phụ thuộc
Các phần còn lại chúng ta cho vao phần Independent
Và sử dụng phương pháp Enter ngoài ra chúng ta còn các phương pháp khác là
Stepwise, Remove , Backwark , Forward nhưng chúng ta chọn phương pháp

-

Enter
Tiếp theo chính ta và phần Statitcs chọn Collinearity diagnostics bởi ta cần
kiểm tra đa cộng tiến . Ô phía dưới là ô phần dư chúng ta không điền và chọn

16


các hoạt động nào vì ta không có các câu hỏi thừa hay một câu hỏi không hợp
-

lệ rồi nhấn Continue.
Sang thanh Plots là đồ thị phần dư :ô phần dư của P , I ta chọn ZPRED là phần
dư dự đoán và ô phần dư của Q ta chon ZRESID đồng thời cũng trong bảng đó
ta chọn biểu đồ Histogram và Nomal probability Plot rồi ấn Continue

• Khi đó chúng ta đã thực hiện thao tác xong ta bấm OK là đã hoàn tất thao tác
khi đó ta có một bảng hồi quy :

17



18


2.3. Phân tích kết quả:
Từ các kết quả trên bảng ta có thể rút ra nhận xét :
1. R hiệu chỉnh là 93,2%>50% . Kết quả này tương đối là ổn cho việc phân tích .
2. Tiếp theo ta xét bản Anova có Sig <10% → kết quả có ý nghĩa thống kê .
3. Tiếp theo chúng ta sét bảng kết quả phân tích hồi quy Coffeicients :
• Xét sự đa cộng tiến ta theo dõi cột VIF nếu các giá trị cột < 10 ta thu được
các biến không bị đa cộng tiến. Quan sát bảng cho ta thấy các giá trị đều thỏa
mãn điều kiện trên.
• Chuyển sang cột Sig các biến có Sig <10% là các biến không bị đa cộng tiến
khi đó ta theo dõi kết quả cho thấy phần giá bán là 15,2% > 10% nên biến đó
là một biến đa cộng tiến ta loại ra khỏi mô hình .
4. Biểu đồ Histogram phần dư ( cột và dây ) theo phân phối chuẩn mang hình
dạng của phân phối chuẩn .
5. Nằm phía dưới biểu đồ phân phối chuẩn là biểu đồ mô hình hồi quy chuẩn
‘Plots of regression standardized residua’và biểu đồ phân tán ‘ Scatterplot’
→ Nhận xét: Dựa vào bảng kết quả trên ta có phương trình hồi quy:
Q = 0.598*I+ - 0.931*P + 10.754
19


Dựa vào kết quả thu được:
+ Nếu giá bán mặt hàng này P tăng 1 triệu đồng/kg thì lượng hàng bán giảm 0.931
kg/tháng.
+ Nếu thu nhập của người tiêu dùng I tăng 1 triệu đồng/tháng thì lượng hàng bán được
tăng lên 0.598 kg/tháng.

+ Điểm xuất phát của mô hình β1 = 10.754 cho thấy các nhân tố khác làm tăng lượng
hàng bán của mặt hàng là 10.754 tấn/tháng.
NHẬN XÉT :
-

Từ bài tập ví dụ trên cho ta tấy được SPSS mang đến cho người một giải

pháp trong việc quản lí dữ liệu công cộng với khả năng xử lí , phân tích số liệu một
cách mạnh mẽ với các thong số xác thực để kiểm tra tính đồng bộ và đa cộng tiến của
nó. Ngoài ra với giao diện than thiện thì người dùng dễ dàng sử dụng để giải bài toán
tương quan và bài toán hồi quy một cách dễ dàng sử dụng các chức năng của các công
cụ thông qua các bước mà tôi đã hướng dẫn phục vụ cho công tác nghiên cứu .
Về quản lí dữ liệu thì SPSS có bộ soạn thảo dữ liệu tương tự như excel,
bộ soạn thảo cho phép vài các dữ liệu và mô tả các thuộc tính của chúng , tuy nhiên
SPSS không có những công cụ quản lí dữ liệu thật mạnh . Các bước thực hiện không
được xắp xếp vào cùng một trang để tiện theo dõi mà ra các trang khác nhau sẽ tạo nên
sự lộn xộn khi chỉnh sửa các dữ liệu khi có sai xót .
Về phần phân tích thống kê thì đây là một ưu điểm nổi bật của SPSS vì
để lập trình để lậ ra biểu bảng như ý là một công việc tỉ mẩn nặng nhọc nhưng đối với
SPSS thì nó lại là một công cụ dễ dàng hiệu quả lại vô cùng chính xác và hoàn chỉnh .
SPSS có sức mạnh lớn nhất là phân tích phương sai và phân tích nhiều
chiều
-

Nhưng cái yếu nhất của nó là khả năng sử lý những vấn đề ước lượng

phức tạp và do đó khó đưa ra những ước lượng sai số đối với các ước lượng này .
SPSS cũng không hỗ trợ cá công cụ phân tích dữ liệu theo lược đồ mẫu .
Về phần vẽ đồ thị : SPSS nhắm vào mục tiêu dễ sử dụng , mục tiêu là
thực sự làm thực sự dễ và mục tiêu này của các nhà nghiên cứu đã thành công . Nhưng

nếu ta sử dụng SPSS như người sử dụng mạnh thì có thể không đáp ứng được yêu
cầu . SPSS thiên về phần biểu bảng, đồ thị , báo cáo tổng hợp số liệu nhưng lại yếu về
một số thủ tục thống kê như phương pháp ướ lượng mạnh vầ thiếu vắng phương pháp
phân tích dữ liệu theo lược đồ mẫu .
20


Nh vy u th ln ca SPSS nờn s dng khi phõn tớch phng sai hoc
nhúm t v tng hp s liu theo biu bng thỡ s t c hiu qu cao nht .
3.ng dng Mfit 3 gii bi toỏn tng quan v hi quy kinh t.
3.1. Gii thiu v mfit3
- Mfit là một bộ phần mềm viết cho các máy PC, nó đc sử dụng để giải các bài tập
Kinh tế lng.
- Hiện nay, ở Việt Nam có nhiều phần mềm khác giao diện đẹp hơn và tính năng có thể
u việt hơn nhng Mfit vẫn đợc lựa chọn để giảng dạy trong các
trng đại học vì hai lý do sau:
Thứ nhất, Mfit không đòi hỏi máy tính có cấu hình cao, với phiên bản cho sinh
viên chỉ cần một đĩa mềm là dùng đc.
Thứ hai, Mfit chạy trên môi trờng DOS nên khi thực hành ngi học phải

-

thực hiện từng bc, do đó có điều kiện đối chiếu với lý thuyết, tạo điều kiện
để hiểu vấn đề một cách cặn kẽ hơn.
Cụng dng ca mfit3: phõn tớch hi quy tng quan trong kinh t

3.2.ng dng phn mm Mfit3 trong phõn tớch tng quan v hi quy kinh t..
Khi ng Mfit3

Hp thoi Data input menu:

21


Ý nghĩa :
0. là thoát khỏi màn hình Microfit
1.là nhập số lệu từ bàn phím
2.đọc tệp số liệu thô hoặc số liệu đã
ghi bằng Lotus
3.là nhập số liệu từ một file đặc biệt
cụ thể là đọc tệp số liệu đã ghi bằng
Mfit
tổ hợp2 tệp số liệu của Mfit có cùng số

4.là
biến
• Hộp thoại Data frequency menu :

Ý nghĩa :
Chọn 1 là
số liệu không
theo thời gian
Chọn 2 là số liệu
theo năm
Chọn 3 là số liệu
theo nửa năm
Chọn 4 là số liệu
theo quý
Chọn 5 là số liệu
theo tháng.



Ở đây yêu cầu
nhập số quan sát
trong vd này số
quan sát là 10.

22




Bảng này yêu cầu nhập số biến ở ví dụ trên ta có 3 biến

Nhấn enter thì xuất hiện bảng

23


• Ta gõ F10 để xóa các biến sau đó ta gõ các biến vào thì được :

24


• Nhập dữ liệu :
Nhập số liệu Q

Tương tự với P, I ta nhập số liệu vào :

25



×