Tải bản đầy đủ (.docx) (57 trang)

Ứng dụng của một số phần mềm trong giải bài toán tương quan và hồi quy kinh tế

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.12 MB, 57 trang )

MỤC LỤC

1

1


MỞ ĐẦU
 Tổng quan tình hình nghiên cứu trong và ngoài nước thuộc lĩnh vực của đề

tài
*Ở ngoài nước:
Cùng với sự phát triển của Khoa học công nghệ thông tin, các công ty lớn trên thế giới
liên tục đưa ra các phần mềm tiện ích ngày càng hiện đại. Mỗi phần mềm có những
tính năng riêng và có thể sử dụng cho tính tốn, giải quyết nhiều vấn đề khác nhau.
Với việc giải bài tốn phân tích tương quan và hồi quy, có thể sử dụng các phần mềm
như: MFIT3, SPSS, Microsoft Excel, E-View,…Khi cung cấp các phần mềm ứng
dụng này, các nhà sản xuất đều đã có những tài liệu hướng dẫn sử dụng đi kèm với
phần mềm được cung cấp[5], [6], [7]. Các tài liệu hướng dẫn tương đối chi tiết để giúp
người sử dụng có thể khai thác sử dụng các ứng dụng mà phần mềm này cung cấp,
nhưng không trọng tâm sâu về ứng dụng trong giải bài tốn phân tích tương quan và
hồi quy. Muốn sử dụng chúng, người sử dụng cần có thời gian tìm hiểu sâu hơn cơng
cụ đó để có thể ứng dụng một cách triệt để.
*Ở trong nước:
Ở Việt Nam, có nhiều giáo trình của mơn học Tin học ứng dụng được các trường đại
học[2],[3], trường cao đẳng khối ngành kinh tế biên soạn làm tài liệu cho học tập và
nghiên cứu ứng dụng công nghệ thông tin ở các lĩnh vực kinh tế và quản trị doanh
nghiệp. Nhưng những giáo trình này thường viết tương đối rộng, hướng dẫn ứng dụng
công nghệ thông tin cho nhiều lĩnh vực chứ chưa đi nghiên cứu sâu cho một bài tốn
cụ thể.
Ngồi ra, cịn có các tài liệu hướng dẫn sử dụng các phần mềm nêu trên [1], [4]. Thực


chất, đó là bản dịch của các tài liệu hướng dẫn sử dụng mà các nhà cung cấp phần
mềm nêu trên ban hành, nhưng được dịch một cách ngắn gọn, không đầu đủ các thông
tin cần thiết khi cần nghiên cứu sâu một công cụ nào đó.
Việc giải bài tốn phân tích tương quan hồi quy cần có sự kêt hợp của sự nắm vững cơ
sở lí luận của bài tốn và các cơng cụ ứng dụng để giải quyết chúng trong kinh tế. Một
tài liệu với sự kết hợp như vậy thì hiện nay trên thế giới cũng như Việt Nam chưa có.
Như vậy, từ tổng quan các cơng trình nghiên cứu trong và ngồi nước, có thể thấy rõ,
chưa có một cơng trình nghiên cứu nào hệ thống hóa tồn bộ các phần mềm hiện nay

2

2


đang được sử dụng trong phân tích tương quan và hồi quy cũng như đánh giá ưu
nhược điểm của mỗi phần mềm và điều kiện áp dụng của mỗi phần mềm.

-

 Tính cấp thiết của đề tài
Sự phát triển như vũ bão của khoa học công nghệ thông tin với nhiều phần mềm tiện

ích ra đời giúp con người giảm đáng kể thời gian, giảm công thức cho các phép tính
tốn và phân tích.Việc áp dụng những phần mềm hiện đại trở thành một nhu cầu tất
-

yếu trong thống kê nói chung và tốn thống kê nói riêng.
Hiện có rất nhiều phần mềm có thể được sử dụng trong phân tích tương quan và hồi
quy. Mỗi phần mềm có những nét đặc trưng riêng, cách sử dụng riêng, điều kiện áp
dụng riêng và ưu nhược điểm riêng.Vì vậy, nếu hệ thống hóa được các phần mềm này

sẽ giúp người sử dụng dễ dàng lựa chọn phần mềm phù hợp khi cần giải quyết các bài

-

tốn phân tích tương quan và hồi quy.
Một phần mềm có thể được sử dụng để giải quyết một bài toán và ngược lại, một bài
toán có nhiều phần mềm có thể sử dụng để giải. Các phần mềm khi được cung cấp trên
thị trường đều đã có bản hướng dẫn sử dụng cũng như các tài liệu giáo trình hướng
dẫn ứng dụng cho giải bài tốn cụ thể. Tuy nhiên, chưa có một cơng trình nghiên cứu
nào hệ thống hóa các phần mềm có thể sử dụng trong phân tích tương quan và hồi quy.
Chính vì tính cấp thiết trên của đề tài là lí do nhóm tác giả thực hiện nghiên cứu
về ứng dụng của các phần mềm trong giải các bài toán hồi quy tương quan. Mỗi phần
mềm có những tính năng riêng và có thể sử dụng cho tính tốn, giải quyết nhiều vấn
đề khác nhau.Với việc giải bài tốn phân tích tương quan và hồi quy,nhóm tác giả lựa
chọn nghiên cứu về các phần mềm như: MFIT3, SPSS, Microsoft Excel, E-View giúp
người sử dụng ứng dụng để giải bài toán nhanh và chính xác hơn.

3

3


 Mục tiêu của đề tài

Mục tiêu nghiên cứu của đề tài nhằm giới thiệu cách sử dụng một số phần mềm
tiện ích có thể sử dụng trong phân tích tương quan và hồi quy từ đó giúp người sử
dụng dễ dàng lựa chọn phần mềm phù hợp.
 Đối tượng, phạm vi nghiên cứu

3.1.Đối tượng nghiên cứu

- Cơ sở lí luận của các bài toán tương quan và hồi quy.
- Các phần mềm SPSS, MFIT3, Microsoft Excel, E-View.
3.2.Phạm vi nghiên cứu
Các phần mềm trên tương đối lớn và nhiều công cụ khác nhau để có thể ứng
dụng trong nhiều lĩnh vực và giải nhiều bài toán khác nhau.Trong phạm vi nghiên cứu
của đề tài, nhóm tác giả chỉ tập trung nghiên cứu sử dụng công cụ của những phần
mềm trên để giải bài tốn phân tích tương quan và hồi quy.
 Phương pháp nghiên cứu của đề tài

+ Phương pháp nghiên cứu lí luận được sử dụng để nghiên cứu các vấn đề cơ sở lí luận
của bài tốn phân tích tương quan và hồi quy: các bước giải bài toán, lập bài toán, xác
định các biến số và các tham số của bài toán, các kiểm định của bài tốn.
+ Nghiên cứu cách thức sử dụng các cơng cụ của các phần mềm tiện ích, sử dụng
phương pháp phân tích, so sánh để đánh giá ưu nhược điểm của mỗi phần mềm và
điều kiện áp dụng.
+ Sử dụng phương pháp tổng hợp các kết quả phân tích để giúp người sử dụng có
những lựa chọn tối ưu khi tìm kiếm cơng cụ cho giải bài tốn phân tích tương quan và
hồi quy.
 Nội dung nghiên cứu của bài toán

Nội dung 1: Nghiên cứu cơ sở lí luận về phân tích tương quan và hồi quy: Dạng bài
tốn, mơ hình phân tích và các biến trong mơ hình, các kiểm định của bài toán.
Nội dung 2: Nghiên cứu sử dụng cơng cụ phân tích tương quan và hồi quy của phần
mềm SPSS.
Nội dung 3: Nghiên cứu sử dụng công cụ phân tích tương quan và hồi quy của phần
mềm Mfit3.

4

4



Nội dung 4: Nghiên cứu sử dụng công cụ phân tích tương quan và hồi quy của phần
mềm EViews.
Nội dung 5: Nghiên cứu sử dụng cơng cụ phân tích tương quan và hồi quy của phần
mềm Microsoft Excel
Nội dung 6: Tổng hợp các cơng cụ phân tích tương quan và hồi quy của các phần
mềm trên, chỉ ra ưu nhược điểm và điều kiện áp dụng của mỗi phần mềm.

5

5


1. Cơ sở lí luận về phân tích tương quan và hồi quy
1.1. Khái niệm và mục tiêu phân tích tương quan và hồi quy
a) Khái niệm về phân tích hồi quy và phân tích tương quan

- Phân tích hồi quy là việc phân tích mối liên hệ phụ thuộc của một biến (biến
phụ thuộc) với một hay nhiều biến khác (biến độc lập) nhằm ước lượng hoặc dự báo
giá trị trung bình của biến phụ thuộc hoặc sự biến động của biến phụ thuộc với sự thay
đổi của biến độc lập [Trích dẫn Bài giảng Kinh tế lượng- Nguyễn Quang Dong]
VD: Chi tiêu của người tiêu dùng đối với một hàng hóa phụ thuộc vào thu nhập của họ
và thị hiếu với hàng hóa đó…
-Phân tích tương quan là nghiên cứu mức độ kết hợp tuyến tính giữa hai biến có
tính chất đối xứng nhau, giữa các biến độc lập và các biến phụ thuộc có mối quan hệ
nhân quả.
VD: Mức độ quan hệ giữa nghiện thuốc lá và ung thư phổi, giữa số lượng sản phẩm
sản xuất thêm với chi phí cận biên để sản xuất thêm sản phẩm đó.
b) Mục tiêu phân tích tương quan và hồi quy


Để biết được mối quan hệ giữa các chỉ tiêu trong kinh tế, ước lượng được mức
độ phụ thuộc hay mức độ liên hệ giữa các chỉ tiêu thông qua việc xây dựng các mơ
hình.

1.2. Nội dung phân tích tương quan và hồi quy
- Sử dụng phương pháp bình phương tối thiểu, tìm một đường nào đó phản ánh đúng
nhất xu thế biến động sao cho độ lệch của đường đó với điểm thực tế là nhỏ nhất.
- Từ các chỉ tiêu kinh tế - xã hội xây dựng mối quan hệ giữa các chỉ tiêu đó thơng qua
các mơ hình phân tích, từ đó:
+ Ước lượng giá trị trung bình của biến phụ thuộc với các giá trị cho trước của biến
độc lập.
+ Kiểm định giả thiết về bản chất của sự phụ thuộc.

1.3. Mơ hình phân tích
Một chỉ tiêu kinh tế có thể có mối liên hệ với một hay nhiều chỉ tiêu kinh tế
khác, vì vậy ta có thể xây dựng nhiều mơ hình với các biến khác nhau:

1.3.1. Các dạng mơ hình hồi quy
a) Mơ hình hồi quy tuyến tính hai biến tổng thể ( mơ hình hồi quy đơn): Khi biến
6

6


phụ thuộc vào một biến độc lập khác, mơ hình có dạng:
Yi= β1 + β2Xi + ui
Trong đó:
- β1, β2 là các tham số chưa biết (hệ số hồi quy) với:
 β1 là hệ số tự do,phản ánh giá trị trung bình của biến phụ thuộc Y khi khơng có

tác động của biến độc lập X.
 β2 là hệ số góc, cho biết mức độ thay đổi về giá trị trung bình của biến phụ
thuộc Y khi biến độc lập X thay đổi 1 đơn vị.
- Yi là giá trị trung bình của biến phụ thuộc Y với biến độc lập Xi.
- ui là sai số ngẫu nhiên, biểu thị ảnh hưởng của các biến độc lập khác.
Vấn đề là phải tìm i= 1+ 2Xi , xác định được các hệ số 1, 2 là các ước lượng gần đúng
của β1, β2 vì trong thực tế chúng ta khơng thể xác định chính xác được giá trị thực của
các chỉ tiêu.
Mơ hình hồi quy tuyến tính ba biến tổng thể: Khi biến phụ thuộc Y có mối liên hệ

b)

với 2 biến độc lập, mơ hình có dạng:
Yi= β1+ β2X2i+ β3X3i + ui
Các biến được giải thích tương tự như trên,cần xác định được các hệ số 1, 2, 3 là các
ước lượng gần đúng của β1, β2, β3.
c) Mơ hình hồi quy tuyến tính k biến tổng thể: Khi biến Y phụ thuộc vào nhiều biến

độc lâp khác,mơ hình hồi quy có dạng:
Yi= β1+ β2X2i+…+ βkXki+ ui
Trong đó:
Yi : là giá trị của biến phụ thuộc Y ở quan sát thứ i
β1 : hệ số tự do (hệ số chặn)
βj : j= : các hệ số hồi quy riêng
X2i, X3i,..¸Xki : các biến độc lập
ui : yếu tố ngẫu nhiên


Khi đó hàm hồi quy tổng thể có dạng:
i= 1+ 2X2i+ …+ kXki

Trong đó: 1, 2,…, k là các ước lượng của β1, β2,…,βk.

1.3.2. Hệ số xác định bội và hệ số tương quan
a) Hệ số xác định bội R2
Gọi TSS= ∑ (Yi - )2

7

ESS= ∑ (i - )2

RSS= ∑ ( Yi- i)2

7


Trong đó: -TSS là tổng bình phương của tất cả các sai lệch giữa các giá trị quan sát Y
và giá trị trung bình của chúng .
-ESS là tổng bình phương của tất cả các sai lệch giữa giá trị của biến phụ
thuộc Y với giá trị trung bình của chúng.
-RSS là tổng bình phương của tất cả các sai lệch giữa các giá trị quan sát
Y và các giá trị nhận được từ hàm hồi quy.
Ta có:
R2= ESS/ TSS hoặc R2= 1- (RSS/ TSS)

0 ≤R2≤ 1

b) Hệ số tương quan bội
r= biểu thị mức độ tương quan giữa biến phụ thuộc Y và các biến độc lập, nó là một
đại lượng không giảm khi số biến độc lập tăng lên. Tuy nhiên, khác với trong mơ hình
hồi quy đơn, hệ số này thường nhận giá trị dương và ít được quan tâm hơn.

- Tính chất của hệ số tương quan: -1 ≤ r≤ 1
r= ± 1 thì hàm hồi quy mẫu được coi là phù hợp tuyệt đối.
r= 0 thì hàm hồi quy mẫu hồn tồn khơng phù hợp.
r> 0 thì biến độc lập và biến phụ thuộc tồn tại mối quan hệ cùng chiều.
r< 0 thì biến độc lập và biến phụ thuộc có mối quan hệ ngược chiều.
c) Hệ số tương quan bội đã điều chỉnh ( )
được sử dụng để so sánh mức độ phù hợp của hai mơ hình hồi quy hoặc đưa ra kết
luận về việc đưa thêm một biến độc lập trong mô hình hồi quy bội.
= 1- (1- R2)(n- 1)/ (n- k)
+ Nếu ≤ R2 ≤1 cho thấy khi số biến độc lập tăng lên thì có thể tăng lên, tuy nhiên tốc
độ tăng của chậm hơn tốc độ tăng của R2.
+ Nếu R2 ≥ 0 nhưng có thể < 0: cho biết còn tăng khi hệ số của một biến độc lập mới
đưa vào mơ hình hồi quy khác 0.
+ Nếu giả thiết:

H0: βj = 0
H1: βj ≠ 0

Khi H0 bị bác bỏ thì sẽ tăng lên và biến độc lập mới được đưa vào mơ hình là phù
hợp.

1.3.3.Các kiểm định của bài tốn


Kiểm định giả thuyết với các hệ số hồi quy βj

Loại giả thiết
8

Giả thiết H0


Giả thiết H1

Miền bác bỏ
8


Hai phía
Phía phải
Phía trái


βj # βj*
βj > βj*
βj < βj*

> tα/2(n-k)
t< -tα (n-k)
t> tα (n-k)

Kiểm định giả thiết đối với 2

Loại giả thiết
Hai phía
Phía phải
Phía trái


βj= βj*
βj ≤ βj*

βj ≥ βj*

Giả thiết H0
б2= б20
б2 ≤ б20
б2 ≥ б20

Giả thiết H1
б2 ≠ б20
б2> б20
б2< б20

Miền bác bỏ
(n-k)2/ б20> X2α/2(n-k)
(n-k)2/ б20> X2α(n-k)
(n-k)2/ б20< X21-α(n-k)

Kiểm định độ phù hợp của hàm hồi quy ( kiểm định F)

F= (R2/1-R2)(
Giả thiết

H0: β2= β3= …=βk=0 ( hay R2=0)

H1: Có ít nhất một βj ≠ 0 hay R2> 0
Nếu F > Fα(m,n-k) thì bác bỏ H0
Với: m: số biến bị loại khỏi mơ hình ban đầu
n: số quan sát
k: số biến trong mơ hình
+) Nếu H0 bị bác bỏ có nghĩa là có ít nhất một biến độc lập X i ảnh hưởng đến biến phụ

thuộc Y.
+) Nếu chấp nhận H0 thì muốn kiểm định biến độc lập X i không ảnh hưởng đến biến
phụ thuộc X.

1.4. Cơng cụ phân tích tương quan và hồi quy
Có rất nhiều cơng cụ để phân tích hồi quy tương quan,nhóm tác giả đi sâu tìm
hiểu,sử dụng phương pháp bình phương tối thiểu để giải bài toán hồi quy tương quan.
Trong phương pháp bình phương tối thiểu gồm 2 phương pháp:
+ Phương pháp bình phương nhỏ nhất có trọng số
+ Phương pháp bình phương nhỏ nhất tổng quát

9

9


Nhóm tác giả lựa chọn phương pháp bình phương nhỏ nhất theo tổng quát để
ứng dụng vào các phần mềm giải bài tốn hồi quy tương quan.

1.5.Một ví dụ cụ thể về bài toán tương quan và hồi quy
a) Bài toán: Như chúng ta đã biết, lượng hàng bán của một loại hàng hóa nào đó phụ

thuộc vào nhiều yếu tố như thu nhập của người tiêu dùng, giá bán của hàng hóa đó, giá
của hàng hóa liên quan khác hay thị hiếu của người tiêu dùng về hàng hóa đó.. Trong
điều kiện các yếu tố khác là khơng đổi, bài toán xét đến mối quan hệ giữa lượng bán
hàng hố A với giá bán của hàng hóa đó và thu nhập của người tiêu dùng. Để xác định
mối quan hệ đó, qua khảo sát điều tra thu thập được số liệu gồm 10 quan sát được cho
trong bảng sau:
Q


14

13

12

10

8

9

8

7

6

6

P

2

2

3

4


5

5

6

7

8

9

I

7

6

7

6

5

6

4

5


4

5

Trong đó: Q là lượng hàng bán được của một loại hàng, đơn vị tính là tấn/tháng.
P là giá bán của mặt hàng này, đơn vị tính là ngàn đồng/kg.
I là thu nhập của người tiêu dùng, đơn vị tính là triệu đồng/tháng.
b) Xây dựng mơ hình của bài tốn:

Các chỉ tiêu giá bán của hàng hóa A và thu nhập của người tiêu dùng có ảnh
hưởng đến lượng bán hàng hóa. Mối quan hệ của các chỉ tiêu trên là một hàm có dạng:
Q= f(P,I)
Giả sử mối quan hệ là tuyến tính, hàm tuyến tính có thể viết như sau:
Q= β1 + β2*P + β3*I + ei
Trong đó:


β2, β3 – là các hệ số hồi quy riêng, thể hiện mức độ ảnh hưởng của giá



bán và thu nhập tới lượng bán hàng hóa đó.
β1 – là hệ số chặn (hệ số tự do), chính là giá trị trung bình của lượng bán

khi chưa xét đến giá bán và thu nhập.
• ei là phần dư hay ước lượng của các yếu tố khác tác động tới lượng bán
hàng hóa.
Vì trong thực tế chúng ta khơng thể xác định chính xác được giá trị thực của
các hệ số hồi quy tương quan, vì vậy cần xác định các ước lượng của các hệ số trên để
10


10


biết được mối quan hệ giữa các chỉ tiêu là như thế nào, do đó ta cần xác định được
hàm hồi quy sau:
= 1+ 2*P+ 3*I
Cần xác định được các hệ số 1, 2, 3 là các ước lượng điểm của β1, β2, β3 để tìm ra
được giá trị của với là ước lượng điểm của biến phụ thuộc Q ( chỉ tiêu lượng bán của
hàng hóa A).
Để xác định được các hệ số 1, 2,

3

có thể dùng phương pháp bình phương nhỏ nhất

(OLS Method)
Với bài tốn trên, chúng ta có thể giải bằng tay, tuy nhiên cách giải thủ công
này làm tốn rất nhiều thời gian và phải sử dụng rất nhiều cơng thức mới có thể giải
được. Hiện nay, với sự phát triển của khoa học máy tính, có rất nhiều phần mềm có thể
sử dụng để xác định các hệ số 1, 2, 3 đồng thời giúp kiểm định giả thuyết của mơ hình
xây dựng được.
Trong khn khổ của báo cáo, nhóm tác giả xin giới thiệu một số phần mềm
phổ biến hiện nay đang được sử dụng rộng rãi và ứng dụng vào giải bài toán trên là
những phần mềm: Mfit3, SPSS, EViews, Microsoft Excel.

2.Ứng dụng của phần mềm SPSS trong giải bài toán hồi quy và tương quan
kinh tế
2.1.Giới thiệu về phần mềm
SPSS (viết tắt của Statistical Package for the Social Sciences) là một phần mềm

máy tính phục vụ cơng tác phân tích thống kê.
SPSS là phần mềm thống kê được sử dụng phổ biến cho các nghiên cứu điều tra
xã hội học và kinh tế lượng. SPSS có giao diện thân thiện với người dùng, dễ sử dụng
bởi sử dụng chủ yếu các thao tác click chuột dựa trên các các công cụ (tool) mà rất ít
dùng lệnh (khác với R hay Stata). SPSS rất mạnh cho các phân tích như kiểm định phi
tham số (Chi-square, Phi, lamda….), thống kê mô tả, kiểm định sự tin cậy của thang
đo bằng Cronbach Alpha, phân tích tương quan, hồi quy tuyến tính đơn và bội, kiểm
định trung bình (T-test), kiểm định sự khác nhau giữa các biến phân loại (định danh)
bằng phân tích phương sai (ANOVA), vẽ bản đồ nhận thức (dùng trong marketing)
hay sử dụng biến giá (hồi quy với biến phân loại), hồi quy nhị thức (logistic), vv…
11

11




Nội dung chủ yếu của SPSS:
Nội dung của SPSS rất phong phú và đa dạng bao gồm từ việc thiết kế các bảng

biểu và sơ đồ thống kê, tính tốn các đặc trưng mẫu trong thống kê mô tả, đến một hệ
thống đầy đủ các phương pháp thống kê phân tích như:
So sánh các mẫu bằng nhiều tiêu chuẩn tham số và phi tham số (Nonparametric



Test), các mơ hình phân tích phương sai theo dạng tuyến tính tổng quát (General
Linear Models), các mơ hình hồi quy đơn biến và nhiều biến, các hồi quy phi
tuyến tính (Nonlinear), các hồi quy Logistic;






Phân tích theo nhóm (Cluster Analysis);



Phân tích tách biệt (Discriminatory Analysis);



Và nhiều chuyên sâu khác (Advanced Statistics).

Một số ứng dụng chính của SPSS:
Những nội dung nói trên, SPSS có thể là đủ để giúp các nhà khoa học thực hiện
việc xử lý số liệu nghiên cứu nói chung và trong nghiên cứu các mảng chuyên ngành
khác nhau của mình, chẳng hạn:
- Ứng dụng SPSS trong nghiên cứu tâm lý học: tâm lý tội phạm, tâm lý học sinhsinh viên…;
-

Ứng dụng SPSS trong nghiên cứu xã hội học: ý kiến của người dân trong việc
xây dựng lại khu chung cư, thống kê y tế…;

-

Ứng dụng SPSS trong nghiên cứu thị trường: nghiên cứu và định hướng phát
triển sản phẩm, mở rộng thị trường; sự hài lòng của khách hàng...;

-


Ứng dụng SPSS nghiên cứu đa dạng sinh học, trong phát triển nông lâm
nghiệp…
SPSS có thể phân tích được thực trạng, tìm ra nhân tố ảnh hưởng, dự đoán được

xu hướng xảy ra tiếp theo, giúp bạn đưa ra các quyết định một cách chính xác, giải
quyết các vấn đề một cách nhanh chóng và cải thiện kết quả tốt hơn.
12

12


Hiện nay phần mềm SPSS đang được sử dụng rộng rãi trong thống kê phân tích
số liệu. Đặc biệt trong các trường đại học, việc sử dụng SPSS làm công cụ nghiên cứu
đang hết sức phổ biến.
SPSS là một bộ chương trình rất dễ sử dụng nên thu hút được nhiều người sử
dụng. SPSS cung cấp một giao diện giữa người và máy cho phép sử dụng các Menu
thả xuống để chọn các lệnh thực hiện. Khi thực hiện một phân tích chỉ đơn giản chọn
thủ tục cần thiết và chọn các biến phân tích rồi bấm OK là có kết quả ngay trên màn
hình để xem xét.

2.2. Ứng dụng của SPSS trong phân tích tương quan và hồi quy kinh tế
 Trước tiên ta cần tải và cài đặt phần mềm để ứng dụng giải bài toán .
 Nhập dữ liệu
- Nhập dữ liệu vào bảng như sau :

Ta vào trang Variable view :
- Nhập dữ liệu cột 1 là tên ‘Name’ chính là tên kí hiệu các biến : Lượng bán (Q) , giá
-


bán hàng (P) ,thu nhập của người tiêu dùng(I).
Sang cột ‘Decimals’ là phần số thập phân nếu trong bảng dữ liệu có số là số thập
phân thì ta đặt mũi tên vào ơ đó rồi nhấn phần bên phải ô nếu ta muốn 2 hay bao

-

nhiêu số thập phân đứng sau thì ta nhấn hình mũi tên lên.
Sang cột ‘Lable’ ta thiết lập kí tự giải thích của biến như Q là lượng bán , P là giá

-

bán hàng , I là thu nhập.
Sang cột căn chỉnh ‘ Align’ ta nhấn vào các ô cần điền sẽ hiện ra các thanh như ‘

-

Right-Left-Center’ thì ta chọn Right.
Sang cột thanh đo ‘Measure’ ta nhấn vào các ô trong hàng của bảng trong đó có các
thanh ‘Scale-Nominal-Ordinal’ vì các biến của chúng ta là biến được định danh nên
ta chọn Nominal cho cả 3 biến.

Như vậy là ta đã hoàn thành việc nhập dữ liệu vào trong bảng và cho ta được bảng như
sau :


Tiếp theo ta vào trang Data view để nhập dữ liệu thao tác như trong excel ta
nhập từng dữ liệu theo thứ tự, theo hàng cho các biến :

13


13


→ Khi đó ta đã thực hiện xong các thao tác nhập dữ liệu vào trong bảng SPSS để tính.
 Phân tích tương quan

14

14




Trước tiên ta chọn manu Analyze rồi chọn Correlate rồi chọn Bivariate :

Tiếp theo ta được 1 bảng :

Khi đó ta chỉ chuột vào P(I-Q) rồi chỉ vào dấu

thì ta đã chuyển biến để tạo bảng

tương quan giữa các biến khi đó nhấn OK ta được bảng sau :

15

15


Giải thích bảng kết quả:
-


Hàng chéo từ trên xuống là tự tương quan khi đó giá trị của nó bằng 1. Mối quan hệ
tương quan giữa lượng hàng bán (Q) với giá bán và thu nhập người tiêu dùng có mối
quan hệ chặt chẽ : P nghịch biến với I và Q ( vì hệ số tương quan <0 ) ; thu nhập
nghịch biến với giá bán nhưng lại đồng biến với lượng bán và lượng bán tỉ lệ thuận với

-

thu nhập và tỷ lệ nghịch với giá hàng hóa.
N là kích thước mẫu (=10).
Sig là mức ý nghĩa . Những Sig của phần biến phụ thuộc <10% thì kết quả tương quan

-

có ý nghĩa thống kê khi đó kết quả của chúng ta là 0,2% → có ý nghĩa thống kê .
** Ở dịng cuối là tương quan có mức ý nghĩa là 1% lấy 2 phía với mức độ tin cậy là

-

90% .
Nhân tố P và nhân tố Q có tương quan chặt chẽ với nhau sẽ dễ xuất hiện hiện tượng đa
cộng tuyến nhưng theo bảng kết quả cho ta thấy tổng sig của các biến độc lập < 90%
nên hai biến độc lập là giá bán và thu nhập của người tiêu dùng khơng có tương quan

-

với nhau.
Bắt buộc ta phải phân tích tương quan thì mới có thể đi đến việc phân tích hồi quy đây
là điều kiện cần để thực hiện các phân tích bên dưới . Bởi Sig (Q)<10% nên hàm ví dụ
có ý nghĩa thống kê.

 Phân tích hồi quy


Ta chọn menu ‘Analyze’ sao đó chọn menu Regression rồi chọn Liner khi đó
chúng ta sẽ có một bảng để chọn như sau :

16

16


-

Ta cho biến Q vào ô biến phụ thuộc .
Các phần còn lại chúng ta cho vào phần Independent.
Tiếp theo vào phần Statitcs chọn Collinearity diagnostics bởi cần kiểm tra sự đa
cộng tuyến của các biến độc lập. Ơ phía dưới là ô phần dư chúng ta không điền
và chọn các hoạt động nào vì ta khơng có các câu hỏi thừa hay một câu hỏi

-

không hợp lệ rồi nhấn Continue.
Sang thanh Plots là đồ thị phần dư: ô phần dư của P , I ta chọn ZPRED là phần
dư dự đốn và ơ phần dư của Q ta chọn ZRESID đồng thời cũng trong bảng đó
ta chọn biểu đồ Histogram và Normal probability Plot rồi ấn Continue.



Sau khi đã thực hiện xong, bấm OK là đã hoàn tất các thao tác khi đó ta có một
bảng hồi quy :


17

17


18

18


2.3. Phân tích kết quả
Từ các kết quả trên bảng ta có thể rút ra nhận xét :
1 Xét bảng Model Summary b có R 2 hiệu chỉnh = 93,2%>70% . Kết quả này
tương đối là ổn cho việc phân tích .
2 Xét bảng Anova a (phân tích phương sai) có Sig (hồi quy – regression)<10%
→ bài tốn có ý nghĩa thống kê .
- Phần kiểm đinh F :
H0: β1= β2= β3 = 0 (hay R2 = 0)
H1: Có ít nhất một βj ≠ 0 (hay R2 ≠0)
F = 62.6405 > F0.1(2,7) = 3.26
Bác bỏ H0 , chấp nhận H1 .
Vậy việc đưa biến giá, thu nhập người tiêu dùng, lượng bán vào mơ hình là phù hợp .
3 Xét bảng kết quả phân tích hồi quy Coffeicients
• Xét sự đa cộng tuyến ta theo dõi cột VIF nếu các giá trị < 10 ta thu được các
biến không bị đa cộng tuyến. Quan sát bảng cho thấy các giá trị đều thỏa mãn
điều kiện trên.
• Cột Sig: các biến có Sig <10% là các biến khơng bị đa cộng tuyến khi đó kết
quả cho thấy phần giá bán là 15,2% > 10% nên loại ra khỏi mơ hình .
19


19


4 Biểu đồ Histogram phần dư (cột và dây) theo phân phối chuẩn mang hình dạng
của phân phối chuẩn.
5 Nằm phía dưới biểu đồ phân phối chuẩn là biểu đồ mơ hình hồi quy chuẩn
‘Plots of regression standardized residua’và biểu đồ phân tán ‘ Scatterplot’ của
biến độc lập doanh thu Q.
→ Nhận xét: Dựa vào bảng kết quả trên ta có phương trình hồi quy:
Q = 0.598*I+ - 0.931*P + 10.754
Dựa vào kết quả thu được:
+ Nếu giá bán mặt hàng này P tăng 1 nghìn đồng/kg thì lượng hàng bán giảm 0.931
tấn/tháng.
+ Nếu thu nhập của người tiêu dùng I tăng 1 triệu đồng/tháng thì lượng hàng bán được
tăng lên 0.598 tấn/tháng.
+ Điểm xuất phát của mơ hình β1 = 10.754 khi khơng có tác động của giá và thu nhập
thì lượng bán ra ngồi thị trường là 10.750 tấn/tháng.
Từ bài tập ví dụ trên cho thấy phần mềm SPSS mang đến cho người sử dụng một

-

giải pháp trong việc quản lí dữ liệu cơng cộng với khả năng xử lí, phân tích số liệu một
cách mạnh mẽ với các thơng số xác thực để kiểm tra tính đồng bộ và đa cộng tuyến
của nó. Ngồi ra với giao diện thân thiện thì người dùng dễ dàng sử dụng để giải bài
toán tương quan và bài toán hồi quy một cách dễ dàng sử dụng các chức năng của các
-

công cụ thông qua các bước đã hướng dẫn phục vụ cho cơng tác nghiên cứu.
Về quản lí dữ liệu thì SPSS có bộ soạn thảo dữ liệu tương tự như excel, bộ soạn thảo

cho phép cài các dữ liệu và mơ tả các thuộc tính của chúng, tuy nhiên SPSS khơng có
những cơng cụ quản lí dữ liệu thật mạnh. Các bước thực hiện không được xắp xếp vào
cùng một trang để tiện theo dõi mà ra các trang khác nhau sẽ tạo nên sự lộn xộn khi

-

chỉnh sửa các dữ liệu khi có sai xót.
Về phần phân tích thống kê thì đây là một ưu điểm nổi bật của SPSS vì để lập trình,
lập ra biểu bảng như ý là một công việc tỉ mẩn, phức tạp nhưng đối với SPSS thì nó lại

-

là một cơng cụ dễ dàng, hiệu quả lại vơ cùng chính xác và hồn chỉnh.
SPSS có ưu thế lớn nhất là phân tích phương sai và phân tích nhiều chiều.
Nhưng cái yếu nhất của nó là khả năng xử lý những vấn đề ước lượng phức tạp và do
đó khó đưa ra những ước lượng sai số đối với các ước lượng này. SPSS cũng khơng hỗ
trợ các cơng cụ phân tích dữ liệu theo lược đồ mẫu.

20

20


-

SPSS thiên về phần biểu bảng, đồ thị, báo cáo tổng hợp số liệu nhưng lại yếu về một
số thủ tục thống kê như phương pháp ước lượng mạnh và thiếu vắng phương pháp
phân tích dữ liệu theo lược đồ mẫu.
→ Như vậy ưu thế lớn nhất của SPSS là sử dụng khi phân tích phương sai hoặc
nhóm tổ và tổng hợp số liệu theo biểu bảng thì sẽ đạt được hiệu quả cao nhất.


3.Ứng dụng của phần mềm Mfit3 trong giải bài toán tương quan và hồi quy
kinh tế
3.1. Giới thiệu phần mềm Mfit3
• Mfit là một bộ phần mềm viết cho các máy PC, nó được sử dụng để giải các bài
tập kinh tế lượng.
• Hiện nay, ở Việt Nam có nhiều phần mềm khác giao diện đẹp hơn và tính năng
có thể ưu việt hơn nhưng Mfit vẫn được lựa chọn để giảng dạy trong các trường
đại học vì hai lí do sau:
- Thứ nhất, Mfit khơng địi hỏi máy tính có cấu hình cao, với phiên bản cho sinh
viên chỉ cần một đĩa mềm là dùng được.
- Thứ hai, Mfit chạy trên môi trường DOS nên khi thực hành người học phải thực
hiện từng bước, do đó có điều kiện đối chiếu với lý thuyết, tạo điều kiện để hiểu vấn
đề một cách cặn kẽ hơn.
• Cơng dụng của Mfit3: để phân tích hồi quy tương quan trong kinh tế

21

21


3.2.Ứng dụng phần mềm Mfit3 trong phân tích tương quan và hồi quy kinh
tế.
 Hồi quy



Khởi động Mfit3.
Hộp thoại Data input menu:


Ý nghĩa :
0. là thốt khỏi màn hình Microfit
1.là nhập số lệu từ bàn phím
2.đọc tệp số liệu thơ hoặc số liệu đã
ghi bằng Lotus
3.là nhập số liệu từ một file đặc biệt
cụ thể là đọc tệp số liệu đã ghi bằng
Mfit
tổ hợp2 tệp số liệu của Mfit có cùng số

4.là
biến



Hộp thoại Data frequency menu :
Ý
nghĩa :
Chọn 1 là
số liệu
không
theo thời
gian
Chọn 2 là số liệu
theo năm
Chọn 3 là số liệu
theo nửa năm
Chọn 4 là số liệu
theo quý


22

22


Chọn 5 là số liệu theo tháng.
Ở đây yêu cầu nhập số quan sát trong vd này số quan sát là 10.

23



Bảng này u cầu nhập số biến ở ví dụ trên ta có 3 biến



Nhấn enter thì xuất hiện bảng
23


24

24




Nhập dữ liệu :
Nhập số liệu Q


Tương tự với P, I ta nhập số liệu vào :

25

25


×