Tải bản đầy đủ (.docx) (14 trang)

Thảo luận kinh tế lượng hiện tượng đa cộng tuyến

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (217.51 KB, 14 trang )

Lời mở đầu
Trong mô hình phân tích hồi quy bội, chúng ta giả thiết giữa các biến giải thích
Xi của mô hình độc lập tuyến tính với nhau, tức các hệ số hồi quy đối với một
biến cụ thể là số đo tác động riêng phần của biến tương ứng khi tất cả các biến
khác trong mô hình được giữ cố định. Tuy nhiên khi giả thiết đó vi phạm tức là
các biến giải thích có tương quan thì chúng ta không thể tác biệt sự ảnh hưởng
riêng biệt của một biến nào đó.
Hiện tượng trên được gọi là hiện tượng đa cộng tuyến. Vậy đa cộng tuyến là gì,
hậu quả của hiện tượng này như thế nào, làm thế nào để phát hiện và biện pháp
khắc phục nó. Để trả lwoif cho câu hỏi này thì sau đây chúng ta cùng đi thảo
luận về đề tài “hiện tượng đa cộng tuyến”.
I.
1.

Lý thuyết
Bản chất của đa cộng tuyến.
Xét mô hình hồi quy:
= + X2i + .... + Xki + Ui
Mô hình trên được gọi là có hiện tượng đa cộng tuyến, nếu các biến độc
lập X2, X3,…. Xk có quan hệ tuyến tính với nhau.

a.

Đa cộng tuyến hoàn hảo:
Mô hình được gọi là xảy ra hiện tượng đa cộng tuyến hoàn hảo nếu tồn
tại k-1 số thực λ1, λ2,..., λk không đồng thời bằng 0, sao cho:
λ1X1 + λ2 X2 + ... + λk Xk = 0

b.

Đa cộng tuyến không toàn phần:


Mô hình được gọi là xảy ra hiện tượng đa cộng tuyến không toàn phần
nếu tồn tại k-1 số thực λ1, λ2,..., λ3 không đồng thời bằng 0, sao cho:
λ 1 X1i + λ2 X2i + ... + λk Xki + Vi = 0

2.

Nguyên nhân
Các nguyên nhân gây ra hiện tượng đa cộng tuyến ở đây có thể là do các
nguyên nhân sau :


Do bản chất kinh tế xã hội các biến ít nhiều có quan hệ tuyến tính
với nhau



Do mẫu lấy không ngẫu nhiên



Do quá trình xử lý tính toán số liệu



3.

Một số nguyên nhân khác

Hậu quả



Phương sai và hiệp phương sai của các ước lượng OLS lớn.



Khoảng tin cậy rộng hơn



Tỷ số t mất ý nghĩa 2



R cao nhưng tỷ số t ít ý nghĩa



Dấu của các ước lượng có thể sai



Các ước lượng và sai số chuẩn rất nhạy với sự thay đổi trong số
liệu



Thay đổi các ước lượng của mô hình khi thêm bớt các biến cộng
tuyến

II.

Bài tập vật dụng
1. Bài toán
- GDP (tổng sản phẩm

quốc nội) là giá trị thị trường của tất cả các hàng
hóa và dịch vụ cuối cùng được sản xuất ra trong phạm vi một lãnh thổ
nhất định và trong một thời kì nhất định.
- Đầu tư là tổng đầu tư ở trong nước của tư nhân. Nó bao gồm các khoản
chi tiêu của doanh nghiệp về trang thiết bị và nhà xưởng hay sự xây dựng,
mua nhà mới của hộ gia đình.
- Xuất khẩu là việc bán hàng hóa dịch vụ cho nước ngoài
- Nhập khẩu là việc quốc gia này mua hàng hóa và dịch vụ từ quốc gia
khác
Ta được bảng số liệu:
(Đơn vị: tỷ đồng)
Năm
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011

GDP

Đầu tư
Xuất khẩu
Nhập khẩu
435319.0
151183.0
14482.7
15636.5
474855.0
170496.0
15029.2
16217.9
527056.0
200145.0
16706.1
19745.6
603688.0
239246.0
20149.3
25255.8
701906.0
290927.0
26485.0
31968.8
897222.0
343135.0
32447.1
36761.1
1038755.0
404712.0
39826.2

44891.1
1211806.0
532093.0
48561.4
62764.7
1567964.0
616735.0
62685.1
80713.8
1731221.0
708826.0
57096.3
69948.8
2075578.0
830278.0
72236.7
84838.6
2660076.0
924495.0
96905.7
106749.8


2012
2013
2014
2015
2.
2.1


3115227.0
3430668.0
3750823.0
3997609.0

1010114.0
1094542.0
1220704.0
1367205.0

114529.2
132032.9
150217.1
162016.7

113780.4
132032.6
147849.1
165570.4

Giải quyết bài toán
Xây dựng mô hình hồi quy
*Với mức ý nghĩa α = 0.05
Mô hình tổng thể:
Trong đó:
Biến phụ thuộc : Ŷi : GDP
Biến giải thích:
Xi: Đầu tư
Zi: Xuất khẩu
Ni: Nhập khẩu

Ui: Sai số ngẫu nhiên
* Dùng eview ước lượng mô hình hồi quy mẫu theo phương pháp bình
phương nhỏ nhất:


-

Từ kết quả trên ta có mô hình hồi quy như sau:
(SRF) Ŷi = 14115,24 + 2,017746X + 24,3044Z – 15,75433N + Ui

-

Ý nghĩa của các hệ số hồi quy:
Đối với = 14115,24 có ý nghĩa là tổng giá trị đầu tư, xuất khẩu, nhập
khẩu đồng thời bằng 0 thì GDP đạt giá trị trung bình là 14115,24 tỷ
đồng/năm
Đối với = 2,017746 có ý nghĩa là khi xuất khẩu, nhập khẩu không đổi
thì tổng giá trị đầu tư tăng thêm một đơn vị thì GDP trung bình sẽ tăng
thêm 2,01 tỷ đồng/năm.
Đối với = 24,3044 có ý nghĩa là khi tổng giá trị đầu tư, nhập khẩu
không đổi thì tổng giá trị xuất khẩu tăng thêm một đơn vị thì GDP
trung bình sẽ tăng thêm 24,3 tỷ đồng/năm
Đối với = -15,75 có ý nghĩa là khi tổng giá trị đầu tư, xuất khẩu tăng

2.2

thêm một đơn vị thì GDP trung bình sẽ giảm đi 15,75 tỷ đồng/năm.
Kiểm định giả thuyết và đánh giá mức độ phù hợp của mô hình.
2.2.1 Hệ số thu được từ hàm hồi quy có phù hợp với lý thuyết kinh tế không
 Kiểm định giả thiết







II.2.2


với mức ý nghĩa α = 0,05
Ta thấy có giá trị kiểm định t = 5,3893 có mức xác suất tương ứng là
Pvalue = 0,0002 < α = 0,05
→ Bác bỏ H0 →
Đầu tư có ảnh hưởng đến tổng thu nhập GDP
Kiểm định giả thiết
với mức ý nghĩa α = 0,05
Ta thấy có giá trị kiểm định t = 8,5843 có mức xác suất tương ứng là
Pvalue = 0,0000 < α = 0,05
→ Bác bỏ H0 →
 Xuất khẩu có ảnh hưởng đến tổng thu nhập GDP
Kiểm định giả thiết với mức ý nghĩa α = 0,05
Ta thấy có giá trị kiểm định t = 0,3725 có mức xác xuất tương ứng là
Pvalue = 0,0039 < α = 0,05
 Nhập khẩu có ảnh hưởng đến tổng thu nhập GDP
Kiểm định sự phù hợp của mô hình hồi quy
Kiểm định giả thiết với mức ý nghĩa α = 0,05
là mô hình không phù hợp
là mô hình phù hợp
Từ kết quả trên ta thấy = 0,9978 và
có xác suất Pvalue = 0,0000 < α = 0,05

→ Bác bỏ H0, tức là mô hình hồi quy là phù hợp.

2.3 Kiểm định và khắc phục hiện tượng
2.3.1
a.


Kiểm định sự tồn tại của đa cộng tuyến
Nhận biết đa cộng tuyến
Hệ số sách định bội R2 cao nhưng tỷ số t thấp.
Từ số liệu sử dụng phần mềm eview t có kết quả sau:
Ŷi = 14115,24 + 2,017746X + 24,3044Z – 15,75433N + Ui
Với mức ý nghĩa α = 0,05 thì ta có = 2,179




Nhận xét từ kết quả eview ta có :
R2 = 0.997859 > 0.8
Thống kê t của hệ số tương ứng với biến C là
t1=0.372550 < 2.179
Thống kê t của hệ số tương ứng với biến X là
t2 = 5.389309 > 2.179
Thống kê t của hệ số tương ứng với biến Z là
t3=8.584396 > 2.179
Thống kê t của hệ số tương ứng với biến N là
t4= -3.566101 < 2.179
Ta thấy rằng hệ số xác định bởi R của mô hình hồi quy rất gần 1 , điều
này chứng tỏ mô hình rất là phù hợp .
Trong khi đó thống kê, t1 lại có giá trị rất gần 0, kết quả làm tăng khả

năng chấp nhận H0 không có ý nghĩa về mặt thống kê.
 Vậy có thể nghi ngờ rằng có hiện tượng đa cộng tuyến xảy ra trong
mô hình.
Hệ số tương quan cặp giữa các biến giải thích với cao.
Sử dụng phần mềm Eview ta được bảng như sau:


Từ kết quả trên cho thấy:
+ Hệ số tương quan giữa biến X và Z là 0,985231 > 0,8
+ Hệ số tương quan giữa biến X và N là 0,993728 > 0,8
+ Hệ số tương quan giữa biến Z và N là 0,992928 > 0,8
 Có thể nói ở đây xuất hiện hiện tượng đa cộng tuyến.
• Hồi quy phụ
Ta tiến hành hồi quy
Sử dụng phần mềm eview ta được bảng:

Từ bảng eview trên ta được mô hình hồi quy phụ:
= 39237.67 - 0.836896 + 8.976440
Kiểm định giả thiết:
với ý nghĩa α = 0,05

Từ kết quả eview ta thấy F = 519,7134
và có xác suất Pvalue = 0,0000 < α= 0,05




Nên ta bác bỏ giả thiết H0
 Mô hình hồi quy phù hợp
 Xảy ra hiện tượng đa cộng tuyến.

Nhân tử phóng đại phương sai VIF
Với biến là X thì R2phụ 2 = 0.987648
suy ra VIF = 80.958549 10
 Có hiện tượng đa cộng tuyến

Với biến Z thì R2phụ 3= 0.986079
suy ra VIF = 71.833919 10


Có hiện tượng đa cộng tuyến.


Với biến N thì R2phụ 4= 0.994062
suy ra VIF = 168,406871 10


Có hiện tượng đa cộng tuyến




Đo độ Theil
Xét mô hình hồi quy Y theo X ta được kết quả:

Xét mô hình hồi quy Y theo Z ta được kết quả:

Xét mô hình hồi quy Y theo N ta được kết quả


b.


Từ 3 bảng trên ta thu được kết quả:
= 0,982058
= 0,992555
= 0,981147
Độ đo Theil:
m = R2 – (R2 - ) – (R2 - ) – (R2 - )
= 0,997859 – (0,997859 - 0,982058) – (0,997859 - 0,992555) –
(0,997859 - 0,981147)
= 0,960042
Vậy độ đo của Theil về mức độ đa cộng tuyến là 0,960042
Khắc phục hiện tượng đa cộng tuyến
- Phương pháp tăng kích thước mẫu
• Ban đầu n=16, k=4, với số liệu đã cho có xảy ra hiện tượng đa
cộng tuyến, bằng phương pháp thêm số liệu từ điều tra thêm mẫu
tức n tăng để khắc phục hiện tượng đa cộng tuyến ta có:
Khi này n’=26 tức thêm 10 mẫu nữa vào n=16.
• Ta sẽ thêm số liệu mới khi này như sau:

Năm
1990
1991
1992
1993
1994
1995
1996
1997
1998


GDP
39284.0
72620.0
106757.0
134913.0
174017.0
228677.0
269654.0
308600.0
352836.0

Đầu tư
57912.0
59679.0
61894.0
68344.0
71171.0
72447.0
87394.0
108370.0
117134.0

Xuất khẩu
2404.0
2087.1
2580.7
2985.2
4054.3
5448.9
7255.8

9185.0
9360.3

Nhập khẩu
2752.4
2338.1
2540.8
3923.9
5825.8
8155.4
11143.6
11592.3
11499.6


1999

392693.0


131171.0

11541.4

11742.1

Tiến hành hồi quy trên eview với n’=26 và k=4 với số liệu trên ta
được kết quả như sau:

Nhận thấy: với mức ý nghĩa 5%:.

R2 = 0,997825 > 0,8
P_value 1 = 0,4407 > 0,05
P_value 2 = 0,0000 < 0,05 ( không t/m)
P_value 3 = 0.0000 < 0,05 ( không t/m)
P_value 4 = 0,0041 < 0,05 ( không t/m)




Với so sánh trên ta nhận thấy mô hình không tồn tại
hiện tượng đa cộng tuyến nữa.

Tuy nhiên bằng phương pháp tương quan cặp giữa các biến giải
thích cao ta có:

Từ bảng trên ta thấy hệ số tương quan cặp giữa các biến giải thích
đều rất cao:
Hệ số tương quan giữa biến X và Z là 0.989511 > 0.8
Hệ số tương quan giữa biến X và N là 0.996033 > 0.8
Hệ số tương quan giữa biến Z và N là 0.994692 > 0.8
Phương pháp lấy thêm biến chưa thực sự hiệu quả để
có thể khắc phục được hiện tượng đa cộng tuyến.
Phương pháp loại bỏ biến
Loại bỏ biến X ta sẽ có mô hình hồi quy:


-

= 93286,89 + 22,61576Z + 2,357846N
= 0,992675

t1 = 1,503269
t2 = 4,523300


t3 = 0,462768
Khi bỏ biến Z ta có:

= -132468,7 + 1,662055X + 11,72962N
= 0,984708
Khi bỏ biến N ta có:
= 0,995589

Ta thấy rằng > > nên khi mô hình loại bỏ biến Z sẽ có sự phù hợp
cao hơn khi bỉ hai biến X và N.



×