Tải bản đầy đủ (.pdf) (16 trang)

Bài giảng Kinh tế lượng: Chương 4 - Nguyễn Ngọc Lam (2017)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (356.95 KB, 16 trang )

Chương 4: Đa cộng tuyến






Bản chất của đa cộng tuyến
Ước lượng trong trường hợp có đa cộng tuyến
Hậu quả của đa cộng tuyến
Phát hiện đa cộng tuyến
Các biện pháp khắc phục

104


Bản chất của đa cộng tuyến
Đa cộng tuyến (Multicollinearity):
Ragnar Frisch: Đa cộng tuyến có nghĩa là sự tồn
tại mối quan hệ tuyến tính “hoàn hảo” hoặc
chính xác giữa một số hoặc tất cả các biến giải
thích trong một mô hình hồi qui.

105


Minh họa bằng hình ảnh

106



Xét hàm hồi qui tuyến tính k biến độc lập:
Yi = 1 + 2X2i + 3X3i + … + kXki + Ui
 Đa cộng tuyến hoàn hảo: Nếu tồn tại các số i
không đồng thời bằng 0 sao cho:
2X2i + 3X3i + …… + kXki = 0
Có nghĩa là tồn tại biến độc lập biểu diễn tuyến
tính qua các biến còn lại.
 Đa cộng tuyến không hoàn hảo: Nếu tồn tại
các số i không đồng thời bằng 0 sao cho:
2X2i + 3X3i + …… + kXki + V = 0

107


Ví dụ:
X2

10

15

18

24

30

X3

50


75

90

120

150

X4

52

75

97

129

152

X3i = 5X2i, vì vậy có cộng tuyến hoàn hảo giữa X2 và
X3 ; r23 = 1
X2 và X4 không có cộng tuyến hoàn hảo, nhưng hai
biến này có tương quan chặt chẽ.

108


Lưu ý:

Giả định về sự đa cộng tuyến liên quan đến mối
quan hệ tuyến tính giữa các biến Xi, và không
đề cập đến các mối quan hệ phi tuyến tính.
 Xem xét mô hình:
Y = 1 + 2X + 3X2 + 4X3 + U
Rõ ràng X2 và X3 có mối quan hệ hàm số với X
nhưng phi tuyến tính nên không vi phạm giả
định về đa cộng tuyến.


109


Ước lượng tham số khi có đa cộng tuyến


Xét mô hình hồi qui 2 biến dưới dạng sau:
Yi = 1 + 2 X2i + 3 X2i + Ui

Var ( B2 ) 
Var ( B3 ) 

2

1

2

1


.
2
2
 x2i 1  r23
2
 x3i

xi  X i  X , yi  Yi  Y

.
2
1  r23

Nếu X2, X3 có quan hệ tuyến tính chặt chẽ r23 gần ±1
Do đó phương sai sẽ rất lớn.

110


Hậu quả nếu có đa cộng tuyến gần hoàn hảo:
1.
2.

3.

4.
5.
6.

Ước lượng phương sai sẽ lớn.

Ước lượng các tham số sẽ rộng.
i  ( Bi t n k 1, / 2S Bi )
Kiểm định tham số có khuynh hướng chấp
nhận.
Bi
t
S Bi
Các ước lượng sẽ nhạy với thay đổi nhỏ của
dữ liệu.
Dấu của các tham số có thể sai.
Thêm vào hoặc bớt đi biến có đa cộng tuyến
mô hình sẽ thay đổi nhiều.
111


Phát hiện đa cộng tuyến
1. Hệ số R2 lớn nhưng tỷ số t nhỏ.
Ví dụ: file Luong tieu thu xang
. regress ttxang maluc nang may lit
Source

SS

df

MS

Model
Residual


491.602177
141.640345

4
45

122.900544
3.14756322

Total

633.242522

49

12.9233168

ttxang

Coef.

maluc
nang
may
lit
_cons

-.0458493
-.0090899
.2452276

.1754044
26.2235

Std. Err.
.0164784
.0021871
.5363098
.8819955
2.319522

t
-2.78
-4.16
0.46
0.20
11.31

Number of obs
F( 4,
45)
Prob > F
R-squared
Adj R-squared
Root MSE
P>|t|
0.008
0.000
0.650
0.843
0.000


=
=
=
=
=
=

50
39.05
0.0000
0.7763
0.7564
1.7741

[95% Conf. Interval]
-.0790386
-.0134949
-.8349558
-1.601026
21.55174

-.01266
-.0046849
1.325411
1.951834
30.89526

112



Phát hiện đa cộng tuyến
2. Tương quan cặp giữa các biến giải thích cao
. pwcorr maluc

nang may lit, sig
maluc

nang

may

maluc

1.0000

nang

0.7857
0.0000

1.0000

may

0.7517
0.0000

0.8023
0.0000


1.0000

lit

0.8176
0.0000

0.9008
0.0000

0.9415
0.0000

lit

1.0000

113


Phát hiện đa cộng tuyến
3. Sử dụng mô hình hồi qui phụ:
X j  1   2 X 2  ...   j 1 X j 1   j 1 X j 1  ...   k X k  Vi
Với biến phụ thuộc là Xj có hệ số tương quan lớn. Nếu mô
hình có ý nghĩa thì ta nghi ngờ có hiện tượng đa cộng tuyến.
. regress lit maluc nang may
Source

SS


df

MS

Model
Residual

75.8529175
4.04614798

3
46

25.2843058
.087959739

Total

79.8990655

49

1.63059317

lit

Coef.

maluc

nang
may
_cons

.0048422
.0015889
.5005502
-2.303298

Std. Err.
.0026606
.0002807
.050903
.1871391

t
1.82
5.66
9.83
-12.31

Number of obs
F( 3,
46)
Prob > F
R-squared
Adj R-squared
Root MSE
P>|t|
0.075

0.000
0.000
0.000

=
=
=
=
=
=

50
287.45
0.0000
0.9494
0.9461
.29658

[95% Conf. Interval]
-.0005133
.0010239
.3980877
-2.67999

.0101976
.0021539
.6030127
-1.926606
114



Phát hiện đa cộng tuyến
4. Sử dụng yếu tố phóng đại phương sai (VIF)
VIF  1 2
1 R j

Rj2 là hệ số xác định của hàm hồi qui phụ. Nếu VIF lớn hơn 10 có
thể nghi ngờ xảy ra hiện tượng đa cộng tuyến.
. vif
Variable

VIF

1/VIF

lit
may
nang
maluc

19.75
9.76
6.07
3.14

0.050641
0.102445
0.164798
0.318373


Mean VIF

9.68
115


Các biện pháp khắc phục
1. Sử dụng thông tin tiên nghiệm:
Ví dụ: hàm sản xuất Cobb-Douglas:


 ut

Qt  ALt K t e

Qt là sản lượng sản phẩm sản xuất ở thời kỳ t
Lt là lao động ở thời kỳ t;
Kt là vốn ở thời kỳ t;
Ut là sai số ngẫu nhiên
Logarit 2 vế ta được:
ln Q  ln A   ln L   ln K  U
Q*  A*  L*   K *  U
116


1. Sử dụng thông tin tiên nghiệm:
Logarit 2 vế ta được:
ln Q  ln A   ln L   ln K  U
Q*  A*  L*  K *  U


Dựa vào thông nào đó chúng ta biết hàm sản xuất
thu nhập theo qui mô không đổi:  +  = 1.
=>  = 1 - 
Qt*  Kt*  A*   ( L*t  Kt* )  U t
 Yt*  A*  X t*  U t

117


Các biện pháp khắc phục
2. Thu thập thêm số liệu hoặc thu thập mới.
Hiện tượng đa cộng tuyến nhiều khi do đặc tính
của mẫu, do đó khi gia tăng kích thước mẫu có
thể làm giảm đa cộng tuyến.
3. Bỏ bớt biến xảy ra đa cộng tuyến:
Thông thường ta bỏ biến nào gây ra đa cộng
tuyến nhiều.

118


Các biện pháp khắc phục
. regress ttxang maluc nang may
Source

SS

df

MS


Model
Residual

491.477691
141.764832

3
46

163.825897
3.08184417

Total

633.242522

49

12.9233168

ttxang

Coef.

maluc
nang
may
_cons


-.0449999
-.0088112
.3330264
25.81949

Std. Err.
.0157484
.0016614
.3013056
1.107715

t
-2.86
-5.30
1.11
23.31

Number of obs
F( 3,
46)
Prob > F
R-squared
Adj R-squared
Root MSE
P>|t|
0.006
0.000
0.275
0.000


=
=
=
=
=
=

50
53.16
0.0000
0.7761
0.7615
1.7555

[95% Conf. Interval]
-.0766997
-.0121555
-.2734702
23.58978

-.0133001
-.0054669
.939523
28.04921

. vif
Variable

VIF


1/VIF

nang
may
maluc

3.58
3.15
2.93

0.279601
0.317793
0.341298

Mean VIF

3.22
119



×