Ước lượng trong trường hợp đa
cộng tuyến không hoàn hảo
Ta có thể ước lượng được các này
nhưng s.e. sẽ rất lớn.
Hậu quả của đa cộng tuyến
Nếu có cộng tuyến gần hoàn hảo:
Các ước lượng vẫn BLUE, nhưng:
Phương sai và hiệp phương sai của các
ước lượng OLS lớn.
r
23
là hệ số
tương quan
giữa X
2
và X
3
.
Khi r
23
1,
các giá trị
trên
Hậu quả của đa cộng tuyến
Nếu có cộng tuyến gần hoàn hảo:
2. Khoảng tin cậy rộng hơn.
khoảng tin cậy của
2
và
3
(với độ tin cậy
1 – ) là:
2
= t
/2
se ( );
3
= t
/2
se ( );
trong đó:
se ( ) = se ( ) =
^
2
^
2
^
3
^
2
^
3
2
2
2
23
)1(
i
xr
^
3
2
3
2
23
)1(
i
xr
Hậu quả của đa cộng tuyến
Nếu có cộng tuyến gần hoàn hảo:
3. Tỉ số t "không có ý nghĩa".
khi kiểm định giả thuyết H
0
:
2
= 0, chúng ta
sử dụng tỷ số t.
và so sánh giá trị ước lượng của t với giá trị tra
bảng (tới hạn) của t.
Trong trường hợp cộng tuyến cao thì sai số
chuẩn sẽ rất lớn và do đó làm cho giá trị t sẽ
nhỏ đi, kết quả là sẽ làm tăng chấp nhận giả
thuyết H
0
.
)
ˆ
(se
ˆ
t
2
2
Hậu quả của đa cộng tuyến
Nếu có cộng tuyến gần hoàn hảo:
3. R
2
cao nhưng tỉ số t ít có ý nghĩa.
Đa cộng tuyến cao:
- một hoặc một số tham số tương quan
(hệ số góc riêng) không có ý nghĩa về
mặt thống kê
- R
2
trong những trường hợp này lại rất
cao (trên 0,9).
- kiểm định F thì có thể bác bỏ giả
thuyết cho rằng
2
=
3
= … =
k
= 0.
Hậu quả của đa cộng tuyến
Nếu có cộng tuyến gần hoàn hảo:
4. Các ước lượng OLS và sai số chuẩn của
chúng trở nên rất nhạy với những thay
đổi nhỏ trong dữ liệu.
5. Dấu của các ước lượng của các hệ số hồi
qui có thể sai
6. Thêm vào hay bớt đi các biến cộng
tuyến với các biến khác, mô hình sẽ
thay đổi về dấu hoặc thay đổi về độ lớn
của các ước lượng.
Ví dụ: hậu quả của đa cộng tuyến
Xét 2 mẫu sau:
Ví dụ: hậu quả của đa cộng tuyến
Phương trình hồi quy của từng mẫu:
Phát hiện đa cộng tuyến
1. Hệ số R
2
lớn nhưng tỷ số t nhỏ
2. Tương quan cặp giữa các biến giải thích
cao
3. Sử dụng mô hình hồi qui phụ
4. Sử dụng yếu tố phóng đại phương sai
(VIF)
Hệ số R
2
lớn nhưng tỷ số t nhỏ
Đây là triệu chứng “kinh điển” của đa
cộng tuyến,
Nếu R
2
cao, chẳng hạn, >0,8 và F
test bác bỏ giả thuyết
2
=
3
= … =
k
= 0, nhưng t test cho từng
i
lại
chấp nhận H
0
.
2. Tương quan giữa các cặp biến giải thích
cao
Stata: corr my anh nhat duc phap
| my anh nhat duc phap
+
my | 1.0000
anh | 0.8121 1.0000
nhat | 0.4515 0.5235 1.0000
duc | 0.2168 0.1510 0.2436 1.0000
phap | 0.9244 0.8933 0.6042 0.1739 1.0000
Nếu tương quan cặp giữa các biến giải
thích cao (lớn hơn 0, 8) thì có thể xảy
ra hiện tượng đa cộng tuyến.