Chương 5: Đa cộng tuyến
Bản chất của đa cộng tuyến
Ước lượng trong trường hợp có đa cộng
tuyến
Hậu quả của đa cộng tuyến
Phát hiện đa cộng tuyến
Các biện pháp khắc phục
Bản chất của đa cộng tuyến
Đa cộng tuyến là gì ?
Ragnar Frisch: Đa cộng tuyến có nghĩa là sự
tồn tại mối quan hệ tuyến tính “hoàn hảo”
hoặc chính xác giữa một số hoặc tất cả các
biến giải thích trong một mô hình hồi qui.
Xét hàm hồi qui tuyến tính k-1 biến độc lập:
Y
i
= β
1
+ β
2
X
2i
+ β
3
X
3i
+ … + β
k
X
ki
+ U
i
Nếu tồn tại các số λ
2
, λ
3
, …… λ
k
sao cho:
λ
2
X
2i
+ λ
3
X
3i
+ …… + λ
k
X
ki
= 0
Với λ
i
( i = 2, 3, k…) không đồng thời bằng
không thì giữa các biến X
i
(i = 2, 3, …k) xảy
ra hiện tượng đa cộng tuyến hoàn hảo.
Nói cách khác là xảy ra trường hợp một biến
giải thích nào đó được biểu diễn dưới dạng
một tổ hợp tuyến tính của các biến còn lại.
Nếu λ
2
X
2i
+ λ
3
X
3i
+ …… + λ
k
X
ki
+ v
i
= 0,
Với v
i
là sai số ngẫu nhiên thì ta có hiện tượng
đa cộng tuyến không hoàn hảo giữa các
biến giải thích.
Nói cách khác là một biến giải thích nào đó có
tương quan với một số biến giải thích khác.
Ví dụ
X
3i
= 5X
2i
, vì vậy có cộng tuyến hoàn hảo giữa X
2
và X
3
; r
23
= 1
X
2
và X
3
* không có cộng tuyến hoàn hảo, nhưng
hai biến này có tương quan chặt chẽ.
X
2
10 15 18 24 30
X
3
50 75 90 120 150
X
*
3
52 75 97 129 152
Lưu ý
Giả định về sự đa cộng tuyến liên quan đến
mối quan hệ tuyến tính giữa các biến X
i
, và
không đề cập đến các mối quan hệ phi
tuyến tính.
Xem xét mô hình:
Y
i
= β
0
+ β
1
X
i
+ β
2
X
i
2
+ β
3
X
i
3
+ u
i
,
Rõ ràng X
i
2
và X
i
3
có mối quan hệ hàm số với X
i
nhưng phi tuyến tính nên không vi phạm
giả định về đa cộng tuyến.
Minh họa bằng hình ảnh
Ước lượng trong trường hợp có đa cộng
tuyến
1. Trường hợp có đa cộng tuyến hoàn hảo
Trường hợp đa cộng tuyến hoàn hảo, các
hệ số hồi qui không xác định và các sai số
chuẩn của chúng là vô hạn.
Xét mô hình hồi qui 3 biến dưới dạng sau:
Y
i
= β
2
X
2i
+ β
3
X
3i
+ e
i
giả sử X
3i
= λX
2i
, mô hình trên có thể được
biến đổi thành:
Y
i
= (β
2
+ λβ
3
)X
2i
+ e
i
= β
0
X
2i
+ e
i
Chúng ta có thể ước lượng được β
0
nhưng không
thể tách riêng được β
2
và β
3
Như vậy, trong trường hợp đa cộng tuyến hoàn hảo,
không thể có lời giải duy nhất cho các hệ số hồi qui
riêng, β
i
.
Trong trường hợp đa cộng tuyến hoàn hảo, phương
sai và sai số chuẩn của β
2
và β
3
là vô hạn.
Ước lượng của β
2
trong hàm hồi quy 3 biến
như sau:
Giả sử X
3i
= λX
2i
:
Các hệ số ước lượng không xác định: chúng ta không tách rời tác động của từng biến
X
i
lên Y
do không thể giả định X
2
thay đổi trong khi X
3
không đổi.
Ước lượng trong trường hợp có đa cộng
tuyến
2. Trường hợp có đa cộng tuyến không hoàn
hảo
Đa cộng tuyến hoàn hảo thường không
xảy ra trong thực tế.
Xét mô hình hồi qui 3 biến dưới dạng sau:
y
i
= β
2
x
2i
+ β
3
x
3i
+ e
i
Giả định x
3i
= λ x
2i
+ v
i
Với λ ≠ 0 và v
i
là sai số ngẫu nhiên.
Trong trường hợp này, các hệ số hồi qui β
2
và β
3
có thể ước lượng được:
Ước lượng trong trường hợp đa cộng
tuyến không hoàn hảo
Ta có thể ước lượng được các β này
nhưng s.e. sẽ rất lớn.