CHƯƠNG 6
CHƯƠNG 6
HIỆN TƯỢNG ĐA CỘNG TUYẾN
HIỆN TƯỢNG ĐA CỘNG TUYẾN
(MULTICOLLINEARITY)
(MULTICOLLINEARITY)
2
1. Hi u b n ch t và h u qu ể ả ấ ậ ả
c a đa c ng tuy nủ ộ ế
2. Bi t cách phát hi n đa c ng ế ệ ộ
tuy n và bi n pháp kh c ph c ế ệ ắ ụ
M C Ụ
TIÊU
BIẾN GIẢ
NỘI DUNG
Bản chất, nguyên nhân của đa cộng tuyến
1
Ước lượng các tham số
2
3
Phát hiện đa cộng tuyến4
Khắc phục đa cộng tuyến
5
Hậu quả
3
4
Trong mô hình hồi quy bội
Có sự phụ thuộc tuyến tính cao giữa các
biến giải thích
kikiii
XXXY
ββββ
ˆ
ˆˆˆ
ˆ
33221
++++=
6.1 Bản chất của đa cộng tuyến
Đa cộng tuyến
Đa cộng tuyến
5
6.1 Bản chất của đa cộng tuyến
a. Đa cộng tuyến hoàn hảo
Tồn tại λ
2
, λ
3
,… λ
k
không đồng thời bằng 0
sao cho
λ
2
X
2
+ λ
3
X
3
+ …+ λ
k
X
k
= 0
b. Đa cộng tuyến không hoàn hảo
λ
2
X
2
+ λ
3
X
3
+ …+ λ
k
X
k
+ v
i
= 0
với v
i
là sai số ngẫu nhiên.
6
X
3i
= 5X
2i
, có cộng tuyến hoàn hảo giữa X
2
và
X
3
; r
23
= 1
X
2
và X
4
có cộng tuyến không hoàn hảo
X
2
10 15 18 24 30
X
3
50 75 90 120 150
X
4
V
52
2
75
0
97
7
129
9
152
2
6.1 Bản chất của đa cộng tuyến
VD
7
6.1 Bản chất của đa cộng tuyến
Hình 6.1 Biểu đồ Venn mô tả hiện tượng đa cộng tuyến
Y
X
2
X
3
Không có đa cộng tuyến Đa cộng tuyến thấp
Y
X
2
X
3
8
Hình 6.1 Biểu đồ Venn mô tả hiện tượng đa cộng tuyến
6.1 Bản chất của đa cộng tuyến
Y
X
2
X
3
Đa cộng tuyến cao
Y
X
2
X
3
Đa cộng tuyến hoàn hảo
9
- Chọn các biến độc lập có mối quan có
quan hệ nhân quả hay có tương quan cao
vì đồng phụ thuộc vào một điều kiện khác.
- Số quan sát nhỏ hơn số biến độc lập.
- Cách thu thập mẫu: mẫu không đặc trưng
cho tổng thể
- Chọn biến X
i
có độ biến thiên nhỏ.
6.1 Nguyên nhân của đa cộng tuyến
6.2 Ước lượng khi có đa cộng tuyến
1. Trường hợp có đa cộng tuyến hoàn hảo
Xét mô hình hồi qui 3 biến dưới dạng sau:
Y
i
= β
2
X
2i
+ β
3
X
3i
+ e
i
giả sử X
3i
= λX
2i
, mô hình được biến đổi thành:
Y
i
= (β
2
+ λβ
3
)X
2i
+ e
i
= β
0
X
2i
+ e
i
Phương pháp OLS
10
∑
∑
=+=
2
2
2
32
)
ˆˆ
(
ˆ
i
ii
o
x
yx
βλββ
Không thể tìm được lời giải duy nhất cho
32
ˆ
,
ˆ
ββ
11
2
32
2
3
2
2
323
2
32
2
)(
ˆ
∑∑ ∑
∑ ∑ ∑ ∑
−
−
=
iiii
iiiiiii
xxxx
xxxyxxy
β
0
0
ˆ
2
3
2
3
22
3
2
3
2
333
2
33
2
=
−
−
=
∑∑∑ ∑
∑ ∑ ∑ ∑
iiii
iiiiiii
xxxx
xxxyxxy
λλ
λλ
β
Các hệ số ước lượng không xác định
Phương sai và sai số chuẩn của β
2
và β
3
là
vô hạn
6.2 Ước lượng khi có đa cộng tuyến
2. Trường hợp có đa cộng tuyến không
hoàn hảo
Đa cộng tuyến hoàn hảo thường không
xảy ra trong thực tế.
Xét mô hình hồi qui 3 biến dưới dạng sau:
y
i
= β
2
x
2i
+ β
3
x
3i
+ e
i
Giả sử x
3i
= λ x
2i
+ v
i
Với λ ≠ 0 và v
i
là sai số ngẫu nhiên
12
6.2 Ước lượng khi có đa cộng tuyến
Có thể ước lượng được các hệ số hồi
quy nhưng sai số chuẩn rất lớn.
Có thể ước lượng được các hệ số hồi
quy nhưng sai số chuẩn rất lớn.
13
6.2 Ước lượng khi có đa cộng tuyến
( )
( ) ( )( )
( )( ) ( )
2
2
2
222
2
22
2
2
22
222
2
2
2
2
ˆ
∑∑ ∑∑
∑∑ ∑∑ ∑∑
−+
+−+
=
iiii
iiiiiiiii
xvxx
xvyxyvxxy
λλ
λλλ
β
6.3 Hậu quả của đa cộng tuyến
Nếu có cộng tuyến gần hoàn hảo
1. Phương sai và hiệp phương sai của các
ước lượng OLS lớn.
2. Khoảng tin cậy rộng hơn.
3. Tỉ số t "không có ý nghĩa"
4. R
2
cao nhưng tỉ số t ít có ý nghĩa
14
5. Các ước lượng OLS và sai số chuẩn của
chúng trở nên rất nhạy với những thay
đổi nhỏ trong dữ liệu.
6. Dấu của các ước lượng của các hệ số hồi
qui có thể sai
7. Thêm vào hay bớt đi các biến cộng tuyến
với các biến khác, mô hình sẽ thay đổi
về dấu hoặc thay đổi về độ lớn của các
ước lượng.
15
6.3 Hậu quả của đa cộng tuyến
16
Đa cộng tuyến là một hiện tượng theo
mẫu, nghĩa là cho dù các biến độc lập
X
i
không tương quan tuyến tính trong
tổng thể nhưng chúng có thể tương
quan tuyến tính trong một mẫu cụ thể
nào đó. Do đó cỡ mẫu lớn thì hiện
tượng đa cộng tuyến ít nghiêm trọng
hơn cỡ mẫu nhỏ
6.3 Hậu quả của đa cộng tuyến
17
1. Hệ số R
2
lớn nhưng tỷ số t nhỏ
2. Tương quan cặp giữa các biến giải
thích cao
3. Sử dụng mô hình hồi qui phụ
4. Sử dụng yếu tố phóng đại phương sai
(VIF)
6.4 Cách phát hiện đa cộng tuyến
18
1. R
2
lớn nhưng tỷ số t nhỏ
2. Tương quan cặp giữa các biến giải thích
cao
Trong đó X, Z là 2 biến giải thích trong mô
hình
∑
∑
−−
−−
=
22
)()(
))((
ZZXX
ZZXX
r
ii
ii
XZ
6.4 Cách phát hiện đa cộng tuyến
19
3. Sử dụng mô hình hồi quy phụ
Hồi qui một biến giải thích X theo các biến còn lại
Tính R
2
và F cho mỗi mô hình
Lập giả thiết H
0
: R
2
= 0 ~ H
0:
không có đa cộng tuyến
Nếu F > F
α
(m-1,n-k): bác bỏ H
0
hay có đa cộng tuyến
Nếu F < F
α
(m-1,n-k): chấp nhận H
0
hay không có đa
cộng tuyến
mikii
XXX
βββ
ˆ
ˆˆ
ˆ
3312
+++=
)1)(1(
)(
2
2
−−
−
=
mR
mnR
F
6.4 Cách phát hiện đa cộng tuyến
20
4. Sử dụng nhân tử phóng đại phương sai (VIF)
Đối với hàm hồi quy 2 biến giải thích
Đối với trường hợp tổng quát, có (k-1) biến giải thích
R
2
j
: là giá trị R
2
trong hàm hồi quy của X
j
theo (k-2)
biến giải thích còn lại.
Thông thường khi VIF > 10, thì biến này được coi là
có cộng tuyến cao
)1(
1
2
23
r
VIF
−
=
)1(
1
2
j
R
VIF
−
=
6.4 Cách phát hiện đa cộng tuyến
21
1. Dùng thông tin tiên nghiệm
Ví dụ mô hình sản xuất Cobb-Douglas
Ln(Y
i
)=β
1
+ β
2
ln(K
i
)+ β
3
ln(L
i
) + u
i
Có thể xảy ra đa cộng tuyến do K và L cùng
tăng theo quy mô sản xuất. Nếu biết hiệu suất
không đổi theo quy mô tức là β
2
+β
3
=1 thì
Ln(Y
i
)=β
1
+ β
2
ln(K
i
)+ (1-β
2
)ln(L
i
) + u
i
Ln(Y
i
) – Ln(L
i
) = β
1
+ β
2
[ln(K
i
) - ln(L
i
)] + u
i
Ln(Y
i
/L
i
) = β
1
+ β
2
ln(K
i
/L
i
) + u
i
=> mất đa cộng tuyến (vì đây là mô hình hồi
quy đơn)
6.5 Cách khắc phục
22
2. Loại trừ một biến giải thích ra khỏi mô
hình
B1: Xem cặp biến giải thích nào có quan hệ
chặt chẽ. Giả sử X
2
, X
3
…X
k
là các biến độc
lập, Y là biến phụ thuộc và X
2
, X
3
có tương
quan chặt chẽ với nhau.
B2: Tính R
2
đối với các hàm hồi quy: có mặt
cả 2 biến; không có mặt một trong 2 biến
B3: Loại biến mà giá trị R
2
tính được khi
không có mặt biến đó là lớn hơn.
6.5 Cách khắc phục
23
6.5 Cách khắc phục
3. Bổ sung thêm dữ liệu hoặc chọn mẫu mới
∑
−
=
)1(
)
ˆ
var(
2
23
2
2
2
2
rx
i
σ
β
24
4. Dùng sai phân cấp 1
Có hàm hồi qui: y
t
= α
1
+ β
1
x
1t
+ β
2
x
2t
+ u
t
suy ra
y
t-1
= α
1
+ β
1
x
1,t-1
+ β
2
x
2,t-1
+ u
t-1
Trừ hai vế cho nhau, được:
y
t
– y
t – 1
= β
1
(x
1,t
– x
1,t – 1
) + β
2
(x
2,t
– x
2,t – 1
) + (u
t
– u
t – 1
)
Hay:
∆y
t
= β
1
∆ x
1,t
+ β
2
∆ x
2,t
+ e
t
,
6.5 Cách khắc phục