Mr.tiz
Nhóm 1
Hiện tượng đa cộng tuyến
Hiện tượng đa cộng tuyến
Mr.tiz
Hiện tượng đa cộng tuyến
Khái niệm
hiện tượng
đa cộng tuyến
Phương pháp
phát hiện
hiện tượng
Biện pháp
khắc phục
hiện tượng
Mr.tiz
Ví dụ
•
NI: tổng thu nhập quốc gia
•
GDP: tổng thu nhập quốc dân
•
NFIA: Thu nhập ròng từ nước ngoài
Mr.tiz
Khái niệm hiện tượng đa
cộng tuyến
•
Hiện tượng đa cộng tuyến là hiện
tượng các biến độc lập trong mô hình
phụ thuộc lẫn nhau và có quan hệ gần
như tuyến tính.
Mr.tiz
Nguồn gốc hiện tượng
1.Do phương pháp thu
thập dữ liệu
-Các giá trị của các biến độc lập phụ
thuộc lẫn nhau trong mẫu, nhưng
không phụ thuộc lẫn nhau trong
tổng thể.
VD: Người có thu nhập cao hơn
khuynh hướng sẽ có nhiều của cải
hơn.điều này có thể đúng với mẫu
mà không đúng trong tổng thể.
Trong tổng thể sẽ có các quan sát
về cá nhân có thu nhập cao nhưng
không có nhiều của cải và ngược
lại.
2.Dạng hàm mô hình
VD các dạng dễ xảy ra hiện
tượng đa cộng tuyến:
Hồi quy dạng các biến độc
lập được bình phương sẽ xảy
ra đa cộng tuyến và đặc biệt
khi phạm vi giá trị ban đầu
của biến độc lập là nhỏ
Các biến độc lập vĩ mô được
quan sát theo dữ liệu chuỗi
thời gian
Mr.tiz
I.Phương pháp phát hiện
hiện tượng
Hệ số xác định bội cao
nhưng tỷ số t thấp
Hệ số tương quan cặp
giữa các biến giải thích cao
Sử dụng mô hình hồi quy phụ
Sử dụng nhân tử phóng đại
phương sai VIF
Mr.tiz
1.Hệ số xác định bội cao
1.Hệ số xác định bội cao
nhưng tỷ số t thấp
nhưng tỷ số t thấp
•
Nếu thấy mà tỷ số t
thấp đó chính là dấu hiệu của đa
cộng tuyến.
2 2
( 0.8)R cao R
>
Mr.tiz
Mr.tiz
2.Hệ số tương quan cặp giữa
2.Hệ số tương quan cặp giữa
các biến giải thích cao
các biến giải thích cao
•
Công thức tính:
Công thức tính:
•
Nếu các hệ số tương quan cặp giữa các biến
Nếu các hệ số tương quan cặp giữa các biến
|
|
r
r
XjXp
XjXp
|
|
lớn
lớn
(vượt 0,8) thì có hiện tượng đa cộng tuyến.
(vượt 0,8) thì có hiện tượng đa cộng tuyến.
•
Chú ý:
Chú ý:
–
chúng ta cần chú ý rằng hiện tượng đa cộng tuyến vẫn xảy
chúng ta cần chú ý rằng hiện tượng đa cộng tuyến vẫn xảy
ra khi các hệ số tương quan cặp r
ra khi các hệ số tương quan cặp r
XjXp
XjXp
nhỏ.
nhỏ.
–
Nếu mô hình chỉ có 2 biến giải thích thì nếu hệ số tương
Nếu mô hình chỉ có 2 biến giải thích thì nếu hệ số tương
quan giữa 2 biến giải thích đó mà nhỏ thì không có hiện tượng
quan giữa 2 biến giải thích đó mà nhỏ thì không có hiện tượng
cộng tuyến.
cộng tuyến.
∑∑
∑
−−
−−
=
22
)()(
))((
ppijji
ppijji
XXXX
XXXX
r
p
x
j
x
Mr.tiz
Mr.tiz
3.Sử dụng mô hình hồi quy phụ
3.Sử dụng mô hình hồi quy phụ
-
Hồi quy giữa một biến độc lập với tất cả các biến
độc lập với nhau và quan sát hệ số của các hồi
quy phụ
-
Thực hiện tính thống kê F
k là số biến độc lập trong hồi quy phụ
Nếu thì chúng ta có thể kết luận rằng = 0
và điều này có nghĩa là có đa cộng tuyến trong mô
hình.
( )
( )
( )
2
1
1
2
2
−
+−
×
−
=
k
kn
R
R
F
2
R
*
FF
>
2
R
Mr.tiz
4.Sử dụng nhân tử phóng đại
4.Sử dụng nhân tử phóng đại
phương sai (VIF)
phương sai (VIF)
Tốc độ gia tăng của phương sai và hiệp phương sai có thể
thấy qua nhân tử phóng đại phương sai (variance-inflation
factor - VIF). Đối với hàm hồi quy có 2 biến giải thích X2 và
X3, VIF được định nghĩa như sau:
VIF cho thấy phương sai của hàm ước lượng tăng nhanh
như thế nào khi có đa cộng tuyến. Khi =1 thì VIF tiến
đến vô hạn. Nếu không có cộng tuyến giữa X2 và X3 thì
VIF = 1.
Từ định nghĩa này, ta có thể rút ra công thức:
)r1(
1
VIF
2
23
−
=
23
r
VIF
x
)
ˆ
var(
2
i2
2
2
∑
σ
=β
VIF
x
)
ˆ
var(
2
i3
2
3
∑
σ
=β
Mr.tiz
2
ˆ
β
3
ˆ
β
Cov(
,
Giá trị của r
23
VIF )
0,00
0,50
0,70
0,80
0,90
0,95
0,97
0,99
0,995
0,999
1,00
1,33
1,96
2,78
5,76
10,26
16,92
50,25
100,00
500,00
1A
1,33A
1,96A
2,78A
5,76A
10,26A
16,92A
50,25A
100A
500A
0
0,67B
1,37B
2,22B
4,73B
9,74B
16,41B
49,75B
99,5B
499,5B
Để có khái niệm về phương sai và hiệp phương sai tăng như thế nào
Để có khái niệm về phương sai và hiệp phương sai tăng như thế nào
khi r23 tăng
khi r23 tăng
.
.
Nhìn bảng số liệu dưới đây:
Nhìn bảng số liệu dưới đây:
Từ kết quả tính toán cho ở bảng này, ta thấy gia tăng ảnh hưởng
Từ kết quả tính toán cho ở bảng này, ta thấy gia tăng ảnh hưởng
nghiêm trọng đến phương sai và hiệp phương sai ước lượng của các hàm
nghiêm trọng đến phương sai và hiệp phương sai ước lượng của các hàm
ước lượng OLS. Khi =0,5 , bằng 1,33 lần khi =0, nhưng khi
ước lượng OLS. Khi =0,5 , bằng 1,33 lần khi =0, nhưng khi
=0,95 thì lớn gấp 10 lần khi không có đa cộng tuyến. Và khi
=0,95 thì lớn gấp 10 lần khi không có đa cộng tuyến. Và khi
tăng từ 0,95 đến 0,995 đã làm phương sai ước lượng tăng 100 lần so với
tăng từ 0,95 đến 0,995 đã làm phương sai ước lượng tăng 100 lần so với
khi không có cộng tuyến. Ảnh hưởng nghiêm trọng này cũng thấy ở
khi không có cộng tuyến. Ảnh hưởng nghiêm trọng này cũng thấy ở
cov(
cov(
, ).
, ).
∑
σ
=
2
i2
2
x
A
∑ ∑
σ−
=
2
i3
2
i2
2
xx
B
Ghi chú:
)
ˆ
(Var
2
β
23
r
23
r
23
r
23
r
23
r
)
ˆ
(Var
2
β
2
ˆ
β
3
ˆ
β
Mr.tiz
Đồ thị phản ánh mối quan hệ
Đồ thị phản ánh mối quan hệ
giữa VIF và r23 như sau:
giữa VIF và r23 như sau:
Trên đồ thị ta thấy, khi r23 tăng từ 0,9 đến 1 thì VIF
tăng rất nhanh.
Khi r23 = 1 thì VIF là vô hạn.
Có nhiều chương trình máy tính cho biết giá trị VIF
đối với các biến độc lập của mô hình hồi quy.
Đối vơi trường hợp tổng quát, có (k-1) biến giải thích
thì:
Với là giá trị trong hàm hồi quy của Xj với
các biến giải thích khác thì sẽ gần 1 và khi đó VIF
sẽ lớn.
Vì vậy một số tác giả dùng VIF như là một dấu hiệu
xác định đa cộng tuyến. Giá trị VIF càng lớn thì biến
Xj càng cộng tuyến cao. Nhưng VIF là bao nhiêu thì
ta có thể coi là có thể xảy ra hiên tượng đa cộng
tuyến. Như một quy tắc kinh nghiệm, nếu VIF 10
(điều này được xảy ra nếu >0,9) thì biến này được
coi là có cộng tuyến cao.
r
23
2
1
1
j
R
VIF
−
=
2
j
R
2
R
2
j
R
≥
2
j
R
Mr.tiz
•
VIF=1/(1-0.84183)=6.3223
=>có đa cộng tuyến
Mr.tiz
II.
II.
Các
Các
biện
biện
pháp
pháp
khắc
khắc
phục
phục
-
-
Sử dụng thông tin tiên
Sử dụng thông tin tiên
nghiệm
nghiệm
-Bỏ biến có khả năng
-Bỏ biến có khả năng
cộng tuyến với các
cộng tuyến với các
biến còn lại
biến còn lại
-Thu thập thêm số liệu
-Thu thập thêm số liệu
hoặc lấy mẫu mới
hoặc lấy mẫu mới
-Sử dụng sai phân cấp
-Sử dụng sai phân cấp
một
một
-Một số biện pháp
-Một số biện pháp
khác
khác
Mr.tiz
1.Sử dụng thông tin tiên nghiệm
1.Sử dụng thông tin tiên nghiệm
Y
i
= β
1
+ β
2
X
2i
+ β
3
X
3i
+ u
i
∀i=1…n
Trong đó: Giữa X
2
và X
3
có cộng tuyến cao.
Giả sử có thông tin β
3
= 0,1β
2
Cách biến đổi như sau:
Y
i
= β
1
+ β
2
X
2i
+ 0,1β
2
X
3i
+ u
i
= β
1
+ β
2
(X
2i
+ 0,1X
3i
) + u
i
Đặt
X
i
= X
2i
+0,1X
3i
Vậy, ta có:
Y
i
= β
1
+ β
2
X
i
+ u
i
Mr.tiz
2.Bỏ biến có khả năng cộng
2.Bỏ biến có khả năng cộng
tuyến với các biến còn lại
tuyến với các biến còn lại
Bỏ biến
Ta có |r
XjXp
|>0 ,8 → Bỏ 1 trong 2 biến
này.
Cách thực hiện
–
Bỏ Xj, thực hiện hồi quy giữa Y và các biến
giải thích còn lại và tính hệ số xác định R
j
2
–
Bỏ Xp, thực hiện hồi qui giữa Y và các biến
giải thích còn lại và tính hệ số xác định R
p
2
Nếu R
p
2
> R
j
2
=> bỏ Xp
Mr.tiz
Hồi quy giữa NI và GDP -Hồi quy giữa NI và NFIA
=>Bỏ biến NFIA
Mr.tiz
3.Thu thập thêm số liệu hoặc
3.Thu thập thêm số liệu hoặc
lấy mẫu mới
lấy mẫu mới
•
Vì vấn đề đa cộng tuyến là một đặc tính của mẫu, có thể
Vì vấn đề đa cộng tuyến là một đặc tính của mẫu, có thể
là trong một mẫu khác, các biến cộng tuyến có thể
là trong một mẫu khác, các biến cộng tuyến có thể
không nghiêm trọng như trong mẫu đầu tiên. Vì vậy, đôi
không nghiêm trọng như trong mẫu đầu tiên. Vì vậy, đôi
khi ta chỉ cần tăng cỡ mẫu cũng có thể làm giảm bớt vấn
khi ta chỉ cần tăng cỡ mẫu cũng có thể làm giảm bớt vấn
đề cộng tuyến. Ví dụ, trong mô hình 3 biến chúng ta
đề cộng tuyến. Ví dụ, trong mô hình 3 biến chúng ta
thấy là:
thấy là:
•
Khi cỡ mẫu tăng, nói chung sẽ tăng, vì vậy, đối với
Khi cỡ mẫu tăng, nói chung sẽ tăng, vì vậy, đối với
bất kỳ r
bất kỳ r
23
23
nào cho trước, phương sai của sẽ giảm, kéo
nào cho trước, phương sai của sẽ giảm, kéo
theo sai số chuẩn giảm, điều này giúp chúng ta ước
theo sai số chuẩn giảm, điều này giúp chúng ta ước
lượng chính xác hơn.
lượng chính xác hơn.
∑
−
σ
=β
)r1(X
)
ˆ
var(
2
23
2
i2
2
2
∑
2
i2
x
2
ˆ
β
2
ˆ
β
Mr.tiz
4.Sử dụng sai phân cấp 1
4.Sử dụng sai phân cấp 1
Sai phân làm cho vấn đề đa cộng tuyến có thể nhẹ đi
Sai phân làm cho vấn đề đa cộng tuyến có thể nhẹ đi
Chúng ta muốn ước lượng:
Chúng ta muốn ước lượng:
Ứng với t-1:
Ứng với t-1:
Lấy sai phân các biến theo thời gian:
Lấy sai phân các biến theo thời gian:
- Điều này có thể giải quyết vấn đề đa cộng tuyến vì đa cộng
- Điều này có thể giải quyết vấn đề đa cộng tuyến vì đa cộng
tuyến xảy ra từ sai phân các biến này. Tuy nhiên có thể vi
tuyến xảy ra từ sai phân các biến này. Tuy nhiên có thể vi
phạm giả định chuẩn về sai số ngẫu nhiên
phạm giả định chuẩn về sai số ngẫu nhiên
tttt
uXXY
+++=
33221
βββ
113312211
−−−−
+++=
tttt
uXXY
βββ
( ) ( )
ttttttt
VXXXXYY
+−+−=−
−−−
133312221
ββ
Mr.tiz
Sử dụng phương pháp sai phân, ta có
bảng số liệu mới:
Mr.tiz
Bảng hồi quy sai phân cấp1
Mr.tiz
Ma trận hệ số tương quan:
Mr.tiz
Hồi quy phụ của biến sai phân:
•
Với mức ý nghĩa 0.05 > Prob (F-statistic)=0.023 =>mô hình
sai phân có đa cộng tuyến