Analytical Methods 11/30/2007
Nguyễn Trọng Hoài 1
Multicollinearity:
Đacộng tuyến trong mô hình
Bài giảng 10
1.Đacộng tuyến?
Analytical Methods 11/30/2007
Nguyễn Trọng Hoài 2
Giảđịnh ban đầuOLS
Giảđịnh: Các biến độclập không có
mốiquanhệ tuyến tính chính xác (exact
linear relationship)
Nếu điềunàyxảy ra thì sẽ có hiệntượng
đacộng tuyến, đólàhiệntượng các biến
độclập trong mô hình phụ thuộclẫn nhau
và thể hiện đượcdướidạng hàm số.
Ví dụ
Đacộng tuyến chính xác:
X2 X3 X4
10 50 52
15 75 75
18 90 97
24 120 129
X2 và X3 có mốiquanhệ tuyếntínhchính
xác - X3 = 5X2
Analytical Methods 11/30/2007
Nguyễn Trọng Hoài 3
Ví dụ (tt)
Giả sử chúng ta ướclượng hàm tiêu
dùng. Y = tiêu dùng, X
2
= thu nhậpvà
X
3
= củacải
Y = β
1
+ β
2
X
2
+ β
3
X
3
X
3
= 5X
2
Y = β
1
+ β
2
X
2
+ β
3
5X
2
Y = β
1
+ (β
2
+ 5β
3
)X
3
Ví dụ (tt)
Chúng ta có thểướclượng (β
2
+ 5β
3
)
nhưng không ướclượng riêng từng hệ số
hồiqui
Không thể có nghiệmduynhấtchotừng hệ số
hồiqui (xemlại cách tính các hệ số hồiqui).
Như vậycáchệ số hồiqui sẽ không xác định
được.
Sai số chuẩncủacáchệ số hồiqui làmột vô cùng lớn.
Analytical Methods 11/30/2007
Nguyễn Trọng Hoài 4
Các lọai đacộng tuyến
Đacộng tuyếnchínhxácthường rấtítkhixảy
ra trong thựctế (perfect/exact collinearity)
Trừ trường hợp chúng ta rơivàobẫybiếngiả
(dummy trap – chúng ta sẽ giớithiệusau)
Đa công tuyến không chính xác thường hay
xảy ra trong thựctế (Near collinearity) (khi các
biến độclậptương quan khá cao):
Trường hợpthứ hai chúng ta có thểướclượng các
hệ số hồiqui.
Đacộng tuyến
Nhậndạng hình học
Nghiên cứu tình huống
Analytical Methods 11/30/2007
Nguyễn Trọng Hoài 5
2. Nguồngốccủa
Multicollinearity
Nguồngốc Đacộng tuyến
Do phương pháp thu thậpdữ liệu
các giá trị củacácbiến độclậpphụ thuộc
lẫn nhau trong mẫu, nhưng không phụ
thuộclẫn nhau trong tổng thể.
Cỡ mẫunhỏ xu hướng quan hệ bị thiên
lệch
Ví dụ: mốiquanhệ tiêu dùng máy lạnh và
tổng chi tiêu và số kwh ở thành thị/nông
thôn.
Analytical Methods 11/30/2007
Nguyễn Trọng Hoài 6
Nguồngốc Multicollinearity
Dạng hàm mô hình:
Ví dụ: hồiqui dạng các biến độclập đượcbình
phương (dạng hàm) sẽ xảyrađacộng tuyếnvà
đặcbiệtkhiphạmvi giátrị ban đầucủabiến độc
lậplànhỏ.
Các biến độclậpvĩ mô được quan sát theo
dữ liệuchuỗithờigian
Ví dụ: Nhậpkhẩuquốcgiaphụ thuộcvàoGDP và
CPI (các chỉ số này đượcthuthậptừ dự liệuchuỗi
thờigian).
3. Hệ quảđacộng tuyến
Analytical Methods 11/30/2007
Nguyễn Trọng Hoài 7
Hệ quả
Đacộng tuyến chính xác/hòan hảo
Chúng ta không thểướclượng đượcmôhình
Các phầnmềm máy tính sẽ báo các tín hiệu
sau
“Matrix singular”: ma trậnkhácthường mà máy
tính không thể thựchiện đượckhiướclượng các
hệ số hồiqui
“Exact collinearity encounted”: trường hợp đa
cộng tuyếnhoànhảo(chínhxác)
Hệ quả
Hệ quả khi có đacộng tuyến không
hoàn hảo
(1) Ướclượng OLS vẫnBLUE
Ướclượng không chệch
Phương sai củahệ sốướclượng vẫn đạt
minimum nhưng so vớigiátrị của ướclượng thì
lạiquálớn.
Coi lạigiảđịnh 3.2 Î 3.7 trong Ramanathan
Analytical Methods 11/30/2007
Nguyễn Trọng Hoài 8
Hệ quả
(2) Sai số chuẩncủacáchệ số sẽ lớn.
Khoảng tin cậylớnvàthống kê t ít ý nghĩa.
Các ướclượng không hiệuquả.
Dễ sai lầmkhikhôngcócơ sở bác bỏ giả thiết
“không” và điềunàycóthể không đúng.
Hệ quả thựctiễn
(3) R
2
rấtcaochodùthống kê t ít ý nghĩa
Tạisaohệ số xác định lạicao?
Không có nhiềunhững biến đổikhácbiệtgiữacác
biếnsốđộclập vì chúng thựcsự có mốiquanhệ
với nhau
Dễ dàng bác bỏ giả thuyết“không”củathống
kê F và cho rằng mô hình ướclượng có gía trị
Analytical Methods 11/30/2007
Nguyễn Trọng Hoài 9
Hệ quả thựctiễn
(4) Các ướclượng và sai số chuẩn
của ướclượng rấtnhạycảmvớisự
thay đổicủadữ liệu
Chỉ cầnmộtsự thay đổinhỏ trong mẫu
dữ liệu(tăng cỡ mẫu)
Chỉ cầnthayđổimột/vài biến độclập
Ví dụ
Xem kếtquảướclượng hàm tiêu dùng:
Y = 24.77 + 0.94X
2
- 0.04X
3
t (3.67) (1.14) (-0.53)
R
2
=0.96, F = 92.40
X
2
: thu nhập
X
3
: củacải
R
2
rấtcaogiải thích 96% biến đổicủahàm
tiêu dùng
Analytical Methods 11/30/2007
Nguyễn Trọng Hoài 10
Ví dụ
Không có biến độclậpnàocóý nghĩa
(thống kê t quá thấp).
Có mộtbiếnsaidấu.
Giá trị thống kê F rấtcaodẫn đếnbácbỏ
giả thuyết “không” và cho rằng mô hình
ướclượng có ý nghĩa.
Biếnthunhậpvàcủacảitương quan rấtmạnh
với nhau do đókhôngthể nào ướclượng được
tác động biên chính xác cho thu nhậphoặc
củacải lên tiêu dùng.
Ví dụ
Thựchiệnhồiqui X
3
theo X
2
X
3
= 7.54 + 10.19X
2
(0.26) ( 62.04) R
2
= .99
Hầunhư chúng ta có đacộng tuyếnrất
cao giữaX
2
và X
3
Hồi qui tiêu dùng theo thu nhập:
Y = 24.45 + 0.51X
2
(3.81) (14.24) R
2
= 0.96
Analytical Methods 11/30/2007
Nguyễn Trọng Hoài 11
Ví dụ
Biếnthunhậptrở nên có ý nghĩathống kê, nhưng
trướclúcđó trong mô hình đầu thì không có ý
nghĩa.
Tương tự hồiqui thunhập Y theo củacải:
Y = 24.41 + 0.05X
3
t (3.55) (13.29) R
2
= 0.96
Biếncủacảitrở nên có ý nghĩathống kê, nhưng
trướclúcđó trong mô hình đầu thì không có ý
nghĩa.
4. Nhậndạng
đacộng tuyến
Analytical Methods 11/30/2007
Nguyễn Trọng Hoài 12
Các dấuhiệutừ hồiqui
(1) R
2
cao và thống kê t thấp.
(2) Tương quan tuyếntínhmạnh giữacác
biến độclập
Xây dựng ma trậnhệ số tương quan cặp
Xét về ý nghĩakinhtế các biếncókhả năng
tương quan cao
Các phương pháp nhậnbiết
(3) Thựchiệnhồiqui phụ
Hồiqui giữamộtbiến độclậpvớitấtcả các
biến độclậpvới nhau và quan sát hệ số R
2
củacáchồiqui phụ
Thựchiệntínhthống kê F
F = [R
2
/(k-1)] /[(1-R
2
)/(n-k)]
k số biến độclậptronghồiqui phụ
Nếu F > F* thì chúng ta có thể kếtluậnrằng R
2
khác không theo ý nghĩathống kê và điềunàycó
nghĩalàcóđacộng tuyến trong mô hình.
Analytical Methods 11/30/2007
Nguyễn Trọng Hoài 13
Các phương pháp nhậnbiết
(4) Thừasố tăng phương sai (Variance
inflation factor-VIF)
VIF = 1/(1-r
ij
2
)
r
ij
2
là hệ số tương quan giữahaibiến độc
lập trong mô hình.
Khi r
ij
tăng làm VIF tăng và làm tăng mức
độ đacộng tuyến
Rule of thumb >= 10 có hiệntượng đacộng
tuyếngiữahaibiến độclập trong mô hình
5. Các giảiphápkhắc
phục Đacộng tuyến
Analytical Methods 11/30/2007
Nguyễn Trọng Hoài 14
Không lọai trừđacộng tuyến
Khi t > 2 và dấukỳ vọng đúng
R
2
của mô hình cao hơnR
2
củamô
hình hồiqui phụ.
Khi xây dựng mô hình sử dụng để dự
báo chứ không phảikiểm định.
Lọai trừđacộng tuyến
Bỏ bớtbiến độclập.
Lưulạibiếnquantâm
Lọai bỏ biếncótương quan yếuvớibiếnphụ
thuộcnhưng lạicótương quan mạnh vớibiến
biếnquantâm.
Analytical Methods 11/30/2007
Nguyễn Trọng Hoài 15
Lọai trừđacộng tuyến
Bổ sung dữ liệuhoặctìmdữ liệumới
Tìm mẫudữ liệukháchoặcgiatăng cỡ mẫu
Nếumẫulớnhơnmàvẫn còn multicollinearity thì
vẫncógiátrị vì mẫulớnhơnsẽ làm cho phương
sai nhỏ hơnvàhệ sốướclượng chính xác hơnso
vớimẫunhỏ.
Lọai trừđacộng tuyến
Thay đổidạng mô hình
Mô hình kinh tế lượng có nhiềudạng hàm khác nhau.
Thay đổidạng mô hình cũng có nghĩalàtáicấutrúc
mô hình
Analytical Methods 11/30/2007
Nguyễn Trọng Hoài 16
Lọai trừđacộng tuyến
Sử dụng sai phân cho các biếncủamôhình
Sai phân làm cho vấn đề đacộng tuyếncóthể
nhẹđi
Quay trở lạivídụ hàm tiêu dùng.
Thu nhậpvàcủacảicómốiquanhệ khá chặtchẽ và
do đó không tránh khỏi đacộng tuyến
Chúng ta muốn ướclượng
Y
t
= β
1
+ β
2
X
2t
+ β
3
X
3t
+ e
t
Ứng vớit-1
Y
t-1
= β
1
+ β
2
X
2t-1
+ β
3
X
3t-1
+ e
t-1
Lấy sai phân các biến theo thờigian
Y
t
-Y
t-1
= β
2
(X
2t
-X
2t-1
)+ β
3
(X
3t
-X
3t-1
)+v
t
Lọai trừđacộng tuyến