Tải bản đầy đủ (.pdf) (16 trang)

Lý thuyết về đa cộng tuyến

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (237.56 KB, 16 trang )

Analytical Methods 11/30/2007
Nguyễn Trọng Hoài 1
Multicollinearity:
Đacộng tuyến trong mô hình
Bài giảng 10
1.Đacộng tuyến?
Analytical Methods 11/30/2007
Nguyễn Trọng Hoài 2
Giảđịnh ban đầuOLS
Giảđịnh: Các biến độclập không có
mốiquanhệ tuyến tính chính xác (exact
linear relationship)
 Nếu điềunàyxảy ra thì sẽ có hiệntượng
đacộng tuyến, đólàhiệntượng các biến
độclập trong mô hình phụ thuộclẫn nhau
và thể hiện đượcdướidạng hàm số.
Ví dụ
Đacộng tuyến chính xác:
 X2 X3 X4
 10 50 52
 15 75 75
 18 90 97
 24 120 129
 X2 và X3 có mốiquanhệ tuyếntínhchính
xác - X3 = 5X2
Analytical Methods 11/30/2007
Nguyễn Trọng Hoài 3
Ví dụ (tt)
Giả sử chúng ta ướclượng hàm tiêu
dùng. Y = tiêu dùng, X
2


= thu nhậpvà
X
3
= củacải
Y = β
1
+ β
2
X
2
+ β
3
X
3
X
3
= 5X
2
Y = β
1
+ β
2
X
2
+ β
3
5X
2
Y = β
1

+ (β
2
+ 5β
3
)X
3
Ví dụ (tt)
Chúng ta có thểướclượng (β
2
+ 5β
3
)
nhưng không ướclượng riêng từng hệ số
hồiqui
 Không thể có nghiệmduynhấtchotừng hệ số
hồiqui (xemlại cách tính các hệ số hồiqui).
 Như vậycáchệ số hồiqui sẽ không xác định
được.
 Sai số chuẩncủacáchệ số hồiqui làmột vô cùng lớn.
Analytical Methods 11/30/2007
Nguyễn Trọng Hoài 4
Các lọai đacộng tuyến
Đacộng tuyếnchínhxácthường rấtítkhixảy
ra trong thựctế (perfect/exact collinearity)
 Trừ trường hợp chúng ta rơivàobẫybiếngiả
(dummy trap – chúng ta sẽ giớithiệusau)
Đa công tuyến không chính xác thường hay
xảy ra trong thựctế (Near collinearity) (khi các
biến độclậptương quan khá cao):
 Trường hợpthứ hai chúng ta có thểướclượng các

hệ số hồiqui.
Đacộng tuyến
Nhậndạng hình học
Nghiên cứu tình huống
Analytical Methods 11/30/2007
Nguyễn Trọng Hoài 5
2. Nguồngốccủa
Multicollinearity
Nguồngốc Đacộng tuyến
Do phương pháp thu thậpdữ liệu
 các giá trị củacácbiến độclậpphụ thuộc
lẫn nhau trong mẫu, nhưng không phụ
thuộclẫn nhau trong tổng thể.
 Cỡ mẫunhỏ xu hướng quan hệ bị thiên
lệch
 Ví dụ: mốiquanhệ tiêu dùng máy lạnh và
tổng chi tiêu và số kwh ở thành thị/nông
thôn.
Analytical Methods 11/30/2007
Nguyễn Trọng Hoài 6
Nguồngốc Multicollinearity
Dạng hàm mô hình:
 Ví dụ: hồiqui dạng các biến độclập đượcbình
phương (dạng hàm) sẽ xảyrađacộng tuyếnvà
đặcbiệtkhiphạmvi giátrị ban đầucủabiến độc
lậplànhỏ.
Các biến độclậpvĩ mô được quan sát theo
dữ liệuchuỗithờigian
Ví dụ: Nhậpkhẩuquốcgiaphụ thuộcvàoGDP và
CPI (các chỉ số này đượcthuthậptừ dự liệuchuỗi

thờigian).
3. Hệ quảđacộng tuyến
Analytical Methods 11/30/2007
Nguyễn Trọng Hoài 7
Hệ quả
Đacộng tuyến chính xác/hòan hảo
 Chúng ta không thểướclượng đượcmôhình
 Các phầnmềm máy tính sẽ báo các tín hiệu
sau
 “Matrix singular”: ma trậnkhácthường mà máy
tính không thể thựchiện đượckhiướclượng các
hệ số hồiqui
 “Exact collinearity encounted”: trường hợp đa
cộng tuyếnhoànhảo(chínhxác)
Hệ quả
Hệ quả khi có đacộng tuyến không
hoàn hảo
 (1) Ướclượng OLS vẫnBLUE
 Ướclượng không chệch
 Phương sai củahệ sốướclượng vẫn đạt
minimum nhưng so vớigiátrị của ướclượng thì
lạiquálớn.
 Coi lạigiảđịnh 3.2 Î 3.7 trong Ramanathan
Analytical Methods 11/30/2007
Nguyễn Trọng Hoài 8
Hệ quả
 (2) Sai số chuẩncủacáchệ số sẽ lớn.
 Khoảng tin cậylớnvàthống kê t ít ý nghĩa.
 Các ướclượng không hiệuquả.
 Dễ sai lầmkhikhôngcócơ sở bác bỏ giả thiết

“không” và điềunàycóthể không đúng.
Hệ quả thựctiễn
 (3) R
2
rấtcaochodùthống kê t ít ý nghĩa
 Tạisaohệ số xác định lạicao?
 Không có nhiềunhững biến đổikhácbiệtgiữacác
biếnsốđộclập vì chúng thựcsự có mốiquanhệ
với nhau
 Dễ dàng bác bỏ giả thuyết“không”củathống
kê F và cho rằng mô hình ướclượng có gía trị
Analytical Methods 11/30/2007
Nguyễn Trọng Hoài 9
Hệ quả thựctiễn
 (4) Các ướclượng và sai số chuẩn
của ướclượng rấtnhạycảmvớisự
thay đổicủadữ liệu
 Chỉ cầnmộtsự thay đổinhỏ trong mẫu
dữ liệu(tăng cỡ mẫu)
 Chỉ cầnthayđổimột/vài biến độclập
Ví dụ
Xem kếtquảướclượng hàm tiêu dùng:
 Y = 24.77 + 0.94X
2
- 0.04X
3
 t (3.67) (1.14) (-0.53)
 R
2
=0.96, F = 92.40

 X
2
: thu nhập
 X
3
: củacải
 R
2
rấtcaogiải thích 96% biến đổicủahàm
tiêu dùng
Analytical Methods 11/30/2007
Nguyễn Trọng Hoài 10
Ví dụ
 Không có biến độclậpnàocóý nghĩa
(thống kê t quá thấp).
 Có mộtbiếnsaidấu.
 Giá trị thống kê F rấtcaodẫn đếnbácbỏ
giả thuyết “không” và cho rằng mô hình
ướclượng có ý nghĩa.
 Biếnthunhậpvàcủacảitương quan rấtmạnh
với nhau do đókhôngthể nào ướclượng được
tác động biên chính xác cho thu nhậphoặc
củacải lên tiêu dùng.
Ví dụ
Thựchiệnhồiqui X
3
theo X
2
 X
3

= 7.54 + 10.19X
2
 (0.26) ( 62.04) R
2
= .99
 Hầunhư chúng ta có đacộng tuyếnrất
cao giữaX
2
và X
3
Hồi qui tiêu dùng theo thu nhập:
 Y = 24.45 + 0.51X
2
 (3.81) (14.24) R
2
= 0.96
Analytical Methods 11/30/2007
Nguyễn Trọng Hoài 11
Ví dụ
 Biếnthunhậptrở nên có ý nghĩathống kê, nhưng
trướclúcđó trong mô hình đầu thì không có ý
nghĩa.
Tương tự hồiqui thunhập Y theo củacải:
 Y = 24.41 + 0.05X
3
 t (3.55) (13.29) R
2
= 0.96
 Biếncủacảitrở nên có ý nghĩathống kê, nhưng
trướclúcđó trong mô hình đầu thì không có ý

nghĩa.
4. Nhậndạng
đacộng tuyến
Analytical Methods 11/30/2007
Nguyễn Trọng Hoài 12
Các dấuhiệutừ hồiqui
(1) R
2
cao và thống kê t thấp.
(2) Tương quan tuyếntínhmạnh giữacác
biến độclập
 Xây dựng ma trậnhệ số tương quan cặp
 Xét về ý nghĩakinhtế các biếncókhả năng
tương quan cao
Các phương pháp nhậnbiết
(3) Thựchiệnhồiqui phụ
 Hồiqui giữamộtbiến độclậpvớitấtcả các
biến độclậpvới nhau và quan sát hệ số R
2
củacáchồiqui phụ
 Thựchiệntínhthống kê F
 F = [R
2
/(k-1)] /[(1-R
2
)/(n-k)]
 k số biến độclậptronghồiqui phụ
 Nếu F > F* thì chúng ta có thể kếtluậnrằng R
2
khác không theo ý nghĩathống kê và điềunàycó

nghĩalàcóđacộng tuyến trong mô hình.
Analytical Methods 11/30/2007
Nguyễn Trọng Hoài 13
Các phương pháp nhậnbiết
(4) Thừasố tăng phương sai (Variance
inflation factor-VIF)
 VIF = 1/(1-r
ij
2
)
 r
ij
2
là hệ số tương quan giữahaibiến độc
lập trong mô hình.
 Khi r
ij
tăng làm VIF tăng và làm tăng mức
độ đacộng tuyến
 Rule of thumb >= 10 có hiệntượng đacộng
tuyếngiữahaibiến độclập trong mô hình
5. Các giảiphápkhắc
phục Đacộng tuyến
Analytical Methods 11/30/2007
Nguyễn Trọng Hoài 14
Không lọai trừđacộng tuyến
Khi t > 2 và dấukỳ vọng đúng
R
2
của mô hình cao hơnR

2
củamô
hình hồiqui phụ.
Khi xây dựng mô hình sử dụng để dự
báo chứ không phảikiểm định.
Lọai trừđacộng tuyến
Bỏ bớtbiến độclập.
 Lưulạibiếnquantâm
 Lọai bỏ biếncótương quan yếuvớibiếnphụ
thuộcnhưng lạicótương quan mạnh vớibiến
biếnquantâm.
Analytical Methods 11/30/2007
Nguyễn Trọng Hoài 15
Lọai trừđacộng tuyến
Bổ sung dữ liệuhoặctìmdữ liệumới
 Tìm mẫudữ liệukháchoặcgiatăng cỡ mẫu
 Nếumẫulớnhơnmàvẫn còn multicollinearity thì
vẫncógiátrị vì mẫulớnhơnsẽ làm cho phương
sai nhỏ hơnvàhệ sốướclượng chính xác hơnso
vớimẫunhỏ.
Lọai trừđacộng tuyến
Thay đổidạng mô hình
 Mô hình kinh tế lượng có nhiềudạng hàm khác nhau.
 Thay đổidạng mô hình cũng có nghĩalàtáicấutrúc
mô hình
Analytical Methods 11/30/2007
Nguyễn Trọng Hoài 16
Lọai trừđacộng tuyến
Sử dụng sai phân cho các biếncủamôhình
 Sai phân làm cho vấn đề đacộng tuyếncóthể

nhẹđi
 Quay trở lạivídụ hàm tiêu dùng.
 Thu nhậpvàcủacảicómốiquanhệ khá chặtchẽ và
do đó không tránh khỏi đacộng tuyến
 Chúng ta muốn ướclượng
 Y
t
= β
1
+ β
2
X
2t
+ β
3
X
3t
+ e
t
 Ứng vớit-1
 Y
t-1
= β
1
+ β
2
X
2t-1
+ β
3

X
3t-1
+ e
t-1
 Lấy sai phân các biến theo thờigian
 Y
t
-Y
t-1
= β
2
(X
2t
-X
2t-1
)+ β
3
(X
3t
-X
3t-1
)+v
t
Lọai trừđacộng tuyến

×