Tải bản đầy đủ (.docx) (25 trang)

Hiện tượng đa cộng tuyến trong kinh tế lượng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (358.89 KB, 25 trang )


 !"
#
Khi xây dựng MHHQ bội, trường hợp lý tưởng là các biến X
i
trong mô
hình không có tương quan với nhau; mỗi biến X
i
chứa một thông tin
riêng về Y, thông tin không chứa trong bất kì biến X
i
khác. Trong thực
hành, khi điều này xảy ra ta không gặp hiện tượng đa cộng tuyến.
Trong những trường hợp còn lại, ta gặp hiện tượng đa cộng tuyến. Giả
sử ta phải ƯL hàm hồi quy Y gồm k biến giải thích X
1
, X
2
, X
3
,… ,X
k
Y
1
= β
1
+ β
2
X
2i
+ β


3
X
3i
+ U
i
,
),1( ni =
- Các biến X
2
, X
3
, , X
k
gọi là các đa cộng tuyến hoàn hảo hay còn gọi
là đa cộng tuyến chính xác nếu tồn tại λ
2
, , λ
k
không đồng thời bằng
không sao cho:
λ
2
X
2
+ λ
3
X
3
+ + λ
k

X
k
= 0
Các biến X
2
, X
3
, , X
k
gọi là các đa cộng tuyến không hoàn hảo nếu
tồn tại λ
2
, , λ
k
không đồng thời bằng không sao cho:
λ
2
X
2
+ λ
3
X
3
+ + λ
k
X
k
+ V
i
= 0 (1.1)

trong đó V
i
là sai số ngẫu nhiên.
Trong (1.1) giả sử

λ
i
≠ 0 khi đó ta biểu diễn:
Bài Thảo Luận KTL Nhóm 9 Page 1
X
i
=
32 2
2 3

i i i i
V
X X
λ
λ λ
λ λ λ λ
− − − − −
- Từ (1.2) ta thấy hiện tượng đa cộng tuyến xảy ra khi một biến là tổ hợp
tuyến tính của các biến còn lại và một sai số ngẫu nhiên, hay nói cách
khác là có một biến biểu diễn xấp xỉ tuyến tính qua các biến còn lại.
$#!"
Do phương pháp thu thập dữ liệu: Các giá trị của các biến độc lập phụ
thuộc lẫn nhau trong mẫu nhưng không phụ thuộc lẫn nhau trong tổng
thể.
%&'()

%*'()* *
%$&*'+*+,-)(.* *
/0123
/-4 --435'62"7
+8'5
/$*1+
/%9:4;8<
- Như đã biết, khi kiểm định giả thiết : chúng ta đã sử dụng tỷ số và
đem so sánh giá trị t đã được ước lượng với giá trị tới hạn t. thong khi có
đa cộn tuyến gần hoàn hảo thì sai số tiêu chuẩn ước lượng được sẽ rất
Bài Thảo Luận KTL Nhóm 9 Page 2
cao vì vậy làm cho chỉ số t nhỏ đi. Kết quả là sẽ làm tăng khả năng chấp
nhận giả thiết H
0
.
//=5'6-78 44;!>
3?+@'!+8A;5BCD+*4;'
/EF835'34;G2)H4
/I9! *55(.
64JC'5+*5'*KL83?
E4MGA3
E*:4;8-
Trong trường hợp R
2
cao (thường R
2
> 0,8) mà tỉ số t thấp thì đó chính là
dấu hiệu của hiện tượng đa cộng tuyến .
E$92K-BN*
E%OPQ72+!

Vì vấn đề được đề cập đến dựa vào tương quan bậc không. Farrar và
Glauber đã đề nghị sử dụng hệ số tương quan riêng. Trong hồi quy của
Y đối với các biến X
2
, X
3
,X
4
. Nếu ta nhận thấy răng r
2
234,1
cao trong khi
đó r
2
34,12
; r
2
24,13
; r
2
23,14
tương đối thấp thì điều đó có thể gợi ý rằng các biến
X
2
, X
3
và X
4
có tương quan cao và ít nhất một trong các biến này là
thừa.

Bài Thảo Luận KTL Nhóm 9 Page 3
Dù tương quan riêng rất có ích nhưng nó cũng không đảm bảo rằng sẽ
cung cấp cho ta hướng dẫn chính xác trong việc phát hiện ra hiện tượng
đa cộng tuyến.
E/0G2-R
Một cách có thể tin cậy được để đánh giá mức độ của đa cộng tuyến là
hồi quy phụ. Hồi quy phụ là hồi quy mỗi một biến giải thích X
i
theo
các biến giải thích còn lại. R
2
được tính từ hồi quy này ta ký hiện R
2
i
Mối liên hệ giữa F
i
và R
2
i
:
F=
)1/()1(
)2/(
2
2
+−−

knR
kR
i

i
F
i
tuân theo phân phối F với k – 2 và n - k +1 bậc tự do. Trong đó n
là , k là số biến giải thích kể cả hệ số chặn trong mô hình. R
2
i
là hệ số
xác định trong hồi quy của biến X
i
theo các biến X khác. Nếu F
i
tính
được vượt điểm tới hạn F
i
(k-2, n-k+1) ở mức ý nghĩa đã cho thì có
nghĩa là X
i
có liên hệ tuyến tính với các biến X khác. Nếu F
i
có ý nghĩa
về mặt thống kê chúng ta vẫn phải quyến định liệu biến X
i
nào sẽ bị
Bài Thảo Luận KTL Nhóm 9 Page 4
loại khỏi mô hình. Một trở ngại của kỹ thuật hồi quy phụ là gánh nặng
tính toán. Nhưng ngày nay nhiều chương trình máy tính đã có thể đảm
đương được công việc tính toán này.
EE#"S-)A-4
Một thước đo khác của hiện tượng đa cộng tuyến là nhân tử phóng đại

phương sai gắn với biến X , ký hiệu là VIF(X ).
VIF(X ) được thiết lập trên cơ sở của hệ số xác định R trong hồi quy
của biến X với các biến khác nhau như sau:
VIF(X
i
) =
R1
1
2
i

(1.15)
- Nhìn vào công thức (1.15) có thể giải thích VIF(X ) bằng tỷ số chung
của phương sai thực của β trong hồi quy gốc của Y đối với các biến X
và phương sai của ước lượng β trong hồi quy mà ở đó X trực giao với
các biến khác. Ta coi tình huống lý tưởng là tình huống mà trong đó các
biến độc lập không tương quan với nhau, và VIF so sánh tình huông
thực và tình huống lý tưởng. Sự so sánh này không có ích nhiều và nó
không cung cấp cho ta biết phải làm gì với tình huống đó.
Khi R
2
i
=1 thì VIF là vô hạn.
IT--(U-R
IVSLR.!
Bài Thảo Luận KTL Nhóm 9 Page 5
I$91-4;'*K'8!W5
I%TD
I/VSLR4-"8-
IEX2+*G2Y

ZZT 91-9M0 
Theo một cuộc điều tra của CR;(! về tổng sản phẩm trong
nước tính theo giá thực tế GDP, giá trị hàng xuất khẩu và tổng số vốn
đầu tư trực tiếp nước ngoài thực hiện FDI của Việt Nam giai đoạn 1995-
2011 như sau:
• GDP_Y (tỉ đồng/ năm)
• Gía Trị Hàng Xuất Khẩu _ X (tỉ đồng/ năm)
Bài Thảo Luận KTL Nhóm 9 Page 6
• FDI _ Z(tỉ đồng/năm)
1-.6 G2
Ta có mô hình hàm hồi quy tuyến tính thể hiện sự phụ thuộc của chi phí
tiêu dùng vào thu nhập và tiền tích lũy:
Bài Thảo Luận KTL Nhóm 9 Page 7
Từ bảng số liệu, sử dụng phần mềm eviews ta được kết quả sau:
Bảng 1
Từ kết quả ước lượng ta thu được hàm hồi quy mẫu sau:

ˆ
Y
i
= 67826,02 +26,3046 – 26,1162
Ý nghĩa kinh tế:
Bài Thảo Luận KTL Nhóm 9 Page 8
+, = 26.3046 có nghĩa: nếu vốn đầu tư trực tiếp nước ngoài vào Việt
Nam không đổi, giá trị hàng xuất khẩu tăng 1 tỷ đồng thì tổng sản phẩm
trong nước GDP tính theo giá thực tế tăng 26.3046 tỷ đồng.
+, = –26,1162 nghĩa: nếu giá trị hàng xuất khẩu không đổi, vốn vốn
đầu tư trực tiếp nước ngoài vào Việt Nam tăng 1 tỷ USD thì tổng sản
phẩm trong nước GDP tính theo giá thực tế giảm 26.1162 tỷ đồng.
$&*'

Với mức ý nghĩa 5% hãy ước lượng khoảng tin cậy của
XDTK : T = ~
với mức ý nghĩa ta có khoảng tin cậy của
(< < )
Từ bảng 1 ta có:
 n=17 ; chọn mức

Thay số ta có: 26.3046 - 2.145.34952<<26.3046 + 2.145.34952
 18.81<<33.8
 vậy với mức ý nghĩa ta có khoảng tin cậy của là:
. (tỉ đồng/ năm )
Ý nghĩa kinh tế :
Nếu giữ chỉ số FDI không đổi , khi giá trị hàng xuất khẩu tăng 1 tỷ
đồng/ năm, thì GDP tăng trong khoảng 18.81 đến 33.8 tỷ đồng / năm.
Bài Thảo Luận KTL Nhóm 9 Page 9
%5Y<[(H\+\O(.
@5:4;XF(.]
Với mức ý nghĩa ta cần kiểm định giả thuyết.
H
0
:
H
1
:
XDTCKĐ: T =
từ bảng ta có t
tn
=7.526
 mà < =7.526
 bác bỏ H

0
chấp nhận H
1

vậy thì giá trị hàng XK có ảnh hưởng tới GDP.
/F^T_`
Khi giá trị hàng hóa xuất khẩu (X) là 110000 (tỉ đồng/ năm), FDI (Z) là 12000 (tỉ
đồng /năm), với độ tin cậy là 95%, hãy dự báo:
1. GDP trung bình trong năm 2014
2. Giá trị GDP trong năm 2014
/LM*XF+6+*a$b/
Với độ tin cậy 95% cần dự báo E(Y/X
0
)
Ước lượng điểm của E(Y/X
0
) là:
Bài Thảo Luận KTL Nhóm 9 Page 10
Se ( =90956.32
Xây dựng thống kê:
Với n=17, k=3, , ta tìm được
Sao cho:
Thay vào ta được khoảng tin cậy của E(Y/X
0
) là:
Bài Thảo Luận KTL Nhóm 9 Page 11
Bài Thảo Luận KTL Nhóm 9 Page 12
Như vậy ta tìm được khoảng tin cậy cho GDP trung bình khi giá trị hàng xuất khẩu
là X = 110000, FDI là Z= 26500 với độ tin cậy 95% là: (2481115 ;3005771) tỉ.
/$LM*XF+*a$b/c

Với độ tin cậy 95%, cần dự báo Y
0
Ước lượng điểm của Y
0
là:
Bài Thảo Luận KTL Nhóm 9 Page 13
Se =166822.5
Xây dựng thống kê:
Với n=17, k=3, , ta tìm được
Sao cho:
Thay vào ta được khoảng tin cậy của Y
0
là:
Bài Thảo Luận KTL Nhóm 9 Page 14
Bài Thảo Luận KTL Nhóm 9 Page 15
Như vậy ta tìm được khoảng tin cậy cho GDP khi giá trị hàng xuất khẩu là X =
110000, FDI là Z= 26500 với độ tin cậy 95% là: (2481115 ;3005771) tỉ đồng.
E
- 04;Q\d
$
*e4;98-c
Bảng 1
Dependent Variable: Y
Method: Least Squares
Date: 11/05/14 Time: 08:20
Sample: 1995 2011
Included observations: 17
Variable Coefficient Std. Error t-Statistic Prob.
C 67826.02 60989.14 1.112100 0.2848
X 26.30460 3.495214 7.525889 0.0000

Z -26.11620 30.48028 -0.856823 0.4060
R-squared 0.969376 Mean dependent var 938129.5
Adjusted R-squared 0.965002 S.D. dependent var 747521.3
S.E. of regression 139845.2 Akaike info criterion 26.69324
Sum squared resid 2.74E+11 Schwarz criterion 26.84028
Log likelihood -223.8926 Hannan-Quinn criter. 26.70786
F-statistic 221.5821 Durbin-Watson stat 0.977629
Prob(F-statistic) 0.000000
Xét MHHQ biểu diễn: Y
i
= ß
1
+ ß
2
X
i

3
Z
i
+ v
i
Từ bảng số liệu1, ta thấy:
Hệ số xác định bội: R
2
= 0.969376 ( >0.8), nên R
2
cao.
t= -0.856823 (tỉ số t thấp)
Có hiện tượng đa cộng tuyến.

Vậy từ đó ta có thể kết luận có hiện tượng đa cộng tuyến.
- 04;2K-BN*c
Bài Thảo Luận KTL Nhóm 9 Page 16
Bảng hệ số tương quan giữa X và Z:
Bảng 2
X Z
X 1
0.9476
9
Z
0.9476
9 1
Từ bảng 2 ta thấy hệ số tương quan giữa biến X và Z:
Có hiện tượng đa cộng tuyến.
Vậy từ đó ta có thể kết luận có hiện tượng đa cộng tuyến.
- O7G2-Rc
Xét MHHQ phụ biểu diễn:
Với mức ý nghĩa 5%, ta cần kiểm định:
Giả thuyết:
Dùng eview ta có bảng sau:
Bảng 3
Dependent Variable: X
Method: Least Squares
Date: 11/05/14 Time: 09:46
Sample: 1995 2011
Included observations: 17
Variable Coefficient Std. Error t-Statistic Prob.
C -3607.907 4408.039 -0.818484 0.4259
Z 8.264403 0.718706 11.49901 0.0000
Bài Thảo Luận KTL Nhóm 9 Page 17

R-squared 0.898117 Mean dependent var 38095.63
Adjusted R-squared 0.891324 S.D. dependent var 31337.33
S.E. of regression 10330.66 Akaike info criterion 21.43375
Sum squared resid 1.60E+09 Schwarz criterion 21.53178
Log likelihood -180.1869 Hannan-Quinn criter. 21.44349
F-statistic 132.2271 Durbin-Watson stat 0.681535
Prob(F-statistic) 0.000000
Từ bảng số liệu 3, ta có p_value = 0.0000<0.05 chấp nhận H
1
, bác bỏ H
0.
Kết luận với mức ý nghĩa 5%, ta có thể kết luận có hiện tượng đa cộng tuyến.
- VSLR"S-)A-4fgZhic
Từ bảng 3:
Nhân tử phóng đại:
Không có hiện hượng đa cộng tuyến.
Kết luận: không có hiện tượng đa cộng tuyến.
I0j=0k=0Zl#9mn#Xop=q#X9&rs#
IT--(U-Rc
9!+\3
Thêm 8 giá trị của các biến ta được bảng số liệu sau đây:
y x z
22889
2
8155.4
2792
27203
6
11143.
6

2938.
2
31362
3
11592.
3
3277.
1
36101
7
11499.
6
2372.
4
Bài Thảo Luận KTL Nhóm 9 Page 18
39994
2
11742.
1
2528.
3
44164
6
15636.
5
2398.
7
48129
5
16218

2225.
6
53576
2
17745.
6
2884.
7
61344
3
25255.
8
2723.
3
71530
7
31968.
8
2708.
4
91400
1
36761.
1
3300.
5
10615
65
44891.
1

4100.
4
12467
69
62764.
7
8034.
1
16160
47
80713.
8
1150
0.2
18091
49
69948.
8
1000
0.5
21578
28
84838.
6
1100
0.3
27798
80
10674
9.9

1100
0.1
18752
39
84521.
7
7451.
9
19845
72
74258.
12
9452.
63
64521
3
12364
5
6245.
32
45672
5
12456
3
1458
9
12567
8
8546.6
1

4759.
23
23456 12564 1458
Bài Thảo Luận KTL Nhóm 9 Page 19
01 7
32647
8
9821.3
5423
1
14569
23
22654
6532
7
trong đó : Y: GDP
X: Giá trị hàng xuất khẩu
Z: FDI
- 04;Q\d
$
*e4;98-c
Chạy MHHQ của bảng dữ liệu mới, ta có kết quả:
Bảng 1
Dependent Variable: Y
Method: Least Squares
Date: 11/05/14 Time: 10:37
Sample: 1 25
Included observations: 25
Variable Coefficient Std. Error t-Statistic Prob.
C 443874.2 231316.2 1.918907 0.0681

X 10.53424 3.590136 2.934218 0.0077
Z 9.121500 8.947468 1.019450 0.3191
R-squared 0.300500 Mean dependent var 1006585.
Adjusted R-squared 0.236909 S.D. dependent var 774557.4
S.E. of regression 676615.3 Akaike info criterion 29.79976
Sum squared resid 1.01E+13 Schwarz criterion 29.94603
Log likelihood -369.4970 Hannan-Quinn criter. 29.84033
F-statistic 4.725512 Durbin-Watson stat 1.575603
Prob(F-statistic) 0.019619
Xét MHHQ biểu diễn: Y
i
= ß
1
+ ß
2
X
i

3
Z
i
+ v
i
Từ bảng số liệu1, ta thấy:
Hệ số xác định bội: R
2
= 0.300500 ( <0.8), nên R
2
thấp.
t= 1.019450 (tỉ số t thấp)

Không có hiện tượng đa cộng tuyến.
Vậy từ đó ta có thể kết luận không có hiện tượng đa cộng tuyến.
Bài Thảo Luận KTL Nhóm 9 Page 20
- 04;2K-BN*c
Bảng hệ số tương quan giữa X và Z:
Bảng 2
X Z
X 1
−0.035
01
Z
−0.035
01
1
Từ bảng 2 ta thấy hệ số tương quan giữa biến X và Z:
Không có hiện tượng đa cộng tuyến.
Vậy từ đó ta có thể kết luận không có hiện tượng đa cộng tuyến.
- O7G2-Rc
Xét MHHQ phụ biểu diễn:
Với mức ý nghĩa 5%, ta cần kiểm định:
Giả thuyết:
Sử dụng phầm mền eview ta có bảng sau:
Bảng 3
Dependent Variable: X
Method: Least Squares
Date: 11/05/14 Time: 10:43
Sample: 1 25
Included observations: 25
Variable Coefficient Std. Error t-Statistic Prob.
C 45244.00 9565.195 4.730066 0.0001

Z -0.087265 0.519349 -0.168027 0.8680
Bài Thảo Luận KTL Nhóm 9 Page 21
R-squared 0.001226 Mean dependent var 44327.98
Adjusted R-squared -0.042199 S.D. dependent var 38493.88
S.E. of regression 39297.69 Akaike info criterion 24.07234
Sum squared resid 3.55E+10 Schwarz criterion 24.16985
Log likelihood -298.9042 Hannan-Quinn criter. 24.09938
F-statistic 0.028233 Durbin-Watson stat 0.523819
Prob(F-statistic) 0.868031
Từ bảng số liệu 3, ta có p_value = 0.868031>0.05 chấp nhận H
0
, bác bỏ H
1.
Kết luận với mức ý nghĩa 5%, ta có thể kết luận không có hiện tượng đa cộng
tuyến.
- VSLR"S-)A-4fgZhic
Từ bảng 3:
Nhân tử phóng đại:
Không có hiện tượng đa cộng tuyến.
Kết luận: không có hiện tượng đa cộng tuyến.
I$T--(U-Rc
TD
Dependent Variable: Y
Method: Least Squares
Date: 11/05/14 Time: 08:20
Sample: 1995 2011
Included observations: 17
Variable Coefficient Std. Error t-Statistic Prob.
C 67826.02 60989.14 1.112100 0.2848
X 26.30460 3.495214 7.525889 0.0000

Z -26.11620 30.48028 -0.856823 0.4060
R-squared 0.969376 Mean dependent var 938129.5
Adjusted R-squared 0.965002 S.D. dependent var 747521.3
S.E. of regression 139845.2 Akaike info criterion 26.69324
Sum squared resid 2.74E+11 Schwarz criterion 26.84028
Log likelihood -223.8926 Hannan-Quinn criter. 26.70786
Bài Thảo Luận KTL Nhóm 9 Page 22
F-statistic 221.5821 Durbin-Watson stat 0.977629
Prob(F-statistic) 0.000000
R
2
đối với hồi qui của Y đối với các biến X, Z là: 0.969376
Dependent Variable: Y
Method: Least Squares
Date: 11/05/14 Time: 11:35
Sample: 1995 2011
Included observations: 17
Variable Coefficient Std. Error t-Statistic Prob.
C 44159.47 53891.89 0.819408 0.4254
X 23.46647 1.105713 21.22294 0.0000
R-squared 0.967771 Mean dependent var 938129.5
Adjusted R-squared 0.965622 S.D. dependent var 747521.3
S.E. of regression 138600.3 Akaike info criterion 26.62671
Sum squared resid 2.88E+11 Schwarz criterion 26.72473
Log likelihood -224.3270 Hannan-Quinn criter. 26.63645
F-statistic 450.4130 Durbin-Watson stat 1.036686
Prob(F-statistic) 0.000000
R
2
đối với hồi qui của Y đối với X và bỏ biến Z là: 0.967771

Dependent Variable: Y
Method: Least Squares
Date: 11/05/14 Time: 11:37
Sample: 1995 2011
Included observations: 17
Variable Coefficient Std. Error t-Statistic Prob.
C -27078.52 129491.6 -0.209114 0.8372
Z 191.2756 21.11287 9.059667 0.0000
R-squared 0.845484 Mean dependent var 938129.5
Adjusted R-squared 0.835183 S.D. dependent var 747521.3
S.E. of regression 303475.8 Akaike info criterion 28.19412
Sum squared resid 1.38E+12 Schwarz criterion 28.29215
Log likelihood -237.6500 Hannan-Quinn criter. 28.20387
F-statistic 82.07756 Durbin-Watson stat 0.828475
Prob(F-statistic) 0.000000
Bài Thảo Luận KTL Nhóm 9 Page 23
R
2
đối với hồi qui của Y đối với Z và loại biến X là: 0.845484
Như vậy, trong trường hợp này ta loại biến Z
Năm y x
1995 228892 8155.4
1996 272036 11143.6
1997 313623 11592.3
1998 361017 11499.6
1999 399942 11742.1
2000 441646 15636.5
2001 481295 16218
2002 535762 17745.6
2003 613443 25255.8

2004 715307 31968.8
2005 914001 36761.1
2006 1061565 44891.1
2007 1246769 62764.7
2008 1616047 80713.8
2009 1809149 69948.8
2010 2157828 84838.6
2011 2779880 106749.9
trong
đó
Y: GDP
X: Giá trị hàng xuất khẩu
- Hệ số xác định bội R
2
cao nhưng tỷ số T thấp:
Chạy MHHQ của bảng dữ liệu mới, ta có kết quả:
Dependent Variable: Y
Method: Least Squares
Date: 11/05/14 Time: 11:35
Sample: 1995 2011
Bài Thảo Luận KTL Nhóm 9 Page 24
Included observations: 17
Variable Coefficient Std. Error t-Statistic Prob.
C 44159.47 53891.89 0.819408 0.4254
X 23.46647 1.105713 21.22294 0.0000
R-squared 0.967771 Mean dependent var 938129.5
Adjusted R-squared 0.965622 S.D. dependent var 747521.3
S.E. of regression 138600.3 Akaike info criterion 26.62671
Sum squared resid 2.88E+11 Schwarz criterion 26.72473
Log likelihood -224.3270 Hannan-Quinn criter. 26.63645

F-statistic 450.4130 Durbin-Watson stat 1.036686
Prob(F-statistic) 0.000000
Xét MHHQ biểu diễn: Y
i
= ß
1
+ ß
2
X
i
+ v
i
Từ bảng số liệu1, ta thấy:
Hệ số xác định bội: R
2
= 0.967771 ( >0.8), nên R
2
cao.
t= 21.22294 >
t
kn−
2
α
=2.131. Suy ra t
tn
cao.
Không có hiện tượng đa cộng tuyến.
Vậy từ đó ta có thể kết luận không có hiện tượng đa cộng tuyến.
Bài Thảo Luận KTL Nhóm 9 Page 25

×