A. LÍ THUYẾT:
I.GIỚI THIỆU VỀ ĐA CỘNG TUYẾN:
Thơng thường các biến độc lập khơng có mối quan hệ tuyến tính, nếu quy tắc
này bị vi phạm sẽ có hiện tượng đa cộng tuyến. Như vậy, đa cộng tuyến là hiện
tượng các biến độc lập trong mơ hình phụ thuộc lẫn nhau và thể hiện được dưới
dạng hàm số
II.
CÁC CÁCH PHÁT HIỆN HIỆN TƯỢNG ĐA CỘNG TUYẾN
1.
R cao nhưng tỉ số t thấp
Trong trường hợp R 2 cao (thường R 2 > 0,8) mà tỉ số t thấp thì đó chính là dấu hiệu
của hiện tượng đa cộng tuyến .
2
2.
Tương quan cặp giữa các biến giải thích cao
Nếu hệ số tương quan cặp giữa các biến giải thích cao (vượt 0,8) thì có khả năng
có tồn tại đa cộng tuyến. Tuy nhiên tiêu chuẩn này thường khơng chính xác. Có
những trường hợp tương quan cặp khơng cao nhưng vẫn có đa cộng tuyến. Thí dụ,
ta có 3 biến giải thích X 1 , X 2 , X 3 như sau
X 1 = (1,1,1,1,1, 0,0,0,0,0, 0,0,0,0,0, 0,0,0,0,0)
X 2 = (0,0,0,0,0, 1,1,1,1,1, 0,0,0,0,0, 0,0,0,0,0)
X 3 = (1,1,1,1,1, 1,1,1,1,1, 0,0,0,0,0, 0,0,0,0,0)
Rõ ràng X 3 = X 2 + X 1 nghĩa là ta có đa cộng tuyến hoàn hảo, tuy nhiên tương
quan cặp là:
r 12 = -1/3 ; r 13 = r 23 =0,59
Như vậy đa cộng tuyến xảy ra mà khơng có sự bảo trước cuả tương quan cặp
những dẫu sao nó cũng cung cấp cho ta những kiểm tra tiên nghiệm có ích.
3.
Xem xét tương quan riêng
Vì vấn đề được đề cập đến dựa vào tương quan bậc không. Farrar và Glauber đã
đề nghị sử dụng hệ số tương quan riêng. Trong hồi quy của Y đối với các biến X 2 ,
2
2
2
2
X 3 ,X 4 . Nếu ta nhận thấy răng r 1, 234 cao trong khi đó r 12,34 ; r 13, 24 ; r 14, 23 tương đối
thấp thì điều đó có thể gợi ý rằng các biến X 2 , X 3 và X 4 có tương quan cao và ít
nhất một trong các biến này là thừa.
Dù tương quan riêng rất có ích nhưng nó cũng không đảm bảo rằng sẽ cung cấp
cho ta hướng dẫn chính xác trong việc phát hiện ra hiện tượng đa cộng tuyến.
4.
Hồi quy phụ
Một cách có thể tin cậy được để đánh giá mức độ của đa cộng tuyến là hồi quy
phụ. Hồi quy phụ là hồi quy mỗi một biến giải thích X i theo các biến giải thích
cịn lại. R 2 được tính từ hồi quy này ta ký hiện R i2
Mối liên hệ giữa F i và R i2 :
F=
Ri2 /(k − 2)
(1 − Ri2 ) /( n − k + 1)
F i tuân theo phân phối F với k – 2 và n-k +1 bậc tự do. Trong đó n là , k là số
biến giải thích kể cả hệ số chặn trong mơ hình. R i2 là hệ số xác định trong hồi quy
của biến X i theo các biến X khác. Nếu F i tính được vượt điểm tới hạn F i (k-2,nk+1) ở mức ý nghĩa đã cho thì có nghĩa là X i có liên hệ tuyến tính với các biến X
khác. Nếu F i có ý nghĩa về mặt thống kê chúng ta vẫn phải quyến định liệu biến
X i nào sẽ bị loại khỏi mơ hình. Một trở ngại của kỹ thuật hồi quy phụ là gánh
nặng tính tốn. Nhưng ngày nay nhiều chương trình máy tính đã có thể đảm
đương được cơng việc tính tốn này.
5.
Nhân tử phóng đại phương sai
Một thước đo khác của hiện tượng đa cộng tuyến là nhân tử phóng đại phương
sai gắn với biến X i , ký hiệu là VIF(X i ).
VIF(X i ) được thiết lập trên cơ sở của hệ số xác định R i2 trong hồi quy của biến X i
với các biến khác nhau như sau:
1
VIF(X i ) = 1 − R 2
(5.15)
i
Nhìn vào cơng thức (5.15) có thể giải thích VIF(X i ) bằng tỷ số chung của phương
sai thực của β 1 trong hồi quy gốc của Y đối với các biến X và phương sai của ước
lượng β 1 trong hồi quy mà ở đó X i trực giao với các biến khác. Ta coi tình huống
lý tưởng là tình huống mà trong đó các biến độc lập không tương quan với nhau,
và VIF so sánh tình hng thực và tình huống lý tưởng. Sự so sánh này khơng có
ích nhiều và nó khơng cung cấp cho ta biết phải làm gì với tình huống đó. Nó chỉ
cho biết rằng các tình huống là khơng lý tưởng.
Đồ thị của mối liên hệ của R i2 và VIF là
0
V IF
100
50
2
Ri
10
0,9 1
1
Như hình vẽ chỉ ra khi R i2 tăng từ 0,9 đến 1 thì VIF tăng rất mạnh. Khi
R i2 =1 thì VIF là vơ hạn.
Có nhiều chương trình máy tính có thể cho biết VIF đối với các biến độc lập
trong hồi quy.
6. Độ đo Theil
Khía cạnh chủ yếu của VIF chỉ xem xét đến tương quan qua lại giữa các biến giải
thích. Một độ đo mà xem xét tương quan của biến giải thích với biến được giải
thích là độ đo Theil. Độ đo Theil được định nghĩa như sau:
k
m = R - ∑ ( R 2 - R 2i )
−
2
i=2
Trong đó R 2 là hệ số xác định bội trong hồi quy của Y đối với các biến X 2 , X 3 …
X k trong mơ hình hồi quy:
Y = β 1 + β 2 X 2i + β 3 X 3i + ……. + β k X ki + U i
R 2 i là hệ số xác định bội trong mơ hình hồi quy của biến Y đối với các biên X 2 , X
−
3 , … ,X i −1 , X i +1 , … ,X k
Đại lượng R 2 - R 2 i được gọi là “đóng góp tăng thêm vào” vào hệ số xác định bội.
−
Nếu X 2 , X 3 … X k khơng tương quan với nhau thì m = 0 vì những đóng góp tăng
thêm đó cộng lại bằng R 2 . Trong các trường hợp khác m có thể nhận giá trị âm
hoặc dương lớn.
Để thấy được độ đo này có ý nghĩa, chúng ta xét trường hợp mơ hình có 2 biến
giải thích X 2 và X 3 . Theo ký hiệu đã sử dụng ở chương trước ta có:
2
2
m = R 2 - ( R 2 - r 12 ) – (R 2 – r 13 )
2
2
Tỷ số t liên hệ với tương quan riêng r 12,3 , r 13, 2
Trong phần hồi quy bội ta đã biết:
2
2
2
R 2 = r 12 + (1- r 12 ) r 13, 2
2
2
2
R 2 = r 13 + (1- r 13 ) r 12,3
Thay 2 công thức này vào biểu thức xác định m ta được:
2
2
2
2
2
2
2
2
m = R 2 - (r 12 + (1- r 12 ) r 13, 2 - r 12 ) - ( r 13 + (1- r 13 ) r 12,3 - r 13 )
2
2
2
2
= R 2 - ((1- r 12 ) r 13, 2 + (1- r 13 ) r 12,3 )
2
2
Đặt 1- r 12 = w 2 ; 1- r 13 = w 3 và gọi là các trọng số. Công thức (5.16) được viết
lại
dưới dạng
2
2
m = R 2 - (w 2 r 13, 2 + w 3 r 12,3 )
Như vây độ đo Theil bằng hiệu giữa hệ số xác định bội và tổng có trọng số của
các hệ số tương quan riêng.
Như vậy chúng ta đã biết một số độ đo đa cộng tuyến nhưng tất cả đều có ý nghĩa
sử dụng hạn chế. Chúng chỉ cho ta những thông báo rằng sự việc khơng phải là lý
tưởng.
Cịn một số độ đo nữa nhưng liên quan đến giá trị riêng hoặc thống kê Bayes
chúng ta khơng trình bày ở đây.
III.
Biện pháp khắc phục
1. Sử dụng thông tin tiên nghiệm
Một trong các cách tiếp cận để giải quyết vấn đề đa cộng tuyến là phải tận dụng
thông tin tiên nghiệm hoặc thông tin từ nguồn khác để ước lượng các hệ số riêng.
Thí dụ : ta muốn ước lượng hàm sản xuất của 1 q trình sản xuất nào đó có dạng :
Qt =AL
Trong đó Qt là lượng sản phẩm được sản xuất thời kỳ t ; Lt lao động thời kỳ t ; Kt
vốn thời kỳ t ; Ut là nhiễu ;A , α, β là các tham số mà chúng ta cần ước lượng .Lấy
ln cả 2 vế (5.17) ta được :
LnQt = LnA + αlnLt + βKt Ut
Đặt
LnQt = Q*t ; LnA = A* ; LnLt = L*t
Ta được
Q*t
= A* + αL*t + βK*t + Ut (5.18)
Giả sử L|K và L có tương quan rất cao dĩ nhiên điều này sẽ dẫn đến phương
sai của các ước lượng của các hệ số co giãn của hàm sản xuất lớn .
Giả sử từ 1 nguồn thơng tin có lới theo quy mơ nào đó mà ta biết được rằng
ngành cơng nghiệp này thuộc ngành cso lợi tức theo quy mô không đổi nghĩa là α
+ β =1 .Với thông tin này ,cách xử lý của chúng ta sẽ là thay β = 1 - α vào (5.18)
và thu được :
Q*t
Q*t – K*t = A* + α(L*t – K*t ) + Ut
Từ đó ta được
Đặt
= A* + αL*t + ( 1 - α )K*t + Ut (5.19)
Q*t – K*t = Y*t và L*t – K*t = Z*t ta được
Y*t
= A* + α Z*t + Ut
Thông tin tiên nghiệm đã giúp chúng ta giảm số biến độc lập trong mơ hình
xuống cịn 1 biến Z*t
µ
µ
µ
µ
Sau khi thu được ước lượng α của α thì β tính được từ điều kiện β = 1 – α
2. Thu thập số liệu hoặc lấy thêm mẫu mới
Vì đa cộng tuyến là đặc trưng của mẫu nên có thể có mẫu khác liên quan đến
cùng các biến trong mẫu ban đầu mà đa cộng tuyến có thể không nghiêm trọng
nữa. Điều này có thể làm được khi chi phí cho việc lấy mẫu khác có thể chấp nhận
được trong thực tế .
Đôi khi chỉ cần thu thập them số liệu , tăng cỡ mẫu có thể làm giảm tính
nghiêm trọng của đa cộng tuyến .
3. Bỏ biến
Khi có hiện tượng đa cộng tuyến nghiêm trọng thì cách “ đơn giản nhất “là bỏ
biến cộng tuyến ra khỏi phương trình. Khi phải sử dụng biện pháp này thì cách
thức tiến hành như sau :
Giả sử trong mơ hình hồi quy của ta có Y là biến được giải thích cịn X2 .X3
…Xk là các biến giải thích . Chúng ta thấy rằng X2 tương quan chặt chẽ với
X3 .Khi đó nhiều thơng tin về Y chứa ở X2 thì cũng chứa ở X3 .Vậy nếu ta bỏ 1
trong 2 biến X2 hoặc X3
Khỏi mơ hình hồi quy , ta sẽ giải quyết được vấn đề đa cộng tuyến nhưng sẽ mất đi
1 phần thông tin về Y .
Bằng phép so sánh R 2 và R 2 trong các phép hồi quy khác nhau mà có và khơng
có 1 trong 2 biến chúng ta có thể quyết định nên bỏ biến nào trong biến X2 và X3
khỏi mơ hình .
Thí dụ R2 đối với hồi quy của Y đối với tất cả các biến X1X2X3 …Xk là 0.94;
R2 khi loại biến X2 là 0.87 và R2 khi loại biến X3 là 0.92 ;như vậy trong trường
hợp này ta loại X3
Chúng ta lưu ý 1 hạn chế của biện pháp này là trong các mơ hình kinh tế có
những trường hợp địi hỏi nhất định phải có biến này hoặc biến khác ở trong mơ
hình .Trong trường hợp như vậy việc loại bỏ 1 biến phải được cân nhắc cẩn thận
giữa sai lệch khi bỏ 1 biến cộng tuyến với việc tăng phương sai của các ước lượng
hệ số khi biến đó ở trong mơ hình .
4. Sử dụng sai phân cấp 1
Thủ tục được trình bày trong chương 7 – tự tương quan .Mặc dù biện pháp này
có thể giảm tương quan qua lại giữa các biến nhưng chúng cũng có thể được sử
dụng như 1 giải pháp cho vấn đề đa cộng tuyến .
Thí dụ Chúng ta có số liệu chuỗi thời gian biểu thị liên hệ giữa các biến Y và các
biến phụ thuộc X2 và X3 theo mơ hình sau :
Yt = β 1 + β 2 X 2t + β 3X 3t+ U t (5.20)
Trong đó t là thời gian . Phương trình trên đúng với t thì cũng đúng với t-1 nghĩa
là :
Yt-1 = β 2 + β 2 X 2t-1 + β 3X 3t-1 + U t-1 (5.21)
Từ (5.20) và (5.21) ta được :
Yt – Yt-1 = β 2 (X 2t - X 2t-1 ) + β 3 (X 3t - X 3t-1) + U t - U t-1
(5.22)
Đặt yt = Yt – Yt-1
x2t = X 2t - X 2t-1
x3t = X 3t - X 3t-1
Vt = U t - U t-1
Ta được : yt = β 2 x2t + β 3 x3t + Vt
(5.23)
Mơ hình hồi quy dạng (5.23) thường làm giảm tính nghiêm trọng của đa cộng
tuyến vì dù X2 và X3 có thể tương quan cao nhưng khơng có lý do tiên nghiệm
nào chắc chắn rằng sai phân của chúng cũng tương quan cao.
Tuy nhiên biến đổi sai phân bậc nhất sinh ra 1 số bấn đề chẳng hạn như số hạng
sai số Vt trong (5.23) có thể khơng thỏa mãn giả thiết của mơ hình hồi quy tuyến
tính cổ điển là các nhiễu khơng tương quan .Vậy thì biện pháp sửa chữa này có thể
lại còn tồi tệ hơn căn bệnh .
5.Giảm tương quan trong hồi quy đa thức
Nét khác nhau của hồi quy đa thức là các biến giải thích xuất hiện với lũy thừa
khác nhau trong mơ hình hồi quy .Trong thực hành để giảm tương quan trong hồi
quy đa thức người ta thường sử dụng dạng độ lệch .Nếu việc sử dụng dạng độ lệch
mà vẫn khơng giảm đa cộng tuyến thù người ta có thể phải xem xét đến kỹ thuật “
đa thức trực giao “.
6. Một số biện pháp khác
Ngoài các biện pháp đã kể trên người ta còn sử dụng 1 số biện pháp khác nữa để
cứu chữa căn bệnh này như sau :
- hồi quy thành phần chính
- Sử dụng các ước lượng từ bên ngoài
Nhưng tất cả các biên pháp đã trình bày ở trên có thể làm giải pháp cho vấn đề
đa cộng tuyến như thế nào còn phụ thuộc vào bản chất của tập số liệu và tính
nghiêm trọng của vấn đề đa cộng tuyến.
B. VÍ DỤ MINH HỌA
Bài tốn: Cho bảng số liệu sau.
Trong đó:
Y: sản lượng dầu thơ (đơn vị: nghìn tấn)
X: kim ngạch xuất khẩu dầu thơ (đơn vị: nghìn tấn)
Z: vốn đầu tư khai thác (đơn vị trăm triệu đồng)
Yêu cầu: Hãy phát hiện hiện tượng đa cộng tuyến và tìm biện pháp khắc phục. Cho
α = 5%.
2.9975
3.2615
3.9534
5.3669
6.0973
7.2072
7.8243
8.1796
9.5359
13.0394
13.2836
13.6048
13.937
14.3781
14.5893
15.2548
15.7597
15.9621
26.444
71.3427
129.8
230.7305
341.7524
481.4634
601.2952
696.9732
863.8135
10.7118
11.9966
13.9931
15.9544
17.1974
18.4503
16.1865
16.8256
17.6121
18.2776
18.8364
18.8881
1003.6598
1144.594
1287.8756
1420.5488
1569.5317
1814.2707
Tiến hành ước lượng hàm hồi quy mẫu ta được
Dependent Variable: Y
Method: Least Squares
Date: 05/06/10 Time: 19:25
Sample: 1 15
Included observations: 15
Variable
C
X
Z
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
Coefficient
12.47549
0.228322
0.001431
0.990379
0.988776
0.210776
0.533118
3.743892
1.650553
Std. Error
t-Statistic
Prob.
0.301090
41.43445
0.0000
0.105322
2.167852
0.0510
0.000924
1.547751
0.1476
Mean dependent var
15.76234
S.D. dependent var
1.989505
Akaike info criterion
-0.099186
Schwarz criterion
0.042424
F-statistic
617.6576
Prob(F-statistic)
0.000000
I/ Phát hiện hiện tượng đa cộng tuyến
Ta có hàm hồi quy mẫu:
ˆ
Yi = 12.47549+0.228322X i + 0.001431Zi
( −
12
tαn/2 k ) = t0.025 = 2.179
Cách 1: Hệ số xác định bội R 2 cao nhưng t thấp.
Nhận xét:
R 2 = 0.990379 > 0.8
Thống kê t của hệ số ứng với biến X
T = 2.167852 < 2.179
Thống kê t của hệ số ứng với biến Z
T = 1.547751 < 2.179
Vậy R 2 cao nhưng t thấp. Suy ra có hiện tượng đa cộng tuyến.
Cách 2: Hệ số tương quan cặp giữa các biến giải thích cao
Ta có.
X
X
1.00000
0
0.994412
Z
Z
0.994412
1000000
r12 = 0.994412 > 0.8
=> Như vậy ta càng có cơ sở kết luận có hiện tượng đa cộng tuyến trong mơ hình
trên
Cách 3: Hồi quy phụ
Ta hồi quy biến X theo biến Z được kết quả như sau:
Dependent Variable: X
Method: Least Squares
Date: 05/06/10 Time: 21:05
Sample: 1 15
Included observations: 15
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
Z
2.717476
0.008727
0.246174
0.000257
11.03884
33.96160
0.0000
0.0000
R-squared
Adjusted R-squared
0.988854
0.987997
Mean dependent var
S.D. dependent var
9.515147
5.066274
S.E. of regression
0.555048
Akaike info criterion
1.784043
Sum squared resid
4.005022
Schwarz criterion
1.878449
Log likelihood
-11.38032
F-statistic
1153.390
Durbin-Watson stat
0.703053
Prob(F-statistic)
0.000000
Ta có α = 0.05 ta đi kiểm định giả thiết
H 0 : X khơng có hiện tượng đa cộng tuyến với Z
H1 : X có hiện tượng đa cộng tuyến với Z
Nhận xét:
Ta thấy giá trị p-value của thống kê F là 0.000000 < α =0.05
=> bác bỏ giả thiết H 0 chấp nhận giả thiết H1
Vậy càng có cơ sở khẳng định mơ hình trên có hiện tượng đa cộng tuyến
Cách 4: Độ đo Theil
Ta có các hệ số tương quan giữa các biến Y và X,Z như
Y
X
Z
Y
1.000000
0.994213
0.993283
X
0.994213
1.000000
0.994412
Z
0.993283
0.994412
1.000000
2
2
Để tính được độ đo Theil ta phải tính được R 2 , r12,3và,r13,2 . Theo công thức đã biết ở
chương hai ta có
2
13,2
r
=r
2
12,3
(r13 − r12 r23 ) 2
(0.993283 − 0.994213 × 0.994412) 2
=
≈ 0.16636
=
2
2
(1 − r12 )(1 − r23 )
(1 − 0.9942132 )(1 − 0.9944122 )
2
r13 = (0.993283) 2 ≈ 0.98661
2
2
2
R 2 = r12 + (1 − r12 )r13,2 = (0.994213)2 + (1 − 0.9942132 )0.16636 ≈ 0.99038
2
2
2
2
2
Vậy m = R − (1 − r12 )r13,2 + (1 − r13 )r12,3
] = 0.99038 – 2(1-0.98846)0.16636=0.98654
m khác 0 nên chứng tỏ có hiện tượng đa cộng tuyến sảy ra. Và mức độ đa cộng
tuyến là 0.98654
II/ Khắc phục hiện tượng đa cộng tuyến
Cách 1: Bỏ biến
Bước 1: hồi quy Y theo X => R12 , R12
2
Bước 2: hồi quy Y theo Z => R22 , R2
Bước 3: so sánh R 2 và R 2 trong các hồi quy trên
Bước 4: kết luận.
* Bước
quy Y
Dependent Variable: Y
Method: Least Squares
Date: 05/06/10 Time: 22:44
Sample: 1 15
Included observations: 15
Dependent Variable: Y Coefficient
Variable
Method: Least Squares
C
13.09595
Date: 05/06/10 Time: 22:42
Z
0.003423
Sample: 1 15
R-squared
0.986612
Included observations: 15 0.985582
Adjusted R-squared
S.E. of Variable
regression
Sum squared resid
C
X
Log likelihood
Durbin-Watson stat
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
* Bước 2 Hồi quy Y theo Z
0.238892
Coefficient
0.741904
12.04740
0.390423
1.265315
1.580353
0.988459
0.987571
0.221801
0.639543
2.378807
1.323845
1 : Hồi
theo X
Std. Error
0.105953
0.000111
t-Statistic
123.6014
30.95139
Prob.
0.0000
0.0000
Mean dependent var
S.D. dependent var
Akaike info criterion
Std. Error
t-Statistic
Schwarz criterion
0.125199
96.22580
0.011701
33.36762
F-statistic
Prob(F-statistic) var
Mean dependent
S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)
15.76234
1.989505
0.097958
Prob.
0.192365
0.0000
0.0000
957.9883
0.000000
15.76234
1.989505
-0.050508
0.043899
1113.398
0.000000
* Bước 3 :
Từ kết quả hồi quy ở trên ta có:
R = 0.988776
R 2 = 0.990379
R12 = 0.988459
R12 = 0.987571
R22 = 0.986612
R22 = 0.985582
* Bước 4:
Ta tiến hành so sánh. Và kết luận trong trường hợp này loại biến Z
Cách 2: Sử dụng sai phân cấp 1
Chúng ta có số liệu chuỗi thời gian biểu thị liên hệ giữa biến Y và các biến phụ
thuộc X,Z theo mơ hình sau
Yt = β1 + β 2 X + β 3 X + U t
(*)
Với t là thời gian. Phương trình trên đúng với t thì cũng đúng với t-1 nghĩa là :
Yt −1 = β1 + β 2 X 2 t −1 + β3 X 3t −1 + U t −1 (**)
Trừ (* ) cho (** ). Và đặt
zt
yt = Yt − Yt −1
xt = X t − X t −1
zt = Z t − Z t −1
Ta thu được bảng số liệu mới
yt
xt
0.2442
0.3212
0.3322
0.4411
0.2112
0.6655
0.5049
0.2024
0.2244
0.6391
0.7865
0.6655
0.5588
0.0517
0.264
0.6919
0.14135
0.7004
1.1099
0.6171
0.3553
1.3563
1.1759
1.2848
1.9965
1.9613
1.243
1.2529
Hồi quy sai phân cấp 1
zzt t
44.8987
58.4573
100.9305
111.0219
139.711
119.8318
95.678
166.8403
139.8463
140.9342
143.2816
132.6732
148.9829
244.739
Dependent Variable: Y
Method: Least Squares
Date: 05/07/10 Time: 00:26
Sample: 1 14
Included observations: 14
Variable
C
X
Z
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
Coefficient
0.492919
0.253956
-0.002599
0.318112
0.194132
0.199640
0.438416
4.380378
1.895777
Std. Error
0.156868
0.118246
0.001415
t-Statistic
3.142245
2.147699
-1.836880
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)
Prob.
0.0094
0.0549
0.0934
0.417764
0.222390
-0.197197
-0.060256
2.565840
0.121737
Ta có hệ số tương quan giữa các biến giải thích
xt
zt
xt
1.000000
0.582640
zt
0.582640
1.000000
Hồi quy phụ của biến sai phân xt theo zt ta được
Dependent Variable: X
Method: Least Squares
Date: 05/07/10 Time: 00:52
Sample: 1 14
Included observations: 14
Variable
C
Z
R-squared
Adjusted R-squared
Coefficient
0.120602
0.006971
0.339469
0.284425
Std. Error
0.381380
0.002807
t-Statistic
0.316226
2.483386
Mean dependent var
S.D. dependent var
Prob.
0.7573
0.0288
1.010761
0.576160
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.487384
2.850513
-8.724231
1.094455
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)
1.532033
1.623327
6.167204
0.028779
Nhận xét R 2 =0.318112< 0.8
r12 = 0.582640 <0.8
Khi ta tiến hành hồi quy phụ xt theo zt , mặc dù vẫn còn hiện tượng đa cộng tuyến
nhưng mức độ cộng tuyến giảm vì Pvalue =0.028778 đã gần với α =0.05 hơn. Tuy
nhiên ta thấy, khi sử dụng sai phân cấp 1 mức độ phù hợp của mơ hình đã bị suy
giảm.
Bỏ biến sai phân
Hồi quy Y theo biến X
Dependent Variable: Y
Method: Least Squares
Date: 05/07/10 Time: 07:51
Sample: 1 14
Included observations: 14
Variable
Coefficient
C
0.288988
X
0.127405
R-squared
0.108950
Adjusted R-squared
0.034696
S.E. of regression
0.218498
Sum squared resid
0.572895
Log likelihood
2.507636
Durbin-Watson stat
1.736288
Std. Error
t-Statistic
0.121294
2.382547
0.105180
1.211307
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)
Hồi quy Y theo biến Z
Dependent Variable: Y
Method: Least Squares
Date: 05/07/10 Time: 07:55
Sample: 1 14
Included observations: 14
Prob.
0.0346
0.2491
0.417764
0.222390
-0.072519
0.018774
1.467265
0.249092
Variable
C
Z
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
Coefficient
0.523546
-0.000828
0.032177
-0.048475
0.227716
0.622256
1.929093
1.210672
Std. Error
t-Statistic
0.178189
2.938155
0.001311 -0.631636
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)
Prob.
0.0124
0.5395
0.417764
0.222390
0.010130
0.101423
0.398964
0.539472
Từ kết quả hồi quy của yt theo xt và yt theo zt ta sẽ chọn loại bỏ biến zt khỏi mơ
hình
Mặt khác ta lại có
t là số quan sát. Phương trình cũng đúng với t quan sát thì cũng đúng với t-1 quan
sát
* Ta có mơ hình hồi quy gốc ban đầu là:
ˆ
Yi = 12.47549+0.228322X i + 0.001431Zi (1)
* Xây dựng hàm hồi quy thứ 2 mà khi ta đã bỏ đi quan sát đâu tiên
Dependent Variable: Y
Method: Least Squares
Date: 05/07/10 Time: 08:23
Sample: 1 14
Included observations: 14
Variable
Coefficient
C
12.53141
X
0.222474
Z
0.001445
R-squared
0.989091
Adjusted R-squared
0.987107
S.E. of regression
0.216974
Sum squared resid
0.517854
Log likelihood
3.214701
Durbin-Watson stat
1.705403
Std. Error
t-Statistic
0.311569
40.22029
0.108643
2.047760
0.000958
1.509363
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)
Ta có hàm hồi quy mới sau khi bỏ đi quan sát đầu tiên
µ
Yi =12.53141 +0.222474 X i +0.001445 Z i (2)
Lấy hiệu của (1) trừ đi (2) ta được mơi hình sai phân cấp 1
Prob.
0.0000
0.0652
0.1594
15.95684
1.910897
-0.030672
0.106269
498.6660
0.000000
µ
Yi = -0.05592+0.00585 X i - 0.000014 Z i
Mơ hình này cũng cũng có thể làm giảm đa cộng tuyến của các biến dộc lập
Kết luận.
Có nhiều cách phát hiện và khắc phục hiện tượng đa cộng tuyến khác nhau. Mỗi
phương pháp có những hạn chế nhất định. Vì vậy, khi áp dụng một phương pháp
nào ta cần cân nhắc kĩ lượng để mang lại kết quả tin cậy nhất.
CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập –Tự do – Hạnh phúc
BIÊN BẢN HỌP NHÓM THẢO LUẬN
Thời gian: 8 giờ 30 phút ngày 28/4/2010
Địa điểm: Sân thư viên trường đại học Thương Mại
Thành phần tham gia
1. Nguyễn Xuân Cẩm Vân
2. Đặng Tiến Vương
3. Đào Đức Việt
4. Phạm Hải Yến
5.
6.
7.
8.
Đinh Thị Hoàng Yến
Đỗ Hải Yến
Phạm Thị Vân
Đỗ Trọng Việt
Thành viên vắng mặt: khơng có thành viên vắng mặt
Nội dung hop: Phân chia công việc cho mỗi thành viên. Thảo luận về nội dung đề
tài.
Buổi họp kết thúc vào lúc 10 giờ 30 phút cùng ngày.
Hà Nội, ngày 28 tháng 4 năm 2010.
Thư kí
Nhóm trưởng
Kí tên
Kí tên
CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập –Tự do – Hạnh phúc
BIÊN BẢN HỌP NHÓM THẢO LUẬN
Thời gian: 8 giờ 30 phút ngày 5/5/2010
Địa điểm: Sân thư viên trường đại học Thương Mại
Thành phần tham gia
1. Nguyễn Xuân Cẩm Vân
2. Đặng Tiến Vương
3. Đào Đức Việt
4. Phạm Hải Yến
5.
6.
7.
8.
Đinh Thị Hoàng Yến
Đỗ Hải Yến
Phạm Thị Vân
Đỗ Trọng Việt
Thành viên vắng mặt: khơng có thành viên vắng mặt
Nội dung họp: Nộp bài thảo luận. Tổng hợp nội dung đề tài nhóm. Phân cơng đánh
máy, người thuyết trình.
Buổi họp kết thúc vào lúc 10 giờ 30 phút cùng ngày.
Hà Nội, ngày 5tháng 5năm 2010.
Thư kí
Nhóm trưởng
Kí tên
Kí tên
BẢN ĐÁNH GIÁ ĐIỂM CÁ NHÂN
1.
2.
3.
4.
5.
6.
7.
8.
Họ và tên
Phạm Thị Vân
Nguyễn Xuân Cẩm Vân
Đinh Thị Hoàng Yến
Đỗ Hải Yến
Đỗ Trọng Việt
Đào Đức Việt
Phạm Hải Yến
Đặng Tiến Vương
Đánh giá
Khá
Tốt
Tốt
Khá
Khá
Tốt
Khá
Khá
Thư kí
Kí tên
Xếp loại
B
A
A
B
B
A
B
B
Nhóm trưởng
Kí tên
BẢN ĐÁNH GIÁ ĐIỂM CỦA CƠ GIÁO
Họ và tên
Điểm
Ghi chú
1. Phạm Thị Vân
2. Nguyễn Xuân Cẩm Vân
3. Đinh Thị Hoàng Yến
4. Đỗ Hải Yến
5. Đỗ Trọng Việt
6. Đào Đức Việt
7. Phạm Hải Yến
8.
Đặng Tiến Vương