Tải bản đầy đủ (.docx) (16 trang)

Bài thảo luận môn kinh tế lượng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (239.67 KB, 16 trang )

MỤC LỤC

I. Lý thuyết
1. Các cách phát hiện hiện tượng đa cộng tuyến.
1.1. R2 cao nhưng chỉ số t thấp.
1.2. Tương quan cặp giữa các biến giải thích cao
1.3. Hồi quy phụ
1.4. Nhân tử phóng đại phương sai
1.5. Độ đo Theil

2. Các biện pháp khắc phục hiện tượng đa cộng tuyến.
2.1. Sử dụng thông tin tiên nghiệm
2.2. Thu thập số liệu hoặc lấy thêm mẫu mới
2.3. Bỏ biến
2.4. Sử dụng sai phân cấp 1
II. Ví dụ minh họa.

1


I. Lý thuyết.
1. Các cách phát hiện hiện tượng đa cộng tuyến.
Sau khi tìm hiểu bản chất và các hệ quả của đa cộng tuyến, câu hỏi thường đặt ra là:
bằng cách nào chúng ta biết được cộng tuyến tồn tại trong một tình huống cho trước,
đặc biệt là trong những mô hình liên quan đến nhiều hơn hai biến giải thích?
Bởi vì đa cộng tuyến là một hiện tượng mẫu rất quan trọng xuất hiện ngoài tập số
liệu phi thực nghiệm lớn được thu thập trong hầu hết các ngành khoa học xã hội,
chúng ta không có một phương pháp duy nhất nào để phát hiện nó hoặc đo lường độ
mạnh của nó. Những gì chúng ta có là một vài qui tắc kinh nghiệm, một số thông
thường và một số ngoại lệ, nhưng các qui tắc kinh nghiệm thì đều giống nhau. Bây giờ
chúng ta xem xét một vài trường hợp của các qui tắc kinh nghiệm này.


1.1. cao nhưng tỉ số t thấp.
Nếu R2 cao (>0.8), ftn cao => Miền bác bỏ Wα
=> Bác bỏ giả thuyết H0: β2 =β3 =…=βk= 0
Nhưng t nhỏ, ttn thấp => Miền bác bỏ Wα => Chấp nhận giả thuyết H0: βj=0
=> Mâu thuẫn
=> Dấu hiệu của đa cộng tuyến.
1.2. Tương quan cặp giữa các biến giải thích cao.
Nếu hệ số tương quan cặp giữa các biến giải thích cao (vượt 0,8) thì có khả năng có
tồn tại đa cộng tuyến. tuy nhiên tiêu chuẩn này thường không chính xác. Có những
trường hợp tương quan cặp không cao nhưng vẫn có đa cộng tuyến. Ta xét 3 biến giải
thích , , như sau:
= ( 1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0)
= ( 0,0,0,0,0,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0)
= ( 1,1,1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0)
Ta thấy = + nghĩa là ta có đa cộng tuyến hoàn hảo, tuy nhiên tương quan cặp là : = 1/3 ; = = 0,59.
Như vậy đa cộng tuyến xảy ra mà không có sự báo trước của tương quan cặp.
1.3. Hồi quy phụ
Hồi qui một biến giải thích X nào đó theo các biến còn lại.

2


Tính R2 tương ứng, ta đặt nó là Ri2
Mối liên hệ giữa
F
F( k−2 ; n−�+1)
Trong đó: n đại diện cho cỡ mẫu; k đại diện cho số biến giải thích; là hệ số xác định
trong hồi quy của biến �� theo các biến � khác.
Lập giả thiết: H0: R2=0
Nếu F> Fα( k−2 ; n−�+1): Bác bỏ H0 => Có đa cộng tuyến

Nếu F< Fα( k−2 ; n−�+1): Chấp nhận H0 => không có đa cộng tuyến
1.4. Nhân tử phóng đại phương sai
Một thước đo khác của hiện tượng đa cộng tuyến là nhân tử phóng đại phương sai
gắn với, biến kí hiệu là VIF()
Đối với hàm hồi quy 2 biến giải thích, VIF được định nghĩa như sau: VIF=
Đối với trường hợp tổng quát, có (k-1) biến giải thích:
VIF()=
Ri2: là giá trị R2 trong hàm hồi quy của Xi theo (k-1) biến giải thích còn lại.
Ta thấy rằng khi Ri2 tăng làm VIF tăng và làm tăng mức độ đa cộng tuyến.
Thông thường khi VIF > 10 thì biến này đuơcj coi là có đa cộng tuyến.

1.5. Độ đo Theil
Ý tưởng của phương pháp này là khi không có đa cộng tuyến thì đóng góp của các
cá thể là đóng góp chung, còn khi có đa cộng tuyến thì đóng góp của cá thể nhỏ hơn
nhiều đóng góp chung. Thực hiện như sau:
Ước lượng k-1 hồi quy, bỏ Xj ra khỏi mô hình.
Khi đó, hàm hồi quy là:
3


Yi = β1 + + ui (i j)’
Sau khi hồi quy người ta tìm được R2(-j), đó là độ phù hợp của hàm hồi quy (không có
Xj), sau đó tính R2 - R2(-j) là phần đóng góp của Xj cho Y.
Tính: m = R2
Người ta quan niệm
2. Các biện pháp khắc phục hiện tượng đa cộng tuyến.
Có thể làm gì nếu vấn đề đa cộng tuyến trở nên nghiêm trọng? Như trong trường
hợp phát hiện đa cộng tuyến, không còn lời hướng dẫn nào đáng tin cậy nữa vì đa
cộng tuyến đặc biệt là một vấn đề về mẫu. Tuy nhiên, chúng ta có thể cố gắng
tuân theo các qui tắc kinh nghiệm, việc thành công còn phụ thuộc vào mức độ

nghiêm trọng của vấn đề cộng tuyến.
2.1. Sử dụng thông tin tiên nghiệm
Một trong các cách tiếp cận để giải quyết vấn đề đa cộng tuyến là phải tận dụng
thông tin tiên nghiệm hoặc thông tin từ nguồn khác để ước lượng các hệ số riêng.
Thí dụ: Khi hồi quy hàm sản xuất Cobb-Douglas

Yi =β1
Yi: sản lượng
Ki: lượng vốn
Li: lượng lao động sử dụng
Ui: sai số ngẫu nhiên.
=>

Ln(Yi) = β1 + β2ln(Ki) + β3ln(Li) + ui

(2.1)

Chúng ta có thể gặp hiện tượng đa cộng tuyến do K và L cùng tăng theo quy mô sản
xuất. Vì hiệu suất không đổi theo quy mô nên ta có thêm thông tin β2+β3=1.
Với thông tin tiên ngiệm này chuyển mô hình hồi quy (2.1) thành
Ln(Yi) = β1 + β2ln(Ki) + (1-β2)ln(Li) + ui
Từ đó ta được:

Ln(Yi) - ln(Li) = β1 + β2(ln(Ki) - ln(Li)) + ui

Đặt: Ln(Yi) - ln(Li) = Yi* ; ln(Ki) - ln(Li) = Xi*

ta có:

Y i * = β 1 + β2 Xi * + ui


(2.2)

=> Mất đa cộng tuyến (vì (2.2) là mô hình hồi quy đơn).
2.2. Thu thập thêm số liệu hoặc lấy thêm mẫu mới
4


Vì vấn đề đa cộng tuyến là một đặc tính của mẫu, có thể là trong một mẫu khác
các biến cộng tuyến có lẽ sẽ không nghiêm trọng như trong mẫu đầu tiên. Điều này
chỉ có thể làm được khi chi phí cho việc lấy mẫu khác có thể chấp nhận được trong
thực tế.
Đôi khi cần thu thập thêm số liệu , tăng cỡ mẫu có thể làm giảm tính nghiêm
trọng của đa cộng tuyến.
2.3. Bỏ biến
Đây là cách làm đơn giản nhất.
Giả sử mô hình hồi quy: Y = β1 + β2X2 + β3X3 + … + βkXk + ui
Y là biến được giải thích ; X2 , X3,….., Xk là các biến giải thích.
Chúng ta thấy rằng X2 tương quan chặt chẽ với X3. Khi đó nhiều thông tin về Y chứa
ở X2 thì cũng chứa ở X3.
Vậy nếu ta bỏ một trong 2 biến X2 hoặc X3 khỏi mô hình hồi quy, ta sẽ giải quyết
được vấn đề đa cộng tuyến nhưng sẽ mất đi một số thông tin về Y.
Bằng phép so sánh R2 và Ŕ2 trong các phép hồi quy khác nhau mà có và không có
một trong hai biến chúng ta có thể quyết định nên bỏ biến nào trong hai biến X2 và X3
khỏi mô hình .
Thí dụ: R2 đối với hồi quy của Y đối với tất cả các biến X1, X2, ……..Xk là 0,94 ;
R2 khi loại biến X2 là 0,87 và R2 khi loại X3 là 0,92 : như vậy trong trường hợp này ta
loại X3.

2.4. Sử dụng sai phân cấp 1.

Thí dụ chúng ta hồi quy trên dữ liệu chuỗi thời gian:
Yt = β1 + β2 X2t + β3X3t + Ut

(2.4)

Trong đó t là thời gian.
Giả sử chúng ta gặp phải hiện tượng đa cộng tuyến do X2t và X3t có thể cùng tăng
hoặc giảm theo từng năm.
Phương trình trên đúng với t thì cũng đúng với t-1 nghĩa là:
Yt-1 = β2 + β2 X2t-1 + β3 X3t-1 + Ut-1

(2.5)

Lấy (2.5) trừ (2.4) ta có:
Yt – Yt-1 = β2 (X2t - X2t-1) + β3 (X3t - X3t-1) + Ut - Ut-1
Đặt

yt = Yt – Yt-1
x2t = X2t – X2t-1
5


Thứ
tự
1
2
3
4
5
6

7
8
9
10
11
12
13
14
15
16
17
18
19
20

Yi

Xi
283971.4
20731.2
20456.2
31461
15349.3
42515.2
12318.8
17968.5
8771
14672.8
13472.8
3077.4

4484
2200
7154
7135
6497.8
11537.8
11606.5
9539.7

x3t = X3t – X3t-1

Zi
6699.6
1014.6
1060.3
1163.7
1718.9
1878.5
1150.4
1786.0
786.9
1833.5
906.9
746.3
515.0
298.7
730.8
637.5
758.6
1139.4

741.2
1574.3

Vt = Ut – Ut-1

2013
821
1289
191
1038
1233
1242
1138
914
1110
652
94
77
61
125
100
110
323
89
410

Ta được: yt = β2 x2t
+ β3 x3t + Vt
(2.6)
Mô hình hồi quy

dạng (2.6) thường
làm giảm tính
nghiêm trọng của đa
cộng tuyến vì

X

2

và X 3 có thể
tương quan cao
nhưng không có lý
do chính đáng nào
để chắc chắn rằng
sai phân của chúng
tương quan cao.

Tuy nhiên biến
đổi sai phân bậc
thấp sinh ra một số
vấn đề chẳng hạn như số hạng sai số Vt trong (2.6) có thể không tuân theo giả thuyết
của mô hình tuyến tính cổ điển đó là, các nhiễu không tương quan theo chuỗi thời
gian. Vì vậy biện pháp sửa chữa này có thể lại còn tồi tệ hơn.
II. Ví dụ minh họa.
Bảng số liệu thu thập mức độ tiêu thụ hàng hóa của các khu vực địa phương năm
2011(theo số liệu của Tổng cục Thống kê)

6



Trong đó:
Yi:Lượng thực phẩm tiêu thụ của địa phương (tấn/năm)
Xi :Dân số trung bình địa phương (nghìn người)
Zi :mật độ dân số (người/km2)

Mô hình hồi quy tuyến tính thẻ hiện sự phụ thuộc của lượng hàng hóa tiêu vào dân số
trung bình địa phương và mật độ dân số .Với mức ý nghĩa 5% phát hiện hiện tượng
đa cộng tuyến và khắc phục .


Lập mô hình hàm hồi quy

Ta có mô hình hồi quy tuyến tính thể hiện sự phụ thuộc của lượng hàng hóa tiêu thụ
vào dân sô trung bình của địa phương và mật độ dân số:
Yi=Ui
Mô hình ước lượng của hàm hồi quy tuyến tính

7


Yˆi = βˆ1 + βˆ 2 X i + βˆ 3 Z i
Từ bảng số liệu sử dụng phần mềm eviews ta có kết quả sau:
Bảng 1

1.R2 cao nhưng tỉ số t thấp
R2= 0.935697 >0.8
;
= =2.110
t1= -4.955234< 2.110
t2= 12.00754 >2.110

t3= -1,764759<2.110
Ta thấy hệ số xác định bội R2 rất gần 1,điều này chứng tỏ mô hình phù hợp.
Trong khi đó,thống kê t1; t3 lại có giá trị thấp,. Vậy có thể nghi ngờ có hiện
tượng đa cộng tuyến trong mô hình .
2.Hồi quy phụ
*, Ta tiến hành hồi quy X theo Z .
Sử dụng phần mềm eviews ta có bảng sau:
Bảng 2

8


Với Kiểm định giả thuyết

H0:=0
H 1:

Xây dựng tiêu chuẩn kiểm định:
F=
Khi H0 đúng FF(k-2;n-k+1)
Với p-value=0.000278 < =0.05 bác bỏ H0,chấp nhận H1 .
Vậy với mức ý nghĩa 5% thì X có mối liên hệ tuyến tính với Z
Kết luận:mô hình có xảy ra hiện trượng đa cộng tuyến.
3.Độ đo Theil
*, Xét mô hình hồi quy Y theo X ta được kết quả sau :
Bảng 3

9



*, Xét mô hình hồi quy Y theo Z ta được kết quả sau :
Bảng 4

10


Từ 2 bảng hồi quy trên ta được kết quả :
= 0.923916
=0.390324
Độ đo Theil :
m=R2 –(R2-)-(R2=0.935697 –(0.935697-0.923916) –(0.935697-0.390324)
=0.378543
Vậy độ đo Theil về mức độ đa cộng tuyến là 0.378543



Biện pháp khắc phục đa cộng tuyến

1.Thu thêm số liệu tăng kích thước mẫu
Ta tiến hành điều tra thêm về lượng tiêu thụ hàng hóa của địa phương thu được
kết quả sau

11


Thứ
tự
1
2
3

4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

Yi


Xi
283971.4
20731.2
20456.2
31461
15349.3
42515.2
12318.8
17968.5
8771
14672.8
13472.8
3077.4
4484
2200
7154
7135
6497.8
11537.8
11606.5
9539.7
11918.6
4090.5
1531.2
99970
5678
6380
32678
18965
11995.6

4750

Zi
6699.6
1014.6
1060.3
1163.7
1718.9
1878.5
1150.4
1786.0
786.9
1833.5
906.9
746.3
515.0
298.7
730.8
637.5
758.6
1139.4
741.2
1574.3
1326
512.3
391.2
1119.4
799.3
3421
853

604.7
1103.1
569

2013
821
1289
191
1038
1233
1242
1138
914
1110
652
94
77
61
125
100
110
323
89
410
375
54
43
79
174
307

178
205
106
128

Từ bảng số liệu sử dụng phần mềm eviews ta có kết quả sau:
Bảng 5

12


Từ bảng 5 ta có mô hình hàm hồi quy mới:



i

= -20966.76+3655888Xi -0.784228Zi
R2=0.691670 ;

;

= =2.052

t1= -2.540503 < 2.052
t2= 5.853974 >2.052
t3= -0.054654 <2.052
Mô hình sau khi tăng kích thước mẫu có R2<0.8 ,các tỉ số t cũng nhỏ nên mô
hình ước lượng là phù hợp.
2.Loại bỏ biến đa cộng tuyến ra khỏi mô hình


Khi bỏ biến Z ra khỏi mô hình hồi quy :

13


*) Khi bỏ biến Z ta có mô hình hồi quy:
= = -32329,22 + 43,90039Xi
r122 = 0,923916
Khi bỏ biến X ra khỏi mô hình hồi quy:

Ta có : = -16361,42 + 66,93391 Zi
= 0,390324
Ta thấy r132 < r122 nên mô hình khi bỏ biến X có sự phù hợp cao hơn
mô hình khi bỏ biến Z. Vậy bỏ biến X ra khỏi mô hình là hợp lý
hơn.Khắc phục được hiện tượng đa cộng tuyến.
14


15


16



×