Tải bản đầy đủ (.doc) (36 trang)

BÀI THẢO LUẬN HIỆN TƯỢNG ĐA CỘNG TUYẾN

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (644.8 KB, 36 trang )

Kinh Tế Lượng

Giảng viên: Vũ Trọng Nghĩa

BÀI THẢO LUẬN
HỌC PHẦN: KINH TẾ LƯỢNG

HIỆN TƯỢNG ĐA CỘNG TUYẾN

Đề tài: Hiện tượng đa cộng tuyến
1. Phát hiện và cách khắc phục hiện tượng đa cộng tuyến
2. Tìm bộ số liệu ( bản chất chứa hiện tượng đa cộng tuyến) phát hiện hiện
tượng sau đó tìm cách khắc phục.
Nhóm: 6
Mã lớp HP: 1225AMAT0411

Nhóm 6 Lớp 1225AMAT0411

1


Kinh Tế Lượng

Giảng viên: Vũ Trọng Nghĩa

MỤC LỤC
A. CƠ SỞ LÝ THUYẾT
1.
Bản chất của đa cộng tuyến
1.1 Định nghĩa
1.2 Nguyên nhân


2.
Hậu quả của đa cộng tuyến
3.
Phát hiện sự tồn tại đa cộng tuyến
3.1 Hệ số xác định bội R 2 cao nhưng tỉ số t thấp
3.2 Hệ số tương quan cặp giữa các biến giải thích cao
3.3 Xem xét tương quan riêng
3.4 Xét hồi quy phụ
3.5 Sử dụng nhân tử phóng đại phương sai VIF
3.6 Độ đo Theil
4.
Biện pháp khắc phục đa cộng tuyến
4.1 Sử dụng thông tin tiên nghiệm
4.2 Thu thập số liệu hoặc lấy thêm mẫu mới
4.3 Bỏ biến
4.4 Sử dụng sai phân cấp một
4.5 Giảm tương quan trong hồi quy đa chức
4.6 Một số biện pháp khác

B BÀI TẬP THỰC HÀNH TRÊN EVIEW
1. Ước lượng mơ hình hồi quy trên eview
2. Phát hiện hiện tượng đa cộng tuyến
3. Khắc phục hiện tượng đa cộng tuyến

Nhóm 6 Lớp 1225AMAT0411

2


Kinh Tế Lượng


Giảng viên: Vũ Trọng Nghĩa

A.

CƠ SỞ LÝ THUYẾT
1. Bản chất của đa cộng tuyến
1.1. Định nghĩa
Xét mơ hình hồi quy tuyến tính cổ điển nhiều biến
Y = β 1 + β 2 X 2i + β 3 X 3i + ……. + β k X ki + U i
Hiện tượng đa cộng tuyến hoàn hảo ( đa cộng tuyến toàn phần)
Hiện tượng đa cộng tuyến toàn phần xảy ra giữa các biến giải thích X2, X3,
…,Xk nếu tồn tại 2, 3,… k không đồng thời bằng 0 sao cho
2X2i + 3X3i + …+ kXki = 0
Với mọi i (1.1)
Hiện tượng đa cộng tuyến khơng hồn hảo ( đa cộng tuyến khơng tồn phần)
Hiện tượng đa cộng tuyến tồn phần xảy ra giữa các biến giải thích X2, X3,
…,Xk nếu tồn tại 2, 3,… k không đồng thời bằng 0 sao cho
2X2i + 3X3i + …+ kXki + vi= 0 Với mọi i
(1.2)
Trong đó: vi là nhiễu ngẫu nhiên
1.2. Nguyên nhân
Do phương pháp thu thập dữ liệu
Các giá trị của các biến độc lập phụ thuộc lẫn nhau trong mẫu, nhưng không
phụ thuộc lẫn nhau trong tổng thể
Do bản chất của các biến độc là tương quan nhau
Do chọn biến Xi có độ biến thiên nhỏ
Do một số dạng mơ hình sản sinh ra đa cộng tuyến.
2. Hậu quả của đa cộng tuyến
2.1 Đa cộng tuyến toàn phần( hoàn hảo)

Trường hợp đa cộng tuyến tồn phần thì các hệ số hồi quy mẫu là không xác
định và các độ lệch tiêu chuẩn là vô hạn
2.2 Đa cộng tuyến không tồn phần ( khơng hồn hảo)
Ta xét trường hợp mơ hình có hiện tượng đa cộng tuyến khơng tồn phần ( khơng
hồn hảo), tức là biến độc lập Xi có thể xấp xỉ tuyến tính theo các biến X2 , X3 ,..., Xk .
Thì có thể xác định được các hệ số hồi quy mẫu nhưng vẫn dẫn đến các hậu quả sau:
2.2.1 Phương sai và hiệp phương sai của các ước lượng bình qn bé nhất lớn.
Trong chương mơ hình hồi quy bội ta đã có biểu thức:
(2.1)

Nhóm 6 Lớp 1225AMAT0411

3


Kinh Tế Lượng

Giảng viên: Vũ Trọng Nghĩa

(2.2)

và:

(2.3)

Trong đó

là hệ số tương quan giữa

Từ (2.1) và (2.2) ta thấy khi


tăng dần đến 1 (nghĩa là cộng tuyến tăng) thì

phương sai của 2 ước lượng này tăng dần đến vô hạn. (2.3) chỉ ra rằng khi

dần đến 1 thì

tăng

tăng về giá trị tuyệt đối.

2.2.2 Khoảng tin cậy rộng hơn.
Ta giả sử có khoảng tin cậy 95% cho

khi

đã biết là:

Trong đó:

Cho nên ta có thể viết lại các khoảng tin cậy 95% cho

Nhóm 6 Lớp 1225AMAT0411

là:

4


Kinh Tế Lượng


Giảng viên: Vũ Trọng Nghĩa

(2.4)

và cho

là:

(2.4) và (2.5) chứng tỏ

(2.5)

càng gần tới 1 thì khoảng tin cậy cho các tham số càng

rộng .
Do đó trong trường hợp có đa cộng tuyến gần hồn hảo thì số liệu của mẫu có thể
thích hợp với tập các giả thiết khác nhau. Vì thế xác suất chấp nhận giả thiết sai tăng
lên (tức là sai lầm loại II).
2.2.3 Tỷ số t mất ý nghĩa.

Như đã biết, kiểm định giả thiết

, chúng ta đã xử dụng tỷ số

và đem so sánh giá trị t đã được ước lượng với giá trị tới hạn t. Nhưng khi có đa cộng
tuyến gần hồn hảo thì sai số tiêu chuẩn ước lượng được sẽ rất cao vì vậy làm cho tỷ
số t nhỏ đi. Kết quả là sẽ làm tăng khả năng chấp nhận giả thiết
2.2.4


.

cao nhưng tỉ số ít ý nghĩa.
Để giải thích điều này. Ta hãy xét mơ hình hồi quy k biến như sau:

Trong trường hợp có đa cộng tuyến gần hồn hảo, như đã chỉ ra ở trên, ta có
thể tìm được một hoặc một số hệ số góc riêng là khơng có ý nghĩa về mặt thống kê
trên cơ sở kiểm định t. Nhưng trong khi đó

Nhóm 6 Lớp 1225AMAT0411

lại có thể rất cao, nên bằng kiểm định

5


Kinh Tế Lượng

F, chúng ta có thể bác bỏ giả thiết:

Giảng viên: Vũ Trọng Nghĩa

. Mâu thuẫn này cũng

là tín hiệu của đa cộng tuyến.
2.2.5 Các ước lượng bình phương bé nhất và các sai số tiêu chuẩn của chúng trở
nên rất nhạy cảm đối với những thay đổi nhỏ trong số liệu.
2.2.6 Dấu của các ước lượng của hệ số hồi quy có thể sai.
Khi có đa cộng tuyến gần hồn hảo thì có thể thu được các ước lượng của các hệ
số hồi quy trái với điều chúng ta mong đợi. Chẳng hạn lý thuyết kinh tế cho rằng đối

với hàng hóa bình thường khi thu nhập tăng, cầu hàng hóa tăng, nghĩa là khi hồi quy
thu nhập là một trong các biến giải thích, biến phụ thuộc là lượng cầu của hàng hóa,
nếu xảy ra hiện tượng đa cộng tuyến gần hồn hảo thì ước lượng của hệ số của biến
thu nhập có thể mang dấu âm – mâu thuẫn với điều ta mong đợi.

2.2.7 Thêm vào hay bớt đi các biến cộng tuyến với các biến khác, mơ hình sẽ thay đổi
về độ lớn của các ước lượng hoặc dấu của chúng.
Tóm lại triệu chứng chủ yếu của đa cộng tuyến mà ta nói ở trên là tăng sai số
tiêu chuẩn. Sai số tiêu chuẩn cao hơn có ngụ ý rằng sự biến thiên của hệ số hồi quy từ
mẫu này đến mẫu khác cao hơn, do đó một sự thay đổi nhỏ trong số liệu hoặc trong
mơ hình hồi quy (như thêm vào hoặc bớt đi một biến) sẽ gây ra sự thay đổi lớn của
các hệ số.
Như vậy chúng ta đã biết được một số hậu quả của đa cộng tuyến. Nhưng dù
hậu quả như thế nào đi chăng nữa thì điều quan trọng là làm thế nào để thấy được sự
tồn tại của nó để ta có thể ngăn ngừa. Chúng sẽ đi tìm hiểu tiếp một số phương pháp
để phát hiện đa công tuyến.
3. Phát hiện sự tồn tại đa cộng tuyến
3.1 Hệ số xác định bội R 2 cao nhưng tỉ số t thấp
Trong trường hợp R 2 cao (thường R 2 > 0,8) mà tỷ số t thấp thì đó chính là dấu
hiệu của hiện tượng đa cộng tuyến .
3.2 Hệ số tương quan cặp giữa các biến giải thích cao
Nếu hệ số tương quan cặp giữa các biến giải thích cao (vượt 0,8) thì có khả
năng có tồn tại đa cộng tuyến. Tuy nhiên tiêu chuẩn này thường không chính xác. Có

Nhóm 6 Lớp 1225AMAT0411

6


Kinh Tế Lượng


Giảng viên: Vũ Trọng Nghĩa

những trường hợp tương quan cặp khơng cao nhưng vẫn có đa cộng tuyến. Thí dụ, ta
có 3 biến giải thích X 1 , X 2 , X 3 như sau
X 1 = (1,1,1,1,1, 0,0,0,0,0, 0,0,0,0,0, 0,0,0,0,0)
X 2 = (0,0,0,0,0, 1,1,1,1,1, 0,0,0,0,0, 0,0,0,0,0)
X 3 = (1,1,1,1,1, 1,1,1,1,1, 0,0,0,0,0, 0,0,0,0,0)
Rõ ràng X 3 = X 2 + X 1 nghĩa là ta có đa cộng tuyến hoàn hảo, tuy nhiên
tương quan cặp là:
r 12 = -1/3 ; r 13 = r 23 =0,59
Như vậy đa cộng tuyến xảy ra mà khơng có sự bảo trước cuả tương quan cặp
những dẫu sao nó cũng cung cấp cho ta những kiểm tra tiên nghiệm có ích.
3.3 Xem xét tương quan riêng
Vì vấn đề được đề cập đến dựa vào tương quan bậc không. Farrar và Glauber
đã đề nghị sử dụng hệ số tương quan riêng. Trong hồi quy của Y đối với các biến X 2 ,
2

2

2

2

X 3 ,X 4 . Nếu ta nhận thấy răng r 1, 234 cao trong khi đó r 12,34 ; r 13, 24 ; r 14, 23 tương đối thấp
thì điều đó có thể gợi ý rằng các biến X 2 , X 3 và X 4 có tương quan cao và ít nhất một
trong các biến này là thừa.
Dù tương quan riêng rất có ích nhưng nó cũng khơng đảm bảo rằng sẽ cung cấp
cho ta hướng dẫn chính xác trong việc phát hiện ra hiện tượng đa cộng tuyến.
3.4 Xét hồi quy phụ

Một cách có thể tin cậy được để đánh giá mức độ của đa cộng tuyến là hồi quy
phụ. Hồi quy phụ là hồi quy mỗi một biến giải thích X i theo các biến giải thích cịn
2

lại. R 2 được tính từ hồi quy này ta ký hiện R i
Mối liên hệ giữa F i và R i2 :

Ri2 /(k  2)
F=
(1  Ri2 ) /(n  k  1)

F i tuân theo phân phối F với k – 2 và n-k +1 bậc tự do. Trong đó n là , k là số
biến giải thích kể cả hệ số chặn trong mơ hình. R i2 là hệ số xác định trong hồi quy của
biến X i theo các biến X khác. Nếu F i tính được vượt điểm tới hạn F i (k-2,n-k+1) ở
mức ý nghĩa đã cho thì có nghĩa là X i có liên hệ tuyến tính với các biến X khác. Nếu
F i có ý nghĩa về mặt thống kê chúng ta vẫn phải quyến định liệu biến X i nào sẽ bị
Nhóm 6 Lớp 1225AMAT0411

7


Kinh Tế Lượng

Giảng viên: Vũ Trọng Nghĩa

loại khỏi mơ hình. Một trở ngại của kỹ thuật hồi quy phụ là gánh nặng tính tốn.
Nhưng ngày nay nhiều chương trình máy tính đã có thể đảm đương được cơng việc
tính tốn này.
3.5 Sử dụng nhân tử phóng đại phương sai VIF
Một thước đo khác của hiện tượng đa cộng tuyến là nhân tử phóng đại phương

sai gắn với biến X i , ký hiệu là VIF(X i ).
2

VIF(X i ) được thiết lập trên cơ sở của hệ số xác định R i trong hồi quy của biến
X i với các biến khác nhau như sau:
VIF(X i ) =

1
1  R i2

(3.1)

Nhìn vào cơng thức (3.1) có thể giải thích VIF(X i ) bằng tỷ số chung của
phương sai thực của β 1 trong hồi quy gốc của Y đối với các biến X và phương sai của
ước lượng β 1 trong hồi quy mà ở đó X i trực giao với các biến khác. Ta coi tình huống
lý tưởng là tình huống mà trong đó các biến độc lập khơng tương quan với nhau, và
VIF so sánh tình hng thực và tình huống lý tưởng. Sự so sánh này khơng có ích
nhiều và nó khơng cung cấp cho ta biết phải làm gì với tình huống đó. Nó chỉ cho
biết rằng các tình huống là khơng lý tưởng.
Đồ thị của mối liên hệ của R i2 và VIF là

Nhóm 6 Lớp 1225AMAT0411

8


Kinh Tế Lượng

Giảng viên: Vũ Trọng Nghĩa
2


Như hình vẽ chỉ ra khi R i tăng từ 0,9 đến 1 thì VIF tăng rất mạnh. Khi
2

R i =1 thì VIF là vơ hạn.
Có nhiều chương trình máy tính có thể cho biết VIF đối với các biến độc lập
trong hồi quy.
3.6 Độ đo Theil
Khía cạnh chủ yếu của VIF chỉ xem xét đến tương quan qua lại giữa các biến
giải thích. Một độ đo mà xem xét tương quan của biến giải thích với biến được giải
thích là độ đo Theil. Độ đo Theil được định nghĩa như sau:
k

m = R - ( R2 - Ri )
2

2

i 2

Trong đó R 2 là hệ số xác định bội trong hồi quy của Y đối với các biến X 2 , X 3
… X k trong mơ hình hồi quy:
Y = β 1 + β 2 X 2i + β 3 X 3i + ……. + β k X ki + U i
2

R  i là hệ số xác định bội trong mô hình hồi quy của biến Y đối với các biên X 2
, X 3 , … ,X i  1 , X i 1 , … ,X k
Đại lượng R 2 - R 2 i được gọi là “đóng góp tăng thêm vào” vào hệ số xác định
bội. Nếu X 2 , X 3 … X k không tương quan với nhau thì m = 0 vì những đóng góp
tăng thêm đó cộng lại bằng R 2 . Trong các trường hợp khác m có thể nhận giá trị âm

hoặc dương lớn.
Để thấy được độ đo này có ý nghĩa, chúng ta xét trường hợp mơ hình có 2 biến
giải thích X 2 và X 3 . Theo ký hiệu đã sử dụng ở chương trước ta có:
m = R 2 - ( R 2 - r 122 ) – (R 2 – r 132 )
2

2

Tỷ số t liên hệ với tương quan riêng r 12,3 , r 13, 2
Trong phần hồi quy bội ta đã biết:
2

R 2 = r 122 + (1- r 122 ) r 13, 2
2

R 2 = r 132 + (1- r 132 ) r 12,3
Thay 2 công thức này vào biểu thức xác định m ta được:
2

2

m = R 2 - [r 122 + (1- r 122 ) r 13, 2 - r 122 ] – [ r 132 + (1- r 132 ) r 12,3 - r 132 ]
2

2

= R 2 - [(1- r 122 ) r 13, 2 + (1- r 132 ) r 12,3 ]

Nhóm 6 Lớp 1225AMAT0411


(1.2)

9


Kinh Tế Lượng

Giảng viên: Vũ Trọng Nghĩa
2

Đặt 1- r 122 = w 2 ; 1- r 13 = w 3 và gọi là các trọng số. Công thức (1.2) được viết lại
dưới dạng:
2

2

m = R 2 - (w 2 r 13, 2 + w 3 r 12,3 )
Như vây độ đo Theil bằng hiệu giữa hệ số xác định bội và tổng có trọng số của
các hệ số tương quan riêng.
4. Biện pháp khắc phục đa cộng tuyến
4.1 Sử dụng thông tin tiên nghiệm
Một trong các cách tiếp cận để giải quyết vấn đề đa cộng tuyến là phải tận
dụng thông tin tiên nghiệm hoặc thông tin từ nguồn khác để ước lượng các hệ số
riêng.
Thí dụ : ta muốn ước lượng hàm sản xuất của 1 quá trình sản xuất nào đó có
dạng :
Qt =A Lαt Kβt eUt
(4.1)
Trong đó Qt là lượng sản phẩm được sản xuất thời kỳ t ; Lt lao động thời kỳ t ;
Kt vốn thời kỳ t ; Ut là nhiễu ;A , , β là các tham số mà chúng ta cần ước lượng .Lấy

ln cả 2 vế (4.1) ta được :
LnQt = LnA + lnLt + βKt Ut
Đặt
Ta được

LnQt = Q*t ; LnA = A* ; LnLt = L*t
Q*t = A* + L*t + βK*t + Ut (4.2)

Giả sử K và L có tương quan rất cao dĩ nhiên điều này sẽ dẫn đến phương sai
của các ước lượng của các hệ số co giãn của hàm sản xuất lớn .
Giả sử từ 1 nguồn thơng tin có lới theo quy mơ nào đó mà ta biết được rằng
ngành cơng nghiệp này thuộc ngành cso lợi tức theo quy mô không đổi nghĩa là
 + β =1 .Với thông tin này ,cách xử lý của chúng ta sẽ là thay β = 1 -  vào (4.2) và
thu được :
Q*t = A* + L*t + ( 1 -  )K*t + Ut

(4.3)

Từ đó ta được Q*t – K* = A* + (L*t – K*t ) + Ut
Đặt

Q*t – K*t = Y*t và L*t – K*t = Z*t ta được
Y*t = A* +  Z*t + Ut

Thông tin tiên nghiệm đã giúp chúng ta giảm số biến độc lập trong mơ hình xuống
cịn 1 biến Z*t
Sau khi thu được ước lượng ^của  thì tính được từ điều kiện β^= 1 – ^
Nhóm 6 Lớp 1225AMAT0411

10



Kinh Tế Lượng

Giảng viên: Vũ Trọng Nghĩa

4.2 Thu thập số liệu hoặc lấy thêm mẫu mới
Vì đa cộng tuyến là đặc trưng của mẫu nên có thể có mẫu khác liên quan đến
cùng các biến trong mẫu ban đầu mà đa cộng tuyến có thể khơng nghiêm trọng nữa.
Điều này có thể làm được khi chi phí cho việc lấy mẫu khác có thể chấp nhận được
trong thực tế .
Đơi khi chỉ cần thu thập them số liệu , tăng cỡ mẫu có thể làm giảm tính nghiêm
trọng của đa cộng tuyến .
4.3 Bỏ biến
Khi có hiện tượng đa cộng tuyến nghiêm trọng thì cách “ đơn giản nhất “là bỏ
biến cộng tuyến ra khỏi phương trình. Khi phải sử dụng biện pháp này thì cách thức
tiến hành như sau :
Giả sử trong mơ hình hồi quy của ta có Y là biến được giải thích cịn X 2 .X3 …
Xk là các biến giải thích . Chúng ta thấy rằng X 2 tương quan chặt chẽ với X3 .Khi đó
nhiều thơng tin về Y chứa ở X2 thì cũng chứa ở X3 .Vậy nếu ta bỏ 1 trong 2 biến X2
hoặc X3
Khỏi mơ hình hồi quy , ta sẽ giải quyết được vấn đề đa cộng tuyến nhưng sẽ mất đi 1
phần thông tin về Y .
Bằng phép so sánh R2 và R 2 trong các phép hồi quy khác nhau mà có và khơng
có 1 trong 2 biến chúng ta có thể quyết định nên bỏ biến nào trong biến X 2 và X3 khỏi
mơ hình .
Thí dụ R2 đối với hồi quy của Y đối với tất cả các biến X1, X2, X3 …Xk là 0.94;
R2 khi loại biến X2 là 0.87 và R2 khi loại biến X3 là 0.92 ;như vậy trong trường hợp
này ta loại X3.
Chúng ta lưu ý 1 hạn chế của biện pháp này là trong các mơ hình kinh tế có

những trường hợp địi hỏi nhất định phải có biến này hoặc biến khác ở trong mơ
hình .Trong trường hợp như vậy việc loại bỏ 1 biến phải được cân nhắc cẩn thận giữa
sai lệch khi bỏ 1 biến cộng tuyến với việc tăng phương sai của các ước lượng hệ số
khi biến đó ở trong mơ hình .
4.4 Sử dụng sai phân cấp một
Mặc dù biện pháp này có thể giảm tương quan qua lại giữa các biến nhưng
chúng cũng có thể được sử dụng như 1 giải pháp cho vấn đề đa cộng tuyến .
Thí dụ: Chúng ta có số liệu chuỗi thời gian biểu thị liên hệ giữa các biến Y và
các biến phụ thuộc X2 và X3 theo mơ hình sau :
Nhóm 6 Lớp 1225AMAT0411

11


Kinh Tế Lượng

Giảng viên: Vũ Trọng Nghĩa

Yt = β 1 + β 2 X 2t + β 3X 3t+ U t (4.4)
Trong đó t là thời gian . Phương trình trên đúng với t thì cũng đúng với t-1
nghĩa là :
Yt-1 = β 2 + β 2 X 2t-1 + β 3X 3t-1 + U t-1 (4.5)
Từ (4.4) và (4.5) ta được :
Yt – Yt-1 = β 2 (X 2t - X 2t-1 ) + β 3 (X 3t - X 3t-1) + U t - U t-1
(4.6)
Đặt yt = Yt – Yt-1
x2t = X 2t - X 2t-1
x3t = X 3t - X 3t-1
Vt = U t - U t-1
Ta được : yt = β 2 x2t + β 3 x3t + Vt

(4.7)
Mơ hình hồi quy dạng (4.7) thường làm giảm tính nghiêm trọng của đa cộng
tuyến vì dù X2 và X3 có thể tương quan cao nhưng khơng có lý do tiên nghiệm nào
chắc chắn rằng sai phân của chúng cũng tương quan cao.
Tuy nhiên biến đổi sai phân bậc nhất sinh ra 1 số bấn đề chẳng hạn như số
hạng sai số Vt trong (4.7) có thể khơng thỏa mãn giả thiết của mơ hình hồi quy tuyến
tính cổ điển là các nhiễu khơng tương quan .Vậy thì biện pháp sửa chữa này có thể lại
cịn tồi tệ hơn căn bệnh .
4.5 Giảm tương quan trong hồi quy đa chức
Nét khác nhau của hồi quy đa thức là các biến giải thích xuất hiện với lũy thừa
khác nhau trong mơ hình hồi quy .Trong thực hành để giảm tương quan trong hồi quy
đa thức người ta thường sử dụng dạng độ lệch .Nếu việc sử dụng dạng độ lệch mà vẫn
không giảm đa cộng tuyến thù người ta có thể phải xem xét đến kỹ thuật “ đa thức
trực giao “.
4.6 Một số biện pháp khác
Ngoài các biện pháp đã kể trên người ta còn sử dụng 1 số biện pháp khác nữa
để cứu chữa căn bệnh này như sau :
- hồi quy thành phần chính
- Sử dụng các ước lượng từ bên ngoài
Nhưng tất cả các biên pháp đã trình bày ở trên có thể làm giải pháp cho vấn đề
đa cộng tuyến như thế nào còn phụ thuộc vào bản chất của tập số liệu và tính nghiêm
trọng của vấn đề đa cộng tuyến.
B. BÀI TẬP THỰC HÀNH EVIEW

Nhóm 6 Lớp 1225AMAT0411

12


Kinh Tế Lượng


Giảng viên: Vũ Trọng Nghĩa

Bài toán: Cho bảng số liệu sau.
Trong đó:
Y: lượng thịt gà tiêu thụ bình quân đầu người (pound)
X: thu nhập khả dụng bình quân đầu người (USD)
Z: Giá bán lẻ của thịt gà (cent/pound)
T: Giá bán lẻ của thịt bò (cent/pound)
Yêu cầu: Hãy phát hiện hiện tượng đa cộng tuyến và tìm biện pháp khắc phục.
Cho α = 5%.

Bảng 1: Dữ liệu về tiêu dùng thịt gà ở Mỹ giai đọan 1960 đến 1989

YEAR
1960
1961
1962
1963
1964
1965
1966
1967
1968
1969
1970
1971
1972
1973
1974

1975
1976
1977
1978
1979
1980

Y
27.8
29.9
29.8
30.8
31.2
33.3
35.6
36.4
36.7
38.4
40.4
40.3
41.8
40.4
40.7
40.1
42.7
44.1
46.7
50.6
50.1


Nhóm 6 Lớp 1225AMAT0411

X
397.5
413.3
439.2
459.7
492.9
528.6
560.3
624.6
666.4
717.8
768.2
843.3
911.6
931.1
1021.5
1165.9
1349.6
1449.4
1575.5
1759.1
1994.2

Z
42.2
38.1
40.3
39.5

37.3
38.1
39.3
37.8
38.4
40.1
38.6
39.8
39.7
52.1
48.9
58.3
57.9
56.5
63.7
61.6
58.9

T
50.7
52
54
55.3
54.7
63.7
69.8
65.9
64.5
70
73.2

67.8
79.1
95.4
94.2
123.5
129.9
117.6
130.9
129.8
128
13


Kinh Tế Lượng
1981
1982
1983
1984
1985
1986
1987
1988
1989
1.

Giảng viên: Vũ Trọng Nghĩa
51.7
52.9
53.1
53.9

54.7
56.1
59.3
62.8
64.5

2258.1
2478.7
2564.3
2620.5
2735.5
2915.4
3185.6
3368.2
3512.9

66.4
70.4
72.7
73.1
74.6
76.4
79.3
83.6
85.9

141
168.2
158.1
175.6

189.4
182.3
196.6
210.6
238.6

Ước lượng mơ hình hồi qui trên eview
Theo đề bài ta có mơ hình hàm hồi quy 4 biến tổng thể PRF có dạng:

Hàm hồi quy mẫu SRF có dạng:

Tiến hành ước lượng hàm hồi quy mẫu trên eviews ta được bảng kết quả sau:

Nhóm 6 Lớp 1225AMAT0411

14


Kinh Tế Lượng

Giảng viên: Vũ Trọng Nghĩa

Từ bảng ước lượng ta thu được hàm hồi quy mẫu sau:
Y^i = 36.92003 + 0.009543 Xi -0.376759 Zi + 0.117773 Ti
Ý nghĩa của β^ 2 , β^ 3 và β^ 4 là:
- β^ 2 = 0.009543 khi giá bán lẻ của thịt gà và giá bán lẻ của thịt bị khơng thay
đổi thu nhập khả dụng bình quân đầu người tăng lên 1 USD thì lượng thịt gà tiêu thụ
bình quân đầu người trung bình tăng 0.009543 (pound).
- β^ 3 = -0.376759 khi thu nhập khả dụng bình quân đầu người và giá bán lẻ
thịt bị khơng thay đổi giá bán lẻ của thịt gà tăng lên 1 USD/ pound thì lượng thịt gà

tiêu thụ bình quân đầu người trung bình giảm 0.376759 (pound).
- β^ 4 = 0.117773 khi thu nhập khả dụng bình qn đầu người và giá bán lẻ thịt
gà khơng thay đổi giá bán lẻ của thịt bò tăng lên 1 USD/ pound thì lượng thịt gà tiêu
thụ bình quân đầu người trung bình tăng 0.117773 (pound).
2. Phát hiện hiện tượng đa cộng tuyến
Ta có mơ hình hồi quy mẫu là:
Nhóm 6 Lớp 1225AMAT0411

15


Kinh Tế Lượng

Giảng viên: Vũ Trọng Nghĩa

Y^i = 36.92003 + 0.009543 Xi -0.376759 Zi + 0.117773 Ti
t(n-k)α/2 = t26 0,025 = 2,056
2.1 Hệ số xác định bội R 2 cao nhưng tỉ số t thấp
Từ bảng kết quả eviews ta có:
- R2 = 0.953408 > 0.8 => Mơ hình phù hợp
- Thống kê t của hệ số ứng với biến X, Z, T là :
+ | ttn2 | = 4.354342 > 2,056
+ | ttn3 | = 2.582554 > 2,056
+ | ttn4 | = 2.267676 > 2,056
=> Do R2 = 0.953408 > 0.8 và | ttn | > 2,056 ta chỉ có thể nghi ngờ rằng có
hiện tượng đa cộng tuyến xảy ra trong mơ hình. Để chắc chắn ta có thể phát hiện
bằng các phương pháp tiếp theo.
2.2 Hệ số tương quan cặp giữa các biến giải thích cao
Sử dụng phần mềm eviews ta có bảng sau:


Từ bảng trên ta thấy hệ số tương quan cặp giữa các biến giải thích đều rất cao.
- Hệ số tương quan giữa biến X và Z là 0.975161 > 0.8
- Hệ số tương quan giữa biến X và T là 0.982907 > 0.8
- Hệ số tương quan giữa biến Z và T là 0.985141> 0.8
=> Như vậy ta càng có cơ sở kết luận có hiện tượng đa cộng tuyến trong mơ
hình trên.
Nhóm 6 Lớp 1225AMAT0411

16


Kinh Tế Lượng

Giảng viên: Vũ Trọng Nghĩa

2.3
Xét hồi quy phụ
2.3.1 Ta hồi quy biến X theo biến Z và T
Ta hồi quy biến X theo biến Z và T được kết quả như sau:

Nhóm 6 Lớp 1225AMAT0411

17


Kinh Tế Lượng

Giảng viên: Vũ Trọng Nghĩa

Ta có   0.05 ta đi kiểm định giả thiết


Nhận xét:
Ta thấy giá trị p-value của thống kê F là 0.000000 <  =0.05
=> bác bỏ giả thiết H 0 chấp nhận giả thiết H1
=>Với mức ý nghĩa 5% thì X có mối liên hệ tuyến tính với Z và T
Vậy càng có cơ sở khẳng định mơ hình trên có hiện tượng đa cộng tuyến

2.3.2 Ta hồi quy biến Z theo biến X và T
Ta hồi quy biến Z theo biến X và T được kết quả như sau:

Nhóm 6 Lớp 1225AMAT0411

18


Kinh Tế Lượng

Giảng viên: Vũ Trọng Nghĩa

Ta có   0.05 ta đi kiểm định giả thiết

Nhận xét:
Ta thấy giá trị p-value của thống kê F là 0.000000 <  =0.05
=> bác bỏ giả thiết H 0 chấp nhận giả thiết H1
=>Với mức ý nghĩa 5% thì Z có mối liên hệ tuyến tính với X và T
=> Vậy càng có cơ sở khẳng định mơ hình trên có hiện tượng đa cộng tuyến

2.3.3 Ta hồi quy biến T theo biến X và Z

Nhóm 6 Lớp 1225AMAT0411


19


Kinh Tế Lượng

Giảng viên: Vũ Trọng Nghĩa

Ta hồi quy biến T theo biến X và Z được kết quả như sau:

Ta có   0.05 ta đi kiểm định giả thiết

Nhận xét:
Ta thấy giá trị p-value của thống kê F là 0.000000 <  =0.05
=> bác bỏ giả thiết H 0 chấp nhận giả thiết H1
=>Với mức ý nghĩa 5% thì Z có mối liên hệ tuyến tính với X và T
=> Vậy càng có cơ sở khẳng định mơ hình trên có hiện tượng đa cộng tuyến

2.4 Độ đo Theil
Hồi quy biến Y đối với các biến X, Z, T :
Nhóm 6 Lớp 1225AMAT0411

20


Kinh Tế Lượng

Giảng viên: Vũ Trọng Nghĩa

 Hồi quy biến Y theo biến X ta được bảng kết quả eviews như sau :


 Hồi quy biến Y theo biến Z ta được bảng kết quả eviews như :

Nhóm 6 Lớp 1225AMAT0411

21


Kinh Tế Lượng

Giảng viên: Vũ Trọng Nghĩa

 Hồi quy biến Y theo biến T ta được bảng kết quả eviews như sau :

Nhóm 6 Lớp 1225AMAT0411

22


Kinh Tế Lượng

Giảng viên: Vũ Trọng Nghĩa

Từ 3 bảng hồi quy trên ta thu được kết quả:
- r122 = 0.950244
- r132 = 0.880096
- r142 = 0.928522
Độ đo Theil:

m = 0.9611012 – (0.9611012 - 0.9502442 ) – (0.9611012 - 0.8800962 ) (0.9611012 - 0.9285222 ) = 0.692255

=> Vậy độ đo của Theil về mức độ đa cộng tuyến là 0.692255
2.5. Nhân tử phóng đại phương sai.
 Nhân tử phóng đại phương sai gắn với biến X là:
VIF(X) =

1
1  R i2

= 1/ (1- R22) = 1 / ( 1- 0.967701) = 30.96

VIF = 30.96 >= 10
 Nhân tử phóng đại phương sai gắn với biến Z là:
VIF(Z) =

1
1  R i2

= 1/ ( 1- R32) = 1/ ( 1- 0.971891) = 35.5758

VIF = 35.5758 >= 10
 Nhân tử phóng đại phương sai gắn với biến T là:
VIF(T) =

1
1  R i2

= 1/ ( 1- R42) = 1/ ( 1- 0.980581) = 51.4959

VIF = 51.4959 >= 10
=> Vậy mơ hình có xảy ra hiện tượng đa cộng tuyến

3. Khắc phục hiện tượng đa cộng tuyến
3.1 Bỏ biến
Bước 1: Hồi quy Y theo Z, T
Bước 2: Hồi quy Y theo X, T
Bước 3: Hồi quy Y theo Z, Z
Bước 4: So sánh R 2 và R 2 trong các hồi quy trên
Bước 5: Kết luận.

Nhóm 6 Lớp 1225AMAT0411

23


Kinh Tế Lượng

Giảng viên: Vũ Trọng Nghĩa

* Bước 1: Hồi quy Y theo Z, T

* Bước 2: Hồi quy Y theo X, T

Nhóm 6 Lớp 1225AMAT0411

24


Kinh Tế Lượng

Giảng viên: Vũ Trọng Nghĩa


* Bước 3: hồi quy Y theo X, Z

* Bước 4: Bằng phép so sánh R2 trong các phép hồi quy trên có một trong ba
biến X, Z, T mà chúng ta quyết định nên bỏ biến nào ra khỏi mơ hình hồi quy để khắc
phục hiện tượng đa cộng tuyến:
-

khi hồi quy Y theo cả X, Z, T là : 0.961101
R2 khi hồi quy Y theo Z, T là : 0.932735
R2 khi hồi quy Y theo X, T là : 0.951123
R2 khi quy Y theo X, Z là : 0. 953408

Từ kết quả ở trên biến chúng ta cần bỏ là biến T
* Bước 5 : Kết luận
Từ kết quả ở trên chúng ta biết được biến cần bỏ là biến T
 Xét mơ hình khi bỏ biến T kiểm tra lại xem mơ hình hồi quy này sau khi bỏ

biến cịn hiện tượng đa cộng tuyến nữa hay không ?
- Phát hiện hiện tượng đa cộng tuyến bằng tương quan cặp giữa 2 biến giải thích X và
Z là :

Nhóm 6 Lớp 1225AMAT0411

25


×