Tải bản đầy đủ (.pptx) (32 trang)

Slide Hiện tượng Đa Cộng Tuyến

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.6 MB, 32 trang )

Chào mừng thầy và các bạn đến
với bài thuyết trình nhóm 11


Đề tài : Tìm hiểu về hiện tượng đa cộng tuyến

Bài thảo luận của nhóm 11 bao gồm 2 phần chính:

 Phần I: Cơ sở lý thuyết
 Phần II: Bài tập minh họa


CƠ SỞ LÝ THUYẾT
Bản chất của hiện tượng đa cộng tuyến

  Đa cộng tuyến xảy ra khi 2 hay nhiều hơn 2 biến giải thích có liên quan với nhau.



Xét hàm hồi quy đa bội :



Trong trường hợp lý tưởng là các biến trong môi trường hồi quy bội không có tương quan với nhau, mỗi biến
chứa một thông tin riêng về , thông tin không chứa trong bất kỳ các biến nào khác. Trong thực hành nếu
trường hợp này xảy ra thì không có hiện tượng đa cộng tuyến.


Bản chất của hiện tượng đa cộng tuyến



  loại hiện tượng đa cộng tuyến: Đa cộng tuyến toàn phần và đa cộng tuyến không toàn phần.
Có hai





Đa cộng tuyến toàn phần xảy ra giữa các biến giải thích nếu tồn tại

không đồng thời bằng 0 sao cho:

λ2 , λ3 ,..., λk

λ2 X 2 i + λ3 X 3i + ... + λk X ki = 0không đồng
∀ithời bằng 0 sao cho:

Hiện tượng đa cộng tuyến không toàn phần xảy ra giữa các biến giải thích nếu tồn tại

λ2 , λ3 ,..., λk

λ2 X 2i + λ3 X 3i + ... + λk X ki + vi = 0

Trong đó là sai số ngẫu nhiên

∀i


Nguyên nhân gây ra hiện tượng đa cộng tuyến

  Chọn các biến độc lập có mối quan hệ nhân quả hay có tương quan cao.

 Số quan sát nhỏ hơn số biến độc lập.
 Cách thu thập mẫu: mẫu không có đặc trưng cho tổng thể.
 Chọn biến có độ biến thiên nhỏ.



Ước lượng khi có đa cộng tuyến hoàn hảo.

 Khi có đa cộng tuyến hoàn hảo thì các hệ số hồi quy là không xác định còn
các sai số tiêu chuẩn là vô hạn.
Ước lượng khi có đa cộng tuyến không hoàn hảo

 Đa cộng tuyến hoàn hảo là trường hợp đặc biệt hiếm xảy ra. Trong thực tế
thường xảy ra đa cộng tuyến không hoàn hảo.


Hậu quả của hiện tượng đa cộng tuyến




Trong trường hợp đa cộng tuyến toàn phần: các hệ số hồi quy mẫu là không xác định và các độ lệch tiêu chuẩn là vô hạn.



Trong trường hợp đa cộng tuyến không toàn phần: có thể xác định được các hệ số hồi quy mẫu nhưng dẫn đến những hậu quả sau:

 




Phương sai và độ lệch tiêu chuẩn của các hệ số hồi quy mẫu sẽ rất lớn.



Khoảng tin cậy của các hệ số hồi quy mẫu sẽ rất lớn



Tỷ số T mất ý nghĩa



Hệ số xác định bội cao nhưng t nhỏ



Dấu các ước lượng của các hệ số hồi quy sao do đó các ước lượng bình phương nhỏ nhất trở nên nhạy cảm với những thay
đổi nhỏ trong số liệu.



Dấu của các ước lượng của hệ số hồi quy có thể sai



Thêm vào hay bớt đi các biến cộng tuyến với các biến khác, mô hình sẽ thay đổi về độ lớn của các ước lượng hoặc dấu
của chúng.



Phát hiện hiện tượng đa cộng tuyến


 

 Hệ số xác định bội

cao nhưng tỷ số t thấp

Trong trường hợp cao (thường ) và tỷ lệ t thấp, chính là dấu hiệu của đa cộng tuyến.

 Hệ số tương quan giữa các biến giải thích cao
Nếu hệ số tương quan giữa cặp giữa các biến giải thích cao (vượt 0,8) thì có khả năng tồn tại đa cộng tuyến.




 

 Xét hồi quy phụ

Hồi quy một biến giải thích theo các biến giải thích còn lại. tính theo hồi quy này kí hiệu là .
Mối liên hệ giữa và là:

Kiểm định: hay : không có đa cộng tuyến.
Nếu : bác bỏ hay có đa cộng tuyến
Nếu : chấp nhận hay không có đa cộng tuyến





 

 Sử dụng nhân tử phóng đại phương sai VIF

Đối với hàm hồi quy hai biến giải thích

Đối với trường hợp tổng quát, có (k-1) biến giải thích

Khi thì có đa cộng tuyến xảy ra.


 

Độ đo Theil
Độ đo Theil được định nghĩa:

Trong đó: + là hệ số xác định bội trong mô hình hồi quy của biến Y với các biến
+ là hệ số xác định bội trong mô hình hồi quy của biến Y với các biến
Đại lượng được gọi là “đóng góp tăng thêm vào” của hệ số xác định bội.
+ Nếu không tương quan thì
+ Trong các trường hợp khác m có thể nhận giá trị âm hoặc dương lớn.


 

Xét mô hình có hai biến giải thích , ta có:

Tỷ số t liên hệ với tương quan riêng và
Trong mô hình hồi quy bội ta biết:


Trong đó: hệ số tương quan riêng giữa biếnY và trong khi không đổi
Thay 2 công thức trên vào biểu thức xác định m ta được:

Ta đặt: và được gọi là trọng số. Thay vào ta được:

Như vậy, độ đo Theil bằng hiệu số xác định bội và tổng có trọng số của các hệ số tương quan riêng.


Ví dụ: Hệ số tương quan giữa các biến Y và X, Z

Y
X
Z

Y
1.000000
0.943669
0.944003

X
0.943669
1.000000
0.999516

 

Ta tính được:

Do đó độ đo Theil về mức độ đa cộng tuyến là 0,889869


Z
0.944003
0.999516
1.000000


Biện pháp khắc phục hiện tượng đa cộng tuyến

biến

Bỏ
 
Khi có hiện tượng đa cộng tuyến nghiêm trọng thì cách đơn giản nhất là biến cộng tuyến ra
khỏi phương trình.
Giả sử trong mô hình hồi quy:

Ta thấy rằng tương quan chặt chẽ với , khi đó, nếu ta loại bỏ một trong hai biến hoặc khỏi
mô hình hồi quy thì ta sẽ giải quyết được vấn đề đa cộng tuyến nhưng sẽ mất đi một số thông
tin của Y.
Bằng phép so sánh và trong các phép hồi quy khác nhau mà có hoặc không có một trong hai
biến chúng ta có thể quyết định nên bỏ biến nào trong hai biến và khỏi mô hình.


Thu thập dữ liệu và lấy mẫu mới
Vì đa cộng tuyến là đặc trưng của mẫu nên có thể có mẫu khác nhau liên quan đến
cùng các biến trong mẫu ban đầu mà cộng tuyến có thể không nghiêm trọng nữa.
Điều này chỉ có thể làm được khi chi phí cho việc lấy mẫu khác có thể chấp nhận
được trong thực tế.


Việc thu thập thêm số liệu, tăng cỡ mẫu có thể làm giảm tình nghiêm trọng của đa
cộng tuyến.




 

Sử dụng sai phân cấp một

 Xét mô hình hồi quy:
(1.11)
Trong đó t là thời gian. Phương trình trên đúng với t thì cũng đúng với t-1 nghĩa là:
(1.12)

Lấy (1.11) trừ (1.12) ta được:
 Đặt: , ,
Ta được:

(1.13)




  NHẬN XÉT
 Mô hình (1.13) thường làm giảm tính nghiêm trọng của đa cộng tuyến vì dù

và có thể tương

quan cao nhưng không có nghĩa sai phân của chúng cũng tương quan cao.


 Tuy nhiên, biện pháp này phát sinh một số vấn đề như số hạng

trong (1.13) có thể không

thoả mãn giả thiết của mô hình hồi quy tuyến tính cổ điển là các nhiễu không tương quan. Vì
vậy biện pháp sửa chữa này có thể lại làm tồi tệ hơn.


Sử dụng thông tin tiên nghiệm

Xét hàm hồi quy sau:


 

(1.14)
Trong đó: Y: biến phụ thuộc
X, Z là các biến giải thích
: là nhiễu
: là các tham số cần ước lượng




  Lấy ln 2 vế (1.14), được:

 Đặt: ; ; ;
Ta được:


(1.15)

 Giả sử từ một nguồn thông tin nào đó mà ta biết được mối quan hệ giữa 2 biến phụ thuộc

thay vào (1.15)

ta được:

 Đặt , ta được:
Kết luận: Nhờ có thông tin tiên nghiệm đã giúp chúng ta làm giảm số biến độc lập từ 2 biến , xuống còn 1
biến => giảm khả năng có hiện tượng đa cộng tuyến => khắc phục được hiện tượng đa cộng tuyến.


 Các biện pháp khắc phục khác
Ngoài ra, để khắc phục hiện tượng đa cộng tuyến, ta có thể sử dụng một trong
những biện pháp sau:
+ Giảm tương quan trong hồi quy đa thức
+ Hồi quy thành phần chính
+ Sử dụng các ước lượng từ bên ngoài
=>Tóm lại, các biện pháp nêu trên có thể giải quyết vấn đề đa cộng tuyến như thế
nào còn phụ thuộc vào bản chất của của tập số liệu và tính nghiêm trọng của vấn
đề đa cộng tuyến.


BÀI TẬP MINH HỌA
Khảo sát chi phí tiêu dùng Y (triệu đồng/ năm), thu nhập X (triệu đồng/ năm) và tiền tích lũy
Z (triệu đồng) ,ta có số liệu sau :

Y


70

65

90

95

110

115

120

140

155

150

X

80

100

120

140


160

180

200

220

240

260

Z

81

100,9

127,3

142,5

163,3

187,6

205,2

220,1


243,5

268,6

Y

165

180

175

165

195

190

200

185

170

205

X

280


300

320

340

360

380

400

420

440

460

Z

279,8

300,2

322,6

344,2

366,1


380,9

410,6

429,8

437,7

469,2

 

Hãy phát hiện hiện tượng đa cộng tuyến và tìm biện pháp khắc phục hiện tượng đa cộng tuyến,
với ?


Ước lượng mô hình hồi quy mẫu
Dependent Variable: Y

 

 

Method: Least Squares

 

 

Date: 04/16/17 Time: 11:33


 

 

 

 

 

 

Sample: 1 20

 

Included observations: 20
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C


51.76164

8.949858

5.783516

0.0000

X

0.047137

0.954802

0.049368

0.9612

Z

0.301076

0.947533

0.317748

0.7545

R-squared


0.891157

Mean dependent var

147.0000

Adjusted R-squared

0.878352

S.D. dependent var

43.93177

S.E. of regression

15.32253

Akaike info criterion

8.434007

Sum squared resid

3991.258

Schwarz criterion

8.583366


Log likelihood

-81.34007

Hannan-Quinn criter.

8.463163

F-statistic

69.59442

Durbin-Watson stat

0.898257

Prob(F-statistic)

0.000000

 

 

 


 

Từ bảng eviews trên ta suy ra mô hình hồi quy mẫu:


Ý nghĩa của hệ số hồi quy:
= 0,047137: Khi tiền tích lũy không thay đổi, nếu thu nhập trong 1 năm tăng lên 1
triệu đồng thì chi phí tiêu dùng trung bình trong 1 năm tăng 47137 nghìn đồng.
=0,301076: Khi thu nhập trong 1 năm không thay đổi, nếu tiền tích lũy tăng lên 1
triệu đồng thì chi phí tiêu dùng trung bình trong 1 năm tăng 301076 nghìn đồng.


Phát hiện hiện tượng đa cộng tuyến


 



cao nhưng tỷ số t thấp

Với ta có:
Từ bảng eviews suy ra:
(1)
Thống kê t của hệ số ứng với X:
(2)
Thống kê t của hệ số ứng với Y:
(3)
Từ (1)(2)(3), suy ra mô hình hồi quy có hiện tượng đa cộng tuyến.




 


Hệ số tương quan giữa các biến giải thích cao.

 

X

Z

X

 1.000000

 0.999516

Z
 1.000000
Từ bảng eviews trên
ta thấy:  0.999516
suy ra mô hình có
hiện tượng đa cộng tuyến.


×