Chào mừng thầy và các bạn đến
với bài thuyết trình nhóm 11
Đề tài : Tìm hiểu về hiện tượng đa cộng tuyến
Bài thảo luận của nhóm 11 bao gồm 2 phần chính:
Phần I: Cơ sở lý thuyết
Phần II: Bài tập minh họa
CƠ SỞ LÝ THUYẾT
Bản chất của hiện tượng đa cộng tuyến
Đa cộng tuyến xảy ra khi 2 hay nhiều hơn 2 biến giải thích có liên quan với nhau.
Xét hàm hồi quy đa bội :
Trong trường hợp lý tưởng là các biến trong môi trường hồi quy bội không có tương quan với nhau, mỗi biến
chứa một thông tin riêng về , thông tin không chứa trong bất kỳ các biến nào khác. Trong thực hành nếu
trường hợp này xảy ra thì không có hiện tượng đa cộng tuyến.
Bản chất của hiện tượng đa cộng tuyến
loại hiện tượng đa cộng tuyến: Đa cộng tuyến toàn phần và đa cộng tuyến không toàn phần.
Có hai
Đa cộng tuyến toàn phần xảy ra giữa các biến giải thích nếu tồn tại
không đồng thời bằng 0 sao cho:
λ2 , λ3 ,..., λk
λ2 X 2 i + λ3 X 3i + ... + λk X ki = 0không đồng
∀ithời bằng 0 sao cho:
Hiện tượng đa cộng tuyến không toàn phần xảy ra giữa các biến giải thích nếu tồn tại
λ2 , λ3 ,..., λk
λ2 X 2i + λ3 X 3i + ... + λk X ki + vi = 0
Trong đó là sai số ngẫu nhiên
∀i
Nguyên nhân gây ra hiện tượng đa cộng tuyến
Chọn các biến độc lập có mối quan hệ nhân quả hay có tương quan cao.
Số quan sát nhỏ hơn số biến độc lập.
Cách thu thập mẫu: mẫu không có đặc trưng cho tổng thể.
Chọn biến có độ biến thiên nhỏ.
Ước lượng khi có đa cộng tuyến hoàn hảo.
Khi có đa cộng tuyến hoàn hảo thì các hệ số hồi quy là không xác định còn
các sai số tiêu chuẩn là vô hạn.
Ước lượng khi có đa cộng tuyến không hoàn hảo
Đa cộng tuyến hoàn hảo là trường hợp đặc biệt hiếm xảy ra. Trong thực tế
thường xảy ra đa cộng tuyến không hoàn hảo.
Hậu quả của hiện tượng đa cộng tuyến
Trong trường hợp đa cộng tuyến toàn phần: các hệ số hồi quy mẫu là không xác định và các độ lệch tiêu chuẩn là vô hạn.
Trong trường hợp đa cộng tuyến không toàn phần: có thể xác định được các hệ số hồi quy mẫu nhưng dẫn đến những hậu quả sau:
Phương sai và độ lệch tiêu chuẩn của các hệ số hồi quy mẫu sẽ rất lớn.
Khoảng tin cậy của các hệ số hồi quy mẫu sẽ rất lớn
Tỷ số T mất ý nghĩa
Hệ số xác định bội cao nhưng t nhỏ
Dấu các ước lượng của các hệ số hồi quy sao do đó các ước lượng bình phương nhỏ nhất trở nên nhạy cảm với những thay
đổi nhỏ trong số liệu.
Dấu của các ước lượng của hệ số hồi quy có thể sai
Thêm vào hay bớt đi các biến cộng tuyến với các biến khác, mô hình sẽ thay đổi về độ lớn của các ước lượng hoặc dấu
của chúng.
Phát hiện hiện tượng đa cộng tuyến
Hệ số xác định bội
cao nhưng tỷ số t thấp
Trong trường hợp cao (thường ) và tỷ lệ t thấp, chính là dấu hiệu của đa cộng tuyến.
Hệ số tương quan giữa các biến giải thích cao
Nếu hệ số tương quan giữa cặp giữa các biến giải thích cao (vượt 0,8) thì có khả năng tồn tại đa cộng tuyến.
Xét hồi quy phụ
Hồi quy một biến giải thích theo các biến giải thích còn lại. tính theo hồi quy này kí hiệu là .
Mối liên hệ giữa và là:
Kiểm định: hay : không có đa cộng tuyến.
Nếu : bác bỏ hay có đa cộng tuyến
Nếu : chấp nhận hay không có đa cộng tuyến
Sử dụng nhân tử phóng đại phương sai VIF
Đối với hàm hồi quy hai biến giải thích
Đối với trường hợp tổng quát, có (k-1) biến giải thích
Khi thì có đa cộng tuyến xảy ra.
Độ đo Theil
Độ đo Theil được định nghĩa:
Trong đó: + là hệ số xác định bội trong mô hình hồi quy của biến Y với các biến
+ là hệ số xác định bội trong mô hình hồi quy của biến Y với các biến
Đại lượng được gọi là “đóng góp tăng thêm vào” của hệ số xác định bội.
+ Nếu không tương quan thì
+ Trong các trường hợp khác m có thể nhận giá trị âm hoặc dương lớn.
Xét mô hình có hai biến giải thích , ta có:
Tỷ số t liên hệ với tương quan riêng và
Trong mô hình hồi quy bội ta biết:
Trong đó: hệ số tương quan riêng giữa biếnY và trong khi không đổi
Thay 2 công thức trên vào biểu thức xác định m ta được:
Ta đặt: và được gọi là trọng số. Thay vào ta được:
Như vậy, độ đo Theil bằng hiệu số xác định bội và tổng có trọng số của các hệ số tương quan riêng.
Ví dụ: Hệ số tương quan giữa các biến Y và X, Z
Y
X
Z
Y
1.000000
0.943669
0.944003
X
0.943669
1.000000
0.999516
Ta tính được:
Do đó độ đo Theil về mức độ đa cộng tuyến là 0,889869
Z
0.944003
0.999516
1.000000
Biện pháp khắc phục hiện tượng đa cộng tuyến
biến
Bỏ
Khi có hiện tượng đa cộng tuyến nghiêm trọng thì cách đơn giản nhất là biến cộng tuyến ra
khỏi phương trình.
Giả sử trong mô hình hồi quy:
Ta thấy rằng tương quan chặt chẽ với , khi đó, nếu ta loại bỏ một trong hai biến hoặc khỏi
mô hình hồi quy thì ta sẽ giải quyết được vấn đề đa cộng tuyến nhưng sẽ mất đi một số thông
tin của Y.
Bằng phép so sánh và trong các phép hồi quy khác nhau mà có hoặc không có một trong hai
biến chúng ta có thể quyết định nên bỏ biến nào trong hai biến và khỏi mô hình.
Thu thập dữ liệu và lấy mẫu mới
Vì đa cộng tuyến là đặc trưng của mẫu nên có thể có mẫu khác nhau liên quan đến
cùng các biến trong mẫu ban đầu mà cộng tuyến có thể không nghiêm trọng nữa.
Điều này chỉ có thể làm được khi chi phí cho việc lấy mẫu khác có thể chấp nhận
được trong thực tế.
Việc thu thập thêm số liệu, tăng cỡ mẫu có thể làm giảm tình nghiêm trọng của đa
cộng tuyến.
Sử dụng sai phân cấp một
Xét mô hình hồi quy:
(1.11)
Trong đó t là thời gian. Phương trình trên đúng với t thì cũng đúng với t-1 nghĩa là:
(1.12)
Lấy (1.11) trừ (1.12) ta được:
Đặt: , ,
Ta được:
(1.13)
NHẬN XÉT
Mô hình (1.13) thường làm giảm tính nghiêm trọng của đa cộng tuyến vì dù
và có thể tương
quan cao nhưng không có nghĩa sai phân của chúng cũng tương quan cao.
Tuy nhiên, biện pháp này phát sinh một số vấn đề như số hạng
trong (1.13) có thể không
thoả mãn giả thiết của mô hình hồi quy tuyến tính cổ điển là các nhiễu không tương quan. Vì
vậy biện pháp sửa chữa này có thể lại làm tồi tệ hơn.
Sử dụng thông tin tiên nghiệm
Xét hàm hồi quy sau:
(1.14)
Trong đó: Y: biến phụ thuộc
X, Z là các biến giải thích
: là nhiễu
: là các tham số cần ước lượng
Lấy ln 2 vế (1.14), được:
Đặt: ; ; ;
Ta được:
(1.15)
Giả sử từ một nguồn thông tin nào đó mà ta biết được mối quan hệ giữa 2 biến phụ thuộc
thay vào (1.15)
ta được:
Đặt , ta được:
Kết luận: Nhờ có thông tin tiên nghiệm đã giúp chúng ta làm giảm số biến độc lập từ 2 biến , xuống còn 1
biến => giảm khả năng có hiện tượng đa cộng tuyến => khắc phục được hiện tượng đa cộng tuyến.
Các biện pháp khắc phục khác
Ngoài ra, để khắc phục hiện tượng đa cộng tuyến, ta có thể sử dụng một trong
những biện pháp sau:
+ Giảm tương quan trong hồi quy đa thức
+ Hồi quy thành phần chính
+ Sử dụng các ước lượng từ bên ngoài
=>Tóm lại, các biện pháp nêu trên có thể giải quyết vấn đề đa cộng tuyến như thế
nào còn phụ thuộc vào bản chất của của tập số liệu và tính nghiêm trọng của vấn
đề đa cộng tuyến.
BÀI TẬP MINH HỌA
Khảo sát chi phí tiêu dùng Y (triệu đồng/ năm), thu nhập X (triệu đồng/ năm) và tiền tích lũy
Z (triệu đồng) ,ta có số liệu sau :
Y
70
65
90
95
110
115
120
140
155
150
X
80
100
120
140
160
180
200
220
240
260
Z
81
100,9
127,3
142,5
163,3
187,6
205,2
220,1
243,5
268,6
Y
165
180
175
165
195
190
200
185
170
205
X
280
300
320
340
360
380
400
420
440
460
Z
279,8
300,2
322,6
344,2
366,1
380,9
410,6
429,8
437,7
469,2
Hãy phát hiện hiện tượng đa cộng tuyến và tìm biện pháp khắc phục hiện tượng đa cộng tuyến,
với ?
Ước lượng mô hình hồi quy mẫu
Dependent Variable: Y
Method: Least Squares
Date: 04/16/17 Time: 11:33
Sample: 1 20
Included observations: 20
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
51.76164
8.949858
5.783516
0.0000
X
0.047137
0.954802
0.049368
0.9612
Z
0.301076
0.947533
0.317748
0.7545
R-squared
0.891157
Mean dependent var
147.0000
Adjusted R-squared
0.878352
S.D. dependent var
43.93177
S.E. of regression
15.32253
Akaike info criterion
8.434007
Sum squared resid
3991.258
Schwarz criterion
8.583366
Log likelihood
-81.34007
Hannan-Quinn criter.
8.463163
F-statistic
69.59442
Durbin-Watson stat
0.898257
Prob(F-statistic)
0.000000
Từ bảng eviews trên ta suy ra mô hình hồi quy mẫu:
Ý nghĩa của hệ số hồi quy:
= 0,047137: Khi tiền tích lũy không thay đổi, nếu thu nhập trong 1 năm tăng lên 1
triệu đồng thì chi phí tiêu dùng trung bình trong 1 năm tăng 47137 nghìn đồng.
=0,301076: Khi thu nhập trong 1 năm không thay đổi, nếu tiền tích lũy tăng lên 1
triệu đồng thì chi phí tiêu dùng trung bình trong 1 năm tăng 301076 nghìn đồng.
Phát hiện hiện tượng đa cộng tuyến
cao nhưng tỷ số t thấp
Với ta có:
Từ bảng eviews suy ra:
(1)
Thống kê t của hệ số ứng với X:
(2)
Thống kê t của hệ số ứng với Y:
(3)
Từ (1)(2)(3), suy ra mô hình hồi quy có hiện tượng đa cộng tuyến.
Hệ số tương quan giữa các biến giải thích cao.
X
Z
X
1.000000
0.999516
Z
1.000000
Từ bảng eviews trên
ta thấy: 0.999516
suy ra mô hình có
hiện tượng đa cộng tuyến.