Tải bản đầy đủ (.pptx) (29 trang)

PHÁT HIỆN HIỆN TƯỢNG ĐA CỘNG TUYẾN

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.62 MB, 29 trang )

CHÀO MỪNG THẦY CÔ VÀ CÁC
BẠN

Giáo viên : Nguyễn Văn Minh


ĐỀ TÀI
PHÁT HIỆN HIỆN TƯỢNG
ĐA CỘNG TUYẾN


Chương 1. Lý luận cơ bản về hiện tượng đa cộng tuyến
1.1
• Khái niệm đa cộng tuyến và nguyên nhân
1.1.1Khái niệm

- Khi xây dựng mô hình hồi quy bội, trường hợp lý tưởng là các biến trong mô
hình không có tương quan với nhau; mỗi biến chứa một thông tin riêng về Y, thông
tin không chứa trong bất kì biến Xi khác. Trong thực hành, khi điều này xảy ra ta
không gặp hiện tượng đa cộng tuyến.
- Trong những trường hợp còn lại, ta gặp hiện tượng đa cộng tuyến.Giả sử ta phải
ước lượng hàm hồi quy Y gồm k biến giải thích , ,.....,
=++)
- Các biến , ,....., gọi là các đa cộng tuyến hoàn hảo hay còn gọi là đa cộng tuyến
chính xác nếu tồn tại ,......, không đồng thời bằng không sao cho:









- Các biến , ,....., gọi là các đa cộng tuyến không hoàn hảo nếu tồn tại ,......,
không đồng thời bằng không sao cho:
0 (1.1)
trong đó là sai số ngẫu nhiên.
Trong (1.1) giả sử λi ≠ 0 khi đó ta biểu diễn:
- Từ (1.2) ta thấy hiện tượng đa cộng tuyến xảy ra khi một biến là tổ hợp
tuyến tính của các biến còn lại và một sai số ngẫu nhiên, hay nói cách khác là có
một biến biểu diễn xấp xỉ tuyến tính qua các biến còn lại.


1.1.2. Nguyên nhân
- Do phương pháp thu thập dữ liệu: Các giá trị của các biến độc lập phụ thuộc lẫn nhau trong mẫu nhưng
không phụ thuộc lẫn nhau trong tổng thể.


1.3 Hậu quả của hiện tượng đa cộng tuyến

•1.
2.
3.
4.

Phương sai và hiệp phương sai của các ước lượng bình quân bé nhất lớn
Khoảng tin cậy rộng hơn
Tỷ số t mất ý nghĩa
cao nhưng tỉ số ít ý nghĩa

Các ước lượng bình phương bé nhất và các sai số tiêu chuẩn của chúng trở lên rất nhạy đối với những thay đổi

nhỏ trong số liệu

5.
6.

Dấu của các ước lượng của các hệ số hồi quy có thể sai
Thêm vào hay bớt đi các biến cộng tuyến với các biến khác, mô hình sẽ thay đổi về độ lớn trong các ước
lượng hoặc dấu của chúng




1.4 Phát hiện sự tồn tại của đa cộng tuyến
1.4.1 cao nhưng tỉ số t thấp
Trong trường hợpcao (thường > 0,8) mà tỉ số t thấp thì đó chính là dấu hiệu của hiện tượng đa cộng tuyến .
1.4.2. Tương quan cặp giữa các biến giải thích cao
Nếu hệ số tương quan cặp giữa các biến giải thích cao (vượt 0,8) thì có khả năng có tồn tại đa cộng tuyến. Tuy
nhiên tiêu chuẩn này thường không chính xác.
Có những trường hợp tương quan cặp không cao nhưng vẫn có đa cộng tuyến.
Như vậy đa cộng tuyến xảy ra mà không có sự bảo trước cuả tương quan cặp những dẫu sao nó cũng cung cấp
cho ta những kiểm tra tiên nghiệm có ích.


1.4.3 Xem xét tương quan riêng

• Vì vấn đề được đề cập đến dựa vào tương quan bậc không. Farrar và Glauber đã đề nghị sử dụng hệ số

tương quan riêng. Trong hồi quy của Y đối với các biến . Nếu ta nhận thấy răng cao trong khi đó tương đối
thấp thì điều đó có thể gợi ý rằng các biến có tương quan cao và ít nhất một trong các biến này là thừa.
Dù tương quan riêng rất có ích nhưng nó cũng không đảm bảo rằng sẽ cung cấp cho ta hướng dẫn chính xác

trong việc phát hiện ra hiện tượng đa cộng tuyến.


1.4.4 Hồi quy phụ

•Một cách có thể tin cậy được để đánh giá mức độ của đa cộng tuyến là hồi quy phụ. Hồi quy phụ là hồi quy
mỗi một biến giải thích theo các biến giải thích còn lại. được tính từ hồi quy này ta ký hiện
Mối liên hệ giữa và :
F=


1.4.5 Nhân tử phóng đại phương sai

• Một thước đo khác của hiện tượng đa cộng tuyến là nhân tử phóng đại phương sai gắn với biến , ký hiệu là
VIF().

VIF() được thiết lập trên cơ sở của hệ số xác định R trong hồi quy của biến với các biến khác nhau như sau:
VIF()= (1.15)


1.4.6 Độ đo Theil

•Độ đo Theil được định nghĩa như sau:
m=
Trong đó là hệ số xác định bội trong hồi quy của Y đối với các biến trong mô hình hồi quy:
Y=
là hệ số xác định bội trong mô hình hồi quy của biến Y đối với các biên


1.5 Biện pháp khắc phục

1.5.1. Sử dụng thông tin tiên nghiệm
Một trong các cách tiếp cận để giải quyết vấn đề đa cộng tuyến là phải tận dụng thông tin tiên nghiệm hoặc
thông tin từ nguồn khác để ước lượng các hệ số riêng.


1.5.2. Thu thập số liệu hoặc lấy thêm mẫu mới
Vì đa cộng tuyến là đặc trưng của mẫu nên có thể có mẫu khác liên quan đến cùng các biến trong mẫu ban
đầu mà đa cộng tuyến có thể không nghiêm trọng nữa. Điều này có thể làm được khi chi phí cho việc lấy mẫu
khác có thể chấp nhận được trong thực tế.
Đôi khi chỉ cần thu thập thêm số liệu, tăng cỡ mẫu có thể làm giảm tính nghiêm trọng của đa cộng tuyến.




1.5.3. Bỏ biến
Cách thức tiến hành như sau:
Giả sử trong mô hình hồi quy của ta có Y là biến được giải thích còn là các biến giải thích. Chúng ta thấy rằng
tương quan chặt chẽ với . Khi đó nhiều thông tin về Y chứa ở thì cũng chứa ở . Vậy nếu ta bỏ 1 trong 2 biến
hoặc khỏi mô hình hồi quy, ta sẽ giải quyết được vấn đề đa cộng tuyến nhưng sẽ mất đi 1 phần thông tin về Y.
Bằng phép so sánh và trong các phép hồi quy khác nhau mà có và không có 1 trong 2 biến chúng ta có thể
quyết định nên bỏ biến nào trong biến và khỏi mô hình.




1.5.4. Sử dụng sai phân cấp 1
Mặc dù biện pháp này có thể giảm tương quan qua lại giữa các biến nhưng chúng cũng có thể được sử dụng
như 1 giải pháp cho vấn đề đa cộng tuyến.




chúng ta có số liệu chuỗi thời gian biểu thị liên hệ giữa các biến Y và các biến phụ thuộc và theo mô hình
sau :





(1.19)
Trong đó t là thời gian. Phương trình trên đúng với t thì cũng đúng với t-1 nghĩa là
(1.20)


Từ (1.19) và (1.20) ta được :



(1.21)

Đặt

Ta được :

(1.22)

Mô hình hồi quy dạng (1.22) thường làm giảm tính nghiêm trọng của đa cộng tuyến vì dù và có thể tương
quan cao nhưng không có lý do tiên nghiệm nào chắc chắn rằng sai phân của chúng cũng tương quan cao.






1.5.5. Giảm tương quan trong hồi quy đa thức





giao”.

Nét khác nhau của hồi quy đa thức là các biến giải thích xuất hiện với lũy thừa
khác nhau trong mô hình hồi quy. Trong thực hành để giảm tương quan trong
hồi quy đa thức người ta thường sử dụng dạng độ lệch. Nếu việc sử dụng dạng
độ lệch mà vẫn không giảm đa cộng tuyến thì người ta có thể phải xem xét đến
kỹ thuật “đa thức trực giao”.
1.5.6. Thay đổi dạng mô hình
Mô hình kinh tế lượng có nhiều dạng hàm khác nhau. Thay đổi dạng mô hình
cũng có nghĩa là tái cấu trúc mô hình.











1.5.7. Một số biện pháp khác

Ngoài các biện pháp đã kể trên người ta còn sử dụng 1 số biện pháp khác nữa
như sau:
- Bỏ qua đa cộng tuyến nếu t > 2
- Bỏ qua đa cộng tuyến nếu R2 của mô hình cao hơn R2 của mô hình hồi quy
phụ.
- Bỏ qua đa cộng tuyến nếu hồi quy mô hình được dùng để dự báo chứ
không phải kiểm định.
- Hồi quy thành phần chính
- Sử dụng các ước lượng từ bên ngoài
Nhưng tất cả các biên pháp đã trình bày ở trên có thể làm giải pháp cho vấn đề
đa cộng tuyến như thế nào còn phụ thuộc vào bản chất của tập số liệu và tính
nghiêm trọng của vấn đề đa cộng tuyến.


Chương II: Bài tập minh họa



Số liệu Thống kê trị giá xuất khẩu, nhập khẩu hàng hóa của Việt Nam giai
đoạn 1996- 2015 (lấy số liệu từ Tổng cục hải quan)



Thống kê Hải quan 18/10/2013 10:00 AM


Obs
1996
1997
1998

1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
2013
2014
2015

Y
26,9654
30,86
35,2836
39,2693
43,5319
47,4855
52,7056
60,3688
70,1906
82,2432
95,1456

110,8752
143,6955
158,046
189,8667
241,504
141,9
358,426
393,856
420,1655

Y: GDP (tổng sản phẩm quốc nội)
X: giá trị xuất khẩu (XK)
Z: giá trị nhập khẩu (NK)
T: Tổng đầu tư trong nước.

X

T

Z
31,6

7.256

11.143

8.756

11.151


9.324

11.494

11.520

11.622

14.449

15.635

15.027

16.162

16.706

19.733

20.176

25.227

26.504

31.954

32.442


36.978

39.826

44.891

48.561

62.682

62.685

80.714

57.096

69.949

72.237

84.839

96.906

106.750

46,92

114.529


113.780

46,92

132.033

132.033

150.217

147.852

162.017

165.570

31,6
31,6
31,6
31,6
34,59
34.59
34,59
34,59
34,59
38,4
38.4
38,4
38,4
38,4


46,92
46,92
46,92


B2: Phát hiện hiện tượng đa cộng tuyến



cao nhưng tỉ số t thấp

2.Tương quan giữa các cặp biến giải thích cao


3. Hồi quy phụ



Ta tiến hành hồi quy X theo Z và T
Với α= 0.05 ta đi kiểm định giả thiết:
:không có hiện tượng đa cộng tuyến
: có hiện tượng đa cộng tuyến
Hay tương đương:
Xây dựng tiêu chuẩn kiểm định: F=
Ta có miền bác bỏ: =
Từ bảng eview ta có = 495.3981
Với n= 20, k=4, α= 0.05 ta có = 3.59
Ta thấy > 3.59 nên ∈
⇒ Bác bỏ giả thuyết

Vậy với mức ý nghĩa 5% thì X có mối liên hệ tuyến tính với Z và


Ta tiến hành hồi quy T theo X và Z



Với α= 0.05 ta đi kiểm định giả thiết:
không có hiện tượng đa cộng tuyến
: có hiện tượng đa cộng tuyến
Hay tương đương:
Xây dựng tiêu chuẩn kiểm định: F=
Ta có miền bác bỏ: =
Từ bảng eview ta có: = 102.8104
Với n=20, k=4, α=0.05 ta có = 3.59
>3.59 nên ∈
⇒ Bác bỏ giả thuyết
Vậy với mức ý nghĩa 5% thì T có mối liên hệ tuyến tính với Z và X


Ta tiến hành hồi quy Z theo X và T



Với α= 0.05 ta đi kiểm định giả thiết:
: không có hiện tượng đa cộng tuyến
: có hiện tượng đa cộng tuyến
Hay tương đương:
Xây dựng tiêu chuẩn kiểm định: F=
Ta có miền bác bỏ: =

Từ bảng eview ta có: =396.2773
Với n=20, k=4, α=0.05 ta có = 3.59
> 3.59 nên ∈
⇒ Bác bỏ giả thuyết
Vậy với mức ý nghĩa 5% thì Z có mối liên hệ tuyến tính với X và T
KL: Mô hình có xảy ra hiện tượng đa công tuyến


B3: Biện pháp và khắc phục hiện tượng



Hồi quy phụ D(X) theo D(Z) và D(T)
+ Kiểm định cặp giả thuyết sau:
Ho: Mô hình không có hiện tượng đa cộng tuyến
H1: Mô hình xảy ra hiện tượng đa cộng tuyến
+ TCKĐ: Ta sử dụng tiêu chuẩn kiểm định F- kiểm định sự phù hợp của mô hình hồi quy.
F = F( k-2; n-k+1)
+ Miền bác bỏ của giả thuyết:
Miền bác bỏ Wα= F/F > Fα ( k-2, n-k+1)
Từ bảng eview trên ta có: F=28.03955
Với n=17, k=4, α = 0.05 ta có
F 0,05 (2,14)= 3.74
Do F=28.03955> F 0,05 (2,14)= 3.74 nên ta bác bỏ giả thuyết Ho . Vậy trong phương pháp
khắc phục sai phân cấp 1 ta không nên sử dụng cách này để khắc phục hiện tượng đa cộng
tuyến.


×