LOGO
www.themegallery.com
Đề tài: Phát hiện hiện tượng đa cộng tuyến và
cách khắc phục hiện tượng.
Môn: Kinh tế lượng
LOGO
www.themegallery.com
I.Lý thuyết :
1.Đa cộng tuyến :
là hiện tượng các biến độc lập trong mô hình phụ
thuộc lẫn nhau và thể hiện dưới dạng hàm số
Có 2 loại:
Đa cộng tuyến hoàn hảo
Đa cộng tuyến không hoàn hảo
LOGO
2.Hậu quả :
Đa cộng tuyến hoàn hảo:
Hệ số hồi quy không xác định
Phương sai, sai số tiêu chuẩn của các
hệ số hồi quy vô hạn
Không thể ước lượng được mô hình
Rất hiếm khi xảy ra.
LOGO
2.Hậu quả :
Đa cộng tuyến không hoàn hảo:
Phương sai ,hiệp phương sai của các ước lượng bình quân
nhỏ nhất lớn
Khoảng tin cậy rộng hơn
Tỷ số t mất ý nghĩa
R
2
cao nhưng t ít ý nghĩa
LOGO
2.Hậu quả :
Các ƯL bình phương nhỏ nhất,sai số tiêu chuẩn rất nhạy với
thay đổi trong số liệu
Dấu các ƯL của các hệ số hồi quy có thể sai
Sự thay đổi về độ lớn,dấu của các ƯL khi thêm (bớt) biến đa
cộng tuyến
LOGO
3.Phát hiện đa cộng tuyến :
R2 cao và thống kê t thấp.
Tương quan cặp giữa các biến giải thích cao
Xét tương quan riêng
Thực hiện hồi quy phụ
Nhân tử phóng đại phương sai
Độ đo Theil
LOGO
4. Khắc phục đa cộng tuyến :
Sử dụng thông tin tiên nghiệm
Thu thập số liệu hay lấy thêm mẫu mới
Bỏ biến
Sử dụng sai phân cấp 1
Giảm tương quan trong hồi quy đa thức
Hồi quy thành phần chính
Dùng các ƯL từ bên ngoài
LOGO
II. Thử nghiệm với số liêu thực tế :
Số liệu
1
Xây dựng mô hình
2
Phân tích kết quả thực nghiệm
3
LOGO
1. Số liệu:
Trong đó: GDP:Tổng sản phẩm quốc dân theo giá thực tế ( tỷ đồng)
CN: Tổng giá trị ngành công nghiệp và xây dựng ( tỷ đồng )
DV: Tổng giá trị ngành dịch vụ ( tỷ đồng )
Năm GDP CN,XD DV
1997
313623 100595 132202
1998
361017 117299 150645
1999
399942 137959 160260
2000
441646 162220 171070
2001
481295 183515 185922
2002
535762 206197 206182
2003
613443 242126 233032
2004
715307 287616 271699
2005
839211 344224 319003
2006
973790 404753 370771
LOGO
1. Số liệu:
Số liệu nói lên mối quan hệ giữa tổng giá trị các ngành công
nghiệp,xây dựng (CN,XD) và dịch vụ (DV) tới tổng thu nhập
quốc dân (GDP)
Số liệu được lấy trên website của Tổng cục thống kê:
www.gso.gov.vn
LOGO
Kết quả bảng tính Eview
2. Xây dựng mô hình hồi quy:
LOGO
Mô hình hồi quy tổng thể : (PRM)
GDP
i
= β
1
+ β
2
X
i
+ β
3
Z
i
+ V
i
Mô hình hồi quy mẫu (SRM)
= 40364.72 + 1.280984X
i
+ 1.122559Z
i
2. Xây dựng mô hình hồi quy:
LOGO
= 40364.72 + 1.280984X
i
+ 1.122559Z
i
Ý nghĩa các hệ số hồi quy :
= 40364.72 : nếu tổng giá trị của ngành CN=0 và
tổng giá trị của ngành DV=0 thì giá trị trung bình
của GDP là 40364.72 tỷ đồng
= 1.280984: khi tổng giá trị các ngành DV không
đổi,tổng giá trị các ngành CN,XD tăng 1 tỷ đồng thì
GDP trung bình tăng 1.280984 tỷ đồng
= 1.122559 : khi tổng giá trị các ngành CN,XD
không đổi,tổng giá trị các ngành DV tăng 1 tỷ đồng
thì GDP trung bình tăng 1.122559 tỷ đồng
2. Xây dựng mô hình hồi quy:
LOGO
Phát hiên hiện tượng đa cộng tuyến :
R cao nhưng tỉ số t thấp
Tương quan cặp giữa các biến giải thích cao
Xem xét tương quan riêng
Hồi quy phụ
Nhân tử phóng đại phương sai
Độ đo Theil
Một số phương pháp khác
LOGO
Phát hiên sự tồn tại hiện tượng đa cộng tuyến :
Cách 1 : Hệ số tương quan cặp cao
Nếu hế số tương quan cặp cao ( > 0,8 ) thì có hiện
tượng đa cộng tuyến
Theo bảng ta thấy r
23
= r
32
=0,997532 là cao nên có
hiện tượng đa cộng tuyến.
3. Phân tích kết quả thực nghiệm:
LOGO
3. Phân tích kết quả thực nghiệm:
Cách 2 : Phương pháp hồi qui phụ
Hồi quy mô hình: CNt =
α
1 +
α
2*DVt + Vt
Hồi qui biến X theo biến Z :
Kiểm định giả thuyết H : H0: R2 = 0
H1: R2 > 0
Ta thấy giá trị P- value của thống kê F là 0,00000000 < 0,01
Có cơ sỏ vững chắc để bác bỏ H0
Hay bác bỏ giả thiết cho rằng không có hiện tượng đa cộng tuyến .
Mô hình xảy ra đa cộng tuyến
LOGO
Các cách khắc phục hiện tượng đa cộng tuyến:
Sử dụng thông tin tiên nghiệm.
Thu thập thêm số liệu hoặc lấy thêm
mẫu mới.
Bỏ biến.
Sử dụng sai phân cấp 1.
Giảm tương quan trong hồi quy đa
thức.
Một số phương pháp khác.
3. Phân tích kết quả thực nghiệm:
LOGO
Sử dụng phương pháp bỏ biến
Đây là phương pháp khắc phục đơn
giản nhất.
Bằng cách bỏ một trong số các biến
độc lập.
Việc bỏ biến nào sẽ quyết định nên bỏ
biến nào ra khỏi mô hình.
Có nhược điểm là làm mất đi một số
thông tin về Y.
3. Phân tích kết quả thực nghiệm:
LOGO
Bỏ biến X (CN,XD):
3. Phân tích kết quả thực nghiệm:
LOGO
Bỏ biến Z (Dịch vụ) :
3. Phân tích kết quả thực nghiệm:
Sử dụng phương pháp bỏ biến
LOGO
Kết luận:
R
2
khi loại biến Z là 0.999087 lớn hơn
R
2
khi loại biến X là 0.998157.
Để khắc phục hiện tượng đa cộng
tuyến ta bỏ biến Z ( Dịch vụ)
3. Phân tích kết quả thực nghiệm:
LOGO
3. Phân tích kết quả thực nghiệm:
Phương pháp bỏ biến :
•
Ưu điểm: khắc phục được hiện tượng đa cộng
tuyến
•
Nhược điểm : mất đi thông tin về sự ảnh hưởng
của Z (Dịch vụ) tới GDP.
LOGO
3. Phân tích kết quả thực nghiệm:
Sử dụng phương pháp sai phân cấp một:
= 40364.72 + 1.280984X
i
+ 1.122559Z
i
LOGO
www.themegallery.com