Đề tài: Hiện tượng đa cộng tuyến
Bài thảo luận nhóm
II. Cơ sở thực tiễn
STT
Năm
Diện tích X
Sản lượng Z
(nghìn ha)
(nghìn tấn)
Khối lượng xuất khẩu Y (nghìn tấn)
1
1995
5765.6
9630.7
1404
2
1996
6003.8
10396.7
1687
3
1997
6099.7
13523.9
1781
4
1998
7362.7
14145.5
2905
5
1999
7653.6
15393.8
3512
6
2000
7666.3
17529.5
5449
7
2001
7492.7
20108.4
7256
8
2002
7504.3
27447.2
9185
9
2003
7452.2
29568.8
9360
10
2004
8445.3
30148.9
11541
11
2005
9329.2
41832.9
20182
12
2006
8324.8
38849.5
18483
13
2007
7807.4
36942.7
15029
14
2008
7400.2
37729.8
16706
15
2009
6940.1
39195.5
19520
16
2010
6390
40110
20190
Số liệu về diện tích, sản lượng, khối lượng
xuất khẩu gạo trong nước giai đoạn 19952010
(Nguồn: TCTK (2009) và Hiệp hội lương thực Việt Nam
(2006) Bộ Nông nghiệp và Phát triển nông thôn)
1. Xây dựng MHHQ tuyến tính
Từ bảng số liệu, sử dụng phần mềm eviews ta được kết quả sau:
-> Mô hình hồi quy: Y= -2621.061- 0.464818X + 0.617217Z
+ Ý nghĩa:
- = -0.464818. Khi sản lượng không đổi, diện tích tăng thêm 1(nghìn ha) thì khối lượng xuất
khẩu gạo trung bình trong 1 năm giảm 0.464818 (nghìn tấn)
- =0.617217. Khi diện tích không đổi, sản lượng tăng thêm 1(nghìn tấn) thì khối lượng xuất
khẩu gạo trung bình trong 1 năm tăng 0.617217(nghìn tấn)
2. Bài toán:
Với mức ý nghĩa 5% kiểm định giả thiết diện tích không ảnh hưởng đến khối
lượng xuất khẩu của gạo
Ta tiến hành kiểm định giả thiết:
Theo bảng eview trên ta có: p-value= 0.2952 >
Suy ra: chấp nhận H0, bác bỏ H1
H 0 : β2 = 0
H1 : β 2 ≠ 0
Vậy: với mức ý nghĩa 5% ta có thể nói rằng diện tích không ảnh hưởng tới
khối lượng xuất khẩu.
Kiểm định sự ảnh hưởng của sản lượng đến khối lượng xuất khẩu của gạo
Ta tiến hành kiểm định giả thiết:
=> bác bỏ giả thiết H0, chấp nhận giả thiết H1
Vậy với mức ý nghĩa , ta có thể nói rằng sản lượng có ảnh hưởng tới khối lượng xuất khẩu.
H 0 : β2 = 0
H1 : β 3 ≠ 0
2. Bài toán:
Với mức ý nghĩa 5% kiểm định giả thiết cả hai yếu tố diện tích và sản lượng
đều không ảnh hưởng đến khối lượng xuất khẩu của gạo.
Ta tiến hành kiểm định giả thuyết:
Ta tiến hành kiểm định giả thuyết:
Theo bảng eview ta có: p-value= 0 <
⇒bác bỏ giả thiết H0, chấp nhận giả thiết H1
Kết luận: với mức ý nghĩa 5% ta có thể cho rằng có ít nhất một trong 2 biến
Ước lương khoảng tin cậy của hệ số hồi quy
Từ bảng 1, ta có:
n=16 ;
=>
Ta XDTK: T = ~
diện tích, sản lượng có ảnh hưởng tới khối lượng xuất khẩu.
với mức ý nghĩa ta có khoảng tin cậy của
Ta có: R2 = 0.970896 do đó ta có thể kết luận mô hình hồi quy giải thích được
97.0896 sự biến thiên của khối lượng xuất khẩu, hay các biến diện tích, sản
lượng gạo giải thích được 97,0896 sự thay đổi của khối lượng xuất khẩu.
(< < )
Hay - 2.160* << - 2.160*
=> 0.5434< 0.691
=> vậy với mức ý nghĩa ta có khoảng tin cậy của là: .
3. Phát hiện hiện tượng đa cộng tuyến
Hồi quy mô hình: Y= β1 + β2 X +β3Z + Ui thu được kết quả ở bảng eview:
1. R2 cao nhưng tỉ số t thấp
Cho α = 0.05
Từ kết quả bảng eview ta thấy: R2 = 0.970896 > 0.8, cao
Và + t1 = - 0.945889 < 2.160
+ t2 = - 1.090632 < 2.160
=> ttn thấp.
Vậy có thể nghi ngờ rằng có hiện tượng đa cộng tuyến xảy ra trong mô hình này.
3. Phát hiện hiện tượng đa cộng tuyến
2. Xét mô hình hồi quy phụ
Ta tiến hành hồi quy Dientich theo Sanluong
Mô hình có dạng : Xi =β1 + β2Zi + ei
Với α = 0.05 ta đi KĐGT:
Ta kiểm định cặp giả thuyết
Từ kết quả bảng Eview ta thấy
H o : R22 = 0
2
H1 : R2 ≠ 0
P-value (F) = 0,030195 < α =0.05
=> Bác bỏ H0 , chấp nhận H1
Kết luân: Với mức ý nghĩa 5% ta có thể kết luận có hiện tượng đa cộng tuyến
3. Phát hiện hiện tượng đa cộng tuyến
3. Đo đọ Theil
Xét mô hình hồi quy Khoiluongxuatkhau theo Dientich
Xét mô hình KhoiIluonguatkhautheo Sanluong ta có kết quả :
Bảng 5
Bảng 4
3. Phát hiện hiện tượng đa cộng tuyến
3. Đo đọ Theil
* Từ 2 bảng hồi quy ta thu được kết quả:
+ r122 = 0,239793
+ r132 = 0,968233
* Đo độ Theil:
m= R2 – (R2 – r122 ) –(R2 – r132 )
= 0,970896-(0,970896 - 0.239793)-( 0,970896- 0.968233) = 0,23713
Vậy m # 0 và độ đo của Theil về mức độ đa cộng tuyến là :
0.23713
* Kết luận : có hiện tượng da cộng tuyến
3. Phát hiện hiện tượng đa cộng tuyến
4. Hệ số tương quan cặp cao
Sử dụng phầm mềm Eview ta có bảng :
Từ bảng ta thấy:r23 = r32 =0.541736 <0.8 thấp
=> vẫn có khả năng xảy ra đa cộng tuyến
3. Phát hiện hiện tượng đa cộng tuyến
5. Sử dụng nhân tử phóng đại phương sai
1
1
≈ 17.4334 > 10
1 − 0,9708962
VIF =
Theo lý thuyêt nếu VIF 10 thì có hiện tượng đa cộng tuyến giữa hai biến độc lập trong mô hình.
Vậy mô hình có xảy ra hiện tượng đa cộng tuyến
1=− R 2
2
≥
4. Dự đoán
Dự báo khối lượng xuất khẩu gạo năm 2011, biết diện tích (X) = 6100 và sản lượng (Z) = 43000
o
Từ eviews ta tìm được se ( Yo/ X )
=> Yo = 21083.86 và SE( Yo) = 1665.711
4. Dự đoán
4. Dự đoán
Các khoảng cận trên và cận dưới của Yo :
Từ bảng dự báo giá trị cho thấy :
Khoảng dự báo giá trị trung bình của y khi
X = 6100
[ 188878.65 ; 23289.08 ]
Giá trị cá biệt là
[ 17485.31 ; 24682.41 ]
Z = 43000 là :
5. Khắc phục hiện tượng đa cộng tuyến
STT
Năm
DiệntíchX
Sảnlượng Z
(nghìn ha)
(nghìntấn)
Khốilượngxuấtkhẩu Y (nghìntấn)
1. Thu thêm số liệu để tăng kích thước mẫu
1
1995
5765.6
9630.7
1404
2
1996
6003.8
10396.7
1687
3
1997
6099.7
13523.9
1781
4
1998
7362.7
14145.5
2905
5
1999
7653.6
15393.8
3512
6
2000
7666.3
17529.5
5449
7
2001
7492.7
20108.4
7256
8
2002
7504.3
27447.2
9185
9
2003
7452.2
29568.8
9360
10
2004
8445.3
30148.9
11541
11
2005
9329.2
41832.9
20182
12
2006
8324.8
38849.5
18483
13
2007
7807.4
36942.7
15029
14
2008
7400.2
37729.8
16706
15
2009
6940.1
39195.5
19520
16
2010
6390
40110
20190
17
2011
6100
43000
23000
18
2012
6050
45000
25000
5. Khắc phục hiện tượng đa cộng tuyến
1. Thu thêm số liệu để tăng kích thước mẫu
Từ bảng số liệu, sử dụng phần mềm eviews ta được kết quả sau:
Từ bảng hồi quy máy tính, ta có mô hình hàm hồi quy mới:
= 1000,757- 1,12922X + 0,671133Z
t1Yˆ= 0,447969
t2 = -3,804539
t3 = 28,72848
R2 = 0,980176
Mô hình sau khi đã tăng kích thước mẫu có R2 khá gần 1, các tỷ số t cũng cao nên mô hình ước lượng là
rất phù hợp.
5. Khắc phục hiện tượng đa cộng tuyến
2. Loại bỏ biến đa cộng tuyến khỏi mô hình
Dựa vào kết quả ước lượng bằng phần mềm eviews trong bảng 4 và bảng 5 ta có mô hình hồi quy của biến phụ thuộc Y với từng biến giải thích như sau:
*) Khi bỏ biến Z ta có mô hình hồi quy:
Y = -16997,25+ 3,70753X
r122 = 0,239793
t1 = -1.30023
t2 = 2,101439
*) Khi bỏ biến X ta có mô hình hồi quy:
Y = -5505,637+ 0.59037Z
r132 = 0,968233
t1’ = -6,616607
t2’ = 20,65708
2
2
Ta thấy: r12 < r13 nên mô hình khi bỏ biến X có sự phù hợp cao hơn mô hình khi bỏ biến Z. Vậy bỏ biến X ra khỏi mô hình là hợp lý hơn.