Tải bản đầy đủ (.pptx) (18 trang)

slide thuyết trình thảo luận phát hiện hiện tượng đa công tuyến và cách khắc phục

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.28 MB, 18 trang )

Đề tài: Hiện tượng đa cộng tuyến
Bài thảo luận nhóm


II. Cơ sở thực tiễn
STT

Năm

Diện tích X

Sản lượng Z

(nghìn ha)

(nghìn tấn)

Khối lượng xuất khẩu Y (nghìn tấn)

1

1995

5765.6

9630.7

1404

2


1996

6003.8

10396.7

1687

3

1997

6099.7

13523.9

1781

4

1998

7362.7

14145.5

2905

5


1999

7653.6

15393.8

3512

6

2000

7666.3

17529.5

5449

7

2001

7492.7

20108.4

7256

8


2002

7504.3

27447.2

9185

9

2003

7452.2

29568.8

9360

10

2004

8445.3

30148.9

11541

11


2005

9329.2

41832.9

20182

12

2006

8324.8

38849.5

18483

13

2007

7807.4

36942.7

15029

14


2008

7400.2

37729.8

16706

15

2009

6940.1

39195.5

19520

16

2010

6390

40110

20190

Số liệu về diện tích, sản lượng, khối lượng
xuất khẩu gạo trong nước giai đoạn 19952010


(Nguồn: TCTK (2009) và Hiệp hội lương thực Việt Nam
(2006) Bộ Nông nghiệp và Phát triển nông thôn)


1. Xây dựng MHHQ tuyến tính



Từ bảng số liệu, sử dụng phần mềm eviews ta được kết quả sau:

-> Mô hình hồi quy: Y= -2621.061- 0.464818X + 0.617217Z
+ Ý nghĩa:
- = -0.464818. Khi sản lượng không đổi, diện tích tăng thêm 1(nghìn ha) thì khối lượng xuất
khẩu gạo trung bình trong 1 năm giảm 0.464818 (nghìn tấn)
- =0.617217. Khi diện tích không đổi, sản lượng tăng thêm 1(nghìn tấn) thì khối lượng xuất
khẩu gạo trung bình trong 1 năm tăng 0.617217(nghìn tấn)


2. Bài toán:



Với mức ý nghĩa 5% kiểm định giả thiết diện tích không ảnh hưởng đến khối
lượng xuất khẩu của gạo







Ta tiến hành kiểm định giả thiết:
Theo bảng eview trên ta có: p-value= 0.2952 >
Suy ra: chấp nhận H0, bác bỏ H1

H 0 : β2 = 0

 H1 : β 2 ≠ 0

Vậy: với mức ý nghĩa 5% ta có thể nói rằng diện tích không ảnh hưởng tới
khối lượng xuất khẩu.



Kiểm định sự ảnh hưởng của sản lượng đến khối lượng xuất khẩu của gạo



Ta tiến hành kiểm định giả thiết:



=> bác bỏ giả thiết H0, chấp nhận giả thiết H1



Vậy với mức ý nghĩa , ta có thể nói rằng sản lượng có ảnh hưởng tới khối lượng xuất khẩu.

H 0 : β2 = 0


 H1 : β 3 ≠ 0


2. Bài toán:



Với mức ý nghĩa 5% kiểm định giả thiết cả hai yếu tố diện tích và sản lượng
đều không ảnh hưởng đến khối lượng xuất khẩu của gạo.

 Ta tiến hành kiểm định giả thuyết:
 Ta tiến hành kiểm định giả thuyết: 
 Theo bảng eview ta có: p-value= 0 <
⇒bác bỏ giả thiết H0, chấp nhận giả thiết H1
 Kết luận: với mức ý nghĩa 5% ta có thể cho rằng có ít nhất một trong 2 biến




Ước lương khoảng tin cậy của hệ số hồi quy



Từ bảng 1, ta có:




n=16 ;


=>



Ta XDTK: T = ~

diện tích, sản lượng có ảnh hưởng tới khối lượng xuất khẩu.



với mức ý nghĩa ta có khoảng tin cậy của

Ta có: R2 = 0.970896 do đó ta có thể kết luận mô hình hồi quy giải thích được
97.0896 sự biến thiên của khối lượng xuất khẩu, hay các biến diện tích, sản
lượng gạo giải thích được 97,0896 sự thay đổi của khối lượng xuất khẩu.



(< < )



Hay - 2.160* << - 2.160*

=> 0.5434< 0.691
=> vậy với mức ý nghĩa ta có khoảng tin cậy của là: .


3. Phát hiện hiện tượng đa cộng tuyến




Hồi quy mô hình: Y= β1 + β2 X +β3Z + Ui thu được kết quả ở bảng eview:

1. R2 cao nhưng tỉ số t thấp





Cho α = 0.05

Từ kết quả bảng eview ta thấy: R2 = 0.970896 > 0.8, cao
Và + t1 = - 0.945889 < 2.160
+ t2 = - 1.090632 < 2.160

=> ttn thấp.



Vậy có thể nghi ngờ rằng có hiện tượng đa cộng tuyến xảy ra trong mô hình này.


3. Phát hiện hiện tượng đa cộng tuyến



2. Xét mô hình hồi quy phụ




Ta tiến hành hồi quy Dientich theo Sanluong



Mô hình có dạng : Xi =β1 + β2Zi + ei



Với α = 0.05 ta đi KĐGT:



Ta kiểm định cặp giả thuyết



Từ kết quả bảng Eview ta thấy



 H o : R22 = 0

2
 H1 : R2 ≠ 0

P-value (F) = 0,030195 < α =0.05

=> Bác bỏ H0 , chấp nhận H1




Kết luân: Với mức ý nghĩa 5% ta có thể kết luận có hiện tượng đa cộng tuyến


3. Phát hiện hiện tượng đa cộng tuyến

3. Đo đọ Theil
Xét mô hình hồi quy Khoiluongxuatkhau theo Dientich



Xét mô hình KhoiIluonguatkhautheo Sanluong ta có kết quả :
Bảng 5

Bảng 4




3. Phát hiện hiện tượng đa cộng tuyến

3. Đo đọ Theil
* Từ 2 bảng hồi quy ta thu được kết quả:
+ r122 = 0,239793
+ r132 = 0,968233
* Đo độ Theil:
m= R2 – (R2 – r122 ) –(R2 – r132 )
= 0,970896-(0,970896 - 0.239793)-( 0,970896- 0.968233) = 0,23713
Vậy m # 0 và độ đo của Theil về mức độ đa cộng tuyến là :

0.23713
* Kết luận : có hiện tượng da cộng tuyến


3. Phát hiện hiện tượng đa cộng tuyến

4. Hệ số tương quan cặp cao





Sử dụng phầm mềm Eview ta có bảng :
Từ bảng ta thấy:r23 = r32 =0.541736 <0.8 thấp
=> vẫn có khả năng xảy ra đa cộng tuyến


3. Phát hiện hiện tượng đa cộng tuyến

5. Sử dụng nhân tử phóng đại phương sai

1

1
≈ 17.4334 > 10
1 − 0,9708962



VIF =




Theo lý thuyêt nếu VIF 10 thì có hiện tượng đa cộng tuyến giữa hai biến độc lập trong mô hình.



Vậy mô hình có xảy ra hiện tượng đa cộng tuyến

1=− R 2
2




4. Dự đoán



Dự báo khối lượng xuất khẩu gạo năm 2011, biết diện tích (X) = 6100 và sản lượng (Z) = 43000



o
Từ eviews ta tìm được se ( Yo/ X )

=> Yo = 21083.86 và SE( Yo) = 1665.711


4. Dự đoán



4. Dự đoán



Các khoảng cận trên và cận dưới của Yo :



Từ bảng dự báo giá trị cho thấy :



Khoảng dự báo giá trị trung bình của y khi



X = 6100



[ 188878.65 ; 23289.08 ]



Giá trị cá biệt là




[ 17485.31 ; 24682.41 ]

Z = 43000 là :


5. Khắc phục hiện tượng đa cộng tuyến
STT

Năm

DiệntíchX

Sảnlượng Z

(nghìn ha)

(nghìntấn)

Khốilượngxuấtkhẩu Y (nghìntấn)

1. Thu thêm số liệu để tăng kích thước mẫu

1

1995

5765.6

9630.7


1404

2

1996

6003.8

10396.7

1687

3

1997

6099.7

13523.9

1781

4

1998

7362.7

14145.5


2905

5

1999

7653.6

15393.8

3512

6

2000

7666.3

17529.5

5449

7

2001

7492.7

20108.4


7256

8

2002

7504.3

27447.2

9185

9

2003

7452.2

29568.8

9360

10

2004

8445.3

30148.9


11541

11

2005

9329.2

41832.9

20182

12

2006

8324.8

38849.5

18483

13

2007

7807.4

36942.7


15029

14

2008

7400.2

37729.8

16706

15

2009

6940.1

39195.5

19520

16

2010

6390

40110


20190

17

2011

6100

43000

23000

18

2012

6050

45000

25000


5. Khắc phục hiện tượng đa cộng tuyến

1. Thu thêm số liệu để tăng kích thước mẫu

 Từ bảng số liệu, sử dụng phần mềm eviews ta được kết quả sau:
 Từ bảng hồi quy máy tính, ta có mô hình hàm hồi quy mới:
 = 1000,757- 1,12922X + 0,671133Z

 t1Yˆ= 0,447969
 t2 = -3,804539
 t3 = 28,72848
 R2 = 0,980176
 Mô hình sau khi đã tăng kích thước mẫu có R2 khá gần 1, các tỷ số t cũng cao nên mô hình ước lượng là
rất phù hợp.


5. Khắc phục hiện tượng đa cộng tuyến

2. Loại bỏ biến đa cộng tuyến khỏi mô hình
Dựa vào kết quả ước lượng bằng phần mềm eviews trong bảng 4 và bảng 5 ta có mô hình hồi quy của biến phụ thuộc Y với từng biến giải thích như sau:



*) Khi bỏ biến Z ta có mô hình hồi quy:

Y = -16997,25+ 3,70753X
r122 = 0,239793
t1 = -1.30023
t2 = 2,101439



*) Khi bỏ biến X ta có mô hình hồi quy:

Y = -5505,637+ 0.59037Z
r132 = 0,968233
t1’ = -6,616607
t2’ = 20,65708


2
2
Ta thấy: r12 < r13 nên mô hình khi bỏ biến X có sự phù hợp cao hơn mô hình khi bỏ biến Z. Vậy bỏ biến X ra khỏi mô hình là hợp lý hơn.




×