Tải bản đầy đủ (.docx) (46 trang)

KINH TẾ LƯỢNG báo cáo thực hành KTL

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (371.19 KB, 46 trang )

Báo cáo Kinh tế lượng

Nhóm 18/ Lớp KTE309.25_LT

1


Báo cáo Kinh tế lượng

Nhóm 18/ Lớp KTE309.25_LT

TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG
KHOA KINH TẾ VÀ KINH DOANH QUỐC TẾ
-----❧❧❧❧-----

BÁO CÁO KINH TẾ LƯỢNG
BẢNG SỐ LIỆU 24 + 58
Nhóm 18

GV HƯỚNG DẪN: T.S ĐINH THỊ THANH BÌNH

Hà Nội, 2014

2


Báo cáo Kinh tế lượng

Nhóm 18/ Lớp KTE309.25_LT

DANH SÁCH THÀNH VIÊN NHÓM VÀ ĐÓNG GÓP



Công việc
Sinh viên

MSSV

Làm việc
nhóm

% đóng góp

(?/5)
Nguyễn Anh Tuấn

1213160132

5/5

Như nhau

Nguyễn Thị Tươi

1216160133

5/5

Như nhau

Phạm Minh Tuyền


1211160134

5/5

Như nhau

Đào Vân Uyên

1211160135

5/5

Như nhau

Nguyễn Thị Hồng Vân

1213160136

5/5

Như nhau

3


Báo cáo Kinh tế lượng

Nhóm 18/ Lớp KTE309.25_LT

MỤC LỤC

Nội dung

Trang

LỜI MỞ ĐẦU
A. BẢNG SỐ LIỆU SỐ 24
I.

MÔ TẢ THỐNG KÊ SỐ LIỆU:
1. Tổng quan:
2. Mô tả chi tiết các biến trong mô hình:

II.

MÔ HÌNH HỒI QUI VÀ PHÂN TÍCH HỒI QUI:

1. Phân tích mối quan hệ tương quan giữa các biến:
2. Chạy mô hình hồi qui và phân tích kết quả:
3. Một số kiểm định F:
III.

KIỂM ĐỊNH VÀ SỬA CHỮA CÁC KHUYẾT TẬT CỦA MÔ HÌNH:

1. Vấn đề đa cộng tuyến:
2. Vấn đề về phương sai sai số thay đổi:
B. BẢNG SỐ LIỆU SỐ 58
I.

MÔ TẢ THỐNG KÊ SỐ LIỆU:
1. Tổng quan:

2. Mô tả chi tiết các biến trong mô hình:

II.

MÔ HÌNH HỒI QUI VÀ PHÂN TÍCH HỒI QUI:

1. Phân tích mối quan hệ tương quan giữa các biến:
2. Chạy mô hình hồi qui và phân tích kết quả:
3. Một số kiểm định F:
III.

KIỂM ĐỊNH VÀ SỬA CHỮA CÁC KHUYẾT TẬT CỦA MÔ HÌNH

1. Vấn đề đa cộng tuyến:
2. Vấn đề về phương sai sai số thay đổi:
TÀI LIỆU THAM KHẢO

4


Báo cáo Kinh tế lượng

Nhóm 18/ Lớp KTE309.25_LT

LỜI MỞ ĐẦU
Như chúng ta đã biết, nếu như kinh tế vi mô và vĩ mô mô tả sự vận động của nền kinh tế, thì
kinh tế lượng cung cấp các phân tích về mặt lượng mối quan hệ giữa các hiện tượng kinh tế, cùng
với sự tác động qua lại giữa chúng, trên cơ sở các số liệu thu thập từ thực tế, nhằm củng cố thêm
các giả thiết, từ đó đưa ra các quyết định đúng đắn hơn. Đặc biệt, trong thời đại công nghệ phát
triển mạnh mẽ như hiện nay, sự đòi hỏi phải phân tích định lượng các hiện tượng kinh tế trong quá

trình hoạch định chính sách vĩ mô, việc dự báo và dự đoán phải có độ tin cậy cao,… kinh tế lượng
ngày càng đóng một vai trò quan trọng, và bản thân nó cũng không ngừng được hoàn thiện và phát
triển.
Sau quá trình học tập và nghiên cứu, dưới sự chỉ dẫn tận tình của cô Đinh Thị Thanh Bình,
nhóm chúng em đã tiếp nhận được lượng kiến thức mà môn học truyền tải, tự đó có thể hoàn thành
báo cáo về bảng số liệu 24 và 58. Chúng em rất mong nhận được những ý kiến nhận xét của cô và
các bạn để bài làm có thể hoàn thiện hơn!

5


Báo cáo Kinh tế lượng

Nhóm 18/ Lớp KTE309.25_LT

A. BẢNG SỐ LIỆU SỐ 24
Bất kì một quốc gia nào trên thế giới muốn giữ vững trật tự, kỉ cương của xã hội cũng đều đặt
ra hệ thống luật pháp của riêng mình; và bất cứ ai vi phạm hệ thống ấy cũng đều bị bắt và xử lý theo
pháp luật.
Vậy số lần phạm tội trộm cắp tài sản bị bắt giữ, thu nhập hợp pháp tính trong năm, thời gian
kết án trung bình trong năm,… có ảnh hưởng như thế nào đến số lần bị bắt giữ trong năm? Để hiểu
rõ hơn, sâu sắc hơn về vấn đề trên, nhóm chúng em đã sử dụng bộ số liệu 24; bộ số liệu này dựa
trên những nghiên cứu trong năm 1986 - một mốc thời gian cụ thể.

6


Báo cáo Kinh tế lượng

I.


Nhóm 18/ Lớp KTE309.25_LT

MÔ TẢ THỐNG KÊ SỐ LIỆU:

1. Tổng quan:
Sau quá trình thảo luận nhóm cũng như xem xét ý nghĩa của từng biến trong file bảng số liệu
24, nhóm chúng em đã quyết định chọn mô hình hồi quy gồm các biến như sau:



Biến phụ thuộc: narr86



Biến độc lập: (bao gồm 5 biến)



X1: nparr86



X2: inc86



X3: black




X4: avgsen



X5: ptime86

Dưới đây là kết quả thu được của nhóm khi tiến hành mô tả thống kê biến phụ thuộc và các
biến độc lập bằng lệnh miêu tả biến des:
des narr86 nparr86 ptime86 avgsen black inc86

variable name

storage

display

value

type

format

label

variable label

---------------------------------------------------------------------------------------------------------------------------------------narr86

byte


%9.0g

# times arrested, 1986

nparr86

byte

%9.0g

# property crme arr., 1986

ptime86

byte

%9.0g

mos. in prison during 1986

avgsen

float

%9.0g

avg sentence length, mos.

black


byte

%9.0g

=1 if black

inc86

float

%9.0g

legal income, 1986, $100s

7


Báo cáo Kinh tế lượng

Nhóm 18/ Lớp KTE309.25_LT

Dựa vào kết quả trên, ta có bảng tổng hợp sau:
Tên biến

Định dạng hiển thị

Đơn vị tính

Ý nghĩa biến


narr86

%9.0g

-

Số lần bị bắt trong năm 1986

nparr86

%9.0g

-

Số lần phạm tội trộm cắp tài sản bị bắt
giữ trong năm 1986

inc86

%9.0g

trăm đô

Thu nhập hợp pháp tính trong năm
1986

%9.0g

-


= 1 nếu là người da đen
Black

=0 nếu là không là người da đen
avgsen

%9.0g

tháng

Thời gian kết án trung bình

ptime86

%9.0g

tháng

Số tháng ngồi tùtrong năm 1986

Sau đó sử dụng lệnh Sum để tiếp tục mô tả các biến trên:
sum narr86 nparr86 avgsen ptime86 inc86 black
Variable |

Obs

Mean

Std. Dev.


Min

Max

-------------+-------------------------------------------------------narr86 |

2725

.4044037

.8590768

0

12

nparr86 |

2725

.1255046

.4828473

0

8

avgsen |


2725

.6322936

3.508031

0

59.2

ptime86 |

2725

.387156

1.950051

0

12

inc86 |

2725

54.96705

66.62721


0

541

-------------+--------------------------------------------------------

8


Báo cáo Kinh tế lượng
black |

Nhóm 18/ Lớp KTE309.25_LT
2725

.1611009

.3676915

0

1

Kết quả của lệnh Sum cho ta biết số quan sát (Obs), giá trị trung bình (Mean), độ lệch chuẩn
(Std. Dev.), giá trị lớn nhất (Max), giá trị nhỏ nhất (Min) của các biến.
Dựa theo kết quả trên, ta có bảng tổng hợp sau:

Biến


Số quan
sát

Giá trị
trung bình

Độ lệch chuẩn

Giá trị nhỏ nhất

Giá trị lớn nhất

narr86

2725

0.4044037

0.8590768

0

12

nparr86

2725

0.1255046


0.4828473

0

8

Avgsen

2725

0.6322936

3.508031

0

59.2

ptime86

2725

0.387156

1.950051

0

12


inc86

2725

54.96705

66.62721

0

541

Black

2725

0.1611009

0.3676915

0

1

2. Mô tả chi tiết các biến trong mô hình:
Để mô tả chi tiết các biến đã chọn, dùng lệnh tab:
a) Số lần bị bắt giữ trong năm 1986.
tab narr86
# times |
arrested, |

1986 |

Freq.

Percent

Cum.

------------+----------------------------------0 |

1,970

72.29

72.29

1 |

559

20.51

92.81

2 |

121

4.44


97.25

3 |

42

1.54

98.79

4 |

12

0.44

99.23

9


Báo cáo Kinh tế lượng

Nhóm 18/ Lớp KTE309.25_LT

5 |

13

0.48


99.71

6 |

4

0.15

99.85

7 |

1

0.04

99.89

9 |

1

0.04

99.93

10 |

1


0.04

99.96

12 |

1

0.04

100.00

------------+----------------------------------Total |

2,725

100.00

− Số lần bị bắt giữ dao động trong khoảng 0 đến 12 với tần suất cao nhất r ơi vào m ức 0 là
1970 chiếm 72,29% và giảm dần đáng kể cho đến mức 12. Nhìn một cách t ổng quan có th ể
thấy số lần phạm tội chủ yếu nằm trong khoảng từ 0 – 2 chiếm 97,25%.
− Ý nghĩa của Cum: có 97.25% trong tổng số 2725 số quan sát mà Số lần bị bắt gi ữ trong năm
1986 ≤ 2.

b) Số lần phạm tội trộm cắp tài sản bị bắt giữ trong năm 1986.
tab nparr86
# property |
crme arr., |
1986 |


Freq.

Percent

Cum.

------------+----------------------------------0 |

2,469

90.61

90.61

1 |

208

7.63

98.24

2 |

31

1.14

99.38


3 |

7

0.26

99.63

4 |

5

0.18

99.82

5 |

3

0.11

99.93

8 |

2

0.07


100.00

------------+----------------------------------Total |

2,725

100.00

10


Báo cáo Kinh tế lượng

Nhóm 18/ Lớp KTE309.25_LT

− Số lần phạm tội trộm cắp tài sản bị bắt giữ nằm trong khoảng từ 0 đến 8. Trong đó mức 0 có
tần suất đáng kể nhất là 2469 chiếm 90,61% , theo sau đó là s ự gi ảm xu ống đáng k ể ở các
mức tiếp theo. Với số lần phạm tội trộm cắp tài sản bị bắt gi ữ là 8 chi ếm ít nh ất, ch ỉ có
0,07%.
− Ý nghĩa của Cum: có 99.63% trong tổng số 2725 số quan sát mà số lần phạm tội trộm cắp tài
sản bị bắt giữ trong năm 1986 ≤ 3

c) Thời gian kết án trung bình.
tab avgsen
avg |
sentence |
length, |
mos. |


Freq.

Percent

Cum.

------------+----------------------------------0 |

2,591

95.08

95.08

.3 |

1

0.04

95.12

.8 |

2

0.07

95.19


.9 |

2

0.07

95.27

1.1 |

5

0.18

95.45

1.4 |

1

0.04

95.49

2.2 |

1

0.04


95.52

2.3 |

1

0.04

95.56

2.6 |

2

0.07

95.63

2.9 |

1

0.04

95.67

3.5 |

1


0.04

95.71

4 |

2

0.07

95.78

4.3 |

1

0.04

95.82

4.8 |

1

0.04

95.85

4.9 |


1

0.04

95.89

5.5 |

2

0.07

95.96

11


Báo cáo Kinh tế lượng

Nhóm 18/ Lớp KTE309.25_LT

5.6 |

4

0.15

96.11

6 |


1

0.04

96.15

6.1 |

2

0.07

96.22

6.2 |

1

0.04

96.26

6.3 |

1

0.04

96.29


6.7 |

1

0.04

96.33

6.9 |

1

0.04

96.37

7.1 |

3

0.11

96.48

7.2 |

1

0.04


96.51

7.6 |

1

0.04

96.55

--more—

− Thời gian kết án trung bình dao động từ 0 đến 59,2 tháng v ới t ần su ất c ủa mỗi kho ảng th ời
gian đều rất ít lặp lại hoặc hầu như không lặp lại trừ mức 0 tháng có t ần su ất cao nh ất 2591
chiếm 95,08%.
− Ý nghĩa của Cum: có 96.26% trong tổng số 2725 số quan sát mà thời gian k ết án trung bình ≤
6.2
d) Số tháng ngồi tù trong năm 1986.
tab ptime86
mos. in |
prison |
during 1986 |

Freq.

Percent

Cum.


------------+----------------------------------0 |

2,594

95.19

95.19

1 |

7

0.26

95.45

2 |

15

0.55

96.00

3 |

8

0.29


96.29

4 |

7

0.26

96.55

5 |

5

0.18

96.73

6 |

10

0.37

97.10

7 |

7


0.26

97.36

12


Báo cáo Kinh tế lượng

Nhóm 18/ Lớp KTE309.25_LT

8 |

2

0.07

97.43

9 |

4

0.15

97.58

10 |

4


0.15

97.72

11 |

4

0.15

97.87

12 |

58

2.13

100.00

------------+----------------------------------Total |

2,725

100.00

− Số tháng ngồi tù trong năm 1986 trải đều từ 0 – 12 tháng. Trong đó thời gian ngồi tù chi ếm
tần suất lớn nhất là 0 tháng với mức 2594 chiếm 95,19%.
− Ý nghĩa của Cum: có 97.43% trong tổng số 2725 số quan sát mà số tháng ngồi tù trong năm

1986 ≤ 8.
e) Thu nhập hợp pháp tính trong năm 1986.
tab inc86
legal |
income, |
1986, $100s |

Freq.

Percent

Cum.

------------+----------------------------------0 |

650

23.85

23.85

.1 |

5

0.18

24.04

.2 |


9

0.33

24.37

.3 |

7

0.26

24.62

.4 |

11

0.40

25.03

.5 |

4

0.15

25.17


.6 |

2

0.07

25.25

.7 |

6

0.22

25.47

.8 |

10

0.37

25.83

.9 |

4

0.15


25.98

1 |

12

0.44

26.42

1.1 |

1

0.04

26.46

1.2 |

3

0.11

26.57

13



Báo cáo Kinh tế lượng

Nhóm 18/ Lớp KTE309.25_LT

1.3 |

7

0.26

26.83

1.4 |

1

0.04

26.86

1.5 |

5

0.18

27.05

1.6 |


3

0.11

27.16

1.7 |

8

0.29

27.45

1.8 |

7

0.26

27.71

1.9 |

9

0.33

28.04


2 |

1

0.04

28.07

2.1 |

6

0.22

28.29

2.2 |

4

0.15

28.44

2.3 |

2

0.07


28.51

2.4 |

3

0.11

28.62

2.5 |

3

0.11

28.73

2.6 |

4

0.15

28.88

--more--

− Thu nhập hợp pháp tính trong năm 1986 dao động trong khoảng từ 0 đến 54100$ v ới t ần
suất cao nhất vẫn là mức 0 với 650 lần xuất hiện chi ếm 23,85%. Nhìn chung, thu nh ập h ợp

pháp ở mức không cao.
− Ý nghĩa của Cum: có 28.44% trong tổng số 2725 số quan sát mà thu nhập hợp pháp tính trong
năm 1986 ≤ 2.2
f) Màu da.
tab black
=1 if black |

Freq.

Percent

Cum.

------------+----------------------------------0 |

2,286

83.89

83.89

1 |

439

16.11

100.00

------------+----------------------------------Total |


2,725

100.00

Biến black = 1 nếu là người da đen, xuất hiện 439 lần chiếm 16,11%.
Biến black =0 nếu là không phải người da đen, xuất hiện 2286 lần chiếm 83,89%

14


Báo cáo Kinh tế lượng

Nhóm 18/ Lớp KTE309.25_LT

Nhìn chung, số lượng người da đen chiếm tỉ lệ thấp hơn so với người da màu khác trong mối
quan hệ với số lần bị bắt giữ trong năm 1986.

II.

MÔ HÌNH HỒI QUI VÀ PHÂN TÍCH HỒI QUI:



Hàm hồi quy tổng thể (PRF) và hàm hồi quy mẫu (SRF):

Chọn biến phụ thuộc Y là narr86, các biến độc lập X1, X2, X3, X4, X5 lần lượt là nparr86,
avgsen, ptime86, inc86, black.
Như vậy ta có hàm hồi qui tổng thể PRF biểu diễn mối quan hệ phụ thuộc giữa Y và các biến
X như sau:

Narr86 = + * nparr86 + * avgsen + * ptime86 + * inc86 + * black +
Hàm hồi qui mẫu SRF là:
+ * nparr86 + * avgsen + * ptime86 + * inc86 + * black

1. Phân tích mối quan hệ tương quan giữa các biến:
Thực hiện lệnh corr có bảng tương quan giữa biến phụ thuộc narr86 và các biến độc lập như
sau:
corr narr86 nparr86 avgsen ptime86 inc86 black
(obs=2725)
|

narr86

nparr86

avgsen

ptime86

inc86

black

-------------+-----------------------------------------------------narr86 |

1.0000

nparr86 |

0.6608


1.0000

avgsen |

0.0293

-0.0098

1.0000

ptime86 |

-0.0299

-0.0087

0.2353

1.0000

inc86 |

-0.1900

-0.1405

-0.0958

-0.1600


1.0000

black |

0.1493

0.1011

0.1194

0.0737

-0.1470

1.0000

Từ bảng trên có thể thấy:

-

Hệ số tương quan giữa narr86 và nparr86 là 0.6608
Hệ số tương quan giữa narr86 và avgsen là 0.0293
Hệ số tương quan giữa narr86 và ptime86 là -0.0299

15


Báo cáo Kinh tế lượng
Nhóm 18/ Lớp KTE309.25_LT

- Hệ số tương quan giữa narr86 và inc86 là -0.1900
- Hệ số tương quan giữa narr86 và black là 0.1493
Như vậy, ta có thể thấy trong các nhân tố được nghiên cứu, biến nparr86 có mối tương quan
mạnh nhất đến narr86, hay nói cách khác số lần phạm tội trộm cắp tài sản bị bắt giữ trong năm
1986 có ảnh hưởng khá lớn đến số lần bị bắt trong năm 1986. Hệ số tương quan mang dấu dương
cũng thể hiện mối quan hệ cùng chiều giữa các biến, như nếu số lần phạm tội trộm cắp tài sản bị bắt
giữ trong năm 1986 tăng thì số lần bị bắt giữ trong năm 1986 cũng tăng.
Ngược lại, biến avgsen ít ảnh hưởng nhất đến narr86, hay mối tương quan giữa thời gian
kết án trung bình và số lần bị bắt giữ trong năm 1986 không mạnh như các yếu tố khác. Hệ số tương
quan giữa 2 biến mang dấu dương, chứng tỏ chúng có quan hệ cùng chiều, nếu thời gian kết án
trung bình tăng thì số lần bị bắt giữ trong năm 1986 tăng nhưng không đáng kể.
Ngoài ra, vì giá trị tuyệt đối của các chỉ số đều nhỏ hơn 0.8 nên dự đoán sẽ không xảy ra
hiện tượng đa cộng tuyến.

2. Chạy mô hình hồi qui và phân tích kết quả:
* Sử dụng lệnh hồi qui reg ta có kết quả như sau:
. reg narr86 nparr86 avgsen ptime86 inc86 black

Source |

SS

df

MS

Number of obs =

-------------+------------------------------


F(

5,

2719) =

2725
452.37

Model |

912.915316

5

182.583063

Prob > F

=

0.0000

Residual |

1097.43184

2719

.403615977


R-squared

=

0.4541

Adj R-squared =

0.4531

Root MSE

.63531

-------------+-----------------------------Total |

2010.34716

2724

.738012906

=

-----------------------------------------------------------------------------narr86 |

Coef.

Std. Err.


t

P>|t|

[95% Conf. Interval]

-------------+---------------------------------------------------------------nparr86 |

1.138975

.0255741

44.54

0.000

1.088828

1.189121

avgsen |

.0074017

.0035952

2.06

0.040


.0003521

.0144513

ptime86 |

-.02286

.0064938

-3.52

0.000

-.0355933

-.0101267

inc86 |

-.0012251

.0001887

-6.49

0.000

-.0015952


-.000855

black |

.1654735

.0338007

4.90

0.000

.0991958

.2317511

_cons |

.3063096

.0181962

16.83

0.000

.2706299

.3419893


------------------------------------------------------------------------------

16


Báo cáo Kinh tế lượng

Nhóm 18/ Lớp KTE309.25_LT

Từ đó ta có bảng số liệu:
Tên biến

Hệ số hồi quy

P-value

Khoảng tin cậy

Hệ số tự do

0.3063096

0.000

(0.2706299 ; 0.3419893)

nparr86

1.138975


0.000

(1.088828 ; 1.189121)

Avgsen

0.0074017

0.040

(0.0003521 ; 0.0144513)

ptime86

-0.02286

0.000

(-0.0355933 ; -0.0101267)

inc86

-0.0012251

0.000

(-0.0015952 ; -0.000855)

Black


0.1654735

0.000

(0.0991958 ; 0.2317511)

Phương trình hồi qui mẫu của mô hình là:
narr86 = 0.3063096 + 1.138975* nparr86 + 0.0074017 * avgsen-0.02286* ptime86 0.0012251 * inc86 + 0.1654735* black + ui
* Phân tích kết quả hồi qui:








Số quan sát Obs = 2725.
Tổng bình phương sai số tổng cộng SST = 2010.34716.
Tổng bình phương sai số được giải thích SSE = 912.915316.
Tổng bình phương các phần dư SSR = 1097.43184.
Bậc tự do của phần được giải thích Dfm= 5.
Bậc tự do của phần dư Dfr = 2719.

− Hệ số xác định R2 = 0.4541 thể hiện mức độ phù hợp của hàm hồi quy mẫu và sự biến động
của số lần bị bắt trong năm 1986 được giải thích bởi các biến độc lập: số lần tội phạm trộm cắp tài
sản bị bắt giữ trong năm 1986, thu nhập hợp pháp tính trong năm 1986, thời gian kết án trung
bình, số tháng ngồi tù trong năm 1986, màu da.
− Hệ số xác định điều chỉnh = 0.4531


17


Báo cáo Kinh tế lượng

Nhóm 18/ Lớp KTE309.25_LT

− Ý nghĩa các hệ số hồi quy trong mô hình:
Với điều kiện các yếu tố khác không đổi thì :

▪ = 0.3063096 có nghĩa khi giá trị các biến độc lập = 0 thì số lần bị bắt trong năm 1986 là






0.3063096 lần.
= 1.138975 có nghĩa số lần phạm tội trộm cắp tài sản bị bắt giữ trong năm 1986 tăng lên 1
đơn vị thì tổng số lần bị bắt giữ tăng lên 1.138975 lần.
= 0.0074017 có nghĩa nếu thời gian kết án trung bình tăng lên 1 tháng thì số lần bị bắt giữ
tăng 0.0074017 lần.
= -0.02286 có nghĩa là nếu số tháng ngồi tù trong năm 1986 tăng lên 1 tháng thì số lần bị bắt
giữ giảm đi 0.02286 lần.
= -0.0012251có nghĩa nếu thu nhập hợp pháp tính trong năm 1986 tăng lên 100$ thì số lần bị
bắt giữ giảm đi 0.0012251 lần.
= 0.1654735 có nghĩa nếu là người da đen thì số lần bị bắt giữ cao hơn so với da màu khác
0.1654735 lần.


3. Một số kiểm định F:
a) Kiểm định sự phù hợp của mô hình:
- Mục đích: xem xét trường hợp các tham số của biến độc lập đồng thời bằng 0 có thể xảy ra
hay không.
- Có cặp giả thuyết thống kê:

Nếu giá trị Prob > F nhỏ hơn mức ý nghĩa thì bác bỏ Ho, chấp nhận H1 tức là hàm hồi quy
mẫu phù hợp.

F = = 452.353

= 2.22

Mà F= 452.353 > 2,22 → Bác bỏ H0.

Vậy mô hình hồi quy tìm được là phù hợp.

18


Báo cáo Kinh tế lượng

Nhóm 18/ Lớp KTE309.25_LT

- Sử dụng lệnh test có kết quả:
test nparr86 avgsen ptime86 inc86 black
( 1)

nparr86 = 0


( 2)

avgsen = 0

( 3)

ptime86 = 0

( 4)

inc86 = 0

( 5)

black = 0
F(

5,

2719) =

Prob > F =

452.37
0.0000

Như vậy, Prob > F = 0.0000, nhỏ hơn mức ý nghĩa , vì thế bác bỏ Ho.
→ Hệ số hồi qui của các biến độc lập không đồng thời bằng 0 mô hình hồi qui phù hợp.

b) Kiểm định giả thuyết về hệ số hồi qui:

- Mục đích: kiểm định ảnh hưởng của từng biến độc lập lên giá trị trung bình của biến phụ
thuộc narr86.
- Có cặp giả thuyết thống kê:

Nếu giá trị Prob > F nhỏ hơn mức ý nghĩa thì bác bỏ Ho, chấp nhận H1, tức là biến độc
lập đó có ý nghĩa thống kê đối với narr86.
- Theo bảng chạy hồi qui, ta thấy:

+ Biến nparr86 có giá trị p-value < 0.05, bác bỏ H o, tức là biến nparr86 có ý nghĩa
+
+
+
+

thống kê đối với narr86.
Biến avgsen có giá trị p-value < 0.05, bác bỏ H o, tức là biến avgsen có ý ngĩa thống
kê đối với narr86.
Biến ptime86 có giá trị p-value < 0.05, bác bỏ H o, tức là biến ptime86 có ý nghĩa
thống kê đối với narr86.
Biến inc86 có giá trị p-value < 0.05, bác bỏ H o, tức là biến inc86 có ý nghĩa thống
kê đối với narr86.
Biến black có giá trị p-value < 0.05, bác bỏ H o, tức là biến black có ý nghĩa thống
kê đối với narr86.

19


Báo cáo Kinh tế lượng

Nhóm 18/ Lớp KTE309.25_LT


→ Các biến nparr86, avgsen, ptime86, inc86, black đều có ảnh hưởng đến narr86.

III.

KIỂM ĐỊNH VÀ SỬA CHỮA CÁC KHUYẾT TẬT CỦA MÔ HÌNH:

1. Vấn đề đa cộng tuyến:
a)

Bản chất:

Đa cộng tuyến là một lỗi của mô hình phân tích hồi quy, xảy ra khi giữa các biến độc lập Xi
trong mô hình hồi quy đa biến có tương quan tuyến tính với nhau.

b)

Nguyên nhân:

Có 3 nguyên nhân gây ra vấn đề đa cộng tuyến:
● Đa cộng tuyến hoàn hảo xảy ra khi đặt mô hình sai, trên thực tế hiện tượng đa cộng
tuyến hoàn hảo ít khi xảy ra.
● Đa cộng tuyến không hoàn hảo xảy ra do bản chất hiện tượng kinh tế xã hội mà các
biến độc lập đã có sẵn mối quan hệ cộng tuyến với nhau.
● Đa cộng tuyến không hoàn hảo xảy ra do số liệu điều tra không đủ lớn, hay số liệu
điều tra không ngẫu nhiên.
Các dạng mô hình dễ xảy ra đa cộng tuyến:

- Hồi quy dạng các biến độc lập được bình phương sẽ xảy ra đa cộng tuyến, đặc biệt khi phạm
vi giá trị ban đầu của biến độc lập là nhỏ.

- Các biến độc lập vĩ mô được quan sát theo chuỗi thời gian.

c)

Cách phát hiện đa công tuyến:

➢ Cách 1: Dùng lệnh corr [indep] để kiểm định đa cộng tuyến. Nếu giữa 2 biến có giá trị corr
> 0.8 thì mô hình có khả năng xảy ra đa cộng tuyến.
Sử dụng phần mềm stata và lệnh corr, ta thu được kết quả như sau:
.

corr nparr86 avgsen ptime86 inc86 black

(obs=2725)
|

nparr86

avgsen

ptime86

inc86

black

-------------+--------------------------------------------nparr86 |

1.0000


avgsen |

-0.0098

1.0000

ptime86 |

-0.0087

0.2353

1.0000

inc86 |

-0.1405

-0.0958

-0.1600

1.0000

20


Báo cáo Kinh tế lượng
black |


Nhóm 18/ Lớp KTE309.25_LT
0.1011

0.1194

0.0737

-0.1470

1.0000

Từ bảng số liệu trên, ta thấy giá trị corr của các biến rất nhỏ so với 0.8 nên mô hình không
tồn tại đa cộng tuyến.

➢ Cách 2: Dùng lệnh vif. Nếu Mean VIF > 10 thì mô hình có hiện tượng đa cộng tuyến.
Sử dụng phần mềm stata và lệnh vif, ta thu được kết quả như sau:
. vif
Variable |

VIF

1/VIF

-------------+---------------------ptime86 |

1.08

0.923993

avgsen |


1.07

0.931522

inc86 |

1.07

0.937112

black |

1.04

0.959274

nparr86 |

1.03

0.971723

-------------+---------------------Mean VIF |

1.06

Từ bảng kết quả trên, ta thấy Mean VIF < 10 => Mô hình không tồn tại vấn đề đa cộng tuyến.
Kết luận: Từ các cách kiểm định khác nhau trên, ta thấy không tồn tại vấn đề đa cộng tuyến trong
mô hình.


2. Vấn đề về phương sai sai số thay đổi:a
a)

Bản chất:

U
X
Phương sai của mỗi một ngẫu nhiên i, trong điều kiện giá trị đã cho của biến giải thích i là
không đổi, nghĩa là:

= = ; i = 1,2,3…n
Khi giảthiết đó bị vi phạm thì mô hình mắclỗi phương sai sai sốthayđổi

b)



Nguyên nhân:
Do bản chất của các hiện tượng kinh tế: Nếu các hiện tượng kinh tế theo không gian được điều tra
trên những đối tượng có quy mô khác nhau hoặc các hiện tượng kinh tế theo thời gian được điều tra
qua các giai đoạn có mức biến động khác nhau thì phương sai sai số có thể không đồng đều.

21


Báo cáo Kinh tế lượng







Nhóm 18/ Lớp KTE309.25_LT

Do định dạng không đúng dạng hàm của mô hình. Có thể do bỏ sót biến thích hợp hoặc giải tích của
hàm là sai.
Do số liệu không phản ánh đúng bản chất của hiện tượng kinh tế, chẳng hạn xuất hiện các quan sát
ngoại lai. Quan sát ngoại lai là các quan sát khác biệt rất nhiều ( quá nhỏ hoặc quá lớn) với các quan
sát khác trong mẫu. Việc đưa vào hay loại bỏ các quan sát này ảnh hưởng rất lớn đến phân tích hồi
quy.
Do kỹ thuật thu thập, bảo quản và xử lý số liệu được cải tiến nên sai số có xu hướng giảm.
Do con người học được hành vi trong quá khứ. Chẳng hạn, lỗi của người đánh máy càng ít nếu thời
gian thực hành càng tăng…

c)

Cách phát hiện dấu hiệu của phương sai sai số thay đồi:

➢ Cách 1: Xem xét đồ thị của phần dư:
Y
Trong cách này ta sẽ sử dụng đồ thị của sai số của hồi qui e (phần dư) với giá trị dự đoán i
Y
(biểu diễn sự tương quan giữa e và i).

Từ cơ sở dữ liệu đã cho và phần mềm stata, sử dụng lệnh rvfplot, yline (0) ta xây dựng
được Đồ thị sau:

Dựa vào lí thuyết kinh tế lượng đã được học và đồ thị vừa xây dựng được, ta thấy các giá trị
trên đồ thị phân bố không đồng đều, các giá trị tuy có xoay xung quanh giá trị trung bình bằng 0

(đường ngang màu đỏ), tuy nhiên tỉ lệ rời xa giá trị trung bình bằng 0 còn khá lớn. Vì thế, ta có thể
dự đoán được mô hình có hiện tượng phương sai sai số thay đổi.

22


Báo cáo Kinh tế lượng
Nhóm 18/ Lớp KTE309.25_LT

Cách 2: Dùng kiểm định White:
Cặp giả thuyết:
Nếu giá trị Prob > chi2 và <0.05, chúng ta bác bỏ giả thiết H 0 và chấp nhận giả thiết H1, có
nghĩa là mô hình có hiện tượng phương sai sai số thay đổi.
Sử dụng phần mềm stata, ta thu được bảng kết quả như sau:
. imtest, white
White's test for Ho: homoskedasticity
against Ha: unrestricted heteroskedasticity
chi2(19)

=

84.28

Prob > chi2

=

0.0000

Cameron & Trivedi's decomposition of IM-test


--------------------------------------------------Source |

chi2

df

p

---------------------+----------------------------Heteroskedasticity |

84.28

19

0.0000

Skewness |

38.28

5

0.0000

Kurtosis |

7.30

1


0.0069

---------------------+----------------------------Total |

129.86

25

0.0000

---------------------------------------------------

Từ bảng trên, kết quả kiểm định bằng lệnh imtest, white cho thấy Prob > chi2 = 0.0000 < 0.05
=> Bác bỏ giả thiết H0, H1 đúng hay mô hình có phương sai sai số thay đổi (với mức ý nghĩa 5%).



Cách 3: Dùng kiểm định Breusch – Pagan:

Cặp giả thuyết:
Sử dụng phần mềm stata và lệnh hettest, ta thu được kết quả như sau:
hettest
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
Ho: Constant variance
Variables: fitted values of narr86
chi2(1)

=


315.85

23


Báo cáo Kinh tế lượng

Nhóm 18/ Lớp KTE309.25_LT

Prob > chi2

=

0.0000

Từ kết quả thu được, ta thấy Prob > chi2 = 0.0000 < 0.05 => Bác bỏ giả thiết H0, H1 đúng
hay mô hình có phương sai sai số thay đổi (với mức ý nghĩa 5%).
Kết luận: Vì kết quả của các kiểm định trên thống nhất nên có thể kết luận được rằng có xảy ra
hiện tượng phương sai sai số thay đổi trong mô hình.

d)

Cách khắc phục hiện tượng phương sai sai số thay đổi

Để khắc phục hiện tượng phương sai sai số thay đổi, chúng ta dùng lệnh robust, thu được kết
quả:
. reg narr86 nparr86 avgsen ptime86 inc86 black, robust

Linear regression


Number of obs =
F(

5,

2719) =

2725
148.18

Prob > F

=

0.0000

R-squared

=

0.4541

Root MSE

=

.63531

-----------------------------------------------------------------------------|
narr86 |


Robust
Coef.

Std. Err.

t

P>|t|

[95% Conf. Interval]

-------------+---------------------------------------------------------------nparr86 |

1.138975

.0478223

23.82

0.000

1.045203

1.232747

avgsen |

.0074017


.0045754

1.62

0.106

-.00157

.0163733

ptime86 |

-.02286

.0040695

-5.62

0.000

-.0308396

-.0148804

inc86 |

-.0012251

.0001533


-7.99

0.000

-.0015257

-.0009244

black |

.1654735

.0445903

3.71

0.000

.0780391

.2529078

_cons |

.3063096

.0187887

16.30


0.000

.2694681

.3431511

------------------------------------------------------------------------------

Với cách này, mô hình đã khắc phục được hiện tượng phương sai sai số thay đổi trong mô
hình.

24


Báo cáo Kinh tế lượng

Nhóm 18/ Lớp KTE309.25_LT

B. BẢNG SỐ LIỆU SỐ 58
Như chúng ta đã biết, tỉ lệ trẻ sơ sinh thiếu cân là một chỉ số sức khỏe quan trọng của một
quốc gia, một địa phương .Trẻ sơ sinh thiếu cân là trẻ sinh ra có cân nặng dưới 2.500g, bao gồm trẻ
đẻ non có cân nặng nhẹ so với tuổi thai ; thai đủ tháng có cân nặng nhẹ hoặc thai già tháng cân nặng
nhẹ so với tuổi thai. Trẻ sơ sinh thiếu cân có nguy cơ mắc các bệnh nhiều hơn trẻ sơ sinh đủ cân
như các bệnh phổi mãn tính, các bệnh nhiễm khuẩn và các bệnh thông thường khác; ngoài ra sau đẻ
phải nằm viện lâu hơn và thường xuyên mắc bệnh phải nhâp viện liên tục nhất là trong năm năm
đầu sau sinh . Nhiều trẻ trong số này phải chết sớm và số còn lại phải chịu đựng bệnh tật, kém phát
triển vể thể chất và tâm thần hoặc chịu những vấn đề sức khỏe khác đến cả khi trưởng thành.
Vậy, có những yếu tố nào ảnh hưởng đến tỉ lệ trẻ sơ sinh thiếu cân ? Và chúng ảnh hưởng với
mức độ ra sao? Để tìm hiểu rõ hơn về chủ đề trên, nhóm chúng em đã tiến hành làm báo cáo thống
kê thông qua bảng dữ liệu số 58 để nghiên cứu, nhằm giúp chúng em và các bạn có một cái nhìn

tổng quan hơn về vấn đề trẻ sơ sinh thiếu cân.

25


×