Tải bản đầy đủ (.docx) (50 trang)

BÁO cáo THỰC HÀNH (môn KINH tế LƯỢNG)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (527.85 KB, 50 trang )

BAO CAO KINH TÊ LƯƠNG


Bang sô liêu
̣ số 15-39

L ơ i m ơ đ âu
Trong cuộc sống hiện đại ngày nay, ngành kinh tế là một trong những ngành học có y
nghĩa quyết định đến sự phát triển của xã hội nói chung và sự tăng trưởng của các quốc gia
nói riêng. Nhắc đến ngành học kinh tế, không thể không nhắc đến môn học Kinh tế lượng. Có
thể nói, kinh tế lượng chính là môn học không thể bỏ qua nhất trong tất cả các môn học của
chương trình đào tạo nhân lực phục vụ cho ngành kinh tế. Đặc thù của môn học này chính là
sự đòi hỏi phải phân tích định lượng các hiện tượng kinh tế, kiểm định sự phù hợp và độ tin
cậy của các giả thuyết trong quá trình hoạch định chính sách vĩ mô cũng như ra các quyết
định tác nghiệp, việc dự báo và dự đoán có độ tin cậy cao… Tất cả những đặc thù quan trọng
đó đã làm cho kinh tế lượng ngày càng phát triển, ngày càng gần gũi hơn với các bạn sinh
viên ngành kinh tế chính bởi yếu tố cần thiết và thực tế của nó. Nghiên cứu môn học này, các
bạn sinh viên sẽ có những cái nhìn toàn diện, thu thập được những kiến thức cơ bản và cụ thể
về việc phân tích những số liệu về các nhân tố ảnh hưởng đến vấn đề nào đó, từ đó vạch ra
những định hướng đúng đắn, xác thực hơn, để hoặc là tiếp tục phát triển vấn đề, hoặc là có
những phương pháp cần thiết để giải quyết vấn đề theo hướng phù hợp với thực tiễn và tính
chất của nó.
Sau một thời gian được học tập những kiến thức cơ bản về môn Kinh tế lượng dưới sự
chỉ dẫn tận tình của cô giáo Đinh Thị Thanh Bình, nhóm chúng em đã phần nào tiếp nhận
được lượng kiến thức mà môn học muốn truyền tải, từ đó áp dụng vào để thực hiện phân tích
và hoàn thành bản báo cáo cuối kỳ gồm hai bảng số liệu 15 và 39 này. Chúng em đã rất cố
gắng và dành nhiều công sức cho bản báo cáo này, tuy nhiên, do kiến thức của bản thân vẫn
còn non nớt và chưa thực sự có nhiều kinh nghiệm, nên chắc chắn chúng em vẫn còn gặp
nhiều sai sót trong quá trình phân tích. Chúng em rất mong nhận được y kiến đóng góp của cô
và các bạn.
Chúng em xin chân thành cảm ơn!



2|Page

Báo cáo kinh tế lượng


Bang sô liêu
̣ số 15-39

Muc luc

Trang

A. Bảng số liệu số 15

3|Page

Báo cáo kinh tế lượng


Bang sơ liêu
̣ sớ 15-39

A. BANG SƠ LIÊU SƠ 15
(CÁC YẾU TỐ ẢNH HƯỞNG ĐẾN TỔNG SỐ LƯỢNG VỤ ÁN XẢY RA
TRONG KÝ TÚC XÁ)
Tên bảng số liệu: Campus.
Sau khi nhóm chúng em bàn bạc và suy luận chủ quan về sự ảnh hưởng của các biến,
chúng em đã đi đến kết luận về nội dung của bảng số liệu này, đó là nghiên cứu về: sự ảnh
hưởng của các nhân tố đến tổng số lượng vụ án xảy ra ở ky túc xá.

Cuộc sống ngày cảng phát triển, và đi cùng với sự phát triển chung của nhân loại, thì
dường như càng ngày con người càng sống cách xa nhau hơn, những vụ án xảy ra ngày cảng
nhiều hơn trên thế giới. Không chỉ ngày càng tăng thêm nhanh về số lượng, mà những hành vi
gây tội còn được diễn ra với phạm vi đa dạng và khó xác định vị trí hơn. Thậm chí, một trong
những địa điểm mà tội phạm dùng đề gây án lại chính là những khu ky túc xá của các trường
học. Như chúng ta đã biết, trường học cần phải là nơi có sự an toàn tuyệt đối với môi trường
vô hại hoàn toàn, thì mới có thể bảo vệ cho thế hệ tương lai một cách tốt nhất và đào tạo ra
lớp trí thức phục vụ cho sự phát triển của đất nước. Vậy nên, việc nghiên cứu về các nhân tố
ảnh hưởng đển tổng số lượng vụ án xảy ra ở ky túc xá là một điều hết sức quan trọng, để từ đó
tìm ra biện pháp khắc phục, giải quyết vấn đề theo hướng tích cực, và góp phần vạch ra
phương pháp làm giảm tổng số vụ án xảy ra ở ky túc xá.
Xét trong phạm vi một trường học, có rất nhiều yếu tố đề một vụ án có thể xảy ra.
Những yếu tố đó có thể là tổng số sinh viên trong ky túc xá, việc ky túc xá là của trường công
hay trường tư và tổng số cảnh sát được thuê để điều tra vụ án ky túc xá… Để tìm hiểu rõ hơn
về vấn đề này, chúng ta cần phải nhìn dưới góc nhìn của Kinh tế lượng, phân tích và kiểm
định các giả thuyết nhất định. Chúng em xin phân tích bảng số liệu số 15, để chúng em nói
riêng và các bạn sinh viên nói chung có cách hiểu tổng quan hơn về vấn đề này.

4|Page

Báo cáo kinh tế lượng


Bang sô liêu
̣ số 15-39

I.

Mô tả thống kê số liệu:


1. Tổng quan:
Sau quá trình phân tích chủ quan về số liệu, đọc và hiểu y nghĩa các biến được cho
trong bảng số liệu số 15, chúng em đã quyết định chạy mơ hình hời quy gờm các biến như
sau:







Biến phụ thuộc: crime
Biến độc lập (bao gồm có 5 biến):

X1: enroll
X2: priv
X3: police
X4: lenroll
X5: lpolice

I.1.

Sử dụng lệnh des để mô tả chung cho các biến:

Dưới đây là kết quả thu được của nhóm khi tiến hành mô tả thống kê biến phụ thuộc
và các biến độc lập bằng lệnh des với cấu trúc câu lệnh là:
“des crime enroll priv police lenroll lpolice”

 Sau khi chạy câu lệnh trong Stata chúng ta thu được kết quả sau:
. des crime enroll priv police lenroll lpolice


variable name

storage

display

value

type

format

label

variable label

----------------------------------------------------------------------------------------------------------------------------------crime

int

%9.0g

total campus crimes

enroll

float

%9.0g


total enrollment

priv

byte

%9.0g

=1 if private college

police

byte

%9.0g

employed officers

lenroll

float

%9.0g

log(enroll)

lpolice

float


%9.0g

log(police)

.

Dựa vào kết quả thu được ta có bảng tổng hợp như sau:
Tên biến

Định dạng hiển thị

Đơn vị tính

Ý nghĩa biến

5|Page

Báo cáo kinh tế lượng


Bang sô liêu
̣ số 15-39
Crime

%9.0g

Vụ án

Tổng số vụ án xảy ra trong ky túc xá

của trường, tính theo đơn vị số vụ án

Enroll

%9.0g

Sinh viên

Tổng số sinh viên trong ky túc xá theo
ghi chép của Nhà trường

Priv

%9.0g

= 0 nếu trường đó không phải là
trường Tư.

-

= 1 nếu trường đó là trường Tư.
Police

%9.0g

Cảnh sát

Tổng số cảnh sát được thuê để điều tra
vụ án ky túc xá của trường.


Lenroll

%9.0g

-

Logarit tự nhiên của giá trị tổng số
sinh viên ở trong ky túc xá của trường.

Lpolice

%9.0g

-

Logarit tự nhiên của giá trị tổng số
cảnh sát được thuê để điều tra vụ án
ky túc xá của trường.

I.2.

Sử dụng lệnh sum để tiếp tục mô tả các biến:

Tiếp tục sử dụng lện sum để mô tả số liệu. Lệnh sum cho biết số lượng quan sát
(Obs). Giá trị trung bình (Mean), độ lệch chuẩn (Std. dev) cũng như giá trị lớn nhất (Max)
và giá trị nhỏ nhất( Min ) của các biến.
Cấu trúc câu lệnh như sau:
“sum enroll priv police crime lcrime lenroll lpolice”
Sau khi chạy câu lệnh này trong Stata ta thu được kết quả:
sum crime enroll priv police lenroll lpolice


Variable |

Obs

Mean

Std. Dev.

Min

Max

-------------+-------------------------------------------------------crime |

97

394.4536

460.7839

1

2052

enroll |

97

16076.35


12298.99

1799

56350

priv |

97

.1237113

.3309624

0

1

police |

97

20.49485

15.63058

1

74


lenroll |

97

9.378556

.8317719

7.494986

10.93934

-------------+-------------------------------------------------------lpolice |

97

2.730898

.8056453

0

4.304065

.
Sau khi đọc hiểu bảng trên ta có kết quả số liệu trong bảng sau:

6|Page


Báo cáo kinh tế lượng


Bang sô liêu
̣ số 15-39

Độ lệch chuẩn
460.7839
12298.99
0.3309624
15.63058
0.8317719
0.8056453

2. Mô tả chi tiết các biến trong mô hình:
Để mô tả chi tiết từng biến một trong mô hình ta sửa dụng lệnh tab
2.1. Crime:

• Cấu trúc lệnh: “tab crime”
 Ta có kết quả sau khi chạy lệnh trên vào Stata như sau:
. tab crime
total |
campus |
crimes |

Freq.

Percent

Cum.


------------+----------------------------------1 |

2

2.06

2.06

15 |

1

1.03

3.09

17 |

1

1.03

4.12

25 |

1

1.03


5.15

38 |

1

1.03

6.19

42 |

1

1.03

7.22

43 |

2

2.06

9.28

44 |

1


1.03

10.31

47 |

1

1.03

11.34

50 |

1

1.03

12.37

53 |

1

1.03

13.40

7|Page


Báo cáo kinh tế lượng


Bang sô liêu
̣ số 15-39
54 |

1

1.03

14.43

55 |

1

1.03

15.46

56 |

1

1.03

16.49


58 |

1

1.03

17.53

62 |

1

1.03

18.56

64 |

1

1.03

19.59

65 |

1

1.03


20.62

67 |

1

1.03

21.65

72 |

1

1.03

22.68

82 |

1

1.03

23.71

83 |

1


1.03

24.74

85 |

1

1.03

25.77

89 |

1

1.03

26.80

90 |

2

2.06

28.87

103 |


1

1.03

29.90

106 |

1

1.03

30.93

--more—

Số lượng vụ án xảy ra tại KTX giao động từ 0 đến 414 trong đó phổ biến nhất là 170
vụ với mức tỉ lệ 3.09%. Tần số của các vụ án không hoặc ít lặp lại.

2.2.

Enroll:

Cấu trúc lệnh: “tab enroll”

 Ta thu được kết qủa sau đây:
tab enroll

total |
enrollment |


Freq.

Percent

Cum.

------------+----------------------------------1799 |

1

1.03

1.03

1859 |

1

1.03

2.06

2123 |

1

1.03

3.09


2167 |

1

1.03

4.12

2446 |

1

1.03

5.15

2746 |

1

1.03

6.19

3176 |

1

1.03


7.22

3256 |

1

1.03

8.25

8|Page

Báo cáo kinh tế lượng


Bang sô liêu
̣ số 15-39
3290 |

1

1.03

9.28

3712 |

1


1.03

10.31

3850 |

1

1.03

11.34

4100 |

1

1.03

12.37

4481 |

1

1.03

13.40

4720 |


1

1.03

14.43

5034 |

1

1.03

15.46

5112 |

1

1.03

16.49

5141 |

1

1.03

17.53


5363 |

1

1.03

18.56

5488 |

1

1.03

19.59

5601 |

1

1.03

20.62

5803 |

1

1.03


21.65

5861 |

1

1.03

22.68

6209 |

1

1.03

23.71

6271 |

1

1.03

24.74

6485 |

1


1.03

25.77

6555 |

1

1.03

26.80

6921 |

1

1.03

27.84

7116 |

1

1.03

28.87

--more--


Số lượng sinh viên trong ky túc xa trải đều từ 1799 sinh viên đến 56350 không có mức
tỷ lệ nào cao hơn mà đồng đều ở mức 1.03%.

2.3.

Priv:

Cấu trúc lệnh: “tab priv”

 Ta thu được kết quả sau:
tab priv

=1 if |
private |
college |

Freq.

Percent

Cum.

------------+----------------------------------0 |

85

87.63

87.63


1 |

12

12.37

100.00

------------+-----------------------------------

9|Page

Báo cáo kinh tế lượng


Bang sô liêu
̣ số 15-39
Total |

97

100.00

Có tổng số 12 ky túc xá được quan sát là ky túc xá trường tư chiếm 12.37%.
Có tổng số 85 ky túc xá được quan sát là ky túc xá không phải của trường tư, chiếm
87.63%.

2.4.

Police:


Cấu trúc lệnh: “tab police”

 Ta thu được kết quả như sau:
tab police
employed |
officers |

Freq.

Percent

Cum.

------------+----------------------------------1 |

1

1.03

1.03

2 |

1

1.03

2.06


3 |

1

1.03

3.09

4 |

1

1.03

4.12

5 |

5

5.15

9.28

6 |

3

3.09


12.37

7 |

6

6.19

18.56

8 |

5

5.15

23.71

9 |

6

6.19

29.90

10 |

3


3.09

32.99

11 |

3

3.09

36.08

12 |

5

5.15

41.24

13 |

1

1.03

42.27

14 |


5

5.15

47.42

15 |

2

2.06

49.48

16 |

3

3.09

52.58

17 |

2

2.06

54.64


18 |

1

1.03

55.67

19 |

3

3.09

58.76

20 |

2

2.06

60.82

21 |

3

3.09


63.92

22 |

1

1.03

64.95

24 |

3

3.09

68.04

25 |

3

3.09

71.13

10 | P a g e

Báo cáo kinh tế lượng



Bang sô liêu
̣ số 15-39
26 |

3

3.09

74.23

27 |

3

3.09

77.32

28 |

1

1.03

78.35

30 |

1


1.03

79.38

--more--

Số lượng cảnh sát được thuê để điều tra vụ án dao động từ 1 đến 74 với mức phổ biến
nhất là 7 và 9 sĩ quan với mức tỉ lệ là 6.19%.

2.5.

Lenroll:

Cấu trúc lệnh: “tab lenroll”

 Ta thu được kết quả như sau:
. tab lenroll

log(enroll) |

Freq.

Percent

Cum.

------------+----------------------------------7.494986 |

1


1.03

1.03

7.527794 |

1

1.03

2.06

7.660585 |

1

1.03

3.09

7.681099 |

1

1.03

4.12

7.802209 |


1

1.03

5.15

7.917901 |

1

1.03

6.19

8.063377 |

1

1.03

7.22

8.088255 |

1

1.03

8.25


8.098643 |

1

1.03

9.28

8.219326 |

1

1.03

10.31

8.255829 |

1

1.03

11.34

8.318742 |

1

1.03


12.37

8.407601 |

1

1.03

13.40

8.459564 |

1

1.03

14.43

8.523971 |

1

1.03

15.46

8.539346 |

1


1.03

16.49

8.545003 |

1

1.03

17.53

8.587278 |

1

1.03

18.56

8.610319 |

1

1.03

19.59

8.6307 |


1

1.03

20.62

8.66613 |

1

1.03

21.65

11 | P a g e

Báo cáo kinh tế lượng


Bang sô liêu
̣ số 15-39
8.676076 |

1

1.03

22.68


8.733755 |

1

1.03

23.71

8.743691 |

1

1.03

24.74

8.777247 |

1

1.03

25.77

8.787983 |

1

1.03


26.80

8.842316 |

1

1.03

27.84

8.870101 |

1

1.03

28.87

8.950274 |

1

1.03

29.90

--more—

Giá trị logarit tự nhiên của biến enroll giao động từ 7.494986 đến 10.93934 trong đó
mỗi mức giá trị đều chiếm 1.03%


2.6.

Lpolice:

Cấu trúc lệnh: “tab lpolice”

 Ta thu được kết quả như sau:
tab lpolice

log(police) |

Freq.

Percent

Cum.

------------+----------------------------------0 |

1

1.03

1.03

.6931472 |

1


1.03

2.06

1.098612 |

1

1.03

3.09

1.386294 |

1

1.03

4.12

1.609438 |

5

5.15

9.28

1.791759 |


3

3.09

12.37

1.94591 |

6

6.19

18.56

2.079442 |

5

5.15

23.71

2.197225 |

6

6.19

29.90


2.302585 |

3

3.09

32.99

2.397895 |

3

3.09

36.08

2.484907 |

5

5.15

41.24

2.564949 |

1

1.03


42.27

2.639057 |

5

5.15

47.42

2.70805 |

2

2.06

49.48

2.772589 |

3

3.09

52.58

2.833213 |

2


2.06

54.64

12 | P a g e

Báo cáo kinh tế lượng


Bang sô liêu
̣ số 15-39
2.890372 |

1

1.03

55.67

2.944439 |

3

3.09

58.76

2.995732 |

2


2.06

60.82

3.044523 |

3

3.09

63.92

3.091043 |

1

1.03

64.95

3.178054 |

3

3.09

68.04

3.218876 |


3

3.09

71.13

3.258096 |

3

3.09

74.23

3.295837 |

3

3.09

77.32

3.332205 |

1

1.03

78.35


3.401197 |

1

1.03

79.38

3.433987 |

1

1.03

80.41

--more—

Giá trị logarit tự nhiên dao động từ 0 đến 4.304065 trong đó giá trị 1.94591 và giá trị
2.197225 xuất hiện thường xuyên nhất với mức 6.19%.

II.

Mơ hình hời quy và phân tích hời quy

 Hàm hồi quy tổng thể (PRF) và hàm hồi quy mẫu (SRF):
Chọn biến phụ thuộc Y là crime, các biến độc lập X1, X2, X3, X4, X5, lần lượt là enroll.
priv, police, lenroll, lpolice.
Như vậy ta có hàm hồi qui tổng thể PRF biểu diễn mối quan hệ phụ thuộc giữa Y và

các biến X như sau:
Crime = β0 + β1 * enroll + β2 * priv + β3 * police + β4* lenroll + β5* lpolice + ui

 Hàm hồi quy mẫu SRF là:
= + * enroll + * priv + * police + * lenroll + * lpolice

1. Phân tích mối quan hệ tương quan giữa các biến:
Trước khi phân tích bất kỳ một bảng số liệu kinh tế lượng nào, chúng ta đều cần phải
phân tích mối quan hệ tương quan giữa các biến, để xác định hệ số tương quan giữa chúng, và
quan trọng hơn, là để xem xét xem các biến trong mô hình có xảy ra hiện tượng đa cộng tuyến
hay không (Nếu R2 >= 0.8 thì xảy ra hiện tượng đa cộng tuyến).
Ta sử dụng lệnh Corr trong Stata với cấu trúc lệnh như sau:
“corr crime enroll priv police lenroll lpolice”
Được kết quả là bảng số liệu tương quan như sau:
corr crime enroll priv police lenroll lpolice

13 | P a g e

Báo cáo kinh tế lượng


Bang sô liêu
̣ số 15-39
(obs=97)

|

crime

enroll


priv

police

lenroll

lpolice

-------------+-----------------------------------------------------crime |

1.0000

enroll |

0.8360

1.0000

priv |

-0.2226

-0.3038

1.0000

police |

0.7233


0.7151

-0.2838

1.0000

lenroll |

0.7195

0.9099

-0.3588

0.6485

1.0000

lpolice |

0.6537

0.6940

-0.3568

0.9005

0.6924


1.0000

.
Từ bảng trên ta có thể thấy được hệ số tương quan của các biến như sau:

-

Hệ số tương quan giữa crime và enroll là: 0.8360
Hệ số tương quan giữa crime và priv là: - 0.2226
Hệ số tương quan giữa crime và police là: 0.7233
Hệ số tương quan giữa crime và lenroll là: 0.7195
Hệ số tương quan giữa crime và lpolice là: 0.6537
Sau khi rút ra được các hệ số tương quan như trên, nhìn vào ta có thể nhận xét, trong
tất cả các nhân tố được nghiên cứu, thì biến enroll có mối tương quan mạnh nhất đến biến
crime (hệ số tương quan của biến này cao nhất, là 0.8360), hay nói cách khác, tổng số vụ sinh
viên trong ky túc xá của trường có mối ảnh hưởng mạnh nhất đến tổng số lượng vụ án xảy ra
trong ky túc xá của Nhà trường. Hệ số tương quan của biến enroll này mang dấu dương, cũng
chứng tỏ được mối quan hệ cùng chiều giữa biến enroll với biến crime, thể hiện nếu như tổng
số sinh viên trong ky túc xác của trường tăng, thì cũng sẽ dẫn tới tổng số lượng vụ án xảy ra
trong ky túc xá của trường cũng tăng theo. Ngược lại, biến priv có mối tương quan ít nhất đến
biến crime (hệ số tương quan của biến này nhỏ nhất là - 0.2226), hay nói cách khác, yếu tố
“trường Dân lập” có ảnh hưởng ít nhất đến tổng số vụ án xảy ra trong ky túc xá nhà trường.
Hệ số tương quan giữa biến priv và biến crime mang dấu âm chứng tỏ chúng có quan hệ
ngược chiều (nghịch) với nhau. Nếu trường được nghiên cứu là trường Dân lập thì tổng số vụ
án xảy ra trong ky túc xá Nhà trường sẽ thấp hơn so với trường không phải là trường Dân lập.
Dấu của hệ số tương quan cũng tương tự với các nhân tố khác, nếu mang dấu âm là
ngược chiều, còn mang dấu dương là thuận chiều. Các biến có quan hệ thuận chiều ở đây là:
enroll, police, lcrime, lpolice. Biến có quan hệ ngược chiều ở bảng số liệu này chỉ gồm 1
biến: priv


14 | P a g e

Báo cáo kinh tế lượng


Bang sô liêu
̣ số 15-39
Ngoài ra, sau khi đọc các số liệu của bảng hệ số tương quan chúng ta cũng nhận thấy
rằng, mối quan hệ tương quan giữa các biến độc lập hầu hết không vượt quá giá trị 0.8. Tuy
nhiên, có hai biến độc lập có hệ số tương quan rất cao, đó là lpolice và police (hệ số tương
quan của hai biến này là 0.9005>0.8) và lenroll với enroll (hệ số tương quan của hai biến này
là 0.9099>0.8). Do vậy ta dự đoán mô hình có xảy ra hiện tượng đa cộng tuyến.

2. Chạy mô hình hồi quy và phân tích kết quả:

• Bước đầu tiên ta sử dụng lệnh reg để chạy mô hình hồi quy với cấu trúc câu lệnh là: “reg
crime enroll priv police lenroll lpolice”, thu được kết quả là bảng:
reg crime enroll priv police lenroll lpolice

Source |

SS

df

MS

Number of obs =


-------------+------------------------------

F(

5,

97

91) =

52.60

Model |

15143382

5

3028676.39

Prob > F

=

0.0000

Residual |

5239508.09


91

57577.012

R-squared

=

0.7429

Adj R-squared =

0.7288

Root MSE

239.95

-------------+-----------------------------Total |

20382890

96

212321.771

=

-----------------------------------------------------------------------------crime |


Coef.

Std. Err.

t

P>|t|

[95% Conf. Interval]

-------------+---------------------------------------------------------------enroll |

.0315662

.0053609

5.89

0.000

.0209175

.042215

priv |

38.41752

80.93085


0.47

0.636

-122.3417

199.1767

police |

9.733369

3.946817

2.47

0.016

1.893502

17.57324

lenroll |

-106.5999

76.66161

-1.39


0.168

-258.8788

45.67894

lpolice |

-48.7223

76.75522

-0.63

0.527

-201.1871

103.7425

_cons |

815.5561

619.467

1.32

0.191


-414.9391

2046.051

Sau khi chạy Stata được toàn bộ dữ liệu như trình bày ở trên, chúng ta tiến hành đọc
và phân tích số liệu. Trước hết, chúng ta thành lập được một bảng số liệu như sau:

Tên biến

Hệ số hồi quy

Hệ số t

P-value

Khoảng tin cậy

Hệ số tự do

815.5561

1.32

0.191

[-414.9391; 2046.051]

Enroll

0.0315662


5.89

0.000

[0.0209175; 0.042215]

15 | P a g e

Báo cáo kinh tế lượng


Bang sơ liêu
̣ sớ 15-39
Priv

38.41752

0.47

0.636

[-122.3417; 199.1767]

Police

9.733369

2.47


0.016

[1.893502; 17.57324]

Lenroll

-106.5999

-1.39

0.168

[-258.8788; 45.67894]

Lpolice

-48.7223

-0.63

0.527

[-201.1871; 103.7425]

• Phương trình hồi quy mẫu của mô hình là:
Crime = 815.5561+ 0.0315662 * enroll + 9.733369 * police - 106.5999 * lenroll 48.7223 * lpolice + ui.

• Phân tích kết quả hồi quy:
-


Số quan sát Obs = 97.
Tổng bình phương sai số tổng cộng SST = 20382890.
Tổng bình phương sai số được giải thích SSE = 15143382.
Tổng bình phương các phần dư SSR = 5239508.09.
Bậc tự do của phần được giải thích Dfm= 5.
Bậc tự do của phần dư Dfr = 91.
Hệ số xác định R2(R-squared) = 0.7429 thể hiện mức độ phù hợp của hàm hồi quy
mẫu là tương đối lớn. Bên cạnh đó, giá trị 0.7429 còn thể hiện tỷ lệ phần trăm biến động tổng
số vụ án xảy ra trong ky túc xá nhà trường được giải thích bởi các biến độc lập gồm: “Tổng số
sinh viên trong ky túc xá Nhà trường”, “có phải Trường tư hay không”, “tổng số cảnh sát
được thuê để điều tra vụ án”, “logarit tự nhiên giá trị của tổng số sinh viên trong trường”,
“logarit tự nhiên giá trị của tổng số cảnh sát được thuê” là 74,29%.
Hệ số xác định điều chỉnh = 0.7288. Hệ số này có y nghĩa: trong trường hợp nếu ta
đưa thêm biến vào mô hình, hệ số xác định điều chỉnh mà tăng thì việc đưa biến ấy có y
nghĩa, và ngược lại.
Ý nghĩa các hệ số hồi quy trong mơ hình:

 = 815.5561 có y nghĩa là: khi giá trị của các biến độc lập bằng 0 trong điều kiện các yếu tố
khác không đổi thì tổng số vụ án xảy ra trong ky túc xá là 815.5561.

 = 0.0315662 có y nghĩa là: trong điều kiện các yếu tố khác không đổi, nếu tăng thêm một
sinh viên trong ky túc xá thì tổng số vụ án trung bình xảy ra trong ky túc xá tăng thêm
0.0315662 vụ.

 = 38.41752 có y nghĩa là: trong điều kiện các yếu tố khác không đổi, nếu trường được nghiên
cứu là trường tư thì tổng số vụ án trung bình xảy ra trong ky túc xá tăng thêm 38.41752 vụ.

16 | P a g e

Báo cáo kinh tế lượng



Bang sô liêu
̣ số 15-39
 = 9.733369 có y nghĩa là: trong điều kiện các yếu tố khác không đổi, nếu tăng thêm một cảnh
sát được thuê để điều tra vụ án thì tổng số vụ án trung bình xảy ra trong ky túc xá tăng thêm là
9.733369 (điều này có thể hiểu là: khi tăng lượng cảnh sát điều tra, thì có nhiều vụ án được
phá hơn, dẫn đến tìm ra nhiều vụ án xảy ra hơn (vì vụ án chỉ được tính khi được điều tra của
Cảnh sát) nên biến độc lập cảnh sát tỷ lệ thuận với biến phụ thuộc là phù hợp với thực tế).

 = -106.5999 có y nghĩa là: trong điều kiện các yếu tố khác không đổi, nếu lượng sinh viên
trong ky túc xá tăng thêm 1% thì tổng số vụ án trung bình xảy ra trong ky túc xá giảm đi là
1.065999 vụ.

 = -48.7223 có y nghĩa là: trong điều kiện các yếu tố khác không đổi, nếu lượng cảnh sát được
thuê để điều tra các vụ án trong ky túc xá tăng thêm 1% thì tổng số vụ án trung bình xảy ra
trong ky túc xá giảm đi là 0.487223 vụ.

- Tuy nhiên, ta chỉ biết chắc chắn biến độc lập có thực sự ảnh hưởng đến biến phụ thuộc với y
nghĩa hệ số hồi quy như ta đã phân tích ở trên hay không sau khi kiểm định hệ số hồi quy cho
mô hình.

3. Một số kiểm định F:

3.1. Kiểm định giả thuyết về hệ số hồi quy:
- Mục đích: kiểm định ảnh hưởng của từng biến đợc lập lên giá trị trung bình của biến phụ
thuộc crime.
Có cặp giả thuyết thống kê:
với i =
Nếu giá trị P-value nhỏ hơn mức y nghĩa thì bác bỏ Ho, chấp nhận H1, tức là biến độc

lập đó có y nghĩa thống kê đối với crime.
- Theo bảng chạy hồi qui ở mục 2, ta thấy:

o Biến enroll: P-value = 0.000 < 0.05, loại bỏ H0 vậy nên biến enroll có y nghĩa thống kê đối
với crime.

o Biến priv: P-value = 0.636 > 0.05, chấp nhận H 0 vậy nên biến priv không có y nghĩa thống kê
đối với crime.

o Biến police: P-value = 0.016 < 0.05, bác bỏ H0 vậy nên biến police có y nghĩa thống kê đối
với crime.

o Biến lenroll: P-value = 0.168 > 0.05, chấp nhận H 0 vậy nên biến lenroll không có y nghĩa
thống kê đối với crime.

o Biến lpolice: P-value = 0.527 > 0.05, chấp nhận H 0 vậy nên biến lpolice không có y nghĩa
thống kê đối với biến crime.
→ Các biến priv, lenroll, lpolice không thực sự ảnh hưởng đến crime.

17 | P a g e

Báo cáo kinh tế lượng


Bang sô liêu
̣ số 15-39
3.2. Kiểm định sự phù hợp của mơ hình:
- Mục đích: xem xét trường hợp các tham số của biến độc lập đồng thời bằng 0 có thể
xảy ra hay không.
Có cặp giả thuyết thống kê:

Nếu giá trị Prob > F nhỏ hơn với mức y nghĩa thì bác bỏ H o, chấp nhận H1 tức là hàm
hồi quy mẫu phù hợp.
Cấu trúc câu lệnh như sau: “test enroll priv police lenroll lpolice”
Ta thu được kết quả sau sau khi chạy lệnh trong Stata:
test enroll priv police lenroll lpolice

( 1)

enroll = 0

( 2)

priv = 0

( 3)

police = 0

( 4)

lenroll = 0

( 5)

lpolice = 0

F(

5,


91) =

Prob > F =

52.60
0.0000

Như vậy, Prob > F = 0.0000 nhỏ hơn = 0.05, vì thế bác bỏ Ho.
→ Hệ số hồi qui của các biến độc lập không đồng thời bằng 0, mô hình hồi quy phù
hợp.

3.3. Kiểm định đa ràng ḅc tún tính:
• Giả sử 2 ́u tớ là enroll và priv đều cùng không ảnh hưởng tới crime:
Cặp giả thuyết cần kiểm định:
Sử dụng lệnh test trong stata để kiểm định, cấu trúc lệnh: “test enroll priv”:
Ta thu được kết quả sau:
test enroll priv

( 1)

enroll = 0

( 2)

priv = 0

F(

2,


91) =

Prob > F =

17.68
0.0000

18 | P a g e

Báo cáo kinh tế lượng


Bang sô liêu
̣ số 15-39
Vì giá trị P-value = 0.0000 < 0.05 nên bác bỏ H0, chấp nhận H1
Kết luận: Có ít nhất 1 trong 2 yếu tố enroll và priv ảnh hưởng đến biến phụ tḥc
crime.

• Giả sử 3 yếu tố là enroll, priv và police đều cùng không ảnh hưởng tới crime:
Cặp giả thuyết cần kiểm định:
Sử dụng lệnh test trong Stata để kiểm định, cấu trúc câu lệnh như sau:
“test enroll priv police”
Ta thu được kết quả sau:
test enroll priv police

( 1)

enroll = 0

( 2)


priv = 0

( 3)

police = 0

F(

3,

91) =

21.10

Prob > F =

0.0000

Vì giá trị P-value = 0.0000 < 0.05 nên bác bỏ H0, chấp nhận H1
Kết luận: Có ít nhất 1 trong 3 yếu tố enroll, priv và police ảnh hưởng đến biến phụ
tḥc crime.

• Giả sử 3 yếu tố là police, lenroll và lpolice đều cùng không ảnh hưởng tới biến crime:
Cặp giả thuyết cần kiểm định:
Sử dụng lệnh test trong stata để kiểm định với cấu trúc lệnh như sau:
“test police lenroll lpolice”
Ta thu được kết quả như sau:
test police lenroll lpolice


( 1)

police = 0

( 2)

lenroll = 0

( 3)

lpolice = 0

F(

3,

91) =

Prob > F =

5.06
0.0027

19 | P a g e

Báo cáo kinh tế lượng


Bang sô liêu
̣ số 15-39

Vì giá trị P-value = 0.0027 < 0.05 nên bác bỏ H0, chấp nhận H1
Kết luận: Có ít nhất 1 trong 3 yếu tố police, lenroll và lpolice ảnh hưởng đến biến phụ
thuộc crime.

III.

Kiếm định và sửa chữa một số khuyết tật của mô hình
1

Vấn đề đa cộng tuyến:

1.1. Bản chất:
Mô hình tốt là mô hình phải đạt được các tính chất BLUE (tuyến tính, không chệch,
hiệu quả nhất). Tuy nhiên trên thực tế do xây dựng sai mô hình hoặc do bản chất của dữ liệu,
dẫn tới mô hình không đạt được đầy đủ các tính chất trên. Một trong những vấn đề ảnh hưởng
đến mô hình mà ta gọi là vi phạm các giả định, đó là đa cộng tuyến.
Đa cộng tuyến là một lỗi của mô hình phân tích hồi quy, xảy ra khi giữa các biến độc
lập Xi trong mô hình hồi quy đa biến có tương quan tuyến tính với nhau.

1.2.

Nguyên nhân:

Có 3 nguyên nhân gây ra vấn đề đa cộng tuyến:

o Đa cộng tuyến hoàn hảo xảy ra khi đặt mô hình sai, trên thực tế hiện tượng đa cộng tuyến
hoàn hảo ít khi xảy ra.

o Đa cộng tuyến không hoàn hảo xảy ra do bản chất hiện tượng kinh tế xã hội mà các biến độc
lập đã có sẵn mối quan hệ cộng tuyến với nhau


o Đa cộng tuyến không hoàn hảo xảy ra do số liệu điều tra không đủ lớn, hay số liệu điều tra
không ngẫu nhiên.

1.3.

Cách phát hiện đa công tuyến:
Dùng lệnh corr [indep] để kiểm định đa cộng tuyến. Nếu giữa 2 biến có giá trị

corr > 0.8 thì mô hình có khả năng xảy ra đa cộng tuyến.
Sử dụng phần mềm stata và lệnh corr, ta thu được kết quả như sau:
. corr crime enroll priv police lenroll lpolice
(obs=97)
|

crime

enroll

priv

police

lenroll

lpolice

-------------+-----------------------------------------------------crime |

1.0000


enroll |

0.8360

1.0000

priv |

-0.2226

-0.3038

1.0000

police |

0.7233

0.7151

-0.2838

1.0000

lenroll |

0.7195

0.9099


-0.3588

0.6485

1.0000

20 | P a g e

Báo cáo kinh tế lượng


Bang sô liêu
̣ số 15-39
lpolice |

0.6537

0.6940

-0.3568

0.9005

0.6924

1.0000

Từ bảng số liệu trên, ta thấy:


• corr (enroll, lenroll) = 0.9099 > 0.8
• corr (police, lpolice)= 0.9005 > 0.8
→ Do đó có xảy ra vấn đề đa cợng tún.

1.4.

Cách khắc phục:

• Bỏ mợt số biến cợng tún ra khỏi mơ hình: lenroll và lpolice ta có kết quả
lệnh corr như sau:
. corr crime enroll priv police
(obs=97)
|

crime

enroll

priv

police

-------------+-----------------------------------crime |

1.0000

enroll |

0.8360


1.0000

priv |

-0.2226

-0.3038

1.0000

police |

0.7233

0.7151

-0.2838

1.0000

Phương pháp này tuy khắc phục được sự đa cộng tuyến nhưng lại vô tình làm mất đi
các biến có y nghĩa trong nghiên cứu . Việc loại bỏ biến ra khỏi mô hình phải được cân nhắc
cẩn thận giữa sai lệch khi bỏ biến cộng tuyến với việc tăng phương sai của các ước lượng hệ
sớ khi biến đó ở trong mơ hình.

• Tăng kích cỡ mẫu:
Vì đa cộng tuyến là đặc trưng của mẫu nên có thể có mẫu khác liên quan đến cùng các
biến trong mẫu ban đầu mà cộng tuyến có thể không nghiêm trọng nữa. Điều này thực hiện
được khi chi phí cho việc lấy mẫu khác có thể chấp nhận được trong thực tế. Đối với nghiên
cứu này, cần phải điều tra thêm những khu ky túc xá khác để làm cho hiện tượng đa cộng

tuyến giảm xuống có thể giảm tính nghiêm trọng của đa cộng tuyến.
2. Vấn đề về phương sai sai số thay đổi:

2.1.

Bản chất:

Một vấn đề khác mà mô hình cũng có thể gặp phải, đó là phương sai của sai số thay
đổi. Hậu quả của phương sai sai số thay đổi là các ước lượng bình phương nhỏ nhất vẫn là
không chệch nhưng không còn hiệu quả nữa, cùng với đó ước lượng của các phương sai sẽ bị
chệch, như vậy làm mất hiệu lực của kiểm định. Điều này làm cho mô hình kém hiệu quả hơn.

21 | P a g e

Báo cáo kinh tế lượng


Bang sô liêu
̣ số 15-39
Phương sai của mỗi một ngẫu nhiên Ui, trong điều kiện giá trị đã cho của biến giải
thích Xi là không đổi, nghĩa là:
= = ; i = 1,2,3…n
Khi giả thiết đó bị vi phạm thì mô hình mắc lỗi phương sai sai số thay đổi. Tên gọi của
lỗi này là Heteroskedasticity.

2.2.

Nguyên nhân:

Có 5 nguyên nhân gây ra hiện tượng phương sai sai số thay đổi:


o Do bản chất của các hiện tượng kinh tế: Nếu các hiện tượng kinh tế theo không gian được
điều tra trên những đối tượng có quy mô khác nhau hoặc các hiện tượng kinh tế theo thời gian
được điều tra qua các giai đoạn có mức biến động khác nhau thì phương sai sai số có thể
không đồng đều.

o Do định dạng không đúng dạng hàm của mô hình.
o Do số liệu không phản ánh đúng bản chất của hiện tượng kinh tế, chẳng hạn xuất hiện các
quan sát ngoại lai.

o Do kỹ thuật thu thập, bảo quản và xử ly số liệu đượccải tiếnnên sai số có xu hướng giảm.
o Học được các sai lầm trong quá khứ, nhờ thế cải tiến trong hiện tại.
2.3.

Cách phát hiện dấu hiệu của phương sai sai số thay đồi:

 Cách 1: Xem xét đồ thị của phần dư:
Trong cách này ta sẽ sử dụng đồ thị của sai số của hồi qui e (phần dư) với giá trị dự
đoán Yi (biểu diễn sự tương quan giữa e và Yi).
Từ cơ sở dữ liệu đã cho và phần mềm stata, sử dụng lệnh rvfplot, yline (0) ta xây dựng
được Đồ thị sau:

22 | P a g e

Báo cáo kinh tế lượng


Bang sô liêu
̣ số 15-39


Dựa vào lí thuyết kinh tế lượng đã được học và đồ thị vừa xây dựng được, ta thấy các
giá trị trên đồ thị phân bố không đồng đều, các giá trị tuy có xoay xung quanh giá trị trung
bình bằng 0 (đường ngang màu đỏ), tuy nhiên tỉ lệ rời xa giá trị trung bình bằng 0 còn khá
lớn. Vì thế, ta có thể dự đoán được mô hình có hiện tượng phương sai sai số thay đổi.

 Cách 2: Dùng kiểm định White:
Cặp giả thuyết:
Nếu giá trị Prob > chi2 và <0.05, chúng ta bác bỏ giả thiết H0 và chấp nhận giả thiết
H1, có nghĩa là mô hình có hiện tượng phương sai sai số thay đổi.
Sử dụng phần mềm stata, ta thu được bảng kết quả như sau:
. imtest, white
White's test for Ho: homoskedasticity
against Ha: unrestricted heteroskedasticity
chi2(19)

=

33.19

Prob > chi2

=

0.0229

Cameron & Trivedi's decomposition of IM-test
--------------------------------------------------Source |

chi2


df

p

---------------------+----------------------------Heteroskedasticity |

33.19

19

0.0229

Skewness |

3.63

5

0.6037

23 | P a g e

Báo cáo kinh tế lượng


Bang sô liêu
̣ số 15-39
Kurtosis |

1.95


1

0.1631

---------------------+----------------------------Total |

38.76

25

0.0389

---------------------------------------------------

Từ bảng trên, kết quả kiểm định bằng lệnh imtest, white cho thấy Prob > chi2 =
0.0229< 0.05 => Bác bỏ giả thiết H0, H1 đúng hay mô hình có phương sai sai số thay đổi (với
mức y nghĩa 5%).

 Cách 3: Dùng kiểm định Breusch – Pagan:
Cặp giả thuyết:
Sử dụng phần mềm stata và lệnh hettest, ta thu được kết quả như sau:
. hettest
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
Ho: Constant variance
Variables: fitted values of crime
chi2(1)

=


72.08

Prob > chi2

=

0.0000

Từ kết quả thu được, ta thấy Prob > chi2 = 0.0000 < 0.05 => Bác bỏ giả thiết H 0 hay
mô hình có phương sai sai số thay đổi (với mức y nghĩa 5%)
KẾT LUẬN: Với kết quả của các kiểm định trên ta có thể kết luận được rằng có xảy ra
hiện tượng phương sai sai số thay đổi.
3. Kiểm định vấn đề về phân phối chuẩn của sai số:
Bước 1: Dự đoán

-

Tạo biến phần dư của mô hình, sử dụng lệnh : predict r, resid ( với r là biến thể
hiện giá trị của phần dư residual)

- Sử dụng lệnh : kdensity r, normal

24 | P a g e

Báo cáo kinh tế lượng


Bang sô liêu
̣ số 15-39


0

.001

Density
.002

.003

Kernel density estimate

-1000

-500

0
Residuals

500

1000

Kernel density estimate
Normal density
kernel = epanechnikov, bandwidth = 41.5518

 Có thể mô hình phân phới chuẩn.
Bước 2: Kiểm định

• Sử dụng lệnh “sktest r” để kiểm định, ta có bảng kết quả sau:

sktest r

Skewness/Kurtosis tests for Normality

------- joint ------

Variable |

Obs

Pr(Skewness)

Pr(Kurtosis)

adj chi2(2)

Prob>chi2

-------------+---------------------------------------------------------------

r |

97

0.0000

0.0000

29.67


0.0000

P value = 0, bác bỏ H0, u không phân phối chuẩn, không có cách sửa chữa ngoài việc
tăng mẫu hoặc thay bằng mẫu có giá trị lớn hơn. Stata không thể sửa chữa, mẫu càng nhiều,
khả năng phân phối chuẩn càng lớn.

25 | P a g e

Báo cáo kinh tế lượng


×