Tải bản đầy đủ (.docx) (25 trang)

TIỂU LUẬN (KINH tế LƯỢNG) phân tích sự ảnh hưởng của một số yếu tố đến tổng số vụ phạm tội

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (376.64 KB, 25 trang )

TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG
KHOA KINH TẾ QUỐC TẾ
=====000=====

BÁO CÁO
KINH TẾ LƯỢNG
NHÓM THỰC HIỆN NGHIÊN CỨU BỘ SỐ LIỆU 13_CRIME2
Giảng viên hướng dẫn:
Nhóm sinh viên thực hiện:

HÀ NỘI
MỤC LỤC
1


2


Kinh tế lượng (Econometrics) là môn khoa học xã hội trong đó các công cụ của ly
thuyết kinh tế, toán học và suy đoán thống kê được áp dụng để phân tích các vấn đề kinh
tế. Kinh tế lượng sử dụng các công cụ phương pháp của thống kê toán để tìm ra bản chất
của các số liệu thống kê, đưa ra kết luận về các số liệu thống kê thu thập được từ đó có thể
đưa ra các dự báo về các hiện tượng kinh tế.
Từ khi ra đời đến nay, kinh tế lượng đã đem lại cho các nhà kinh tế một công cụ đo
lường sắc bén để đo các quan hệ kinh tế. Là những sinh viên đang theo học khối ngành
kinh tế, chúng em nhận thấy được sự cần thiết của việc học tập và tìm hiểu về Kinh tế
lượng trong việc phân tích logic và nghiên cứu vấn đề. Để hiểu sâu hơn về việc đưa Kinh
tế lượng vào trong thực tế cuộc sống và áp dụng Kinh tế lượng sao cho đúng và hiệu quả,
nhóm em xin xây dựng bài BÁO CÁO THỰC HÀNH KINH TẾ LƯỢNG dưới sự
hướng dẫn của TS. Đinh Thị Thanh Bình. Trong bài báo cáo, nhóm đã em sử dụng công
cụ phân tích kinh tế lượng là phần mềm stata để phân tích, nghiên cứu dựa trên số liệu của


file dữ liệu: 13_CRIME2.DTA: "Phân tích sự ảnh hưởng của một số yếu tố đến tổng
số vụ phạm tội.”
Chúng em xin chân thành cảm ơn giảng viên hướng dẫn – TS. Đinh Thị Thanh
Bình đã giúp đỡ chúng em thực hiện bài báo cáo này. Trong quá trình làm bài báo cáo, dù
đã rất cố gắng nhưng chắc chắn chúng em không thể tránh khỏi những sai sót, kính mong
được cơ góp y để nhóm chúng em có thể hồn thiện hơn bản báo cáo này.

3


NỘI DUNG
I.

MƠ TẢ SỐ LIỆU

1. Mơ tả tổng quan
Trong bới cảnh xã hội ngày càng phát triển với tốc độ đô thị hóa cao cũng như việc
đất nước mạnh dạn mở cửa để tiếp thu với các nền văn hóa khác nhau thì tình trạng vi
phạm pháp luật ngày càng trở thành một vấn đề đáng lo ngại. Có rất nhiều yếu tố tác động
đến tổng số vụ phạm tội. Sau khi xem xét y nghĩa của từng biến trong file số liệu
13_CRIME2.DTA, nhóm em đã quyết định chọn mô hình hồi quy gồm các biến sau:
 Biến phụ thuộc: Y: crimes
 Biến độc lập: gồm 5 biến:

 X1: south
 X2: area
 X3: popden
 X4: lawexpc
 X5: polpc


Mô tả dữ liệu bẳng lệnh des, ta thu được kết quả như sau:
. des crimes south area popden lawexpc polpc
storage
variable name
type

display
format

crimes
south
area
popden
lawexpc
polpc

%9.0g
%9.0g
%9.0g
%9.0g
%9.0g
%9.0g

float
byte
float
float
float
float


Ta có bảng sau:
Tên biến
Đơn vị tính
crimes
Vụ án
south

-

area
popden
lawexpc

dặm vng
người/dặm vng
$

value
label

variable label
total number index crimes
=1 if city in south
land area, square miles
people per sq mile
law enforce. expend. pc, $
police per 1000 people

Ý nghĩa biến
Tổng số vụ phạm tội

= 1 nếu người phạm tội sống ở phía nam
= 0 nếu người phạm tội sống ở những vùng khác
Diện tích vùng đất khảo sát
Mật độ dân số trên 1 dặm vuông
Chi phí thực thi pháp luật bình quân đầu người
4


polpc

Cảnh sát

Số lượng cảnh sát trên 1000 người dân

Tiếp tục sử dụng lệnh sum để mô tả dữ liệu. Lệnh sum cho biết số lượng quan sát
(Obs), giá trị trung bình (mean), độ lệch chuẩn (std. dev.) cũng như giá trị lớn nhất (max)
và nhỏ nhất (min) của các biến.
. sum crimes south area popden lawexpc polpc
Variable

Obs

Mean

crimes
south
area
popden
lawexpc


92
92
92
92
92

39663.53
.326087
122.7304
4984.489
958.643

polpc

92

2.251738

Std. Dev.

Min

Max

29692.1
.4713482
125.5295
3172.98
313.88


4124
0
13
703.7964
377.54

164452
1
604
16550.28
2262.44

.6315045

1.283939

4.619234

Dựa theo kết quả trên, ta có bảng tổng hợp sau:
Tên biến

Số quan
sát

Giá trị
trung bình

Độ lệch
chuẩn


Giá trị nhỏ
nhất

Giá trị lớn
nhất

crimes

92

39663.53

29692.1

4124

164452

south

92

0.326087

0.4713482

0

1


area

92

122.7304

125.5295

13

604

popden

92

4984.489

3172.98

703.7964

16550.28

lawexpc

92

958.643


313.88

377.54

2262.44

polp

92

2.251738

0.6315045

1.283939

4.619234

Có thể nhận thấy biến tổng số vụ phạm tội có sự chênh lệch khá lớn giữa mức cao
nhất và mức thấp nhất, lên tới xấp xỉ 40 lần, cao hơn hẳn so với các biến cịn lại.
2. Mơ tả chi tiết các biến trong mơ hình
Để mơ tả chi tiết các biến đã chọn, ta dùng lệnh tab.
5


Sử dụng lệnh tab cho phép miêu tả các biến với các thông tin tần suất (Freq.), phần
trăm (Percent), phần trăm tích lũy cộng phần trăm từ trên xuống (Cum.)
a) Crimes (tổng số tội phạm)
. tab crimes
total

number
index
crimes

Freq.

Percent

Cum.

4124
5276
5596
5708
6533
7207
8511
11648
13122
13188
14537
15233
15698
15931
16806
16953
17136
17306
18703
18915

19082
19438

1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

1.09
1.09
1.09
1.09

1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09

1.09
2.17
3.26
4.35
5.43
6.52
7.61
8.70
9.78
10.87
11.96

13.04
14.13
15.22
16.30
17.39
18.48
19.57
20.65
21.74
22.83
23.91

more

Tổng số vụ phạm tội dao động từ 4124 vụ án đến 164452 vụ án. Tất cả các giá trị
số vụ phạm tội đều chiếm tỉ trọng như nhau là 1.09%.
− Có 23.91% trong tổng số 92 số quan sát mà tổng số vụ phạm tội ≤ 19438 vụ án.


6


b) Vùng miền (south)

. tab south
=1 if city
in south

Freq.


Percent

Cum.

0
1

62
30

67.39
32.61

67.39
100.00

Total

92

100.00

Biến giả south nhận giá trị = 1 nếu người phạm tội sống ở phía nam, xuất hiện 30
lần chiếm 32.61%
− Biến giả south nhận giá trị = 0 nếu người phạm tội không sống ở phía nam, xuất
hiện 62 lần chiếm 67.39%
− Nhìn chung, số lượng người phạm tội sống ở phía nam chiếm tỉ lệ thấp hơn so với
số lượng người phạm tội sống ở những vùng khác trong mối quan hệ với tổng sớ
vụ phạm tợi.



c) Diện tích đất (area)

7


. tab area
land area,
square
miles

Freq.

Percent

Cum.

13
17.8
18.9
20.8
21.9
24.1
24.2
25.3
27.4
34.2
34.3
41.8
44.6

46.4
49.8
52.9
53
54.4
55.1
55.3
55.4
55.9
61.1
74
78
79
95.8
97.3
100.5
104.2
106.8
113.9
131.2
135.6
169.2
186.8
199.4
255.9
258.5
264.1
316.4
329
331.4

352
375
604

2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2

2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2

2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17

2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17

2.17
2.17
2.17
2.17
2.17
2.17
2.17

2.17
4.35
6.52
8.70
10.87
13.04
15.22
17.39
19.57
21.74
23.91
26.09
28.26
30.43
32.61
34.78
36.96
39.13
41.30
43.48
45.65
47.83

50.00
52.17
54.35
56.52
58.70
60.87
63.04
65.22
67.39
69.57
71.74
73.91
76.09
78.26
80.43
82.61
84.78
86.96
89.13
91.30
93.48
95.65
97.83
100.00

Total

92

100.00


8


Diện tích vùng đất khảo sát dao động từ 13 dặm vuông đến 604 dặm vuông. Mỗi
giá trị đều xuất hiện 2 lần với tỉ lệ như nhau là 2.17%.
− Có 63.04% trong tổng số 92 số quan sát mà diện tích đất ≤ 100.5 dặm vuông.


d) Mật độ dân số trên 1 dặm vuông (popden)
.

tab popden
people per
sq mile
703.7964
730.8079
1050.75
1314.366
1329.261
1359.923
1404.494
1426.666
1590.438
1596.368
1672.36
1727.662
2170.811
2220.036
2385.081

2488.472
2497.993
2498.724
2570.054
2700.385
2725.987
2743.34
2755.948
2793.656
more

Freq.

Percent

Cum.

1
1
1
1
1
1
1
1
1
1
1
1
1

1
1
1
1
1
1
1
1
1
1
1

1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09

1.09
1.09
1.09
1.09
1.09
1.09

1.09
2.17
3.26
4.35
5.43
6.52
7.61
8.70
9.78
10.87
11.96
13.04
14.13
15.22
16.30
17.39
18.48
19.57
20.65
21.74
22.83
23.91
25.00

26.09

Mật độ dân số trên 1 dặm vuông dao động và trải đều từ 703.7964 đến 16550.28
người/dặm vuông. Mỗi giá trị chỉ xuất hiện 1 lần với tỉ lệ như nhau là 1.09%.
− Có 26.09% trong tổng số 92 số quan sát mà mật độ dân số ≤ 2793.656 người/dặm
vuông.


9


e) Chi phí thực thi pháp luật bình qn đầu người (lawexpc)
. tab lawexpc
law
enforce.
expend. pc,
$
377.54
554.7
556.8
570
570.63
582.56
586.72
608.44
635.7
641.55
655.1799
660.15
660.3

661.5
668.1
671.56
672.75
702.96
710.52
714
726.45
731.64
more

Freq.

Percent

Cum.

1
1
1
1
1
1
1
1
1
1
1
1
1

1
1
1
1
1
1
1
1
1

1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09

1.09
1.09

1.09
2.17
3.26
4.35
5.43
6.52
7.61
8.70
9.78
10.87
11.96
13.04
14.13
15.22
16.30
17.39
18.48
19.57
20.65
21.74
22.83
23.91

Chi phí thực thi pháp luật bình quân đầu người dao động và trải đều từ 377.54$
đến 2262.44$. Mỗi giá trị chỉ xuất hiện một lần với tỉ lệ như nhau là 1.09%.
− Có 23.91% trong tổng số 92 số quan sát mà chi phí thực thi pháp luật bình quân
đầu người ≤ 731.64$.



10


f) Số lượng cảnh sát trên 1000 người (popden)
. tab polpc
police per
1000 people
1.283939
1.300569
1.350198
1.351552
1.366975
1.388133
1.420306
1.434222
1.478796
1.481664
1.487614
1.515053
1.517768
1.568048
1.577169
1.608299
1.632377
1.685959
1.688117
1.697174
1.737621

1.74235
1.747294
1.764359
more

Freq.

Percent

Cum.

1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

1
1
1
1
1

1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09


1.09
2.17
3.26
4.35
5.43
6.52
7.61
8.70
9.78
10.87
11.96
13.04
14.13
15.22
16.30
17.39
18.48
19.57
20.65
21.74
22.83
23.91
25.00
26.09

Số cảnh sát trên 1000 người dân dao động trong khoảng 1.283939% đến
4.619234%. Mỗi giá trị chỉ xuất hiện một lần với tỉ lệ như nhau là 1.09%.
− Có 26.09% trong tổng số 92 số quan sát mà số cảnh sát trên 1000 người dân ≤
1.764359%.



11


II.

PHÂN TÍCH HỒI QUY
1. Phương trình hồi quy tuyến tính

Chọn biến phụ thuộc Y là crimes, các biến độc lập X1, X2, X3, X4, X5, X6 lần lượt là
unem, pcinc, area, popden, lawexpc, polpc.
Ta có:
− Hàm hồi quy tổng thể:

(PRF): crimes = β0 + β1south + β2area + β3popden + β4lawexpc + β5polpc + ui
− Hàm hồi quy mẫu:

(SRF): = + south + area + popden + lawexpc + polpc
Trong đó: ui là yếu tố ngẫu nhiên (nhiễu).
2. Lập bảng tương quan và phân tích mối quan hệ tương quan giữa các biến
2.1. Lập bảng tương quan

Trước khi chạy mô hình hồi quy, chúng ta xem xét mức độ tương quan giữa các biến
bằng cách sử dụng lệnh corr crimes south area popden lawexpc polpc. Ta thu được
bảng tương quan giữa các biến như sau:
. corr crimes south area popden lawexpc polpc
(obs=92)

crimes

south
area
popden
lawexpc
polpc

crimes

south

area

popden

lawexpc

polpc

1.0000
0.0600
0.4801
0.0477
0.2322
0.3304

1.0000
0.2163
-0.2847
-0.2294
-0.0586


1.0000
-0.5490
-0.2358
-0.2109

1.0000
0.3654
0.4798

1.0000
0.3965

1.0000

Kết luận:
Nhìn chung các biến độc lập có tương quan với biến phụ thuộc không cao. Tất cả
các biến độc lập đều có hệ số tương quan dương, cho thấy tác động cùng chiều lên biến
phụ thuộc.
12


Mối quan hệ tương quan giữa các biến độc lập với nhau cũng không cao, hệ số
tương quan cao nhất cũng chỉ là 0.4798 giữa biến popden và polpc. Do không có hệ số
tương quan nào có độ lớn vượt quá 0.8 nên có thể dự đoán mô hình không xảy ra hiện
tượng đa cộng tuyến khi hồi quy.
2.2. Phân tích mối quan hệ tương quan giữa các biến

Từ bảng tương quan trên ta thấy:
-


Hệ số tương quan giữa biến crimes và south là 0.0600

-

Hệ số tương quan giữa biến crimes và area là 0.4801

-

Hệ số tương quan giữa biến crimes và popden là 0.0477

-

Hệ số tương quan giữa biến crimes và lawexpc 0.2322

-

Hệ số tương quan giữa biến crimes và polpc là 0.3304
Như vậy, trong các nhân tố được nghiên cứu, biến area có mối tương quan mạnh

nhất đến crimes, hay diện tích đất có ảnh hưởng khá lớn đến tổng số vụ phạm tội. Hệ số
tương quan giữa 2 biến mang dấu dương thể hiện mối quan hệ cùng chiều giữa 2 biến,
như nếu diện tích đất tăng thì tổng số vụ phạm tội cũng tăng.
Ngược lại, biến popden ít ảnh hưởng nhất đến crimes, hay mối tương quan giữa mật
độ dân số trên 1 dặm vuông và tổng số vụ phạm tội không mạnh như các nhân tố khác. Hệ
số tương quan giữa 2 biến mang dấu dương thể hiện mối quan hệ cùng chiều giữa 2 biến,
nếu mật độ dân số trên 1 dặm vuông tăng thì tổng số vụ phạm tội cũng tăng nhưng tăng
không đáng kể.
Ngồi ra, vì giá trị tụt đới của các chỉ số đều nhỏ hơn 0.8 nên dự đoán rằng mô
hình không xảy ra hiện tượng đa cộng tuyến.


3. Chạy mơ hình hồi quy và phân tích kết quả
3.1. Chạy mơ hình hồi quy

Để chạy mơ hình hồi quy, ta thực hiện lệnh reg như sau:

13


. reg crimes south area popden lawexpc polpc
Source

SS

df

MS

Model
Residual

3.9943e+10
4.0284e+10

5
86

7.9887e+09
468419090


Total

8.0227e+10

91

881620871

crimes

Coef.

south
area
popden
lawexpc
polpc
_cons

2380.125
168.0235
2.192713
19.75433
13507.01
-42015.36

Std. Err.
5128.681
21.76537
.9861742

8.203154
4307.702
10856.3

t
0.46
7.72
2.22
2.41
3.14
-3.87

Number of obs
F( 5,
86)
Prob > F
R-squared
Adj R-squared
Root MSE

P>|t|
0.644
0.000
0.029
0.018
0.002
0.000

=
=

=
=
=
=

92
17.05
0.0000
0.4979
0.4687
21643

[95% Conf. Interval]
-7815.356
124.7554
.232264
3.447003
4943.584
-63596.97

12575.61
211.2916
4.153163
36.06166
22070.44
-20433.75

Từ đó ta có bảng số liệu sau:
Tên biến
Hệ số tự do

south
area
popden
lawexpc
polpc

Hệ số hồi quy
-42015.36
2380.125
168.0235
2.192713
19.75433
13507.01

Thống kê t
-3.87
0.46
7.72
2.22
2.41
3.14

P-value
0.000
0.644
0.000
0.029
0.018
0.002


Khoảng tin cậy
[-63596.97 ; -20433.75]
[-7815.356 ; 12575.61]
[124.7554 ; 211.2916]
[0.232264 ; 4.153163]
[3.447003 ; 36.06166]
[4943.584; 22070.44]

Từ bảng trên ta có phương trình hàm hồi quy mẫu SRF:
= -42015.36 + 2380.125south + 168.0235area + 2.192popden + 19.754lawexpc +
13507.01polpc
3.2. Phân tích kết quả sau khi chạy mơ hình








Sớ quan sát Obs = 92.
Tổng bình phương sai số được giải thích SSE = 3.9943e+10
Tổng bình phương các phần dư SSR = 4.0284e+10
Tổng bình phương sai số tổng cộng SST = 8.0227e+10
Bậc tự do của phần được giải thích Dfm = 5
Bậc tự do của phần dư Dfr =86
Hệ số xác định R2 = 0.4979 có nghĩa là các biến X trong mô hình giải thích được

53.31% sự dao động của biến Y. Hay các biến vùng miền, diện tích đất, mật độ dân số
14



trên 1 dặm vuông, chi phí thực thi pháp luật bình quân đầu người và số cảnh sát trên
1000 người giải thích được 49.79% sự dao động của biến tổng số tội phạm.
− Hệ số xác định điều chỉnh = 0.4687
− Ý nghĩa của các hệ số hồi quy trong mô hình:
 β1 = 2380.125>0 nghĩa là tổng số vụ phạm tội xảy ra ở phía nam cao hơn tổng số

vụ phạm tội xảy ra không ở phía nam là 2380.125 vụ án trong điều kiện các yếu tố
khác không đổi.
 β2 = 168.0235>0 nghĩa là diện tích đất tăng 1 dặm vuông thì tổng số vụ phạm tội
tăng 168.0235 vụ án trong điều kiện các yếu tố khác không đổi.
 3 = 2.192713>0 nghĩa là mật độ dân số tăng 1 người/dặm vuông thì tổng số vụ
phạm tội tăng 2.192713 vụ án trong điều kiện các yếu tố khác không đổi.
 β4 = 19.75433>0 nghĩa là chi phí thực thi pháp luật tăng 1$ thì tổng số vụ phạm tội
tăng 19.75433 vụ án trong điều kiện các yếu tố khác không đổi.
 β5 = 13507.01>0 nghĩa là cứ tăng thêm 1 cảnh sát trên 1000 người dân thì tổng số
vụ phạm tội tăng 13507.01 vụ án trong điều kiện các yếu tố khác không đổi (điều
này có thể hiểu là: khi tăng số lượng cảnh sát điều tra thì chứng tỏ có nhiều vụ án
xảy ra hơn nên biến độc lập số lượng cảnh sát trên 1000 người tỷ lệ thuận với biến
phụ thuộc tổng số vụ phạm tội là phù hợp với thực tế).
 β0 = -42015.36<0 nghĩa là khi giá trị của các biến độc lập bằng 0 thì tổng số vụ
phạm tội là -42015.36vụ án trong điều kiện các yếu tố khác không đổi
4. Kiểm định giả thuyết về hệ số hồi quy

Cặp giả thuyết thống kê:
Sử dụng giá trị tới hạn:
Ta có:
Do mô hình mắc lỗi phương sai sai số thay đổi (sẽ chứng minh ở phần cuối) nên phải
sửa lỗi mô hình bằng lệnh reg, robust trước khi kiểm định giả thuyết thống kê.


15


. reg crimes south area popden lawexpc polpc, robust
Linear regression

Number of obs =
F( 5,
86) =
Prob > F
=
R-squared
=
Root MSE
=

crimes

Coef.

south
area
popden
lawexpc
polpc
_cons

2380.125
168.0235

2.192713
19.75433
13507.01
-42015.36

Robust
Std. Err.
4999.456
37.32388
.814641
8.280635
4638.13
14229.47

t
0.48
4.50
2.69
2.39
2.91
-2.95

P>|t|
0.635
0.000
0.009
0.019
0.005
0.004


92
6.67
0.0000
0.4979
21643

[95% Conf. Interval]
-7558.464
93.82607
.5732607
3.292975
4286.716
-70302.62

12318.71
242.2209
3.812166
36.21569
22727.31
-13728.11

Từ bảng trên ta thấy biến south có p-value = 0.635 > 0.05 cịn các biến đợc lập
khác đều có p-value > 0.05 nên chỉ có biến south không có ảnh hưởng mang y nghĩa
thống kê đến biến crimes.
a) south:

Có: ⇒ chưa có cơ sở để bác bỏ H0 với mức y nghĩa 5%.
 Biến south không có ảnh hưởng mang y nghĩa thống kê đến biến crimes.

Kết luận:

Vùng miền không có ảnh hưởng mang y nghĩa thống kê đến tổng số tội phạm.
b) area:

Có ⇒ Bác bỏ H0, chấp nhận H1 với mức y nghĩa 5%.
 Biến area có ảnh hưởng mang y nghĩa thống kê đến biến crimes.

Kết luận:




Diện tích đất có ảnh hưởng mang y nghĩa thống kê đến tổng số vụ phạm tội.
Diện tích đất càng tăng thì tổng số vụ phạm tội cũng tăng.
Kết quả chạy mô hình hồi quy dựa trên 1 mẫu cụ thể cho thấy diện tích đất tăng 1
dặm vuông thì tổng số vụ phạm tội tăng 168.0235 vụ án với điều kiện các yếu tố
khác không đổi.

16


c) popden:

Có: ⇒ Bác bỏ H0, chấp nhận H1 với mức y nghĩa 5%.
 Biến popden có ảnh hưởng mang y nghĩa thống kê đến biến crimes.

Kết luận:





d)


Mật độ dân số trên 1 dặm vuông có ảnh hưởng mang y nghĩa thống kê đến tổng số
tội phạm.
Mật độ dân số trên 1 dặm vuông tăng thì tổng số tội phạm cũng tăng.
Kết quả chạy mô hình hồi quy dựa trên 1 mẫu cụ thể cho thấy cứ tăng thêm 1
người/dặm vuông thì tổng số vụ phạm tội tăng 2.192713 vụ án với điều kiện các
yếu tố khác không đổi.
lawexpc
Có: ⇒ Bác bỏ H0, chấp nhận H1 với mức y nghĩa 5%.
biến lawexpc có ảnh hưởng mang y nghĩa thống kê đến biến crimes.
Kết luận:





e)


Chi phí thực thi pháp luật bình quân đầu người có ảnh hưởng mang y nghĩa thống
kê đến tổng số vụ phạm tội.
Chi phí thực thi pháp luật bình quân đầu người tăng thì tổng số vụ phạm tội cũng
tăng.
Kết quả chạy mô hình hồi quy dựa trên 1 mẫu cụ thể cho thấy chi phí thực thi pháp
luật bình quân đầu người tăng 1$ thì tổng số vụ phạm tội tăng 19.75433 vụ án với
điều kiện các yếu tố khác không đổi.
polpc
Có: ⇒ Bác bỏ H0, chấp nhận H1 với mức y nghĩa 5%.

Biến polpc có ảnh hưởng mang y nghĩa thống kê đến biến crimes.
Kết luận:

Số cảnh sát trên 1000 người dân có ảnh hưởng mang y nghĩa thống kê đến tổng số
tội phạm.
− Số cảnh sát trên 1000 người dân tăng thì tổng số tội phạm cũng tăng.
− Kết quả chạy mô hình hồi quy dựa trên 1 mẫu cụ thể cho thấy cứ tăng thêm 1 cảnh
sát trên 1000 người dân thì tổng số vụ phạm tội tăng 13507.01 vụ án với điều kiện
các yếu tố khác không đổi.


Vậy trong các biến độc lập, với mức ý nghĩa 5%, chỉ có biến south khơng có ảnh
hưởng mang ý nghĩa thống kê đến biến crimes.

17


5. Một số kiểm định F
5.1. Kiểm định sự phù hợp của mơ hình

Kiểm định này nhằm xem xét trường hợp các tham số của biến độc lập đồng thời
bằng 0 có thể xảy ra hay không.
Cặp giả thuyết thống kê:

hoặc:

Cách 1: Phương pháp giá trị tới hạn

17.05
= =1.987

Ta có: F=17.056 > 1.987 => Bác bỏ H0, chấp nhận H1.
Cách 2: Phương pháp p-value
Nếu giá trị Prob > F nhỏ hơn mức y nghĩa α = 0.05 thì bác bỏ H 0, chấp nhận H1 tức
là mô hình hồi quy phù hợp.
Ta có: Prob > F = 0.0000 < 0.05 => Bác bỏ H0, chấp nhận H1.
Kết luận: Mơ hình phù hợp tại mức ý nghĩa 5%.
Kiểm định đa ràng buộc tuyến tính
Giả sử 3 yếu tớ south, lawexpc và polpc cùng không ảnh hưởng đến crimes.
5.2.

Cặp giả thuyết thống kê:
Ta tiến hành chạy mô hình bị ràng buộc với q= 3 biến độc lập south, lawexpc và polpc bị
loại khỏi mô hình trên, tức là chỉ chạy lênh hồi quy với 2 biến độc lập area và popden.
. reg crimes area popden
Source

SS

df

MS

Model
Residual

2.9615e+10
5.0613e+10

2
89


1.4807e+10
568683453

Total

8.0227e+10

91

881620871

crimes

Coef.

area
popden
_cons

171.406
4.169318
-2155.116

Std. Err.
23.82601
.9426052
7203.629

t

7.19
4.42
-0.30

Number of obs
F( 2,
89)
Prob > F
R-squared
Adj R-squared
Root MSE

P>|t|
0.000
0.000
0.766

=
=
=
=
=
=

92
26.04
0.0000
0.3691
0.3550
23847


[95% Conf. Interval]
124.0642
2.296382
-16468.57

218.7477
6.042255
12158.34

18


Phương trình không bị ràng buộc:
(UR):
Phương trình bị ràng buộc
(R):
Thống kê F dùng để bỏ biến là: F

= = = 7.355

F0 = Fq; n-k-1 = F3; 86 = 2.71
 F = 7.355 > F0 = 2.71 => Bác bỏ H0, chấp nhận H1.
 Không thể bỏ 3 biến south, lawexpc và polpc ra khỏi mô hình.
6. Kiểm tra khuyết tật của mơ hình
6.1. Đa cộng tuyến
a

Bản chất:


Mơ hình tớt là mô hình phải đạt được các tính chất BLUE (tuyến tính, không chệch,
hiệu quả nhất). Tuy nhiên trên thực tế do xây dựng sai mô hình hoặc do bản chất của dữ
liệu, dẫn tới mô hình không đạt được đầy đủ các tính chất trên. Một trong những vấn đề
ảnh hưởng đến mô hình mà ta gọi là vi phạm các giả định, đó là đa cộng tuyến.
Đa cộng tuyến là một lỗi của mô hình phân tích hồi quy, xảy ra khi giữa các biến
độc lập Xi trong mô hình hồi quy đa biến có tương quan tuyến tính với nhau.
Nguyên nhân:
Có 3 nguyên nhân gây ra vấn đề đa cợng tuyến:
Đa cợng tuyến hồn hảo xảy ra khi đặt mô hình sai, trên thực tế hiện tượng đa cợng
tuyến hồn hảo ít khi xảy ra.
Đa cợng tuyến khơng hoàn hảo xảy ra do bản chất hiện tượng kinh tế xã hội mà các
biến độc lập đã có sẵn mối quan hệ cộng tuyến với nhau.
Đa cộng tuyến không hồn hảo xảy ra do sớ liệu điều tra khơng đủ lớn, hay số liệu
điều tra không ngẫu nhiên.
b





Cách phát hiện đa cộng tuyến:
Cách 1: Dùng lệnh corr để kiểm tra đa cộng tuyến.
Nếu các biến độc lập có tương quan mạnh với nhau (r > 0.8) thì có thể xảy ra hiện
tượng đa cộng tuyến.
Sử dụng lệnh corr, ta thu được kết quả như sau:
c

19



. corr crimes south area popden lawexpc polpc
(obs=92)

crimes
south
area
popden
lawexpc
polpc

crimes

south

area

popden

lawexpc

polpc

1.0000
0.0600
0.4801
0.0477
0.2322
0.3304

1.0000

0.2163
-0.2847
-0.2294
-0.0586

1.0000
-0.5490
-0.2358
-0.2109

1.0000
0.3654
0.4798

1.0000
0.3965

1.0000

Từ kết quả trên, ta thấy hệ số tương quan giữa các biến độc lập tương đối thấp và đều
nhỏ hơn 0.8. Do vậy có thể kết ḷn mơ hình khơng xảy ra hiện tượng đa cộng tuyến.
Cách 2: Sử dụng thừa số tăng phương sai VIF (variance inflation factor).
Nếu VIF > 10 thì xảy ra hiện tượng đa cộng tuyến.
Sử dụng lệnh vif trong phần mềm stata, ta thu được kết quả như sau:
. vif
Variable

VIF

1/VIF


popden
area
polpc
lawexpc
south

1.90
1.45
1.44
1.29
1.14

0.525716
0.689556
0.695583
0.776434
0.880842

Mean VIF

1.44

Ta thấy tất cả các giá trị VIF đều <10, do đó có thể đi đến kết ḷn mơ hình khơng
xảy ra hiện tượng đa cộng tuyến.
Kết luận: Từ 2 cách kiểm định trên có thể kết luận rằng: Mơ hình khơng xảy ra
hiện tượng đa cộng tuyến.
6.2. Phương sai sai số thay đổi
a


Bản chất:

Một vấn đề khác mà mô hình cũng có thể gặp phải, đó là phương sai của sai số thay
đổi. Hậu quả của phương sai sai số thay đổi là các ước lượng bình phương nhỏ nhất vẫn là
20


khơng chệch nhưng khơng cịn hiệu quả nữa, cùng với đó ước lượng của các phương sai
sẽ bị chệch, như vậy làm mất hiệu lực của kiểm định. Điều này làm cho mô hình kém hiệu
quả hơn.
Phương sai của mỗi một ngẫu nhiên Ui, trong điều kiện giá trị đã cho của biến giải
thích Xi là không đổi, nghĩa là:
= = ; i = 1,2,3…n
Khi giả thiết đó bị vi phạm thì mô hình mắc lỗi phương sai sai số thay đổi. Tên gọi
của lỗi này là Heteroskedasticity.
b








Nguyên nhân:

Do bản chất của các hiện tượng kinh tế: Nếu các hiện tượng kinh tế theo không gian
được điều tra trên những đối tượng có quy mô khác nhau hoặc các hiện tượng kinh tế
theo thời gian được điều tra qua các giai đoạn có mức biến động khác nhau thì
phương sai sai số có thể không đồng đều.

Do định dạng không đúng dạng hàm của mô hình. Có thể do bỏ sót biến thích hợp
hoặc giải tích của hàm là sai.
Do số liệu không phản ánh đúng bản chất của hiện tượng kinh tế, chẳng hạn xuất hiện
các quan sát ngoại lai. Việc đưa vào hay loại bỏ các quan sát này ảnh hưởng rất lớn
đến phân tích hồi quy.
Do kỹ thuật thu thập, bảo quản và xử ly số liệu được cải tiến nên sai số có xu hướng
giảm.
Do con người học được hành vi trong quá khứ.

c

Cách phát hiện phương sai sai số thay đồi:

Để kiểm định phương sai sai số thay đổi ta có cặp giả thuyết sau:
Nếu giá trị [Prob>chi2] < 0.05 thì bác bỏ giả thiết H0 và chấp nhận giả thiết H1.
Cách 1: Kiểm định white
Ta sử dụng lệnh imtest, white để kiểm định:

21


. imtest, white
White's test for Ho: homoskedasticity
against Ha: unrestricted heteroskedasticity
chi2(19)
Prob > chi2

=
=


54.53
0.0000

Cameron & Trivedi's decomposition of IM-test

Source

chi2

df

p

Heteroskedasticity
Skewness
Kurtosis

54.53
9.54
-4116.08

19
5
1

0.0000
0.0895
1.0000

Total


-4052.01

25

1.0000

Kết quả kiểm định bằng lệnh imtest, white cho thấy Prob>chi2 = 0.0000 < 0.05
Do đó mô hình mắc lỗi phương sai sai số thay đổi.

22


Cách 2: Kiểm định Breusch-Pagan
Thực hiện lệnh hettest ta thu được kết quả sau:
. hettest
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
Ho: Constant variance
Variables: fitted values of crimes
chi2(1)
Prob > chi2

=
=

76.97
0.0000

Kết quả kiểm định bằng lệnh hettest cho thấy Prob>chi2 = 0.0000 < 0.05
Do đó mô hình mắc lỗi phương sai sai số thay đổi.

Kết luận: Từ 2 cách kiểm định trên có thể kết luận rằng mơ hình mắc lỗi phương
sai sai số thay đổi.
7. Sửa lỗi mơ hình

Mơ hình trên đã mắc lỗi phương sai sai số thay đổi, để sửa lỗi mô hình ta sử dụng lệnh
reg, robust như sau:
. reg crimes south area popden lawexpc polpc, robust
Linear regression

Number of obs =
F( 5,
86) =
Prob > F
=
R-squared
=
Root MSE
=

crimes

Coef.

south
area
popden
lawexpc
polpc
_cons


2380.125
168.0235
2.192713
19.75433
13507.01
-42015.36

Robust
Std. Err.
4999.456
37.32388
.814641
8.280635
4638.13
14229.47

t
0.48
4.50
2.69
2.39
2.91
-2.95

P>|t|
0.635
0.000
0.009
0.019
0.005

0.004

92
6.67
0.0000
0.4979
21643

[95% Conf. Interval]
-7558.464
93.82607
.5732607
3.292975
4286.716
-70302.62

12318.71
242.2209
3.812166
36.21569
22727.31
-13728.11

23


Từ việc kiểm định mô hình đã sửa lỗi trên, ta thấy chỉ có biến south không có ảnh
hưởng mang y nghĩa thống kê đến biến crimes trong mô hình. Ta sẽ tiến hành chạy mô
hình mới để kiểm tra như sau:
. reg crimes area popden lawexpc polpc

Source

SS

df

MS

Model
Residual

3.9843e+10
4.0385e+10

4
87

9.9606e+09
464194550

Total

8.0227e+10

91

881620871

crimes


Coef.

area
popden
lawexpc
polpc
_cons

168.6107
2.102858
19.11096
13771.01
-40841.1

Std. Err.
21.63036
.9626099
8.048618
4250.678
10509.6

t
7.80
2.18
2.37
3.24
-3.89

Number of obs
F( 4,

87)
Prob > F
R-squared
Adj R-squared
Root MSE

P>|t|
0.000
0.032
0.020
0.002
0.000

=
=
=
=
=
=

92
21.46
0.0000
0.4966
0.4735
21545

[95% Conf. Interval]
125.618
.1895665

3.11346
5322.329
-61730.07

211.6033
4.016149
35.10846
22219.69
-19952.13

Sau khi chạy hồi quy mô hình mới, mức độ phù hợp của mô hình R 2 = 0.4966, giảm
đi một chút so với trước đó R2 = 0.4977.
Các giá trị p-value đều nhỏ hơn 0.05 nên các biến độc lập trong mô hình đều có y
nghĩa thống kê ở mức y nghĩa 5%.
Như vậy lỗi phương sai sai số thay đổi của mô hình đã được khắc phục.

24


KẾT LUẬN
Bản báo cáo trên được hoàn thành trên cơ sở sự đóng góp của các thành viên với vốn
kiến thức được đúc kết ra từ quá trình học và nghiên cứu môn Kinh tế lượng. Đây cũng là
một cơ hội thực hành khiến chúng em có thể hiểu rõ hơn về các phân tích và kiểm định
đặc trưng có liên quan, áp dụng kiến thức trên giảng đường để tự tìm hiểu và rút ra được
nhưng kết luận bổ ích về những hiện tượng trong những mối tương quan khác nhau và sự
ảnh hưởng lẫn nhau giữa các hiện tượng kinh tế xã hợi. Nhóm chúng em đã hồn thành
xong mô hình kinh tế lượng về các yếu tố ảnh hưởng đến tổng số vụ phạm tội. Mô hình đã
lượng hóa cho các yếu tố để chúng ta có thể có những biện pháp, chiến lược phá án hiệu
quả hơn. Ngồi ra, vẫn cịn nhiều yếu tớ ảnh hưởng đến biến phụ thuộc được nghiên cứu
chưa được đưa vào mô hình như dân số, sự thay đổi trong tỉ lệ phạm tội… cần được xem

xét để có báo cáo với kết quả chính xác hơn.
Qua đây, nhóm 13 chúng em cũng xin chân thành cảm ơn sự hướng dẫn và giảng dạy
nhiệt tình của cô Đinh Thị Thanh Bình. Do vớn kiến thức và kĩ năng cịn hạn chế nên chắc
hẳn bản báo cáo này không thể tránh khỏi sai sót, chúng em rất mong nhận được sự góp y
đợng viên của cơ để chúng em có thể hồn thiện hơn, áp dụng tốt hơn trong các công việc
sau này.

25


×