Tải bản đầy đủ (.docx) (36 trang)

Báo cáo kinh tế lượng phân tích những số liệu thống kê nằm trong bộ số liệu số 26 và bộ số liệu số 81 về tỉ lệ phạm tội cũng như tỉ lệ hút thuốc lá trung bình của con người

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (805.3 KB, 36 trang )

BÁO CÁO KINH TẾ LƯỢNG

TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG
KHOA KINH TẾ VÀ KINH DOANH QUỐC TẾ
-------***-------

BÁO CÁO
KINH TẾ LƯỢNG
NHÓM 2- THỰC HIỆN NGHIÊN CỨU BỘ DỮ LIỆU SỐ
26– 81
GIÁO VIÊN HƯỚNG DẪN: TS. ĐINH THỊ THANH BÌNH
DANH SÁCH THÀNH VIÊN:

Hà Nội, tháng 04 năm 2014
NHÓM SỐ 2

1


BÁO CÁO KINH TẾ LƯỢNG

Mục lục

NHÓM SỐ 2

2


BÁO CÁO KINH TẾ LƯỢNG

Lời mở đầu


Trong bối cảnh xã hội đang ngày càng phát triển, kinh tế lượng đã và đang là một môn
khoa học có nhiều ứng dụng trong thực tế, đặc biệt là các vấn đề liên quan đến kinh tế. Kinh tế
lượng cung cấp những công cụ đắc lực giúp các nhà kinh tế học có thể phân tích các số liệu
thống kê được thu thập. từ đó đưa ra các dự báo về các hiện tượng kinh tế.
Xét trên phạm vi các trường đại học thuộc khối ngành kinh tế, bộ môn kinh tế lượng
đang trở thành một trong số những bộ môn quan trọng cung cấp những kiến thức về lý thuyết
và thực hành giúp cho sinh viên có thể học tập và nghiên cứu những chuyên ngành của mình.
Là những sinh viên khối ngành kinh tế, chúng em ý thức rõ được sự cần thiết trong việc học tập
và nghiên cứu môn kinh tế lượng. Để hiểu rõ hơn, nhóm chúng em xin được xây dựng bài Báo
cáo kinh tế lượng phân tích những số liệu thống kê nằm trong bộ số liệu số 26 và bộ số liệu số
81 về tỉ lệ phạm tội cũng như tỉ lệ hút thuốc lá trung bình của con người nhằm đưa ra những
phân tích và những dự báo của các yếu tố ảnh hưởng đến hai vấn đề kinh tế này.
Nhóm chúng em gồm 5 thành viên:
Mã số sinh
viên

Đóng góp (%)

Mai Thị Tú Anh

1212210017
1211110033

20
20

3

Đàm Thái Anh


1213330002

20

4

Vũ Phương Anh

1211330089

20

5

Đặng Ngọc Ánh

1213320016

20

STT

Họ và tên

1

Trần Nguyễn Tuấn Anh (nhóm trưởng)

2


Chúng em xin chân thành cảm ơn giảng viên hướng dẫn - tiến sĩ Đinh Thị Thanh Bình
đã giúp đỡ chúng em thực hiện bài báo cáo này. Trong quá trình làm bài tiểu luận, dù đã rất cố
gắng nhưng chắc chắn không tránh khỏi những sai sót, kính mong được cô góp ý để nhóm
chúng em có thể hoàn thiện hơn bản báo cáo này.
NHÓM SỐ 2

3


BÁO CÁO KINH TẾ LƯỢNG

A. Bộ số liệu số 26
Mô hình lý thuyết

I.
1.

Vấn đề nghiên cứu và mô hình lý thuyết:
Trong bối cảnh xã hội ngày càng phát triển với tốc độ đô thị hóa cao cũng như việc đất

nước mạnh dạn mở cửa để tiếp thu với các nền văn hóa khác nhau thì tình trạng vi phạm pháp
luật ngày càng trở thành một vấn đề đáng lo ngại. Có rất nhiều yếu tố tác động đến tỉ lệ phạm
tội của mỗi khu vực. Trong bộ số liệu số 26, nhóm đã chọn ra những biến để nghiên cứu dưới đây.
Mô tả dữ liệu trong file CRIME3.DTA từ phần mềm Stata, ta thu được kết quả như sau:
. des crime district clrprc1 clrprc2 clcrime cavgclr
storage
variable name
type

display

format

crime
district
clrprc1
clrprc2
clcrime
cavgclr

%9.0g
%9.0g
%9.0g
%9.0g
%9.0g
%9.0g

float
byte
byte
byte
float
float

value
label

variable label
crimes per 1000 people
district number
clear-up perc, prior year

clear-up perc, two-years prior
change in lcrime
change in avgclr

Các biến sẽ được mô tả chi tiết trong bảng sau:
Tên
biến
Crime
District
clrprc1
clrprc2
clcrime
cavgclr

Dạng dữ liệu
Float
Byte
Byte
Byte
Float
Float

Đơn vị
%
đơn vị
đơn vị
đơn vị
%
%


Ý nghĩa biến
Tỉ lệ phạm tội
Số quận khảo sát
Tỉ lệ phá án thành công một năm trước
Tỉ lệ phá án thành công hai năm trước
Sự thay đổi tỉ lệ phạm tội
Sự thay đổi trong trung bình tỉ lệ phá án
NHÓM SỐ 2

4


BÁO CÁO KINH TẾ LƯỢNG

Bảng 1: Định dạng và ý nghĩa của các biến
Tiếp tục sử dụng lệnh sum để miêu tả dữ liệu. Lệnh sum cho biết số lượng quan sát
(Obs), giá trị trung bình (mean), độ lệch chuẩn (std. dev.) cũng như giá trị lớn nhất (max) và
nhỏ nhất (min) của các biến.
. sum crime district clrprc1 clrprc2 clcrime cavgclr
Variable

Obs

Mean

crime
district
clrprc1
clrprc2
clcrime


106
106
106
106
53

17.51538
27
40.60377
41.36792
.2336373

cavgclr

53

-8.066038

Std. Dev.

Min

Max

11.07309
15.36973
12.81865
12.83917
.3762207


1.65
1
15
17
-.6719313

71.32
53
78
77
1.357084

9.444696

-38.5

10.5

Có thể nhận thấy tỉ lệ phạm tội có sự chênh lệch khá lớn giữa mức cao nhất và mức thấp
nhất, lên tới xấp xỉ 70 lần, cao hơn hẳn so với các biến còn lại.
2.

Mục đích và lý do lựa chọn các biến:

Mục đích của việc lựa chọn mô hình này nhằm tìm hiểu sự tác động của khả năng giải
quyết vụ án trong các năm trước, thời gian, khu vực địa lýđối với tỉ lệ phạm tội.

NHÓM SỐ 2


5


BÁO CÁO KINH TẾ LƯỢNG

3.

Mối quan hệ từng biến độc lập với biến phụ thuộc:

Mối quan hệ giữa
crime và district

Mối quan hệ giữa
crime và clrprc1

NHÓM SỐ 2

6


BÁO CÁO KINH TẾ LƯỢNG

Mối quan hệ giữa
crime và clrprc2

Mối quan hệ giữa
crime và clcrime

NHÓM SỐ 2


7


BÁO CÁO KINH TẾ LƯỢNG

Mối quan hệ giữa
crime và avgclr

Phân tích hồi quy

II.
1.

Thiết lập mô hình tổng quát

a. Mô hình tổng quát

Hàm hồi quy tổng thể biểu diễn mối quan hệ giữa biến phụ thuộc là tỉ lệ phạm tộicrime
với các biến độc lập district, clrprc1, clrprc2, clcrime, và cavgclr có dạng:
b. Giải thích biến

Các biến được giải thích ở Bảng 2 dưới đây:
Loại
biến
Biến phụ
thuộc(Y)
Các biến
độc lập

Tên biến

crime
district

Ý nghĩa

Dấu kì
vọng

Diễn giải

+

Tùy từng khu vực có tỉ lệ phạm tội

Tỉ lệ phạm tội trong
1000 người
Các khu vực được khảo
sát

khác nhau
NHÓM SỐ 2

8


BÁO CÁO KINH TẾ LƯỢNG

Tỉ lệ phá án thành công
clrprc1


clrprc2

trong một năm trước, so

Tỉ lệ phá án thành công một năm
-

với thời điểm khảo sát

năm hiện tại càng cao

Tỉ lệ phá án thành công

Tỉ lệ phá án thành công hai năm

trong hai năm trước, so

-

với thời điểm khảo sát
(Xi)

clcrime

cavgclr

trước càng thấp thì tỉ lệ phạm tội

Sự thay đổi của tỉ lệ
phạm tội


trước càng thấp thì tỉ lệ phạm tội
năm hiện tại càng cao

+

Sự thay đổi của tỉ lệ phạm tội càng
lớn thì tỉ lệ phạm tội càng cao

Sự thay đổi trong trung

Sự thay đổi trong trung bình cộng

bình cộng

phần trăm của các vụ án được giải

phần trăm

của các vụ án được giải
quyết trong 1 năm trước

-

quyết trong 1 năm trước và 2 năm
trước càng thấp thì tỉ lệ phạm tội

và 2 năm truóc
năm hiện tại càng cao
Bảng 2: Giải thích các biến

2.

Lập bảng tương quan

Chạy lệnh corr để biểu diễn mỗi quan hệ tương quan giữa các biến, nhóm thu được kết quả
như sau:

. corr crime district clrprc1 clrprc2 clcrime cavgclr
(obs=53)
crime district
crime
district
clrprc1
clrprc2
clcrime
cavgclr

1.0000
-0.4057
-0.6020
-0.5968
0.1876
0.1016

1.0000
0.4422
0.3586
-0.1100
-0.1092


clrprc1

clrprc2

clcrime

cavgclr

1.0000
0.6443
-0.1971
0.2087

1.0000
-0.3272
0.2098

1.0000
-0.4180

1.0000

NHÓM SỐ 2

9


BÁO CÁO KINH TẾ LƯỢNG

Nhìn chung các biến độc lập có tương quan với biến phụ thuộc không cao, đặc biệt hai

biến clrprc1và clrprc2 có hệ số tương quan khá thấp (-0.6020 và -0.5968).
2 biến clcrime và cavgclr có hệ số tương quan dương, cho thấy tác động cùng chiều lên
biến phụ thuộc
3 biến district, clrprc1 và clrprc2 có hệ số tương quan âm, cho thấy tác động ngược
chiều đối với biến phụ thuộc.
Mối quan hệ tương quan giữa các biến độc lập với nhau cũng không cao, hệ số tương
quan cao nhất cũng chỉ là 0.4422, giữa biến district và clrprc2.
Do không có hệ số tương quan nào có độ lớn vượt quá 0.8 nên có thể dự đoán mô hình
không xảy ra hiện tượng đa cộng tuyến khi hồi quy.

3.

Chạy mô hình hồi quy
Chạy mô hình hồi quy giữa biến phụ thuộc và các biến độc lập, ta thu được kết quả như

sau:
. reg crime district clrprc1 clrprc2 clcrime cavgclr
Source

SS

df

MS

Model
Residual

4125.50252
3819.7885


5
47

825.100503
81.2720957

Total

7945.29101

52

152.794058

crime

Coef.

district
clrprc1
clrprc2
clcrime
cavgclr
_cons

-.0512635
-.4141517
-.3824153
3.73996

.3878464
52.60476

Std. Err.
.0940661
.150318
.1515184
3.824927
.1525202
5.321782

t
-0.54
-2.76
-2.52
0.98
2.54
9.88

Number of obs
F( 5,
47)
Prob > F
R-squared
Adj R-squared
Root MSE

P>|t|
0.588
0.008

0.015
0.333
0.014
0.000

=
=
=
=
=
=

53
10.15
0.0000
0.5192
0.4681
9.0151

[95% Conf. Interval]
-.2405
-.7165526
-.6872309
-3.9548
.0810153
41.89872

.1379731
-.1117509
-.0775997

11.43472
.6946776
63.31081

NHÓM SỐ 2

10


BÁO CÁO KINH TẾ LƯỢNG

4.

Phương trình hồi quy
Từ kết quả chạy hồi quy, nhóm tóm tắt các giá trị thu được ở bảng 3:

Hệ số

Biến

Giá trị
52.60476
-0.0512635
-0.4141517
-0.3824153
3.73996
0.3878464

District
Clrprc1

Clrprc2
Clcrime
Cavgclr

Thống kê t
9.88
-0.54
-2.76
-2.52
0.98
2.54

P – value
0.000
0.588
0.008
0.015
0.333
0.14

Bảng 3: Kết quả hồi quy
Từ bảng trên ta có phương trình hồi quy sau:
=

52.60476



0.0512635*District




0.4141517*Clrprc1



0.3824153*Clrprc2

+

3.73996*Clcrime + 0.3878464*Cavgclr.
5.

Phân tích kết quả hồi quy
- Số quan sát đưa vào phân tích obs = 53.
- Phần tổng bình phương các độ lệch giữa giá trị quan sát Yi với giá trị trung bình của

nó TSS=7945.29101
- Phần tổng bình phương được giải thích bởi mô hình (biến giải thích) ESS=4125.50252.
- Phần tổng bình phương không giải thích được (phần dư) RSS=3819.7885
- Độ lệch bình phương bình quân (phương sai) của các bộ phận trên là
MSm=825.100503và MSr=81.2720957
- Sai số chuẩn của ước lượng RMSE=9.0151, nhỏ hơn độ lệch chuẩn của biến phụ thuộc
là SD = = = 12.360989. Vậy ước lượng của hồi quy là chấp nhận được.
- Mức độ phù hợp của mô hình so với thực tế là = 51.92% cho thấy các biến độc lập đã
giải thích được 51.92% sự thay đổi của biến phụ thuộc.
NHÓM SỐ 2

11



BÁO CÁO KINH TẾ LƯỢNG

- Ý nghĩa các tham số trong mô hình:
* �0= 52.60476 có nghĩa là trong điều kiện các yếu tố khác không đổi và giá trị các biến
độc lập bằng 0 thì tỉ lệ phạm tội sẽ là 52.60476 USD.
* �1 có p-value = 0.588> 0.05 nên không có ý nghĩa thống kê. Do đó, số quận khảo sát
không có tác động lên tỉ lệ phạm tội.
* �2= -0.4141517 có ý nghĩa thống kê, chỉ ra rằng trong điều kiện các yếu tố khác không
đổi, nếu tỷ lệ phá án thành công trong một năm trước tăng thêm 1 đơn vị thì tỉ lệ phạm tội giảm
đi 0.4141%
* �3= -0.3824153 có ý nghĩa thống kê, chỉ ra rằng trong điều kiện các yếu tố khác không
đổi, nếu tỷ lệ phá án thành công trong hai năm trước tăng lên 1 đơn vị thì tỉ lệ phạm tội giảm
0.3824%
* �4 có p-value = 0.333 nên không có ý nghĩa thống kê, do đó sự thay đổi trong logarit
cơ số e của tỷ lệ phạm tội
* �5= 0.3878464 có ý nghĩa thống kê, chỉ ra rằng trong điều kiện các yếu tố khác không
đổi, nếu tỷ lệ trung bình phá án tăng thêm 1 đơn vị thì tỷ lệ phạm tội tăng 0.3878%

III. Kiểm định mô hình
1.

Ý nghĩa của hệ số hồi quy:

Giả thuyết:
Sử dụng giá trị tới hạn:

Ta có:

* �1

⇒ Chấp nhận H0 với mức ý nghĩa 5%
NHÓM SỐ 2

12


BÁO CÁO KINH TẾ LƯỢNG

* �2
⇒ Bác bỏ H0 với mức ý nghĩa 5%
* �3
⇒ Bác bỏ H0 với mức ý nghĩa 5%
* �4
⇒ Chấp nhận H0 với mức ý nghĩa 5%
* �5
⇒ Bác bỏ H0 với mức ý nghĩa 5%
Kết luận: Vậy trong các hệ số góc của hồi quy, với mức ý nghĩa 5%, hệ số�1 và�4
không có ý nghĩa thống kê.
2.

Kiểm định sự phù hợp của mô hình:
Kiểm định này nhằm xem xét trường hợp các tham số của biến độc lập đồng thời bằng

0 có thể xảy ra hay không.
Cặp giả thuyết thống kê như sau:

(Với k là số biến độc lập, n là số quan sát)
Ta thấy
⇒ Bác bỏ giả thiết H0
⇒ Mô hình hồi quy phù hợp ở mức ý nghĩa 5%


3.

Kiểm định khuyết tật của mô hình:

a. Bệnh đa cộng tuyến:

NHÓM SỐ 2

13


BÁO CÁO KINH TẾ LƯỢNG

Mô hình tốt là mô hình phải đạt được các tính chất BLUE (tuyến tính, không chệch,
hiệu quả nhất). Tuy nhiên trên thực tế do xây dựng sai mô hình hoặc do bản chất của dữ liệu,
dẫn tới mô hình không đạt được đầy đủ các tính chất trên. Một trong những vấn đề ảnh hưởng
đến mô hình mà ta gọi là vi phạm các giả định, đó là đa cộng tuyến.
Do vậy, chúng ta sẽ khảo sát mô hình có bị đa cộng tuyến hay không.
Cách 1: Tính hệ số tương quan r giữa các biến giải thích
Nếu các biến giải thích có tương quan cao với nhau (r > 0.8) thì có thể xảy ra đa cộng
tuyến.
Sử dụng lệnh Corr trong stata cho kết quả sau:

Từ kết quả trên, ta thấy hệ số tương quan giữa các biến giải thích tương đối thấp và
nhỏ hơn 0.8. Do vậy có thể kết luận mô hình không mắc bệnh đa cộng tuyến.
Cách 2: Sử dụng thừa số tăng phương sai VIF
Nếu thì có thể xảy ra hiện tượng đa cộng tuyến.
Sử dụng lệnh vif trong phần mềm stata, ta có kết quả sau:


NHÓM SỐ 2

14


BÁO CÁO KINH TẾ LƯỢNG

Các giá trị VIF đều nhỏ hơn 10, do đó có thể đi đến kết luận mô hình không có hiện
tượng đa cộng tuyến.
Như vậy hai kiểm định đều cho cùng một kết luận: Mô hình không mắc bệnh đa
cộng tuyến.
b. Phương sai sai số thay đổi:

Phương sai của mỗi một ngẫu nhiên Ui trong điều kiện giá trị đã cho của biến giải thích
Xi là không đổi, nghĩa là:
= = ; i = 1,2,3…n
Tuy nhiên, trong thực tế, do bản chất kinh tế xã hội, quá trình thu thập, xử lí số liệu hay
do mô hình định dạng sai mà giả thiết này bị vi phạm dẫn đến hiện tượng phương sai sai số
thay đổi.
Cách 1: Phương pháp định tính:
Xem xét đồ thị ei theo i:

NHÓM SỐ 2

15


BÁO CÁO KINH TẾ LƯỢNG

Cách 2: Phương pháp định lượng:

Để kiểm định phương sai sai số thay đổi ta có cặp giả thuyết sau:

Nếu giá trị [Prob>chi2] , chúng ta bác bỏ giả thiết H0 và chấp nhận giả thiết H1.
Ta thực hiện kiểm định White:

NHÓM SỐ 2

16


BÁO CÁO KINH TẾ LƯỢNG

Kết quả kiểm định bằng lệnh imtest, white cho thấy Prob>chi2 = 0.1327> 0.05
Do đó từ 2 kiểm định trên có cơ sở kết luận rằng mô hình không mắc lỗi phương sai
sai số thay đổi.
c. Kiểm định phân phối chuẩn của sai số:

Trong các giả định của mô hình hồi quy tuyến tính, có một giả định quan trọng đó là
ui~U(0;σ2). Tuy nhiên trên thực tế có nhiều nhân tố ảnh hưởng tới phân phối của ui, làm cho nó
không còn phân phối chuẩn nữa. Phân phối không chuẩn khiến cho các kiểm định và suy diễn
thống kê không còn đáng tin cậy nữa.
Bây giờ ta cùng kiểm định xem mô hình có gặp phải vấn đề phân phối không chuẩn (đối
với u và cả biến phụ thuộc) hay không.
Cách 1:Sử dụng đồ thị:
Sử dụng Stata và vẽ đồ thị phân phối của phần dư trong mô hình:

NHÓM SỐ 2

17



BÁO CÁO KINH TẾ LƯỢNG

Nhìn trên đồ thị có thể thấy phân phối của phần dư bị chệch so với phân phối chuẩn.
Như vậy có cơ sở để kết luận mô hình đang mắc phải vấn đề phân phối không chuẩn.
Cách 2:Kiểm định Skewness-Kurtosis:
Cặp giả thiết:
Sử dụng lệnh sktest trong Stata để kiểm định:

Ta thấy p-value = 0.0014 < 0,05

⇒ bác bỏ H0
⇒ suy ra có cơ sở để cho rằng phần dư phân phối không chuẩn
Như vậy 2 kiểm định đều cho thấy có dấu hiệu phần dư phân phối không chuẩn
trong mô hình.

NHÓM SỐ 2

18


BÁO CÁO KINH TẾ LƯỢNG

IV.

Sửa lỗi mô hình

Từ việc kiểm định trên, ta thấy có biến district, clcrime không có ý nghĩa thống kê trong mô
hình. Ta có thể bỏ khỏi mô hình và tiến hành chạy lại mô hình mới như sau:
. reg crime clrprc1 clrprc2 cavgclr

Source

SS

df

MS

Model
Residual

4013.84647
3931.44454

3
49

1337.94882
80.233562

Total

7945.29101

52

152.794058

crime


Coef.

clrprc1
clrprc2
cavgclr
_cons

-.4322091
-.4300952
.3512738
54.22555

Std. Err.
.1407264
.1449878
.1351666
5.073135

t
-3.07
-2.97
2.60
10.69

Number of obs
F( 3,
49)
Prob > F
R-squared
Adj R-squared

Root MSE

P>|t|
0.003
0.005
0.012
0.000

=
=
=
=
=
=

53
16.68
0.0000
0.5052
0.4749
8.9573

[95% Conf. Interval]
-.7150093
-.721459
.0796463
44.0307

-.1494089
-.1387313

.6229013
64.4204

= 54.22555 – 0.4322091*Clrprc1 – 0.4300952*Clrprc2 + 0.3512738*Cavgclr

KẾT LUẬN
Như vậy nhóm chúng em đã hoàn thành xong mô hình kinh tế lượng về các yếu tố ảnh hưởng
đến tỉ lệ phạm tội. Mô hình đã lượng hóa cho các yếu tố để chúng ta có biện pháp, chiến lược
phá án hiệu quả . Ngoài ra, sẽ còn nhiều yếu tố ảnh hưởng đến biến phụ thuộc được nghiên cứu
chưa được đưa vào mô hình như số năm, sự thay đổi trong tỉ lệ phá án trung bình trong 1 hay 2
năm trước… cần được xem xét để có báo cáo với kết quả chính xác hơn nữa.

NHÓM SỐ 2

19


BÁO CÁO KINH TẾ LƯỢNG

GVHD: TS. ĐINH THỊ THANH BÌNH

Bộ số liệu số 81
Mô hình lý thuyết

I.
1.

Vấn đề nghiên cứu và mô hình lý thuyết:
Ngày nay, thuốc lá đang ngày càng trở thành một mối nguy hại lớn đối với sức khỏe của


con người. Mặc dù xã hội đã đưa ra nhiều biện pháp nhằm giảm thiểu tỉ lệ hút thuốc của người
dân nhưng vẫn chưa thực sự hiệu quả. Có rất nhiều yếu tố ảnh hưởng đến việc hút thuốc của
mỗi người. Trước hết, chúng ta phải tìm hiểu xem những yếu tố nào thực sự tác động đến tỉ lệ
hút thuốc của chúng ta. Trong bộ số liệu số 81, nhóm đã chọn ra những biến để nghiên cứu
dưới đây.
Mô tả dữ liệu trong fileSMOKE.DTA từ phần mềm Stata, ta thu được kết quả như sau:
. des cigs income age cigpric educ restaurn
storage
variable name
type

display
format

cigs
income
age
cigpric
educ
restaurn

%8.0g
%8.0g
%8.0g
%9.0g
%9.0g
%8.0g

byte
int

byte
float
float
byte

value
label

variable label
cigs. smoked per day
annual income, $
in years
state cig. price, cents/pack
years of schooling
=1 if rest. smk. restrictions

Các biến sẽ được mô tả chi tiết trong bảng sau:
Tên
biến
cigs
income
age
cigpric
educ
restaurn

Dạng dữ liệu

Đơn vị


Ý nghĩa biến

byte
int
byte
float
float
byte

điếu/ngày
$
tuổi
cents/hộp
năm

Số điếu thuốc được hút trung bình một ngày
Thu nhập hàng năm của người hút
Tuổi tác của người hút
Giá thuốc tại nơi người hút sinh sống
Số năm học của người hút thuốc
Nơi nghỉ ngơi của người hút có cấm thuốc không
NHÓM SỐ 2

20


BÁO CÁO KINH TẾ LƯỢNG

GVHD: TS. ĐINH THỊ THANH BÌNH


Bảng 1: Định dạng và ý nghĩa của các biến

Tiếp tục sử dụng lệnh sum để miêu tả dữ liệu. Lệnh sum cho biết số lượng quan sát
(Obs), giá trị trung bình (mean), độ lệch chuẩn (std. dev.) cũng như giá trị lớn nhất (max) và
nhỏ nhất (min) của các biến.

. sum cigs income age cigpric educ restaurn
Variable

Obs

Mean

cigs
income
age
cigpric
educ

807
807
807
807
807

8.686493
19304.83
41.23792
60.30041
12.47088


restaurn

807

.2465923

Std. Dev.

Min

Max

13.72152
9142.958
17.02729
4.738469
3.057161

0
500
17
44.004
6

80
30000
88
70.129
18


.4312946

0

1

Có thể nhận thấy số điều thuốc hút mỗi ngàycó sự chênh lệch khá lớn giữa mức cao nhất
và mức thấp nhất, lên tới 80 điếu/ngày,những người được khảo sát thuộc nhóm tuổi khá trẻ, có
ảnh hưởng lớn đế sự phát triển của xã hội. Có sự chênh lệch rất lớn giữa mức thu nhập cao nhất
và thập nhất, cho ta thấy số liệu khảo sát bao quát được hầu hết các đối tượng, từ đối tượng có
thu nhập cao đến đối tượng có thu nhập thấp.

2.

Mục đích và lý do lựa chọn các biến:
Mục đích của việc lựa chọn mô hình này nhằm tìm hiểu sự tác động của thu nhập, tuổi

tác, giá thuốc cũng như trình độ học vấn của con người đối với số điếu thuốc hút trong ngày.

NHÓM SỐ 2

21


BÁO CÁO KINH TẾ LƯỢNG

3.

GVHD: TS. ĐINH THỊ THANH BÌNH


Mối quan hệ từng biến độc lập với biến phụ thuộc:

Mối quan hệ giữa
cigs và income

Mối quan hệ giữa
cigs và age

NHÓM SỐ 2

22


BÁO CÁO KINH TẾ LƯỢNG

GVHD: TS. ĐINH THỊ THANH BÌNH

Mối quan hệ giữa
cigs và cigpric

Mối quan hệ giữa
cigs và educ

NHÓM SỐ 2

23


BÁO CÁO KINH TẾ LƯỢNG


GVHD: TS. ĐINH THỊ THANH BÌNH

Mối quan hệ giữa
cigs và restaurn

II. Phân tích hồi quy
1.

Thiết lập mô hình tổng quát

a. Mô hình tổng quát
Hàm hồi quy tổng thể biểu diễn mối quan hệ giữa biến phụ thuộc là thu nhập hàng tháng
cigsvới các biến độc lập income, age, cigpric, educ, restaurncó dạng:

b. Giải thích biến
Các biến được giải thích ở Bảng 2 dưới đây:
Loại biến
Biến phụ thuộc(Y)
Các biến độc lập (Xi)

Bảng 2: Giải thích các biến
NHÓM SỐ 2

24


BÁO CÁO KINH TẾ LƯỢNG

2.


GVHD: TS. ĐINH THỊ THANH BÌNH

Lập bảng tương quan
Chạy lệnh corr để biểu diễn mỗi quan hệ tương quan giữa các biến, nhóm thu được kết

quả như sau:
. corr cigs income educ cigpric restaurn age
(obs=807)

cigs
income
educ
cigpric
restaurn
age

cigs

income

educ

1.0000
0.0532
-0.0487
-0.0114
-0.0871
-0.0415


1.0000
0.3344
0.0480
0.1060
-0.0640

1.0000
0.0310
0.0605
-0.1806

cigpric restaurn

1.0000
0.1392
0.0293

1.0000
-0.0389

age

1.0000

Từ bảng tương quan có thể thấy, mức độ tương quan với biến phụ thuộc của các biến
độc lập không cao. Ngoại trừ biến income có hệ số tương quan dương thể hiện sự tác động
cùng chiều lên biến phụ thuộc, các biến độc lập còn lại đều có hệ số tương quan âm, cho thấy
tác động ngược chiều lên biến phụ thuộc.
Mối quan hệ tương quan giữa các biến độc lập với nhau cũng không cao, hệ số tương
quan cao nhất cũng chỉ là 0.3344 giữa biến income và educ. Do không có hệ số tương quan nào

có độ lớn vượt quá 0.8 nên nhóm em có thể dự đoán mô hình không xảy ra hiện tượng đa cộng
tuyến khi hồi quy.
3.

Chạy mô hình hồi quy
Dùng lệnh reg để chạy mô hình hồi quy giữa biến phụ thuộc và các biến độc lập, ta thu

được kết quả như sau:

NHÓM SỐ 2

25


×