Tải bản đầy đủ (.doc) (18 trang)

Phân tích tình hình tiêu thụ thuốc lá qua các yếu tố ảnh hưởng (File data: SMOKE)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (663.85 KB, 18 trang )

TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG
TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG
KHOA KINH TẾ VÀ KINH DOANH QUỐC TẾ
KHOA KINH TẾ VÀ KINH DOANH QUỐC TẾ
-------------***-------------
-------------***-------------
TIỂU LUẬN KINH TẾ LƯỢNG
TIỂU LUẬN KINH TẾ LƯỢNG
Đề tài:
Đề tài:
Phân tích tình hình tiêu thụ thuốc lá
Phân tích tình hình tiêu thụ thuốc lá
qua các yếu tố ảnh hưởng
qua các yếu tố ảnh hưởng
(File data: SMOKE)
(File data: SMOKE)
Nhóm sinh viên thực hiện:
Nhóm sinh viên thực hiện:
Tên thành viên
Tên thành viên
Mã sinh viên
Mã sinh viên
% đóng góp
% đóng góp
Lớp:
Lớp:
Giảng viên hướng dẫn:
Giảng viên hướng dẫn:
Hà Nội,
Hà Nội,
MỤC LỤC


L I M UỜ Ở ĐẦ
L I M UỜ Ở ĐẦ
.............................................................................................................
.............................................................................................................
3
3
N I DUNGỘ
N I DUNGỘ
...................................................................................................................
...................................................................................................................
4
4
PH N I: QUÁ TRÌNH NGHIÊN C U TÀIẦ Ứ ĐỀ
PH N I: QUÁ TRÌNH NGHIÊN C U TÀIẦ Ứ ĐỀ
..........................................................
..........................................................
4
4
1. N i dung nghiên c uộ ứ
1. N i dung nghiên c uộ ứ
.........................................................................................
.........................................................................................
4
4
2. Quy trình thu th p s li uậ ố ệ
2. Quy trình thu th p s li uậ ố ệ
.............................................................................
.............................................................................
4
4

3. Ph ng pháp nghiên c uươ ứ
3. Ph ng pháp nghiên c uươ ứ
...................................................................................
...................................................................................
4
4
PH N II: K T QU NGHIÊN C UẦ Ế Ả Ứ
PH N II: K T QU NGHIÊN C UẦ Ế Ả Ứ
......................................................................
......................................................................
4
4
I. MÔ T S LI UẢ Ố Ệ
I. MÔ T S LI UẢ Ố Ệ
.............................................................................................
.............................................................................................
4
4
II. CH Y H I QUY VÀ T NG QUAN CHO MÔ HÌNHẠ Ồ ƯƠ
II. CH Y H I QUY VÀ T NG QUAN CHO MÔ HÌNHẠ Ồ ƯƠ
..............................
..............................
8
8
III. M T S KI M NHỘ Ố Ể ĐỊ
III. M T S KI M NHỘ Ố Ể ĐỊ
.................................................................................
.................................................................................
9
9

1. Ki m nh v i t ng h s h i quyể đị ớ ừ ệ ố ồ
1. Ki m nh v i t ng h s h i quyể đị ớ ừ ệ ố ồ
..........................................................
..........................................................
9
9
2. Ki m nh t h p tuy n tính h s h i quy ể đị ổ ợ ế ệ ố ồ
2. Ki m nh t h p tuy n tính h s h i quy ể đị ổ ợ ế ệ ố ồ
.......................................
.......................................
11
11
3. Ki m nh a ràng bu c tuy n tínhể đị đ ộ ế
3. Ki m nh a ràng bu c tuy n tínhể đị đ ộ ế
........................................................
........................................................
12
12
IV. KHUY T T T MÔ HÌNH VÀ S A CH AẾ Ậ Ử Ữ
IV. KHUY T T T MÔ HÌNH VÀ S A CH AẾ Ậ Ử Ữ
...............................................
...............................................
13
13
1. Hi n t ng a c ng tuy nệ ượ đ ộ ế
1. Hi n t ng a c ng tuy nệ ượ đ ộ ế
.....................................................................
.....................................................................
13
13

2. Hi n t ng ph ng sai sai s thay iệ ượ ươ ố đổ
2. Hi n t ng ph ng sai sai s thay iệ ượ ươ ố đổ
................................................
................................................
15
15
3. Hi n t ng t t ng quanệ ượ ự ươ
3. Hi n t ng t t ng quanệ ượ ự ươ
.....................................................................
.....................................................................
16
16
K T LU NẾ Ậ
K T LU NẾ Ậ
................................................................................................................
................................................................................................................
18
18
2
2
LỜI MỞ ĐẦU
Như chúng ta đã biết, thuốc lá là một sản phẩm vô cùng nguy hiểm đối với sức khỏe con
người, không chỉ với người hút thuốc mà còn cả với những người xung quanh. Tuy nhiên, số
lượng người hút thuốc lá trên thế giới vẫn không thuyên giảm, không những vậy còn có xu
hướng tăng lên ở các nước đang phát triển, đặc biệt ở độ tuổi thanh thiếu niên từ 17-24 tuổi.
Việt Nam là nước có số lượng người hút thuốc lá cao trên thế giới, 50% nam giới và 3.4% nữ
giới (theo thống kê của Tổ chức Sức khỏe Thế giới là cao nhất Châu Á). Nghiêm trọng hơn,
số lượng người tử vong do hút thuốc lá sẽ nhiều hơn số nười tử vong do HIV/AIDS, lao, tai
nạn giao thông và tự tử cộng lại vào năm 2020. Do đó, việc tìm ra các biện pháp để giảm
thiểu tình trạng hút thuốc lá trong cộng đồng là việc làm vô cùng cấp thiết không của riêng

bất cứ cá nhân nào mà là của toàn xã hội.
Sau quá trình học tập bộ môn
Sau quá trình học tập bộ môn
“Kinh tế lượng”
“Kinh tế lượng”
dưới sự hướng dẫn của giảng viên,
dưới sự hướng dẫn của giảng viên,
TS.
TS.


Đinh Thị Thanh Bình
Đinh Thị Thanh Bình
, để vận dụng kiến thức đã học cũng như các thao tác thực hành phần
, để vận dụng kiến thức đã học cũng như các thao tác thực hành phần


mềm Stata, nhóm chúng em đã tìm hiểu, đánh giá và chọn ra một đề tài không mới nhưng
mềm Stata, nhóm chúng em đã tìm hiểu, đánh giá và chọn ra một đề tài không mới nhưng


theo đánh giá chủ quan của nhóm là khá cần thiết để nghiên cứu, đó là
theo đánh giá chủ quan của nhóm là khá cần thiết để nghiên cứu, đó là
“Phân tích tình hình
“Phân tích tình hình


tiêu thụ thuốc lá qua các yếu tố ảnh hưởng”
tiêu thụ thuốc lá qua các yếu tố ảnh hưởng”
để làm bước đệm cho việc tìm ra các cách

để làm bước đệm cho việc tìm ra các cách


giải quyết phù hợp. Trong quá trình thực hiện, bài viết sẽ khó tránh khỏi những thiếu sót,
giải quyết phù hợp. Trong quá trình thực hiện, bài viết sẽ khó tránh khỏi những thiếu sót,


chúng em rất mong nhận được sự đóng góp
chúng em rất mong nhận được sự đóng góp


từ các thầy cô để bài tiểu luận của nhóm được
từ các thầy cô để bài tiểu luận của nhóm được


hoàn thiện hơn.
hoàn thiện hơn.
Chúng em xin chân thành cảm ơn!
Chúng em xin chân thành cảm ơn!
3
3
NỘI DUNG
PHẦN I: QUÁ TRÌNH NGHIÊN CỨU ĐỀ TÀI
1.
1.
Nội dung nghiên cứu
Nội dung nghiên cứu
Trước khi nghiên cứu chuyên sâu vào việc làm thế nào để giảm thiểu tình trạng hút
thuốc lá, chúng em tiến hành tìm hiểu những yếu tố ảnh hưởng đến lượng thuốc lá trung bình
mà một người hút trong một ngày, từ đó lấy nền tảng để nghiên cứu sâu hơn.

2.
2.
Quy trình thu thập số liệu
Quy trình thu thập số liệu
Nhóm đã xác định những yếu tố ảnh hưởng đến lượng thuốc lá trung bình mà một người
hút trong một ngày như: học vấn, tuổi tác, thu nhập… và tiến hành điều tra và thu thập số liệu
trên 807 mẫu, sau đó đem phân tích các số liệu này qua phần mềm Stata để đi đến những kết
luận cuối cùng.
3.
3.
Phương pháp nghiên cứu
Phương pháp nghiên cứu
a. Phương pháp thu thập số liệu
- Kích cỡ mẫu: 807 người
- Phạm vi: Chủ yếu tập trung vào nhóm người từ 17 tuổi trở lên
- Hình thức: Thảo một bản khảo sát và đi thu thập số liệu tại những nơi tập trung đông
người như công viên.
b. Phương pháp phân tích số liệu
- Phương pháp thu thập số liệu
- Phương pháp tương quan và hồi quy
- Phương pháp phân tích phương sai
PHẦN II: KẾT QUẢ NGHIÊN CỨU
I.
I.
MÔ TẢ SỐ LIỆU
MÔ TẢ SỐ LIỆU
Các biến được sử dụng để phân tích gồm có: educ, cigpric, age, income, restaurn và
Các biến được sử dụng để phân tích gồm có: educ, cigpric, age, income, restaurn và



cigs, trong đó cigs – số điếu thuốc hút trong 1 ngày được chọn làm biến độc lập Y, các
cigs, trong đó cigs – số điếu thuốc hút trong 1 ngày được chọn làm biến độc lập Y, các


biến còn lại là biến phụ thuộc X
biến còn lại là biến phụ thuộc X
i
i
.
.
Để nắm được những đặc điểm cơ bản của từng biến, ta sử dụng lệnh ‘sum’:
Để nắm được những đặc điểm cơ bản của từng biến, ta sử dụng lệnh ‘sum’:
4
4
cigs 807 8.686493 13.72152 0 80

restaurn 807 .2465923 .4312946 0 1
income 807 19304.83 9142.958 500 30000
age 807 41.23792 17.02729 17 88
cigpric 807 60.30041 4.738469 44.004 70.129
educ 807 12.47088 3.057161 6 18

Variable Obs Mean Std. Dev. Min Max
. sum educ cigpric age income restaurn cigs
Kết quả cho thấy:
Kết quả cho thấy:
- Đối với biến cigs (cigs. smoked per day): số điếu thuốc trung bình hút trong 1 ngày là
8.686493 điếu thuốc, số điếu thuốc hút trong 1 ngày ít nhất là 1, nhiều nhất là 80 điếu.
→ Đánh giá mật độ qua đồ thị (đồ thị histogram)
(bin=28, start=0, width=2.8571429)

. histogram cigs
0 .05 .1 .15 .2
Density
0 20 40 60 80
cigs. smoked per day
Nhìn vào đồ thị ta thấy mật độ tập trung các giá trị thấp là rất lớn (rất nhiều người
không hút thuốc hoặc hút ít) và một bộ phận các giá trị cao phân tán tạo thành một cái đuôi
dài về phía phải. Ta khẳng định phân bố lệch nhiều về phía phải.
5
5
- Đối với biến educ (years of schooling): số năm học vấn trung bình là 12.47088 tương
đương với bậc trung học, số năm học vấn thấp nhất là 6 tương đương với bậc tiểu học, số
năm học vấn cao nhất là 18 tương đương với bậc thạc sỹ.
(bin=28, start=6, width=.42857143)
. histogram educ
0 .2 .4 .6 .8
Density
5 10 15 20
years of schooling
Nhìn vào đồ thị ta thấy mật độ tập trung các giá trị trung bình là rất lớn (số lượng người
có số năm học vấn trung bình khá cao) và một bộ phận các giá trị thấp và cao phân tán về 2
phía tương đối cân bằng. Ta khẳng định phân bố không lệch.
- Đối với biến cigpric (state cig. price, cents/pack): giá trung bình của một bao thuốc lá
là 60.30041 cents/pack, thấp nhất là 44.004 cents/pack và cao nhất là 70.129 cents/pack.
(bin=28, start=44.004002, width=.93303558)
. histogram cigpric
0 .05 .1 .15
Density
45 50 55 60 65 70
state cig. price, cents/pack

6
6
Nhìn vào đồ thị ta thấy mật độ các giá trị trung bình là khá lớn, các giá trị thấp phân tán
hơn so với các giá trị ở mức cao.
- Đối với biến age (in years): độ tuổi trung bình là 41.23792, độ tuổi thấp nhất là 17
tuổi, độ tuổi cao nhất là 88 tuổi.
(bin=28, start=17, width=2.5357143)
. histogram age
0 .01 .02 .03 .04
Density
20 40 60 80 100
in years
Nhìn vào đồ thị ta thấy các giá trị phân tán và không tập trung nhưng nhìn chung các giá
trị mức thấp có mật độ dày hơn các giá trị mức cao, ta thấy xu hướng là phân bố lệch phải.
- Đối với biến income (annual income, $): mức thu nhập trung bình là 19304.83$ chênh
lệch rất lớn với mức thu nhập thấp nhất là 500$, chênh lệch không lớn với mức thu nhập cao
nhất là 30000$.
(bin=28, start=500, width=1053.5714)
. histogram income
0 2.0e-04 4.0e-04 6.0e-04
Density
0 10000 20000 30000
annual income, $
Nhìn vào đồ thị ta thấy mật độ tập trung các giá trị lớn của thu nhập là khá lớn. Các giá
trị thấp phân tán thành đuôi ở phía trái → phân bố lệch nhiều về phía trái.
7
7
- Đối với biến restaurn (=1 if rest. smk. restrictions):
restaurn 199 1 0 1 1


Variable Obs Mean Std. Dev. Min Max
. sum restaurn if restaurn==1
Trong số 807 quan sát, có 199 quan sát được gắn giá trị 1 nghĩa là 199/807 người được
Trong số 807 quan sát, có 199 quan sát được gắn giá trị 1 nghĩa là 199/807 người được


hỏi đã từng đến khu vực nhà hàng hạn chế hút thuốc. Còn lại 608 người chưa từng đến khu
hỏi đã từng đến khu vực nhà hàng hạn chế hút thuốc. Còn lại 608 người chưa từng đến khu


vực đó ứng với 608 quan sát được gắn giá trị 0.
vực đó ứng với 608 quan sát được gắn giá trị 0.
II.
II.
CHẠY HỒI QUY VÀ TƯƠNG QUAN CHO MÔ HÌNH
CHẠY HỒI QUY VÀ TƯƠNG QUAN CHO MÔ HÌNH
 Sử dụng lệnh ‘corr’ để xét sự tương quan giữa các biến:
restaurn -0.0871 0.0605 0.1392 -0.0389 0.1060 1.0000
income 0.0532 0.3344 0.0480 -0.0640 1.0000
age -0.0415 -0.1806 0.0293 1.0000
cigpric -0.0114 0.0310 1.0000
educ -0.0487 1.0000
cigs 1.0000

cigs educ cigpric age income restaurn
(obs=807)
. corr cigs educ cigpric age income restaurn
Nhìn vào bảng kết quả trên, ta có thể thấy các biến độc lập ảnh hưởng tương đối ít đến
Nhìn vào bảng kết quả trên, ta có thể thấy các biến độc lập ảnh hưởng tương đối ít đến
biến phụ thuộc và chủ yếu là tương quan ngược chiều (ngoại trừ biến income – khi thu nhập

biến phụ thuộc và chủ yếu là tương quan ngược chiều (ngoại trừ biến income – khi thu nhập
tăng thì số điếu thuốc hút trong 1 ngày tăng).
tăng thì số điếu thuốc hút trong 1 ngày tăng).
 Dùng lệnh ‘reg’ để chạy hồi quy:

_cons 13.01946 6.551227 1.99 0.047 .1598616 25.87906
restaurn -2.982192 1.130995 -2.64 0.009 -5.202256 -.7621274
income .0001306 .000056 2.33 0.020 .0000207 .0002405
age -.0438986 .028707 -1.53 0.127 -.1002484 .0124512
cigpric .0046741 .1024819 0.05 0.964 -.1964908 .2058389
educ -.3680468 .169172 -2.18 0.030 -.7001196 -.0359739

cigs Coef. Std. Err. t P>|t| [95% Conf. Interval]

Total 151753.683 806 188.280003 Root MSE = 13.633
Adj R-squared = 0.0129
Residual 148865.047 801 185.848998 R-squared = 0.0190
Model 2888.63535 5 577.72707 Prob > F = 0.0087
F( 5, 801) = 3.11
Source SS df MS Number of obs = 807
. reg cigs educ cigpric age income restaurn
Từ bảng trên, ta lập được phương trình hồi quy tuyến tính như sau:
Từ bảng trên, ta lập được phương trình hồi quy tuyến tính như sau:
8
8
(1)
(1)
trong đó: X
trong đó: X
1

1
– educ, X
– educ, X
2
2
– cigpric, X
– cigpric, X
3
3
– age, X
– age, X
4
4
– income, X
– income, X
5
5
– restaurn.
– restaurn.
Ý nghĩa của hệ số R
2
:
Với R
2
=0.0190 ta nhận thấy độ chặt chẽ của mô hình chưa cao, nghĩa là việc điều tra
số năm học, giá thuốc lá, độ tuổi, thu nhập, việc hạn chế hút thuốc trong nhà hàng không nói
lên nhiều ý nghĩa, chúng chỉ có thể giải thích được 1.9% sự biến động của biến độc lập Y.
Ý nghĩa của các hệ số hồi quy:
Ý nghĩa của các hệ số hồi quy:
- = 13.01946 cho biết ảnh hưởng của các yếu tố nằm ngoài mô hình đến giá trị trung

bình của Y khi các yếu tố X
i
= 0.
- = -0.3680468 cho biết khi số năm học tăng lên 1 năm thì số điếu thuốc lá hút sẽ
giảm trung bình 0.3680468 đơn vị, với điều kiện các yếu tố khác không đổi.
- = 0.0046741 cho biết khi giá của 1 gói thuốc tăng 1 cent thì số điếu thuốc lá hút
tăng trung bình 0.0046741 đơn vị, với điều kiện các yếu tố khác không đổi.
- = -0.0438968 cho biết khi số tuổi tăng lên 1 tuổi thì số điếu thuốc lá hút giảm trung
bình 0.0438968 đơn vị, với điều kiện các yếu tố khác không đổi.
- = 0.0001306 cho biết khi thu nhập hằng năm tăng lên 1 đô la thì số điếu thuốc lá
hút tăng trung bình 0.0001306 đơn vị, với điều kiện các yếu tố khác không đổi.
- = -2.982192 cho biết khi ở trong khu vực nhà hàng hạn chế hút thuốc lá, số điếu
thuốc hút trung bình nhỏ hơn khi không ở trong khu vực đó là 2.982192, với điều kiện các
yếu tố khác không đổi.
• = 1 nếu nhà hàng hạn chế hút thuốc lá, khi đó = 13.01946 – 2.982192 =
10.037268; , , , như trên.
• = 0 nếu nhà hàng không hạn chế hút thuốc lá, khi đó , , , , như trên.
III.
III.
MỘT SỐ KIỂM ĐỊNH
MỘT SỐ KIỂM ĐỊNH
1.
1.
Kiểm định với từng hệ số hồi quy
Kiểm định với từng hệ số hồi quy
Ta có
Ta có
 Kiểm định :
9
9

:
:
- Cách 1: Theo bảng |t|= 1.99 > 1.96, do đó loại H
0
. Suy ra có ý nghĩa thống kê.
- Cách 2: P-value = 0.047 < α (=0.05), do đó loại H
0
. Suy ra có ý nghĩa thống kê.
 Kiểm định :
:
:
- Cách 1: Theo bảng |t| = 2.18 > 1.96, do đó loại H
0
. Suy ra có ý nghĩa thống kê.
- Cách 2: P-value = 0.03 < α, do đó loại H
0
. Suy ra có ý nghĩa thống kê.
 Kiểm định :
:
:
- Cách 1: Theo bảng |t| = 0.05 < 1.96, do đó không có cơ sở loại H
0
.
- Cách 2: P-value = 0.964 > α, do đó không có cơ loại H
0
.
 Kiểm định :
:
:
- Cách 1: Theo bảng, |t| = 1.53 < 1.96, do đó không có cơ sở loại H

0
.
- Cách 2: p-value = 0.127 > α do đó không có cơ sở loại bỏ H
0
.
 Kiểm định :
:
:
- Cách 1: Theo bảng, |t| = 2.33 > 1.96, do đó loại bỏ H
0
. Suy ra có ý nghĩa thống kê.
- Cách 2: P-value = 0.02 < α do đó loại H
0
. Suy ra có ý nghĩa thống kê.
 Kiểm định (hệ số của biến giả):
10
10
:
- Cách 1: Theo bảng, |t| = 2.64 > 1.96, do đó loại bỏ H
0
. Suy ra có ý nghĩa thống kê.
- Cách 2: P-value = 0.009 < α do đó loại bỏ H
0
. Suy ra có ý nghĩa thống kê.
2.
2.
Kiểm định tổ hợp tuyến tính hệ số hồi quy
Kiểm định tổ hợp tuyến tính hệ số hồi quy
Trước tiên ta kiểm định sự phù hợp của mô hình hồi quy:



(1)
Giả thuyết cần kiểm định:
Tiêu chuẩn kiểm định:
F =
Tiến hành kiểm định:
Prob > F = 0.0087
F( 5, 801) = 3.11
( 5) restaurn = 0
( 4) income = 0
( 3) age = 0
( 2) cigpric = 0
( 1) educ = 0
. test educ cigpric age income restaurn
Kết quả kiểm định cho thấy: F(5, 801) = 3.11
Tra bảng thống kê F ta có giá trị tới hạn = 2.23
F(5, 801) > → Bác bỏ H
0
Kết luận:
Kết luận:
Từ kiểm định tổ hợp tuyến tính hệ số hồi quy, với mức ý nghĩa 5% có thể thấy
Từ kiểm định tổ hợp tuyến tính hệ số hồi quy, với mức ý nghĩa 5% có thể thấy


trong các biến độc lập educ, cigpric, age, income, restaurn có ít nhất một yếu tố ảnh hưởng tới
trong các biến độc lập educ, cigpric, age, income, restaurn có ít nhất một yếu tố ảnh hưởng tới


sự biến động của biến phụ thuộc cigs.
sự biến động của biến phụ thuộc cigs.

11
11
3.
3.
Kiểm định đa ràng buộc tuyến tính
Kiểm định đa ràng buộc tuyến tính
Dưạ vào kết quả kiểm định ở trên, ta nhận định các biến độc lập cigpric và age không
ảnh hưởng đến biến phụ thuộc cigs. Ta tiếp tục tiến hành kiểm định đa ràng buộc tuyến tính
và xét xem có thể loại hai biến trên ra khỏi mô hình hay không.
Giả thuyết cần kiểm định:
Giả thuyết cần kiểm định:
Tiêu chuẩn kiểm định:
Tiêu chuẩn kiểm định:
F =
F =
hoặc F =
hoặc F =
Tiến hành kiểm định:
Prob > F = 0.3111
F( 2, 801) = 1.17
( 2) age = 0
( 1) cigpric = 0
. test cigpric age
Ta có: F
qs
= 1.17
Tra bảng thống kê F, với mức ý nghĩa 0.05, ta có giá trị tới hạn = 3.01
Fqs < → Chấp nhận H
0
, loại biến cigpric và age ra khỏi mô hình.

→ Ta chạy hồi quy với các biến còn lại:

_cons 10.92859 2.056444 5.31 0.000 6.891949 14.96523
restaurn -2.926764 1.12031 -2.61 0.009 -5.125846 -.7276817
income .0001308 .000056 2.34 0.020 .0000209 .0002406
educ -.3243288 .1667578 -1.94 0.052 -.6516614 .0030037

cigs Coef. Std. Err. t P>|t| [95% Conf. Interval]

Total 151753.683 806 188.280003 Root MSE = 13.636
Adj R-squared = 0.0125
Residual 149299.688 803 185.927382 R-squared = 0.0162
Model 2453.99514 3 817.99838 Prob > F = 0.0044
F( 3, 803) = 4.40
Source SS df MS Number of obs = 807
. reg cigs educ income restaurn
Phương trình hồi quy mới là:
Phương trình hồi quy mới là:
12
12
trong đó:
X
X
1
1
– educ, X
– educ, X
2
2
– income, X

– income, X
3
3
– restaurn
– restaurn.
IV.
IV.
KHUYẾT TẬT MÔ HÌNH VÀ SỬA CHỮA
KHUYẾT TẬT MÔ HÌNH VÀ SỬA CHỮA
1.
1.
Hiện tượng đa cộng tuyến
Hiện tượng đa cộng tuyến
Xét mối quan hệ tuyến tính giữa các biến giải thích: X
Xét mối quan hệ tuyến tính giữa các biến giải thích: X
1
1
, X
, X
2
2
, X
, X
3
3
, X
, X
4
4
, X

, X
5
5
 Cách 1 : Chạy tương quan cho mô hình các biến phụ thuộc ta được:
restaurn 0.0605 0.1392 -0.0389 0.1060 1.0000
income 0.3344 0.0480 -0.0640 1.0000
age -0.1806 0.0293 1.0000
cigpric 0.0310 1.0000
educ 1.0000

educ cigpric age income restaurn
(obs=807)
. corr educ cigpric age income restaurn
Từ bảng trên có thể thấy sự tương quan cặp giữa các biến giải thích là rất thấp
Từ bảng trên có thể thấy sự tương quan cặp giữa các biến giải thích là rất thấp
(
(


do đó mô hình (1) không có hiện tượng đa cộng tuyến hoàn hảo.
do đó mô hình (1) không có hiện tượng đa cộng tuyến hoàn hảo.
 Cách 2: Chạy hồi quy lần lượt từng biến X lên các biến độc lập khác:
- X
1
lên X
2
, X
3
, X
4

, X
5

_cons 10.85799 1.312584 8.27 0.000 8.281488 13.4345
restaurn .1257927 .2360305 0.53 0.594 -.3375178 .5891032
income .0001075 .0000111 9.72 0.000 .0000858 .0001292
age -.0286972 .0059057 -4.86 0.000 -.0402897 -.0171048
cigpric .0114531 .0213872 0.54 0.592 -.0305284 .0534345

educ Coef. Std. Err. t P>|t| [95% Conf. Interval]

Total 7533.06568 806 9.34623533 Root MSE = 2.8455
Adj R-squared = 0.1337
Residual 6493.86371 802 8.09708692 R-squared = 0.1380
Model 1039.20197 4 259.800492 Prob > F = 0.0000
F( 4, 802) = 32.09
Source SS df MS Number of obs = 807
. reg educ cigpric age income restaurn
- X
2
lên X
1
, X
3
, X
4
, X
5
13
13


_cons 58.78738 .8866825 66.30 0.000 57.04689 60.52787
restaurn 1.498422 .3860876 3.88 0.000 .7405605 2.256284
income .0000152 .0000193 0.79 0.429 -.0000226 .0000531
age .0111549 .0098834 1.13 0.259 -.0082456 .0305554
educ .0312093 .0582796 0.54 0.592 -.0831892 .1456078

cigpric Coef. Std. Err. t P>|t| [95% Conf. Interval]

Total 18097.1865 806 22.4530849 Root MSE = 4.6973
Adj R-squared = 0.0173
Residual 17695.6175 802 22.0643609 R-squared = 0.0222
Model 401.568997 4 100.392249 Prob > F = 0.0012
F( 4, 802) = 4.55
Source SS df MS Number of obs = 807
. reg cigpric educ age income restaurn
- X
3
lên X
1
, X
2
, X
4
, X
5

_cons 45.51008 7.896519 5.76 0.000 30.0098 61.01037
restaurn -1.315678 1.390413 -0.95 0.344 -4.044955 1.413599
income -4.75e-06 .0000689 -0.07 0.945 -.0001399 .0001304

cigpric .1421627 .1259586 1.13 0.259 -.1050847 .3894102
educ -.9966023 .2050939 -4.86 0.000 -1.399187 -.594018

age Coef. Std. Err. t P>|t| [95% Conf. Interval]

Total 233682.32 806 289.928436 Root MSE = 16.769
Adj R-squared = 0.0301
Residual 225519.959 802 281.196957 R-squared = 0.0349
Model 8162.36044 4 2040.59011 Prob > F = 0.0000
F( 4, 802) = 7.26
Source SS df MS Number of obs = 807
. reg age educ cigpric income restaurn
- X
4
lên X
1
, X
2
, X
3
, X
5
14
14

_cons 3606.5 4130.256 0.87 0.383 -4500.888 11713.89
restaurn 1745.784 710.7123 2.46 0.014 350.7079 3140.86
age -1.248886 18.10702 -0.07 0.945 -36.79163 34.29386
cigpric 51.09074 64.61579 0.79 0.429 -75.7453 177.9268
educ 981.3698 100.9224 9.72 0.000 783.2666 1179.473


income Coef. Std. Err. t P>|t| [95% Conf. Interval]

Total 6.7377e+10 806 83593686.3 Root MSE = 8598.9
Adj R-squared = 0.1155
Residual 5.9300e+10 802 73940346.3 R-squared = 0.1199
Model 8.0764e+09 4 2.0191e+09 Prob > F = 0.0000
F( 4, 802) = 27.31
Source SS df MS Number of obs = 807
. reg income educ cigpric age restaurn
- X
5
lên X
1
, X
2
, X
3
, X
4

_cons -.5779944 .2035175 -2.84 0.005 -.9774842 -.1785046
income 4.28e-06 1.74e-06 2.46 0.014 8.59e-07 7.70e-06
age -.0008476 .0008958 -0.95 0.344 -.002606 .0009107
cigpric .0123029 .00317 3.88 0.000 .0060804 .0185254
educ .0028144 .0052808 0.53 0.594 -.0075515 .0131803

restaurn Coef. Std. Err. t P>|t| [95% Conf. Interval]

Total 149.928129 806 .186015048 Root MSE = .42563

Adj R-squared = 0.0261
Residual 145.29099 802 .181160836 R-squared = 0.0309
Model 4.6371386 4 1.15928465 Prob > F = 0.0000
F( 4, 802) = 6.40
Source SS df MS Number of obs = 807
. reg restaurn educ cigpric age income
Nhìn vào các kết quả chạy hồi quy trên ta thấy hệ số xác định R
Nhìn vào các kết quả chạy hồi quy trên ta thấy hệ số xác định R
2
2
của các hồi quy riêng
của các hồi quy riêng


đều nhỏ hơn 0.8 (R
đều nhỏ hơn 0.8 (R
2
2
1,2345
1,2345
= 0.138, R
= 0.138, R
2
2
2,1345
2,1345
= 0.0222, R
= 0.0222, R
2
2

3,1245
3,1245
= 0.0349, R
= 0.0349, R
2
2
4,1235
4,1235
= 0.1199, R
= 0.1199, R
2
2
5,1234
5,1234
=
=


0.0309)
0.0309)


nên mô hình
nên mô hình


(1) không có đa cộng tuyến hoàn hảo.
(1) không có đa cộng tuyến hoàn hảo.
2.
2.

Hiện tượng phương sai sai số thay đổi
Hiện tượng phương sai sai số thay đổi
Ta lập cặp giả thuyết cho mô hình (1):
H
0
: Phương sai thuần nhất
H
1
: Phương sai sai số thay đổi
Nếu giá trị P-value là nhỏ (được ngầm định là nhỏ hơn 0.05), chúng ta sẽ bác bỏ giả
thuyết H
0
và chấp nhận giả thuyết thay thế H
1
.
15
15

Total 103.51 25 0.0000

Kurtosis 8.24 1 0.0041
Skewness 57.26 5 0.0000
Heteroskedasticity 38.00 19 0.0059

Source chi2 df p

Cameron & Trivedi's decomposition of IM-test
Prob > chi2 = 0.0059
chi2(19) = 38.00
against Ha: unrestricted heteroskedasticity

White's test for Ho: homoskedasticity
. imtest, white
Kết quả kiểm định cho thấy P-value = Prob > chi2 = 0.0059, do vậy ta sẽ bác bỏ giả
thuyết H
0
, nghĩa là đã có hiện tượng phương sai sai số thay đổi trong mô hình.
Với hiện tượng này, chúng ta sẽ khắc phục bằng cách chạy hồi quy với lệnh robust:
Với hiện tượng này, chúng ta sẽ khắc phục bằng cách chạy hồi quy với lệnh robust:

_cons 13.01946 6.985614 1.86 0.063 -.6928091 26.73173
restaurn -2.982192 1.045631 -2.85 0.004 -5.034693 -.929691
income .0001306 .0000537 2.43 0.015 .0000252 .000236
age -.0438986 .0235419 -1.86 0.063 -.0901098 .0023126
cigpric .0046741 .1074171 0.04 0.965 -.2061783 .2155264
educ -.3680468 .1647903 -2.23 0.026 -.6915185 -.044575

cigs Coef. Std. Err. t P>|t| [95% Conf. Interval]
Robust

Root MSE = 13.633
R-squared = 0.0190
Prob > F = 0.0035
F( 5, 801) = 3.55
Linear regression Number of obs = 807
. reg cigs educ cigpric age income restaurn, robust
Sau khi được sửa chữa, mô hình hồi quy sẽ cho ta các ước lượng hiệu quả hơn.
Sau khi được sửa chữa, mô hình hồi quy sẽ cho ta các ước lượng hiệu quả hơn.
3.
3.
Hiện tượng tự tương quan

Hiện tượng tự tương quan
Ta xét xem mô hình có hiện tượng tự tương quan hay không bằng cách quan sát đồ thị
Ta xét xem mô hình có hiện tượng tự tương quan hay không bằng cách quan sát đồ thị
thể hiện độ phân tán của phần dư.
thể hiện độ phân tán của phần dư.
Vẽ đồ thị:
Vẽ đồ thị:
. rvfplot
16
16
-20 0 20 40 60 80
Residuals
0 5 10 15
Fitted values
Kết quả vẽ đồ thị cho thấy phần dư của các quan sát phân bố không theo một xu thế
Kết quả vẽ đồ thị cho thấy phần dư của các quan sát phân bố không theo một xu thế
nhất định, do đó có thể nói mô hình hồi quy không có hiện tượng tự tương quan.
nhất định, do đó có thể nói mô hình hồi quy không có hiện tượng tự tương quan.
17
17
KẾT LUẬN
Qua quá trình điều tra và phân tích số liệu, nhóm đã đi đến một số kết luận như sau:
Qua quá trình điều tra và phân tích số liệu, nhóm đã đi đến một số kết luận như sau:
-
-
Độ tuổi ảnh hưởng lớn đến số lượng điếu thuốc hút một ngày do các đặc tính về công
Độ tuổi ảnh hưởng lớn đến số lượng điếu thuốc hút một ngày do các đặc tính về công


việc, tâm lý của mỗi độ tuổi khác nhau là khác nhau.

việc, tâm lý của mỗi độ tuổi khác nhau là khác nhau.
-
-
Số năm học vấn cũng là một yếu tố ảnh hưởng đến số lượng thuốc lá hút một ngày,
Số năm học vấn cũng là một yếu tố ảnh hưởng đến số lượng thuốc lá hút một ngày,


cho thấy tất cả mọi đối tượng đều có thể hút thuốc, từ người trình độ tiểu học đến các bậc đại
cho thấy tất cả mọi đối tượng đều có thể hút thuốc, từ người trình độ tiểu học đến các bậc đại


học, thạc sỹ, tiến sỹ
học, thạc sỹ, tiến sỹ
,…
,…
-
-
Với tất cả mọi mức thu nhập của người dân đều có thể hút thuốc và số lượng điếu
Với tất cả mọi mức thu nhập của người dân đều có thể hút thuốc và số lượng điếu


thuốc phụ thuộc không nhiều vào thu nhập, có thể do giá cả thuốc lá ở Việt Nam không.
thuốc phụ thuộc không nhiều vào thu nhập, có thể do giá cả thuốc lá ở Việt Nam không.
-
-
Việc nhà hàng hạn chế hút thuốc lá ảnh h
Việc nhà hàng hạn chế hút thuốc lá ảnh h
ưởng lớn đến số lượng hút thuốc lá một ngày,
ưởng lớn đến số lượng hút thuốc lá một ngày,



cho thấy
cho thấy
ý thức của ng
ý thức của ng
ười hút thuốc lá khá tốt khi bị hạn chế, và nhà hàng là một trong những
ười hút thuốc lá khá tốt khi bị hạn chế, và nhà hàng là một trong những


nơi có số lượng thuốc lá được hút lớn
nơi có số lượng thuốc lá được hút lớn
.
.
Từ
Từ
các
các
kết luận trên
kết luận trên
, chúng em đã
, chúng em đã


thảo luận và đưa ra
thảo luận và đưa ra
một số đề nghị để cải thiện tình
một số đề nghị để cải thiện tình


trạng hút thuốc lá gia tăng:

trạng hút thuốc lá gia tăng:
-
-
Giảm áp lực công việc đối với các đối tượng thường xuyên làm việc trong môi trường
Giảm áp lực công việc đối với các đối tượng thường xuyên làm việc trong môi trường


áp lực cao
áp lực cao
.
.
-
-
Đẩy mạnh công tác tuyên truyền giáo dục các đối tượng người dân về tác hại của việc
Đẩy mạnh công tác tuyên truyền giáo dục các đối tượng người dân về tác hại của việc


hút thuốc tới sức khỏe của con người để ngăn chặn việc hút thuốc gia tăng
hút thuốc tới sức khỏe của con người để ngăn chặn việc hút thuốc gia tăng
.
.
-
-
Cần có lệnh cấm hút thuốc tại các nơi công cộng, cửa hàng, siêu thị và có các hình
Cần có lệnh cấm hút thuốc tại các nơi công cộng, cửa hàng, siêu thị và có các hình


thức chế tài xử lí người vi phạm việc hút thuốc nơi công cộng
thức chế tài xử lí người vi phạm việc hút thuốc nơi công cộng
.

.
-
-
Tăng giá thuốc lá để hạn chế một số lượng đối tượng thu nhập thấp ý thức giảm số
Tăng giá thuốc lá để hạn chế một số lượng đối tượng thu nhập thấp ý thức giảm số


lượng thuốc lá hút vào mỗi ngày.
lượng thuốc lá hút vào mỗi ngày.
-
-
Yêu cầu hạn chế hút thuốc ở các nhà hàng.
Yêu cầu hạn chế hút thuốc ở các nhà hàng.
Nhóm rất hi vọng những ý kiến trên sẽ có những tác dụng nhất định đối với chiến dịch
Nhóm rất hi vọng những ý kiến trên sẽ có những tác dụng nhất định đối với chiến dịch


đẩy lùi tác hại của thuốc lá trong cộng đồng.
đẩy lùi tác hại của thuốc lá trong cộng đồng.
18
18

×