Tải bản đầy đủ (.doc) (28 trang)

tiểu luận kinh tế lượng các yếu tố ảnh hưởng tới thời gian giấc ngủ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (249.44 KB, 28 trang )

TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG
KHOA KINH TẾ QUỐC TẾ

TIỂU LUẬN KINH TẾ LƯỢNG

ĐỀ TÀI: PHÂN TÍCH CÁC YẾU TỐ ẢNH HƯỞNG ĐẾN
THỜI GIAN NGỦ CỦA CON NGƯỜI
Nhóm thực hiện: 7
Lớp tín chỉ: KTE309.2
Giảng viên hướng dẫn: TS. Chu Thị Mai Phương
Nhóm sinh viên thực hiện:
1.
2.
3.
4.
5.

Bùi Thị Hồng
Chu Minh Châu
Nguyễn Lê Hiền Nhi
Trần Thị Thuỳ Trang
Nguyễn Hữu Phúc

1711120071
1711120025
1617720044
1617720059
1612210178

Hà Nội, ngày 30 tháng 03 năm 2020



MỤC LỤC

DANH MỤC CÁC BẢNG.............................................................................................................. 4
LỜI GIỚI THIỆU............................................................................................................................... 5
1. Tính cấp thiết của đề tài......................................................................................................... 5
2. Mục đích nghiên cứu............................................................................................................... 5
3. Đối tượng và phạm vi nghiên cứu.................................................................................... 5
4. Phương pháp nghiên cứu...................................................................................................... 5
5. Bố cục đề tài................................................................................................................................... 6
CHƯƠNG I: TỔNG QUAN VỀ ĐỀ TÀI............................................................................. 7
1.1. Tổng quan về vai trò của thời gian ngủ với con người................................... 7
1.2. Tình hình nghiên cứu liên quan tới đề tài.............................................................. 7
CHƯƠNG II: MIÊU TẢ DỮ LIỆU THỐNG KÊ........................................................... 9
2.1. Mô tả các biến khả dụng.................................................................................................... 9
2.2.1. Chạy lệnh DES

9

2.2.2. Chạy lệnh SUM

9

2.2.3. Chạy lệnh TAB

10

2.2. Mô hình hồi quy và sự tương quan giữa các biến.......................................... 14
2.2.1. Thiết lập mô hình


14

2.2.2. Xét tương quan giữa các biến phụ thuộc

15

2.2.3. Xét mối quan hệ tương quan giữa các biến

16

2.2.4. Dùng lệnh Regression

16

CHƯƠNG III: KIỂM ĐỊNH GIẢ THUYẾT.................................................................. 19
3.1. Kiểm định hệ số hồi quy riêng.................................................................................... 19
3.1.1. Kiểm định T

19

3.1.2. Phương pháp kiểm định P-value

19

3.1.3. Kiểm định ý nghĩa tổng thể của mẫu

20

3.1.4. Kiểm định đa cộng tuyến


21

CHƯƠNG IV: KIỂM CHỨNG MÔ HÌNH...................................................................... 22


4.1. Đa cộng tuyến......................................................................................................................... 22
4.2. Phương sai sai số không đồng nhất.......................................................................... 24
KẾT LUẬN........................................................................................................................................... 26
TÀI LIỆU THAM KHẢO........................................................................................................... 27
ĐÓNG GÓP THÀNH VIÊN....................................................................................................... 28


DANH MỤC CÁC BẢNG
Ký hiệu

Tên

Trang

Bảng 1

Kết quả từ chạy lệnh DES

6

Bảng 2

Kết quả từ chạy lệnh SUM

7


Bảng 3

Kết quả từ chạy lệnh TAB

8

Bảng 4

Kết quả từ chạy lệnh TAB với ceduc

9

Bảng 5

Kết quả từ chạy lệnh TAB với cgdhlth

10

Bảng 6

Kết quả từ chạy lệnh TAB với cmarr

11

Bảng 7

Kết quả từ chạy lệnh TAB với ctotwrk

12


Bảng 8

Kết quả từ chạy lệnh TAB với cyngkid

13

Bảng 9

Kết quả của chạy biến Corr với các biến độc lập

14

Bảng 10

Kết quả dùng lệnh regression để thiết lập phương trình hồi quy

14

Bảng 11

Kết quả từ việc chạy hàm với 5 biến độc lập

18

Bảng 12

Kết quả chạy kiểm định hàm với 4 biến độc lập

21


Tóm tắt: Mục tiêu của bài luận là tìm hiểu những yếu tố ảnh hưởng tới thời gian ngủ. Số liệu
được phân tích, đánh giá qua việc chạy mô hình hồi quy trên phần mềm Stata.


5

LỜI GIỚI THIỆU
1. Tính cấp thiết của đề tài
Theo tháp nhu cầu của Maslow, mong muốn có đủ thức ăn, nước uống, ngủ nghỉ, hoạt động...
đều là những nhu cầu cơ bản và thiết yếu của con người. Tuy nhiên, thiếu ngủ đã trở thành
vấn nạn chung của đời sống ngày nay. Không ngủ đủ giấc có thể ảnh hưởng đến tâm trạng, trí
nhớ và sức khỏe, gây nên những bệnh lý như trầm cảm, kiệt sức, các vấn đề về trí nhớ, cân
nặng, huyết áp cao, tiểu đường, đau tim hoặc đột quỵ… Vì vậy, hầu như tất cả các chuyên gia
sức khỏe đều khuyên mọi người nên ăn, ngủ và làm việc vừa phải và hợp lý.
Có nhiều yếu tố quyết định chất lượng giấc ngủ, trong đó, quan trọng nhất là thời gian ngủ. Lý
do dẫn đến việc thiếu thời gian ngủ có thể là do áp lực công việc, trình độ học vấn (những
người có trình độ học vấn cao hơn thường ngủ ít hơn những người có trình độ học vấn thấp
hơn), khác biệt giới tính, v.v ... Việc cho trẻ ăn cũng khiến phụ huynh ngủ ít hơn bình thường.
Việc xác định yếu tố chính làm ảnh hưởng tới thời lượng giấc ngủ tới giờ vẫn là một chủ đề
gây tranh cãi. Nhận thấy tính cấp thiết của đề tài, nhóm chúng em quyết định chọn chủ đề này
để thực hiện nghiên cứu. Thông qua đề tài "Các yếu tố ảnh hưởng tới thời gian giấc ngủ",
nhóm chúng em hy vọng có thể làm sáng tỏ vấn đề bằng cách định lượng các yếu tố dựa trên
kết quả khảo sát thực tế.

2. Mục đích nghiên cứu
Mục đích nghiên cứu là tìm ra mối liên hệ giữa thời gian ngủ với các yếu tố như thời gian làm
việc, tình trạng hôn nhân, con cái, giới tính… Qua đó sáng tỏ vấn đề yếu tố nào ảnh hưởng
nhiều đến thời gian ngủ, mức độ tác động của nó ra sao. Theo phán đoán chủ quan ban đầu
của nhóm thì thời gian làm việc sẽ ảnh hưởng nhiều đến thời gian ngủ, ngoài ra các yếu tố

khác cũng tiềm ẩn khả năng thời gian ngủ như: tình trạng hôn nhân, tình trạng con cái.

3. Đối tượng và phạm vi nghiên cứu
Nghiên cứu những tác động và các yếu tố ảnh hưởng đến biến Cslpnap. Phạm vi nghiên cứu
dựa trên số liệu từ 239 người tham gia khảo sát được thực hiện trong hai năm 1975 và 1981,
với 20 biến được đem ra nghiên cứu.

4. Phương pháp nghiên cứu
Trong báo cáo này, nhóm 7 sử dụng phương pháp phân tích định lượng. Nhóm thực hiện các lệnh
để quan sát mẫu, thống kê những biến khả dụng, và ước lượng mô hình hồi quy tuyến tính bằng
phương pháp bình phương thông thường nhỏ nhất (OLS). Sau khi phân tích số liệu, kiểm


6

định và xây dựng độ tin cậy, nhóm sẽ rút ra kết luận nhân tố nào có tác động tới thời gian ngủ.
Công cụ chính được sử dụng là phần mềm Stata phiên bản 12.0.

5. Bố cục đề tài
Bài báo cáo gồm 3 phần:


Phần I: Tổng quan đề tài



Phần II: Thống kê và phân tích dữ liệu




Phần III: Kết luận

Chúng em xin chân thành cảm ơn sự giúp đỡ tận tình của giảng viên Chu Thị Mai Phương
trong quá trình làm bài. Vì hạn chế về thời gian và khả năng hiểu biết, chắc chắn bài báo cáo
không tránh khỏi thiếu sót. Chúng em mong nhận được sự góp ý từ cô để hoàn thiện và phát
triển đề tài này.


7

CHƯƠNG I: TỔNG QUAN VỀ ĐỀ TÀI
1.1. Tổng quan về vai trò của thời gian ngủ với con người
Giấc ngủ đóng vai trò rất quan trọng với con người. Giấc ngủ điều chỉnh đồng hồ sinh học của
cơ thể, giúp cho bộ não được nghỉ ngơi, loại trừ stress, tăng cường khả năng tập trung, trí nhớ
và sự sáng suốt. Trong đó, thời gian ngủ là yếu tố then chốt quyết định tới chất lượng của giấc
ngủ. Một giấc ngủ được cho là phù hợp nếu có thời gian khoảng 7-8 tiếng/ngày, Theo một
nghiên cứu khoa học gần đây thì để cho đầu óc được minh mẫn, con người mỗi đêm cần ngủ 7
giờ, không nên ngủ nhiều hơn hay ít hơn.
Trong cuộc nghiên cứu Nurses' Health của tiến sĩ khoa học Elizabeth Devore ở bệnh viện
Brigham ở Boston (Mỹ), sử dụng dữ liệu của 15.000 phụ nữ mỗi đêm ngủ 5 giờ và ít hơn nữa
cho thấy chỉ số minh mẫn thấp hơn mức tiêu chuẩn, thấp hơn so với những người mỗi đêm
ngủ 7 giờ. Phụ nữ ngủ 9 giờ hoặc nhiều hơn nữa cũng cho thấy chỉ số minh mẫn thấp hơn so
với những người mỗi đêm ngủ 7 giờ.
Từ đó, tiến sĩ khoa học Elizabeth Devore kết luận về mối liên hệ giữa thời gian ngủ và sự
minh mẫn ở lứa tuổi trung niên và tuổi già. Việc mỗi đêm ngủ dưới 7 giờ làm tăng nguy cơ bị
bệnh tim mạch và tiểu đường. Do vậy ngủ ít quá hay nhiều quá đều không tốt cho sức khỏe
con người, gây rối loạn khiến cơ thể dễ rơi vào tình trạng mệt mỏi về cả thể chất lẫn tinh thần.
Từ đó làm giảm chất lượng cuộc sống của bạn. Vì thế, chúng ta cần xem xét các yếu tố tác
động lên thời gian ngủ để từ đó có cách cải thiện, giúp nâng cao chất lượng giấc ngủ, nâng cao
chất lượng cuộc sống.


1.2. Tình hình nghiên cứu liên quan tới đề tài
Vấn đề “Thời gian ngủ và các nhân tố ảnh hưởng” thực sự là một đề tài thú vị và thu hút được
nhiều sự quan tâm nhất là trong cuộc sống hiện nay. Xã hội ngày càng hiện đại và phát triển,
cuộc sống con người càng trở nên phức tạp hơn. Do đó, một giấc ngủ đủ, có chất lượng là
điều mà rất nhiều người mong muốn hiện nay nhưng lại không dễ gì có được. Cuộc sống hiện
đại khiến đa phần chúng ta ngủ ít hơn 7-8 tiếng 1 ngày (thời gian ngủ lý tưởng), một số khác
lại ngủ nhiều hơn 8 tiếng, điều đó khiến chúng ta hầu như luôn trong trạng thái mệt mỏi về thể
chất lẫn tinh thần.
Tổ chức quốc gia nghiên cứu về giấc ngủ Mỹ National Sleep Foundation vừa đưa ra n hững
khuyến cáo mới về thời lượng ngủ riêng cho người khỏe mạnh theo từng nhóm tuổi, hầu hết
đều theo hướng nới rộng khung giờ ngủ.


8

Việc ngủ ít có liên quan đến các vấn đề sức khỏe, bao gồm cả béo phì và huyết áp cao cũng
như năng suất giảm lao động và lái xe buồn ngủ. Ngủ quá nhiều có liên quan với tình trạng
sức khỏe cũng như bệnh tim và tử vong sớm.
Theo kết quả nghiên cứu của GS Franco Cappuccio, thuộc khoa tim mạch và dịch tễ tại ĐH
Warwick (Anh), Thì những người có thời gian ngủ ít hơn 7 tiếng mỗi ngày có tỷ lệ chết sớm
hơn 12% so với nhóm ngủ từ 7-8 tiếng/ngày. Tuy nhiên không phải ngủ càng nhiều thì càng
tốt, mọi chuyện có thể còn tệ hơn với những người ngủ quá nhiều. Nhóm những người ngủ
nhiều hơn 8 tiếng mỗi ngày có tỷ lệ chết sớm cao hơn những 30% so với nhóm ngủ ít hơn 7
tiếng/ngày
Ở một nghiên cứu độc lập khác, GS Shawn Youngstedt thuộc ĐH Bang Arizona (Mỹ) kết luận
người trưởng thành không nên ngủ quá nhiều. Shawn đã yêu cầu 14 người lớn ngủ thêm 2 tiếng
mỗi tối trong suốt 3 tuần lễ. Kết quả, hàm lượng protein IL-6 trong máu của những người được
khảo sát tăng lên cao, dẫn đến cảm giác " chán nản" và nguy cơ viêm nhiễm, đau lưng, nhức mỏi.
Theo GS Youngstedt, đây có thể là hệ quả của việc nằm bất động lâu trong thời gian dà Kết quả

của hàng loạt nghiên cứu sau nhiều năm đã chỉ ra quá nhiều nhân tố có thể chi phối thời gian ngủ
của mỗi người. Tuy nhiên, chưa có nghiên cứu nào đủ rộng và đủ cơ sở chắc chắn

để có thể mang tính đại diện. Đây sẽ là đề tài được nhiều nhà nghiên cứ u, nhiều nhà giáo dục
cũng như học sinh, sinh viên tiếp tục tìm hiểu trong tương lai.


9

CHƯƠNG II: MIÊU TẢ DỮ LIỆU THỐNG KÊ
2.1. Mô tả các biến khả dụng
2.2.1. Chạy lệnh DES

Thông tin quan trọng nhất sau khi sử dụng lệnh DES là tên biến
des cslpnap ceduc cgdhlth cmarr ctotwrk cyngkid.
Tên biến

Dạng lưu trữ

Hình thức

Tên Biến

cslpnap

int

%9.0g

change in slnap


ceduc

byte

%9.0g

change in educ

cgdhlth

byte

%9.0g

change in gdhlth

cmarr

byte

%9.0g

change in marr

ctotwrk

int

%9.0g


change in totwrk

cyngkid

byte

%9.0g

change in yngkid

Bảng 1. Kết quả từ chạy lệnh DES

Bằng việc sử dụng lệnh DES chúng ta biết rõ về các biến. Theo các kết quả, chúng ta có:


cslpnap: change in slpnap



ceduc: change in educ



cgdhlth: change in ghdlth



cmarr: change in marr




ctotwrk: change in totwrk



cyngkid: change in yngkid

2.2.2. Chạy lệnh SUM
Lệnh sum cho biết số lượng quan sát (Obs), giá trị trung bình (mean), độ lệch chuẩn (std. dev.)
cũng như giá trị lớn nhất (max) và nhỏ nhất (min) của các biến:


10

sum cslpnap ceduc cgdhlth cmarr ctotwrk cyngkid.
Sử dụng lệnh SUM trên 239 mẫu quan sát chúng ta có:

Biến

Số lượng

Giá trị trung

Độ lệch

Giá trị nhỏ

Giá trị lớn


quan sát

bình

chuẩn

nhất

nhất

cslpnap

239

-52.6569

642.2038

-2434

1940

ceduc

239

0.3723849

0.804028


0

5

cgdhlth

239

-0.1841004

0.5099826

-1

1

cmarr

239

-0.0083682

0.4200003

-1

1

ctotwrk


239

-281.0921

1087.289

-4325

2797

cyngkid

239

-0.0711297

0.448109

-1

1

Bảng 2. Kết quả từ chạy lệnh SUM
2.2.3. Chạy lệnh TAB
Lệnh TAB1 cho phép mô tả đồng thời nhiều hơn 1 biến số với tần suất xuất hiện và phân phối
xác suất của biến.
tab1 cslpnap ceduc cgdhlth cmarr ctotwrk cyngkid
Thay đổi trong

Tần suất


Tỉ lệ

Tích luỹ

slpnap
-2434

1

0.42

0.42


11

-2406

1

0.42

0.84

-2181

1

0.42


1.26

-1996

1

0.42

1.67

-1728

1

0.42

2.09

-1693

1

0.42

2.51






...

...

1242

1

0.42

97.91

1253

1

0.42

98.33

1264

1

0.42

98.74

1297


1

0.42

99.16

1367

1

0.42

99.58

1940

1

0.42

100.00

Tổng

239

100.00

Bảng 3. Kết quả


từ chạy lệnh TAB

Ví dụ phân tích thông tin từ bảng:
+ Biến cslpnap dao động từ - 2434 à 1940

Thay đổi trong educ

Tần suất

Tỉ lệ

Tích luỹ

0

183

76.57

76.57

1

32

13.39

89.96



12

2

20

8.37

98.33

3

1

0.42

98.74

4

1

0.42

99.16

5

2


0.84

100

Tổng

239

100.00

Bảng 4. Kết quả chạy lệnh TAB với educ
Ví dụ phân tích thông tin từ bảng:
+ Biến ceduc dao động từ 0 đến 5
+ Gía trị phổ biến nhất của biến là 0

Thay đổi trong

Tuần suất

Tỉ lệ

Tích luỹ

-1

57

23.85


23.58

0

169

70.71

94.56

1

13

5.44

100.00

Tổng

239

100.00

gdhlth

Bảng 5. Kết quả chạ y lệnh TAB với cgdhlth
Ví dụ phân tích thông tin từ bảng:
+ Biến cgdhlth dao động từ -1 đến 1
+ 70,71% quan sát ở giá trị cgdhlth=0


Thay đổi trong marr

Tuần suất

Tỷ lệ

Tích luỹ


13

-1

22

9.21

9.21

0

197

82.43

91.63

1


20

8.37

100.00

Tổng

239

100.00

Bảng 6. Kết quả chạy TAB với cmarr
Ví dụ phân tích thông tin từ bảng
+ Biến cmarr dao động trong khoảng từ -1 đến 1
+ 82,43% quan sát ở giá trị cmarr=0
Thay đổi trong

Tuần suất

Tỉ lệ

Tích luỹ

-4325

1

0.42


0.42

-3495

1

0.42

0.84

-3021

1

0.42

1.26

-2975

1

0.42

1.67

-2880

1


0.42

2.09

-2725

1

0.42

2.51

totwrk

…..

……..

……..

……….

2210

1

0.42

98.74


2357

1

0.42

99.16


14

2524

1

0.42

99.58

2797

1

0.42

100.00

Tổng

239


100.00

Bảng 7. Kết quả chạy TAB với ctotwrk
Phân tích thông tin từ bảng
+ Biến ctotwrk dao động trong khoảng từ -4325 đến 2797
+ Các quan sát có phân phối xác suất giống nhau (0,42%)

Thay đổi trong

Tuần suất

Tỉ lệ

Tích luỹ

-1

33

13.81

13.81

0

190

79.50


93.31

1

16

6.69

100.00

Tổng

239

100

yngkid

Bảng 8. Kết quả chạy lệnh TAB với cyngkid
Phân tích thông tin từ bảng
+ Biến cyngkid dao động trong khoảng từ -1 đến 1
+ 79,50% quan sát ở giá trị cyngkid =0 (sửa lại số liệu ở trên)

2.2. Mô hình hồi quy và sự tương quan giữa các biến
2.2.1. Thiết lập mô hình
a. Mô hình
Mô hình hồi quy mô tả mối quan hệ giữa biến phụ thuộc cslpnap và các biến độc lập ceduc,
cgdhlth, cmarr, ctotwrk, cyngkid theo phương trình



15

(PRF) cslpnap=0+1 ceduc+ 2 ×cgdhlth+ 3 ×cmarr+ 4 ×ctotwrk+ 5 ×cyngkid+ ui
(SRF) cslpnap=0+1 ceduc+ 2 ×cgdhlth+ 3 ×cmarr+ 4 ×ctotwrk+ 5 ×cyngkid+ u

b. Ý nghĩa các biến
Biến độc lập: Cslpnap (Y)
Các biến phụ thuộc
Tên biến

Ý nghĩa

Dự

đoán Ý nghĩa

tương quan
Biến

ceduc

số

(X1)
cgdhlth

Change in educ

+


Giá trị cslpnap tăng khi Xceduc
tăng

Change in gdhlth +

Giá trị cslpnap tăng khi

(X2)
cmarr

Xcgdhlth tăng
Change in marr

+

Giá trị cslpnap tăng khi Xcmarr

(X3)
ctotwrk

tăng
Change in totwrk -

Giá trị cslpnap giảm khi

(X4)
cyngkid

Xctotwrk tăng
Change in yngkid +


Giá trị cslpnap tăng khi

(X5)

Xcyngkid tăng

2.2.2. Xét tương quan giữa các biến phụ thuộc
Sử dụng lệnh CORR. corr cslpnap ceduc cgdhlth cmarr ctotwrk cyngkid
cslpnap

ceduc

cgdhlth

cmarr

ctotwrk

ctotwrk


16

cslpnap

1.000

ceduc


0.0118

1.0000

cgdhlth

0.0460

-0.0883

1.0000

cmarr

0.0479

-0.0778

-0.0072

1.0000

ctotwrk

-0.3700

-0.0478

0.0501


0.0433

1.0000

cyngkid

0.0160

0.0738

-0.0575

-0.0478

0.1115

1.0000

Bảng 9. Kết quả của chạy biến Corr với các biến độc lập
2.2.3. Xét mối quan hệ tương quan giữa các biến

Hệ số tương quan giữa cslpnap và ceduc là đồng biến


Hệ số tương quan giữa cslpnap và cgdhlth là đồng biến



Hệ số tương quan giữa cslpnap và cmarr là đồng biến




Hệ số tương quan giữa cslpnap và cyngkid là nghịch biến



Hệ số tương quan giữa cslpnap và cyngkid là đồng biến

Nhìn chung, các biến độc lập có tương quan khá yếu với biến phụ thuộc. Cá biệt có biến
ctotwrk có tương quan mạnh nhất ( -0.3700). Ngoài hệ số tương quan âm của biến ctwrwrk,
các biến độc lập còn lại có hệ số tương quan dương cho thấy chúng ảnh hưởng đến biến phụ
thuộc theo cùng một hướng.
Mối quan hệ tương quan giữa các biến độc lập cũng yếu, hệ số thấp nhất là -0,0072 giữa biến
cgdhlth và biến cmarr. Các biến độc lập có hế số tương quan <0.8, vì vậy mô hình không gặp
phải hiện tượng đa cộng tuyến.
2.2.4. Dùng lệnh Regression
Dùng lệnh regress để thiết lập phương trình hồi quy thu được kết quả như sau

Nguồn

SS

df

MS

Number of obs = 239
F (5, 233) = 8.19

Mô hình


14674698.2

5

2934939.64


17



83482611.7

233

358294.471

Tổng

98157309.9

238

412425.672

Prob > F = 0.0000
R-squared = 0.1495
Adj R-squared = 0.1313
Root SME = 598.58


cslpnap

Coef.

Std. Err

t

P>|t|

[95% Conf. Interval]

ceduc

-.0244717

48.75938

-0.00

1.000

-96.09008

96.04113

cgdhlth

87.57785


76.59913

1.14

0.254

-63.33578

238.4933

cmarr

104.2139

92.85536

1.12

0.263

-78.72946

287.1574

ctotwrk

-.2266694

.036054


-6.29

0.000

-.2977029

-.1556359

cyngkid

95.6654

87.65252

1.08

0.281

-78.02739

267.3582

_cons

-92.63404

45.8659

-2.02


0.045

-182.9989

-2.269152

Bảng 10. Kết quả dùng lệnh regression để thiết lập phương trình hồi quy

Phương trình hồi quy thu được:
cslpnap=-92.63404 - 0.0244717ceduc+87.57785cgdhlth+ 104.2139 ×cmarr -0.2266694
ctotwrk+94.6654 cyngkid+ ui
Phương trình hồi quy mẫu:
cslpnap=-92.63404 - 0.0244717ceduc+87.57785cgdhlth+ 104.2139 ×cmarr-0.2266694
ctotwrk+94.6654 cyngkid
Hoặc:
Y=-92.63404 - 0.0244717X1+87.57785X2+ 104.2139 ×X3-0.2266694 ×X4+94.6654 ×X5
Ý nghĩa hệ số R – squared
Từ mô hình cho ta hệ số R – squared = 0.1495. Có nghĩa là các biến độc lập là trình độ học
vấn, tình trạng con cái, tình trạng hôn nhân, tình trạng sức khỏe, thời gian làm việc trong tuần
chỉ giải thích được 14.95% cho thời gian ngủ hàng tuần cho người được tham gia khảo sát.


18


19

CHƯƠNG III: KIỂM ĐỊNH GIẢ THUYẾT
3.1. Kiểm định hệ số hồi quy riêng

3.1.1. Kiểm định T
Mục đích của kiểm định là để kiểm tra ảnh hưởng của mỗi biến độc lập, bao gồm các biến ceduc,
cgdhlth, cmarr, ctotwrk, cyngkid lên giá trị kì vọng của biến phụ thuộc, tức biến myopia. Trong
phần này, nhóm nghiên cứu sử dụng kiểm định hai mặt với cặp giả thiết { 0: & = 0 1: &≠0
Dựa trên dữ liệu thu thập từ bảng Stata trên, ta có
Var
PT
Cặp giả thuyết
Critical t
Kết luận
,*,
.*,-

*

Ceduc

{ *:

./01.

=0

3: ./01.

≠0

4

56785


9: *

- 1.972

=

Không đủ bằng chứng
để bác bỏ

;/ 4567859

0.00
Cgdhlth

{

:
=0
* .<0=>?=
3

:

.<0=>?=

*

≠0
4


5@7ABCA9: *

;/ 4

= 1.972

Không đủ bằng chứng
để bác bỏ

5@7ABCA9

1.14
Cmarr

{ *:

.DEFF

= 03

:

.DEFF

*

≠0

= 1.972


45GHII9: *

Không đủ bằng chứng
để bác bỏ

;/ 495GHI

1.12
{

Ctotwrk

:

* .?J?KFL

=0

3

:

.?J?KFL

*

≠0
4


= - 1.972

5CMCNIO9: *

;/ 4

Bác bỏ

*

5CMCNIO9

6.29
Cyngkid
{

*: .PQ
= 03

:

.PQ
≠0

= 1.972
4

5ST@OU7


;/ 4

Không đủ bằng chứng

9: *

5ST@OU79

để bác bỏ

1.08

*

Kết luận: Tại mức ý nghĩa 5%, hệ số dốc của biến ctotwrk có ý nghĩa thống kê.
3.1.2. Phương pháp kiểm định P-value
Nhóm nghiên cứu cũng sử dụng phương pháp kiểm định P- value để kiểm định hệ số của các
biến.


20

Trước tiên, ta có cặp giả thiết: { 0: & = 0 1: & ≠ 0
Dựa trên dữ liệu từ Stata, có thể dễ dàng thấy rằng:
-

P-value của ceduc: 1.000

-


P-value của cgdhlth: 0.254

-

P-value của cmarr: 0.263

-

P-value của ctotwrk: 0.000

-

P-value của cyngkid: 0.045

Chỉ có p-value của ctotwrk là nhỏ hơn mức ý nghĩa = 0.05do đó ta phủ nhận 0 và chấp nhận 1. Do đó, hệ số hồi
quy của ctotwrk là có ý nghĩa thống kê.

Hơn nữa, kết quả thu được từ phương pháp kiểm định P-value cũng giống với kết quả thu
được từ phương pháp kiểm định T phía trên.

3.1.3. Kiểm định ý nghĩa tổng thể của mẫu
Kiểm định F này đánh giá giả thuyết H0 rằng tất cả các hệ số của các biến độc lập đều bằng 0
và giả thuyết H1 là giả thuyết có ít nhất một hệ số bằng 0.
Ta thiết lập cặp giả thiết như sau:
{ 0: 1= 2= 3=⋯= 6=0 1: ớ í ℎấ R≠0 hoặc tương đương:
{

0:


2

1:

=0

2

≠0

(Với mức ý nghĩa: α = 0.05)
]2 /L

F=

= 8.19
(1:]2)(Q:L:1)

0.05(5,233)

= 2.25 (theo bảng phân phối F)

Ta có Fs > (5,233), do đó ta phủ định
0 và chấp nhận 1
Ta cũng có thể thực hiện kiểm định trên Stata và thu được kết quả:
0.05

test ceduc cgdhlth cmarr ctotwrk cyngkid
( 1)


ceduc = 0

( 2)

cgdhlth = 0


21

( 3)

cmarr = 0

( 4)

ctotwrk = 0

( 5)

cyngkid = 0

F ( 5, 223) = 8.19
Prob > F = 0.0000
Bảng 11: Kết quả từ việc chạy hàm với 5 biến độc lập
Từ kết quả có thể thấy, P-value cho kiểm định F của kiểm định ý nghĩa tổng thể là thấp hơn
mức ý nghĩa (0.0000<0.05), do đó ta phủ định 0 và chấp nhận 1, điều đó có nghĩa là các hệ số
của biến độc lập không đồng thời bằng 0. Kết luận, mô hình hồi quy là phù hợp.

3.1.4. Kiểm định đa cộng tuyến
Cho rằng bộ gồm 4 yếu tố ceduc, cgdhlth, ctotwrk, cyngkid không có ảnh hưởng lên biến độc

lập, tức là giá trị kì vọng của lương là bằng với giá trị doanh thu bán hàng, lợi nhuận trên vốn
chủ sở hữu và lợi nhuận từ cổ phiếu của công ty.
Do đó, giả thuyết của chúng ta sẽ là:
{

0: 1= 2=

4=

5=0

1:

ớ í ℎấ

1, 2, 4, 5

≠0

Sử dụng lệnh kiểm định trên Stata với 4 biến: ceduc, cgdhlth, ctotwrk, cyngkid để kiểm định,
ta thu được kết quả:
test ceduc cgdhlth ctotwrk cyngkid
( 1)

ceduc = 0

( 2)

cgdhlth = 0


( 3)

ctotwrk = 0

( 4)

cyngkid = 0

F( 4, 233) = 10.08
Prob > F = 0.0000
Bảng 12: Kết quả chạy kiểm định hàm với 4 biến độc lập


22

Như đã thấy từ kết quả trong Bảng 11, P-value cho kiểm định F của kiểm định ý nghĩa tổng
thể là thấp hơn mức ý nghĩa (P-value <0.05). Do đó ta phủ nhận 0 và chấp nhận 1.
Bài báo cáo trên của nhóm 8 chúng em đã tiến hành chạy mô hình hồi quy với 239 mẫu quan sát,
trong đó biến phụ thuộc cần nghiên cứu là thời gian ngủ (cslpnap) dựa vào phân tích mối tương
quan với 5 biến độc lập rời rạc khác là: thời gian làm việc (ctotwrk),tình trạng sức khỏe (cgdhlth),
tình trạng hôn nhân (cmarr), số lượng con cái (cyngkid) và trình độ học vấn (ceduc).

Các biến độc lập trong mô hình đều có ảnh hưởng cùng chiều (cgdhlth, cmarr và cyngkid)
hoặc ngược chiều (ctotwrk và ceduc) đến biến phụ thuộc thời gian ngủ với mức độ ảnh hưởng
khác nhau. Trong đó thời gian làm việc (ctotwrk) là các yếu tố tác động lớn nhất tới thời gian
ngủ. Giấc ngủ là lúc cơ thể nghỉ ngơi, lấy lại sức sau một ngày hoạt động. Một giấc ngủ đủ
thời gian sẽ giúp các cơ quan hồi phục để có thể tiếp tục hoạt động.
Tuy nhiên, trong khuôn khổ mẫu quan sát, các biến được chỉ ra hầu hết là nguyên nhân khách
quan, chưa mang tính đại diện.
Bên cạnh đó, dù không thể phủ nhận tầm quan trọng của thời gian ngủ, nhưng cũng không phải

yếu tố duy nhất để đánh giá chất lượng của giấc ngủ. Còn rất nhiều yếu tố khách quan tác động

lên giấc ngủ như môi trường, tư thế ngủ… Các nhà khoa học đã chứng minh rằng, thời gian
ngủ tốt cho sức khỏe nhất là 8 tiếng 1 ngày, ngủ ít quá hay nhiều quá đều không tốt cho cơ thể,

khiến cơ thể rơi vào tình trạng mệt mỏi, dẫn tới làm việc kém hiệu quả. Vì vậy để đáp có một
giấc ngủ có chất lượng giúp cơ thể hồi phục tốt nhất, chúng ta cần chú ý thời gian ngủ, thông
qua việc cân đối, sắp xếp các yếu tố khác tác động lên nó như một số ví dụ chúng tôi nêu trong

bài, bên cạnh đó cũng cần chú ý tới các yếu tố khách quan khác.

CHƯƠNG IV: KIỂM CHỨNG MÔ HÌNH
4.1. Đa cộng tuyến
Tại sao là đa cộng tuyến?
Nếu mục tiêu chỉ là dự đoán Y từ một tập hợp các biến X, thì đa cộng tuyến không phải là vấn đề.
Các dự đoán sẽ vẫn chính xác và R2 tổng thể (hoặc R2 được điều chỉnh) định lượng mức độ mô
hình dự đoán các giá trị Y chính xác như thế nào. Nếu mục tiêu là để hiểu các biến X khác nhau
ảnh hưởng đến Y như thế nào, thì đa cộng tuyến là một vấn đề lớn. Một vấn đề là các giá trị P
riêng lẻ có thể gây hiểu nhầm (giá trị P có thể cao, mặc dù biến là quan trọng). Vấn đề thứ hai là
khoảng tin cậy trên các hệ số hồi quy sẽ rất rộng. Khoảng tin cậy thậm chí có thể bao gồm 0, điều
đó có nghĩa là không thể khẳng định liệu việc tăng giá trị X có liên quan đến tăng hay giảm, trong
Y. Bởi vì khoảng tin cậy rất rộng, ngoại trừ một đối tượng (hoặc thêm một


23

đối tượng mới) có thể thay đổi đáng kể các hệ số và thậm chí có thể thay đổi các dấu hiệu của
chúng. Có ba nguồn sơ cấp của đa cộng tuyến:
- Phương pháp thu thập dữ liệu
- Những ràng buộc về mô hình hoặc trong dân số

- Mô hình xác định
Điều quan trọng là phải hiểu sự khác biệt giữa các nguồn của đa cộng tuyến này, vì các
khuyến nghị để phân tích dữ liệu và giải thích mô hình kết quả phụ thuộc vào một mức độ nào
đó vào nguyên nhân của vấn đề. Phương pháp thu thập dữ liệu có thể dẫn đến các vấn đề đa
cộng tuyến khi các nhà phân tích chỉ lấy một không gian con của vùng hồi quy. Các ràng buộc
của mô hình hoặc trong quần thể được lấy mẫu có thể gây ra đa cộng tuyến. Một mô hình
được xác định có nhiều biến hồi quy hơn số lượng quan sát. Những mô hình này đôi khi gặp
phải trong nghiên cứu y học và hành vi, trong đó có thể chỉ có một số lượng nhỏ đối tượng
(đơn vị mẫu) có sẵn và thông tin được thu thập cho một số lượng lớn các biến hồi quy trên
mỗi đối tượng. Cách tiếp cận thông thường để đối phó với tính đa cộng tuyến trong bối cảnh
này là loại bỏ một số biến hồi quy khi xem xét.
Tác dụng của đa cộng tuyến
Để đánh giá tính đa cộng tuyến, cần lưu ý rằng mỗi biến số độc lập (X) được dự đoán chính
xác như thế nào từ các biến X khác. Và giá trị của yếu tố lạm phát phương sai (VIF) là gì. Khi
giá trị VIF cao đối với bất kỳ biến X nào, mức độ phù hợp sẽ bị ảnh hưởng bởi đa cộng tuyến
Bài tiểu luận sử dụng chức năng vif để kiểm tra tính đa cộng tuyến của mô hình. Nếu ít nhất
một trong các hệ số có giá trị vif> 10, chúng ta có thể đi đến kết luận rằng mô hình có tính đa
cộng tuyến.
Kết quả như sau:
vif
Biến

VIF

i/VIF

cyngkid

1.02


0.975814

ceduc

1.02

0.979500

ctotwrk

1.02

0.979640


24

cgdhlth

1.01

0. 986517

cmarr

1.01

0.989806

Mean VIF


1.02

Giá trị trung bình vif= 1,02 <10, do đó tính đa cộng tuyến không xảy ra trong mô hình này.

4.2. Phương sai sai số không đồng nhất
Phương sai không đồng nhất phù hợp với hồi quy tuyến tính trong đó phương sai là hàm số
mũ của các hiệp phương sai mà bạn chỉ định. Nó cho phép bạn mô hình hóa sự không đồng
nhất. Khi chúng ta khớp các mô hình bằng cách sử dụng bình phương tối thiểu thông thường
(hồi quy), chúng ta giả sử rằng phương sai của phần dư là không đổi. Nếu nó không phải là
hằng số, hồi quy báo cáo các lỗi tiêu chuẩn sai lệch, dẫn đến suy luận không chính xác.
Giả thuyết bị vi phạm gây ra sự không đồng nhất. Kết quả của tính không đồng nhất là giá trị
bình phương ước tính tối thiểu không hiệu quả.
{

*:

ℎươ

ố đồ

ℎấ

3:

ố ℎô

ℎươ

đồ


ℎấ

Do đó, nếu giá trị p nhỏ hơn 0,05



Bác bỏ H0 và chấp nhận H1.

Kết quả như sau

imtest, white
White's test cho Ho: homoskedasticity
against Ha: unrestricted heteroskedasticity
chi2(20) = 28.35
Prob > chi2 = 0.1015
Cameron & Trivedi's decomposition of IM Test
Nguồn

chi2

df

p


25

PSSS không đồng


28.35

20

0.1015

Độ lệch (Skewness)

17.06

5

0.0044

Độ nhọn (Kurtosis)

4.16

1

0.0414

Tổng

49.56

26

nhất


Như có thể thấy rõ từ bảng, giá trị P liên quan đến phép thử độ không đồng nhất lớn hơn
ngưỡng (P-value = 0.1015> 0,05). Vì vậy, chúng ta không thể bác bỏ giả thuyết ban đầu nếu
phương sai sai số đồng nhất


chấp nhận H0 và bác bỏ H1.


×