Tải bản đầy đủ (.pdf) (15 trang)

THỐNG KÊ MÔ TẢ, ĐẠI HỌC Y TẾ CÔNG CỘNG

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (142.81 KB, 15 trang )

1
Thng kê mô t
1 Tìm hiu s liu
2i và lu tp tin s liu So lieu NC THA.sav t trang web elearning ca khóa
c vào máy tính ca bn.
 liu này ly t nghiên cu v tình trng và các yu t nguy c ca tng huyt áp
 ngi cao tui
Sinh viên thc hin quá trình làm sch s liu  tìm hiu và chun b s liu cho phân
tích.
2 Thng kê mô t
Thng kê mô t nhm mc ích mô ti tng nghiên cu và nhng yu t nguy c
liên quan n vn  nghiên cu. Vic mô t mt cách rõ ràng và chính xác thông tin
a i tng nghiên cu giúp cho nhng ngi c báo cáo kt qu nghiên cu hiu rõ
n c m ca nghiên cu và dân s nghiên cu. Các thông tin c chn a ra
trong thng kê mô t liên quan cht chn nhng thông tin trong thng kê suy lun. Vì
y trc khi bn tin hành phân tích thng kê mô t thì bn phi xác nh rõ các bin mà
n cn phi miêu t hay nói mt cách khác bn phi có mt k hoch phân tích rõ ràng.
1 tìm hiu rõ cách lp k hoch phân tích cho toàn b báo cáo bn hãy c
phn 3.2 và 3.3 trong Cun giáo trình Thng kê y t Công cng: phn 2 Phân tích s
liu (trang 48-51). Riêng phn lp k hoch cho phân tích mô t bn hãy c phn
3.4.1 trong tài liu trên
2.1. K hoch phân tích
t cách tóm tt, k hoch phân tích bao gm các bc sau:
1. Xác nh câu hi phân tích. Câu hi này da trên các ni dung mà mc tiêu nghiên
u yêu cu. ây là phn rt quan trng nh hng phân tích theo úng mc
tiêu ca nghiên cu
Ví d:
Click to buy NOW!
P
D
F


-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F

-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
2
c tiêu nghiên cu là: Xác nh yu t nguy c ca li sng liên quan n bnh tng
huyt áp
Câu hi phân tích có th là:

- i sng ít vn ng có phi là yu t nguy c ca bnh tng huyt áp hay không?
-  l tng huyt áp  ngi ít vn ng có cao hn ngi vn ng nhiu hay
không?
- Có s khác nhau v t l mc bnh tng huyt áp  ngi có và ít vn ng
không?
2. Xác nh các gi thuyt trong phân tích (i vi các câu hi phân tích suy lun).
u này giúp cho vic xem xét kt qu phân tích và phiên gii sau này
Ví d:
Câu hi phân tích là:
- Có s khác bit huyt áp tâm thu trung bình gia nam và n hay không?
Gi thuyt:
Ho: HATT trung bình ca nam và n không khác nhau
Ha: HATT trung bình ca nam và n khác nhau
Câu hi:
Mô t HATT trung bình theo hai gii?
Câu hi này không cn và không có gi thuyt vì ây là câu hi yêu cu thc hin
thng kê mô tn thun.
3. Lit kê các bin s và tính cht ca bin s, mi liên qua gia các bin s
Ví d:
a. Trong câu hi “Có s khác bit huyt áp tâm thu trung bình gia nam và n hay
không?” có:
Bin s ph thuc: HATT, là bin nh lng
Bin sc lp: gii tính, là bin nh giá
b. Trong câu hi “Mô t HATT trung bình theo hai gii?” có 2 bin s
Bin s HATT: bin nh lng
Bin s gii tính: bin nh giá
Click to buy NOW!
P
D
F

-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F

-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
3
4. a chn phng pháp trình bày s liu và thng kê thích hp
Ví d:
i vi câu 3a: ây là so sánh trung bình gia hai nhóm i tng c lp à chn

kim nh thng kê t-không ghép cp
i vi câu hi 3b: ây là mô t mi liên quan gia hai bin s, 1 bin nh lng, 1
bin nh tính à la chn cách trình bày nh sau:
- Dùng s thng kê mô t: trung bình và  lch chun ca HATT theo 2 gii (nu
HATT có phân phi chun)
- Dùng  th (biu ): Box-and-Whisker
5. Phiên gii các kt qu: da trên các kt qu tr li mc tiêu nghiên cu
Ngoài ra, cn lu ý là mi loi nghiên cu có nhng quy nh riêng r v cách trình bày
và mô t s liu. Nói chung, nghiên cu ct ngang (nghiên cu mô t) thì c mô t mà
không có so sánh (kim nh thng kê) còn nghiên cu phân tích (thun tp, bnh chng)
luôn có so sánh các yu t liên quan tng ng  tng nhóm. Ví d nghiên cu thun tp
thì phi so sánh các c tính, yu t nguy c khác gia nhóm phi nhim và nhóm không
phi nhim vi yu t mà nhà nghiên cu mun ánh giá; còn nghiên cu bnh chng thì
phi tin hành so sánh các c tính, yu t nguy c khác ca nhng ngi b bnh và
không b bnh.
2.2. La chn i lng mô t bin s
Nh trong các ví d trên, vic chn i lng mô t cho bin liên tc ph thuc vào phân
 ca bin ó. Nu bin có phân b chun, giá tr trung bình và  lch chun c
dùng  mô ti lng c th hin bi bin ó. Nhng nu bin ó không có phân b
chun thì giá tr trung v, khong (giá tr nh nht; giá tr ln nht) c dùng  mô t
cho bin ó.
Click to buy NOW!
P
D
F
-
X
C
H
A

N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A

N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
4
ng 1: La chn i lng mô t 1 bin s
Bin s nh lng Th bc Danh nh
Trình bày s liu - Phân nhóm s
liu
- ng phân phi
n sut
- Có th dùng %
tích lu

- ng phân phi
n sut (sp xp
theo th t)
- Có th dùng %
tích lu
- ng phân phi
n sut (sp xp
theo tn sut)
- Không dùng %
tích lu
 th, biu  Histograms
Box-and-Whisker
Biu  ct ri
Biu  bánh
Biu  ct ri
Biu  bánh
Thng kê tóm tt (phân
phi bình thng)
Trung bình
 lch chun
Phân phi không bình
thng
Trung v
Phm vi (min, max,
phân v)
Không cn thit
ng 2: La chn i lng mô t mi liên quan gia hai bin s
Bin s nh lng Phân loi
nh lng
- Phân tán  (biu 

chm m)
-  s tng quan
- Boxplot
- Case summaries
Phân loi
- Boxplot
- Case summaries
ng chéo (Crosstabs)
Ginh
Các quan sát là c lp
Bin nh lng có phân phi chun
3 Mô t bin snh lng
3.1. Mô t 1 bin s:
Bài tp 1: Mô t các c tính ca dân s nghiên cu nh HATT, HATTr, chiu cao, cân
ng, vòng ngc, vòng bng, BMI
Ví d HATT
c 1: Kim tra tính chun ca bin s:
 histogram có kt qu nh sau:
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E

w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E

w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
5
Huyet ap tam thu
220.0200.0180.0160.0140.0120.0100.0
70
60
50
40
30
20
10
0
Std. Dev = 24.93

Mean = 137.3
N = 190.00
t cách khác  kim tra phân phi chun là s dng s P-P plot (Normal P-P plot)
i menu Graphs – P-P sau ó chn bin cn kim nh vào ô Variable và có kt qu nh
sau:
Normal P-P Plot of Huyet ap tam thu
Observed Cum Prob
1.00.75.50.250.00
Expected Cum Prob
1.00
.75
.50
.25
0.00
ng Normal P-P plot càng nm gn ng chéo ca hình thì phân phi càng có tính
chun.
c 2: Mô t bin s
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w

w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w

w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
6
Huyt áp tâm thu có phân phi chun nên các giá tr trung bình và  lch chun c s
ng  mô t tóm tt bin s này.
Descriptive Statistics
190 90 220 137.29 24.932
190
Huyet ap tam thu
Valid N (listwise)
N Minimum Maximum Mean Std. Deviation
Nghiên cu này có 190 i tng, huyt áp tâm thu trung bình ca các i tng này là
khong 137 mmHg ( lch chun là 24.9 mmHg). Huyt áp tâm thu thp nht là 90
mmHg, cao nht là 220 mmHg. Các giá tr ca HATT c mô t nh trong hình 1.
100

150
200
Huyet ap tam thu
A
A
A
A
A
(Cách v: Graphs – Interrative – Boxplot)
Ngoài ra, chúng ta có th mô t theo cách phân nhóm giá tr ca bin s có thông tin
 tình trng cao huyt áp vì thc t, kt qu trên cha th hin c mc ích chúng ta
mong mun là th hin tình trng THA ca các i tng. Sau khi phân nhóm (xem li
BT1) chúng ta có kt qu sau:
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d

o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d

o
c
u
-
t
r
a
c
k
.
c
o
m
7
THATTHU
36 18.8 18.9 18.9
154 80.6 81.1 100.0
190 99.5 100.0
1 .5
191 100.0
khong tha tthu
co tha tthu
Total
Valid
SystemMissing
Total
Frequency Percent Valid Percent
Cumulative
Percent
Có 154 i tng có tng huyt áp tâm thu (chim t l 81.1%).

Hoc chúng ta có th thành nhiu mc  nh:
c  THA HATThu HATTr
Không THA: HATThu < 120 và HATTr < 80
Tin THA: 120-139 hoc 80-89
THA  1: 140-159 hoc 90-99
THA  2:  169 hoc  100
Ta có kt qu:
THA
30 15.7 15.7 15.7
62 32.5 32.5 48.2
53 27.7 27.7 75.9
46 24.1 24.1 100.0
191 100.0 100.0
khong tha
tien tha
tha1
tha2
Total
Valid
Frequency Percent Valid Percent
Cumulative
Percent
(Sinh viên t suy ngh thc hin c thao tác to bin  tính toán nh bng
trên)
Bài tp 2: Tip tc thc hin vi các bin snh lng còn li trong b s liu
3.2. Mô t mi liên quan gia 2 bin s
a. Mi liên quan gia 1 bin nh lng và 1 bin phân loi:
Bài tp 3: Mô t cân nng theo gii.
Click to buy NOW!
P

D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P

D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
8
Theo bng 2, chúng ta có th s dng: Case summaries và Box plot. Tuy nhiên trc tiên

phi kim tra phân phi ca bin cân nng  hai nhóm.
30.0 40.0 50.0 60.0 70.0
Can nang
10
20
30
40
Count
Nam Nu
30.0 40.0 50.0 60.0 70.0
Can nang
(Thao tác: Graphs – Interrative – Histogram: lu ý chn mô hình v theo count, a hai
bin vào v trí, chn histogram  chn normal curve)
Theo biu  trên, s lng nam gii trong nghiên cu này ít hn n gii (u này
chúng ta có th kim tra khi mô t gii tính trong nghiên cu). u này mt phn làm
cho phân phi ca bin s cân nng ca nam gii không có phân phi chun mt cách rõ
ràng nh n gii. Chúng ta có th s dng c trung bình, trung v,  lch chun  xem
xét thêm.
Mô t hai bin s có kt qu nh sau:
(Thao tác: Analyze – Reports – Case summaries: trong ó lu ý chn Statistics  la
chn các con s thng kê cn báo cáo)
Case Summaries
Can nang
50 48.880 46.500 36.0 64.0 8.1432
137 43.938 43.500 29.0 72.0 7.5633
187 45.259 45.000 29.0 72.0 8.0066
Gioi
Nam
Nu
Total

N Mean Median Minimum Maximum Std. Deviation
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o

m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o

m
9
13750N =
Gioi
NuNam
Can nang
80
70
60
50
40
30
20
102
(Thao tác: Graphs – Boxplot – Simple - Define)
Rõ ràng kt qu cho thy ch có 50 nam gii trong nghiên cu này, cân nng trung bình
a nam cao hn n (46.5 kg so vi 43.5 kg). Hình v box plot minh ho trc quan s
khác bit này.
Bài tp 4: Mô t theo tui các bin s sau: HATT, HATTr, Chiu cao, vòng bng.
b. Mi liên quan gia hai bin nh lng:
Bài tp 5: Mô t s thay i ca HA tâm thu theo vòng bng (hoc: HA tâm thu thay i
nh th nào khi vòng bng thay i)
Theo bng 2, chúng ta có th s dng phân tán  và h s tng quan. Nhng trc ht
phi kim tra phân phi ca hai bin này.
Click to buy NOW!
P
D
F
-
X

C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X

C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
10
Huyet ap tam thu
220.0200.0180.0160.0140.0120.0100.0
70
60
50

40
30
20
10
0
Std. Dev = 24.93
Mean = 137.3
N = 190.00
Vong bung
105.0100.095.090.085.080.075.070.065.0
60
50
40
30
20
10
0
Std. Dev = 7.43
Mean = 87.8
N = 186.00
Hai bin này u có phân phi chun. Tip tc thc hin thao tác v phân tán  (scatter)
và tính h s tng quan.
Click to buy NOW!
P
D
F
-
X
C
H

A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H

A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
11
Huyet ap tam thu
24022020018016014012010080
Vong bung
110
100
90
80

70
60
Hình trên là scatter graph vi ng fit linec lng mi liên h gia HATT và cân
ng. Theo hình trên thì dng nh không có snh hng lên HATT ca s thay i
vòng bng.
Thao tác: Graphs – Scatter – Simple – Define - chn bin vào trc X và Y. Hình v sau
khi hoàn thành các thao tác này không có ng fit line,  vng này, double click
vào hình v, màn hình hin lên nh sau:
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t

r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t

r
a
c
k
.
c
o
m
12
Khi ó chn Chart, sau ó chn Options, chn Total trong ô Fit line. Nh vy hoàn tt
vic v phân tán .
Thao tác tính h s tng quan nh sau: Analyze – Correlate – Bivariate: chn 2 bin s
n phân tích vào ô Variables. Kt qu nh sau:
Correlations
1 .046
. .536
185 185
.046 1
.536 .
185 186
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
Huyet ap tam thu
Vong bung
Huyet ap
tam thu

Vong bung
Theo kt qu trên, h s tng quan gia HATT và vòng bng là 0.046, nh vy không
có mi tng quan gia HATT và vòng bng.
Nhc li lý thuyt:
-  s tng quan R luôn luôn nm trong n [-1,1]
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c

k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c

k
.
c
o
m
13
-  s tng quan r dng chng t hai bin s là ng bin (ngha là khi bin s
này tng lên thì giá tr ca bin s liên quan cng tng lên); h s tng quan r âm
chng t hai bin s là nghch bin (khi giá tr 1 bin tng thì bin kia gim).
- Tr s tuyt i ca h s tng quan r nói lên mc  liên quan gia hai bin s.
- u r=0 (hay r < 0,1) , không có mi liên h tuyn tính gia hai bin s. Nu r t
0,1 n 0,3 là quan h yu, t 0,3 n 0,5 quan h trung bình và trên 0,5 là quan h
nh.
- R2 nói lên t l s bin thiên ca bin s ph thuc c gii thích bi bin sc
p
Bài tp 6:
Mô t s liên quan gia HATTr và cân nng
Mô t s liên quan gia cân nng và vòng bng
4 Mô t bin s phân loi (nh tính)
a. Mô t 1 bin s phân loi:
Vic mô t 1 bin s phân loi rt ging vi thao tác trong qun lý s liu và làm sch s
liu. Chúng ta dùng bng phân phi tn s và các biu  minh ho.
Bài tp 7: Mô t dân s nghiên cu theo các c tính v tui, gii…
Tuoi
45 24.2 24.2 24.2
99 53.2 53.2 77.4
37 19.9 19.9 97.3
5 2.7 2.7 100.0
186 100.0 100.0
60-69 tuoi

70-79 tuoi
80-89 tuoi
>= 90tuoi
Total
Valid
Frequency Percent Valid Percent
Cumulative
Percent
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t

r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t

r
a
c
k
.
c
o
m
14
Tuoi
Tuoi
>= 90tuoi80-89 tuoi70-79 tuoi60-69 tuoi
Frequency
120
100
80
60
40
20
0
Nh vy, trong nghiên cu này, la tui 70-79 tui có s lng nhiu nht vi 99 ngi
(chim 53.2%), la tui trên 90 ít nht.
b. Mô t mi liên quan gia hai bin s phân loi
Bài tp 8: Mô t t l có tin cn b THA  nam và n.
Theo bng 2, chúng ta s dng bng chéo  mô t các t l này. Thao tác nh sau:
Analyze – Descriptive Statistics – Crosstabs: chn bin gii tính vào hàng (row), chn
bin ã tng b THA vào ct (column), chn Cells  ly phn trm theo gii tính (theo
hàng). Kt qu nh sau:
Gioi * Ban than da bi THA Crosstabulation
13 32 6 51

25.5% 62.7% 11.8% 100.0%
39 65 30 134
29.1% 48.5% 22.4% 100.0%
52 97 36 185
28.1% 52.4% 19.5% 100.0%
Count
% within Gioi
Count
% within Gioi
Count
% within Gioi
Nam
Nu
Gioi
Total
Co Khong
Khong biet/
khong tra loi
Ban than da bi THA
Total
Nh vy, t l có tin cn THA  nam là 25.5%, thp hn t l có tin cn THA  n
(29.1%). Tuy nhiên s chênh lch này là không nhiu.
Click to buy NOW!
P
D
F
-
X
C
H

A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H

A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
15
u ý: u quan trng là phi chn t l cho úng. Vì ây chúng ta mun so sánh t l
có THA  nam và  n, do ó mu s là tng s nam và tng s n. Vy phi ly phn
trm theo bin gii tính.
Bài tp 9: Mô t t l b tai bin mch vành  nam và n.
5. Trình bày kt qu
Vic trình bày kt qu không chn thun là trình bày các thao tác thc hin. m cn
trình bày là chúng ta phi phiên gii kt qu theo yêu cu mc tiêu ca nghiên cu. Trong

khi báo trình bày nghiên cu, có hai phn chính:
- Báo cáo phng pháp phân tích s liu: Thông thng c ghi ngn gn làm hai
phn
o Phân tích mô t
o Phân tích suy lun
- Báo cáo kt qu phân tích: báo cáo theo tng mc nh:
o Mô t dân s nghiên cu và các yu t liên quan, bênh…
o t qu theo tng mc tiêu.
Ví d:
Phng pháp phân tích s liu:
Phân tích mô t: các giá tr t l phn trm c s dng  mô t các bin snh tính,
giá tr trung bình,  lch chun c s dng mô t bin nh lng. Khi bin nh
ng không có phân phi chun, giá tr trung v và các giá tr ln nht nh nht c s
ng
Phân tích suy lun: Kim nh t c s dng  so sánh trung bình cân nng gia hai
gii… .
t qu: ng 1: Mô t các c tính ca i tng nghiên cu
Các c tính N Trung bình (SD) Trung v (Max- min)
HA tâm thu
HA tâm trng
Cân nng
Click to buy NOW!
P
D
F
-
X
C
H
A

N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A

N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m

×