1
Thng kê mô t
1 Tìm hiu s liu
2i và lu tp tin s liu So lieu NC THA.sav t trang web elearning ca khóa
c vào máy tính ca bn.
liu này ly t nghiên cu v tình trng và các yu t nguy c ca tng huyt áp
ngi cao tui
Sinh viên thc hin quá trình làm sch s liu tìm hiu và chun b s liu cho phân
tích.
2 Thng kê mô t
Thng kê mô t nhm mc ích mô ti tng nghiên cu và nhng yu t nguy c
liên quan n vn nghiên cu. Vic mô t mt cách rõ ràng và chính xác thông tin
a i tng nghiên cu giúp cho nhng ngi c báo cáo kt qu nghiên cu hiu rõ
n c m ca nghiên cu và dân s nghiên cu. Các thông tin c chn a ra
trong thng kê mô t liên quan cht chn nhng thông tin trong thng kê suy lun. Vì
y trc khi bn tin hành phân tích thng kê mô t thì bn phi xác nh rõ các bin mà
n cn phi miêu t hay nói mt cách khác bn phi có mt k hoch phân tích rõ ràng.
1 tìm hiu rõ cách lp k hoch phân tích cho toàn b báo cáo bn hãy c
phn 3.2 và 3.3 trong Cun giáo trình Thng kê y t Công cng: phn 2 Phân tích s
liu (trang 48-51). Riêng phn lp k hoch cho phân tích mô t bn hãy c phn
3.4.1 trong tài liu trên
2.1. K hoch phân tích
t cách tóm tt, k hoch phân tích bao gm các bc sau:
1. Xác nh câu hi phân tích. Câu hi này da trên các ni dung mà mc tiêu nghiên
u yêu cu. ây là phn rt quan trng nh hng phân tích theo úng mc
tiêu ca nghiên cu
Ví d:
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
2
c tiêu nghiên cu là: Xác nh yu t nguy c ca li sng liên quan n bnh tng
huyt áp
Câu hi phân tích có th là:
- i sng ít vn ng có phi là yu t nguy c ca bnh tng huyt áp hay không?
- l tng huyt áp ngi ít vn ng có cao hn ngi vn ng nhiu hay
không?
- Có s khác nhau v t l mc bnh tng huyt áp ngi có và ít vn ng
không?
2. Xác nh các gi thuyt trong phân tích (i vi các câu hi phân tích suy lun).
u này giúp cho vic xem xét kt qu phân tích và phiên gii sau này
Ví d:
Câu hi phân tích là:
- Có s khác bit huyt áp tâm thu trung bình gia nam và n hay không?
Gi thuyt:
Ho: HATT trung bình ca nam và n không khác nhau
Ha: HATT trung bình ca nam và n khác nhau
Câu hi:
Mô t HATT trung bình theo hai gii?
Câu hi này không cn và không có gi thuyt vì ây là câu hi yêu cu thc hin
thng kê mô tn thun.
3. Lit kê các bin s và tính cht ca bin s, mi liên qua gia các bin s
Ví d:
a. Trong câu hi “Có s khác bit huyt áp tâm thu trung bình gia nam và n hay
không?” có:
Bin s ph thuc: HATT, là bin nh lng
Bin sc lp: gii tính, là bin nh giá
b. Trong câu hi “Mô t HATT trung bình theo hai gii?” có 2 bin s
Bin s HATT: bin nh lng
Bin s gii tính: bin nh giá
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
3
4. a chn phng pháp trình bày s liu và thng kê thích hp
Ví d:
i vi câu 3a: ây là so sánh trung bình gia hai nhóm i tng c lp à chn
kim nh thng kê t-không ghép cp
i vi câu hi 3b: ây là mô t mi liên quan gia hai bin s, 1 bin nh lng, 1
bin nh tính à la chn cách trình bày nh sau:
- Dùng s thng kê mô t: trung bình và lch chun ca HATT theo 2 gii (nu
HATT có phân phi chun)
- Dùng th (biu ): Box-and-Whisker
5. Phiên gii các kt qu: da trên các kt qu tr li mc tiêu nghiên cu
Ngoài ra, cn lu ý là mi loi nghiên cu có nhng quy nh riêng r v cách trình bày
và mô t s liu. Nói chung, nghiên cu ct ngang (nghiên cu mô t) thì c mô t mà
không có so sánh (kim nh thng kê) còn nghiên cu phân tích (thun tp, bnh chng)
luôn có so sánh các yu t liên quan tng ng tng nhóm. Ví d nghiên cu thun tp
thì phi so sánh các c tính, yu t nguy c khác gia nhóm phi nhim và nhóm không
phi nhim vi yu t mà nhà nghiên cu mun ánh giá; còn nghiên cu bnh chng thì
phi tin hành so sánh các c tính, yu t nguy c khác ca nhng ngi b bnh và
không b bnh.
2.2. La chn i lng mô t bin s
Nh trong các ví d trên, vic chn i lng mô t cho bin liên tc ph thuc vào phân
ca bin ó. Nu bin có phân b chun, giá tr trung bình và lch chun c
dùng mô ti lng c th hin bi bin ó. Nhng nu bin ó không có phân b
chun thì giá tr trung v, khong (giá tr nh nht; giá tr ln nht) c dùng mô t
cho bin ó.
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
4
ng 1: La chn i lng mô t 1 bin s
Bin s nh lng Th bc Danh nh
Trình bày s liu - Phân nhóm s
liu
- ng phân phi
n sut
- Có th dùng %
tích lu
- ng phân phi
n sut (sp xp
theo th t)
- Có th dùng %
tích lu
- ng phân phi
n sut (sp xp
theo tn sut)
- Không dùng %
tích lu
th, biu Histograms
Box-and-Whisker
Biu ct ri
Biu bánh
Biu ct ri
Biu bánh
Thng kê tóm tt (phân
phi bình thng)
Trung bình
lch chun
Phân phi không bình
thng
Trung v
Phm vi (min, max,
phân v)
Không cn thit
ng 2: La chn i lng mô t mi liên quan gia hai bin s
Bin s nh lng Phân loi
nh lng
- Phân tán (biu
chm m)
- s tng quan
- Boxplot
- Case summaries
Phân loi
- Boxplot
- Case summaries
ng chéo (Crosstabs)
Ginh
Các quan sát là c lp
Bin nh lng có phân phi chun
3 Mô t bin snh lng
3.1. Mô t 1 bin s:
Bài tp 1: Mô t các c tính ca dân s nghiên cu nh HATT, HATTr, chiu cao, cân
ng, vòng ngc, vòng bng, BMI
Ví d HATT
c 1: Kim tra tính chun ca bin s:
histogram có kt qu nh sau:
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
5
Huyet ap tam thu
220.0200.0180.0160.0140.0120.0100.0
70
60
50
40
30
20
10
0
Std. Dev = 24.93
Mean = 137.3
N = 190.00
t cách khác kim tra phân phi chun là s dng s P-P plot (Normal P-P plot)
i menu Graphs – P-P sau ó chn bin cn kim nh vào ô Variable và có kt qu nh
sau:
Normal P-P Plot of Huyet ap tam thu
Observed Cum Prob
1.00.75.50.250.00
Expected Cum Prob
1.00
.75
.50
.25
0.00
ng Normal P-P plot càng nm gn ng chéo ca hình thì phân phi càng có tính
chun.
c 2: Mô t bin s
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
6
Huyt áp tâm thu có phân phi chun nên các giá tr trung bình và lch chun c s
ng mô t tóm tt bin s này.
Descriptive Statistics
190 90 220 137.29 24.932
190
Huyet ap tam thu
Valid N (listwise)
N Minimum Maximum Mean Std. Deviation
Nghiên cu này có 190 i tng, huyt áp tâm thu trung bình ca các i tng này là
khong 137 mmHg ( lch chun là 24.9 mmHg). Huyt áp tâm thu thp nht là 90
mmHg, cao nht là 220 mmHg. Các giá tr ca HATT c mô t nh trong hình 1.
100
150
200
Huyet ap tam thu
A
A
A
A
A
(Cách v: Graphs – Interrative – Boxplot)
Ngoài ra, chúng ta có th mô t theo cách phân nhóm giá tr ca bin s có thông tin
tình trng cao huyt áp vì thc t, kt qu trên cha th hin c mc ích chúng ta
mong mun là th hin tình trng THA ca các i tng. Sau khi phân nhóm (xem li
BT1) chúng ta có kt qu sau:
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
7
THATTHU
36 18.8 18.9 18.9
154 80.6 81.1 100.0
190 99.5 100.0
1 .5
191 100.0
khong tha tthu
co tha tthu
Total
Valid
SystemMissing
Total
Frequency Percent Valid Percent
Cumulative
Percent
Có 154 i tng có tng huyt áp tâm thu (chim t l 81.1%).
Hoc chúng ta có th thành nhiu mc nh:
c THA HATThu HATTr
Không THA: HATThu < 120 và HATTr < 80
Tin THA: 120-139 hoc 80-89
THA 1: 140-159 hoc 90-99
THA 2: 169 hoc 100
Ta có kt qu:
THA
30 15.7 15.7 15.7
62 32.5 32.5 48.2
53 27.7 27.7 75.9
46 24.1 24.1 100.0
191 100.0 100.0
khong tha
tien tha
tha1
tha2
Total
Valid
Frequency Percent Valid Percent
Cumulative
Percent
(Sinh viên t suy ngh thc hin c thao tác to bin tính toán nh bng
trên)
Bài tp 2: Tip tc thc hin vi các bin snh lng còn li trong b s liu
3.2. Mô t mi liên quan gia 2 bin s
a. Mi liên quan gia 1 bin nh lng và 1 bin phân loi:
Bài tp 3: Mô t cân nng theo gii.
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
8
Theo bng 2, chúng ta có th s dng: Case summaries và Box plot. Tuy nhiên trc tiên
phi kim tra phân phi ca bin cân nng hai nhóm.
30.0 40.0 50.0 60.0 70.0
Can nang
10
20
30
40
Count
Nam Nu
30.0 40.0 50.0 60.0 70.0
Can nang
(Thao tác: Graphs – Interrative – Histogram: lu ý chn mô hình v theo count, a hai
bin vào v trí, chn histogram chn normal curve)
Theo biu trên, s lng nam gii trong nghiên cu này ít hn n gii (u này
chúng ta có th kim tra khi mô t gii tính trong nghiên cu). u này mt phn làm
cho phân phi ca bin s cân nng ca nam gii không có phân phi chun mt cách rõ
ràng nh n gii. Chúng ta có th s dng c trung bình, trung v, lch chun xem
xét thêm.
Mô t hai bin s có kt qu nh sau:
(Thao tác: Analyze – Reports – Case summaries: trong ó lu ý chn Statistics la
chn các con s thng kê cn báo cáo)
Case Summaries
Can nang
50 48.880 46.500 36.0 64.0 8.1432
137 43.938 43.500 29.0 72.0 7.5633
187 45.259 45.000 29.0 72.0 8.0066
Gioi
Nam
Nu
Total
N Mean Median Minimum Maximum Std. Deviation
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
9
13750N =
Gioi
NuNam
Can nang
80
70
60
50
40
30
20
102
(Thao tác: Graphs – Boxplot – Simple - Define)
Rõ ràng kt qu cho thy ch có 50 nam gii trong nghiên cu này, cân nng trung bình
a nam cao hn n (46.5 kg so vi 43.5 kg). Hình v box plot minh ho trc quan s
khác bit này.
Bài tp 4: Mô t theo tui các bin s sau: HATT, HATTr, Chiu cao, vòng bng.
b. Mi liên quan gia hai bin nh lng:
Bài tp 5: Mô t s thay i ca HA tâm thu theo vòng bng (hoc: HA tâm thu thay i
nh th nào khi vòng bng thay i)
Theo bng 2, chúng ta có th s dng phân tán và h s tng quan. Nhng trc ht
phi kim tra phân phi ca hai bin này.
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
10
Huyet ap tam thu
220.0200.0180.0160.0140.0120.0100.0
70
60
50
40
30
20
10
0
Std. Dev = 24.93
Mean = 137.3
N = 190.00
Vong bung
105.0100.095.090.085.080.075.070.065.0
60
50
40
30
20
10
0
Std. Dev = 7.43
Mean = 87.8
N = 186.00
Hai bin này u có phân phi chun. Tip tc thc hin thao tác v phân tán (scatter)
và tính h s tng quan.
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
11
Huyet ap tam thu
24022020018016014012010080
Vong bung
110
100
90
80
70
60
Hình trên là scatter graph vi ng fit linec lng mi liên h gia HATT và cân
ng. Theo hình trên thì dng nh không có snh hng lên HATT ca s thay i
vòng bng.
Thao tác: Graphs – Scatter – Simple – Define - chn bin vào trc X và Y. Hình v sau
khi hoàn thành các thao tác này không có ng fit line, vng này, double click
vào hình v, màn hình hin lên nh sau:
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
12
Khi ó chn Chart, sau ó chn Options, chn Total trong ô Fit line. Nh vy hoàn tt
vic v phân tán .
Thao tác tính h s tng quan nh sau: Analyze – Correlate – Bivariate: chn 2 bin s
n phân tích vào ô Variables. Kt qu nh sau:
Correlations
1 .046
. .536
185 185
.046 1
.536 .
185 186
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
Huyet ap tam thu
Vong bung
Huyet ap
tam thu
Vong bung
Theo kt qu trên, h s tng quan gia HATT và vòng bng là 0.046, nh vy không
có mi tng quan gia HATT và vòng bng.
Nhc li lý thuyt:
- s tng quan R luôn luôn nm trong n [-1,1]
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
13
- s tng quan r dng chng t hai bin s là ng bin (ngha là khi bin s
này tng lên thì giá tr ca bin s liên quan cng tng lên); h s tng quan r âm
chng t hai bin s là nghch bin (khi giá tr 1 bin tng thì bin kia gim).
- Tr s tuyt i ca h s tng quan r nói lên mc liên quan gia hai bin s.
- u r=0 (hay r < 0,1) , không có mi liên h tuyn tính gia hai bin s. Nu r t
0,1 n 0,3 là quan h yu, t 0,3 n 0,5 quan h trung bình và trên 0,5 là quan h
nh.
- R2 nói lên t l s bin thiên ca bin s ph thuc c gii thích bi bin sc
p
Bài tp 6:
Mô t s liên quan gia HATTr và cân nng
Mô t s liên quan gia cân nng và vòng bng
4 Mô t bin s phân loi (nh tính)
a. Mô t 1 bin s phân loi:
Vic mô t 1 bin s phân loi rt ging vi thao tác trong qun lý s liu và làm sch s
liu. Chúng ta dùng bng phân phi tn s và các biu minh ho.
Bài tp 7: Mô t dân s nghiên cu theo các c tính v tui, gii…
Tuoi
45 24.2 24.2 24.2
99 53.2 53.2 77.4
37 19.9 19.9 97.3
5 2.7 2.7 100.0
186 100.0 100.0
60-69 tuoi
70-79 tuoi
80-89 tuoi
>= 90tuoi
Total
Valid
Frequency Percent Valid Percent
Cumulative
Percent
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
14
Tuoi
Tuoi
>= 90tuoi80-89 tuoi70-79 tuoi60-69 tuoi
Frequency
120
100
80
60
40
20
0
Nh vy, trong nghiên cu này, la tui 70-79 tui có s lng nhiu nht vi 99 ngi
(chim 53.2%), la tui trên 90 ít nht.
b. Mô t mi liên quan gia hai bin s phân loi
Bài tp 8: Mô t t l có tin cn b THA nam và n.
Theo bng 2, chúng ta s dng bng chéo mô t các t l này. Thao tác nh sau:
Analyze – Descriptive Statistics – Crosstabs: chn bin gii tính vào hàng (row), chn
bin ã tng b THA vào ct (column), chn Cells ly phn trm theo gii tính (theo
hàng). Kt qu nh sau:
Gioi * Ban than da bi THA Crosstabulation
13 32 6 51
25.5% 62.7% 11.8% 100.0%
39 65 30 134
29.1% 48.5% 22.4% 100.0%
52 97 36 185
28.1% 52.4% 19.5% 100.0%
Count
% within Gioi
Count
% within Gioi
Count
% within Gioi
Nam
Nu
Gioi
Total
Co Khong
Khong biet/
khong tra loi
Ban than da bi THA
Total
Nh vy, t l có tin cn THA nam là 25.5%, thp hn t l có tin cn THA n
(29.1%). Tuy nhiên s chênh lch này là không nhiu.
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
15
u ý: u quan trng là phi chn t l cho úng. Vì ây chúng ta mun so sánh t l
có THA nam và n, do ó mu s là tng s nam và tng s n. Vy phi ly phn
trm theo bin gii tính.
Bài tp 9: Mô t t l b tai bin mch vành nam và n.
5. Trình bày kt qu
Vic trình bày kt qu không chn thun là trình bày các thao tác thc hin. m cn
trình bày là chúng ta phi phiên gii kt qu theo yêu cu mc tiêu ca nghiên cu. Trong
khi báo trình bày nghiên cu, có hai phn chính:
- Báo cáo phng pháp phân tích s liu: Thông thng c ghi ngn gn làm hai
phn
o Phân tích mô t
o Phân tích suy lun
- Báo cáo kt qu phân tích: báo cáo theo tng mc nh:
o Mô t dân s nghiên cu và các yu t liên quan, bênh…
o t qu theo tng mc tiêu.
Ví d:
Phng pháp phân tích s liu:
Phân tích mô t: các giá tr t l phn trm c s dng mô t các bin snh tính,
giá tr trung bình, lch chun c s dng mô t bin nh lng. Khi bin nh
ng không có phân phi chun, giá tr trung v và các giá tr ln nht nh nht c s
ng
Phân tích suy lun: Kim nh t c s dng so sánh trung bình cân nng gia hai
gii… .
t qu: ng 1: Mô t các c tính ca i tng nghiên cu
Các c tính N Trung bình (SD) Trung v (Max- min)
HA tâm thu
HA tâm trng
Cân nng
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m