Phân tích s liu bng Epi Info
41
Phân tích s liu
c tiêu
Sau khi hc xong bài này, hc viên có th s dng c chng trình ANALYSIS
phân tích:
1. Phân tích mô t cho mt bin hoc c b s liu
2. Tìm hiu mi liên quan gia các bin trong b s liu
3. Phân tích suy lun cho các giá tr trung bình; giá tr t l
4. dng phân tng tìm yu t nhiu
Gii thiu bài tp
Trc khi bn thc hành các bài tp trong phn này, bn hãy mã hoá li các bin trong
s d liu Ni ca khách hàng, gii tính, tình trng hôn nhân, có xét nghim Hiv
trc ây hay không, ngun thông tin mà bnh nhân bit dch v t vn này, nguyên
nhân khách hàng ti trung tâm t vn trong b s liu VTC.mdb
Mã lnh thc hin vic mã hoá này nh sau
** gioi tinh**
DEFINE sex
IF n2c1= (+) THEN
sex=1
ELSE
sex=2
END
** noi o cua khach hang**
DEFINE residence
IF n1c1=1 THEN
residence=1
END
IF n1c2=1 THEN
residence=2
END
IF n1c3=1 THEN
residence=3
END
IF n1c4=1 THEN
residence=4
END
**tinh trang hon nhan **
Phân tích s liu bng Epi Info
42
DEFINE married
IF n5c1=1 THEN
married =1
END
IF n5c2=1 THEN
married =2
END
IF n5c3=1 THEN
married =3
END
IF n5c4=1 THEN
married =4
END
Trong bài này, chúng tôi s gii thiu vi bn c v cách mô t s liu nghiên cu (các
thng kê mô t) và so sánh cách s liu nh lng trong Epi Info tr li các câu hi
nghiên cu: mô t các thay i (hay s bin thiên ca các bin) và s liên quan ca các
bin vi nhau. Tuy nhiên trong phm vi cun sách này chúng tôi không cp v vn
thng kê mt cách chi tit nh là mô t s liu nh th nào hay là lý thuyt v kim
nh thng kê. Nhng hiu rõ và phiên gii c kt qu phân tích thng kê mà máy
tính a ra, bn cng cn hiu rõ v các kin thc c bn trong thng kê y t. Bn có th
tham kho và tìm c các cun sách thng kê c bn nh cun Giáo trình Thng kê Y t
do Trng i hc Y t Công cng biên son nm 2003.
Vic u tiên trong quá trình phân tích s liu là chn i lng và cách mô
s liu ph thuc vào thit k nghiên cu mà bn tin hành, loi bin mà bn mun
mô t. Tip theo bn phi chn c loi kim nh thng kê phù hp? Vic bn phi
hoch nh mt k hoch rõ ràng cho bn thân trc khi tin hành phân tích s liu.
Vic lên k hoch này càng rõ ràng thì bn càng tránh c nhiu sai sót v sau. Lý
ng nht là bn phi a ra mt k hoch phân tích ngay ti thi m thit k nghiên
u: bn o lng cái gì ai và khi nào? Các câu hi nghiên cu cn c tr li khi thit
nghiên cu và chúng ta không th tin hành phân tích mt b s liu hoàn chnh nu
n không có mt mc tiêu nghiên cu rõ ràng và các câu hi nghiên cu rõ ràng. Nu
t nghiên cu mà bn tham gia t thit k nghiên cu thu thp s liu và phân tích s
liu thì có th d dàng hn cho bn, nhng nu bn ch tham gia mt phn thì bn phi
tho lun vi các thành viên khác trong nhóm làm rõ các câu hi nghiên cu trc
khi phân tích s liu
Trong hu ht các nghiên cu thì quá trình phân tích s liu chia làm hai thành phn
- Phân tích mô t (thng kê mô t)
- So sánh, ánh giá và c lng (thng kê suy lun)
Phân tích s liu bng Epi Info
43
V thng kê mô t thì trong các nghiên cu chúng ta ch yu mô t v các yu t dân
- xã hi ca i tng nghiên cu và các yu thông tin vi tng nghiên cu ca
n. Da trên các i lng ã c mô tó bn có thc lng, a ra các so sánh
Trong b s liu ca chúng ta chúng ta có th phân tích các vn sau
- Mô t tui, gii, trình trng hôn nhân ca các i tng n t vn ti trung tâm
- Mô t s ngi c xét nghim Hiv trên tng vùng, so sánh các vùng vi nhau
- Tính thi gian trung bình c t vn ca các bnh nhân
- ánh giá c các yu t nguy c và nhn thc ca khách hàng sau khi c t
n thì có thay i nh th nào?
- ………………….
Phn mm ch giúp bn tính c các i lng nhng bn phi chn c i lng
thng kê nào cho phù hp. Trong chng trình này chúng tôi ch hng dn cách các
n dùng chng trình Epi Info thc hin các lnh thng kê.
phân tích s liu trong Epi Info bn dùng chng trình Analys Data.
Các thành phn trong chng trình Analys Data:
Chú ý rng tt c các lnh c hin hin góc trái màn hình, gi là Command
Generator (H thng các lnh) hay Command tree (cây lnh).
Nháy chut trái vào mt lnh bt kì cây lnh (command tree) s xut hin mt
ng. Làm theo yêu cu ca các câu hi, và nháy chut vào OK to ra và thc
hin mt lnh c hin góc di màn hình. Nu ch bm chut vào phím
“Save Only” thì lnh vn c to nhng không hin th lên màn hình.
t qu hin th trên màn hình phía trên màn hình Program editor.
Trc khi tin hành phân tích, a ra các bng biu, các kim nh thng kê chúng ta
n thit phi c tp s liu vào chng trình ANALYSIS và có th cn thit phi xem
các s liu trong tp ó có nhng gì. Các bc sau s giúp bn thc hin u ó.
1.Dùng lnh READc tp s liu RTI.mdb. mc Show, chn phn All, bng phía
i, chn vtc. Sau ó bm phím OK
2.Bm vào lnh List xem mt bin.
1.Sp xp các giá tr ca mt bin
có th kim tra các giá tr s liu ôi khi chúng ta cn thit phi sp xp các giá tr
theo nhng chiu hng nht nh. Lnh SORT s cho phép chúng ta làm vic ó.
1. sp xp li các d liu, bm chut vào lnh Sort.
Phân tích s liu bng Epi Info
44
nh Sort òi hi dòng hin th dng ch hoc dng s, sp xp theo mt
hoc nhiu bin.
(++) - Sp xp t thp n cao
( ) - Sp xp t cao xung thp
2.Nháy chut úp vào bin N3 bng Available Variables. Bng Sort Variables bên
nh s xut hin N3 (++) ngha là bin này sc sp xp theo th t t thp lên cao.
3.Nháy chut vào phím Descending bng Sort Order phía trên, bin Ageround s xut
hin bng Sort Variables di dng Ageround ( ), sp xp theo th t gim dn. Sau
ó nhn OK.
4.Sau ó dùng lnh List xác nhn li kt qu
Lnh Sort có hiu lc n khi bn hu b lnh sort hoc c mt bn ghi khác
2.V th
1. Bm chut vào lnh Graph.
2. ô Graph Type, chn Bar.
3. ô X-Axis chn trng AgeGroup
(bin tui ã c nhóm li bài tp trên).
4.Da vào bin u ra, t tên th là “Biu nhóm tui”. Bm OK.
u ý n nhng la
chn cho các thay i
a th. Tu thuc
vào tng loi th,
ng la chn có th
hin th hoc không.
Phân tích s liu bng Epi Info
45
Chng trình Analysis sa ra th mt ca s mi (có th chnh sa c). Có
t vài phng án bn có th la chn. Bm chut phi vào th, chnh và sa th
theo ý mun và xem li kt qu.
óng ca s Epi Graph li khi ã chnh sa xong theo ý mun. th mi s hin th
i ca s phía trên ca s Program Editor.
Khi th hin ra ca s hin các kt qu, bn s không chnh sa c na.
3.a ra bng phân phi tn s
Các bng tn s và biu ct ca tn sut (frequency), t l (percent) và t l tích lu
(cum percent) mô t mt bin phân loi. Ngoài ra Epi Info còn cho bn mt biu
t trong kt qu khi bn dùng lnh frequencies tính kt qu
1.Nhn chut vào lnh Frequency a ra tn s ca gii tính các khách hàng n t
n Trung tâm.
2. ô Frequency of chn bin Sex (bin này c bn mã hoá li t 2 bin n2c1 và
n2c2).
3.Nu kt qu ca bn c s dng liên tc, bn có th lu li bng các a tên bng
vào Output to Table,
4.Kích chut vào OK.
Câu lnh trong màn hình son tho câu lnh s nh sau:
Freq Sex
t qu sc in ra nh sau:
sex Frequency
Percent Cum Percent
1
181 65.6% 65.6%
2
95 34.4% 100.0%
Total
276 100.0% 100.0%
95% Conf Limits
1 59.6% 71.2%
2 28.8% 40.4%
Phân tích s liu bng Epi Info
46
n cng có th thc hin vic tính toán bng phân phi tn s cho nhiu bin cùng mt
lúc.
1.Chn lnh Frequency trong chng trình ANALYSIS.
danh sách các bin, chn bin sex (gii tính), residence (ni ), và married (tình
trng hôn nhân) và chuyn chúng vào danh sách bin cn phân tích bng cách chn
chúng t thc n Frequency of
EPI INFO s cho kt qu nh sau:
married
Forward
married Frequency Percent Cum Percent
1
111 41.1% 41.1%
2
143 53.0% 94.1%
3
11 4.1% 98.1%
4
5 1.9% 100.0%
Total
270 100.0% 100.0%
Phân tích s liu bng Epi Info
47
95% Conf Limits
1 35.2% 47.2%
2 46.8% 59.0%
3 2.1% 7.2%
4 0.6% 4.3%
residence
Back Forward Current Procedure
residence Frequency Percent Cum Percent
1
202 73.5% 73.5%
2
58 21.1% 94.5%
3
15 5.5% 100.0%
Total
275 100.0% 100.0%
95% Conf Limits
1 67.8% 78.6%
2 16.4% 26.4%
3 3.1% 8.8%
sex
Back Forward Current Procedure
sex Frequency Percent Cum Percent
1
181 65.6% 65.6%
2
95 34.4% 100.0%
Total
276 100.0% 100.0%
95% Conf Limits
1 59.6% 71.2%
2 28.8% 40.4%
Phân tích s liu bng Epi Info
48
4.Tính giá tr trung bình
ng phân phi tn s là mt phng pháp mô t rt tt cho các bin ri rc, tuy nhiên
nó không phù hp cho mt bin liên tc vì s có rt nhiu giá trc a vào bng.
Trong trng hp bin là liên tc, s dng các thng kê mô t, ví d các giá tr trung
bình và các giá tr trung v, lch chun s phù hp hn. Vì o lng liên tc lng
giá cho bin liên tc, biu ct liên tc phù hp hn là biu ct. Trong b s liu
u, chúng ta mun mô t phân b ca tui trong mu nghiên cu.
c lng giá tr thng kê (trung bình, lch chun) cho mt bin nh lng bn
làm nh sau:
1.Chn lnh MEANS
2.T danh sách bin, chn bin N3 (tui ca khách hàng) t trong danh sách means of
và chuyn chúng vào danh sách phân tích.
2.Nu bn không mun hin th bng tn s ca bin thì có th kích chut vào nút
SETTING sau ó b la chn trong phn Show Tables in Output.
Phân tích s liu bng Epi Info
49
Chúng ta có kt qu nh sau
Obs Total Mean Variance Std Dev
275 8461.0000
30.7673 85.7851 9.2620
Minimum 25% Median 75% Maximum Mode
2.0000 25.0000 30.0000 34.0000 70.0000 30.0000
Trong ví d này giá tr trung bình là 30,7672 lch chun là 9,2620. Tuy nhiên ây là
giá tr trung bình tui nên ta có th làm tròn thành 31 tui và lch chun là 9.
5.To mt bng so sánh
mô t mi liên quan gia hai bin danh mc, chúng ta có th s dng lnh TABLES
so sánh. Kt qa s hin th trong mt bng bao gm các tn sut, t l ca các ô.
Ngoài ra Epi Info cng cho chúng ta khá nhiu các ch s thng kê cn thit cho phép
chúng ta phiên gii mi quan h gia hai bin này.
1.Chn lnh TABLES trong chng trình ANALYSIS
2.T danh sách bin, chn bin Sex và chuyn vào hp Exposure variable ng cách
chn trong danh sách.
3.Chn bin test (bin c mã hoá li t câu hi khách hàng có c xét ngim HIv
trc ây không) và chuyn vào hp Outcome variable
4.Kích OK hoàn thành lnh.
Phân tích s liu bng Epi Info
50
t qu trong EPI INFO có dng:
Tables sex test
Previous Procedure Next Procedure Current Dataset
Forward
TEST
sex 0 1 2 3 TOTAL
1
Row %
Col %
136
74.7
66.3
35
19.2
66.0
5
2.7
100.0
3
1.6
75.0
182
100.0
66.9
2
Row %
Col %
69
76.7
33.7
18
20.0
34.0
0
0.0
0.0
1
1.1
25.0
90
100.0
33.1
TOTAL
Row %
Col %
205
75.4
100.0
53
19.5
100.0
5
1.8
100.0
4
1.5
100.0
272
100.0
100.0
TEST
sex 4 TOTAL
1
Row %
Col %
3
1.6
60.0
182
100.0
66.9
2
Row %
Col %
2
2.2
40.0
90
100.0
33.1
TOTAL
Row %
Col %
5
1.8
100.0
272
100.0
100.0
Phân tích s liu bng Epi Info
51
Single Table Analysis
Chi-squared
df Probability
2.7470 4 0.6010
Phiên gii kt qu (gi s b s liu này c thu thp trong vòng mt tháng)
Trong nhng ngi n t vn tháng qua thì có 4 ngi không có thông tin vã xét
nghim HIV trc ây cha? T l cha xét nghim Hiv trc ây chim 75,4%, trong
ó ch yu là nam 69 ngi chim 66.3%; trong 19.5 % nhng ngi xét nghim có
t qu âm tính thì nam chim 66%. Cng trong tháng qua s ngi xét nghim mà có
t qu dng tính là 5 nam; t l xét nghim nhng không xác nh c kt qu là
1.5 và ch yu là nam; trong 5 ngi sau khi xét nghim mà không ly kt qu thì có 3
ngi là nam và 2 ngi là n.
*************Mã lnh mã hoá bin và thc hin câu lnh trên nh sau*******
DEFINE sex
IF n2c1= (+) THEN
sex=1
ELSE
sex=2
END
freq sex
define test
IF n6c0 = (+) THEN
test = 0
END
IF n6c1 = (+) THEN
test = 1
END
IF n6c2 = (+) THEN
test = 2
END
IF n6c3 = (+) THEN
test = 3
END
IF n6c4 = (+) THEN
test = 4
END
IF n6c88 = (+) THEN
Phân tích s liu bng Epi Info
52
test = 88
END
freq test
tables sex test
*********************************************************************
6.So sánh t l ca hai nhóm
Gi s ta cn thit phi phân tích gi thuyt sau:
H
0
: T l ngi n trung tâm t vn cùng vi bn tình tng ng nhau hai nhóm
nam và n
ây là mt mi liên quan c tóm tt theo dng sm và t l phn trm, chúng ta có
th s dng kim nh Khi bình phng thc hin phân tích này.
dng EPI INFO thc hin kim nh Khi Bình Phng
1.T danh sách lnh chn : TABLES
2.T danh sách các bin, chn bin mà bn mun phân tích. Trong ví d này là SEx và
n7c1(có n t vn cùng vi bn tình hay không?).
3.Bây gi kích OK.
t qu ca bn s xut hin nh sau.
tables sex n7c1
Previous Procedure Next Procedure Current Dataset
Forward
1-CÃ
sex Yes No TOTAL
1
Row %
Col %
7
3.8
50.0
176
96.2
67.2
183
100.0
66.3
2
Row %
Col %
7
7.5
50.0
86
92.5
32.8
93
100.0
33.7
TOTAL
Row %
Col %
14
5.1
100.0
262
94.9
100.0
276
100.0
100.0
Phân tích s liu bng Epi Info
53
Single Table Analysis
Warning: The expected values of a cell is <5. Fisher Exact Test should be used.
Point 95% Confidence Interval
Estimate
Lower Upper
PARAMETERS: Odds-based
Odds Ratio (cross product)
0.4886 0.1661
1.4373 (T)
Odds Ratio (MLE)
0.4900 0.1597
1.5035 (M)
0.1417
1.6940 (F)
PARAMETERS: Risk-based
Risk Ratio (RR)
0.5082 0.1837
1.4058 (T)
Risk Difference (RD%) -
3.7017
-
9.7411
2.3376 (T)
(T=Taylor series; C=Cornfield; M=Mid-P; F=Fisher Exact)
STATISTICAL TESTS Chi-
square
1-tailed p 2-tailed p
Chi square - uncorrected
1.7548
0.1852758042
Chi square - Mantel-
Haenszel 1.7484
0.1860740731
Chi square -
corrected (Yates) 1.0702
0.3008949844
Mid-p exact
0.1034565398
Fisher exact 0.1505587497
Phiên gi kt qu
l n trung tâm t vn cùng bn tình là không khác nhau nhóm nam và n
(p>0,05)
Trong hu ht các tài liu thng kê dng kim nh Khi bình phng hay dùng nht là
ng kim nh Khi bình phng Pearson. Tuy nhiên khi bng ch có 2 hàng và 2 ct thì
chúng ta nên s dng kt qu hin chnh liên tc cho kim nh Khi bình phng (Chi
square – uncorrected ). Kim nh Khi bình phng yêu cu các ô phi có giá trc
tính ln hn 5. Quy c này cng có tính cht rt bo th vì trong thc t kim nh
Phân tích s liu bng Epi Info
54
Khi bình phng vn có th tin hành kim nh úng khi mt ô nào ó có giá trc
tính nh hn 2 (tuy nhiên không quá nhiu ô nh hn 5). Epi Info s ch ra có bt c
t ô nào có giá tr nh hn 5 nhng vn thc hin kim nh Khi bình phng. Lúc ó
n phi rt cn thn tránh a ra các kt lun sai.
Trong kt quu ra trong Epi 2000 thông thng cho chúng ta kt qu tt c các
loi kim nh Khi bình phng: Khi bình phng không hiu chnh, kim nh hiu
chnh ca Khi bình phng , Mantel – Haenszel ,Yates.
Trong bài toán ca chúng ta thì các kim nh u không có ý ngha thng kê (giá tr p
>0.05) và có mt ô có giá trc tính nh hn 5 nên chúng ta s dng kt qa ca kim
nh Fisher.
Ngoài ra, khi vit kt lun thng kê trong trng hp mà kim nh có ý ngha chúng ta
có tha ra các bng chng chng minh kt lun ca chúng ta bng cách lit kê ra
các giá tr: p, giá tr kim nh; Nu hai bin a ra trong bng là mt bin Bnh và mt
bin v phi nhim thì bn có tha vào kt lun các i lng v t sut chênh (OR)
và t s nguy c (RR). Cn c vào kiu thit k nghiên cu mà bn chn mt trong hai
i lng trên hay c hai.
7.So sánh hai giá tr trung bình
bit c hai giá tr trung bình có khác bit có ý ngha thng kê hay không, chúng ta
có th tin hành kim nh ý ngha cho hai giá tr trung bình. Gi s chúng ta mun so
sánh giá tr trung bình tui ca các ngi n t vn hai nhóm là nam và n. Vic
này c tin hành trong Epi Info nh sau:
1.Chn lnh Means –trong chng trình ANALYSIS
2.T danh sách các bin ca Means of, bn mun so sánh trung bình gì; trong trng
p này bn chn trung bình ca tui ngi c t vn, t danh sách các bin bn
chn bin N3.
3.ánh du vào bin ph thuc mà bn mun phân tích. t danh sách các bin, ánh du
vào bin c lp mà bn mun s dng có ngha là nhóm mà bn mun so sánh, trong
trng hp c th này là Sex và chuyn chúng sang ô Cross-tabulate by value of
Phân tích s liu bng Epi Info
55
4.Bây gi kích OK.
Chúng ta s có kt qu nh sau:
Descriptive Statistics for Each Value of Crosstab Variable
Obs
Total Mean
Variance Std Dev
1 182 5728.0000 31.4725 79.6981 8.9274
2 93 2733.0000 29.3871 95.7833 9.7869
Minimum
25%
Median
75%
Maximum
Mode
1 18.0000 25.0000
30.0
000 35.0000 62.0000 29.0000
2 2.0000 25.0000 30.0000 33.0000 70.0000 28.0000
ANOVA, a Parametric Test for Inequality of Population Means
(For normally distributed data only)
Variation
SS df MS
F statistic
Between
267.6783 1 267.6783 3.1448
Within
23237.4272 273 85.1188
Phân tích s liu bng Epi Info
56
Total
23505.1055 274
T Statistic =1.7733
P-value =0.0773
Bartlett's Test for Inequality of Population Variances
Bartlett's chi square= 1.0459 df=1 P value=0.3065
A small p-value (e.g., less than 0.05) suggests that the variances
are not homogeneous and that the ANOVA may not be appropriate.
Mann-Whitney/Wilcoxon Two-Sample Test (Kruskal-Wallis test for two groups)
Kruskal-
Wallis H (equivalent to Chi square) = 1.1836
Degrees of freedom = 1
P valu
e =
0.2766
Phiên gii kt qu
Trong mu nghiên cu có 182 là nam và 93 ngi là n. Trung bình tui ca hai nhóm
nam và n này xp x nhau là 31 và 29 tui và s khác bit trung bình tui n t vn là
2 tui.
t qu ca phn mm cung cp cho bn hai tình hung: th nht là hai phng sai
ng nht thì s dng kim nh ANOVA và trng hp th hai là hai phng sai khác
nhau s dng kim nh (Kruskal – Wallis). Khi ó da và kim nh Barlett chúng
ta quyt nh chn theo tình hung nào. Trong bài toán ca chúng ta kim nh Barlett
có giá tr p> 0.05 ( không có ý ngha thng kê) nên chúng ta s dng kt qu kim nh
ANOVA vi ginh là hai phng sai ng nht.
y kt lun cho gi thuyt ca chúng ta là:
Chúng ta cha bng chng kt lun v s khác bit v tui hai nhóm nam và
n t vn (F
1,273
= 3,1448, p = 0,0773).
8.Nhiu và phân tích phân tng
Gii thiu bài tp
Phân tích s liu bng Epi Info
57
minh ho cho phn này bn s dng b s liu Owesgo ca Epi 6.4. B s liu này
là s liu ca mt nghiên cu ct ngang v mt v ngc thc phm. Nhng u tra
viên s hi các thông tin v ba tic mà nhng ngi b ngc ã tham d. B câu hi
nh sau:
câu hi cho Church Supper - Oswego
Name _________________________ Case ID <IDNUM>
Telephone <phonenum>
Age : ### Sex :<A> Time of Supper (24 hours)
:####
Ill ? <Y> Diarrhea? <Y> Vomiting? <Y>
Onset Date (MM/DD) :<mm/dd> Onset Time (24 hour)
:####
Food History (Mark Y or N):
Baked Ham: <Y>
Spinach: <Y>
Mashed Potatoes: <Y>
Cabbge salad: <Y>
Jello: <Y>
Rolls: <Y>
Brown Bread: <Y>
Milk: <Y>
Coffee: <Y>
Water: <Y>
Cakes: <Y>
Ice Cream: {Vanilla}: <Y> Chocolate: <Y>
Fruit Salad: <Y>
u ht các nghiên cu sc kho liên quan n các lng giá quan sát trên con ngi
trong môi trng sng t do, có ít tác ng vào ó. u này dn n mt kh nng ln
s khác bit gia các cá nhân che lp bt k s khác bit nào do can thip ca chúng
ta hoc s khác bit tht s gia các nhóm. Các phân tích thng kê cn phi tính m
n nhng khác bit này càng nhiu càng tt trc khi tìm kim s khác bit tht s mà
chúng ta quan tâm. Nhng khác bit phin phc này c bit n nh là các tác ng
nhiu.
Nhiu trong nghiên cu y t công cng còn có ngha là có tác ng khác xen vào trong
t qu nghiên cu. u này có ngha là mi liên quan gia bin ph thuc và bin c
p có th là tht nhng cng có th là có mt vài mi liên quan khác là nguyên nhân
a kt qu này. S có mt ca nhiu dn n nhng kt lun nghiên cu sai, vì vy
nhiu cn phi c khng ch. Nhng nh ngha dch t ca nhiu là có s mt cân
ng ca các c tính trong các nhóm so sánh, ví d mt nhóm có biu hin c tính c
Phân tích s liu bng Epi Info
58
thù ca mt ngi c so sánh vi ngi khác trong nhóm hoc nhóm khác. nh
ngha thng kê ca nhiu là mt bin th ba có tng quan vi c bin ph thuc và các
bin c lp mà chúng là mi quan tâm hàng u trong kim nh gi thuyt này.
tìm ra yu t nhiu và các tng tác s liu, chúng ta dùng phng pháp phân tng
hoc phân tích hi quy. Mt nguyên nhân chúng ta tin hành phân tng d liu là xác
nh bin phân tng có th “thay i” hoc nh hng lên mi quan h gia phi nhim
và bnh. “Thay i” ây c hiu là có th làm thay i kt qu lên mi quan h
gia yu t bnh và phi nhim. Vn t ra cho chúng ta tip theo là bin phân tng
có phi là yu t nhiu không? bit c u ó chúng ta so sánh t sut chênh thô
và t sut chênh ã hiu chnh. Thông thng giá tr OR hiu chnh ln hn giá tr OR
thô nhng li có ít ý ngha hn (khong tin cy rng hn). Không có loi kim nh
thng kê nào cho nhiu, nhà phân tích phi chn la gia vic có giá tr chính xác hn
nhng ít ý ngha c lng hn (OR ã hiu chnh) và giá tr kém chính xác hn nhng
i có ý ngha c lng hn (OR thô). Vic t ra mc khác nhau ca t sut chênh và
thô bao nhiêu thì kt lun là có nhiu rt khác nhau và tu thuc tng ngi phân tích
và tng vn phân tích. Thông thng theo ý kin ch quan ca mt s nhà nghiên
u thì s khác nhau ca hai t sut phi hn 5% hoc 10% thì bin phân tng mi
c xem là bin nhiu. Trong quá trình phân tích s liu nu bin phân tng không tác
ng vào mi liên quan gia bnh và phi nhim thì bn có th b qua yu tó khi
phân tích sâu hn. Khi chúng ta phiên gii kt qu thng kê chúng ta có th theo quy tc
sau ây:
- u OR thô và OR hiu chnh ging nhau thì chúng ta không phi s dng bin
phân tng.
- u OR thô và OR hiu chnh khác nhau thì chúng ta s dng OR hiu chnh vì
giá tró chính xác hn.
Ngoài ra trong mt s trng hp chúng ta có th s dng t s nguy c (RR) hoc t
sut khác nhau (RD) khi trình bày các kt lun v tng tác và nhiu.
Trong Epi Info 2000 chúng ta có th s dng phng pháp phân tng tìm ra yu t
nhiu. phn cui ca kt quu ra có mt phn tóm tt cho bng 2 × 2 c phân
ng bao gm các kim nh thng kê. Các kim nh này c s dng trong kt qu
a bn khi mà ã xác nh c bin phân tng có phi là bin nhiu không?
Câu lnh dùng trong phng pháp này là lnh Tables và lnh có dng nh sau:
Tables <exposure var> <disease var> {<stratifying var>}
Trong b s liu Oswego.rec câu hi t ra cho chúng ta là gii tính có phi là yu t
nhiu trong mi liên quan gia vic b bnh và n Vanilla không. làm vic ó chúng
ta tin hành theo các bc sau:
1. Chn lnh Tables t cây lnh
Phân tích s liu bng Epi Info
59
2. Trong ô Outcome Variable chn bin Ill, trong ô Exposure Variable chn bin
Vanilla, chn bin SEx trong ô Stratify by
3. Kích OK
t qu trong Epi s nh sau:
TABLES VANILLA ILL STRATAVAR= SEX FREQGRAPH=(-)
Previous Procedure Next Procedure Current Dataset
Ice Cream: Vanilla: : Ill?, Sex:=F
Ice Cream: Vanilla: : Ill?, Sex:=M
Ice Cream: Vanilla: : Ill? Summary
Ice Cream: Vanilla: : Ill?, Sex:=F
Forward
ILL?
Ice Cream: Vanilla: Yes No TOTAL
Yes
Row %
Col %
27
87.1
90.0
4
12.9
28.6
31
100.0
70.5
No
Row %
Col %
3
23.1
10.0
10
76.9
71.4
13
100.0
29.5
TOTAL
Row %
Col %
30
68.2
100.0
14
31.8
100.0
44
100.0
100.0
Phân tích s liu bng Epi Info
60
Single Table Analysis
Warning: The expected values of a cell is <5. Fisher Exact Test should be used.
Point 95% Confidence Interval
Estimate
Lower Upper
PARAMETERS: Odds-based
Odds Ratio (cross product)
22.5000 4.2630
118.7545 (T)
Odds Ratio (MLE)
20.1438 4.0932
128.3747 (M)
3.4398
168.7688 (F)
PARAMETERS: Risk-based
Risk Ratio (RR)
3.7742 1.3861
10.2767 (T)
Risk Difference (RD%)
64.0199 38.2548
89.7849 (T)
(T=Taylor series; C=Cornfield; M=Mid-P; F=Fisher Exact)
STATISTICAL TESTS Chi-
square
1-tailed p 2-tailed p
Chi square - uncorrected
17.3037
0.0000330266
Chi square - Mantel-
Haenszel 16.9104
0.0000403557
Chi square -
corrected (Yates) 14.4785
0.0001429406
Mid-p exact 0.000042243
9
Fisher exact
0.0000813850
Ice Cream: Vanilla: : Ill?, Sex:=M
Back Forward Current Procedure
Single Table Analysis
ILL?
Ice Cream: Vanilla: Yes No TOTAL
Yes
Row %
Col %
16
69.6
100.0
7
30.4
46.7
23
100.0
74.2
No
Row %
Col %
0
0.0
0.0
8
100.0
53.3
8
100.0
25.8
TOTAL
Row %
Col %
16
51.6
100.0
15
48.4
100.0
31
100.0
100.0
Phân tích s liu bng Epi Info
61
Warning: The expected values of a cell is <5. Fisher Exact Test should be used.
Point 95% Confidence Interval
Estimate
Lower Upper
PARAMETERS: Odds-based
Odds Ratio (cross product)
Undefined Undefined
Undefined (T)
Odds Ratio (MLE)
Undefined 3.6884
Undefined (M)
2.7700
Undefined (F)
PARAMETERS: Risk-based
Risk Ratio (RR)
Undefined Undefined
Undefined (T)
Risk Difference (RD%)
69.5652 50.7602
88.3702 (T)
(T=Taylor series; C=Cornfield; M=Mid-P; F=Fisher Exact)
STATISTICAL TESTS Chi-
square
1-tailed p 2-tailed p
Chi square - uncorrected
11.5014
0.0
006965879
Chi square - Mantel-
Haenszel 11.1304
0.0008503951
Chi square -
corrected (Yates) 8.8846
0.0028770329
Mid-p exact
0.0004078606
Fisher exact
0.0008157212
SUMMARY
Back Forward Current Procedure
SUMMARY INFORMATION
Point 95%Confidence Interval
Parameters Estimate Lower Upper
Odds Ratio Estimates
Crude OR (cross product) 23.4545 5.8410, 94.1811 (T)
Crude OR (MLE) 22.1490 5.9280, 109.1473 (M)
5.2153, 138.3935 (F)
Adjusted OR (MH) 37.6398 7.1914, 197.0062 (R)
Adjusted OR (MLE) 28.5753 6.9155, 160.2216 (M)
6.0084, 207.5014 (F)
Risk Ratios (RR)
Phân tích s liu bng Epi Info
62
Crude Risk Ratio (RR) 5.5741 1.9383, 16.0296
Adjusted RR (MH) 5.7277 1.9868, 16.5127
(T=Taylor series; R=RGB; M=Exact mid-P; F=Fisher exact)
STATISTICAL TESTS (overall assoc)
Chi-square 1-tailed p 2-tailed p
MH Chi square - uncorrected 28.0098 0.0000
MH Chi square - corrected 25.2769 0.0000
Mid-p exact 0.0000
Fisher exact 0.0000
Trong bng phân tng i vi nam t sut chênh không xác nh c là do trong
ng có giá tr bng 0. Và nhng bng nh vy không th kt lun rng có mi liên
. Nên khi phiên gii kt qu chúng ta nêu rõ là do không tính c t sut chênh
nên không th rút ra mt kt lun nào.
Phiên gii kt qu
Giá tr t sut chênh rt ln (23,45) cho thy có mt mi liên quan rt cht ch gia
vic n kem Vanilla và b ngc. Giá tr OR theo Mantel_ Haenzel khi phân tng
ng rt ln cho thy là mi liên quan này tn ti c hai gii. Giá tr p và khong
tin cy ca OR ây u không cha 1 cng nói lên có mi liên quan gia hai yu
ang xét. Trong phn kt qu cui cùng OR thô (23,45 và OR hiu chnh (37,64)
khác nhau nên chúng ta có th kt lun gii cng là mt yu t nhiu.