Phân tích s liu bng Epi Info
63
Phân tích hi quy
c tiêu bài hc
Sau khi kt thúc bài hc này, sinh viên có kh nng:
1. Dùng c biu chm m biu din mi liên quan gia hai bin nh
ng liên tc
2. Trình bày, tính và phiên gii c h s tng quan
3. Xây dng và phiên gii c ng hi qui tuyn tính ca hai bin nh
ng
4. Kim nh c ng hi quy là mô t tt nht cho mi liên quan gia hai
bin nh lng
5. Phiên gii c các kt qu phân tích s liu bng chng trình Epi Info
Gii thiu
Trong các chng trc chúng ta ã xem xét n các phng pháp ánh giá mi liên
quan gia các bin s khác nhau. Các bin này có th là ri rc hoc liên tc, trong các
phân tích ó chúng ta ch cp n vic các bin này có liên quan n nhau hay
không. Chúng ta cha xét n liu s thay i ca bin s này kéo theo s thay i
trong bin khác nh th nào. Ví d: cân nng, tui, chiu cao có nh hng th nào n
huyt áp ca i tng nghiên cu, hoc có nh hng nh th nào n vic mc hoc
không mc bnh. Nhng câu hi nghiên cu nh vy có thc tr li thông qua vic
xây dng các mô hình hi quy phù hp vi yu t mà chúng ta quan tâm.
Phân tích hi quy rt tin dng trong vic khng nh mi liên h gia mt (hoc nhiu)
bin ph thuc vi mt (hoc nhiu) bin c lp. Mc tiêu cui cùng ca phng pháp
này là oán hoc c lng giá tr ca bin ph thuc t các giá tr ca mt hay
nhiu bin khác.
Chúng ta có 2 dng phân tích hi quy c bn, vic s dng phng pháp nào ph thuc
vào dng bin ph thuc mà chúng ta quan tâm. Dng i quy tuyn tínhc s dng
khi chúng ta có bin ph thuc là bin liên tc và s dng i quy logistics khi bin ph
thuc ca chúng ta là bin i rc dng nh phân.
Trong bài này chúng tôi s hng dn các bn s dng c phn mm Epi Info tin
hành phân tích hi quy.
Gi s khi n t vn ti Trung tâm, các khách hàng tr li mt bng hi v cuc sng
a h. Nhng ngi làm nghiên cu cn c vào bng hi ó và ánh giá m cht
ng cuc sng cho nhng khách hàng n vi trung tâm. Bin m cht lng cuc
ng c ký hiu là Qol trong b s liu vtc1.mdb
Phân tích s liu bng Epi Info
64
1. Mô hình hi quy tuyn tính
Mô hình hi quy tuyn tính dùng xem xét mi liên h gia bin liên tc Y gi là bin
ph thuc và các bin c lp X
i.
Chúng ta có th có rt nhiu bin c lp và ây là
t mô hình hi quy a bin, tuy nhiêu trong khoá hc này chúng ta ch cp n mô
hình hi quy n gin ch liên quan n hai bin X và Y. Khi xây dng mt mô hình hi
quy chúng ta phi xem xét n mt s gi thuyt sau:
• Giá tr ca bin X là cnh và có mt s lng gii hn các giá tr,
u này có ngha là các giá tr ca X c xác nh trc bi nhà
nghiên cu và s lng các giá tr ca X là gii hn. ôi khi bin X
còn c gi là bin không ngu nhiên (mô hình hi quy vn có th xây
ng c vi X là bin ngu nhiên)
• Bin X c thu thp không có sai s, hoc sai s rt bé và có th b
qua c.
• i vi mi giá tr ca bin X thì ta s xác nh c mt tp hp giá
tr ca bin Y. i vi quy trình c lng và kim nh thng kê, tp
p giá tr ca bin Y s phi có phân b chun.
• t c các phng sai ca các tp hp giá tr Y là bng nhau.
• t c các giá tr trung bình ca tp hp giá tr Y u nm trên mt
ng thng, gi thuyt này c bit n là gi thuyt tuyn tính, và
nó có thc biu hin bng x
xy
βαµ +=
|
trong ó µ
y|x
là giá tr trung
bình ca tp hp các giá tr Y ng vi mt giá tr ca X. α và βc
i là các h s hi quy, v mt hình hc các h s này c gi là
m ct – hay giao m (intercept) và dc (slope) ca ng hi
quy.
• Các giá tr ca Y là c lp vi nhau. Nói mt cách khác i, các giá tr
a Y tng ng vi mt giá tr nht nh ca X không ph thuc vào
các giá tr khác ca Y da trên mt giá tr khác ca X.
Các gi thuyt nói trên có thc tóm tt thành mt phng trình nh sau, phng
trình này c gi là mt mô hình hi quy:
bxay
+
=
+ e
trong ó y là mt giá tr t mt trong các tp hp các qun th ca bin Y; a, b là các giá
trc nh ngha trong các gi thuyt trên. e là sai s.
1.1Xây dng mô hình hi quy
c tiêu ca các nhà nghiên cu là mong mun xây dng mt phng trình hi quy
mô t mi liên h thc gia bin c lp X và bin ph thuc Y. xác nh phng
trình hi quy ca hai bin nh lng, chúng ta có rt nhiu cách tip cn và phng
Phân tích s liu bng Epi Info
65
pháp tính toán. Tuy nhiên các bc sau ây có thc s dng tin hành mt phân
tích hi quy mt cách chun tc.
1.2 Các bc tin hành mt phân tích hi quy
• ánh giá xem các gi thuyt v mi liên h tng quan tuyn tính trong
s liu phân tích có tho mãn không.
• Xác nh phng trình ng hi quy mô t b s liu ó mt cách
chính xác nht
• ánh giá phng trình hi quy xác nh mc ca mi tng quan
và tính áp dng ca nó trong vic doán và c lng.
• u các s liu c th hin tt trong mô hình tuyn tính va xây
ng, s dng phng trình hi quy doán và c lng các giá
tr.
• Khi chúng ta s dng phng trình hi quy oán chúng ta s d
oán các giá tr ca Y khi ta có các giá tr ca X. Khi ta s dng
phng trình hi quy c lng, chúng ta c lng giá tr trung
bình ca mt tp hp các giá tr ca Y da trên các giá tr ca X.
tìm hiu và thc hành phng pháp phân tích hi quy chúng ta s tho
lun mt ví d c th nh sau:
1.3 Biu chm m
c u tiên trong vic ánh giá mi quan h gia hai bin là chúng ta s tin hành v
biu phân tán dng chm m ca các s liu ging nh trong hình di ây. Các
m trên thc xác nh bng cách gán các giá tr ca bin c lp X trên trc
hoành ca th và giá tr ca bin ph thuc Y trên trc tung ca th. Trong phn
này chúng ta s v biu chm m cho mi tng quan gia bin tui và m cht
ng cuc sng.
1. Chn lnh Graph t cây lnh
2. Trong ô Graph type chn loi biu loi Scatter XY
3. Nhp n3 và qol tng ng vào ô các bin
Phân tích s liu bng Epi Info
66
Ngoài ra bn có th nhp các thng s khác nh tên trang và kích OK thc hin lnh.
Biu v ra c hin lên mt ca s riêng bit mi. Bn có th chnh sa li các
ng ca biu bng cách s dng menu trên ca su ra. Kt quu ra trong ví d
a chúng ta có dng nh sau:
.
Phân tích s liu bng Epi Info
67
ng phân tán ca các chm m trên th có th gi ý cho chúng ta c mi quan
t nhiên ca hai bin. Nh chúng ta nhìn thy trên th các m chm dng nh
phân tán xung quanh mt ng thng nào ó. Nu ch nhìn vào th các chm m
chúng ta có th v các ng thng th hin mi liên h gia X (tui) và Y(m cht
ng cuc sng), và nu mi ngi v mt ng thng bt k bng mt thng thì
khó có th xy ra trng hp hai ngi nào ó v hai ng thng trùng khít lên nhau.
Câu hi t ra cho chúng ta là: vy ng thng nào trong các ng thng ó cho phép
mô t tt nht v mi liên h gia hai bin X và Y. Chúng ta không th có c câu tr
i ch bng cách xem xét các ng thng c v bng tay và mt thng, vì khi tin
hành v bng mt thng chúng ta s bnh hng bi nhng gì chúng ta nhìn thy và
do ó ng thng mà chúng ta xây dng nên, cha chc ã là mô t tt nht cho mi
quan h gia hai bin ó
1.4ng bình phng ti thiu (least-square line)
Phng pháp có c ng thng mô t tt nht mi liên h gia hai bin sc
i là phng pháp bình phng ti thiu, và ng thng thu c t phng pháp
này c gi là ng bình phng ti thiu. Phng trình ng bình phng ti
thiu có thc tính toán t các s liu mu thông qua các phép tính s hc c bn.
Tuy nhiên chúng ta có th s dng chng trình Epi Info tính các h s ca ng
i quy. Gi s mô hình hi quy cho bin m cht lng cuc sng và bin tui
1.Chn lnh Linear Regression t cây lnh. Chng trình s m ra mt hp thoi ca
nh Linear Regression nh sau:
2. Nhp bin Qol là bin outcome variable và bin n3 vào ô other variable
3. Chn khong tin cy cho h s hi quy là 95%; kích vào ô confidence limit 95%.
Phân tích s liu bng Epi Info
68
4. Kích Ok thc hin lnh
Chng trình trong Epi s cho kt qu nh sau:
REGRESS qol = n3 PVALUE=95%
Previous Procedure Next Procedure Current Dataset
Linear Regression
kt qu trên chúng ta có c các h s ca phng trình ng hi quy nh di
ây, h s a = 56,986(constant), h s b = 0,254 (tui):
y
=56.986+0,254 x tui
Phng trình ng thng ch ra cho chúng ta thy rng giá tr a là dng, ng thng
ct trc tung ti m di gc to và giá tr dc b là dng, ng thng s
kéo dài t góc di bên trái ca trc to lên góc trên bên phi ca trc to. Và
chúng ta thy c mi mt n v tng ca x thì giá tr ca y s tng thêm 0.254 n v.
Ký hiu
y
biu th giá tr yc tính t công thc ch không phi giá tr y quan sát
c.
1.5 H s xác nh R
2
(R square)
Chúng ta có thánh giá mnh ca mi liên quan trong phng trình hi qui thông
qua vic so sánh phân tán ca các m s liu so vi ng hi qui và phân tán
a các m này so vi ng trung bình
y (trung bình ca bin Y). Nu chúng ta s
ng th phân tán trong ví d trên và vng thng ct trc tung giá tr trung bình
Variable Coefficient
Std Error F-test P-Value
n3 0.254 0.134 3.5968 0.058951
CONSTANT
56.986 4.308 174.9680 0.000000
Correlation Coefficient: r^2=
0.01
Source df
Sum of Squares Mean Square F-statistic
Regression 1 1520.319 1520.319 3.597
Residuals 273
115393.848 422.688
Total 274 116914.167
Phân tích s liu bng Epi Info
69
y và song song vi trc hoành, chúng ta có th thu c mt hình nh v mc phân
tán ca các m th so vi ng trung bình và ng hi quy.
Hình nh th hin trên th cho thy, phân tán ca các m th so vi ng hi
quy s nh hn phân tán so vi ng trung bình. Tuy vy chúng ta cng cha th
t lun rng ng hi quy là mt biu din tt nht cho mi liên h gia hai bin, do
ó chúng ta s phi s dng mt giá tr khác c gi là s xác nh (coefficient of
determination) R
2
.
Trong ví d này thì R
2
= 0,01
Giá tr h s xác nh o lng s phù hp ca mô hình ng hi quy trong vic lý
gii các giá tr quan sát ca bin Y. Khi giá tr (y
i
- y
) nh, tc là khong cách t giá tr
quan sát ti ng hi quy nh thì tng bình phng không c lý gii s nh. u
này dn n giá tr tng bình phng c lý gii s ln hn, và do ó R
2
s ln hn.
Giá tr R
2
ln nht s bng 1, và kt qu là tt c các m quan sát s nm trên ng
thng hi quy. Trong trng hp ng hi quy hoàn toàn không lý gii c s bin
thiên ca Y, giá tr R
2
s bng 0. Trong trng hp giá tr R
2
ln, ng hi quy gii
thích c phn ln s bin thiên ca giá tr Y, và chúng ta s tin hành xem xét n
phng trình ng hi quy. Nu giá tr R
2
nh ngha là ng hi quy này không gii
thích c s bin thiên ca các giá tr quan sát Y – hay nói cách khác ng hi qui
này không giúp gì trong vic mô t mi liên quan gia hai bin s, và do ó chúng ta có
tha ra kt lun rng không th dùng phng trình hi quy này trong vic doán và
c lng cho b s liu. Tuy nhiên chúng ta ch có th loi b gi thuyt sau khi ã
thông qua các kim nh thng kê.
1.6 ánh giá phng trình hi quy
t khi ã xác nh c phng trình hi quy, chúng ta cn phi xem xét, ánh giá
xem liu nó có mô t mi liên h gia hai bin không, và vic dùng nó doán
hoc c lng có hiu qu không. Chúng ta s tin hành kim nh h s hi quy b và
chúng ta s có 2 trng hp nh sau:
- Khi H
0
: b=0 không b bác b: Nu trong mt qun th, mi liên h gia
hai bin X và Y là tuyn tính, giá tr b, dc ca ng bình phng ti
thiu, có th là dng, âm hoc bng không. Nu b bng 0, thì các s liu
qun thó s cho ta mt phng trình ng hi quy không có tác
ng hoc ít giá tr trong vic doán hoc c lng kt qu. Hn th
a, mc dù chúng ta gi thuyt rng mi quan h gia hai bin X và Y là
tuyn tính, nhng trên thc t rt có th mi quan h này là không tuyn
tính. Vy nu nh trong kim nh mà gi thuyt H
0
là b bng 0 không b
bác b, chúng ta có tha kt lun (ginh rng chúng ta không mc
phi sai lm loi II) là mt trong hai tình hung sau: 1) mc dù quan h ca
hai bin X và Y là tuyn tính nhng mi quan h này cha mnh có
Phân tích s liu bng Epi Info
70
th doán hoc c lng c các giá tr Y t các giá tr X; hoc 2) mi
quan h gia bin X và Y có th không phi là tuyn tính, mi quan h này
có th là mt mi quan ha thc nào ó.
- Khi H
0
: b=0 b bác b: Bây gi chúng ta s xét n trng hp chúng ta
bác b gi thuyt H
0
là b = 0. Gi s rng chúng ta không mc phi sai lm
loi I, chúng ta có th dn n mt trong các kt lun sau: (1) mi liên h
tuyn tính gia bin X và Y mnh và chúng ta có th s dng mô hình
i quy doán hoc c lng giá tr ca Y t bin X; hoc (2) mô
hình tuyn tính có th là mt c lng tt cho các s liu này, nhng cng
có th còn có các mô hình a thc khác cho phép c lng tt hn.
i nhng phân tích nh vy chúng ta thy rng, trc khi s dng mô hình hi quy
oán và c lng các giá tr, chúng ta cn phi tin hành kim nh gi thuyt
thng kê H
0
: b=0. Chúng ta có th s dng kim nh F .Trc khi tin hành các kim
nh gi thuyt cho giá tr chúng ta s xem xét n vic xác nh ln ca mi quan
gia hai bin này nh th nào.
Trong ví d trên ta có kt qu kim nh mô hình hi quy nh sau:
Ho: b=0, S dng kim nh F: F=3,597 và p>0,05 à không bác b gi thuyt Ho. Hay
nói mt cách khác chúng ta cha th kt lun c có mt mi quan h gia m cht
ng cuc sng và bin tui u này cng phù hp vi kt lun ca chúng ta khi giá tr
r
2
nh ( = 0.01)
Chúng ta cng có th kim nh h s a, tuy nhiên trên thc t, vic kim nh ý ngha
và xác nh khong tin cy i vi giá tr a không c quan tâm nhiu, vì giá tr a ch
cho chúng ta bit giao m ca ng hi quy vi trc tung và ây là giá tr khi m
a Y mà thôi. u chúng ta quan tâm là giá tr b, giá tr b cho chúng ta bit v mi
quan h gia hai bin X và Y nhiu hn. Khi hai bin X và Y có liên h tng quan thì
t giá tr b dng s cho chúng ta thy mi quan h tuyn tính thun nu giá tr X tng
thì giá tr ca Y s tng . Ngc li, mt giá tr b âm s cho thy mt mi quan h tuyn
tính nghch, giá tr ca Y s gim khi X tng và ngc li. Khi không có mi quan h
tuyn tính gia hai bin thì giá tr b s bng 0.
Khong tin cy cho giá tr b
Khi ã xác nh c giá tr ca b là khác 0, chúng ta s xác nh khong tin cy cho
giá tr b. Trong bài toán ca chúng ta kim nh b 0 không có ý ngha nên chúng ta
không tip tc tính khong tin cy cho giá tr β; Nu bn mun tính khon g tin cy cho
giá tr β bn có th dng công thc
β+
1,2896 (S.E)
Phân tích s liu bng Epi Info
71
1.7 S dng mô hình hi quy c lng và doán
u các kim nh thng kê cho thy phng trình hi quy biu din mi liên h
gia hai bin quan sát mà ta quan tâm, chúng ta có th s dng phng trình này vào
t sng dng thc t. Chúng ta có th s dng phng trình hi quy ó doán
giá tr ca Y t các giá tr ca X cho trc, ngoài ra chúng ta cng có thc lng
khong doán cho giá tr Y.
Chúng ta cng có th s dng phng trình hi quy c lng trung bình ca tp
p các giá tr Y da trên các giá tr X cho trc, tng t chúng ta cng có thc
ng khong doán cho các giá tr trung bình Y.
Vì trong ví d ca chúng ta phép kim nh không có ý ngha nên chúng tôi ch gii
thiu cho các bn các công thc tính bn có th áp dng trong các trng hp thc t
oán giá tr ca Y khi bit giá tr ca X: Khi các gi thuyt v hi quy c áp
ng cho phng trình hi quy, tính toán giá tr doán Y, ta ch cn thay giá tr X
và phng trình và tính toán. Chúng ta có th tính toán khong tin cy (100-α) phn
trm cho giá tr Y da trên công thc sau:
trong ó x
p
là mt giá tr bt k ca x mà chúng ta s dng doán khong tin cy
cho giá tr Y, bc t do cho vic tính toán t là (n-2).
2. Hi quy logistics
Trong rt nhiu nghiên cu chúng ta s có bin ph thuc là nhng bin ri rc, ví d
nh chúng ta quan tâm n s kin ó có xy ra hay không, i tng có b bnh hay
không b bnh, t vong hay không b t vong. Và tt c nhng bin s nh vy là nhng
bin ri rc dng nh phân, chúng ta cng có nhng bin khác dng nh danh hoc th
c trong ó các giá tr ca bin này có nhiu hn 2 loi và trong phm vi khoá hc này
chúng ta cha xem xét n các phân tích hi quy cho nhng dng s liu ó. Chúng ta
ch quan tâm n phng pháp phân tích hi quy logistic cho bin nh phân. Dng bin
này thng c mã hoá di dng 0 và 1, tng ng vi vic có hoc không xy
ra s kin.
Chúng ta s dng d liu Oswego vào dng bài tp này. Chúng ta quan tâm n bin là
t ngi có b bnh hay không b bnh nu trong ba n ó ngi ó có n kem
Vanilla.
Chúng ta cng có th a ra mt câu hi "Ti sao không dùng phng pháp bình
phng ti thiu phân tích hi quy cho câu hi này”. ây là mt câu hi mà rt nhiu
ngi ã t ra, tuy nhiên lý do chúng ta không th dùng là nh sau:
Nh li chúng ta có phng trình ng thng hi quy nh trên
Y = a + bX
Trong ó:
Phân tích s liu bng Epi Info
72
- Y là bin ph thuc và trong trng hp bin benh thì nó s có giá
tr, =1 nu có bnh, =0 nu không có,
- a là hng s,
- b là h s hi quy ca bin c lp,
- X là bin c lp
- e là sai s
u s dng cách phân tích theo phng trình bình phng ti thiu chúng ta s b mc
t s sai lm sau :
- Giá tr sai s s b sai lnh, u này xy ra do phng sai ca bin
c lp khác vi phng sai ca bin ph thuc: var(e)= p(1-p),
trong ó p là xác sut xut hin s kin =1.
- e không có phân b chun vì p ch có mi 2 giá tr. Do ó gi thit
i quy không t c
- Giá tr doán nu s dng hi quy tuyn tính có th cho chúng
ta các giá tr ln hn 1 hoc nh hn 0 và u này là sai vì bin
ph thuc ca chúng ta ch có th nhn mt trong hai giá tr là 0
và 1.
2.1 Mô hình hi quy logistics
Mô hình hi quy logistics nh di ây s giúp cho chúng ta khc phc nhng sai
m trên, phng trình ca mô hình hi quy logistics c vit nh sau:
ebXa
p
p
++=
−1
ln hoc
]exp[
1
ebXa
p
p
++=
−
trong ó
- ln là logarit t nhiên, log
exp,
i exp=2,71828…
- p là xác sut s kin Y xy ra, P(Y=1)
- p/(1-p) là giá tr t sut chênh "odds ratio"
- ln[p/(1-p)] là giá tr log ca odds ratio
- các thành phn khác ca mô hình thì cng ging nh mô hình hi
quy tuyn tính.
Mô hình hi quy logistics thc cht là mt bin i ca mô hình hi quy tuyn tính. Nó
cho phép chúng ta c lng xác sut nm trong khong giá tr [0,1].
Ví d, chúng ta có thc lng xác sut
]exp[1
]exp[
bXa
bXa
p
++
+
=
hoc
]exp[1
1
bXa
p
−−+
=
i mô hình này, nu chúng ta a + bX =0, thì p = 0,5
u a + bX càng ln thì p s dn ti 1
Phân tích s liu bng Epi Info
73
u a + bX càng nh thì p s dn ti 0.
Trên ây là hình nh so sánh 2 mô hình hi quy
Chúng ta thc hin phân tích hi quy trong Epi Info nh sau:
1. Chn lnh Logictic regression t cây lnh. Chng trình s hin th mt hp thoi
nh sau:
2. Chn bin Ill vào ô outcome variables, chn bin Vanilla, sex và ô other variable
3. Chn khong tin cy là 95 % vào ô confidence limits
4. Kích Ok thc hin câu lnh
t qu ca bn s có dng nh sau
y=0
y=1
i quy tuyn tính
i quy logistics
x
Phân tích s liu bng Epi Info
74
LOGISTIC ILL = SEX VANILLA
Next Procedure
Unconditional Logistic Regression
Convergence: Converged
Iterations: 6
Final -2*Log-
Likelihood:
67.3710
Phiên gii kt qu
Có mi liên quan gia vic nhng ngi n kem Vallina và b ngc (p< 0,001) và
và vi OR =32,47 chúng ta có th nói rng t l nhng ngi n kem Vallina b ngc
p 32 nhng ngi không n. Trong mô hình này chúng tôi có a yu t gii (nhiu
vào ây) và kim nh có ý ngha nên t sut ngc ây ca nhng ngi n và
không n khác nhau hai gii
Term
Odds
Ratio
95% C.I. Coefficient
S. E.
Z-
Statistic
P-
Value
SEX (M/F) 0.2657
0.0729 0.9683 -1.3253 0.6597 -2.0089 0.0446
VANILLA
(Yes/No)
32.4765
7.0446 149.7213 3.4805 0.7797 4.4637 0.0000
CONSTANT * * * -1.4254 0.6459 -2.2069 0.0273
Test Statistic D.F. P-Value
Score 29.9991 2 0.0000
Likelihood Ratio 32.7140 2 0.0000
Ph lc
CHN KIM NH THÍCH HP Bin u ra là LIÊN TC hoc KHONG
Phân tích s liu bng Epi Info
76
Phân b ca bin u ra có tuân theo phân phi chun hay không ?
Có Không
Bao nhiêu nhóm sc so sánh? Bao nhiêu nhóm sc so sánh?
1
a
u ra là liên
c
1
b
So sánh vi
giá tr có sn
1
c
o lng lp
i trên cùng
t n v
2 3+
1
a
Bin u ra
là liên tc
1
b
So sánh vi
giá tr có sn
1
c
o lng lp
i trên cùng
t n v
2 3+
Các thng
kê mô t
h s tng
quan Pearson
TB & LC TB s khác
bit & LC
d
a s khác
bit
TB & LC TB & LC
H s tng
quan
Spearman
TV &
khong
S khác
nhau gia
các TV và s
khác nhau
a khong
Các TV &
khong
Các TV &
khong
Các kim
nh thng
kê
Kim nh
ng quan
t mt mu KD t-ghép cp K t- không
ghép cp
phân tích
phng sai
(ANOVA)
Kim nh
ng quan
Kim nh
u hoc kim
nh du hng
Wilcoxon
d
kim nh du
hoc kim
nh du hng
Wilcoxon
d
Kim nh
Mann-
Whitney
Kim nh
Kruskal-
Wallis
ANOVA
Gi thuyt
(H
0
)
ng quan =
0
TB = giá tr
chun
khác bit
gia hai TB =
0
TB 1 = TB 2 TB1 = TB2 =
TB3= .v.v.
Tng quan
= 0
khác bit
gia TV và
giá tr so sánh
= 0
khác bit
gia các TV =
0
TV1 = TV2 TV1 = TV2
= TV3 =.v.v.
Các ginh Hai bin có
quan h tuyn
tính
Bin u ra
tuân theo phân
phi chun
khác bit
tuân theo phân
phi chun
Bin u ra
tuân theo
phân phi
chun và
phng sai
ng nht
Bin u ra
tuân theo phân
phi chun và
phng sai
ng nht
Hai bin này
có quan h
tuyn tính
Không Không Các
phng sai
là ng
nht
Các phng
sai là ng
nht
Phân tích s liu bng Epi Info
77
a) ây không phi là nhóm mà ch là mt bin c lp liên tc
b) ây không phi là bin c lp mà ch là mt thng kê mô t mà c so sánh vi mt qun th chun hay giá trc tính
c) Là thit k nghiên cu trong ó nhiu o lng c tin hành lp li trên cùng mt n v quan sát
d) Không ln vi kim nh tng hng Wilcoxon (tng t nh kim nh Mann-Whitney)
e) Vit tt: LC: lch chun, TB: trung bình, TV: Trung v, K: Kim nh
Phân tích s liu bng Epi Info
78
CHN KIM NH THÍCH HP Bin u ra là BIN PHÂN LOI
Có bao nhiêu phân nhóm trong bin u ra
2 3+
o các bin c so sánh nh th nào o ca các bin so sánh nh th nào?
Phân loi – 2
phân nhóm
Phân loi –
3 phân
nhóm tr
lên
Liên tc
hoc khong
– phân b
chun
Liên tc hoc
khong –
không phi là
phân b
chun
Phân loi lp li
trong mt n v
quan sát
phân loi –
2 phân
nhóm
Phân loi –
3 phân
nhóm tr
lên
Liên tc hoc
khong nhng
có phân phi
chun
Liên tc hoc
khong -
không có
phân phi
chun
Các loi c
p li trong
t n v
quan sát
Các thng
kê c bn
% hoc OR
a
% hoc OR TB & LC
a các bin
liên tc trong
các phân
nhóm ca bin
u ra
TV và khong
a các bin
liên tc trong
các phân nhóm
a bin u ra
% phù hp,
s kappa v tính
phù hp và sai s
chun
% % TB & LC ca
bin liên tc
trong các phân
nhóm ca bin
u ra
TV & khong
a bin liên
c trong các
phân nhóm ca
bin u ra
%
s kappa v
tính phù hp và
sai s chun
Phân tích s liu bng Epi Info
79
Các kim
nh thng
kê
Kim nh χ2 Kim nh χ
2
K t không
ghép cp
Kim nh
Mann-Whitney
Kim nh
McNemar
hoc
kim nh kappa
cho mc ý ngha
Kim nh χ2 Kim nh χ2 Phân tích
phng sai
(ANOVA)
Kruskal-Wallis
ANOVA
Kim nh
kappa cho mc
ý ngha
Gi thuyt
(H0)
%1 = %2
hoc
OR = 1
t c %
ng nhau
hoc
t c ORa
= 1
TB1 = TB2 TV1 = TV 2 S không phù
p ca các phân
nhóm cùng
ng
n s các ô
quan sát gi
ý rng hai
bin là c
p
n s các ô
quan sát gi
ý rng hai
bin là c
p
t c các TB
là tng t
nhau
t c TV
ng t
nhau
S không
phù hp ca
các phân
nhóm cùng
ng
Các gi
nh
Các quan sát
là c lp
Các quan sát
là c lp
Bin u ra
tuân theo
phân phi
chun
Bin u ra
tuân theo phân
phi chun;
các phng sai
ng nht
Các n v quan
sát là c lp
Các quan sát
là c lp
Các quan sát
là c lp
Bin u ra
tuân theo phân
phi chun
Bin u ra
tuân theo phân
phi chun;
các phng sai
ng nht
Các n v
quan sát là c
p
a OR: t s chênh
ng mã b s liu
MÃ KHÁCH HÀNG
Tên trng: ClientCode
Format: Text
Length: 10
Description: Mt mã duy nht gn cho mi khách hàng. Nó là s kt hp ca 4 ký t mã huyn
và s có 6 ch s, ví d: HP12-3456768.
MÃ TNH
Tên trng: ProvinceCode
Format: Text
Length: 2
Description: Mt mã gm 2 ký t , phân bit duy nht cho 7 tnh Vit Nam.
MÃ HUYN
Tên trng: SiteCode
Format: Text
Length: 4
Description: là mã t hp bao gm 4 ký t phân bit duy nht cho mi huyn trong tnh. Mã
huyn là 2 ký t c theo là 2 s, ví d HP12
NGÀY TRC XÉT NGHIM
Tên trng: DateInitialSession
Format: Date, DD-MM-YYYY
Length: 10
Description: Ngày u tiên khách hàng n trung tâm VCT.
MÃ T VN VIÊN
Tên trng: CounsellorCodeInitialSession
Format: Text
Length: 7
Description: bao gm 7 ký t
Phân tích s liu bng Epi Info
81
TRC XÉT NGHIÊM
Field Name: PretestSessionMinutes
Format: Number
Length: 3
Description: Thi gian t vn, tính theo phút.
NGÀY T VN SAU XÉT NGHIM
Tên trng: DateofSecond
Format: Date, DD-MM-YYYY
Length: 10
Description: Ngày khách hàng quay tr li VCT sau xét nghim.
MÃ T VN VIÊN
Tên trng: CounsellorCodeSecondSession
Format: Text
Length: 7
Description: Gm 7 ký t nó có th khác mã t vn viên ca ln xét nghim trc.
SAU XÉT NGHIM
Field Name: PostTestSession
Format: Number
Length: 3
Description: Thi gian t vn sau xét nghim, tính theo phút.
1. I C TRÚ
i mà khách hàng hin ang sng, có th là ni có dch v VCT, tnh ngoài hoc nc khác.
Câu tr li là n la chn.
FIELD NAME FIELD TYPE VALUE
1 – Th trn/ thành ph N1C1 Checkbox Missing or 1
2 – Nông thôn N1C2 Checkbox Missing or 1
Phân tích s liu bng Epi Info
82
3 – Tnh khác (trong Vit Nam) N1C3 Checkbox Missing or 1
4 – Nc ngoài N1C4 Checkbox Missing or 1
2. GII TÍNH
Câu tr li là n la chn
FIELD NAME FIELD TYPE VALUE
1 – Nam N2C1 Checkbox Missing or 1
2 – N N2C2 Checkbox Missing or 1
3. TUI
Tui, tính theo nm ca khách hàng
FIELD NAME FIELD TYPE VALUE
Tui N3 Number 00 - 99
4. NM I HC
nm tính n thi m khách hàng ngng hc
FIELD NAME FIELD TYPE VALUE
nm i hc N4 Number 00 - 99
5. TÌNH TRNG HÔN NHÂN
Tình trng hôn nhân ca khách hàng ti thi m khách hàng n xét nghim. Câu tr li là n
a chn.
FIELD NAME FIELD TYPE VALUE
Phân tích s liu bng Epi Info
83
1 – Cha kt hôn N5C1 Checkbox Missing or 1
2 –ã kt hôn/ sng vi ngi yêu N5C2 Checkbox Missing or 1
3 – ã ly hôn/ Ly thân N5C3 Checkbox Missing or 1
4 – Góa N5C4 Checkbox Missing or 1
6. Ã XÉT NGHIM HIV TRC ÂY CHA?
Câu hi khách hàng ã tng tham gia xét nghim HIV cha? Kt qu?
FIELD NAME FIELD TYPE VALUE
0 – Không N6C0 Checkbox Missing or 1
1 – Có, âm tính N6C1 Checkbox Missing or 1
2 – Có, dng tính N6C2 Checkbox Missing or 1
3 – Có, không xác nh N6C3 Checkbox Missing or 1
4 – Có, không nhn kt qu N6C4 Checkbox Missing or 1
88 – Khác (b mt, v.v) N6C88 Checkbox Missing or 1
6a. NU CÓ, NGÀY XÉT NGHIM?
Ngày mà khách hàng làm xét nghim nu câu tr li là có.
FIELD NAME FIELD TYPE VALUE
u có, ngày? N6DATE Date MM-DD-YYYY
6b. NI XÉT NGHIM?
FIELD NAME FIELD TYPE VALUE
i xét nghim HIV N6PLACE Text
7. N CÙNG BN TÌNH NGÀY HÔM NAY?
Khách hàng có n cùng bn tình ngày hôm nay? Câu tr li là n la chn?
Phân tích s liu bng Epi Info
84
FIELD NAME FIELD TYPE VALUE
0 – Có N7C0 Checkbox Missing or 1
1 – Không N7C1 Checkbox Missing or 1
7a. MÃ S CA BN TÌNH?
Nêu mã s ca bn tình trong trng hp câu tr li là Có
FIELD NAME FIELD TYPE VALUE
u có, mã? N7PARTNERCODE Text
8. ÂU MÀ KHÁCH HÀNG BIT DCH V NÀY? C AI GII THIU.
Nhng phng tin mà khách hàng bit n dch v VCT. Câu tr li là a la chn.
FIELD NAME FIELD TYPE VALUE
1 – Giáo dc viên ng ng N8C1 Checkbox Missing or 1
2 – Cán b y t N8C2 Checkbox Missing or 1
3 – Bn tình N8C3 Checkbox Missing or 1
4 – Bn chích chung N8C4 Checkbox Missing or 1
5 – Khách hàng khác N8C5 Checkbox Missing or 1
6 – Thông tin i chúng (TV, ài,
báo)
N8C6 Checkbox Missing or 1
88 – Khác N8C88 Checkbox Missing or 1
8a. C TH:
u khách hàng bit n các dch v ca VCT bng các phng tin khác, hãy lit kê:
FIELD NAME FIELD TYPE VALUE
Nêu c th N8OTHER Text
9. LÝ DO CHÍNH N DCH V HÔM NAY. (chn 1 lý do thích hp nht)
Câu tr li là n la chn
Phân tích s liu bng Epi Info
85
FIELD NAME FIELD TYPE VALUE
1 – Có hành vi nguy c cao (vd:
TCMT, MD, khách hàng ca MD, có
nhiu bn tình)
N9C1 Checkbox Missing or 1
2 – Bn tình ca ngi nhim HIV N9C2 Checkbox Missing or 1
3 – Bn tình ca ngi TCMT, MD,
ngi có nhiu bn tình, khách hàng
a MD
N9C3 Checkbox Missing or 1
4 – Bm/ cán b Y t khuyn cáo
ên làm xét nghim
N9C4 Checkbox Missing or 1
5 – Bn tình/ bn chích chung
khuyn cáo n làm xét nghim
N9C5 Checkbox Missing or 1
6 – Tai nn (p phi BKT, âm
kim)
N9C6 Checkbox Missing or 1
7 – Tip xúc vi ngi nhim HIV
(tip xúc thông thng, chm sóc
ngi nhim)
N9C7 Checkbox Missing or 1
88 – Khác N9C88 Checkbox Missing or 1
9a. C TH:
Lý do chính khin khách hàng n dch v. Nu câu tr li là khác , hãy lit kê:
FIELD NAME FIELD TYPE VALUE
Nêu c th N9OTHER Text
10. YÊU T NGUY C (T vn viên ánh giá và chn tt c các yu t nguy c phù hp) ây là
nguy c ca bn thân khách hàng. Câu t li là a la chn.
FIELD NAME FIELD TYPE VALUE
0 – Bn thân không có nguy c
(chuyn sang phn nguy c ca bn
tình)
N10C0 Checkbox Missing or 1
1 – Tiêm chích ma túy (TCMT) N10C1 Checkbox Missing or 1
Phân tích s liu bng Epi Info
86
2 – Mi dâm nam hoc n (vì tin
hay mâ túy)
N10C2 Checkbox Missing or 1
3 – Có QHTD ng gii nam N10C3 Checkbox Missing or 1
4 – Có QHTD vi nhiu ngi
(không vì tin hay ma túy)
N10C4 Checkbox Missing or 1
88 – Nguy c khác ca bn thân
(nêu c th)
N10C88 Checkbox Missing or 1
10a. NÊU C TH:
Câu tr li nguy c ca khách hàng là Khác, hãy lit kê:
FIELD NAME FIELD TYPE VALUE
Nêu c th N100OTHER Text
10b. Nguy c ca bn tình:
FIELD NAME FIELD TYPE VALUE
0 – Không có bn tình N10CP0 Checkbox Missing or 1
1 – Bn tình không có nguy c N10CP1 Checkbox Missing or 1
2 – Bn tình là ngi nhim HIV N10CP2 Checkbox Missing or 1
3 – Bn tình tiêm chích ma túy
(TCMT)
N10CP3 Checkbox Missing or 1
4 – Bn tình là mãi dâm (nam hoc
)
N10CP4 Checkbox Missing or 1
5 – Bn tình có tình dc ng gii
nam
N10CP5 Checkbox Missing or 1
6 – Bn tình có tình dc vi mi
dâm
N10CP6 Checkbox Missing or 1
7 – Bn tình có tình dc vi nhiu
ngi khác (không vì tin hay ma
túy)
N10CP7 Checkbox Missing or 1
88 – Nguy c khác ca bn tình (nêu
th)
N10CP88 Checkbox Missing or 1
Phân tích s liu bng Epi Info
87
10c. NÊU C TH:
Câu tr li nguy c khác ca bn tình, hãy lit kê:
FIELD NAME FIELD TYPE VALUE
Nêu c th N100POTHER Text
Trong vòng 30 ngày va qua:
11. LNG BN TÌNH:
lng bn tình ca khách hàng trong vòng 30 ngày gn nht.
FIELD NAME FIELD TYPE VALUE
lng bn tình N11 Number 000 - 999
11a. KHÔNG TR LI
FIELD NAME FIELD TYPE VALUE
Không tr li N11REFUSED Checkbox Missing or 1
12. LN GIAO HP ÂM O
Trong vòng 30 ngày qua:
FIELD NAME FIELD TYPE VALUE
ln giao hp âm o N12 Number 000 - 999
12a. KHÔNG TR LI
FIELD NAME FIELD TYPE VALUE
Refused N12REFUSED Checkbox Missing or 1
13. LN GIAO HP HU MÔN
Trong vòng 30 ngày qua:
FIELD NAME FIELD TYPE VALUE
ln giao hp hu môn N13 Number 000 - 999
13a. KHÔNG TR LI