Tải bản đầy đủ (.pdf) (31 trang)

Phân tích số liệu bằng Epi Info 2002 - Phần 6 pot

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (427.95 KB, 31 trang )

Phân tích s liu bng Epi Info
63
Phân tích hi quy
c tiêu bài hc
Sau khi kt thúc bài hc này, sinh viên có kh nng:
1. Dùng c biu  chm m  biu din mi liên quan gia hai bin nh
ng liên tc
2. Trình bày, tính và phiên gii c h s tng quan
3. Xây dng và phiên gii c ng hi qui tuyn tính ca hai bin nh
ng
4. Kim nh c ng hi quy là mô t tt nht cho mi liên quan gia hai
bin nh lng
5. Phiên gii c các kt qu phân tích s liu bng chng trình Epi Info
Gii thiu
Trong các chng trc chúng ta ã xem xét n các phng pháp ánh giá mi liên
quan gia các bin s khác nhau. Các bin này có th là ri rc hoc liên tc, trong các
phân tích ó chúng ta ch  cp n vic các bin này có liên quan n nhau hay
không. Chúng ta cha xét n liu s thay i ca bin s này kéo theo s thay i
trong bin khác nh th nào. Ví d: cân nng, tui, chiu cao có nh hng th nào n
huyt áp ca i tng nghiên cu, hoc có nh hng nh th nào n vic mc hoc
không mc bnh. Nhng câu hi nghiên cu nh vy có thc tr li thông qua vic
xây dng các mô hình hi quy phù hp vi yu t mà chúng ta quan tâm.
Phân tích hi quy rt tin dng trong vic khng nh mi liên h gia mt (hoc nhiu)
bin ph thuc vi mt (hoc nhiu) bin c lp. Mc tiêu cui cùng ca phng pháp
này là oán hoc c lng giá tr ca bin ph thuc t các giá tr ca mt hay
nhiu bin khác.
Chúng ta có 2 dng phân tích hi quy c bn, vic s dng phng pháp nào ph thuc
vào dng bin ph thuc mà chúng ta quan tâm. Dng i quy tuyn tínhc s dng
khi chúng ta có bin ph thuc là bin liên tc và s dng i quy logistics khi bin ph
thuc ca chúng ta là bin i rc dng nh phân.
Trong bài này chúng tôi s hng dn các bn s dng c phn mm Epi Info  tin


hành phân tích hi quy.
Gi s khi n t vn ti Trung tâm, các khách hàng tr li mt bng hi v cuc sng
a h. Nhng ngi làm nghiên cu cn c vào bng hi ó và ánh giá m cht
ng cuc sng cho nhng khách hàng n vi trung tâm. Bin m cht lng cuc
ng c ký hiu là Qol trong b s liu vtc1.mdb
Phân tích s liu bng Epi Info
64
1. Mô hình hi quy tuyn tính
Mô hình hi quy tuyn tính dùng  xem xét mi liên h gia bin liên tc Y gi là bin
ph thuc và các bin c lp X
i.
Chúng ta có th có rt nhiu bin c lp và ây là
t mô hình hi quy a bin, tuy nhiêu trong khoá hc này chúng ta ch cp n mô
hình hi quy n gin ch liên quan n hai bin X và Y. Khi xây dng mt mô hình hi
quy chúng ta phi xem xét n mt s gi thuyt sau:
• Giá tr ca bin X là cnh và có mt s lng gii hn các giá tr,
u này có ngha là các giá tr ca X c xác nh trc bi nhà
nghiên cu và s lng các giá tr ca X là gii hn. ôi khi bin X
còn c gi là bin không ngu nhiên (mô hình hi quy vn có th xây
ng c vi X là bin ngu nhiên)
• Bin X c thu thp không có sai s, hoc sai s rt bé và có th b
qua c.
• i vi mi giá tr ca bin X thì ta s xác nh c mt tp hp giá
tr ca bin Y. i vi quy trình c lng và kim nh thng kê, tp
p giá tr ca bin Y s phi có phân b chun.
• t c các phng sai ca các tp hp giá tr Y là bng nhau.
• t c các giá tr trung bình ca tp hp giá tr Y u nm trên mt
ng thng, gi thuyt này c bit n là gi thuyt tuyn tính, và
nó có thc biu hin bng x
xy

βαµ +=
|
trong ó µ
y|x
là giá tr trung
bình ca tp hp các giá tr Y ng vi mt giá tr ca X. α và βc
i là các h s hi quy, v mt hình hc các h s này c gi là
m ct – hay giao m (intercept) và  dc (slope) ca ng hi
quy.
• Các giá tr ca Y là c lp vi nhau. Nói mt cách khác i, các giá tr
a Y tng ng vi mt giá tr nht nh ca X không ph thuc vào
các giá tr khác ca Y da trên mt giá tr khác ca X.
Các gi thuyt nói trên có thc tóm tt thành mt phng trình nh sau, phng
trình này c gi là mt mô hình hi quy:
bxay
+
=
+ e
trong ó y là mt giá tr t mt trong các tp hp các qun th ca bin Y; a, b là các giá
trc nh ngha trong các gi thuyt trên. e là sai s.
1.1Xây dng mô hình hi quy
c tiêu ca các nhà nghiên cu là mong mun xây dng mt phng trình hi quy 
mô t mi liên h thc gia bin c lp X và bin ph thuc Y.  xác nh phng
trình hi quy ca hai bin nh lng, chúng ta có rt nhiu cách tip cn và phng
Phân tích s liu bng Epi Info
65
pháp tính toán. Tuy nhiên các bc sau ây có thc s dng  tin hành mt phân
tích hi quy mt cách chun tc.
1.2 Các bc tin hành mt phân tích hi quy
• ánh giá xem các gi thuyt v mi liên h tng quan tuyn tính trong

 s liu  phân tích có tho mãn không.
• Xác nh phng trình ng hi quy mô t b s liu ó mt cách
chính xác nht
• ánh giá phng trình hi quy  xác nh mc  ca mi tng quan
và tính áp dng ca nó trong vic doán và c lng.
• u các s liu c th hin tt trong mô hình tuyn tính va xây
ng, s dng phng trình hi quy  doán và c lng các giá
tr.
• Khi chúng ta s dng phng trình hi quy  oán chúng ta s d
oán các giá tr ca Y khi ta có các giá tr ca X. Khi ta s dng
phng trình hi quy c lng, chúng ta c lng giá tr trung
bình ca mt tp hp các giá tr ca Y da trên các giá tr ca X. 
tìm hiu và thc hành phng pháp phân tích hi quy chúng ta s tho
lun mt ví d c th nh sau:
1.3 Biu  chm m
c u tiên trong vic ánh giá mi quan h gia hai bin là chúng ta s tin hành v
biu  phân tán dng chm m ca các s liu ging nh trong hình di ây. Các
m trên  thc xác nh bng cách gán các giá tr ca bin c lp X trên trc
hoành ca  th và giá tr ca bin ph thuc Y trên trc tung ca  th. Trong phn
này chúng ta s v biu  chm m cho mi tng quan gia bin tui và m cht
ng cuc sng.
1. Chn lnh Graph t cây lnh
2. Trong ô Graph type chn loi biu  loi Scatter XY
3. Nhp n3 và qol tng ng vào ô các bin
Phân tích s liu bng Epi Info
66
Ngoài ra bn có th nhp các thng s khác nh tên trang và kích OK  thc hin lnh.
Biu  v ra c hin lên  mt ca s riêng bit mi. Bn có th chnh sa li các
ng ca biu  bng cách s dng menu trên ca su ra. Kt quu ra trong ví d
a chúng ta có dng nh sau:

.
Phân tích s liu bng Epi Info
67
ng phân tán ca các chm m trên  th có th gi ý cho chúng ta c mi quan
 t nhiên ca hai bin. Nh chúng ta nhìn thy trên  th các m chm dng nh
phân tán xung quanh mt ng thng nào ó. Nu ch nhìn vào  th các chm m
chúng ta có th v các ng thng th hin mi liên h gia X (tui) và Y(m cht
ng cuc sng), và nu mi ngi v mt ng thng bt k bng mt thng thì
khó có th xy ra trng hp hai ngi nào ó v hai ng thng trùng khít lên nhau.
Câu hi t ra cho chúng ta là: vy ng thng nào trong các ng thng ó cho phép
mô t tt nht v mi liên h gia hai bin X và Y. Chúng ta không th có c câu tr
i ch bng cách xem xét các ng thng c v bng tay và mt thng, vì khi tin
hành v bng mt thng chúng ta s bnh hng bi nhng gì chúng ta nhìn thy và
do ó ng thng mà chúng ta xây dng nên, cha chc ã là mô t tt nht cho mi
quan h gia hai bin ó
1.4ng bình phng ti thiu (least-square line)
Phng pháp  có c ng thng mô t tt nht mi liên h gia hai bin sc
i là phng pháp bình phng ti thiu, và ng thng thu c t phng pháp
này c gi là ng bình phng ti thiu. Phng trình ng bình phng ti
thiu có thc tính toán t các s liu mu thông qua các phép tính s hc c bn.
Tuy nhiên chúng ta có th s dng chng trình Epi Info  tính các h s ca ng
i quy. Gi s mô hình hi quy cho bin m cht lng cuc sng và bin tui
1.Chn lnh Linear Regression t cây lnh. Chng trình s m ra mt hp thoi ca
nh Linear Regression nh sau:
2. Nhp bin Qol là bin outcome variable và bin n3 vào ô other variable
3. Chn khong tin cy cho h s hi quy là 95%; kích vào ô confidence limit 95%.
Phân tích s liu bng Epi Info
68
4. Kích Ok  thc hin lnh
Chng trình trong Epi s cho kt qu nh sau:

REGRESS qol = n3 PVALUE=95%
Previous Procedure Next Procedure Current Dataset
Linear Regression
 kt qu trên chúng ta có c các h s ca phng trình ng hi quy nh di
ây, h s a = 56,986(constant), h s b = 0,254 (tui):
y

=56.986+0,254 x tui
Phng trình ng thng ch ra cho chúng ta thy rng giá tr a là dng, ng thng
 ct trc tung ti m di gc to và giá tr dc b là dng, ng thng s
kéo dài t góc di bên trái ca trc to lên góc trên bên phi ca trc to. Và
chúng ta thy c mi mt n v tng ca x thì giá tr ca y s tng thêm 0.254 n v.
Ký hiu
y

biu th giá tr yc tính t công thc ch không phi giá tr y quan sát
c.
1.5 H s xác nh R
2
(R square)
Chúng ta có thánh giá  mnh ca mi liên quan trong phng trình hi qui thông
qua vic so sánh  phân tán ca các m s liu so vi ng hi qui và  phân tán
a các m này so vi ng trung bình
y (trung bình ca bin Y). Nu chúng ta s
ng  th phân tán trong ví d trên và vng thng ct trc tung  giá tr trung bình
Variable Coefficient
Std Error F-test P-Value
n3 0.254 0.134 3.5968 0.058951
CONSTANT
56.986 4.308 174.9680 0.000000

Correlation Coefficient: r^2=
0.01
Source df
Sum of Squares Mean Square F-statistic
Regression 1 1520.319 1520.319 3.597
Residuals 273
115393.848 422.688
Total 274 116914.167
Phân tích s liu bng Epi Info
69
y và song song vi trc hoành, chúng ta có th thu c mt hình nh v mc  phân
tán ca các m  th so vi ng trung bình và ng hi quy.
Hình nh th hin trên  th cho thy,  phân tán ca các m  th so vi ng hi
quy s nh hn  phân tán so vi ng trung bình. Tuy vy chúng ta cng cha th
t lun rng ng hi quy là mt biu din tt nht cho mi liên h gia hai bin, do
ó chúng ta s phi s dng mt giá tr khác c gi là  s xác nh (coefficient of
determination) R
2
.
Trong ví d này thì R
2
= 0,01
Giá tr h s xác nh o lng s phù hp ca mô hình ng hi quy trong vic lý
gii các giá tr quan sát ca bin Y. Khi giá tr (y
i
- y

) nh, tc là khong cách t giá tr
quan sát ti ng hi quy nh thì tng bình phng không c lý gii s nh. u
này dn n giá tr tng bình phng c lý gii s ln hn, và do ó R

2
s ln hn.
Giá tr R
2
ln nht s bng 1, và kt qu là tt c các m quan sát s nm trên ng
thng hi quy. Trong trng hp ng hi quy hoàn toàn không lý gii c s bin
thiên ca Y, giá tr R
2
s bng 0. Trong trng hp giá tr R
2
ln, ng hi quy gii
thích c phn ln s bin thiên ca giá tr Y, và chúng ta s tin hành xem xét n
phng trình ng hi quy. Nu giá tr R
2
nh ngha là ng hi quy này không gii
thích c s bin thiên ca các giá tr quan sát Y – hay nói cách khác ng hi qui
này không giúp gì trong vic mô t mi liên quan gia hai bin s, và do ó chúng ta có
tha ra kt lun rng không th dùng phng trình hi quy này trong vic doán và
c lng cho b s liu. Tuy nhiên chúng ta ch có th loi b gi thuyt sau khi ã
thông qua các kim nh thng kê.
1.6 ánh giá phng trình hi quy
t khi ã xác nh c phng trình hi quy, chúng ta cn phi xem xét, ánh giá
xem liu nó có  mô t mi liên h gia hai bin không, và vic dùng nó  doán
hoc c lng có hiu qu không. Chúng ta s tin hành kim nh h s hi quy b và
chúng ta s có 2 trng hp nh sau:
- Khi H
0
: b=0 không b bác b: Nu trong mt qun th, mi liên h gia
hai bin X và Y là tuyn tính, giá tr b,  dc ca ng bình phng ti
thiu, có th là dng, âm hoc bng không. Nu b bng 0, thì các s liu

 qun thó s cho ta mt phng trình ng hi quy không có tác
ng hoc ít giá tr trong vic doán hoc c lng kt qu. Hn th
a, mc dù chúng ta gi thuyt rng mi quan h gia hai bin X và Y là
tuyn tính, nhng trên thc t rt có th mi quan h này là không tuyn
tính. Vy nu nh trong kim nh mà gi thuyt H
0
là b bng 0 không b
bác b, chúng ta có tha kt lun (ginh rng chúng ta không mc
phi sai lm loi II) là mt trong hai tình hung sau: 1) mc dù quan h ca
hai bin X và Y là tuyn tính nhng mi quan h này cha  mnh  có
Phân tích s liu bng Epi Info
70
th doán hoc c lng c các giá tr Y t các giá tr X; hoc 2) mi
quan h gia bin X và Y có th không phi là tuyn tính, mi quan h này
có th là mt mi quan ha thc nào ó.
- Khi H
0
: b=0 b bác b: Bây gi chúng ta s xét n trng hp chúng ta
bác b gi thuyt H
0
là b = 0. Gi s rng chúng ta không mc phi sai lm
loi I, chúng ta có th dn n mt trong các kt lun sau: (1) mi liên h
tuyn tính gia bin X và Y  mnh và chúng ta có th s dng mô hình
i quy  doán hoc c lng giá tr ca Y t bin X; hoc (2) mô
hình tuyn tính có th là mt c lng tt cho các s liu này, nhng cng
có th còn có các mô hình a thc khác cho phép c lng tt hn.
i nhng phân tích nh vy chúng ta thy rng, trc khi s dng mô hình hi quy 
 oán và c lng các giá tr, chúng ta cn phi tin hành kim nh gi thuyt
thng kê H
0

: b=0. Chúng ta có th s dng kim nh F .Trc khi tin hành các kim
nh gi thuyt cho giá tr chúng ta s xem xét n vic xác nh  ln ca mi quan
 gia hai bin này nh th nào.
Trong ví d trên ta có kt qu kim nh mô hình hi quy nh sau:
Ho: b=0, S dng kim nh F: F=3,597 và p>0,05 à không bác b gi thuyt Ho. Hay
nói mt cách khác chúng ta cha th kt lun c có mt mi quan h gia m cht
ng cuc sng và bin tui u này cng phù hp vi kt lun ca chúng ta khi giá tr
r
2
nh ( = 0.01)
Chúng ta cng có th kim nh h s a, tuy nhiên trên thc t, vic kim nh ý ngha
và xác nh khong tin cy i vi giá tr a không c quan tâm nhiu, vì giá tr a ch
cho chúng ta bit giao m ca ng hi quy vi trc tung và ây là giá tr khi m
a Y mà thôi. u chúng ta quan tâm là giá tr b, giá tr b cho chúng ta bit v mi
quan h gia hai bin X và Y nhiu hn. Khi hai bin X và Y có liên h tng quan thì
t giá tr b dng s cho chúng ta thy mi quan h tuyn tính thun nu giá tr X tng
thì giá tr ca Y s tng . Ngc li, mt giá tr b âm s cho thy mt mi quan h tuyn
tính nghch, giá tr ca Y s gim khi X tng và ngc li. Khi không có mi quan h
tuyn tính gia hai bin thì giá tr b s bng 0.
Khong tin cy cho giá tr b
Khi ã xác nh c giá tr ca b là khác 0, chúng ta s xác nh khong tin cy cho
giá tr b. Trong bài toán ca chúng ta kim nh b  0 không có ý ngha nên chúng ta
không tip tc tính khong tin cy cho giá tr β; Nu bn mun tính khon g tin cy cho
giá tr β bn có th dng công thc
β+
1,2896 (S.E)
Phân tích s liu bng Epi Info
71
1.7 S dng mô hình hi quy  c lng và doán
u các kim nh thng kê cho thy phng trình hi quy  biu din mi liên h

gia hai bin quan sát mà ta quan tâm, chúng ta có th s dng phng trình này vào
t sng dng thc t. Chúng ta có th s dng phng trình hi quy ó  doán
giá tr ca Y t các giá tr ca X cho trc, ngoài ra chúng ta cng có thc lng
khong doán cho giá tr Y.
Chúng ta cng có th s dng phng trình hi quy  c lng trung bình ca tp
p các giá tr Y da trên các giá tr X cho trc, tng t chúng ta cng có thc
ng khong doán cho các giá tr trung bình Y.
Vì trong ví d ca chúng ta phép kim nh không có ý ngha nên chúng tôi ch gii
thiu cho các bn các công thc tính  bn có th áp dng trong các trng hp thc t
oán giá tr ca Y khi bit giá tr ca X: Khi các gi thuyt v hi quy c áp
ng cho phng trình hi quy,  tính toán giá tr doán Y, ta ch cn thay giá tr X
và phng trình và tính toán. Chúng ta có th tính toán khong tin cy (100-α) phn
trm cho giá tr Y da trên công thc sau:
trong ó x
p
là mt giá tr bt k ca x mà chúng ta s dng  doán khong tin cy
cho giá tr Y, bc t do cho vic tính toán t là (n-2).
2. Hi quy logistics
Trong rt nhiu nghiên cu chúng ta s có bin ph thuc là nhng bin ri rc, ví d
nh chúng ta quan tâm n s kin ó có xy ra hay không, i tng có b bnh hay
không b bnh, t vong hay không b t vong. Và tt c nhng bin s nh vy là nhng
bin ri rc dng nh phân, chúng ta cng có nhng bin khác dng nh danh hoc th
c trong ó các giá tr ca bin này có nhiu hn 2 loi và trong phm vi khoá hc này
chúng ta cha xem xét n các phân tích hi quy cho nhng dng s liu ó. Chúng ta
ch quan tâm n phng pháp phân tích hi quy logistic cho bin nh phân. Dng bin
 này thng c mã hoá di dng 0 và 1, tng ng vi vic có hoc không xy
ra s kin.
Chúng ta s dng d liu Oswego vào dng bài tp này. Chúng ta quan tâm n bin là
t ngi có b bnh hay không b bnh nu trong ba n ó ngi ó có n kem
Vanilla.

Chúng ta cng có th a ra mt câu hi "Ti sao không dùng phng pháp bình
phng ti thiu  phân tích hi quy cho câu hi này”. ây là mt câu hi mà rt nhiu
ngi ã t ra, tuy nhiên lý do chúng ta không th dùng là nh sau:
Nh li chúng ta có phng trình ng thng hi quy nh trên
Y = a + bX
Trong ó:
Phân tích s liu bng Epi Info
72
- Y là bin ph thuc và trong trng hp bin benh thì nó s có giá
tr, =1 nu có bnh, =0 nu không có,
- a là hng s,
- b là h s hi quy ca bin c lp,
- X là bin c lp
- e là sai s
u s dng cách phân tích theo phng trình bình phng ti thiu chúng ta s b mc
t s sai lm sau :
- Giá tr sai s s b sai lnh, u này xy ra do phng sai ca bin
c lp khác vi phng sai ca bin ph thuc: var(e)= p(1-p),
trong ó p là xác sut  xut hin s kin =1.
- e không có phân b chun vì p ch có mi 2 giá tr. Do ó gi thit
i quy không t c
- Giá tr doán nu s dng hi quy tuyn tính có th cho chúng
ta các giá tr ln hn 1 hoc nh hn 0 và u này là sai vì bin
ph thuc ca chúng ta ch có th nhn mt trong hai giá tr là 0
và 1.
2.1 Mô hình hi quy logistics
Mô hình hi quy logistics nh di ây s giúp cho chúng ta khc phc nhng sai
m trên, phng trình ca mô hình hi quy logistics c vit nh sau:
ebXa
p

p
++=






−1
ln hoc
]exp[
1
ebXa
p
p
++=

trong ó
- ln là logarit t nhiên, log
exp,
i exp=2,71828…
- p là xác sut  s kin Y xy ra, P(Y=1)
- p/(1-p) là giá tr t sut chênh "odds ratio"
- ln[p/(1-p)] là giá tr log ca odds ratio
- các thành phn khác ca mô hình thì cng ging nh mô hình hi
quy tuyn tính.
Mô hình hi quy logistics thc cht là mt bin i ca mô hình hi quy tuyn tính. Nó
cho phép chúng ta c lng xác sut nm trong khong giá tr [0,1].
Ví d, chúng ta có thc lng xác sut
]exp[1

]exp[
bXa
bXa
p
++
+
=
hoc
]exp[1
1
bXa
p
−−+
=
i mô hình này, nu chúng ta  a + bX =0, thì p = 0,5
u a + bX càng ln thì p s dn ti 1
Phân tích s liu bng Epi Info
73
u a + bX càng nh thì p s dn ti 0.
Trên ây là hình nh so sánh 2 mô hình hi quy
Chúng ta thc hin phân tích hi quy trong Epi Info nh sau:
1. Chn lnh Logictic regression t cây lnh. Chng trình s hin th mt hp thoi
nh sau:
2. Chn bin Ill vào ô outcome variables, chn bin Vanilla, sex và ô other variable
3. Chn khong tin cy là 95 % vào ô confidence limits
4. Kích Ok  thc hin câu lnh
t qu ca bn s có dng nh sau
y=0
y=1
i quy tuyn tính

i quy logistics
x
Phân tích s liu bng Epi Info
74
LOGISTIC ILL = SEX VANILLA
Next Procedure
Unconditional Logistic Regression
Convergence: Converged
Iterations: 6
Final -2*Log-
Likelihood:
67.3710
Phiên gii kt qu
Có mi liên quan gia vic nhng ngi n kem Vallina và b ngc (p< 0,001) và
và vi OR =32,47 chúng ta có th nói rng t l nhng ngi n kem Vallina b ngc
p 32 nhng ngi không n. Trong mô hình này chúng tôi có a yu t gii (nhiu
vào ây) và kim nh có ý ngha nên t sut ngc ây ca nhng ngi n và
không n khác nhau  hai gii
Term
Odds
Ratio
95% C.I. Coefficient
S. E.
Z-
Statistic
P-
Value
SEX (M/F) 0.2657
0.0729 0.9683 -1.3253 0.6597 -2.0089 0.0446
VANILLA

(Yes/No)
32.4765
7.0446 149.7213 3.4805 0.7797 4.4637 0.0000
CONSTANT * * * -1.4254 0.6459 -2.2069 0.0273
Test Statistic D.F. P-Value
Score 29.9991 2 0.0000
Likelihood Ratio 32.7140 2 0.0000
Ph lc
CHN KIM NH THÍCH HP  Bin u ra là LIÊN TC hoc KHONG
Phân tích s liu bng Epi Info
76
Phân b ca bin u ra có tuân theo phân phi chun hay không ?
Có Không
Bao nhiêu nhóm sc so sánh? Bao nhiêu nhóm sc so sánh?
1
a
u ra là liên
c
1
b
So sánh vi
giá tr có sn
1
c
o lng lp
i trên cùng
t n v
2 3+
1
a

Bin u ra
là liên tc
1
b
So sánh vi
giá tr có sn
1
c
o lng lp
i trên cùng
t n v
2 3+
Các thng
kê mô t
h s tng
quan Pearson
TB & LC TB s khác
bit & LC
d
a s khác
bit
TB & LC TB & LC
H s tng
quan
Spearman
TV &
khong
S khác
nhau gia
các TV và s

khác nhau
a khong
Các TV &
khong
Các TV &
khong
Các kim
nh thng

Kim nh
ng quan
 t mt mu KD t-ghép cp K t- không
ghép cp
 phân tích
phng sai
(ANOVA)
Kim nh
ng quan
Kim nh
u hoc kim
nh du hng
Wilcoxon
d
kim nh du
hoc kim
nh du hng
Wilcoxon
d
Kim nh
Mann-

Whitney
Kim nh
Kruskal-
Wallis
ANOVA
Gi thuyt
(H
0
)
ng quan =
0
TB = giá tr
chun
 khác bit
gia hai TB =
0
TB 1 = TB 2 TB1 = TB2 =
TB3= .v.v.
Tng quan
= 0
 khác bit
gia TV và
giá tr so sánh
= 0
 khác bit
gia các TV =
0
TV1 = TV2 TV1 = TV2
= TV3 =.v.v.
Các ginh Hai bin có

quan h tuyn
tính
Bin u ra
tuân theo phân
phi chun
 khác bit
tuân theo phân
phi chun
Bin u ra
tuân theo
phân phi
chun và
phng sai
ng nht
Bin u ra
tuân theo phân
phi chun và
phng sai
ng nht
Hai bin này
có quan h
tuyn tính
Không Không Các
phng sai
là ng
nht
Các phng
sai là ng
nht
Phân tích s liu bng Epi Info

77
a) ây không phi là nhóm mà ch là mt bin c lp liên tc
b) ây không phi là bin c lp mà ch là mt thng kê mô t mà c so sánh vi mt qun th chun hay giá trc tính
c) Là thit k nghiên cu trong ó nhiu o lng c tin hành lp li trên cùng mt n v quan sát
d) Không ln vi kim nh tng hng Wilcoxon (tng t nh kim nh Mann-Whitney)
e) Vit tt: LC:  lch chun, TB: trung bình, TV: Trung v, K: Kim nh
Phân tích s liu bng Epi Info
78
CHN KIM NH THÍCH HP  Bin u ra là BIN PHÂN LOI
Có bao nhiêu phân nhóm trong bin u ra
2 3+
 o các bin c so sánh nh th nào o ca các bin so sánh nh th nào?
Phân loi – 2
phân nhóm
Phân loi –
 3 phân
nhóm tr
lên
Liên tc
hoc khong
– phân b
chun
Liên tc hoc
khong –
không phi là
phân b
chun
Phân loi lp li
trong mt n v
quan sát

phân loi –
2 phân
nhóm
Phân loi –
 3 phân
nhóm tr
lên
Liên tc hoc
khong nhng
có phân phi
chun
Liên tc hoc
khong -
không có
phân phi
chun
Các loi c
p li trong
t n v
quan sát
Các thng
kê c bn
% hoc OR
a
% hoc OR TB & LC
a các bin
liên tc trong
các phân
nhóm ca bin
u ra

TV và khong
a các bin
liên tc trong
các phân nhóm
a bin u ra
% phù hp,
 s kappa v tính
phù hp và sai s
chun
% % TB & LC ca
bin liên tc
trong các phân
nhóm ca bin
u ra
TV & khong
a bin liên
c trong các
phân nhóm ca
bin u ra
%
 s kappa v
tính phù hp và
sai s chun
Phân tích s liu bng Epi Info
79
Các kim
nh thng

Kim nh χ2 Kim nh χ
2

K t không
ghép cp
Kim nh
Mann-Whitney
Kim nh
McNemar
hoc
kim nh kappa
cho mc ý ngha
Kim nh χ2 Kim nh χ2 Phân tích
phng sai
(ANOVA)
Kruskal-Wallis
ANOVA
Kim nh
kappa cho mc
ý ngha
Gi thuyt
(H0)
%1 = %2
hoc
OR = 1
t c %
ng nhau
hoc
t c ORa
= 1
TB1 = TB2 TV1 = TV 2 S không phù
p ca các phân
nhóm cùng

ng
n s các ô
quan sát gi
ý rng hai
bin là c
p
n s các ô
quan sát gi
ý rng hai
bin là c
p
t c các TB
là tng t
nhau
t c TV
ng t
nhau
S không
phù hp ca
các phân
nhóm cùng
ng
Các gi
nh
Các quan sát
là c lp
Các quan sát
là c lp
Bin u ra
tuân theo

phân phi
chun
Bin u ra
tuân theo phân
phi chun;
các phng sai
ng nht
Các n v quan
sát là c lp
Các quan sát
là c lp
Các quan sát
là c lp
Bin u ra
tuân theo phân
phi chun
Bin u ra
tuân theo phân
phi chun;
các phng sai
ng nht
Các n v
quan sát là c
p
a OR: t s chênh
ng mã b s liu
MÃ KHÁCH HÀNG
Tên trng: ClientCode
Format: Text
Length: 10

Description: Mt mã duy nht gn cho mi khách hàng. Nó là s kt hp ca 4 ký t mã huyn
và s có 6 ch s, ví d: HP12-3456768.
MÃ TNH
Tên trng: ProvinceCode
Format: Text
Length: 2
Description: Mt mã gm 2 ký t , phân bit duy nht cho 7 tnh  Vit Nam.
MÃ HUYN
Tên trng: SiteCode
Format: Text
Length: 4
Description: là mã t hp bao gm 4 ký t phân bit duy nht cho mi huyn trong tnh. Mã
huyn là 2 ký t c theo là 2 s, ví d HP12
NGÀY TRC XÉT NGHIM
Tên trng: DateInitialSession
Format: Date, DD-MM-YYYY
Length: 10
Description: Ngày u tiên khách hàng n trung tâm VCT.
MÃ T VN VIÊN
Tên trng: CounsellorCodeInitialSession
Format: Text
Length: 7
Description: bao gm 7 ký t
Phân tích s liu bng Epi Info
81
TRC XÉT NGHIÊM
Field Name: PretestSessionMinutes
Format: Number
Length: 3
Description: Thi gian t vn, tính theo phút.

NGÀY T VN SAU XÉT NGHIM
Tên trng: DateofSecond
Format: Date, DD-MM-YYYY
Length: 10
Description: Ngày khách hàng quay tr li VCT sau xét nghim.
MÃ T VN VIÊN
Tên trng: CounsellorCodeSecondSession
Format: Text
Length: 7
Description: Gm 7 ký t nó có th khác mã t vn viên ca ln xét nghim trc.
SAU XÉT NGHIM
Field Name: PostTestSession
Format: Number
Length: 3
Description: Thi gian t vn sau xét nghim, tính theo phút.
1. I C TRÚ
i mà khách hàng hin ang sng, có th là ni có dch v VCT, tnh ngoài hoc nc khác.
Câu tr li là n la chn.
FIELD NAME FIELD TYPE VALUE
1 – Th trn/ thành ph N1C1 Checkbox Missing or 1
2 – Nông thôn N1C2 Checkbox Missing or 1
Phân tích s liu bng Epi Info
82
3 – Tnh khác (trong Vit Nam) N1C3 Checkbox Missing or 1
4 – Nc ngoài N1C4 Checkbox Missing or 1
2. GII TÍNH
Câu tr li là n la chn
FIELD NAME FIELD TYPE VALUE
1 – Nam N2C1 Checkbox Missing or 1
2 – N N2C2 Checkbox Missing or 1

3. TUI
Tui, tính theo nm ca khách hàng
FIELD NAME FIELD TYPE VALUE
Tui N3 Number 00 - 99
4.  NM I HC
 nm tính n thi m khách hàng ngng hc
FIELD NAME FIELD TYPE VALUE
 nm i hc N4 Number 00 - 99
5. TÌNH TRNG HÔN NHÂN
Tình trng hôn nhân ca khách hàng ti thi m khách hàng n xét nghim. Câu tr li là n
a chn.
FIELD NAME FIELD TYPE VALUE
Phân tích s liu bng Epi Info
83
1 – Cha kt hôn N5C1 Checkbox Missing or 1
2 –ã kt hôn/ sng vi ngi yêu N5C2 Checkbox Missing or 1
3 – ã ly hôn/ Ly thân N5C3 Checkbox Missing or 1
4 – Góa N5C4 Checkbox Missing or 1
6. Ã XÉT NGHIM HIV TRC ÂY CHA?
Câu hi khách hàng ã tng tham gia xét nghim HIV cha? Kt qu?
FIELD NAME FIELD TYPE VALUE
0 – Không N6C0 Checkbox Missing or 1
1 – Có, âm tính N6C1 Checkbox Missing or 1
2 – Có, dng tính N6C2 Checkbox Missing or 1
3 – Có, không xác nh N6C3 Checkbox Missing or 1
4 – Có, không nhn kt qu N6C4 Checkbox Missing or 1
88 – Khác (b mt, v.v) N6C88 Checkbox Missing or 1
6a. NU CÓ, NGÀY XÉT NGHIM?
Ngày mà khách hàng làm xét nghim nu câu tr li là có.
FIELD NAME FIELD TYPE VALUE

u có, ngày? N6DATE Date MM-DD-YYYY
6b. NI XÉT NGHIM?
FIELD NAME FIELD TYPE VALUE
i xét nghim HIV N6PLACE Text
7. N CÙNG BN TÌNH NGÀY HÔM NAY?
Khách hàng có n cùng bn tình ngày hôm nay? Câu tr li là n la chn?
Phân tích s liu bng Epi Info
84
FIELD NAME FIELD TYPE VALUE
0 – Có N7C0 Checkbox Missing or 1
1 – Không N7C1 Checkbox Missing or 1
7a. MÃ S CA BN TÌNH?
Nêu mã s ca bn tình trong trng hp câu tr li là Có
FIELD NAME FIELD TYPE VALUE
u có, mã? N7PARTNERCODE Text
8. ÂU MÀ KHÁCH HÀNG BIT DCH V NÀY? C AI GII THIU.
Nhng phng tin mà khách hàng bit n dch v VCT. Câu tr li là a la chn.
FIELD NAME FIELD TYPE VALUE
1 – Giáo dc viên ng ng N8C1 Checkbox Missing or 1
2 – Cán b y t N8C2 Checkbox Missing or 1
3 – Bn tình N8C3 Checkbox Missing or 1
4 – Bn chích chung N8C4 Checkbox Missing or 1
5 – Khách hàng khác N8C5 Checkbox Missing or 1
6 – Thông tin i chúng (TV, ài,
báo)
N8C6 Checkbox Missing or 1
88 – Khác N8C88 Checkbox Missing or 1
8a. C TH:
u khách hàng bit n các dch v ca VCT bng các phng tin khác, hãy lit kê:
FIELD NAME FIELD TYPE VALUE

Nêu c th N8OTHER Text
9. LÝ DO CHÍNH N DCH V HÔM NAY. (chn 1 lý do thích hp nht)
Câu tr li là n la chn
Phân tích s liu bng Epi Info
85
FIELD NAME FIELD TYPE VALUE
1 – Có hành vi nguy c cao (vd:
TCMT, MD, khách hàng ca MD, có
nhiu bn tình)
N9C1 Checkbox Missing or 1
2 – Bn tình ca ngi nhim HIV N9C2 Checkbox Missing or 1
3 – Bn tình ca ngi TCMT, MD,
ngi có nhiu bn tình, khách hàng
a MD
N9C3 Checkbox Missing or 1
4 – Bm/ cán b Y t khuyn cáo
ên làm xét nghim
N9C4 Checkbox Missing or 1
5 – Bn tình/ bn chích chung
khuyn cáo n làm xét nghim
N9C5 Checkbox Missing or 1
6 – Tai nn (p phi BKT, âm
kim)
N9C6 Checkbox Missing or 1
7 – Tip xúc vi ngi nhim HIV
(tip xúc thông thng, chm sóc
ngi nhim)
N9C7 Checkbox Missing or 1
88 – Khác N9C88 Checkbox Missing or 1
9a. C TH:

Lý do chính khin khách hàng n dch v. Nu câu tr li là khác , hãy lit kê:
FIELD NAME FIELD TYPE VALUE
Nêu c th N9OTHER Text
10. YÊU T NGUY C (T vn viên ánh giá và chn tt c các yu t nguy c phù hp) ây là
nguy c ca bn thân khách hàng. Câu t li là a la chn.
FIELD NAME FIELD TYPE VALUE
0 – Bn thân không có nguy c
(chuyn sang phn nguy c ca bn
tình)
N10C0 Checkbox Missing or 1
1 – Tiêm chích ma túy (TCMT) N10C1 Checkbox Missing or 1
Phân tích s liu bng Epi Info
86
2 – Mi dâm nam hoc n (vì tin
hay mâ túy)
N10C2 Checkbox Missing or 1
3 – Có QHTD ng gii nam N10C3 Checkbox Missing or 1
4 – Có QHTD vi nhiu ngi
(không vì tin hay ma túy)
N10C4 Checkbox Missing or 1
88 – Nguy c khác ca bn thân
(nêu c th)
N10C88 Checkbox Missing or 1
10a. NÊU C TH:
Câu tr li nguy c ca khách hàng là Khác, hãy lit kê:
FIELD NAME FIELD TYPE VALUE
Nêu c th N100OTHER Text
10b. Nguy c ca bn tình:
FIELD NAME FIELD TYPE VALUE
0 – Không có bn tình N10CP0 Checkbox Missing or 1

1 – Bn tình không có nguy c N10CP1 Checkbox Missing or 1
2 – Bn tình là ngi nhim HIV N10CP2 Checkbox Missing or 1
3 – Bn tình tiêm chích ma túy
(TCMT)
N10CP3 Checkbox Missing or 1
4 – Bn tình là mãi dâm (nam hoc
)
N10CP4 Checkbox Missing or 1
5 – Bn tình có tình dc ng gii
nam
N10CP5 Checkbox Missing or 1
6 – Bn tình có tình dc vi mi
dâm
N10CP6 Checkbox Missing or 1
7 – Bn tình có tình dc vi nhiu
ngi khác (không vì tin hay ma
túy)
N10CP7 Checkbox Missing or 1
88 – Nguy c khác ca bn tình (nêu
 th)
N10CP88 Checkbox Missing or 1
Phân tích s liu bng Epi Info
87
10c. NÊU C TH:
Câu tr li nguy c khác ca bn tình, hãy lit kê:
FIELD NAME FIELD TYPE VALUE
Nêu c th N100POTHER Text
Trong vòng 30 ngày va qua:
11.  LNG BN TÌNH:
 lng bn tình ca khách hàng trong vòng 30 ngày gn nht.

FIELD NAME FIELD TYPE VALUE
 lng bn tình N11 Number 000 - 999
11a. KHÔNG TR LI
FIELD NAME FIELD TYPE VALUE
Không tr li N11REFUSED Checkbox Missing or 1
12.  LN GIAO HP ÂM O
Trong vòng 30 ngày qua:
FIELD NAME FIELD TYPE VALUE
 ln giao hp âm o N12 Number 000 - 999
12a. KHÔNG TR LI
FIELD NAME FIELD TYPE VALUE
Refused N12REFUSED Checkbox Missing or 1
13.  LN GIAO HP HU MÔN
Trong vòng 30 ngày qua:
FIELD NAME FIELD TYPE VALUE
 ln giao hp hu môn N13 Number 000 - 999
13a. KHÔNG TR LI

×