Tải bản đầy đủ (.pdf) (62 trang)

Tài Liệu Thực Hành Dịch Tễ Học Thú Y

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (975.22 KB, 62 trang )

8/25/2009

Thӵc hành dӏch tӉ hӑc thú y
dŚƐ͘ >ġ dŚĂŶŚ ,ŝӅŶ

Mөc Tiêu
• Giӟi thiӋu chung mӝt sӕ phҫn mӅm sӱ
dөng trong dӏch tӉ
» Phҫn mӅm quҧn lý sӕ liӋu
» Phҫn mӅm thӕng kê

• Sӱ dөng các phҫn mӅm trong phân tích
dӏch tӉ hӑc cѫ bҧn
» Phân tích ÿѫn biӃn
» Phân tích ÿa biӃn

• Làm quen vӟi phҫn mӅm R

1


8/25/2009

Chѭѫng trình
y Ngày 1

y Giӟi thiӋu
y Quҧn lý sӕ liӋu bҵng EpiData
y Giӟi thiӋu phҫn mӅm thӕng kê STATA

y Ngày 2


y
y
y
y
y

Các nghiên cӭu dӏch tӉ
Các ÿҥi lѭӧng sӱ dөng trong nghiên cӭu dӏch tӉ
Dùng STATA ÿӇ tính các ÿҥi lѭӧng dung trong nghiên cӭu dӏch tӉ
Phân tích ÿa biӃn bҵng Logistic
Bài tұp

y
y
y
y

Thҧo luұn vӅ bài tұp
Giӟi thiӋu phҫn mӅm R
ThiӃt lұp bҧn ÿӗ nguy cѫ bҵng R
SaTScan ÿӇ xác ÿӏnh cluster trên bҧn ÿӗ dӏch tӉ

y Ngày 3

ŚƚƚƉ͗ͬͬĚŝĐŚƚĞ͘ũŝŵĚŽ͘ĐŽŵͬ

2


8/25/2009


EŐăLJ ϭ

Quҧn lý sӕ liӋu ÿiӅu tra
dӏch tӉ

3


8/25/2009

Sѫ ÿӗ nghiên cӭu
Ĉһt giҧ
thiӃt
ThiӃt kӃ khҧo sát, thí
nghiӋm
KiӇm chӭng
Thu thұp,
quҧn lý sӕ
liӋu
Ӭng dөng
thӵc tiӉn

Xӱ lý sӕ liӋu

KӃt luұn

DөĐ ƚŝġƵ
^ĂƵ ŬŚŝ ŚŽăŶ ƚŚăŶŚ ƉŚҫŶ ƚŚӵĐ ƚұƉ ŶăLJ͕ ĐĄĐ  ƐӁ͗
ϭ͘ ,ŝӇƵ ÿѭӧc ĐĄĐ ƚŚăŶŚ ƉŚҫŶ ĐӫĂ ĚĂƚĂďĂƐĞ

Ϯ͘ ŝӃƚ ĐĄĐŚ ƚŚŝӃƚ ŬӃ ĨůĂƚͲĨŝůĞ ĚĂƚĂďĂƐĞ ďҵŶŐ ĐĄĐŚ Ɛӱ ĚөŶŐ
ƉŝĂƚĂ
ϯ͘ ,ŝӇƵ ÿѭӧc ĐĄĐ ŶŐƵLJġŶ ƚҳĐ ĐӫĂ ĚĂƚĂďĂƐĞƐ
ϰ͘ ŝӃƚ ÿѭӧc ĐĄĐ ƉŚѭѫnŐ ƉŚĄƉ ŬŚĄĐ ŶŚĂƵ ÿӇ ŝŵƉŽƌƚ
ĚĂƚĂ ǀ㎠ХРƉŚҫŶ ŵӅŵ ƚŚӕŶŐ Ŭġ

4


8/25/2009

ӏŶŚ ŶŐŚšĂ
• ,Ӌ ƚŚӕŶŐ ƋƵҧŶ ůlj ĂƚĂďĂƐĞ
– ĂƚĂďĂƐĞ ƐŽĨƚǁĂƌĞ

• ĂƚĂďĂƐĞ
– ͞ŽůůĞĐƚŝŽŶ ŽĨ ĚĂƚĂ ƐƚŽƌĞĚ ŝŶ ƐŽŵĞ ŽƌŐĂŶŝnjĞĚ
ĨĂƐŚŝŽŶ͟ с ͞ƚұƉ ŚӧƉ ĐĄĐ Ěӳ ůŝӋƵ ĐŚӭĂ ƚƌŽŶŐ
ŶŚӳŶŐ ĚҥŶŐ Đſ ƚә ĐŚӭĐ͟

ĄĐ ŚŞŶŚ ƚŚӭĐ ůѭƵ ƚƌӳ ĚĂƚĂ
BiӃn (Variables = Fields)
Mã xác ÿӏnh (Unique identifier =
primary key, id)

Dӳ liӋu quan sát
(Records)

5



8/25/2009

ĄĐ ďѭӟc ƚƌŽŶŐ ƋƵҧŶ ůlj Ěӳ ůŝӋƵ
ϭ͘ ӏŶŚ ŶŐŚšĂ ďŝӃŶ
Ϯ͘ dҥŽ ĐҩƵ ƚƌƷĐ ĚĂƚĂďĂƐĞ ǀă ĚĂƚĂ ĚŝĐƚŝŽŶĂƌLJ
ϯ͘ <ŝӇŵ ƚƌĂ ƋƵҧŶ ůlj Ěӳ ůŝӋƵ ƚƌѭӟc ŬŚŝ ďҳƚ ÿҫƵ ƚŚƵ
ƚŚұƉ Ɛӕ ůŝӋƵ
ϰ͘ EŚұƉ ůŝӋƵ ǀă džĄĐ ÿӏŶŚ ŶŚӳŶŐ ƐĂŝ Ɛſƚ
ϱ͘ 'Śŝ ĐŚƷ ŶŚӳŶŐ ƚŚĂLJ ÿәŝ
ϲ͘ ӏŶŚ ŬLj ďĂĐŬ ƵƉ ĚĂƚĂƐĞƚ
ϳ͘ dҥŽ ĚĂƚĂƐĞƚ ÿӇ ƉŚąŶ ƚşĐŚ
ϴ͘ >ѭƵ ƚƌӳ ĚĂƚĂďĂƐĞ ďĂŶ ÿҫƵ ǀă ĚĂƚĂďĂƐĞ ĐƵӕŝ ĐƶŶŐ ǀă
ĨŝůĞ ƉŚąŶ ƚşĐŚ

ӏŶŚ ŶŐŚšĂ ďŝӃŶ͗ dġŶ ďŝӃŶ
• dġŶ Őӧŝ lj ŶŐŚšĂ ĐӫĂ ďŝӃŶ
• ^ӕ Ŭlj ƚӵ͗ ϴ ŵĂdž
ͻ ӕ ÿӏŶŚ ŶŐƵLJġŶ ƚҳĐ ÿһƚ ƚġŶ
• sş Ěө ;ĚĂƚĞϬ͕ ĚĂƚĞϭ͙͖ ďůŽŽĚϬ͕ ďůŽŽĚϭ͙Ϳ
• <ŚӑŶŐ ÿѭӧc ďҳƚ ÿҫƵ ďҵŶŐ ĚҩƵ η͕ Λ͕ ͙

• ĄŶ ŶŚĆŶƐ͗
– ĂƚĂƐĞƚƐ
– sĂƌŝĂďůĞƐ
– sĂƌŝĂďůĞ ǀĂůƵĞƐ

6



8/25/2009

ӏŶŚ ŶŐŚšĂ ďŝӃŶ ͗ ӏŶŚ ĚҥŶŐ ǀă Őŝӟŝ
ŚҥŶ ĐŚŽ ƉŚĠƉ

• ĂƚĂ ĚŝĐƚŝŽŶĂƌLJ
• ӕŝ ǀӟŝ ŵӛŝ ďŝӃŶ
– dLJƉĞ
– &ŽƌŵĂƚ

9DULDEOH

([DPSOH

9DULDEOH
VWRUDJH W\SH

&RQWLQXRXV

:HLJKW

1XPHULFDO PDQ\


&RQWLQXRXV

7LPH

1XPHULFDO


%RG\ FRQGLWLRQ

1XPHULFDO6WULQJ

3RV1HJ

1XPHULFDO

(\H FRORU

1XPHULFDO6WULQJ

2SHQ HQGHG
TXHVWLRQ 1DPHV

6WULQJ

• &ƌĞĞ ƚĞdžƚ ;ŵĞĚŝĐĂƚŝŽŶ ,QWHUYDO
Ϳ
%LQDU\
• ŝŶĂƌLJ ǀĂƌŝĂďůĞ
;ŵĞĚŝĐĂƚŝŽŶ LJĞƐ Žƌ 1RPLQDO
ŶŽͿ

– WĞƌŵŝƐƐŝďůĞ ǀĂůƵĞƐ
ͻ EŐƵLJġŶ ƚҳĐ
Ͳ

͘Ő͘ Ϭ с ŶĞŐĂƚŝǀĞ


• DŝƐƐŝŶŐ ǀĂůƵĞ

)UHH WH[W

$OWKRXJK HQWHUHG DV QXPHULFDO ZLOO EH DQDO\]HG DV
FDWHJRULFDO

Dӝƚ Ɛӕ ĚҥŶŐ ĚĂƚĂďĂƐĞ
'DWDVHW IRUPDW

'DWDEDVH FUHDWHG E\

$OO GDWD LQ RQH VSUHDGVKHHW

5HVHDUFKHU

$OO GDWD LQ RQH WDEOH RI D GDWDEDVH FUHDWHG
E\ GDWD PDQDJHPHQW V\VWHP

5HVHDUFKHU

$OO GDWD LQ PXOWLSOH WDEOHV RI D GDWDEDVH
UHODWLRQDO RU QRW


5HVHDUFKHU

$OO GDWD LQ PXOWLSOH WDEOHV RI D UHODWLRQDO
GDWDEDVH


'DWDEDVH SURIHVVLRQDOV

4XHULHG )LOWHUHG GDWD
IURP PXOWLSOH WDEOHV
RI D UHODWLRQDO GDWDEDVH

'DWDEDVH SURIHVVLRQDOV

'DWD IURP PXOWLSOH WDEOHV DQG PXOWLSOH
VRXUFHV ZLWK RU ZLWKRXW UHIHUHQWLDO
LQWHJULW\


'LIIHUHQW

7


8/25/2009

ĂƚĂďĂƐĞƐ
+HDOWK VFLHQFHV WHUPLQRORJ\

&RPSXWHU VFLHQFH WHUPLQRORJ\

)ODWILOH GDWDEDVHV

)ODWILOH GDWDEDVH

5HODWLRQDO GDWDEDVHV


+LHUDUFKLFDO GDWDEDVHV
1HWZRUN GDWDEDVHV
5HODWLRQDO GDWDEDVHV
2EMHFWRULHQWHG GDWDEDVHV

&ůĂƚͲĨŝůĞ ĚĂƚĂďĂƐĞ
• dҩƚ Đҧ ƚŚƀŶŐ ƚŝŶ ƚƌŽŶŐ ϭ ďҧŶ
• ĂƚĂ ĐŚӭĂ ƚƌŽŶŐ ĐĄĐ ĚҥŶŐ
– ^ƉƌĞĂĚƐŚĞĞƚƐ
– KŶĞ ƚĂďůĞ ŝŶ Ă ĚĂƚĂďĂƐĞ

• ƉŝĂƚĂ ŶƚƌLJ
• 'ŝӟŝ ŚҥŶ Ɛӱ ĚөŶŐ ƚƌŽŶŐ ĚĂƚĂďĂƐĞ ƉŚąŶ ŶŚĄŶŚ

8


8/25/2009

dƌĄŶŚ Ɛӱ ĚөŶŐ ƐƉƌĞĂĚƐŚĞĞƚƐ
Tên cӝt không duy nhҩt

Age vӯa dҥng sӕ lүn dҥng
chuӛi
NhiӅu dҥng format cӫa
date

yƵҩƚͬŶŚұƉ ĚĂƚĂ ǀ㎠ХРƐƚĂƚŝƐƚŝĐĂů
ƐŽĨƚǁĂƌĞ

• yƵҩƚ ĚĂƚĂ ƚӯ ĚĂƚĂďĂƐĞ ĜӇ ŶŚұƉ ǀ㎠ХРƉŚҫŶ ŵӃŵ
ƚŚӕŶŐ Ŭġ
• ƉŝĂƚĂ ƚŽ ;^ƚĂƚĂ͕ ^W^^͕ ^ ^Ϳ͕ ĚĂƚĂ ĂŶĚ ůĂďĞůƐ
• ŶLJ ĚĂƚĂďĂƐĞ ʹ ͘ƚdžƚ Žƌ ͘ĐƐǀ ĨŝůĞ ʹ ƐƚĂƚƐ ƉĂĐŬĂŐĞ

9


8/25/2009

'ŝӟŝ ƚŚŝӋƵ ƉŚҫŶ ŵӅŵ

W/ d ůă ŐŞ
• EpiData là phҫn mӅm hӛ trӧ nhұp và quҧn lý sӕ
liӋu, ÿѭӧc lұp trình bӣi Bác sƭ Jens M.Lauritsen,
ngѭӡi Ĉan Mҥch.
• Phҫn mӅm này ÿã ÿѭӧc sӱ dөng lҫn ÿҫu tiên
cho mӝt ŶŐŚŝġŶ ĐӭƵ ĚӏĐŚ ƚӉ ŚӑĐ ͞WŚžŶŐ ĐŚӕŶŐ ƚĂŝ
ŶҥŶ͘͟
• Ý tѭӣng cӫa ngѭӡi phát triӇn phҫn mӅm
EpiData là viӋc tҥo ra mӝt phҫn mӅm nhұp liӋu
miӉn phí, giao diӋn ngѭӡi dùng thân thiӋn, dӉ
sӱ dөng

10


8/25/2009

• EpiData là sҧn phҫn hoàn toàn miӉn phí, ngѭӡi

sӱ dөng có thӇ tҧi chѭѫng trình cài ÿһt tӯ trang
Web .
• EpiData có thӇ chҥy trên các máy tính cài ÿһt hӋ
ÿiӅu hành Microsoft Windows ŚŽһĐ DĂĐŝŶƚŽƐŚ͘
• Epidata có thӇ xuҩt sӕ liӋu sang nhiӅu dҥng
khác nhau ÿӇ sӱ dөng cho phân tích sӕ liӋu
bҵng các phҫn mӅm nhѭ Stata, Spss, .v.v.

ҥŶŐ ĨŝůĞ ƚƌŽŶŐ ĞƉŝĚĂƚĂ
• &ŝůĞ ĚҥŶŐ Ύ͘ƋĞƐ
– &ŝůĞ ƚŚŝӃƚ ŬӃ ďҧŶ ƋƵĞƐƚŝŽŶĂŝƌĞ
ͻ &ŝůĞ ĚҥŶŐ Ύ͘ƌĞĐ
– &ŝůĞ ŶŚұƉ ǀă ůѭƵ ƚƌӳ Ěӳ ůŝӋƵ

• &ŝůĞ ĚҥŶŐ ,<

11


8/25/2009

<ŝӇƵ Ěӳ ůŝӋƵ

12


8/25/2009

<ŝ͛Ƶ / ŶƵŵďĞƌ
• Chuӛi ÿӏnh dҥng là <IDNUM>

• Mӝt trѭӡng sӕ liӋu ÿѭӧc khai báo kiӇu ID
number thì giá trӏ sӕ liӋu cӫa trѭӡng sӁ ÿѭӧc tӵ
ÿӝng nhұp khi nhұp sӕ liӋu. Ngѭӡi sӱ dөng
không ÿѭӧc nhұp giá trӏ cho trѭӡng này.
• sĚ͗ /y ^Ž ƚŚƵ ƚƵ ƉŚŽŶŐ ǀĂŶ ф/EhDх

<ŝ͛Ƶ EƵŵĞƌŝĐ
• Chuӛi ÿӏnh dҥng sӱ dөng kí tӵ #, ví dө ###,
hoһc ###.###, hoһc ########, ŚŽһĐ ηη͘ηηηη ͘ǀ͘ǀ͘
• Trѭӡng ÿѭӧc khai báo kiӇu sӕ chӍ chҩp nhұn sӕ
liӋu nhұp vào ӣ dҥng sӕ.
• Ĉӝ rӝng cӫa trѭӡng ÿѭӧc xác ÿӏnh bҵng sӕ kí tӵ
# ÿѭӧc khai báo.
• Kích cӥ lӟn nhҩt sӕ liӋu nhұp vào mӝt trѭӡng có
kiӇu sӕ là 14 chӳ sӕ gӗm cҧ ký tӵ (“.”)ngăn cách
phҫn sӕ nguyên và phҫn thұp phân vӟi sӕ thұp
phân.

13


8/25/2009

<ŝ͛Ƶ dĞdžƚ
• Chuӛi ÿӏnh dҥng là sӱ dөng ký tӵ “_” hoһc <E >
• Chuӛi văn bҧn nhұp vào có thӇ gӗm các ký tӵ a,
b, c, … và kӇ cҧ các chӳ sӕ.
• Ĉӝ rӝng cӫa trѭӡng lӟn nhҩt là 80 kí tӵ.
• Khi khai báo mӛi dҩu “_” tѭѫng ӭng vӟi khai báo
cho mӝt kí tӵ.

• sĚ͗ sϮ ,Ž ƚĞŶ ͺͺͺͺͺͺͺͺͺͺͺͺͺͺͺͺͺ

• <ŝ͛Ƶ hƉƉĞƌͲĐĂƐĞ ƚĞdžƚ
– Chuӛi ÿӏnh dҥng là <A>, hoһc <A >
– Trѭӡng ÿѭӧc khai báo kiӇu Upper-case text
thì sӕ liӋu nhұp vào trѭӡng này ÿѭӧc hiӇu là
dҥng văn bҧn và ÿѭӧc tӵ ÿӝng chuyӇn sang
dҥng kí tӵ viӃt hoa.
– Ĉӝ rӝng cӫa trѭӡng tѭѫng ӭng vӟi sӕ kí tӵ
“trӕng” (dҩu cách) giӳa hai dҩu “<” ǀă ͞х͘͟

14


8/25/2009

<ŝ͛Ƶ ŽŽůĞĂŶ
• Ĉây là kiӇu dӳ liӋu logic.
• Trѭӡng ÿѭӧc khai báo kiӇu này chӍ chҩp
nhұn giá trӏ Y hoһc N (cNJng có thӇ chҩp
nhұn sӕ 0 hoһc 1)
• huӛi ÿӏnh dҥng là <Y>

<ŝ͛Ƶ ĂƚĞ
• Chuӛi ÿӏnh dҥng là <dd/mm/yyyy>, hoһc
<mm/dd/yyyy>, hoһc фLJLJLJLJͬŵŵͬĚĚх
• <ŝ͛Ƶ ƚŽĚĂLJ͛Ɛ ĚĂƚĞ
– Chuӛi ÿӏnh dҥng là <today-dmy>, hoһc
<today-mdy>, hoһc <today-ymd>
– Mӝt trѭӡng ÿѭӧc khai báo kiӇu Today’s date

sӁ ÿѭӧc tӵ ÿӝng ÿiӅn vào giá trӏ ŶŐăLJ ŚŝӋŶ ƚҥŝ
;ŶŐăLJ ĐӫĂ ŵĄLJ ƚşŶŚͿ ŬŚŝ ŶŚұƉ ůŝӋƵ͘

15


8/25/2009

<ŝ͛Ƶ ƐŽƵŶĚĞdž
• KiӇu Soundex là kiӇu dӳ liӋu mã hóa. Sӕ liӋu
nhұp vào trѭӡng này sӁ ÿѭӧc Epidata tӵ ÿӝng
mã hóa (chuyӇn sang mӝt giá trӏ khác) theo quy
luұt mã hóa cӫa Epidata trѭӟc khi lѭu vào cѫ sӣ
dӳ liӋu
• Chuӛi ÿӏnh dҥng là >

ăŝ Ĝһƚ ƉŝĚĂƚĂ
• Dӣ ĐӱĂ Ɛә ƚƌŞŶŚ ĚƵLJӋƚ /ŶƚĞƌŶĞƚ džƉůŽƌĞƌ ǀ㎠ƚƌĂŶŐ
ǁĞď ǁǁǁ͘ĞƉŝĚĂƚĂ͘ĚŬ͕ ǀ㎠ŵөĐ ŽǁŶůŽĂĚ ;ŐĞƚ ĨŝůĞƐͿ͘
• Chӑn liên kӃt Epidata Entry ÿӇ nhҧy ÿӃn phҫn
Epidata Entry
• Chӑn mөc Complete setup ÿӇ bҳt ÿҫu tҧi tӋp
chѭѫng trình cài ÿһt vӅ máy tính.
• dŝӃŶ ŚăŶŚ ŝŶƐƚĂůů

16


8/25/2009


*LӟL WKLӋX SKҫQ PӅP

17


8/25/2009

• Phҫn mӅm xӱ lý thӕng kê cӫa StataCorp
• Ý nghƭa là "statistics" and "data“
• Ĉѭӧc sӱ dөng ngày càng rӝng rãi vì khҧ
năng phân tích mҥnh và dӉ sӱ dөng, bên
cҥnh ÿó có thӇ lұp trình và giá thành rҿ
• NhiӅu chӭc năng phân tích ӭng dөng
trong dӏch tӉ

Tài liӋu Tham khҧo
• ŚƚƚƉ͗ͬͬǁǁǁ͘ĂƚƐ͘ƵĐůĂ͘ĞĚƵͬƐƚĂƚͬƐƚĂƚĂͬ
• ,ĂŶĚŬ ŽĨ ^ƚĂƚŝƐƚŝĐĂů ŶĂůLJƐĞƐ hƐŝŶŐ
^ƚĂƚĂ
LJ ^ŽƉŚŝĂ ZĂďĞͲ,ĞƐŬĞƚŚ͕ ƌŝĂŶ ^͘ ǀĞƌŝƚƚ

18


8/25/2009

Cài ÿһt STATA

Các thành phҫn cӫa STATA







ŽŵŵĂŶĚ
ZĞƐƵůƚ
ZĞǀŝĞǁ
sĂƌŝĂďůĞƐ
ĂƚĂ ĞĚŝƚŽƌ

19


8/25/2009

Mӝt sӕ vҩn ÿӅ
• Thao tác cӫa Stata có thӇ ÿѭӧc thӵc hiӋn
thông qua 2 kiӇu
– graphical user interface (GUI)
– command line

• Do-file
• log

1KɪS OLʄX
1. Nhұp trӵc tiӃp
2. Nhұp tӯ gián tiӃp


20


8/25/2009

Nhұp trӵc tiӃp
• Tҥo biӃn bҵng lӋnh genenate = gen
• Nhұp sӕ liӋu bҵng lӋnh edit
• Label biӃn
• Tѭѫng tӵ thӵc hiӋn thao tác bҵng GUI

Nhұp gián tiӃp
Các phҫm mӅm
quҧn lý sӕ liӋu
Phҫm mӅm thông thѭӡng
- Excel, Access

Text file

Phҫm mӅm chuyên dùng
- Epidata, survey toolbox

21


×