53
Chương II
XỬ LÝ DỮ LIỆU TRONG DỊCH TỄ HỌC THÚ Y
Dịch tễ học là môn học về trạng thái và diễn biến sức khỏe của một quần thể. Nói như
vậy dịch tễ học bao hàm vấn ñề sức khỏe theo không gian (trạng thái) và thời gian (diễn
biến). ðồng thời dịch tễ học bao hàm cả vấn ñề y học (sức khỏe) và toán học thống kê
(quần thể). Trước ñây, tại các nước xã hội chủ nghĩa cũ, dịch tễ học ñược hiểu là môn học
về các bệnh truyền nhiễm. Chính xác hơn là phần nghiên cứu về sự lây lan và biện pháp
phòng chống bệnh truyền nhiễm trong các trường ñào tạo bác sỹ hay bác sỹ thú y. ðó là
cách hiểu chưa ñầy ñủ bởi dịch tễ học không chỉ giới hạn trong các bệnh truyền nhiễm mà
còn là môn học ñể xác ñịnh mối tương quan giữa sức khỏe với các yếu tố có trong môi
trường xung quanh và quan trọng hơn, dịch tễ học là môn học nghiên cứu về một quần thể
và ño lường bệnh tật của quần thể ñó.
Dịch tễ học còn ñược ñịnh nghĩa là môn toán (thống kê) mang màu sắc y học. Do vậy,
với sự phát triển của ngành ñiện tử, dịch tễ học ñã ñược tin học hóa rất nhanh chóng. Có
thể nói rằng trong khoa học về sức khỏe của người và ñộng vật, dịch tễ học là môn học
ñược tin học hóa sớm nhất và có ý nghĩa nhất. Nhiều phần mềm vi tính ñã ñược viết và
ñược sử dụng rộng rãi. Ngược lại tin học góp phần thúc ñẩy làm cho dịch tễ học phát triển
và dịch tễ học ñược sử dụng nhiều hơn và rộng rãi hơn trong việc quản lý bệnh tật.
Trong chương này, chúng tôi xin giới thiệu một số phần mềm máy vi tính thường ñược
sử dụng trong dịch tễ học. ðể hiểu và sử dụng các phần mềm này, yêu cầu người ñọc (i)
phải là người ñã nắm rõ các khái niệm về dịch tễ học (tỷ lệ mắc bệnh, tỷ suất mắc bệnh, tỷ
lệ chết, tỷ lệ tử vong, tỷ lệ tấn công, ñộ nhạy, ñộ ñặc hiệu, ngưỡng dương tính…). Mặt
khác cũng ñòi hỏi người ñọc (ii) phải có ñủ kiến thức về toán thống kê (số trung bình,
phương sai, khoảng tin cậy, phân bố chuẩn…). Việc sử dụng các phần mềm không khó,
thực chất tin học là công cụ thực hiện các phép tính toán, chúng ta chỉ việc nhập số liệu và
nhấp chuột là có kết quả. Tuy nhiên, kết quả ñó nói lên ñiều gì thì cần kiến thức về dịch tễ
và toán thống kê. Thậm chí, có hiểu về dịch tễ học thì việc nhập số liệu vào máy mới ñúng
và chính xác, ñồng thời kết quả ñưa ra mới có ý nghĩa. Bởi vì máy nhận bất kỳ số liệu nào
khi ta nhập vào và cho kết quả theo số liệu nạp vào nó.
Hạn chế trong khuôn khổ giới thiệu phần mềm dùng trong dịch tễ học, chương này
không giải thích các khái niệm dịch tễ học cũng như không trình bày chi tiết về toán thống
kê. Người ñọc ñược mặc ñịnh là ñã có ñầy ñủ kiến thức về hai môn học trên. Cuối cùng
(iii), ña số các phần mềm ñều viết bằng tiếng Anh hoặc tiếng nước ngoài khác. Do vậy ñối
với sinh viên và những người không thành thạo tiếng Anh hoặc ngôn ngữ nước ngoài nào
khác sẽ rất khó khăn khi học và sử dụng các phần mềm dịch tễ. Với các ñiều kiện (i, ii và
iii) như nêu trên, sau khi ñọc xong chương này, người ñọc có thể sử dụng phần mềm Win
Episcope hoặc EpiCalc sau một vài lần thực tập trên máy.
54
1. CÁC PHẦN MỀM VI TÍNH DÙNG TRONG DỊCH TỄ HỌC
1.1. ðặc ñiểm
Các phần mềm vi tính dùng trong dịch tễ học ban ñầu chủ yếu là ñể tính toán các con
số ño lường về bệnh trong dịch tễ học. Cùng với sự phát triển tính năng của máy vi tính và
thiết bị ñiện tử, nhiều phần mềm khác ra ñời có tính phức tạp cao phản ánh cụ thể và rõ
ràng hơn về tình hình bệnh dịch. Ví dụ các phần mềm vi tính kết hợp với kỹ thuật ñịnh vị
GIS có thể xác ñịnh vị trí một ổ dịch trên bản ñồ một cách chính xác không những về kinh
ñộ, vĩ ñộ mà cả về ñộ cao so với mặt biển, hoặc phần mềm EpiMap cho phép chúng ta xác
lập bản ñồ dịch tễ mà nếu không có máy vi tính thì con người không thể làm nổi. Cũng như
vậy, người ta ñã ñưa ra các phần mềm về quản lý và thông báo dịch (trong các nước thành
viên của OIE) sao cho các khái niệm dịch tễ trở thành ngôn ngữ chung của nhân loại khi
nói về dịch bệnh. Các phần mềm như vậy dành cho những cán bộ dịch tễ chuyên nghiệp.
Chương này chỉ giới thiệu phần mềm cơ bản ñể tính toán các chỉ số ño lường về bệnh tật
ñược giảng dạy cho sinh viên ñại học trong môn dịch tễ học.
Cuối cùng, ñặc ñiểm của phần mềm vi tính dùng trong dịch tễ học thường là các ô
trống, nhập số liệu vào các ô trống ñó giống như thay các con số vào các ký hiệu bằng chữ
trong các công thức toán học. Máy sẽ tính và cho ta kết quả mong muốn. Ví dụ, công thức
v=S/t là công thức tính tốc ñộ trung bình v bằng quãng ñường ñi S chia cho thời gian t. ðể
có v ta nhập giá trị cụ thể của S và con số giá trị của t, nhấn chuột, máy sẽ cho ra con số
khác, ñó là v và là tốc ñộ trung bình. ðây chỉ là ví dụ ñơn giản. Trong nhiều trường hợp
cần phải có các khái niệm rõ và chi tiết hơn hơn. Ví dụ, trong buôn bán, ta có thể tính lãi
bằng chênh lệch giá trị số tiền chi ra khi mua và tiền thu vào khi bán; nhưng ñó chưa phải
là lãi thực, còn phải trừ tiền thuê cửa hàng và tiền thuê nhân công bán hàng… ðiều ñó cho
thấy cần có khái niệm như thế nào là lãi. Như vậy vẫn chưa ñủ, lại phải tính các khoản chi
khác như thuế (nhiều loại thuế khác nhau)… Trong dịch tễ học cũng như vậy. ðiều ñó nói
lên rằng, phần mềm dùng trong dịch tễ học thực ra chỉ ñể tính toán các con số về bệnh tật.
Các công thức tính toán này ñều có trong các sách về dịch tễ học. Muốn hiểu biết ý nghĩa
các kết quả cần phải hiểu rõ công thức ñể tính kết quả là như thế nào. Tóm lại, sử dụng
phần mền vi tính dùng trong dịch tễ học chủ yếu là nhập số liệu (ñiền các con số vào các
công thức toán học ñã ñược lập ra) ñể tính giá trị các số ño lường về bệnh tật.
1.2. Các phần mềm ñược dùng nhiều trong dịch tễ học
Như trên ñã nói, có nhiều phần mềm vi tính dùng trong dịch tễ học. Có những phần
mềm mang tính ñặc thù của dịch tễ học như: Epi-Info, EpiCalc, WinEpiscope, EpiMap,
ToolBox, Freecalc … và có phần mềm không chỉ dùng trong dịch tễ học như phần mềm
GIS (ñịnh vị ñịa lý toàn cầu), thậm chí các phần mềm toán thống kê cũng là các phầm mềm
có thể sử dụng ñể tính toán các số ño lường về bệnh tật. Với những người chuyên về dịch
tễ, việc sử dụng thành thạo các phần mềm trên là yêu cầu bắt buộc. Vì hạn chế giới thiệu
trong một chương sách chúng tôi giới thiệu hai phần mềm chính là WinEpiscope và
Epicalc.
2. SỬ DỤNG PHẦN MỀM WIN EPISCOPE
2.1. Giới thiệu
Sau khi cài ñặt phần mềm này vào máy vi tính, chúng ta có thể biết rõ hơn về nguồn
gốc và các tác giả soạn thảo phần mềm này. Sơ lược như sau: Win Episcope có nguồn gốc
55
từ chương trình EPIDEMO do trường ñại học Hoàng gia Thú y và Nông nghiệp
Copenhagen (ðan Mạch) và ñại học Utrecht (Hà Lan) biên soạn. Sau ñó nó ñược cải tiến
và ñổi tên là EPISCOPE, tiếp theo ñó ñược cải tiến trở thành WIN EPISCOPE với sự hợp
tác của các trường ñại học khác như Wagningen Agricultural University (Hà Lan) và ñại
học Zaragoza (Tây Ban Nha). Phần mềm này có nhiều phiên bản khác nhau, chúng tôi xin
giới thiệu trong chương này phiên bản 2.0. ðể cập nhật, ta có thể tải các phiên bản mới
nhất theo ñịa chỉ: hoặc hoặc
.
Một lý do khác là ñây là phần mềm công cộng, ai cũng có thể tải về, cài ñặt vào máy,
sử dụng, sao chép và phổ biến cho người khác.
Các tiêu chí có thể tính toán ñược bằng Win Episcope
Những người biết tiếng Anh và tiếng Tây Ban Nha có thể dễ dàng sử dụng phần mềm
này vì nó ñược viết ra trên cơ sở hai ngôn ngữ nói trên và phần Help giới thiệu ñầy ñủ các
tiêu chí có thể tính toán ñược khi dùng phần mềm này
Các tiêu chí ñó là
:
Các phương pháp chẩn ñoán
(
trong Menu Test), Nghiên cứu về mẫu
(trong Menu Sample), Phân tích
(
trong Menu Analysis)
Sau khi cài ñặt WIN EPISCOPE, nháy chuột vào chương trình ta sẽ thấy giao diện như
sau xuất hiện trên màn hình:
Start
Progams
WinEpi
Giao diện này thay ñổi ngay trong vòng vài giây sau ñó, phần tên chương trình mất ñi
chỉ ñể lại giao diện trống và chúng ta có thể bắt ñầu sử dụng.
56
Trên thanh công cụ có các menu sau: File, Test, Samples, Analysis, Model, Window
và Help.
Mục File dùng ñể lưu trữ các thư mục và các tính toán ñã ñược tiến hành và có chức
năng giống như mục File của các phần mềm khác trong máy vi tính. Các mục dùng trong
dịch tễ học là test, samples, analysis , model và help.
ðối với người ñã nắm rõ môn học dịch tễ hoc và biết tiếng Anh hoặc Tây Ban Nha, có
thể tự mình làm quen và sử dụng phần mềm này một cách dễ ràng. Khi có khó khăn có thể
vào phần Help ñể ñược hướng dẫn.
Nhấn chuột vào mục Test chẳng hạn chúng ta sẽ thấy trên màn hình xuất hiện giao
diện sau (hình 2.1)
:
Hình 2.1.
Như hình trên cho thấy xuất hiện các submenu: Agreement, Evaluation, Advanced
Evaluation, Cut-off Value và Multiple Test. Ta nhấn chuột vào submenu Evaluation chẳng
hạn, trên màn hình sẽ xuất hiện giao diện như sau (hình 2.2):
Test
Evaluation…
Hình 2.2
57
Trên thanh công cụ của window con sẽ xuất hiện dòng chữ: Diagnosis Test Evaluation
có nghĩa là ñánh giá phương pháp chẩn ñoán. Cửa sổ con này có hai phần. Phần trên có các
ô màu trắng và có dòng chữ input of DATA có nghĩa là phần ñể nhập số liệu. Phần dưới
ghi RESULTS là phần cho kết quả.
Ô nhập số liệu có 2 cột (Yes và No) thuộc tiêu ñề Disease (có mắc bệnh và không mắc
bệnh) và 2 dòng (+ và -) thuộc tiêu ñề Test (kết quả dương tính hay âm tính).
ðể hiểu và sử dụng tiện ích này, nói cách khác tiện ích này dùng ñể làm gì chúng ta lấy
một thí dụ như sau: một nhà khoa học nọ sang chế ra một phương pháp chẩn bệnh bằng kỹ
thuật ELISA nhằm phát hiện vi rút dịch tả lợn trong huyết thanh. ðể xác ñịnh phương pháp
này có giá trị chính xác ñến ñâu cần phải xác ñịnh các tiêu chí sau:
- ðộ nhạy (sensitivity)
- ðộ ñặc hiệu (specificity)
- Tỷ lệ mắc bệnh thực (true prevalence)
- Tỷ lệ mắc bệnh thấy ñược (apparent prevalence)
- Tỷ lệ dự ñoán dương tính (predictive value +)
- Tỷ lệ dự ñoán âm tính (predictive value -)
ðể làm việc ñó, tác giả sử dụng mẫu máu của 50 lợn mắc bệnh và 50 lợn không mắc
bệnh ñể xác ñịnh giá trị của phương pháp ELISA do ông ta sáng chế. Sau khi xét nghiêm,
kết quả thu ñược như sau: trong số 50 mẫu lợn bệnh, có 47 mẫu dương tính và 3 mẫu âm
tính. Trong số 50 mẫu lợn khỏe mạnh có 2 mẫu cho kết quả dương tính. Ta nhập số liệu
vào máy 4 con số nói trên như hình 2.3 sau ñây:
Hình 2.3.
58
ðồng thời nhấp chuột vào các giá trị về ñộ tin cậy (Level of Confidence). Chúng ta
chọn với ñộ tin cậy là 95% chẳng hạn. Sau khi nhập ñầy ñủ số liệu, nút calculate sẽ hiện rõ
màu xanh. Nhấn chuột vào nút calculate (tính) ta sẽ có các kết quả trên màn hình như sau
(hình 2.4.):
Hình 2.4.
Nhìn vào bảng kết quả chúng ta thấy sensitivity (ñộ nhạy của phương pháp này) là
94%; với Lower Lim (cận dưới) là 87,4% và cận trên (Upper Lim) là 100%. Cũng như vậy
với ñộ ñặc hiệu (Specificity) là 96% cận dưới là 90,56% và cận trên là 100%.
Về kết quả các tiêu chí khác chúng ta thấy:
- Tỷ lệ mắc bệnh thực (true prevalence): 50%
- Tỷ lệ mắc bệnh thấy ñược (apparent prevalence): 49%
- Tỷ lệ dự ñoán dương tính (predictive value +): 95,9%
- Tỷ lệ dự ñoán âm tính (predictive value -): 94,1% (ñã làm tròn số).
ðể hiểu các tiêu chí khác, chúng ta lập bảng 2X2 như sau (bảng 2.1):
Bảng 2.1. Một thí dụ về bảng 2X2
Có bệnh Không có bệnh Tổng số
Kết quả dương tính A (47) B (2) A+B=49
Kết quả âm tính C (3) D (48) C+D=51
Tổng số A+C = 50 B+D=50 (A+B+C+D) = N
59
Thật ra, khi lập bảng 2X2 như trên ta có thể tính các chỉ số như sau:
- ðộ nhạy (sensitivity) = A/A+C = 47/50 = 94%
- ðộ ñặc hiệu (specificity) = D/B+D = 48/50 =96%
- Tỷ lệ mắc bệnh thực (true prevalence) = (A+C)/N = 50/100 = 50%
- Tỷ lệ mắc bệnh thấy ñược (apparent prevalence) = (A+B)/N = 40/100 = 49%.
- Tỷ lệ dự ñoán dương tính (predictive value +) = A/A+B = 47/49 = 95,9%
- Tỷ lệ dự ñoán âm tính (predictive value -) = D/C+D = 48/51 = 94,1%
Tuy nhiên ñể tính giá trị cận trên và cận dưới (toán thống kê) lại rất mất thời gian khi
coi các kết quả trên ñây có phân bố chuẩn và tính chúng với ñộ tin cậy là 95%. Nếu chúng
ta thay ñộ tin cậy ví dụ là 97,5% chúng ta nhấn chuột vào nút dành cho con số 97.5%
chúng ta sẽ thấy các con số kết quả thay ñổi theo nhưng chủ yếu là cận trên và cận dưới.
Về ý nghĩa các con số trên, xin nhắc lại là bài viết này dành cho người ñọc ñược mặc
ñịnh là ñã có kiến thức về dịch tễ học và toán thống kê. Bài viết này không giới thiệu cặn kẽ
các khái niệm sử dụng trong dịch tễ học. Cũng như vậy ñối với kiến thức về toán thống kê.
2.2. Các phương pháp chẩn ñoán
Nhấn chuột vào submenu TEST ta có
a. Thử sự trùng hợp kết quả (Test of Agreement)
Trong nhiều trường hợp, phải sử dụng các phương pháp tốn kém ñể xác ñịnh dịch
bệnh. Các phương pháp này chưa phải ñã là hoàn hảo do không xác ñịnh ñược ñộ ñặc hiệu
và ñộ nhạy của nó. Trong hoàn cảnh như vậy, khi dùng một phương pháp thay thế (rẻ hơn,
nhanh hơn hoặc ñơn giản và dễ thực hiện hơn…) phải so sánh với phương pháp nói trên
ñược lấy làm chuẩn. Sự trùng hợp về kết quả của hai phương pháp ñược thể hiện bằng giá
trị Kappa, tỷ lệ trùng kết quả
Trong phần kết quả chúng ta thấy giá trị của Kappa và khoảng tin cậy (Confidence
Interval) của Kappa ñược tính với hai giả thiết. (i) giả thiết thứ nhất là sai số chuẩn của K
bằng không [se(0)] và giả thiết thứ hai (ii) là sai số chuẩn của K khác 0 [se(1)].
ðể nhập số liệu, trong bảng 16 ô có phần hàng dọc là kết quả của phương pháp chuẩn;
các chữ A, B, C, D là tiêu chí ñánh giá (ví dụ A là số dương tính, B số nghi ngờ và C là số
âm tính theo phương pháp chuẩn). Phần hàng ngang là kết quả của phương pháp thay thế.
Như vậy, ô Aa là cùng có kết quả dương tính với cả 2 phương pháp; Ac là dương tính với
phương pháp chuẩn nhưng âm tính với phương pháp thay thế…
Thí dụ: ta có 100 mẫu huyết thanh ñược xét nghiệm kháng thể vi rút cúm type A với
hai phương pháp ELISA và HI (ức chế ngưng kết hồng cầu). ELISA ñược coi là chuẩn
nhưng tốn kém và phức tạp trong khi thực hiên. Sau khi xét nghiệm ta thấy số mẫu dương
tính với cả hai phương pháp (Aa) là 60; dương tính với ELISA và âm tính với HI (Ab) là 3;
âm tính với ELISA và dương tính với HI (Ba) là 4 và âm tính với cả hai phương pháp (Bb)
là (100 – 60 – 4 – 3) = 33 mẫu. Nhập các con số trên vào các ô tương ứng, xác ñịnh ñộ tin
cậy, nút calculate sẽ hiện rõ màu xanh, nhấn vào ñó ta có kết quả (xem hình 2.5) như sau:
Test
Agreement…
60
Hình 2.5.
Trong phần kết quả cho thấy:
- Tỷ lệ trùng kết quả quan sát thấy (Observed Proportion of Agreement) là 93%,
- Tỷ lệ hy vọng trùng kết quả (Expected Proportion of Agreement) là 53,6%,
- Tỷ lệ trùng quan sát ñược trừ ñi tỷ lệ trùng do ngẫu nhiên (Observed Minus Chance)
là 39,4%
- Tỷ lệ trùng kết quả tối ña ngoài tỷ lệ trùng do ngẫu nhiên (Max. possible agreement
beyond chance) là 46,4% và chỉ số Kappa là 0,894 với các cận trên và cận dưới theo giả
thiết sai số chuẩn là 0 [Se(0)] và [Se(1)] khác 0.
b. ðánh giá phương pháp chẩn ñoán (Evaluation)
Như ñã trình bày trong phần cuối mục giới thiệu (2.1).
c. Advanced Evaluation – ðánh giá phân tích phương pháp chẩn ñoán.
Với ñộ nhạy và ñộ ñặc hiệu cho trước của một phương pháp chẩn ñoán, kèm theo tỷ lệ
mắc bệnh thực và số mẫu kiểm tra sử dụng phương pháp ñó (các dữ liệu nhập vào máy),
tiện ích này cho biết mối tương quan giữa các chỉ số liên quan. Trong hình 6 có thí dụ về
hai phương pháp chẩn ñoán. Phương pháp 1 có (ví dụ) ñộ nhạy (sensitivity) là 96% ñộ ñặc
hiệu (specificity) là 98%, dùng phương pháp này ñể xét nghiệm 100 (sample) mẫu tại một
quần thể có tỷ lệ mắc bệnh thực (true prevalence) là 2%. Ta có kết quả là sẽ có hai mẫu
dương tính mắc bệnh thật (dương tính thật) và hai mẫu dương tính nhưng thực chất không
mắc bệnh (dương tính giả).
Ngoài ra máy cho ta biết:
- Tỷ lệ dương tính thấy ñược là 3,88% (trong khi thực sự chỉ có 2%).
- Giá trị tiên ñoán dương tính là: 49,48% (có nghĩa là khi dùng phương pháp này, chỉ
một nửa số mẫu dương tính ñúng là dương tính từ bệnh phẩm mắc bệnh thực)
61
- Giá trị tiên ñoán âm tính là: 99,92% (có nghĩa là khi dùng phương pháp này, một mẫu
có kết quả âm tính thì chắc chắn 99,9% ñúng là âm tính).
- Ngoài ra máy còn cho ta các số liệu khác khi thay ñổi tỷ lệ dương tính thật và mối
tương quan giữa tỷ lệ dương tính thật với các chỉ số nêu trên.
Test
Advanced Evaluation…
Hình 2.6b
Hình 2.6b
62
Cũng với 100 mẫu trên nếu ta sử dụng phương pháp xét nghiệm có ñộ nhạy là 60% và
ñộ ñặc hiệu là 80%, ta sẽ có kết quả khác, tỷ lệ mắc bệnh (dương tính) sẽ là 20,8% (trong
khi thực tế chỉ là 2%). Và mối tương quan dạng ñồ thị giữa các tiêu chí cũng khác ñi. Xem
chi tiết trong hình 2.6a và 2.6b dưới ñây.
d. Xác ñịnh ngưỡng (dương tính) - cut-off value
Phần này dành chủ yếu cho người thiết lập các phương pháp chẩn ñoán mới.
e. ðánh giá phương pháp chẩn ñoán dùng nhiều phép thử – multitest
Trong khi chẩn ñoán bệnh ta không chỉ dùng một phép thử mà kết hợp nhiều phép thử
(xét nghiệm) khác nhau, gọi là phương pháp chẩn ñoán ña phép thử (multitest). Các phép
thử không phải ñều cho cùng kết quả giống nhau. Kết quả có thể là dương tính với phép
thử này nhưng lại âm tính với phép thử khác. ðể kết luận có hay không có bệnh, người ta
dùng hai cách ñánh giá, cách thứ nhất gọi là (i) ñánh giá kết quả ñồng thời (còn gọi là song
song – in parallel) tức là tất cả các phép thử chẩn ñoán ñều phải cho kết quả dương tính thì
mới kết luận là có bệnh. Như vậy, phải làm tất cả các phép thử, sẽ tốn kém và mất thời
gian. Nhưng cũng có thể kết luận bằng cách thứ hai (ii) lần lượt – in series, tức là cứ thấy
một phép thử nào ñó cho kết quả dương tính là kết luận ñã có bệnh (tránh khỏi phải làm
các phép thử khác, mà chỉ làm phép thử tiếp theo với các mẫu âm tính). Tiện ích này sẽ
phân tích về ñộ nhạy, ñộ ñặc hiệu v.v… của phương pháp nhiều phép thử.
Với ñặc ñiểm của từng bệnh và trong hoàn cảnh cụ thể khác nhau, các cơ quan quản lý
sẽ ñưa ra quyết ñịnh là dùng phương pháp nào (song song hay lần lượt) ñể kết luận bệnh
khi dùng phương pháp chẩn ñoán ña phép thử.
2.3. Nghiên cứu về mẫu (Sample)
Dịch tễ học như ñã nói là môn toán (thống kê) mang màu sắc y học. Do vậy việc xác
ñịnh cỡ mẫu và với số mẫu ñã sử dụng ta ñánh giá các kết quả thu ñược như thế nào ñược
xử lý trong tiện ích này. Vào submenu SAMPLES ta sẽ thất xuất hiện các mục như sau
(hình 2.7):
Hình 2.7
63
- Estimate mean - Ước lượng số trung bình
- Estimate difference between means - Ước lượng sự khác nhau về giá trị trung bình
- Estimate percentage - Ước lượng tỷ lệ phần trăm
- Estimate difference between percentage - Ước lượng sự khác nhau về tỷ lệ phần trăm.
- Detection of Disease - Phát hiện bệnh
- Threshold value - Giá trị ngưỡng
- Unmached case control - bệnh chứng không cặp ñôi
- Mached case control - Nghiên cứu bệnh chứng cặp ñôi.
- Cohort - Nghiên cứu thuần tập
Trong dịch tễ học, cỡ mẫu liên quan chặt chẽ ñến tỷ lệ (thực sự) có bệnh có trong quần
thể, tỷ lệ thấy ñược (phát hiện), ñộ nhạy và ñộ ñặc hiệu của phép thử, khoảng tin cậy của
kết quả mong muốn… Do vậy, cần phải tính toán cỡ mẫu sao cho kết quả phản ánh trung
thực nhất trạng thái thực tế. Ngược lại, với cỡ mẫu cho trước chúng ta phải tính toán và xác
ñịnh các con số kết quả nêu trên có giá trị ñến mức nào?. Mặt khác, trong nghiên cứu hay
ñiều tra dịch tễ, các phương pháp và mục tiêu nghiên cứu khác nhau (phát hiện bệnh –
detection, hay sàng lọc bệnh - screening…) ñòi hỏi các cỡ mẫu khác nhau. Hơn nữa, ñể so
sánh ñặc tính các quần thể một cách chính xác và ñúng ñắn ñòi hỏi phải có cỡ mẫu tối
thiểu phù hợp. Phần submenu này giúp chúng ta giải quyết các vấn ñề liên quan ñến mẫu
ñiều tra và các vấn ñề nêu trên.
a. Ước lượng giá trị trung bình - Estimate Mean
Khi nhấn chuột vào phần ước lượng giá trị trung bình (Estimate Mean) chẳng hạn, máy
tính sẽ cho cung cấp cho ta số lượng mẫu cần thiết ñể xét nghiệm. Ví dụ: trong một quần thể
có 1000 lợn, muốn biết trọng lượng trung bình của ñàn lợn này (tính bằng Kg) với ñộ tin cậy
là 95% cho rằng ñộ lệch chuẩn (Expected Standard Deviation) là 0,5 và sai số tuyệt ñối
(Expected Standard Error) là 0,1 ta nhập các số liệu vào máy sau ñó nhấn nút calculate sẽ
cho ta cỡ mẫu cần lấy (Required Sample Size) là 88. Có nghĩa là cần tính trọng lượng trung
bình của 88 lợn thì số trung bình này mới ñại diện cho cả ñàn lợn 1000 con với ñộ tin cậy là
95%. Với ñàn lợn 1000 con khác, trông bề ngoài không ñồng ñều so với ñàn trước. Có nghĩa
là sai số chuẩn sẽ cao hơn, ví dụ là 1 (lớn hơn 0,5) chẳng hạn. Sau khi nhập số liệu và nhấn
chuột vào nút calculate ta sẽ có cỡ mẫu cần lấy (Required Sample Size) sẽ là 278 (lớn hơn
88, xem hình 2.8a và 2.8b).
Sample
Estimate Mean
Hình 2.8a
64
Hình 2.8b
b. Ước lượng giá trị phần trăm – Estimate percentage
Trong nghiên cứu dịch tễ ta thường lấy một lượng mẫu nào ñó, sau khi xét nghiệm
thấy có (ví dụ) 14% số mẫu dương tính. Ta có thể kết luận như thế nào về toàn bộ quần
thể. Ngược lại, một ví dụ khác: ñối với một ñàn gia súc có n=1000 cá thể, trong ñó có
khoảng 20% có kháng thể, ta phải lấy bao nhiêu mẫu ñể giá trị % ñó ñại ñiện cho quần thể
với ñộ tin cậy là 95% và sai số là +/- 5% (các con số nêu ra chỉ là các ví dụ).
Ta nhấn con trỏ vào mục Ước lượng phần trăm - Estimate Percentage sẽ xuất hiện của
giao diện như hình 9. Nhập các số liệu vào các ô như sau:
- ðộ lớn của quần thể - Population Size: 1000
- Tỷ lệ mắc bệnh dự ñoán - Expected Prevalence (%): 20
- Sai số chấp nhận - Accepted Error (%): 5
- ðộ tin cậy - Level of Confidence: 95%
Nhấn nút calculate, trong phần kết quả màn hình xuất hiện ba dòng như sau:
- Tỷ lệ lấy mẫu - Sampling Fraction: 19,734
- Cỡ mẫu -Sample Size: n
:
245,86
- Cỡ mẫu ñược ñiều chỉnh -Sample Size n(a):
197,34
Trên một thanh nhấp nháy xuất hiện dòng chữ: Use value of n(a) = 198 có nghĩa là hãy
sử dụng giá trị 198 (hình 2.9a). Nói cách khác phải lấy 198 mẫu ñể ñạt các yêu cầu như ñã
nạp vào máy (kết quả tỷ lệ mắc bệnh khoảng gần 20 (+/-5%).
Sample
Estimate Percentage
Hình 2.9a
65
Nếu ta chấp nhận sai số cao hơn ví dụ 10% chẳng hạn ta thấy chỉ cần lấy 58 mẫu (hình
2.9b). Cùng trong cửa sổ này có một trang khác nhằm ñể tính sai số phần trăm với một cỡ
mẫu nào ñó. Ví dụ: cùng là quần thể 1000 con, tỷ lệ có kháng thể ước khoảng 20%, khi lấy
100 mẫu ñể xét nghiệm thì sai số sẽ là +/-7,84%.
Hình 2.9b
c. Phát hiện bệnh - Detection of Disease
Một tiện ích quan trọng khác là: (cỡ mẫu cần có ñể) Phát hiện bệnh - Detection of
Disease. Giả sử rằng trong ñàn 300 lợn có 2 lợn bị ho nghi bị suyễn lợn. Khi thú y muốn
xác ñịnh xem trong ñàn lợn này có bệnh suyễn lợn không; cần lấy mẫu bao nhiêu lợn ñể có
kết quả 1 lợn dương tính với suyễn lợn. Ta nhập số liệu vào phần Input như sau:
- Cỡ quần thể (tổng ñàn) - Population Size: 300
- Số ñộng vật mắc bệnh (ho) - No of Diseased animals
:
2
- ðộ tin cậy - Level of Confidence: 95%
Sample
Detection of Disease
Hình 2.10
66
Sau ñó nhấn chuột vào nút calculate, thấy bên phần kết quả (RESULTS) cho ta Cỡ
mẫu cần lấy – Required Sample Size là 233; Tỷ lệ mắc bệnh (Prevalence) là 0,67% (xem
hình 2.10).
Bạn ñọc thay con số lợn bệnh là 2 bằng con số 10 (có 10 lợn ho thở, số còn lại trông
bên ngoài ñều khỏe mạnh) thì cỡ mẫu (số lợn cần xét nghiệm) sẽ giảm xuống rất nhiều.
d. Tỷ lệ mắc bệnh tối ña - Maximun No Positives
Một tiện ích khác là xác ñịnh tỷ lệ mắc bệnh tối ña – Maximun No Positives – ñể giải
quyết vấn ñề như sau: tại trại 300 lợn; nghi mắc bệnh Aujesky do có lợn có lâm sàng nghi mắc
bệnh. Cần xét nghiệm ñể khẳng ñịnh có ñúng là trại này có bệnh ñó không. Phương pháp xét
nghiệm là PCR phát hiện kháng nguyên vi rút Aujesky trong các tampon ngoáy mũi lợn
(swabs). Người ta ñã lấy 100 mẫu swab và gửi ñi xét nghiệm. Tất cả ñều âm tính. Ta có thể kết
luận ñược gì về xét nghiệm trên và có thể loại trừ bệnh suyễn lợn ở trại này không?
Ta ñưa con trỏ nhấn vào phần phát hiện bệnh, sau ñó vào trang Tỷ lệ mắc bệnh tối ña -
Maximum No Positives. Nhập số liệu như sau:
- Cỡ quần thể (tổng ñàn) - Population Size: 300
- Số mẫu âm tính - No of Negative Samples: 100
- ðộ tin cậy - Level of Confidence: 95%
- Nhấn con trỏ vào nút calculate.
Trong phần kết quả - RESULTS hiện lên các mục sau:
- Tỷ lệ lấy mẫu - Sampling Fraction
:
33,33%
- Số lợn dương tính tối ña - Maximum No Positives: 8
- Tỷ lệ mắc bệnh tối ña - Maximum Prevalence: 2,67% (xem hình 2.10)
So với thí dụ về cỡ mẫu cần lấy (phần 2.2.1.9 trên ñây) chúng ta thấy cần lấy 233 trong
số 300 lợn ñể có thể phát hiện 1 lợn dương tính và khi ñó tỷ lệ mắc bệnh là 0,67% (trong
khi thực tế ñã có 10 lợn ho). Với 100 mẫu xét nghiệm; ñều có kết quả âm tính chúng ta
không thể loại trừ khả năng mắc bệnh Aujesky trong trại mà chỉ có thể nói trại này có thể
mắc Aujesky với tỷ lệ tối ña là 2,67%.
Sample
Detection of Disease
Hình 2.11
67
Các tiện ích còn lại là dùng ñể xác ñịnh cỡ mẫu cần lấy trong các nghiên cứu dịch tễ là
Bệnh - Chứng và nghiên cứu thuần tập.
2.4. Phân tích - Analysis
ðây là các tiện ích dùng trong dịch tễ học phân tích. Khi nhấn con trỏ vào thư mục này
(Analysis) trên màn hình sẽ hiển thị như hình 2.12.
Hình 2.12
Xin nhắc lại là trong dịch tễ phân tích người ta chủ yếu sử dụng các phương pháp
nghiên cứu sau:
- Nghiên cứu cắt ngang
- Nghiên cứu bệnh chứng và
- Nghiên cứu thuần tập
Phần mềm này cho phép ta tính toán kết quả các phương pháp nghiên cứu sau (còn cỡ
mẫu cần lấy cho mỗi loại nghiên cứu thì ñã nói trong phần 2.2.1):
- (Nghiên cứu) cắt ngang - Cross-sectional
- (Nghiên cứu) cắt ngang phân lớp - Stratified Cross-sectional
- (Nghiên cứu) bệnh chứng - Case-Control
- Bệnh chứng phân lớp - Stratified Case-Control
- Bệnh chứng cặp ñôi - Matched Case -Control
- (Nghiên cứu) thuần tập (tỷ suất tích lũy)
- Thuần tập (tương quan nguy cơ)
- Thuần tập phân lớp (tỷ suất tích lũy)
- Thuần tập phân lớp (tương quan nguy cơ)
Hiện nay (2008) các nghiên cứu cắt ngang ñang ñược sử dụng nhiều ở Việt Nam. Phần
mềm máy vi tính cho nghiên cứu này giúp chúng ta ñược những ñiều sau:
a. Nghiên cứu cắt ngang - Cross-sectional
Bài toán: cho rằng lợn ăn thức ăn thừa tận dụng từ các nhà ăn tập thể thường mắc Dịch
tả lợn. ðể khẳng ñịnh giả thiết này ta chọn hai trại lợn, trại A 300 con ñược nuôi bằng cám
68
tổng hợp và trại B 100 con nuôi bằng thức ăn thừa các hiệu ăn, nhà bếp. Kết quả cho thấy
trại A có 10 lợn bệnh, B có 20 lợn bệnh. ðể tính toán ta nhấn nút Analysis; sau ñó Cross-
sectional. Trên màn hình sẽ hiển thị như hình 2.12. ðể nhập số liệu, ta ñiền các con số vào
các ô như sau:
- 20 vào ô yes+disease
- 80 vào ô yes+healthy
- 10 vào ô No+Disease
- 290 vào ô No+healthy
- Nhấn nút xác ñịnh ñộ tin cậy (ví dụ 95%)
- Nhấn nút Calculate
- Màn hình sẽ hiển thị như hình 2.13 dưới ñây:
Analysis
Cross - Sectional
Hình 2.13
Trong phần kết quả chúng ta thấy xuất hiện:
- Expected frequencies (khái quát hóa thành tần số mắc bệnh lý thuyết ở mỗi loại lợn
tại thời ñiểm nghiên cứu – nhằm ñể tính χ
2
)
- Attributable Risk (nguy cơ thành phần - do ăn thức ăn thừa)
:
0,167 (ñây là tỷ lệ phần
trăm (16,7%) số bị bệnh dịch tả lợn trong toàn bộ số lợn của một vùng do ăn thức ăn thừa
gây ra. Nói cách khác: cứ 100 lợn thì có 16,7 lợn mắc bệnh dịch tả do thức ăn thừa gây ra)
- Attributable proportion among exposed (tỷ lệ thành phần trong số phơi nhiễm): 0,833
(Ý nghĩa của con số này là: trong số 100 lợn [ăn thức ăn thừa + bị bệnh dịch tả lợn], thì có
69
83,3% số lợn bệnh ñúng là do thức ăn thừa gây ra - không phải hoàn toàn 100 lợn bệnh
ñều do thức ăn thừa gây ra).
- Attributable proportion (Tỷ lệ thành phần): 0,556 (Ý nghĩa của con số này là cứ 100
lợn bị bệnh dịch tả lợn (do mọi nguyên nhân), thì có 55,6 con là có nguyên nhân từ việc ăn
thức ăn thừa từ các nhà ăn, nhà hàng).
- Odd Ratio (mức ñộ nguy cơ - tỷ số lệch): 7,25 (con số này nói rằng lợn ăn thức ăn
thừa có nguy cơ mắc bệnh Dịch tả lợn cao gấp 7,25 lần so với lợn ăn thức ăn tổng hợp)
- Prevalence Ratio (tỷ số giữa hai tỷ lệ mắc bệnh): 6,0 (tại thời ñiểm nghiên cứu lợn ăn
thức ăn thừa có tỷ lệ mắc bệnh cao gấp 6 lần lợn ăn thức ăn tổng hợp).
- Các con số khác trong bảng là khoảng tin cậy kèm cận trên và cận dưới ñược tính
bằng phương pháp logarit và Chi bình phương (χ
2
).
Trên thanh nhấp nháy hiển thị dòng chữ Limits are valid có nghĩa là các cận trên và
dưới có giá trị. Nói cách khác, các số ñã hiển thị là có giá trị. Tuy nhiên:
Lưu ý:
- Người ra ít dùng Odd Ratio (OR) rút ra từ nghiên cứu cắt ngang. Trong nghiên cứu
cắt ngang con số có giá trị sử dụng ñể so sánh là Tỷ số giữa hai tỷ lệ - Prevalence Ratio
(PR).
- ðây là một nghiên cứu dịch tễ không hoàn hảo nên một số kết quả không có ý nghĩa
(không ñúng với) thực tế. Sai lầm ở chỗ ngay từ ban ñầu tác giả không xác ñịnh tỷ lệ số lợn
(ñại diện cho một vùng, một tỉnh hay một nước) ñược nuôi bằng thức ăn thừa nhà bếp và
lấy mẫu theo tỷ lệ ñó. Trong khi ñó, tác giả chọn một trại có 100 con ñược nuôi thức ăn
thừa nhà bếp và một trại có 300 con ñược nuôi bằng cám tổng hợp. ðiều ñó mặc nhiên
công nhận rằng có 100/(300+100) tức ¼ số lợn ñược nuôi bằng thức ăn thừa nhà bếp. ðưa
ra ví dụ trên ñể chứng minh rằng khi dùng phần mềm vi tính, máy sẽ cho bất kỳ kết quả
nào tùy theo số liệu mà người sử dụng nhập vào máy. Do vậy, ở trong nghiên cứu (ví dụ)
cụ thể này, chỉ có tỷ số giữa hai tỷ lệ Proportion Ratio là có ý nghĩa thực tiễn.
b. Nghiên cứu bệnh - chứng
ðây là nghiên cứu hồi cứu, xuất phát từ việc chọn một số ca bệnh (bệnh) và một số
không mắc bệnh (chứng), sau ñó tìm ngược lại các yếu tố nguy cơ ñã phơi nhiễm, so sánh
giữa hai nhóm và tìm ra nguyên nhân hay yếu tố gây bệnh. Có nghiên cứu hồi cứu mà bệnh
và chứng (ñược cho là) có cùng hoàn cảnh (mọi ñiều kiện) giống nhau, trừ yếu tố phơi
nhiễm gọi là bệnh chứng cặp ñôi – Matched Case Control (ví dụ cùng ở một cơ quan, cùng
tham gia bữa tiệc liên hoan…) sau ñó một số bị tiêu chảy (bệnh) số khác lại không
(chứng). Bệnh và chứng không cặp ñôi (unmatched) là chọn bệnh và chứng có hoàn cảnh
khác với ñiều trình bày ở trên.
Thí dụ về nghiên cứu bệnh chứng cặp ñôi: sau một ñám tiệc cưới gồm hơn 400 người
tham dự, có 100 người bi ñi tiêu chảy phải cấp cứu vào ngày hôm sau. Người ñiều tra ñược
biết có 6 món ăn trong ñó có món nộm thịt gà xé. ðiều tra viên sau khi ñi hỏi 60 người
bệnh thì ñược biết có 10 người không ăn món nộm ñó; hỏi 70 người không mắc bệnh thì có
60 người không ăn và 10 người có ăn (thí dụ này dựa theo ví dụ kinh ñiển về ñiều tra dịch
tễ vụ ngộ ñộc có thực ở Oswego – USA, ñã ñược tả trong các sách về dịch tễ học).
Như vậy:
70
- Có 50 người ăn nộm thịt gà xé (phơi nhiễm) và mắc bệnh,
- 10 người phơi nhiễm có ăn và không mắc bệnh,
- 10 người không phơi nhiễm (không ăn) và mắc bệnh và
- 60 người không phơi nhiễm và không mắc bệnh.
Các số liệu nhập vào máy:
- 54 người ăn (phơi nhiễm) và mắc bệnh nhập vào ô Case+Yes,
- 6 người phơi nhiễm và không mắc bệnh nhập vào ô Case+No,
- 10 người không phơi nhiễm và mắc bệnh nhập vào ô Control+Yes và
- 60 người không phơi nhiễm và không mắc bệnh nhập vào ô Control+No
- Nhấn con trỏ vào nút ñộ tin cậy 95%
- Nhấn con trỏ vào nút calculate.
Màn hình sẽ hiển thị như hình 2.14
Analysis
Case
Control
Hình 2.14
Có các hiển thị trong phần kết quả giống như ở các phép tính khác như tần số lý
thuyết, giới hạn cận trên và cận dưới ðiều quan trọng trong kết quả này là OR. Giá trị
của OR ở ñây là 36 (về lý thuyết nếu OR>1 thì tác nhân phơi nhiễm - ăn nộm gà xé phay -
có tính chất gây bệnh; OR=1 không có ảnh hưởng ñến sức khỏe; OR<1 có tác dụng bảo vệ
sức khỏe). Thông thường và trên thực tế OR>4 thì tác nhân phơi nhiễm mới ñược coi là
nguyên nhân gây ra bệnh.
Còn lại hai tiêu chí khác:
71
- Attributable proportion among exposed - Tỷ lệ phát bệnh do phơi nhiễm: 0,967 (nói
lên rằng trong số [ca bệnh + phơi nhiễm = 50] thì có 96,7% bị tiêu chảy ñúng là do ăn
nộm thịt gà xé phay).
- Attributable proportion - tỷ lệ thành phần ñóng góp: 0,806 (nói lên rằng trong toàn bộ
số người bi bệnh tiêu chảy sau bữa tiệc cưới thì có 80,6% là do nộm thịt gà xé phay gây ra)
c. Nghiên cứu thuần tập
Nghiên cứu thuần tập là nghiên cứu tiến cứu. Chọn hai quần thể tương ñương nhau
(thuần tập hay tập hợp thuần), một quần thể ñược cho phơi nhiễm với yếu tố ñược coi là
yếu tố nguy cơ, còn một quần thể khác thì không. Sau một thời gian theo dõi ta có kết quả
như sau:
- Quần thể phơi nhiễm (tổng ñàn 60) có 20 cá thể bệnh và 40 không có bệnh,
- Quần thể không phơi nhiễm (tổng ñàn 59) có 9 cá thể bệnh và 50 không bệnh
- Nhập số liệu như trình bày phần bệnh chứng, nhấn nút Calculate, trên màn hình hiểu
thị như hình 2.15.
Analysis
Cohort (Cum. Incidence)
Hình 2.15
Trong phần kết quả chú ý hai kết quả:
- Giá trị OR như ñã trình bày trong phần bệnh chứng.
- Giá trị RR (Relative Risk - nguy cơ tương quan) nếu RR>1 thì tác nhân phơi nhiễm
có tính chất gây bệnh; OR=1 không có ảnh hưởng ñến sức khỏe; OR<1 có tác dụng bảo vệ
sức khỏe.
72
Chú ý: trong nghiên cứu bệnh chứng thì dùng OR, trong nghiên cứu thuần tập thì dùng
RR do tính chất của hai phương pháp nghiên cứu khác nhau.
Các phép tính toán khác trong Win Episcope rất dễ dàng thực hiện với ñiều kiện nắm
chắc kiến thức về dịch tễ học.
3. PHẦN MỀM EPICALC
3.1. Giới thiệu mềm EpiCalc
ðây là phần mềm do Joe Gilman và Mark Myatt viết năm 1998 do Bixton Books xuất
bản. Phiên bản 1.02 ra mắt năm 2000 gọi là EpiCalc 2000 (hình 2.16). ðây cũng là một
chương trình công cộng (public), do vậy ai cũng có thể sử dụng miễn phí. Mặt khác, ñây là
chương trình gọn nhẹ, chỉ có 984 KB. Chúng tôi giới thiệu phầm mềm này cũng vì lý do
ñó. Hình 2.16 là giao diện của phần mềm này khi sử dụng.
Start
Progams
Accessories
Epicalc 2000
Hình 2.16
Chương trình này ñòi hỏi hiểu biết về dịch tễ học và toán thống kê thành thạo hơn so
với sử dụng Win Episcope. Bởi vì phần help cuả chương trình này không giống như của
Win Episcope. Nghĩa là không có sự trợ giúp về các khái niệm dịch tễ học và cũng không
giới thiệu các công thức tính toán. Mặt khác, phần Help của EpiCalc chỉ tương thích với
các phiên bản phần mềm Window trước Vista, nếu dùng Window Vista thì không sử dụng
ñược phần Help của chương trình này.
73
3.2. Các tiêu chí có thể tính toán ñược bằng EpiCalc
ðể so sánh, như chúng ta ñã thấy ở phần Win Episcope, mỗi phép tính toán (ví dụ như
thuần tập hoặc bệnh chứng) mặc dù ñược trình bày ra nhiều giao diện khác nhau, tiện cho
người sử dụng nhưng ñều dựa trên cơ sở bảng 2×2 ô. Trong Epicalc không chia ra rõ ràng
từng window cho từng phương pháp nghiên cứu mà chỉ việc ñiền các con số vào 4 ô của
bảng 2X2. Chương trình sẽ cho ra kết quả của tất cả các phép tính. Do vậy, người sử dụng
phải biết mình nhập số liệu ñầu vào là số liệu thu ñược từ phương pháp nghiên cứu gì ñể
chọn ra những kết quả cần thiết và thích hợp.
ðể chứng minh cho ñiều vừa nói chúng ta xem hiển thị trên màn hình. Sau khi cài ñặt
và khởi ñộng, giao diện của chương trình này như sau (hình 2.17).
Hình 2.17
ðưa con trỏ và nhấn chuột phải vào chữ Untitled ta sẽ thấy như hình 2.18.
Hình 2.18
74
Như vậy trên giao diện trên màn hình, chương trình cho phép thực hiện các công việc sau:
- Diễn tả - Describe (dùng cho dịch tễ học diễn tả)
- So sánh - Compare (dùng ñể so sánh số trung bình, tỷ lệ phần trăm…)
- Bảng - Tables (xử lý các số liệu trong bảng 2×2 ô)
- Mẫu - Samples (tương tự như Win Episcope, dùng cho việc xác ñịnh cỡ mẫu và các
thông số liên quan ñến cỡ mẫu).
- Xác suất - Probability (dành cho việc tính xác suất các sự kiện).
ðể chứng minh rằng nếu như trong Win Episcope người ta tách riêng từng phép thử
thành từng mục, thì trong EpiCalc lại ñể chung và người sử dụng phải biết chọn giá trị kết
quả thích hợp, chúng ta ñưa con trỏ vào mục Bảng – Tables, ta thấy màn hình hiển thị các
mục sau:
- R-by-C Table
- 2-by-2 unstratified
- 2-by-2 stratified
- Note
Ta nhấn chuột vào mục (ví dụ) 2-by-2 Stratified (bảng 2×2 không phân lớp) ta thấy
màn hình hiển thị như sau (hình 2.19):
Untitled
Tables
2 - by- 2 unstratified
Hình 2.19
Trong ô có tiêu ñề title sẽ xuất hiện thời gian (giờ, phút và ngày tháng). Thực chất, nếu
ta ñể nguyên hoặc thay ñổi thì nó vẫn là tên của thư mục (File), ngày tháng là tên mặc ñịnh
của thư mục ñó. Trong chương trình này chỉ có hai mức ñộ tin cậy ñể ta chọn khi tính toán
là 95 và 99%. Tiếp theo, ở phần 4 ô trống ñể nhập số liệu ta chỉ có hai tiêu chí là Exposure
(Phơi nhiễm) và Outcome (Kết quả). Outcome ở ñây ñược hiểu là dương tính hoặc âm tính,
có bệnh hay không có bệnh… Nói cách khác chương trình này có tính khái quát cao.
Ta nhập số liệu, lấy các giá trị (bảng 2.2) trong ví dụ của nghiên cứu thuần tập trên
ñây. Ta nhập số liệu vào 4 ô nhỏ lấy các số liệu như bảng 1 ở trên (tuy nhiên cần biết rõ
ñưa con số nào vào ô nào). Chú ý, nhìn vào màn hình, ta thấy sau khi vào số liệu các con
số (xem hình 2.20) nằm khác vị trí của chúng trong bảng 2.2:
75
Bảng 2.2. Số liệu (ví dụ) kết quả nghiên cứu thuần tập
Phơi nhiễm
Có không
Mắc bệnh 20 9
Khỏe mạnh 40 50
Hình 2.20
ðến ñây ta nhấn nút có tiêu ñề [n Label-Max], trên màn hình sẽ xuất hiện như sau
(hình 2.21):
Hình 2.21
Như ta thấy, trên màn hình xuất hiện tất cả các kết quả tính toán, thậm chí còn có cả
kết quả hiệu lực vắc xin – Vaccine Efficacy, trong khi số liệu nhập vào không hề có nói
76
ñến hiệu lực vắc xin. Chính vì vậy, như trên ñã nói, tùy theo số liệu nhập vào và số liệu ñó
là kết quả của phương pháp nghiên cứu dịch tễ nào mà người sử dụng chương trình này
chọn ra và lấy kết quả cần tìm. Với Win Episcope trong thuần tập ta tìm ra OR là 2,778 thì
ở chương trình này cũng cho ta con số Odds ratio là 2,78.
Như vậy chương trình này có ưu ñiểm là cho phép tiến hành tất cả mọi phép tính miễn
là có dữ liệu nhập vào. Chọn kết quả nào cho phù hợp là do người nhập số liệu tùy chọn,
khác với Win Episcope, chỉ ñưa ra kết quả phù hợp với phương pháp nghiên cứu. Do vậy,
với những người chưa thông thạo về dịch tễ học và toán thống kê thì chương trình này
nhiều khi làm cho họ lúng túng. Một ưu ñiểm khác của chương trình là khi ta ra khỏi
chương trình (exit) ta có thể lưu lại (save) thậm chí với tên tệp (file) giờ giấc ngày tháng.
ðiều này cho phép ta có thể rà soát lại việc nhập số liệu và kết quả tính toán.
Thêm một tiện ích khác có phần trái với ñiều trình bày trên ñây là phần mềm này lại
cho phép nhiều tính toán ñơn giản. Thí dụ, khi nghiên cứu về tỷ lệ có trứng giun tại một
trại lợn với số mẫu phân là 200 mẫu, ta thấy 20% có trứng giun. Vậy khoảng tin cậy 95%
là bao nhiêu. ðưa con trỏ vào phần describe (diễn tả) sau ñó nhấn vào phẩn tỷ lệ
(proportion) rồi nhấn vào mục phần trăm (percentage). Trên màn hình sẽ hiển thị như sau
(hình 2.22):
Untitled
Describe
Proportion
Percentage
Hình 2.22
Trên màn hình trong window nhỏ có hai ô trống màu trắng ñể nhập số liệu. ðó là
Proportion (tỷ lệ) Sample (mẫu). Ta nhập số 20 (%) vào ô Tỷ lệ và 200 (mẫu) vào ô Mẫu.
nhấn con trỏ vào nút [n Label-Max], ta thấy trên màn hình sẽ hiển thị như sau (hình 2.23):
77
Hình 2.23
Sample size (cỡ mẫu): 200
Proportion (95% CI): 20% (14.83, 26,38)
ðiều ñó có nghĩa là tỷ lệ nhiễm giun là khoảng từ 14,83 ñến 26,38% với ñộ tin cậy
95%. Nếu ñặt ñộ tin cậy là 99%, thì kết quả sẽ khác ñi. Với phần mềm có trong máy, bạn
ñọc tự thực hành sẽ thấy kết quả.
Trên ñây là hai phần mềm vi tính chủ yếu dùng trong tính toán các số ño lường về
bệnh tật. Mỗi phần mềm có ñặc tính và tiện ích khác nhau ñôi chút, có ưu ñiểm và bất cập
riêng. Tuy nhiên nắm vững kiến thức về dịch tễ học và toán thống kê trong tiếng Anh
chúng ta ñều có thể sử dụng dễ dàng bất kỳ phần mềm nào. Ngoài hai phần mềm này ra
còn có các phần mềm khác. Ví dụ, phần mềm Freecalc do các ñồng nghiệp Australia sáng
tạo dùng trong quá trình tạo khu vực an toàn bệnh. Nói cách khác, chuyên dùng cho các
phép tính nhằm chứng minh rằng ñã thanh toán bệnh tại một khu vực nào ñó. Tuy nhiên,
ñó chỉ là tên gọi, phần mềm này chỉ trích ra một số mục từ các phần mềm tổng hợp ñể tiện
cho người dùng, tương tự như Win Episcope, chỉ là tách riêng từng phép tính và ñặt tên cụ
thể nếu so với Epicalc. Phần mềm ñang ñược ưa chuộng là Win Episcope.
BÀI TẬP CHƯƠNG II
1. Lấy và xét nghiệm 100 mẫu máu của một trại có 1500 lợn bằng phương pháp RT-
PCR nhằm ñiều tra xác ñịnh sự hiện diện của vi rút bệnh tai xanh (PRRS) bạn thấy tất cả
số mẫu ñều âm tính (không phát hiện thấy vi rút). Bạn kết luận thế nào về tình trạng nhiễm
vi rút tai xanh của trại lợn trên với ñộ tin cậy 95% và 99%? (Gợi ý: sử dụng Win Episcope,
lệnh sample sau ñó disease detection).
2. Khi xét nghiệm 200 mẫu huyết thanh gia cầm ñược lấy ngẫu nhiên (bằng phương
pháp HI - ức chế ngưng kết hồng cầu) tỉnh A có tỷ lệ gia cầm có kháng thể kháng vi rút cúm
với hiệu giá có hiệu lực phòng bệnh sau khi tiêm phòng là 60%. Trong khi ñó xét nghiệm
200 mẫu của tỉnh B tỷ lệ này là 40%. Bạn có cho rằng tỉnh A ñã tiêm phòng tốt hơn tỉnh B
không? Vì sao? Nếu bạn chịu trách nhiệm việc giám sát sau tiêm phòng bạn sẽ ñề ra kế
hoạch theo dõi như thế nào (cho rằng mỗi tỉnh có khoảng 2 triệu gia cầm)? (Gọi ý: so sánh
hai số trên bằng cách tính p<0,05 hoặc p<0,01; Tuy nhiên, chú ý ñến số lượng mẫu tính
bằng Win Episcope, lệnh sample; sau ñó Estimate Percentage; sau ñó sample size)
3. ðể xem xét tác dụng của vôi bột trong việc phòng trừ bệnh vi rút ñốm trắng ở tôm,
bạn ñã ñiều tra 100 hộ nuôi tôm mắc bệnh và thấy 40 hộ ñã sử dụng vôi bột ñể xử lý ao
nuôi trước khi thả tôm giống. Trong khi ñó tại 100 hộ nuôi tôm không mắc bệnh ñốm trắng
thì số hộ dùng vôi bột ñể xử lý ao nuôi là 70. Bạn có kết luận gì về tác dụng của việc xử lý