CÁC SAI SỐ TRONG
NGHIÊN CỨU DỊCH TỄ HỌC
Ths Nguyễn Tấn Đạt
Mục tiêu học tập:
1. Trình bài được định nghĩa và phân loại
các loại sai số
2. Nêu các biện pháp khắc phục sai số
3. Trình bài được khái niệm về yếu tố nhiễu,
yếu tố tương tác
4. Nêu biện pháp khắc phục yếu tố nhiễu
•
Sai số là gì?
•
Có mấy loại?
•
Xảy ra khi nào?
•
Xảy ra khi ước lượng (ví dụ: tỷ lệ mới mắc,
tye lệ hiện mắc, tử vong) hoặc mối liên
quan (RR, OR) sai lệch so với tình huống
đúng.
• Nguồn gốc của sai số có thể là ngẫu nhiên
hoặc hệ thống
•
Có thể xuất hiện trong các giai đoạn của
nghiên cứu:
–
Thiết kế nghiên cứu (chất lượng)
–
Tiến hành
– Phân tích
“Error - Sai số” trong DTH
Sai số
Ngẫu nhiên Hệ thống
(cơ hội) (sai lệch)
Sai số
Cơ hội
80 90
Huyết áp thật
(Thông qua ống thông động mạch)
Huyết áp đo lường
(máy đo huyết áp)
số quan sát
Huyết áp tâm trương (mmHg)
, WHO (www)
C
C
B
A D
•
Là sự dao động xung quanh giá trị thật của
quần thể
•
Nguồn gốc của sai số ngẫu nhiên
–
Sự giao động về mặt sinh học của cá thể
•
Luôn luôn hiện diện
–
Sai số do chọn mẫu
•
Một mẫu nhỏ có thể không đại diện cho toàn bộ dân
số
–
Sai số do đo lường
•
Công cụ và tập huấn
Sai số ngẫu nhiên
Sai số ngẫu nhiên
•
Cỡ mẫu
–
Nhỏ hơn
•
Thường khác với quần thể đích
•
Giới hạn lực (POWER) để phát hiện hiệu quả (effect)
–
Lớn hơn
•
Thường tương tự như quần thể đích
•
Tăng lực (POWER) để phát hiện hiệu quả (effect)
•
Cỡ? POWER CALCULATIONS
Bao gồm việc tính toán = độ lớn của sự khác biệt, số lượng sự kiện,
mức độ sai số có thể chấp nhận.
Ảnh hưỏng đến tính tin cậy, liên quan đến độ chính xác và khả
năng lặp lại giống nhau ở các lần quan sát
•
Đánh giá bằng cách so sánh với “tiêu chuẩn vàng”
•
Sự lặp lại giống nhau giữa quan sát bên trong quần thể
nghiên cứu và quần thể tham khảo (intra-observer inter-
observer and intra-observer comparisons)
Giảm:
•
Cỡ mẫu lớn hơn
•
Tập huấn kỹ quan sát viên
•
Dụng cụ và công cụ chuẩn
•
sử dụng thống kê thích hợp
Sai số ngẫu nhiên (tt)
•
Sự sai lệch về kết quả hoặc suy luận từ sự thật
•
Ảnh hưởng đến độ tin cậy, bao gồm tính giá trị nội
suy hoặc/và ngoại suy
•
Nguồn gốc của sai số hệ thống
•
Sai số chọn
•
Sai số thông tin (đo lường)
•
Nhiễu
Sai số hệ thống (bias)
•
Tăng lên khi các tiêu chuẩn chọn lựa khác nhau được sử
dụng (dựa vào tình trạng bệnh và/hoặc phơi nhiễm) vì
vậy dân số nghiên cứu không đại diện cho quần thể quan
tâm
Không thể làm giảm bằng cách tăng cỡ mẫu
Giảm thông qua các chiến lược thiết kế
Sai số chọn
•
Trở thành vấn
Trở thành vấn
đề
đề
khi mẫu nghiên cứu không
khi mẫu nghiên cứu không
có tính
có tính
đại
đại
diện cho quần thể tham khảo
diện cho quần thể tham khảo
•
Cần cân nhắc kỹ trong quá trình thiết kế và phân
Cần cân nhắc kỹ trong quá trình thiết kế và phân
tích
tích
•
Nếu không nhận biết, thì kết quả
Nếu không nhận biết, thì kết quả
được
được
xem nh
xem nh
ư
ư
chính xác, khi
chính xác, khi
đó
đó
chúng ta có thể bị sai lầm
chúng ta có thể bị sai lầm
Sai số chọn (tt)
•
Sai lệch do suy luận (Berkson’s Bias)
•
Sai lệch về hiện mắc và mới mắc (Neyman’s Bias)
•
Sai lệch do phản hồi:
•
Sai lệch do mất dấu
•
Sai lệch liên quan đến sự tham gia
•
….
Một số ví dụ của sai số chọn
Các nguyên tắc để giảm sai số chọn
Giai đoạn
nghiên cứu
Cách tiếp cận
Thiết kế
Khung mẫu thích hợp cho dân số nguồn
Tiêu chuẩn bệnh và phơi nhiễm rõ ràng
Nhóm so sánh thích hợp
Thu thập dữ
liệu
Tỷ lệ tham gia cao
Các thông tin về các yếu tố chọn tìm tàng
Xem xét các đối tượng không phản hồi
Phân tích dữ
liệu
Hiệu chỉnh theo xác suất chọn (nếu biết)
Kiểm soát các biến xảy ra đồng thời có liên
quan
So sánh đối tượng tham gia và không tham
gia
Sử dung các nhóm so sánh khác nhau
•
Được
Được
xem nh
xem nh
ư
ư
là sai số
là sai số
đ
đ
o l
o l
ường
ường
và sai số quan
và sai số quan
sát
sát
•
T
T
ă
ă
ng lên khi
ng lên khi
đ
đ
o l
o l
ường
ường
hoặc phân loại không chính
hoặc phân loại không chính
xác của các biến xảy ra
xác của các biến xảy ra
•
Có thể ảnh h
Có thể ảnh h
ưởng
ưởng
đế
đế
n yếu tố ph
n yếu tố ph
ơ
ơ
i nhiễm hoặc kết
i nhiễm hoặc kết
quả (thậm chí yếu tố gây nhiễu)
quả (thậm chí yếu tố gây nhiễu)
Sai số thông tin
•
Sai số nhớ lại
•
Sai số do báo cáo
•
Sai số do phát hiện
•
Sai số do người phỏng vấn
Các kiểu của sai số thông tin/đo lường
Nguyên tắc làm giảm sai số thông tin
Giai đoạn
nghiên cứu
Cách tiếp cận
Thiết kế
Dụng cụ và công cụ cụ thể
Nhóm so sánh phù hợp
Người thu thập thông tin được huấn luyện
kỹ
Thu thập
thông tin
Nhiều nguồn thông tin
Bao gồm tiếp xúc và bệnh tật không liên
quan
Đối tượng nghiên cứu và người thu thập
thông tin không biết
Tỷ lệ phản hồi cao
Phân tích dữ
liệu
Chú ý dữ liệu khuyết
Đánh giá và hiệu chỉnh dữ liệu
21
Một mối liên quan giữa yếu tố ph
Một mối liên quan giữa yếu tố ph
ơ
ơ
i
i
nhiễm và hậu quả cho tr
nhiễm và hậu quả cho tr
ước
ước
bị ảnh
bị ảnh
h
h
ưởng
ưởng
bởi một yếu tố thứ 3 nữa.
bởi một yếu tố thứ 3 nữa.
Nhiễu
22
Yếu tố tx Hậu quả
Nhiễu
Nhiễu
23
Nguyên tắc xác
Nguyên tắc xác
định
định
yếu tố gây nhiễu
yếu tố gây nhiễu
1. Yếu tố nguy cơ được xác định cho hậu quả
2. Liên quan đến yếu tố phơi nhiễm
3. KHÔNG là bước trung gian trong con
đường nguyên nhân và hậu quả
Yếu tố gây nhiễu
24
Uống cafe Ung thư tụy
Hút thuốc
Thí dụ về nhiễu
25
Hiến máu ↓CHD
Hiến máu Liên quan rõ CHD
?nhiễu
Ví dụ
Việc hiến máu thường xuyên có làm giảm
nguy cơ bệnh tim mạch hay không?