Cỡ mẫu và chọn mẫu
Chia sẻ
Khó khăn
Kinh nghiệm
Nghiên cứu
Khơng thể thực hiện trên tồn bộ dân số
Khó khăn trong việc kiểm soát và đảm bảo chất lượng số liệu/chất lượng nghiên cứu
Chỉ chọn một mẫu (sample) từ dân số (population/target population)
tính tốn các chỉ số thống kê từ mẫu dùng để ước lượng giá trị thực của quần thể
Mục tiêu
Vai trị của chọn mẫu và tính tốn cỡ mẫu
Nắm được một số khái niệm cơ bản trong chọn mẫu
Tính tốn được cỡ mẫu cho nghiên cứu thường gặp
Sử dụng được phần mềm SampleSize của WHO để tính tốn nhanh cỡ mẫu
Phân biệt được các phương pháp chọn mẫu
Quy trình chọn mẫu
Xác định tổng thể NC và phần tử
Xác định khung mẫu
Xác định k.thước mẫu/tính cỡ mẫu
Xác định p.p. chọn mẫu
Chọn mẫu
Nội dung
Các khái niệm
Tính cỡ mẫu cho các nghiên cứu thường gặp
Sử dụng SampleSize của WHO để tính tốn nhanh cỡ mẫu
Các phương pháp chọn mẫu
Các khái niệm
•
•
•
•
•
Quần thể: tồn bộ các phần tử
Quần thể đích: quần thể lý tưởng cho việc đáp ứng các mục tiêu của điều tra
Quần thể NC: quần thể được điều tra trong thực tế
Khung mẫu: danh sách các đơn vị trong quần thể nghiên cứu
Phần tử: một đơn vị nghiên cứu trong cuộc điều tra
8
Các khái niệm
Quần thể
Quần thể NC
Quần thể đích
Các phần tử
9
Các khái niệm
Vấn đề
Quần thể đích
Đơn vị NC
Suy dinh dưỡng liên quan đến việc cai
Toàn bộ trẻ từ 6-24 tháng
1 trẻ trong độ tuổi 6-24 tháng ở
sữa cho trẻ ở huyện X
tuổi ở huyện X
huyện X
Tác động của lũ lụt đến KTXH (và sức
Tồn bộ những hộ gia đình bị
1 hộ gia đình bị lụt ở phường Y
khỏe) ở phường Y
lụt ở phường Y
Đánh giá mức độ hài lòng về chất
Toàn bộ các lần khám chữa
1 lần khám chữa bệnh tại phòng
lượng khám chữa bệnh tại phòng
bệnh tại phòng khám Z trong
khám Z trong vòng 6 tháng
khám Z
vòng 6 tháng
Các khái niệm
Đơn vị nghiên cứu
Cỡ mẫu
Số lượng tối thiểu đơn vị NC cần tiến hành điều tra
Phụ thuộc vào:
Mục tiêu (câu hỏi/giả thuyết NC) – đo lường cái gì
Thiết kế NC
Độ chính xác mong muốn
Phương pháp chọn
Nguồn lực (thời gian, nhân lực, tài chính)
12
Cỡ mẫu
Mục tiêu: Xác định, đo lường, so sánh …
Tỷ lệ: chỉ số đầu ra là biến phân loại
VD: mắc bệnh, khỏi bệnh, tử vong, tiếp cận được với dịch vụ, có kiến thức tốt/đạt, mức độ hài lịng …
Giá trị trung bình: chỉ số đầu ra là biến liên tục
VD: chiều cao, cân nặng, số ngày nằm viện, chi phí …
Trong NC có nhiều chỉ số đầu ra:
Tính cỡ mẫu cho từng chỉ số, lấy cỡ mẫu có giá trị lớn nhất
Nguyên tắc cơ bản, chỉ số có giá trị càng nhỏ, cỡ mẫu càng lớn
Cỡ mẫu
Thiết kế nghiên cứu
Cắt ngang/Sinh thái
Bệnh chứng
Thuần tập
Thử nghiệm lâm sàng
Cỡ mẫu - NC cắt ngang – 1 Tỷ lệ
z12−α / 2 p (1 − p )
n=
2
d
z
: hệ số tin cậy
p
: tỷ lệ dự đoán
từ các nghiên cứu trước hoặc 50%
d
: độ chính xác tuyệt đối
+ x đơn vị
Ví dụ: một nghiên cứu cắt ngang, để đánh giá tỷ lệ thừa cân của trẻ 6-12 tuổi tại tỉnh X. Tỷ lệ của một nghiên cứu
khác là 15%.
p=0.15
z=1.96 ~ mức chính xác 95%
d=0.05 ~ độ chính xác + 0.05 kì vọng p [0.1-0.2]
15
Cỡ mẫu - NC cắt ngang – 1 Tỷ lệ
z12−α / 2 p (1 − p )
n=
2
d
z
: hệ số tin cậy
p
: tỷ lệ dự đoán
từ các nghiên cứu trước hoặc 50%
d
: độ chính xác tuyệt đối
+ x đơn vị
Ví dụ: một nghiên cứu cắt ngang, để đánh giá tỷ lệ thừa cân của trẻ 6-12 tuổi
tại tỉnh X. Tỷ lệ của một nghiên cứu khác là 15%.
p=0.15
z=1.96 ~ mức chính xác 95%
d=0.05 ~ độ chính xác + 0.05 kì vọng p [0.1-0.2]
1,96 2 x0,15 x(1 − 0,15)
n=
= 196
2
0,05
Cần có tối thiểu 196 trẻ 6-12 tuổi để nghiên cứu
16
Cỡ mẫu - NC cắt ngang – Tỷ lệ
Cỡ mẫu - NC cắt ngang – Tỷ lệ
Tỷ lệ thấp
Sử dụng cơng thức tính cỡ mẫu với độ chính xác tương đối (ε)
z12−α / 2 (1 − p )
n=
2
ε
p sơ sinh tại huyện X. Tỷ
Ví dụ: một nghiên cứu cắt ngang, để đánh giá tỷ lệ tử vong
lệ của một nghiên cứu khác là 50/1000
p=0.05
z=1.96 ~ mức chính xác 95%
ε =0.2 ~ độ chính xác tương đối + 20% của p kì vọng p [0.04-0.06]
19
Cỡ mẫu - NC cắt ngang – 1 Tỷ lệ
Cỡ mẫu - NC cắt ngang – 1 Trung bình
Ví dụ:
Xác định thời gian bị chậm trễ trong việc điều trị ở những bệnh nhân lao tại …
Z1−α / 2 × σ 2
n=
ε 2µ 2
n
cỡ mẫu cần thiết
α
sai số loại 1 (xác suất không đạt được các kết quả tương tự nếu điều tra được lặp lại)
μ
giá trị trung bình của vấn đề cần NC (tham khảo các NC trước đây)
σ
độ lệch chuẩn của vấn đề cần NC (tham khảo các NC trước đây)
ε
sai số tương đối chấp nhận được
Cỡ mẫu - NC cắt ngang- 1 trung bình
Cỡ mẫu - NC bệnh chứng
Ví dụ: xác định mối liên quan giữa việc sử dụng nguồn nước hợp vệ sinh và tình trạng mắt hột hoạt
tính ở trẻ dưới 10 tuổi ở huyện X
{
z
n=
1−α / 2
2 P2 (1 − P2 ) + z1− β P1 (1 − P1 ) + P2 (1 − P2 )
( P1 − P2 ) 2
n
cỡ mẫu cần thiết
α
sai số loại 1
1-β
lực mẫu, xác suất có thể tìm thấy khác biệt thực sự giữa hai nhóm
ORo
tỷ số chênh cần kiểm định (ORo=1)
P1
tỷ lệ phơi nhiễm trong nhóm bệnh (NC trước đây)
P2
tỷ lệ phơi nhiễm trong nhóm chứng (NC trước đây)
ORa
tỷ số chênh theo giả thuyết (NC trước đây)
}
2
Ví dụ
Theo báo cáo của Trung tâm Y tế huyện X:
- tỉ lệ người dân của huyện có tiếp cận với nguồn nước sạch là 20%
tỉ lệ hộ gia đình phải sử dụng nguồn nước khơng hợp vệ sinh là 80% (tỉ lệ phơi
nhiễm với yếu tố nguy cơ trong quần thể).
Lực mẫu bằng 80%
OR (tham khảo) giữa nhóm bệnh và nhóm chứng về tình trạng phơi nhiễm là 1,75.
Ta tính được cỡ mẫu cần thiết để nghiên cứu cho nhóm trẻ bệnh và trẻ chứng là 299 trẻ
(tỉ lệ bệnh:chứng là 1:1).
Cỡ mẫu - NC bệnh chứng
Cỡ mẫu - NC thuần tập
Ví dụ: xác định mối liên quan giữa uống rượu và ung thư gan ở những người uống rượu ít và uống
{
z
n=
rượu nhiều.
1−α / 2
2 P (1 − P ) + z1− β P1 (1 − P1 ) + P2 (1 − P2 )
( P1 − P2 ) 2
n
cỡ mẫu cần thiết
α
sai số loại 1
1-β
lực mẫu, xác suất có thể tìm thấy khác biệt thực sự giữa hai nhóm
RRo
nguy cơ tương đối cần kiểm định (RRo=1)
P1
tỷ lệ mắc bệnh trong nhóm phơi nhiễm (NC trước đây)
P2
tỷ lệ mắc bệnh trong nhóm khơng phơi nhiễm (NC trước đây)
RRa
nguy cơ tương đối cần kiểm định (NC trước đây)
p
tỷ lệ dự đoán của vấn đề cần NC (tham khảo các NC trước đây)
d
giới hạn của sai số chấp nhận được
}
2