Tải bản đầy đủ (.) (61 trang)

BÀI GIẢNG Phương pháp chọn mẫu và tính cỡ mẫu trong nghiên cứu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.25 MB, 61 trang )

Cỡ mẫu và chọn mẫu


Chia sẻ

Khó khăn
Kinh nghiệm


Nghiên cứu

Khơng thể thực hiện trên tồn bộ dân số
Khó khăn trong việc kiểm soát và đảm bảo chất lượng số liệu/chất lượng nghiên cứu
Chỉ chọn một mẫu (sample) từ dân số (population/target population)
 tính tốn các chỉ số thống kê từ mẫu dùng để ước lượng giá trị thực của quần thể


Mục tiêu

Vai trị của chọn mẫu và tính tốn cỡ mẫu
Nắm được một số khái niệm cơ bản trong chọn mẫu
Tính tốn được cỡ mẫu cho nghiên cứu thường gặp
Sử dụng được phần mềm SampleSize của WHO để tính tốn nhanh cỡ mẫu
Phân biệt được các phương pháp chọn mẫu


Quy trình chọn mẫu
Xác định tổng thể NC và phần tử

Xác định khung mẫu


Xác định k.thước mẫu/tính cỡ mẫu

Xác định p.p. chọn mẫu

Chọn mẫu


Nội dung

Các khái niệm
Tính cỡ mẫu cho các nghiên cứu thường gặp
Sử dụng SampleSize của WHO để tính tốn nhanh cỡ mẫu
Các phương pháp chọn mẫu


Các khái niệm







Quần thể: tồn bộ các phần tử
Quần thể đích: quần thể lý tưởng cho việc đáp ứng các mục tiêu của điều tra
Quần thể NC: quần thể được điều tra trong thực tế
Khung mẫu: danh sách các đơn vị trong quần thể nghiên cứu
Phần tử: một đơn vị nghiên cứu trong cuộc điều tra

8



Các khái niệm
Quần thể

Quần thể NC

Quần thể đích

Các phần tử
9


Các khái niệm
Vấn đề

Quần thể đích

Đơn vị NC

Suy dinh dưỡng liên quan đến việc cai

Toàn bộ trẻ từ 6-24 tháng

1 trẻ trong độ tuổi 6-24 tháng ở

sữa cho trẻ ở huyện X

tuổi ở huyện X


huyện X

Tác động của lũ lụt đến KTXH (và sức

Tồn bộ những hộ gia đình bị

1 hộ gia đình bị lụt ở phường Y

khỏe) ở phường Y

lụt ở phường Y

Đánh giá mức độ hài lòng về chất

Toàn bộ các lần khám chữa

1 lần khám chữa bệnh tại phòng

lượng khám chữa bệnh tại phòng

bệnh tại phòng khám Z trong

khám Z trong vòng 6 tháng

khám Z

vòng 6 tháng


Các khái niệm

Đơn vị nghiên cứu


Cỡ mẫu

Số lượng tối thiểu đơn vị NC cần tiến hành điều tra
Phụ thuộc vào:
Mục tiêu (câu hỏi/giả thuyết NC) – đo lường cái gì
Thiết kế NC
Độ chính xác mong muốn
Phương pháp chọn
Nguồn lực (thời gian, nhân lực, tài chính)

12


Cỡ mẫu
Mục tiêu: Xác định, đo lường, so sánh …

Tỷ lệ: chỉ số đầu ra là biến phân loại
 VD: mắc bệnh, khỏi bệnh, tử vong, tiếp cận được với dịch vụ, có kiến thức tốt/đạt, mức độ hài lịng …

Giá trị trung bình: chỉ số đầu ra là biến liên tục
 VD: chiều cao, cân nặng, số ngày nằm viện, chi phí …

Trong NC có nhiều chỉ số đầu ra:
 Tính cỡ mẫu cho từng chỉ số, lấy cỡ mẫu có giá trị lớn nhất
 Nguyên tắc cơ bản, chỉ số có giá trị càng nhỏ, cỡ mẫu càng lớn



Cỡ mẫu

Thiết kế nghiên cứu

Cắt ngang/Sinh thái
Bệnh chứng
Thuần tập
Thử nghiệm lâm sàng


Cỡ mẫu - NC cắt ngang – 1 Tỷ lệ

z12−α / 2 p (1 − p )
n=
2
d
z

: hệ số tin cậy

p

: tỷ lệ dự đoán

 từ các nghiên cứu trước hoặc 50%

d

: độ chính xác tuyệt đối


 + x đơn vị

Ví dụ: một nghiên cứu cắt ngang, để đánh giá tỷ lệ thừa cân của trẻ 6-12 tuổi tại tỉnh X. Tỷ lệ của một nghiên cứu
khác là 15%.
p=0.15
z=1.96 ~ mức chính xác 95%
d=0.05 ~ độ chính xác + 0.05  kì vọng p [0.1-0.2]

15


Cỡ mẫu - NC cắt ngang – 1 Tỷ lệ

z12−α / 2 p (1 − p )
n=
2
d
z

: hệ số tin cậy

p

: tỷ lệ dự đoán

 từ các nghiên cứu trước hoặc 50%

d

: độ chính xác tuyệt đối


 + x đơn vị

Ví dụ: một nghiên cứu cắt ngang, để đánh giá tỷ lệ thừa cân của trẻ 6-12 tuổi
tại tỉnh X. Tỷ lệ của một nghiên cứu khác là 15%.

p=0.15
z=1.96 ~ mức chính xác 95%
d=0.05 ~ độ chính xác + 0.05  kì vọng p [0.1-0.2]

1,96 2 x0,15 x(1 − 0,15)
n=
= 196
2
0,05
Cần có tối thiểu 196 trẻ 6-12 tuổi để nghiên cứu

16



Cỡ mẫu - NC cắt ngang – Tỷ lệ


Cỡ mẫu - NC cắt ngang – Tỷ lệ

Tỷ lệ thấp
Sử dụng cơng thức tính cỡ mẫu với độ chính xác tương đối (ε)

z12−α / 2 (1 − p )

n=
2
ε
p sơ sinh tại huyện X. Tỷ
 Ví dụ: một nghiên cứu cắt ngang, để đánh giá tỷ lệ tử vong
lệ của một nghiên cứu khác là 50/1000

p=0.05
z=1.96 ~ mức chính xác 95%
ε =0.2 ~ độ chính xác tương đối + 20% của p  kì vọng p [0.04-0.06]
19


Cỡ mẫu - NC cắt ngang – 1 Tỷ lệ


Cỡ mẫu - NC cắt ngang – 1 Trung bình

Ví dụ:
Xác định thời gian bị chậm trễ trong việc điều trị ở những bệnh nhân lao tại …

Z1−α / 2 × σ 2
n=
ε 2µ 2
n

cỡ mẫu cần thiết

α


sai số loại 1 (xác suất không đạt được các kết quả tương tự nếu điều tra được lặp lại)

μ

giá trị trung bình của vấn đề cần NC (tham khảo các NC trước đây)

σ

độ lệch chuẩn của vấn đề cần NC (tham khảo các NC trước đây)

ε

sai số tương đối chấp nhận được


Cỡ mẫu - NC cắt ngang- 1 trung bình


Cỡ mẫu - NC bệnh chứng
Ví dụ: xác định mối liên quan giữa việc sử dụng nguồn nước hợp vệ sinh và tình trạng mắt hột hoạt
tính ở trẻ dưới 10 tuổi ở huyện X

{
z
n=

1−α / 2

2 P2 (1 − P2 ) + z1− β P1 (1 − P1 ) + P2 (1 − P2 )
( P1 − P2 ) 2


n

cỡ mẫu cần thiết

α

sai số loại 1

1-β

lực mẫu, xác suất có thể tìm thấy khác biệt thực sự giữa hai nhóm

ORo

tỷ số chênh cần kiểm định (ORo=1)

P1

tỷ lệ phơi nhiễm trong nhóm bệnh (NC trước đây)

P2

tỷ lệ phơi nhiễm trong nhóm chứng (NC trước đây)

ORa

tỷ số chênh theo giả thuyết (NC trước đây)

}


2


Ví dụ

Theo báo cáo của Trung tâm Y tế huyện X:
- tỉ lệ người dân của huyện có tiếp cận với nguồn nước sạch là 20%
 tỉ lệ hộ gia đình phải sử dụng nguồn nước khơng hợp vệ sinh là 80% (tỉ lệ phơi
nhiễm với yếu tố nguy cơ trong quần thể).

Lực mẫu bằng 80%
OR (tham khảo) giữa nhóm bệnh và nhóm chứng về tình trạng phơi nhiễm là 1,75.
Ta tính được cỡ mẫu cần thiết để nghiên cứu cho nhóm trẻ bệnh và trẻ chứng là 299 trẻ
(tỉ lệ bệnh:chứng là 1:1).


Cỡ mẫu - NC bệnh chứng


Cỡ mẫu - NC thuần tập
Ví dụ: xác định mối liên quan giữa uống rượu và ung thư gan ở những người uống rượu ít và uống

{
z
n=

rượu nhiều.

1−α / 2


2 P (1 − P ) + z1− β P1 (1 − P1 ) + P2 (1 − P2 )
( P1 − P2 ) 2

n

cỡ mẫu cần thiết

α

sai số loại 1

1-β

lực mẫu, xác suất có thể tìm thấy khác biệt thực sự giữa hai nhóm

RRo

nguy cơ tương đối cần kiểm định (RRo=1)

P1

tỷ lệ mắc bệnh trong nhóm phơi nhiễm (NC trước đây)

P2

tỷ lệ mắc bệnh trong nhóm khơng phơi nhiễm (NC trước đây)

RRa


nguy cơ tương đối cần kiểm định (NC trước đây)

p

tỷ lệ dự đoán của vấn đề cần NC (tham khảo các NC trước đây)

d

giới hạn của sai số chấp nhận được

}

2


×