PHÂN TÍCH PHÂN TẦNG
(STRATIFIED ANALYSIS)
BM Dich tễ - Thống kê
1
Mục tiêu
• Hiểu được lý do phân tích phân tầng
• Hiểu được khái niệm về gây nhiễu, tương
tác và khống chế nhiễu
• Thực hiện được phương pháp phân tầng
khống chế nhiễu trong SPSS
• Phiên giải được kết quả phân tích trên
SPSS
2
Phân tích phân tầng
• Là một phương pháp dùng để khống chế,
kiểm soát nhiễu khi phân tích.
• “Phân tầng”: phân tích dựa trên từng
“tầng”
- từng “giá trị” của biến số thứ 3 khi
phân tích mối liên quan giữa biến phơi
nhiễm và kết quả:
– Ví dụ: Tuổi là biến số gây nhiễu khi phân tích
mối liên quan giữa hút thuốc lá và ung thư phổi
3
Nhiễu (Confounding)
Nhiễu xuất hiện khi tác dụng của phơi nhiễm đối với kết quả
bị đánh giá sai lệch (có thể mạnh hơn hay yếu hơn).
Vídụ: Hút thuốc lá và ung thư phổi: tuổi là yếu tố nhiễu
Biến nhiễu
• “Một biến số (yếu tố) thứ 3 làm ảnh hưởng tới mối liên quan
giữa phơi nhiễm và bệnh”
• Cácđặcđiểmcủabiếnnhiễu
Ø Là yếu tố nguy cơ của bệnh (thậm chí ở nhóm không phơi
nhiễm)
Ø Có liên quan tới phơi nhiễm trong quần thể NC
Ø Không phải là yếu tố trung gian trong mối quan hệ nhân quả
của phơi nhiễm – bệnh
5
Sơ đồ thể hiện nhiễu
Exposure
Disease
Bệnh
Phơi nhiễm
Confounder
Biến nhiễu
Ví dụ
Hút thuốc lá
Phơi nhiễm
Tuổi
Biến nhiễu
Ung thư phổi
Bệnh
Trong đó, biến số “tuổi”:
1. Là yếu tố nguy cơ của ung thư phổi, kể cả ở nhóm
không hút thuốc
2. Có liên quan đến việc hút hoặc không hút thuốc lá
3. Không phải là yếu tố trung gian giữa hút thuốc lá và bệnh,
nghĩa là không nằm trên con đường
“hút thuốc lá à tuổi à bệnh”
Kiểm soát nhiễu
Ø nhiễu có thể được kiểm soát ở cả giai đoạn thiết kế
nghiên cứu và giai đoạn phân tích
1. Khống chế nhiễu một cách tối đa khi thiếtkếnghiên cứu
•
•
•
Phương pháp hạn chế
phân nhóm ngẫu nhiên (randomisation)
ghép cặp (matching): ví dụ trong nghiên cứu bệnh-chứng, có
thể ghép cặp theo tuổi, giới, v.v.
2. Khống chế, kiểm soát nhiễu khi phân tích
• Phân tích phân tầng (stratified analyses)
• Phân tích bằng mô hình đa biến (multivariable modeling)
Trong phân tích phân tầng
§ Để xét mối liên quan giữa hai biến phơi nhiễm và kết
quả, sử dụng các con số đo lường sự kết hợp OR hoặc RR
§ Một biến nhiễu là một biến mà khi ta hiệu chỉnh (kiểm
soát) trong quá trình phân tích sẽ dẫn tới những kết quả
RR hoặc OR khác nhau.
§ Cần dùng các kết quả đã hiệu chỉnh (adjusted) để thể
hiện mối liên quan giữa phơi nhiễm và bệnh chứ không
dùng các kết quả thô (crude).
Ví dụ
Giảthuyết: Không sống chung với vợ (E) là yếu tố nguy cơ dẫn tới
tình trạng giảm trí nhớ tuổi già(D) ở đàn ông.
Biếnnhiễutiềmtàng: Tuổi
Thiết kế nghiên cứu: Nghiên cứu bệnh chứng (Case-Control study)
Tấtcảđốitượng
Cases
Controls
Exposed
145
90
Unexposed
105
Tổng
250
Tuổi60-69
Controls
Cases
Controls
25
50
120
40
160
75
150
30
10
250
100
200
150
50
OR = 2.46
Cases
Tuổi70-79
OR = 1.00
OR = 1.00
Ví dụ
1. Mối liên quan giữa tuổi và bệnh?
Bệnh
Không bệnh
70-79
160
40
60-69
75
225
OR = 12.0
Ví dụ (tt)
2. Mối liên quan giữa tuổi và phơi nhiễm (không sống
với vợ)?
70-79
60-69
Phơi nhiễm Không phơi nhiễm
160
40
OR = 12.0
75
225
Ví dụ (tt)
3. Tuổi có phải là yếu tố trung gian trong mối liên
quan giữa “không sống chung với vợ” và
“giảm trí nhớ” không?
Không
4. OR thô (tính toán cho tất cả các đối tượng) có
khác OR hiệu chỉnh (tính toán sau khi đã cân
nhắc biến tuổi) không?:
Có
13
Tương tác
(Interaction/Effect Modification)
Tương tác xuất hiện khi tác dụng của phơi nhiễm đối với
bệnh thể hiện khác nhau trên các nhóm đối tượng khác nhau
(tác dụng này có thể mạnh hơn hay yếu hơn)
Vídụ: Uống cà phê liên quan đến ung thư bàng quang.
Biến tương tác tiềm ẩn: Hút thuốc lá
Ví dụ
Giảthuyết
Uống cà phê (E) liên quan tới ung thư bàng quang (D)
Biến tương tác tiềm ẩn (Effect Modifier): Hút thuốc lá
Thiết kế:
Uống cà phê
Có
Không
Bênh chứng
Không bệnh
Bệnh
450
400
50
100
OR = 2.3
Phân tích phân tầng (Stratified Analysis)
Có hút thuốc
Uống
cà phê
Bệnh
Có
Không
370
30
Không bệnh
200
50
OR = 3.8
Không hút thuốc
Uống
cà phê
Bệnh
Không bệnh
OR = 1.0
Có
Không
80
20
200
50
Tương tác
Có sự thay đổi về độ lớn của mối liên quan giữa phơi nhiễm
và bệnh tùy thuộc vào các mức độ của một biến số thứ ba
(the effect modifier)
Ø Phản ánh đặc điểm của mối quan hệ tự nhiên giữa bệnh
và phơi nhiễm
Ø Tương tác là khái niệm hoàn toàn độc lập với biến nhiễu
Ø Khi phân tích, nếu thấy có hiện tượng tương tác, không
hiệu chỉnh theo biến nhiễu mà phải trình bày các kết quả độc lập ở
từngtầng
Tương tác (tt)
Ø Thể hiện qua sự tương tác về mặt thống kê trong bộ
số liệu (mối liên quan giữa phơi nhiễm và bệnh là
không như nhau ở các tầng của yếu tố tương tác)
Tuy nhiên
Ø Cần đặc biệt lưu ý cân nhắc tới ý nghĩa về mặt sinh
học (hoặc lâm sàng) của mối tương tác về mặt thống
kê quan sát được.
Các bước kiểm soát nhiễu và tương tác
1. Phân tầng theo các mức độ của yếu tố nghi
ngờ là “yếu tố nhiễu”
2. Tính các ước lượng (RR hoặc OR) không bị
nhiễu đặc trưng cho từng tầng
3. Đánh giá sự khác biệt của RR hoặc OR ở các
tầng thông qua kiểm định ý nghĩa (test of
significance)
Các bước kiểm soát nhiễu và tương tác (tt)
4. Nếu RR hoặc OR của các tầng khác nhau: biến số
thứ 3 là biến tương tác à nhà nghiên cứu báo cáo
OR hoặc RR của từng tầng
Nếu RR hoặc OR của các tầng không khác
nhau: biến số thứ 3 là không phải là biến tương tác
à nhà nghiên cứu so sánh OR (RR) thô với OR
(RR) hiệu chỉnh
5. Nếu OR (RR) thô khác với OR (RR) hiệu chỉnh:
biến số thứ 3 là biến gây nhiễu à nhà nghiên cứu
báo cáo OR (RR) hiệu chỉnh
Các bước trong SPSS
Thực hiện lệnh Crosstab
với Layer là biến thứ 3
Giá trị kiểm định Breslow
Day’s Homongeinity.
Sig. (p-value)<0,05
C
ó
Tương tác, báo cáo kết
quả OR riêng từng tầng
Không
So sánh OR thô và OR
hiệu chỉnh
Khác biệt ~ 10%
C
ó
Biến layer là biến nhiễu,
báo cáo OR hiệu chỉnh
Không
Không nhiễu, báo cáo
OR thô
21
Thực hành trong SPSS
• Bộ số liệu Chilumba của 1 nghiên cứu bệnh chứng
• Nghiên cứu này nhằm tìm hiểu việc chủng ngừa BCG có
bảo vệ đối với bệnh lao hay không (nghĩa là có mối liên
quan giữa chủng ngừa BCG và bệnh lao hay không).
• Nghiên cứu này được tiến hành trên 1260 đối tượng bao
gồm 252 trường hợp mắc bệnh lao và 1008 trường hợp
chứng không mắc bệnh lao
22
Các bước tiếp cận
• Mục tiêu nghiên cứu:
– Tìm hiểu mối liên quan giữa chủng ngừa BCG và
bệnh lao
• Câu hỏi phân tích:
– Có mối liên quan giữa chủng ngừa BCG và bệnh lao
hay không
• Đặt giả thuyết:
– Ho: Không có mối liên quan giữa chủng ngừa BCG
và bệnh lao
– Ha: Có mối liên quan giữa chủng ngừa BCG và bệnh
lao
23
Các bước tiếp cận (tt)
• Các biến số:
– Biến số độc lập (phơi nhiễm): Chủng ngừa
BCG
– Biến số phụ thuộc (kết quả - bệnh): bệnh lao
• Để đo lường sự liên quan giữa phơi nhiễm
và bệnh trong NC bệnh chứng: sử dụng
OR
24
Phân tích
• 1. Phân tích đơn biến: trả lời câu hỏi về mối liên
quan
– Ví dụ: có mối liên quan giữa chủng ngừa BCG và
bệnh lao hay không?
• 2. Phân tích phân tầng với yếu tố gây nhiễu tiềm
tàng: trả lời câu hỏi mối liên quan (hay không
liên quan) đó có thực sự hay không (hay là ảnh
hưởng bởi yếu tố khác)
– Ví dụ: mối liên quan (hay không liên quan) giữa
chủng ngừa BCG và bệnh lao có bị ảnh hưởng bởi
yếu tố khác (như: tuổi…) hay không?
25