<span class='text_page_counter'>(1)</span><div class='page_container' data-page=1>
<b>Ứng dụng mơ hình hồi qui logistic</b>
<b>Tuan V. Nguyen</b>
Senior Principal Research Fellow, Garvan Institute of Medical Research
Professor, UNSW School of Public Health and Community Medicine
Professor of Predictive Medicine, University of Technology Sydney
Adj. Professor of Epidemiology and Biostatistics,
School of Medicine Sydney, University of Notre Dame Australia
</div>
<span class='text_page_counter'>(2)</span><div class='page_container' data-page=2>
<b>Ba ứng dụng hình hồi qui logistic</b>
•
<b>Đánh giá mối liên quan, ảnh hưởng (association)</b>
•
<b>Hiệu chỉnh (adjustment) cho yếu tố nhiễu </b>
</div>
<span class='text_page_counter'>(3)</span><div class='page_container' data-page=3>
<b>Ứng dụng 1: </b>
</div>
<span class='text_page_counter'>(4)</span><div class='page_container' data-page=4>
<b>Cân nặng của trẻ sơ sinh và mẹ hút thuốc lá </b>
•
Câu hỏi nghiên cứu: có mối liên quan giữa mẹ hút thuốc lá và trọng lượng
sơ sinh?
•
Nghiên cứu cắt ngang trên 189 bà mẹ và trẻ sơ sinh
•
Biến outcome: low, biến tiên lượng: smoke
<b>bw = read.csv("~/Dropbox/_Conferences and Workshops/Dai hoc Duoc </b>
<b>6-2019/Datasets/birthwt.csv")</b>
<b>head(bw)</b>
</div>
<span class='text_page_counter'>(5)</span><div class='page_container' data-page=5>
<b>Hiển thị mối liên quan bằng biểu đồ </b>
bw$smoke =
as.factor(bw$smoke)
bs$low =
as.factor(bw$low)
library(DescTools)
Desc(bw$smoke ~ bw$low)
Summary:
estimate
lwr.ci upr.ci'
<b>odds ratio 2.022 </b>
<b>1.081 3.783</b>
rel. risk (col1) 1.258
1.013 1.561
rel. risk (col2) 0.622
0.409 0.945
bw$low
0 1
Sum
bw$smoke
0 freq 86 29
115
p.row 74.8% 25.2%
.
p.col 66.2% 49.2%
.
1 freq 44 30
74
<b> p.col 33.8% 50.8% </b>
<b> .</b>
Sum freq 130 59
189
p.row . .
.
</div>
<span class='text_page_counter'>(6)</span><div class='page_container' data-page=6>
<b>Mơ hình hồi qui logistic </b>
Mơ hình liên quan giữa smoke và low như sau: gọi P là xác suất trọng lượng
thấp
# Tri n khai b ng R ể ằ
m = glm(low ~ smoke, family=binomial, data=bw)
summary(m)
# tính odds ratio
library(epiDisplay)
logistic.display(m)
log
<i>P</i>
1
−
<i>P</i>
</div>
<span class='text_page_counter'>(7)</span><div class='page_container' data-page=7>
<b>Kết quả phân tích </b>
Mơ hình liên quan giữa smoke và low như sau: gọi P là xác suất trọng lượng
thấp
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -1.0871 0.2147 -5.062 4.14e-07 ***
smoke1 0.7041 0.3196 2.203 0.0276 *
---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
log
<i>P</i>
1
−
<i>P</i>
=
α
+
β
<i>smoke</i>
log
<i>P</i>
1
−
<i>P</i>
</div>
<span class='text_page_counter'>(8)</span><div class='page_container' data-page=8>
<b>Kết quả phân tích </b>
> logistic.display(m)
Logistic regression predicting low : 1 vs 0
OR(95%CI) P(Wald's test) P(LR-test)
smoke: 1 vs 0 <b>2.02 (1.08,3.78) 0.028 0.027 </b>
Log-likelihood = -114.9023
No. of observations = 189
AIC value = 233.8046
</div>
<span class='text_page_counter'>(9)</span><div class='page_container' data-page=9>
<b>Ứng dụng 2: </b>
</div>
<span class='text_page_counter'>(10)</span><div class='page_container' data-page=10>
<b>Yếu tố nhiễu (confounding factors)</b>
•
Câu hỏi nghiên cứu: có mối liên quan giữa bà mẹ hút thuốc lá và
sinh con thiếu cân ?
•
Yếu tố nhiễu: có liên quan đến yếu tố nguy cơ (risk factor) và
outcome
•
Mối liên quan giữa hút thuốc lá và thiếu cân có thể do yếu tố
chủng tộc và độ tuổi?
•
Câu hỏi mới: mối liên quan giữa hút thuốc lá và thiếu cân có
<b>độc </b>
</div>
<!--links-->