Tải bản đầy đủ (.pdf) (10 trang)

Bài giảng Mô hình hồi quy Logistic - Trường Đại Học Quốc Tế Hồng Bàng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.08 MB, 10 trang )

<span class='text_page_counter'>(1)</span><div class='page_container' data-page=1>

<b>Tuan V. Nguyen</b>



Senior Principal Research Fellow, Garvan Institute of Medical Research
Professor, UNSW School of Public Health and Community Medicine


Professor of Predictive Medicine, University of Technology Sydney
Adj. Professor of Epidemiology and Biostatistics,


School of Medicine Sydney, University of Notre Dame Australia


</div>
<span class='text_page_counter'>(2)</span><div class='page_container' data-page=2>

<b>Mơ hình hồi qui logistic (logistic regression)</b>



• Ví dụ dẫn nhập



</div>
<span class='text_page_counter'>(3)</span><div class='page_container' data-page=3></div>
<span class='text_page_counter'>(4)</span><div class='page_container' data-page=4>

<b>The </b>

<i><b>Challenger</b></i>

<b>shuttle disaster</b>



<b>Flight </b> <b>Temp</b> <b>Damage</b>


STS-1 66 0


STS-2 70 1


STS-3 69 0


STS-4 80


STS-5 68 0


STS-6 67 0


STS-7 72 0



STS-8 73 0


STS-9 70 0


STS 41B 57 1


STS 41C 63 1


STS 41D 70 1


STS 41G 78 0


STS 51A 67 0


STS 51C 53 1


STS 51D 67 0


<b>Flight </b> <b>Temp</b> <b>Damage</b>


STS 51B 75 0


STS 51G 70 0


STS 51F 81 0


STS 51I 76 0


STS 51J 79 0



STS 61A 75 1


STS 61B 76 0


STS 61C 58 1


</div>
<span class='text_page_counter'>(5)</span><div class='page_container' data-page=5>

<b>Nghiên cứu bệnh tiểu đường (type 2 diabetes)</b>



• Nghiên cứu cắt ngang trên 3155 cá nhân


• Outcome: chẩn đốn tiểu đường



• Yếu tố nguy cơ: tuổi, giới tính, huyết áp, vịng eo, vịng mơng, cân nặng,


tỉ trọng cơ thể (BMI)



• Câu hỏi 1: BMI có liên quan đến bệnh tiểu đường?


• Câu hỏi 2: Yếu tố nào có liên quan đến tiểu đường?



</div>
<span class='text_page_counter'>(6)</span><div class='page_container' data-page=6>

<b>> db = read.csv("~/Dropbox/_Conferences and Workshops/Dai hoc Duoc </b>
<b>6-2019/Datasets/Diabetes data.csv", header=T)</b>


<b>> head(db)</b>


id age gender height weight waist hip sysbp diabp active hypertension


1 1 76 Female 163 53 90 93 160 90 0 1


2 1 40 Female 149 51 74 94 100 60 0 0


3 1 51 Female 151 55 91 100 120 80 0 0



4 1 43 Female 158 62 78 96 120 80 1 0


5 2 72 Female 148 47 91 95 130 60 1 0


6 2 44 Male 155 48 69 86 120 80 0 0


<b>bmi</b> whr <b>diabetes</b>


</div>
<span class='text_page_counter'>(7)</span><div class='page_container' data-page=7>

<b>Gian lận thẻ tín dụng (credit card)</b>



• Nghiên cứu cắt ngang trên 284807 transactions


• Outcome: gian lận (yes / no)



• Yếu tố nguy cơ: Time, Amount, V1-V28



</div>
<span class='text_page_counter'>(8)</span><div class='page_container' data-page=8>

<b>2019/Datasets/Credit card data.csv", header=T)</b>


<b>> head(cc, 3</b>)


Time V1 V2 V3 V4 V5 V6
1 0 -1.359807 -0.07278117 2.5363467 1.3781552 -0.33832077 0.46238778
2 0 1.191857 0.26615071 0.1664801 0.4481541 0.06001765 -0.08236081
3 1 -1.358354 -1.34016307 1.7732093 0.3797796 -0.50319813 1.80049938


V7 V8 V9 V10 V11 V12
1 0.23959855 0.09869790 0.3637870 0.09079417 -0.5515995 -0.61780086
2 -0.07880298 0.08510165 -0.2554251 -0.16697441 1.6127267 1.06523531
3 0.79146096 0.24767579 -1.5146543 0.20764287 0.6245015 0.06608369



V13 V14 V15 V16 V17 V18
1 -0.9913898 -0.3111694 1.4681770 -0.4704005 0.2079712 0.02579058
2 0.4890950 -0.1437723 0.6355581 0.4639170 -0.1148047 -0.18336127
3 0.7172927 -0.1659459 2.3458649 -2.8900832 1.1099694 -0.12135931


V19 V20 V21 V22 V23 V24
1 0.403993 0.25141210 -0.01830678 0.2778376 -0.1104739 0.06692808
2 -0.145783 -0.06908314 -0.22577525 -0.6386720 0.1012880 -0.33984648
3 -2.261857 0.52497973 0.24799815 0.7716794 0.9094123 -0.68928096


</div>
<span class='text_page_counter'>(9)</span><div class='page_container' data-page=9>

<b>Đặc tính của các nghiên cứu </b>



<b>Outcome (dependent) variable</b>

: biến nhị phân (binary variable), chỉ có


2 giá trị



<b>Predictor (independent) variables</b>

: đa dạng (nhị phân, biến liên tục)



</div>
<span class='text_page_counter'>(10)</span><div class='page_container' data-page=10>

<b>Ứng dụng của mơ hình hồi qui logistic</b>



• Mơ tả mối liên quan giữa biến outcome và biến tiên lượng


• Kiểm sốt các biến nhiễu (Controlling for confounders)



</div>

<!--links-->

×