Tải bản đầy đủ (.ppt) (66 trang)

Bài giảng Hồi quy logistic

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (459.93 KB, 66 trang )

Hồi quy logistics

11/13/16

1


Đã học…
• Hồi quy
• Hồi quy logistic

11/13/16

2


Mục tiêu





Trình bày được nguyên lý của hồi quy
logistic
Trình bày được các bước xây dựng mô
hình hồi quy logistic
Kiểm soát được các vấn đề khi thực hiện
hồi quy logistic
Thực hiện được phân tích trên SPSS và
phiên giải kết quả


11/13/16

3


Nguyên lý của hồi quy logistics

11/13/16

4


Ví dụ 1

11/13/16

5


Ví dụ 1 (tt)

Tuyến tính?

11/13/16

6


Ví dụ 2


Tuyến tính?

11/13/16

7


Vấn đề
• Giá trị trục tung – y: đi từ 0 đến 1
• Giá trị ước lượng theo hồi quy tuyến tính
có thể nằm ra ngoài giá trị ý nghĩa
• Sai số không có phân phối chuẩn

11/13/16

8


Hồi quy logistics
• Hồi quy logistic được sử dụng khi biến phụ thuộc
là biến nhị giá
– Được đo lường bằng:
• Nguy cơ (risk), hoặc
• Số chênh (odds), hoặc
• Tỷ số số chênh (odds ratio)

– Các đo lường này có miền xác định: risk(0,1),
Odds(0,+α)

• Khi đó, mô hình y = a + bx

– với miền xác định của y là (-α; +α) không thích hợp để
sử dụng.
11/13/16

9


Hồi quy logistics (tt)
• Vấn đề: biến đổi đo lường biến phụ thuộc để
có miền xác định (-α; +α)
• Sử dụng thuật toán logit
– Logit = ln(θ/1- θ)
– Như vậy: miền xác định của logit là (-α; +α)

11/13/16

10


Hồi quy logistics (tt)
Tình trạng
bệnh

Có chủng
ngừa

Không
chủng
ngừa


Tổng

Bệnh
phong

a

b

a+b

Không có
bệnh phong

c

d

c+d

a+c

b+d

N

Tổng

Theo lý thuyết, Odds được tính như sau :
Odds của nhóm bệnh

= tỷ lệ có chủng ngừa trong nhóm bệnh/tỷ lệ không chủng ngừa trong nhóm bệnh
= (a/a+b)/(b/a+b)
= 11/13/16
p/(1-p)
11


Hồi quy logistics (tt)
• Sử dụng thuật toán logit
– Logit = ln(θ/1- θ)

• Như vậy:
– Logit = ln(Odds) = ln[p/(1 - p)] = a + bx
 Tính toán được OR

11/13/16

12


Hồi quy logistics (tt)
• Như vậy:
• Odds của x = 0 là:
• Odds của x = 1 là:
• Vậy OR được tính:

11/13/16

13



Như vậy
• Hồi quy logistics:
– Dùng cho biến phụ thuộc là biến nhị giá
– Giúp xác định:
• Số chênh
• Tỷ số số chênh
• Tỷ lệ đã hiệu chỉnh

11/13/16

14


Hồi quy logistics trong SPSS
Biến độc lập là biến nhị giá

11/13/16

15


Tính tỷ số số chênh OR
• Đo lường mức độ tác động giữa chủng
ngừa BCG và bệnh phong
– Bảng 2x2
– Hồi quy logistics
• Đơn biến: 1 biến độc lập
• Kết quả phần Block 1


11/13/16

16


Kết quả hồi quy logistics
• Kết quả 1: Omnibus Test of Model Coefficients
– Giả thuyết Ho: việc đưa biến độc lập vào mô hình là
không có ý nghĩa
– Đối thuyết Ha: việc đưa biến độc lập vào mô hình là
có ý nghĩa
Omnibus Test s of Model Coef f icient s
Step 1

11/13/16

Step
Block
Model

Chi- square
84.352
84.352
84.352

df
1
1
1


Sig.
.000
.000
.000
17


Kết quả hồi quy logistics (tt)
Variables in t he Equat ion

Step
a
1

bcg
Constant

B
- 1.490
- .933

S.E.
.180
.081

Wald
68.221
131.286

df

1
1

Sig.
.000
.000

Exp(B)
.225
.393

95.0% C.I.for EXP(B)
Lower
Upper
.158
.321

a. Variable(s) entered on step 1: bcg.

• ln(odds) = - 0.933 – 1.49 x chủng ngừa BCG
• Như vậy
ln(Odds) = - 0.933 – 1.49 x 0 = - 0.933  Odds=0.393
ln(Odds) = - 0.933 – 1.49 x 1 = - 2.423  Odds=0.089
Hiểu như thế nào?
11/13/16

18


Phiên giải thế nào?

• OR=0.089/0.393 = 0.225
• Người được tiêm chủng BCG có nguy cơ
mắc bệnh phong chỉ vào khoảng 22,5% so
với người không tiêm BCG

11/13/16

19


Phiên giải
• Suy luận tỷ lệ từ giá trị Odds tính được
– Odds = 0.393  p = 0.393/1.393 = 0.282 
mô hình giúp tiên đoán: 28.2% người không
chủng ngừa BCG sẽ mắc bệnh phong.
– Odds = 0.089  p = 0.089/1.089 = 0.082. 
mô hình giúp tiên đoán: 8.2% người có chủng
ngừa BCG sẽ mắc bệnh phong.

11/13/16

20


Hồi quy logistics trong SPSS
Biến độc lập là biến thứ bậc

11/13/16

21



Tính tỷ số số chênh (1)
• Đo lường mối liên quan giữa bệnh phong và tuổi
• Giả định tính khuynh hướng của tuổi: sự khác biệt giữa
các lớp tuổi kế cận nhau là giống nhau:
• Mô hình: y = logit = ln(Odds) = ln[p/(1 - p)] = α + βx + ε

11/13/16

22


Tính tỷ số số chênh (1)
• Khi đó
– OR của nhóm tuổi 15-24 so với nhóm 1-14 là:
• OR = Oddsx=1/Oddsx=0 = eα + β/eα = eβ

– OR của nhóm tuổi 25-24 so với 15-24 là:
• OR = Oddsx=2/Oddsx=1 = eα + 2β/eα + β = eβ

11/13/16

23


Phiên giải kết quả
Variables in t he Equat ion

Step

a
1

nhtuoi
Constant

B
.380
- 2.669

S.E.
.049
.194

Wald
59.253
189.407

df
1
1

Sig.
.000
.000

Exp(B)
1.463
.069


95.0% C.I.for EXP(B)
Lower
Upper
1.328
1.612

a. Variable(s) entered on step 1: nhtuoi.

• So với nhóm tuổi nhỏ hơn, nhóm tuổi lớn hơn kề
bên sẽ bị nguy cơ bị bệnh phong tăng gấp 1.463
lần.

11/13/16

24


Phiên giải kết quả (tt)

e0.76 = 2.138
11/13/16

25


Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×