Tải bản đầy đủ (.pptx) (33 trang)

BAI 6 TUONG QUAN VA HOI QUY

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.98 MB, 33 trang )

TIN HỌC ỨNG DỤNG

TƯƠNG QUAN VÀ HỒI QUY

TRƯỜNG ĐẠI HỌC Y DƯỢC HUẾ
BỘ MÔN THỐNG KÊ – DÂN SỐ - SỨC KHỎE SINH SẢN

1


2


3


4


Phương trình hồi qui cho 2 chỉ số gồm: BMI, độ tuổi. Và nghiên cứu đề nghị: nam
giới có PBF > 30 và nữ PBF > 40 thì được xem là béo phì.
PBF (nữ) = -18.9 + 0.044*tuổi + 3.473*BMI - 0.051*BMI*BMI
PBF (nam) = -29.8 + 0.044*tuổi + 3.473*BMI - 0.051*BMI*BMI
/>

Mục tiêu

1/ Xác định được ý nghĩa và cách sử dụng phân tích tương quang, mơ hình hồi quy
thích hợp.
2/ Thực hiện được cách lệnh phân tích tương quan, mơ hình hồi quy trong SPSS.
3/ Đọc phiên giãi ý nghĩa và trình bày kết quả phân tích.



Tin học ứng dụng - NCKH

Bộ môn: TKYT – DS -SKSS

6


PHÂN TÍCH TƯƠNG QUAN

Thường xét đến khi 2 biến NC là biến định lượng.
Chú ý đến tính phân bố của số liệu định lượng.
Xác định ngưỡng ý nghĩa của hệ số tương quan (r )
r<0,3: tương quan yếu
0,3 ≤ r ≤ 0,5 : tương quan TB
0,5 < r ≤ 0,7 : tương quan chặt chẽ
r>0,7 : tương quan rất chặt chẽ
7


Ví dụ: tính hệ số tương quan giữa tuổi và chiều cao
Thực hiện: Analyze/ Correlate/Bivariate

Biến số

8


Kết quả thực hiện


Hệ số tương quan r
Ngưỡng ý nghĩa p value
Số trường hợp quan sát

9


Thể hiện mối tương quan trên biểu đồ scatter plot: graph/legacy Dialogs/Scatter plot

10


Biến phụ thuộc

Biến độc lập

11


Chú ý :




Lựa chọn hệ tương quan pearson khi số liệu có phân bố chuẩn
Hệ số tương quan Spearman khi số liệu có phân bố khơng chuẩn

12



MƠ HÌNH HỒI QUY

Phân loại: (dựa vào kiểu biến số phụ thuộc )



Thơng thường chúng ta có nhiều mơ hình hồi quy khác nhau tùy thuộc vào
kiểu biến số của biến phụ thuộc.



Một số mơ hình chính hay gặp trong các phân tích thống kê: Hồi quy tuyến
tính, hồi quy logistic, và hồi quy Cox ( sự kiện theo thời gian).

13


MƠ HÌNH HỒI QUY



Chương trình này chúng tơi chỉ đề cập đến 2 mơ hình là hồi quy tuyến tính (linear
regression) và mơ hình logistic với biến phụ thuộc là nhị phân (Binary logistic).

• Dựa vào số lượng biến độc lập đưa vào mơ hình
 hồi quy đơn biến ( 1 biến độc lập)
 Hồi quy đa biến ( ≥ 2 biến độc lập)

14



Mơ hình hồi quy tuyến tính đơn biến

Hồi quy tuyến tính đơn biến có dạng:







Biến phụ thuộc (y): là biến định lượng
Biến độc lập (x): thường là biến định lượng hoặc thứ bậc.
: là điểm cắt y khi x = 0 ( hằng số constant)
: là độ dốc là sự thay đổi của mỗi đơn vị y khi x thay đổi.
Sử dụng phương pháp ước tính bình phương tối thiểu để lựa chọn mơ hình tối
ưu

15


Mơ hình hồi quy tuyến tính
Thực hiện:
Analyza/ Regression/ Linear
Lưu ý: Các giả định số liệu phải có phân bố chuẩn, các quan sát độc lấp

16


Biến phụ thuộc


Biến độc lập
Phương pháp đưa phân
tích

17


+ Một số phương pháp phân tích:

-

Enter : tất cả các biến đưa vào đều góp mặt trong mơ hình (1 mơ hình duy nhất)

-

Backward: Loại bỏ dần các biến khơng đóng góp cho mơ hình (số biến độc lập
giảm dần theo các mơ hình)

-

Forward: Tăng dần các biến trong mơ hình

-

Stepwise: Kết hợp

18



Ví dụ: Hồi quy tuyến tính đơn biến
Viết phương trình tuyến tính giữa t score cổ xương đùi với tuổi nghiên cứu

19


Phương pháp đưa biến độc lập vào mơ hình

Tóm tắt mơ hình ( lưu ý ý nghĩa hệ số R2)

Kiểm định sự tồn tại có ý
nghĩa của mơ hình

20


Coefficients

a

Model
Standardized
Unstandardized Coefficients

1

B

Std. Error


(Constant)

1.146

.612

tuoi

-.051

.009

Coefficients

Beta

-.408

95.0% Confidence Interval for B

t

Sig.

Lower Bound

Upper Bound

1.872


.063

-.062

2.354

-5.960

.000

-.069

-.034

a. Dependent Variable: tscore_coxdui

*Lưu ý hệ số B, sig. ( giá trị p) và 95% của hệ số B

Phương trình :
Tscore cổ xương đùi = 1,1146 – 0,051*tuổi

21


Mơ hình hồi quy binary logistic đơn biến







Với biến phụ thuộc là nhị phân ( mã 0;1)
Thường sử dụng để đo lường chỉ số nguy cơ (OR).
Biến độc lập có thể định lượng hoặc định tính.
Phương pháp này về nguyên tắc tương tự như mơ hình tuyến tính. Sử
dụng hàm log



Dạng :

Logit = ln(Odds) = ln[p/(1 - p)] = a + bx

22


Đo lường hệ số nguy cơ ( OR)
Bệnh

Không bệnh

Tổng

Phơi nhiễm

a

b

a+b


Không phơi nhiễm

c

d

d+d

a+c

b+d

a+b+c+d

Tổng

Theo lý thuyết odds được tính như sau :
Odd nhóm bệnh = tỷ lệ có phơi nhiễm nhóm bênh/ tỷ lệ khơng phơi nhiễm của nhóm bệnh
= a/(a+c) / c/(a+c)
= p/ (1-p) = a/c
Tương tự
Odd nhóm khơng bệnh = p’/(1-p’) = b/d

OR = odds bệnh/ Odds không bệnh = ad/bc
23


Trong mơ hình hồi quy logistic thì
OR chính là ?

(SỬ DỤNG THUẬT TỐN LOGIT thì OR chính là log cơ số e của hệ số hồi quy B)

24


Ví dụ: xây dựng mơ hình logistic giữa tình trạng lỗng xương (cổ xương đùi) với trình trạng
giảm chiều cao (có; khơng )
Analyze/ Regression/Binary logistic

Biến phụ thuộc

Biến độc lập

Phương pháp lựa chọn
biến

25


Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×