CÁCH HIỆU CHỈNH CÁC YẾU TỐ GÂY NHIỄU TRONG NGHIÊN CỨU

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (530.95 KB, 11 trang )

CÁCH HIỆU CHỈNH CÁC
YẾU TỐ GÂY NHIỄU TRONG NGHIÊN CỨU
Trong phân tích kết quả nghiên cứu, đặc biệt các nghiên cứu hồi cứu
hoặc các nghiên cúu tiến cứu mà 2 nhóm không được phân bổ ngẫu nhiên
(randomization) sẽ có nhiểu biến gây nhiễu (confounders) như giới, tuổi, độ
nặng của bệnh...sẽ không được phân đều giữa 2 nhóm, do vậy khi phân tích
số liệu cần phải được hiệu chỉnh các yếu tố gây nhiễu này.
Tùy theo biến kết cục (biến phụ thuộc) là biến số hoặc biến nhị phân ta sử
dụng các thuật thống kê khác nhau để hiệu chỉnh.
1. Biến phụ thuộc là biến số:
Nếu biến phụ thuộc là biến số (lượng cholesterol máu chẳng hạn), sử
dụng phép phân tích hiệp biến (Analysis of covariance) trong mô hình tuyến
tính tổng quát (General linear model) để hiệu chỉnh. Các ví dụ sau đây đều
dùng phần mềm SPSS 13.0 để thực hiện hiệu chỉnh.

Ví dụ 1: Một nghiên cứu về lượng cholesterol máu ở đối tượng bị nhiễm viêm
gan virus C mạn tính và đối tượng không bị nhiễm. Các dữ liệu thu thập
được như sau:

Doituong Gioi Tuoi Nhom Cholesterol
1
1
56
0
5.6
2
2
53
1
6.3
3

2
55
1
5.9
4
2
54
1
5.5
5
1
53
1
5.3
6
2
54
1
4.7
7
1
54
1
4.3
8
2
52
1
3.6
9

2
57
1
3.8
10
2
51
1
3.6
11
2
52
1
4.5
12
2
51
1
4.2
13
2
50
1
4.4
14
2
47
1
4.7
15

2
46
1
4.3
16
1
47
0
5
17
2
47
0
5.2
18
2
43
0
4.8
19
2
44
0
4.4
20
2
45
0
4.5

Doituong Gioi
31
2
32
1
33
1
34
1
35
2
36
2
37
2
38
2
39
2
40
1
41
2
42
2
43
2
44
2
45

1
46
2
47
2
48
2
49
2
50
2

Tuoi
40
45
44
43
42
41
40
39
43
43
42
42
42
42
42
42
42

42
42
41

Nhom Cholesterol
1
4.3
0
4.8
0
4.4
0
3.3
0
3.9
0
5.6
0
4.8
0
4.7
0
5.2
0
3.8
1
4.5
1
4.7
1

4.5
1
4.6
0
6.2
0
5.2
0
4
0
4.8
0
4.8
1
3.7

21
22
23
24
25
26
27
28
29
30

1
1

2
2
2
2
2
2
2
2

46
47
45
44
45
46
45
44
42
41

0
0
1
1
0
1
1
1
1
1

4.3
4.8
4.7
4.8
4.3
3.6
3.8
3.6
3.1
4.2

51
52
53
54
55
56
57
58
59
60

2
1
2
1
2
1
2

1
2
1

41
39
40
41
42
41
42
42
40
44

1
0
0
0
0
0
0
1
0
1

Ghi chú: Giới 1 (Nam); 2 (Nữ)- Nhóm 0 (đối tượng không mắc viêm gan C); 1
(đối tượng mắc viêm gan C)
Nhập số liệu vào SPSS.
Dùng phép kiểm T ta có:

Group Statistics

Kết quả phép kiểm T cho thấy :
-Có sự khác biệt về tuổi giữa 2 nhóm: 43.1 ± 3.3 so với 47.0 ± 5.3 (
p=0.001)

3.8
4.4
4.7
4.1
3.8
5.6
5
4.2
5
4.2

- Không có sự khác biệt lượng cholesterol giữa 2 nhóm: 4.7 ± 0.6 so với
4.3 ± 0.7 (p=0.069)

Theo sinh học, nồng độ cholesterol tăng theo tuổi. Trong nghiên cứu này,
nhóm không nhiễm viêm gan C có tuổi trung bình nhỏ hơn (43.1 ± 3.3 so với
47.0 ± 5.3), vì vậy nếu không hiệu chỉnh theo tuổi thì sự so sánh này không
hợp lý.
Để hiệu chỉnh tuổi dùng phép phân tích hiệp biến (Analysis of covariance)
trong SPSS như sau.
Vào Menu>Analyze>General Linear Model>Univariate...

Vào màn hình Univariate:

Nhắp Cholesterol chuyển vào ô Dependent Variable
Nhắp Group (Viem gan c) chuyển vào ô Fixed Factor(s)
Nhắp Tuoi chuyển vào ô Covariate(s)
Nhấn vào nút Options, đánh dấu vào ô Descriptive statistics (Thống kê mô tả)
và ô Homogeneity tests để kiểm tra sự đồng nhất về phương sai giữa 2 nhóm,
nhắp Continue

Cuối cùng nhấn OK, kết quả như sau :

Kết quả test Levene với p=0.75 (>0.05)  chấp nhận giả thuyết không
phương sai giữa 2 nhóm không khác biệt hoặc 2 phương sai đồng nhất

Kiểm định sự khác biệt giữa 2 nhóm (đọc Group ở hàng 4) cho kết quả tổng
bình phương cùa phương sai típ 3 là 3,080, với bậc tự do=1 và phương sai
trung bình là 3,080, chia cho trung bình phương sai của phần dư (error) là
0,414, ta có F=7,440 và p=0,008 : Có sự khác biệt rõ lượng cholesterol giữa 2
nhóm với p=0.008.
Nếu so sánh với phép kiểm T trên đây (khi chưa hiệu chỉnh) thì p=0.069.
Kết luận : Sau khi đã hiệu chỉnh tuổi, nhóm đối tượng nhiễm viêm gan
virus C mạn tính có lượng cholesterol thấp hơn so với đối tượng không
bị nhiễm viêm gan virus C.
2. Biến phụ thuộc là biến phân loại (nhị phân) :
Nếu biến kết cục (biến phụ thuộc) là biến nhị phân (chỉ có 2 trạng thái
như sống-chết, có nhiễm trùng-không nhiẽm trùng...), sử dụng phép hồi qui
logistic để hiệu chỉnh.
Ví dụ 2: Một nghiên cứu về liên hệ giữa hạ đường máu và tử vong sơ sinh.

Các dữ liệu thu thập được như sau:

Id
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26

27
28
29
30

gender weight
1
2400
1
2400
0
2400
0
2900
1
3000
0
2800
1
3000
1
1100
1
2500
1
2400
1
2800
1
2700

1
3200
1
3000
0
2900
0
1100
1
1600
1
1500
0
1700
0
2600
0
3000
0
1600
1
2900
1
1200
1
1500
1
900
0
1600

0
1100
0
1400
0
1200

hypoglycemia
1
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
1

0
0
1
1
0
0
0
1

Death
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
1
0
0
0
0

0
1
0
0
1
1
1
1
0
1

Ghi chú: Weight : cân nặng (gam) ; hypoglycemia (1= có hạ đường; 0= không
hạ đường);
death (1: chết, 0=sống)
Trước hết thử dùng phép kiểm 2 cho 2 biến phân loại (death và
hypoglycemia)
Vào menu: Analyze> Descriptive Statistics> Crosstabs

n

Vào màn hình Crosstabs, nhắp death vào ô Row(s) và hypoglycemia vào ô
Column(s).
Nhắp vào nút statistics, nhắp vào ô Chi-square (kiểm định chi bình phương) và
ô
Risk (tính odds ratio)

Nhắp vào nút cells, chọn Observed trong ô Counts và Column trong ô
Percentages

Nhắp Continue và cuối cùng nhắp OK.

Risk Estimate

95% Confidence
Interval
Value

Lower

Upper

Odds Ratio for
35.000 2.977
411.466
death (0 / 1)
For
cohort
1.036
6.256
hypoglycemia 2.545
=0
For
cohort
hypoglycemia .073
.010
.531
=1

N of Valid
30
Cases
Kết quả: Nhóm hạ đường máu, tỉ lệ tử vong là 5/6 (83,3%)
Nhóm không hạ đường, tỉ lệ tử vong là 3/24 (12,5%)
Tỉ lệ tử vong khác nhau giữa 2 nhóm có ý nghĩa thống kê với
p=0,002 (Fisher’s Exact Test) và Odds Ratio= 35,0 (KTC 95% :2,9411,4)
Như vậy nếu chưa hiệu chỉnh theo cân nặng (trẻ sơ sinh nhẹ cân) thì hạ
đường máu có ý nghĩa tiên lượng tử vong trẻ sơ sinh. :
Muốn hiệu chỉnh biến gây nhiễu này (trẻ nhẹ cân), sử dụng mô hình hồi qui
logistic
như sau :
Vào menu: Analyze> Regression > Binary Logistic...

Vào màn hình Logistic Regression, nhắp death chuyển vào ô dependent
Nhắp lần lượt hypoglycemia và biến weight (cân nặng trẻ sơ sinh) chuyển vào
ô Covariate(s)

Nhắp nút Options, Nhắp vào ô CI for exp (B) 95% (tính odds ratio và khoảng
tin cậy 95%)

Nhắp Continue sau đó nhắp OK, xem kết quả ở bảng cuối cùng (ý nghĩa của 2 Log likelihood và test Hosmer- Lemeshow sẽ đề cập ở các bài khác)

Như vậy odds ratio của chết/sống ở trẻ sơ sinh có hạ đường máu là 115,70
(KTC 95% : 0,22- 58438,47) và p=0,135.
Kết luận: Sau khi đã hiệu chỉnh theo cân nặng, yếu tố hạ đường máu
không có ý nghĩa tiên lượng tử vong ở trẻ sơ sinh.
TS Nguyễn Ngọc Rạng, bsrang.blogspot.com

Tài liệu tham khảo:
1. Müllner M, Matthews H, Altman DG. Reporting on statistical methods to
adjust for confounding: a cross-sectional survey. Ann Intern Med.
2002,136:122-6.
2.
Wuensch
K.L.
Multivariate
Analysis
with
SPSS,
website:
/>

CÁCH HIỆU CHỈNH CÁC YẾU TỐ GÂY NHIỄU TRONG NGHIÊN CỨU

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về