Tải bản đầy đủ (.pdf) (23 trang)

Phân tích số liệu trong y tế. ThS. Đỗ Thanh Toàn

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.57 MB, 23 trang )

THỐNG KÊ CƠ BẢN
VÀ PHÂN TÍCH SỐ
LIỆU Y TẾ
ThS. Đỗ Thanh Toàn
()
BM Thống kê, Tin học Y học

Mục tiêu học tập
Sau bài häc, học viªn cã kh¶ n¨ng:
1.  Trình bày được một số khái niệm cơ bản về

thống kê và phân tích số liệu
2.  Trình bày và áp dụng được nguyên tắc lựa
chọn trắc nghiệm thống kê cho các mục tiêu
phân tích và biến số
3.  Trình bày và áp dụng được nguyên tắc phiên
giải được kết quả phân tích số liệu
4.  Lập được các bảng, biểu đồ cho dự kiến phân
tích số liệu cho đề cương NC nhóm

1


thống kê là gì?
Là môn khoa học liên quan đến:
J thu thập
J tổ chức
J tóm tắt và
J phân tích số liệu
nhằm đưa ra các suy luận về toàn bộ hay một
phần quần thể nghiên cứu.



Thng kờ y sinh hc
" Thng kờ y sinh hc l 1 cm t bao gm y

sinh v thng kờ. Y sinh cú ngha l cuc
sng, cũn thng kờ liờn quan n thu thp, t
chc, phõn tớch v phiờn gii cỏc SL.
" Thng kờ y sinh hc liờn quan n ng dng
cỏc phng phỏp TK vo KH cuc sng nh
sinh hc, y hc v y t cụng cng.
" Thng kờ cú ý ngha khỏc nhau trong cỏc
ng cnh khỏc nhau. VD: TK YTCC, TK bnh
vin, TK dõn s, TK cỏc dch v, vvv.

2


SỐ LIỆU
" Là kết quả “quan sát” được trên từng cá thể

(hay từng đối tượng nghiên cứu)
Ví dụ: Quan sát hộ gia đình:
Số người trong hộ: 8 (4 nam, 4 nữ)
Số trẻ dưới 5 tuổi: 2
Nguồn nước:
nước giếng khoan
Loại nhà ở: kiên cố
Thu nhập bình quân: 1 triệu/tháng

SỐ LIỆU

" Loại số liệu - Nguồn số liệu

–  Số liệu ban đầu: Do tự thu thập
" Qua điều tra
" Nghiên cứu thử nghiệm

–  Số liệu có sẵn: Do người khác thu thập
" Từ kết quả của các nghiên cứu khác
" Từ báo cáo, sổ sách, hồ sơ, bệnh án,…

3


BIN S
" L cỏc c im cú th quan sỏt c
" Bin nh tớnh:

Vớ d: dõn tc, gii tớnh, ngh nghip,...
" Bin nh lng (bin dng s):
Bin liờn tc: chiu cao theo cm, cõn nng
theo kg
Bin ri rc: s bnh nhõn n khỏm trong
mt ngy, s ging bnh, s trng giun
trong tiờu bn,...

Tôi cân
nặng bao
nhiêu?!

Nhiệt độ bình

nước như thế
nào?

!
Tôi ăn mấy
bữa một ngày

Tôi có đẹp
trai không?!

Lượng thức
ăn mình nhận
TB 1 ngày là
bao nhiêu?!

4


QUN TH V MU NGHIấN CU
" Qun th: Tp hp ton b cỏc cỏ th mà

chúng ta quan tâm ở một khía cạnh nào
đó trong một khoảng thời gian nhất định
" Mu: Phn c chn ra o lng,

quan sỏt c gi l mu
Quần thể với cỡ N!

P!
à!

!

Chọn mẫu!

p
s

X

Mẫu với cỡ n

Cú hai lnh vc chớnh ca thng kờ
" Thng kờ mụ t

Cỏc con s, vn c mụ t da trờn cỏc
giỏ tr thng kờ nh: trung bỡnh, trung v,
mode, tng s, khong, lch chun, t l, ...
Trỡnh by cỏc kt qu da trờn cỏc bng biu
v th.
" Thng kờ suy lun
Da trờn cỏc con s t mt mu cung cp
cỏc giỏ tr khỏi quỏt, suy lun v qun th.

5


Quần thể đích!
Lựa chọn!
Mẫu xác suất!
- Ngẫu nhiên đơn !

- Ngẫu nhiên hệ thống!
- Mẫu phân tầng !
- Mẫu chùm !
- Mẫu nhiều bậc!
Mẫu không xác suất!
- Mẫu kinh nghiệm !
- Mẫu thuận tiện !
- Mẫu chỉ tiêu!
- Mẫu có mục đích.!

- Khung chọn mẫu!
- Đơn vị quan sát!
- Đơn vị mẫu!
- Các chỉ số!

Kết luận ngoại suy!

Quần thể
nghiên cứu!

Tham số quần thể!
(à, , P...)!

Ước lượng!
điểm!
khoảng!

Suy luận
thông kê
(Chỉ áp

dụng cho
mẫu xác
suất với
cỡ mẫu
đủ lớn)!

Chọn
mẫu!

Mẫu!

Kiểm định
giả thuyết!

Giá trị p
Tham số mẫu!
( X , s, p...)!

Biến số!

Các test
thống kê

Mô tả các tham số mẫu!
(trình bày kết quả nghiên cưú)!

Thng kờ

Mụ t
bin

nh
lng

Mụ t
bin nh
tớnh

Suy lun
bin nh
lng

Suy lun
bin
nh tớnh

6


Thống kê mô tả biến định lượng
" Đo lường độ tập trung
–  Trung bình (mean)
–  Trung vị (median)
–  Mode
" Đo lường độ phân tán
–  Khoảng số liệu (range)
–  Khoảng tứ phân vị (25%-75%) (Interquartile )
–  Độ lệch chuẩn (Standard deviation)
–  Phương sai (Variance)

1. Tổng hợp và mô tả số liệu định lượng


DTT - Tong hop so lieu

14

7


Đo lường độ phân tán

DTT - Tong hop so lieu

15

Thống kê mô tả biến định tính
" Tần số: Số lần xuất hiện của một quan sát
" Tỷ số: Là phân số mà mẫu số không bao

hàm tử số
" Tỷ lệ phần trăm: Là phân số mà mẫu số
bao hàm tử số
" Tỷ suất: dạng đặc biệt của tỷ lệ khi được
đo lường trong một khoảng thời gian nhất
định

8


N


Range Minimum Maximum Mean

HATĐ 373 125.0
TB

86.0

211.0

Statistics
huyet ap toi da tb
N
Valid
373
Missing 0
Percentiles
10
20
25
30
40
50
60
70
75
80
90

122.4


Std.
Deviation

Variance

19.3

371.9

101.0000
110.4000
111.0000
111.0000
114.0000
121.0000
121.0000
128.4000
131.0000
133.1000
147.3000

Thực hành
" Mở file số liệu trên SPSS
⇒ Màn hình data view: màn hình số liệu
⇒ Màn hình variable view: xem tên biến số và
giải thích của biến số
" Thực hiện thống kê mô tả: biến định lượng
⇒  Analyze -> Descriptive Statistic -> Descriptive
⇒  Kiểm tra phân bố số liệu


" Thực hiện thống kê mô tả: biến định tính
⇒ Analyze -> Descriptive Statistic -> Crosstab

9


Thng kờ suy lun
" L quỏ trỡnh ngoi suy kt qu nghiờn cu

t mu ra qun th nghiờn cu:
c lng khong
Kim nh gi thuyt

Cỏc tham s mu v tham s qun th
Cỏc tiờu thc

Tham s
qun th

Tham s
mu
X

Trung binh số học (mean)

à

Phương sai (variance)

2


s2

ộ lệch chuẩn (standard
deviation



s

Tỷ lệ (proportion)

P

Sự khác nhau gia 2 giá trị
trung bỡnh

à1 à2

- Sự khác nhau gia 2 tỷ lệ

P1 P2

p
X1 X 2

p1 p 2

10



Ước lượng khoảng-khoảng tin cậy
(confidence interval)
" Thường chọn khoảng tin cậy 95%

(95%CI)
" Khi thực hiện đo đạc 100 lần thì it nhất 95
lần kết quả nằm trong khoảng tin cậy
" 95% tin tưởng rằng giá trị thực của quần
thể nằm trong khoảng tin cậy
95%CI= Trung bình ± 1,96*sai số chuẩn

Ước lượng khoảng-khoảng tin cậy
(confidence interval)
Confidence interval
90
95
99
99.9

Multiplying factor
1.64
1.96
2.58
3.29

11


Sai số chuẩn (standard errors)

95%CI= Trung bình ± 1,96*sai số chuẩn

Thực hành (SPSS)
" Thực hiện ước lượng khoảng cho giá trị

trung bình
⇒ Analyze -> Descriptive Statistic -> Explore

12


Kiểm định giả thuyết
⇒ Sử dụng trắc nghiệm (test) thống kê để đưa ra

kết luận về giả thuyết của nhà nghiên cứu là
chấp nhận được hay không
Quần thể

Chọn mẫu

Ngoại suy

Trắc nghiệm thống kê

Mẫu NC

Giả thuyết nghiên cứu
" Giả thuyết Ho: Không có sự khác biệt

(Điều trị không hiệu quả)

" Giả thuyết Ha: Có sự khác biệt (Điều trị có
hiệu quả)

13


Các loại sai lầm trong kiểm định
Loại quyết
định

Thực tế
Ho đúng

Ho sai

Chấp nhận
Ho

x

Sai lầm loại
II (β)

Bác bỏ Ho

Sai lầm loại I
(α)

x


Mức ý nghĩa thống kê
" Loại bỏ sai lầm loại I
–  α= 0.05
–  p = probability= Xác suất để giả thuyết Ho đúng
p<0.05
= Xác suất để giả thuyết Ho đúng là < 5%
= Ho xảy ra chỉ là may rủi
= Bác bỏ Ho
= Xác suất để giả thuyết Ha đúng là > 95%
= Ha xảy ra là chắc chắn
= Chấp nhận Ha
p>0.05 = ???

14


Mức ý nghĩa thống kê
α
.01 (99)
.02(98)
.05 (95)
.10 (90)

Z(1-α/2)
2.576
2.326
1.960
1.645

Độ mạnh

" Loại bỏ sai lầm loại II
–  1- β = 80%
–  Thường dùng trong tính toán cỡ mẫu
1-β

Z(1-β)

.80
.85
.90
.95

0.842
1.036
1.282
1.645

15


Lựa chọn trắc nghiệm thống kê
" Mục tiêu của nghiên cứu?
⇒ So sánh:
–  Các giá trị trung bình
–  Các tỷ lệ
⇒ Tìm mối liên quan giữa các biến NC:
–  Giữa hai biến:
" ...

–  Giữa nhiều biến

" ...

Xác định sự khác biệt
hai biến định lượng
" 1 nhóm
Phân bố
chuẩn

t test

Phân bố
K chuẩn

Sign test/
Wilcoxon
test

" 2 nhóm
Phân bố
chuẩn

t test
(Ph sai
đ.nh
ất)

Phân bố
K chuẩn
MannWhitney
test


" >2 nhóm
Phân bố
chuẩn

Phân bố
K chuẩn

ANOVA
(ph.s
ai
đ.nhấ
t)

KruskalWallis
test

16


T test (Student t test)
" Sử dụng cho số liệu định lượng, có phân bố chuẩn
" So sánh sự khác biệt về giá trị trung bình của một hoặc hai

nhóm độc lập
" Lệnh trên SPSS:
•  So sánh một nhóm độc lập:
Analyze -> Compare Means -> One-Sample T test
•  So sánh hai nhóm độc lập
Analyze -> Compare Means -> Independent-Samples T

test

Mann-Whitney test
" Sử dụng cho so sánh 2 giá trị trung bình

của các nhóm độc lập, số liệu là phân bố
không chuẩn hoặc chuẩn
" Analyze -> Nonparametric Tests -> 2 Independent

Samples

17


ANOVA test
" So sánh ≥ 3 giá trị trung bình của các nhóm

độc lập
" Điều kiện:

-  Biến số kiểm định có phân bố chuẩn
-  Phương sai đồng nhất giữa các nhóm
Analyze -> Compare Means -> One-Way ANOVA
(Đánh dấu hộp Option: Homogeneity of variance
test để kiểm định tính đồng nhất của phương sai)

Kruskal Wallis Test
" So sánh ≥ 3 giá trị trung bình của các

nhóm độc lập khi biến số kiểm định có

phân bố không chuẩn hoặc chuẩn
Analyze -> Nonparametric Tests -> K Independent
Samples

18


Xác định
sự khác
biệt biến
định tính

Z test

1 nhóm
> 1 nhóm

Giá trị mong đợi ≥ 5

Giá trị mong đợi < 5

Khi bình phương

Fisher’s exact test

Z test
" So sánh một tỷ lệ mẫu với một tỷ lệ lý

thuyết
Analyze -> Nonparametric Tests -> Binomial Test


19


Test Khi bình phương
" So sánh hai hay nhiều tỷ lệ
" Điều kiện: Dưới 20% số ô trong bảng có

tần số mong đợi (E) < 5 và không có ô
nào có tần số mong đợi <1
Analyze -> Descriptive Statistic -> Crosstab
Hoặc
Analyze -> Nonparametric Tests -> Chi-square Test

Xác định mối liên quan
" Biến định lượng:
v Hệ số tương quan (r)
ü pearson
ü spearman

v Hồi quy tuyến tính

" 4. Biến định tính
v Tỷ suất chênh (OR), nguy cơ tương đối (RR)
v Hồi quy logistic

20


Tương quan của hai biến định lượng

" Hệ số tương quan r
•  Có giá trị từ -1 đến +1
"
"
"

Khi HSTQ > 0 => tương quan đồng biến
Khi HSTQ < 0 => tương quan nghịch biến
Càng gần 1 => tương quan càng chặt

•  Quy ước:
"
"
"
"

<0,3: tương quan yếu
>=0,3-0,5: tương quan TB
>=0,5-0,7: tương quan chặt chẽ
>=0,7: tương quan rất chặt chẽ

Tương quan của hai biến định lượng
Analyze -> Correlate -> Bivariate
•  Chọn Pearson khi các biến tương quan là
phân bố chuẩn
•  Chọn Spearman khi các biến tương quan
không tuân theo phân bố chuẩn

21



Tương quan của 2 biến định tính
" Khi muốn tìm cường độ mối liên quan giữa hai

biến định tính=> có thể sử dụng:
–  Nguy cơ tương đối: RR, hoặc
–  Tỷ suất chênh: OR
Bệnh

Không
bệnh

Tổng

Phơi nhiễm

a

b

a+b

Không phơi nhiễm

c

d

c+d


Tổng

a+c

b+d

a+b+c+d

Công thức tính OR - RR
" RR = Risk ratio = risk1/risk2

" OR = Odds ratio = odds1/ odds2
" RR/OR có thể:

–  >1
–  =1
–  <1

ð Yếu tố nguy cơ
ð Không liên quan
ð Yếu tố bảo vệ

Analyze -> Descriptive Statistic -> Crosstab
=> Chọn Risk trong hộp Statistics

22


Z test cho 1 tỷ lệ
Biến định

tính

Z test cho 2 tỷ lệ
Test χ2 cho ≥ 2 tỷ lệ

Quan sát
độc lập
Biến định
lượng

Tìm sự
khác biệt

T test cho 2 giá trị
trung bình
Quan sát
ghép cặp

Giả thuyết
nghiên cứu

Biến định tính - Test χ2 Mc Nemar
Biến định lượng - Test t ghép cặp

Biến định tính
Tìm mối
tương quan

T test cho 1 giá trị
trung bình


Test χ2 tìm

mối liên quan
Biến định
lượng

Hệ số tương quan
Hồi qui tuyến tính

Một số ví dụ (matching)
1. Tìm mối liên quan giữa hai biến
định lượng
2. So sánh huyết áp (mmHg) trước
và sau điều trị của một nhóm bệnh
nhân
3. Tỷ lệ khỏi bệnh sau điều trị thuốc
A có tăng không?
4. Nồng độ Hb trong máu trung bình
của những người mắc bệnh xơ gan
so với người bình thường.
5. Liên quan giữa giới và tình trạng
bệnh tiểu đường (có bệnh/không
bệnh) trong nghiên cứu bệnh chứng

A. Phân tích tầng
B. Test t student
C. Test t ghép cặp
D. Hệ số tương quan
E. Nguy cơ tương đối

F. Tỷ suất chênh
G. Test Chi bình
phương

23



×