KIỂM ĐỊNH GIẢ THUYẾT CHO GIÁ
TRỊ TỶ LỆ
Mục tiêu
• Phân tích các số liệu phân loại sử dụng
các kiểm định:
– Z test cho 1 giá trị tỷ lệ
– Khi bình phương cho 2 và nhiều giá trị tỷ lệ
– Phân tích cho mẫu độc lập và ghép cặp.
Kiểm định giả thuyết
MỘT GIÁ TRỊ TỶ LỆ
Một tỷ lệ (one proportion)
• Mẫu n được rút ra từ quần thể có phân bố
chuẩn.
• Số lượng đối tượng có sự kiện A (mắc
bệnh, chết, …) là k
• Tỷ lệ p=k/n có phân bố nhị thức (biominal
distribution)
• Có thể sử dụng kiểm định chuẩn z-test để
tiến hành các phân thống kê.
Một tỷ lệ - so với 1 giá trị cho trước
• Giả thuyết:
– H0: Tỷ lệ chấn thương đầu tương đương với 15%.
• Mô tả biến
– một biến phụ thuộc là chấn thương ở đầu, nhị phân
• Mối liên quan
– So sánh 1 tỷ lệ với 1 giá trị cho trước
• Chọn kiểm định
– Chọn kiểm định Biominal test
• Báo cáo phương pháp
– chúng ta sử dụng kiểm định biominal để kiểm tra giả thuyết là chấn thương
đầu của quần thể nghiên cứu này tương đương khoảng 15%
Analyze/Nonparametric Tests/Binomimal…
Analyse \Nonparametric \Biominal test
• Tỷ lệ chấn thương đầu/cột sống là 36%
• Có sự khác biệt giữa tỷ lệ chấn thương đầu với
15% (p<0,001)
Kiểm định giả thuyết
HAI TỶ LỆ
Hai tỷ lệ (two - proportions)
Nhóm 1
Nhóm 2
Tổng
Sự kiện A
k1
k2
k1+k2
Không có sự kiện
A
n1-k1
n2-k2
(n1+n2)-(k1-k2)
Tổng
n1
n2
n1+n2
p1=k1/n1; p2=k2/n2, có thể sử dụng kiểm định z chuẩn để so sánh
Hoặc sử dụng các kiểm định cho các bảng tiếp liên (contingency table)
Kiểm định c2 xác định mối liên quan
1. Kiểm định mối liên quan giữa 2 biến định
tính
–
KHÔNG chứng minh nguyên nhân
2. Giả định
–
Giá trị kỳ vọng của các ô đều ³ 5
3. Sử dụng bảng tiếp liên
Kiểm định c2 cho bảng tiếp liên
1. Bảng tiếp liên (2x2) thể hiện giá trị của 2
biến
Biến 2
Lọai nhà
Nhà tạm
Nhà kiên cố
Tổng
Vị trí
Thành thị
Nông
thôn
63
49
15
33
78
82
Biến 1
Tổng
112
48
160
Kiểm định c2 cho bảng tiếp liên
• Kiểm định thống kê
Giá trị quan sát
c =å
2
[O - E ]
n
E=
2
E
Giá trị kỳ vọng
(Tong hàng) × (Tong côt )
Tong chung
Số cột
Bậc tự do: (r - 1)(c - 1)
Số dòng
Phân bố Khi bình phương (Chi-Square distribution)
Bác bỏ H0
Hai tỷ lệ - hai mẫu độc lập
• Giả thuyết:
– H0: Tỷ lệ chấn thương đầu và cột sống của nhóm đi xe tương đương với
nhóm đi bộ.
• Mô tả biến
– một biến phụ thuộc là chấn thương ở đầu/ cột sống, nhị phân
– một biến độc lập là đi bộ, nhị phân
• Mối liên quan
– So sánh hai tỷ lệ
• Chọn kiểm định
– Kiểm tra giả định
– Chọn kiểm định Khi bình phương
• Báo cáo phương pháp
– chúng ta sử dụng kiểm định khi bình phương (một phía) để kiểm tra giả
thuyết là chấn thương đầu hoặc cột sống sẽ xảy ra nhiều ở những người đi
bộ hơn là những người sử dụng phương tiện giao thông
Analyze/Descriptive Statistics/ Crosstabs
Analyse \Descriptive statistics\Crosstabs
Kết luận
• Có sự khác biệt giữa tỷ lệ chấn thương đầu/cột sống ở những
người đi bộ so với những người dùng phương tiện giao thông.
• Có 44% những người bị chấn thương đầu/cột sống ở những
người đi bộ nhưng chỉ có 37% những người bị chấn thương
loại này khi dùng phương tiện giao thông. Tỷ suất chênh chỉ ra
sự khác nhau của hai tỷ lệ này là 1,37 (khoảng tin cậy 95%
0,99 – 1,89).
• Không đủ bằng chứng để kết luận rằng sự khác nhau giữa hai
nhóm là có ý nghĩa thống kê (c2 = 3,3, p = 0,070).
Kiểm định giả thuyết
NHIỀU HƠN 2 TỶ LỆ
Nhiều hơn hai tỷ lệ
• Giả thuyết:
– H0: Tỷ lệ những người nhận được điểm chất lượng cuộc sống thấp là giống
nhau không kể đến mức độ chấn thương,
• Mô tả biến
– Biến phụ thuộc là điểm chất lượng thấp, nhị phân
– Biến độc lập: vị trí chấn thương; phân loại ; 3 nhóm
• Mối liên quan
– So sánh tỷ lệ
• Chọn kiểm định
– Kiểm tra giả định
– Chọn kiểm định Khi bình phương
• Báo cáo phương pháp
– Chúng ta sử dụng kiểm định khi bình phương (hai phía) để so sánh tỷ lệ các
nạn nhân chấn thương có điểm chất lượng cuộc sống thấp qua các mức độ
chấn thương. Các mức độ chấn thương được đo bằng vị trí chấn thương
Analyse \Descriptive statistics\Crosstabs
Most severe injury * QOL score after injury - categorised Crosstabulation
Most severe
injury
head-spine
torso
limbs
Total
Count
% within Most
severe injury
Count
% within Most
severe injury
Count
% within Most
severe injury
Count
% within Most
severe injury
QOL score after injury categorised
Suboptimal
Adequate
QOL
QOL
216
404
Total
620
34.8%
65.2%
100.0%
131
241
372
35.2%
64.8%
100.0%
204
443
647
31.5%
68.5%
100.0%
551
1088
1639
33.6%
66.4%
100.0%
Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear
Association
N of Valid Cases
Chi-Square Tests
Value
2.103a
2.111
1.571
2
2
Asymp. Sig.
(2-sided)
.349
.348
1
.210
df
1639
a. 0 cells (.0%) have expected count less than 5. The
minimum expected count is 125.06.
Kết luận
• Có tất cả 33,6% những nguời có điểm chất lượng cuộc
sống thấp.
• Chúng ta không có đủ bằng chứng để chỉ ra rằng tỷ lệ
này khác nhau theo vị trí chấn thương (c2 = 2,1, p =
0,349).
Kiểm định giả thuyết
ĐO LƯỜNG LẶP LẠI
Hai tỷ lệ - đo lường lặp lại
• Giả thuyết:
– H0: trung bình điểm chất lượng cuộc sống phân nhóm sau và trước khi chấn
thương là như nhau
• Mô tả biến
– Phụ thuộc: QOL, định danh
– Lặp lại theo thời gian
• Mối liên quan
– So sánh hai tỷ lệ
• Chọn kiểm định
– Kiểm tra giả định
– Chọn kiểm định Khi bình phương McNemar
• Báo cáo phương pháp
– Để kiểm tra sự khác nhau về tỷ lệ người có điểm chất lượng cuộc sống thấp
(điểm<50) của trước và sau khi chấn thương chúng ta sử dụng kiểm định khi
bình phương McNemar.
Analyze/Descriptive Statistics/ Crosstabs