Câu 8:
Bài toán so sánh các tỉ lệ (hay là bài tốn kiểm định tính độc lập)
i. Xét một mẫu kích thước n của BNN định tính 2 chiều (X,Y).
X nhận các giá trị A1; A2;….; Ak. Y nhận các giá trị B1; B2; …; Bh.
Y B1
B2
…
Bh
X
A1
n11
n12
…
n1h
A2
n21
n22
…
n2h
…
…
…
…
…
Ak
nk1
nk2
…
nkh
Tổng cột
m1
m2
…
mh
Kiểm định xem X, Y độc lập hay không với mức ý nghĩa α.
ii. Các bước thực hiện: (Cơ sở lí thuyết)
1) Theo lí thuyết:
Bước 1:
Giả thiết kiểm định H0: X, Y độc lập
Giả thiết đối H1: X, Y không độc lập
Bước 2:
Miền bác bỏ Wα= ( χ 2α (số hàng -1)*(số cột -1) ; +∞)
Bước 3:
Do giả thiết X, Y độc lập nên xác suất tính theo lý thuyết là:
Suy ra tần số lý thuyết là:
Tổng hàng
n1
n2
…
nk
Tính tiêu chuẩn kiểm định:
hoặc:
Bước 4: Kết luận
2) Giải trên excel
Công cụ giải : Hàm Chitest
Bước 1: Nhập số liệu
Bước 2: Tính tổng hàng và tổng cột bằng “AutoSum”
Bước 3: Lập bảng tần số lí thuyết Eij
Bước 4: Tính P-value bằng hàm Chi test
Bước 5: Kết luận
iii. Ứng dụng
Xét tính độc lập giữa “Độ tuổi” X và “Các triệu chứng đau ngực” Y với mức ý
nghĩa 0,05. Từ dữ kiện
Ta được bảng số liệu
X
Y
0
1
2
3
Under 50
50-65
14
20
23
3
19
12
32
9
Above 65
3
3
9
3
(Chú thích: 0: khơng triệu chứng, 1: đau thắt ngực điển hình, 2: đau thắt ngực
khơng điển hình, 3:non-anginal pain)
(Muốn thống kê có bao nhiêu người dưới 50 tuổi mắc chứng đau lưng loại 1
trong Excel ta thực hiện hàm COUNTIFS vs 2 điều kiện
Tương tự vs những phần còn lại)
*Đặt giả thiết
Giả thiết khẳng định H0: X, Y độc lập
Giả thiết đối H1: X, Y khơng độc lập
*Lập bảng tần số lí thuyết Eij
*Tính P-value bằng hàm “Chitest”
Nhận thấy
Bác bỏ H0, chấp nhận H1.
Vậy có thể nói “Các triệu chứng đau ngực” có phụ thuộc vào “Độ tuổi”.