CHƯƠNG 10
KIỂM ĐỊNH PHI THAM SỐ
Ths. Nguyễn Tiến Dũng
Viện Kinh tế và Quản lý, Trường ĐH Bách khoa Hà Nội
Email:
CÁC NỘI DUNG CHÍNH
10.1 KĐ dấu và hạng Wilcoxon về trung vị của một
tổng thể
10.2 KĐ dấu và hạng Wilcoxon trên 2 tổng thể,
trường hợp lấy mẫu cặp
10.3 KĐ tổng hạng Wilcoxon trên 2 tổng thể, trường
hợp lấy mẫu độc lập
10.4 KĐ Kruskal - Wallis
10.5 KĐ Chi bình phương về mối liên hệ giữa hai
biến định tính
10.6 KĐ Chi bình phương trên một mẫu
© Nguyễn Tiến Dũng
Thống kê ứng dụng
2
10.1 KĐ dấu và hạng Wilcoxon về trung vị của tổng thể
Gọi trung vị tổng thể là M, giá trị cần so sánh
là M0.
● B1: Lập giả thuyết
● B2: Lựa chọn mức ý nghĩa α
● B3: Tính các chênh lệch di: 𝑑𝑖 = 𝑥𝑖 − 𝑀0
● B4: Loại bỏ các di = 0, tính giá trị tuyệt đối
của các chênh lệch |di| và xếp hạng các |di|
H0 : M M 0
H1 : M M 0
● |di| nhỏ nhất có hạng là 1.
● Nếu có hạng ngang nhau thì tính hạng TB.
● Cỡ mẫu rút gọn n’ = n – số trường hợp có di
bằng 0
● B5: Tách các hạng vừa xếp thành 2 cột.
● Nếu di > 0 thì đặt vào cột R+.
● Nếu di < 0 thì đặt vào cột R© Nguyễn Tiến Dũng
Thống kê ứng dụng
3
Quan điểm 1: SGK
● B6: Tính chỉ tiêu KĐ
● Nếu n’ ≤ 20, chỉ tiêu KĐ là W
● KĐ 2 bên: W = min(ΣR+; ΣR-)
● KĐ bên phải: W = ΣR+
● KĐ bên trái: W =ΣR-
● Nếu n’ > 20, chỉ tiêu KĐ là z
● B7: Bác bỏ H0
● Nếu n’ ≤ 20: W < WL
● Nếu n’ > 20:
z
W W
W
n '.( n ' 1)
W
4
n '.( n ' 1).(2 n ' 1)
W2
24
● KĐ 1 bên: z < -zα
● KĐ 2 bên: z < -zα/2
© Nguyễn Tiến Dũng
Thống kê ứng dụng
4
W W
Quan điểm 2 (khuyên dùng)
z
● B6: Tính chỉ tiêu KĐ,
W
● Nếu n’ ≤ 20, chỉ tiêu KĐ là W = ΣR+.
● Nếu n’ > 20, chỉ tiêu KĐ là z.
W2
W
n '.( n ' 1)
4
n '.( n ' 1).(2 n ' 1)
24
● B7: Bác bỏ H0
● Nếu n’ ≤ 20, tra bảng tìm WL (cận dưới) và WU (cận trên)
● Nếu KĐ 2 bên: Bác bỏ H0 nếu W < WL hoặc W > WU
● Nếu KĐ bên trái: Bác bỏ H0 nếu W < WL
● Nếu KĐ bên phải: Bác bỏ H0 nếu W > WU
● Nếu n’ > 20, bác bỏ H0
● KĐ bên trái: z < -zα
● KĐ bên phải: z > zα
● KĐ 2 bên: z < -zα/2 hoặc z > zα/2
© Nguyễn Tiến Dũng
Thống kê ứng dụng
5
Wilcoxon Signed-Rank Test Table
© Nguyễn Tiến Dũng
Thống kê ứng dụng
6
10.2 KĐ tổng hạng Wilcoxon về TB của 2 mẫu độc lập
● B1: Chọn mẫu làm Mẫu 1 (n1
2 mẫu có cỡ mẫu bằng nhau, thì coi mẫu nào là Mẫu 1 cũng
được. Gọi M1, M2 là trung vị của tổng thể thứ nhất và thứ hai
H0 : M1 M 2
H1 : M 1 M 2
H0 : M1 M 2
H1 : M 1 M 2
H0 : M1 M 2
H1 : M 1 M 2
● B2: Gộp chung 2 mẫu thành 1 danh sách chung và sắp xếp từ
nhỏ tới lớn. Xác định hạng của các quan sát theo nguyên tắc là
QS có giá trị nhỏ nhất sẽ có hạng là 1, giá trị càng lớn thì hạng
càng lớn. Nếu có 2 quan sát có giá trị bằng nhau, thì lấy hạng
TB.
© Nguyễn Tiến Dũng
Thống kê ứng dụng
7
● B3: Xác định chỉ tiêu KĐ
● Nếu cỡ mẫu nhỏ (n1 ≤ 10 và n2 ≤ 10) thì chỉ tiêu
KĐ là T1.
● T1 là tổng hạng của Mẫu 1.
T 1
n1 ( n 1)
2
T1
● n = n1+ n2.
● Nếu cỡ mẫu lớn (n1 > 10 hoặc n2 > 10) thì chỉ
tiêu KĐ là z
z
● B4: Bác bỏ H0
n1n2 ( n 1)
12
T1 T1
T
1
● Nếu cỡ mẫu nhỏ:
● KĐ 2 bên: T1 > WU hoặc T1 < WL
● KĐ bên trái: T1 < WL
● KĐ bên phải: T1 > WU
● Nếu cỡ mẫu lớn: KĐ bên trái: z < -zα; KĐ bên
phải: z > zα; KĐ hai bên: z < -zα/2 hoặc z > zα/2
© Nguyễn Tiến Dũng
Thống kê ứng dụng
8
10.3 KĐ dấu và hạng Wilcoxon với 2 mẫu cặp
● B1: Xác định các chênh lệch di = x1i – x2i và
lập cặp giả thuyết KĐ
H0 : M1 M 2
H1 : M 1 M 2
H0 : M1 M 2
H1 : M 1 M 2
H0 : M1 M 2
H1 : M 1 M 2
H0 : M D 0
H1 : M D 0
H0 : M D 0
H1 : M D 0
H0 : M D 0
H1 : M D 0
© Nguyễn Tiến Dũng
Thống kê ứng dụng
9
● B2: Xác định các giá trị tuyệt đối |di|
● B3: Loại bỏ các |di| bằng 0, sắp hạng các |di| từ nhỏ
tới lớn. Giá trị |di| nhỏ nhất có hạng là 1. Nếu có nhiều
|di| bằng nhau, thì tính hạng trung bình.
● n’ = n – số trường hợp có di = 0
● B4: Tách riêng các hạng của |di| thành 2 loại, hạng R+
và hạng R- theo dấu của di gốc. Nếu di> 0, xếp vào cột
R+. Nếu di < 0, xếp vào cột R-.
● B5: Tính giá trị KĐ W = Ri+
● B6: Áp dụng quy tắc bác bỏ H0
● Nếu n’ ≤ 20
● KĐ bên trái: W < WL
● KĐ hai bên: W ≤ WL hoặc W ≥ WU
● KĐ bên phải: W ≥ WU
© Nguyễn Tiến Dũng
Thống kê ứng dụng
10
● Nếu n’ > 20 thì W xấp xỉ PP bình thường. Khi đó
sẽ biến đổi chuẩn hoá W và kiểm định theo chỉ tiêu
z.
● Quy tắc bác bỏ H0 tương tự như bài toán KĐ TB
của một tổng thể, trường hợp biết
W
W
z
© Nguyễn Tiến Dũng
n '( n ' 1)
4
n '( n ' 1)(2 n ' 1)
24
W W
W
Thống kê ứng dụng
11
10.4 KĐ Kruskal – Wallis trên nhiều mẫu độc lập
● Mục đích: so sánh TB
của k mẫu độc lập (k >2)
● Gọi n = n1 + n2 + … + nk
● H0: M1 = M2 = … = Mk
● Chỉ tiêu KĐ W
● Quy tắc bác bỏ H0
© Nguyễn Tiến Dũng
k
12
Ri2
W
3( n 1)
n ( n 1) i 1 ni
Baùc boû H 0 neáu
W> k21;
Thống kê ứng dụng
12
10.5 KĐ Chi bình phương về mối liên hệ giữa 2 biến
định tính
● Biến 1: Biến hàng
● Biến 2: Biến cột
● Lập bảng tần số kết hợp 2 biến
● Tại ô mà có hàng i cột j -> tính tần số thực Oij
● Tính các tổng theo hàng Ri và tổng theo cột Cj
● Tính ra các tần số kỳ vọng Eij = Ri x Cj / n
● Tính (Oij – Eij)2/Eij -> tổng lại là Chi-square
● Bác bỏ H0 theo chỉ tiêu đánh giá Chi-square
© Nguyễn Tiến Dũng
Thống kê ứng dụng
13
Ngắn
TB
Dài
Tổng hàng
H.phúc
O11=38
E11 = 45
O12 = 58
E12 = 60
O13 = 54
E13 = 45
R1 = 150
Không HP
O21 = 12
E21 = 9
O22 = 14
E22 = 12
O23 = 4
E23 = 9
R2 = 30
Ly dị / Ly thân
O31 = 10
E31 = 6
O32 = 8
E32 = 8
O33 = 2
E33 = 6
R3 = 20
C1 = 60
C2 = 80
C3 = 60
n = 200
Eij
Ri C j
n
r
c
2
(Oij Eij ) 2
i 1 j 1
Eij
Baùc boû H 0 neáu 2 df2 ;
df ( r 1).( c 1)
© Nguyễn Tiến Dũng
Thống kê ứng dụng
14
ij
Oij
Eij
Oij-Eij
(Oij-Eij)2
11
38
45
-7
49
1,0889
12
58
60
-2
4
0,0667
13
54
45
9
81
1,8000
21
12
9
3
9
1,0000
22
14
12
2
4
0,3333
23
4
9
-5
25
2,7778
31
10
6
-4
16
2,6667
32
8
8
0
0
33
2
6
-4
16
Tổng
200
Chi-square tính = 12,4
Chi-square tra bảng (df = 2 x 2 = 4; alpha = 0,05) = 9,4877
Bác bỏ Ho
© Nguyễn Tiến Dũng
Thống kê ứng dụng
(Oij-Eij)2/Ei
2,6667
12,4000
15
10.6 KĐ Chi bình phương về sự phù hợp
● Goodness-of-fit Test
● Mục đích: Kiểm tra sự phân phối tần số có
phù hợp với một tần số lý thuyết hay không
● Chỉ tiêu KĐ
● Quy tắc bác bỏ H0
2
Stat
(Oi Ei ) 2
Ei
i 1
k
Baùc boû H 0 neáu
2
Stat
2
df ;
df k 1
© Nguyễn Tiến Dũng
Thống kê ứng dụng
16
(Oi-Ei)2
(Oi-Ei)2/Ei
i
Thứ
Oi
Ei
Oi-Ei
1
Hai
7
5,333
1,667
2,7889
0,5211
2
Ba
3
5,333
-2,333
5,4289
1,0206
3
Tư
3
5,333
-2,333
5,4289
1,0206
4
Năm
2
5,333
-3,333
11,0889
2,0830
5
Sáu
5
5,333
-0,333
0,1089
0,0208
6
Bảy
12
5,333
6,667
44,4889
8,3347
Tổng
© Nguyễn Tiến Dũng
32
13,0008
Thống kê ứng dụng
17