Chương 8:
KIỂM ĐỊNH PHI THAM SỐ
www.nguyenngoclam.com
I.KIỂM ĐỊNH PHÂN PHỐI CHUẨN
1.1.Dựa vào đồ thị tần suất: Đối chiếu đồ thị tần suất có
giống đồ thị hàm phân phối chuẩn.
1.2. Kiểm định Jarque-Bera:
H0: X có phân phối chuẩn
H1: X không có phân phối chuẩn
( x i x )3 / n
S
3
s
x
( x i x )4 / n
K
4
s
x
S2 (K 3)2
JB n
6
24
Bác bỏ H0: JB > 22,
152
I.KIỂM ĐỊNH PHÂN PHỐI CHUẨN
Ví dụ: Kiểm định tỷ lệ lãi trên vốn (%) trước và sau CPH có
phân phối chuẩn với mức ý nghĩa 5%:
DN
1
2
3
4
5
6
7
Trước CPH
3,5
5,1
4,0
4,2
5,0
6,0
5,8
Sau CPH
4,0
4,8
6
6,8
5,2
6,4
6,0
8
6,0
5,0
DN
9
10
11
12
13
14
15
153
Trước CPH
4,5
5,0
6,0
4,0
5,0
6,0
5,4
Sau CPH
5,0
5,4
6,5
5,0
5,6
6,2
6,5
I.KIỂM ĐỊNH PHÂN PHỐI CHUẨN
1.3. Kolmogorov-Smirnov
154
I.KIỂM ĐỊNH PHÂN PHỐI CHUẨN
155
II.KIỂM ĐỊNH WILLCOXON (T)
2.1.Giả thuyết: H0: x = y Mẫu phối hợp từng cặp
2.2.Mẫu nhỏ (n≤20):
1. Tính các chênh lệch giữa các cặp: di = xi - yi
2. Xếp hạng di theo thứ tự tăng dần, các giá trị bằng
nhau sẽ nhận hạng trung bình của các hạng liên tiếp, bỏ
qua trường hợp di = 0.
3. Tìm tổng các hạng di>0 (di<0). Ký hiệu: T+, T4. Giá trị kiểm định T=min(T+,T-)
5. Bác bỏ H0: T Tn’,, Tn’, có phân phối Wilcoxon
n’: Số cặp quan sát khác 0
156
II.KIỂM ĐỊNH WILLCOXON (T)
Ví dụ: Để khảo sát xem khách hàng thích sản phẩm nào
hơn, chọn ngẫu nhiên 10 khách hàng và yêu cầu họ cho
biết sở thích về 2 sản phẩm cùng loại X, Y khác nhau thông
qua thang điểm từ 1 đến 5 (điểm càng cao sở thích càng
cao). Hãy cho biết khách thích sản phẩm nào nhiều hơn với
= 5%.
Khách hàng
1
2
3
4
5
6
7
8
9
10
X
4
5
2
4
3
1
3
2
1
5
Y
3
5
5
2
5
5
3
5
5
2
157
II.KIỂM ĐỊNH WILLCOXON (T)
Khách
hàng
X
Y
Di
T+
T-
1
2
3
4
5
6
7
8
9
4 5 2 4
3
1 3 2 1
3 5 5 2
5
5 3 5 5
1 0 -3 2 -2 -4 0 -3 -4
1
2,5
5
2,5 7,5
5 7,5
158
10 Tổng
5
2
3
5
8,5
27,5
II.KIỂM ĐỊNH WILLCOXON (T)
2.3. Mẫu lớn n>20: Ta có kiểm định Z
T T
n' (n'1)
2 n' (n'1)(2n'1)
z
T
T
T
4
24
159
II.KIỂM ĐỊNH WILLCOXON (T)
160
II.KIỂM ĐỊNH WILLCOXON (T)
161
III.KIỂM ĐỊNH MANN-WHITNEY (U)
3.1.Giả thuyết: H0: 1 = 2 Mẫu độc lập
3.2.Mẫu nhỏ (n1,n2≤20):
1. Xếp hạng tất cả các giá trị của hai mẫu theo thứ tự tăng
dần. Những giá trị bằng nhau sẽ nhận hạng trung bình các
hạng liên tiếp.
2. Tổng hạng mẫu 1 và mẫu 2. Ký hiệu: R1, R2
3. Giá trị kiểm định: U=min(U1,U2)
n1(n1 1)
U2 n1.n2 U1
U1 n1.n2
R1
2
4. Bác bỏ H0: U Un1,n2,
162
III.KIỂM ĐỊNH MANN-WHITNEY (U)
Ví dụ: Tại một trang trại nuôi lợn người ta thử áp dụng một loại thuốc
tăng trọng bổ sung vào khẩu phần thức ăn của 10 con lợn, sau 3
tháng người ta thu thập số liệu về trọng lượng của heo (X). Trong khi
đó 15 con lợn khác không dùng thuốc tăng trọng có trọng lượng, sau
3 tháng người ta thu thập số liệu (Y). Hãy kiểm tra xem trọng lượng
có như nhau hay không khi thử nghiệm với =5%.
X
60
61
62
62
63
63
68
64
64
65
Y
56
56
57
57
58
58
58
59
59
60
R(X)
11,5
15
18
18
20,5
R(Y)
1,5
1,5 3,5 3,5
6
20,5 25 22,5 22,5
6
6
8,5
163
8,5
60
60
24
11,5
61 61 62
197,5
11,5
11,5
15 15 18 127,5
III.KIỂM ĐỊNH MANN-WHITNEY (U)
3.3.Mẫu lớn (n1,n2>20): Ta có kiểm định z
U U
n1n2
2 n1.n2 (n1 n2 1)
z
U
U
U
2
12
164
III.KIỂM ĐỊNH MANN-WHITNEY (U)
165
III.KIỂM ĐỊNH MANN-WHITNEY (U)
166
IV.KIỂM ĐỊNH KRUSKAL-WALLIS
• Giả thuyết:
H0 : 1 2 ... k
H1 : i j (i j)
• Giá trị kiểm định:
Chọn k mẫu độc lập có n1...,nk quan sát (ni5), n=ni.
Tổng hạng của k mẫu R1,...,Rk
12 k Ri2
W
3(n 1)
n(n 1) i1 ni
• Bác bỏ H0: W> 2k-1,
167
IV.KIỂM ĐỊNH KRUSKAL-WALLIS
Ví dụ: Một nhà nghiên cứu muốn xem xét phải chăng ở 3 ngành công
nghiệp A,B,C tổng giá trị sản phẩm trung bình của các xí nghiệp là
như nhau với mức ý nghĩa 5%. Chọn một số xí nghiệp ở các ngành
đó như sau:
Ngành A
Ngành B
Ngành C
rank(A)
rank(B)
rank(C)
1,38 1,55 1,90 2,00 1,22 2,11 1,98 1,61
2,33 2,50 2,79 3,01 1,99 2,45
1,06 1,37 1,09 1,65 1,44 1,11
6
8
11
14
4
15
12
9
16
18
19
20
13
17
1
5
2
10
7
3
W=13,5416
168
Tổng
79
103
28
IV.KIỂM ĐỊNH KRUSKAL-WALLIS
169
IV.KIỂM ĐỊNH KRUSKAL-WALLIS
170
V.KIỂM ĐỊNH SỰ PHÙ HỢP
Giả thuyết H0: Tổng thể được chia làm k nhóm, có phân
phối xác suất pi (pi=1) để một quan sát rơi vào nhóm i.
Chọn ngẫu nhiên n quan sát, ni là số quan sát rơi vào nhóm
i.
Nhóm
1
2
…
k
Ho
P1
P2
…
Pk
1
Quan sát
n1
n2
…
nk
n
2
(
n
E
)
i , E np 5
2 i
i
i
Ei
i1
k
Giá trị kiểm định:
Bác bỏ Ho: 2 >2k-1,
171
V.KIỂM ĐỊNH SỰ PHÙ HỢP
Ở một quán cafe, có 4 nhãn hiệu nước giải khát khác nhau.
160 khách hàng được chọn ngẫu nhiên cho thấy sự lựa
chọn về các nhãn hiệu như sau. Có thể kết luận sự ưa
chuộng của khách hàng về 4 giải khát là như nhau được
không ở mức ý nghĩa 2,5%.
Nhãn hiệu
A
B
C
D
Số khách hàng
34
46
29
51
160
GT Ho (pi)
Ei=n.pi
0,25
40
0,25
40
0,25
40
0,25
40
1
(ni-Ei)2/Ei
0,90
0,90
3,03
3,03
7,85
172
VI.KIỂM ĐỊNH SỰ ĐỘC LẬP
Giả sử có mẫu ngẫu nhiên gồm n quan sát, được phân nhóm kết hợp
thành 2 tiêu thức:
Phân nhóm theo tiêu
thức thứ hai
1
2
...
r
1
n11
n21
...
nr1
C1
Phân nhóm theo tiêu thức thứ nhất
2
...
c
n12
...
n1c
n22
...
n2c
...
...
...
nr2
...
nrc
C2
...
Cc
Giả thuyết H0: Tiêu thức 1 và tiêu thức 2 độc lập
r c (nij E ij )2
R iC j
2
, E ij
Giá trị kiểm định:
E ij
n
i 1 j 1
2
2
Bác bỏ H0: ( r 1)( c 1),
173
R1
R2
...
Rr
n
VI.KIỂM ĐỊNH SỰ ĐỘC LẬP
Ví dụ: Một nghiên cứu được thực hiện nhằm xem xét mối liên hệ giữa
giới tính và sự ưa thích các nhãn hiệu nước giải khát, một mẫu ngẫu
nhiên 2.425 người tiêu dùng với các nhãn hiệu nước giải khát được
ưa thích như sau. Kiểm định giả thuyết không có mối liên hệ nào giữa
giới tính và sự ưa thích nhãn hiệu nước giải khát ở mức ý nghĩa
0,5%.
Giới tính
Nam
Nữ
Tổng(Cj)
Nhãn hiệu ưa thích
Coca
Pepsi
7Up
Tổng (Ri)
308
(200)
502
(610)
810
177
(199)
627
(605)
804
114
(200)
697
(611)
811
599
2 = 129,83
174
1826
2425
www.nguyenngoclam.com