1
NGUYÊN LÝ THỐNG KÊ KINH TẾ
ThS. Hứa Thanh Xuân
Phần dành cho đơn vị
98
CHƯƠNG 8: KIỂM ĐỊNH PHI THAM SỐ
• Điều kiện áp dụng:
- Không
đòi hỏi phân phối tổng thể là chuẩn.
- D
ữ liệu ở dạng tần số hoặc số đếm.
•
Các dạng kiểm định phi tham số:
– Kiểm định Wilcoxon (Kiểm định T).
– Ki
ểm định Mann-Whitney.
– Ki
ểm định Kruskal – Wallis.
– Ki
ểm định sự phù hợp.
– Ki
ểm định sự độc lập.
99
KIỂM ĐỊNH WILCOXON (KIỂM ĐỊNH T)
(So sánh TB 2 tổng thể-Phương pháp so sánh cặp)
• Trường hợp mẫu nhỏ: n 20
Bước 1: Đặt giả thuyết:
Bước 2: Tính giá trị kiểm định:
- Tính s
ự chênh lệch giữa các cặp: di = xi – yi
- X
ếp hạng các dI trong giá trị tuyệt đối di
- Tìm t
ổng hạng của di mang dấu dương + và
t
ổng hạng của di mang dấu âm -.
- Giá tr
ị kiểm định (T): T = min ( + ; -).
Bước 3: Điều kiện bác bỏ H
0
: T < T
n;
0:
0:
2
1
2
1
10
H
H
2
100
KIỂM ĐỊNH WILCOXON (KIỂM ĐỊNH T)
(So sánh TB 2 tổng thể-Phương pháp so sánh cặp)
Ví dụ 8.1: Trong tháng trước và sau Noel, số
lượng người mua sắm quần áo tại 11 cửa hàng
trong thành ph
ố như sau:
971455570891057558309550Sau Noel
9715060728911585463010556
Trước Noel
1110987654321
C
ửa hàng
Với mức ý nghĩa 5%, hãy kiểm định xem số lượt
người mua sằm quần áo trước và sau Noel có thực
s
ự khác nhau không?
101
• Trường hợp mẫu lớn: n > 20
Bước 1: Đặt giả thuyết: có thể đặt ở dạng 1 đuôi hoặc
2
đuôi.
Bước 2: Giá trị kiểm định:
Bước 3: Bác bỏ H
0
khi:
- Ki
ểm định dạng “1 đuôi”: Z < - Z
- Kiểm định dạng “2 đuôi”: Z < - Z/2.
KIỂM ĐỊNH WILCOXON (KIỂM ĐỊNH T)
(So sánh TB 2 tổng thể-Phương pháp so sánh cặp)
T
T
T
Z
4
1)n(n
T
24
121
2
)n)(n(n
T
Với
102
KIỂM ĐỊNH MANN-WHITNEY (KIỂM ĐỊNH U)
(So sánh TB 2 tổng thể-Phương pháp độc lập)
1. Trường hợp mẫu nhỏ: n
1
, n
2
10; n
1
< n
2
Bước 1: Đặt giả thuyết: như các trường hợp trên
Bước 2: Tính giá trị kiểm định:
- X
ếp hạng tất cả các giá trị của 2 mẫu theo thứ tự tăng dần.
Nh
ững giá trị bằng nhau sẽ nhận giá trị trung bình
- C
ộng các hạng của tất cả các giá trị ở mẫu thứ nhất, ký
hi
ệu là R1.
- Giá tr
ị kiểm định:
Bước 3: Tra bảng phân phối để tìm F (U) = F
n1,n2
(U)
Bước 4: Giả thuyết H
0
bị bác bỏ khi: > p = 2 F(U).
Lưu ý:
2
)
1
n
(
n
R
1
11
21
2
1
R
)n(n
nnU
3
103
Ví dụ 8.2: Chúng ta muốn so sánh lương khởi điểm
c
ủa sinh viên tốt nghiệp ở ngành kinh tế với điện tử tin
h
ọc được trả bởi các công ty như sau: (100.000đ)
Có th
ể kết luận tiền lương khởi điểm của 2 nhóm là
khác nhau không?
22251814302812242217Kinh t
ế
2430271815Điện tử tin học
KIỂM ĐỊNH MANN-WHITNEY (KIỂM ĐỊNH U)
(So sánh TB 2 tổng thể-Phương pháp độc lập)
104
2. Trường hợp mẫu lớn: n1, n2 > 10
211
210
:H
:H
211
210
:H
:H
211
210
:H
:H
U
U
U
Z
2
21
n
n
U
12
1
2121
2
)nn(nn
U
;
Bác bỏ H
0
GTKĐ
Đặt giả thuyết
2
đuôi1 đuôi trái1 đuôi phải
Với
KIỂM ĐỊNH MANN-WHITNEY (KIỂM ĐỊNH U)
(So sánh TB 2 tổng thể-Phương pháp độc lập)
| Z |> Z
| Z |> Z/2
105
Ví dụ 8.3: Trở lại vấn đề tiền lương khởi điểm
c
ủa hai ngành kinh tế và điện tử tin học. Mỗi
ngành ch
ọn ngẫu nhiên 80 sinh viên và sau đó
ti
ền lương được xếp hạng từ nhỏ đến lớn, và
t
ổng cộng hạng được xếp cho tiền lương của
ngành kinh t
ế bằng 7.287.
KIỂM ĐỊNH MANN-WHITNEY (KIỂM ĐỊNH U)
(So sánh TB 2 tổng thể-Phương pháp độc lập)
4
106
KIỂM ĐỊNH KRUSKAL WALLIS
(So sánh TB nhi
ều tổng thể)
Bước 1: Đặt giả thuyết
H
0
: Trung bình của k tổng thể thì giống nhau.
H
1
: Trung bình của k tổng thể thì khác nhau.
Bước 2: Xếp hạng tất cả các giá trị quan sát của k mẫu
theo th
ứ tự tăng dần. Những giá trị bằng nhau sẽ nhận
giá tr
ị trung bình.
Bước 3: Cộng các hạng của tất cả các giá trị ở từng mẫu
l
ại, ký hiệu là R
1
, R
2
, …, R
k
(Lưu ý: ∑R = [n*(n+1)] / 2).
Bước 4: Giá trị kiểm định:
Bước 5: Bác bỏ H
0
nếu
k
1i
i
2
i
)1n(3
n
R
)1n(*n
12
W
2
;1k
W
107
Ví dụ 8.4:
Để so sánh chi phí quảng cáo trên 4 tờ báo khác nhau
(v
ới điều kiện nội dung quảng cáo là như nhau), người
ta l
ấy mẫu trên các tờ báo và thu được các kết quả
sau (đơn vị: ngàn đồng)
Báo A: 57 65 50 45 70 62 68.
Báo B: 72 81 64 55 75.
Báo C: 35 42 58 46 59 60 61 38.
Báo D: 73 92 68 85 82 94 62.
Yêu c
ầu: hãy kiểm định có sự khác biệt về chi phí
qu
ảng cáo giữa các tờ báo nói trên hay không ở mức ý
ngh
ĩa 5%.
KIỂM ĐỊNH KRUSKAL WALLIS
(So sánh TB nhi
ều tổng thể)
108
KIỂM ĐỊNH SỰ PHÙ HỢP
• Bài toán tổng quát:
Giả sử có mẫu ngẫu nhiên n quan sát, được
chia thành k nhóm khác nhau: m
ỗi quan sát
ph
ải và chỉ thuộc về một nhóm thứ i nào đó ( i
= 1,2, … , k).
G
ọi Oi là số lượng quan sát ở nhóm thứ i.
Ki
ểm định giả thuyết H
0
về phân phối của tổng
th
ể (hay giả thuyết H
0
thể hiện các xác suất p
i
để một quan sát nào đó thuộc về nhóm thứ i.
5
109
Bước 1: Tính số lượng quan sát thuộc về nhóm thứ i trong trường hợp
gi
ả thuyết H
0
đúng, nghĩa là tính các giá trị mong muốn E
i
- theo công
th
ức: E
i
= np
i
(Ei 5).
n
1
n
O
i
p
i
E
i
= np
i
…
…
…
O
2
p
2
E
2
= np
2
O
1
p
1
E
1
= np
1
Giá trị thực tế (O
i
)
XS theo gi
ả thuyết H
0
( p
i
)
Giá tr
ị mong muốn
(E
i
)
k…21Nhóm
KIỂM ĐỊNH SỰ PHÙ HỢP
Bước 2: Tính giá trị kiểm định:
k
i
i
ii
E
)EO(
1
2
2
Bước 3: Bác bỏ giả thuyết H
0
khi:
2
1
2
,k
110
KIỂM ĐỊNH SỰ PHÙ HỢP
• Ví dụ 8.5 (bài tổng hợp 6):
18031296654Số lượng khách
ch
ọn (người)
T
ổngLgSony
Ericsson
SamsungNokiaNhãn hiệu
Với mức ý nghĩa 5%, có thể kết luận sở thích của người
tiêu dùng
đối với 4 nhãn hiệu điện thoại di động trên là
khác nhau hay không?
111
KIỂM ĐỊNH SỰ ĐỘC LẬP
Bài toán tổng quát:
• Giả sử có mẫu ngẫu nhiên gồm n quan sát, được phân
nhóm k
ết hợp 2 tiêu thức với nhau, hình thành nên bảng
ti
ếp liên gồm r hàng (row) và c cột (column).
• G
ọi Oij là số quan sát ứng với hàng thứ i và cột thứ j .
• Ri là t
ổng số quan sát ở hàng thứ i .
• Cj là t
ổng số quan sát ở cột thứ j .
nC
c
……C
2
C
1
RrO
rc
……O
r2
O
r1
r
…………………
R2O
2c
……O
22
O
21
2
R1O
1c
……O
12
O
11
1
c……21
Phân nhóm theo tiêu th
ức thứ 1Phân nhóm theo
tiêu th
ức thứ 2
6
112
KIỂM ĐỊNH SỰ ĐỘC LẬP
- Bước 1: Đặt giả thuyết
H
0
: Không có mối liên hệ giữa 2 tiêu thức.
H
1
: Tồn tại mối liên hệ giữa 2 tiêu thức.
- Bước 2: Tính số lượng quan sát theo giả thuyết H
0
- Bước 3: Tính GTKĐ:
-
Bước 4: Bác bỏ H
0
nếu :
V
ới có phân phối 2 với (r-1) (c-1) bậc tự do.
n
C
R
n
R
CE
jjj
jij
r
1i
c
1j
ij
2
ijij
2
E
)EO(
2
11
2
),c)(r(
113
KIỂM ĐỊNH SỰ ĐỘC LẬP
32066131123
170318455Nữ
150354768Nam
7 UpPepsiCoca - Cola
Nhãn hi
ệu ưa thích
Gi
ới tính
Ví dụ 8.6:
Với α = 5%, có thể kết luận có mối liên hệ giữa nhãn
hi
ệu ưa thích và giới tính hay không?