Tải bản đầy đủ (.docx) (17 trang)

KIỂM ÐỊNH PHI THAM SỐ TRONG KẾ TOÁN

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (211.08 KB, 17 trang )

KIỂM ÐỊNH PHI THAM SỐ
(Nonparametric Tests)
I. KIỂM ĐỊNH WILCOXON
II. KIỂM ĐỊNH MANN-WHITNEY
III. KIỂM ĐỊNH SỰ PHÙ HỢP
1. Kiểm định sự phù hợp trong trường hợp giả định đã biết các tham số của
tổng thể
2. Kiểm định sự phù hợp trong trường hợp các tham số tổng thể chưa biết
IV. BẢNG TIẾP LIÊN

Trong nhiều tình huống thực tế, số liệu chỉ có thể biểu hiện dưới hình thức xếp
hạng, vì vậy kiểm định Wilconxon và Mann-Whitney là hai lọai kiểm định thông dụng
nhất ứng với hai trường hợp: một là sử dụng cho mẫu ngẫu nhiên gồm các quan sát từng
cặp và một dùng cho mẫu ngẫu nhiên độc lập. Hơn nữa, khi phân phối của tổng thể
được giả định không phải là phân phối chuẩn (phân phối bất kỳ) thì kiểm định phi
tham số có thể có nhiều ứng dụng hơn. Tuy nhiên, phương pháp kiểm định phi tham số
thì khó mở rộng để giải quyết các vấn đề của mô hình kinh tế phức tạp.
Kiểm định phi tham số bạn có thể dễ dàng tìm được kết quả khi sử dụng phần
mềm phân tích SPSS, sau khi nhập sữ liệu, chọn menu Analize - Nonparametric Tests -
Chọn loại kiểm định mà bạn mong đợi.
I. KIỂM ĐỊNH WILCOXON (Kiểm định T)
Kiểm định Wilcoxon được áp dụng khi một mẫu ngẫu nhiên gồm các quan sát
từng cặp và phân phối tổng thể của chênh lệch (di) trong các cặp này thì đối xứng.
1. Trường hợp mẫu nhỏ (n ( 20):
Ví dụ: Một công ty nước giải khát muốn kiểm tra hiệu quả của chiến dịch quảng cáo cho
5 loại thức uống tốt nhất của công ty bằng cách điều tra số người sử dụng 5 loại thức
uống này tăng lên hay giảm xuống sau đợt quảng cáo ở mức ý nghĩa 2,5% và 5%. Công
ty chọn ngẫu nhiên 10 thành phố và mỗi thành phố chọn ngẫu nhiên 500 người để trả lời
cuộc điều tra này kết quả như sau:
Thành
phố


1 2 3 4 5 6 7 8 9 10
Trước
quảng cáo
(y
i
)

95

151

192

71

86

215

254

123

97

153
Sau
quảng
cáo (xi)


123

160

180

93

99

193

311

121

131

169
Chênh
lệch (d
i
)
28 9 -12 22 13 -22 57 -2 34 16
Xếp
hạng
l d
i
l
8 2 3 6,5 4 6,5 10 1 9 5

å{+d
i
} 8 2 0 6,5 4 0 10 0 9 5
å{- d
i
} 0 0 3 0 0 6,5 0 1 0 0

2. Trường hợp mẫu lớn (n >20):

Ví dụ: Trở lại ví dụ ở trường hợp 1, thay vì thu thập số liệu ở 10 thành phố, ta thực hiện ở
85 thành phố lớn nhỏ khác nhau. Trong 85 mức độ chênh lệch được xếp hạng thì giá trị
nhỏ nhất của T (minimum) là 1.195. Hãy kiểm định giả thuyết H0 với đối thuyết H1 rằng
chiến dịch quảng cáo có hiệu quả hơn.
Ta có n = 85, T = 1195 và nếu giả thuyết H0 đúng thì phân phối Wilcoxon có trung bình
và phương sai như sau:
II. KIỂM ĐỊNH MANN - WHITNEY (Kiểm định U)
Cũng như kiểm định T, kiểm định U cũng là một loại kiểm định bằng cách xếp
hạng các mẫu độc lập với mục đích kiểm định sự bằng nhau của các tổng thể có phân
phối bất kỳ.
1. Trường hợp mẫu nhỏ (n < 10 và n1 < n2): : là số quan sát mẫu chọn ra từ tổng thể
thứ 1,

Ví dụ: Chúng ta muốn so sánh lương khởi điểm của sinh viên tốt nghiệp ở ngành kinh tế
và điện tử tin học được trả bởi các công ty như sau (100.000 đồng):
Ðiện tử tin học 15 18 27 30 24
Kinh tế 17 22 24 12 28 30 14 18 25 22
Giả thuyết H0: Trung bình lương khởi điểm của 2 ngành thì bằng nhau
H1: Trung bình lương khởi điểm ngành tin học được trả cao hơn
Trước tiên ta xếp hạng các số liệu liên tục cho cả hai ngành từ nhỏ đến lớn:
Ðiện

tử
Tin
học
1
5
18 24 2
7
30
Xếp
hạng
3 5,5 9,5 1
2
14,
5
Kinh
tế
1
2
1
4
17 18 22 22 24 2
5
28 30

Xếp
hạng
1 2 4 5,5 7,5 7,5 9,5 1
1
13 14,
5

Chú ý: Trong xếp hạng, hạng của các giá trị trùng nhau của hai ngành cũng được xếp
bằng nhau và bằng trung bình cộng của giá trị hai hạng liên tiếp đó.

2. Trường hợp mẫu lớn (n >10):
Ví dụ: Trở lại vấn đề tiền lương khởi điểm của hai ngành kinh tế và điện tử tin học. Mỗi
ngành chọn ngẫu nhiên 80 sinh viên và sau đó tiền lương được xếp hạng từ nhỏ đến lớn,
và tổng cộng hạng được xếp cho tiền lương của hai ngành thì bằng nhau và bằng 7.287.
Ta có : n1 = 80 n2 = 80 R1 = 7.287
Giả thuyết H0: Trung bình lương khởi điểm của hai ngành thì bằng nhau.
H1: Trung bình lương khởi điểm ngành kinh tế và điện tử tin học được trả khác
nhau.
III. KIỂM ĐỊNH SỰ PHÙ HỢP (Goodness-of-fit test)
Kiểm định sự phuùhợp là kiểm định xem giả thuyết về phân phối của tổng thể và
số liệu thực tế phù hợp (thích hợp) với nhau đến mức nào. Ở đây ta dùng phân phối "Chi"
bình phương (χ
2
) để so sánh trong quá trình kiểm định. Một kiểm định χ
2
thường bao
gồm những bước sau đây:
1. Thiết lập giả thuyết H
0
và H
1
về tổng thể.
2. Tính toán các giá trị lý thuyết theo giả thuyết H
0
3. Tính toán các khác biệt giữa giá trị lý thuyết và giá trị thực tế. Từ đó, xác định
giá trị kiểm định theo χ
2

công thức

Oi: Tần số quan sát của nhóm thứ i.
Ei: Tần số lý thuyết của nhóm thứ i (tính theo giả thuyết H
0
).
4. So sánh giá trị kiểm định tính được với giá trị trong bảng phân phối χ
2
và kết
luận.
1. Kiểm định sự phù hợp trong trường hợp giả định đã biết các
tham số của tổng thể.
Giả sử có một mẫu ngẫu nhiên với n quan sát, mỗi quan sát có thể được phân vào
một trong k nhóm.
· Gọi O1,O2, ,Ok là số quan sát ở nhóm thứ 1,2, ,k.
· Gói p1, p2, , pk là xác suất giả thuyết để quan sát rơi vào nhóm thứ 1,2, ,k (giả
thuyết H0). Do vậy, số quan sát ở nhóm thứ i, theo giả thuyết H0, là:
E
i
= n.p
i
(i=1,2, ,k)

Vớ dỳ: Mt cụng ty d nh a ra th trng mt sn phm mi vi bn mu sc khỏc
nhau. Giỏm c cụng ty mun tỡm hiu th hiu khỏch hng v mu sc sn phm - thớch
c bit mt mu no hay s thớch i vi c bn mu l ging nhau mc ý ngha 1%.
Mt mu 80 khỏch hng c chn ngu nhiờn. Mi khỏch hng c xem sn phm vi
cỏc mu sc khỏc nhau v cho bit ý kin. Kt qu nh sau:
Trng Nõu Xanh en Tng cng
12 40 8 20 80

ã Gi thuyt H0: S thớch i vi 4 mu l ging nhau, ngha l cỏc sut khỏch hng
chn la mt trong 4 mu bng nhau:
p
1
= p
2
= p
3
= p
4
= 0,25.
ã Gi thuyt H1 : S thớch i vi 4 mu l ging nhau, ngha l xỏc sut khỏch hng
chon la i vi 4 mu khụng bng nhau
Theo gi thuyt H0 s lng khỏch hng chn mu th i l Ei

= n .p
i
.
Do ú, ta cú:
E
1
= E
2
= E
3
= E
4
= (80) (0,25) = 20
Giỏ tr kim nh:


2
=

Tra baỷng phaõn phoỏi
2
, ta coự:
2
k-1,


=
2
4 -1,1%
= 11,34.
Vì giá trò kiểm đònh χ
2
> χ
2
k-1,
α

, ta kết luận rằng ở mức ý nghóa 1% giả thuyết H
0

bác bỏ, nghóa là sự chọn lựa đối với 4 màu sắc của sản phẩm là khác nhau. Một vài
màu sắc nào đó được ưa thích hơn.
Cũng cần lưu ý rằng các xác suất giả thuyết không phải bắt buộc bằng nhau,
chúng có thể rất khác nhau. Chúng ta cần xác đònh rõ các xác suất giả thuyết này khi
lập giả thuyết H
0

và dùng các xác suất giả thuyết đó để tính toán các giá trò E
i
.
2. Kiểm định sự phù hợp trong trường hợp các tham số tổng thể
chưa biết.
Ở phần (1) trang 150, ta đã thực hiện kiểm định giả thuyết về việc quan sát được
phân phối với các xác suất xác định nào đó. Khi đó, xác suất để một quan sát rơi vào
nhóm thứ i được xác định rõ khi lập giả thuyếtH
0
.
Phần này sẽ đề cập đến việc kiểm định giả thuyết các quan sát tn theo một luật
phân phối nào đó - có thể là phân phối nhị thức, phân phối Poission, hay phân phối chuẩn
- trường hợp khơng giả định là đã biết các tham số của tổng thể nhưµ và σ. Trường hợp
này, ta có thể dùng các dữ liệu thu thập được để ước lượng tham số tổng thể.
Trước hết, dựa vào các tham số mẫu để xác định xác suất một quan sát rơi vào
nhóm thứ i theo như luật phân phối muốn kiểm định, nghĩa là xác định các pi. Sau đó,
tính các E
i
, giá trị kiểm định χ
2
và áp dụng qui tắc kiểm định giống như đã nói ở phần
(1). Cần chú ý rằng trong trường hợp này, số bậc tự do giảm đi 1 cho mỗi tham số tổng
thể được ước lượng.
Ví dú: Một nhà nghiên cứu thống kê muốn kiểm định giả thuyết về phân phối của số tiền
chi ra của khách hàng trong một lần mua sắp ở siêu thị. Một mẫu ngẫu nhiên 100 khách
hàng được chọn cho thấy số tiền chi trung bình cho một lần mua sắm là x =
125.000 đồng và độ lệch chuẩn s=40.000 đồng ở mức ý nghĩa 10%.
· Giả thuyết H
0
: Tổng thể (số tiền chi ra) có phân phối chuẩn (nghĩa là trung bình

một lần mua sắm của khách hàng là 125.000 đồng).
· Giả thuyết H1: Tổng thể khơng có phân phối chuẩn (trung bình một lần mua sắm
của khách hàng có thể trên hoặc dưới 125.000 đồng hay khác 125.000đồng).
Trước tiên, ta xác định các xác suất của một đại lượng phân phối chuẩn. Từ bảng
phân phối chuẩn, ta xác định được các xác suất cho một đại lượng phân phối chuẩn Z.
Chẳng hạn, tra bảng phân phối chuẩn ta có xác suất từ của Z từ 0 đến 1 là 0,3413 và gần
phân nửa của xác suất này là 0,1700 ứng với Z = 0,44. Vậy xác suất từ 0,44 đến 1 bằng
0,1713 (0,3413-0,1700) và xác suất từ 1(( sẽ bằng 0,1587 (0,5-0,3413).

Từ công thức Ei = n pi, các Ei có giá trị như sau:
E
1
= 15,87, E
2
= 17,13, E
3
= 17, E
4
= 17, E
5
= 17,13, E
6
= 15,87
Dựa vào công thức X = µ + σZ , chuyển các giá trị của đại lượng ngẫu nhiên Z thành
giá trị của vấn đề đang xét. Ta có thể
dùng và s (tham số mẫu) thay cho µ
vàσ (tham số tổng thể). Do đó, giới hạn của các nhóm được xác định như sau:
x
1
= 125+ (-1)(40) = 85

x
2
= 125+ (-0,44)(40) = 107,4
x
3
= 125+ (0)(40) = 125
x
4
= 125+ (0,44)(40) = 142,6
x
5
= 125+ (1)(40) = 165
Từ số liệu thu thập được, ta dễ dàng xác định được số lượng các quan sát rơi vào
từng nhóm, nghĩa là xác định Oi. Như vậy, ta đã xác định được các nhóm, xác suất để
một quan sát rơi vào nhóm thứ i (pi), số lượng quan sát thực tế (Oi) và số lượng quan sát
theo lý thuyết (Ei).
Từ đó, tính giá trị kiểm định χ
2
theo công thức:
Số liệu tính toán được trình bày trong bảng 4.1 như sau:
Bảng 4.1: Xác định giá trị kiểm định
xi (1000đđ) p
i
E
i =
(n.p
i
) O
i
(O

i
-E
i
)
2
/ E
i
0 - 84,99 0,1587 15,87 14 0,22
85 - 107,39 0,1713 17,13 20 0,48
107,4 - 124,99 0,17 17 16 0,06
125 - 142,59 0,17 17 19 0,24
142,6 - 164,99 0,1713 17,13 16 0,07
³ 165 15,87 15,87 15 0,05
Tổng cộng 1 100 100 1,12
Trong đó Oi là số quan sát thực tế và n = 100 (100 khách hàng)
Từ bảng 4.1 ta có giá trị kiểm định χ
2
= 1,12 và trong 6 nhóm có hai tham số
được ước lượng ( được ước lượng
cho µ và s được ước lượng cho σ) nên số bậc 6 -1 -2 = 3 (giá trị này được tính bằng k
trừ 1 rồi trừ đi số tham số được ước lượng).
Tra bạng phân phối χ
2
, ta có: : χ
2
3,10%
= 6,25 > 1,12. Do vậy, ta chấp nhận giả
thuyết H
0
ở mức ý nghĩa 10%, nghĩa là không có chứng cứ để nói rằng tổng thể không có

phân phối chuẩn, hay nói cách khác số tiền chi ra trung bình của một khách hàng trong
một lần mua sắm là 125.000 đồng.
IV. BẢNG TIẾP LIÊN (Contingency table)
Trong phần này, ta sẽ đề cập đến việc sử dụng kiểm định "Chi" bình
phương (χ
2
) vào việc phân tích một bảng tiếp liên, bảng tiếp liên là bảng kết hợp hai tiêu
thức, nhằm xác định xem giữa hai tiêu thức của tổng thể có mối liên hệ hay không. Ví dụ,
xem xét mối liên hệ giữa giới tính và mức độ hoàn thành công việc, giữa hiệu quả kinh
doanh (lãi, lỗ) và ngành kinh doanh (dịch vụ hoặc sản xuất) v.v
Giả sử có mẫu ngẫu nhiên gồm n quan sát, được phân nhóm kết hợp hai tiêu thức
với nhau, hình thành nên bảng tiếp liên gồm (r) hàng và (c) cột. Gọi O
ij
là quan sát ứng
với hàng thứ i và cột thứ j, R
i
là tổng số quan sát ở hàng thứ i, C
j
là tổng số quan sát ở cột
thứ j, n là tổng số quan sát của (r) hàng đồng thời cũng là tổng số quan sát của (c) cột.
Bảng 4.2: Dạng tổng quát của một bảng tiếp liên kết hợp hai tiêu thức.
Phân nhóm Phân nhóm theo tiêu thức 1
theo tiêu thức
2
1 2 3 c å
1 O
11
O
12
O

13
O
1c
R
1
2 O
21
O
22
O
23
R
2
3 O
31
O
32
O
33
R
3

r O
r1
O
r2
O
r3
O
rc

R
r
Tổng cộng C
1
C
2
C
3
C
c
n
Để kiểm định xem có mối liên hệ giữa hai tiêu thức này không, trước hết ta lập giả
thuyết H
0
vaø H
1
· Giả thuyết H
0
: Không có mối liên hệ giữa hai tiêu thức.
· Giả thuyết H
1
: Tồn tại mối liên hệ giữa hai tiêu thức.
Nguyên tắc của kiểm định ở đây cũng giống như kiểm định sự phù hợp
(Goodness-of-Fitness) đã nói ở phần trước. Điểm khác biệt duy nhất là khi tính giá trị
kiểm định phải lấy tổng số cho tất cả các ô gồm (r) hàng và (c) cột trong bảng tiếp liên,
nghĩa là:
Giá trị kiểm định:

với số lượng quan sát lý thuyết (theo giả thuyết H
0

):Eij = R
i
C
j
/ n.
Ri và C j là tổng tần số của hàng thứ i và cột thứ j.
với (r-1)(c-1): số bậc tự do.
Ví dụ: Để nghiên cứu mối liên hệ giữa tuổi tác và kết quả học tập của sinh viên tại chức ở
một trường đại học, người ta lấy mẫu ngẫu nhiên 1140 sinh viên tại chức. Kết quả phân
nhóm theo hai tiêu thức kết quả học tập và tuổi tác được trình bày trong bảng sau:
Bảng 4.3: Tuổi và kết quả học tập của sinh viên phân theo nhóm
Kết quả học tập
Tuổi Tốt Không tốt Tổng cộng
(R
i
)
£ 25 198 90 288
26 - 35 114 97 211
36 - 45 166 211 377
³ 46 92 172 264
Tổng
cộng (C
i
)
570 570 1140
· Giả thuyết H
0
: Không có mối liên hệ giữa tuổi và kết quả học tập.
· Giả thuyết H
1

: Tồn tại mối liên hệ giữa tuổi tác và kết quả học tập.
Số lượng quan sát lý thuyết (theo giả thuyết H
0
) E
ij
được tính toán và được để trong
dấu ngoặc đơn bên phải giá trị O
ij
. Chẳng hạn, E
11
= R
1
C
1
/ n = (288)(570) / 1140 = 144
Tương tự cách tính như trên ta có: E
42
= R
4
C
2
/n = (264) (570)/1140 = 132
Bảng 4.4: Bảng kết quả các Oij và Eij
Tuổi Kết quả học tập
Tốt Không tốt
≤ 25
198 (144) 90 (144)
26 - 35 114 (105,5) 97 (105,5)
36 - 45 166 (188,5) 211 (188,5)
³ 46 92 (132) 172 (132)

Giá trị kiểm định:
Vôùi r = 4, c = 2, số bậc tự do là: (r - 1)(c - 1) = (4 - 1)(2 - 1) = 3
Tra bảng phân phối χ
2
, ta có χ
2
3, 0,5%
= 12,84 < 71,5
Do vậy, ở mức ý nghĩa 0,5%, giả thuyết H
0
bị bát bỏ, nghĩa là có tồn tại mối liên
hệ giữa tuổi tác và kết quả học tập. Điều đó có thể nhận thấy khi quan sát bảng (9.4) tính
toán ở trên, nói chung nhóm tuổi thấp có kết quả học tập cao hơn so với nhóm tuổi lớn
hơn.
Bài tập
1. Kết quả sau đây cho thấy mức độ hài lòng về thu nhập của nhân viên nam và nữ trong
một cuộc điều tra về các yếu tố ảnh hưởng đến kết quả công việc. Hãy kiểm định giả
thuyết về mối liên hệ giữa giới tính và sự hài lòng về thu nhập ở mức ý nghĩa 5%?
Giới tính Mức độ hài lòng
Thấp Trung bình cao
Nam 46 61 53
Nữ 8 9 12

2. Quản đốc một phân xưởng sản xuất ghi nhận rằng trong điều kiện sản xuất bình thường
93% sản phẩm không có lỗi nào, 5% có một lỗi và 2% có hơn một lỗi. Từ một mẫu 500
sản phẩm được lấy ngẫu nhiên từ sản phẩm được sản xuất ra trong tuần, người Quản đốc
thấy có 458 sản phẩm không có lỗi. Ông cho rằng chất lượng của những sản phẩm sản
xuất ra trong tuần giống như trong điều kiện sản xuất bình thường. Hãy kiểm định nhận
định trên của ông ở mức ý nghĩa 5%?


3. Một công ty đang xem xét việc đặt tên cho một sản phẩm mới. Trước khi quyết định
chọn một trong 5 tên được đề nghị, giám đốc muốn kiểm định xem phải chăng cả 5 tên
đều có sức hấp dẫn bằng nhau đối với khách hàng. Mẫu 100 khách hàng được chọn ngẫu
nhiên và được yêu cầu cho biết ý kiến về một tên cho sản phẩm mà họ thích nhất, kết quả
như dưới đây. Hãy kiểm định giả thuyết nói trên ở mức ý nghĩa 5%?
Tên sản phẩm: A B C D E
Lượng khách hàng chọn: 4 12 34 40 10

4. Một nhà phân tích thống kê muốn xem xét mối quan hệ giữa giới tính và việc chọn lựa
các nhãn hiệu nước giải khát. Một mẫu 330 người được chọn ngẫu nhiên và kết quả như
sau:

Sự chọn lựa nhãn hiệu
Giới tính
Coke Pepsi 7up Tribeco Tổng cộng
Nam
55 32 47 21 155
Nữ
60 43 35 37 175
Tổng
cộng
115 75 82 58 330
Hãy kết luận về mối quan hệ nói trên ở mức ý nghĩa 5%?

5. Một công ty nước giải khát Coca-cola hoạt động trên toàn cầu đang mở một chiến dịch
quảng cáo với mục đích cần đạt tới là nhãn hiệu của nó sẽ ở trong tiềm thức của khách
hàng. Một mẫu ngẫu nhiên gồm 500 người ở mỗi thành phố của 10 quốc gia được phỏng
vấn về 5 nhãn hiệu giải khát trước và sau chiến dịch quảng cáo. Nhãn hiệu Coca-Cola
được khách hàng nhắc tới theo bảng dưới đây. Hãy sử dụng kiểm định Wilcoxon để
kiểm định giả thuyết H0 tương ứng giả thuyết H1 cho rằng nhãn hiệu Coca-Cola được

nhận biết bởi khách hàng tốt hơn sau chiến dịch quảng cáo ở mức ý nghĩa 5%?
Thành phố Trước quảng cáo Sau quảng cáo
1 95 123
2 151 160
3 192 180
4 71 93
5 86 99
6 215 193
7 254 311
8 123 121
9 97 131
10 153 169

6. Một nhà phân tích thị trường chứng khoán đã đưa ra đầu năm một danh sách chứng
khoán để mua và một danh sách khác để bán. Một mẫu ngẫu nhiên gồm 10 chứng khoán
từ danh sách mua và 10 chứng khoán từ danh sách bán. Phần trăm tăng lên (%) qua một
năm về số lượng chứng khoán mua và bán như sau:
Mua:
9,6 5,8 13,8 17,2 11,6 4,2 3,1 11,7 13,9 12,3
Bán:
-2,7 6,2 8,9 11,3 2,1 3,9 -2,4 1,3 7,9 10,2
Sử dụng kiểm định Mann-Whitney cho trường hợp trên và giải thích?

7. Lương khởi điểm của sinh viên tốt nghiệp bằng MBA từ hai trường kinh doanh nổi
tiếng được đem ra so sánh. Những mẫu ngẫu nhiên độc lập gồm 30 sinh viên từ mỗi
trường được chọn ra để phỏng vấn. Sáu mươi mức lương được đánh giá xếp hạng. Tổng
hạng được xếp của một trong hai trường này là 1243. Hãy kiểm định giả thuyết H0 rằng
phân phối của hai tổng thể thì bằng nhau?

×