KIỂM ĐỊNH PHI THAM SỐ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (385.13 KB, 44 trang )

Kiểm định phi tham số
thực hành

Thống kê

Lí THUYT XC SUT V THNG Kấ TON
Chng 5
Kim nh phi tham s
NI DUNG
Chng ny dnh riờng cho cỏc kim nh phi tham s, õy l cỏc kim nh c
bn thng c tin hnh xỏc nh tớnh cht ca cỏc tng th thụng qua cỏc b s
liu hay cỏc mu ngu nhiờn. Cỏc kim nh quan trng hn c l kim nh v dng
phõn phi thc nghim v s phự hp ca chỳng vi phõn phi lý thuyt. Chng ny
cng dnh mt phn quan trng cho vic kim nh cỏc phõn phi thụng dng nh phõn
phi chun, Poison, u, M. Trong mt vi trng hp cỏc kim nh cng c trỡnh
by nh mt k thut, ngoi ra cỏc kim nh u cú th nhn c t cỏc phn mm
ng dng. Cú th chia ni dung kim nh phi tham s thnh hai phn, ú l kim nh
Khi bỡnh phng v cỏc kim nh phi tham s khỏc m ch yu l cỏc kim nh da
trờn cỏc h s tng quan hng. Mt s th tc, cỏc tớnh toỏn c th s c gii thiu
ngi hc cú th tnh ton c lp khụng cn n s tr giỳp ca cỏc phn mm chuyờn
dng. V phn mm ng dng, chng ti dnh mt phn riờng gii thiu cỏc kim
nh phi tham s ca SPSS, vi mt s kim nh khụng c trỡnh by c s lý thuyt.
YU CU
Sau khi nghin cu chng ny ngi hc cn t c mt s yờu cu sau:
- Phừn bit r kim nh phi tham s v kim nh v giỏ tr cỏc tham s ca cỏc
bin ngu nhiờn.
- Nm c mt cỏch thng quỏt cỏch tip cn kim nh s phự hp ca cỏc
phõn phi thc nghim vi cụng c kim nh Khi bnh phng.
- Nm c cỏch thc dựng cỏc kim nh du trong mt s bi toỏn c th.
- p dng thun thc cỏc k nng kim nh da trờn tiờu chun Khi bnh
phng.

- Nm c thut toỏn cỏc kim nh dng phõn phi c bit l cỏc kim nh
Jacque-Bera, Kolmogorov, Kolmogorov-Simirnov. Cỏch thc s dng cỏc k thut ny
trờn SPSS.
- Cch hnh thnh cc h s tng quan hng v s dng cỏc h s ny trong
tng bi toỏn kim nh cỏc quan h khụng tuyn tớnh, phi tham s.
- S dng thnh tho cỏc kim nh trờn Winstata v SPSS cú liờn quan.

1

KiÓm ®Þnh phi tham sè
thùc hµnh

Thèng kª

I. kiểm định khi bình phương
1- Kiểm định sự phù hợp của qui luật thực nghiệm
Kiểm định Khi bình phương được dùng phổ biến trong việc kiểm định giả thuyết
về dạng phân phối. Kiểm định này dựa trên cơ sở đánh giá tổng bình phương khác biệt
giữa giá trị lý thuyết theo giả thuyết và giá trị thực nghiệm tương ứng. Để đưa ra các giả
thuyết về dạng phân phối, người ta thường mô tả và phân tích sơ bộ hiện tượng, đặc điểm
của biến ngẫu nhiên thông qua số liệu quan sát. Tuy vậy, trong nhiều trường hợp các
phân tích này có thể bị bỏ qua, vì nhận thức chủ quan hay kinh nghiệm của người phân
tích.
Thống kê Khi bình phương thiết lập trên một mẫu kích thước n có thể mô tả tổng
quát nhờ công thức sau:
n

χ2 = ∑
i =1

(Oi − E i ) 2
Ei

(5.1)

Trong đó: Ei là giá trị lý thuyết theo giả thuyết, Oi là giá trị thực nghiệm tương ứng. Cỏc
giỏ trị Oi và Ei có thể là các tần số của các dấu hiệu hoặc giá trị thực của các biến ngẫu
nhiên. Trong các kiểm định cụ thể chúng ta sẽ mô tả cụ thể cách chọn hai loại giá trị này.
a- Kiểm định giả thuyết về phân phối đều
Phân phối đều trên đoạn [a, b] là phân phối liên tục, mà biến ngẫu nhiên tương
ứng có khả năng nhận các giá trị khác nhau trong đoạn này bằng nhau. Đây cũng là
trường hợp minh họa dễ dàng nhất đối với các kiểm định về dạng phân phối của các biến
ngẫu nhiên lien tục. Đặc điểm chính là thực tế quan sát chúng ta nhận được các giá trị
rời rạc, kiểm định này thực hiện trên cơ sở phân khoảng và rời rạc hoá phân phối đều
như sau: Giả sử X nhận các giá trị {x i} trong k khoảng thời gian có độ dài bằng nhau.
Nếu X phân phối đều theo thời gian thì các giá trị của X trong mỗi khoảng thời gian là
trung bình của X (x* chẳng hạn). Thống kê khi bình phương được tính theo công thức
k

χ2 = ∑
i =1

( xi − x*) 2
x*
thống kê này tuân theo qui luật Khi bình phương (k-1) bậc tự do nếu

X phân phối đều. Với mức ý nghĩa α cho trước, giả thuyết X phân phối đều bị bác bỏ nếu
giá trị quan sát lớn hơn giá trị tới hạn χ2(k-1) mức α.
Thí dụ 1: Quan sát 12 tháng số lượng lương thực cung cấp cho 1 hộ người ta nhận được

kết quả sau
Thán

1

2

3

4

5

6

7

8

9

10

11

12

2

KiÓm ®Þnh phi tham sè
thùc hµnh

g
SL

Thèng kª

25.0 32.0 33.0 28.0 19.0 31.0 27.0 28.0 17.0 18.0 21.0 20.0

Để tính giá trị thống kê Khi bình phương ta lập bảng sau:
i

xi

x*

xi -x*

(xi-x*)2/x*

1
2
3
4
5
6
7
8
9

10
11
12

25.0
32.0
33.0
28.0
19.0
31.0
27.0
28.0
17.0
18.0
21.0
20.0

24.917
24.917
24.917
24.917
24.917
24.917
24.917
24.917
24.917
24.917
24.917
24.917

0.083
7.083
8.083
3.083
-5.917
6.083
2.083
3.083
-7.917
-6.917
-3.917
-4.917

0.00028
2.01366
2.62235
0.38155
1.40496
1.48523
0.17419
0.38155
2.51533
1.92001
0.61566
0.97018

TB

24.917

χ2qs= 14.48945

Tra bảng giá trị phân phối χ2 ta có: χ20.05 (11) = 19.675. So sánh với giá trị quan sát, ta
thấy không có cơ sở bác bỏ giả thuyết cho rằng lượng lương thực cung cấp cho hộ là đều
đặn (phân phối đều theo thời gian).
b- Kiểm định giả thuyết về cấu trúc tổng thể
Giả thiết về cấu trúc tổng thể theo các dấu hiệu của 1 biến định tính hay các khoảng của
1 biến định lượng, có thể qui về một phân phối xác suất của một biến ngẫu nhiên rời rạc.
Có thể xem đây là trường hợp tổng quát kiểm định phân phối xác suất của các biến ngẫu
nhiên rời rạc với việc sử dụng tiờu chuẩn Khi bỡnh phương để kiểm định cấu trúc tổng
thể. Không mất tính tổng quát, có thể mô tả kiểm định này qua một thí dụ cụ thể sau đây.
Thớ dụ 2: Giả sử mức sống của cư dân một vùng có thể phân chia 5 bậc như sau: quá
nghèo, nghèo, trung bình, khá và giàu. Có người cho rằng tỷ lệ dân cư ở các mức sống
tương ứng là:
Mức sống
quá nghèo
nghèo
Trung bình
Khá
Giàu
Tỷ lệ (%)
12
25
40
20
3
Với mẫu ngẫu nhiên 1000 quan sát người ta thấy số cư dân có các mức sống như sau:
Mức sống
quá nghèo
nghèo

Trung bình
Khá
Giàu
Số cư dân
135
280
440
100
45
Ta có thể tính giá trị quan sát của thống kê Khi bình phương nhờ bảng sau:
Giá trị lý thuyết Giá trị quan sát (Oi -Ei)2/Ei
(Ei)
(Oi)
120
135
1.875
250
280
3.6
400
440
4

3

KiÓm ®Þnh phi tham sè
thùc hµnh

Thèng kª

200
30
1000
2
Ta có: χ qs= 66.975. Với mức ý nghĩa 5%,

100
50
45
7.5
1000
66.975
tra bảng phân phối Khi bình phương ta nhận

được: χ20.05 (4) = 9.4877. Như vậy đủ cơ sở bác bỏ giả thuyết về cấu trúc mức sống dân
cư nói trên.
c- Kiểm định giả thuyết về phân phối Poison
Phân phối Poison là một trong những phân phối có nhiều ứng dụng trong thực tế,
đây là phân phối của các hiện tượng “hiếm”. Có nhiều cách nhận biết một biến ngẫu
nhiên X phân phối Poison, như dựa vào hiện tượng trung bình xấp xỉ phương sai; tính
chất của dòng biến cố theo thời gian... . Chúng ta nêu thủ tục, nhờ đó có thể kiểm tra lại
chính các phân tích có tính định tính này nhờ tiêu chuẩn Khi bình phương qua một thí dụ
cụ thể.
Thớ dụ 3: Quan sát số lần máy bay bay qua một không phận A, người ta có số liệu (k và
nk) và bảng tính toán sau:
Số lần
(k)
0
1

2
3
4
>=5

số phút
(nk)
10
23
45
49
32
41

Pk
(λ=2.965)
0.05156
0.152877
0.22664
0.223996
0.166037
0.17889

n’= nPk

(n-n’)2/n’

10.31209
30.57536
45.32797

44.79914
33.20736
35.77807

0.009445
1.876873
0.002373
0.393918
0.043898
0.762157
3.088665

200
1
200
Ta có: χ 0.05 (5) =11.07048, vậy không đủ cơ sở bác bỏ giả thuyết số máy lần máy bay
2

qua không phân A phân phối Poison.
d- Kiểm định giả thuyết về phân phối chuẩn
Phân phối chuẩn là phân phối liên tục, tuy vậy trong thực hành chúng ta luôn
nhận được các giá trị quan sát rời rạc. Để kiểm định giả thuyết về phân phối chuẩn của
một biến ngẫu nhiên X, người ta dựa trên các tần số theo khoảng. Thủ tục kiểm định như
sau:
Chia vựng giỏ trị quan sỏt thành k khoảng dạng (x i , xi+1); gọi ni là số giỏ trị quan
sỏt thuộc khoảng (xi , xi+1).
k

Kích thước mẫu

n = ∑ ni
i =1

.

4

KiÓm ®Þnh phi tham sè
thùc hµnh

Thèng kª

Tớnh giỏ trị trung bỡnh khoảng i:

xi =

x i + x i +1
2

k

Tớnh giỏ trị trung bỡnh mẫu:

x = ∑ nixi
i =1

Tính giá trị phương sai mẫu theo các giá trị trung tâm x i , từ đó tính độ lệch tiêu
chuẩn mẫu s.
x −x

zi = i
s
Chuẩn hóa các khoảng ước lượng với các giá trị biên là:
,
Tỡnh cỏc tần số lý thuyết: n i = nP(z i < Z < z i +1 ) với Z là biến n.n phõn phối

N(0,1)
Tớnh giỏ trị quan sỏt của thống kờ Khi bỡnh phương (

2
χqs

).

2
So sỏnh với giỏ trị tới hạn χα (k − 1) và kết luận.
Thớ dụ 4: Sau đây là kiểm định về giả thuyết thu nhập ( X) của viên chức vùng A phân
phối chuẩn, (Z là biến chuẩn hoá của X).

Khoảng
Giá trị
giá trị trung tâm
(xi .. xi+1)
x
( i)
570..580
575
580.. 590
585
590.. 600

595
600.. 610
605
610.. 620
615
620.. 630
625

Số
người ni x i
(ni)
20
142
310
370
128
30

11500
83070
184450
223850
78720
18750

x
n ( i - x )2
i

Zi

Zi+1

ni’=
nP(Zi
(ni’-ni)2/ni’

23.86
135.29
326.02
335.58
147.56
27.59

0.62478
0.33247
0.78778
3.52996
2.59467
0.21024

12842.31 -2.906 -1.948
33414.82 -1.948 -0.990
8839.836 -0.990 -0.032
8034.772 -0.032 0.925
27509.2 0.9258 1.883
18243.47 1.883 2.840

χ 2qs=

1000 600340 108884.4
Độ lệch TC (s)=10.439 ;
Trung bình( x ) =600.34

χ

2

0.05

8.0798

(5) =11.07048

Kết quả trên cho thấy có thể xem thu nhập của viên chức hành chính phân phối chuẩn.
2- Kiểm định tính độc lập của hai dấu hiệu
Kiểm định tính độc lập của hai dấu hiệu định tính nhờ tiêu chuẩn Khi bình
phương là kiểm định dựa trên cơ sở kiểm định sự đồng nhất của phân phân phối xác suất
đồng thời và tích hai phân phối biên. Với biến ngẫu nhiên hai chiều (X,Y) chúng ta đã
biết rằng nếu X và Y độc lập thì hàm mật độ đồng thời f(x,y) bằng tích hai hàm mật độ
f1(x) và f2(y). Dựa trên cơ sở này người ta tiến hành kiểm định tính độc lập của hai dấu
hiệu.
Giả sử A và B là hai biến ngẫu nhiên định tính. A có p dấu hiệu và B có q dấu
hiệu. Với mẫu ngẫu nhiên kích thước n ta có bảng tiếp liên
A1

A2

...........

Ap

5

KiÓm ®Þnh phi tham sè
thùc hµnh

Gọi:

Thèng kª

B1
B2
.........

n11
n21
...

n12
n22
....

............
.........
..........

n1p

n2p
.........

Bq

nq1

nq2

................

nqp

Ri =ni1 + ni2 + .... + nip

(i=1...q)

Cj =n1j + n2j + .... + npj

(j=1..p)

q

n=

;

p

∑∑ n

i =1 j =1

ij

Phân tích dòng theo cột:
Theo mỗi dòng ta có các tần số Ri. Tỷ lệ Ri/n là tần suất của dấu hiệu Bi.
Hãy xét một cột j ứng với dấu hiệu A j. Nếu A, B độc lập thì theo tỷ lệ R i/n mỗi ô
(i,j) sẽ có tần số lý thuyết là CjRi/n.
Như vậy, chênh lệch tần suất và xác suất trong ô (i,j) có thể tính như sau:
(Oij − E ij ) = (nij −

q

p

χ = ∑∑
2

i =1 j =1

(nij −

Ri C j
n

Ri C j

n
Ri C j

)

)2

n

Và

(5.2)

A, B độc lập thống kê này có phân phối χ2 với (p-1)(q-1) bậc tự do. Với mức ý nghĩa α
cho trước ta kết luận A, B không độc lập nếu χ2qs >χ2α [(p-1)(q-1)].
Thí dụ 5: Với tệp số liệu GSS93 ta có thể kiểm định giả thuyết cho rằng sự ưa thích nhạc
cổ điển và nhạc đồng quê châu Âu độc lập với nhau. Các tính toán từ bảng tiếp liên như
sau:
Count ry West ern Music * Classical Music Crosst abulat ion
Count

Country
Western
Music

Total

Like Very Much
Like It
Mixed Feelings
Dislike It
Dislike Very Much

Like It
Very
Much
50
77
89
33
16
265

Classical Music
Mixed
Feeling
Dislike
Like It
s
It
92
74
78
200
117
96
90
92
33
47
40
24
16

10
6
445
333
237

Dislike It
Very
Much
45
43
20
8
13
129

Total
339
533
324
152
61
1409

6

KiÓm ®Þnh phi tham sè
thùc hµnh

Thèng kª

(nij −

Ri C j

n
Ri C j

)2

n

Giá trị

2.96876
5.390035
12.92389
0.681022
1.786564

tại các ô (i,j)

2.119857
5.956122
1.485195
0.021068
0.553482

0.467262

0.638465
3.107843
0.462626
1.353052

7.718278
0.449345
8.480528
0.09605
1.76908

6.281812
0.688995
3.148135
2.515192
9.845455

Giá trị thống kê Khi bình phương: 80.90812. Kết luận nhận được là bác bỏ ý kiến trên.
Kết quả sau nhận được từ SPSS với chương trình:
CROSSTABS
/TABLES=country BY classicl
/STATISTIC=CHISQ.
Chi-Sq ua re T est s

Pea rson C hi-Sq uare
Likelihood Ratio
Linear-by-Linear
Association
N of Valid Cases

Value
80 .908 a
77.941
16 .868

16
16

Asymp.
Sig.
(2-sided)
.0 00
.0 00

1

.0 00

df

1409

a. 0 cells (.0 % ) have expected count less than 5. The
minimum expected co unt is 5.58.

3. Kiểm định dấu (sign test)
Kiểm định dấu là một trong những cách thức kiểm định đơn giản nhưng có nhiều
ứng dụng. Đơn giản nhất là kiểm định giả thuyết về trung vị của một biến X nhờ một
mẫu ngẫu nhiên. Tư tưởng của kiểm định dấu được mở rộng cho nhiều kiểm định khác
như kiểm định xác suất, kiểm định tính ngẫu nhiên của một mẫu.... . Thực tế kiểm định

này có thể qui về kiểm định cấu trỳc tổng thể đó trỡnh bày ở trờn, việc sử dụng các tiếp
cận khác có thể làm cho việc kiểm định thuận tiện hơn.
a- Kiểm định giá trị trung vị
Giả sử X là một biến ngẫu nhiên, gọi M d(X) là giá trị trung vị của X. Giả thuyết
H0 là Md(X)= m0 thì P(X<=m0) =0.5, như vậy các giá trị quan sát từ một mẫu ngẫu nhiên
có khả năng chia đều về hai phía của m 0. Nếu điều đó thực sự không đúng thì hoặc là giả

7

KiÓm ®Þnh phi tham sè
thùc hµnh

Thèng kª

thuyết H0 sai hoặc là mẫu được chọn thực tế là mẫu không ngẫu nhiên. Trước tiên ta xem
xét thủ tục kiểm định giá trị trung vị.
Với một quan sát mẫu, dấu của quan sát là dấu "-" nếu giá trị quan sát nhỏ hơn
m0, dấu của quan sát là dấu "+" nếu giá trị quan lớn hơn m 0, các giá trị quan sát đúng
bằng m0 được đánh dấu "0". Nguyên tắc kiểm định là nếu số dấu "-" (hoặc dấu "+") quá
nhỏ hay quá lớn giả thuyết H0 sẽ bị bác bỏ.
Gọi số dấu "+ "(chẳng hạn khi có ít dấu "+") là Y, thì Y phân phối Nhị thức với hai tham
số n và 0.5- B(n, 0.5). Với giả thuyết trờn tại mỗi giỏ trị Y 0 (số dấu “+“) quan sát được ta
xác định được P(Y<=Y0) và P(Y>=Y0). Cỏc giỏ trị này là cơ sở để kết luận về giả thuyết
trên với mức ý nghĩa cho trước.
Vỡ việc lựa chọn Y là số dấu “+” hay số dấu”-“ không làm thay đổi phân phối của Y nờn
cú thể giả sử Y0 là số dấu có tần suất nhỏ, nếu xác suất P(Y<=Y 0) nhỏ hơn mức ý nghĩa
của kiểm định thì bác bỏ giả thuyết H0, tức là giá trị trung vị không bằng m0.
Thí dụ 6: Có giả thuyết cho rằng thu nhập hộ/tháng ở một thành phố có giá trị trung vị là
500$. Quan sát ngẫu nhiên 100 hộ ta nhận được 66 hộ có thu nhập không thấp hơn

500$/tháng và 34 hộ có thu nhập thấp hơn 500$/tháng. Như vậy số dấu - trong 100 quan
sát là 34. Gọi Y là số dấu - thì Y phân phối B(100, 0.5) và: P(Y<=34)= 0.009; Với mức ý
nghĩa 5% ta bác bỏ giả thuyết trung vị của thu nhập hộ là 500$/tháng.
b- Kiểm định giá trị xác suất
Hoàn toàn tương tự với kiểm định trung vị, ta có thể sử dụng phân phối nhị thức
để tiến hành kiểm định xác suất.
Giả thuyết cần kiểm định là H0: P(A) =p0 và H1: P(A) ≠ p0. Với mẫu ngẫu nhiên
kích thước n (quan sát A n lần), gọi m là số lần xuất hiện A, tương ứng số dấu "+", thì A
không xuất hiện (n-m) lần, tương ứng số dấu "-". Không mất tính tổng quát có thể giả sử
p0 lớn và m nhỏ, gọi Y là số dấu "+" thì Y phân phối B(n, p0). Xác định P(Y<=m) nếu giá
trị xác suất này nhỏ hơn mức ý nghĩa kiểm định thì bác bỏ giả thuyết H0. Trường hợp p0
nhỏ và m lớn hoàn toàn tương tự.
Thí dụ 7: Một dây chuyền sản xuất tự động được coi là bình thường nếu tỷ lệ phế phẩm
không quá 5%. Kiểm tra ngẫu nhiên 50 sản phẩm thấy có 4 phế phẩm, có thể xem là dây
chuyền hoạt động bình thường hay không?
Gọi Y là số phế phẩm thì Y phân phối nhị thức B(50, 0.05).
Như vậy P(Y>=4)= 1 - P(Y<=3) =0.2396. Vậy với mức ý nghĩa 5% không đủ cơ sở cho
rằng dây chuyền hoạt động không bình thường.

8

KiÓm ®Þnh phi tham sè
thùc hµnh

Thèng kª

c- Kiểm định tính ngẫu nhiên của mẫu- Kiểm định các đoạn mạch (Runs test)
Một trong những yêu cầu của suy luận thống kê từ mẫu là tính ngẫu nhiên của
mẫu cụ thể phải được đảm bảo. Có nhiều thủ tục kiểm định hay xác nhận tính ngẫu nhiên

của các quan sát, ở đây ta xét việc ứng dụng kiểm định dấu để giải quyết vấn đề này. Giả
sử có n quan sát về X : x1, x2, ...., xn. Theo một dấu hiệu nào đó mà chúng ta xác định làm
tiêu chuẩn ngẫu nhiên, chẳng hạn nếu X là thu nhập hộ ta có thể chọn tiêu chuẩn nhỏ hơn
hay lớn hơn trung bình để xem xét, hoặc thay cho trung bình ta có thể chọn trung vị... .
Với một tiêu chuẩn xem xét xác định các quan sát được chia thành hai nhóm với hai dấu
hiệu "+", "-" theo thứ tự quan sát. Ta gọi dãy các dấu như nhau là một đoạn mạch.
Kiểm định các đoạn mạch được thực hiện như sau:
Gọi: n1 là số dấu "+"; n2 là số dấu "-" và m là số đoạn mạch. Sử dụng bảng tính
các giá trị M1 và M2 cho kiểm định các đoạn mạch, nếu M1ngẫu nhiên, ngược lại ta kết luận mẫu không ngẫu nhiên.
Thí dụ 8: Quan sát số lần ốm đau trong năm và số con của phụ nữ trên 49 tuổi đã từng
kết hôn người ta nhận được số liệu về con của họ như sau: 2 3 2 4 5 3 2 1 1 3 4 6
2 4 3 5 6 3 2. Người ta cho rằng người quan sát đã không quan sát theo thứ tự ngẫu
nhiên ngẫu nhiên vì trung bình số con của phụ nữ đã hết tuổi sinh đẻ trong vùng có số
con trung bình là 2,8. Hãy xác nhận tính ngẫu nhiên nếu có của số liệu quan sát với mức
ý nghĩa 5%.
Ta lập các đoạn mạch như sau:
-+-+++---+++-+++++Ta thấy n1=12 , n2 =7 và số đoạn mạch m=9. Tra bảng M ta có: M1=5, M2=14,
như vậy không đủ cơ sở cho rằng các quan sát đã được thực hiện theo thứ tự không ngẫu
nhiên.
Với n1, n2 >=10

2n1 n 2
+1
n
+
n
1
2
Số đoạn mạch m phân phối xấp xỉ chuẩn với trung bình E(m)=

và phương sai
2n1 n 2 (2n1 n2 − n1 − n 2 )
2
là: Var(m)= (n1 + n2 ) (n1 + n2 − 1)
m − E ( m)
Chuẩn hoá biến m ta có:

U=

Var (m)

Nếu |Uqs| > Uα/2 ta bác bỏ giả thuyết số liệu mẫu được quan sát ngẫu nhiên.

9

KiÓm ®Þnh phi tham sè
thùc hµnh

Thèng kª

Xắp xếp dấu phần dư e t nhận được từ hồi qui Y=a+bX theo chiều tăng của X người ta
nhận được 24 đoạn mạch với 42 dấu "+" và 64 dấu "-". Có thể kiểm định tự tương quan
trong mô hình trên nhờ kiểm định tính ngẫu nhiên về dấu của các phần dư như sau:
m
n1
24
42
E(m)= 51.71698
Se(m)= 4.900433

U=
-5.65603

n2
64

Với mức ý nghĩa 5% ta bác bỏ giả thuyết các sai số ngẫu nhiên không tương quan tuyến
tính với nhau, hay mô hình có tự tương quan.
II. MỘT SỐ KIỂM ĐỊNH DẠNG PHÂN PHỐI THÔNG DỤNG
Phần này giới thiệu một số thủ tục kiểm định dạng phân phối của biến ngẫu nhiên
1 chiều. Các thủ tục kiểm định được trỡnh bày ở đây tập trung cho một số dạng phân
phối như: Phân phối đều; Phân phối Poison; Phân phối mũ và đựac biệt chú trọng đến
phân phối chuẩn.
1- Tiêu chuẩn Kolmogorov
Tiêu chuẩn Konmogorov áp dụng được cho mọi phân phối liên tục, nhưng đây là
tiêu chuẩn dựa trên các tham số lý thuyết xác định ngoài số liệu thống kê. Tiêu chuẩn này
được sử dụng khi đã có một “chuẩn mực” cho đại lượng được nghiên cứu. Chẳng hạn,
một thiết kế kỹ thuật, một quá trình kinh tế hay một quá trình sinh hoá đã xác định có
tính chất lý thuyết, vấn đề còn lại là thực tế đối tượng nghiên cứu có xảy ra như lý thuyết
hay không. Có thể tóm tắt tiêu chuẩn này như sau: Dựa trên cơ sở nào đó người ta cho
rằng X có phân phối F(x, θ*) với θ* đã xác định. Dựa trên quan sát mẫu ta có các giá trị
xi. Gọi phân phối thực nhiệm là F(x) ta có:
D=max| F(xi, θ*)-F(xi) |

(5.3)

Với n đủ lớn biến Y=D n phân phối Kolmogorov với hàm mật độ sau:
 +∞
k −2 k 2 y 2
khi x > 0

 ∑ (−1) e
K ( y ) = k = −∞
0
khi x ≤ 0

Nếu Yqs >kα ta bác bỏ giả thuyết phân phối thực nghiệm phù hợp với phân phối lý thuyết.
Bảng giá trị tới hạn của phân phối Kolmogorov
α

0.5

0.4

0.3

0.2

0.1

0.05

0.02

0.01

0.001

10

KiÓm ®Þnh phi tham sè
thùc hµnh

kα

Thèng kª

0.828

0.895

0.973

1.072

1.224

1.357

6

2

8

7

1

6

1.520

1.627

1.954

4

8

Thí dụ 9: Dây chuyền tự động sản xuất đồng hồ đo điện được thiết kế với số sản
phẩm/giờ là biến ngẫu nhiên phân phối chuẩn trung bình mỗi giờ 12 chiếc với độ lệch
chuẩn 2 chiếc. Quan sát 100 giờ sản xuất thực tế có số liệu sau:
Số SF
10
11
12
13
14
Số giờ
18
24
35
16
7
Có thể xem là giây chuyền này hoạt động đúng thiết kế kỹ thuật hay không? Kết luận với
mức ý nghĩa 5%. Ta có bảng so sánh xác suất sau:
X
F(x,θ*)

F(x)
|F(x,θ*)-F(x)|

10
0.158655
0.18
0.021345

11
0.308538
0.42
0.111462

12
0.5
0.77
0.27

13
0.691462
0.93
0.238538

14
0.841345
1
0.158655

Yqs = 0,27x 10=2,7. Ta bác bỏ giả thuyết dây chuyền hoạt động như thiết kế kỹ thuật.
Sau đây là kết quả kiểm định này trên SPSS với biến thu nhập (tn1):

One-Sample Kolmogorov-Smirnov Test

N
Normal Parameters(a,b)
Most Extreme Differences

Mean
Std. Deviation
Absolute

tn1
15822
3266.27
18199.671
.429

Positive

.350

Negative

-.429

Kolmogorov-Smirnov Z
Asymp. Sig. (2-tailed)

53.935
.000

Cú thể kiểm tra giỏ trị thống kờ Z trong bảng này theo cụng thức tớnh giỏ trị Y ở trờn.
2- Tiêu chuẩn Jacque- Bera
Tiêu chuẩn Jacque-Bera kiểm định biến ngẫu nhiên phân phối chuẩn nhờ các đặc trưng
định dạng phân phối.
Với mẫu ngẫu nhiên W(X) kích thước n, ta xác định các hệ số bất đối xứng S
(Skew) và hệ số nhọn K (Kurt). Trong mô tả thống kê ta đã biết nếu X phân phối chuẩn
thì hệ số bất đỗi xứng bàng 1 và hệ số nhọn bằng 3.
Lập thống kê:

 S2 K2 
JB = n 
+
÷
24 
 6
(5.4)

11

KiÓm ®Þnh phi tham sè
thùc hµnh

Thèng kª

Với n đủ lớn thống kê JB phân phối Khi bình phương 2 bậc tự do.
Nếu JBqs > χ2α( 2) ta bác bỏ giả thuyết biến ngẫu nhiên X phân phối chuẩn, ngược lại
không đủ cơ sở bác bỏ giả thuyết này.
Chú ý rằng với số liệu mẫu các thống kê ước lượng cho hệ số bất đối xứng và hệ
số nhọn là:

3

n
n
 xi − x 
Skew( X ) =
∑

÷
(n − 1)(n − 2) i =1  s 

4

n
n(n + 1)
3(n − 1)2
 xi − x 
Kurt ( X ) =
∑
÷ −
(n − 1)(n − 2)(n − 3) i =1  s  (n − 2)(n − 3)

Với n đủ lớn các giá trị này xấp xỉ bởi công thức tương ứng
với tổng thể:
3

1 n X −X 
Skew( X ) = ∑  i
÷
n i =1  MS 2 

4

1 n X −X 
Kurt ( X ) = ∑  i
÷ −3
n i =1  MS 2 

Thớ dụ 10: Mức xăng tiêu hao cho mỗi km đường đi trên mỗi xi lanh xe du lịch là biến
ngẫu nhiên X. Với 397 quan sát người ta tính được Skew(x)=0,21 và Kurt(x)=-1,197.
Phải chăng X phân phối chuẩn.
Ta tính được: JB = 26,619; P(ữ2(2)> 26,619)=0,00001. Vậy cú thể kết luận X khụng phõn
phối chuẩn.
2- Tiờu chuẩn Kolmogorov-Simirnov
Tiờu chuẩn Kolmogorov-Simirnov cú thể dựng để kiểm định giả thuyết một biến
ngẫu nhiên X phân phối Chuẩn, đều, Poisson hay phõn phối mũ.
Cú thể túm tắt tiờu chuẩn này như sau: Giả sử quan sỏt mẫu Wn(x) là: x1 < x2 < x3 <…<
xm, goi fi là tần số tương ứng của xi. Hàm phõn phối xỏc suất thực nghiệm của x sẽ là:
khi − ∞ < x < x1
0
 k
 ∑ fi

ˆ
F ( x) =  i=1
khi xk ≤ x < xk +1 k = 1..m − 1
n

khi xm ≤ x < ( +∞ = xm+1 )
1



(5.5)
Gọi F0(x) là phõn phối theo giả thuyết của x.

12

KiÓm ®Þnh phi tham sè
thùc hµnh

Thèng kª

Phõn phối
F0 ( x j ) =

Đều

F0(x)
x j − min( xi )

max( xi ) − min( xi )
x −µ
F0 ( x j ) = Φ ( j
)
σ
xj
e− λ λ i
F0 ( x j ) = ∑
i!

i =0

Chuẩn
Poisson

F0 ( x j ) = 1 − e

Mũ

−β xj

Đặt:
 Fˆ ( x j − 1) − F0 ( x j − 1)
Dj = 
0
D* = Fˆ ( x ) − F ( x )

Với phõn phối Poisson:

j

j

0

xj > 0
xj = 0
(5.6)

j

D j = Fˆ ( x j −1 ) − F0 ( x j )
với cỏc phõn phối khỏc:

D*j = Fˆ ( x j ) − F0 ( x j )

(5.7)

Lập thống kờ:
Z = n max ( D j , D*j )

(5.8)

j

0 ≤ Z<0,27
1

−2 2
2π

(Q + Q 9 + Q 25 ); Q = e − Z π / 8 0, 27 ≤ Z < 1
1p=
Z
 2(Q − Q 4 + Q 9 − Q16 ); Q = e −2 Z 2
1 ≤ Z < 3,1


Z ≥ 3,1
0

(5.9)

Nếu p < ỏ bỏc bỏ giả thuyết phõn phối F0(x).
Thớ dụ 11: Dữ liệu mức chi tiờu của/khẩu của cỏc hộ cú mức sống trung bỡnh tại Hà
nội năm 1998 từ VLHS98 được cho ở hai cột đầu của bảng dưới đây. Với mức ý nghĩa
tối thiểu là bao nhiờu là thể xem là chi tiêu/khẩu của các hộ loại này ở hà nồi năm 1998
là biến ngẫu nhiên phân phỗi chuẩn?
Các tính toán sau đây mô tả việc thực hiện kiểm định Kolmogrov-Simirnov
Xi
1924,81
1988,63
2075,64
2096,75
2116,9

ni
4
4
5
4
2

niXi
7699,24
7954,52
10378,2
8387
4233,8

niXi2
14819574
15818597
21541407
17585442
8962531

Fqs
0,0506
0,1013
0,1646
0,2152
0,2405

Fh
0,0445
0,0846
0,1761
0,2054
0,2359

Dj
0,03398
0,07486
0,04087
0,02074
0,02328

Dj*
0,00613

0,01665
0,01157
0,00976
0,00458

13

KiÓm ®Þnh phi tham sè
thùc hµnh

2134,08
2139,46
2161,04
2230,95
2242,65
2259,9
2441,87
2445,28
2457,42
2466,72
2506,11
2519,69
2644,47

9
6
4
4
4

5
3
5
5
5
3
3
4

Thèng kª

19206,72
12836,76
8644,16
8923,8
8970,6
11299,5
7325,61
12226,4
12287,1
12333,6
7518,33
7559,07
10577,88

40988677
27463735
18680376
19908552
20117916

25535740
17888187
29896971
30194565
30423538
18841762
19046513
27972886

0,3544
0,4304
0,4810
0,5316
0,5823
0,6456
0,6835
0,7468
0,8101
0,8734
0,9114
0,9494
1,0000

0,2638
0,2728
0,3107
0,4456
0,4693
0,5044
0,8265

0,8309
0,8461
0,8571
0,8977
0,9096
0,9759

0,08159
0,11973
0,03546
0,06239
0,0779
0,18095
0,1474
0,09928
0,04698
0,0243
0,00184
0,02652

0,09064
0,15754
0,17036
0,08609
0,11302
0,14119
0,14297
0,08411
0,03599
0,01631

0,01368
0,03982
0,02411

Các đặc trưng cơ bản và giá trị các thống kê cần tính p như sau:
N=

79

TB=

S=

195,77

Zqs=

2257,751

S2 =

38325,89

1,60829

Fqs là hàm phõn phối thực nghiệm tớnh theo (5.5) và Fh là phân phối với giả thuyết dang
hàm phân phối chuẩn trong đó các tham số được tính theo tham số mẫu.
Với Zqs tính được ở trên ta sử dụng công thức sau để tính p:

{

p = 2(Q − Q 4 + Q 9 − Q16 ); Q = e −2 Z

2

Q= 0,00567; p= 0,01133
Vậy với mức ý nghĩa 5% ta bỏc bỏ giả thuyết biến ngẫu nhiên đang xét phân phối chuẩn,
nhưng với mức ý nghĩa 1% thỡ giả thuyết này khụng bị bỏc bỏ.
Thủ tục tạo tệp chikhau_hanoi.sav được thực hiện từ tệp Hhexpn98v.sav như sau:
USE ALL.
COMPUTE filter_$=(province=17).
VARIABLE LABEL filter_$ 'province=17 (FILTER)'.
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.
FORMAT filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE .
AGGREGATE
/OUTFILE='G:\Gtrinh\TKTH\data\solieu/chikhau_hanoi.sav'
/BREAK=quint98 househol
/pcexp1_mean = MEAN(pcexp1).

Thủ tục kiểm định Kolmogrov-Simirnov, được mô tả bới tính toán như trên với tệp
chikhau_hanoi.sav là:
USE ALL.
COMPUTE filter_$=(quint98 = 3). * Chọn nhúm mức sống trung bỡnh

14

KiÓm ®Þnh phi tham sè

thùc hµnh

Thèng kª

VARIABLE LABEL filter_$ 'quint98 = 3 (FILTER)'.
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.
FORMAT filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE .
NPAR TESTS
/K-S(NORMAL)= pcexp1_mean * Chọn thủ tục Kolmogorov-Simrnov
/MISSING ANALYSIS.

Kết quả nhận được từ SPSS:
pcexp1_mean
79

N
Normal Parameters(a,b)
Most Extreme Differences

Mean

2257.7502

Std. Deviation

195.76852

Absolute

.181

Positive

.170

Negative

-.181

Kolmogorov-Smirnov Z

1.608

Asymp. Sig. (2-tailed)

.011

a Test distribution is Normal.

Kết quả nhận được như đó cú trong thớ dụ trờn.
III. các kiểm định trên cơ sở tương quan hạng
1- Kiểm định Wilcoxon
Kiểm định Wilconxon thường được sử dụng khi mẫu ngẫu nhiên thành lập từ hai
mẫu khi quan sát cho cùng một biến. Như vậy từ giả thuyết về tính ngẫu nhiên của mẫu,
khi áp dụng cho hai mẫu ghép một ta có giả thuyết về tính đối xứng của thông tin từ hai
mẫu thành phần. Đây là một kiểm định dựa trên cơ sở kiểm định hạng. Tổng quát hoá
thành một qui trình ta xét một thí dụ, thí dụ này liên quan đến kiểm định dấu mà ta đã nói
ở trên.

Thớ dụ 12: Để đánh giá về chất lượng một loại sản phẩm từ hai cơ sở sản xuất, người ta
chọn ngẫu nhiên 10 cặp sản phẩm của hai cơ sở này và yêu cầu 10 chuyên gia cho điểm
theo thang điểm 10. Kết quả nhận được như sau:
Chuyên

Sản phẩm

Sản phẩm cơ

gia
A
B
C
D
E
F

cơ sở I
6
4
5
8
7
6

sở II
8
9
4
7

8
5

15

KiÓm ®Þnh phi tham sè
thùc hµnh

Thèng kª

G
H
I
J

7
8
6
8

9
8
7
6

Có thể cho rằng chất lượng sản phẩm của hai cơ sở như nhau hay không?.
Với kiểm định Wilcoxon ta xắp xếp hạng của các chênh lệch thành hai loại hạng dương
và hạng âm như sau:
Chuyên gia

A
B
C
D
E
F
G
H
I
J

Chênh lệch điểm
Hạng "+" Hạng "-"
-2
4,5
-5
6
1
2
1
2
-1
2
1
2
-2
4,5
0
-1
2

-1
2
Tổng hạng
6
21
Thống kê Wilconxon T nhận giá trị của tổng hạng nhỏ, ở đây T = 6.
Với n là số chênh lệch khác không thống kê T là biến ngẫu nhiên có các đặc trưng
như sau:
n

n(n + 1)
n(n + 1)( 2n + 1)
(t 3j − t j ) / 48
∑
4
24
E(T) =
và Var(T) =
- j =1

(5.10)

với tj là số quan sỏt của cỏc nhúm cú hạng bằng nhau.
T − E (T )
Với n đủ lớn biến Z = Se(T ) phân phối xấp xỉ chuẩn N(0,1). Sử dụng Z làm tiêu
chuẩn kiểm định giả thuyết H0.
Trở lại thí dụ trên ta có: Tqs =6, E(T) = 22,5;
Var(T) = 73,1396 và Se(T) = 8,5521.
Zqs = -1,9293.
P( Z < -1,9293) = 0,0268.

Mức ý nghĩa bác bỏ H0 với H1: " Sản phẩm cơ sở II tốt hơn" là 2,68%. Như vậy trong
trường hợp này kiểm định Wincoxon sử dụng nhiều thông tin hơn kiểm định dấu và cho
một kết luận khỏc.
Có thể tóm tắt kiểm định Wincoxon như sau:

16

KiÓm ®Þnh phi tham sè
thùc hµnh

Thèng kª

Cho hai mẫu ngẫu nhiên kích thước m. Các quan sát ngẫu nhiên từ hai mẫu tạo thành các
cặp ngẫu nhiên (Xi, Yi). Gọi di = Xi - Yi là chênh lệch của các cặp giá trị quan sát, tập d i
chia thành ba nhóm: nhóm "+" gồm các d i > 0; nhóm "-" gồm các di < 0 và nhóm còn lại
tạm gọi là nhóm "không".
Xếp hạng riêng từng nhóm và tính hai tổng hạng của nhóm "+" và nhóm"-", cỏc
giỏ trị di bằng nhau tớnh hạng theo hạng trung bỡnh. Gọi t j là số quan sỏt của cỏc nhúm
cú hạng bằng nhau.
Thống kê Wilconxon- T nhận giá trị của tổng hạng nhỏ với các đặc trưng:
n(n + 1)
4
E(T) =
;
n(n + 1)( 2n + 1)
24
Var(T) =
-

n

∑ (t
j =1

3
j

− t j ) / 48

(5.11)

T − E (T )
Với n đủ lớn biến Z = Se(T ) phân phối xấp xỉ chuẩn N(0,1).
Nếu Zqs < - uα , giả thuyết H0 bị bác bỏ.
Chú ý rằng kiểm định này chỉ sử dụng cho mẫu lớn, thí dụ bằng số nói trên chỉ có
tính chất mô tả phương pháp.
Có thể sử dụng kiểm định dấu với các tính toán ở bảng sau:
Chuyên gia
A
B
C
D
E
F
G
H
I
J

Sản phẩm c.sở I
6
4
5
8
7
6
7
8
6
8

Sản phẩm c.sở II
8
9
4
7
8
5
9
8
7
9

Sử dụng kiểm định giá trị trung vị (0,5) ta có:

Chênh lệch
-2
-5
1

1
-1
1
-2
0
-1
-1

Dấu
+
+
+
0
-

H0: p = 0,5 với H1: p < 0,5.

Số dấu khác không là n= 9, số dấu "+" là 3. Sử dụng phân phối nhị thức p = 0,5. n = 9 ta
có: P(X<=3) = 0,2539.
Như vậy giả thuyết H0 có thể đúng với mức xác suất 25,39%. Nếu bác bỏ H 0
chúng ta chịu mức sai lầm loại 1 tương ứng với mức xác suất trên.

17

KiÓm ®Þnh phi tham sè
thùc hµnh

Thèng kª

Thực tế kiểm định Wilcoxon được sử dụng không chỉ kiểm định tính đối xứng
của hai mẫu, kiểm định này hoàn toàn có thể sử dụng để kiểm định quan hệ của hai biến
ngẫu nhiên trong cùng một mẫu. Về mục đích, kiểm định Wilcoxon trong trường hợp này
như kiểm định Khi bình phương, tuy nhiên kiểm định này dựa trên cơ sở kiểm định hạng.
Sau đây ta xem xét cách thực hiện kiểm định này trên SPSS.
Với tệp GSS93 ta kiểm định giả thuyết số con của người được phỏng vấn và số anh chị
em ruột có quan hệ hay độc lập. Kiểm định này thực chất là kiểm định tương quan của số
con theo dòng tộc:
Chương trình chi tiết như sau
GET FILE='C:\Program Files\SPSS\GSS93 subset.sav'.
NPAR TEST
/WILCOXON=sibs WITH childs (PAIRED)
/STATISTICS DESCRIPTIVES
/MISSING ANALYSIS.
Kết quả kiểm định
NPar Tests
Descript ive St at ist ics
N
Number of Brothers
and Sisters
Number of Children

Mean

Std.
Deviation

Minimum

Maximum

1495

3.71

2.98

0

22

1495

1.85

1.68

0

8

Wilcoxon Signed Ranks Test
Ranks
N
Number of Children Number of Brothers
and Sisters

Negative Ranks
Positive Ranks
Ties

Total

992a
292b
207c
1491

Mean
Rank
694.02
467.48

Sum of
Ranks
688464.50
136505.50

a. Number of Children < Number of Brothers and Sisters
b. Number of Children > Number of Brothers and Sisters
c. Number of Brothers and Sisters = Number of Children

18

KiÓm ®Þnh phi tham sè
thùc hµnh

Thèng kª

b

T est St at ist ics

Number of
Children - Number
of Brothers and
Sisters
Z
-20.893a
Asymp. Sig. (2-tailed)
.000
a. Based on positive ranks.
b. Wilcoxon Signed Ranks Test

Kết quả kiểm định này cho thấy có quan hệ tương quan giữa hai biến số con của người
được phỏng vấn và số con của cha mẹ họ.
2- Kiểm định tương quan hạng Spearman
Kiểm định tương quan hạng Spearman thường thực hiện với hai biến ngẫu nhiên
trên cùng một mẫu ngẫu nhiên nhiều chiều. Hệ số tương quan hạng được thành lập với
mục đích đo quan hệ của hai biến (không nhất thiết là quan hệ tuyến tính). Như vậy, yêu
cầu đối với hai biến được kiểm định phải là hai biến định lượng hoặc hai biến có thang
đo thứ bậc như nhau.
Thủ tục cụ thể tóm tắt như sau:
Giả sử X và Y là hai thành phần của một biến ngẫu nhiên nhiều chiều, với mẫu
ngẫu nhiên kích thước n cần kiểm định giả thuyết X và Y độc lập với giả thuyết đối X và
Y có quan hệ nào đó.
Xếp hạng của các quan sát mẫu cho X i và Yi. Gọi các hạng này tương ứng là
di(X) và di(Y)
Tính chênh lệch hạng di= di(X)- di(Y)
Hệ số tương quan hạng Spearman được tính theo công thức sau:
n

rs =

1−

6∑ di2
i =1

n(n 2 − 1) .

(5.12)

Với n nhỏ chúng ta sử dụng bảng giá trị tới hạn của thống kê r s (bảng N). Nếu
giá trị quan sát nằm ngoài lân cận giá trị tới hạn của 0 ta bác bỏ H0.
Với n lớn ta có thể sử dung thống kê Z = r s n − 1 , thống kê này phân phối xấp xỉ
chuẩn N(0,1). Nếu Zqs>Uỏ/2 chúng ta có thể kết luận hai biến nói trên không độc lập.
Thớ dụ 13: Xột một mẫu nhỏ từ GSS93subset với biến X là số anh chi em ruột và Y là
số con mong muốn của người được điều tra. Có thể dùng kiểm định Spearman kết luận
hai biến này độc lập không?. Biết số liệu quan sỏt là:

19

KiÓm ®Þnh phi tham sè
thùc hµnh

X
Y
X
Y

0
1
15
2

2
1
1
2

Thèng kª

3
2
1
2

7
2
7
2

1
2
4
3

2
2

3
3

3
2
2
3

4
2
2
3

2
2
7
3

4
2
9
3

1
2
3
4

1
2

6
4

3
2

Các tính toán cụ thể như sau
X
0
2
3
7
1
2
3
4
2
4
1
1
3
15
1
1
7
4
3
2
2
7

9
3
6

Y
1
1
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
3
3
3
3
3
3
4
4

Rank(x)
1
9
14
22
4
9
14
18
9
18
4
4
14
25
4
4
22
18
14
9
9
22
24
14
20

Rank(y)
d(i)

1,5
-0,5
1,5
7,5
10
4
10
12
10
-6
10
-1
10
4
10
8
10
-1
10
8
10
-6
10
-6
10
4
10
15
10
-6

10
-6
10
12
20,5
-2,5
20,5
-6,5
20,5
-11,5
20,5
-11,5
20,5
1,5
20,5
3,5
24,5
-10,5
24,5
-4,5
Sum (d2i)=

Hệ số tương quan Spearman tính được là:

d2(i)
0,25
56,25
16
144
36

1
16
64
1
64
36
36
16
225
36
36
144
6,25
42,25
132,25
132,25
2,25
12,25
110,25
20,25
1385.5

r s= 0,467. Giỏ trị tới hạn của

rs(25;0,05)= 0,3977 vậy chúng ta bác bỏ giả thuyết hai biến X, Y độc lập.
3- Kiểm định Mann-Whitney
Khác với hai kiểm định trên, kiểm định Mann-Whitney được thiết lập để kiểm
định tính độc lập của hai mẫu bất kỳ (không yêu cầu cùng kích thước). Tuy nhiên, điểm
không thay đổi ở đây là các biến là các biến định lượng hoặc biến có thang đo thứ bậc
như nhau. Giả thuyết được chọn có thể thay đổi theo mục đích phân tích, nhưng thông

thường đây là tiêu chuẩn kiểm định về sự thuần nhất của 2 mẫu (2 mẫu cựng tổng thể)
hoặc đối với các giá trị trung tâm của các biến. Vì vậy, đôi khi người ta vẫn sử dụng cho

20

KiÓm ®Þnh phi tham sè
thùc hµnh

Thèng kª

kiểm định sự khác biệt của một biến, theo các dấu hiệu như thủ tục phân tích phương sai
(xem chương 6).
Thủ tục như sau:
Giả sử X và Y là hai biến ngẫu nhiên, với hai mẫu ngẫu nhiên kích thước n X và
nY.
Trộn hai mẫu và tính hạng cho các quan sát i=1..n; (n= nx + ny).
Với mỗi biến X và Y tính tổng hạng riêng, ký hiệu RX, RY.
Thiết lập các thống kê:


ni (ni + 1) 

nx ny −  Ri −
÷
2



U =

 nx n y +  R − ni ( ni + 1) 
 i
÷
 2
2



ni (ni + 1) nx n y
≤
2
2
n (n + 1) nx n y
khi Ri − i i
>
2
2

khi Ri −

(5.13)

Với kích thước hai mẫu đủ lớn (ít nhất 10 quan sát cho mỗi mẫu) các biến U có phân
phối với các đặc trưng sau:
nX nY (nX + nY + 1)
12
E(U) =0,5 nXnY và Var(U) =
.

(5.14)

Hoặc phương sai điều chỉnh khi có nhiều hạng tính trung bỡnh:

Var(U) =

nx n y  n3 − n n ti3 − ti 
−∑

÷
n(n − 1)  12
i =1 12 

Khi nxny<400 và nxny/2 + min(nx, ny) <220.
U − E (U )
Chuẩn hoá biến này ta có: Z = Se(U ) . Sử dụng phân phối N(0,1) ta có kết luận về
các giả thiết.
Chú ý rằng nếu kích thước mẫu bằng nhau (m), thì hai thống kê U của kiểm định
Mann -Whitney và W của kiểm định Wilcoxon có quan hệ sau:
U +W =

m(m + 2n + 1)
2

Kết quả là hai kiểm định tương đương nhau khi chuẩn hoá U và W.
Thí dụ 14: Bảng sau đây cho số liệu về số con mong muốn của theo giới tính của người
được điều tra. Phải chăng số con mong muốn của hai giới này độc lập với nhau?
Nữ (F)

1

1

2

2

2

2

2

2

2

2

3

3

Nam (M)

2

2

2

2

2

2

2

3

3

3

3

4

1.5

1.5

10

10

10

10

10

10

10

10

20,5

20,5

Rank(F)

4

24,5

21

KiÓm ®Þnh phi tham sè
thùc hµnh

Rank(M)

10

Tổng hạng:

10

Thèng kª

10

10

10

10

10

20,5

20,5

20,5

20,5

24,5

RF =148,5; RM =176,5. nF=13; nM=12
U =57,5; E(U)=78; Var(U)=322; S(U)= 17,94
|Zqs| = 1,1424

Với mức ý nghĩa 5% cú thể kết luận về số con mong muốn có thể xem là những người
được điều tra ở cùng một tổng thể (không có mong muốn khác nhau theo gới tính).

Thớ dụ 15: Kiểm định Mann-Whitney về số con của những người được phỏng vấn ở hai
mức học vấn khác nhau, được thực hiện nhờ SPSS như sau:
NPAR TESTS
/M-W= childs BY degree2(1 0)
/MISSING ANALYSIS.

Mann-Whitney Test
Ranks

Number of Children

College Degree
No College degree
College degree
Total

N
1146
346
1492

Mean
Rank
776.68
646.52

Sum of
Ranks
890081.00
223697.00

a
T est St at ist ics

Number of
Children
Mann-Whitney U
163666.000
Wilcoxon W
223697.000
Z
-5.048
Asymp. Sig. (2-tailed)
.000
a. Grouping Variable: College Degree

Trong kết quả này kiểm định Wilcoxon chỉ được tính trên mẫu 346 quan sát. Kết luận
của cả hai kiểm định như nhau, đó là: ở hai mức học vấn khác nhau số con không như
nhau.
4- Kiểm định Friedman về sự thuần nhất của k mẫu
Kiểm định Friedman là một kiểm định trên cơ sở hạng về sự thuần nhất của k
mẫu hay nói cách khác nó kiểm tra giả thuyết cho rằng k biến ngẫu nhiên có cùng phân
phối xác suất. Trong nhiều trường hợp phân phối xác suất này không được xác định
trước.

22

KiÓm ®Þnh phi tham sè
thùc hµnh

Thèng kª

Nếu có n quan sát cho k biến, với mỗi quan sát ta có n giá trị của k biến. Xếp
n

hạng (rankj(i)) của các giá trị này trong mỗi quan sát. Gọi

C 2j = ∑ ( rank j (i ) )
i =1

2

. Gọi tij là

số biến cú giỏ trị quan sỏt bằng nhau ở quan sỏt thứ i có hạng như nhau.
Thống kê:
k
12
C 2j − 3n( k + 1)
∑
nk (k + 1) j =1
χ2 =
Tij
1− ∑
2
i , j nk ( k − 1)

(5.15)

với Tij= tij3 – tij. Thống kê trên cũng được gọi là thống kê Friedman
Với giả thuyết các biến có cùng phân phối thì thống kê trên phân phối Khi bình
phương (k-1) bậc tự do.
Giả thuyết các biến có cùng phân phối bị bác bỏ với mức ý nghĩa α nếu giá trị
2
quan sát của thống kê trên vượt quá mức tới hạn χ α (k − 1) .

Các kiểm định phi tham số được giới thiệu trong chương này chỉ là một bộ phận
nhỏ của các phương pháp kiểm định phi tham số hiện nay. Chúng ta có thể tìm thấy các
thủ tục kiểm định mở rộng của các kiểm định trên, cho nhiều biến, nhiều bộ phận mẫu
hay nhiều mẫu, đã được thiết lập trên các phần mềm thống kê nói chung và SPSS nói
riêng. Phần khai thác trên SPSS và Winstata cho phép xem xét thêm các kiểm định như
vậy.
iV- Winstata với các kiểm định phi tham số
Winstata cung cấp một lớp các thủ tục kiểm định phi tham số khá phong phú và
không kém tiện lợi. Sau đây chúng ta lần lượt xem xét các thủ tục này với tệp số liệu
Hhexpn98.dta.
1- Các kiểm định dựa trên hạng
+ Kiểm định Wilcoxon
Lệnh: signrank mcpi = mcpir
Cho kết quả:
Wilcoxon signed-rank test
sign

|

obs

positive |

0

negative |

5718

sum ranks
0

expected
8978689.5

17957379 8978689.5

23

KiÓm ®Þnh phi tham sè
thùc hµnh

zero
all

|
|

Thèng kª

281

39621

5999

17997000

39621
17997000

unadjusted variance 1.800e+10
adjustment for ties -43437313
adjustment for zeros -1858885.3
adjusted variance

1.795e+10

Ho: mcpi = mcpir
z = -67.016
Prob > |z| = 0.0000
Có thể kết luận rằng hai biến không độc lập.
+ So sánh hai trunh vị nhờ kiểm định dấu
Lệnh: signtest rcpif= rcpinf
Cho kết quả:
Sign test
sign |
observed
positive |
1816
negative |
4183

zero |
0
all |
5999
One-sided tests:

expected
2999.5
2999.5
0
5999

Ho: median of rcpif - rcpinf = 0 vs. Ha: median of rcpif - rcpinf > 0
Pr(#positive >= 1816) =
Binomial(n = 5999, x >= 1816, p = 0.5) = 1.0000
Ho: median of rcpif - rcpinf = 0 vs. Ha: median of rcpif - rcpinf < 0
Pr(#negative >= 4183) =
Binomial(n = 5999, x >= 4183, p = 0.5) = 0.0000
Two-sided test:
Ho: median of rcpif - rcpinf = 0 vs. Ha: median of rcpif - rcpinf ~= 0
Pr(#positive >= 4183 or #negative >= 4183) =
min(1, 2*Binomial(n = 5999, x >= 4183, p = 0.5)) = 0.0000
+ Kiểm định Mann-Whitney
Lệnh: ranksum rcpif, by(urban98)
Cho kết quả:
Two-sample Wilcoxon rank-sum (Mann-Whitney) test
urban98

|

obs

rank sum

expected

24

KiÓm ®Þnh phi tham sè
thùc hµnh

Rural

Thèng kª

|

4269

10175345

12807000

Urban |

1730

7821655

5190000

combined|

5999

17997000

17997000

unadjusted variance 3.693e+09
adjustment for ties -36291408
adjusted variance

3.656e+09

Ho: rcpif(urban98==Rural) = rcpif(urban98==Urban)
z = -43.521
Prob > |z| = 0.0000
+ Kiểm định Kruskal-Wallis
Lệnh: kwallis mcpi, by(urban98)
Cho kết quả:

Rural |

4269

10175345

12807000

|

1730

7821655

5190000

combined |

5999

17997000

17997000

Urban

unadjusted variance 3.693e+09
adjustment for ties -36291408
adjusted variance

3.656e+09

Ho: rcpif(urban98==Rural) = rcpif(urban98==Urban)
z = -43.521
Prob > |z| = 0.0000
2- Kiểm định Khi bình phương
+ Lệnh Tabulate và các kiểm định Khi bình phương

Winstata cung cấp các kiểm định Khi bình phương như các tự chọn của lệnh lập
các bảng tiếp liên.
a- Với số liệu đơn (không tần số) chúng ta có thể chọn lệnh
lab Danh_sách_biến, lựa_chọn kiểm_định
Các lựa chọn có thể:
chi2

Tiêu chuẩn Khi bình phương với thống kê Pearson

lrchi2 Tiêu chuẩn Khi bình phương với logarit hàm hợp lý
gamma Kiểm định Kruskal-Goodman
taub

Kiểm định với hệ số Kandall tau'b

V

Kiểm định với hệ số Cramer

all

Chọn mọi kiểm định

25

KIỂM ĐỊNH PHI THAM SỐ

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về