Tải bản đầy đủ (.docx) (43 trang)

Chuong 5 kiem dinh phi tham so

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (462.87 KB, 43 trang )

KiÓm ®Þnh phi tham sè

Thèng kª thùc hµnh

Chương 5
Kiểm định phi tham số
NỘI DUNG
Chương này dành riêng cho các kiểm định phi tham số, đây là các kiểm định cơ
bản thường được tiến hành để xác định tính chất của các tổng thể thông qua các bộ số
liệu hay các mẫu ngẫu nhiên. Các kiểm định quan trọng hơn cả là kiểm định về dạng
phân phối thực nghiệm và sự phù hợp của chúng với phân phối lý thuyết. Chương này
cũng dành một phần quan trọng cho việc kiểm định các phân phối thông dụng như phân
phối chuẩn, Poison, Đều, Mũ. Trong một vài trường hợp các kiểm định cũng được trình
bày như một kỹ thuật, ngoài ra các kiểm định đều có thể nhận được từ các phần mềm
ứng dụng. Có thể chia nội dung kiểm định phi tham số thành hai phần, đó là kiểm định
Khi bình phương và các kiểm định phi tham số khác mà chủ yếu là các kiểm định dựa
trên các hệ số tương quan hạng. Một số thủ tục, các tính toán cụ thể sẽ được giới thiệu để
người học có thể tỡnh toỏn độc lập không cần đến sự trợ giúp của các phần mềm chuyên
dụng. Về phần mềm ứng dụng, chỳng tụi dành một phần riêng để giới thiệu các kiểm
định phi tham số của SPSS, với một số kiểm định không được trình bày cơ sở lý thuyết.
YấU CẦU
Sau khi nghiờn cứu chương này người học cần đạt được một số yêu cầu sau:
- Phõn biệt rừ kiểm định phi tham số và kiểm định về giá trị các tham số của các
biến ngẫu nhiên.
- Nắm được một cách thổng quát cách tiếp cận kiểm định sự phù hợp của các
phân phối thực nghiệm với công cụ kiểm định Khi bỡnh phương.
- Nắm được cách thức dùng các kiểm định dấu trong một số bài toán cụ thể.
- Áp dụng thuần thục các kỹ năng kiểm định dựa trên tiêu chuẩn Khi bỡnh
phương.
- Nắm được thuật toán các kiểm định dạng phân phối đặc biệt là các kiểm định
Jacque-Bera, Kolmogorov, Kolmogorov-Simirnov. Cách thức sử dụng các kỹ thuật này


trên SPSS.
- Cỏch hỡnh thành cỏc hệ số tương quan hạng và sử dụng các hệ số này trong
từng bài toán kiểm định các quan hệ không tuyến tính, phi tham số.
- Sử dụng thành thạo các kiểm định trên Winstata và SPSS có liên quan.

1


KiÓm ®Þnh phi tham sè

Thèng kª thùc hµnh

I. kiểm định khi bình phương
1- Kiểm định sự phù hợp của qui luật thực nghiệm
Kiểm định Khi bình phương được dùng phổ biến trong việc kiểm định giả thuyết
về dạng phân phối. Kiểm định này dựa trên cơ sở đánh giá tổng bình phương khác biệt
giữa giá trị lý thuyết theo giả thuyết và giá trị thực nghiệm tương ứng. Để đưa ra các giả
thuyết về dạng phân phối, người ta thường mô tả và phân tích sơ bộ hiện tượng, đặc điểm
của biến ngẫu nhiên thông qua số liệu quan sát. Tuy vậy, trong nhiều trường hợp các
phân tích này có thể bị bỏ qua, vì nhận thức chủ quan hay kinh nghiệm của người phân
tích.
Thống kê Khi bình phương thiết lập trên một mẫu kích thước n có thể mô tả tổng
quát nhờ công thức sau:
n

χ2 = ∑
i =1

(Oi − E i ) 2
Ei


(5.1)

Trong đó: Ei là giá trị lý thuyết theo giả thuyết, O i là giá trị thực nghiệm tương ứng. Cỏc
giỏ trị Oi và Ei có thể là các tần số của các dấu hiệu hoặc giá trị thực của các biến ngẫu
nhiên. Trong các kiểm định cụ thể chúng ta sẽ mô tả cụ thể cách chọn hai loại giá trị này.
a- Kiểm định giả thuyết về phân phối đều
Phân phối đều trên đoạn [a, b] là phân phối liên tục, mà biến ngẫu nhiên tương
ứng có khả năng nhận các giá trị khác nhau trong đoạn này bằng nhau. Đây cũng là
trường hợp minh họa dễ dàng nhất đối với các kiểm định về dạng phân phối của các biến
ngẫu nhiên lien tục. Đặc điểm chính là thực tế quan sát chúng ta nhận được các giá trị
rời rạc, kiểm định này thực hiện trên cơ sở phân khoảng và rời rạc hoá phân phối đều
như sau: Giả sử X nhận các giá trị {x i} trong k khoảng thời gian có độ dài bằng nhau.
Nếu X phân phối đều theo thời gian thì các giá trị của X trong mỗi khoảng thời gian là
trung bình của X (x* chẳng hạn). Thống kê khi bình phương được tính theo công thức
k

χ2 = ∑
i =1

( xi − x*) 2
x*
thống kê này tuân theo qui luật Khi bình phương (k-1) bậc tự do nếu

X phân phối đều. Với mức ý nghĩa α cho trước, giả thuyết X phân phối đều bị bác bỏ
nếu giá trị quan sát lớn hơn giá trị tới hạn χ2(k-1) mức α.
Thí dụ 1: Quan sát 12 tháng số lượng lương thực cung cấp cho 1 hộ người ta nhận được
kết quả sau
Thán
g


1

2

3

4

5

6

7

8

9

10

11

12

2


KiÓm ®Þnh phi tham sè


SL

Thèng kª thùc hµnh

25.0 32.0 33.0 28.0 19.0 31.0 27.0 28.0 17.0 18.0 21.0 20.0

Để tính giá trị thống kê Khi bình phương ta lập bảng sau:
i

xi

x*

xi -x*

(xi-x*)2/x*

1
2
3
4
5
6
7
8
9
10
11
12


25.0
32.0
33.0
28.0
19.0
31.0
27.0
28.0
17.0
18.0
21.0
20.0

24.917
24.917
24.917
24.917
24.917
24.917
24.917
24.917
24.917
24.917
24.917
24.917

0.083
7.083
8.083
3.083

-5.917
6.083
2.083
3.083
-7.917
-6.917
-3.917
-4.917

0.00028
2.01366
2.62235
0.38155
1.40496
1.48523
0.17419
0.38155
2.51533
1.92001
0.61566
0.97018

TB

24.917

χ2qs= 14.48945

Tra bảng giá trị phân phối χ2 ta có: χ20.05 (11) = 19.675. So sánh với giá trị quan sát, ta
thấy không có cơ sở bác bỏ giả thuyết cho rằng lượng lương thực cung cấp cho hộ là đều

đặn (phân phối đều theo thời gian).
b- Kiểm định giả thuyết về cấu trúc tổng thể
Giả thiết về cấu trúc tổng thể theo các dấu hiệu của 1 biến định tính hay các khoảng của
1 biến định lượng, có thể qui về một phân phối xác suất của một biến ngẫu nhiên rời rạc.
Có thể xem đây là trường hợp tổng quát kiểm định phân phối xác suất của các biến ngẫu
nhiên rời rạc với việc sử dụng tiờu chuẩn Khi bỡnh phương để kiểm định cấu trúc tổng
thể. Không mất tính tổng quát, có thể mô tả kiểm định này qua một thí dụ cụ thể sau đây.
Thớ dụ 2: Giả sử mức sống của cư dân một vùng có thể phân chia 5 bậc như sau: quá
nghèo, nghèo, trung bình, khá và giàu. Có người cho rằng tỷ lệ dân cư ở các mức sống
tương ứng là:
Mức sống
quá nghèo
nghèo
Trung bình
Khá
Giàu
Tỷ lệ (%)
12
25
40
20
3
Với mẫu ngẫu nhiên 1000 quan sát người ta thấy số cư dân có các mức sống như sau:
Mức sống
quá nghèo
nghèo
Trung bình
Khá
Giàu
Số cư dân

135
280
440
100
45
Ta có thể tính giá trị quan sát của thống kê Khi bình phương nhờ bảng sau:
Giá trị lý thuyết Giá trị quan sát (Oi -Ei)2/Ei
(Ei)
(Oi)
120
135
1.875
250
280
3.6
400
440
4
200
100
50
30
45
7.5

3


KiÓm ®Þnh phi tham sè


Thèng kª thùc hµnh

1000
1000
66.975
Ta có: χ 2qs= 66.975. Với mức ý nghĩa 5%, tra bảng phân phối Khi bình phương ta nhận
được: χ20.05 (4) = 9.4877. Như vậy đủ cơ sở bác bỏ giả thuyết về cấu trúc mức sống dân
cư nói trên.
c- Kiểm định giả thuyết về phân phối Poison
Phân phối Poison là một trong những phân phối có nhiều ứng dụng trong thực tế,
đây là phân phối của các hiện tượng “hiếm”. Có nhiều cách nhận biết một biến ngẫu
nhiên X phân phối Poison, như dựa vào hiện tượng trung bình xấp xỉ phương sai; tính
chất của dòng biến cố theo thời gian... . Chúng ta nêu thủ tục, nhờ đó có thể kiểm tra lại
chính các phân tích có tính định tính này nhờ tiêu chuẩn Khi bình phương qua một thí dụ
cụ thể.
Thớ dụ 3: Quan sát số lần máy bay bay qua một không phận A, người ta có số liệu (k và
nk) và bảng tính toán sau:
Số lần
(k)
0
1
2
3
4
>=5

số phút
(nk)
10
23

45
49
32
41

Pk
(λ=2.965)
0.05156
0.152877
0.22664
0.223996
0.166037
0.17889

n’= nPk

(n-n’)2/n’

10.31209
30.57536
45.32797
44.79914
33.20736
35.77807

0.009445
1.876873
0.002373
0.393918
0.043898

0.762157
3.088665

200
1
200
Ta có: χ20.05 (5) =11.07048, vậy không đủ cơ sở bác bỏ giả thuyết số máy lần máy bay
qua không phân A phân phối Poison.
d- Kiểm định giả thuyết về phân phối chuẩn
Phân phối chuẩn là phân phối liên tục, tuy vậy trong thực hành chúng ta luôn
nhận được các giá trị quan sát rời rạc. Để kiểm định giả thuyết về phân phối chuẩn của
một biến ngẫu nhiên X, người ta dựa trên các tần số theo khoảng. Thủ tục kiểm định như
sau:
Chia vựng giỏ trị quan sỏt thành k khoảng dạng (x i , xi+1); gọi ni là số giỏ trị quan
sỏt thuộc khoảng (xi , xi+1).
k

Kích thước mẫu

n = ∑ ni
i =1

.

Tớnh giỏ trị trung bỡnh khoảng i:

xi =

x i + x i +1
2


4


KiÓm ®Þnh phi tham sè

Thèng kª thùc hµnh

k

Tớnh giỏ trị trung bỡnh mẫu:

x = ∑ ni xi
i =1

Tính giá trị phương sai mẫu theo các giá trị trung tâm x i , từ đó tính độ lệch tiêu
chuẩn mẫu s.
x −x
zi = i
s
Chuẩn hóa các khoảng ước lượng với các giá trị biên là:
,
Tỡnh cỏc tần số lý thuyết: n i = nP(z i < Z < z i +1 ) với Z là biến n.n phõn phối

N(0,1)
Tớnh giỏ trị quan sỏt của thống kờ Khi bỡnh phương (

2
χqs


).

2
So sỏnh với giỏ trị tới hạn χα (k − 1) và kết luận.
Thớ dụ 4: Sau đây là kiểm định về giả thuyết thu nhập ( X) của viên chức vùng A phân
phối chuẩn, (Z là biến chuẩn hoá của X).

Khoảng
Giá trị
giá trị trung tâm
(xi .. xi+1)
x
( i)
570..580
575
580.. 590
585
590.. 600
595
600.. 610
605
610.. 620
615
620.. 630
625

Số
người ni x i
(ni)
20

142
310
370
128
30

x
n ( i - x )2
i

11500
83070
184450
223850
78720
18750

Zi

Zi+1

ni’=
nP(Zi
(ni’-ni)2/ni’

23.86
135.29
326.02
335.58

147.56
27.59

0.62478
0.33247
0.78778
3.52996
2.59467
0.21024

12842.31 -2.906 -1.948
33414.82 -1.948 -0.990
8839.836 -0.990 -0.032
8034.772 -0.032 0.925
27509.2 0.9258 1.883
18243.47 1.883 2.840

1000 600340 108884.4
Độ lệch TC (s)=10.439
=11.07048
Trung bình( x ) =600.34

χ 2qs=
;

χ

8.0798
2


0.05

(5)

Kết quả trên cho thấy có thể xem thu nhập của viên chức hành chính phân phối chuẩn.
2- Kiểm định tính độc lập của hai dấu hiệu
Kiểm định tính độc lập của hai dấu hiệu định tính nhờ tiêu chuẩn Khi bình
phương là kiểm định dựa trên cơ sở kiểm định sự đồng nhất của phân phân phối xác suất
đồng thời và tích hai phân phối biên. Với biến ngẫu nhiên hai chiều (X,Y) chúng ta đã
biết rằng nếu X và Y độc lập thì hàm mật độ đồng thời f(x,y) bằng tích hai hàm mật độ
f1(x) và f2(y). Dựa trên cơ sở này người ta tiến hành kiểm định tính độc lập của hai dấu
hiệu.
Giả sử A và B là hai biến ngẫu nhiên định tính. A có p dấu hiệu và B có q dấu
hiệu. Với mẫu ngẫu nhiên kích thước n ta có bảng tiếp liên
A1
B1
B2
.........

A2
n11
n21
...

n12
n22
....

...........
Ap

............
n1p
.........
n2p
..........
.........

5


KiÓm ®Þnh phi tham sè

Thèng kª thùc hµnh

nq1

Bq

Gọi:

nq2

Ri =ni1 + ni2 + .... + nip

(i=1...q)

Cj =n1j + n2j + .... + npj

(j=1..p)


q

n=

................

nqp

;

p

∑∑ n
i =1 j =1

ij

Phân tích dòng theo cột:
Theo mỗi dòng ta có các tần số Ri. Tỷ lệ Ri/n là tần suất của dấu hiệu Bi.
Hãy xét một cột j ứng với dấu hiệu A j. Nếu A, B độc lập thì theo tỷ lệ R i/n mỗi ô
(i,j) sẽ có tần số lý thuyết là CjRi/n.
Như vậy, chênh lệch tần suất và xác suất trong ô (i,j) có thể tính như sau:
(Oij − E ij ) = (nij −

q

p

χ = ∑∑
2


i =1 j =1

(nij −

Ri C j
n

Ri C j

n
Ri C j

)

)2

n



(5.2)

A, B độc lập thống kê này có phân phối χ2 với (p-1)(q-1) bậc tự do. Với mức ý nghĩa α
cho trước ta kết luận A, B không độc lập nếu χ2qs >χ2α [(p-1)(q-1)].
Thí dụ 5: Với tệp số liệu GSS93 ta có thể kiểm định giả thuyết cho rằng sự ưa thích nhạc
cổ điển và nhạc đồng quê châu Âu độc lập với nhau. Các tính toán từ bảng tiếp liên như
sau:
Count ry West ern Music * Classical Music Crosst abulat ion
Count


Country
Western
Music

Total

Like Very Much
Like It
Mixed Feelings
Dislike It
Dislike Very Much

Like It
Very
Much
50
77
89
33
16
265

Classical Music
Mixed
Feeling
Dislike
Like It
s
It

92
74
78
200
117
96
90
92
33
47
40
24
16
10
6
445
333
237

Dislike It
Very
Much
45
43
20
8
13
129

Total

339
533
324
152
61
1409

6


KiÓm ®Þnh phi tham sè

Thèng kª thùc hµnh

(nij −

Ri C j

n
Ri C j

)2

n

Giá trị

2.96876
5.390035
12.92389

0.681022
1.786564

tại các ô (i,j)

2.119857
5.956122
1.485195
0.021068
0.553482

0.467262
0.638465
3.107843
0.462626
1.353052

7.718278
0.449345
8.480528
0.09605
1.76908

6.281812
0.688995
3.148135
2.515192
9.845455

Giá trị thống kê Khi bình phương: 80.90812. Kết luận nhận được là bác bỏ ý kiến trên.

Kết quả sau nhận được từ SPSS với chương trình:
CROSSTABS
/TABLES=country BY classicl
/STATISTIC=CHISQ.
Chi- Sq uare T est s

Pearson Chi- Square
Likelihood Ratio
Linear- by- Linear
Association
N of Valid Cases

Value
80.908 a
77.941
16.868

16
16

Asymp.
Sig.
(2- sided)
.0 00
.0 00

1

.0 00


df

1409

a. 0 cells (.0%) ha ve expected count less than 5. The
minimum expected count is 5.58.

3. Kiểm định dấu (sign test)
Kiểm định dấu là một trong những cách thức kiểm định đơn giản nhưng có nhiều
ứng dụng. Đơn giản nhất là kiểm định giả thuyết về trung vị của một biến X nhờ một
mẫu ngẫu nhiên. Tư tưởng của kiểm định dấu được mở rộng cho nhiều kiểm định khác
như kiểm định xác suất, kiểm định tính ngẫu nhiên của một mẫu.... . Thực tế kiểm định
này có thể qui về kiểm định cấu trỳc tổng thể đó trỡnh bày ở trờn, việc sử dụng các tiếp
cận khác có thể làm cho việc kiểm định thuận tiện hơn.
a- Kiểm định giá trị trung vị
Giả sử X là một biến ngẫu nhiên, gọi M d(X) là giá trị trung vị của X. Giả thuyết
H0 là Md(X)= m0 thì P(X<=m0) =0.5, như vậy các giá trị quan sát từ một mẫu ngẫu nhiên
có khả năng chia đều về hai phía của m 0. Nếu điều đó thực sự không đúng thì hoặc là giả

7


KiÓm ®Þnh phi tham sè

Thèng kª thùc hµnh

thuyết H0 sai hoặc là mẫu được chọn thực tế là mẫu không ngẫu nhiên. Trước tiên ta xem
xét thủ tục kiểm định giá trị trung vị.
Với một quan sát mẫu, dấu của quan sát là dấu "-" nếu giá trị quan sát nhỏ hơn
m0, dấu của quan sát là dấu "+" nếu giá trị quan lớn hơn m 0, các giá trị quan sát đúng

bằng m0 được đánh dấu "0". Nguyên tắc kiểm định là nếu số dấu "-" (hoặc dấu "+") quá
nhỏ hay quá lớn giả thuyết H0 sẽ bị bác bỏ.
Gọi số dấu "+ "(chẳng hạn khi có ít dấu "+") là Y, thì Y phân phối Nhị thức với hai tham
số n và 0.5- B(n, 0.5). Với giả thuyết trờn tại mỗi giỏ trị Y0 (số dấu “+“) quan sát được ta
xác định được P(Y<=Y0) và P(Y>=Y0). Cỏc giỏ trị này là cơ sở để kết luận về giả thuyết
trên với mức ý nghĩa cho trước.
Vỡ việc lựa chọn Y là số dấu “+” hay số dấu”-“ không làm thay đổi phân phối của Y nờn
cú thể giả sử Y0 là số dấu có tần suất nhỏ, nếu xác suất P(Y<=Y0) nhỏ hơn mức ý nghĩa
của kiểm định thì bác bỏ giả thuyết H0, tức là giá trị trung vị không bằng m0.
Thí dụ 6: Có giả thuyết cho rằng thu nhập hộ/tháng ở một thành phố có giá trị trung vị là
500$. Quan sát ngẫu nhiên 100 hộ ta nhận được 66 hộ có thu nhập không thấp hơn
500$/tháng và 34 hộ có thu nhập thấp hơn 500$/tháng. Như vậy số dấu - trong 100 quan
sát là 34. Gọi Y là số dấu - thì Y phân phối B(100, 0.5) và: P(Y<=34)= 0.009; Với mức ý
nghĩa 5% ta bác bỏ giả thuyết trung vị của thu nhập hộ là 500$/tháng.
b- Kiểm định giá trị xác suất
Hoàn toàn tương tự với kiểm định trung vị, ta có thể sử dụng phân phối nhị thức
để tiến hành kiểm định xác suất.
Giả thuyết cần kiểm định là H0: P(A) =p0 và H1: P(A) ≠ p0. Với mẫu ngẫu nhiên
kích thước n (quan sát A n lần), gọi m là số lần xuất hiện A, tương ứng số dấu "+", thì A
không xuất hiện (n-m) lần, tương ứng số dấu "-". Không mất tính tổng quát có thể giả sử
p0 lớn và m nhỏ, gọi Y là số dấu "+" thì Y phân phối B(n, p0). Xác định P(Y<=m) nếu giá
trị xác suất này nhỏ hơn mức ý nghĩa kiểm định thì bác bỏ giả thuyết H0. Trường hợp p0
nhỏ và m lớn hoàn toàn tương tự.
Thí dụ 7: Một dây chuyền sản xuất tự động được coi là bình thường nếu tỷ lệ phế phẩm
không quá 5%. Kiểm tra ngẫu nhiên 50 sản phẩm thấy có 4 phế phẩm, có thể xem là dây
chuyền hoạt động bình thường hay không?
Gọi Y là số phế phẩm thì Y phân phối nhị thức B(50, 0.05).
Như vậy P(Y>=4)= 1 - P(Y<=3) =0.2396. Vậy với mức ý nghĩa 5% không đủ cơ sở cho
rằng dây chuyền hoạt động không bình thường.


8


KiÓm ®Þnh phi tham sè

Thèng kª thùc hµnh

c- Kiểm định tính ngẫu nhiên của mẫu- Kiểm định các đoạn mạch (Runs test)
Một trong những yêu cầu của suy luận thống kê từ mẫu là tính ngẫu nhiên của
mẫu cụ thể phải được đảm bảo. Có nhiều thủ tục kiểm định hay xác nhận tính ngẫu nhiên
của các quan sát, ở đây ta xét việc ứng dụng kiểm định dấu để giải quyết vấn đề này. Giả
sử có n quan sát về X : x1, x2, ...., xn. Theo một dấu hiệu nào đó mà chúng ta xác định làm
tiêu chuẩn ngẫu nhiên, chẳng hạn nếu X là thu nhập hộ ta có thể chọn tiêu chuẩn nhỏ hơn
hay lớn hơn trung bình để xem xét, hoặc thay cho trung bình ta có thể chọn trung vị... .
Với một tiêu chuẩn xem xét xác định các quan sát được chia thành hai nhóm với hai dấu
hiệu "+", "-" theo thứ tự quan sát. Ta gọi dãy các dấu như nhau là một đoạn mạch.
Kiểm định các đoạn mạch được thực hiện như sau:
Gọi: n1 là số dấu "+"; n2 là số dấu "-" và m là số đoạn mạch. Sử dụng bảng tính
các giá trị M1 và M2 cho kiểm định các đoạn mạch, nếu M1ngẫu nhiên, ngược lại ta kết luận mẫu không ngẫu nhiên.
Thí dụ 8: Quan sát số lần ốm đau trong năm và số con của phụ nữ trên 49 tuổi đã từng
kết hôn người ta nhận được số liệu về con của họ như sau: 2 3 2 4 5 3 2 1 1 3 4 6
2 4 3 5 6 3 2. Người ta cho rằng người quan sát đã không quan sát theo thứ tự ngẫu
nhiên ngẫu nhiên vì trung bình số con của phụ nữ đã hết tuổi sinh đẻ trong vùng có số
con trung bình là 2,8. Hãy xác nhận tính ngẫu nhiên nếu có của số liệu quan sát với mức
ý nghĩa 5%.
Ta lập các đoạn mạch như sau:
-+-+++---+++-+++++Ta thấy n1=12 , n2 =7 và số đoạn mạch m=9. Tra bảng M ta có: M1=5, M2=14,
như vậy không đủ cơ sở cho rằng các quan sát đã được thực hiện theo thứ tự không ngẫu
nhiên.

Với n1, n2 >=10

2n1 n 2
+1
n
+
n
1
2
Số đoạn mạch m phân phối xấp xỉ chuẩn với trung bình E(m)=
và phương sai
2n1 n 2 (2n1 n 2 − n1 − n 2 )
2
là: Var(m)= (n1 + n2 ) (n1 + n 2 − 1)
m − E ( m)
Chuẩn hoá biến m ta có:

U=

Var (m)

Nếu |Uqs| > Uα/2 ta bác bỏ giả thuyết số liệu mẫu được quan sát ngẫu nhiên.

9


KiÓm ®Þnh phi tham sè

Thèng kª thùc hµnh


Xắp xếp dấu phần dư et nhận được từ hồi qui Y=a+bX theo chiều tăng của X người ta
nhận được 24 đoạn mạch với 42 dấu "+" và 64 dấu "-". Có thể kiểm định tự tương quan
trong mô hình trên nhờ kiểm định tính ngẫu nhiên về dấu của các phần dư như sau:
m
n1
24
42
E(m)= 51.71698
Se(m)= 4.900433
U=
-5.65603

n2
64

Với mức ý nghĩa 5% ta bác bỏ giả thuyết các sai số ngẫu nhiên không tương quan tuyến
tính với nhau, hay mô hình có tự tương quan.
II. MỘT SỐ KIỂM ĐỊNH DẠNG PHÂN PHỐI THÔNG DỤNG
Phần này giới thiệu một số thủ tục kiểm định dạng phân phối của biến ngẫu nhiên
1 chiều. Các thủ tục kiểm định được trỡnh bày ở đây tập trung cho một số dạng phân
phối như: Phân phối đều; Phân phối Poison; Phân phối mũ và đựac biệt chú trọng đến
phân phối chuẩn.
1- Tiêu chuẩn Kolmogorov
Tiêu chuẩn Konmogorov áp dụng được cho mọi phân phối liên tục, nhưng đây là
tiêu chuẩn dựa trên các tham số lý thuyết xác định ngoài số liệu thống kê. Tiêu chuẩn
này được sử dụng khi đã có một “chuẩn mực” cho đại lượng được nghiên cứu. Chẳng
hạn, một thiết kế kỹ thuật, một quá trình kinh tế hay một quá trình sinh hoá đã xác định
có tính chất lý thuyết, vấn đề còn lại là thực tế đối tượng nghiên cứu có xảy ra như lý
thuyết hay không. Có thể tóm tắt tiêu chuẩn này như sau: Dựa trên cơ sở nào đó người ta
cho rằng X có phân phối F(x, θ*) với θ* đã xác định. Dựa trên quan sát mẫu ta có các giá

trị xi. Gọi phân phối thực nhiệm là F(x) ta có:
D=max| F(xi, θ*)-F(xi) |

(5.3)

Với n đủ lớn biến Y=D n phân phối Kolmogorov với hàm mật độ sau:
 +∞
k −2 k 2 y 2
khi x > 0
 ∑ (−1) e
K ( y ) = k = −∞
0
khi x ≤ 0

Nếu Yqs >kα ta bác bỏ giả thuyết phân phối thực nghiệm phù hợp với phân phối lý thuyết.
Bảng giá trị tới hạn của phân phối Kolmogorov
α


0.5
0.828

0.4
0.895

0.3
0.973

0.2
1.072


0.1
1.224

0.05
1.357

0.02
1.520

0.01
1.627

0.001
1.954

10


KiÓm ®Þnh phi tham sè

6

2

Thèng kª thùc hµnh

8

7


1

6

4

8

Thí dụ 9: Dây chuyền tự động sản xuất đồng hồ đo điện được thiết kế với số sản
phẩm/giờ là biến ngẫu nhiên phân phối chuẩn trung bình mỗi giờ 12 chiếc với độ lệch
chuẩn 2 chiếc. Quan sát 100 giờ sản xuất thực tế có số liệu sau:
Số SF
10
11
12
13
14
Số giờ
18
24
35
16
7
Có thể xem là giây chuyền này hoạt động đúng thiết kế kỹ thuật hay không? Kết luận với
mức ý nghĩa 5%. Ta có bảng so sánh xác suất sau:
X
F(x,θ*)
F(x)
|F(x,θ*)-F(x)|


10
0.158655
0.18
0.021345

11
0.308538
0.42
0.111462

12
0.5
0.77
0.27

13
0.691462
0.93
0.238538

14
0.841345
1
0.158655

Yqs = 0,27x 10=2,7. Ta bác bỏ giả thuyết dây chuyền hoạt động như thiết kế kỹ thuật.
Sau đây là kết quả kiểm định này trên SPSS với biến thu nhập (tn1):
One-Sample Kolmogorov-Smirnov Test


N
Normal Parameters(a,b)
Most Extreme Differences

Mean
Std. Deviation

tn1
15822
3266.27
18199.671

Absolute

.429

Positive

.350

Negative

-.429

Kolmogorov-Smirnov Z
Asymp. Sig. (2-tailed)

53.935
.000


Cú thể kiểm tra giỏ trị thống kờ Z trong bảng này theo cụng thức tớnh giỏ trị Y ở trờn.
2- Tiêu chuẩn Jacque- Bera
Tiêu chuẩn Jacque-Bera kiểm định biến ngẫu nhiên phân phối chuẩn nhờ các đặc trưng
định dạng phân phối.
Với mẫu ngẫu nhiên W(X) kích thước n, ta xác định các hệ số bất đối xứng S
(Skew) và hệ số nhọn K (Kurt). Trong mô tả thống kê ta đã biết nếu X phân phối chuẩn
thì hệ số bất đỗi xứng bàng 1 và hệ số nhọn bằng 3.
Lập thống kê:

 S2 K2 
JB = n 
+
÷
24 
 6
(5.4)
Với n đủ lớn thống kê JB phân phối Khi bình phương 2 bậc tự do.

11


KiÓm ®Þnh phi tham sè

Thèng kª thùc hµnh

Nếu JBqs > χ2α( 2) ta bác bỏ giả thuyết biến ngẫu nhiên X phân phối chuẩn, ngược lại
không đủ cơ sở bác bỏ giả thuyết này.
Chú ý rằng với số liệu mẫu các thống kê ước lượng cho hệ số bất đối xứng và hệ
số nhọn là:
3


n
n
 xi − x 
Skew( X ) =

(n − 1)(n − 2) i =1  s ÷


4

n
n(n + 1)
3(n − 1)2
 xi − x 
Kurt ( X ) =
∑
÷ −
(n − 1)(n − 2)(n − 3) i =1  s  (n − 2)(n − 3)

Với n đủ lớn các giá trị này xấp xỉ bởi công thức tương
ứng với tổng thể:
3

1 n X −X 
Skew( X ) = ∑  i
÷
n i =1  MS 2 
4


1 n X −X 
Kurt ( X ) = ∑  i
÷ −3
n i =1  MS 2 

Thớ dụ 10: Mức xăng tiêu hao cho mỗi km đường đi trên mỗi xi lanh xe du lịch là biến
ngẫu nhiên X. Với 397 quan sát người ta tính được Skew(x)=0,21 và Kurt(x)=-1,197.
Phải chăng X phân phối chuẩn.
Ta tính được: JB = 26,619; P(ữ2(2)> 26,619)=0,00001. Vậy cú thể kết luận X khụng
phõn phối chuẩn.
2- Tiờu chuẩn Kolmogorov-Simirnov
Tiờu chuẩn Kolmogorov-Simirnov cú thể dựng để kiểm định giả thuyết một biến
ngẫu nhiên X phân phối Chuẩn, đều, Poisson hay phõn phối mũ.
Cú thể túm tắt tiờu chuẩn này như sau: Giả sử quan sỏt mẫu Wn(x) là: x1 < x2 < x3 <…<
xm, goi fi là tần số tương ứng của xi. Hàm phõn phối xỏc suất thực nghiệm của x sẽ là:
khi − ∞ < x < x1
0
 k
 ∑ fi

Fˆ ( x ) =  i=1
khi xk ≤ x < xk +1 k = 1..m − 1
 n
khi xm ≤ x < ( +∞ = xm+1 )
1


(5.5)
Gọi F0(x) là phõn phối theo giả thuyết của x.
Phõn phối

Đều

F0 ( x j ) =

F0(x)
x j − min( xi )
max( xi ) − min( xi )

12


KiÓm ®Þnh phi tham sè

Thèng kª thùc hµnh

xj − µ

Chuẩn

F0 ( x j ) = Φ (

Poisson

F0 ( x j ) = ∑

xj

i =0

σ

e− λ λ i
i!

F0 ( x j ) = 1 − e



)

−β xj

Đặt:
 Fˆ ( x j − 1) − F0 ( x j − 1)
Dj = 
0
D* = Fˆ ( x ) − F ( x )

Với phõn phối Poisson:

j

j

0

xj > 0
xj = 0
(5.6)

j


D j = Fˆ ( x j −1 ) − F0 ( x j )
với cỏc phõn phối khỏc:

D*j = Fˆ ( x j ) − F0 ( x j )

(5.7)

Lập thống kờ:
Z = n max ( D j , D*j )

(5.8)

j

0 ≤ Z<0,27
1

−2 2


(Q + Q 9 + Q 25 ); Q = e − Z π / 8 0, 27 ≤ Z < 1
1p=
Z
 2(Q − Q 4 + Q 9 − Q16 ); Q = e −2 Z 2
1 ≤ Z < 3,1


Z ≥ 3,1
0


(5.9)

Nếu p < ỏ bỏc bỏ giả thuyết phõn phối F0(x).
Thớ dụ 11: Dữ liệu mức chi tiờu của/khẩu của cỏc hộ cú mức sống trung bỡnh tại Hà
nội năm 1998 từ VLHS98 được cho ở hai cột đầu của bảng dưới đây. Với mức ý nghĩa
tối thiểu là bao nhiờu là thể xem là chi tiêu/khẩu của các hộ loại này ở hà nồi năm 1998
là biến ngẫu nhiên phân phỗi chuẩn?
Các tính toán sau đây mô tả việc thực hiện kiểm định Kolmogrov-Simirnov
Xi
1924,81
1988,63
2075,64
2096,75
2116,9
2134,08
2139,46
2161,04
2230,95

ni
4
4
5
4
2
9
6
4
4


niXi
7699,24
7954,52
10378,2
8387
4233,8
19206,72
12836,76
8644,16
8923,8

niXi2
14819574
15818597
21541407
17585442
8962531
40988677
27463735
18680376
19908552

Fqs
0,0506
0,1013
0,1646
0,2152
0,2405
0,3544

0,4304
0,4810
0,5316

Fh
0,0445
0,0846
0,1761
0,2054
0,2359
0,2638
0,2728
0,3107
0,4456

Dj
0,03398
0,07486
0,04087
0,02074
0,02328
0,08159
0,11973
0,03546
0,06239

Dj*
0,00613
0,01665
0,01157

0,00976
0,00458
0,09064
0,15754
0,17036
0,08609

13


KiÓm ®Þnh phi tham sè

2242,65
2259,9
2441,87
2445,28
2457,42
2466,72
2506,11
2519,69
2644,47

4
5
3
5
5
5
3
3

4

Thèng kª thùc hµnh

8970,6
11299,5
7325,61
12226,4
12287,1
12333,6
7518,33
7559,07
10577,88

20117916
25535740
17888187
29896971
30194565
30423538
18841762
19046513
27972886

0,5823
0,6456
0,6835
0,7468
0,8101
0,8734

0,9114
0,9494
1,0000

0,4693
0,5044
0,8265
0,8309
0,8461
0,8571
0,8977
0,9096
0,9759

0,0779
0,18095
0,1474
0,09928
0,04698
0,0243
0,00184
0,02652

0,11302
0,14119
0,14297
0,08411
0,03599
0,01631
0,01368

0,03982
0,02411

Các đặc trưng cơ bản và giá trị các thống kê cần tính p như sau:
N=
S=

79
195,77

TB=
2257,751
Zqs= 1,60829

S2 =

38325,89

Fqs là hàm phõn phối thực nghiệm tớnh theo (5.5) và Fh là phân phối với giả thuyết dang
hàm phân phối chuẩn trong đó các tham số được tính theo tham số mẫu.
Với Zqs tính được ở trên ta sử dụng công thức sau để tính p:

{

p = 2(Q − Q 4 + Q 9 − Q16 ); Q = e −2 Z

2

Q= 0,00567; p= 0,01133
Vậy với mức ý nghĩa 5% ta bỏc bỏ giả thuyết biến ngẫu nhiên đang xét phân phối chuẩn,

nhưng với mức ý nghĩa 1% thỡ giả thuyết này khụng bị bỏc bỏ.
Thủ tục tạo tệp chikhau_hanoi.sav được thực hiện từ tệp Hhexpn98v.sav như sau:
USE ALL.
COMPUTE filter_$=(province=17).
VARIABLE LABEL filter_$ 'province=17 (FILTER)'.
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.
FORMAT filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE .
AGGREGATE
/OUTFILE='G:\Gtrinh\TKTH\data\solieu/chikhau_hanoi.sav'
/BREAK=quint98 househol
/pcexp1_mean = MEAN(pcexp1).

Thủ tục kiểm định Kolmogrov-Simirnov, được mô tả bới tính toán như trên với tệp
chikhau_hanoi.sav là:
USE ALL.
COMPUTE filter_$=(quint98 = 3). * Chọn nhúm mức sống trung bỡnh
VARIABLE LABEL filter_$ 'quint98 = 3 (FILTER)'.
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.
FORMAT filter_$ (f1.0).
FILTER BY filter_$.

14


KiÓm ®Þnh phi tham sè

Thèng kª thùc hµnh


EXECUTE .
NPAR TESTS
/K-S(NORMAL)= pcexp1_mean * Chọn thủ tục Kolmogorov-Simrnov
/MISSING ANALYSIS.

Kết quả nhận được từ SPSS:
pcexp1_mean
79

N
Normal Parameters(a,b)
Most Extreme Differences

Mean

2257.7502

Std. Deviation

195.76852

Absolute

.181

Positive

.170

Negative


-.181

Kolmogorov-Smirnov Z

1.608

Asymp. Sig. (2-tailed)

.011

a Test distribution is Normal.

Kết quả nhận được như đó cú trong thớ dụ trờn.
III. các kiểm định trên cơ sở tương quan hạng
1- Kiểm định Wilcoxon
Kiểm định Wilconxon thường được sử dụng khi mẫu ngẫu nhiên thành lập từ hai
mẫu khi quan sát cho cùng một biến. Như vậy từ giả thuyết về tính ngẫu nhiên của mẫu,
khi áp dụng cho hai mẫu ghép một ta có giả thuyết về tính đối xứng của thông tin từ hai
mẫu thành phần. Đây là một kiểm định dựa trên cơ sở kiểm định hạng. Tổng quát hoá
thành một qui trình ta xét một thí dụ, thí dụ này liên quan đến kiểm định dấu mà ta đã nói
ở trên.
Thớ dụ 12: Để đánh giá về chất lượng một loại sản phẩm từ hai cơ sở sản xuất, người ta
chọn ngẫu nhiên 10 cặp sản phẩm của hai cơ sở này và yêu cầu 10 chuyên gia cho điểm
theo thang điểm 10. Kết quả nhận được như sau:
Chuyên

Sản phẩm

Sản phẩm cơ


gia
A
B
C
D
E
F
G
H
I
J

cơ sở I
6
4
5
8
7
6
7
8
6
8

sở II
8
9
4
7

8
5
9
8
7
6

15


KiÓm ®Þnh phi tham sè

Thèng kª thùc hµnh

Có thể cho rằng chất lượng sản phẩm của hai cơ sở như nhau hay không?.
Với kiểm định Wilcoxon ta xắp xếp hạng của các chênh lệch thành hai loại hạng dương
và hạng âm như sau:
Chuyên gia
A
B
C
D
E
F
G
H
I
J

Chênh lệch điểm

Hạng "+" Hạng "-"
-2
4,5
-5
6
1
2
1
2
-1
2
1
2
-2
4,5
0
-1
2
-1
2
Tổng hạng
6
21
Thống kê Wilconxon T nhận giá trị của tổng hạng nhỏ, ở đây T = 6.
Với n là số chênh lệch khác không thống kê T là biến ngẫu nhiên có các đặc
trưng như sau:
n

n(n + 1)
n(n + 1)( 2n + 1)

(t 3j − t j ) / 48

4
24
E(T) =
và Var(T) =
- j =1

(5.10)

với tj là số quan sỏt của cỏc nhúm cú hạng bằng nhau.
T − E (T )
Với n đủ lớn biến Z = Se(T ) phân phối xấp xỉ chuẩn N(0,1). Sử dụng Z làm tiêu
chuẩn kiểm định giả thuyết H0.
Trở lại thí dụ trên ta có: Tqs =6, E(T) = 22,5;
Var(T) = 73,1396 và Se(T) = 8,5521.
Zqs = -1,9293.
P( Z < -1,9293) = 0,0268.
Mức ý nghĩa bác bỏ H0 với H1: " Sản phẩm cơ sở II tốt hơn" là 2,68%. Như vậy trong
trường hợp này kiểm định Wincoxon sử dụng nhiều thông tin hơn kiểm định dấu và cho
một kết luận khỏc.
Có thể tóm tắt kiểm định Wincoxon như sau:
Cho hai mẫu ngẫu nhiên kích thước m. Các quan sát ngẫu nhiên từ hai mẫu tạo thành các
cặp ngẫu nhiên (Xi, Yi). Gọi di = Xi - Yi là chênh lệch của các cặp giá trị quan sát, tập di
chia thành ba nhóm: nhóm "+" gồm các d i > 0; nhóm "-" gồm các d i < 0 và nhóm còn lại
tạm gọi là nhóm "không".

16



KiÓm ®Þnh phi tham sè

Thèng kª thùc hµnh

Xếp hạng riêng từng nhóm và tính hai tổng hạng của nhóm "+" và nhóm"-", cỏc
giỏ trị di bằng nhau tớnh hạng theo hạng trung bỡnh. Gọi t j là số quan sỏt của cỏc nhúm
cú hạng bằng nhau.
Thống kê Wilconxon- T nhận giá trị của tổng hạng nhỏ với các đặc trưng:
n(n + 1)
4
E(T) =
;
n(n + 1)( 2n + 1)
24
Var(T) =
-

n

∑ (t
j =1

3
j

− t j ) / 48

(5.11)

T − E (T )

Với n đủ lớn biến Z = Se(T ) phân phối xấp xỉ chuẩn N(0,1).
Nếu Zqs < - uα , giả thuyết H0 bị bác bỏ.
Chú ý rằng kiểm định này chỉ sử dụng cho mẫu lớn, thí dụ bằng số nói trên chỉ có
tính chất mô tả phương pháp.
Có thể sử dụng kiểm định dấu với các tính toán ở bảng sau:
Chuyên gia
A
B
C
D
E
F
G
H
I
J

Sản phẩm c.sở I
6
4
5
8
7
6
7
8
6
8

Sản phẩm c.sở II

8
9
4
7
8
5
9
8
7
9

Sử dụng kiểm định giá trị trung vị (0,5) ta có:

Chênh lệch
-2
-5
1
1
-1
1
-2
0
-1
-1

Dấu
+
+
+
0

-

H0: p = 0,5 với H1: p < 0,5.

Số dấu khác không là n= 9, số dấu "+" là 3. Sử dụng phân phối nhị thức p = 0,5. n = 9 ta
có: P(X<=3) = 0,2539.
Như vậy giả thuyết H0 có thể đúng với mức xác suất 25,39%. Nếu bác bỏ H 0
chúng ta chịu mức sai lầm loại 1 tương ứng với mức xác suất trên.
Thực tế kiểm định Wilcoxon được sử dụng không chỉ kiểm định tính đối xứng
của hai mẫu, kiểm định này hoàn toàn có thể sử dụng để kiểm định quan hệ của hai biến
ngẫu nhiên trong cùng một mẫu. Về mục đích, kiểm định Wilcoxon trong trường hợp
này như kiểm định Khi bình phương, tuy nhiên kiểm định này dựa trên cơ sở kiểm định
hạng.
Sau đây ta xem xét cách thực hiện kiểm định này trên SPSS.

17


KiÓm ®Þnh phi tham sè

Thèng kª thùc hµnh

Với tệp GSS93 ta kiểm định giả thuyết số con của người được phỏng vấn và số anh chị
em ruột có quan hệ hay độc lập. Kiểm định này thực chất là kiểm định tương quan của số
con theo dòng tộc:
Chương trình chi tiết như sau
GET FILE='C:\Program Files\SPSS\GSS93 subset.sav'.
NPAR TEST
/WILCOXON=sibs WITH childs (PAIRED)
/STATISTICS DESCRIPTIVES

/MISSING ANALYSIS.
Kết quả kiểm định
NPar Tests
Descript ive St at ist ics
N
Number of Brothers
and Sisters
Number of Children

Mean

Std.
Deviation

Minimum

Maximum

1495

3.71

2.98

0

22

1495


1.85

1.68

0

8

Wilcoxon Signed Ranks Test
Ranks
N
Number of Children Number of Brothers
and Sisters

Negative Ranks
Positive Ranks
Ties
Total

992a
292b
207c
1491

Mean
Rank
694.02
467.48

Sum of

Ranks
688464.50
136505.50

a. Number of Children < Number of Brothers and Sisters
b. Number of Children > Number of Brothers and Sisters
c. Number of Brothers and Sisters = Number of Children
b
T est St at ist ics

Number of
Children - Number
of Brothers and
Sisters
Z
- 20.893a
Asymp. Sig. (2- tailed)
.000
a. Based on positive ranks.
b. Wilcoxon Signed Ranks Test

Kết quả kiểm định này cho thấy có quan hệ tương quan giữa hai biến số con của người
được phỏng vấn và số con của cha mẹ họ.

18


KiÓm ®Þnh phi tham sè

Thèng kª thùc hµnh


2- Kiểm định tương quan hạng Spearman
Kiểm định tương quan hạng Spearman thường thực hiện với hai biến ngẫu nhiên
trên cùng một mẫu ngẫu nhiên nhiều chiều. Hệ số tương quan hạng được thành lập với
mục đích đo quan hệ của hai biến (không nhất thiết là quan hệ tuyến tính). Như vậy, yêu
cầu đối với hai biến được kiểm định phải là hai biến định lượng hoặc hai biến có thang
đo thứ bậc như nhau.
Thủ tục cụ thể tóm tắt như sau:
Giả sử X và Y là hai thành phần của một biến ngẫu nhiên nhiều chiều, với mẫu
ngẫu nhiên kích thước n cần kiểm định giả thuyết X và Y độc lập với giả thuyết đối X và
Y có quan hệ nào đó.
Xếp hạng của các quan sát mẫu cho Xi và Yi. Gọi các hạng này tương ứng là
di(X) và di(Y)
Tính chênh lệch hạng di= di(X)- di(Y)
Hệ số tương quan hạng Spearman được tính theo công thức sau:
n

rs =

1−

6∑ di2
i =1

n(n 2 − 1) .

(5.12)

Với n nhỏ chúng ta sử dụng bảng giá trị tới hạn của thống kê r s (bảng N). Nếu
giá trị quan sát nằm ngoài lân cận giá trị tới hạn của 0 ta bác bỏ H0.

Với n lớn ta có thể sử dung thống kê Z = r s n − 1 , thống kê này phân phối xấp xỉ
chuẩn N(0,1). Nếu Zqs>Uỏ/2 chúng ta có thể kết luận hai biến nói trên không độc lập.
Thớ dụ 13: Xột một mẫu nhỏ từ GSS93subset với biến X là số anh chi em ruột và Y là
số con mong muốn của người được điều tra. Có thể dùng kiểm định Spearman kết luận
hai biến này độc lập không?. Biết số liệu quan sỏt là:
X
Y
X
Y

0
1
15
2

2
1
1
2

3
2
1
2

7
2
7
2


1
2
4
3

2
2
3
3

3
2
2
3

4
2
2
3

2
2
7
3

4
2
9
3


1
2
3
4

1
2
6
4

3
2

Các tính toán cụ thể như sau
X
0
2
3
7
1
2

Y
1
1
2
2
2
2


Rank(x)
1
9
14
22
4
9

Rank(y)
1,5
1,5
10
10
10
10

d(i)
-0,5
7,5
4
12
-6
-1

d2(i)
0,25
56,25
16
144
36

1

19


KiÓm ®Þnh phi tham sè

3
4
2
4
1
1
3
15
1
1
7
4
3
2
2
7
9
3
6

Thèng kª thùc hµnh

2

2
2
2
2
2
2
2
2
2
2
3
3
3
3
3
3
4
4

14
18
9
18
4
4
14
25
4
4
22

18
14
9
9
22
24
14
20

10
4
10
8
10
-1
10
8
10
-6
10
-6
10
4
10
15
10
-6
10
-6
10

12
20,5
-2,5
20,5
-6,5
20,5
-11,5
20,5
-11,5
20,5
1,5
20,5
3,5
24,5
-10,5
24,5
-4,5
2
Sum (d i)=

Hệ số tương quan Spearman tính được là:

16
64
1
64
36
36
16
225

36
36
144
6,25
42,25
132,25
132,25
2,25
12,25
110,25
20,25
1385.5

r s= 0,467. Giỏ trị tới hạn của

rs(25;0,05)= 0,3977 vậy chúng ta bác bỏ giả thuyết hai biến X, Y độc lập.
3- Kiểm định Mann-Whitney
Khác với hai kiểm định trên, kiểm định Mann-Whitney được thiết lập để kiểm
định tính độc lập của hai mẫu bất kỳ (không yêu cầu cùng kích thước). Tuy nhiên, điểm
không thay đổi ở đây là các biến là các biến định lượng hoặc biến có thang đo thứ bậc
như nhau. Giả thuyết được chọn có thể thay đổi theo mục đích phân tích, nhưng thông
thường đây là tiêu chuẩn kiểm định về sự thuần nhất của 2 mẫu (2 mẫu cựng tổng thể)
hoặc đối với các giá trị trung tâm của các biến. Vì vậy, đôi khi người ta vẫn sử dụng cho
kiểm định sự khác biệt của một biến, theo các dấu hiệu như thủ tục phân tích phương sai
(xem chương 6).
Thủ tục như sau:
Giả sử X và Y là hai biến ngẫu nhiên, với hai mẫu ngẫu nhiên kích thước n X và
nY.
Trộn hai mẫu và tính hạng cho các quan sát i=1..n; (n= nx + ny).
Với mỗi biến X và Y tính tổng hạng riêng, ký hiệu RX, RY.

Thiết lập các thống kê:

20


KiÓm ®Þnh phi tham sè

Thèng kª thùc hµnh


ni (ni + 1) 

nx ny −  Ri −
÷
2



U =
 nx n y +  R − ni ( ni + 1) 
 i
÷
 2
2



ni (ni + 1) nx n y

2

2
n (n + 1) nx n y
khi Ri − i i
>
2
2

khi Ri −

(5.13)

Với kích thước hai mẫu đủ lớn (ít nhất 10 quan sát cho mỗi mẫu) các biến U có phân
phối với các đặc trưng sau:
nX nY (nX + nY + 1)
12
E(U) =0,5 nXnY và Var(U) =
.

(5.14)

Hoặc phương sai điều chỉnh khi có nhiều hạng tính trung bỡnh:

Var(U) =

nx n y  n3 − n n ti3 − ti 
−∑

÷
n(n − 1)  12
i =1 12 


Khi nxny<400 và nxny/2 + min(nx, ny) <220.
U − E (U )
Chuẩn hoá biến này ta có: Z = Se(U ) . Sử dụng phân phối N(0,1) ta có kết luận về
các giả thiết.
Chú ý rằng nếu kích thước mẫu bằng nhau (m), thì hai thống kê U của kiểm định
Mann -Whitney và W của kiểm định Wilcoxon có quan hệ sau:
U +W =

m(m + 2n + 1)
2

Kết quả là hai kiểm định tương đương nhau khi chuẩn hoá U và W.
Thí dụ 14: Bảng sau đây cho số liệu về số con mong muốn của theo giới tính của người
được điều tra. Phải chăng số con mong muốn của hai giới này độc lập với nhau?
Nữ (F)

1

1

2

2

2

2

2


2

2

2

3

3

Nam (M)

2

2

2

2

2

2

2

3

3


3

3

4

Rank(F)

1.5

1.5

10

10

10

10

10

10

10

10

20,5


20,5

Rank(M)

10

10

10

10

10

10

10

20,5

20,5

20,5

20,5

24,5

Tổng hạng:


4

24,5

RF =148,5; RM =176,5. nF=13; nM=12
U =57,5; E(U)=78; Var(U)=322; S(U)= 17,94
|Zqs| = 1,1424

Với mức ý nghĩa 5% cú thể kết luận về số con mong muốn có thể xem là những người
được điều tra ở cùng một tổng thể (không có mong muốn khác nhau theo gới tính).
Thớ dụ 15: Kiểm định Mann-Whitney về số con của những người được phỏng vấn ở hai
mức học vấn khác nhau, được thực hiện nhờ SPSS như sau:
NPAR TESTS

21


KiÓm ®Þnh phi tham sè

Thèng kª thùc hµnh

/M-W= childs BY degree2(1 0)
/MISSING ANALYSIS.

Mann-Whitney Test
Ranks

Number of Children


College Degree
No College degree
College degree
Total

N
1146
346
1492

Mean
Sum of
Rank
Ranks
776.68 890081.00
646.52 223697.00

a
T est St at ist ics

Number of
Children
Mann- Whitney U
163666.000
Wilcoxon W
223697.000
Z
- 5.048
Asymp. Sig. (2- tailed)
.000

a. Grouping Variable: College Degree

Trong kết quả này kiểm định Wilcoxon chỉ được tính trên mẫu 346 quan sát. Kết luận
của cả hai kiểm định như nhau, đó là: ở hai mức học vấn khác nhau số con không như
nhau.
4- Kiểm định Friedman về sự thuần nhất của k mẫu
Kiểm định Friedman là một kiểm định trên cơ sở hạng về sự thuần nhất của k
mẫu hay nói cách khác nó kiểm tra giả thuyết cho rằng k biến ngẫu nhiên có cùng phân
phối xác suất. Trong nhiều trường hợp phân phối xác suất này không được xác định
trước.
Nếu có n quan sát cho k biến, với mỗi quan sát ta có n giá trị của k biến. Xếp
n

hạng (rankj(i)) của các giá trị này trong mỗi quan sát. Gọi

C 2j = ∑ ( rank j (i ) )
i =1

2

. Gọi tij là

số biến cú giỏ trị quan sỏt bằng nhau ở quan sỏt thứ i có hạng như nhau.
Thống kê:
k
12
C 2j − 3n( k + 1)

nk (k + 1) j =1
χ2 =

Tij
1− ∑
2
i , j nk ( k − 1)

(5.15)

với Tij= tij3 – tij. Thống kê trên cũng được gọi là thống kê Friedman

22


KiÓm ®Þnh phi tham sè

Thèng kª thùc hµnh

Với giả thuyết các biến có cùng phân phối thì thống kê trên phân phối Khi bình
phương (k-1) bậc tự do.
Giả thuyết các biến có cùng phân phối bị bác bỏ với mức ý nghĩa α nếu giá trị
2
quan sát của thống kê trên vượt quá mức tới hạn χ α (k − 1) .

Các kiểm định phi tham số được giới thiệu trong chương này chỉ là một bộ phận
nhỏ của các phương pháp kiểm định phi tham số hiện nay. Chúng ta có thể tìm thấy các
thủ tục kiểm định mở rộng của các kiểm định trên, cho nhiều biến, nhiều bộ phận mẫu
hay nhiều mẫu, đã được thiết lập trên các phần mềm thống kê nói chung và SPSS nói
riêng. Phần khai thác trên SPSS và Winstata cho phép xem xét thêm các kiểm định như
vậy.
iV- Winstata với các kiểm định phi tham số
Winstata cung cấp một lớp các thủ tục kiểm định phi tham số khá phong phú và

không kém tiện lợi. Sau đây chúng ta lần lượt xem xét các thủ tục này với tệp số liệu
Hhexpn98.dta.
1- Các kiểm định dựa trên hạng
+ Kiểm định Wilcoxon
Lệnh: signrank mcpi = mcpir
Cho kết quả:
Wilcoxon signed-rank test
sign

|

obs

sum ranks

positive |

0

negative |

5718

zero

281

39621

5999


17997000

all

|
|

0

expected
8978689.5

17957379 8978689.5
39621
17997000

unadjusted variance 1.800e+10
adjustment for ties -43437313
adjustment for zeros -1858885.3
adjusted variance

1.795e+10

Ho: mcpi = mcpir
z = -67.016
Prob > |z| = 0.0000
Có thể kết luận rằng hai biến không độc lập.
+ So sánh hai trunh vị nhờ kiểm định dấu


23


KiÓm ®Þnh phi tham sè

Thèng kª thùc hµnh

Lệnh: signtest rcpif= rcpinf
Cho kết quả:
Sign test
sign |
observed expected
positive |
1816
2999.5
negative |
4183
2999.5
zero |
0
0
all |
5999
5999
One-sided tests:
Ho: median of rcpif - rcpinf = 0 vs. Ha: median of rcpif - rcpinf > 0
Pr(#positive >= 1816) =
Binomial(n = 5999, x >= 1816, p = 0.5) = 1.0000
Ho: median of rcpif - rcpinf = 0 vs. Ha: median of rcpif - rcpinf < 0
Pr(#negative >= 4183) =

Binomial(n = 5999, x >= 4183, p = 0.5) = 0.0000
Two-sided test:
Ho: median of rcpif - rcpinf = 0 vs. Ha: median of rcpif - rcpinf ~= 0
Pr(#positive >= 4183 or #negative >= 4183) =
min(1, 2*Binomial(n = 5999, x >= 4183, p = 0.5)) = 0.0000
+ Kiểm định Mann-Whitney
Lệnh: ranksum rcpif, by(urban98)
Cho kết quả:
Two-sample Wilcoxon rank-sum (Mann-Whitney) test
urban98

|

obs

rank sum expected

Rural |

4269

10175345

12807000

Urban |

1730

7821655


5190000

combined|

5999

17997000

17997000

unadjusted variance 3.693e+09
adjustment for ties -36291408
adjusted variance

3.656e+09

Ho: rcpif(urban98==Rural) = rcpif(urban98==Urban)
z = -43.521
Prob > |z| = 0.0000
+ Kiểm định Kruskal-Wallis
Lệnh: kwallis mcpi, by(urban98)

24


KiÓm ®Þnh phi tham sè

Cho kết quả:


Thèng kª thùc hµnh

Rural |

4269

10175345

12807000

|

1730

7821655

5190000

combined |

5999

17997000

17997000

Urban

unadjusted variance 3.693e+09
adjustment for ties -36291408

adjusted variance

3.656e+09

Ho: rcpif(urban98==Rural) = rcpif(urban98==Urban)
z = -43.521
Prob > |z| = 0.0000
2- Kiểm định Khi bình phương
+ Lệnh Tabulate và các kiểm định Khi bình phương
Winstata cung cấp các kiểm định Khi bình phương như các tự chọn của lệnh lập
các bảng tiếp liên.
a- Với số liệu đơn (không tần số) chúng ta có thể chọn lệnh
lab Danh_sách_biến, lựa_chọn kiểm_định
Các lựa chọn có thể:
chi2

Tiêu chuẩn Khi bình phương với thống kê Pearson

lrchi2 Tiêu chuẩn Khi bình phương với logarit hàm hợp lý
gamma Kiểm định Kruskal-Goodman
taub

Kiểm định với hệ số Kandall tau'b

V

Kiểm định với hệ số Cramer

all


Chọn mọi kiểm định

Thí dụ: Với tệp Hhexpn98.dta
lệnh:

tab hhsize comped98, all

Cho kết quả:
size
1
2
3
4
5
6
7
8
9
10
11
12

Never
74
77
62
85
92
69
48

31
11
3
5
2

79
196
204
276
315
255
155
96
42
17
11
3

Cap I
24
68
152
280
297
206
128
72
42

26
7
3

Cap II
17
57
130
371
320
196
76
26
23
9
4
1

Cap III
3
12
47
112
85
39
18
11
2
1
0

0

Nghe SC
4
26
39
102
65
39
21
8
3
1
2
0

THCN
10
42
60
113
100
44
23
8
2
0
0
0


DHCD
3
19
37
65
44
19
11
3
1
1
0
0

Total
214
497
731
1404
1318
867
480
255
126
58
29
9

25



Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×