Tải bản đầy đủ (.pdf) (21 trang)

Chương 7 KIỂM ĐỊNH GIẢ THUYẾT THỐNG kê

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (252.93 KB, 21 trang )

Chương 7:

KIỂM ĐỊNH GIẢ THUYẾT
THỐNG KÊ


I. Khái niệm chung :
Giả thuyết thống kê là một mệnh đề về tham số,
về luật phân phối hay về tính chất của biến ngẫu
nhiên.
Ví dụ :
• Giả thuyết về tham số μ = EX :
⎧H0 : μ = μ 0
a) ⎨
⎩ H1 : μ > μ 0

⎧H0 : μ = μ 0
c) ⎨
⎩ H1 : μ ≠ μ 0

⎧H0 : μ = μ 0
b) ⎨
⎩ H1 : μ < μ 0


Trong đó, H0 gọi là giả thuyết không, H1 gọi là đối
thuyết và μ0 là số đã biết.
Đối thuyết trong a) và b) gọi là đối thuyết một phía.
Đối thuyết trong c) gọi là đối thuyết hai phía.




Giả thuyết về luật phân phối :
H0 : “ X có luật phân phối với hàm phân phối F(x)”
(H1 : “ X không có luật phân phối với hàm phân
phối F(x)”, không cần phát biểu)



Giả thuyết về tính chất :
H0 : “ X và Y là độc lập ”
(H1 : “X và Y không độc lập”, không cần phát biểu)


Cách kiểm định giả thuyết :
Gọi M là không gian mẫu quan sát X từ tổng thể M.
• Chia M thành hai miền M0 và M1 sao cho :
M0 ∪ M1 = M
M0 ∩ M1 = ∅



Lấy mẫu ( x1 , … , xn ),
1) Nếu (x1, … , xn) ∈ M0 thì chấp nhận H0
H1).
2) Nếu (x1, … , xn) ∈ M1 thì chấp nhận H1
H0).
Gọn hơn :
1) Nếu (x1, … , xn ) ∈ M1 thì chấp nhận H1
H0).
2) Nếu (x1 , … , xn ) ∉ M1 thì chấp nhận H0

H1).

(Bác bỏ
(Bác bỏ
(Bác bỏ
(Bác bỏ


Sai lầm khi kiểm định :
• Sai lầm loại 1 : Bác bỏ H0 khi thực tế H0 đúng.
Xác suất xảy ra sai lầm loại 1 :
α = P[(X1 , …, Xn )∈ M1 / H0 đúng ]
• Sai lầm loại 2 : Chấp nhận H0 khi thực tế H0 sai.
Xác suất xảy ra sai lầm loại 2 :
β = P[(X1 , …, Xn )∈ M0 / H1 đúng ]
Một cách chia M thành M0 và M1 gọi là một qui tắc
( tiêu chuẩn) kiểm định. M1 được gọi là miền bác bỏ
H0. Người ta xây dựng qui tắc sao cho đạt được α
đủ nhỏ cho trước và với β có thể chấp nhận được.


α được gọi là mức ý nghĩa của kiểm định, thường
cho trước là 1% hoặc 5%.

II. Kiểm định giả thuyết về so sánh kỳ
vọng với một số cho trước :
Đặt μ = EX và σ2 = DX.
Các giả thuyết :
H0 : μ = μ0
a) H1 : μ > μ0 ; b) H1 : μ < μ0 ; c) H1 : μ ≠ μ0

1) Khi n ≥ 30, σ2 đã biết.
Xét thống kê
X − μ0
Z=
~ N (0,1)
σ
khi H0 đúng.
n


Miền bác bỏ H0 ứng với các đối thuyết :
a) M1 = { ( x1 , … , xn ) : Z > z1− α }
b) M1 = { ( x1 , … , xn ) : Z < - z1− α }
c) M1 = { ( x1 , … , xn ) : ⎢Z ⎢ > z1− α/2 }
Trong đó, zα là phân vị mức α của Φ(x).

}

2) Khi n ≥ 30, σ2 không biết.
Xét thống kê
X −μ
Z=
~ N (0,1)
S
khi H0 đúng.
n
Miền bác bỏ H0 như ở phần 1).

(1)



3) Khi n < 30, σ2 đã biết và X ~ N(μ ,σ2 ).
Thống kê Z và miền bác bỏ H0 như ở phần 1).
4) Khi n < 30, σ2 không biết và X ~ N(μ ,σ2 ).
Xét thống kê

X − μ0
T=
~ t (n − 1)
S
n

khi H0 đúng.

Miền bác bỏ H0 ứng với các đối thuyết :
n −1
t
M1 = { ( x1 , … , xn ) : T > 1−α }
n −1
t
(2)
M1 = { ( x1 , … , xn ) : T < - 1−α }
n −1
M1 = { ( x1 , … , xn ) : ⎢T ⎢ > t1− α }

}

2



III. Kiểm định giả thuyết về so sánh hai kỳ
vọng :
Quan sát X trên hai mẫu lấy từ hai tổng thể A và B.
Trên tổng thể A :
2
σ
X có kỳ vọng μ1 và phương sai 1 , mẫu cỡ n1, kỳ
2
S
vọng mẫu, phương sai mẫu có điều chỉnh 1 .
Trên tổng thể B :
2
σ
X có kỳ vọng μ2 và phương sai 2 , mẫu cỡ n2, kỳ
2
vọng mẫu, phương sai mẫu có điều chỉnh S 2 .


Xét các giả thuyết :
H0 : μ1 = μ2
a) H1 : μ1 > μ2 ; b) H1 : μ1 < μ2 ; c) H1 : μ1 ≠ μ2
2
2
σ
σ
1. Khi n1 ≥ 30, n2 ≥ 30 và 1 và 2 đã biết

Xét thống kê
X1 − X 2
Z=

~ N (0,1)

σ 12
n1

+

σ 22
n2


Miền bác bỏ H0 ứng với các đối thuyết như ở (1).
Khi các phương sai mẫu chưa biết ta thay
bằng phương sai mẫu.
2
2
2. Khi n1 < 30, n2 < 30 và σ 1 = σ 2 = σ2
Xét thống kê

T=

X1 − X 2
⎛1 1⎞
S ⎜ + ⎟
⎝ n1 n2 ⎠

~ t (n1 + n2 − 2)

2


Trong đó
2
2
(
n

1)
S

(
n

1)
S
1
2
2
S2 = 1
n1 + n2 − 2
Miền bác bỏ H0 ứng với các đối thuyết như ở (2).


IV. Kiểm định giả thuyết về so sánh tỷ lệ
với số cho trước :
Giả sử tham số p là tỷ lệ các phần tử loại L trên tổng
thể M.
m
f
=
Gọi m là số phần tử loại L trên mẫu và

là tần
n
suất các phần tử loại L trên mẫu.
Xét mẫu cỡ lớn : nf ≥ 10 , n(1-f) ≥ 10, các giả thuyết:
H0 : p = p0
a) H1 : p > p0 ; b) H1 : p < p0 ; c) H1 : p ≠ p0
và thống kê

Z=

f − p0

p0 (1 − p0 )
n

~ N (0,1)

, khi H0 đúng


Miền bác bỏ H0 như ở phần 1) kiểm định giả thuyết
về kỳ vọng.

V. Kiểm định giả thuyết về so sánh hai tỷ lệ:
Xét mẫu cỡ lớn : n1 ≥ 30, n2 ≥ 30.
Quan sát tỷ lệ các phần tử lọai L trên hai mẫu lấy từ
hai tổng thể A và B.
Trên tổng thể A : tỷ lệ phần tử loại L là p1, mẫu cỡ n1,
tần suất f1.
Trên tổng thể B : tỷ lệ phần tử loại L là p2, mẫu cỡ n2,

tần suất f2.


Xét các giả thuyết :
H0 : p1 = p2
a) H1 : p1 > p2 ; b) H1 : p1 < p2 ; c) H1 : p1 ≠ p2
Xét thống kê
f1 − f 2
Z=
~ N (0,1)
⎛1 1⎞
ˆ ˆ⎜ + ⎟
pq
⎝ n1 n2 ⎠
Trong đó,
pˆ =

n1 f1 + n2 f 2
n1 + n2



qˆ = 1 − pˆ


Miền bác bỏ H0 ứng với các đối thuyết như ở (1).
VI. Kiểm định giả thuyết về so sánh hai
phương sai :
Quan sát X trên hai mẫu lấy từ hai tổng thể A và B.
Trên tổng thể A :

X ~N(μ1,σ 12 ), mẫu cỡ n1, phương sai mẫu có điều
2
chỉnh S1 .
Trên tổng thể B :
X ~N(μ2, σ 22 ), mẫu cỡ n2, phương sai mẫu có điều
2
chỉnh S 2 .


Xét các giả thuyết :
H0 : σ 12 = σ 22
a) H1 : σ 12 > σ 22
; b) H1 : σ 12 ≠ σ 22
và thống kê
S12
F = 2 ~ F (n1 − 1, n2 − 1)
S2
có luật phân phối Fisher với bậc tự do n1-1 và n2-1.
2
2
Chú ý rằng ta đánh chỉ số sao cho S1 > S 2 .
Miền bác bỏ H0 ứng với các đối thuyết :
n1 −1, n2 −1
t
M1 = { ( x1 , … , xn ) : F > 1−α
}

n1 −1, n2 −1
t
M1 = { ( x1 , … , xn ) : ⎢F ⎢ > 1−α / 2 }

n −1, n −1
Trong đó, t1−1 α 2 là phân vị mức (1-a) của luật Fisher

với bậc tự do n1-1 và n2-1.


VII. Kiểm định giả thuyết về luật phân phối :
H0 : “ X có luật phân phối với hàm phân phối F(x)”
Lập bảng :
Lớp
Tần số

L1

...

Lk

Tổng

Tần số TN

N1

...

Nk

n


Tần số LT

N’1

...

N’k

n

Trong đó,
Ni là các tần số thực nghiệm của lớp Li, hay số phần tử
của mẫu rơi vào Li .
N’i là các tần số lý thuyết của lớp Li, hay số phần tử
của mẫu rơi vào Li khi H0 đúng.


N’i = npi
pi = P( X∈ Li / H0 đúng )
Nếu Li = (ai , ai+1 ] thì pi = P( ai < X < ai+1 / H0 đúng )
= F(ai+1) - F(ai)
Định lý Pearson : Thống kê Q có luật chi bình phương
với k-r-1 bậc tự do.
( N i − N i' ) 2
2
Q=∑
~
(k − r − 1)
χ
'

Ni
i =1
Miền bác bỏ H0 :
k − r −1
M1 = { ( x1 , … , xn ) : Q > χ1−α }
k

Trong đó, χ1k−−αr −1 là phân vị mức 1-α của luật chi bình
phương với k-r-1 bậc tự do.


VIII. Kiểm định giả thuyết về tính độc lập :
Ta có bảng số liệu hai chiều về hai thuộc tính X và Y :
Giả thuyết H0 : “ Thuộc tính X và Y là độc lập”
Thuộc tính X có n mức độ A1, …, An. Thuộc tính Y có
m mức độ B1, …, Bm.
Ta quan sát N cá thể. Và lập bảng sau đây.
Thuộc tính
A1

N11

...
An
Tổng số

Nn1

B1


...

( N’11 )

...

...

...

( N’n1 )

...

NB1

...

Bm
N1m

( N’1m )

Tổng số
NA1

...
Nnm

( N’nm )


NBm

NAn
N


Trong đó,
Nij là tần số thực nghiệm, hay số quan sát có thuộc
tính Ai và Bj .
N’ij là tần số lý thuyết, hay số phần tử của mẫu có
thuộc tính Ai và Bj khi H0 đúng.

N 'ij =
Thống kê
n

m

Q = ∑∑

N A i . NB j
n

( N i j − N i' j ) 2

~ χ 2 [(h − 1)(c − 1)]

'
N

i =1 j =1
ij
có phân phối chi bình phương với (h-1)(c-1) bậc tự
do. Trong đó, h là số hàng, c là số cột.


Miền bác bỏ H0 :
M1 = { ( x1 , … , xn ) : Q >

χ1(−hα−1)( c −1) }

Trong đó, χ1−α
là phân vị mức 1-α của luật chi
bình phương với (h-1)(c-1) bậc tự do.
( h −1)( c −1)



×