CHƯƠNG 8
Kiểm đònh giả thiết thống kê
(3LT + 3BT)
1. Khái niệm
Giả thiết thống kê (giả thiết) là các phát biểu
liên quan đến các số đặc trưng của ĐLNN, quy luật
phân phối của ĐLNN, tính độc lập của các ĐLNN…
Kiểm đònh là dựa vào một mẫu cụ thể, thực hiện
một số thủ tục để đưa ra quyết đònh chấp nhận hoặc
bác bỏ giả thiết thống kê.
Giả thiết cần kiểm đònh ký hiệu H
o
. Giả thiết
phải chấp nhận nếu bác bỏ H
o
ký hiệu là H
1
.
Vì quyết đònh đưa ra chỉ dựa trên một mẫu cụ
thể nên quyết đònh có thể bò sai. Ta gọi sai lầm
loại I là quyết đònh bác bỏ H
o
trong khi H
o
đúng, sai
lầm loại II là quyết đònh chấp nhận H
o
trong khi H
o
sai. Xác suất mắc sai lầm loại I gọi là mức ý nghóa,
ký hiệu α.
Để tiến hành thủ tục kiểm đònh, trước tiên
người ta xây dựng tiêu chuẩn kiểm đònh như sau:
Xét ĐLNN X và các giả thiết H
o
, H
1
.
Xét mẫu ngẫu nhiên X
1
,
X
2
, …,
X
n
. Tiêu chuẩn
kiểm đònh là một thống kê G = G(X
1
,
X
2
, …,
X
n
) được
chọn sao cho khi H
o
đúng thì quy luật phân phối xác
suất của ĐLNN G được xác đònh.
Với mức ý nghóa α, chọn miền bác bỏ H
o
là W
α
sao cho:
P(G∈W
α
/H
o
) = α
Sau khi lấy mẫu cụ thể, hàm G có giá trò kiểm
đònh g. Quy tắc quyết đònh như sau:
* g∈W
α
: bác bỏ H
o
.
* g∉W
α
: chấp nhận H
o
.
2. Kiểm đònh số đặc trưng tổng thể
2.1 Kiểm đònh trung bình tổng thể
2.1.1 Kiểm đònh hai phía (H
1
:
µ
µµ
µ
≠
≠≠
≠
µ
µµ
µ
o
)
Cho trước một mẫu cụ thể kích thước n, xét phát
biểu cho rằng giá trò µ
o
là trung bình tổng thể µ với
mức ý nghóa α. Để xem phát biểu trên có chấp nhận
được hay không, ta cần kiểm đònh giả thiết:
H
o
: µ = µ
o
với H
1
: µ ≠ µ
o
TH1,2,3
n > 30 hoặc "n ≤
≤≤
≤ 30, biết σ
σσ
σ
2
và tổng
thể có phân phối Chuẩn"
Khi một trong các trường hợp trên xảy ra thì với
mẫu ngẫu nhiên kích thước n,
X
/ n
− µ
σ
có phân phối
Chuẩn Chính Tắc hay được xấp xỉ với phân phối
Chuẩn Chính Tắc. Trường hợp chưa biết σ thì thay
bởi S.
Phân tích vấn đề theo cách I
Giả đònh H
o
đúng, tức là µ = µ
o
. Lúc này ĐLNN
− µ
σ
o
X
/ n
có phân phối Chuẩn Chính Tắc, vì vậy biến
cố
− µ
σ
o
X
/ n
≤
z
α/2
xảy ra với xác suất 1–α. Với α từ 5%
trở xuống, ta cho rằng biến cố
− µ
σ
o
X
/ n
≤
z
α/2
chắc
chắn xảy ra trong thực tế, tức là với mẫu cụ thể kích
thước n nào cũng phải có
− µ
σ
o
x
/ n
≤
z
α/2
. Nếu với một
mẫu cụ thể kích thước n, ta thấy
− µ
σ
o
x
/ n
>
z
α/2
thì
đây là điều vô lý, chứng tỏ giả đònh µ = µ
o
sai. Vậy
nếu dấu hiệu này xảy ra ta quyết đònh bác bỏ giả
thiết H
o
.
Khi
− µ
σ
o
X
/ n
có phân phối Chuẩn Chính Tắc thì
biến cố
− µ
σ
o
X
/ n
>
z
α/2
vẫn có thể xảy ra với xác suất
α. Vậy lập luận để dẫn đến điều vô lý nêu trên có
thể bò sai với xác suất α, tức là quyết đònh bác bỏ giả
thiết H
o
có thể gặp sai lầm với xác suất α.
Phân tích vấn đề theo cách II
Kết quả của việc ước lượng µ với độ tin cậy 1–α
cho thấy biến cố µ∈[
X
–
ε
,
X
+
ε
], viết cách khác là
X
–
µ≤
ε
, xảy ra với xác suất 1–
α
.
Giả đònh H
o
đúng, tức là
µ
=
µ
o
, thì biến cố
X
–
µ
o
≤
ε
phải xảy ra với xác suất 1–
α
. Với
α
từ 5%
trở xuống, ta cho rằng biến cố
X
–
µ
o
≤
ε
chắc chắn
xảy ra trong thực tế, tức là với mẫu cụ thể kích thước
n nào ta cũng phải có
x
–
µ
o
≤
ε
. Nếu với một mẫu cụ
thể kích thước n, ta thấy
x
–
µ
o
>
ε
thì đây là điều
vô lý, chứng tỏ giả đònh
µ
=
µ
o
sai. Vậy nếu dấu hiệu
này xảy ra ta quyết đònh bác bỏ giả thiết H
o
.
Ta có:
x
–
µ
o
>
ε
=
z
α/2
n
σ
⇔
− µ
σ
o
x
/ n
> z
α/2
Vì độ tin cậy là 1–α nên ngay khi H
o
đúng, biến
cố
X
–
µ
o
>
ε vẫn có thể xảy ra với xác suất α. Vậy
lập luận để dẫn đến điều vô lý nêu trên có thể bò sai
với xác suất α, tức là quyết đònh bác bỏ giả thiết H
o
có thể gặp sai lầm với xác suất α.
Các phân tích trên gợi ý cho ta chọn:
Tiêu chuẩn kiểm đònh: G =
− µ
σ
o
X
/ n
(Nếu chưa biết σ thì thay bởi S)
Miền bác bỏ H
o
: W
α
=
(–∞,
–z
α/2
)∩(z
α/2
, +∞)
TH4 n
≤
≤≤
≤
30, chưa biết phương sai tổng thể
σ
σσ
σ
2
, tổng thể có phân phối Chuẩn
Lúc này
− µ
X
S / n
có phân phối Student n–1 bậc tự
do. Tất cả lập luận bên trên đều áp dụng được, miễn
là thay z
α/2
bởi t(n–1)
α/2
. Vậy ta chọn:
Tiêu chuẩn kiểm đònh: G =
− µ
o
X
S / n
Miền bác bỏ H
o
: W
α
=
(–∞,
–t
α/2
)∩(t
α/2
, +∞)
Tóm tắt – Kiểm đònh hai phía trung bình tổng
thể (H
1
:
µ
µµ
µ
≠
≠≠
≠
µ
µµ
µ
o
)
Cho trước một mẫu cụ thể và mức ý nghóa α.
Tính giá trò kiểm đònh (KĐ) và tra giá trò tới hạn
(TH). Nếu giá trò kiểm đònh có trò tuyệt đối lớn hơn
giá trò tới hạn thì bác bỏ H
o
(KĐ > TH).
Công thức tính giá trò kiểm đònh:
− µ
σ
o
x
/ n
(Nếu chưa biết σ thì thay bởi s)
Giá trò tới hạn được tra theo hai trường hợp:
n > 30 hoặc "n
≤
≤≤
≤
30, biết
σ
σσ
σ
2
và tổng thể có
phân phối Chuẩn"
Giá trò tới hạn: z
α/2
n
≤
≤≤
≤
30, chưa biết
σ
σσ
σ
2
và tổng thể có phân
phối Chuẩn
Giá trò tới hạn: t(n–1)
α/2
Ví dụ
(1) Trọng lượng ghi trên bao bì của một loại sản
phẩm 6Kg. Lấy ngẫu nhiên 121 sản phẩm và cân
thử thì tính được trọng lượng trung bình là 5,975Kg
và phương sai là 5,7596. Với mức ý nghóa 5% thì
trọng lượng ghi trên bao bì có chấp nhận được
không?
Ta cần kiểm đònh giả thiết:
H
o
:
µ
=
µ
o
"Trọng lượng ghi trên bao bì chấp
nhận được"
H
1
: µ
≠
µ
o
"Trọng lượng ghi trên bao bì không
chấp nhận được"
Ta có:
n
=
121
x
=
5,975 µ
o
= 6 s
2
=
5,7596
⇒
s
=
2,399
Giá trò kiểm đònh: KĐ =
− µ
o
x
s / n
= –0,1146
Giá trò tới hạn: α = 5% ⇒ TH = z
α/2
= z
0,025
= 1,96
=NORMSINV(1–0,025)
Điều kiện bác bỏ H
o
là KĐ > TH không thoả, quyết
đònh chấp nhận giả thiết H
o
.
Trọng lượng ghi trên bao bì chấp nhận được (với mức
ý nghóa 5%).
(2) Đường kính của một chi tiết máy được sản xuất
theo chuẩn là 3,02cm. Lấy ngẫu nhiên 25 chi tiết và
đo thử thì tính được đường kính trung bình là 3,14cm
với độ lệch chuẩn là 0,275cm. Với độ tin cậy 95%
hãy cho biết các chi tiết sản xuất có đúng chuẩn
không ?
Ta cần kiểm đònh giả thiết:
H
o
:
µ
=
µ
o
"Các chi tiết sản xuất đúng chuẩn"
H
1
:
µ
≠
µ
o
"Các chi tiết sản xuất không đúng
chuẩn"
Ta có: n = 25
x
= 3,14 µ
o
= 3,02 s = 0,275
Giá trò kiểm đònh: KĐ =
− µ
o
x
s / n
= 2,1818
Giá trò tới hạn:
1–α
=
95% ⇒ TH
=
t(n–1)
α/2
=
t(24)
0,025
=
2,0639
=TINV(0,025*2; 24)
Điều kiện bác bỏ H
o
là KĐ
>
TH thoả, quyết đònh
bác bỏ giả thiết H
o
, chấp nhận giả thiết H
1
.
Các chi tiết sản xuất không đúng chuẩn (với độ tin
cậy 95%).
2.1.2 Kiểm đònh phải (H
1
:
µ
µµ
µ
>
µ
µµ
µ
o
)
Từ dữ liệu của một mẫu cụ thể, với mức ý nghóa
α cho trước, ta cần kiểm đònh:
H
o
: µ = µ
o
với H
1
: µ > µ
o
TH1,2,3 n > 30 hoặc "n
≤
≤≤
≤
30, biết
σ
σσ
σ
2
và tổng
thể có phân phối Chuẩn"
Khi một trong các trường hợp trên xảy ra thì với
mẫu ngẫu nhiên kích thước n,
X
/ n
− µ
σ
có phân phối
Chuẩn Chính Tắc hay được xấp xỉ với phân phối
Chuẩn Chính Tắc. Trường hợp chưa biết σ thì thay
bởi S.
Giả đònh H
o
đúng, tức là µ = µ
o
. Do
− µ
σ
o
X
/ n
có
phân phối Chuẩn Chính Tắc nên biến cố
− µ
σ
o
X
/ n
≤
z
α
xảy ra với xác suất 1–α. Vì vậy nếu với một mẫu cụ
thể kích thước n, ta thấy
− µ
σ
o
x
/ n
>
z
α
thì đây là điều
vô lý, chứng tỏ giả đònh µ = µ
o
sai. Vậy nếu dấu hiệu
này xảy ra ta quyết đònh bác bỏ giả thiết H
o
.
Khi
− µ
σ
o
x
/ n
>
z
α
xảy ra, tức là khi bác bỏ H
o
, thì
ta vẫn có
− µ
σ
x
/ n
≤
z
α
, do đó
− µ
σ
o
x
/ n
>
− µ
σ
x
/ n
. Điều này
chứng tỏ khi bác bỏ giả thiết H
o
thì µ > µ
o
.
Vậy ta chọn:
Tiêu chuẩn kiểm đònh: G =
− µ
σ
o
X
/ n
(Nếu chưa biết σ thì thay bởi S)
Miền bác bỏ H
o
: W
α
=
(z
α
, +∞)
TH4 n
≤
≤≤
≤
30, chưa biết phương sai tổng thể
σ
σσ
σ
2
, tổng thể có phân phối Chuẩn
Phân tích tương tự trên với phân phối Student,
ta chọn:
Tiêu chuẩn kiểm đònh: G =
− µ
o
X
S / n
Miền bác bỏ H
o
: W
α
=
(t
α
, +∞)
Tóm tắt – Kiểm đònh phải trung bình tổng thể
(H
1
:
µ
µµ
µ
>
µ
µµ
µ
o
)
Cho trước một mẫu cụ thể và mức ý nghóa α. Ta
tính giá trò kiểm đònh (KĐ) và tra giá trò tới hạn
(TH). Nếu giá trò kiểm đònh lớn hơn giá trò tới hạn
thì bác bỏ H
o
(KĐ > TH).
Công thức tính giá trò kiểm đònh:
− µ
σ
o
x
/ n
(Nếu chưa biết σ thì thay bởi s)
Giá trò tới hạn được tra theo hai trường hợp:
n > 30 hoặc "n
≤
≤≤
≤
30, biết
σ
σσ
σ
2
và tổng thể có
phân phối Chuẩn"
Giá trò tới hạn: z
α
n
≤
≤≤
≤
30, chưa biết
σ
σσ
σ
2
và tổng thể có phân
phối Chuẩn
Giá trò tới hạn: t(n–1)
α
Ví dụ
Trọng lượng của một con gà khi xuất chuồng
được chọn ngẫu nhiên là ĐLNN có phân phối Chuẩn.
Trước đây, trọng lượng trung bình là 1,7Kg. Người ta
áp dụng phương pháp chăn nuôi mới và cân thử 25
con gà xuất chuồng thì tính được trọng lượng trung
bình là 1,87Kg và phương sai là 0,25. Hãy cho nhận
xét về phương pháp chăn nuôi mới với mức ý nghóa
5%.
Do gà tăng trọng nên ta kiểm đònh giả thiết:
H
o
:
µ
=
µ
o
"Phương pháp chăn nuôi mới không
làm gà tăng trọng"
H
1
:
µ
>
µ
o
"Phương pháp chăn nuôi mới làm gà
tăng trọng"
Ta có: n = 25
x
= 1,87 µ
o
= 1,7 s
2
= 0,25 ⇒ s =
0,5
Giá trò kiểm đònh: KĐ =
−
x 1,7
s / n
= 1,7
Giá trò tới
hạn: α
=
5%
⇒
TH
=
t(n–1)
α
=
t(24)
0,05
=
1,711
=TINV(0,05*2; 24)
Điều kiện bác bỏ H
o
là KĐ > TH không thoả, quyết
đònh chấp nhận giả thiết H
o
.
Phương pháp chăn nuôi mới không làm gà tăng
trọng (với mức ý nghóa 5%).
2.1.3 Kiểm đònh trái (H
1
:
µ
µµ
µ
<
µ
µµ
µ
o
)
Từ dữ liệu của một mẫu cụ thể, với mức ý nghóa
α cho trước, ta cần kiểm đònh:
H
o
: µ = µ
o
với H
1
: µ < µ
o
Phân tích tương tự trên, ta đi đến kết luận:
TH1,2,3 n > 30 hoặc "n
≤
≤≤
≤
30, biết
σ
σσ
σ
2
và tổng
thể có phân phối Chuẩn"
Tiêu chuẩn kiểm đònh: G =
− µ
σ
o
X
/ n
(Nếu chưa biết σ thì thay bởi S)
Miền bác bỏ H
o
: W
α
=
(–∞, –z
α
)
TH4 n
≤
≤≤
≤
30, chưa biết phương sai tổng thể
σ
σσ
σ
2
, tổng thể có phân phối Chuẩn
Tiêu chuẩn kiểm đònh: G =
− µ
o
X
S / n
Miền bác bỏ H
o
: W
α
=
(–∞, –t
α
)
Tóm tắt – Kiểm đònh trái trung bình tổng thể
(H
1
:
µ
µµ
µ
<
µ
µµ
µ
o
)
Cho trước một mẫu cụ thể và mức ý nghóa α. Ta
tính giá trò kiểm đònh (KĐ) và tra giá trò tới hạn
(TH). Nếu giá trò kiểm đònh nhỏ hơn giá trò tới hạn
thì bác bỏ H
o
(KĐ < TH).
Công thức tính giá trò kiểm đònh:
− µ
σ
o
x
/ n
(Nếu chưa biết σ thì thay bởi s)
Giá trò tới hạn được tra theo hai trường hợp:
n > 30 hoặc "n
≤
≤≤
≤
30, biết
σ
σσ
σ
2
và tổng thể có
phân phối Chuẩn"
Giá trò tới hạn: –z
α
n
≤
≤≤
≤
30, chưa biết
σ
σσ
σ
2
và tổng thể có phân
phối Chuẩn
Giá trò tới hạn: –t(n–1)
α
Ví dụ
Mức tiêu hao nguyên liệu để sản xuất một sản
phẩm là ĐLNN có phân phối chuẩn. Mức tiêu hao
trung bình là 1,2Kg với độ lệch chuẩn 3,1Kg. Sau
một thời gian sản xuất, người ta kiểm tra mức sử
dụng nguyên liệu của 25 sản phẩm thì thu được bảng
sau:
Mức NL (Kg) 0,9
1,0
1,1
1,2
1,3
Số sản phẩm 4 5 6 7 3
Với mức ý nghóa 5%, hãy cho nhận xét về mức
tiêu hao nguyên liệu trung bình.
Do lượng tiêu hao nguyên liệu trung bình giảm nên
ta kiểm đònh giả thiết:
H
o
: µ
=
µ
o
"Mức tiêu hao nguyên liệu trung bình
không thay đổi"
H
1
: µ
<
µ
o
"Mức tiêu hao nguyên liệu trung bình
có giảm"
Ta có: n = 25
x
= 1,1 µ
o
= 1,2 σ = 3,1
Giá trò kiểm đònh: KĐ =
− µ
σ
o
x
/ n
= –0,16
Giá trò tới hạn: α = 5% ⇒ TH = –z
α
= –z
0,05
= –1,645
=–NORMSINV(1–0,05)
Điều kiện bác bỏ H
o
là KĐ
<
TH không thoả, quyết
đònh chấp nhận giả thiết H
o
.
Mức tiêu hao nguyên liệu trung bình không thay đổi
(với mức ý nghóa 5%).
2.2 Kiểm đònh tỷ lệ tổng thể
Ta chỉ xét trường hợp khi n đủ lớn (np
o
≥ 10 và
n(1–p
o
) ≥ 10).
2.2.1 Kiểm đònh hai phía (H
1
: p
≠
≠≠
≠
p
o
)
Từ dữ liệu của một mẫu cụ thể, với mức ý nghóa
α cho trước, ta cần kiểm đònh:
H
o
: p = p
o
với H
1
: p ≠ p
o
Theo giả thiết n đủ lớn,
−
−
F p
p(1 p) / n
được xấp xỉ
bởi phân phối Chuẩn Chính Tắc. Giả đònh H
o
đúng,