Tải bản đầy đủ (.pdf) (27 trang)

chương 6 kiểm định giả thiết thống kê

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (341.96 KB, 27 trang )


Chng 6

KIM ĐNH GI THIT THNG KÊ

133





Chương 6



Kiểm ñịnh
giả thiết thống kê





1. KHÁI NIỆM
Những thông tin từ mẫu của một tổng thể ñược dùng ñể suy ñoán về các ñặc
trưng của tổng thể ñó, chẳng hạn ước lượng các tham số của một tổng thể mà
chúng ta ñã gặp ở chương 6. Trong chương này, chúng ta bàn ñến một dạng suy
ñoán khác, liên quan ñến các giả thiết thống kê, và các phép kiểm ñịnh ñể có
quyết ñịnh chấp nhận hay bác bỏ các giả thiết ñó.
1.1. Định nghĩa. Một giả thiết thống kê là một khẳng ñịnh về phân phối
của một hoặc nhiều biến ngẫu nhiên. Nếu giả thiết thống kê xác ñịnh hoàn toàn
một phân phối, thì nó ñược gọi là một giả thiết thống kê ñơn; trường hợp ngược


lại, nó ñược gọi là một giả thiết thống kê hợp.
Trong quá trình ñi ñến một quyết ñịnh, chúng ta thường dựa vào một qui
luật hay một kinh nghiệm nào ñó ñể ñặt ra một giả thiết thống kê; sau ñó, xây
dựng những thủ tục, theo ñó, những giả thiết ñã ñặt ra ñược chấp nhận hay bác bỏ.
Những thủ tục ñó ñược gọi là những phép kiểm ñịnh (trắc nghiệm) giả thiết thống
kê.
Phép kiểm ñịnh thường là phép so sánh giữa hai hay nhiều giá trị. Giả thiết
ñược ñặt ra ttường ñược gọi là Giả thiết không, ký hiệu H
o
. Chữ “không” ở ñây
có nghĩa là không có sự khác biệt có ý nghĩa về mặt thống kê giữa các giá trị cần
so sánh. Khi bác bỏ H
o
, chúng ta sẽ chấp nhận một giả thiết H
1
khác, ñược gọi là
giả thiết ñối của H
o
.
Thí dụ, ñể so sánh hiệu quả ñiều trị của hai loại thuốc A và B ñối với một
bệnh X, ñiều tra trên mẫu chúng ta có kết quả tỉ lệ khỏi bệnh p(A) > p(B). Với ý
muốn chứng minh hiệu quả của hai loại thuốc trên là khác nhau, chúng ta ñặt giả
thiết H
o
là “ không có sự khác nhau về hiệu quả ñiều trị của hai loại thuốc A và B

Chng 6

KIM ĐNH GI THIT THNG KÊ


134




” hay “ sự khác nhau về hiệu quả ñiều trị của hai loại thuốc A và B là không có
ý nghĩa ”.
Phương pháp của thủ tục là dùng kết quả của mẫu ñể chứng minh một giả
thiết.
Xét mẫu kích thước n (X
1
, X
2
, …, X
n
) ñược thành lập từ tổng thể X . Người
ta chia Im(X
1
, X
2
, …, X
n
) (còn gọi là không gian mẫu ) thành hai tập con, lần
lượt ñược ký hiệu là W và W* = Im(X
1
, X
2
, …, X
n
) −

−−
− W. Khi mẫu cụ thể (x
1
, x
2
,
…, x
n
) ñược thực hiện, nếu (x
1
, x
2
, …, x
n
) ∈ W thì giả thiết H
o
bị bác bỏ (chấp
nhận H
1
); nếu (x
1
, x
2
, …, x
n
) ∈ W* thì H
o
ñược chấp nhận (bác bỏ H
1
). Tập hợp

W ñược gọi là miền bác bỏ (hay miền tới hạn) của phép kiểm ñịnh. Như vậy,
chúng ta có ñịnh nghĩa
1.2. Định nghĩa. Một phép kiểm ñịnh (hay trắc nghiệm) một giả thiết
thống kê là một qui tắc, theo ñó, dựa vào một mẫu cụ thể ñược thực hiện, chúng ta
có thể quyết ñịnh chấp nhận hay bác bỏ giả thiết ñang xét.
1.3. Định nghĩa. Nếu chúng ta bác bỏ giả thiết H
o
khi, thực ra, nó phải
ñược chấp nhận thì chúng ta ñã mắc phải sai lầm gọi là Sai lầm loại I. Nếu
chúng ta chấp nhận Ho trong khi, thực ra, nó phải bị bác bỏ thì chúng ta ñã mắc
phải sai lầm gọi là Sai lầm loại II.
Xác suất mắc phải sai lầm loại I, thường ký hiệu là α, gọi là Mức ý nghĩa
của trắc nghiệm. Như vậy, xác suất ñể chấp nhận Ho khi nó ñúng là (1 − α).
Nếu ký hiệu β là xác suất mắc phải sai lầm loại II, thì xác suất ñể bác bỏ
H
o
khi nó sai là (1 − β), ñược gọi là Năng lực của phép kiểm ñịnh.
Như vậy, một báo cáo kết quả so sánh là “ sự khác biệt có ý nghĩa về mặt
thống kê ở mức ý nghĩa 5% ” có nghĩa là “giả thiết không” H
o
ñã bị bác bỏ với
nguy cơ sai lầm là 5%. Các bước cơ bản của một phép kiểm ñịnh giả thiết thống
kê:
1. Đặt giả thiết không H
o
và giả thiết ñối H
1
,
2. Xác ñịnh mức ý nghĩa α của phép kiểm ñịnh,
3. Với cặp giả thiết và mức ý nghĩa α ñã xác ñịnh, chúng ta thiết lập ñược

một Qui luật quyết ñịnh dùng ñể quyết ñịnh chấp nhận hay bác bỏ giả thiết H
o
.
Qui luật này bao gồm việc chọn một thống kê thích hợp ñể dùng cho phép kiểm
ñịnh và ñưa ra một giá trị tới hạn ñể so sánh.
• Khác với phép kiểm ñịnh một giả thiết với mức ý nghĩa α cho trước, các
nhà nghiên cứu thường xác ñịnh mức ý nghĩa nhỏ nhất, tại ñó, “giả thiết không”
H
o
bị bác bỏ. Từ ñó, người ta có ñịnh nghĩa
1.4. Định nghĩa. Trong một phép kiểm ñịnh, mức ý nghĩa nhỏ nhất, tại ñó,
“giả thiết không” H
o
có thể bị bác bỏ ñược gọi là giá trị xác suất hay p −
−−
− giá trị
(p – value) của phép kiểm ñịnh.

Chng 6

KIM ĐNH GI THIT THNG KÊ

135




Trong phạm vi của chương trình, giáo trình này chỉ giới thiệu một số phép
kiểm ñịnh cơ bản.
1.5. Định nghĩa. Giả sử chúng ta có "giả thiết không" liên quan ñến một

tham số θ là H
o
: θ = θ
o
. Khi ñó,
(a) nếu H
1
là θ ≠ θ
o
thì trắc nghiệm ñược gọi là hai ñuôi
(b) nếu H
1
là θ < θ
o
hay θ > θ
o
thì trắc nghiệm ñược gọi là một ñuôi

2. KIỂM ĐỊNH GIẢ THIẾT VỀ TRUNG BÌNH TỔNG THỂ
Giả sử tổng thể X có phân phối chuẩn, với trung bình µ chưa biết. Chúng ta
cần kiểm ñịnh giả thiết
H
o
: µ = µ
o
ñối với H
1
: µ ≠ µ
o
,

với mức ý nghĩa α cho trước.
Phân biệt hai trường hợp:
2.1. Trường hợp 1: Biết σ
σσ
σ
Nếu H
o
ñúng thì BNN
( )
o
X n
U
− µ
σ
=
~ N(0,1).
Giả thiết H
o
sẽ bị bác bỏ nếu |U| có giá trị khá lớn. Miền tới hạn ñược
xác ñịnh bởi: Có một số C sao cho
P(|U| > C) = α ⇔
1
2
C u
α

=

C ñược gọi là giá trị tới hạn ( viết tắt là gtth) của trắc nghiệm
Như vậy, trong trường hợp này, gtth =


u
α
αα
α
1
2

Với mẫu cụ thể, chúng ta tính ñược giá trị u của U.
* H
o
bị bác bỏ nếu |
||
|u|
||
| > gtth.
2.2. Trường hợp 2: Không biết σ
σσ
σ
Nếu H
o
ñúng thì BNN
( )
o
X n
S
T
− µ
=
~ t(n -1)

Lý luận như trên, gtth =
( )


n
t
α
αα
α
1
1
2

Với mẫu cụ thể, chúng ta tính ñược giá trị u của U.

Chng 6

KIM ĐNH GI THIT THNG KÊ

136




* H
o
bị bác bỏ nếu |
||
| t |
||

| > gtth.
2.3. Chú ý. Trong trường hợp cỡ mẫu lớn ( n > 30), không cần giả thiết
tổng thể X có phân phối chuẩn (do Định lý giới hạn trung tâm).


2.4. Thí dụ. Công ty ABC muốn sản xuất loại bóng ñèn có tuổi thọ trung
bình µ = 1600 giờ. Nếu thời gian dùng ngắn hơn 1600 giờ thì công ty sẽ mất
khách hàng; nếu thời gian dùng dài hơn thì chi phí sản xuất tăng lên. Để biết
xem qui trình sản xuất có tốt không, công ty chọn một mẫu ngẫu nhiên gồm 64
bóng ñèn ñốt thử và thấy tuổi thọ trung bình của chúng là 1570 giờ với ñộ lệch
chuẩn là 121 giờ. Hãy cho kết luận về qui trình sản xuất ở mức ý nghĩa 5%.
Giải.
Gọi X là BNN chỉ tuổi thọ của loại bóng ñèn do công ty ABC sản xuất
Kiểm ñịnh giả thiết:
H
o
: µ = µ
o
= 1600 giờ ñối với H
1
: µ ≠ µ
o
.
Nếu H
o
ñúng thì BNN
( ) 64
o
X
S

T
− µ
=
~ t(63).
Với mức ý nghĩa α = 0,05, gtth =
(63)
0,975
t = 1,9983
Với mẫu cụ thể, chúng ta có :
x
= 1570, s = 121 và
(1570 1600) 64
121
1,9835
t

= = − .
Vì |t | < gtth nên: Ở mức α = 0,05, giả thiết H
o
ñược chấp nhận, nghĩa là
qui trình sản xuất của công ty vẫn tốt.
2.5. Trắc nghiệm một ñuôi.
Trong phép kiểm ñịnh trên, có hai miền bác bỏ nằm ở “hai ñuôi” của phân
phối nên còn ñược gọi là Trắc nghiệm hai ñuôi. Tuy nhiên, ñôi khi, chúng ta chỉ
quan tâm ñến ñộ lệch về một phía so với giá trị của giả thiết. Phép kiểm ñịnh
trong trường hợp này ñược gọi là Trắc nghiệm một ñuôi. Khi ñó,
Giả thiết H
o
là µ = µ
o

, còn H
1
là µ > µ
o
hay µ < µ
o
.
Cụ thể.
2.5.1. Kiểm ñịnh giả thiết:
H
o
: µ = µ
o
ñối với H
1
: µ > µ
o
,
với mức ý nghĩa α cho trước.
Giá trị tới hạn C ñược xác ñịnh bởi:
P(U > C) = α ⇔ gtth =
1
u
−α
( nếu biết σ ),

Chng 6

KIM ĐNH GI THIT THNG KÊ


137




hoặc
P(T > C) = α ⇔ gtth =
( 1)
1
n
t

− α
( nếu không biết σ )
Với mẫu cụ thể, nếu giá trị u hoặc t lớn hơn gtth thì H
o
bị bác bỏ.
2.5.2. Kiểm ñịnh giả thiết:
H
o
: µ = µ
o
ñối với H
1
: µ < µ
o
,
với mức ý nghĩa α cho trước.
Giá trị tới hạn là:


−−

1
u
−α
, nếu biết σ;
hoặc −
−−

( 1)
1
n
t

− α
, nếu không biết σ
Vậy, với mẫu cụ thể:
* H
o
bị bác bỏ nếu u < gtth. (hoặc t < gtth)
2.6. Thí dụ. Trở lại công ty ABC trong Thí dụ 5.2.4, Công ty tuyên bố
rằng tuổi thọ trung bình của bóng ñèn do họ sản xuất là không dưới 1600 giờ. Với
mẫu trên, bạn hãy cho kết luận về lời tuyên bố của công ty, ở mức ý nghĩa 4%.
Giải.
Kiểm ñịnh giả thiết:
H
o
: µ = µ
o
= 1600 giờ; ñối với H

1
: µ < µ
o
.
Nếu H
o
ñúng thì BNN
( ) 64
o
X
S
T
− µ
=

tuân theo luật phân phối t(63).
Với mức ý nghĩa α = 4%, gtth =
0,96
(63)
t
− = −
−−
− 1,7794
Với mẫu cụ thể, chúng ta có :
(1570 1600) 64
121
1,9835
t

= = −

< gtth.
Vậy, ở mức ý nghĩa α = 0,04, giả thiết H
o
bị bác bỏ, nghĩa là lời tuyên bố
của công ty không phù hợp với thực tế.

3. KIỂM ĐỊNH GIẢ THIẾT VỀ TỈ LỆ TỔNG THỂ
(MẪU LỚN)

Chng 6

KIM ĐNH GI THIT THNG KÊ

138




Giả sử tổng thể X có phân phối B(p). Với mẫu cỡ n > 30 thoả np ≥ 5 và
n(1 − p) ≥ 5 thì phân phối nhị thức tiệm cận phân phối chuẩn nên có thể dùng trắc
nghiệm U.
Chúng ta cần kiểm ñịnh giả thiết:
H
o
: p = p
o
ñối với H
1
là: p ≠ p
o

hay p < p
o
hay p > p
o

Dùng trắc nghiệm U (2 ñuôi hoặc 1 ñuôi), với
( )
(1 )
~ (0,1)
o
o o
P p n
p p
U N


=

Thí dụ. Tại một ñịa phương, bệnh B có tỉ lệ 34%. Sau một ñợt ñiều trị,
kiểm tra lại trên 100 người, thấy có 24 người bị bệnh B.
Hỏi ñợt ñiều trị có thực sự làm giảm tỉ lệ bệnh B ở ñịa phương trên không?
( kết luận ở mức α = 0,05 )
Giải. Gọi p là tỉ lệ bệnh B ở ñịa phương sau ñợt ñiều trị.
Kiểm ñịnh giả thiết:
H
o
: p = p
o
= 0,34 ñối với H
1

: p < p
o

Giá trị tỉ lệ bệnh B trên mẫu:
p
= 0,24
Nếu H
o
ñúng thì BNN
( ) 100
(1 )
P p
o
p p
o o
U


=
~ N(0,1)
Với mức α = 0,05, gtth = − u
0,95
= − 1,6449
Với mẫu cụ thể,
(0,24 0,34) 100
0,34 0,66
2,111
u

×

= = −
< gtth
Vậy, chúng ta bác bỏ giả thiết H
o
, i.e. ñợt ñiều trị thực sự có làm giảm tỉ lệ
bệnh B tại ñịa phương (kết luận ở mức α = 5%).

4. SO SÁNH HAI TRUNG BÌNH VỚI HAI MẪU ĐỘC LẬP
Xét hai mẫu (X
1
, X
2
, , X
n
), ñặc tính X có phân phối chuẩn, với kỳ vọng
µ
X
, ñộ lệch chuẩn
σ
X
và mẫu (Y
1
, Y
2
, , Y
m
), ñặc tính Y có phân phối chuẩn,
với kỳ vọng
µ
Y

, ñộ lệch chuẩn
σ
Y
. Giả sử hai mẫu trên ñộc lập nhau. Chúng ta
muốn kiểm ñịnh xem giữa µ
X
và µ
Y
, thể hiện qua
x

y
, có khác nhau không?.
Phân biệt 2 trường hợp:
4.1. Trường hợp 1: Biết σ
σσ
σ
X
và σ
σσ
σ
Y
.

Chng 6

KIM ĐNH GI THIT THNG KÊ

139





Trắc nghiệm U sẽ ñược dùng, với
( ) ( )
X Y
X Y
X Y
U

− − µ − µ
=
σ

trong ñó,
2 2
X Y
X Y
n m
σ σ

σ = +
Chúng ta ñặt giả thiết không H
o
là “sự khác nhau giữa
x

y
, là không
có ý nghĩa về mặt thống kê”, hay hai mẫu trên ñược rút từ cùng một tổng thể, i.e.

µ
X
= µ
Y
, và σ
X
= σ
Y
.
Vậy, chúng ta phải có quyết ñịnh giữa hai giả thiết:
H
o
: µ
X
= µ
Y

và H
1
: µ
X
≠ µ
Y
hay H
1
: µ
X
> µ
Y
hay H

1
: µ
X
< µ
Y

Nếu H
o
ñúng thì BNN
2 2
X Y
n m
X Y
U
σ σ

+
=

tuân theo luật phân phối chuẩn N(0, 1).
Thí dụ. Người ta cho hai nhóm học sinh, theo thứ tự, ñại diện cho hai
trường A và B, làm một bài kiểm tra. Nhóm thứ nhất gồm 40 học sinh, có ñiểm
trung bình 7,4; nhóm thứ hai gồm 50 học sinh, có ñiểm trung bình 7,8. Dựa vào
mẫu trên, có thể kết luận rằng: Điểm trung bình của trường B tốt hơn ñiểm trung
bình của trường A không? (kết luận ở mức ý nghĩa 4%). Biết rằng ñiểm số của
mỗi học sinh của hai trường A và B có phân phối chuẩn với ñộ lệch chuẩn, theo
thứ tự, là 0,8 và 0,7.
Giải.
Gọi X và Y, theo thứ tự, là biến ngẫu nhiên chỉ ñiểm số của mỗi học sinh
của hai trường A và B thì X ~ N(µ

X
, (0,8)
2
) và Y ~ N(µ
Y
, (0,7)
2
).
Chúng ta phải có quyết ñịnh giữa hai giả thiết:
H
o
: µ
X
= µ
Y
và H
1
: µ
X
< µ
Y

Nếu H
o
ñúng thì BNN
2 2
40 50
X Y
X Y
U

σ σ

+
=
~ N (0,1)

Chng 6

KIM ĐNH GI THIT THNG KÊ

140




Với mức ý nghĩa α = 0,04, gtth = − u
0,96
= − 1,7507
Với mẫu cụ thể, chúng ta có :

2 2
(0,8) (0, 7)
40 50
7,4 7,8
2,4903
u

= = −
+
< gtth

Vậy, ở mức ý nghĩa 4%, giả thiết H
o
bị bác bỏ, i.e. ñiểm trung bình của
trường B thực sự tốt hơn trường A.
4.2. Trường hợp 2: Không biết σ
σσ
σ
X
và σ
σσ
σ
Y
, nhưng biết σ
σσ
σ
X
= σ
σσ
σ
Y
.
Nếu H
o
ñúng thì BNN
( )
2
1 1
n m
X Y
T

S

=
+
,
trong ñó
2 2
2
( 1) ( 1)
2
X Y
n S m S
S
n m
− + −
=
+ −
,
tuân theo luật phân phối Student với (n + m − 2) bậc tự do.
Trắc nghiệm t ñược sử dụng như trong trường hợp kiểm ñịnh giả thiết về
trung bình.
Thí dụ. Trong một công ty sản xuất bóng ñèn, người ta muốn kiểm tra sự
làm việc của hai phân xưởng A và B. Một mẫu gồm n = 10 bóng ñèn của phân
xưởng A cho tuổi thọ trung bình 4000 giờ với ñộ lệch chuẩn 200 giờ. Một mẫu
gồm m = 8 bóng ñèn của phân xưởng B cho tuổi thọ trung bình 4300 giờ với ñộ
lệch chuẩn 250 giờ. Biết rằng tuổi thọ của mỗi bóng ñèn của haơ phân xưởng A
và B, theo thứ tự, tuân theo luật phân phối chuẩn có cùng phương sai. Hãy cho kết
luận về sự khác nhau giữa tuổi thọ trung bình của hai loại bóng ñèn trên ở mức ý
nghĩa 1%.
Giải.

Gọi X và Y lần lượt là BNN chỉ tuổi thọ của bóng ñèn của phân xưởng A
và B. Kiểm ñịnh giả thiết:
H
o
: µ
X
= µ
Y
ñối với H
1
: µ
X
≠ µ
Y
.
Nếu H
o
ñúng thì BNN

( )
2
1 1
10 8
X Y
T
S

=
+
~ t(10 + 8 −

−−
− 2)

Chng 6

KIM ĐNH GI THIT THNG KÊ

141




Với mức α = 0,01, gtth =
(16)
0,995
t
= 2,9208
Với mẫu cụ thể:
2 2
2
9s 7s
s
10 8 2
X Y
+
=
+ −
49 843 75
=
. ,

;
( )
2
1 1
10 8
4000 4300
49843,75 0,225
2,8329
x y
s
t
− −
×
+
= = = −

Vì |t |< gtth nên không thể bác bỏ giả thiết H
o
ở mức 1%.
Vậy, chúng ta kết luận rằng: Với mức ý nghĩa 1%, sự khác nhau về tuổi thọ
trung bình của hai loại bóng ñèn trên là không có ý nghĩa về mặt thống kê

5. SO SÁNH HAI TRUNG BÌNH VỚI DÃY SỐ LIỆU TỪNG CẶP
Phép kiểm ñịnh trên về hiệu hai trung bình nêu trên dựa trên cơ sở hai mẫu
ñộc lập. Tuy nhiên, trong nhiều trường hợp, hai mẫu ñược chọn như là các giá trị
ñược quan sát từng cặp (
i
x
,
i

y
), không ñộc lập; e.g. ño huyết áp của mỗi bệnh
nhân trước và sau khi ñiều trị bằng một loại thuốc.
Trong trường hợp này, ñặt D = X − Y, chúng ta có dãy số liệu trên mẫu
tương ứng:
i i i
d x y
= −
, (i = 1, 2, , n) ( hiệu giữa hai giá trị của cặp thứ i).
Chúng ta trở về trường hợp một mẫu (D
1
, D
2
, , D
n
), ñặc tính D và giả thiết
không:
H
o
: µ
X
= µ
Y
⇔ H
o
: µ
D
= 0.
Vì không biết
σ


D
nên trắc nghiệm t là thích hợp cho trường hợp này, với
.
~ ( 1)
D
D n
S
T t n
= −

Thí dụ. Người ta muốn nghiên cứu về ảnh hưởng của loại thuốc M
ñến nhịp tim. Một mẫu ngẫu nhiên gồm 10 bệnh nhân ñược cho dùng thuốc
M và ghi nhận nhịp tim trước và sau khi dùng thuốc. Kết quả nhịp tim như
sau:
Bệnh nhân 1 2 3 4 5 6 7 8 9 10
Trước thuốc 65 68 71 79 75 83 77 80 65 78
Sau thuốc 63 68 75 72 80 80 80 85 67 81
Thuốc M có làm thay ñổi nhịp tim không? ( ở mức ý nghĩa 8%), biết rằng
nhịp tim là biến ngẫu nhiên tuân theo luật phân phối chuẩn.
Giải.

Chng 6

KIM ĐNH GI THIT THNG KÊ

142





Gọi X và Y, theo thứ tự, là biến ngẫu nhiên chỉ nhịp tim của mỗi người
trước và sau khi dùng thuốc. Đặt: D = X −
−−
− Y, chúng ta có dãy số liệu trên mẫu
như sau:
i 1 2 3 4 5 6 7 8 9 10
d
i

2 0
− 4
7
− 5
3
− 3 − 5 − 2 − 3
Kiểm ñịnh giả thiết:
H
o
: µ
D
= 0 ñối với H
1
: µ
D
≠ 0.
Nếu H
o
ñúng thì BNN
=

10
D
D
T
S
~ t(9)
Với mức
α
= 0,08, gtth =
9
0 96
1 9727
t =
( )
,
,
Với mẫu cụ thể:
1 3 94405
D
d s= − =; ,


1 10
3 94405
0 8018
t

= = −
( )
,

,



t

< 2,262 nên: Với mức
α
= 5%, giả thiết H
o
ñược chấp nhận ,
i.e. thuốc M không làm thay ñổi nhịp tim người sử dụng.

6. SO SÁNH HAI TỈ LỆ VỚI HAI MẪU LỚN ĐỘC LẬP
Giả sử mẫu (X
1
, X
2
, . . ., X
n
), ñặc tính X ~ b(p
1
), có tỉ lệ mẫu
1
P
và giá trị tỉ
lệ mẫu
1
p
; mẫu (Y

1
, Y
2
, . . ., Y
m
), ñặc tính Y ~ b(p
2
), có tỉ lệ mẫu
2
P
và giá trị
tỉ lệ mẫu
2
p
. Chúng ta muốn kiểm ñịnh xem sự khác nhau giữa
1
p

2
p
là có ý
nghĩa về mặt thống kê không? Trắc nghiệm U sẽ ñược dùng khi n

30, m

30,
1
np



5, n(1


1
p
)

5,
2
mp


5 và m(1


2
p
)

5.
Chúng ta ñặt giả thiết không H
o
là “ sự khác nhau giữa
1
p

2
p
là không
có ý nghĩa về mặt thống kê ”, i.e. hai mẫu trên ñược rút từ cùng một tổng thể có

ước lượng tỉ lệ là
1 2
ˆ
n p m p
n m
p
+
+
=

và ước lượng phương sai
2
ˆ ˆ ˆ
(1 )
p p
σ
= −


Chng 6

KIM ĐNH GI THIT THNG KÊ

143




Dùng trắc nghiệm U như trong phép kiểm ñịnh giả thiết về hiệu hai trung
bình, với

( )
1 2
1 1
ˆ ˆ
(1 )
~ (0,1)
n m
P P
p p
U N

− +
=

Thí dụ. Để so sánh về tỉ lệ một loại bệnh B ñối với trẻ sơ sinh trai và trẻ sơ
sinh gái, người ta quan sát 100 bé trai thấy có 20 cháu mắc bệnh B; quan sát 120
bé gái thấy có 30 cháu mắc bệnh B, Hỏi tỉ lệ nhiễm bệnh B ñối với bé trai và gái
có như nhau không? ( kết luận với mức ý nghĩa
α
= 0,01 ).
Giải.
Giả sử p
1
và p
2
lần lượt là tỉ lệ bệnh B của bé trai và bé gái.
Kiểm ñịnh giả thiết:
H
o
: p

1
= p
2
ñối với H
1
: p
1


p
2

Nếu H
o
ñúng, thì hai mẫu trên ñược xem như rút từ cùng một tổng thể
có ước lượng tỉ lệ là
20 30
5
220 22
ˆ
p
+
= =

và BNN
( )
1 2
1 1
100 120
ˆ ˆ

(1 )
~ (0,1)
P P
p p
U N

− +
=

Với mức ý nghĩa
α
= 0,01, gtth =
0,995
2,5758
u
=

Với mẫu cụ thể,
20 30
1 2
100 120
0,2; 0,25;
p p= = = =

5 17
1 1
22 22 100 120
0,2 0,25
. .( )
0,8812

u

+
= =
< gtth
Vậy ở mức ý nghĩa 1%, H
o
không thể bị bác bỏ, i.e. tỉ lệ nhiễm loại bệnh B
ñối với bé trai và bé gái là như nhau.

7. KIỂM ĐỊNH GIẢ THIẾT VỀ PHƯƠNG SAI

Giả sử tổng thể X có phân phối N(
µ
,
σ
2
), trong ñó
σ
chưa biết. Dựa vào mẫu
cỡ n, chúng ta kiểm ñịnh giả thiết H
0
:
σ
2
=
2
0
σ
ở mức ý nghĩa

α
cho trước.
Nếu H
0
ñúng thì biến ngẫu nhiên

Chng 6

KIM ĐNH GI THIT THNG KÊ

144





=
2
2
( 1)
o
n S
Y
σ
σσ
σ

tuân theo luật phân phối
χ


2
(n

1).
Trắc nghiệm dựa trên phân phối của Y có thể là trắc nghiệm 1 ñuôi hay 2
ñuôi. Chúng ta dễ dàng tìm ñược giá trị tới hạn trong mỗi trường hợp.
(a) Trường hợp giả thiết ñối là H
1
:
σ
2
<
2
0
σ
:
gtth =
2
( 1)
n
α
χ −
và H
0
bị bác bỏ nếu y < gtth
(b) Trường hợp giả thiết ñối là H
1
:
σ
2

>
2
0
σ
:
gtth =
2
1
( 1)
n
−α
χ −
và H
o
bị bác bỏ nếu y > gtth
(c) Trường hợp giả thiết ñối là : H
1
:
σ
2



2
0
σ :
H
o
bị bác bỏ khi P(Y < a) + P(Y > b) =
α

, trong ñó a và b ñược chọn
sao cho
P(Y < a) = P(Y > b) =
2
α
.
Vậy, các giá trị tới hạn là:
2
2
( 1)
n
α
χ −

2
2
1
( 1)
n
α

χ −
.
H
o
bị bác bỏ nếu
y <
2
2
( 1)

n
α
χ −
hay y >
2
2
1
( 1)
n
α

χ −

Thí dụ. Bằng phương pháp cũ, người ta tìm ñược hàm lượng ñạm trong
một loại hạt ñạt mức trung bình là 4,2% với ñộ lệch chuẩn 0,45%. Người ta làm
với phương pháp mới lặp lại 5 lần với kết quả như sau: 2,3%; 2,4%; 4,0%;
5,5%; 5,8%. Hãy cho kết luận về hiệu quả của hai phương pháp trên ở mức ý
nghĩa 1%.
Giải.
Gọi X là BNN chỉ hàm lượng ñạm trong loại hạt ñang khảo sát.
Giá trị trung bình mẫu:
x
= 4,0%, ñộ lệch chuẩn chuẩn mẫu: s = 1,654%.
Nếu chỉ so sánh giá trị trung bình thì hiệu quả của hai phương pháp không
khác nhau mấy. Để ñánh giá hiệu quả của hai phương pháp, chúng ta hãy kiểm
ñịnh về phương sai của hai phương pháp. Gọi
σ
2
là phương sai của phương pháp
mới, chúng ta kiểm ñịnh giả thiết:

H
o
:
σ
2
=
2
0
σ = (0,45)
2
ñối với H
1
:
σ
2
> (0,45)
2


Chng 6

KIM ĐNH GI THIT THNG KÊ

145




Nếu H
o

ñúng thì biến ngẫu nhiên
2
2
4
o
S
Y =
σ

tuân theo luật phân phối
χ

2
(4).
Với mức ý nghĩa
α
= 1%, gtth =
2
0,99
(4) 13,277
χ =

Với mẫu cụ thể,
2
2 2
4 4 2,735
54,0247
(0,45)
o
s

y
×
= = =
σ
> gtth
Ở mức ý nghĩa 1%, H
0
bị bác bỏ.
Vậy, ở mức ý nghĩa 1%, phương pháp mới có phương sai lớn hơn phương
pháp cũ, nói cách khác, phương pháp mới biến ñộng hơn nên không hiệu quả bằng
phương pháp cũ.

8. TRẮC NGHIỆM
χ
χχ
χ
2

Trong nhiều trường hợp, các kết quả thu thập ñược trên mẫu thường không
hoàn toàn phù hợp với những kết quả tương ứng trên lý thuyết. Thí dụ, mặc dù
theo lý thuyết, khi chúng ta gieo một ñồng tiền vô tư 100 lần thì sẽ xuất hiện 50
lần mặt sấp và 50 lần mặt ngửa, nhưng thật hiếm khi chúng ta quan sát ñược ñúng
kết quả trên.
Giả sử với một tổng thể nhất ñịnh, dựa trên một số tiêu chuẩn nào ñó, người
ta chia tổng thể ñó thành nhiều lớp (biến cố ) rời nhau: B
1
, B
2
, . . ., B
k

, với các
xác suất, theo thứ tự, là p
1
, p
2
, . . ., p
k
, với p
1
+ p
2
+ . . . + p
k
= 1.
Một mẫu cỡ n ñược thành lập từ tổng thể trên. Ký hiệu o
i
là tần số quan
sát ñược trên mẫu của biến cố B
i
, i = 1, 2, . . ., k.
Biến cố
B
1
B
2
B
3

. . .
B

k

Tổng
Tần số quan sát
o
1

o
2
o
3

. . .
o
k

n
Giả thiết H
o
: Xác suất ñể một phần tử rơi vào một trong các lớp B
1
, B
2
, .
. ., B
k
, lần lượt là p
1
, p
2

, . . ., p
k
.
Giả thiết H
1
: Phủ ñịnh mệnh ñề trên.
Nếu H
o
ñúng thì số phần tử kỳ vọng rơi vào một trong các lớp B
1
, B
2
, . .
., B
k
, gọi là tần số lý thuyết, lần lượt là:


Chng 6

KIM ĐNH GI THIT THNG KÊ

146




e
1
= np

1
, e
2
= np
2
, . . ., e
k
= np
k

Như vậy, chúng ta có bảng:
Biến cố
B
1
B
2
B
3

. . .
B
k

Tổng
Tần số quan sát
Tần số lý thuyết
o
1
e
1


o
2
e
2

o
3
e
3

. . .
. . .
o
k
e
k

n
n
Chúng ta muốn biết sự khác biệt giữa tần số quan sát và tần số lý
thuyết thực sự có ý nghĩa không?.
Để ñánh giá sự khác biệt trên, thống kê sau ñây ñã ñược sử dụng:
2 2
2
1 1
( )
k k
i i i
i i

i i
O e O
Q n
e e
= =

= = −
∑ ∑

Nếu Q
2
= 0 thì tần số quan sát và tần số lý thuyết hoàn toàn phù hợp nhau;
trong khi nếu Q
2
> 0 thì chúng không hoàn toàn phù hợp nhau. Giá trị của Q
2
càng lớn thì sự khác biệt giữa tần số quan sát và tần số lý thuyết càng có ý nghĩa.
Chúng ta công nhận:
8.1. Định lý. Phân phối mẫu của Q
2
rất tiệm cận với phân phối
χ
2
ñịnh bởi:
2 2
1 1 1
2 2 2
( 2)
2 2
Y ( )

Q ZQ
o o
Y Q e Y Q e
ν − − −
ν −
= =

nếu các tần số lý thuyết không nhỏ hơn 5. Sự tiệm cận càng tốt với n càng
lớn.
Bậc tự do
ν
ñược cho bởi:
a)
ν
= k

1 nếu các tần số lý thuyết có thể ñược tính mà không có
một sự ước lượng nào từ mẫu.
b)
ν
= k

1

m nếu các tần số lý thuyết có thể ñược tính nhờ vào
m ước lượng từ mẫu.
Trong thực hành, các tần số lý thuyết ñược tính trên cơ sở của giả thiết H
0
.
Nếu với giả thiết này và với mức ý nghĩa

α
cho trước, giá trị của Q
2
lớn hơn
2
1
( )
−α
χ ν
thì chúng ta kết luận rằng sự khác nhau giữa tần số quan sát và lý
thuyết là có ý nghĩa.và giả thiết H
0
bị bác bỏ. H
0
ñược chấp nhận trong trường hợp
ngược lại. Thủ tục này ñược gọi là Trắc nghiệm
χ
χχ
χ
2
.

Trắc nghiệm
χ
2
thường ñược dùng trong việc kiểm ñịnh các giả thiết liên
quan ñến tính phù hợp giữa phân phối thực nghiệm với phân phối lý thuyết, tính
ñộc lập giữa hai biến ngẫu nhiên và sự khác nhau giữa nhiều tỉ lệ.
Dữ liệu dùng trong trắc nghiệm
χ

2
thường ñược trình bày dưới dạng bảng.
Thí dụ như bảng nêu trên gọi là bảng một chiều, bảng 1
×
c. Mở rộng, chúng ta có

Chng 6

KIM ĐNH GI THIT THNG KÊ

147




bảng hai chiều dạng h
×
c, trong ñó, các tần số quan sát ñược viết trong h hàng và
c cột. Các báng như thế ñược gọi là các Bảng ngẫu nhiên.
Tương ứng với mỗi tần số quan sát trong bảng ngẫu nhiên h
×
c, có một tần
số lý thuyết ñược tính dựa trên giả thiết không. Những tần số trong những ô của
một bảng ngẫu nhiên ñược gọi là những Tần số ô. Tổng các tần số theo hàng
hoặc theo cột ñược gọi là Tần số lề.
Theo Định lý 6.8.1, phân phối mẫu của BNN Q
2
tiệm cận phân phối
χ
2

với
bậc tự do
ν
, với h > 1 và c > 1, ñược cho bởi:
a)
ν
= (h

1)(c

1) nếu các tần số lý thuyết có thể ñược tính mà không có
một sự ước lượng nào từ mẫu.
b)
ν
= (h

1)(c

1)

m nếu các tần số lý thuyết có thể ñược tính nhờ
vào m ước lượng từ mẫu.
Bảng ngẫu nhiên 2
×
3
I II III Tổng
A
o
1


o
2

o
3
n
A

B
o
4

o
5

o
6

n
B

Tổng
n
I

n
II

n
III


n
8.2. Thí dụ. Quan sát khối lượng X (kg) của một nhóm người cùng lứa
tuổi, kết quả ñược ghi lại như sau:
X
i

(30, 40] (40, 45] (45, 50] (50, 55] (55, 60] (60, 70]
Số người

9 15 24 27 17 8
Có tài liệu cho rằng khối lượng của những người cùng lứa tuổi trên tuân
theo luật phân phối chuẩn. Tài liệu trên có phù hợp với kết quả quan sát trên mẫu
không? ( kết luận ở mức
α
= 0,05 ).
Giải.
Các giả thiết:
Giả thiết H
0
: Khối lượng của những người cùng lứa tuổi trên tuân theo luật
phân phối chuẩn.
Giả thiết H
1
: Khối lượng của những người cùng lứa tuổi trên không tuân
theo luật phân phối chuẩn.
Ước lượng trung bình và phương sai của X bằng các giá trị của trung bình
và phương sai mẫu.
Từ mẫu, chúng ta tính ñược:
x

= 50,075 và s
2
= 60,032
Nếu H
0
ñúng thì X ~ N(50 ; 60). Khi ñó:

Chng 6

KIM ĐNH GI THIT THNG KÊ

148




p
1
=
40 50 43 50
7,75 7,75
(30 40) ( ) ( ) 0,1
P X
− −
≤ ≤ = Φ − Φ =
0 ;
p
2
= P(40 < X  45) = 0,16;
p

3
= P(45 < X ≤ 50) = 0,24; p
4
= P(50 < X ≤ 55) = 0,24;
p
5
= P(55 < X ≤ 60) = 0,16; p
6
= P(60 < X ≤ 70) = 0,10.
Bảng tính χ
2
với 3 bậc tự do:
Lớp
o
i
p
i

e
i
(o
i
− e
i
)
2
/ e
i

(30, 40] 9 0,10 10 0,1

(40, 45] 15 0,16 16 0,0625
(45, 50] 24 0,24 24 0
(50, 55] 27 0,24 24 0.375
(55, 60] 17 0,16 16 0,0625
(60, 70] 8 0,10 10 0,4
Tổng N = 100
Q
2
= 1
Với mức ý nghĩa α = 0,05, gtth =
2
1 α−
χ
(3) = 7,82.
Vì Q
2
< 7,82 nên, ở mức 5%, chúng ta không thể bác bỏ H
0
, i.e. chúng ta
chấp nhận rằng X tuân theo luật phân phối chuẩn.
8.3. Thí dụ. Gieo một con xúc xắc 120 lần, tần số quan sát của các mặt
ñược cho trong bảng sau:
Mặt 1 2 3 4 5 6
Tần số 25 17 15 23 24 16
Hãy kiểm ñịnh giả thiết cho rằng con xúc xắc là vô tư ở mức ý nghĩa 5%.
Giải.
Giả thiết H
o
: Con xúc xắc là vô tư.
Giả thiết H

1
: Con xúc xắc là không vô tư.
Với giả thiết H
0
, chúng ta có các tần số lý thuyết ñược cho trong bảng sau:
Mặt 1 2 3 4 5 6
Tần số quan sát
Tần số lý thuyết
25
20
17
20
15
20
23
20
24
20
16
20
Giá trị của Q
2
với 5 bậc tự do là:

Chng 6

KIM ĐNH GI THIT THNG KÊ

149





2
6
2
1
( )
Q 5,00
i i
i
i
o e
e
=

= =


Với mức ý nghĩa α = 0,05, gtth =
2
1 α−
χ
(5) = 11,1
Vì Q
2
< gtth nên ở mức ý nghĩa α = 5%., chúng ta không thể bác bỏ giả
thiết H
o
, i.e. chúng ta chập nhận rằng con xúc xắc là vô tư

8.4. Thí dụ. Trong một trường ñại học, số các sinh viên ñậu và rớt bởi
môn học của 3 Thầy A, B và C ñược cho trong bảng dưới ñây. Hãy kiểm ñịnh giả
thiết cho rằng tỉ lệ sinh viên bị rớt bởi môn học của 3 Thầy là như nhau ở mức ý
nghĩa α = 5%.
Thầy A Thầy B Thầy C Tổng
Đậu 50 47 56 153
Rớt 5 14 8 27
Tổng 55 61 64 180
Giải. Với giả thiết H
0
, cho rằng tỉ lệ sinh viên bị rớt bởi môn học của 3
Thầy là như nhau, chúng ta dễ dàng tính ñược các tần số lý thuyết, ñược viết
trong ngoặc ñơn, phía dưới tần số quan sát tương ứng.
Thầy A Thầy B Thầy C Tổng
Đậu 50
( 46,75 )
47
( 51,85 )
56
( 54,40 )
153
Rớt 5
( 8,25 )
14
( 9,15 )
8
( 9,60 )
27
Tổng 55 61 64 180
Giá trị của Q

2
với (h − 1)(c − 1) = 2 bậc tự do là:

2 2 2
2
2 2 2
(50 46,75) (47 51,85) (56 54,40 )
46,75 51,85 54,40
(5 8,25) (14 9,15) (8 9,60)
4,84
8,25 9,15 9,60
Q
− − −
= + + +
− − −
+ + + =

V

i m

c ý ngh
ĩ
a α = 0,05, gtth =
2
1 α−
χ
(2) = 5,99.
Vì Q
2

< gtth nên chúng ta không th

bác b

gi

thi
ế
t H
0

m

c ý ngh
ĩ
a 5%.
Nói cách khác, chúng ta ch

p nh

n r

ng t

l

sinh viên b

r


t b

i ba Th

y là
nh
ư
nhau

m

c ý ngh
ĩ
a 5%.

Chng 6

KIM ĐNH GI THIT THNG KÊ

150




BÀI TẬP

6.1.
Trong m

t cu


c
ñ
i

u tra v

nh

p m

ch c

a 64 thanh niên làm ngh

A,
k
ế
t qu

là nh

p m

ch trung bình 74 l

n/phút và
ñộ
l


ch chu

n b

ng 9 l

n/phút.
Hãy ki

m
ñị
nh xem
ñặ
c
ñ
i

m ngh

A có làm cho nh

p m

ch c

a thanh niên t
ă
ng
quá m


c bình th
ườ
ng không, bi
ế
t r

ng nh

p m

ch bình th
ườ
ng c

a thanh niên là
72 l

n / phút. ( k
ế
t lu

n v

i m

c α = 0,01 ).
6.2.

Đ
i


u tra Cholesterol toàn ph

n trong huy
ế
t thanh c

a 25 b

nh nhân b


m

t lo

i b

nh B, ta có trung bình c

ng c

a l
ượ
ng Cholesterol là 172 mg% và
ñộ

l

ch chu


n b

ng 40 mg%. Theo tài li

u v

h

ng s

sinh hoá bình th
ườ
ng c

a
ng
ườ
i Vi

t Nam thì l
ượ
ng Cholesterol trung bình toàn ph

n trong huy
ế
t thanh là
156 mg% và tuân theo lu

t phân ph


i chu

n.
H

i l
ượ
ng Cholesterol c

a các b

nh nhân m

c b

nh B có cao h
ơ
n bình
th
ườ
ng không ? ( m

c α = 0,05 )
6.3.
M

t công ty bào ch
ế
m


t lo

i thu

c ch

a d



ng tuyên b

r

ng thu

c
c

a h

có hi

u qu

không d
ướ
i 90% trong vi


c làm gi

m c
ơ
n d



ng trong vòng 8
gi

. M

t m

u g

m 200 ng
ườ
i b

d



ng s

d

ng lo


i thu

c trên, có 160 ng
ườ
i
gi

m c
ơ
n d



ng. Hãy xác
ñị
nh xem l

i tuyên b

c

a công ty có giá tr

không? (

m

c ý ngh
ĩ

a α = 0,07).

6.4.
Tr
ướ
c
ñ
ây, Nhà máy Alpha s

n xu

t ra m

t lo

i s

n ph

m v

i t

l

ph
ế

ph


m 5%. N
ă
m nay, sau
ñợ
t c

i ti
ế
n k

thu

t,
ñể
ki

m tra hi

u qu

, ng
ườ
i ta l

y ra
ra m

t m

u g


m 800 s

n ph

m
ñể
ki

m tra thì th

y có 24 ph
ế
ph

m.
(a) V

i m

c ý ngh
ĩ
a α = 5%, hãy ki

m
ñị
nh xem
ñợ
t c


i ti
ế
n k

thu

t có
th

c s

làm gi

m t

l

ph
ế
ph

m không?.
(b) Sau
ñợ
t c

i ti
ế
n k


thu

t, n
ế
u nhà máy báo cáo t

l

ph
ế
ph

m là 2% thì
có ch

p nh

n
ñượ
c không? (

m

c ý ngh
ĩ
a α = 3%)
6.5.
Ti

n l

ươ
ng hàng tu

n trung bình trên m

t m

u g

m 30 công nhân trong
m

t xí nghi

p l

n là 180 (ngàn
ñồ
ng) v

i v

i
ñộ
l

ch chu

n 14 (ngàn
ñồ

ng).
Trong m

t xí nghi

p l

n khác, m

t m

u g

m 40 công nhân
ñượ
c ch

n ng

u nhiên
có ti

n l
ươ
ng hàng tu

n trung bình là 170 (ngàn
ñồ
ng) v


i
ñộ
l

ch chu

n 10
(ngàn
ñồ
ng). Ti

n l
ươ
ng hàng tu

n trung bình

hai xí nghi

p trên có khác nhau
không? (

m

c ý ngh
ĩ
a α = 5%).
6.6.
G


i X và Y l

n l
ượ
t là bi
ế
n ng

u nhiên ch

kh

i l
ượ
ng c

a tr

s
ơ
sinh
trai và tr

s
ơ
sinh gái. Cho bi
ế
t X và Y tuân theo lu

t phân ph


i chu

n có cùng
ph
ươ
ng sai. Kh

o sát ng

u nhiên 20 tr

s
ơ
sinh trai, ng
ườ
i ta tính
ñượ
c
x
= 3200
g, s
X
= 400 g và 17 tr

s
ơ
sinh gái, ng
ườ
i ta tính

ñượ
c
y
= 3000 g, s
Y
= 380 g.
Ph

i ch
ă
ng kh

i l
ượ
ng c

a tr

s
ơ
sinh trai l

n h
ơ
n kh

i l
ượ
ng c


a tr

s
ơ
sinh gái?
(k
ế
t lu

n v

i m

c ý ngh
ĩ
a α = 5%)
6.7.
Kh

i l
ượ
ng c

a m

t lo

i s

n ph


m do m

t nhà máy s

n xu

t là m

t
bi
ế
n ng

u nhiên tuân lu

t phân ph

i chu

n N(500; (8,5)
2
). Sau m

t th

i gian s

n


Chng 6

KIM ĐNH GI THIT THNG KÊ

151




xu

t, ban lãnh
ñạ
o nhà máy nghi ng

r

ng kh

i l
ượ
ng c

a lo

i s

n ph

m này có xu

h
ướ
ng gi

m, nên ti
ế
n hành cân th

25 s

n ph

m và thu
ñượ
c k
ế
t qu

sau:
Kh

i l
ượ
ng (g) 480 485 490 495 500 510
S

s

n ph


m 2 3 8 5 3 4
V

i m

c ý ngh
ĩ
a α = 5% , hãy cho k
ế
t lu

n v


ñ
i

u nghi ng

trên.
6.8.
M

t công ty mu

n
ñ
ánh giá v

hi


u qu

c

a m

t
ñợ
t qu

ng cáo
ñố
i
v

i s

s

n ph

m b

n ra c

a công ty. 10 c

a hàng bán s


n ph

m c

a công ty
ñượ
c
ch

n ng

u nhiên
ñể
theo dõi s

l
ượ
ng s

n ph

m bán ra trong m

t tu

n tr
ướ
c
ñợ
t

qu

ng cáo (T
Đ
QC) và m

t tu

n sau
ñợ
t qu

ng cáo (S
Đ
QC).
C

a hàng 1 2 3 4 5 6 7 8 9 10
T
Đ
QC 53 114 81 86 34 66 89 113 88 111
S
Đ
QC 137 135 83 125 47 46 114 157 57 144
Hãy cho k
ế
t lu

n v


hi

u qu

c

a
ñợ
t qu

ng cáo (

m

c α = 5%)
6.9.
M

t máy s

n xu

t t


ñộ
ng có t

l


s

n xu

t ra s

n ph

m lo

i A lúc
ñầ
u
là 48%. Máy
ñượ
c c

i ti
ế
n và sau m

t th

i gian áp d

ng, ng
ườ
i ta ki

m tra 40

h

p, m

i h

p g

m 10 s

n ph

m và ghi l

i s

s

n ph

m lo

i A trong m

i h

p
(SSPLA/h) nh
ư
sau :

SSPLA/h 1 2 3 4 5 6 7 8 9 10
S

h

p 2 0 4 6 8 10 4 5 1 0
(a). Hãy
ướ
c l
ượ
ng t

l

s

n ph

m lo

i A sau khi máy
ñượ
c c

i ti
ế
n b

ng
kho


ng tin c

y 95,44%
(b). Hãy cho k
ế
t lu

n v

hi

u qu

c

a vi

c c

i ti
ế
n máy

m

c ý ngh
ĩ
a α =
0,05.

6.10.
Kh

i l
ượ
ng trung bình khi xu

t chu

ng

m

t tr

i ch
ă
n nuôi gà công
nghi

p n
ă
m tr
ướ
c là 3,3 kg/con. N
ă
m nay ng
ườ
i ta s


d

ng lo

i th

c
ă
n m

i. Sau
m

t th

i gian, cân th

15 con khi xu

t chu

ng, có các s

li

u sau: (
ñơ
n v

kg)

3,25; 2,50; 4,00; 3,75; 3,80; 3,90; 4,02;
3,60; 3,80; 3,20; 3,82; 3,40; 3,75; 4,00; 3,50.
Gi

thi
ế
t kh

i l
ượ
ng gà là bi
ế
n ng

u nhiên phân ph

i theo qui lu

t chu

n v

i
ph
ươ
ng sai 0,04.
(a) V

i m


c ý ngh
ĩ
a α = 0,05, hãy cho k
ế
t lu

n v

tác d

ng c

a lo

i th

c
ă
n m

i.
(b) N
ế
u tr

i ch
ă
n nuôi báo cáo kh

i l

ượ
ng trung bình c

a gà xu

t chu

ng
n
ă
m nay là 3,7 kg/con thì có ch

p nh

n
ñượ
c không? (

m

c ý ngh
ĩ
a α
= 0,05)

Chng 6

KIM ĐNH GI THIT THNG KÊ

152





6.11.
M

t cu

c
ñ
i

u tra c

a H

i ph

n


ñể

ñ
ánh giá v

m

t d

ư
lu

n xã h

i
cho r

ng l
ươ
ng c

a ph

n

th

p hon l
ươ
ng c

a nam gi

i. M

t m

u nhiên g


m 4
ñ
àn ông có l
ươ
ng trung bình là 78,0 (ngàn
ñồ
ng), v

i
ñộ
l

ch chu

n m

u là 24,4;
m

t m

u ng

u nhiên khác
ñ
ôc l

p v

i m


u trên g

m 4 ph

n

có l
ươ
ng trung bình
là 63,5 (ngàn
ñồ
ng), v

i
ñộ
l

ch chu

n là 20,2. Gi

s

r

ng l
ươ
ng c


a c

nam và
n

gi

i
ñề
u là các bi
ế
n ng

u nhiên tuân theo lu

t phân ph

i chu

n có cùng ph
ươ
ng
sai. Hãy cho k
ế
t lu

n v

cu


c
ñ
i

u tra trên

m

c ý ngh
ĩ
a 10%.
6.12.
Ng
ườ
i ta mu

n nghiên c

u tác d

ng c

a vi

c cho sinh viên
ñ
i th

c
t

ế
xem s

ti
ế
p thu ki
ế
n th

c có t

t h
ơ
n không b

ng cách so sánh
ñ
i

m thi c

a
nhóm sinh viên không
ñ
i th

c t
ế
(SVK
Đ

TT) v

i nhóm sinh viên có
ñ
i th

c t
ế

(SVC
Đ
TT). K
ế
t qu

nh
ư
sau:
Đ
i

m 0 1 2 3 4 5 6 7 8 9 10
SVC
Đ
TT 0 0 3 9 7 5 17 10 11 4 1
SVK
Đ
TT 3 3 6 11 7 13 10 12 4 1 3
G


i X và Y l

n l
ượ
t là bi
ế
n ng

u nhiên bi

u th


ñ
i

m s

c

a sinh viên có
ñ
i
th

c t
ế
và sinh viên không
ñ
i th


c t
ế
.
Đ
i

m thi c

a nhóm sinh viên có
ñ
i th

c t
ế
có th

c s

t

t h
ơ
n không? (k
ế
t
lu

n


m

c ý ngh
ĩ
a α = 0,01 )
6.13.
M

t công ty v

n t

i, mu

n
ñ
ánh giá tác d

ng c

a m

t lo

i ch

t ph


gia pha vào x

ă
ng,
ñ
ã ch

n 10 chi
ế
c xe. Cho m

i chi
ế
c ch

y hai l

n v

i cùng
ñ
i

u
ki

n nh
ư
nhau; nh
ư
ng l


n
ñầ
u v

i x
ă
ng không có ch

t ph

gia (KPG), l

n sau, v

i
cùng m

t l
ượ
ng x
ă
ng nh
ư
l

n
ñầ
u, có ch

t ph


gia (CPG). Ng
ườ
i ta ghi l

i s


d

m
ñ
ã
ñ
i
ñượ
c c

a 10 chi
ế
c xe trên trong hai l

n nh
ư
sau:
Xe KPG CPG Xe KPG CPG
1
2
2
4

5
26,2
25,7
22,3
19,6
18,1
26,7
25,8
21,9
19,3
18,4

6
7
8
9
10
15,8
13,9
12,0
11,5
10,0
15,7
14,2
12,6
11,9
10,3
Có s

khác nhau gi


a s

d

m trung bình
ñ
i
ñượ
c v

i x
ă
ng không có ch

t
ph

gia và có ch

t ph

gia không? (k
ế
t lu

n

m


c ý ngh
ĩ
a 5%)
6.14.
Kh

i l
ượ
ng bao g

o (KLBG) là bi
ế
n ng

u nhiên có phân ph

i chu

n
N(50; 0,01). Có nhi

u ý ki
ế
n c

a khách hàng ph

n ánh là kh

i l

ượ
ng b

thi
ế
u. M

t
nhóm thanh tra
ñ
ã cân ng

u nhiên 25 bao g

o trong kho và
ñượ
c k
ế
t qu

nh
ư
sau:
KLBG (kg) (48; 48,5] (48,5; 49] (49; 49,5] (49,5; 50] (50; 50,5]
S

bao g

o 2 5 10 6 2


Chng 6

KIM ĐNH GI THIT THNG KÊ

153




Hãy ki

m
ñị
nh xem ý ki
ế
n c

a khách hàng ph

n ánh có
ñ
úng không? (k
ế
t
lu

n

m


c ý ngh
ĩ
a α = 5%).
6.15.
M

t m

u g

m 300 c

tri

khu v

c A và m

t m

u g

m 200 c

tri


khu v

c B cho th


y có 56% và 48%, theo th

t

,

ng h



ng c

viên X.

m

c ý
ngh
ĩ
a 5%, hãy ki

m
ñị
nh gi

thi
ế
t:
(a)


Có s

khác bi

t gi

a hai khu v

c v

s



ng h



ng c

viên X.
(b)

ng c

viên X
ñượ
c


ng h

h
ơ
n

khu v

c A.
6.16.

Đ
i

u tra ng

u nhiên 200 ng
ườ
i có hút thu

c lá, th

y có 28 ng
ườ
i b


lao ph

i; 170 ng

ườ
i không hút thu

c lá, th

y có 12 ng
ườ
i b

lao ph

i. T

l

lao
ph

i gi

a nh

ng ng
ườ
i có và không hút thu

c lá có khác khau không? (k
ế
t lu


n


m

c ý ngh
ĩ
a α = 1%).
6.17.
M

t nhà máy có hai phân x
ưở
ng A và B cùng s

n xu

t m

t lo

i tr

c
máy. Sau m

t th

i gian ho


t
ñộ
ng, ch

n ng

u nhiên 20 tr

c máy do phân x
ưở
ng
A s

n xu

t, ng
ườ
i ta
ñ
o
ñượ
c
ñườ
ng kính c

a chúng nh
ư
sau (
ñơ
n v


mm)
250; 249; 251; 253; 248; 250; 250; 252; 257; 245;
248; 247; 249; 250; 280; 250; 247; 253; 256; 249.
Gi

s


ñườ
ng kính c

a các tr

c máy

hai phân x
ưở
ng A và B tuân theo
lu

t phân ph

i chu

n có cùng ph
ươ
ng sai.
(a) Tìm kho


ng tin c

y 95% cho
ñườ
ng kính trung bình các tr

c máy do
phân x
ưở
ng A s

n xu

t.
(b) Tìm kho

ng tin c

y 90% cho ph
ươ
ng sai c

a
ñườ
ng kính các tr

c máy
do phân x
ưở
ng A s


n xu

t.
(c) Gi

s


ñườ
ng kính c

a m

t tr

c máy do phân x
ưở
ng A s

n xu

t, theo
qui
ñị
nh là 250 mm. Hãy cho k
ế
t lu

n v


ch

t l
ượ
ng s

n xu

t c

a phân
x
ưở
ng A

m

c ý ngh
ĩ
a α = 5%.
(d)
Đ
o ng

u nhiên
ñườ
ng kính 20 tr

c máy do phân x

ưở
ng B s

n xu

t,
ng
ườ
i ta tính
ñượ
c
ñườ
ng kính trung bình là 249,8 v

i ph
ươ
ng sai 56,2.
Hãy ki

m
ñị
nh,

m

c ý ngh
ĩ
a α = 5%, gi

thi

ế
t H
o
cho r

ng
ñườ
ng
kính trung bình các tr

c máy
ñượ
c s

n xu

t

hai phân x
ưở
ng là nh
ư

nhau
ñố
i v

i gi

thi

ế
t H
1
cho r

ng chúng khác nhau.
6.18.
S

n ph

m c

a m

t xí nghi

p
ñ
úc cho phép s

khuy
ế
t t

t trung bình
cho m

t s


n ph

m là 3. Sau m

t
ñợ
t c

i ti
ế
n k

thu

t, ng
ườ
i ta l

y ng

u nhiên 36
s

n ph

m
ñể
ki

m tra s


khuy
ế
t t

t trên m

i s

n ph

m (SKTTMSP). K
ế
t qu

thu
ñượ
c nh
ư
sau:
SKTTMSP 0 1 2 3 4 5 6
S

s

n ph

m 7 4 4 6 8 6 1
(a)


Hãy cho k
ế
t lu

n v

hi

u qu

c

a
ñợ
t c

i ti
ế
n k

thu

t
ñố
i v

i s


khuy

ế
t t

t trung bình c

a m

t s

n ph

m

m

c ý ngh
ĩ
a α = 10%.

Chng 6

KIM ĐNH GI THIT THNG KÊ

154




(b)


S

n ph

m có không quá 2 khuy
ế
t t

t
ñượ
c g

i là s

n ph

m lo

i A. T


l

s

n ph

m lo

i A tr

ướ
c
ñợ
t c

i ti
ế
n k

thu

t là 40%.
Đợ
t c

i ti
ế
n k


thu

t có th

c s

làm t
ă
ng t


l

s

n ph

m lo

i A không? (k
ế
t lu

n

m

c
ý ngh
ĩ
a 5%).
6.19.

Đ
i

u tra v

hai ch

tiêu X (cm) và Y(g),

ñề
u có phân ph

i chu

n, trên
m

t m

t m

u g

m m

t s

s

n ph

m do xí nghi

p A s

n xu

t, ng
ườ

i ta có k
ế
t qu

:
y
k

x
i

(90, 95] (95, 100] (100, 105] (105, 110]
25 5 19 12
30 13 23 10
35 2 15 7 5
40 8 2
(a) Nh

ng s

n ph

m có ch

tiêu Y không h
ơ
n 95 g g

i là s


n ph

m lo

i II.
Tìm kho

ng tin c

y 98% cho trung bình ch

tiêu X c

a nh

ng s

n ph

m
lo

i II.
(b) Báo cáo c

a xí nghi

p cho r

ng t


l

s

n ph

m lo

i II c

a xí nghi

p
không quá 13%. Hãy cho nh

n xét v

báo cáo trên

m

c ý ngh
ĩ
a α
= 8%.
6.20.
M

t hãng bào ch

ế
thu

c
ñ
ang th

nghi

m hai lo

i thu

c gây mê A
và B m

i. Vi

c th

nghi

m
ñượ
c ti
ế
n hành trên hai nhóm thú v

t khác nhau.
Nhóm th


nh

t g

m 100 con dùng thu

c A thì có 71 con b

mê; nhóm th

hai, khi
dùng thu

c B, có 58 con b

mê trong 90 con. Hãng bào ch
ế
mu

n ki

m
ñị
nh xem
tác d

ng c

a hai lo


i thu

c trên có khác nhau không

m

c ý ngh
ĩ
a 5%. Hãy cho
bi
ế
t k
ế
t lu

n.

6.21.
V

i ý mu

n làm t
ă
ng ch

s

m


s

a c

a lo

i gi

ng bò A, m

t tr

i
ch
ă
n nuôi cho lai bò gi

ng A v

i m

t lo

i bò gi

ng B.
Đ
o ch


s

m

s

a c

a 130
con bò lai gi

ng
ñượ
c ch

n ng

u nhiên trong
ñ
àn bò c

a tr

i, ng
ườ
i ta có k
ế
t qu



sau:
Ch

s

m

s

a S

bò lai
[3,0; 3,6)
[3,6; 4,2)
[4,2; 4,8)
[4,8; 5,4)
[5,4; 6,0)
[6,0; 6,6)
[6,6; 7,2)
2
8
35
43
22
15
5

Chng 6

KIM ĐNH GI THIT THNG KÊ


155




(a)

Hãy
ướ
c l
ượ
ng ch

s

m

s

a trung bình c

a gi

ng bò lai b

ng kho

ng
tin c


y 99%.
(b)

Bi
ế
t r

ng ch

s

m

s

a trung bình c

a gi

ng bò A thu

n ch

ng là 4,95.
Hãy cho k
ế
t lu

n v


hi

u qu

c

a vi

c lai gi

ng

m

c ý ngh
ĩ
a 1%.
6.22.

Đ
i

u tra v

m

t nguyên nhân gây ung th
ư
ph


i:
Th
ă
m dò trong 200 ng
ườ
i có hút thu

c lá, th

y có 28 ng
ườ
i b

K ph

i;
trong 170 ng
ườ
i không không hút thu

c lá, có 12 ng
ườ
i b

K ph

i. Hai t

l


này
có khác nhau không ? K
ế
t lu

n r

ng thu

c lá là nguyên nhân gây K ph

i có
ñ
úng
không? (

m

c ý ngh
ĩ
a α = 5%).
6.23.

Để
kh

o sát m

c thu nh


p hàng n
ă
m c

a m

t nhân viên công ty ABC
g

m 3000 ng
ườ
i, m

t m

u ng

u nhiên g

m 144 nhân viên c

a công ty
ñượ
c quan
sát v

thu nh

p hàng n

ă
m (
ñơ
n v

tính tri

u
ñồ
ng/n
ă
m). K
ế
t qu

nh
ư
sau:
Thu nh

p
(10
6
ñ
/n
ă
m)
s

ng

ườ
i

Thu nh

p
(10
6
ñ
/n
ă
m)
s

ng
ườ
i
[10, 14)
[14, 16)
[16, 18)
[18, 20)
5
15
22
34
[20, 22)
[22, 24)
[24, 26)
[26, 30)
25

20
14
9
(a) Tìm kho

ng tin c

y 95% cho thu nh

p trung bình hàng n
ă
m c

a m

t
nhân viên công ty ABC.
(b) Nh

ng ng
ườ
i có thu nh

p hàng n
ă
m d
ướ
i 16 tri

u là nh


ng ng
ườ
i có thu
nh

p th

p. Hãy
ướ
c l
ượ
ng s

ng
ườ
i có thu nh

p th

p c

a công ty ABC
v

i
ñộ
tin c

y 98%. Báo cáo c


a công ty cho r

ng t

l

nh

ng ng
ườ
i có
thu nh

p th

p trong công ty là không quá 12%. Hãy cho nh

n xét v


báo cáo trên

m

c ý ngh
ĩ
a 5%.
(c) N
ế

u công ty báo cáo r

ng m

c thu nh

p trung bình c

a m

t nhân viên
c

a công ty là không d
ướ
i 1,4 tri

u
ñ
/tháng thì có ch

p nh

n
ñượ
c
không? (k
ế
t lu


n

m

c ý ngh
ĩ
a 4%)
(d) N
ế
u mu

n dùng m

u trên
ñể

ướ
c l
ượ
ng thu nh

p trung bình c

a m

t
nhân viên c

a công ty v


i sai s

là 558 ngàn
ñồ
ng thì
ñộ
tin c

y
ñạ
t
ñượ
c là bao nhiêu?
6.24.
N
ế
u máy móc ho

t
ñộ
ng bình th
ườ
ng thì kh

i l
ượ
ng m

t s


n ph

m
tuân theo lu

t phân ph

i chu

n v

i
ñộ
l

ch chu

n không quá 1kg. Có th

coi máy
móc còn ho

t
ñộ
ng bình th
ườ
ng hay không n
ế
u cân th


30 s

n ph

m do máy
ñ
ó
s

n xu

t ra, thì tính
ñượ
c
ñộ
l

ch chu

n là 1,1 kg. Yêu c

u k
ế
t lu

n

m

c ý ngh

ĩ
a
α = 1%.
6.25.
M

t nhà s

n xu

t bóng
ñ
èn cho r

ng ch

t l
ượ
ng bóng
ñ
èn
ñượ
c coi là
ñồ
ng
ñề
u n
ế
u tu


i th

c

a bóng
ñ
èn có
ñộ
l

ch chu

n b

ng 1000 ho

c ít h
ơ
n. L

y
ng

u nhiên 10 bóng
ñể
ki

m tra, thì
ñượ
c

ñộ
l

ch chu

n m

u là 1150. V

y, v

i

Chng 6

KIM ĐNH GI THIT THNG KÊ

156




m

c ý ngh
ĩ
a 5%, có th

coi ch


t l
ượ
ng bóng
ñ
èn do công ty
ñ
ó s

n xu

t là
ñồ
ng
ñề
u không? Bi
ế
t r

ng tu

i th

c

a bóng
ñ
èn là m

t BNN có phân ph


i chu

n.

6.26.
T

i m

t nông tr
ườ
ng,
ñể

ñ
i

u tra kh

i l
ượ
ng c

a m

t lo

i trái cây, sau
m


t
ñợ
t bón m

t lo

i phân m

i, ng
ườ
i ta cân th

m

t s

trái cây
ñượ
c ch

n ng

u
nhiên và
ñượ
c k
ế
t qu

sau:

Kh

i l
ượ
ng (gam) S

trái cây
[45, 50)
[50, 55)
[55, 60)
[60, 65)
[65, 70)
[70, 75)
[75, 80)

80
2
11
25
74
187
43
16
3
(a)

Ng
ườ
i ta qui
ñị

nh r

ng nh

ng trái cây có kh

i l
ượ
ng nh

h
ơ
n 60 gam là
thu

c lo

i 2. Hãy
ướ
c l
ượ
ng t

l

trái cây lo

i 2 b

ng kho


ng tin c

y
95% và
ướ
c l
ượ
ng kh

i l
ượ
ng trung bình c

a m

i trái cây lo

i b

ng
kho

ng tin c

y 90%
(b) Tr
ướ
c kia, kh


i l
ượ
ng trung bình c

a m

i trái là 65 gam. Hãy
ñ
ánh giá
xem lo

i phân bón m

i có mang l

i hi

u qu

không? (k
ế
t lu

n


m

c ý ngh
ĩ

a α = 1%).
6.27.
M

t công ty th
ươ
ng m

i, d

a vào kinh nghi

m quá kh

,
ñ
ã xác
ñị
nh
r

ng vào cu

i n
ă
m thì 80% s

hoá
ñơ
n

ñ
ã
ñượ
c thanh toán
ñầ
y
ñủ
, 10% kh

t l

i 1
tháng, 6% kh

t l

i 2 tháng, và 6% kh

t l

i h
ơ
n 2 tháng. Vào cu

i n
ă
m nay, công ty
ki

m tra m


t m

u ng

u nhiên g

m 400 hoá
ñơ
n và th

y r

ng: 287 hoá
ñơ
n
ñ
ã
ñượ
c thanh toán
ñầ
y d

, 49 kh

t l

i 1 tháng, 30 kh

t l


i 2 tháng và 34 kh

t l

i h
ơ
n
2 tháng. Nh
ư
v

y, vi

c thanh toán hoá
ñơ
n n
ă
m nay có còn theo qui lu

t nh
ư

nh

ng n
ă
m tr
ướ
c không? (k

ế
t lu

n

m

c ý ngh
ĩ
a α = 5%).
6.28.

Để
l

p k
ế
ho

ch s

n xu

t m

t hàng m

i, m

t công ty

ñ
ã ti
ế
n hành
ñ
i

u tra v

s

thích c

a khách hàng v

3 lo

i m

u khác nhau c

a cùng m

t lo

i
hàng. K
ế
t qu



ñượ
c trình bày

b

ng sau:
M

u hàng

Ý ki
ế
n
A B C
Thích 43 30 42
Không thích 35 53 39
Không có ý ki
ế
n 22 17 19

Chng 6

KIM ĐNH GI THIT THNG KÊ

157





Có hay không s

phân bi

t v

s

thích c

a khách hàng
ñố
i v

i 3 lo

i m

u
nói trên? K
ế
t lu

n

m

c ý ngh
ĩ
a 5%

6.29.

Đ
i

u tra m

t s

s

n ph

m c

a m

t xí nghi

p v

chi

u dài (X (cm)) và
hàm l
ượ
ng ch

t A (Y (%)), ng
ườ

i ta có k
ế
t qu

sau:
Y
X
8 10 12 14 16
100 5 5
110 4 6 7
120 5 9 8
130 4 6 9
140 5 7
(a) Các s

n ph

m có chi

u dài không quá 110cm và hàm l
ượ
ng ch

t A
không h
ơ
n 12%
ñượ
c g


i là s

n ph

m lo

i II. N
ế
u xí nghi

p báo cáo
r

ng s

n ph

m lo

i II có ch

tiêu Y trung bình là 10% thì có th

ch

p
nh

n
ñượ

c không? K
ế
t lu

n

m

c ý ngh
ĩ
a 5% (gi

thi
ế
t hàm l
ượ
ng này
có phân ph

i chu

n)
(b) Giá 1m s

n ph

m là 280 VN
Đ
. Tìm kho


ng tin c

y 98% cho giá trung
bình m

t s

n ph

m c

a xí nghi

p.
(c) N
ế
u mu

c
ướ
c l
ượ
ng t

l

s

n ph


m lo

i II v

i sai s

không quá 3% và
ướ
c l
ượ
ng chi

u dài trung bình c

a s

n ph

m v

i sai s

không quá 8
mm, và c

hai
ướ
c l
ượ
ng cùng

ñộ
tin c

y 87%, thì ph

i
ñ
i

u tra thêm
bao nhiêu s

n ph

m n

a?
6.30.
Trong t

ng th

b

nh M, bác s
ĩ
(BS) t

h


i, li

u hai tri

u ch

ng S
1

S
2
có liên quan hay không?. BS quan sát ng

u nhiên 300 ng
ườ
i b

nh M, k
ế
t qu


nh
ư
sau:
S
2

S
1


0 1
0 45

105

1 72

78
(a) Làm cách nào BS ki

m
ñị
nh s

liên quan gi

a 2 tri

u ch

ng trên?
(b) V

i phép ki

m
ñị
nh
ñ

ã ch

n, nh

ng giá tr

nào c

a ng
ưỡ
ng α có th


giúp k
ế
t lu

n?
(c) Tìm kho

ng tin c

y 95% v

t

l

b


nh nhân M có c

hai tri

u ch

ng S
1

và S
2
trong t

ng th

.

×