Tải bản đầy đủ (.pdf) (27 trang)

Bài giảng xác suất thống kê chương 7 kiểm định giả thiết thống kê

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (352.52 KB, 27 trang )

ThS. Phạ m Trí Cao * Chương 7

CHƯƠNG 7:
KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ

1

Trong thực tế ta thường gặp vấn đề: phải
kiểm tra xem 1 điều gì đó đúng hay sai,
nội dung thông tin mà ta nhận được từ các
nguồn cung cấp (1 người, 1 cơ quan, 1 tờ
báo, 1 tổ chức,...) có đáng tin cậy không.
Công việc kiểm tra lại nội dung thông tin
mà ta nhận được xem có đáng tin cậy
không chính là bài toán kiểm đònh.

 Ta

tiến hành kiểm đònh (kiểm tra) như sau:
 Thu thập số liệu thực tế (lấy mẫu): đo chiều cao
của khoảng 1 triệu người
 Dùng 1 quy tắc kiểm đònh tương ứng với giả thiết
đang xét (kiểm đònh giá trò trung bình) để quyết
đònh: chấp nhận hay bác bỏ H0

 Chấp

nhận H0: tổ chức này báo cáo đúng. Con số
1.65m là đáng tin cậy.
 Bác bỏ H0: tổ chức này báo cáo sai.
3



 Thí

dụ 1: Một tổ chức cho rằng chiều cao trung bình
hiện nay của thanh niên VN là 1.65m. Hãy lập giả
thiết để kiểm chứng kết quả này?

 HD:
 H0:=1.65
 H1:≠1.65

chiều cao TB thực tế của thanh niên hiện nay
1.65: chiều cao TB của thanh niên hiện nay theo
lời tổ chức này
 H0 gọi là giả thiết thống kê (giả thiết không)
 H1 gọi là giả thiết đối
 :

 0=

2

 Thí

dụ 2: Một học viên luyện thi cao học cho rằng tỷ lệ
học viên thi đạt môn XSTK là 50%. Hãy lập giả thiết
thống kê để kiểm chứng điều này?

 HD:
 H0:


p=0.5
 H1: p≠0.5
 p: tỷ lệ học viên thực tế thi đạt môn XSTK
 p0= 0.5 : tỷ lệ học viên thi đạt môn XSTK theo lời
người này.
4

1


ThS. Phạ m Trí Cao * Chương 7

 Thí

dụ 3: Một cô gái được cho là thùy mò, nết na, đằm
thắm, dòu dàng, ngăn nắp, chu đáo, …nói chung là hết…
ý! Và ta muốn để ý!
 Ta phải kiểm tra điều này! Tuy nhiên ta sẽ không
quyết đònh được lập giả thiết thống kê như thế nào, bởi
vì sai lầm nào cũng đau khổ cả! Và ta không thể tự
mình tiến hành kiểm đònh được!
 Bài toán loại này ta không thể xét được, bởi vì không
có quy tắc quyết đònh chung. Ctmb quyết đònh như thế
nào!

5

 Ta


không thể làm giảm P(sll1) và P(sll2) xuống cùng
lúc được (cỡ mẫu cố đònh), nếu làm giảm P(sll1) thì
sẽ làm tăng P(sll2), và ngược lại. Chỉ có thể làm
giảm cả P(sll1) và P(sll2) cùng lúc bằng cách tăng
cỡ mẫu lên.

 Về

mặt khách quan thì cả 2 loại sai lầm đều nguy
hiểm, tuy nhiên về mặt chủ quan thì ta coi sai lầm
loại 1 là nguy hiểm hơn sai lầm loại 2. Do đó người
ta lập giả thiết sao cho sai lầm loại 1 là nguy hiểm
hơn.
7

Để xét xem chấp nhận hay bác bỏ H 0 thì ta
phải lấy mẫu, và đưa ra quyết đònh dựa trên
mẫu. Trong quá trình làm, có 4 trường hợp
sau:
H0 đúng
Quyết đònh H0 sai
Chủ quan
Thực tế
khách quan
H0 sai
Đúng
Sai lầm loại 2
H0 đúng
Sai lầm loại 1 Đúng
P(sll1)= P(bác bỏ H 0/H0 đúng) ,

P(sll2)= P(chấp nhận H 0/H0 sai)

6

Một người bò nghi ngờ là ăn trộm.
lập giả thiết:
H0: người này là vô tội
H1: người này là có tội
(Trong xã hội văn minh, dân chủ thì luôn mong muốn
điều tốt đẹp xãy ra!)

 VD1:
 Ta

 Công

an đi thu thập chứng cớ để bác bỏ H0, nếu có
đủ chứng cớ thì kết luận người này có tội (bác bỏ
H0), nếu không đủ chứng cớ thì vẫn phải kết luận
người này vô tội (chấp nhận H0).
8

2


ThS. Phạ m Trí Cao * Chương 7

 Ta

có 2 loại sai lầm sau:

 Trong thực tế người này vô tội, nhưng do sự tắc
trách của CA hoặc do bò hãm hại mà người này bò
kết luận là có tội  BẮT OAN (sll1).
 Trong thực tế người này có tội, nhưng do là SIÊU
TRỘM nên CA không tìm được chứng cớ nên phải
thả ra  THẢ LẦM (sll2).

 Ta

thấy BẮT OAN nguy hiểm hơn THẢ LẦM, nếu
có thả lầm thì ta hy vọng rằng “Lưới trời lồng lộng,
tuy thưa mà khó lọt, lọt lần này thì chưa chắc sẽ lọt
lần khác!” (Bao Công)
9

2: Một người đi khám bệnh xem có bò ung thư
phổi không, ta đặt giả thiết sau:
 H0: người này có bệnh ung thư phổi.
 VD

 Ta

có hai loại sai lầm tương ứng:
 sai lầm loại I là người này có bệnh nhưng bác só
kết luận không có.
 sai lầm loại II là người này không có bệnh nhưng
bác só kết luận có.
 Ta thấy sai lầm loại I là nguy hiểm hơn.
10


CÁC DẠNG KIỂM ĐỊNH:
Kiểm
 Do

đó ta đưa ra quy tắc kiểm đònh sao cho:
 P(sll1) <=, với  là 1 con số cho trước, gọi là
mức (có) ý nghóa của kiểm đònh.
 P(sll2) bé nhất có thể được.

đònh tham số
Kiểm đònh giá trò trung bình
Kiểm đònh tỷ lệ
Kiểm đònh phương sai
Kiểm đònh tham số có 2 dạng:
2 phía
1 phía (phải, trái)
Kiểm

11

đònh phi tham số
Kiểm đònh quy luật phân phối xác suất
Kiểm đònh tính độc lập của 2 dấu hiệu

12

3


ThS. Phạ m Trí Cao * Chương 7


PHƯƠNG PHÁP KIỂM ĐỊNH
 Phương

pháp khoảng tin cậy
 Phương pháp giá trò tới hạn
 Phương pháp p-value

 PHẦN

I: KIỂM ĐỊNH THAM SỐ
 KIỂM ĐỊNH GIÁ TRỊ TRUNG BÌNH
 KIỂM ĐỊNH TỶ LỆ
 KIỂM ĐỊNH PHƯƠNG SAI

13

1) KIỂM ĐỊNH GIÁ TRỊ TRUNG BÌNH:

14

KIỂM ĐỊNH HAI PHÍA:

trung bình đám đông
0: 1 con số cần kiểm đònh xem đúng hay sai

 :

 Kiểm


đònh giá trò trung bình
 Kiểm đònh tỷ lệ
 Kiểm đònh phương sai

 a)

Kiểm đònh 2 phía
H0: =0 ; H1: 0

 b)

Kiểm đònh một phía
 Phía phải: H0: =0 ; H1: >0
 Phía trái: H0: =0 ; H1: <0
15

16

4


ThS. Phạ m Trí Cao * Chương 7

Cách 2: pp giá trò tới hạn
(X   )
0
Chọn G  T 
/ n

III) Kiểm đònh giá trò trung bình

H0: µ= µ0

, H1: µ µ0

WX=(X1, …,Xn)

Nếu giả thiết H0 đúng thì T~N(0,1)

G=f(WX,µ0) : tiêu chuẩn kiểm đònh.

ta tìm được t sao cho:

Nếu giả thiết H0 đúng thì ta biết được quy luật ppxs
của G.

P(GW/H0) =  = P(|T|>t)
Do đó ta có miền bác bỏ 2 phía là:
(X   )
0 ,|T|>t}
W={T 
/ n

Ta tìm miền W sao cho: P(GW/H0) = 
W gọi là miền bác bỏ giả thiết H0,  gọi là mức ý
nghóa của kiểm đònh.
Cách 1: phương pháp KTC (ít thông dụng)
Ta tìm KTC của µ. Nếu µ0 thuộc KTC này thì ta
chấp nhận giả thiết H0.

17


Trong thực hành:
(x   )
0
Tính t 
/ n

18

|t|> t: bác bỏ H0

n  30 , biết 2:
(x   ) n
0
t

  t (tra bảng G)
|t| < t : chấp nhận H0
|t|  t : bác bỏ H0 , chấp nhận H1
Trong trường hợp bác bỏ H 0 :
+ Nếu x  o thì  > 0

1.

+ Nếu x  o thì  < 0

Nếu không biết 2: thay  bằng s
(x   ) n
0
t

,   t (tra bảng G)
s
|t| < t : chấp nhận H 0
|t|  t : bác bỏ H0 , chấp nhận H 1

19

20

5


ThS. Phạ m Trí Cao * Chương 7

n < 30, biết 2 (X có phân phối chuẩn)
(x   ) n
0
t
,   t (tra bảng G)

|t| < t : chấp nhận H0
|t|  t : bác bỏ H0
2. n < 30, không biết 2 (X có phân phối
chuẩn)
( x  o ) n
t
,   t (n–1) (tra bảng H)
s
|t| < t(n–1) : chấp nhận H0
21

|t|  t(n–1) : bác bỏ H0
1.

Giả thiết H 0 :  = 600 ; H 1:   600
 : là tiền lương trung bình thực sự của công nhân hiện nay
o = 600 : là tiền lương trung bình của công nhân theo lời giám đốc
x = 520 , n = 36 > 30 ,  = 40 ,  = 5%
 = 5%   = 1 –  = 0,95  t = 1,96
Ta có t  (xo) n  (520600) 36 12
40

|t|= 12 > 1,96= t  : bác bỏ H 0
Kết luận : với mức ý nghóa là 5%, không tin vào lời của giám đốc.
Lương trung bình thực sự của công nhân bé hơn 600 ngàn đồng /
23
tháng (do x 520600 o).

Bài 1 : Giám đốc một xí nghiệp cho biết lương
trung bình của 1 công nhân thuộc xí nghiệp hiện
nay là 600 ngàn đồng/tháng.
Chọn ngẫu nhiên 36 công nhân thấy lương trung
bình là 520 ngàn đồng/tháng, với độ lệch chuẩn
 = 40 ngàn đồng/tháng. Lời báo cáo của giám
đốc có tin cậy được không, với mức có ý nghóa
là  = 5%.
22

Chú ý quan trọng:
 Trước tiên phải đặt giả thiết thống kê rùi muốn làm
gì thì làm!

 Nếu không đặt giả thiết thống kê mà có tính toán
đúng thì cũng hổng được điểm.
 Tính toán, tra bảng đúng nhưng kết luận sai thì cũng
hổng được điểm. “Uổng ơi là uổng!”
24

6


ThS. Phạ m Trí Cao * Chương 7

Giải

Bài 3 :Một cửa hàng thực phẩm nhận thấy thời gian vừa qua
trung bình một khách hàng mua 25 ngàn đồng thực phẩm trong
ngày. Nay cửa hàng chọn ngẫu nhiên 15 khách hàng thấy trung
bình một khách hàng mua 24 ngàn đồng trong ngà y và phương
sai mẫu hiệu chỉnh là s 2 = (2 ngàn đồng) 2.
Với mức ý nghóa là 5% , thử xem có phải sức mua của khách
hàng hiện nay có thay đổi so với trước đây.
25

Giả thiết H0 :  = 25
H1:   25
 : là sức mua của khách hàng hiện nay
o = 25 : là sức mua của khách hàng trước đây
n = 15 ; x = 24 , s = 2 ,  = 5%
 = 5%   = 0,95
 t(n–1) = t0,05(14) = 2,1448 (tra bảng H)
( x  o ) n (24  25) 15

t

 1,9364
s
2
|t| =1,9364 < t (n– 1) = 2,1448 : Chấp nhận H 0
Kết luận : với mức có ý nghóa là 5%, sức mua của khách
hàng hiện hay không thay đổi so với trước đây.

Cách 3: dùng p-value

Bài 1:

Biết  : T ~ N(0,1)
|x  |
|x  |
0 ) = 0,5-(
0 )
p-value= P(T 
/ n
/ n

Cách 1: KTC
  t  1,96 40 13,067
n
36

tra bảng F

  x  = 52013,067  506,933 <µ< 533,067


Chưa biết  (n<30) : T ~ T(n-1)
|x  |
0 )
p-value= P(T 
s/ n

µ0= 600  (506,933 ; 533,067) : bác bỏ H0
cách 3: p-value

tra bảng H với (n-1) bậc tự do



*) không biết : 2*p-value < 0,05 : bác bỏ H0





p-value= 0,5-|520600| 36  = 0,5-(12)  0
40





quy tắc quyết đònh:
*) biết : 2*p-value <  : bác bỏ H0


26

27

2*p-value < =0,05 : bác bỏ H0

28

7


ThS. Phạ m Trí Cao * Chương 7

KIỂM ĐỊNH TỶ LỆ
H0: p=p0

; H1: pp0

Cách 1: pp KTC
Xác đònh KTC của p. nếu p0 thuộc KTC này thì ta
chấp nhận H0.

 Cách

2: pp giá trò tới hạn

Cách 3: p-value
|f p | n
0
)

p (1 p )
0
0
Quy tắc quyết đònh:
*) biết  : 2*p–value <  : bác bỏ H 0
*) kg biết  : 2*p–value < 0,05 : bác bỏ H0

p–value = 0,5– (

Kiểm đònh về tỷ lệ: khi n  30
Giả thiết thống kê : H0 : p = p0
Giả thiết đối :
H1 : p  p0
(f  p ) n
0
t
p (1  p )
0
0
  t
(tra bảng G)
|t|  t : bác bỏ H 0
|t| < t : chấp nhận H 0

n. p  5

0
Điều kiện áp dụng : 
 n .( 1  p
)5


0
Trong trường hợp bác bỏ H 0 :
+ Nếu f > p 0 thì p > p 0
+ Nếu f < p 0 thì p < p 0

29

30

Lưu ý: cần nhớ kỹ cái gì?

Bài 4 : Theo một nguồn tin thì tỉ lệ hộ dân thích
xem dân ca trên Tivi là 80%. Thăm dò 36 hộ
dân thấy có 25 hộ thích xem dân ca.
Với mức có ý nghóa là 5%. Kiểm đònh xem
nguồn tin này có đáng tin cậy không?

31

32

8


ThS. Phạ m Trí Cao * Chương 7

Bài 5 : Một máy sản xuất tự động, lúc đầu tỷ lệ sản phẩm
loại A là 20%. Sau khi áp dụng một phương pháp sản xuất
mới, người ta lấy 40 mẫu, mỗi mẫu gồm 10 sản phẩm để kiểm

tra. Kết quả kiểm tra cho ở bảng sau :

Giải
Giả thiết H 0 : p = 0,8 ; H1 : p  0,8
p : là tỷ lệ hộ dân thực sự thích xem dân ca
po = 0,8 : là tỷ lệ hộ dân thích xem dân ca theo nguồn tin
n = 36 , f = 25/36= 0,69 ,  = 5%
 = 5%   = 1 –  = 0,95  t = 1,96
( f  po ) n (0,69  0,8) 36
t

  1,65
0,2  0,8
po (1  po )
|t| = 1,65 < t  = 1,96 : Chấp nhận H 0
kết luận : với mức có ý nghóa 5%, nguồn tin trên đáng tin
cậy.

Số sản phẩm loại A trong mẫu 1 2 3 4 5 6 7 8 9 10
Số mẫu
2 0 4 6 8 10 4 5 1 0

33

Với mức ý nghóa 5% . Hãy cho kết luận về phương pháp sản
xuất mới này.
34

Giải


Bài 4:

H0:p=20% ; H1:p 20% ;  = 0,05 thì t  = 1,96.
Trong đó p là tỷ lệ sản phẩm loại A của máy sau khi áp
dụng phương pháp sản xuất mới.
Theo số liệu ở bảng trên thì tỷ lệ sản phẩm loại A của mẫu

f  2 1 4  3  6  4  8 5 10  6  4  7  5 8 1 9
400
 215  0,5375
400
Vậy t  (0,53750,2) 400 16,875
0,2(10,2)

Cách 1: KTC
 1,96 0,69(1 0,69)  0,151
36

|t| = 16,875 > t  = 1,96 : bác bỏ H0 . Do f=0,5375>p o=0,2 nên
ta kết luận pp sản xuất mới làm tăng tỷ lệ sản phẩm loại A.

p f  0,690,151 0,539 < p < 0,841
p0= 0,8  (0,539 ; 0,841) : chấp nhận H0
cách 3: p-value

35












p-value= 0,5- |0,690,8| = 0,5-(1,65) = 0,5-0,4505 = 0,0495
0,2*0,8 

2*p-value = 0.099 > 0,05: chấp nhận H0

36

9


ThS. Phạ m Trí Cao * Chương 7

Kiểm đònh phương sai
X có quy luật phân phối chuẩn. X  N(, 2 )
Giả thiết thống kê H0 : 2 = o2 ; H1 : 2  o2
2
 2  (n1)s
o2
Nếu 2 (n1) <  2 <  2 (n1) : chấp nhận H0
1
2
2
Nếu 2 (n1) >  2 , hoặc  2 (n1) <  2 : bác bỏ H0

1
2
2
Trong trường hợp bác bỏ H0 :
+ Nếu s2 > o2 thì 2 > o2
+ Nếu s2 < o2 thì 2 < o2

Bài 8: Nếu máy móc hoạt động bình thường thì
kích thước của một loại sản phẩm (cm) là đại
lượng ngẫu nhiên phân phối theo quy luật chuẩn
với phương sai 2=25 cm2 . Nghi ngờ máy hoạt
động không bình thường, người ta đo thử 20 sản
phẩm và tính được s 2 = 27,5cm 2 .
Với  = 0,02 , hãy kết luận về điều nghi ngờ
này?
37

Giải:
H0 : 2 = 25
H 1 : 2  25
2 : phương sai của kích thước sản phẩm hiện nay
 2  25 : phương sai của kích thước sản phẩm khi máy hoạt
0
động bình thường
Tra bảng I ta có 2 (19)= 7,6327 ; 2 (19)= 36,1908
0,01
0,99
2
Ta có 2 (n1)s 1927,520,9
25

2
0
2 (19)< 2 < 2 (19) : chấp nhận H0 .
0,01
0,99
39
Vậy máy làm việc bình thường

38

KIỂM ĐỊNH MỘT PHÍA:
 Kiểm

đònh giá trò trung bình
 Kiểm đònh tỷ lệ
 Kiểm đònh phương sai

40

10


ThS. Phạ m Trí Cao * Chương 7

I. KIỂM ĐỊNH TRUNG BÌNH
1.Phía phải:
Giả thiết
H0 :  = 0
Giả thiết đối H1 :  > 0
Ở bài toán này ta tin 1 cách tiên quyết rằng   0 ,

do đó chỉ cần phải lựa chọn hai khả năng: =0 hay
>0
a. n  30 , biết  :
(x   ) n
0
Tính t =
, tra bảng tìm t 2

t > t2 : bác bỏ H0
t  t2 : chấp nhận H 0
Nếu chưa biết : thay  bằng s
41
(x   ) n
0
t=
s

b. n < 30,  đã biết (X có quy luật phân phối chuẩn)
(x ) n
Tính t = 0
, tra bảng tìm t2
t > t2 : bác bỏ H0
c. n < 30,  chưa biết (X có quy luật phân phối
chuẩn)
(x ) n
0
Tính t =
, tra bảng tìm t2(n1)
s
t > t2(n-1) : bác bỏ H0


2.Phía trái:
Giả thiết
H0 :  = 0
Giả thiết đối H1 :  < 0
Giống như phía phải, chỉ thay đổi:
( x) n
( x) n
0
Tính t =
hoặc t = 0 s


II. KIỂM ĐỊNH TỶ LỆ
Cỡ mẫu n  30
1.Phía phải:
H0 : p = p 0
H1 : p > p 0
(f p ) n
0
Tính t =
, tra bảng tìm t 2
p (1 p )
0
0
t > t2 : bác bỏ H0

43

42


44

11


ThS. Phạ m Trí Cao * Chương 7

Điều kiện áp dụng (kiểm đònh phía trái và phải) :

n.p 5


0

45
n.(1 p )  5

0

III. KIỂM ĐỊNH PHƯƠNG SAI
1.Phía phải:
H0 :  2   2 ; H1 :  2   2
0
0
2
Tính 2 = (n 1)s
, tra bảng tìm
 02
2 >  2 (n 1) : bác bỏ H0

1
2.Phía trái:
H0 :  2   2 ; H1 :  2  2
0
0
2
2
Tính  = (n 1)s
, tra bảng tìm
 02
 2 < 2 (n 1) : bác bỏ H 0

Bài 1: Một công ty có 1 hệ thống máy tính có thể
xử lý 1200 hóa đơn trong 1 giờ. Công ty vừa nhập 1
hệ thống máy tính mới. Hệ thống này khi chạy kiểm
tra trong 40 giờ cho thấy số hóa đơn được xử lý
trung bình trong 1 giờ là 1260 với độ lệch chuẩn là
215.
1) Với  = 5% hãy nhận xét xem hệ thống mới có
tốt hơn hệ thống cũ hay không?
2) Với  = 1% hãy nhận xét xem hệ thống mới có
tốt hơn hệ thống cũ hay không?

Giải:
H0 :  = 1200 (HT mới tốt bằng HT cũ)
H1 :  > 1200 (HT mới tốt hơn HT cũ)
( x   ) n (1260  1200 ) 40
0
t


 1, 7 6
s
215
1)  = 5%  t2 = 1,6449
t > t2 : bác bỏ H0. Vậy HT mới tốt
hơn HT cũ.
2)  = 1%  t2 = 2,3263
t < t2 : chấp nhận H0. Vậy HT mới
không tốt hơn HT cũ.
Câu hỏi: Theo bạn thì có mâu thuẫn gì
không giữa kết luận của câu 1 và 2?

2.Phía trái:
H0 : p = p 0
H1 : p < p 0
(p  f ) n
, tra bảng tìm t 2
Tính t = 0
p (1 p )
0
0
t > t2 : bác bỏ H 0

47

 2 (n 1)
1

2 (n 1)
46


48

12


ThS. Phạ m Trí Cao * Chương 7

Bài 4: Một báo cáo nói rằ ng 18% gia đình ở thành
phố HCM có máy tính cá nhân ở nhà. Để kiểm tra
người ta chọn ngẫu nhiên 80 gia đình trong thành
phố có trẻ em đang đi học và thấy rằng có 22 gia
đình có máy tính. Với mức ý nghóa 2%, hãy kiểm
đònh xem liệu trong các gia đình có trẻ em đang đi
học, tỷ lệ gia đình có máy tính cao hơn tỷ lệ chung
hay không?

Giải:

49

Bài 5: Đo đường kính 12 sản phẩm của 1 dây
chuyền sản xuất, người kỹ sư kiểm tra chất lượng
tính được s = 0,3 . Biết rằng nếu độ biến động của
các sản phẩm lớn hơn 0,2 thì dây chuyền sản xuất
phải dùng lại để điều chỉnh.Với mức ý nghóa 5%,
người kỹ sư có kết luận gì?
51

H0 : p = 0,18

H1 : p > 0,18
f = 22/80 = 0,275
( f  p ) n (0,2750,18) 80
0
t

2,21
0,180,82
p (1 p )
0
0
 = 2%  t2 = 2,0537
t > t2 : bác bỏ H0
Vậy trong các gia đình có trẻ em đi học, tỷ lệ gia
đình có máy tính cao hơn tỷ lệ chung.

Giải:
H0 : 2 = (0,2)2 = 0,04
H1 : 2 > 0,04
(11)   2 (11) 19,6752
 2 (n1)   2
1
10,05
0,95
2
2
 2  (n 1)s  (121).(0,3)  24,75
0,04
2
0

2 >  2 (11): bác bỏ giả thiết H0
0,95
Dây chuyền cần điều chỉnh vì độ biến động lớn hơn
mức cho phép.

50

52

13


ThS. Phạ m Trí Cao * Chương 7

Kiểm đònh giá trò trung bình, một phía

Kiểm đònh tỷ lệ, một phía

Cách 3: dùng p-value

Cách 3: dùng p-value

Biết  : T ~ N(0,1)
(x   )
(x   )
0 ) = 0,5-(
0 )
p-value= P(T 
 / n
 / n


Biết  : T ~ N(0,1)
( f  p )
0
p-value= P(T
p 0 (1  p 0 ) /
( f  p ) n
0
= 0,5-(
)
p 0 (1  p 0 )

tra bảng F

n

)

tra bảng F

Chưa biết  (n<30) : T ~ T(n-1)
(x   )
0 )
p-value= P(T 
s/ n

quy tắc quyết đònh:

tra bảng H với (n-1) bậc tự do


*) biết : p-value <  : bác bỏ H0

quy tắc quyết đònh:

*) không biết : p-value < 0,05 : bác bỏ
H0
54

*) biết : p-value <  : bác bỏ H0
*) không biết : p-value < 0,05 : bác bỏ H0

53

Xác suất mắc sai lầm loại 1 và loại 2.

VD:

P(sll1) = P(bác bỏ H0/H0 đúng)  

 Xem

các bài tập ở trang 129
 Quyển sách bài tập XSTK, 2007

P(sll2) = P(chấp nhận H0/H0 sai) = 
Trong lý thuyết kiểm đònh, ta giả thiết H0 đúng, rồi
từ đó ta đưa ra các quy tắc kiểm đònh. Thí dụ như
quy tắc kiểm đònh giá trò trung bình, tỷ lệ.
Tính xác suất mắc sai lầm loại 1: chính là giá trò
p-value mà ta tính được trong các kiểm đònh ở trên.

55

56

14


ThS. Phạ m Trí Cao * Chương 7

Tính xác suất mắc sai lầm loại 2:
1) kiểm đònh trung bình:
1a) 2 phía: H0: µ= µ0 , H1: µ  µ0
Nếu giá trò thực tế của µ là µ1 thì











   n 
1
    t  0 s 1 
2

1– gọi là lực kiểm đònh




57

1b) 1 phía: H0: µ= µ0 , H1: µ > µ0 hoặc H1: µ < µ0
|   | n
  1   (t  0 s 1
)
2
2
Kiểm đònh với  ,  cho trước
Nếu muốn xác suất mắc sai lầm loại 1 là  và xác
suất mắc sai lầm loại 2 không vượt quá  cho trước,
với giá trò thực 1 của  sai lệch so với 0 không
vượt quá  cho trước thì cỡ mẫu là:
 2 (t
t
)2


2
2
n
với |1–0|  
59
2

Kiểm đònh với  ,  cho trước
Nếu muốn xác suất mắc sai lầm loại 1 là  và xác

suất mắc sai lầm loại 2 không vượt quá  cho trước,
với giá trò thực 1 của  sai lệch so với 0 không
vượt quá  cho trước thì cỡ mẫu là:
 2 (t  t ) 2
2
n
với |1–0|  
2
  1 t ,   12 t
2
 2(t t )2
2 2
58
Trường hợp:0 10   thì n 
2

Bài 2 : Trong thập niên 80, trọng lượng trung bình
của thanh niên là 48kg. Nay để xác đònh lại trọng
lượng ấy, người ta chọn ngẫu nhiên 100 thanh niên
đo trọng lượng được trọng lượng trung bình là 50kg
và phương sai mẫu hiệu chỉnh s2 = (10kg)2.
1) Thử xem trọng lượng thanh niên hiện nay phải
chăng có thay đổi, với mức có ý nghóa là 1%.
2) Nếu trọng lượng thực tế của thanh niên là 1 =
51kg thì xác suất mắc sai lầm loại 2 là bao nhiêu
60

15



ThS. Phạ m Trí Cao * Chương 7

Bài 2 :
3) Nếu muốn xác suất mắc sai lầm loại 1 là 1% và
xác suất mắc sai lầm loại 2 không vượt quá 5% thì
phải đo trọng lượng của bao nhiêu thanh niên nếu
trọng lượng trung bình thự c tế của thanh niên hiện
nay không vượt quá 52kg
4) Nếu muốn xác suất mắc sai lầm loại 1 là 1% và
xác suất mắc sai lầm loại 2 không vượt quá 5% thì
phải đo trọng lượng của bao nhiêu thanh niên nếu
trọng lượng trung bình thực tế của thanh niên hiện
61
nay trong khoảng (44 ; 52) kg.

Giải
H1 :   48
1) Giả thiết
H0 :  = 48
 : là trọng lượng trung bình của thanh niên hiện
nay
o = 48 : là trọng lượng trung bình của thanh niên
trong thập niên 80
n = 100 > 30 ; x = 50 , s = 10 ,  = 1%
 = 1%   = 1 –  = 0,99  t = 2,58
( x   o ) n ( 48  50 ) 100
Ta có t 

 2
s

10
|t|= 2 < t = 2,58 : Chấp nhận H 0
Kết luận : với mức có ý nghóa là 1%, trọng lượng
trung bình thanh niên hiện nay thực sự không thay
đổi so với thập niên 80.

|   | n
  1   (t  0 s 1
)
2
2)
 1   ( 2 ,58  | 48  51 | 100 )
2
10
= 0,5 – (0,42) = 0,5 – 0,1628 = 0,3372
: xác suất mắc sai lầm loại 2
Lực kiểm đònh là 1–  = 0,6628

3)  = 0,01  t2 = t0,02 = 2,32
(Nếu tra bảng G thì
 = 0,05  t2 = t0,1 = 1,65
nhìn = 0,90 . Nếu tra bảng F thì nhìn dòng 1.6 và
cột 5)
0 ≤ 1 –0 = 52 – 48 = 4 ≤  = 4
s 2 (t
t
)2
2
2



2
2
=10 ( 2 ,32  1,65 ) = 98,01  99
n
2
2

4
thanh niên
4)  = 0,01  t = t0,01 = 2,58
 = 0,05  t2 = t0,1 = 1,65
|0–1|  |48–52| = 4 = 
s 2 (t  t
)2
2
2
2
=10 ( 2 ,58  1,65 )  111 ,83  112
n
64
2
42
thanh niên

63

62

16



ThS. Phạ m Trí Cao * Chương 7

Kiểm đònh với  ,  cho trước
Nếu muốn xác suất mắc sai lầm loại 1 là  và xác
suất mắc sai lầm loại 2 không vượt quá  cho trước,
với giá trò thực p1 của p sai lệch so với p0 không vượt
quá  cho trước thì cỡ mẫu là:
 2 ( t  t
)2

2
với |p1–p0|  
n
2
    1    t
   1 2  t
2

2) kiểm đònh tỷ lệ:
1a) 2 phía: H0: p= p0 , H1: p  p0
Nếu giá trò thực tế của p là p1 thì










p  p n
1
  1   t  0
2
f (1  f )










1– gọi là lực kiểm đònh
65

1b) 1 phía: H0: p= p0 , H1: p > p0 hoặc H1: p < p0
|p  p | n
1
 0
)
  1   (t
2
2
f (1  f )
Kiểm đònh với  ,  cho trước

Nếu muốn xác suất mắc sai lầm loại 1 là  và xác
suất mắc sai lầm loại 2 không vượt quá  cho trước,
với giá trò thực p1 của p sai lệch so với p0 không vượt
quá  cho trước thì cỡ mẫu là:
t
)2
 2 (t
2
2


với |p1–p0|  
n
67
2

66

 PHẦN

II: KIỂM ĐỊNH PHI THAM SỐ
 KIỂM ĐỊNH QUY LUẬT PHÂN PHỐI XÁC
SUẤT
 KIỂM ĐỊNH TÍNH ĐỘC LẬP

68

17



ThS. Phạ m Trí Cao * Chương 7

PHẦN II.1: KIỂM ĐỊNH QUY LUẬT PHÂN
PHỐI XÁC SUẤT
 Trong

thực tế ta thường gặp vấn đề là ta phải kiểm
tra xem một đại lượng ngẫu nhiên đang xét có một
quy luật phân phối nào đó không. VD như chiều cao
của một loại cây có quy luật phân phối chuẩn
không? Trọng lượng một loại sản phẩm có quy luật
phân phối chuẩn?...

69

1. X là ĐLNN rời rạc
pi = P(X= xi) : theo quy luật A
Ta xét X có quy luật phân phối nhò thức, Poisson
2. X là ĐLNN liên tục
pi = P(xi-1 < X < xi) hoặc pi = P(xi < X < xi+1)
Ta xét X có quy luật chuẩn
71

TIÊU CHUẨN K.PEARSON
( TIÊU CHUẨN 2 )
Cho bảng tần số của ĐLNN X :
X
x1 x2 xk
Tần số n1 n2 nk
ni : tần số quan sát (tần số thực nghiệm)

n = n1 + n2 +…+ nk : cỡ mẫu
Lập giả thiết
H0 : X phân phối theo quy luật A
H1 : X không phân phối theo quy luật A

70

3. Quy tắc kiểm đònh
2


 n  np 
k


 2    i np i 
i
i1
Với mức ý nghóa    2  k  r 1

1 
trong đó:
r = số tham số chưa xác đònh của quy luật X
k là số điểm (khoảng) chia các giá trò của X
Quy tắc quyết đònh:
 2   2  k  r 1 : bác bỏ H0
1
72
2
   2  k  r 1 : chấp nhận H0

1

18


ThS. Phạ m Trí Cao * Chương 7

I.2 CÁC QUY LUẬT PHÂN PHỐI CƠ
BẢN CẦN KIỂM ĐỊNH
1. Nhò thức
X ~ B(n,p)
n, p biết  r= 0
n biết, p chưa biết  r = 1
n, p chưa biết  r= 2
2. Poisson
X ~ P()
 chưa biết, thay bằng x  r=1
3. Chuẩn
X ~ N(, 2)
Nếu , 2 chưa biết. Thay  = x , 2 = s2
(hoặc sˆ 2 )  r = 2

Lưu ý: Điều kiện để áp dụng tiêu chuẩn phù
hợp 2 theo K.Pearson
Các tần số quan sát n i  5 . Nếu các n i quá nhỏ
thì phải ghép các giá trò hay các khoảng giá trò
của mẫu lại để tăng n i lên
73

Bài 1: Quan sát 1 đối tượng trong 100 ngày.

Gọi X là số lần xuất hiện của đối tượng trong 1
ngày, ta có:
X
0 1 2 3 4 5 6 7 8 9 10
Số ngày 5 10 19 29 21 6 9 0 0 1 0
Với  =5%, hãy xét xem X ~B (10 ; 0,3) ?
75

74

Giải:
H0: X có quy luật phân phối nhò thức B(10; 0,3)
H1: X không có quy luật phận phối nhò thức
B(10; 0,3)
Trước hết, ta thu ngọn mẫu để cho thỏa n i không
quá nhỏ: ni  5
X 0 1 2 3 4 5 6
ni 5 10 19 29 21 6 10
Nếu giả thiết H0 đúng, ta tính được các xác suất:
pi=P(X=xi)= C xi (0,3) xi (0,7 )10  xi xi= 0,1,2,...,6
10
76
Ví dụ: p1= P(X=0)= C 0 (0,3) 0 (0,7 )10  0,0282
10

19


ThS. Phạ m Trí Cao * Chương 7


Ta lập bảng sau:
xi
ni
0
1
2
3
4
5
6
Tổng

5
10
19
29
21
6
10
n=100

pi

npi

0,0282
0,1211
0,2335
0,2668
0,2001

0,1029
0,0474
1

2,82
12,11
23,35
26,68
20,01
10,29
4,74

n  np
i
i
np
i
1,6852
0,3676
0,8104
0,2017
0,0490
1,7885
5,8370
10,7394











7
6
Lưu ý: Để  pi= 1 thì p7 = 1–  Pi = 0,0474
i1
i1
Vậy 2 = 10,7394
k=7 , r=0 , =0,05
(7 1)   2 (6) 12,5916
2
10,05
0,95
 2   2 (6) : chấp nhận H0
0,95

2

77

Bài 2: Trong dân gian lưu truyền 1 quan niệm
rằng: 1 loại thức ăn A nào đó làm tăng khả năng
sinh con trai. Để kiểm tra quan niệm này người
ta cho 1 nhóm phụ nữ dùng thức ăn A rồi xem
xét 80 trường hợp có 3 con trong thời gi an dùng
loại thức ăn A đó. Kết quả cho trong bảng sau:
X: số bé trai 3 2 1 0

ni: số phụ nữ 14 36 24 6
Với mức ý nghóa 5%, kiểm đònh xem liệu lọai
thức ăn A có tác dụng đến việc sinh con trai
79
không?

78

Giải:
H0 : loại thức ăn A không có tác dụng đến giới
tính của bào thai.
Nếu H0 đúng thì số bé trai trong gia đình có 3 con
là 1 ĐLNN có qluật nhò thức với n=3, p= ½
Gọi X là số con trai trong 1 gia đình có 3 con
H0 : X~B(3, ½)
Đặt : Bk = biến cố trong 3 đứa trẻ có k đứa là
con trai.
80

20


ThS. Phạ m Trí Cao * Chương 7

Nếu H0 đúng thì:

Ta lập bảng sau:
xi
ni


pi npi n np 2

i 
 i
np
i
3
14
1/8 10 1,6
2
36
3/8 30 1,2
1
24
3/8 30 1,2
0
6
1/8 10 1,6
Tổng n = 80 1
5,6

3
3




p1 = P(B0) = C 0  1   1 , p  P ( B )  C 1  1   3
3 2
2

1
3 2 
8
8
3
3




p  P ( B )  C 2  1   3 , p  p ( B )  C 3  1   1
3
2
3 2
4
3
32
8
8

Vậy 2 = 5,6
=0,05 , k=4 , r=0
( 3 )  7 ,8147
 2
( k  r  1)   2
1 
0 ,95
 2   2 (3) : chấp nhận H0
0,95
81


Bài 3: Sản phẩm được sản xuất ra trên một dây
chuyền tự động được đóng gói một cách ngẫu
nhiên theo quy cách: 3 sản phẩm/hộp. Tiến
hành kiểm tra 200 hộp ta được kết quả:
Số sp loại I có trong hộp 0 1 2 3
Số hộp
6 14 110 70
Với = 2% , có thể xem số sp loại I có trong hộp
là đại lượng ngẫu nhiên có quy luật phân phối
83
nhò thức không?

Số liệu đã cho chưa cho phép ta khẳng đònh
loại thức ăn A có ảnh hưởng đến giới tính.

82

Giải:
Gọi X là số sp loại I có trong một hộp.
XB(3, p)
Ta xấp xỉ p bằng:
f  1*14  2 *110  3 * 70  0 ,74
3 * 200
H0: X  B(3 ; 0,74)

84

21



ThS. Phạ m Trí Cao * Chương 7

Ta lập bảng sau:
ni
pi
xi
0
1
2
3
Tổng

6
14
110
70

npi

n  np
i
i
np
i
0,017576 3,5152 1,75644
0,150072 30,0144 8,5446
0,427128 85,4256 7,06932
0,405224 81,0448 1,50519


n = 200 1











2

18,8755

2= 18,8755 >  2 (4 11) = 7,8241 : bác bỏ H0
0,98

Gọi X= số lỗi trong 300 trang in
H0: X ~ P(4,7)
P1 = P(X 2)
0
1
2
= e-4,7 ( ( 4 ,7 )  ( 4 ,7 )  ( 4 ,7 ) )  0 ,1523
0!
1!
2!
3

P2 = P(X=3) = e-4,7 ( 4 ,7 ) = 0,1574
3!
-4,7 ( 4 ,7 ) 4
P3= P(X=4)= e
= 0,1849
4!
5
P4 = P(X=5) = e-4,7 ( 4 ,7 ) = 0,1738
5!
6
P5 = P(X=6) = e-4,7 ( 4 ,7 ) = 0,1362
6!
6
P6 = P(X  7) = 1–  p ( X  k )  0 ,1954
k 0

85

Giải:

87

Bài 4: Một nhà máy sản xuất máy in nói rằng số
lỗi in trong 1 cuốn sách dày 300 trang của máy
in là 1 ĐLNN có quy luật phân phối Poisson với
tham số =4,7 . Kiểm tra 300 trang sách in của
50 máy in cùng loại, ta thu được:
Số lỗi 0 1 2 3 4 5 6 7 8  9
Số máy 1 1 8 6 13 10 5 5 1 0
Với mức ý nghóa 1%, hỏi lời tuyên bố của nhà

sản xuất có đúng không?
86

xi

ni

pi

npi

2
3
4
5
6
7
Tổng

10
6
13
10
5
6

0,1523
0,1574
0,1849
0,1738

0,1362
0,1954

7,6150
7,8692
9,2463
8,6915
6,8083
9,7697

n np 
i
i
np
i
0,7470
0,4440
1,5239
0,1970
0,4803
1,4546





2

n =50 1
4,8468

2
 = 0,01, k = 6, r = 0  
(5 )  15 ,0863
0,99
2 = 4,8468 <  2 (5) : chấp nhận H0. tin lời tuyên bố trên.
0,99

88

22


ThS. Phạ m Trí Cao * Chương 7

Lưu ý: Nếu đề không cho biết  = 4,7 thì ta làm
như sau:
6
x  1n  n x
i1 i i
 1 (2*103*64*135*106*57*6) 4,24
50
Thay  bằng x = 4,24 . Xem X~P(4,24)
Tra bảng  2 (6 11)   2 (4)
0,99
0,99

89

Gọi X = chiều cao của cây khuynh diệp (cm)
H0 : X có phân phối chuẩn N(, 2)

x  1n  n x  1 [65*10+90*9+105*13+115*14
i i 120
+125*21+135*15+145*12+155*13 + 165*13]
= 124,875
s 2  1 ( n x 2  n( x) 2 )
i i
n 1
 1 (1963675 120 (124 ,875 ) 2 )  776 ,6649
120 1
s  776 ,6649  27 ,8687
91
2

Xem X ~ N (124,875 ; (27,8687) )

Bài 6: Quan sát chiều cao của 120 cây khuynh diệp ở 1 năm
tuổi ta được bảng số liệu:
Chiều cao (cm) 50-80 80-100 100-110 110-120 120-130
Số cây
10 9
13
14
21
Chiều cao 130-140 140-150 150-160 160-170
Số cây 15
12
13
13
Với mức ý nghóa 5%, hãy kiểm đònh giả thiết: chiều cao cây
khuynh diệp có phân phối chuẩn?

90

x  , x  
i i 

ni

pi

(–, 80)

10
9

0,0537 6,444
0,1330 15,96

13

0,1114 13,368 0,1354

0,0101

(110, 120) 14
(120, 130) 21
(130, 140) 15
(140, 150) 12

0,1344
0,1389

0,1340
0,1105

0,2808
1,1259
0,0725
0,1197

(150, 160) 13
(160, +) 13

0,0803 9,636 11,3165 1,1744
0,1038 12,456 0,2959 0,0238








(80, 100)
(100, 10)

Tổng

n =120 1

npi


16,128
16,668
16,08
13,26

(ni-npi)2






n  np 
i
i
np
i

2

12,6451 1,9623
48,4416 3,0352
4,5284
18,7662
1,1664
1,5876

7,8047

92


23


ThS. Phạ m Trí Cao * Chương 7


p1= P(X< 80)= 0,5+   80  124 ,875

27 ,8687








= 0,5  (1,61) = 0,5-0,4463 = 0,0537
p2= P(80



=   100  124 ,875  –  80  124 ,875 




27 ,8687

27 ,8687




=(0,89)+(1,61)= – 0,3133+0,4463 = 0,1330
p3 = P (100= – 0,2019+0,3133 = 0,1114
p4= P (110 < X < 120)= –(0,17) + (0,53)
= –0,0675 + 0,2019 = 0,1344
p5 = P (120 < X < 130) = (0,18) + (0,17)
= 0,0714 + 0,0675 = 0,1389
93
p6 = P (130 < X < 140) = (0,54) - (0,18)
= 0,2054 – 0,0714 = 0,1340

Lưu ý:
* Nếu đề cho trước  = 25 thì r = 1
P(xi< X < xi+1)
x 124,875
x 124,875
)  ( i
)
=  ( i1
25
25
* Nếu đề cho trước = 120, = 25 thì r= 0
P( xi < X < xi+1)
x 120
x 120

=  ( i1
)( i
)
25
25

95

p7 = P (140 < X < 150 ) = (0,90) - (0,54)
= 0,3159 – 0,2054 = 0,1105
p8 = P (150 < X < 160 ) = (1,26) - (0,90)
= 0,3962 – 0,3159 = 0,0803
p9 = P (X>160 ) = 0,5 - (1,26)
= 0,5 – 0,3962 = 0,1038
Hay p9 = 1–(p1 + . . . + p8) = 0,1038
 = 0,05, k = 9, r = 2
 2
(6 )  12 ,5916
(9  2  1)   2
1 0,05
1 0,95
2 = 7,8047 <  2
(6) : chấp nhận H 0
0,95

94

Vậy có thể xem X~N(124,875 ; (27,8687) 2)

PHẦN II.2 : KIỂM ĐỊNH TÍNH ĐỘC LẬP

Một phần tử của đám đông có thể có các dấu hiệu
đònh lượng. Ví dụ con người có: chiều cao, trọng
lượng. Một phần tử của đám đông còn có dấu hiệu
đònh tính. Ví dụ con người có: màu tóc, màu mắt.
Ta khảo sát 3 trường hợp:
*Tính độc lập của 2 dấu hiệu đònh tính.
*Tính độc lập của 1 dấu hiệu đònh tính và 1 dấu
hiệu đònh lượng.
96
*Tính độc lập của 2 dấu hiệu đònh lượng.

24


ThS. Phạ m Trí Cao * Chương 7

I. KIỂM ĐỊNH TÍNH ĐỘC LẬP CỦA 2 DẤU HIỆU ĐỊNH TÍNH

Giả thiết H0: Hai dấu hiệu A và B độc lập
H1: Hai dấu hiệu A và B không độc lập

Ta có bảng liên hợp các dấu hiệu sau:
A
A1
A2
…..
Ar
Tổng

B B1 B2 ……. Bk Tổng

n11 n12
n21 n22

n1k n10
n2k n20

nr1 nr2
nrk nr0
n01 n02 ….. n0k n
k
r
k
k
n   n , n   n , n   n   n : cỡ mẫu
i0 j1 ij
0 j i1 ij
i1 i0 j1 oj

97

98

Giải

Ví dụ: Để nghiên cứu xem quy mô của một công ty có ảnh hưởng
đến hiệu quả quảng cáo đối với khách hàng hay không, người ta
tiến hành phỏng vấn 356 khách hàng và thu được kết quả sau:
Hiệu quả quảng
cáo Mạnh Vừa phải Yếu Tổng
Quy mô công ty

Nhỏ
20
52
32 104
Vừa
53
47
28 128
Lớn
67
32
25 124
Tổng
140
131
85 356
Với mức ý nghóa 5%, có thể cho rằng quy mô của công ty có ảnh
hưởng đến hiệu quả của quảng cáo đối với khách hàng hay khôn g?

nij : tần số quan sát
n2
2
  n (   n .ijn  1)
i j i0 0 j
   2 ( k  1)( r  1)
1 
Quy tắc quyết đònh:
2 >  2 ( k  1 )( r  1) : bác bỏ H0
1 


H0: Quy mô không ảnh hưởng hiệu quả quảng cáo



202  522  322  532  472 

2 356140*104 131*104 85*104 140*128 131*128
282  672  322  252 1




*124 85*124

 85*128 140*124 131
= 29,638 >  2
(31)(31)   2 (4)  9,4877:
10,05
0,95

99

bác bỏ H0
Tức quy mô công ty có ảnh hưởng đến hiệu quả
của quảng cáo

100

25



×