Tải bản đầy đủ (.pdf) (18 trang)

Kiểm định giả thiết thống kê

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (252.83 KB, 18 trang )

ThS. Ph m Trí Cao * Ch

ng 7

CHƯƠNG 7:
KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ

1

Trong thực tế ta thường gặp vấn đề: phải
kiểm tra xem 1 điều gì đó đúng hay sai,
nội dung thông tin mà ta nhận được từ các
nguồn cung cấp (1 người, 1 cơ quan, 1 tờ
báo, 1 tổ chức,...) có đáng tin cậy không.
Công việc kiểm tra lại nội dung thông tin
mà ta nhận được xem có đáng tin cậy
không chính là bài toán kiểm đònh.

 Ta

tiến hành kiểm đònh (kiểm tra) như sau:
 Thu thập số liệu thực tế (lấy mẫu): đo chiều cao
của khoảng 1 triệu người
 Dùng 1 quy tắc kiểm đònh tương ứng với giả thiết
đang xét (kiểm đònh giá trò trung bình) để quyết
đònh: chấp nhận hay bác bỏ H0

 Chấp

nhận H0: tổ chức này báo cáo đúng. Con số
1.65m là đáng tin cậy.


 Bác bỏ H0: tổ chức này báo cáo sai.
3

 Thí

dụ 1: Một tổ chức cho rằng chiều cao trung bình
hiện nay của thanh niên VN là 1.65m. Hãy lập giả
thiết để kiểm chứng kết quả này?

 HD:
 H0:=1.65
 H1:≠1.65

chiều cao TB thực tế của thanh niên hiện nay
1.65: chiều cao TB của thanh niên hiện nay theo
lời tổ chức này
 H0 gọi là giả thiết thống kê (giả thiết không)
 H1 gọi là giả thiết đối
 :

 0=

2

 Thí

dụ 2: Một học viên luyện thi cao học cho rằng tỷ lệ
học viên thi đạt môn XSTK là 50%. Hãy lập giả thiết
thống kê để kiểm chứng điều này?


 HD:
 H0:

p=0.5
 H1: p≠0.5
 p: tỷ lệ học viên thực tế thi đạt môn XSTK
 p0= 0.5 : tỷ lệ học viên thi đạt môn XSTK theo lời
người này.
4

1


ThS. Ph m Trí Cao * Ch

ng 7

 Thí

dụ 3: Một cô gái được cho là thùy mò, nết na, đằm
thắm, dòu dàng, ngăn nắp, chu đáo, …nói chung là hết…
ý! Và ta muốn để ý!
 Ta phải kiểm tra điều này! Tuy nhiên ta sẽ không
quyết đònh được lập giả thiết thống kê như thế nào, bởi
vì sai lầm nào cũng đau khổ cả! Và ta không thể tự
mình tiến hành kiểm đònh được!
 Bài toán loại này ta không thể xét được, bởi vì không
có quy tắc quyết đònh chung. Ctmb quyết đònh như thế
nào!


5

 Ta

không thể làm giảm P(sll1) và P(sll2) xuống cùng
lúc được (cỡ mẫu cố đònh), nếu làm giảm P(sll1) thì
sẽ làm tăng P(sll2), và ngược lại. Chỉ có thể làm
giảm cả P(sll1) và P(sll2) cùng lúc bằng cách tăng cỡ
mẫu lên.

 Về

mặt khách quan thì cả 2 loại sai lầm đều nguy
hiểm, tuy nhiên về mặt chủ quan thì ta coi sai lầm
loại 1 là nguy hiểm hơn sai lầm loại 2. Do đó người
ta lập giả thiết sao cho sai lầm loại 1 là nguy hiểm
hơn.
7

Để xé t xem chấ p nhậ n hay bác bỏ H 0 thì ta
phả i lấy mẫu, và đưa ra quyế t đònh dựa trên
mẫ u. Trong quá trình làm, có 4 trường hợp
sau:
H0 đúng
Quyết đònh H0 sai
Chủ quan
Thự c tế
khách quan
H0 sai
Đúng

Sai lầ m loại 2
H0 đúng
Sai lầm loạ i 1 Đúng
P(sll1)= P(bác bỏ H 0/H0 đúng) ,
P(sll2)= P(chấp nhậ n H 0/H0 sai)

6

Một người bò nghi ngờ là ăn trộm.
lập giả thiết:
H0: người này là vô tội
H1: người này là có tội
(Trong xã hội văn minh, dân chủ thì luôn mong muốn
điều tốt đẹp xãy ra!)

 VD1:
 Ta

 Công

an đi thu thập chứng cớ để bác bỏ H0, nếu có
đủ chứng cớ thì kết luận người này có tội (bác bỏ
H0), nếu không đủ chứng cớ thì vẫn phải kết luận
người này vô tội (chấp nhận H0).
8

2


ThS. Ph m Trí Cao * Ch


ng 7

 Ta

có 2 loại sai lầm sau:
 Trong thực tế người này vô tội, nhưng do sự tắc
trách của CA hoặc do bò hãm hại mà người này bò
kết luận là có tội  BẮT OAN (sll1).
 Trong thực tế người này có tội, nhưng do là SIÊU
TRỘM nên CA không tìm được chứng cớ nên phải
thả ra  THẢ LẦM (sll2).

 Ta

thấy BẮT OAN nguy hiểm hơn THẢ LẦM, nếu
có thả lầm thì ta hy vọng rằng “Lưới trời lồng lộng,
tuy thưa mà khó lọt, lọt lần này thì chưa chắc sẽ lọt
lần khác!” (Bao Công)
9

2: Một người đi khám bệnh xem có bò ung thư
phổi không, ta đặt giả thiết sau:
 H0: người này có bệnh ung thư phổi.
 VD

 Ta

có hai loại sai lầm tương ứng:
 sai lầm loại I là người này có bệnh nhưng bác só

kết luận không có.
 sai lầm loại II là người này không có bệnh nhưng
bác só kết luận có.
 Ta thấy sai lầm loại I là nguy hiểm hơn.
10

CÁC DẠNG KIỂM ĐỊNH:
Kiểm
 Do

đó ta đưa ra quy tắc kiểm đònh sao cho:
 P(sll1) <=, với  là 1 con số cho trước, gọi là
mức (có) ý nghóa của kiểm đònh.
 P(sll2) bé nhất có thể được.

đònh tham số
Kiểm đònh giá trò trung bình
Kiểm đònh tỷ lệ
Kiểm đònh phương sai
Kiểm đònh tham số có 2 dạng:
2 phía
1 phía (phải, trái)
Kiểm

11

đònh phi tham số
Kiểm đònh quy luật phân phối xác suất
Kiểm đònh tính độc lập của 2 dấu hiệu


12

3


ThS. Ph m Trí Cao * Ch

ng 7

PHƯƠNG PHÁP KIỂM ĐỊNH
 Phương

pháp khoảng tin cậy
 Phương pháp giá trò tới hạn
 Phương pháp p-value
 Ta

 PHẦN

I: KIỂM ĐỊNH THAM SỐ
 KIỂM ĐỊNH GIÁ TRỊ TRUNG BÌNH
 KIỂM ĐỊNH TỶ LỆ
 KIỂM ĐỊNH PHƯƠNG SAI

chỉ học phương pháp giá trò tới hạn

13

n  30 , biế t 2:
(x   ) n

0
t

  t (tra bảng G)
|t| < t : chấ p nhậ n H0
|t|  t : bá c bỏ H0 , chấp nhậ n H1
Trong trường hợp bác bỏ H 0 :
+ Nế u x  o thì  > 0

1.

1) KIỂM ĐỊNH GIÁ TRỊ TRUNG BÌNH:


: trung bình đám đông
0: 1 con số cần kiểm đònh xem đúng hay sai



a) Kiểm đònh 2 phía
H0: =0 ; H1: 0



b) Kiểm đònh một phía
 Phía phải: H0: =0 ; H1: >0
 Phía trái: H0: =0 ; H1: <0




Ta chỉ học kiểm đònh 2 phía

14

15

+ Nế u x  o thì  < 0

16

4


ThS. Ph m Trí Cao * Ch

ng 7

n < 30, biế t 2 (X có phân phối chuẩn)
(x   ) n
0
t
,   t (tra bả ng G)

|t| < t : chấ p nhận H0
|t|  t : bác bỏ H0
2. n < 30, khô ng biết 2 (X có phâ n phố i
chuẩ n)
( x  o ) n
t
,   t (n–1) (tra bả ng H)

s
|t| < t(n–1) : chấ p nhận H0
18
|t|  t(n–1) : bác bỏ H0

1.

Nếu không biết 2: thay  bằng s
(x   ) n
0
t
,   t (tra bả ng G)
s
|t| < t : chấp nhận H 0
|t|  t : bác bỏ H0 , chấp nhận H 1

17

Bài 1 : Giám đố c một xí nghiệ p cho biết lương
trung bình củ a 1 cô ng nhâ n thuộc xí nghiệp hiệ n
nay là 600 ngàn đồng/tháng.
Chọn ngẫ u nhiên 36 cô ng nhâ n thấy lương trung
bình là 520 ngà n đồ ng/tháng, với độ lệch chuẩ n
 = 40 ngà n đồng/thá ng. Lờ i bá o cáo củ a giám
đố c có tin cậ y đượ c không, với mứ c có ý nghóa
là  = 5%.
19

Giả thiết H 0 :  = 600 ; H 1:   600
 : là tiề n lương trung bình thực sự củ a công nhâ n hiện nay

o = 600 : là tiền lương trung bình của công nhân theo lờ i giám đốc
x = 520 , n = 36 > 30 ,  = 40 ,  = 5%
 = 5%   = 1 –  = 0,95  t = 1,96
Ta có t  (xo) n  (520600) 36 12
40

|t|= 12 > 1,96= t  : bác bỏ H 0
Kết luận : với mức ý nghóa là 5%, không tin vào lờ i củ a giám đố c.
Lương trung bình thự c sự của công nhân bé hơn 600 ngà n đồng /
20
tháng (do x 520600 o).

5


ThS. Ph m Trí Cao * Ch

ng 7

Chú ý quan trọng:
 Trước tiên phải đặt giả thiết thống kê rùi muốn làm
gì thì làm!
 Nếu không đặt giả thiết thống kê mà có tính toán
đúng thì cũng hổng được điểm.
 Tính toán, tra bảng đúng nhưng kết luận sai thì cũng
hổng được điểm. “Uổng ơi là uổng!”

Bài 3 :Một cửa hàng thực phẩm nhận thấy thời gian vừa qua
trung bình một khách hàng mua 25 ngàn đồng thực phẩm trong
ngày. Nay cửa hàng chọn ngẫu nhiên 15 khách hàng thấy trung

bình một khách hàng mua 24 ngàn đồng trong ngà y và phương
sai mẫu hiệu chỉnh là s 2 = (2 ngàn đồng) 2.
Với mức ý nghóa là 5% , thử xem có phải sức mua của khách
hàng hiện nay có thay đổi so với trước đây.

21

Giải
Giả thiết H0 :  = 25
H1:   25
 : là sức mua của khách hàng hiện nay
o = 25 : là sức mua của khách hàng trước đây
n = 15 ; x = 24 , s = 2 ,  = 5%
 = 5%   = 0,95
 t(n–1) = t0,05(14) = 2,1448 (tra bảng H)
( x  o ) n (24  25) 15
t

 1,9364
s
2
|t| =1,9364 < t (n– 1) = 2,1448 : Chấp nhận H 0
Kết luận : với mức có ý nghóa là 5%, sức mua của khách
hàng hiện hay không thay đổi so với trước đây.

23

22

Kiểm đònh về tỷ lệ: khi n  30

Giả thiế t thố ng kê : H0 : p = p0
Giả thiế t đố i :
H1 : p  p0
(f  p ) n
0
t
p (1  p )
0
0
  t
(tra bả ng G)
|t|  t : bá c bỏ H 0
|t| < t : chấ p nhậ n H 0

n. p  5

0
Điề u kiệ n á p dụ ng : 
 n .( 1  p
)5

0
Trong trườ ng hợ p bá c bỏ H 0 :
+ Nế u f > p 0 thì p > p 0
+ Nế u f < p 0 thì p < p 0

24

6



ThS. Ph m Trí Cao * Ch

ng 7

Giải

Lưu ý: cần nhớ kỹ cái gì?

Bài 4 : Theo một nguồn tin thì tỉ lệ hộ dân thích
xem dâ n ca trên Tivi là 80%. Thăm dò 36 hộ
dâ n thấy có 25 hộ thích xem dâ n ca.
Vớ i mức có ý nghóa là 5%. Kiể m đònh xem
nguồn tin nà y có đáng tin cậy không?

25

Bài 5 : Một máy sản xuất tự động, lúc đầu tỷ lệ sản phẩm
loại A là 20%. Sau khi áp dụng một phương pháp sản xuất
mới, người ta lấy 40 mẫu, mỗi mẫu gồm 10 sản phẩm để kiểm
tra. Kết quả kiểm tra cho ở bảng sau :
Số sản phẩm loại A trong mẫu 1 2 3 4 5 6 7 8 9 10
Số mẫu
2 0 4 6 8 10 4 5 1 0
Với mức ý nghóa 5% . Hãy cho kết luận về phương pháp sản
xuất mới này.
27

Giả thiết H 0 : p = 0,8 ; H1 : p  0,8
p : là tỷ lệ hộ dân thực sự thích xem dân ca

po = 0,8 : là tỷ lệ hộ dân thích xem dân ca theo nguồn tin
n = 36 , f = 25/36= 0,69 ,  = 5%
 = 5%   = 1 –  = 0,95  t = 1,96
( f  po ) n (0,69  0,8) 36
t

  1,65
0,2  0,8
po (1  po )
|t| = 1,65 < t  = 1,96 : Chấp nhận H 0
kết luận : với mức có ý nghóa 5%, nguồn tin trên đáng tin
cậy.

26

Giải
H0:p=20% ; H1:p 20% ;  = 0,05 thì t  = 1,96.
Trong đó p là tỷ lệ sản phẩm loại A của máy sau khi áp
dụ ng phương pháp sả n xuấ t mới.
Theo số liệu ở bảng trên thì tỷ lệ sản phẩ m loại A của mẫ u

f  2 1 4  3  6  4  8 5 10  6  4  7  5 8 1 9
400
 215  0,5375
400
Vậy t  (0,53750,2) 400 16,875
0,2(10,2)
|t| = 16,875 > t  = 1,96 : bá c bỏ H0 . Do f=0,5375>p o=0,2 nê n
ta kết luận pp sả n xuất mớ i làm tăng tỷ lệ sản phẩm loạ i A.


28

7


ThS. Ph m Trí Cao * Ch

ng 7

Kiểm đònh phương sai
X có quy luật phân phối chuẩn. X  N(, 2 )
Giả thiết thống kê H0 : 2 = o2 ; H1 : 2  o2
2
 2  (n1)s
o2
Nếu 2 (n1) <  2 <  2 (n1) : chấp nhận H0
1
2
2
Nếu 2 (n1) >  2 , hoặc  2 (n1) <  2 : bác bỏ H0
1
2
2
Trong trường hợp bác bỏ H0 :
+ Nếu s2 > o2 thì 2 > o2
+ Nếu s2 < o2 thì 2 < o2

Bài 8: Nếu máy móc hoạt động bình thường thì
kích thước của một loại sản phẩm (cm) là đại
lượng ngẫu nhiên phân phối theo quy luật chuẩn

với phương sai 2=25 cm2 . Nghi ngờ máy hoạt
động không bình thường, người ta đo thử 20 sản
phẩm và tính được s 2 = 27,5cm 2 .
Với  = 0,02 , hãy kết luận về điều nghi ngờ
này?
29

Giải:
H0 : 2 = 25
H 1 : 2  25
2 : phương sai của kích thước sản phẩm hiện nay
 2  25 : phương sai của kích thước sản phẩm khi máy hoạt
0
động bình thường
Tra bảng I ta có 2 (19)= 7,6327 ; 2 (19)= 36,1908
0,01
0,99
2
Ta có 2 (n1)s 1927,520,9
25
2
0
2 (19)< 2 < 2 (19) : chấp nhận H0 .
0,01
0,99
31
Vậy máy làm việc bình thường

30


 PHẦN

II: KIỂM ĐỊNH PHI THAM SỐ
 KIỂM ĐỊNH QUY LUẬT PHÂN PHỐI XÁC
SUẤT
 KIỂM ĐỊNH TÍNH ĐỘC LẬP

32

8


ThS. Ph m Trí Cao * Ch

ng 7

PHẦN II.1: KIỂM ĐỊNH QUY LUẬT PHÂN
PHỐI XÁC SUẤT
 Trong

thực tế ta thường gặp vấn đề là ta phải kiểm
tra xem một đại lượng ngẫu nhiên đang xét có một
quy luật phân phối nào đó không. VD như chiều cao
của một loại cây có quy luật phân phối chuẩn không?
Trọng lượng một loại sản phẩm có quy luật phân
phối chuẩn?...

33

1. X là ĐLNN rời rạc

pi = P(X= xi) : theo quy luật A
Ta xét X có quy luật phân phối nhò thức, Poisson
2. X là ĐLNN liên tục
pi = P(xi-1 < X < xi) hoặc pi = P(xi < X < xi+1)
Ta xét X có quy luật chuẩn
35

TIÊU CHUẨN K.PEARSON
( TIÊU CHUẨN 2 )
Cho bả ng tần số củ a ĐLNN X :
X
x1 x2 xk
Tầ n số n1 n2 nk
ni : tầ n số quan sát (tần số thực nghiệm)
n = n1 + n2 +…+ nk : cỡ mẫ u
Lậ p giả thiế t
H0 : X phân phố i theo quy luậ t A
H1 : X không phâ n phối theo quy luật A

34

3. Quy tắc kiể m đònh
2


 n  np 
k


 2    i np i 

i
i1
Với mức ý nghóa    2  k  r 1

1 
trong đó :
r = số tham số chưa xá c đònh của quy luật X
k là số điể m (khoả ng) chia các giá trò của X
Quy tắ c quyết đònh:
 2   2  k  r 1 : bá c bỏ H0
1
36
2
   2  k  r 1 : chấp nhậ n H0
1

9


ThS. Ph m Trí Cao * Ch

ng 7

I.2 CÁC QUY LUẬT PHÂN PHỐI CƠ
BẢN CẦN KIỂM ĐỊNH
1. Nhò thức
X ~ B(n,p)
n, p biế t  r= 0
n biế t, p chưa biết  r = 1
n, p chưa biế t  r= 2

2. Poisson
X ~ P()
 chưa biết, thay bằ ng x  r=1
3. Chuẩ n
X ~ N(, 2)
Nế u , 2 chưa biế t. Thay  = x , 2 = s2
(hoặ c sˆ 2 )  r = 2

Lưu ý: Điều kiện để áp dụng tiêu chuẩn phù
hợp 2 theo K.Pearson
Các tần số quan sát n i  5 . Nếu các n i quá nhỏ
thì phải ghép các giá trò hay các khoảng giá trò
của mẫu lại để tăng n i lên
37

Bài 1: Quan sát 1 đối tượng trong 100 ngày.
Gọi X là số lần xuất hiện của đối tượng trong 1
ngày, ta có:
X
0 1 2 3 4 5 6 7 8 9 10
Số ngày 5 10 19 29 21 6 9 0 0 1 0
Với  =5%, hãy xét xem X ~B (10 ; 0,3) ?
39

38

Giải:
H0: X có quy luật phâ n phố i nhò thứ c B(10; 0,3)
H1: X không có quy luật phận phối nhò thứ c
B(10; 0,3)

Trướ c hế t, ta thu ngọn mẫ u để cho thỏa n i khô ng
quá nhỏ : ni  5
X 0 1 2 3 4 5 6
ni 5 10 19 29 21 6 10
Nếu giả thiết H0 đúng, ta tính đượ c các xác suất:
pi=P(X=xi)= C xi (0,3) xi (0,7 )10  xi xi= 0,1,2,...,6
10
40
Ví dụ : p1= P(X=0)= C 0 (0,3) 0 (0,7 )10  0,0282
10

10


ThS. Ph m Trí Cao * Ch

ng 7

Ta lậ p bảng sau:
xi
ni
0
1
2
3
4
5
6
Tổng


5
10
19
29
21
6
10
n=100

pi

npi

0,0282
0,1211
0,2335
0,2668
0,2001
0,1029
0,0474
1

2,82
12,11
23,35
26,68
20,01
10,29
4,74


n  np
i
i
np
i
1,6852
0,3676
0,8104
0,2017
0,0490
1,7885
5,8370
10,7394










7
6
Lưu ý: Để  pi= 1 thì p7 = 1–  Pi = 0,0474
i1
i1
Vậy 2 = 10,7394
k=7 , r=0 , =0,05

(7 1)   2 (6) 12,5916
2
10,05
0,95
 2   2 (6) : chấp nhận H0
0,95

2

41

Bài 2: Trong dân gian lưu truyền 1 quan niệ m
rằ ng: 1 loạ i thứ c ăn A nào đó làm tăng khả năng
sinh con trai. Để kiể m tra quan niệm nà y người
ta cho 1 nhó m phụ nữ dù ng thứ c ăn A rồi xem
xé t 80 trườ ng hợ p có 3 con trong thời gi an dù ng
loạ i thứ c ă n A đó. Kế t quả cho trong bảng sau:
X: số bé trai 3 2 1 0
ni: số phụ nữ 14 36 24 6
Với mứ c ý nghóa 5%, kiể m đònh xem liệ u lọ ai
thức ăn A có tá c dụ ng đế n việc sinh con trai
43
không?

42

Giải:
H0 : loạ i thứ c ă n A không có tá c dụ ng đế n giớ i
tính củ a bào thai.
Nế u H0 đúng thì số bé trai trong gia đình có 3 con

là 1 ĐLNN có qluậ t nhò thứ c với n=3, p= ½
Gọ i X là số con trai trong 1 gia đình có 3 con
H0 : X~B(3, ½)
Đặt : Bk = biế n cố trong 3 đứa trẻ có k đứ a là
con trai.
44

11


ThS. Ph m Trí Cao * Ch

ng 7

Nếu H0 đú ng thì:

Ta lập bảng sau:
xi
ni

pi npi n np 2

i 
 i
np
i
3
14
1/8 10 1,6
2

36
3/8 30 1,2
1
24
3/8 30 1,2
0
6
1/8 10 1,6
Tổng n = 80 1
5,6

3
3




p1 = P(B0) = C 0  1   1 , p  P ( B )  C 1  1   3
3 2
2
1
3 2 
8
8
3
3





p  P ( B )  C 2  1   3 , p  p ( B )  C 3  1   1
3
2
3 2
4
3
32
8
8

Vậ y 2 = 5,6
=0,05 , k=4 , r=0
( 3 )  7 ,8147
 2
( k  r  1)   2
1 
0 ,95
 2   2 (3) : chấp nhận H0
0,95
45

Bài 3: Sản phẩm được sản xuất ra trên mộ t dây
chuyền tự động được đó ng gói một cách ngẫu
nhiên theo quy cách: 3 sản phẩm/hộp. Tiến
hành kiể m tra 200 hộp ta được kết quả:
Số sp loại I có trong hộp 0 1 2 3
Số hộp
6 14 110 70
Với = 2% , có thể xem số sp loại I có trong hộp
là đại lượng ngẫu nhiên có quy luật phân phối

47
nhò thứ c không?

Số liệu đã cho chưa cho phép ta khẳng đònh
loạ i thức ă n A có ả nh hưởng đến giới tính.

46

Giải:
Gọi X là số sp loại I có trong một hộ p.
XB(3, p)
Ta xấp xỉ p bằng:
f  1*14  2 *110  3 * 70  0 ,74
3 * 200
H0: X  B(3 ; 0,74)

48

12


ThS. Ph m Trí Cao * Ch

ng 7

Ta lập bảng sau:
ni
pi
xi
0

1
2
3
Tổng

6
14
110
70

npi

n  np
i
i
np
i
0,017576 3,5152 1,75644
0,150072 30,0144 8,5446
0,427128 85,4256 7,06932
0,405224 81,0448 1,50519

n = 200 1












2

18,8755

2= 18,8755 >  2 (4 11) = 7,8241 : bác bỏ H0
0,98

49

Giải:

Gọi X= số lỗi trong 300 trang in
H0: X ~ P(4,7)
P1 = P(X 2)
0
1
2
= e-4,7 ( ( 4 ,7 )  ( 4 ,7 )  ( 4 ,7 ) )  0 ,1523
0!
1!
2!
3
P2 = P(X=3) = e-4,7 ( 4 ,7 ) = 0,1574
3!
-4,7 ( 4 ,7 ) 4
P3= P(X=4)= e

= 0,1849
4!
5
P4 = P(X=5) = e-4,7 ( 4 ,7 ) = 0,1738
5!
6
P5 = P(X=6) = e-4,7 ( 4 ,7 ) = 0,1362
6!
6
P6 = P(X  7) = 1–  p ( X  k )  0 ,1954
k 0

51

Bài 4: Một nhà máy sản xuất máy in nói rằng số
lỗi in trong 1 cuốn sách dày 300 trang của máy
in là 1 ĐLNN có quy luật phân phối Poisson với
tham số =4,7 . Kiểm tra 300 trang sách in của
50 máy in cùng loại, ta thu được:
Số lỗi 0 1 2 3 4 5 6 7 8  9
Số máy 1 1 8 6 13 10 5 5 1 0
Với mức ý nghóa 1%, hỏi lời tuyên bố của nhà
sản xuất có đúng không?
50

xi

ni

pi


npi

2
3
4
5
6
7
Tổng

10
6
13
10
5
6

0,1523
0,1574
0,1849
0,1738
0,1362
0,1954

7,6150
7,8692
9,2463
8,6915
6,8083

9,7697

n np 
i
i
np
i
0,7470
0,4440
1,5239
0,1970
0,4803
1,4546





2

n =50 1
4,8468
2
 = 0,01, k = 6, r = 0  
(5 )  15 ,0863
0,99
2 = 4,8468 <  2 (5) : chấp nhận H0. tin lời tuyên bố trên.
0,99

52


13


ThS. Ph m Trí Cao * Ch

ng 7

Lưu ý : Nếu đề không cho biết  = 4,7 thì ta làm
như sau:
6
x  1n  n x
i1 i i
 1 (2*103*64*135*106*57*6) 4,24
50
Thay  bằng x = 4,24 . Xem X~P(4,24)
Tra bảng  2 (6 11)   2 (4)
0,99
0,99

53

Gọ i X = chiề u cao của câ y khuynh diệp (cm)
H0 : X có phâ n phố i chuẩ n N(, 2)
x  1n  n x  1 [65*10+90*9+105*13+115*14
i i 120
+125*21+135*15+145*12+155*13 + 165*13]
= 124,875
s 2  1 ( n x 2  n( x) 2 )
i i

n 1
 1 (1963675 120 (124 ,875 ) 2 )  776 ,6649
120 1
s  776 ,6649  27 ,8687
55
2

Xem X ~ N (124,875 ; (27,8687) )

Bài 6: Quan sát chiều cao của 120 cây khuynh diệp ở 1 năm
tuổi ta được bảng số liệu:
Chiều cao (cm) 50-80 80-100 100-110 110-120 120-130
Số cây
10 9
13
14
21
Chiều cao 130-140 140-150 150-160 160-170
Số cây 15
12
13
13
Với mứ c ý nghóa 5%, hãy kiểm đònh giả thiết: chiều cao cây
khuynh diệp có phân phối chuẩn?
54

x  , x  
i i 

ni


pi

(–, 80)

10
9

0,0537 6,444
0,1330 15,96

13

0,1114 13,368 0,1354

0,0101

(110, 120) 14
(120, 130) 21
(130, 140) 15
(140, 150) 12

0,1344
0,1389
0,1340
0,1105

0,2808
1,1259
0,0725

0,1197

(150, 160) 13
(160, +) 13

0,0803 9,636 11,3165 1,1744
0,1038 12,456 0,2959 0,0238








(80, 100)
(100, 10)

Tổ ng

n =120 1

npi

16,128
16,668
16,08
13,26

(ni-npi)2







n  np 
i
i
np
i

2

12,6451 1,9623
48,4416 3,0352
4,5284
18,7662
1,1664
1,5876

7,8047

56

14


ThS. Ph m Trí Cao * Ch


ng 7


p1= P(X< 80)= 0,5+   80  124 ,875

27 ,8687








= 0,5  (1,61) = 0,5-0,4463 = 0,0537
p2= P(80



=   100  124 ,875  –  80  124 ,875 




27 ,8687
27 ,8687





=(0,89)+(1,61)= – 0,3133+0,4463 = 0,1330
p3 = P (100= – 0,2019+0,3133 = 0,1114
p4= P (110 < X < 120)= –(0,17) + (0,53)
= –0,0675 + 0,2019 = 0,1344
p5 = P (120 < X < 130) = (0,18) + (0,17)
= 0,0714 + 0,0675 = 0,1389
57
p6 = P (130 < X < 140) = (0,54) - (0,18)
= 0,2054 – 0,0714 = 0,1340

Lưu ý :
* Nếu đề cho trước  = 25 thì r = 1
P(xi< X < xi+1)
x 124,875
x 124,875
)  ( i
)
=  ( i1
25
25
* Nếu đề cho trước = 120, = 25 thì r= 0
P( xi < X < xi+1)
x 120
x 120
=  ( i1
)( i
)
25

25

59

p7 = P (140 < X < 150 ) = (0,90) - (0,54)
= 0,3159 – 0,2054 = 0,1105
p8 = P (150 < X < 160 ) = (1,26) - (0,90)
= 0,3962 – 0,3159 = 0,0803
p9 = P (X>160 ) = 0,5 - (1,26)
= 0,5 – 0,3962 = 0,1038
Hay p9 = 1–(p1 + . . . + p8) = 0,1038
 = 0,05, k = 9, r = 2
 2
(6 )  12 ,5916
(9  2  1)   2
1 0,05
1 0,95
2 = 7,8047 <  2
(6) : chấ p nhậ n H 0
0,95

58

Vậ y có thể xem X~N(124,875 ; (27,8687) 2)

PHẦN II.2 : KIỂM ĐỊNH TÍNH ĐỘC LẬP
Một phầ n tử của đám đông có thể có các dấu hiệu
đònh lượng. Ví dụ con người có: chiề u cao, trọng
lượ ng. Một phần tử củ a đám đô ng còn có dấu hiệu
đònh tính. Ví dụ con người có: màu tóc, màu mắt.

Ta khảo sát 3 trường hợ p:
*Tính độ c lậ p của 2 dấu hiệu đònh tính.
*Tính độ c lậ p của 1 dấ u hiệ u đònh tính và 1 dấ u
hiệ u đònh lượ ng.
60
*Tính độ c lậ p của 2 dấu hiệu đònh lượng.

15


ThS. Ph m Trí Cao * Ch

ng 7

I. KIỂM ĐỊNH TÍNH ĐỘC LẬP CỦA 2 DẤU HIỆU ĐỊNH TÍNH

Giả thiết H0: Hai dấu hiệu A và B độc lập
H1: Hai dấu hiệ u A và B không độc lập

Ta có bảng liên hợp các dấu hiệu sau:
A
A1
A2
…..
Ar
Tổng

B B1 B2 ……. Bk Tổng
n11 n12
n21 n22


n1k n10
n2k n20

nr1 nr2
nrk nr0
n01 n02 ….. n0k n
k
r
k
k
n   n , n   n , n   n   n : cỡ mẫu
i0 j1 ij
0 j i1 ij
i1 i0 j1 oj

61

62

Giải

Ví dụ: Để nghiên cứu xem quy mô của một công ty có ảnh hưởng
đến hiệu quả quảng cáo đối với khách hàng hay không, người ta
tiến hà nh phỏ ng vấn 356 khách hàng và thu được kết quả sau:
Hiệu quả quảng
cáo Mạ nh Vừ a phải Yếu Tổng
Quy mô công ty
Nhỏ
20

52
32 104
Vừa
53
47
28 128
Lớn
67
32
25 124
Tổng
140
131
85 356
Với mức ý nghóa 5%, có thể cho rằng quy mô của công ty có ảnh
hưởng đến hiệu quả của quảng cáo đối với khách hà ng hay khôn g?

nij : tần số quan sát
n2
2
  n (   n .ijn  1)
i j i0 0 j
   2 ( k  1)( r  1)
1 
Quy tắc quyết đònh:
2 >  2 ( k  1 )( r  1) : bác bỏ H0
1 

H0: Quy mô không ảnh hưởng hiệu quả quảng cáo




202  522  322  532  472 

2 356140*104 131*104 85*104 140*128 131*128
282  672  322  252 1




*124 85*124

 85*128 140*124 131
= 29,638 >  2
(31)(31)   2 (4)  9,4877:
10,05
0,95

63

bác bỏ H0
Tức quy mô công ty có ảnh hưởng đến hiệu quả
của quảng cáo

64

16


ThS. Ph m Trí Cao * Ch


ng 7

II. KIỂM ĐỊNH TÍNH ĐỘC LẬP CỦA 1 DẤU
HIỆU ĐỊNH TÍNH VÀ 1 DẤU HIỆU ĐỊNH
LƯNG
Tiêu chuẩn phù hợ p 2 nói trên cò n có thể áp dụng
để kiểm đònh tính độc lập củ a 1 dấu hiệu đònh tính A
và 1 dấu hiệu đònh lượng X. Khi đó ta cầ n chia
miề n giá trò của X thành k khoả ng B 1, B2, Bk , và
nế u cá thể có số đo xj rơi và o khoảng Bj thì ta xem
cá thể đó có dấu hiệu Bj
65

Ví dụ: Một con cua biển có thể có màu vỏ là xanh, hoặc
hồng. Số vạ ch trên vỏ của nó có thể là 0, 1, 2, 3, 4, 5. Ở đây
dấu hiệu A (màu vỏ) là dấu hiệu đònh tính, còn số vạch trên
vỏ X là dấu hiệu đònh lượng (hay X là ĐLNN rời rạc).
Xét ngẫu nhiên 169 con cua biển, ta thu được:
Số vạch 0 1 hoặc 2 3 hoặc 4
Màu vỏ
Xanh
35 19
36
Hồng
14 14
16
Tổng
49 33
52

Với  = 5%, xét xem: A và X có độc lập?

5 Tổng
25 115
10 54
35 169
66

III. KIỂM ĐỊNH TÍNH ĐỘC LẬP CỦA 2 DẤU
HIỆU ĐỊNH LƯNG

Giải
H0: hai dấu hiệu A và X độc lập

2
2
2
2 169( 35  19 ..... 10 1) 2,13
49*115 33*115
35*54
 = 0,05 , r=2 , k=4
2
(2 1)(4 1)   2 (3)  7,8147
10,05
0,95
 2   2 (3) : chấp nhận H 0
0,95

67


Tương tự như vậy, ta có thể dùng tiê u chuẩn 2 nói
trên để kiểm tra tính độ c lậ p của 2 ĐLNN X và Y
(lưu ý rằng nếu X và Y không tương quan: RXY = 0 thì
chưa chắc X,Y độ c lập. Ta phả i kiểm tra mới khẳ ng
đònh đượ c). Muốn vậ y, ta chia miề n giá trò của X
thà nh k khoảng B1 , B2, Bk còn miền giá trò của Y
thà nh r khoảng A1, A2, Ar . Nếu cá thể có số đo (y,x)
 Ai x Bj thì ta coi cá thể đó có dấu hiệ u Ai và Bj 68

17


ThS. Ph m Trí Cao * Ch

ng 7

Ví dụ: Giả sử X và Y (pound) tương ứng là số đo huyết áp và
trọng lượng của trẻ em 14 tuổi. Lấy 1 mẫu ngẫu nhiên gồm
200 trẻ, ta có:
H. áp X  99 99T. lượng
Y  102
10
20
11
5
Y >102
6
48
50

50
Tổng
16
68
61
55
Với : 1 pound = 0,454 kg
Với  =1%, xét xem: X,Y có độc lập.

Tổng
46
154
200
69

Giải
H0: hai dấu hiệu X và Y độc lập
 = 0,01 , r= 2 , k= 4

(2 1)(4 1)   2 (3) 11,345
2
10,01
0,99
2
2
2
 2  200( 10  20 .... 50 1)  22,53
16*46 68*46
55*154
2

2
 
(3) : bác bỏ H0
0,95
Vậy giữa huyết áp và trọng lượng (trẻ 14 tuổi) có sự phụ
70
thuộc lẫn nhau.

Mời ghé thăm trang web:





 www37.websamba.com/phamtricao
 www.phamtricao.web1000.com

71

18



×