Tải bản đầy đủ (.pdf) (94 trang)

Xác suất và thống kê toán Hướng dẫn giải bài tập Phần 2

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.53 MB, 94 trang )

Chương 6

Kiểm định giả thuyết thống kê
6.1
6.1.1

Một số khái niệm và định nghĩa
Giả thuyết thống kê

Giả thuyết về quy luật phân phối xác suất của ĐLNN, về tham số đặc
trưng của ĐLNN hoặc về tính độc lập của các ĐLNN được gọi là giả thuyết
thống kê, kí hiệu là Ho
Mội giả thuyết trái với giả thuyết Ho được gọi là đối thuyết, kí hiệu là Hỵ.
Ho và Hỵ lập thành một cặp giả thuyết thống kê. Ta quy định: Khi đã chọn
cặp giả thuyết Ho, Hi thì nếu bác bỏ Ho ta sẽ chấp nhận Hì-

6.1.2

Tiêu chuẩn kiểm định

Để kiểm định cặp giả thuyết thống kê Ho và H1, từ đám đông ta chọn mẫu
ngẫu nhiên : w = (X1, x2,. ■ ■, Xn). Dựa trên mẫu này ta xây dựng thống kê:

G = f(x1,x2,...,xn,&o)
trong đó ỚQ là một tham số liên quan đến Ho, sao cho nếu Ho đúng thì quy
luật phân phối xác suất của G hồn tồn xác định. Khi đó thống kê G được
gọi là tiêu chuẩn kiểm, định.

6.1.3

Miền bác bỏ



Để xây dựng miền bác bỏ, ta sử dụng nguyên lý xác suất nhỏ: Nếu một
biến cố có xác suất khá bé ta có thể coi nó khơng xảy ra trong một lần thực

97


hiện phép thử. Vì đã biết quy luật phân phối xác suất của G, nên với một xác
suất a khá bé cho trước ta có thể tìm được miền wa, gọi là miền bác bỏ, sao
cho nếu giả thuyết Ho đúng thì xác suất để G nhận giá trị thuộc miền Wa
bằng a:

P(G e Wa/Hữ) = a

(6.1)

Vì a khá bé, theo nguyên lý xác suất nhỏ ta có thể coi biến cố (G G Wa/Ho)
không xảy ra trong một lần thực hiện phép thử. Nếu từ một mẫu cụ thể

w = (ỉi, X2,..., xn) ta tìm được giá trị thực nghiệm gtn = (aq, x2,..., xn, ỡo)
mà gtn 6 Wa (nghĩa là vừa thực hiện phép thử một lần đã thấy biến cố
(Ge Wa/Ho) xảy ra) ta có cơ sở bác bỏ giả thuyết Ho.
Ký hiệu wa là miền bù ca wa. Khi ú ta cú P(G ỗ. Wa/Ho) = 1 — a. Vì
a khá bé nên 1 — a khá gần 1. Theo nguyên lý xác suất lớn: Nếu một biến cố
có xác suất khá gần ỉ ta có the coi nó sẽ xảy ra trong một lần thực hiện phép
thử, nếu trong một lần lấy mẫu ta thấy gtn 6 wa thì giả thuyết Ho tỏ ra hợp
lý, chưa có cơ sỏ bác bỏ Ho. Vì vậy ta có quy tắc kiểm định sau:
Từ đám đơng ta lấy ra một mẫu cụ thể kích thước n : w = (xỵ,X2,..., Xn)
và tính gtn.
- Nếu gtn 6 wa thì bác bỏ Ho và chấp nhận H1.

- Nếu gtn ị wa thì chưa có cơ sở bác bỏ Ho-

6.1.4

Các loại sai lầm

Theo quy tắc kiểm định trên ta có thể mắc hai loại sai lầm như sau:
- Sai lầm loại một là sai lầm bác bỏ giả thiết Ho khi Ho đúng. Theo (6.1)
ta có xác suất mắc sai lầm loại một bằng a. Giá trị a được gọi là mức ý nghĩa.
- Sai lầm loại hai là sai lầm chấp nhận Ho khi chính nó sai. Nếu kí hiệu
xác suất mắc sai lầm loại hai là ß thì ta có:

P(G e Wa/Ho) = ß
Sai lầm loại một và sai lầm loại hai có quan hệ mật thiết với nhau: Khi
kích thước mẫu xác định, nếu giảm a thì ß tăng và ngược lại. Do đó khơng
thể lấy a bé tùy ý được. Người ta thường chọn a = 0,1;; 0,05; 0,01; 0,001.

98


6.2

Kiểm định giả thuyết về kì vọng tốn của
một ĐLNN

Giả sử ta cần nghiên cứu một dấu hiệu X thể hiện trên một đám đơng.
Kí hiệu EỢC) = ỊJL, Var(X) = ơ2, trong đó ịi chưa biết. Từ một cơ sỏ nào đó
người ta tìm được ịi = ịiũ, nhưng nghi ngờ về điều này. Vâi mức ý nghĩa a cho
trước ta cần kiểm định giả thuyết Ho : ụ. = /XoTừ đám đông ta lấy mẫu: w — (Xi, X2, • •. ,Xn) và tính được các đặc
trưng mẫu:


*=ề
TI i=1

và s'2 =

n — 1 ¿=1

- *)2

Xét các trường hợp sau:

6.2.1 ĐLNN X trên đám đơng có phân phối chuẩn với
cr2 đã biết
Xây dựng tiêu chuẩn kiểm

Vì X có phân phối chuẩn nên: X ~

định (XDTCKĐ):
(6.2)
y/n

Nếu Ho đúng thì ư ~ N(o, 1).
Xét những bài toán cụ thể sau:
Bài toán 1: <

Hq :

ụ. = ụ,Q


Hi :
ịio
Với a cho trước ta có thể tìm được ua sao ch°: ^*(1^1 >
Theo 6.1.3 ta có miền bác bỏ: Wa = {utn : lutn| > UỊ}

Trong đó:
ntn

=a

X — ụo

ơ’

ựn

Bài tốn 2: <

7/1 : fj, > Ho
Với a cho trước, ta có thể tìm được Ua sao ch°: ^(^ >
Từ đó ta có miền bác bỏ: Wa = {utn : Utn

99

= a.


Bài toán 3: <

Ho :


/z = Ho

Hỉ : H < Hữ
Với a cho trước, ta có thể tìm được ua sao cho: p(u < — ua) = a.
Từ đó ta có miền bác bỏ: wa = {utn : Utn < — ưQ}

Phương pháp P-giá trị (P-Value)
1. Cơng thức tìm P-giá trị
nÁ;

,,/k ux;

. - í H° :

a. Đỗi với bài tốn <

= ^0

[#1 : H^ Mo
Ta có P-giá trị = 2P(t7 > |ưfnI).
Trong đó u ~ 7V(0,1) và Utn — x ơ^ũ
y/n

b. Đối với bài toán

' Ho-.

M = Mo


Hi : M > Mo
Ta có P-giá trị = PựJ > utn).
\

c. Đối với bài tốn

' Ho-

M - Mo

M < Mo
Ta có P-giá trị = P{u < Utn).
P1 :

2. Kết luận sau khi tìm được P-giá trị

a. Cách thứ nhất:
- Nếu P-giá trị < 0,05 : Chưa có cơ sở để bác bỏ Hq
- Nếu 0,01 < P-giá trị < 0, 05 : Có cơ sỏ để bác bỏ fỉ0
- Nếu P-giá trị < 0, 01 : Có cơ sở chắc chắn để bác bỏ Ho

b. Cách thứ hai: Quy định trước mức ý nghĩa a. Tính P-giá trị rồi so sánh
với a:
- Nếu P-giá trị < a thì bác bỏ Ho

100


- Nếu F-giá trị > a chưa có cơ sở để bác bỏ ỈĨQ


Chú ý 6.1 Các cơng thức tìm P-giá trị trên cịn được dùng cho các bài tốn
kiểm định giả thuyết thống kê khác, trong đó có dùng tiêu chuẩn kiểm định u.

Ví dụ 6.1 Theo dõi 9 xí nghiệp may có số liệu thống kê về số phần trăm chi
phí về điện trong giá thành sản phẩm như sau:
9%

11%

10,5%

11%

9,5%

10%

11,5%

10,5%

11%

1) Với mức ý nghĩa 0,05 có thể nói: hơn 10% giá thành sản phẩm của hàng
may mặc dùng cho chi phí về điện hay khơng?

2) Tìm P-giá trị và kết luận với mức ý nghĩa 0,05.

Biết số phần trăm chi phí về điện trong giá thành sản phẩm của các xí
nghiệp may là một ĐLNN phân phối chuẩn với độ lệch tiêu chuẩn là 1%.


Lời giải.
1) Gọi X là số phần trăm chi phí về điện của xí nghiệp.
Gọi X là số phần trăm chi phí trung bình về điện trẽn mẫu.
Gọi U, là số phần trăm chi phí trung bình vệ điện trên đám đơng.
2
Vì X có phân phối chuẩn nên: X ~ 7V(m,
............................................ 4
, Íp0:
Với mức ý nghĩa a = 0,05 can kiếm định: <
[ Hi

M = ^o

(=10%)

n > Mo

XDTCKĐ: u = x
y/đ

Nếu Ho đúng thì u ~ 7V(0, 1). Khi đó tìm được phân vị ua sao cho
P(ụ > Ua) = a. Vì a khá bé, theo nguyên lý xác suất nhỏ ta có miền
bác bỏ:

X — ịlQ

Wa = {utn : Utn > UQ}, trong đó Utn = —-ã—
y/đ


101

\


Tra bảng ta có: ua — u0,05 = 1,65. Từ bảng số liệu thống kê ta tìm được
X = 10,44444. Khi đó:

Suy ra Utn ị Wa nên ta chưa có cơ sở bác bỏ Hũ-

Kết luận'. Với mức ý nghĩa a — 0,05 ta có thể nói rằng chi phí trung bình
về điện trong các xí nghiệp may chiếm 10% giá thành của sản phẩm.
2) P-giá trị =p(u > 1,33332) — 0,0918 > 0,05, suy ra chưa có cơ sở để
bác bỏ Hữ.

6.2.2

ĐLNN X trên đám đơng có phân phối chuẩn với

ơ2 chưa biết
_
X — ịJLữ

XDTCKĐ:

y/đ
Vì X có phân phối chuẩn, nếu Ho đúng thì T ~ T(n
. .............. I Ho : n = fj-o
Bài tốn 1: <
( Hì. : M / Mo

Với mức ý nghĩa a cho trước ta có thể tìm được -1) sao cho:

P(|T| > 4n_1)) = a

Từ đó ta có miền bác bỏ:
= [ttn : |ítn| > í ạ 1}} trong đó : tin = — ,^°
2
s
y/đ
Bài tốn 2:

: M > Mo
Với mức ý nghĩa a cho trước ta có thể tìm được ía"-1) sao cho:
P(T > ¿n_1)) = a

102

(6.3)


Từ đó ta có miền bác bỏ:

Wa = {ttn : ítn > ¿n_1)}

Bài toán 3: <

' Ho ’

M = Mo


M < ịiữ
V
Với mức ý nghĩa a cho trước ta có thể tìm được ta"-1) sao cho:
P(T < -íLn_1)) = a

Từ đó ta có miền bác bỏ:
wo = {ttn : ttn < -tLn_1)}

Cơng thức P-giá trị (P-Value).
Bài tốn 1: <

Ho :

= Mo

P1 :

P-giá trị = 2P(T > |ítn|), trong đó T ~ 7’(n_1),ítn =

Bài tốn 2: <

X - Mo

22

y/ĩĩ

'h0: M = Mo

XH1 : M > Mo

P-giá trị = P(T > ttn).

'h,. M = Mo

Bài toán 3: <

P-giá trị = P(T < íin).

M < Mo

Chú ý 6.2 Cơng thức tìm P-giá trị trên cịn dùng cho các bài tốn kiểm định
khác có dùng tiêu chuẩn kiểm định T.

Sau khi tìm được P-giá trị, việc kết luận được tiến hành như trong mục
6.2.1.

Chú ý 6.3 Khi ĐLNN có phân phối chuẩn, mặc dù ơ2 chưa biết, nhưng nếu
kích thước mẫu n > 30 người ta thường dùng chuẩn u. như trong mục 6.2.1.

Đến khi tìm Utn ta lấy ơ « s'.

103


Ví dụ 6.2 Tiền cước hàng tháng phải trả của các máy điện thoại cố định là
một ĐLNN phân phối chuẩn. Điều tra tiền cước phải trả của 16 máy, tính
được trung bình mẫu là 145 nghìn đồng và độ lệch tiêu chuẩn mẫu điều chỉnh
là 7,6864 nghìn đồng.

1) Với mức ý nghĩa 5% có thể nói rằng tiền cước tháng trung bình của mỗi

máy là ít hơn 150 nghìn đồng hay khơng?
2) Tìm P-giá trị và kết luận.

Lời giải.
1) Gọi X là tiền cước tháng phải trả của mỗi máy.
Gọi X là tiền cước tháng trung bình của mỗi máy trên mẫu.
Gọi ụ. là tiền cước tháng trung bình của mỗi máy trên đám đông.
Với mức ý nghĩa a — 0,05 cần kiểm định:

Ho :

M = Mo

H1 ■

Mo

(= 150)

XDTCKĐ: T = x ~/°
ựn
Nếu Ho đúng thì T ~ T
sao cho

P(T < -t£n-x)) = a
Vì a khá bé, nên theo nguyên lý xác suất nhỏ ta có miền bác bỏ:

= {tín : ttn < -t^n_1)} trong đó ttn =


Ta có ¿n_1) — ¿0^05 = 1,753, tín = 1

s
y/ĩi

— -2,602 < -1,753 =>

ựĩẽ
tin ẽ IVO. Suy ra bác bỏ Ho- Vậy với mức ý nghĩa a = 0,05 ta có thể nói
rằng tiền cước tháng trung bình của một máy điện thoại là ít hơn 150

nghìn đồng.2
2) P-giá trị = PtT^-V < ttn) = P(T<15) < —2,602) = P(T<15’ > 2,602) =

0,01 < 0,05. Vậy ta bác bỏ Ho-

104


6.2.3

Chưa biết quy luật phân phối xác suất của X
nhưng kích thước mẫu n > 30

Theo (4.6) khi TI > 30 thì X ~
định:

71

)• Ta vẫn dùng tiêu chuẩn kiểm


Khi đó, nếu giả thuyết Ho đúng thì thì u sẽ xấp xỉ phân phối chuẩn JV(0,1).
Phần còn lại tiến hành như mục 6.2.1. Ta cũng cằn nhớ rằng: nếu ơ2 chưa biết,
nhưng 71 > 30 ta có thể lấy ơ « s'.

Ví dụ 6.3 Bình thường, thời gian từ khi gieo hạt đến khi thu hoạch một giống
lúa là 90 ngày. Do điều kiện gieo trồng thay đổi, người ta nghi ngờ thời gian
canh tác đã thay đổi. Theo dõi thời gian canh tác giống lúa này trẽn 36 thửa
ruộng tính được X = 95 ngày và s' — 12 ngày.
1) Với mức ý nghĩa 1% hãy cho kết luận về điều nghi ngờ trên.

2) Tính P-giá trị và kết luận với mức ý nghĩa 1%.

Lời giải.
1) Gọi X là thời gian canh tác của giống lúa.
Gọi X là thời gian canh tác trung bình của giống lúa trên mẫu.
Gọi p, là thời gian canh tác trung bình của giống lúa trên đám đông.

Với mức ý nghĩa 1% cần kiểm định:

Ho-

/1 = /*O

Hi :

/1 7^ /lo

(=90)


XDTCKĐ: u = x

y/n
Vì 71 > 30 nên X ~ 7V(/1, —). Nếu Ho đúng thì ư ~ 7V(0,1). Với a =
n

0,01 cho trước ta tìm được phân vị chuẩn Tia sao cho F(|uI > Tia) = a.
Vì a khá bé nên theo nguyên lý xác suất nhỏ ta có miền bác bỏ:

Wa = {utn : |utn| > Ha}, trong đó Utn = —ã—
v/ũ
*

105

l


95 - 90
= 2,5 (vì ơ
12
ựãẽ
chưa biết, kích thước mẫu n lớn ta lấy ơ ~ s'), Suy ra Utn ị wa, nên ta
chưa có cơ sỏ để bác bỏ Ho.

Ta có Us2

— Wo,005

= 2,58. Theo đề bài ta có Utn =


2) P-giá trị =2P([/ > |2, 5|) = 2.0,0062 = 0,0124 > 0,01. Suy ra chưa có
cơ sỏ để bác bỏ Ho.

6.3

So sánh kì vọng tốn của hai ĐLNN

Xét hai ĐLNN X1,X2. Kí hiệu P(X1) = fỉlfE(X2) = H2,Var(Xi} =
<71, Var{x2') = ớị. Trong đó ịiỵ và ịi.2 chưa biết. Với mức ý nghĩa a cho trước
ta cần kiểm định giả thuyết Po : /11 = /12.
Chọn từ đám đơng thứ nhất ra mẫu kích thước nỵ: Wi — (X11, X12,..., Xini
từ đó tính được Xị và s'lChọn từ đám đơng thứ nhất ra mẫu kích thước n2:1V2 = (-^21, X22, ■ ■ •, X2T12
từ đó tính được x2 và S22.
Ta xét các trường hợp sau:

6.3.1

Xi, x2 đều có phân phối chuẩn với ơl, ơỊ đã biết

XDTCKĐ:
ĨJ —

X1-X2

V ni

(6.4)

n2


Nếu Ho đúng, theo (4.7) thì u ~ N(o, 1). Tương tự như trong mục 6.2.1, ta

có:

Bài tốn 1: <

Ho :

/11 = /12

Hl :

/11

/12

Với miền bác bỏ là: wa = {utn ■ lnl > u3}’ trons đó Utn

Bài tốn 2: <

Hq :

/11 = /12

Hi : /11 > /12
Với miền bác bỏ là: Wa = {utn ■ Utn

> WQ}


106

r^2
V «1 + n2


Bài toán 3:

Ho'.

ịii — fi2
M1 < M2

Với miền bác bỏ là: Wa = {utn : utn < —ua}

Ví dụ 6.4 Có hai máy đóng gói hàng cùng loại. Người ta cho rằng trọng lượng
trung bình của các gói hàng do máy I đóng nhỏ hơn máy II. Để kiểm tra lại,
người ta cân 10 gói do máy I đóng, 15 gói do máy II đóng và tính được các
trung bình mầu tương ứng là 985 gam và 1002 gam. Với mức ý nghĩa a — 0,05
hãy cho kết luận về vấn đề trên. Biết rằng trọng lượng của các gói hàng do
mỗi máy đóng đều có phân phối chuẩn với <71 = lOO(gam)2, crj = 90(gam)2.

Lời giải. Gọi X1, x2 lần lượt trọng lượng của các gói hàng do máy I và máy
II đóng.
Với mức ý nghĩa a = 0,05 cần kiểm định:

— M2

Mi < M2


XDTCKĐ:

ư=
Vì Xi ~ V(/Z1, <7?); x2 ~ X(/12, ơi'). Nếu Ho đúng thì u ~ 7V(0,1). Khi đó ta
tìm được ua sao cho P(ư < —ua) = a. Vì a khá bé nên theo nguyên lý xác

suất nhỏ, ta có miền bác bỏ:
trong đó Utn =

Ta có ua = u0,05 = 1,65 và Utn =

571

572

/
= = —4’ 25 < ~1’ 65Ị100 90
V'ĩõ' + 15

Suy ra Utn Ễ IVQ, nên bác bỏ Ho.
Kết luận: Với mức ý nghĩa a = 0,05 có thể nói rằng trọng lượng trung bình
của các gói hàng do máy I đóng thấp hơn máy II.

Chú ý 6.4 Nếu <71 và <72 chưa biết, nhưng ni > 30, n2 > 30 ta vẫn có thể
dùng thống kê (6.4) làm tiêu chuẩn kiểm định, đến khi tính Utn ta thay <71 «
s'1 và ơ2 ~ s'2.

107



6.3.2

Chưa biết quy luật phân phối của Xi,X2 nhưng
771 > 30,77,2 > 30

Theo chú ý 4.5 ta vẫn có thể dùng (6.4) làm tiêu chuẩn kiểm định. Các
phần còn lại được tiến hành như trong mục 6.3.1.

6.3.3

Xi, x2 đều có phân phối chuẩn với (71 = <72 = ơ2

chưa biết
XDTCKĐ:

-X2

X1

(6.5)

7Ỉ1 + 7Ỉ2 — 2
Nếu Ho đúng, theo (4.8) thì T ~ 71("i+n2 2) Từ đó ta có miền bác bỏ với

mức ý nghĩa a cho từng bào toán sau:
Hũ :

Bài tốn 1: <

/J>1 = ụ2


H1 : ụ-1 Ỷ M2
Có miền bác bỏ là: Wa = {ttn : |ifn| > í^1+"2 2)}, trong đó
X

2

Xi — x2

tin —

Hỵ + n2 — 2


Bài tốn 2:

Ho-.

M — Mo

H, :

M1 > M2
Có miền bác bỏ là: Wa — {ttn : ttn > t à(ni+n2-2) }
X



Bài tốn 3:


Ho'.

ịi = Mo

Hi : /21 < /22
Có miền bác bỏ là: Wa = {ttn : ttn < — í£ll+"2-2)}
X

108


6.4

Kiểm định giả thiết về tỉ lệ của đám đông
(Kiểm định giả thuyết về tham số p của phân phối Aịp)

Xét một đám đơng có tỉ lệ phần tử mang dấu hiệu A là p, trong đó p chưa
biết. Từ một cơ sở nào đó người ta tìm được p = Pũ nhưng nghi ngờ về điều
này. Với mức ý nghĩa a cần kiểm định giả thuyết: Ho : p = Po- Gọi f là tỉ lệ
phần tử mang dấu hiệu A trên mẫu ngẫu nhiên kích thước n. Như ta đã biết
(xem mục 4.3.4) khi kích thước mẫu n đủ lớn thì f có phân phối xấp xỉ chuẩn:
n
XDTCKĐ:
ư -

f-Po

Ví dụ 6.5 Theo cơng bố gần đây thì tỉ lệ người sử dụng phương tiện giao
thông công cộng (PTGTCC) ở Tp.Hồ Chí Minh là 30%. Để kiểm tra lại, người


ta phỏng vấn 200 người thấy có 54 người sử dụng PTGTCC. Dựa trên sô liệu
thống kê này, với mức ý nghĩa 5% hãy kẽt luận xem tỉ lệ công bơ trên có hợp
lý hay khơng?

Lời giải. Gọi f là tỉ lệ người sử dụng PTGTCC trên mâu.
Gọi p là tỉ lệ ngưịi sử dụng PTGTCC trên đám đơng.

109

'


2
PQ
Vì 71 khá lớn nên f có phân phối xấp xỉ chuẩn: f ~ N(p, ^).
Với mức ý nghĩa a = 0,05 cần kiểm định: <

XDTCKĐ:

Ho'- P = Po(= 0,3)
VH1 : p^Po

u=ỉ-po

trong đó qo = 1 — PoNếu Ho đúng thì u Oi N(0,1). Tìm được phân vị Us sao cho

P(|C/| >

Uị) = a


Vì a khá bé nên theo nguyên lý xác suất nhỏ ta có miền bác bỏ:
Wa = {utn ■ ktnl > ua}, trong đó utn =



p

Ho.

Kết luận: Với mức ý nghĩa a = 0,05 ta có thể nói rằng tỉ lệ người sử dụng
PTGTCC ở Tp.HỒ Chí Minh là 30%.

6.5

So sánh tỉ lệ của hai đám đông

(So sánh hai tham

số p của hai phân phối không - một)
Xét đồng thời thời hai đám đông. Gọi P1 và p2 là tỉ lệ phần tử mang dấu
hiệu A tương ứng trẽn đám đông thứ nhất và thứ hai. Yêu cầu kiểm định giả
thuyết Ho : P1 — p2 với mức ý nghĩa a.

Lần lượt từ đám đông thứ nhất và đám đông thứ hai ta chọn ra hai mẫu
độc lập kích thước 711 và 712. Gọi 7114 và 7124 lần lượt là số phần tử mang dấu
hiệu A tương ứng trẽn mẫu thứ nhất và mẫu thứ hai.
nifi + n2f2
Đặt
nl + n2


110


XDTCKĐ; ư =
V
Hi n2
Nếu Ho đúng và 711,712 đủ lớn, theo cơng thức (4.11) trong mục 4.3.3 thì u có
phân phối xấp xỉ chuẩn hóa. Từ đó ta có miền bác bỏ cho từng bài toán như
sau :
Ho' P1 = P2
có miền bác bỏ là: Wa — {utn : |n| >
Bài toán 1:
H1 : P1 P2

Bài toán 2:

Bài toán 3:

H1 '.

P1 — P2 có miền bác bỏ là: Wa — (uín : Utn > ua}
P1 > P2

Ho'.

P1 = P2

Hi :

P1 < P2


Ho'.

có miền bác bỏ là: WQ = {utn : Utn < — ua}-

Ví dụ 6.6 Điều tra 60 hộ vay vốn hỗ trợ người nghèo ở tỉnh A thấy có 18 hộ
sử dụng khơng đúng mục đích. Điều tra 80 hộ vay vốn này ở tỉnh B thấy có 20
hộ sử dụng khơng đúng mục đích. Với mức ý nghĩa 0,01 có thể kết luận là tỉ lệ
sử dụng vốn khơng đúng mục đích của tỉnh A cao hơn của tỉnh B hay không?

Lời giải. Gọi Pi và p2 lần lượt là tỉ lệ hộ sử dụng vốn không đúng mục đích
ỏ tỉnh A và B trên đám đơng.
Gọi /1 và /2 lần lượt là tỉ lệ hộ sử dụng vốn khơng đúng mục đích ở tỉnh
A và B trên mẫu.

Gọi f là tỉ lệ hộ sử dụng vốn khơng đúng mục đích chung của hai tỉnh A
và B trên mẫu.
Ho'- P1 — P2
Với mức ý nghĩa a — 0,01 cần kiểm định giả thuyết <
\ Hì. : Pi> P2
/1-/2
XDTCKĐ: u =

Vì 711 và 712 lớn, nếu Ho đúng thì u có phân phối xấp xỉ chuẩn N(Q-, 1). Khi đó
ta tìm được phân vị ua sao cho P(U > ua) = Ck. Vì Q khá bé nên theo nguyên
lý xác suất nhỏ ta có miền bác bỏ
— ị^tn • ^tn > ^a}
Ta CÓ ua = 140,01 = 2,33. Mặt khác theo đề bài Tiỵ = 60, TỈ1A = 18;

111



ỳMl-0,27)(l+2j)
Vì vậy Utn ị Wa nên chưa đủ cơ sở để bác bỏ HoKết luận-. Với mức ý nghĩa a = 0,01 ta có thể nói tỉ lệ sử dụng vốn khơng
đúng mục đích ở cả hai thành phố A và B là bằng nhau.

6.6

Kiểm định giả thiết về phương sai của
ĐLNN phân phối chuẩn

Xét ĐLNN X, giả sử X ~
nghĩa a cần kiểm định giả thuyết Ho : cr2 = ƠQ.

Từ đám đơng lấy ra mẫu ngầu nhiên kích thước n
w = (x1,x2,...,xn)

Từ mẫu này tính được s12. XDTCKĐ:
Theo (4.4), nếu Ho đúng thì X2 ~ x2(n 0.


Bài tốn 1:
Ta tìm được

Ho'
H1

y2/_1)


(n - l),?72
ơ0

ơ2 = ơg

a2 í ơ2
và Xi^Ts1) sao cho
1

2

P[(x2 < xĩ(2ị1}) + (x2 > xị(n_1))] = a

Vậy miền bác bỏ là:

= {xin ■ xin < xl-ị 1} hoặc xln > xị(n x)}
m___ 2
(n-l)s'2
Trong đó x?„ = v-- y7—
ơõ

112


Ví dụ 6.7 Kiểm tra ngẫu nhiên 20 gói hàng do một máy tự động đóng tính
được phương sai mẫu điều chỉnh về trọng lượng là 30 (gam)2.
(

1) Với mức ý nghĩa 5% hãy kiểm định <


Ho:

<72 = ơo(= 25)

Hi :

<72 / ƠQ

2) Tìm P—giá trị và kết luận.

Giả sử trọng lượng của các gói hàng do máy tự đóng phân phối theo quy luật
chuẩn.

Lời giải.
1) XDTCKĐ: X2 = -n

p—
*0

113


Nếu Ho đúng, vì X có phân phối chuẩn nên X2 ~ x2(n
được Xs"-1> và Ỉ11 sao cho
2

. Khi đó ta tìm

2


1

p[(x2 < x?-ä1}) + (X2 > x|(n_1))] = «
Vì a khá bé nên theo nguyên lý xác suất nhỏ ta có miền bác bỏ là:

™a = {xỉn ■ Xtn < xỉ-ệ0 hoặc x?n > x|(n_1)}
___
2
(n — l)^
Trong đó Xtn =---- “2 —
ơõ
Ta có x!ínã1} = x?$ = 8,90655; xị(n_1) = XồS = 32,8523

và Xtn =
Do đó Xin ị

= 22,8.
Vậy ta chưa đủ cơ sở để bác bỏ Ho.

2) P—giá trị = 2P(x2 > Xin) = 2P(x2 > 22,8) = 2.0, 25 — 0,5 lớn hơn
nhiều so với 0,05. Vì vậy máy hoạt động bình thường.

6.7

So sánh phương sai của hai ĐLNN phân

phối chuẩn
Xét hai ĐLNN Xi và x2 thể hiện trên hai đám đông. Giả sử X1 và x2 đều
tuân theo quy luật phân phối chuẩn với các phương sai ơ2, ơ2 chưa biết. Với
mức ý nghĩa a cần kiểm định giả thuyết Ho : ơ2 — Ơ2

Chọn từ đám đơng thứ nhất ra mẫu kích thưóc m:
W1

= {Ấ11,X12,...,XlflJ

Từ đó tính được Xi = J-

-Vư và Sỵ — _
ĩlỵ 1 2=1
Chọn từ đám đơng thứ hai ra mẫu kích thước n2:

— VJ2

71*1 2—1

w2 = {x21,x22,...,x2n,}

Từ đó tính được x2 = -- £ x2i và sỉ = _
Ẽ(v2i - x2y
7Ỉ2 i=i
n2 — 1 i=1

114


z
s? ơĩ
Theo (4.9), nếu hai mẫu độc lập ta có F = -^2' 2 ~ F(ni - l,n2 — 1).
$2 ơí
s?

*
________ ___
XDTCKĐ: F =
(ta ln kí hiệu sao cho sợ > SỊ)
‘-’2

‘s?
Nếu Ho đúng thì F = —h.
‘-’2

F(ni — 1, n2 — 1)

Có những bài tốn sau cần giải giải quyết:
Bài tốn 1:

'

ƠỊ = ƠỊ

1^:

al/aỉ

Ta tìm được

và y^"1-1;n2-1> sao cho

p[(p < /(271;n2_1)) + (P >
1


2

=a

2

Vậy miền bác bỏ là:

Wa = {ftn : ftn < /1%-1;n2-1) hoặc ftn >
2

2

_
sTrong đó ftn =
Bài toán 2: <

Ho'-

ơ? = ơ|

Hi :

ơ2 > ơ2
sao cho P(F > yơu-i;"2-i)} _ a

Ta tìm được

Vậy miền bác bỏ là: Wa = {ftn : ftn > y^ni-1;n2-1)}


Công thức P-giá trị (P-Value).

f Ho :
Đối với bài toán J: <
(#1 :

ơ2 = Ơ2


P-giá trị — 2P(F > ftn) nếu P(F > ftn) < 0, 5, hoặc
P-giá trị = 2P(P < /tn) nếu P(P < ftn) <0,5
Trong đó p ~ F(ni — 1; n2 — 1)

Đối với bài toán 2\ <

Ho :

ơj = ơl

Hi : ơ2 > ơ2
P-giá trị = P(F > ftn).

Ví dụ 6.8 Điều tra ngẫu nhiên 20 hộ ở địa phương A và 25 hộ ở địa phương
B tính được các phương sai mẫu điều chỉnh về mức thu nhập hàng năm là
4900 (nghìn đồng)2 và 10000 (nghìn đồng)2.

115



1) Với mức ý nghĩa 0,01 có thể nói độ đồng đều về thu nhập của các hộ ỏ
địa phương A cao hơn ở địa phương B hay khơng?
2) Tìm P—giá trị và kết luận.

Biết mức thu nhập của các hộ ở mỗi địa phương đều phân phối theo quy luật
chuẩn.

Lời giải.
1) Gọi X1 là mức thu nhập của các hộ ở địa phương B.
Gọi x2 là mức thu nhập của các hộ ở địa phương A.

Với mức ý nghĩa a = 0,01 cần kiểm định <

'h0:

ơ2

= ơĩ
ỈỈ1 ■ ơị > Ớị

XDTCKĐ: F = ^2
Vì Xỵ, X2 đều phân phối theo quy luật chuẩn, nếu Hq đúng thì

F ~ F(ni — 1; 712 — !)• Khi đó ta tìm được phân vị
P(F >

—1:”3—1 sao cho

=a


Vì a khá bé nên theo nguyên lý xác suất nhỏ ta có miền bác bỏ:

Wa = {ftn : ftn >

Ta có
Mặt khác ftn =

= 2,92.
= 12^9. = 2,04 < 2,92 hay ftn ị wa nên ta chưa

đủ cơ sở để bác bỏ HoKết luận: Với mức ý nghĩa 0,01 có thể nói độ đồng đều về thu nhập của
các hộ dân ở hai địa phương là như nhau.

2) p-giá trị = p(p(24-19) > ftn) = p(p(24’19) > 2,13) > 0,05. Vậy chưa đủ

cơ sở để bác bỏ Ho.

116


6.8

Kiểm định phi tham số

6.8.1 Tiêu chuẩn kiểm định Jarque - Bera (JB) dùng để

kiểm định tính phân phối chuẩn của ĐLNN
Xét ĐLNN X thể hiện trên một đám đông. Giả sử quy luật phân phối xác
suất của X chưa biết. Với mức ý nghĩa a cần kiểm định cặp giả thuyết thống

kê:
Hữ: ĐLNN X có phân phối chuẩn.
H1: ĐLNN X khơng có phân phối chuẩn.
Từ đám đơng lấy mẫu w = (Xj,..., Xn). Từ mẫu này ta tính được các thống
kê (xem [1] mục 3.1.2 chương VI).
_
...

1
..
Trung bình mẫu X = — V Xi
n 1
,
_
/1 n
Độ lệch tiêu chuấn mẫu s = ./£■ V(Xj — X)2
Vn 1
nệ(Xi~^3

Hệ số bất đối xứng Sk =-------- ™-------ỏ3
lậ(Xt_X)4
Hệ số nhọn mẫu K =--------—;------------3
s4
Dựa trên những thống kê trên ta XDTCKĐ Jarque-Bera như sau:

Người ta chứng minh được rằng nếu Hq đúng thì JB ~ x2(2\ Khi đó ta có thể
tìm được Xa2) sao cho p(x2 > Xa2)) = a. Vì a khá bé, theo nguyên lý xác

suất nhỏ ta có miền bác bỏ:
Wo = [JBtn : JBín > xẳ(2)}, trong đó JBtn = n[y + §]


Ví dụ 6.9 Theo dõi doanh thu của một cửa hàng trong 20 ngày được bảng
số liệu:
Doanh thu (triệu đồng)
Số ngày theo dõi

18
1

117

19
5

20
8

21

22

4

2


Với mức ý nghĩa 5% có thể nói rằng doanh thu của cửa hàng có phân phối
chuẩn hay khơng?

Lời giải. Ta có:


= 1 "
1.18 + 5.19 + 8.20 + 4.21 + 2.22 „„
x = ^Ị2xi =----------------- -----------------------= 2°.05
ÍT' Í=1
20
s = Ấ/ịỄ(zi-*)2 = 1,023474
V ni=i
^ệ(xị-x)3

sk = n 1

k= n 1

,------- = 0,179789
,---------- 3 = 2,547929 - 3 = -0,452071

S2

JBtn = n[ặ +

,2

= 0,278054; xg = 5,99147

Khi đó JBtn ị wa vì vậy chưa đủ cơ sở bác bỏ Hq.

6.8.2 Kiểm định giả thuyết về tính độc lập
Xét hai ĐNN rời rạc X và Y thể hiện trên cùng một đám đông. Với mức
ý nghĩa a cần. kiểm định cặp giả thuyết thống kê:

Ho: X và Y độc lập.
Hị : X và Y không độc lập.

Từ đám đông lấy mẫu ngẫu nhiên kích thước n, điều tra trên mẫu này và được
kết quả:
X

X1



xk

mj

Kị!

nki

mi

^kj

7Tlị



Xi








Y
yi

nn

yj

nij

7ĩij

yi

Tiu

nu

Tbị

ni

ni




nki
nk

E = n

Trong đó: Xi,... ,Xị,... ,xk là các giá trị quan sát của X.
yi,. ■ ■ ,yj, ■ • ■ ,yi là các giá quan sát trị của Y.
riij là tần số của cặp giá trị quan sát (li, 2/j).

118


Tii là tần số của giá trị quan sát Xi(i — 1,..., kỵ
•m,j là tần số của giá trị quan sát j/j(j = 1,..., /).

k
k
l
kỉ
Suy ra ni = 52 Hý-; mj - 52 nij’ E ni = 12 mj = E E nij = n
j=l
Í=1
i=l
j=l
i=lj = l
XDTCKĐ
2

fc
1

„2
=néếẴ

-1]

Người ta chứng minh được rằng nếu Hq đúng và kích thước mẫu n khá lớn
thì X2 có phân phối xấp xỉ ỵ2((fe-1)(i-1)). Khi đó ta tìm được ỵ2«fc-i)ơ-i)) sao

=a

P(x2 >

Vì a khá bé, theo nguyên lý xác suất nhỏ ta có miền bác bỏ:

trong đó

—l)(í—1))
w<* = {xỉn -x2tn>x 2((fc
a
}

1 được tính trên một mẫu cụ thể.

Ví dụ 6.10 Điều tra 50 người được bảng số liệu:
Trọng lượng
< 50 kg
50kg - 60kg
>60kg

< 150cm


Chiều cao
150cm - 160cm

> 160cm

8

5

2

5
1

8
6

7
8

Với mức ý nghĩa 0,05 hãy kiểm định cặp giá thuyết thống kê:

Hữ: Chiều cao và cân nặng độc lập
Hỵ: Chiều cao và cân nặng không độc lập.

Lời giải. Ta có:
2
82
52

22
52
82
72
j2
X‘n - u44 15 + 19 15 + 17 15 + 14 20 + 19.20 + 17.20 + 14.15
+ẫ+ẫ-i)-9’602499-

^,2((fc-l)(i-l)) = ^2(4) = g, 48773

G wa vì vậy bác bỏ ỊỊ0

119


Chú ý 6.5
1) Trong trường hợp X và Y là những ĐLNN liên tục ta có thể chia các giá
trị của chúng ra thành từng khoảng (như trong ví dụ trên).

2) Trong TCKĐ ở trên chỉ chứa có kích thước mẫu n, các tần số 7ij, mj
và Tiij còn các giá trị cụ thể Xi, yj hồn tồn khơng tham gia, vì vậy
tiêu chuẩn kiểm định trên có thể sử dụng để kiểm định tính độc lập của
hai dấu hiệu định tính A, B với các thuộc tính thành phần tương ứng là
Ai,... ,Ai,..., Ak', B1,..., Bj,... ,Bi (xem [1] mục 3.2, §3. chương VIII).

Bài tập chương 6
6.1 Trước khi thay đổi trang thiết bị, tiền lãi trung bình mỗi ngày của một
cửa hàng là 20 triệu đồng. Sau khi thay đổi trang thiết bị, theo dõi 16 ngày
liên tiếp thấy tiền lãi trung bình của mỗi ngày là 20,3 triệu đồng.


a. Với mức ý nghĩa 0,05 có thể cho rằng sau khi thay đổi trang thiết bị tiền
lãi trung bình đã thay đổi hay khơng?

b. Tìm P-giá trị và kết luận với mức ý nghĩa 0,05.
Biết tiền lãi mỗi ngày của cửa hàng là một ĐLNN phân phối chuẩn với độ lệch
tiêu chuẩn là 0,6 triệu đồng.

6.2 Theo dõi 25 bệnh nhân mắc bệnh ung thư gan thấy thời gian trung bình
từ khi phát hiện ra bệnh đến khi chết kéo dài 49 tháng.

a. Với mức ý nghĩa 0,05 có thể nói rằng thời gian trung bình từ khi phát
hiện ra bệnh đến khi chết kéo dài hơn 4 năm hay khơng?
b. Tìm P-giá trị và kết luận.
Biết thời gian từ khi phát hiện ra bệnh ung thư gan đến khi chết của bệnh
nhân là một ĐLNN phân phối chuẩn với độ lệch tiêu chuẩn là 4 tháng.

6.3 Cân thử lượng ga trong 9 bình được kết quả: ll,8kg; ll,7kg; ll,6kg;
ll,4kg; ll,5kg; ll,6kg; u,8kg; ll,4kg; u,5kg.

120


a. Với mức ý nghĩa 0,01 có thể kết luận rằng trọng lượng trung bình của
mỗi bình ga là nhỏ hơn 12kg hay khơng?
b. Tìm P-giá trị và kết luận.
Biết trọng lượng ga trong mỗi bình là ĐLNN phân phối theo quy luật chuẩn
với độ lệch tiêu chuẩn là 0,15kg.

6.4 Trước khi thay đổi nhân viên phục vụ, trung bình mỗi khách hàng vào
cửa hàng ăn uống A tiêu hết 80 nghìn đồng. Sau khi thay đổi nhân viên phục

vụ, theo dõi 100 khách vào cửa hàng thấy mức tiêu trung bình của mỗi người
là 78 nghìn đồng và độ lệch tiêu chuẩn mẫu điều chỉnh là 16 nghìn đồng. Với
mức ý nghĩa 0,05 có thể nói rằng do thay đối nhãn viên phục vụ nên số tiền
chi tiêu trung bình của mỗi khách hàng một lần vào cửa hàng đã thay đổi hay
không?

6.5 Theo dõi thời gian cần thiết để sản xuất ra một đơn vị sản phẩm cùng
loại của 49 công nhân được kết quả:
Thời gian (phút)
Số công nhân

13

14

15

16

8

13

18

10

Với mức ý nghĩa 0,05 có thể nói rằng thời gian trung bình cần thiết để sản
xuất ra một đơn vị sản phẩm là ít hơn 15 phút hay khơng?


6.6 Thống kê doanh thu 36 ngày liên tiếp của một cửa hàng và tính được
doanh thu trung bình của một ngày là 63 triệu đồng và độ lệch tiêu chuẩn mẫu
điều chỉnh là 9 triệu đồng. Với mức ý nghĩa 0,05 có thể nói rằng doanh thu
trung bình trong một ngày của cửa hàng là lớn hơn 60 triệu đồng hay không?

6.7 Năng suất của một giống lúa là một ĐLNN phân phối theo quy luật
chuẩn. Thống kê năng suất lúa ở 9 thửa ruộng tính được năng suất trung bình
là 61 tạ trẽn một héc ta và độ lệch tiêu chuẩn mẫu điều chỉnh là 1,6129 tạ.
a. Với mức ý nghĩa 0, 05 hãy kiểm định giả thuyết <
b. Tìm P- giá trị và kết luận.

121

Ho:

fi = 60

Hi :

/1 Ỷ 60


×