Tải bản đầy đủ (.pdf) (45 trang)

Bài toán kiểm định giả thuyết thống kê

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (694.27 KB, 45 trang )

Mục lục

MỤC LỤC

1

PHẦN MỞ ĐẦU

2

1 MỘT SỐ KIẾN THỨC CƠ SỞ

5

1.1

Một số phân phối xác suất của biến ngẫu nhiên . . . . . .

5

1.1.1

Phân phối chuẩn . . . . . . . . . . . . . . . . . . .

5

1.1.2

Phân phối nhị thức . . . . . . . . . . . . . . . . .

6



1.1.3

Phân phối Khi bình phương χ2 . . . . . . . . . . .

7

1.1.4

Phân phối Student . . . . . . . . . . . . . . . . . .

8

1.2

Mẫu ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . .

9

1.3

Các đại lượng thống kê . . . . . . . . . . . . . . . . . . . .

9

1.3.1

Trung bình mẫu . . . . . . . . . . . . . . . . . . .

9


1.3.2

Phương sai mẫu . . . . . . . . . . . . . . . . . . .

10

Một số định lý giới hạn theo phân phối . . . . . . . . . .

10

1.4

1


1.5

Quy luật phân phối xác suất của một số thống kê đặc trưng
mẫu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2 BÀI TOÁN KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
2.1

12

Những khái niệm về kiểm định giả thuyết thống kê . . . .

13


2.1.1

Giả thuyết thống kê . . . . . . . . . . . . . . . . .

13

2.1.2

Tiêu chuẩn kiểm định - Miền tiêu chuẩn kiểm định
giả thuyết thống kê . . . . . . . . . . . . . . . . . .

2.1.3

14

Các loại sai lầm trong việc kiểm định giả thuyết
thống kê . . . . . . . . . . . . . . . . . . . . . . . .

15

kiểm định một phía và kiểm định khác phía . . . .

16

Bài toán kiểm định giả thuyết thống kê . . . . . . . . . . .

17

2.2.1


Kiểm định giả thuyết thống kê về giá trị trung bình

17

2.2.2

Kiểm định giả thuyết thống kê về phương sai của

2.1.4
2.2

11

biến ngẫu nhiên phân phối chuẩn. . . . . . . . . . .
2.2.3

30

Kiểm định giả thuyết về xác suất p của biến ngẫu
nhiên phân phối theo quy luật 0 - 1. . . . . . . . .

37

KẾT LUẬN

44

TÀI LIỆU THAM KHẢO

45


2


PHẦN MỞ ĐẦU
Lý thuyết Xác suất và Thống kê ra đời từ thế kỷ XVII, nội dung chủ yếu
nghiên cứu về các hiện tượng ngẫu nhiên. Ngày nay, lý thuyết Xác suất và
Thống kê đã được đưa vào giảng dạy ở hầu hết các ngành đào tạo trong
các trường Đại học và Cao đẳng. Nó được ứng dụng rộng rãi trong các lĩnh
vực Khoa học Tự nhiên, Khoa học Xã hội, Y tế....., nhằm giải quyết các
bài toán thực tế trong cuộc sống. Một trong những công cụ để hổ trợ cho
việc giải quyết các bài toán thực tế là kiểm định giả thuyết thống kê.
Nội dung của bài toán kiểm định giả thuyết thống kê là dựa vào mẫu cụ
thể và các quy tắc hay thủ tục để quyết định bác bỏ hay chấp nhận giả
thuyết của tổng thể.
Lý thuyết kiểm định giả thuyết thống kê có có nhiều ứng dụng trong
việc giải quyết nhiều bài toán thực tế, giúp các nhà quản lý kiểm tra tính
đúng đắn của các quyết định về một vấn đề đặt ra nào đó trong cuộc sống.
Với mong muốn tìm ra ứng dụng của kiểm định giả thuyết thống kê
trong toán học và trong thực tế nên tôi chọn tôi đề tài " Bài toán kiểm
định giả thuyết thống kê và ứng dụng " để làm khóa luận tốt nghiệp.
Ngoài phần mở đầu, kết luận và tài liệu tham khảo, nội dung khóa luận
được chia thành hai chương:
Chương I: Một số kiến thức cơ sở.
Chương này trình bày lại một số kiến thức liên quan tới bài toán kiểm
định giả thuyết thống kê như một số phân phối xác suất của biến ngẫu

3



nhiên, định lý giới hạn theo phân phối, các đại lượng thống kê.
Chương II: Bài toán kiểm định giả thuyết thống kê.
Trong chương này trình bày những khái niệm về kiểm định giả thuyết
thống kê. Bài toán kiểm định giả thuyết thống kê về giá trị trung bình
trong trường hợp đã biết phương sai và chưa biết phương sai. Bài kiểm
định giả thuyết thống kê về phương sai của biến ngẫu nhiên phân phối
chuẩn. Bài toán kiểm định giả thuyết thống kê về xác suất p của biến ngẫu
nhiên phân phối theo quy luật 0 - 1.
Khóa luận có thể là tài liệu tham khảo cho những sinh viên chuyên ngành
toán và sinh viên các ngành kinh tế, kỷ thuật trong học phần Xác suất Thống kê.
Với bản thân tôi, khóa luận này giúp tôi tìm hiểu được nhiều hơn về bài
toán kiểm định giả thuyết thống kê và cách giải quyết các bài toán thực
tế bằng phương pháp kiểm định giả thuyết thống kê.

4


Chương 1

MỘT SỐ KIẾN THỨC CƠ SỞ

1.1

Một số phân phối xác suất của biến ngẫu nhiên

1.1.1

Phân phối chuẩn

Định nghĩa 1.1.1: Biến ngẫu nhiên liên tục X được gọi là tuân theo luật

phân phối chuẩn với hai tham số µ và σ 2 nếu X có hàm mật độ xác suất
f (x) được xác định bởi:
1
f (x) = √
σ 2π

−(x − µ)2
e 2σ 2
.

Kí hiệu: X ∼ N (µ, σ 2 ).
- Hàm phân phối xác suất của phân phối chuẩn có dạng:
x

F (x) =
−∞

1

σ 2π

−(x − µ)2
dt
e 2σ 2

- Các đặc trưng của biến ngẫu nhiên X có phân phối chuẩn X ∼ N (µ, σ 2 ).
Kỳ vọng: E(X) = µ.
Phương sai: D(X) = σ 2 .
5



- Trường hợp đặc biệt nếu biến ngẫu nhiên X có kì vọng µ = 0 và phương
sai σ = 1 thì X được gọi là có phân phối chuẩn tắc.
Kí hiệu: Z ∼ N (0, 1).
x

- Hàm phân phối xác suất của phân phối chuẩn tắc F(x) =
−∞

−t2
1
√ e 2 dt.


- Đồ thị của hàm phân phối chuẩn tắc:

1.1.2

Phân phối nhị thức

Định nghĩa 1.1.2: Ta tiến hành n phép thử một cách độc lập nhau. Giả
sử trong mỗi phép thử chỉ xảy ra hai trường hợp. Hoặc biến cố A xảy ra
với xác suất p hoặc biến cố A không xảy ra với xác suất q = 1 − p. Khi đó
xác suất để trong n phép thử độc lập, biến cố A xuất hiện k lần được tính
bằng công thức :
P (n, k, p) = Cnk pk (1 − p)n−k
Phép thử này được gọi là phép thử Bernoulli.
Tiến hành một dãy n phép thử Bernoulli với xác suất thành công ở mỗi
phép thử là p, (0 ≤ p ≤ 1). Giả sử X là số lần thành công trong n phép
thử đó thì X là biến ngẫu nhiên rời rạc với miền giá trị S = 1, 2, ...., n và

P[X = k] = Cnk pk (1 − p)n−k , k ∈ S.

6


Khi đó X được gọi là có phân phối nhị thức với các tham số n , p hay
nói gọn X có phân phôi B(n, p).
Bảng phân phối xác suất của biến ngẫu nhiên X theo quy luật nhị thức:

Kí hiệu: X ∼ B(n, p).
- Tham số đặc trưng của biến ngẫu nhiên X có phân phối nhị thức:
Kì vọng: EX = np.
Phương sai: DX = np(1 − p).

1.1.3

Phân phối Khi bình phương χ2

Định nghĩa 1.1.3: Biến ngẫu nhiên liên tục χ2 gọi là có phân phối Khi
bình phương với n bậc tự do nếu hàm mật độ xác suất của nó được xác
định bằng biểu thức sau:




0



x n

−1
1
f (x) =
2
2
e
x

n



n

 2 2 Γ( )
2
1

Trong đó Γ(x) =

;x ≤ 0
; x > 0.

tx−1 e−t dt là hàm Gamma. Nếu n là một số nguyên

0

thì Γ(n + 1) = n!
7



Kí hiệu: Z ∼ χ2n .
- Đồ thị hàm f (χ2 ) của phân phối Khi bình phương:

Đồ thị hàm phân phối Khi bình phương

1.1.4

Phân phối Student

Định nghĩa 1.1.4: Biến ngẫu nhiên liên tục T gọi là phân phối theo quy
luật Student với n bậc tự do nếu hàm mật độ xác suất của nó được xác
định bằng biểu thức sau :
f (t) =

n
Γ( )
2
Π(n − 1)(

n−1
)
2

[1 +

t2
].
n−1


Trong đó Γ(x) là hàm Gamma, n > 0, −∞ < t < +∞
- Đồ thị của phân phối Student.

8


1.2

Mẫu ngẫu nhiên

Định nghĩa 1.2.1: Để nghiên cứu đại lượng ngẫu nhiên X của một tổng
thể, ta quan sát ( cân, đo, đong, đếm ....) một cách độc lập n lần về X. Gọi
Xi (i = 1, n) là giá trị quan sát ở lần thứ i thì (Xi )i=1,n là các biến ngẫu
nhiên độc lập cùng phân phối với X. Mẫu X1 , X2 , ...., Xn được gọi là mẫu
ngẫu nhiên sinh ra từ X, n gọi là cỡ mẫu hay số lần quan sát.
Gọi xi là một kết quả cụ thể của Xi khi đó (x1 , x2 , ...., xn ) là mẫu cụ
thể mà mẫu ngẫu nhiên X1 , X2 , ...., Xn nhận được và được gọi là mẫu thực
nghiệm.

1.3

1.3.1

Các đại lượng thống kê

Trung bình mẫu

Giả sử (X1 , X2 , ...., Xn ) là mẫu ngẫu nhiên sinh ra từ X có EX = µ,
DX = σ 2 , trung bình mẫu kí hiệu là X được xác định bởi:
1

X=
n

n

Xi .
i=1

- Trung bình mẫu X có các đặc trưng E(X) = µ, D(X) =

σ2
.
n

- Trên mẫu cụ thể (x1 , x2 , ...., xn ) trung bình mẫu nhận giá trị x =

9

1 n
xi .
n i=1


1.3.2

Phương sai mẫu

Phương sai mẫu là trung bình của tổng bình phương độ lệch giữa giá trị
quan sát so với giá trị trung bình, kí hiệu: Sx2 .
Phương sai mẫu được xác định bởi:

Sx2

1
=
n

n

(Xi − X)2 .
i=1

Phương sai mẫu hiệu chỉnh kí hiệu là Sx2 , được xác định bởi:
Sx2

1
=
n−1

n

(Xi − X)2 .
i=1

Căn bậc hai phương sai mẫu gọi là độ lệch chuẩn mẫu, kí hiệu Sx .
Sx2 .

Sx =

Căn bậc hai phương sai mẫu hiệu chỉnh gọi là độ lêch chuẩn mẫu hiệu
chỉnh, kí hiệu Sx .

Sx =

Sx2 .

- Bằng các phép biến đổi, ta có được Sx2 =

1.4

n
Sx2 .
n−1

Một số định lý giới hạn theo phân phối

Định lý 1.4.1. (Xem 6)
Cho X1 , X2 , ...., Xn là các biến ngẫu nhiên độc lập có cùng phân phối với
trung bình µ và phương sai σ 2 , X1 + X2 + .... + Xn có phân phối chuẩn với
trung bình nµ và phương sai nσ 2 khi n đủ lớn. Khi đó,
σ2
X − µ√
Nếu X ∼ N (µ, ) thì Z =
n ∼ N (0, 1).
n
σ
10


Định lý 1.4.2. (Xem 6)
Giả sử ta tiến hành các phép thử độc lập, trong mỗi phép thử, sự kiện A
xuất hiện với xác suất p. Gọi m là số lần xuất hiện A trong n thí nghiệm.

Khi đó,

m
− p√
f − p√
n√
n= √
n
pq
pq

có phân phối tiệm cận chuẩn N(0,1) khi n → ∞.

1.5

Quy luật phân phối xác suất của một số thống kê đặc trưng
mẫu

Mệnh đề 1.5.1. (Xem 6)
Nếu X là biến ngẫu nhiên có phân phối chuẩn N (µ, σ 2 ) và (X1 , X2 , ...., Xn )
(n − 1)S 2
là mẫu ngẫu nhiên độc lập thì
∼ χ2n−1 .
2
σ
Định lý 1.5.2. (Xem 6)
Nếu (X1 , X2 , ..., Xn ) là mẫu ngẫu nhiên có phân phối chuẩn N (µ, σ 2 ) thì
X − µ√
T =
n có phân phối Student với (n - 1) bậc tự do.

S

11


Chương 2

BÀI TOÁN KIỂM ĐỊNH GIẢ
THUYẾT THỐNG KÊ
Việc thống kê và xử lý các số liệu thực nghiệm là một vấn đề rất quan
trọng. Nó không những giúp việc nghiên cứu có độ chính xác, độ tin cậy
cao mà nó còn giúp người nghiên cứu có cơ sở khẳng định giả thuyết mình
đưa ra là đúng hay sai. Như vậy, kiểm định giả thuyết thống kê là một
công cụ minh chứng cho tính đúng sai của các giả thuyết đưa ra. Trong
chương này ta xét các bài toán kiểm định giả thuyết thống kê về giá trị
trung bình trong trường hợp đã biết phương sai và chưa biết phương sai,
kiểm định giả thuyết thống kê về phương sai của biến ngẫu nhiên phân
phối chuẩn và kiểm định giả thuyết thống kê về xác suất p của biến ngẫu
nhiên phân phối theo quy luật 0 - 1.

12


2.1

Những khái niệm về kiểm định giả thuyết thống kê

2.1.1

Giả thuyết thống kê


Giả thuyết thống kê là giả thuyết về dạng phân phối xác suất F (x, θ) của
biến ngẫu nhiên X về các tham số đặc trưng θ hoặc về tính độc lập của
biến ngẫu nhiên X.
Giả thuyết thống kê đưa ra được kí hiệu là H0 và được gọi là giả thuyết
không.
Khi đưa ra một giả thuyết thống kê, người ta còn nghiên cứu các vấn đề
mâu thuẩn với nó, gọi là giả thuyết đối và kí hiệu là H1 .
Giả thuyết H0 và đối thuyết H1 tạo nên cặp giả thuyết thống kê.
Vì các giả thuyết thống kê đưa ra có thể đúng hoặc sai nên ta cần kiểm
định, tức là tìm ra kết luận về tính thừa nhận được hay không thừa nhận
được của giả thuyết đó. Việc kiểm định này dựa vào thông tin mẫu ngẫu
nhiên (X1 , X2 , ..., Xn ) nên được gọi là thống kê kiểm định.
Ví dụ:

13


2.1.2

Tiêu chuẩn kiểm định - Miền tiêu chuẩn kiểm định giả
thuyết thống kê

Xét bài toán kiểm định giả thuyết có giả thuyết H0 và đối thuyết H1 . Gọi
U là không gian các giá trị của mẫu ngẫu nhiên (X1 , X2 , ..., Xn ). Ta chia
U thành hai phần Wα và Wα sao cho Wα ∩ Wα = ∅ và Wα ∪ Wα = U.
Giả sử rằng H0 đúng từ mẫu ngẫu nhiên X = (X1 , X2 , ...., Xn ) chọn hàm
Z = h(X1 , X2 , ...., Xn ; θ0 ) sao cho với số α > 0 bé tùy ý thỏa mãn điều
kiện P (Z ∈ Wα ) = α. Sau đó ta chọn quyết định theo quy tắc:
+; Nếu Z ∈ Wα thì ta bác bỏ giả thuyết H0 và chấp nhận đối thuyết

H1 .
+; Nếu Z ∈ Wα thì ta chấp nhận giả thuyết H0 .
Trong đó Wα được gọi là miền tiêu chuẩn (hay miền bác bỏ) giả thuyết
H0 .
- Miền giá trị còn lại của Z được gọi là miền chấp nhận giả thuyết H0 , kí
hiệu là Wα .
- Đại lượng ngẫu nhiên Z = h(X1 , X2 , ...., Xn ; θ0 ) gọi là tiêu chuẩn kiểm
định giả thuyết H0 .
- Giá trị α được gọi là mức ý nghĩa của bài toán kiểm định.
- Điểm giới hạn phân chia miền bác bỏ và miền không bác bỏ gọi là giá trị
tới hạn.

14


2.1.3

Các loại sai lầm trong việc kiểm định giả thuyết thống kê

Nội dung của bài toán kiểm định là dựa vào mẫu quan sát để chọn một
trong hai quyết định: Chấp nhận giả thuyết H0 hay phải bác bỏ giả thuyết
H0 . Khi đưa ra quyết định chấp nhận hay bác bỏ giả thuyết H0 ta có thể
mắc phải các loại sai lầm sau:
Sai lầm loại I:
Là loại sai lầm mắc phải khi ta bác bỏ giả thuyết H0 , trong khi thực tế
giả thuyết H0 đúng.
Xác suất mắc phải sai lầm này là α và được kí hiệu P (Wα /H0 ) = α.
Sai lầm loại II:
Là loại sai lầm mắc phải khi ta chấp nhận giả thuyết H0 , trong khi thực
tế giả thuyết H0 sai.

Xác suất mắc phải sai lầm này là β (với β = 1 − α) và được kí hiệu
P (W α /H1 ) = β.
Quan hệ giữa việc kiểm định giả thuyết và các loại sai lầm có thể mô tả
ở bảng sau:

Người làm thống kê muốn hạn chế cả hai loại sai lầm này, nghĩa là mong

15


muốn chọn được miền tiêu chuẩn Wα sao cho có thể loại trừ khả năng
phạm cả hai sai lầm càng nhiều càng tốt. Song không thể cực tiểu đồng
thời cả hai loại sai lầm khi cỡ mẫu cố định, bởi vì hai xác suất trên liên hệ
với nhau bởi hệ thức: P (Wα /H0 ) + P (W α /H1 ) = 1.
Thông thường với giá trị α cho trước khá bé ta xác định miền tiêu chuẩn
Wα sao cho xác suất P (W α /H1 ) = β đạt cực tiểu hay P (Wα /H0 ) = α đạt
cực đại.

2.1.4

kiểm định một phía và kiểm định khác phía

Kiểm định một phía: Khi đối thuyết H1 có tính chất một phía thì việc
kiểm định được gọi là kiểm định 1 phía.
Với tham số θ ta có bài toán kiểm định:
H0 : θ ≤ θ0
H1 : θ > θ0
hoặc
H0 : θ ≥ θ0
H1 : θ < θ0 .

Kiểm định hai phía: Khi đối thuyết H1 có tính chất 2 phía thì việc kiểm
định được gọi là kiểm định 2 phía.
Với tham số θ ta có bài toán kiểm định:
H0 : θ = θ0
H1 : θ = θ0 .
16


2.2

2.2.1

Bài toán kiểm định giả thuyết thống kê

Kiểm định giả thuyết thống kê về giá trị trung bình

I. Trường hợp phương sai đã biết.
Giả sử biến ngẫu nhiên X có phân phối chuẩn N (µ, σ 2 ) với phương
sai mẫu σ 2 đã biết. Từ mẫu ngẫu nhiên (X1 , X2 , ..., Xn ) ta xây dựng
bài toán kiểm định cho giá trị trung bình µ trong các trường hợp sau:
1. Trường hợp giả thuyết H0 : µ = µ0 , đối thuyết H1 : µ = µ0
Xét thống kê kiểm định Z =

X − µ√
n.
σ

Giả sử H0 đúng tức là µ = µ0 ta có P (Wα /H0 ) = α.
Vì X có phân phối chuẩn nên theo định lý 1.4.1 ta có:
Z=


X − µ0 √
n ∼ N (0, 1).
σ

Với xác suất α cho trước ta tìm giá trị U ( α2 ) sao cho:
α
P (|Z| > U ( ))) = α.
2
Ta có miền tiêu chuẩn của bài toán kiểm định trên là:

Miền tiêu chuẩn kiểm định
17


α
Wα = {X1 , X2 , ..., Xn : |Z| > U ( )}.
2
α
W α = {X1 , X2 , ..., Xn : |Z| ≤ U ( )}.
2
Giá trị U ( α2 ) được xác định bằng việc tra bảng phân phối chuẩn N(0,1).
Tính giá trị thống kê Z =

X − µ0 √
n của bài toán kiểm định rồi tiến
σ

hành so sánh:
+, Nếu |Z| > U ( α2 ) thỏa mãn miền tiêu chuẩn:

Wα = {X1 , X2 , ..., Xn : |Z| > U ( α2 )} thì ta quyết định bác bỏ giả
thuyết H0 .
+, Nếu |Z| ≤ U ( α2 ) thỏa mãn miền tiêu chuẩn:
W α = {X1 , X2 , ..., Xn : |Z| ≤ U ( α2 )} thì ta quyết định chấp nhận giả
thuyết H0 .
Ví dụ: ( Xem 2)
Một máy khoan trong dây chuyền sản xuất dùng để khoan lổ trên các
bản thép. Khi máy khoan hoạt động đúng theo chức năng thiết kế
đường kính các lỗ khoan sẽ tuân theo phân phối chuẩn với số trung
bình là 2 inches và độ lệch chuẩn là 0,06 inches. Trong quá trình kiểm
tra định kỳ xem máy khoan có hoạt động đúng hay không, người ta
đo ngẫu nhiên các lỗ đã khoan. Giả sử độ lệch chuẩn không thay đổi.
Mẫu ngẫu nhiên gồm 9 lổ khoan cho ta trung bình là 1,95 inches. Với
mức ý nghĩa α = 0,05, hãy kiểm tra xem có đúng là đường kính trung
bình các lổ khoan là 2 inches ?
Giải::
Xét bài toán kiểm định giả thuyết H0 : µ = µ0 = 2,
18


đối thuyết H1 : µ = µ0 = 2.
Theo bài ra ta có: n = 9; trung bình mẫu X = 1,95; phương sai mẫu
σ = 0,06.
Thống kê Z =

|X − µ0 | √
|1, 95 − 2| √
n=
9 = 2,5.
σ

0, 06

Với mức ý nghĩa α = 0,05 tra bảng phân phối chuẩn ta tìm được:
U ( α2 ) = 1,96.
Ta có : |Z|= 2,5 > U ( α2 ) = 1, 96 thỏa mãn miền tiêu chuẩn:
α
Wα = {X1 , X2 , ..., Xn : |Z| > U ( )}.
2
Vậy ta bác bỏ giả thuyết H0 ở mức ý nghĩa α = 0, 05 tức là máy hoạt
động không đúng chức năng thiết kế.
2. Trường hợp giả thuyết H0 : µ = µ0 , đối thuyết H1 : µ > µ0 .
Xét thống kê kiểm định Z =

X − µ√
n.
σ

Giả sử H0 đúng tức là µ = µ0 ta có P (Wα /H0 ) = α.
Vì X có phân phối chuẩn nên theo định lý 1.4.1 ta có:

Z=

X − µ0 √
n ∼ N (0, 1).
σ

Với xác suất α cho trước ta tìm giá trị U (α) sao cho:
P (Z > U (α)) = α.
Ta có miền tiêu chuẩn của bài toán kiểm định trên là:
Wα = {X1 , X2 , ..., Xn : Z > U (α)}.

W α = {X1 , X2 , ..., Xn : Z ≤ U (α)}.
19


xoa

Miền tiêu chuẩn kiểm định

Giá trị U (α) được xác định bằng việc tra bảng phân phối chuẩn N(0,1).
Tính giá trị thống kê Z =

X − µ0 √
n của bài toán kiểm định rồi tiến
σ

hành so sánh:
+, Nếu Z > U (α) thỏa mãn miền tiêu chuẩn:
Wα = {X1 , X2 , ..., Xn : Z > U (α)} thì ta quyết định bác bỏ giả thuyết
H0 .
+, Nếu Z ≤ U (α) thỏa mãn miền tiêu chuẩn:
W α = {X1 , X2 , ..., Xn : Z ≤ U (α)} thì ta quyết định chấp nhận giả
thuyết H0 .
Ví dụ: (Xem 3)
Một công nhân của một công ty cho biết lương trung bình của một
công nhân ở một xí nghiệp họ làm là 3,8 triệu/tháng. Chọn ngẫu
nhiên 36 công nhân của xí nghiệp này thấy lương trung bình là 3,9
triệu/ tháng. Với độ lệch chuẩn là 0,4 và mức ý nghĩa α = 0,05. Hãy
xét xem công nhân này nói có đúng không ?
Giải:
Gọi µ là lương trung bình thực sự hàng tháng của công nhân.

20


Xét bài toán kiểm định giả thuyết H0 : µ = µ0 = 3,8
đối thuyết H1 : µ > µ0 =3,8.
Theo bài ra ta có: n = 36; trung bình mẫu X = 3, 9; phương sai mẫu
σ = 0,4.
Mức ý nghĩa α = 0,05.



(X − µ0 ) n
(3, 9 − 3, 8) 36
Xét thống kê : Z =
=
= 2,25.
σ
0, 4

Tra bảng phân phối chuẩn ta tìm được : U(α) = U(0,05) = 1,65.
Ta có: Z = 2,25 > U (α) = 1,65 thỏa mãn miền tiêu chuẩn:
Wα = {X1 , X2 , ..., Xn : Z > U (α)}.
Vậy ta bác bỏ giả thuyết H0 và chấp nhận đối thiết H1 . Tức là lời nói
của công nhân trong công ty này là không chính xác.
3. Trường hợp giả thuyết H0 : µ = µ0 , đối thuyết H1 : µ < µ0 .
Xét thống kê kiểm định Z =

X − µ√
n.
σ


Giả sử H0 đúng tức là µ = µ0 ta có P (Wα /H0 ) = α.
Vì X có phân phối chuẩn nên theo định lý 1.4.1 ta có:
Z=

X − µ0 √
n ∼ N (0, 1).
σ

Với xác suất α cho trước ta tìm giá trị U (α) sao cho:
P (Z < −U (α)) = α.
Ta có miền tiêu chuẩn của bài toán kiểm định trên là:

21


Wα = {X1 , X2 , ..., Xn : Z < −U (α)}.
W α = {X1 , X2 , ..., Xn : Z ≥ −U (α)}.

Miền tiêu chuẩn kiểm định

Giá trị U (α) được xác định bằng cách tra bảng phân phối chuẩn
N (0, 1).
Tính giá trị thống kê Z =

X − µ0 √
n của bài toán kiểm định rồi tiến
σ

hành so sánh:

+, Nếu Z < −U (α) tức là thỏa mãn miền tiêu chuẩn:
Wα = {X1 , X2 , ..., Xn : Z < −U (α)} thì ta quyết định bác bỏ giả
thuyết H0 .
+, Nếu Z ≥ −U (α) tức là thỏa mãn miền tiêu chuẩn:
W α = {X1 , X2 , ..., Xn : Z ≥ −U (α)} thì ta quyết định chấp nhận giả
thuyết H0 .
Ví dụ: (Xem 7)
Trong một nhà máy bánh kẹo, một máy tự động sản xuất ra các
thanh socola với trọng lượng quy định là 250g. Biết rằng trọng lượng
các thanh socola được sản xuất ra có phân phối chuẩn N (µ, 52 ). Trong
22


một ngày bộ phận kiểm tra kỉ thuật chọn một mẫu ngẫu nhiên gồm
16 thanh socola và tính trọng lượng trung bình của chúng được 244g.
Có thể khẳng định máy tự động sản xuất ra các thanh socola có trọng
lượng nhỏ hơn quy định hay không ? Với múc ý nghĩa α = 0, 05 hãy
kiểm định giả thuyết thống kê tương ứng.
Giải:
Ta xét bài toán kiểm định giả thuyết H0 : µ = µ0 = 250,
đối thuyết H1 : µ < µ0 = 250.
Theo bài ra ta có: µ0 = 250g, n = 16; trung bình mẫu X = 244g;
phương sai mẫu σ 2 = 25.
Thống kê Z =

X − µ0 √
244 − 250 √

n=
16 = -4,8.

σ
25

Với mức ý nghĩa α = 0,05 tra bảng phân phối chuẩn ta có:
U (α) = U (0, 05) = 1,65 ⇒ −U (α) = -1,65.
Ta có: Z = -4,8 < −U (α) = -1,65 thỏa mãn miền tiêu chuẩn :
Wα = {X1 , X2 , ..., Xn : Z < −U (α)}.
Vậy ta bác bỏ giả thuyết H0 ở mức ý nghĩa α = 0,05.
Nghĩa là máy tự động sản xuất socola có trọng lượng nhỏ hơn quy
định.
II. Trường hợp phương sai chưa biết.
Giả sử biến ngẫu nhiên X có phân phối chuẩn N (µ, σ 2 ), với giá trị
trung bình µ đã biết và phương sai σ 2 chưa biết. Từ mẫu ngẫu nhiên
(X1 , X2 , ..., Xn ) ta xây dựng các bài toán kiểm định sau :
23


1. Trường hợp giả thuyết H0 : µ = µ0 , đối thuyết H1 : µ = µ0 .
Xét thống kê Z =

X − µ√
n.
S

Giả sử H0 đúng tức là µ = µ0 ta có P (Wα /H0 ) = α.
Vì X có phân phối chuẩn nên theo định lý 1.5.2 ta có Z =

X − µ0 √
n
S


sẽ có phân phối Student với (n - 1) bậc tư do.
Với xác suất α cho trước ta tìm giá trị U ( α2 ,n−1 ) sao cho:
P (|Z| > U ( α2 ,n−1 )) = α.
Ta có miền tiêu chuẩn của bài toán kiểm định trên là:
Wα = {X1 , X2 , ..., Xn : |Z| > U ( α2 ,n−1 ).
W α = {X1 , X2 , ..., Xn : |Z| ≤ U ( α2 ,n−1 )}.

Miền tiêu chuẩn kiểm định

Giá trị U ( α2 ,n−1 ) được xác định bằng cách tra bảng phân phối chuẩn.
Tính giá trị thống kê Z =

X − µ0 √
n của bài toán kiểm định rồi tiến
S

hành so sánh:
+, Nếu |Z| > U ( α2 ,n−1 ) tức là thỏa mãn miền tiêu chuẩn:
Wα = {X1 , X2 , ..., Xn : |Z| > U ( α2 ,n−1 )} thì ta quyết định bác bỏ giả
thuyết H0 .
24


+,Nếu |Z| ≤ U ( α2 ,n−1 ) tức là thỏa mãn miền tiêu chuẩn:
W α = {X1 , X2 , ..., Xn : |Z| ≤ U ( α2 ,n−1 )} thì ta quyết định chấp nhận
giả thuyết H0 .
Ví dụ: (Xem 7)
Nhà quản lý các cửa hàng bán lẻ nhận thấy rằng số lượng hàng bán
ra trung bình trong tháng 12 cao hơn 20% so với tháng 11. Theo dõi

sổ sách của sáu cửa hàng (được chọn một cách ngẩu nhiên) nhà quản
lý thấy phần trăm độ tăng trung bình của lượng hàng bán ra tại 6
cửa hàng trong tháng 12 như sau:
19,2%

18,4%

19,8%

20,2%

20,4%

19,0%.

Giả sử phần trăm độ tăng trung bình của lượng hàng bán ra tại tất
cả các của hàng trong hệ thống bán lẻ tuân theo phân phối chuẩn.
Hãy kiểm định giả thuyết biết rằng phần trăm độ tăng trung bình của
lượng hàng bán ra trong tháng 12 là 20% so với tháng 11 với mức ý
nghĩa α = 10%.
Giải:
Ta xét bài toán kiểm định giả thuyết H0 : µ = µ0 = 20,
đối thuyết H1 : µ = µ0 = 20.
Theo bài ra ta có: Trung bình mẫu X =
Phương sai mẫu hiệu chỉnh :
Độ lệch chuẩn SX =
Thống kê Z =

2 =
SX


Sx2


1 n
Xi =19,5.
n i=1

n
1
=
(Xi − X)2 = 0,588.
n − 1 i=1

0, 588 = 0, 767.

|X − µ0 | √
|19, 5 − 20| √
n=
6 = 1,597.
S
0, 767
25


×