Kiểm định giả thuyết thống kê
Hoàng Văn Hà
Ngày 10 tháng 11 năm 2012
Bài toán kiểm định giả thuyết thống kê. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Định nghĩa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
Giả thuyết không và đối thuyết . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
Cách đặt giả thuyết . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Miền bác bỏ - Tiêu chuẩn kiểm định . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
Sai lầm loại I và loại II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
Sai lầm loại I và loại II - Nhận xét . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
p - giá trị (p - value) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
Kiểm định giả thuyết cho trường hợp một mẫu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Kiểm định giả thuyết cho kỳ vọngTH biết σ
2
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
Kiểm định giả thuyết cho kỳ vọngTH không biết σ
2
, mẫu nhỏ . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
Kiểm định giả thuyết cho kỳ vọngTH không biết σ
2
, mẫu lớn . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
Kiểm định giả thuyết cho kỳ vọngTH không biết σ
2
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
Kiểm định giả thuyết cho kỳ vọngTH không biết σ
2
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
Kiểm định giả thuyết cho kỳ vọngTH không biết σ
2
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
Kiểm định giả thuyết cho tỷ lệ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
Kiểm định giả thuyết cho tỷ lệ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
So sánh hai kỳ vọng, trường hợp biết phương sai . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
So sánh hai kỳ vọng. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
So sánh hai kỳ vọng, trường hợp không biết phương sai, mẫu lớn . . . . . . . . . . . . . . . . . . . . . . . . . 52
So sánh hai kỳ vọng, trường hợp không biết phương sai, mẫu nhỏ . . . . . . . . . . . . . . . . . . . . . . . . 55
So sánh hai phương s ai. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
So sánh hai kỳ vọng, mẫu nhỏ, trường hợp σ
2
1
= σ
2
2
= σ
2
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
So sánh hai kỳ vọng, mẫu nhỏ, trường hợp σ
2
1
= σ
2
2
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
So sánh hai kỳ vọng, trường hợp không biết phương sai . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
So sánh hai tỷ lệ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
So sánh hai tỷ lệ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
So sánh hai mẫu không độc lập (paired t - test). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
Kiểm định giả thuyết về phân phối. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
Kiểm định giả thuyết về phân phối. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
Kiểm định giả thuyết về tính độc lập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
Kiểm định giả thuyết về tính độc lập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
1
Bài toán kiểm định giả thuyết thống kê 2
Bài toán kiểm định giả thuyết thống kê
■ Định nghĩa
■ Giả thuyết không và đối thuyết
■ Cách đặt giả thuyết
■ Miền bác bỏ - Tiêu chuẩn kiểm định
■ Sai lầm loại I và loại II
■ p - giá t rị
3
Định nghĩa
Định nghĩa 1.
Giả thuyết thống kê là những phát biểu về các tham số, quy luật phân phối, hoặc tính
độc lập của các đại lượng ngẫu nhiên. Việc tìm ra kết luậ n để bác bỏ hay chấp nhận một giả thuyết
gọi là kiểm định giả thuyết thống kê.
Ví dụ 1. Gi ám đốc một nhà máy sản xuất bo mạch chủ máy vi tính tuyên bố rằng tuổi thọ trung
bình của một bo mạch chủ do nhà máy sản xuất ra là 5 năm; đây là một giả thuyết về kỳ vọng của
biến ngẫu nhiên X = tuổi thọ của một bo mạ ch chủ. Để đưa ra kết luận là chấp nhận hay bác bỏ giả
thuyết trên, ta cần dựa vào mẫu điều tra và quy tắc kiểm định thống kê.
4
Giả thuyết không và đối thuyết
Định nghĩa 2. Trong bài toán kiểm định giả thuyết, giả thuyết cần được kiểm định gọi là
Giả thuyết
không (null hyp othesis)
, ký hiệu là H
0
. Mệnh đề đối lậ p với H
0
gọi là đối thuyết (al ternative
hypothesis)
, ký hiệu là H
1
.
Xét bài toán kiểm định tham số, giả sử ta quan trắc mẫu ngẫu nhiên (X
1
, . . . ,X
n
) từ biến ngẫu
nhiên X có hàm mật độ xác suất f (x; θ) phụ thuộc vào tham số θ. Gọi Θ là không gian t ham số, và
Θ
0
và Θ
c
0
là hai tập con rời nhau của Θ sao cho Θ
0
∪ Θ
c
0
= Θ. Giả thuyết (giả thuyết không) và đối
thuyết của bài toán có dạng như sau
H
0
: θ ∈ Θ
0
H
1
: θ ∈ Θ
c
0
(1)
5
2
Giả thuyết không và đối thuyết
Ví dụ 2.
1. Gọi µ là độ thay đổi trung bình trong huyết áp của một bệnh nhân sau khi dùng thuốc; bác sĩ điều
trị cần quan tâm đến giả thuyết sau
H
0
: µ = 0 Không có ảnh hưởng của thuốc lên huyết áp của bệnh nhân
H
1
: µ = 0 Có ảnh hưởng của thuốc lên huyết áp của bệnh nhân
2. Một khách hàng quan tâm đến tỷ lệ sản phẩm kém chất lượng trong một lô hàng mua của một
nhà cung cấp. G iả sử tỷ lệ sản phấm kém tối đa được phép là 5%. Khách hàng cần quan tâm đến giả
thuyết sau
H
0
: p ≥ 0.05 Tỷ lệ sản phẩm kém cao hơn mức cho phép
H
1
: p < 0.05 Tỷ lệ sản phẩm kém ở mức chấp nhận được
6
Cách đặt giả thuyết
1. Giả thuyết được đặt ra với ý đồ bác bỏ nó, nghĩa lã giả thuyết đặt ra ngược lại với điều ta muốn
chứng minh, muốn thuyết phục.
2. Giả thuyết được đặt ra sao cho khi chấp nhận hay bá c bỏ nó sẽ có tác dụng trả lời bài toán thực
tế đặt ra.
3. Giả thuyết được đặt ra sao cho nếu nó đúng thì ta sẽ xác định được quy luậ t phân phối xác suất
của đại lượng ngẫu nhiên được chọn làm tiểu chuẩn kiểm định.
4. Khi đặt giả thuyết, ta thường so sánh cái chưa biết với cái đã biết. Cái chưa biết là điều mà ta
cần kiểm định, kiểm tra , làm rõ. "Cái đã biết" là những thông tin trong quá khứ, các định mức
kinh tế, kỹ thuật.
5. Giả thuyết đặt ra thường mang ý nghĩa: "không khác nhau" hoặc "khác nhau không có ý nghĩa"
hoặc "bằng nhau".
7
3
Cách đặt giả thuyết
Tổng quát, một bài toán kiểm định giả thuyết cho tham số θ sẽ có một trong 3 dạng dưới đây (θ
0
là
giá trị kiểm định đã biết):
Hai phía:
H
0
: θ = θ
0
H
1
: θ = θ
0
Một phía bên trái:
H
0
: θ ≥ θ
0
H
1
: θ < θ
0
Một phía bên phải:
H
0
: θ ≤ θ
0
H
1
: θ > θ
0
8
Miền bác bỏ - Tiêu chuẩn kiểm định
Định nghĩa 3. Xét bài toán kiểm định giả thuyết có giả thuyết H
0
và đối thuyết H
1
. Giả sử rằng H
0
đúng, từ mẫu ngẫu nhiên X = (X
1
, . . . ,X
n
) chọn hàm Z = h(X
1
, . . . ,X
n
; θ
0
) sao cho với số α > 0
bé tùy ý ta có thể tìm được tập hợp W
α
thỏa điều kiện
P (Z ∈ W
α
) = α (2)
Tập hợp W
α
gọi là
miền bác bỏ giả thuyết H
0
và phần bù W
c
α
gọi là
miền chấp nhận giả thuyết H
0
.
Đại lượng ngẫu nhiên Z = h(X
1
, . . . , X
n
; θ
0
) gọi là
tiêu chuẩn kiểm định giả thuyết H
0
. Giá trị α gọi
là
mức ý nghĩa của bài toán kiểm định.
9
Miền bác bỏ - Tiêu chuẩn kiểm định
Thực hiện quan trắc dựa trên mẫu ngẫu nhiên (X
1
, . . . ,X
n
) ta thu được mẫu thực nghiệm
(x
1
, . . . , x
n
). Từ mẫu thực nghiệm này, ta tính được giá trị của Z là z = h(x
1
, . . . ,x
n
; θ
0
).
■ Nếu z ∈ W
α
thì ta bác bỏ giả thuyết H
0
.
■ Nếu z ∈ W
c
α
thì ta kết luận chưa đủ cơ sở để bác bỏ H
0
.
10
4
Sai lầm loại I và loại II
Trong bài toán kiểm định giả thuyết thống kê, ta có thể mắc phải các sai lầm sau
a.
Sai lầm loại I: là sai lầm mắc phải khi ta bác bỏ H
0
trong khi thực tế giả thuyết H
0
đúng. Sai
lầm loại I ký hiệu là α, chính là mức ý nghĩa của kiểm định.
α = P (W
α
|H
0
) (3)
b.
Sai lầm loại II: là sai lầm mắc phải khi ta chấp nhận giả thuyết H
0
trong khi thực tế H
0
sai. Sai
lầm loại II ký hiệu là β.
β = P (W
c
α
|H
1
) (4)
11
Sai lầm loại I và loại II
❳
❳
❳
❳
❳
❳
❳
❳
❳
❳
❳
❳
Quyết định
Thực tế
H
0
đúng H
0
sai
Không bác bỏ H
0
Không có sai lầm Sai lầm loại II
(1 − α) β
Bác bỏ H
0
Sai lầm loại I Không có sai lầm
α (1 − β)
12
Sai lầm loại I và loại II
Ví dụ 3. Khảo sát t ốc độ cháy của một loại nhiên liệu rắn dùng để đẩy tên lửa ra khỏi giàn phóng.
Giả sử biến ngẫu nhiên X = tốc độ cháy của nhiên liệu (cm/s) có phân phối chuẩn với kỳ vọng µ và
độ lệch chuẩn σ = 2.5.
Ta cần kiểm định giả thuyết
H
0
: µ = 50
H
1
: µ = 50
Giả sử bác bỏ H
0
khi: ¯x < 48.5 hoặc ¯x > 51.5. Các giá trị 48.5 và 51.5 gọi là giá trị tới hạn (critical
value). Giả sử khảo sát mẫu ngẫu nhiên cỡ n = 10, ta tìm xác suất sai lầm loại I.
α = P(Bác bỏ H
0
khi H
0
đúng)
13
5
Sai lầm loại I và loại II
Tức là,
α = P(
¯
X < 48.5|µ = 50) + P(
¯
X > 51.5|µ = 50)
= P
¯
X − 50
2.5/
√
10
<
48.5 − 50
2.5/
√
10
+ P
¯
X −50
2.5/
√
10
<
51.5 − 50
2.5/
√
10
= P(Z < −1.90) + P(Z > 1.90) = 0.0287 + 0.0287 = 0.0574
nghĩa là có 5.74% số mẫu ngẫu nhiên khảo sát được sẽ dẫn đến kết luận bác b ỏ giả thuyết
H
0
: µ = 50 (cm/s) khi tốc độ cháy trung bình thực sự là 50 (cm/s).
Ta có thể giả m sai lầm α bằng cách mở rộng miền chấp nhận. G iả sử với cỡ mẫu n = 10, miền chấp
nhận là 48 ≤ ¯x ≤ 52, khi đó giá trị của α là
α = P
Z <
48 − 50
2.5/
√
10
+ P
Z >
52 − 50
2.5/
√
10
= 0.0057 + 0.0057 = 0.0114
14
Sai lầm loại I và loại II
Cách thứ hai để giảm α là tăng cỡ mẫu khảo sát, giả sử cỡ mẫu n = 16, ta có
σ/
√
n = 2.5/
√
16 = 0.625, với miền bác bỏ là ¯x < 48.5 hoặc ¯x > 51.5, ta có
α = P(
¯
X < 48.5|µ = 50) + P(
¯
X > 51.5|µ = 50)
= P
Z <
48.5 − 50
0.625
+ P
Z >
51.5
0.625
= 0.0082 + 0.0082 = 0.0164
Xác suất sai lầm loại I I β được tính như sau
β = P(Không bác bỏ H
0
khi H
0
sai)
Để tính β, ta cần chỉ ra một giá trị cụ thể cho tham số trong đối thuyết H
1
.
15
6
Sai lầm loại I và loại II
Giả sử với cỡ mẫu n = 10, miền chấp nhận của giả thuyết H
0
là 48.5 ≤
¯
X ≤ 51.5 trong khi giá trị
thực sự của µ = 52. Sai lầm β cho bởi
β = P(48.5 ≤
¯
X ≤ 51.5|µ = 52)
= P
48.5 − 52
2.5/
√
10
≤
¯
X −52
2.5/
√
10
≤
51.5 − 52
2.5/
√
10
= P(−4.43 ≤ Z ≤ −0.63) = P(Z ≤ −0.63) − P(Z ≤ −4.43)
= 0.2643 − 0.0000 = 0.2643
Giả sử giá trị thực sự µ = 50.5, khi đó
β = P(48.5 ≤
¯
X ≤ 51.5|µ = 50.5)
= P
48.5 − 50.5
2.5/
√
10
≤
¯
X − 50.5
2.5/
√
10
≤
51.5 − 50.5
2.5/
√
10
= P(−2.53 ≤ Z ≤ 1.27) = 0.8980 − 0.0057 = 0.8923
16
Sai lầm loại I và loại II
Tương tự α, tăng cỡ mẫu sẽ làm giảm sai lầm β, với cỡ mẫu n = 16 và miền chấp nhận là
48 <
¯
X < 52, ta tính được β = 0.229.
Bảng
1 tổng kết sai lầm lầm loại I và loại II với miền chấp nhận và cỡ mẫu khác nhau
Miền chấp nhận n α β với µ = 52 β với µ = 50.5
48.5 < ¯x < 51.5 10 0.0574 0.2643 0.8923
48 < ¯x < 52 10 0.0114 0.5000 0.9705
48.5 < ¯x < 51.5 16 0.0164 0.2119 0.9445
48 < ¯x < 52 16 0.0014 0.5000 0.9918
Bảng 1: Sai lầm loại I và loại II
17
Sai lầm loại I và loại II - Nhận xét
1. Ta có thể giảm kích t hước của miền bác bỏ (tương ứng tăng kích thước miền chấp nhận), và
xác suất sai lầm loại I α bằng cách chọn những điểm tới hạn thích hợp.
2. Xác suất sai lầm loại I và loại II có liên quan với nhau. Với một cỡ mẫu cố định, việc giảm sai
lầm loại này sẽ làm tăng sai lầm loại kia.
3. Cố định các điểm tới hạn, tăng cỡ mẫu n sẽ làm giảm xác suất sai lầm loại I α và loại II β.
4. Nếu H
0
sai, sai lầm β sẽ tăng khi giá trị thực của tham số tiến gần đến giá trị được phát bi ểu
trong giả thuyết H
0
.
18
7
p - giá trị (p - value)
Định nghĩa 4. Tương ứng với một giá trị t hống kê kiểm định tính t rên một mẫu các giá trị quan trắc
xác định, p - giá trị là mức ý nghĩa nhỏ nhất dùng để bác bỏ giả thuyết H
0
.
Dựa vào đối thuyết H
1
, các bước tính p-giá trị như sau:
1. Xác định thống kê kiểm định: T S. Tính giá trị thống kê kiểm định dựa trên mẫu (x
1
, . . . ,x
n
),
giả sử bằng a.
2. p-giá t rị cho bởi
p =
P(|T S| > |a||H
0
), kiểm định hai phía
P(T S < a|H
0
), kiểm định một phía - bên trái
P(T S > a|H
0
), kiểm định một phía - bên phải
(5)
Kết luận: Bác bỏ giả thuyết H
0
nếu p-giá trị ≤ α.
19
Kiểm định giả thuyết cho trường hợp một mẫ u 20
Kiểm định giả thuyết cho trường hợp một mẫu
■ Kiểm định giả thuyết cho kỳ vọng
◆ Trường hợp biết phương sai,
◆ Trường hợp không biết phương sai, mẫu nhỏ,
◆ Trường hợp không biết phương sai, mẫu lớn.
■ Kiểm định giả thuyết cho tỷ lệ
21
8
Kiểm định giả thuyết cho kỳ vọng
TH biết σ
2
• Các giả định:
■ Mẫu ngẫu nhiên X
1
, . . . ,X
n
đượ c chọn t ừ tổng thể có phân phối chuẩn N(µ, σ
2
) với kỳ vọng µ
chưa biết.
■ Phương sai σ
2
đã biết.
■ Cho trước giá trị µ
0
, cần so sánh kỳ vọng µ với µ
0
.
• Bài toán kiểm định có 3 trường hợp:
(a)
H
0
: µ = µ
0
H
1
: µ = µ
0
(b)
H
0
: µ = µ
0
H
1
: µ < µ
0
(c)
H
0
: µ = µ
0
H
1
: µ > µ
0
với mức ý nghĩa α cho trước.
22
Kiểm định giả thuyết cho kỳ vọng
TH biết σ
2
Các bước kiểm định
1. Phát biểu giả thuyết không và đối thuyết
2. Xác định mức ý nghĩa α
3. Lấy mẫu ngẫu nhiên cỡ n: X
1
, . . . , X
n
và tính thống kê kiểm định
Z
0
=
¯
X −µ
0
σ/
√
n
(6)
4. Xác định miền bác bỏ W
α
: bảng
2
23
9
Kiểm định giả thuyết cho kỳ vọng
TH biết σ
2
Giả thuyết Miền bác bỏ
H
0
: µ = µ
0
W
α
=
z
0
: |z
0
| > z
1−α/2
H
1
: µ = µ
0
H
0
: µ = µ
0
W
α
=
z
0
: z
0
< −z
1−α
H
1
: µ < µ
0
H
0
: µ = µ
0
W
α
=
z
0
: z
0
> z
1−α
H
1
: µ > µ
0
Bảng 2: Miền bác bỏ với đối thuyết tương ứng
5. Kết luậ n: Bác bỏ H
0
/ Chưa đủ cơ sở để bác bỏ H
0
.
24
Kiểm định giả thuyết cho kỳ vọng
TH biết σ
2
• Sử dụng p-giá trị (p - value): tính p-giá trị dựa theo đối thuyết và kết luận bác bỏ H
0
khi p -giá
trị ≤ α, với mức ý nghĩa α cho trước. Công thức tính p - giá trị theo các trường hợp x em ở bảng
3.
Giả thuyết p - giá trị
H
0
: µ = µ
0
p = 2 [1 − Φ(|z
0
|)]
H
1
: µ = µ
0
H
0
: µ = µ
0
p = Φ(z
0
)
H
1
: µ < µ
0
H
0
: µ = µ
0
p = 1 − Φ(z
0
)
H
1
: µ > µ
0
Bảng 3: p-giá trị với đối thuyết tương ứng
25
10
Kiểm định giả thuyết cho kỳ vọng
TH biết σ
2
Ví dụ 4 (Kiểm định 2 phía). Dây chuyền sản xuất kem đánh răng P/S được thiết kế để đóng hộp
những tuýt kem có trọng lượng trung bình là 6 oz (1 oz = 28g). Một mẫu gồm 30 tuýt kem được
chọn ngẫu nhiên để kiểm tra định kỳ. Bộ phận đi ều khiển dây chuyền phải đảm bảo để trọng lượng
trung bình mỗi tuýt kem là 6 oz; nếu nhiều hơn hoặc ít hơn, dây chuyền phải đượ c điều chỉnh lại.
Giả sử trung bình mẫu của 30 tuýt kem là 6.1 oz và độ lệch tiêu chuẩn của tổng thể σ = 0.2 oz .
Thực hiện kiểm định giả thuyết với mức ý nghĩa 3% để xác định xem dây chuyền sản xuất có vận
hành tốt hay không?
26
Kiểm định giả thuyết cho kỳ vọng
TH biết σ
2
Gọi X là trọng lượng của một tuýt kem đánh răng, giả sử X ∼ N(µ, 0.2
2
). Các bước kiểm định như
sau:
1. Phát biểu giả thuyết:
H
0
: µ = 6
H
1
: µ = 6
2. Xác định mức ý nghĩa: α = 0.03
3. Tính giá trị thống kê kiểm định
z
0
=
¯x − µ
0
σ/
√
n
=
6.1 − 6.0
0.2/
√
30
= 2.74
4. Xác định miền bác bỏ: Bác bỏ H
0
khi |z
0
| > z
1−α/2
27
11
Kiểm định giả thuyết cho kỳ vọng
TH biết σ
2
α = 3% nên z
1−α/2
= z
0.985
= 2.17. Vậy bác bỏ H
0
nếu
z
0
< −2.17 hoặc z
0
> 2.17
5. Kết luậ n: do z
0
= 2.74 > 2.17 nên bác bỏ H
0
. Ta kết luận với 97% độ tin cậy rằ ng trọng lượng
trung bình mỗi tuýt kem không bằng 6.
• Sử dụng p - giá trị:
4a. Tính p-giá trị, bài toán kiểm định ha i phía
p = 2[1 −Φ(|z
0
|)] = 2[1 − Φ(2.74)] = 2[1 −0.9969] = 0.0062
5a. Kết luận: với α = 0.03, ta có p = 0.0062 < 0.03 nên bác bỏ H
0
. Ta kết luận với 97% độ tin cậy
rằng trọng lượng trung bình mỗi tuý t kem không bằng 6.
28
Kiểm định giả thuyết cho kỳ vọng
TH biết σ
2
Ví dụ 5 (Kiểm định một phía). Metro EMS: Một bệnh viện tại trung tâm thành phố cung cấp dịch
vụ cấp cứu tại nhà. Với khoảng 20 xe cấp cứu, mục tiêu của trung tâm là cung cấp dịch vụ cấp cứu
trong khoảng thời gian trung bình là 12 phút sau khi nhận được điện thoại yêu cầu. Một mẫu ngẫu
nhiên gồm thời gian đáp ứng khi có yêu cầu của 40 ca cấp cứu được chọn. Trung bình mẫu là 13.25
phút. Biết rằng độ lệch tiêu chuẩn của tổng thể l à σ = 3.2 phút. Giám đốc EMS muốn thực hiện một
kiểm định, với mức ý nghĩa 5%, để xác định xem liệu thời gian một ca cấp cứu có bé hơn hoặc bằng
12 phút hay không?
Các bước kiểm định:
1. Phát biểu giả thuyết
H
0
: µ = 12: Thời gian đáp ứng của dịch vụ cấp cứu đạt yêu cầu, không cần phải t hay đổi.
H
1
: µ > 12: Thời gian đáp ứng của dịch vụ không đạt yêu cầu, cần t hay đổi.
29
12
Kiểm định giả thuyết cho kỳ vọng
TH biết σ
2
2. Xác định mức ý nghĩa: α = 0.05
3. Tính giá trị thống kê kiểm định
z
0
=
¯x − 12
σ/
√
n
=
13.25 − 12
3.2/
√
40
= 2.47
4. Xác định miền bác bỏ: bác bỏ H
0
nếu z
0
> z
1−α
= z
0.95
= 1.645
5. Kết luậ n: z
0
= 2.47 > 1.645 nên bác bỏ H
0
. Ta kết luận rằng với 95% độ tin cậy, Mertro EMS
không đáp ứng được mục tiêu thời gian phục vụ khách hàng từ 12 phút trở xuống.
30
Kiểm định giả thuyết cho kỳ vọng
TH biết σ
2
• Sử dụng p - giá trị:
4a. Tính p-giá trị, bài toán kiểm định một phía - bên phải
p = 1 − Φ(z
0
) = 1 − Φ(2.47) = 1 − 0.9932 = 0.0068
5a. Kết luận: với α = 0.05, ta có p = 0.0068 < 0.05 nên bác bỏ H
0
. Ta kết luận với 95% độ tin cậy
rằng Metro EMS không đáp ứng được mục tiêu thời gia n phục vụ khách hàng từ 12 phút trở
xuống.
31
Kiểm định giả thuyết cho kỳ vọng
TH không biết σ
2
, mẫu nhỏ
• Các giả định:
■ Mẫu ngẫu nhiên X
1
, . . . ,X
n
đượ c chọn t ừ tổng thể có phân phối chuẩn N(µ, σ
2
) với kỳ vọng µ
và phương sai σ
2
không biết.
■ Sử dụng ước lượng không chệch S thay cho σ.
■ Cỡ mẫu nhỏ: n ≤ 30.
• Bài toán kiểm định có 3 trường hợp:
(a)
H
0
: µ = µ
0
H
1
: µ = µ
0
(b)
H
0
: µ = µ
0
H
1
: µ < µ
0
(c)
H
0
: µ = µ
0
H
1
: µ > µ
0
với mức ý nghĩa α cho trước.
32
13
Kiểm định giả thuyết cho kỳ vọng
TH không biết σ
2
, mẫu nhỏ
Các bước kiểm định
1. Phát biểu giả thuyết không và đối thuyết
2. Xác định mức ý nghĩa α
3. Lấy mẫu ngẫu nhiên cỡ n: X
1
, . . . , X
n
và tính thống kê kiểm định
T
0
=
¯
X − µ
0
S/
√
n
(7)
Biến ngẫu nhiên T
0
có phân phối Student với n − 1 bậc tự do.
4. Xác định miền bác bỏ W
α
: bảng
4
33
Kiểm định giả thuyết cho kỳ vọng
TH không biết σ
2
, mẫu nhỏ
Giả thuyết Miền bác bỏ
H
0
: µ = µ
0
W
α
=
t
0
: |t
0
| > t
n−1
1−α/2
H
1
: µ = µ
0
H
0
: µ = µ
0
W
α
=
t
0
: t
0
< −t
n−1
1−α
H
1
: µ < µ
0
H
0
: µ = µ
0
W
α
=
t
0
: t
0
> t
n−1
1−α
H
1
: µ > µ
0
Bảng 4: Miền bác bỏ với đối thuyết tương ứng (trường hợp mẫu nhỏ)
5. Kết luậ n: Bác bỏ H
0
/ Chưa đủ cơ sở để bác bỏ H
0
.
34
14
Kiểm định giả thuyết cho kỳ vọng
TH không biết σ
2
, mẫu nhỏ
• Sử dụng p-giá trị (p - value): tính p-giá trị dựa theo đối thuyết và kết luận bác bỏ H
0
khi p -giá
trị ≤ α, với mức ý nghĩa α cho trước. Công thức tính p - giá trị theo các trường hợp x em ở bảng
5.
Giả thuyết p - giá trị
H
0
: µ = µ
0
p = 2P(T
n−1
≥ |t
0
|)
H
1
: µ = µ
0
H
0
: µ = µ
0
p = P(T
n−1
≤ t
0
H
1
: µ < µ
0
H
0
: µ = µ
0
p = P(T
n−1
≥ t
0
)
H
1
: µ > µ
0
Bảng 5: p-giá trị với đối thuyết tương ứng (trường hợp mẫu nhỏ)
35
Kiểm định giả thuyết cho kỳ vọng
TH không biết σ
2
, mẫu lớn
• Các giả định:
■ Mẫu ngẫu nhiên X
1
, . . . ,X
n
đượ c chọn từ tổng thể có kỳ vọng µ và phương sai σ
2
không biết.
■ Sử dụng ước lượng không chệch S thay cho σ.
■ Cỡ mẫu lớn: n > 30.
• Khi cỡ mẫu lớn biến ngẫu nhiên
Z
0
=
¯
X −µ
0
S/
√
n
(8)
sẽ hội tụ về phân phối chuẩn hóa Z ∼ N(0, 1). Khi đó miền bác bỏ W
α
hoặc p-giá trị sẽ được tính
tương tự như trường hợp biết phương sai, chỉ thay thế
¯
X − µ
0
σ/
√
n
bằng Z
0
ở phương trình (
8).
36
15
Kiểm định giả thuyết cho kỳ vọng
TH không biết σ
2
Ví dụ 6. Trạm cảnh sát giao thông trên đường cao tốc sẽ thực hiện việc bắn tốc độ định kỳ tại các
địa điểm khác nhau để kiểm tra tốc độ của các phương tiện giao thông. Một mẫu về tốc độ của các
loại xe được chọn để thực hiện kiểm định giả thuyết sau
H
0
: µ = 65
H
1
: µ > 65
Những vị trí mà bác bỏ H
0
là những vị trí tốt nhất được chọn để đặt radar kiểm soát tốc độ.
Tại địa điểm F, một mẫu gồm tốc độ của 64 phương tiện được bắn tốc độ ngẫu nhiên có trung bình
là 66.2 mph và độ lệch tiêu chuẩn 4.2 mph. Sử dụng α = 5% để kiểm định giả thuyết.
37
Kiểm định giả thuyết cho kỳ vọng
TH không biết σ
2
• Các bước kiểm định:
1. Phát biểu giả thuyết:
H
0
: µ = 65
H
1
: µ > 65
2. Xác định mức ý nghĩa: α = 0.05
3. Tính giá trị thống kê kiểm định khi σ
2
không biết và cỡ mẫu n = 64 (lớn)
z
0
=
¯x − µ
0
s/
√
n
=
66.2 − 65
4.2/
√
64
= 2.286
4. Xác định miền bác bỏ: Bác bỏ H
0
khi z
0
> z
1−α
= z
0.95
= 1.645
38
Kiểm định giả thuyết cho kỳ vọng
TH không biết σ
2
5. Kết luậ n: z
0
= 2.286 > 1.645 nên bá c bỏ H
0
, ta kết luận với 95% độ tin cậy rằng tốc độ trung
bình tại địa điểm F lớn hơn 65 mph. Địa điểm F là địa điểm tốt để đặt radar kiểm soát tốc độ.
• Sử dụng p-giá trị:
4a. Tính p-giá trị:
Với z
0
= 2.286, p = 1 − Φ(z
0
) = 1 − Φ(2.286) = 0.0111
5a. Kết luận: p = 0.0111 < 0.05 nên bác bỏ H
0
, ta kết luận với 95% độ tin cậy rằng tốc độ trung
bình tại địa điểm F lớn hơn 65 mph. Địa điểm F là địa điểm tốt để đặt radar kiểm soát tốc độ.
39
16
Kiểm định giả thuyết cho tỷ lệ
• Bài toán:
Cho t ổng thể X, trong đó tỷ lệ phần tử mang đặc tính A nà o đó là trong tổng thể là p (p chưa biết).
Từ mẫu ngẫu nhiên (X
1
, X
2
, , X
n
) hãy kiểm định
(a)
H
0
: p = p
0
H
1
: p = p
0
(b)
H
0
: p = p
0
H
1
: p < p
0
(c)
H
0
: p = p
0
H
1
: p > p
0
với mức ý nghĩa α.
• Giả định:
■ Cỡ mẫu n l ớn; để phân phối chuẩn xấp xỉ phân phối nhị thức tốt cần có np
0
≥ 5 và
n(1 − p
0
) ≥ 5.
40
Kiểm định giả thuyết cho tỷ lệ
• Quan sát sự xuất hiện của biến cố "phần tử mang đặc tính A" trong n phép thử độc lập. Gọi Y là
số lần xuất hiện biến cố trên thì Y ∼ B(n, p). Và
ˆ
P =
Y
n
là một ước lượng không chệch cho p.
• Nếu H
0
đúng, thống kê
Z
0
=
ˆ
P − p
0
p
0
(1 − p
0
)
n
có phân phối chuẩn hóa N(0, 1). Chọn Z
0
làm tiêu chuẩn kiểm định.
41
Kiểm định giả thuyết cho tỷ lệ
Các bước kiểm định
1. Phát biểu giả thuyết và đối thuyết
2. Xác định mức ý nghĩa α
3. Tính giá trị thống kê kiểm định
Z
0
=
ˆ
P − p
0
p
0
(1 − p
0
)
n
4. Xác định miền bác bỏ: bảng
6
42
17
Kiểm định giả thuyết cho tỷ lệ
Giả thuyết Miền bác bỏ
H
0
: p = p
0
W
α
=
z
0
: |z
0
| > z
1−α/2
H
1
: p = p
0
H
0
: p = p
0
W
α
=
z
0
: z
0
< −z
1−α
H
1
: p < p
0
H
0
: p = p
0
W
α
=
z
0
: z
0
> z
1−α
H
1
: p > p
0
Bảng 6: Miền bác bỏ cho bài toán kiểm định tỷ lệ
5. Kết luậ n: Bác bỏ H
0
/ Chưa đủ cơ sở để bác bỏ H
0
.
Sử dụng p-giá trị: p-giá trị tính tương tự như bảng 3.
43
Kiểm định giả thuyết cho tỷ lệ
Ví dụ 7. Trong kỳ nghỉ giáng sinh và đầu năm mới, Cục An toàn giao thông đã thống kê được rằng
có 500 người chết và 25000 người bị thương do các vụ tại nạn giao thông trên toàn quốc. Theo thông
cáo của Cục ATGT thì khoảng 50% số vụ tai nạn có liên quan đến rượu bia.
Khảo sát ngẫu nhi ên 120 vụ tai nạn thấy có 67 vụ do ảnh hưởng của rượu bia. Sử dụng số liệu trên
để kiểm định l ời khẳng định của Cục An toàn giao thông với mức ý nghĩa α = 5%.
Các bước kiểm định:
1. Phát biểu giả thuyết:
H
0
: p = 0.5
H
1
: p = 0.5
2. Xác định mức ý nghĩa: α = 0.05
44
18
Kiểm định giả thuyết cho tỷ lệ
3. Tính giá trị thống kê kiểm định
σ
ˆp
=
p
0
(1 − p
0
)
n
=
0.5(1 − 0.5
120
= 0.045644
z
0
=
ˆp − p
0
σ
ˆp
=
(67/120) − 0.5
0.045644
= 1.28
4. Xác định miền bác bỏ: bác bỏ H
0
khi |z
0
| > z
0.975
= 1.96 hoặc tính p-giá trị
p = [(1 − Φ(z
0
)] = 2[1 − Φ(1.28)] = 2(1 − 0.8977) = 0.2006
5. Kết luậ n: do z
0
= 1.28 < 1.96 (hoặc p = 0.2006 > 0.05) nên kết luận chưa đủ cơ sở để bác bỏ
giả thuyết H
0
.
45
Kiểm định giả thuyết cho trường hợp hai mẫu độc lập 46
So sánh hai kỳ vọng, trường hợp biết phương sai
• Các giả định:
■ X
1
, X
2
, . . . ,X
n
là mẫu ngẫu nhiên được chọn từ tổng thể 1 có phân phối chuẩn với kỳ vọng µ
1
và phương sai σ
2
1
.
■ Y
1
, Y
2
, . . . ,Y
m
là mẫu ngẫu nhiên được chọn từ tổng thể 2 có phân phối chuẩn với kỳ vọng µ
2
và phương sai σ
2
2
.
■ Tổng thể 1 và 2 (đại diện bởi X và Y ) độc lập với nhau.
■ Các phương sai σ
2
1
và σ
2
2
đã biết.
• Bài toán kiểm định giả thuyết trên hai mẫu độc lập gồm các dạng sau:
(a)
H
0
: µ
1
− µ
2
= D
0
H
1
: µ
1
− µ
2
= D
0
(b)
H
0
: µ
1
− µ
2
= D
0
H
1
: µ
1
− µ
2
< D
0
(c)
H
0
: µ
1
− µ
2
= D
0
H
1
: µ
1
− µ
2
> D
0
với mức ý nghĩa α cho trước.
47
19
So sánh hai kỳ vọng, trường hợp biết phương sai
Các bước kiểm định
1. Phát biểu giả thuyết H
0
và đối thuyết H
1
2. Xác định mức ý nghĩa α
3. Tính thống kiểm định
Z
0
=
¯
X −
¯
Y − (µ
1
− µ
2
)
σ
2
1
n
+
σ
2
2
m
(9)
thống kê Z
0
∼ N(0, 1).
4. Xác định miền bác bỏ
48
So sánh hai kỳ vọng, trường hợp biết phương sai
Miền bác bỏ v à p-giá trị tương ứng
Đối thuyết
Miền bác bỏ p - giá trị
H
1
: µ
1
−µ
2
= D
0
|z
0
| > z
1−α/2
p = 2[1 − Φ(|z
0
|)]
H
1
: µ
1
−µ
2
< D
0
z
0
< −z
1−α
p = Φ(z
0
)
H
1
: µ
1
−µ
2
> D
0
z
0
> z
1−α
p = 1 − Φ(z
0
)
5. Kết luậ n: Nếu bác bỏ H
0
, ta kết luận H
1
đúng với (1 − α)100% độ tin cậy. Ngược lại ta kết
luận chưa đủ cơ sở để bác bỏ H
0
với α cho trước.
49
So sánh hai kỳ vọng
Ví dụ 8. Một công ty sản xuất sơn nghiên cứu về 1 loại phụ gia làm giảm thời gian khô của sơn.
Thực hiện thí nghiệm trên 2 mẫu: mẫu thứ nhất gồm 10 mẫu vật được sơn bằng loại sơn bình
thường; mẫ u thứ hai gồm 10 mẫu vật được sơn với sơn có chất phụ gia mới. Trong những nghiên cứu
trước, biết rằng độ lệch tiêu chuẩn của thời gian khô sau khi quét sơn là 8 phút và không thay đổi khi
thêm phụ gia vào. Trung bình của mẫu 1 và 2 lần lượt là ¯x = 121 phút và ¯y = 112 phút. Với mức ý
nghĩa 5%, hãy cho kết luận về loại sơn với chất phụ gia mới.
1. Phát biểu giả thuyết và đối thuyết
H
0
: µ
1
− µ
2
= 0 chất phụ gia mới không có hiệu quả
H
1
: µ
1
> µ
2
chất phụ gia mới có hiệu quả
2. Mức ý nghĩa: α = 0.05
50
20
So sánh hai kỳ vọng
3. Tính giá trị thống kê kiểm định, với ¯x = 121, ¯y = 112 và σ
1
= σ
2
= 8 ta có
z
0
=
¯x − ¯y − 0
σ
2
1
n
1
+
σ
2
2
n
2
=
121 − 112
8
2
10
+
8
2
10
= 2.52
4. Xác định miền bác bỏ: bác bỏ H
0
khi z
0
> z
1−α
= z
0.95
= 1.65.
5. Kết luậ n: Ta có z
0
= 2.52 > 165 nên bác bỏ H
0
. Ta kết luận rằng với 95% độ tin cậy, chất phụ
gia có hiệu quả làm giảm thời gian khô sau khi sơn.
5a. Sử dụng p - giá trị: ta có p = 1 − Φ(z
0
) = 1 − Φ(2.52) = 0.0059 < 0.05 nên bác bỏ H
0
.
51
So sánh hai kỳ vọng, trường hợp không biết phương sai, mẫu lớn
• Các giả định:
■ X
1
, X
2
, . . . ,X
n
là mẫu ngẫu nhiên được chọn từ tổng thể 1 có kỳ vọng µ
1
và phương sai σ
2
1
không biết.
■ Y
1
, Y
2
, . . . ,Y
m
là mẫu ngẫu nhiên được chọn từ tổng thể 2 có kỳ vọng µ
2
và phương sai σ
2
2
không biết.
■ Tổng thể 1 và 2 (đại diện bởi X và Y ) độc lập với nhau.
■ Cỡ mẫu lớn: n > 30 và m > 30.
52
So sánh hai kỳ vọng, trường hợp không biết phương sai, mẫu lớn
■ Đối với trường hợp mẫu lớn, khi phương sai tổng thể σ
2
1
và σ
2
2
không biết, ta thay thế bằng các
phương sai mẫu S
2
1
và S
2
2
mà không tạo ra nhiều khác biệt.
■ Khi cả n > 30 và m > 30, đại lượng
Z
0
=
¯
X −
¯
Y − (µ
1
− µ
2
)
S
2
1
n
+
S
2
2
m
(10)
sẽ xấp xỉ phân phối chuẩn hóa N(0, 1).
■ Miền bác bỏ (hoặc p - giá trị) trong trường hợp này được tính tương tự như trường hợp biết
phương sai (thay thế σ
1
và σ
2
bởi S
1
và S
2
).
53
21
So sánh hai kỳ vọng, trường hợp không biết phương sai, mẫu lớn
Ví dụ 9. Khảo sát về chiều cao của sinh viên hai khoa Toán và CNTT: chọn ngẫu nhiên 50 si nh viên
khoa Toán, t ính được chiều cao trung bình là 163 (cm) và độ lệch tiêu chuẩn 5 (cm). Đo chiều cao 50
khoa CNTT, có trung bình mẫu là 166 (cm) và độ lệch tiêu chuẩn 8 (cm). Với mức ý nghĩa α = 1%,
hãy cho kết luận về chiều cao của sinh viên hai khoa.
54
So sánh hai kỳ vọng, trường hợp không biết phương sai, mẫu nhỏ
• Các giả định:
■ X
1
, X
2
, . . . ,X
n
là mẫu ngẫu nhiên được chọn từ tổng thể 1 có phân phối chuẩn với kỳ vọng µ
1
và phương sai σ
2
1
không biết.
■ Y
1
, Y
2
, . . . ,Y
m
là mẫu ngẫu nhiên được chọn từ tổng thể 2 có phân phối chuẩn với kỳ vọng µ
2
và phương sai σ
2
2
không biết.
■ Tổng thể 1 và 2 (đại diện bởi X và Y ) độc lập với nhau.
■ Cỡ mẫu nhỏ: n ≤ 30 hoặc m ≤ 30.
• Ta xét hai trường hợp:
1. Trường hợp phương sai bằng nhau σ
2
1
= σ
2
2
,
2. Trường hợp phương sai khác nhau σ
2
1
= σ
2
2
.
55
So sánh hai phương sai
• Giả sử X
1
, . . . ,X
n
và Y
1
, . . . ,Y
m
lần lượt là hai mẫu ngẫu nhiên chọn từ hai tổng thể độc lập và có
phân phối chuẩn với kỳ vọng và phương sai là (µ
1
, σ
2
1
) và (µ
2
, σ
2
2
). Ta cần kiểm định giả thuyết
H
0
: σ
2
1
= σ
2
2
H
1
: σ
2
1
= σ
2
2
(11)
• Nếu S
2
1
là phương sai mẫu ngẫu nhiên (X
1
, . . . ,X
n
) thì
(n − 1)S
2
1
σ
2
1
∼ χ
2
(n − 1) (12)
tương tự, ta có
(m − 1)S
2
2
σ
2
2
∼ χ
2
(m − 1)
56
22
So sánh hai phương sai
• Khi đó, đại lượng
F =
S
2
1
/σ
2
1
S
2
2
/σ
2
2
(13)
sẽ có phân phối F với (n − 1, m − 1) bậc tự do.
• Xét biến ngẫu nhiên F ∼ F(u, v) có hàm mật độ xác suất là f(x), phân vị trên mức α của F là
f
α,u,v
đượ c định nghĩa như sau
P(F > f
α,u,v
) =
∞
f
α,u,v
f(x)dx = α (14)
• Phân vị dưới mức 1 − α của F cho bởi
f
1−α,u,v
=
1
f
α,u,v
(15)
57
So sánh hai phương sai
Các bước kiểm định
1. Phát biểu giả thuyết H
0
: σ
2
1
= σ
2
2
và đối thuyết H
1
: σ
2
1
= σ
2
2
2. Xác định mức ý nghĩa α
3. Khi H
0
đúng, thống kê
F =
S
2
1
S
2
2
(16)
có phân phối F với (n − 1, m − 1) bậc tự do.
4. Xác định miền bác bỏ: bác bỏ H
0
khi f > f
α/2,n−1,m−1
hoặc f < f
1−α/2,n−1,m−1
5. Kết luận: Nếu bác bỏ H
0
, ta kết luận H
1
đúng với (1 − α) ∗100% độ tin cậy. Ngược lại kết luận
chưa đủ cơ sở để bác bỏ H
0
.
58
23
So sánh hai kỳ vọng, mẫu nhỏ, trường hợp σ
2
1
= σ
2
2
= σ
2
■ Trường hơp σ
2
1
= σ
2
2
= σ
2
, ta sử dụng một ướ c lượng chung cho cả σ
2
1
và σ
2
2
là S
2
p
gọi là
phương sai mẫu chung (pooled sample variance)
S
2
p
=
(n − 1)S
2
1
+ (m − 1)S
2
2
n + m −2
(17)
■ Thống kê
T
0
=
¯
X −
¯
Y − (µ
1
− µ
2
)
S
p
1
n
+
1
m
(18)
có phân phối Student với n + m − 2 bậc tự do
59
So sánh hai kỳ vọng, mẫu nhỏ, trường hợp σ
2
1
= σ
2
2
= σ
2
■ Đặt df = n + m − 2, miền bác bỏ và p - giá trị trong trường hợp này có dạng
Đối thuyết
Miền bác bỏ p - giá trị
H
1
: µ
1
−µ
2
= D
0
|t
0
| > t
df
1−α/2
p = 2P(T
df
≥ |t
0
|)
H
1
: µ
1
−µ
2
< D
0
t
0
< −t
df
1−α
p = P(T
df
≤ t
0
)
H
1
: µ
1
−µ
2
> D
0
t
0
> t
df
1−α
p = P(T
df
≥ t
0
)
■ Kết luận: Bác bỏ H
0
/Chưa đủ cơ sở để bác bỏ H
0
.
60
So sánh hai kỳ vọng, mẫu nhỏ, trường hợp σ
2
1
= σ
2
2
■ Khi σ
2
1
= σ
2
2
, sử dụng thống kê
T
0
=
¯
X −
¯
Y − (µ
1
− µ
2
)
S
2
1
n
+
S
2
2
m
(19)
■ Khi đó T
0
có phân phối Student với bậc tự do df được xác định như sau
df =
(s
2
1
/n) + (s
2
2
/m)
2
(s
2
1
/n)
2
n − 1
+
(s
2
2
/m)
2
m − 1
(20)
■ Miền bác bỏ trong trường hợp này giống như trường hợp phương sai bằng nhau, chỉ thay bậ c tự
do df cho bởi phương trình (
20).
61
24
So sánh hai kỳ vọng, trường hợp không biết phương sai
Ví dụ 10. Tại một thành phố, ở khu vực A, người ta chọn ngẫu nhiên 17 sinh viên và cho làm 1 bài
kiểm tra để đo chỉ số IQs, thu được trung bình mẫu là 106 và độ lệch tiêu chuẩn bằng 10; tại khu vực
B, chỉ số IQs trung bình của một mẫu gồm 14 sinh viên bằng 109 với độ lệch tiêu chuẩn là 7. Giả sử
phương sai bằng nha u. Có sự khác biệt về chỉ số IQs của sinh viên ở hai khu vực A và B hay không?
α = 0.02.
62
So sánh hai kỳ vọng, trường hợp không biết phương sai
Ví dụ 11. Hàm lượng thạch tín (Asen) (Đv: ppb) trong nước càng cao càng có hại cho sức khỏe.
Người ta kiểm tra hàm lượng thạch tín ở hai khu vực là trung tâm thành phố Biên Hòa và khu vực
gần sân bay Biên Hòa. Tại mỗi khu vực, người ta đo ngẫu nhiên hàm lượng thạch tín trong nước ứng
với 10 địa điểm khác nhau. Số liệu cho bởi bảng thống kê bên dưới
Trung tâm TP 3 7 25 10 15 6 12 25 15 7
Khu vực gần sân bay 48 44 40 38 33 21 20 12 1 18
Với α = 0.05, hãy kiểm tra xem có sự khác biệt về hàm lượng thạch tín ở hai khu vực này.
63
So sánh hai tỷ lệ
• Khảo sát những phần tử thỏa một tính chất A nào đó trên hai tổng thể độc lập với tỷ lệ tương ứng
là p
1
và p
2
; từ hai tổng thể chọn ra hai mẫu với cỡ lần lượt là n và m. Gọi X và Y là số phần tử thỏa
tính chất A trong mẫu 1 và mẫu 2. Khi đó, ta có X ∼ B(n, p
1
) và Y ∼ B(m, p
2
).
• Bài toán: so sánh tỷ lệ p
1
và p
2
.
• Bài toán kiểm định giả thuyết gồm các trường hợp sau:
(a)
H
0
: p
1
− p
2
= D
0
H
1
: p
1
− p
2
= D
0
(b)
H
0
: p
1
− p
2
= D
0
H
1
: p
1
− p
2
< D
0
(c)
H
0
: p
1
− p
2
= D
0
H
1
: p
1
− p
2
> D
0
• Các giả định
■ Hai mẫu độc lập,
■ Cỡ mẫu lớn và np
1
> 5; n(1 − p
1
) > 5 và mp
2
> 5; m(1 − p
2
) > 5.
64
25