CHƯƠNG 7
Ước lượng các số đặc trưng tổng thể
* Không thể tính được các số đặc trưng tổng thể.
Từ một mẫu cụ thể, ta ước lượng đặc trưng tổng thể θ
bằng cách tuyên bố θ là θ
o
(ước lượng điểm) hoặc
tuyên bố θ thuộc một khoảng (ước lượng khoảng).
1. Ước lượng điểm
Ta tuyên bố mỗi số đặc trưng ứng với một mẫu
cụ thể là số đặc trưng tương ứng của tổng thể.
1.1 Ước lượng điểm trung bình tổng thể µ
µµ
µ
Trung bình tổng thể µ được ước lượng bởi trung
bình mẫu ngẫu nhiên
X
.
Công thức ước lượng này có tính chất:
Không chệch
: Kỳ vọng của sai số khi ước lượng
bằng 0, tức là E(
X
–
µ
)
=
0.
Hiệu qua
û: Phương sai của (
X
–
µ
) là nhỏ nhất
trong các công thức ước lượng
µ
.
Vững
:
X
càng gần
µ
khi kích thước mẫu càng
lớn.
1.2 Ước lượng điểm phương sai tổng thể σ
σσ
σ
2
Phương sai tổng thể
σ
2
được ước lượng bởi
phương sai mẫu ngẫu nhiên S
2
.
Công thức ước lượng điểm này là không chệch,
vững.
1.3 Ước lượng điểm tỷ lệ tổng thể p
Tỷ lệ tổng thể p được ước lượng bằng với tỷ lệ
mẫu ngẫu nhiên F.
Công thức ước lượng điểm này là không chệch.
Ví dụ
Đo chiều cao (m) của 50 cây rừng ta có bảng:
Chiều cao Số lượng
Chiều cao
Số lượng
6,25–6,75 1
8,25–8,75
18
6,75–7,25 2
8,75–9,25
9
7,25–7,75 5
9,25–9,75
3
7,75–8,25 11
9,75–10,2
1
Ứớc lượng chiều cao trung bình, độ lệch chuẩn
và tỷ lệ cây cao từ 7,75m đến 8,75m.
2. Ước lượng khoảng
Xét mẫu ngẫu nhiên X
1
,
X
2
,
,
X
n
. Chọn 2 thống
kê
1
ˆ
θ
,
2
ˆ
θ
, tức là lập 2 hàm n-biến X
1
,
X
2
,
,
X
n
. Số
đặc trưng tổng thể θ được xem thuộc khoảng [
1
ˆ
θ
,
2
ˆ
θ
]
(
khoảng tin cậy
) với xác suất 1–α. 1–α gọi là
độ
tin cậy
.
Với độ tin cậy 1–α từ 95% trở lên, ta cho rằng
biến cố
1
ˆ
θ
≤
θ
≤
2
ˆ
θ
chắc chắn xảy ra trong thực tế.
Ghi chú
Ta cũng có thể xét khoảng ước lượng một phía
2.1 Ước lượng khoảng trung bình tổng thể
µ
µµ
µ
Xét mẫu ngẫu nhiên X
1
, X
2
,…, X
n
và độ tin cậy
1–α.
Ta chọn khoảng ngẫu nhiên dạng (
X
−
ε,
X
+
ε)
để ước lượng µ. ε gọi là
độ chính xác
của ước lượng.
Để tìm khoảng ngẫu nhiên ước lượng µ, ta cần
xác đònh công thức tính độ chính xác ε.
TH1 n
≥
≥≥
≥
30 và biết phương sai tổng thể
σ
σσ
σ
2
Xét Z =
X
/ n
− µ
σ
. Nếu X có phân phối Chuẩn thì Z
có phân phối Chuẩn Chính tắc. Nếu chưa biết quy
luật phân phối của X thì từ giả thiết n ≥ 30, ta xấp
xỉ Z với phân phối Chuẩn Chính tắc.
Ta có:
P(
X
–
ε < µ <
X
+
ε) = 1−α
⇔ P(
X
–
µ
< ε) = 1−α ⇔ P(
X
−µ>
ε) = α
⇔ P(
X
/ n
− µ
σ
>
/ n
ε
σ
) = α ⇔ P(Z>
/ n
ε
σ
) = α
⇔ P(Z
>
/ n
ε
σ
) + P(Z
<
−
/ n
ε
σ
) = α
⇔ 2P(Z >
/ n
ε
σ
) = α ⇔ P(Z >
/ n
ε
σ
) = α/2
Đẳng thức cuối chứng tỏ
/ n
ε
σ
là phân vò mức
α/2 của
phân phối Chuẩn Chính tắc. Vậy:
/ n
ε
σ
= z
α/2
⇒ ε =
/2
z
n
α
σ
Lấy mẫu cụ thể kích thước n, ta tính được giá trò
ε và do đó tìm được khoảng tin cậy (
x
−ε,
x
+ε) với độ
tin cậy 1–α để ước lượng µ.
TH2 n < 30, biết phương sai tổng thể
σ
σσ
σ
2
và X
có phân phối Chuẩn
Lúc này
X
/ n
− µ
σ
có phân phối Chuẩn Chính tắc.
Vậy tất cả lập luận cũng như công thức nêu trên đều
áp dụng được.
TH3 n
≥
≥≥
≥
30 và chưa biết phương sai tổng
thể
σ
σσ
σ
2
Lúc này
X
S / n
− µ
có phân phối Student bậc tự do
(n–1). Theo giả thiết n ≥ 30, phân phối Student được
xấp xỉ với phân phối Chuẩn Chính tắc; hơn nữa, S
cũng được xấp xỉ bởi s. Vậy tất cả lập luận cũng như
công thức nêu trên đều áp dụng được, miễn là thay σ
bởi s khi tính ε ứng với mẫu cụ thể.
TH4 n
≤
≤≤
≤
30, chưa biết phương sai tổng thể
σ
σσ
σ
2
, X có phân phối Chuẩn
Lúc này
X
S / n
− µ
có phân phối Student bậc tự do
(n–1). Tất cả lập luận trên cũng áp dụng được cho
phân phối Student. Công thức tính độ chính xác ε
ứng với mẫu cụ thể lúc này là công thức đã biết
nhưng thay σ bởi s và thay z
α/2
bởi t
α/2
(n–1).
Tóm tắt – Khoảng tin cậy trung bình tổng thể
µ
µµ
µ
Cho trước một mẫu cụ thể kích thước n và độ tin
cậy 1–α. Trung bình tổng thể µ được ước lượng thuộc
khoảng tin cậy (
x
−ε,
x
+
ε). Độ chính xác ε được tính
theo công thức gồm hai trường hợp sau:
n > 30 hoặc "n
≤
≤≤
≤
30, biết
σ
σσ
σ
2
và tổng thể có
phân phối Chuẩn"
ε
εε
ε
=
==
=
/ 2
z
n
α
αα
α
σ
σσ
σ
(σ
≈
s)
n ≤
≤≤
≤ 30, chưa biết σ
σσ
σ
2
và tổng thể có phân
phối Chuẩn
ε
εε
ε =
==
=
/2
s
t (n 1)
n
α
αα
α
−
−−
−
Excel
ε trong trường hợp đầu được tính theo công thức
=CONFIDENCE(α, σ, n)
Ví dụ
(1) Thống kê về tuổi thọ (giờ) của một số bóng đèn
do một nhà máy sản xuất ta có bảng:
Tuổi thọ Số bóng đèn
Tuổi thọ
Số bóng đèn
1000–1100
4
1600–1700
42
1100–1200
10
1700–1800
32
1200–1300
16
1800–1900
26
1300–1400
20
1900–2000
14
1400–1500
36
2000–2100
8
1500–1600
48
Lấy trung điểm mỗi khoảng. Ta có:
n
= 256
x
= 1.587,50 s
2
= 51.450,98 ⇒ s = 226,83
a) Tính tuổi thọ trung bình của bóng đèn với độ tin
cậy 95%.
1
−α = 95% ⇒ z
α/2
= z
0,025
= 1,96
=NORMSINV(1–.025)
⇒ ε =
/2
s
z
n
α
= 27,79
Tuổi thọ trung bình của bóng đèn là 1.587,50
± 27,79
giờ (độ tin cậy 95%).
b) Nếu muốn độ tin cậy đạt đến 98% và độ chính
xác như trên thì phải có số liệu về tuổi thọ của bao
nhiêu bóng đèn?
1
−α = 98% ⇒ z
α/2
= z
0,01
= 2,33
=NORMSINV(1–0,01)
Từ công thức tính ε ta có:
n
=
2
/2
s
z
α
ε
= 360,66
≈
361
Phải có số liệu của 361 bóng đèn.
c) Nếu lấy độ chính xác là 20 giờ và dùng số liệu
điều tra 256 bóng đèn như trên thì độ tin cậy đạt
bao nhiêu?
s = 226,83 n = 256 ε = 20
Từ công thức tính ε ta có:
z
α/2
=
n
s
ε
≈
1,41
⇒ α/2 = 0,5
–
Φ(1,41) = 0,5
–
0,42 ⇒ 1–α = 84%
Khi độ chính xác là 20 thì độ tin cậy là 84%.
(2) Trọng lượng của một sản phẩm lấy ngẫu nhiên
tại một nhà máy là một ĐLNN có phân phối Chuẩn.
Cân 20 sản phẩm lấy ngẫu nhiên thì tính được trung
bình trọng lượng của một sản phẩm là 1.100g và độ
lệch chuẩn là 25,649g. Ước lượng trọng lượng một
sản phẩm của nhà máy này với độ tin cậy 98%.
n
=
20 (< 30)
x
=
1.100 s
=
25,649
1−α = 98% ⇒ t
α/2
(n–1) = t
0,01
(19) = 2,539
=TINV(.01*2; 19)
⇒ ε =
/2
s
t (n 1)
n
α
−
= 14,56
Trọng lượng một sản phẩm là 1.100 ± 14,56 g (độ tin
cậy 98%).
2.2 Ước lượng khoảng tỷ lệ tổng thể p
Xét mẫu ngẫu nhiên X
1
, X
2
,…, X
n
và độ tin cậy
1−α.
Ta tìm khoảng ngẫu nhiên dạng (F−ε, F+ε) để
ước lượng p. ε gọi là
độ chính xác
của ước lượng.
Cần xác đònh công thức tính độ chính xác ε.
Xét n ≥
≥≥
≥ 30. Z =
−
−
F p
p(1 p) / n
được xấp xỉ với
phân phối Chuẩn Chính tắc. Ta có:
P(F−ε < p < F+ε) = 1−α
⇔ P(F
–
p
< ε) = 1–α ⇔ P(F
–
p
> ε) = α
⇔ P(
−
−
F p
p(1 p) / n
>
ε
−
p(1 p) / n
) = α
⇔ P(Z >
ε
−
p(1 p) / n
) = α
⇔ P(Z >
ε
−
p(1 p) / n
) = α/2
Đẳng thức cuối chứng tỏ
ε
−
p(1 p) / n
là phân vò
mức
α/2 của phân phối Chuẩn Chính tắc. Theo giả
thiết n > 30, p được xấp xỉ bởi F. Vậy:
ε =
α
−
/2
z F(1 F) / n
Lấy mẫu cụ thể kích thước n, ta tính được giá trò
ε và do đó tìm được khoảng tin cậy (f−ε, f+ε) với độ
tin cậy 1−α để ước lượng p.
Tóm tắt – Khoảng tin cậy tỷ lệ tổng thể p
Cho trước một mẫu cụ thể kích thước n (n ≥ 30)
và độ tin
cậy 1−α. Tỷ lệ tổng thể p được ước lượng
thuộc khoảng tin cậy (f−ε, f+ε). Độ chính xác ε được
tính theo công thức:
ε
εε
ε
=
==
=
/ 2
f(1 f)
z
n
α
αα
α
−
−−
−
Ví dụ
Điều tra thu nhập hàng tháng của 100 công
nhân gặp ngẫu nhiên tại một nhà máy thì thấy có
81 lần được trả lời là trên 3 triệu đồng/tháng.
Ta có: n
=
100 f
=
81%
a) Ước lượng tỷ lệ công nhân đạt mức thu nhập
trên với độ tin cậy 96%.
1
−α
=
96%
⇒
z
α/2
=
z
0,02
=
2,0537
=NORMSINV(1–.02)
⇒
ε
=
/2
f (1 f)
z
n
α
−
=
8,06%
Tỷ lệ công nhân đạt mức thu nhập trên 3 triệu
đồng/tháng từ 72,94% đến 89,06% (độ tin cậy 96%).
b) Nếu muốn độ tin cậy đạt đến 98% và độ chính
xác như trên thì phải điều tra thêm bao nhiêu công
nhân nữa?
1
−α
=
98%
⇒
z
α/2
=
z
0,01
=
2,3263
=NORMSINV(1–.01)
Từ công thức tính
ε
ta có:
n
=
2
/2
z
f(1 f)
α
−
ε
=
128,21
≈
129
Phải điều tra thêm 129
−
100
=
29 công nhân.
c) Nếu lấy độ chính xác là 7% và dùng số liệu điều
tra 100 công nhân như trên thì độ tin cậy đạt được
bao nhiêu?
n
=
100 f
=
81%
ε
=
7%
Từ công thức tính
ε
ta có:
z
α/2
=
n
f(1 f)
ε
−
≈
1,78 ⇒ α/2 = 0,5 – Φ(1,78)
⇒ α/2 = 0,0375 ⇒ 1–α = 92,5%
Khi độ chính xác là 7% thì độ tin cậy là 92,5%.
2.3 Ước lượng khoảng phương sai tổng thể σ
σσ
σ
2
Xét mẫu ngẫu nhiên X
1
, X
2
,…, X
n
và độ tin cậy
1–α.
Ta tìm khoảng ngẫu nhiên dạng (a, b) để ước
lượng σ
2
.
Ta chỉ xét tổng thể có phân phối Chuẩn.
TH1
chưa biết trung bình tổng thể µ
µµ
µ
Lúc này
2
2
(n 1)S
−
σ
có phân phối Chi Bình n–1
bậc tự do. Ta có:
P(a
<
σ
2
<
b) = 1–α ⇔ P(σ
2
> b) + P(σ
2
< a) = α
Để có đẳng thức trên, ta chọn P(σ
2
>
b)
=
α/2 và
P(σ
2
<
a)
=
α/2. Ta có:
P(σ
2
> b) = α/2
⇔ P(
2
2
(n 1)S
−
σ
<
2
(n 1)S
b
−
) = α/2
⇔ P(
2
2
(n 1)S
−
σ
>
2
(n 1)S
b
−
) = 1–α/2
Đẳng thức trên chứng tỏ
2
(n 1)S
b
−
là phân vò
mức 1–α/2 của phân phối Chi Bình n–1 bậc tự do.
Vậy:
2
(n 1)S
b
−
=
χ
2
1–α/2
⇒ b =
−α
−
χ
2
2
1 /2
(n 1)S
Tương tự:
P(σ
2
< a) = α/2 ⇔ P(
2
2
(n 1)S
−
σ
>
2
(n 1)S
a
−
) = α/2
Đẳng thức trên chứng tỏ
2
(n 1)S
a
−
là phân vò
mức α/2 của phân phối Chi Bình n–1 bậc tự do. Vậy:
2
(n 1)S
a
−
=
χ
2
α/2
⇒ a =
α
−
χ
2
2
/2
(n 1)S
Lấy mẫu cụ thể kích thước n, ta tính được giá trò
a, b và do đó tìm được khoảng tin cậy [a, b] với độ
tin cậy 1–α để ước lượng σ
2
.
TH2 biết trung bình tổng thể
µ
µµ
µ