Tải bản đầy đủ (.doc) (13 trang)

Xác suất thống kê: Chương 7 Ước lượng tham số (đầy đủ)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (174.51 KB, 13 trang )

CHƯƠNG 7. ƯỚC LƯỢNG THAM SỐ
7.1. Ước lượng điểm cho kỳ vọng, median, phương sai
và xác suất
7.2. Ước lượng khoảng
7.3. Độ chính xác của ước lượng và số phép thử cần thiết
Bài 7.1. Ước lượng điểm cho kỳ vọng,
median, phương sai và xác suất
1.Khái niệm về ước lượng điểm cho tham số:
Giả sử X là ĐLNN có tham số đặc trưng θ nào đó (chưa
biết) mà ta đang quan tâm. Vấn đề đặt ra là: căn cứ trên n
giá trị x
1
, x
2
, …, x
n
của X được quan trắc trên một mẫu
ngẫu nhiên (MNN) cỡ n lấy ra từ tập chính, cần đưa ra
một giá trị gần đúng

θ
của θ.
Định nghĩa 1. Một hàm
) ,,,(
21 n
n
XXX
∧∧
=
θθ
của n giá


trị X
1
, X
2
, …, X
n
được gọi là một ước lượng điểm cho θ.
Để khảo sát về mặt toán học, ta coi (x
1
, x
2
, …, x
n
) là giá
trị quan sát được là một thể hiện của MNN cỡ n (X
1
, X
2
,
…, X
n
), trong đó X
1
, X
2
, …, X
n
là các BNN độc lập cùng
phân phối với X.
Như vậy,

) ,,,(
21 n
n
XXX
∧∧
=
θθ
là 1 hàm của n BNN X
1
,
X
2
, …, X
n
và do đó cũng là 1 BNN. Giá trị của ước
lượng cũng thay đổi từ mẫu quan sát này tới mẫu quan
sát khác.
Việc lựa chọn một ước lượng nào là “tốt” được căn cứ
trên các tiêu chuẩn sau:
1
2. Các tính chất của ước lượng điểm:
Định nghĩa 2.
1.Ước lượng

n
θ
gọi là ước lượng không chệch cho
θ

nếu

θθ
θ
=

)(
n
E
.
Tính chất không chệch có nghĩa là ước lượng

n
θ
không
có sai số hệ thống.
2. Ước lượng

n
θ
gọi là ước lượng vững nếu với mọi
0
>
ε


1
lim
=







<−

∞→
εθθ
n
n
P
.
Hay
1
lim
=






+<<−

∞→
εθθεθ
n
n
P
3. Ước lượng hiệu quả: Đó là ước lượng không chệch có
phương sai nhỏ nhất trên lớp các ước lượng không chệch

của θ.
3.Ước lượng điểm của giá trị trung bình:
Giả sử X là BNN với giá trị trung bình với E(X)= μ
(chưa biết), μ được gọi là giá trị trung bình của tập hợp
chính.
Ước lượng điểm của kỳ vọng là trung bình mẫu:


=


==
=
=
N
i
r
xr
i
N
n
k
k
n
k
kk
xx
1
1
1

1
Định lý 1. Trung bình mẫu là ước lượng không chệch và
vững cho giá trị trung bình μ của tập chính.
2
4.Ước lượng điểm của phương sai:
Ước lượng điểm của phương sai là phương sai mẫu:

∑∑
=

=

−=−=
n
k
kk
N
N
i
i
N
xxrxxs
1
2
1
1
1
2
1
1

2
)()(
Định lý 2. Phương sai mẫu là ước lượng không chệch và
vững cho giá trị phương sai σ
2
của tập chính.
5. Ước lượng điểm của xác suất:
Giả sử A là biến cố mà ta quan tâm với p=P(A)
chưa biết. Tiến hành quan sát N lần độc lập, ký hiệu m là
tần số xuất hiện của A. Khi đó,
Nmp /=

là ước lượng
điểm của p.
Định lý 3.
Nmp /=

là ước lượng này không chệch và
vững cho giá trị xác suất p=P(A).
6. Ước lượng điểm của Median:
Ước lượng điểm của Median là Median mẫu được xác
định như sau:
Với một mẫu, trung vị mẫu là là giá trị nằm giữa dãy giá
trị quan trắc theo thứ tự tăng hay giảm.
Nếu dãy quan trắc có 2n+1 số liệu sắp xếp theo thứ tự
tăng dần thì giá trị thứ n+1 là trung vị, nếu dãy quan trắc
gồm 2n số liệu thì trung vị là giá trị trung bình của giá trị
thứ n và n+1.
Nếu các giá trị x
i

có tần số r
i
, gọi k là chỉ số bé nhất để
r
1
+r
2
+…+r
k
≥n/2. Khi đó ta định nghĩa Med(X)=x
k
.
Ví dụ: Cho bảng phân bố tần số của đại lượng X như sau:
x
i
0 1 2 3 4 5 6 7 8 9 10 11
r
i
6 15 43 53 85 72 55 33 18 10 7 3
Kích thước mẫu là 400
Hãy tính trung bình mẫu và trung vị.
Giải
3
Trung bình mẫu
645.4=x
Ta thấy số giá trị của mẫu bé hơn hay bằng 3 là:
3+15+43+53=117<200
Số giá trị của mẫu bé hơn hay bằng 4 là:
3+15+43+53+85=202>200
Vậy Med(X)=4.

Trong trường hợp mẫu được cho dưới dạng phân bố ghép
lớp ta định nghĩa trung vị như sau:
Giả sử ta có m khoảng với các điểm chia là:
a
0
<a
1
< …<a
m
C
1
= [a
0
, a
1
), C
2
= [a
1
, a
2
), …, C
m
= [a
m-1
, a
m
]. Trong đó
khoảng C
i

có tần số r
i
.
Khoảng C
k
được gọi là khoảng trung vị nếu k là chỉ số bé
nhất sao cho r
1
+r
2
+…+r
k
≥n/2.
Số trung vị Med(X) là số mà tại đó đường thẳng
x=Med(X) chia đôi diện tích của tổ chức đồ tần số (tần
suất).
Med(X)=a
k-1
+[(n/2 )–( r
1
+r
2
+…+r
k-1
)]/h
k
, h
k
– là chiều cao
của hình chữ nhật thứ k.

4
Bài 7.2. Ước lượng khoảng
Định nghĩa 2. Khoảng có 2 đầu mút a(X
1
, X
2
, …, X
n
) và
b(X
1
, X
2
, …, X
n
) gọi là khoảng tin cậy với độ tin cậy
γ=1-α của
θ
, nếu:
{ }
γθ
=≤≤ baP
1. Ước lượng khoảng của kỳ vọng:
A.Khi X là BNN chuẩn
),(
2
σµ
N
:
A1. Ước lượng khoảng của kỳ vọng khi phương sai

2
0
2
σσ
=
đã biết:
{ }
αµ
σ
α
σ
α
−=+≤≤−
1
00
2/2/
nn
zxzxP
Tra bảng Excel z
α
/2
=NORMSINV(1-α/2)
z
0.05
==NORMSINV(1-0.05)
Ví dụ 1. Hãy tìm khoảng tin cậy 95% cho chiều cao
trung bình của sinh viên dựa trên một mẫu kích thước
n=36 với trung bình mẫu
inchesx 66
=

. Giả sử rằng độ
lệch tiêu chuẩn σ của chiều cao người lớn là 3 inches.
Giải
Ta có σ
0
=3, n=36, γ=95%, z
α/2
=1.96.
Vậy khoảng tin cậy 95% là :
98.066)5.0(96.16696.166
36
3
2/
0
±=±=±=±
n
zx
σ
α
hay
[ ]
98.66;02.65
.
Vậy với độ tin cậy 95%, chiều cao trung bình μ nằm giữa
65.02 và 66.98 (inches).
Ví dụ 2. Cũng câu hỏi như trên nhưng cần tìm khoảng tin
cậy 99%.
Giải
Ta có σ=3, n=36, γ=99%, u
α/2

=2.58.
Vậy khoảng tin cậy 99% là :
5
29.166)5.0(58.26658.266
36
3
2/
±=±=±=±
n
ux
σ
α
hay
[ ]
29.67;71.64
.
Vậy với độ tin cậy 99%, chiều cao trung bình μ nằm giữa
64.71 và 67.29 (inches).
A2. Ước lượng khoảng của kỳ vọng khi phương sai
2
σ
chưa biết:
- Nếu n < 30 thì:
{ }
αµ
αα
−=−+≤≤−−
1)1()1(
2/2/
n

s
n
s
ntxntxP
Trong đó
)1(
2/

nt
α
tính theo phân phối Student với n-1
bậc tự do, tức là
{ }
2/)1(
2/
α
α
=−>
ntTP
với T là BNN
Student với n-1 bậc tự do.
Cơ sở cho việc xây dựng khoảng tin cậy trong trường
hợp này là Mệnh đề sau:
Mệnh đề : Giả sử X
j
với j=1, 2, n là các biến ngẫu
nhiên Gauss độc lập cùng phân phối với X. Khi đó :
W
σ
σµµ

/
/)(
/
n
n
n
n
V
Mn
nV
M −
=

=

[ ]
{ }
.
)1/(/)1(
)/)((
2/1
22
−−

=
nVn
nM
n
n
σ

σµ
Có phân phối Student với (n-1) bậc tự do với hàm mật
độ:
ƒ
n – 1
(y) =
Ví dụ 3: Để xác định trọng lượng trung bình của các
bao bột mỳ được đóng bao bằng máy tự động, người ta
chọn ngẫu nhiên 15 bao và tính được
8.39
=
x

144.0
2
=
S
.
Tìm khoảng tin cậy cho trọng lượng trung bình μ của
bao bột với độ tin cậy γ=99%.
Giải
6
Ta có α=1-γ=1-0.99=0.01 ;
005.0
2
=
α
. Tra bảng
phân phối Student với 14 bậc tư do ta tìm được
t==TINV(0.01,14)=t

0.005
(14)=2.977.
Vậy khoảng tin cậy 99% của μ là :
( )
15
379.0
005.0
977.28.39)).(14(
±=±
N
S
tx
Hay 39.5023≤μ≤40.0977
Ví dụ 4. Để ước lượng chiều cao trung bình μ của thanh
niên của vùng A nào đó, một mẫu ngẫu nhiên gồm 16
thanh niên được chọn. Chiều cao của các thanh niên này
đo được như sau (đơn vị cm) :
172 173 173 174 174 175 175 176
166 167 165 173 171 170 171 170
Hãy tìm khoảng tin cậy γ=99%.
TB Mẫu 171.5625 t0.005(15) 2.946713
PS mẫu 10.79583 γ=99%
cận
dưới 169.142
cận trên 173.983
- Nếu
30≥N
thì
{ }
αµ

αα
−=+≤≤−
1
2/2/
n
s
n
s
zxzxP
Trong đó
2/
α
z
được tính theo phân phối chuẩn tắc N(0, 1),
tức là:
{ }
2/
2/
α
α
=>
zZP
, với Z là BNN chuẩn tắc N(0, 1).
α
10% 5% 2% 1% 0,3%
z
α
/2
1,645 1,96 2,326 2,576 3
Còn S là căn bậc 2 của phương sai mẫu.

7
Ví dụ 5. Một trường đại học tiến hành 1 nghiên cứu xem
1 SV trung bình tiêu hết bao nhiêu tiền điện thoại trong 1
tháng. Một mẫu ngẫu nhiên gồm 59 sv được chọn và kết
quả cho như sau:
14 18 22 30 36 28 42 79 36 52 15
47 95 16 27 111 37 63 127 23 31 70
27 11 30 147 72 37 25 7 33 29 35
41 48 15 29 73 26 15 26 31 57 40
18 85 28 32 22 37 60 41 35 26 20
58 33 23 35
Hãy xây dựng khoảng tin cậy 95% cho số tiền gọi điện
thoại trung bình μ hàng tháng của 1 sv.
Giải
Từ các số liệu trên ta có: n=59,
05,41
=
x
, S=27.99
Do đó
64.3
59
99.27
==
n
S
.
Vì n=59>30 nên ta có khoảng tin cậy 95% cho μ là
13.705.41)64.3(96.1
±=±

x
Hay 33.92≤μ≤48.18
B.Khi X là BNN tùy ý:
Điều kiện: n

30.
B1. Ước lượng khoảng của kỳ vọng khi phương sai
2
0
2
σσ
=
đã biết:
{ }
αµ
σ
α
σ
α
−=+≤≤−
1
00
2/2/
nn
zxzxP
B2. Ước lượng khoảng của kỳ vọng khi phương sai
2
σ
chưa biết:
{ }

αµ
αα
−=+≤≤−
1
2/2/
n
s
n
s
zxzxP
8
Ví dụ cho Trường hợp B1:
Giả sử ta có mẫu cỡ n=50 với phân phối chưa
biêt nhưng biết phương sai bằng 25 cm2, ta tính
được trung bình mẫu bằng 168 cm.
Xây dựng khoảng tin cậy 99% cho giá trị TB μ
của X.
Ví dụ cho Trường hợp B2:
Giả sử ta có mẫu cỡ n=50 với phân phối chưa
biêt và biết trung bình mẫu bằng 168 cm và
2
1
2
1445000cmx
n
i
i
=

=

.
Xây dựng khoảng tin cậy 99% cho giá trị TB μ
của X.
2. Ước lượng khoảng cho xác suất:
+ Ước lượng khoảng của xác suất:
Điều kiện:
-
30

n
-
.10))1(;min(
≥−
∧∧
pnpn
α
αα
−≈








+≤≤−
∧∧∧∧





1
)1(
2/
)1(
2/
n
pp
n
pp
zppzpP
.
Ví dụ 6. Trước cuộc bầu cử tổng thống, một cuộc thăm
dò dư luận đã được tiến hành. Người ta chọn ngẫu nhiên
100 người để hỏi ý kiến thì có 60 người nói rằng họ sẽ bỏ
phiếu cho ứng cử viên A. Tìm khoảng tin cậy 90% cho tỷ
lệ cử tri bỏ phiếu cho ứng cử viên A.
Giải
Ta có n=100; k=60;
6.0
==

n
m
p
.
Ta thấy
9
10404.0100)1(

10606.0100
>==−
>==


xpn
xpn
Như vậy

p
sẽ có phân bố xấp xỉ chuẩn với
ppE =

)(
với độ lệch tiêu chuẩn là
049.00024.0
100
4.06.0
)1(
====
∧∧


x
n
pp
σ
.
Với γ=0.90 thì
645,1

2/
=
α
z
.
Vậy khoảng tin cậy 90% cho p là:

08.060.0)049.0(645.1
±=±

xp
Hay 0.52≤ p ≤ 0.68.
3.Ước lượng khoảng cho phương sai:
+ Ước lượng khoảng của phương sai khi đã biết giá
trị trung bình µ=µ
0
:Khi N=n ta có công thức:
ασ
αχ
µ
αχ
µ
−=












≤≤


−−
==
1
)2/1(
)(
2
)2/(
)(
2
1
2
0
2
1
2
0
n
n
i
i
n
n
i

i
XX
P
Trong đó các giá trị
)2/(
2
αχ
n

)2/1(
2
αχ

n
là các
giá trị được tra từ bảng phân phối
2
χ
với n bậc tự do,
cụ thể là:
{ }
{ }
2/1)2/1(
2/)2/(
22
22
ααχχ
ααχχ
−=−>
=>

nn
nn
P
P
+ Ước lượng khoảng của phương sai khi chưa biết
giá trị trung bình:Khi N=n ta có công thức:
10
( )
ασ
αχαχ
−=≤≤

−−
−−
1
)2/1(
)1(
2
)2/(
)1(
1
2
2
1
2
2
nn
snsn
P
Trong đó các giá trị

)2/(
2
1
αχ
−n

)2/1(
2
1
αχ

−n
là các
giá trị được tra từ bảng phân phối
2
χ
với n-1 bậc tự
do, cụ thể là:
{ }
{ }
2/1)2/1(
2/)2/(
2
1
2
1
2
1
2
1

ααχχ
ααχχ
−=−>
=>
−−
−−
nn
nn
P
P
Mệnh đề : Giả sử X
j
với j=1, 2, là các biến ngẫu nhiên
Gauss độc lập cùng phân phối, với kỳ vọng µ chưa biết
và phương sai σ
2
chưa biết. Khi đó :
(n – 1)V/σ
2
là biến ngẫu nhiên χ
2
với n – 1 bậc tự do.
11
Bài 7.3. Độ chính xác của ước lượng
và cỡ mẫu cần thiết
Với độ tin cậy γ đã cho, ta thấy có mối liên quan giữa cỡ
mẫu n và độ dài khoảng tin cậy. Cỡ mẫu càng lớn thì độ
dài khoảng tin cậy càng hẹp, nghĩa là độ chính xác càng
cao, sai số của ta càng nhỏ. Tuy nhiên, khi cỡ mẫu càng
lớn thì càng đòi hỏi nhiều thời gian, tiền của, công sức.

Vậy bài toán đặt ra là: cần chọn cỡ mẫu tối thiểu bao
nhiêu để đạt được độ chính xác mong muốn.
1. Trường hợp ước lượng cho trung bình μ:
Để ước lượng giá trị trung bình ta cần cỡ mẫu đủ lớn,
cụ thể, với độ chính xác
ε
cho trước, ta có:
Khi phương sai đã biết
( )
2
2/
ε
σ
α
z
n

, hay khi phương sai chưa biết.
( )
)30,max(
2
2/
ε
α
sz
n ≥
Điều kiện: n≥30.
2. Trường hợp ước lượng cho tỷ lệ:
Để ước lượng xác suất với độ chính xác
ε

cho trước,
cỡ mẫu phải đủ lớn, cụ thể là:
Cách 1:
2
2
2/
)1(
ε
α
∧∧


ppz
n
Với
-
30

n
12
-
.10))1(;min(
≥−
∧∧
pnpn
Cách 2:
2
2
2/
4

ε
α
z
n ≥
13

×