Tải bản đầy đủ (.pdf) (15 trang)

Tài liệu Toán xác suất_ Chương 5 ppt

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (132.06 KB, 15 trang )

CHƯƠNG 5
ƯỚC LƯNG CÁC THAM SỐ THỐNG KÊ
(Estimation)


Khái niệm chung:
- Xét một tập họp chính gôøm N biến ngẫu nhiên X tuân theo luật phân phối có hàm mật độ
xác suất là f (x,θ); trong đó θ là các tham số thống kê của tập họp chính.

Thí dụ:
• Trong phân phối nhò thức:
fx C
n
xx nx
(, ) ( )
θρρ
=−

1 => θ = ρ , θ ∈ [0 , 1]
• Trong phân phối poisson
fx
e
x
x
(, )
!
θ
λ
λ
= => θ = λ θ > 0
• Trong phân phối chuẩn



fx e
x
(, )
()
θ
πσ
µ
σ
=


1
2
2
2
2
2
=> θ = (µ , σ
2
) , -∞ < µ < +∞
0 < σ
2
< +∞
- Gọi {x
1,
x
2
,.... , x
n

} là mẫu ngẫu nhiên, cỡ mẫu n được dùng lấy ra từ tập họp chính tuân
theo hàm mật độ xác suất f (x,θ). Ở đây dạng của hàm f xem như đã biết còn các tham số thống kê
θ của tập họp chính xem như chưa biết.
Vấn đề đặt ra ở chương trình này là dựa vào các mẫu quan sát {x
1
,x
2
,...,x
n
} ta ước lượng
xem giá trò cụ thể của θ bằng bao nhiêu (bài toán đó gọi là ước lượng điểm ) hoặc ước lượng xem θ
nằm trong khoảng nào (bài toán ước lượng khoảng).

1. ƯỚC LƯNG ĐIỂM (Point Estimation)
1.1 Ước lượng và giá trò ước lượng (estimator and estimate)
1.1.1 Ước lượng (Estimatir) ô hàm ước lượng

• Là biến ngẫu nhiên hay các tham số thống kê của mẫu được dùng để ước lượng các tham số
thống kê chưa biết của tập hợp chính.
• Ước lượng của tham số thống kê θ của tập họp chính được ký hiệu là
θ

.
• Dựa vào mẫu {x
1
,x
2
...,x
n
} người ta lập ra làm

θ

=
θ

(x
1
,x
2,
....,x
n
) để ước lượng cho θ.
θ

được
gọi là hàm ước lượng của θ hay gọi tắt là ước lượng của θ.

θ

chỉ phụ thuộc vào giá trò quan sát x
1
, x
2
, ... ,x
n
chứ không phụ thuộc vào các tham chưa số
biết θ của tập họp chính.

1.1.2 Giá trò ước lượng (estimate) hay còn gọi là giá trò ước lượng điểm (point estimate)
• Là giá trò cụ thể của ước lượng

θ

và được xem như giá trò ước lượng của tham số thống kê θ của
tập họp chính.



Tham số thống kê và tập họp
chính (population patameter)
Ước lượng
(Estimation)
Giá trò ước lượng Estimate
(Point estimate)
Số trung bình µ
x

Phương sai σ
x
2

Độ lệch chuẩn σ
x

Trò số p
f
x
n
=

p

X
S
x
2

S
x

f


p
x


x
S
x
2
S
x

f


p
x




1.2 Ước lượng không chệch: (Unbiased estimators)
1.2.1 Ước lượng không chệch:
• Ước lượng θ được gọi là ước lượng không chệch của tham số thống kê θ nếu kỳ vọng của
θ


θ.
E (
θ

) = θ
Thí dụ

E(X) = µ
x
=> X là ước lượng không chệch của µ
x

E(S
x
2
) = σ
x
2
=> S
x
2
là ước lượng không chệch cuả σ
x
2


E ( f

) = p => f

là ước lượng không chệch của p

12.2. Độ chệch (The bias)
• Gọi
θ

là ước lượng của θ.
Bias(
θ

) = E (
θ

) - θ
• Đối với ước lượng không chệch => Bias = độ chệch = 0

1.3 Ước lượng hiệu quả tốt nhất:
• Gọi
θ

1

θ

2

là 2 ước lượng không chệch của θ dựa trên số lượng của mẫu quan sát giống
nhau.
*
θ

1
được gọi là hiệu quả hơn
θ

2
nếu
Var (
θ

1
) < Var (
θ

2
)
* Hiệu quả tương đối giữa hai ước lượng là tỉ số giữa 2 phương sai của chúng.
Hiệu quả tương đối =
Var
Var
()
()
θ
θ
2
1




(Relative efficency)
• Nếu
θ

là ước lượng không chệch của θ và nếu không có một ước lượng không chệch nào có
phương sai nhỏ hơn phương sai của
θ

thì
θ

đïc gọi là ước lượng tốt nhất (best estimator) hay
θ

còn gọi là ước lượng không chệch có phương sai nhỏ nhất của θ (minimum variance unbiased
estimator of θ)


1.4 Sai số bình phương trung bình (men spuared eveor) MSE
• Sai số bình phương trung bình của ước lượng
θ

được đònh nghóa như sau:
MSE(
θ

) = E [(

θ

- θ)
2
]
Người ta chứng minh được rằng:
MSE (
θ

) = Var(
θ

) + [θ - E (
θ

)]
2

MSE (
θ

) = Var (
θ

) + [ Bias(
θ

)]
2


• Nếu
θ

là ước lượng không chệch ta có
Bias(
θ

) = 0
=> MSE (
θ

) = Var (
θ

)

1.5 Ước lượng nhất quán vững (Consistent estimators)

θ

n
=
θ

(x
1
, x
2
,... x
n

) gọi là ước lượng vững của θ nếu với mọi ε > 0 ta có:
lim P( |
θ

n
- θ | ≤ ε ) = 1]
n - ∞
tức là dãy
θ

n
hội tụ theo xác suất tới θ khi n -> ∞
2. ƯỚC LƯNG KHOẢNG (Interal estimation)
2.1 Khoảng tin cậy (Confidence interval)
2.1.1. Ước lượng khoảng và giá trò ước lượng khoảng (interval estimator and interval
estimate).
* Ước lượng khoảng:
Ước lượng khoảng đối với tham số thống kê của tập họp chính θ là một quy tắc dựa trên
thông tin của mẫu để xác đònh miền (range) hay khoảng (interval) mà tham số θ hầu như nằm
trong đó.
* Gía trò ước lượng khoảng:
là giá trò cụ thể của miền hay khoảng mà tham số θ nằm trong
đó.
2.1.2 Khoảng tin cậy và độ tin cậy
(Confidence interval and level of confidence)
Gọi θ là tham số thống kê chưa biết. Giả sử dựa trên thông tin của mẫu ta có thể xác đònh
được 2 biến ngẫu nhiên A và B sao cho
P (A < θ < B) = 1 - α với 0 < α < 1

• Nếu giá trò cụ thể của biến ngẫu nhiên A và B là a và b thì khoảng (a,b) từ a đến b được gọi là

khoảng tin cậy của θ với xác suất la (1 - α)
• Xác suất (1 - α) được gọi là độ tin cậy của khoảng.
Ghi chú:
• Trong thực tế, độ tin cậy (1 -α) do nhà thống kê chọn theo yêu cầu của mình, thông thường độ
tin cậy được chọn là 0,90; 0,95; 0,99...
• α là xác suất sai lầm khi chọn khoảng tin cậy (a, b)
2.2 Khoảng tin cậy đến với số trung bình của phân phối chuẩn trong trường hợp đã biết
phương sai của tập họp chính:
Nghóa là đi tìm ước lượng của µ trong N (µ, σ
x
2
) khi đã biến σ
x
2


2.2.1 Điểm phần trăm giới hạn trên Z (Upper percentage cut off point)
Gọi Z là biến ngẫu nhiên chuẩn hóa và α là số bất kỳ sao cho 0 <α < 1
Z
α
là điểm phần trăm giới hạn trên nếu.
P (Z > Z
α
) = α

Ghi chú:
• P (Z > Z
α
) = F
Z

(z
α
) = 1 - α

Hình 2 (p5)




• P (-Z
α/2
< Z < Z
α/2
) = 1 - α
Chứng minh:
P(Z > Z
α/2
) =
α
2

Do tính đối xứng => P (-Z
α/2
< Z < Z
α/2
) = 1 -
α
2
-
α

2
= 1 - α
P (Z < -Z
α/2
) =
α
2



Hình 3 (P5)




2.2.2 Khoảng tin cậy của µ trong N(µ,σ
x
2
) khi đã biết σ
x
2

Giả sử ta có mẫu ngẫu nhiên vơí cỡ mẫu n từ phân phối chuẩn N(µ,σ
x
2
). Nếu σ
z
2
đã biết và
số trung bình mẫu có giá trò trung bình tập họp chính được tính bởi.


x
Z
n
x
Z
n
xx
−−
−<<+
αα
σ
µ
σ
//22

Trong đó Z
α/2
là số có P (Z > z
α/2
) = α/2 với Z là biến ngẫu nhiên chuẩn chuẩn hóa.
Chứng minh:
Ta có:
P ( - Z
α/2
< Z < Z
α/2
) = 1 - α
P (-Z
α/2

<
X
Z
xn

<
µ
σ
α
/
/
)
2
= 1 - α
P(
−<−<
Z
n
X
Z
n
xX
αα
σ
µ
σ
//
)
22
= 1 - α

P (
X
Z
n
X
Z
n
xX
−<<+
αα
σ
µ
σ
//
)
22
= 1 - α
Thí dụ
:
Giả sử trọng lượng của các học sinh lớp 2 tuân theo phân phối chuẩn với độ lệch chuẩn
1,2kg. Mẫu ngẫu nhiên gồm 25 học sinh có trung bình là 19,8kg. Tìm khoảng tin cậy 95% đối với
trọng lượng trung bình của tất cả học sinh lớp 2 trong 1 trường.
Giải
:
Ta có 100 (1 - α) = 95
=> α = 0.05
=> Z
α/2
= Z 0.025
=> P(Z > Z

0.025
) = 0.025
P(Z < Z
0.025
) = F
Z
(Z
0.025
) = 1 - 0.025 = 0.975
Tra bảng ta có:
Z
0.025
= 1.96
Khoảng tin cậy 95% đối với số trung bình tập chính µ sẽ là

x
Z
n
x
Z
n
xX
−<<+
αα
σ
µ
σ
//22

Với x = 19,8 kg σ

x
= 1,2 kg x = 25 Z
α/2
= 1,96
=> 19,33 < µ < 20,27








Ghi chú:

a)
ε
σ
α
=
Z
n
x/2
gọi là độ chính xác của ước lượng hay dung sai
b) x là trung tâm của khoảng tin cậy với bề rộng của khoảng tin cậy của µ là


x
Z
n

x
−=
α
σ
/
,
2
19 33

x
= 19,8
x
Z
n
x
+=
α
σ
/
,
2
20 83




2
2
Z
n

x
α
σ
/



W
Z
n
x
==
2
2
2
α
σ
ε
/

c) + W càng nhỏ thì ước lượng càng chính xác (≡ ε càng nhỏ)
+ Với xác suất α và cỡ mẫu nhỏ trước, σ
x
càng lớn thì W càng lớn.
+ Với α và σ
x
cho trước, n càng lớn thì W càng nhỏ.
+ Với σ
x
và n cho trước, ( 1 - α) càng lớn thì W càng nhỏ



2.2.3 Khoảng tin cậy đối với số trung bình của tập hợp chính µ trong trường hợp cỡ mẫu lớn.
Giả sử ta có mẫu với cỡ mẫu là n được lấy từ tập họp chính có số trung bình là µ.
Gọi x là số trung bình của mẫu và S
x
là phương sai của mẫu.
Nếu n lớn thì khoảng tin cậy với xáx suất 100(1- α) % đối với µ được xem như đúng là.


x
Z S
n
x
Z S
n
Xx
−<<+
αα
µ
//22

Ghi Chú:
• Sự ước lượng này gần đứng ngay cả khi tập hợp chính không theo phân phối chuẩn.
• Khi n lớn ta có thể xem gần đúng S
x
= σ
x



2.3 Phân phối Stutent t:
Trong phần trước, ta đi tìm khoảng tin cậy của µ trong N(µ,σ
x
2
) khi đã biết σ
x
2
hoặc tìm
khoảng tin cậy của µ khi có mẫu lớn.
Trong trường hợp không biết phương sai σ
x
2
và cỡ mẫu không lớn, để tìm khoảng tin cậy
của µ ta cần phải có một phân phối thích họp hơn, đó là phân phối Student t.
23.1 Phân phối Student t

Cho mẫu ngẫu nhiên với cỡ n với số trung bình của mẫu X và độ lệch chuẩn mẫu S
x
; mẫu
được lấy ra từ tập họp chính với số trung bình là µ.
Biến ngẫu nhiên
t
x
Sn
x
=

µ
/


t tuân theo phân phối Student t với độ tự do là n - 1



Hình
n = 25 , σ
x
= 1.2 , 1-α = 0.95
19.33 19.80 20.27
n = 64 , σ
x
= 1.2 , 1-α = 0.95
19.51 19.80 20.09
n = 25 , σ
x
= 2 , 1-α = 0.95
19.02 19.80 20.58
n = 25 , σ
x
= 1.2 , 1-α = 0.99
19.18 19.80 20.24

×