Tải bản đầy đủ (.pdf) (15 trang)

Bài giảng Toán ứng dụng - P14

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (386.39 KB, 15 trang )

Cao Hào Thi 74
Chương 7

ƯỚC LƯỢNG CÁC THAM SỐ THỐNG KÊ
(Estimation)
7.1 KHÁI NIỆM CHUNG
Xét một tập hợp chính gồm N biến ngẫu nhiên X có hàm mật độ xác suất là f (x,θ); trong
đó θ là các tham số thống kê của tập hợp chính.
Thí dụ:
Trong phân phối nhị thức:

fx C
n
xx nx
(, ) ( )
θρρ
=−

1
⇒ θ = ρ, θ ∈ [0 , 1]
Trong phân phối poisson

fx
e
x
x
(, )
!
θ
λ
λ


=
⇒ θ = λ λ > 0
Trong phân phối chuẩn

fx e
x
(, )
()
θ
πσ
µ
σ
=


1
2
2
2
2
2
⇒ θ = (µ, σ
2
) ;
-∞ < µ < +∞ ; 0 < σ
2
< +∞
Gọi {x
1,
x

2
,.... , x
n
} là mẫu ngẫu nhiên, cỡ mẫu n được dùng lấy ra từ tập hợp chính tuân
theo hàm mật độ xác suất f (x,θ). Ở đây dạng của hàm f xem như đã biết còn các tham số
thống kê θ của tập hợp chính xem như chưa biết.
Vấn đề đặt ra ở chương trình này là dựa vào các mẫu quan sát {x
1
,x
2
,...,x
n
} ta ước lượng
xem giá trị cụ thể của θ bằng bao nhiêu (bài toán đó gọi là ước lượng điểm ) hoặc ước
lượng xem θ nằm trong khoảng nào (bài toán ước lượng khoảng).

7.2 ƯỚC LƯỢNG ĐIỂM (Point Estimation)

7.2.1 Ước lượng và giá trị ước lượng (Estimator And Estimate)

a) Ước lượng (Estimator) và hàm ước lượng
- Là biến ngẫu nhiên hay các tham số thống kê của mẫu được dùng để ước lượng các
tham số thống kê chưa biết của tập hợp chính.
- Ước lượng của tham số thống kê θ của tập hợp chính được ký hiệu là
θ
ˆ

- Dựa vào mẫu {x
1
,x

2
...,x
n
} người ta lập ra Hàm
θ
ˆ
=
θ
ˆ
(x
1
,x
2,
....,x
n
) để ước lượng
cho θ.
θ
ˆ
được gọi là hàm ước lượng của θ hay gọi tắt là ước lượng của θ.
Cao Hào Thi 75
θ
ˆ
chỉ phụ thuộc vào giá trị quan sát x
1
, x
2
, ... ,x
n
chứ không phụ thuộc vào các tham

số chưa biết θ của tập hợp chính.
b) Giá trị ước lượng (Estimate) hay còn gọi là giá trị ước lượng điểm (Point
Estimate)
Là giá trị cụ thể của ước lượng
θ
ˆ
và được xem như giá trị ước lượng của tham số thống
kê θ của tập hợp chính.
Tham số thống kê và tập hợp
chính (Population Parameter)
Ước lượng (Estimation)
Giá trị ước lượng
Estimate (Point estimate)
Số trung bình
µ
X

Phương sai
2
x
σ

S
x
2

Độ lệch chuẩn
σ
x


S
x

Tỷ lệ p
f
ˆ

7.2.2 Ước lượng không chệch: (Unbiased Estimators)
a) Ước lượng không chệch:
Ước lượng
θ
được gọi là ước lượng không chệch của tham số thống kê
θ
nếu kỳ vọng
của
θ
ˆ

θ
.
E (
θ
ˆ
) =
θ

Thí dụ
E(
X
) =

µ
=> X là ước lượng không chệch của
µ

E(S
x
2
) =
2
x
σ
=> S
x
2
là ước lượng không chệch cuả
2
x
σ

E (
f
ˆ
) = p =>
f
ˆ
là ước lượng không chệch của p
b) Độ chệch (The Bias)
Gọi
θ
ˆ

là ước lượng của
θ
: Bias(
θ
ˆ
) = E (
θ
ˆ
) -
θ

Đối với ước lượng không chệch

Bias = độ chệch = 0
c) Ước lượng hiệu quả tốt nhất:
Gọi
θ
ˆ
1

θ
ˆ
2
là 2 ước lượng không chệch của
θ
dựa trên số lượng của mẫu quan sát
giống nhau.
o
θ
ˆ

1
được gọi là hiệu quả hơn
θ
ˆ
2
nếu: Var (
θ
ˆ
1
) < Var (
θ
ˆ
2
)
o
Hiệu quả tương đối giữa hai ước lượng là tỉ số giữa 2 phương sai của chúng.
Hiệu quả tương đối (Relative Efficency) =
)
ˆ
(Var
)
ˆ
(Var
1
2
θ
θ

Cao Hào Thi 76
o

Nếu
θ
ˆ
là ước lượng không chệch của
θ
và nếu không có một ước lượng không
chệch nào có phương sai nhỏ hơn phương sai của
θ
ˆ
thì
θ
ˆ
đuợc gọi là ước lượng
tốt nhất (Best Estimator) hay
θ
ˆ
còn gọi là ước lượng không chệch có phương sai
nhỏ nhất của
θ
(Minimum Variance Unbiased Estimator of
θ
)
θ
2
θ
1

θ
2
θ

1

θ
ˆ
1
: ước lượng không chệch của
θ

θ
ˆ
1
θ
ˆ
2
: ước lượng không chệch của
θ

θ
ˆ
2
: ước lượng chệch của
θ

θ
ˆ
1
ước lượng hiệu quả hơn
θ
ˆ
2

:
d) Sai số bình phương trung bình (Mean Squared Error - MSE)

Sai số bình phương trung bình của ước lượng
θ
ˆ
được định nghĩa như sau:


MSE(
θ
ˆ
) = E [(
θ
ˆ
-
θ
)
2
]
Người ta chứng minh được rằng:
MSE (
θ
ˆ
) = Var(
θ
ˆ
) + [
θ
- E (

θ
ˆ
)]
2

MSE (
θ
ˆ
) = Var (
θ
ˆ
) + [ Bias(
θ
ˆ
)]
2


Nếu
θ
ˆ
là ước lượng không chệch ta có:


Bias(
θ
ˆ
) = 0



MSE (
θ
ˆ
) = Var (
θ
ˆ
)
e) Ước lượng nhất quán vững (Consistent Estimators)
θ
ˆ
n
=
θ
ˆ
(x
1
, x
2
,... x
n
) gọi là ước lượng vững của
θ
nếu với mọi
ε
> 0 ta có:

∞→i
lim
P( |
θ

ˆ
n
-
θ
|


ε
) = 1
tức là dãy
θ
ˆ
n
hội tụ theo xác suất tới
θ
khi n




Cao Hào Thi 77
7.3 ƯỚC LƯỢNG KHOẢNG (Interval Estimation)
7.3.1 Khoảng tin cậy (Confidence Interval)
a) Ước lượng khoảng và giá trị ước lượng khoảng
(Interval Estimator And Interval Estimate).

Ước lượng khoảng: Ước lượng khoảng đối với tham số thống kê của tập hợp chính
θ

là một quy tắc dựa trên thông tin của mẫu để xác định miền (Range) hay khoảng

(Interval) mà tham số
θ
hầu như nằm trong đó.

Gía trị ước lượng khoảng: là giá trị cụ thể của miền hay khoảng mà tham số
θ
nằm
trong đó.
b) Khoảng tin cậy và độ tin cậy (Confidence Interval and Level of Confidence)
Gọi
θ
là tham số thống kê chưa biết. Giả sử dựa trên thông tin của mẫu ta có thể xác
định được 2 biến ngẫu nhiên A và B sao cho
P (A <
θ
< B) = 1 -
α
với 0 <
α
< 1
Nếu giá trị cụ thể của biến ngẫu nhiên A và B là a và b thì khoảng (a,b) từ a đến b
được gọi là khoảng tin cậy của
θ
với xác suất là (1 -
α
)
Xác suất (1 -
α
) được gọi là độ tin cậy của khoảng.
Ghi chú:

o
Trong thực tế, độ tin cậy (1-
α
) do nhà thống kê chọn theo yêu cầu của mình,
thông thường độ tin cậy được chọn là 0,90; 0,95; 0,99...
o
α
là xác suất sai lầm khi chọn khoảng tin cậy (a, b)
7.3.2 Khoảng tin cậy đối với số trung bình của phân phối chuẩn trong trường hợp
đã biết phương sai của tập hợp chính:
Nghĩa là đi tìm ước lượng của
µ
trong N (
µ
,
σ
x
2
) khi đã biến
σ
x
2

a) Điểm phần trăm giới hạn trên Z (Upper Percentage Cut Off Point)
Gọi Z là biến ngẫu nhiên chuẩn hóa và
α
là số bất kỳ sao cho 0 <
α
< 1
Z

α
là điểm phần trăm giới hạn trên nếu.
P (Z > Z
α
) =
α

Ghi chú:

 P (Z > Z
α
) = F
Z
(Z
α
) = 1 -
α

Cao Hào Thi 78
Z
α
Ζ
α

 P (-Z
α/2
< Z < Z
α/2
) = 1 -
α


Chứng minh:
Do tính đối xứng: P(Z > Z
α
/2
) =
2
α

P (Z < -Z
α
/2
) =
2
α



P (-Z
α
/2
< Z < Z
α
/2
) = 1 -
2
α
-
2
α

= 1 -
α

Z
α/2
Ζ
α
α/2
−Ζ
α
0
f
Z
(z)

b) Khoảng tin cậy của
µ
trong N(
µ
,
σ
x
2
) khi đã biến
σ
x
2

Giả sử ta có mẫu ngẫu nhiên vơí cỡ mẫu n từ phân phối chuẩn N(
µ

,
σ
x
2
). Nếu
σ
x
2

số trung bình mẫu đã biết, giá trị trung bình tập hợp chính được tính bởi.

x
Z
n
x
Z
n
xx
−−
−<<+
αα
σ
µ
σ
//22

Trong đó Z
α
/2
là số có P (Z > Z

α
/2
) =
α
/2 với Z là biến ngẫu nhiên chuẩn chuẩn hóa.
Chứng minh
:
Ta có:
P ( - Z
α
/2
< Z < Z
α
/2
) = 1 -
α

P ( - Z
α
/2
<
n/
X
X
σ
µ−
< Z
α
/2
) = 1 - α

P (-
n
Z
x/
σ
α 2
<
µ−X <
n
Z
x/
σ
α 2
) = 1 - α
P (
X
-
n
Z
x/
σ
α 2
< µ <
X
+
n
Z
x/
σ
α 2

)= 1 - α
Cao Hào Thi 79
Thí dụ:
Giả sử trọng lượng của các học sinh lớp 2 tuân theo phân phối chuẩn với độ lệch chuẩn
1,2kg. Mẫu ngẫu nhiên gồm 25 học sinh có trung bình là 19,8kg. Tìm khoảng tin cậy 95%
đối với trọng lượng trung bình của tất cả học sinh lớp 2 trong 1 trường.
Giải
:
Ta có: 100 (1 - α) = 95 ⇒ α = 0,05
⇒ Z
α/2
=Z
0,025

⇒ P(Z > Z
0,025
) = 0,025
P(Z < Z
0,025
) = F
Z
(Z
0,025
) = 1 - 0,025 = 0,975
Tra bảng ta có: Z
0,025
= 1,96
Khoảng tin cậy 95% đối với số trung bình tập chính µ sẽ là

x

Z
n
x
Z
n
xX
−<<+
αα
σ
µ
σ
//22

Với
X
= 19,8 kg σ
x
= 1,2 kg n = 25 Z
α/2
= 1,96
Vậy : 19,33 < µ < 20,27
Ghi chú:
ε =
n
Z
x/
σ
α 2
: gọi là độ chính xác của ước lượng hay dung sai
X là trung tâm của khoảng tin cậy với bề rộng của khoảng tin cậy của µ là

W
Z
n
x
==
2
2
2
α
σ
ε
/

o
W càng nhỏ thì ước lượng càng chính xác ( ≡ ε càng nhỏ)
o
Với xác suất α và cỡ mẫu nhỏ, σ
x
càng lớn thì W càng lớn.
o
Với α và σ
x
cho trước, n càng lớn thì W càng nhỏ.
o
Với σ
x
và n cho trước, (1 - α) càng lớn thì W càng nhỏ
n = 25
σ
x

= 1.2 1-
α
= 0.99
n = 25
n = 64
n = 25
σ
x
= 1.2
σ
x
= 1.2
σ
x
= 1.2
1-
α
= 0.95
1-
α
= 0.95
1-
α
= 0.95

c) Khoảng tin cậy của số trung bình
µ
trong tập hợp chính trường hợp cỡ mẫu lớn.
Giả sử ta có mẫu với cỡ mẫu là n được lấy từ tập hợp chính có số trung bình là µ.
Gọi

X là số trung bình của mẫu và S
x
là phương sai của mẫu.

×