NHÓM 4
Ước lượng các tham số của ĐLNN và
kiểm định giả thiết thống kê
1
Lý thuyết toán
5.1. Ước lượng điểm:
• Giả sử cần ước lượng tham số . Từ đám đông lấy mẫu
W= (X1, X2, …, Xn) từ mẫu này ta xây dựng 1 thống kê *=
f(X1, X2, …, Xn) thích hợp. Để có ước lượng điểm, ta chỉ
việc điều tra 1 mẫu cụ thể w= (x1, x2, …, xn) với kích
thước người lao động đủ lớn, rồi lấy *= f(x1, x2, …, xn).
• Có nhiều cách chọn thống kê *. Thông thường người ta
xây dưng * bằng các phương pháp hàm ước lượng, tức là
chon * là các đặc trưng mẫu tương ứng. Chẳng hạn lấy
trung bình mẫu để ước lượng trung bình đám đông µ=
E(X), lấy phương sai mẫu điều chỉnh S’2 để ước lượng
phương sai của đám đông S’2=Var(X), lấy tần suất mẫu f
để ước lượng tỉ lệ của đám đông p. Sau đây là các tiêu
chuẩn phản ánh bản chất tốt của ước lượng
2
Lý thuyết toán
5.1.1. Ước lượng không chệch.
Thống kê
* được gọi là ước lượng không chệch của
nếu E(
*)=
. Nếu
E(
*)
thì
* được gọi là ước lượng chệnh của
.
5.1.2. Ước lượng vững
Thống kê
* được gọi là ước lượng vững của
nếu với mọi
>0, nhỏ tùy ý ta
luôn có:
1)*(lim
P
n
5.1.3. Ước lượng hiệu quả
Thống kê
* được gọi là ước lượng hiệu quả của tham số
của ĐLNN gốc X
nếu nó là ước lượng không chệch và có phương sai nhỏ nhất so với mọi ước lượng
không chệch khác được xây dựng trên cùng mẫu đó.
3
Lý thuyết toán
5.2. Khái niệm về ước lượng bằng khoảng tin cậy.
Để ước lượng tam số
của ĐLNN X trước hết từ đám đông ta lấy ra mẫu ngẫu
nhiên W= (X
1
, X
2
, …, X
n
).
Tiếp đến ta xây dựng thống kê G= f(X
1
, X
2
, …, X
n,
), sao cho quy luật phân phối
xác suất của G hoàn toàn xác định. Với xác suất
= 1-
cho trước ta xác định
cặp giá trị
1
,
2
thỏa mãn các điều kiện
1
0,
2
0 và
1
+
2
=
. Vì quy
luật phân phối xác suất của G đã biết, ta tìm được phân vị g
1-
1
và g
2
sao cho:
P(G> g
1-
1
) = 1-
1
và P(G> g
2
) =
2
Khi đó P(g
1-
1
<G< g
2
) = 1-
1
-
2
= 1-
=
Cuối cùng bằng biến đổi tương đương, ta có:
P(
1
* <
<
2
*) = 1-
=
= 1-
: độ tin cậy
(
1
,
2
) : khoảng tin cậy
I= (
2
*-
1
*) : độ dài của khoảng tin cậy
Người ta thường chọn
1
=
2
=
2
. Nếu chọn
1
=0 và
2
=
hoặc chọn
2
=0
và
1
=
thì ta sẽ có khoảng tin cậy 1 phía.
4
Lý thuyết toán
5
Lý thuyết toán
6
Lý thuyết toán
7
Lý thuyết toán
8
Lý thuyết toán
9
Lý thuyết toán
10
Lý thuyết toán
11
Lý thuyết toán
12
Lý thuyết toán
5.4 Ước lượng tỷ lệ ( Ước lượng tham số p trong phân phối A(p))
Xét một đám đông kích thước N phần tử mang dấu hiệu A. Kí hiệu tỉ lệ
phần tử mang dấu hiệu A trên đám đông là p =
N
M
. Để ước lượng p từ đám
đông ta lấy ra mẫu kích thước n. Kí hiệu n
A
là số phần tử mang dấu hiệu A
có trong n phần tử lấy ra.Khi đó f =
n
n
A
là tỉ lệ phần tử mang dấu hiệu A
trên mẫu. Ta sẽ dùng f để ước lượng p. Khi n đủ lớn, theo mục 4.3.4, chương
4 thì f
N(p,
n
pq
), ở đây ta kí hiệu q= 1- p. Vì vậy ta có:
U =
)1,0(N
n
pq
pf
13
Lý thuyết toán
a. Khoảng tin cậy đối xứng (lấy α
1
= α
2
=
2
)
Với độ tin cậy γ = 1- α cho trước, ta có thể tìm u
2
sao cho:
P(│U│< u
2
) = 1 – α = γ
Thay biểu thức U vào công thức trên, ta có:
P(│f – p│<
.
n
pq
u
2
) = 1 – α = γ
( f –
< p < f +
) = 1 – α = γ
Trong đó :
=
.
n
pq
u
2
là sai số ước lượng. Nếu p chua biết, n khá lớn để tính
ta lấy p
f , khi đó:
Khoảng tin cậy đối xứng của p là (f –
; f +
).
Độ tin cậy của ước lượng là γ = 1 – α.
14
Lý thuyết toán
b. Khoảng tin cậy phải ( lấy α
1
= 0, α
2
= α dùng để ước lượng giá trị tối
thiểu của p).
Ta vẫn dùng thống kê (5.5). Với độ tin cậy γ = 1 – α cho trước ta tìm
được u
α
sao cho:
P( U < u
α
) ≈ 1- α = γ
Từ (5.5) ta có :
P(
n
pq
pf
u
α
) ≈ 1- α = γ
P (f -
n
pq
. u
α
< p) ≈ 1- α = γ
Vì p chưa biết, n lớn ta lấy p ≈ f. Ta có khoảng tin cậy phải của p là :
( f -
.
)1(
n
ff
u
α
; +∞ )
15
Lý thuyết toán
c.Khoảng tin cậy trái ( lấy α
1
= α , α
2
= 0 dùng để ước lượng giá trị tối
đa của p ).
Ta vẫn dùng thống kê (5.5). Với độ tin cậy γ = 1 – α cho trước ta tìm
được u
α
sao cho:
P ( - u
α
< U ) ≈ 1- α = γ
Từ (5.5) ta có :
P ( - u
α
<
n
pq
pf
) ≈ 1- α = γ
P ( p < f +
n
pq
. u
α
) ≈ 1- α = γ
Vì p chưa biết, n lớn ta lấy p ≈ f . Ta có khoảng tin cậy trái cua p là:
( - ∞ ; f +
.
)1(
n
ff
u
α
)
16
Lý thuyết toán
5.5 ước lượng phương sai của đại lượng ngẫu nhiên
phân phối chuẩn
Giả sử ta cần nghiên cứu một dấu hiệu X có phân phối chuẩn với Var(X)
=
2
chưa biết. Để ước lượng
2
, từ đám đông ta lấy ra mẫu W = ( X
1
,
X
2,….
X
n
) . Từ mẫu này ta tìm được
S
2'
.Theo 4.4 ta có :
2
2'
2
)1(
S
n
~
)1(2 n
17
Lý thuyết toán
a. Khoảng tin cậy 2 phía của
2
( lấy α
1
= α
2
=
2
)
Vì
2
~
)1(2 n
, với độ tin cậy γ = 1 – α cho trước, ta có thể tìm được
phân vị
)1(2
2
1
n
và
)1(2
2
n
sao cho:
P (
)1(2
2
1
n
<
2
<
)1(2
2
n
) = 1 – α = γ
Thay biểu thức của
2
vào công thức trên và biến đổi, ta có:
P (
)1(2
2
1
2'
2
)1(2
2
2'
)1()1(
nn
SS
nn
1 – α = γ
Ở đây γ = 1 – α là độ tin cậy.
Khoảng tin cậy của
2
là (
)
)1(
;
)1(
)1(2
2
1
2'
)1(2
2
2'
nn
SS
nn
18
Lý thuyết toán
b. Khoảng tin cậy phải của
2
( lấy α
1
= 0, α
2
= α dùng để ước lượng giá
trị tối thiểu của
2
)
Ta vẫn dùng thống kê (5.9). Với γ = 1 – α cho trước ta tìm được phân
vị
)1(2 n
sao cho:
P (
2
)1(2 n
) = 1 – α = γ
Thay biểu thức của
2
từ (5.9) vào công thức trên và biến đổi , ta có:
P
)
)1(
(
2
)1(2
2'
n
S
n
= 1 – α = γ
Vậy khoảng tin cậy phải của
2
là :
;
)1(
(
)1(2
2'
n
S
n
+∞ )
19
Lý thuyết toán
c. Khoảng tin cậy trái của
2
( lấy α
1
= α , α
2
= 0 dùng để ước lượng giá
trị tối đa của
2
).
Ta vẫn dùng thống kê (5.9). Với γ = 1 – α cho trước ta tìm được phân
vị
)1(2
1
n
sao cho:
P (
)1(2
1
n
<
2
) = 1 – α = γ
Thay biểu thức của
2
từ (5.9) vào công thức trên và biến đổi , ta có:
P
)
)1(
(
)1(2
1
2'
2
n
S
n
= 1 – α = γ
Vậy khoảng tin cậy phải của
2
là :
( -∞ ;
)
)1(
)1(2
1
2'
n
S
n
20
Lý thuyết toán
21
Lý thuyết toán
22
Lý thuyết toán
23
Lý thuyết toán
6.1.4 Các loại sai lầm
2 sai lầm dễ mắc phải
-Sai lầm bác bỏ giả thuyết H
0
khi H
0
đúng
-Sai lầm chấp nhận H
0
khi H
0
sa
24
Lý thuyết toán
6.2: Kiểm định giả thuyết về kỳ vọng toán của một
ĐLNN.
Giả sử ta cần nghiên cứu một dấu hiệu X thể hiện trên một
đám đông. Ký hiệu
,)( XE
2
)( XVar
, trong đó
chưa biết. Từ
một cơ sở nào đó người ta tìm được
0
, nhưng nghi ngờ về điều
này. Với mức ý nghĩa
cho trước, ta cần kiểm định giả thuyết
.00
: H
Từ đám đông ta lấy mẫu: W = (
), ,,
21 n
XXX
và tính được các
đặc trưng mẫu:
n
i
i
X
n
X
1
1
và
2
1
2
)(
1
1
XX
n
S
n
i
i
25