Tải bản đầy đủ (.pdf) (20 trang)

lý thuyết mẫu và ước lượng tham số

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (103.95 KB, 20 trang )


GV. Dương Hoàng Kiệt

1

CHƯƠNG 5
LÝ THUYẾT MẪU VÀ ƯỚC LƯNG THAM SỐ

5.1. MẪU VÀ PHÂN PHỐI MẪU
5.1.1. Đám đông và mẫu
Hàng ngày ta vẫn hay dùng những thao tác cần thiết để chọn lựa
những đối tượng cần cho mục đích nghiên cứu, xem xét và đánh giá. Đơn
giản như nếm thử, hút thử, dùng thử, … Phức tạp hơn, ta đến một trường
Cao Đẳng để mượn sổ theo dõi quá trình thử nghiệm những phương pháp
giảng dạy và học tập mới hay cũng có thể đến các trung tâm lưu trữ số liệu
của một đòa phương để thu thập về những thông tin cần thiết cho các vấn đề
dân số, tỷ lệ sinh, sự phân bố dân cư, tình hình thu nhập, …
Tư tưởng chính ở đây là: Trong thực tế ta cần nghiên cứu một dấu
hiệu
X
nào đó trên một tập hợp
K
có số lượng lớn các phần tử. Tuy nhiên
có thể vì thời gian hạn hẹp, chi phí quá tốn kém hoặc làm hư hỏng các phần
tử của
K
mà ta không thể quan sát hết tất cả các phần tử của
K
, vì vậy
trong thực tế, chúng ta chỉ chọn ra một tập con hữu hạn
n


phần tử để khảo
sát, nghiên cứu, rút ra một số kết luận. Từ những kết luận này ta hy vọng
có một sự đánh giá, ước lượng về dấu hiệu
X
mà ta quan tâm trên
K
.
Tập
K
được gọi là đám đông, các đối tượng trong đám đông gọi là các
phần tử, số lượng các phần tử của
K
gọi là kích thước của đám đông, ký
hiệu là
N
. Việc chọn một tập con từ
K
để quan sát được gọi là phép lấy
mẫu, một tập con được lấy ra gọi là một mẫu. Một mẫu có
n
phần tử gọi là
mẫu có kích thước
n
.
Để nghiên cứu
X
, ta cho tương ứng mỗi phần tử cần quan sát (đã
chọn trong mẫu) của
K
với một số thực

x
. Khi đó với
n
cá thể trong mẫu
sẽ cho ta một bộ
n
số
)
, ,
,
(
2
1
n
x
x
x

và ta gọi đó là một mẫu thống kê. Nếu các phần tử trong mẫu được chọn
ngẫu nhiên thì ta có mẫu thống kê ngẫu nhiên hay gọi tắt là mẫu ngẫu nhiên.

GV. Dương Hoàng Kiệt

2

Chẳng hạn ta nghiên cứu vấn đề
X
về chiều cao của sinh viên Việt Nam thì
ta có thể xác đònh một số yếu tố sau:


Dấu hiệu
X
Chiều cao của sinh viên Việt Nam
Đám đông
K

Tập hợp tất cả sinh viên theo học
tại các trường Đại học, Cao Đẳng,
Viện nghiên cứu, … tại Việt Nam
Chọn mẫu
Chọn
n
sinh viên ngẫu nhiên, gọi
i
x
là chiều cao của sinh viên thứ
i

đã chọn
)
,
1
(
n
i
=
Mẫu thống kê
)
, ,
,

(
2
1
n
x
x
x

Ý nghóa
nghiên cứu
Ước lượng kích thước cho các mẫu
hàng hoá thiết yếu
Bảng 5.1. Các yếu tố liên quan đến chiều cao
X

Như vậy Khoa học Thống kê là sự điều tra, thu thập số liệu sau đó
nghiên cứu, phân tích những thông tin trên mẫu thống kê để rút ra những
dấu hiệu cần nghiên cứu trong đám đông. Chính vì vậy Thống kê có ý nghóa
thực tế to lớn trong đời sống kinh tế, xã hội và khoa học. Nó được ứng dụng
rộng rãi trong dự báo, kiểm tra chất lượng, điều khiển ngẫu nhiên, chẩn
đoán, thăm dò dư luận, …
5.1.2. Nghiên cứu chọn mẫu
Để nghiên cứu mẫu ta thường trải qua các bước theo sơ đồ sau:
Bước 1 Xác đònh mục đích nghiên cứu
Bước 2 Xác đònh đám đông
Bước 3 Xác đònh kích thước mẫu
Bước 4 Lựa chọn phương pháp chọn mẫu
Bước 5 Suy rộng kết luận của mẫu
Bước 6 Rút ra kết luận về đám đông
Bảng 5.2. Các bước nghiên cứu mẫu


GV. Dương Hoàng Kiệt

3

Bước 1 và bước 2 sẽ được xem xét trong từng vấn đề cụ thể. Bước 3
phụ thuộc vào bước 4, bước 4, bước 6 và một số yếu tố cần thiết (về mặt lý
thuyết) và đây là một trong các công việc được chuẩn bò đầu tiên. Vì trên cơ
sở hình thành phương pháp chọn mẫu, để tiến hành lấy mẫu ta phải biết
chọn bao nhiêu phần tử từ đám đông. Nếu chọn ít hơn số lượng cần thiết thì
số liệu phản ánh thiếu trung thực và sai số có thể lớn, còn nếu chọn nhiều
hơn số lượng cần thiết thì có thể mất thời gian, tốn kém, rủi ro cao, … Điều
này được nghiên cứu cụ thể trong phần ước lượng thống kê. Bây giờ ta phải
đònh hình một số phương pháp chọn mẫu ngẫu nhiên.
Dó nhiên mẫu cần chọn phải có tính đại diện cao cho đám đông, khi đó
việc nghiên cứu mẫu sẽ có nhiều khả năng thuận lợi. Muốn vậy mẫu cần
được chọn ngẫu nhiên, do đó dấu hiệu
X
sẽ là một biến ngẫu nhiên xác
đònh trong đám đông. Để chọn được mẫu ngẫu nhiên ta giả đònh phần tử của
đám đông đã có xác suất chọn từ trước (tức là mọi phần tử trong đám đông
đều có đồng khả năng được chọn vào mẫu) và các mẫu có cùng kích thước
thì cũng có cùng xác suất được chọn. Khi đó ta có các cách chọn mẫu ngẫu
nhiên như sau:
)
(
a
Chọn mẫu ngẫu nhiên đơn giản
Đây là phương pháp chọn mẫu đơn giản nhất trong các phương pháp
chọn mẫu ngẫu nhiên. Các phần tử của mẫu được chọn ra từ đám đông bằng

cách bắt thăm, quay số hoặc theo bảng số ngẫu nhiên và có thể được chọn
một lần (chọn không hoàn lại) hoặc chọn nhiều lần (chọn có hoàn lại).
Nếu kích thước mẫu khá bé so với kích thước đám đông thì việc chọn
có hoàn lại và không hoàn lại là như nhau. Phương pháp này có thể cho kết
quả tốt nếu giữa các phần tử trong đám đông không có gì khác biệt nhiều.
Nếu đám đông có các kết cấu phức tạp thì phương pháp này sẽ khó đảm bảo
tính đại diện. Hơn nữa việc đánh số tất cả các phần tử của đám đông sẽ
hoàn toàn không thực tế nếu đám đông có qui mô quá lớn.
)
(
b
Chọn mẫu theo phân nhóm đại diện
Chia tập nền thành những nhóm thuần nhất, sau đó từ mỗi nhóm chọn
một mẫu con ngẫu nhiên. Tập hợp tất cả các mẫu đó cho ta một mẫu phân
nhóm ngẫu nhiên. Mỗi nhóm sẽ có vai trò khác nhau phụ thuộc vào độ quan
trọng của chúng trong đám đông, vì vậy kích thước của mẫu con từng nhóm
cũng được chọn khác nhau.

GV. Dương Hoàng Kiệt

4

Nếu tập nền được phân thành
k
nhóm, nhóm
i
sẽ có
i
n


)
,
1
(
k
i
=
phần tử tham gia vào mẫu, khi đó ta có
k
n
n
n
n
+
+
+
=

2
1

Phương pháp này thực hiện thuận lợi, phân tích số liệu khá toàn diện
và hiệu quả hơn phương pháp lấy mẫu ngẫu nhiên đơn giản. Tuy nhiên
phương pháp đòi hỏi phải có các nguồn thông tin có sẵn và những kiến thức,
kinh nghiệm về đám đông để phân nhóm nên có phần nào dựa vào những
kinh nghiệm phán đoán chủ quan. Vì vậy cần phải đảm bảo nguyên tắc
chung khi phân nhóm, trước hết là đảm bảo tính đồng nhất của tổ, tiếp theo
là số nhóm không được chia quá ít hoặc quá nhiều, cuối cùng kích thước mẫu
con đại diện nhóm phải đủ lớn.
)

(
c
Chọn mẫu phân theo chùm
Nếu đám đông quá lớn, ta chia thành các tập con, chọn ngẫu nhiên
một số tập con làm tập đại diện có kích thước
1
N
,
2
N
, và
k
N
. Khi đó
tổng số cá thể của đám đông mới là:
k
N
N
N
N
+
+
+
=

2
1
0

từ tập đại diện có kích thước

i
N
ta chọn một mẫu có kích thước
i
n

)
,
1
(
k
i
= theo tỷ lệ:
k
k
N
n
N
n
N
n
≈≈≈
2
2
1
1

với
k
n

n
n
n
+
+
+
=

2
1

Phương pháp này có ưu điểm là không cần thiết phải xây dựng một
danh sách tất cả các phần tử trong đám đông như hai phương pháp trên.
Các phần tử được chọn đều nằm tập trung theo từng khu vực nên hạn chế
được thời gian và chi phí đi lại. Tuy nhiên nhược điểm của phương pháp là
có thể tính đại diện của mẫu không cao do sai số chọn mẫu có khả năng phát
sinh lớn hơn khi các cá thể tập trung không phân bố đều.
5.1.3. Bảng phân phối mẫu
)
(
a
Phân phối tần số
Giả sử đám đông có
N
phần tử, từ đó ta chọn được một mẫu có kích
thước
n
. Gọi
i
x

với
n
i
,
1
= là giá trò của phần tử thứ
i
trong mẫu. Nếu
j
i
x
x
j
i



,
thì mẫu thống kê

GV. Dương Hoàng Kiệt

5

)
, ,
,
(
2
1

n
x
x
x

gọi là mẫu đơn.
Trường hợp trong mẫu có nhiều giá trò trùng nhau, nghóa là có
i
n
lần
xuất hiện giá trò
i
x

)
,
1
(
k
i
= thì ta phải có
k
n
n
n
n
+
+
+
=


2
1

do đó
n
k
<
. Một mẫu thống kê như thế gọi là mẫu lặp.
Tuy nhiên trong nhiều trường hợp, chẳng hạn kích thước mẫu lớn và
các giá trò của mẫu khác nhau không nhiều, khi đó để tiện lợi trong tính
toán ta phân các số liệu thành từng khoảng dưới dạng:
)
,
(
); ;
,
(
);
,
(
1
3
2
2
1
k
k
a
a

a
a
a
a


Hoặc
12231
,, ,
kk
aaaaaa



trong đó có
i
n
giá trò của mẫu xuất hiện trong khoảng
)
,
(
1
i
i
a
a

với
k
i

,
1
= . Mẫu như vậy gọi là mẫu phân lớp.
Trong tính toán, để thuận lợi, ta đưa mẫu phân lớp về mẫu lặp bằng
cách đặt:

1
2
ii
i
aa
x


 ,
k
i
,
1
=
)
1
.
5
(

Cụ thể, ta có thể trình bày số liệu thu được khi kiểm tra môn Xác suất
thống kê của
36
sinh viên Trường Đại học Công Nghiệp Thực Phẩm

TP.HCM, kết quả như sau:

1 2 5 5 4 6
5 6 3 4 6 7
6 2 5 4 7 6
3 5 7 9 7 4
3 6 3 6 8 7
8 10 8 9 8 9

Ta có bảng phân phối tần số theo mẫu đơn, mẫu lặp và mẫu phân lớp:

i
x
điểm,

i
n
số sinh viên đạt điểm
i
x
.

GV. Dương Hoàng Kiệt

6

Mẫu lặp Mẫu phân lớp
j
y


j
m

1
[,)
hh
aa


i
q

1 1 1 – 3 3
2 2 3 – 5 8
3 4 5 – 7 12
4 4 7 – 9 9
5 5 9 – 10 4
6 7

7 5
8 4
9 3
10 1

Bảng 5.3. Phân phối tần số theo mẫu đơn, lặp và phân lớp
)
(
b
Phân phối tần suất
Từ bảng phân phối tần số, nếu ta đặt

n
n
f
i
i
= ,
k
i
,
1
=
thì
i
f
được gọi là tần suất xuất hiện của
i
x

)
,
1
(
k
i
= . Khi đó ta có bảng
phân phối tần suất cho mẫu lặp:

X

1

x

2
x

L

k
x

i
f

n
n
1

n
n
2

L

n
n
k


GV. Dương Hoàng Kiệt


7


Nếu số liệu cho ở dạng mẫu đơn thì ta sử dụng bảng trên với
n
k
=

n
i
n
i
,
1
,
1
=

=
. Trường hợp mẫu phân lớp ta sử dụng
)
1
.
5
(
để đưa về mẫu
lặp.
Cụ thể, ta có bảng phân phối tần suất về điểm của
36
sinh viên:


Mẫu lặp Mẫu phân lớp
j
y

j
f

1
[,)
hh
aa


h
t

h
f

1
36
1

1 – 3 2
36
3

2
36

2

3 – 5 4
36
8

3
36
4

5 – 7 6
36
12

4
36
4

7 – 9 8
36
9

5
36
5

9 – 10 9,5
36
4


6
36
7


7
36
5

8
36
4

1
2
hh
h
aa
t



9
36
3

10
36
1


Bảng 5.4. Phân phối tần số theo mẫu lặp và phân lớp
)
(
c
Đa giác đồ và tổ chức đồ
Để có được một hình dạng về phân phối mẫu, người ta thường dùng đồ
thò để biểu diễn bảng phân phối tần số hoặc tần suất.

GV. Dương Hoàng Kiệt

8

Trên hệ trục toạ độ vuông góc
Oxy
ta nối các điểm có toạ độ
(
)
i
i
n
x
,

hoặc







n
n
x
i
i
,
với
i
chạy liên tiếp từ
1
đến
k
. Khi đó ta được một đường
gấp khúc gọi là đa giác đồ.
Cụ thể ta có đa giác đồ về điểm của
36
sinh viên, hình 5.1.

0.000
0.100
0.200
0.300
1 2 3 4 5 6 7 8 9 10

Hình 5.1. Đa giác đồ cho bảng phân phối tần suất theo mẫu lặp

Nếu chia đoạn
]
,
[

1
k
x
x
thành
m
khoảng đều nhau, mỗi khoảng có độ
dài
0
h
, trên mỗi khoảng
j
L
với
m
j
,
1
= ta tính tổng


=
j
j
Lx
jj
n
l

Tiến hành dựng các hình chữ nhật đáy

j
L
và chiều cao
0
h
l
j
. Đồ thò
nhận được gọi là tổ chức đồ của mẫu đã cho. Tổng diện tích của các hình
chữ nhật chính là kích thước của mẫu.
Cụ thể ta có tổ chức đồ về điểm của
36
sinh viên: Bằng cách chia đoạn
[0;10]
thành năm khoảng đều nhau, ta có độ dài mỗi khoảng là
8
,
1
0
=
h
. Ta
có:


GV. Dương Hoàng Kiệt

9

j

L

1 – 2,8 2,8 – 4,6 4,6 – 6,4 6,4 – 8,2 8,2 – 10
j
l

3 8 12 9 4
0
h
l
j

1,67 4,44 6,67 5,00 2,22
Tổ chức đồ về điểm có đồ thò như hình 5.2.
1.67
4.44
6.67
5
2.22
0
2
4
6
8

Hình 5.1. Tổ chức đồ cho bảng phân phối tần suất theo mẫu lặp
5.2. CÁC ĐẶC TRƯNG CỦA MẪU
Giả sử ta quan tâm đến dấu hiệu
X
của đám đông

K
, ta tiến hành
n

phép thử độc lập để xác đònh
n
giá trò của mẫu
)
, ,
,
(
2
1
n
x
x
x
.
Gọi
i
X
là biến ngẫu nhiên chỉ giá trò sẽ thu được ở phép thử thứ
i
với
n
i
,
1
= . Các biến ngẫu nhiên
i

X
độc lập trong toàn bộ và có cùng phân
phối với
X
.
Ta gọi mẫu ngẫu nhiên kích thước
n
từ đám đông là vector ngẫu nhiên
n
chiều
)
, ,
,
(
2
1
n
X
X
X
. Mỗi bộ số
)
, ,
,
(
2
1
n
x
x

x
được gọi là một giá trò
của mẫu ngẫu nhiên.
Chẳng hạn, gọi
X
là biến ngẫu nhiên chỉ số chấm khi gieo ba con xúc
xắc, khi đó mẫu ngẫu nhiên có kích thước
3
=
n
, là vector ba chiều
)
,
,
(
3
2
1
X
X
X
. Còn giá trò của bộ
)
4
;
2
;
1
(
là một kết quả thu được từ mẫu

ngẫu nhiên. Điều này có nghóa gieo con thứ nhất được mặt một chấm, con

GV. Dương Hoàng Kiệt

10

thứ hai được mặt hai chấm và gieo con thứ ba được mặt bốn chấm. Tập hợp
các giá trò có thể xảy ra của mẫu ngẫu nhiên là:
}6,1;6,1;6,1),,({
3
2
1
3
2
1
=== xxxxxx
Một hàm
)
, ,
,
(
2
1
n
x
x
x
g
g
=


xác đònh trên tập giá trò của mẫu ngẫu nhiên
)
, ,
,
(
2
1
n
x
x
x
được gọi là một
thống kê. Tuỳ theo mục đích nghiên cứu mà ta phân loại mẫu ngẫu nhiên là
đònh lượng hay đònh tính. Những thống kê được đưa ra cũng dựa trên sự
phân loại này.
Mẫu đònh lượng là mẫu mà ta quan tâm đến một yếu tố về lượng của
các phần tử, chẳng hạn như khối lượng, chiều dài, … Thường trên mẫu này
ta chỉ quan tâm đến thống kê trung bình mẫu và phương sai mẫu.
Mẫu đònh tính là mẫu mà ta chỉ quan tâm đến các phần tử của nó có
một tính chất A nào đó hay không. Trong trường hợp này ta quan tâm đến
tỷ lệ phần tử có tính chất A trong mẫu gọi là tỷ lệ mẫu.
Để tiện lợi trong việc trình bày, các thống kê đều được xây dựng trên
mẫu lặp, các công thức biểu diễn các thống kê trên mẫu đơn và mẫu phân
lớp được xác đònh tương tự bằng cách dựa vào cách xác đònh trên mẫu lặp.
Nếu số liệu cho ở dạng mẫu đơn thì ta sử dụng cách xây dựng trên mẫu lặp
với
n
k
=


n
i
n
i
,
1
,
1
=

=
. Trường hợp mẫu phân lớp ta sử dụng
)
1
.
5
(

để đưa về mẫu lặp.
)
(
a
Trung bình mẫu
Trung bình mẫu, ký hiệu
X
là thống kê được xác đònh bởi:

1
1

k
ii
i
Xxn
n




(5.2)

với
i
n
là tần số xuất hiện
i
x

)
,
1
(
k
i
= trong mẫu thoả

=
=
k
i

i
nn
1
.
Trung bình mẫu đặc trưng về vò trí và là một số mà các giá trò của
mẫu có xu hướng qui tụ quanh nó. Nếu
µ
=
)
(
X
E

2
)
(
σ=
X
D
thì ta có
kỳ vọng và phương sau của trung bình mẫu là:

GV. Dương Hoàng Kiệt

11

µ=
)
(
X

E

n
XD
2
)(
σ
=
(5.3)

)
(
b
Phương sai mẫu
Phương sai mẫu, ký hiệu
2
X
s là thống kê được xác đònh bởi:


=
−=
k
i
ii
X
Xxn
n
s
1

22
)(
1

(5.4)

với
i
n
là tần số xuất hiện
i
x

)
,
1
(
k
i
= trong mẫu thoả

=
=
k
i
i
nn
1
.
Phương sai mẫu đặc trưng về sự phân tán của giá trò mẫu quanh trung

bình mẫu. Nếu
µ
=
)
(
X
E

2
)
(
σ=
X
D
thì ta có kỳ vọng của phương sai
mẫu là:

22
1
)( σ

=
n
n
sE
X

(5.5)

Nếu đặt

2
2
1
X
s
n
n
S

=
(5.6)

thì
2
S
là thống kê được gọi là phương sai mẫu hiệu chỉnh, xác đònh bằng
công thức tổng quát:


=


=
k
i
ii
Xxn
n
S
1

22
)(
1
1

(5.7)

Lúc này ta có Nếu
µ
=
)
(
X
E

2
)
(
σ=
X
D
thì ta có kỳ vọng của
phương sai mẫu hiệu chỉnh là

2
2
)
(
σ=
S

E

(5.8)

Trong tính toán ta tính phương sai mẫu bằng công thức đơn giản hơn:
)(
2
2
XXs
X
−=
(5.9)

với

=
=
k
i
ii
xn
n
X
1
22
1

(5.10)



GV. Dương Hoàng Kiệt

12

Để thuận lợi trong việc tính toán các thống kê về đơn vò đo, người ta
đặt thêm các thống kê có cùng ý nghóa với phương sai, đó là độ lệch chuẩn
trung bình mẫu là căn bậc hai của phương sai mẫu
2
X
X
ss =
và độ lệch chuẩn hiệu chỉnh trung bình mẫu là căn bậc hai của phương sai
mẫu hiệu chỉnh

2
S
S
=
(5.11)

Độc giả dễ dàng chứng minh được

()
ES


(5.12)

)
(

c
Tỷ lệ mẫu
Nếu
X
là biến ngẫu nhiên có phân phối nhò thức với xác suất gặp
phần tử trong mẫu có tính chất A
)
1
(
=
i
x
bằng
p
thì

n
p
n
m
X ==
(5.13)

được gọi là tỷ lệ mẫu với
n
là kích thước mẫu,
m
là số phần tử trong mẫu
có tính chất A.
Nếu

)
;
1
(
p
B
X

thì
p
p
E
n
=
)
(

n
p
p
pD
n
)
1
(
)(

=
(5.14)


Ví dụ
5.1.
Đo chiều cao của 100 sinh viên năm nhất Trường Cao Đẳng Công
Nghiệp Thực Phẩm TP.HCM ta có bảng thống kê (tính bằng
cm
):
Chiều cao Số sinh viên
146 – 150 10
150 – 154 14
154 – 158 24
158 – 162 28
162 – 166 12
166 – 170 8
170 – 174 4
Tính
X
,
S


n
p
sinh viên có chiều cao thấp nhất là
cm
166
?

GV. Dương Hoàng Kiệt

13


Giải
Cách 1. Xử lý trực tiếp số liệu đã cho. Gọi
i
x
là chiều cao của sinh viên

i
n
là số sinh viên đạt được điểm
i
x
. Đặt
1
2
ii
i
aa
x



Ta có bảng số liệu như sau:

i
x

i
n


ii
xn

2
ii
xn

148

10

1480

219040

152

14

2128

323456

156

24

3744

584064


160

28

4480

716800

164

12

1968

322752

168

8

1344

225792

172

4

688


118336

Tổng 100

15832

2510240


Tính
X
ta dùng
(5.2)

1
115832
158,32
100
k
ii
i
Xxn
n




Tính
S

ta dùng
(5.7)
hoặc có thể dùng
(5.9)(5.11)


2
2510240
25102,4
100
X 
2222
()25102,4(158,32)37,1776
X
sXX


2
100
.37,177637,5531
99
S 
37,55316,1281
S


Tính
n
p
ta dựa vào

(5.13)


GV. Dương Hoàng Kiệt

14

84
0,12
100
n
p


Cách 2. Ta dựa vào cách 1, nhưng số liệu sẽ đơn giản hơn bằng cách
đặt

160
4
i
i
x
y


(5.15)

Ta có bảng số liệu như sau:
i
x


i
n

i
y

ii
yn

2
ii
yn

148

10

3


30


90

152

14


2


28


56

156

24

1


24


24

160

28

0

0

0


164

12

1

12

12

168

8

2

16

32

172

4

3

12

36


Tổng 100


42


250


Tính toán tương tự như trên nhưng chú ý rằng biến ngẫu nhiên cần
tính là
Y
:
42
0,42
100
Y


2
250
2,5
100
Y

2222
()2,5(0,45)0,25
Y
sYY



Từ
(5.15)
ta có
160
4
X
Y

 suy ra
4160
XY


Vậy ta tính được:
4.1604.(0,42)160158,32
XY


22
16.16.0,323637,1776
XY
ss



GV. Dương Hoàng Kiệt

15


2
100
.37,177637,5531
99
S 
37,55316,1281
S


Tính tỷ lệ, làm tương tự.
5.3. ƯỚC LƯNG
Khi chọn mẫu, điều quan trọng không phải nhằm nghiên cứu mẫu đại
diện được chọn ra từ đám đông, mà chính là quan mẫu đó có thể nghiên cứu
được qui luật và trạng thái của đám đông chứa mẫu. Nghóa là dựa vào sự
hiểu biết về thống kê θ (chẳng hạn
)
,
,
n
p
S
X
của mẫu đã tính toán được để
rút ra một số kết luận về thống kê
θ
(tương ứng
p
,
,
σ

µ
) của đám đông.
Việc làm như vậy gọi chung là ước lượng thống kê.
Có hai phương pháp ước lượng:
Ước lượng điểm: chỉ ra
θ
=
θ
0
nào đó để ước lượng
θ
.
Ước lượng khoảng tin cậy: chỉ ra một khoảng
)
;
(
2
1
θ
θ
chứa
θ
sao cho:
α

=
θ
<
θ
<

θ
1
)
(
2
1
P

với
α
là số dương khá gần 0.
5.3.1. Ước lượng điểm
Giả sử cần ước lượng thống kê
θ
của biến ngẫu nhiên
X
từ đám đông
K
. Từ
X
ta chọn mẫu ngẫu nhiên
)
, ,
,
(
2
1
n
X
X

X
có giá trò đại diện là
)
, ,
,
(
2
1
n
x
x
x
. Khi đó ước lượng điểm của
θ
là giá trò
)
, ,
,
(
2
1
n
x
x
x
g

Có nhiều ước lượng θ của
θ
khác nhau, tuy nhiên một ước lượng được

coi là tốt nhất nếu nó thỏa mãn các tiêu chuẩn sau:
)
(
a
Ước lượng không chệch
Thống kê θ được gọi là ước lượng không chệch của thống kê
θ
nếu
θ=θ
)
(
E

)
2
.
5
(

Từ đònh nghóa
)
2
.
5
(
kết hợp với (…) ta dễ dàng nhận thấy nếu θ là
ước lượng không chệch của
θ
thì
0

)
(
=θ−θ
E
,

GV. Dương Hoàng Kiệt

16

nghóa là ước lượng không chệch là ước lượng có sai số trung bình bằng 0.
Từ
)
2
.
5
(
,
)
3
.
5
(

)
4
.
5
(
ta suy ra

n
p
S
X
,
,
2
lần lượt là ước lượng
không chệch cho trung bình
)
(
µ
, phương sai
)
(
2
σ và tỷ lệ
)
(
p
của đám
đông. Trong tính toán khi có mẫu cụ thể, ta lấy
µ≈
X

2
2
σ≈
S


p
p
n


)
(
b
Ước lượng vững
Thống kê θ được gọi là ước lượng vững của thống kê
θ
nếu
1)(lim =ε<θ−θ
∞→
P
n

Điều này có nghóa nếu ta tăng kích thước mẫu
n
lên khá lớn thì θ khá
gần
θ
với xác suất bằng
%
100
.
Theo bất đẳng thức Tchebychev (…) ta có:
2
)
(

1))((
ε
θ
−≥ε<θ−θ
D
EP
Hay
2
)
(
1)))(()((
ε
θ
−≥ε<θ−θ−θ−θ
D
EP
Như vậy nếu θ là ước lượng không chệch của
θ

0
)
(
lim

∞→
D
n
thì
θ là ước lượng vững của
θ

. Từ đây suy ra nếu biến ngẫu nhiên
X
có mẫu

)
, ,
,
(
2
1
n
X
X
X
thỏa
µ
=
)
(
i
X
E

2
)( σ=
i
XD thì
X
là một ước lượng
vững của

µ
. Tương tự, nếu
)
;
(
p
n
B
X

thì
n
p
cũng là một ước lượng vững
của
p
.
)
(
c
Ước lượng hiệu quả
Thống kê θ được gọi là ước lượng hiệu quả của thống kê
θ
nếu θ là
ước lượng không chệch của
θ
và có phương sai bé nhất. Nghóa là:

GV. Dương Hoàng Kiệt


17

θ ước lượng hiệu quả
θ






θ≤θ⇒θ=θθ∀
θ=θ

)'()()'(:'
)
(
DDE
E

Để đánh giá ước lượng ta dùng bất đẳng thức Rao – Cramer sau đây:
Nếu θ là ước lượng không chệch của
θ
thì
)
(
1
)(
θ
≥θ
nI

D
trong đó
)
(
θ
I
là tin lượng Fisher xác đònh bởi
2
),()(






θ
θ∂

=θ XfEI
ở đây
f
là hàm mật độ của
X
.
Từ đây dễ dàng kiểm chứng lại rằng nếu
)
,
(
σ
µ


N
X
thì
X
là ước
lượng hiệu quả của
µ
.
Từ ba tiêu chuẩn trên, người ta tiến hành xây dựng các phương pháp
ước lượng. Trong giáo trình này ta dùng phương pháp hợp lí cực đại, nghóa
là ước lượng θ của
θ
được xây dựng sao cho xác suất để xác đònh được mẫu
ngẫu nhiên là lớn nhất. Để làm điều này ta xây dựng hàm hợp lí
)
,
(
θ
x
L
như
sau:
)
,
(
)
,
(
).

,
(
)
,
(
1
θ
θ
θ
=
θ
n
n
x
f
x
f
x
f
x
L

Khi quan sát được mẫu, ta biết được
n
x
x
x
, ,
,
2

1
. Do đó
)
,
(
θ
x
L
chỉ
còn phụ thuộc vào
θ
. Hàm
)
,
(
θ
x
L
đạt cực đại chỗ nào thì lấy giá trò đó làm
ước lượng cho
θ
.
Ví dụ
5.2.
Tìm một ước lượng hợp lí cực đại cho tỷ lệ sản phẩm hỏng
p

trong một lô hàng có rất nhiều sản phẩm?
Giải
Trước tiên ta quan sát mẫu. Trong lần quan sát đầu tiên, ta đặt






=
tốt phẩm sảnđược lấy nếu
hỏngphẩm sảnđược lấy nếu
X
0
1
1

Ta có bảng phân phối cho
1
X
:

GV. Dương Hoàng Kiệt

18

1
X

0 1
)
(
1
X

p

p

1

p

Hàm mật độ xác suất của
1
X
là:
11
1
1
)1(),(
x
x
pppxf

−=
Tương tự sau
n
lần quan sát ta được mẫu
)
, ,
,
(
2
1

n
X
X
X
. Khi đó
hàm hợp lí là:
∑∑
==

−−−
−=
−−−=
=
n
i
i
n
i
i
nn
xnx
xxxxxx
n
pp
pppppp
p
x
f
p
x

f
p
x
f
p
x
L
11
2211
)1.(
)1( )1(.)1(
)
,
(
)
,
(
).
,
(
)
,
(
111
21

suy ra
)1ln(ln),(ln
1
1

pxnpxpxL
n
i
i
n
i
i








−+







=
==


( )
)
1

(
)(
)1(
1
1
1
),(ln
1
11
p
p
ppn
pp
npx
xn
p
x
p
pxL
p
n
n
i
i
n
i
i
n
i
i



=



=









+







=


=
==


với

=
=
n
i
i
n
x
n
p
1
1
là tỷ lệ sản phẩm hỏng của mẫu vừa lấy.
Do đó
( )
pppxL
p
n
=⇔=


0),(ln .
Mặt khác:

GV. Dương Hoàng Kiệt

19

( )











=


)1(
)
(
),(ln
2
2
pp
p
p
n
p
pxL
p
n


22

)
1
(
)
1
)(
(
)
1
(
p
p
p
p
p
p
n
p
np
n







=



[
]
22
2
)
1
(
)
2
1
)(
(
p
p
p
p
p
p
p
n
n

−−+−−
=


22
2
)
1

(
)
2
(
p
p
p
p
p
p
n
n

+−−
=

Suy ra
( )
0
)1(
)
1
(
)
(
),(ln
22
2
2
2

<


=

−−
=


pp
n
p
p
p
p
n
pxL
p

Nghóa là
)
,
(
ln
p
x
L
đạt cực đại tại
p
p

n
=
, điều này cũng cho ta khẳng
đònh
)
,
(
p
x
L
đạt cực đại tại
p
p
n
=
. Vậy công thức ước lượng là:
p
p
n
=

Đánh giá ước lượng: Ta có

=
=
n
i
i
n
x

n
p
1
1

suy ra
p
p
E
n
=
)
(

n
p
p
pD
n
)
1
(
)(

=
Tin lượng Fisher
)
(
p
I

là:
( )
2
),(ln)(








= pXf
p
EpI

( )
2
1
)1(ln









=

−XX
pp
p
E

( )
2
)1ln()1(ln






−−+


= pXpX
p
E

2
1
1









−=
p
X
p
X
E

GV. Dương Hoàng Kiệt

20


2
)1(








=
pp
pX
E

2

22
)(
)
1
(
1
pXE
p
p


=

22
2
)
1
(
p
p
p
p


=


)
1
(

1
p
p

=
Từ đây ta có một chặn dưới của Rao – Cramer:
)(
)
1
(
)
(
1
n
pD
n
p
p
p
nI
=

=
Vậy
p
p
n
=
là ước lượng hợp lí cực đại của
p

.


×