Giao an thong ke

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (379.58 KB, 55 trang )

học viện khoa học quân sự
Khoa K18

giáo án
môn: Xác suất Thống kê
Bài: Thống kê
Chuyên nghành: TSKT
Đối tợng: Dùng cho đào tạo CN TSKTVTĐ

Giảng viên : Thng tỏ, ths Phm Hong Anh

Hà nội, tháng năm 2013

2

kế hoạch bài giảng
phê duyệt
ngày.. tháng ..năm 200
CH NHIM KHOA

Môn: Xác suất Thống kê
Bài : Thống kê
Đối tợng : Đào tạo CNTSKT

ý định giảng bài
I. Mục đích.
Cung cấp cho học viên các kiến thức về:
- Lý thuyết mẫu, cách mô tả mẫu và các đặc trng mẫu
- Phơng pháp ớc lợng các tham số của ĐLNN
- Cách kiểm định các giả thuyết thống kê

II. Yêu cầu.
Học viên nắm vững các kiến thức đã học, hiểu sâu sắc
các khái niệm, tính chất, các phép toán về lý thuyết mẫu, ớc lợng các tham số và cách kiểm định các giả thuyết thống . Trên
cơ sở đó học viên biết vận dụng vào làm các bài tập liên quan.
III. Nội dung chính, trọng tâm, trọng điểm
- cách mô tả mẫu và các đặc trng mẫu
- Phơng pháp ớc lợng các tham số của ĐLNN bằng khoảng
tin cậy
- Cách kiểm định các giả thuyết thống kê
IV. Thời gian
- Tổng số 22 tiết
- lên lớptiết
- luyện tập.
V. Tổ chức:
- lên lớp 22 tiết
- Thảo luận.
- thực hành...
VI. Địa điểm: Lớp học
VII. Vật chất , tài liệu:
- Giảng viên: Giáo án, giáo trình
- Học viên: giáo trình

3
trình tự giảng bài
st
t
1

2

3

Nội dung

Chơng 1. Lý thuyết mẫu
Bài 1. Khái niệm về đám
đông và mẫu.
Bài 2. Các phơng pháp mô tả
mẫu
Bài 3. Các đặc trng mẫu
quan trọng
Bài 4. Quy luật phân phối
xác suất của một số thống kê
quan trọng

tổ
ng
22
tiế
t

ngà
y

đê
m

Phơng
Vật

pháp
ch
GV
HV ất
Thuy
ết
trìn
h kết
hợp
gợi
mở
và
vấn
đáp

Bài 4. (tiếp theo)
Chơng 2. ớc lợng các tham số
của ĐLNN
Bài 1. Ước lợng điểm
Bài 2.Ước lợng bằng khoảng tin
cậy

4

Bài 2 ( tiếp ) .

5

Bài 2 ( tiếp ) .
Chơng 3. Kiểm định giả

thuyết thống kê
Bài 1. Khái niệm về kiểm
định giả thuyết thống kê

6

thời gian

Bài 2. Kiểm định giả
thuyết về các tham số
Bài2 ( tiếp)
ôn tập thi học phần
Ngày thángnăm
2013
Ngời làm kế hoạch

4
Thng tỏ, ths Phm Hong Anh

Nội dung huấn luyện
Phần II. Thống kê toán

Chơng 1. Lý thuyết mẫu
Bài 1. khái niệm về đám đông và mẫu
1.1. Đám đông
Giả sử ta cần nghiên cứu một hay nhiều dấu hiệu thể hiện
trên một tập hợp gồm N phần tử, thì tập hợp N phần tử này đợc
gọi là đám đông (còn đợc gọi là tổng thể hay tập nền), N đợc
gọi là kích thớc của đám đông.

Dấu hiêu cần nghiên cứu có thể là định lợng hoặc định
tính. Chẳng hạn đối với công nhân một ngành kinh tế thì dấu
hiệu định lợng có thể là mức lơng hàng tháng của công nhân
hoặc bậc thợ còn dấu hiệu định tính có thể là giới tính của
công nhân hoặc khu vực kinh tế công nhân đang làm. Tuy
nhiên dấu hiệu định tính có thể chuyển về dấu hiệu định lợng bằng phơng pháp biến giả (xem chơng 5 (10).
Thông thờng kích thớc N của đám đông là hữu hạn, song
trong trờng hợp số lợng các phần tử của đám đông là quá lớn
hoặc không thể nắm bắt đợc toàn bộ các phần tử của đám
đông thì ta có thể coi kích thớc của đám đông là vô hạn.
Ví dụ 1: Cần nghiên cứu mức tiêu thụ X một loại thực phẩm
của các gia đình ở một quận nội thành Hà Nội trong một tháng
thì đám đông là tập hợp tất cả các gia đình trong quận còn
kích thớc của đám đông là số gia đình trong quận.
Ví dụ 2: Cần nghiên cứu trọng lợng X của các gói hàng do
một máy tự động đóng thì đám đông là tất cả các gói hàng
do máy đóng. Vì máy đã đóng, đang đóng và sẽ đóng nên ta
có thể coi kích thớc của đám đông N = +.
Giả sử trong một đám đông kích thớc N, dấu hiệu định lợng cần nghiên cứu X chỉ có thể nhận các giá trị x 1, , x2,, xk
với các tần số tơng ứng N1, Ni,, Nk. Tất nhiên ta có

k

N i N ,
i 1

trong đó 0 Ni N với i. Theo định nghĩa
suất, ta có P(X=xi) = Ni/N = pi, (i = 1,, k).
rằng X là một ĐLNN và nếu điều tra tất cả
đám đông thì luật phân phối xác suất của

định với bảng phân phối xác suất:

cổ điển về xác
Điều này chỉ ra
các phần tử của
X hoàn toàn xác

5
X
x1.. xi xk
P
p1.. pi pk
Đại lợng ngẫu nhiên X đợc gọi là ĐLNN gốc, phân phối xác
suất của X đợc gọi là phân phối lý thuyết còn các số đặc trng
của X đợc gọi là các tham số của đám đông (hay các tham số
lý thuyết).
1.2. Mẫu
Để nghiên cứu dấu hiệu X thể hiện trên một đám đông
kích thớc N, đáng lẽ ta phải điều tra tất cả các phần tử của
đám đông, nhng điều này thờng không thể thực hiện đợc vì
những lý do:
- Khi N = + , rõ ràng ta không thể điều tra đợc tất cả các
phần tử của đám đông.
- Trong một số trờng hợp các phần tử sau khi nghiên cứu bị
phá huỷ, lúc đó việc nghiên cứu toàn bộ đám đông là vô
nghĩa.
- Điều chủ yếu là khi N lớn việc nghiên cứu toàn bộ đám
đông đòi hỏi nhiều chi phí về vật chất và thời gian.
Vì vậy từ đám đông ngời ta lấy ra một tập hợp nhỏ hơn

gồm n phần tử để nghiên cứu và dựa vào đó mà đa ra những
kết luận về dấu hiệu X trên toàn bộ đám đông. Tập hợp n
phần tử này đợc gọi là mẫu, n đợc gọi là kích thớc mẫu.
1.3. Các phơng pháp chọn mẫu
Vì từ thông tin của mẫu ta sẽ đa ra kết luận về dấu hiệu
cần nghiên cứu trên toàn bộ đám đông nên ta phải lấy mẫu
một cách khoa học sao cho mẫu đại diện một cách khách quan,
trung thực cho đám đông theo dấu hiệu cần nghiên cứu. Nếu
mẫu không đại diện trung thực cho đám đông thì từ những
thông tin thu đợc trên mẫu, ta sẽ có những kết luận sai lệch về
dấu hiệu cần nghiên cứu. Tuỳ từng trờng hợp cụ thể ta có thể áp
dụng một trong những cách chọn mẫu thông dụng sau:
- Chọn ngẫu nhiên đơn giản có hoàn lại
- Chọn ngẫu nhiên đơn giản không hoàn lại
- Chọn điển hình
- Chọn máy móc
Ngoài các cách chọn mẫu trên, còn có nhiều cách lấy mẫu
khác (xem [8]).
Để hiểu đợc thế nào là chọn ngẫu nhiên đơn giản có hoàn
lại, chọn ngẫu nhiên đơn giản không hoàn lại, trớc hết ta đi
nghiên cứu xem thế nào là chọn ngẫu nhiên đơn giản, chọn
ngẫu nhiên đơn giản là cách chọn trong đó các phần tử của
mẫu đợc chọn một cách ngẫu nhiên từng phần tử một từ đám
đông. Ví dụ để đợc một mẫu kích thớc n từ một đám đông
kích thớc N ta có thể tiến hành nh sau: Đánh số các phần tử của

6
đám đông từ 1 đến N. Sau đó viết các số tự nhiên từ 1 đến
N lên N tấm thẻ giống nhau. Xáo trộn đều N tấm thẻ này rồi rút

ngẫu nhiên ra từng thẻ một, rút ra n thẻ. Khi đó những phần tử
nào có số trùng với số ở n thẻ rút ra sẽ là các phần tử của mẫu.
Tuy nhiên trong thực tế để chọn mẫu ngẫu nhiên đơn giản ngời ta k hông dùng thẻ mà thờng dùng các bảng số ngẫu nhiên,
hoặc dùng phần mềm máy tính. Sau đây ta đi nghiên cứu kỹ
hơn từng cách chọn.
a. Chọn ngẫu nhiên đơn giản có hoàn lại là chọn ngẫu nhiên
đơn giản ra từng phần tử một, nhng phần tử thứ hai đợc chọn
sau khi đã trả phần tử thứ nhất vào đám đông, phần tử thứ ba
đợc chọn sau khi đã trả phần tử thứ hai vào đám đông. Mẫu
đợc chọn nh vậy đợc gọi là mẫu lặp.
b. Chọn ngẫu nhiên đơn giản không hoàn lại là chọn ngẫu
nhiên đơn giản ra từng phần tử một, nhng không trả lại đám
đông những phần tử đã đợc chọn (hoặc chọn ngẫu nhiên liền
một lúc cả n phần tử). Mẫu đợc chọn nh vậy gọi là mẫu không
lặp lại.
Nh vậy đối với mẫu lặp, một phần tử có thể đợc chọn
nhiều lần, còn đối với mẫu không lặp, các phần tử đợc chọn
nhiều nhất một lần.
c. Chọn điển hình là cách chọn trong đó mẫu đợc chọn ra
không phải từ toàn bộ đám đông mà từ các bộ phận "điển
hình" của nó. Ví dụ: để kiểm tra chất lợng các sản phẩm đợc
sản xuất từ nhiều máy khác nhau, ngời ta không chọn mẫu từ
kho sản phẩm nói chung, mà chọn từ mỗi lô sản phẩm của mỗi
máy.
d. Chọn máy móc là cách chọn trong đó đám đông đợc
chia ngẫu nhiên ra một số nhóm đúng bằng số phần tử của
mẫu. Sau đó từ mỗi nhóm ta chọn ngẫu nhiên ra một phần tử.
Trong thực tế ngời ta thờng phối hợp các cách chọn mẫu nói
trên. Ngời ta còn chứng minh đợc rằng (xem s3 chơng III) khi
kích thớc của đám đông khá lớn và kích thớc mẫu khá nhỏ so với

kích thớc của đám đông thì cách chọn mẫu có hoàn lại và k
hông hoàn lại cho kết quả xấp xỉ nh nhau. Đặc biệt khi kích
thớc của đám đông N = + thì sự khác biệt giữa hai cách
chọn mẫu trên không còn nữa. Do đó, trong thực tế ngời ta thờng dùng cách chọn mẫu không lặp, nhng lại áp dụng các công
thức của mẫu lặp. Trong giáo trình này, ta giả thiết mẫu đợc
lấy theo cách chọn ngẫu nhiên đơn giản có hoàn lại, còn những
trờng hợp khác ta sẽ nói cụ thể sau.
1.4. Mẫu ngẫu nhiên
Giả sử ta có mẫu kích thớc n. Gọi Xi là giá trị quan sát của
dấu hiệu cần nghiên cứu X thể hiện trên phần tử thứ i của mẫu,

7
i = 1,, n. Vì mẫu lấy từ đám đông theo phơng pháp ngẫu
nhiên đơn giản có hoàn lại nên X i (i = 1,2., n) là các ĐLNN
độc lập có cùng luật phân phối xác suất với ĐLNN gốc X.
Định nghĩa: Mẫu ngẫu nhiên kích thớc n là tập hợp của n
ĐLNN độc lập X1, X2, Xn đợc rút ra từ đại lợng ngẫu nhiên gốc
X và có cùng luật phân phối xác suất với X.
Mẫu ngẫu nhiên kích thớc n đợc ký hiệu là:
W = (X1, X2, Xn)
Trong một lần lấy mẫu. ĐLNN Xi nhận giá trị xi (i = 1, 2,,
n). Tập hợp n giá trị x1, .x2 tạo nên một giá trị của mẫu ngẫu
nhiên W = (X1, X2, Xn) và đợc gọi là một mẫu cụ thể, ký hiệu
là: w = (x1, x2, xn).
Bài 2. các phơng pháp mô tả mẫu
2.1. Dãy số liệu thống kê
Giả sử trong một lần lấy mẫu kích thớc n ta đợc một mẫu cụ
thể nh sau:
w = (x1, x2, xn).

Trong đó xi là giá trị quan sát của dấu hiệu X thể hiện trên
phần tử thứ i của mẫu (i = 1,2,.n).
Dãy các giá trị quan sát x 1, x2, xn đợc gọi là dãy số liệu
thống kê.
Ví dụ: Theo dõi doanh thu của một cửa hàng trong 10 ngày
ta đợc dãy số liệu thống kê (đơn vị là triệu đồng): 10, 15, 9,
12, 8, 11, 14, 13, 16, 11.
2.2. Bảng phân phối thực nghiệm
Dãy số liệu thống kê thu thập đợc còn nhiều và cha đợc
trình bày theo một trật tự nhất định nên gây khó khăn cho
việc nghiên cứu. Vì vậy sau khi đã có dãy số liệu thống kê , ngời ta thờng sắp xếp và hệ thống chúng lại theo thứ tự tăng dần
hoặc giảm dần rồi trình bày chúng dới dạng bảng phân phối
tần số thực nghiệm hoặc bảng phân phối tần suất thực
nghiệm.
a) Bảng phân phối tần số thực nghiệm tổng quát có dạng:
xi (hoặc X)
x1
x2
.. xi
. xk
ni
n1
n2
.. ni
. nk
Trong đó ni(i = 1,2,,k) là tần số của giá trị quan sát x i. Tất
nhiên ta có

k

ni n.
i 1

b) Bảng phân phối tần suất thực nghiệm tổng quát có
dạng:
xi (hoặc X)
x1
x2
.. xi
. xk
fi
f1
f2
.. fi
. fk

8
Trong đó fi = ni / n (i = 1,2,,k) là tần suất của giá trị quan
sát xi. Tất nhiên ta cũng có:
* 0 fi 1 , (i = 1,2,.,k)
*

k

fi 1
i 1

Ví dụ: Kiểm tra đờng kính của 10 trục máy do một máy tự
động sản xuất ra ta có dãy số liệu thống kê (tính theo cm):

19,9; 20,1; 20; 19,9; 20; 19,8; 20; 19,9; 20
Gọi X là đờng kính của các trục máy, khi đó ta có:
- Bảng phân phối tần số thực nghiệm:
X
19,8
19,9
20
20,1
ni
1
3
4
2
Bảng 1.1.
- Bảng phân phối tần suất thực nghiệm:
X
19,8
19,9
20
fi
0,1
0,3
0,4

20,1
0,2

Bảng 1.2
Các bảng phân phối thực nghiệm ở trên còn đợc gọi là các
bảng phân phối thực nghiệm rời rạc

c) Trong trờng hợp ĐLNN X liên tục hoặc nếu X rời rạc nhng
kích thớc mẫu n lớn, các giá trị của X sai khác nhau ít thì ngời
ta chia các giá trị của X ra thành từng lớp. Khi đó bảng phân
phối thực nghiệm có dạng:
Lớp
Trung tâm lớp xi
Tần số ni
Tần suất fi
x1 - x2
x1
n1
f1
.

xi- xi+1
xi
ni
fi

.

xk - xk+1
xk
nk
fk
Trong đó lớp (xi-xi+1) là lớp thứ i: i = 1,2,, k.
xi là trung tâm của lớp thứ i

ni là tần số của lớp thứ i
fi là tần suất của lớp thứ i.
Ví dụ 2: Để theo dõi quá trình làm việc của một máy tự
động ngời ta kiểm tra ngẫu nhiên 100 sản phẩm do máy đó
sản xuất và có bảng phân phối thực nghiệm của chiều dài các
sản phẩm nh sau (đơn vị tính bằng cm).
Lớp
Trung tâm lớp xi
Tần số ni
Tần suất fi
5,78 - 5,80
5,79
14
0,14

9
5,80
5,82
5,84
5,86

-

5,82
5,84
5,86
5,88

5,81

5,83
5,85
5,87

23
29
25
9

0,23
0,29
0,25
0,09

Bảng 1.3
2.3. Hàm phân phối thực nghiệm
Cho X với bảng phân phối tần số thực nghiệm:
X
x1
x2
.. xi
. xk
ni
n1
n2
.. ni
. nk
Giả sử x là số thực bất kỳ. Gọi nx là số các quan sát có giá
trị nhỏ hơn x, n là kích thớc mẫu. Ta thấy rằng nx/n là tần suất
của biến cố (X

nên nx/n cũng thay đổi theo, vậy nx/n là hàm số của biến x.
2.4.1. Định nghĩa: Hàm phân phối thực nghiệm của X, ký
hiệu là F*(x) đợc định nghĩa bởi công thức F*(x) = nx/n
Trong đó x là một số thực bất kỳ.
2.4.2. Tính chất
1/ Giá trị của hàm F*(x) nằm trong khoảng [0,1]
2/ F*(x) là hàm không giảm.
3/ Nếu x1 là giá trị quan sát nhỏ nhất và x k là giá trị quan
sát lớn nhất của biến X trên mẫu thì
F*(x) = 0 với xx1 và
F*(x) = 1 với x > xk.
Ví dụ: Lập và vẽ đồ thị hàm phân phối thực nghiệm của X
cho bởi bảng 2.1.
Ta có:
Với x 19,8 thì nx =0 vì không có giá trị quan sát nào của
X bé hơn x, do đó F*(x) = nx/n =0/10 = 0
Với 19,8 < x 19,9 thì nx =1, do đó F*(x) = nx/n = 1/10
=0,1
Với 19,9 < x 20 thì nx = 1 + 3, do đó F *(x) = nx/n = 4/10
= 0,4
Với 20 < x 20,1 thì nx = 1+3+4 = 8, do đó F*(x) = nx/n =
8/10=0,8
Với x > 20,1 thì nx = 1 + 3 + 4 + 2 = 10, do đó F *(x) = nx/n
=10/10=1
Nh vậy ta có:
F*(x) =
0
khi
x 19,8
0,1

khi
19,80,4
khi
19,9 < x 20,0
0,8
khi
20,0 < x 20,1

10
1
khi
Dới đây là đồ thị của hàm F*(x)

20,1 < x

F*(x)

Hình 1.3.

1
0,
0,
0,
0

19, 19, 20, 20,
8
9 trọng

1
0
Bài 3. các đặc trng mẫu quan

Để nghiên cứu ĐLNN gốc X thể hiện trên một đám đông
kích thớc N, từ đám đông ta rút ra một mẫu ngẫu nhiên kích
thớc n: W = (X1, X2,Xn). Để có thể tiếp tục nghiên cứu, ngời ta
đa ra các đặc trng mẫu. Có hai loại đặc trng.
+ Đặc trng vị trí dùng để nghiên cứu vị trí của các giá trị
của mẫu nh trung bình mẫu, trung vị, mốt
+ Đặc trng phân tán dùng để nghiên cứu tình hình phân
tán của các giá trị của mẫu nh phơng sai mẫu, độ lệch tiêu
chuẩn mẫu, khoảng biến thiên..
Sau đây ta sẽ nghiên cứu các đặc trng mẫu quan trọng
nhất.
3.1. Trung bình mẫu
3.1.1. Định nghĩa: Giả sử từ ĐLNN gốc X ta rút ra một mẫu
ngẫu nhiên kích thớc n: W = (X1, X2, , Xn)
Khi đó trung bình mẫu ký hiệu là X đợc định nghĩa
bằng công thức
1 n
X Xi
n i 1
Ta chú ý rằng trung bình mẫu là một ĐLNN, tuân theo một
quy luật phân phối xác suất nào đó. Khi mẫu ngẫu nhiên nhận
một giá trị cụ thể w = (x 1, x2,, xn) thì trung bình mẫu cũng
nhận một giá trị cụ thể:
1 n
x xi
n i 1

Nếu có bảng phân phối tần số thực nghiệm:
X
x1
x2
.. xi
. xk
ni
n1
n2
.. ni
. nk
k
1
thì x ni xi
n i1

11
3.1.2. Tính chất của trung bình mẫu: Nếu ĐLNN gốc X có
E(X) = và
Var (X) = 2 thì :
E( X ) =
(1.1)
2
và Var ( X ) = /n
(1.2)
Thật vậy, vì X1, X2, , Xn là các ĐLNN độc lập có cùng phân
phối xác suất với X nên: E(Xi) = E(X) = ; Var (Xi) = Var(X) = 2 (i
= 1, 2,, n). Theo các tính chất của kỳ vọng toán và phơng sai
ta có:

1 n
1 n
1
E X E X i E X i n
n
n i 1 n i 1

1 n
1 n
n 2 2
Var X Var X i 2 Var X i 2
n
n
n i 1 n i 1
Nh vậy không phụ thuộc vào quy luật phân phối xác suất
của ĐLNN gốc, kỳ vọng toán của ĐLNN trung bình mẫu
luôn luôn bằng kỳ vọng toán của ĐLNN gốc, còn phơng sai
của ĐLNN trung bình mẫu nhỏ hơn phơng sai của ĐLNN gốc n
lần. Nghĩa là khi n lớn trung bình mẫu phân tán rất ít
xung quanh kỳ vọng toán của đại lợng ngẫu nhiên gốc.
Độ lệch tiêu chuẩn của ĐLNN trung bình mẫu đợc tính
bằng công thức:

X Var X
n
3.2. Trung vị (Median) ( HV có thể tự đọc giáo trình)
Trung vị ký hiệu là Xđ là giá trị nằm ở chính giữa tức là giá
trị chia các số liệu mẫu thành hai phần bằng nhau.

Có hai trờng hợp nh sau:
1. Giả sử ta có ngẫu nhiên W = (X 1, X2,, Xn) sau khi sắp
xếp các giá trị quan sát X1, X2, , Xn theo thứ tự tăng dần ta đợc X1 X2 .. Xn .
+ Nếu n là số chẵn, tức là n = 2q thì trung vị đợc tính
bằng công thức
X q X q1
Xđ =
2
+ Nếu n là số lẻ, tức là n = 2q-1 thì Xđ = Xq
Ví dụ: Quan sát dấu hiệu X trên mẫu kích thớc n = 100 ta
đợc kết quả
X
1
2
3
4
5
6
ni
4
6
22 16 36 16

12
Ta thấy n = 100 là số chẵn n = 2q, suy ra q = 50 nên ta có

X 50 X 51 5 5
Xđ=

5
2
2
2. Nếu mẫu quan sát đợc chia thành lớp thì trung vị đợc
tính bằng công thức:
n

S
2
Xđ =
.h
L
nd
Trong đó L là giới hạn dới của lớp chứa trung vị. n là kích thớc
mẫu
S là tổng tần số của các lớp đứng trớc lớp chứa trung vị.
nd là tần số của lớp chứa trung vị.
h là độ dài của lớp chứa trung vị.

Ví dụ: Tìm trung vị của mẫu cho trong bảng 2.3.
Lớp
Trung tâm lớp xi
Tần số ni
Tần suất fi
5,78 - 5,80
5,79
14

0,14
5,80 - 5,82
5,81
23
0,23
5,82 - 5,84
5,83
29
0,29
5,84 - 5,86
5,85
25
0,25
5,86 - 5,88
5,87
9
0,09
Ta có n/2 = 100/2 = 50 vậy trung vị nằm ở lớp thứ ba. Từ
đó ta có:
xđ = 5,82

50 37
.0,025,83
27

3.3. Mốt (Mode)
Mốt ký hiệu là X0 là giá trị có tần số lớn nhất trong dãy số
liệu mẫu
Có hai trờng hợp sau:
1/ Nếu mẫu cho dới dạng bảng

X
x1
x2
.. xi
. xk
ni
n1
n2
.. ni
. nk
thì giá trị x0 là giá trị của X mà tần số xuất hiện giá trị
đó lớn nhất
Ví dụ: Cho bảng phân phối mẫu
X
15
17
18
19
ni
2
3
4
1

13
thì x0 = 18
2/ Nếu mẫu cho dới dạng lớp thì mốt đợc tính theo công
thức:
d1

.h
X0 = L
d1 d2
trong đó: L là giới hạn của lớp chứa mốt
d1 là hiệu số giữa tần số của lớp chứa mốt và tần số của lớp
đứng trớc
d2 là hiệu số giữa tần số của lớp chứa mốt và tần số của lớp
đứng sau
h là độ dài của lớp chứa mốt.
Ví dụ: Hãy tìm giá trị mốt của mẫu cho trong bảng 5.3.
Ta có:
6
.0,025,832
x0 = 5,82
6 4
3.4. Khoảng biến thiên
Khoảng biến thiên ký hiệu là R, là hiệu số giữa giá trị quan
sát lớn nhất và giá trị quan sát nhỏ nhất.
R = Xmax - Xmin
Nếu các số liệu mẫu đợc chia thành lớp thì khoảng biến
thiên là hiệu số giữa cận trên của lớp cuối cùng và cận dới của lớp
đầu tiên trong dãy phân phối các giá trị của mẫu.
Khoảng biến thiên R cho ta biết mức độ phân tán của các
giá trị của
ĐLNN X nhng cha xét đến tất cả các giá trị mà chỉ xét
đến hai giá trị lớn nhất và bé nhất trong bảng phân phối mẫu.
Việc tính khoảng biến thiên khá đơn giản song không
mang lại nhiều thông tin về độ phân tán của các giá trị của
mẫu nên việc sử dụng nó cũng bị hạn chế.
3.5. Phơng sai mẫu

3.5.1. Định nghĩa: Giả sử từ ĐLNN gốc X ta rút ra một
mẫu ngẫu nhiên kích thớc n:
W = (X1, X2, , Xn)
Khi đó phơng sai mẫu, ký hiệu là S2 đợc định nghĩa bằng
công thức:
1 n
2
2
S = (X i X )
n i 1
3.5.2. Tính chất của phơng sai mẫu: Giả sử Đ LNN gốc
X có E(X)= và Var(X) = 2, khi đó
n 1 2

E(S2) =
(1.3)
n
Thật vậy, ta có:

14
S2

1n
Xi X
n i1

2

2
1n

X

X

i

n i1

2
1n
2
X i 2 X X i X

n i1
2
1n
1n
2
X i 2 X X i X
n i1
n i 1
n
2
1
1n
2
X i X vi X i X
n i1
n i1
2
Vì E(Xi - ) = Var (Xi) = Var (X) = 2 và
2
2
E X Var X
n
Do đó:
2
1 n
2 n 1 2
2
2
2

E S E X i E X

n i 1
n
n
Nh vậy kỳ vọng toán của phơng sai mẫu khác với phơng sai
của Đ LNN gốc. Để khắc phục điều này ngời ta đa ra một tham
số mẫu mới là phơng sai mẫu điều chỉnh.
3.5.3. Phơng sai mẫu điều chỉnh
Định nghĩa: Phơng sai mẫu điều chỉnh ký hiệu là S 2 và
2
1 n
'2
Xi X
đợc định nghĩa bằng công thức: S

n 1 n 1
(1.4)
Khi đó dễ đàng thấy rằng E(S2) = 2
Cũng nh đối với X , ta cần chú ý rằng S2 và S'2 là những Đ
LNN, chúng tuân theo những quy luật phân phối xác suất nào
đó. Khi mẫu ngẫu nhiên nhận một giá trị cụ thể w = (x 1, x2,,
xn) thì phơng sai mẫu cũng nh phơng sai mẫu điều chỉnh
cũng nhận một giá trị cụ thể:
2
1 n
1 n
2
'2

2
(
x

x
)
s

xi x
s = i
và

n i 1
n 1 n 1
2
1k
hoặc
s2 = ni xi x và
n i1
k
2
1
ni xi x
s'2 =

n 1 i1
nếu có bảng phân phối tần số thực nghiệm:
X
x1
x2

.. xi
. xk
ni
n1
n2
.. ni
. nk

Chú ý 1: Biết s2 ta có thể tính s'2 theo công thức:

15
ns2
s' =
n 1
Chú ý 2: Để tính giá trị của phơng sai mẫu ta có thể dùng
trực tiếp công thức trên, nhng để cho đơn giản ngời ta có thể
dùng công thức sau:
2

2
1k
2
s = ni xi x
n i1
2

2
1 k
2
hoặc s ni xi n x
n i 1

Thật vậy, ta có:

2

2
2
1 k
1 k 2
s ni xi x ni xi 2xi x x

n i 1
n i 1
2

2
1 k
1 k
ni x2i 2 x ni xi x
n i 1
n i 1
k
2
2
2
1
1k
2

ni xi 2x x ni x2i x
n i1
n i1
1 k

ni x2i n(x)2

n
i 1

ns2
nên ngời ta thờng tính phơng sai mẫu
n 1
điều chỉnh theo công thức:
2
1 k
2
ni x2i nx
s' =
n 1 i 1

3.5.4. Định nghĩa độ lệch tiêu chuẩn mẫu, độ lệch tiêu
chuẩn mẫu điều chỉnh ( HV có thể tự đọc tài liệu)
Căn bậc hai của phơng sai mẫu S2 đợc gọi là độ lệch tiêu
chuẩn mẫu và đợc ký hiệu là S:
Chú ý 3: Vì s'2 =

1 n

S X i X
n i 1

2

Căn bậc hai của phơng sai mẫu điều chỉnh S2 đợc gọi là
độ lệch tiêu chuẩn mẫu điều chỉnh và đợc ký hiệu là S':

1 n
S'
Xi X
n 1 i 1

2

Còn các giá trị của chúng trên một mẫu cụ thể là những số
xác định, ký hiệu tơng ứng là s và s':

16
2
1 n

s s xi x và
n i 1

2

2
1 n
s' s'
x

x
i
n 1 i 1
2

Đề tính trung bình mẫu và phơng sai mẫu đợc dễ dàng
ngời ta thờng lập bảng tính toán.
Ví dụ: Cho X với bảng phân phối tần số thực nghiệm (bảng
5.1)
X
19,8
19,9

20
20,1
ni
1
3
4
2
Ta lập bảng tính toán (đa về dạng cột) nh sau:
xi
ni
nixi
nixi2
19,8
1
19,8
392,04
19,9
3
59,7
1188,03
20,0
4
80,0
1600,00
20,1
2
40,2
808,02
=
ni= n = 10

nixi = 199,7 nixi2=3988,0
9
Khi đó:

1 n
199,7
x ni xi
19,97
n i 1
10
2
1 k
3988
,09
2
2
s ni x2i x
19,97 0,0081
n i 1
10
0,00810,09
n 2 10
s .0,00810,009
n 1
9
s' 0,0090,03
s'2

Theo chú ý 3, ta có thể tính phơng sai mẫu điều chỉnh
theo công thức:

2
1 k
1
2
2
ni x2i nx 3988
,09 10.19,77 0,009
s' =
n 1 i 1
9
Nh ta đã biết, trong trờng hợp X liên tục hoặc nếu X rời rạc
nhng kích thớc mẫu n lớn, các giá trị của X sai khác nhau ít thì
ngời ta chia các giá trị của X ra thành từng lớp. Khi đó để tính
các đặc trng mẫu ngời ta lấy giá trị trung tâm của mỗi lớp đại
diện cho lớp đó để tính toán.

17
Ví dụ: Hãy tìm trung bình mẫu và độ lệch tiêu chuẩn
mẫu điều chỉnh của chiều dài của các sản phẩm với bảng
phân phối mẫu là bảng (1.3).
Ta có bảng tính toán sau:
xi
ni
nixi
nixi2

5,79
14
81,06
469,3374
5,81
23
133,63
776,3903
5,83
29
169,07
985,6781
5,85
25
146,25
855,5625
5,87
9
52,83
310,1121
100
582,84
3397,0804
=
Vậy

1 n
582,84
x ni xi
5,8284

n i 1
100
2
1 k
1
2
ni x2i nx 3397
,0804 100(5,8284
0,0005630
2
n

1
99
s' =
i 1

s' 0,00056307
0,023729
Bài 4. quy luật phân phối xác suất của một số thống
kê quan trọng
Để nghiên cứu một dấu hiệu X thể hiện trên một đám
đông, từ đám đông ta lấy ra một ngẫu nhiên kích thớc n: W =
(X1, X2, .., Xn). Vì quy luật phân phối xác suất của X thờng
cha biết nên quy luật phân phối xác suất của các Đ LNN X i (i =

1,2,., n) cũng không biết. Song nếu tổng hợp các Đ LNN này lại
thì theo luật số lớn chúng sẽ bộc lộ những quy luật nào đó làm
cơ sở cho những kết luận về Đ LNN gốc X trên đám đông.
Việc tổng hợp mẫu ngẫu nhiên W = (X 1, X2,, Xn) đợc thực
hiện dới một dạng hàm f nào đó của các Đ LNN X 1, X2, ., Xn
hàm này đợc gọi là một thống kê và đợc ký hiệu là G. Nh vậy:
G = f (X1, X2, ., Xn).
Ví dụ: Đ LNN trung bình mẫu. Đ LNN phơng sai mẫu, Đ
LNN phơng sai mẫu điều chỉnh mà ta đã xét đều là những
thống kê và sẽ đợc sử dụng thờng xuyên sau này.
Theo định nghĩa trên, thống kê là một hàm của các Đ
LNN nên nó cũng là một Đ LNN vì vậy ta lại có thể nói về
luật phân phối xác suất cũng nh các số đặc trng của nó. Tất
nhiên với một mẫu cụ thể w = (x1, x2, ., xn) thì thống kê G
cũng nhận một giá trị cụ thể: g= f(x1, x2, ., xn).

18
Sau đây ta sẽ nghiên cứu quy luật phân phối xác suất của
một số thống kê quan trọng, nhờ đó ta có thể có những kết
luận hữu ích về Đ LNN gốc X.
4.1. Trờng hợp Đ LNN gốc X phân phối theo quy luật
chuẩn
Giả sử dấu hiệu cần nghiên cứu X tuân theo quy luật phân
phối chuẩn với E(X) = và Var (X) = 2 (hai tham số này có thể
đã biết hoặc cha biết).
Dới đây ta sẽ sử dụng định lý 2 trong mục Đ6 chơng III:
Nếu các Đ LNN X1, X2,, Xn là độc lập và cùng phân phối
theo quy luật chuẩn thì mọi tổ hợp tuyến tính của
chúng cũng phân phối theo quy luật chuẩn.

4.1.1. Quy luật phân phối xác suất của Đ LNN trung
bình mẫu X
Ta thấy các Đ LNN thành phần X 1, X2,, Xn của mẫu ngẫu
nhiên có cùng quy luật phân phối xác suất với X và độc lập nên
thoả mãn các điều kiện của định lý vừa nêu. Mặt khác trung
bình mẫu:
1 n
X Xi
n i 1
là một tổ hợp tuyến tính của các X 1, X2,, Xn vậy nó cũng
có phân phối chuẩn. Hơn thế nữa ta có:
2
(1.5)
E X vàVar(X ) X ~N(. 2 / n)
n
(Theo định lý 3 mục Đ6 chơng III) ta có thống kê
X
U
~N(0,1)
/ n
(1.6)
4.1.2. Ngời ta chứng minh đợc rằng (xem mục Đ7 chơng
III) thống kê
(n 1)S'2
(1.7)
2
~ 2 (n 1)
2

2

2
1 n
1 n
'2
X

X
X

X
~ 2 (n 1)
vì S
và

i
i
2
n 1 n 1
i1
4.1.3. Theo trên ta có
X
U
~N(0,1) ;
/ n
(n 1)S'2
2

~ 2 (n 1)
2

Nên thống kê:

19
T

X (X )

:
S'/ n / n

(n 1)S'2

2(n 1)

U

~ T(n 1)

(1.8)

n 1
Nh ta đã biết khi n tăng thì quy luật Student hội tụ khá
nhanh về quy luật chuẩn hoá (xem Đ 8 chơng III), do đó khi n >
30 về mặt thực hành ta có thể coi thống kê T phân phối xấp
xỉ chuẩn hóa N(0,1).
4.2. Trờng hợp cha biết quy luật phân phối xác suất của
X nhng kích thớc mẫu n khá lớn (thờng đòi hỏi n> 30)
Vì mẫu W = (X1, X2,, Xn) là ngẫu nhiên, nên theo định lý
giới hạn trung tâm (xem mục Đ 2 chơng IV) ta có:
X
(X )
U
; N(0,1) v U
; N(0,1)
(1.9)
/ n
S'/ n
(U có phân phối xấp xỉ chuẩn hoá N(0,1)
4.3. Quy luật phân phối xác suất của tần suất mẫu
Xét một đám đông gồm N phần tử, trong đó có M phần
tử mang dấu hiệu A. Gọi p là xác suất để rút ngẫu nhiên từ
đám đông đợc một phần tử mang dấu hiệu A thì P(A) = M/N
= p chính là tỷ lệ các phần tử mang dấu hiệu A trên đám
đông. Vì không điều tra cả đám đông nên cha biết p.
Từ đám đông ta lấy ngẫu nhiên ra một mẫu kích thớc n. Gọi
n
nA là số phần tử mang dấu hiệu A trên mẫu khi đó f A là tần

n
suất xuất hiện dấu hiệu A trên mẫu (f chính là tỷ lệ dấu hiệu A
pq
trên mẫu). Theo (5.4) ta có E(f) = p và Var(f) = , trong đó q =
n
1-p.
Theo định lý giới hạn trung tâm (xem mục 3.1. Đ3, chơng V
và mục 2.3 Đ 2 chơng IV) thì khi n lớn (chẳng hạn trong thực tế
ta có thể đa ra điều kiện.
np 5
khibiếtp,

n(1 p) 5
2

nf 10
hoặc
Khi cha biết p)f có phân phối xấp xỉ

n(1 f ) 10
pq
chuẩn. Khi đó ta có thể viết f N(p; . Do đó ta có
n
f p
U
N(0,1)
(1.10)
pq
n

20
Phần đọc thêm 4.3 4.4
4.3. Trờng hợp có hai Đ LNN gốc cùng phân phối theo quy
luật chuẩn
Giả sử ta có hai đám đông, trên đám đông thứ nhất dấu
hiệu cần nghiên cứu là X1 có phân phối chuẩn với E(X1) = 1; Var
(X1) = 12 còn trên đám đông thứ hai dấu hiệu cần nghiên cứu
là X2 cũng có phân phối chuẩn với E(X2) = 2; Var (X2) = 22.
Từ hai đám đông trên ta lấy ra hai mẫu độc lập với kích thớc tơng ứng n1 và n2:
W1 = (X11, X12,., X1n1)
W2 = (X21, X22, ., X2n2)
4.3.1. Trờng hợp X1và X2 cùng có phân phối chuẩn với
2
1 và 22 đã biết
Thống kê X 1 X 2 là một tổ hợp tuyến tính của hai Đ LNN
độc lập cùng phân phối theo quy luật chuẩn vì vậy nó cũng là
Đ LNN phân phối chuẩn với kỳ vọng toán là:
E( X 1 X 2 ) = E( X 1 ) - E( X 2 ) = 1 - 2
và phơng sai là:
12 22
Var ( X 1 X 2 ) = Var (X 1 ) Var(X 2 )
n1 n2
Vì vậy ta có:
(X X 2 ) ( 1 2 )
U 1
~ N(0,1)
2
2
(5.12)

1 2

n1 n2
4.3.2. Trờng hợp X1 và X2 cùng có phân phối chuẩn với
2
1 = 22 = 2 cha biết
(n1 1)S12 (n2 1)S22
2
Vì

~ 2 (n1 n2 2) và
2
2

(X X 2 ) ( 1 2 )
U 1
~ N(0,1) nê n
1
1

n1 n2

T

U
2

/(n1 n2 2)

(X 1 X 2 ) ( 1 2 )
(n1

1)S'12 (n2

n1 n2 2

1)S'22

1
1

n1 n2

~T(n1 n2 2)

(5.13)

21
4.3.3. Nh ta đã biết các thống kê

12

(n1 1)S12

và
12

(n2 1)S22

22
cùng phân phối theo quy luật khi bình phơng với số bậc tự
do tơng ứng là (n1-1) và (n2-1) nên ta có
12
n1 1 S12 . 22
F 2 2 2 ~ F(n1 1);n2 1)
(5.14)
2
S2 . 1
n2 1
(xem Đ 9 chơng III)
4.4.2. Xét hai đám đông: Đám đông thứ nhất gồm N 1
phần tử trong đó có M1 phần tử mang dấu hiệu cần nghiên cứu,
khi đó p1 = M1/N1 là tỷ lệ của các phần tử cần nghiên cứu trên
đám đông thứ nhất. Đám đông thứ hai gồm N 2 phần tử trong
đó có M2 phần tử mang dấu hiệu cần nghiên cứu, khi đó p 2 =
M2/N2 là tỷ lệ các phần tử cần nghiên cứu trên đám đông thứ
hai.
Từ đám đông thứ nhất lấy ra mẫu ngẫu nhiên kích thớc n1
thấy có n1A phần tử mang dấu hiệu cần nghiên cứu, khi đó f 1 =
n1A/n1 là tần suất xuất hiện các phần tử mang dấu hiệu cần
nghiên cứu trên mẫu thứ nhất. Từ đám đông thứ hai lấy ra mẫu
ngẫu nhiên kích thớc n2 thấy có n2A phần tử mang dấu hiệu cần
nghiên cứu, khi đó f2 = n2A/n2 là tần suất xuất hiện các phần tử
mang dấu hiệu cần nghiên cứu trên mẫu thứ hai.

Nh trong mục 5.4.1. khi n1 và n2 lớn thì ta có
pq
pq
f1 N(p1; 1 1 ); f2 N(p2 ; 2 2 ) do đó, thống kê f1 - f2 cũng có
n1
n2
phân phối xấp xỉ chuẩn với các tham số tơng ứng là E(f1 - f2) =
p1 - p2.
p1q1 p2q2

và Var(f1 - f2) =
, trong đó q1 = 1-p1 ; q2 = 1-p2.
n1
n2
Vì vậy ta có:
(f f ) (p1 p2 )
U 1 2
N(0,1)
p1q1 p2q2

n1
n2
22

chơng 2
ớc lợng các tham số của đại lợng ngẫu nhiên

22
Giả sử ta cần nghiên cứu một dấu hiệu X thể hiện trên

một đám đông nào đó, những số đặc trng của X đợc gọi là
các tham số lý thuyết (hay còn gọi là tham số của đám đông)
nh trung bình mẫu của đám đông = E(X), phơng sai mẫu
của đám đông 2=var(X). Những tham số này thờng cha
biết vì ta không chủ trơng điều tra hết cả đám đông. trong
chơng này ta sẽ đi ớc lợng các tham số nói trên.
Để thuận tiện , ta kí hiệu chung cho các tham số của đám
đông cần nghiên cứu là . Giả sử từ đám đông ta lấy ra mẫu
ngẫu nhiên kích thớc n: W = (X1, X2, ., Xn) và từ mẫu này ta
xây dựng một thống kê *= f(X1, X2, ., Xn). Ta sẽ ớc lợng thông
qua *. ơ đây là hằng số, * là một ĐLNN vì là hàm của các
ĐLNN. Có 2 phơng pháp sử dụng * để ớc lợng là ớc lợng điểm
và ớc lợng bằng khoảng tin cậy.
Bài 1. ớc lợng điểm
Để ớc lợng thông qua * khi kích thớc mẫu n khá lớn ta chỉ
việc tính giá trị của thống kê * trên mẫu cụ thể w = (x1,., xn)
rồi lấy *. * đợc gọi là ớc lợng điểm của vì * chỉ cho
một giá trị tơng ứng với một mẫu cụ thể. Rõ ràng chất lợng
của ớc lợng phụ thuộc hoàn toàn vào việc chọn thống kê *. Sau
đây chúng ta xét một số phơng pháp chọn thống kê *.
1.1. Các phơng pháp chọn thống kê *
1.1.1. Phơng pháp hàm ớc lợng (phơng pháp mômen)
Giả sử ta cần ớc lợng tham số của Đ LNN gốc X. Từ đám
đông ta lập ra một mẫu ngẫu nhiên kích thớc n: W = (X1, X2,
., Xn). Ta xây dựng Đ LNN X' với luật phân phối:
X'
X1
X2
. Xn
P

1/n
1/n
1/n
Luật phân phối này đợc gọi là luật phân phối mẫu và nó sẽ
ngày một gần với phân phối lý thuyết khi n ->
Các số đặc trng của Đ LNN X' chính là các đặc trng mẫu
mà ta đã xét trong chơng I nh kỳ vọng toán của X' chính là
trung bình mẫu, phơng sai của X chính là phơng sai mẫu:
1 n
E(X ' ) X i X
n i 1
1 n
Var(X ' ) (X i X )2 S2
n i 1
Theo phơng pháp hàm ớc lợng ta sẽ chọn thống kê * là tham
số mẫu tơng ứng. Cụ thể lấy trung bình mẫu X để ớc lợng

23
trung bình đám đông = E(X), lấy phơng sai mẫu S2 để ớc lợng phơng sai của đám đông 2=var(X) Mà kỳ vọng toán là
mômen gốc cấp 1, phơng sai là mômen trung tâm cấp 2, Nói
chung, theo phơng pháp hàm ớc lợng ngời ta lấy mô men của
phân phối mẫu ớc lợng mô men tơng ứng của phân phối lý
thuyết.
Vì thống kê * = f(X1, X2,, Xn) thực chất là hàm của các Đ
LNN X1, X2,, Xn nên nó còn đợc gọi là hàm ớc lợng của .
1.1.2. Phơng pháp ớc lợng hợp lý tối đa
Giả sử ta đã biết dạng tổng quát của luật phân phối xác
suất của Đ LNN gốc X, nhng luật này phụ thuộc vào một tham số
cha biết. Để ớc lợng từ đám đông ta lấy ra mẫu ngẫu nhiên

kích thớc n: W = (X1, X2,., Xn) ta đi xây dựng hàm hợp lý L với
đối số là tại một giá trị cụ thể của mẫu.
w = (x1, x2 ,.xn):
+ Trờng hợp rời rạc:
L(, x1, , xn) = P(X1 = x1, X2 = x2, , Xn = xn/) =
n

P(X i xi / ) đây chính là xác suất để nhận đợc mẫu cụ thể
i 1

đang xét.
+ Trờng hợp liên tục: Tơng tự nh trong trờng hợp rời rạc ta có:
n

L(, x1,, xn) =

f (x1, )
i 1

trong đó f(x,) là hàm mật độ của X với tham số .
Ta sẽ đi tìm ớc lợng của là *(x1, , xn) sao cho * làm cực
đại hàm hợp lý L(, x1,, xn ), tức là:
L(*, x1,, xn) = max L(, x1,, xn)
Nh vậy ớc lợng hợp lý tối đa của là ớc lợng làm cho xác suất
nhận đợc mẫu cụ thể là lớn nhất (trờng hợp rời rạc).
Vì hàm lôgarit cơ số e (e 2,71828. > 1) là hàm đồng
biến, nên hàm L và hàm lnL đạt cực đại tại cùng một giá trị của
. Giả sử lnL có đạo hàm đến cấp hai theo , để tìm giá trị
của làm cực đại hàm lnL ta làm nh sau:
+ Tìm đạo hàm bậc nhất của lnL theo và giải phơng

trình
ln L , x1,...,xn
0
(1.1)

Giả sử phơng trình này có nghiệm = * (x1, , xn)
+ Tìm đạo hàm bậc hai của lnL theo . Nếu

24
2 lnL

,x1,...,xn

0
*

2
thì * là ớc lợng hợp lý tối đa của . Thờng ta chỉ cần giải
(1.1) là đủ.
Ví dụ 1: Biết X ~ N(, 2), hãy tìm ớc lợng hợp lý tối đa của
các tham số và 2-.
Giả sử có mẫu cụ thể w = (x1, x2, , xn). Lập hàm hợp lý:
1 n
1
2
2
exp
(
x

)
L (, , x1,., xn) =

i

2
( 2 )"
2 i 1

Tìm đạo hàm riêng của lnL theo và theo rồi giải hệ phơng trình:
nx n
ln L 1 n
2 (xi )
0

i 1
2
ln L 1 n
n
3 (xi )2 0

i 1
2
ta đợc = x và = s2. Mặt khác ta có
2 ln L n
20
2

n

3 (xi )2
2
ln L
n
i 1 4
2
và
2

2 s2

2n2
n

(xi )

0
2

i 1

Nh vậy ớc lợng hợp lý tối đa của trung bình đám đông là
trung bình mẫu X , còn của phơng sai của đám đông 2 là phơng sai mẫu S2.

Ví dụ 2: Xét một đám đông kích thớc N trong đó có M
phần tử mang dấu hiệu A khi đó p = M/N là tỷ lệ số phần tử
mang dấu hiệu A khi lấy ngẫu nhiên từ đám đông một phần tử
thì theo mục 3.1. Đ3 chơng IV Đ LNN gốc X tuân theo quy luật
phân phối không - một với tham số là p. Ta lập mẫu ngẫu nhiên
kích thớc n: W = (X1, X2, , Xn) và lập hàm hợp lý cho một giá trị
w = (x1, x2,,xn) của mẫu (cũng nh Đ LNN gốc, xi chỉ có thể
nhận một trong hai giá trị 0 hoặc 1: xi nhận giá trị 1 nếu phần
tử thứ i của mẫu mang dấu hiệu A hoặc nhận giá trị 0 nếu
phần tử thứ i của mẫu không mang dấu hiệu A). Ta có:
L(p, x1,, xn) =

n

px (1
i

p)1 xi

i 1

lnL =

n

xi ln p (1
i 1

xi ) ln(1 p)

25
ln L 1 n
1 n
xi
(xi 1) 0
p
p i 1
1 p i 1
Giải ra ta có:
n
1 n
p = xi A f
n i 1
n
2 ln L
n 0
Dễ dàng thấy rằng
p2
Vì vậy ớc lợng hợp lý tối đa của p là f
Chú ý rằng hàm hợp lý là hàm của chứ không phải là của w
= (x1, x2,xn) vì vậy kết quả sẽ vẫn đúng nếu thay mẫu cụ
thể w = (x1, x2,xn) bằng mẫu ngẫu nhiên W = (X1, X2, , Xn).
Chúng ta thấy rất rõ nhận xét này qua hai ví dụ trên.
Ngoài hai phơng pháp trên còn có những phơng pháp khác
nh phơng pháp Minimax, phơng pháp 2 bé nhất. (xem trang
135 [9]).
Rõ ràng có vô số cách chọn thống kê * dùng làm ớc lợng cho
. Vì vậy chúng ta cần đa ra các tiêu chuẩn để đánh giá chất
lợng của các thống kê *. Dới đây ta sẽ giới thiệu một số tiêu

chuẩn đó.
1.2. Các tiêu chuẩn phản ánh bản chất tốt của ớc lợng
1.2.1. Ước lợng không chệch
Định nghĩa: Thống kê * đợc gọi là ớc lợng không chệch của
nếu
E(*) = . Ngợc lại nếu E(*) 0 thì ta nói * là ớc lợng chệch
của
Ví dụ:
X là ớc lợng không chệch của vì E( X ) =
S2 là ớc lợng không chệch của 2 vì E(S2) = 2
n 1 2
2
Nhng S2 là ớc lợng chệch của 2 vì E(S2) =
n
2
(nh vậy ớc lợng hợp lý tối đa của là ớc lợng chệch).
Vì vậy sau này ta làm việc chủ yếu với S2.
-Nếu * là ớc lợng chệch của song thoả mãn điều kiện:
*
limE( ) thì * đợc gọi là ớc lợng tiệm cận không chệch
n

của
Ví dụ: Dễ dàng nhận thấy rằng S2 là ớc lợng tiệm cận không
chệch của 2
1.2.2. Ước lợng vững

Giao an thong ke

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về