i
LỜI CẢM ƠN
Trong quá trình thực hiện khóa luận tốt nghiệp em đã gặp rất nhiều
khó khăn và bỡ ngỡ. Nếu không có những sự giúp đỡ và động viên của
nhiều thầy cô giáo, bạn bè và gia đình có lẽ em khó có thể hoàn thành
khóa luận này.
Đầu tiên em xin chân thành cảm ơn sâu sắc đến cô giáo Th.S Hoàng
Thị Duyên, người đã chỉ dạy cho em những kiến thức, kinh nghiệm trong
học tập và nghiên cứu khoa học, đã động viên em trong suốt thời gian học
tập, đặc biệt là trong quá trình làm khóa luận.
Em xin chân thành cảm ơn Ban giám hiệu, cán bộ, giảng viên Trường
Đại Học Quảng Bình, giảng viên khoa khoa học tự nhiên đã tận tình giảng
dạy, khích lệ, giúp đỡ em trong suốt quá trình học tập, nghiên cứu.
Xin cảm ơn gia đình, bạn bè đặc biệt là các bạn trong lớp Đại học sư
phạm Toán - K52 đã động viên và giúp đỡ em trong thời gian vừa qua.
Mặc dù đã cố gắng hết sức nhưng do thời gian thực hiện còn bị chi
phối bởi đợt thực tập tốt nghiệp, kiến thức còn hạn chế nên bài khóa luận
chắc chắn không tránh khỏi những thiếu sót. Em mong muốn nhận được
những ý kiến đóng góp quý báu của các thầy cô và các bạn để đề tài được
hoàn thiện hơn.
Sinh viên
Võ Thị Thủy
MỤC LỤC
LỜI CẢM ƠN i
MỤC LỤC 1
MỞ ĐẦU 3
CHƯƠNG 1 MỘT SỐ KIẾN THỨC CHUẨN BỊ 7
1.1 Biến ngẫu nhiên và phân phối xác suất . . . . . . . . . . . 7
1.1.1 Biến ngẫu nhiên . . . . . . . . . . . . . . . . . . . . 7
1.1.2 Phân phối xác suất . . . . . . . . . . . . . . . . . . 8
1.2 Mẫu ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . 17
CHƯƠNG 2 ƯỚC LƯỢNG KHOẢNG 22
2.1 Ước lượng khoảng cho trung bình của một phân phối chuẩn
khi biết phương sai σ
2
. . . . . . . . . . . . . . . . . . . . 24
2.2 Ước lượng khoảng cho trung bình của một phân phối chuẩn
khi chưa biết phương sai σ
2
. . . . . . . . . . . . . . . . . 29
2.3 Ước lượng khoảng cho phương sai σ
2
của một phân phối
chuẩn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.4 Ước lượng khoảng cho hiệu giữa hai giá trị trung bình của
hai phân phối chuẩn . . . . . . . . . . . . . . . . . . . . . 35
2.4.1 Ước lượng khoảng cho hiệu giữa hai giá trị trung
bình của hai phân phối chuẩn khi đã biết phương
sai σ
2
. . . . . . . . . . . . . . . . . . . . . . . . . 35
1
2
2.4.2 Ước lượng khoảng cho hiệu giữa hai giá trị trung
bình của hai phân phối chuẩn khi chưa biết phương
sai σ
2
. . . . . . . . . . . . . . . . . . . . . . . . . 38
2.5 Ước lượng khoảng cho trung bình của biến ngẫu nhiên
Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
2.6 Ước lượng khoảng cho trung bình của hàm phân phối mũ 47
KẾT LUẬN 50
TÀI LIỆU THAM KHẢO 51
3
MỞ ĐẦU
1. Lý do chọn đề tài
Xác suất thống kê là một nghành khoa học hiện đại, nó gần như xuất
phát từ các hiện tượng trong đời sống thực tiễn, hình thành và phát triển
rất nhanh nhằm phục vụ các nhu cầu thực tiễn.
Trong khoa học cũng như trong cuộc sống hằng ngày chúng ta thường
gặp các hiện tượng ngẫu nhiên. Đó là những hiện tượng mà ta không thể
dự đoán một cách chắc chắn rằng chúng xảy ra hay không xảy ra. Nhà
triết học Mỹ Bengiamin Fraklin có nói: "ở nước Mỹ không có gì là chắc
chắn cả, ngoại trừ 2 điều: chắc chắn ai cũng chết và chắc chắn ai cũng
phải nộp thuế".
Ngẫu nhiên hiển diện mọi nơi, mọi lúc tác động đến chúng ta. Ngẫu
nhiên mang lại cho ta cả niềm vui và nổi buồn, cả hạnh phúc và nổi
đau. Ngẫu nhiên đích thị là một phần tất yếu của cuộc sống. Lý thuyết
xác suất là bộ môn toán học nghiên cứu tìm ra các quy luật và đưa ra
các phương pháp tính toán xác suất của các hiện tượng ngẫu nhiên. Lý
thuyết xác suất đã trở thành một nghành toán học quan trọng cả về
phương diện lý thuyết và ứng dụng. Nó là một công cụ không thể thiếu
được mỗi khi cần đánh giá các cơ may, các nguy cơ rủi ro. Nhà toán học
Pháp Laplace ở thế kỷ XIX đã tiên đoán " Môn khoa học này hứa hẹn
trở thành một trong những đối tượng quan trọng nhất của đời sống thực
tế thuộc về những bài toán của lý thuyết xác suất".
Navigation đã nói "Có bao giờ bạn thấy mình gặp may mắn hay rủi
ro? Khi nào may mắn, khi nào rủi ro? Nếu nắm được quy luật này thì
tuyệt vời phải không? Lý thuyết xác xuất đang hướng tới điều đó".
Song hành cùng với sự phát triển của lý thuyết xác xuất, Chúng ta
phải nhắc tới thống kê toán học. Sự ra đời của thống kê toán học bắt
nguồn từ các vấn đề thực tiễn và dựa trên những thành tựu của lý thuyết
4
xác suất. Thống kê toán học đã có bước tiến nhanh với sự đóng góp
của các nhà toán học như: Gantơn (1822 - 1911), Piếcxơn (1857 - 1936),
Cramer, Fisher, Von Neuman
Hiện nay thống kê toán học đã được ứng dụng rộng rãi trong hầu hết
các hoạt động của con người, từ khoa học tự nhiên, kinh tế, nông nghiệp,
y học cho tới các khoa học xã hội và nhân văn. Thông kê giúp chúng ta
phân tích số liệu một cách khách quan, đáng tin cậy, phát hiện ra các tri
thức, thông tin ẩn chứa trong các số liệu đó. Cho nên, chúng ta cần biết
trình bày các số liệu thống kê, cách tính các số liệu đặc trưng của các
số liệu này và hiểu ý nghĩa của chúng. Một nhà xã hội nổi tiếng đã nói
"Thiếu khoa học thống kê, nhà nghiên cứu xã hội khác nào một người
mù mò mẫn trong căn nhà kho tối đen để tìm một con mèo đen đã không
còn ở đó nữa".
Thống kê toán học cung cấp các phương pháp thu thập, xử lí và diễn
giải các phân tích về dân số, kinh tế, giáo dục để từ đó có thể vạch
chính sách và ra các quyết định đúng đắn. Ngay đầu thế kỉ XX, nhà triết
học người Anh, H.G.Well đã dự báo "Trong một tương lai không xa, kiến
thức thống kê và tư duy thống kê sẽ trở thành một yếu tố không thể
thiếu được trong học vấn phổ thông của mỗi công dân, giống như là khả
năng biết đọc, biết viết vậy".
Như vậy, để đáp ứng nhu cầu cuộc sống hiện đại thì thống kê và tư duy
thống kê là một điều không thể thiếu đối với bất kì ai, dù công việc của
người đó có liên quan trực tiếp đến các phương pháp thống kê hay không.
Ước lượng khoảng cho các tham số là một trong những bài toán cơ
bản của thống kê toán học. Khi nghiên cứu đặc tính X của mỗi cá thể
của tổng thể thì một trong những mục tiêu cơ bản của việc nghiên cứu
là xác định các tham số đặc trưng của tổng thể như trung bình, phương
sai, cơ cấu của tổng thể theo dấu hiệu nghiên cứu. Đó là những chỉ tiêu
tổng hợp để phân tích tổng thể cần nghiên cứu.
Nếu xác định được quy luật xác suất của X thì việc đưa ra các đánh
5
giá cũng như các dự báo về sự biến động của tổng thể liên quan đến đặc
tính này sẽ chính xác và khách quan. Tuy nhiên không phải lúc nào chúng
ta cũng xác định được quy luật của X. Trong một số trường hợp, ta chỉ
biết được dạng toán học của hàm phân phối hoặc hàm mật độ của biến
định lượng X mà chưa biết các tham số có mặt trong chúng. Vì vậy để
xác định quy luật xác suất của X trước hết ta phải đưa ra những đánh
giá về tham số này. Bài toán ước lượng khoảng cho các tham số của phân
phối xác suất sẽ giúp chúng ta giải quyết vấn đề này.
Với những lý do trên, chúng tôi đã chọn đề tài cho khóa luận
Ước lượng khoảng.
2. Mục đích nghiên cứu
Mục đích của khóa luận này là giới thiệu cách xây dựng các ước lượng
khoảng cho các tham số trong một số phân phối nhất định, và đưa ra
một số ví dụ để làm rõ cho từng trường hợp cụ thể. Để từ đó trang bị
cho các học sinh, sinh viên vốn kiến thức cơ bản về ước lượng khoảng.
Thông qua ví dụ, giúp các bạn hiểu rõ hơn.
3. Đối tượng và phạm vi nghiên cứu
• Đối tượng nghiên cứu: Nghiên cứu về cách xây dựng các ước lượng
khoảng cho các tham số với các phân phối nhất định.
• Phạm vi nghiên cứu: Lý thuyết xác suất, xác suất thống kê toán.
4. Phương pháp nghiên cứu
Các phương pháp được sử dụng trong quá trình nghiên cứu đề tài:
- Phương pháp nghiên cứu lý luận: Đọc, phân tích, tổng hợp tài liệu
làm rõ nội dung lý thuyết. sau đó trình bày lại các nội dung theo một hệ
6
thống lôgic.
- Phương pháp tổng kết kinh nghiệm: Tổng kết kinh nghiệm của bản
thân, của các bạn học, anh chị học trước để tổng hợp và hệ thống hóa
kiến thức, vấn đề nghiên cứu đầy đủ và khoa học kết hợp với việc đưa ra
các ví dụ cụ thể để minh họa chi tiết.
- Phương pháp lấy ý kiến chuyên gia: Xemina, tiếp thu ý kiến của
giảng viên hướng dẫn để hoàn thành về mặt nội dung cũng như hình thức
của khóa luận.
5. Bố cục đề tài
Ngoài phần mở đầu, kết luận và tài liệu tham khảo, nội dung đề tài
khóa luận được chia thành hai chương, trong đó, nội dung chính của khóa
luận được trình bày ở chương 2.
Chương 1: Một số kiến thức chuẩn bị
Chương này là hệ thống gồm một số khái niệm, định nghĩa và mệnh
đề cơ bản về biến ngẫu nhiên và phân phối xác suất, mẫu ngẫu nhiên
cùng với một số hệ quả, định lý có liên quan trực tiếp đến việc nghiên
cứu cho chương sau.
Chương 2: Ước lượng khoảng
Chương này nghiên cứu về các vấn đề của ước lượng khoảng và đưa ra
cách xây dựng các ước lượng khoảng cho các tham số với các phân phối
khác nhau và đưa ra một số ví dụ minh họa làm rõ vấn đề cần nghiên
cứu.
CHƯƠNG 1
MỘT SỐ KIẾN THỨC CHUẨN BỊ
Trong chương này, chúng tôi trình bày một số khái niệm và kết quả
cơ bản của biến ngẫu nhiên và phân phối xác suất, mẫu ngẫu nhiên làm
cơ sở để xây dựng cho chương 2 của khóa luận. Các kiến thức ở chương
này, chúng tôi trích dẫn trong các tài liệu [5], [6], [7], [9].
1.1 Biến ngẫu nhiên và phân phối xác suất
1.1.1 Biến ngẫu nhiên
Định nghĩa 1.1.1. Một ánh xạ X từ không gian các sự kiện ngẫu nhiên
cơ bản Ω vào R gọi là một biến ngẫu nhiên.
X : Ω → R
ω → X(ω).
Tập X = {X(ω)|ω ∈ Ω} gọi là tập giá trị của biến ngẫu nhiên X.
Ví dụ 1.1.2. Các đại lượng sau đây là các biến ngẫu nhiên.
• Gọi X là số lần xuất hiện mặt sấp trong 1 lần gieo đồng tiền cân
đối và đồng chất thì X là biến ngẫu nhiên. Giá trị của X là: 0; 1.
• Gọi X là số viên đạn trúng đích khi bắn n viên đạn độc lập vào một
mục tiêu thì X là biến ngẫu nhiên với giá trị 0, 1, , n.
7
8
1.1.2 Phân phối xác suất
Định nghĩa 1.1.3. Hàm phân phối xác suất của một biến ngẫu nhiên X
được định nghĩa bởi
F
X
(x) = P {X ≤ x}.
Đó là một hàm đơn điệu tăng, liên tục phải và
lim
x→−∞
F
X
(x) = 0, lim
x→+∞
F
X
(x) = 1.
Định nghĩa 1.1.4. Biến ngẫu nhiên X được gọi là biến ngẫu nhiên rời
rạc nếu tập các giá trị của X là một tập hợp hữu hạn hoặc đếm được.
Định nghĩa 1.1.5. Biến ngẫu nhiên X gọi là biến ngẫu nhiên liên tục
nếu hàm phân phối xác suất của X được biểu diễn dưới dạng
F (x) =
x
−∞
f(t)dt,
trong đó, f(t) ≥ 0. Hàm f (t) được gọi là hàm mật độ của biến ngẫu
nhiên X. Khi đó, hàm phân phối F (x) được gọi là hàm phân phối tuyệt
đối liên tục.
Mệnh đề sau nói lên mối liên hệ giữa hàm mật độ và hàm phân phối
của X.
Mệnh đề 1.1.6.
i, F (x) = P (X ≤ x) =
x
−∞
f(t)dt.
ii, f(x) =
dF (x)
dx
, nếu x là điểm liên tục của f(x).
Định nghĩa 1.1.7. Véctơ X = (X
1
, X
2
, , X
n
) mà các thành phần
X
1
, X
2
, , X
n
là các biến ngẫu nhiên được gọi là véctơ ngẫu nhiên n
9
chiều. Các biến ngẫu nhiên X
1
, X
2
, , X
n
được gọi là các tọa độ của
véctơ ngẫu nhiên X.
F
X
1
,X
2
, ,X
n
(x
1
, x
2
, , x
n
) = P (X
1
< x
1
, X
2
< x
2
, , X
n
< x
n
)
được gọi là hàm phân phối của véctơ ngẫu nhiên (X
1
, X
2
, , X
n
) hay là
hàm phân phối đồng thời của các biến ngẫu nhiên X
1
, X
2
, , X
n
.
Định nghĩa 1.1.8. Véctơ ngẫu nhiên (X
1
, X
2
, , X
n
) là véctơ ngẫu nhiên
rời rạc nếu các tọa độ của nó là những biến ngẫu nhiên rời rạc.
Định nghĩa 1.1.9. Hàm phân phối F(x
1
, , x
n
) của véctơ ngẫu nhiên
(X
1
, X
2
, , X
n
) có dạng
F (x
1
, x
2
, , x
n
) =
x
1
−∞
x
2
−∞
x
n
−∞
f(u
1
, u
2
, , u
n
)du
1
du
2
du
n
,
trong đó f (u
1
, u
2
, , u
n
) ≥ 0. Hàm f(u
1
, u
2
, , u
n
) được gọi là hàm mật độ
xác suất của véctơ ngẫu nhiên (X
1
, X
n
) và véctơ ngẫu nhiên (X
1
, X
n
)
được gọi là véctơ ngẫu nhiên liên tục.
Định nghĩa 1.1.10. Các biến ngẫu nhiên X
1
, X
n
được gọi là độc lập
nếu
F
X
1
, X
n
(x
1
, x
2
, , x
n
) = F
X
1
(x
1
)F
X
2
(x
2
) F
X
n
(x
n
).
Các đặc trưng của phân phối cho chúng ta một lượng thông tin nào
đó về biến ngẫu nhiên tương ứng. Chúng ta xét một số đặc trưng thường
dùng sau.
Định nghĩa 1.1.11. Kì vọng của biến ngẫu nhiên X, kí hiệu là E(X)
được xác định như sau
i, Nếu X là biến ngẫu nhiên có hàm phân phối F (x) thì
E(X) =
+∞
−∞
xdF (x).
10
ii, Nếu X là biến ngẫu nhiên rời rạc nhận các giá trị x
1
, , x
n
với các xác
suất tương ứng p
1
, , p
n
thì
E(X) =
n
x
n
p
n
.
iii, Nếu X là biến ngẫu nhiên liên tục có hàm mật độ f (x) thì
E(X) =
+∞
−∞
xf(x)dx.
Định nghĩa 1.1.12. Cho biến ngẫu nhiên X có kì vọng E(X). Nếu tồn
tại E(X − E(X))
2
thì
D(X) = E(X −E(X))
2
được gọi là phương sai của biến ngẫu nhiên X và
σ(X) =
D(X)
được gọi là độ lệch chuẩn của X.
Nhận xét 1.1.13.
i, Nếu X là biến ngẫu nhiên có hàm phân phối F (X) thì
D(X) =
+∞
−∞
(x − µ)
2
dF (x) với µ = E(X).
ii, Nếu X là biến ngẫu nhiên rời rạc và p
n
= P (X = x
n
) thì
D(X) =
n
(x
n
− µ)
2
p
n
với µ =
n
x
n
p
n
.
iii, Nếu X là biến ngẫu nhiên liên tục với hàm mật độ f(x) thì
D(X) =
+∞
−∞
(x − µ)
2
f(x)dx
trong đó, µ =
+∞
−∞
xf(x)dx.
11
Định nghĩa 1.1.14. Cho biến ngẫu nhiên X và µ ∈ R. Ta gọi
E(X −µ)
k
, (k ≥ 0)
là môment bậc k có gốc µ của biến ngẫu nhiên X.
Và biểu thức E(| X − µ |
k
) là môment tuyệt đối cấp k có gốc µ của X.
Nếu µ = 0 thì gọi E|X|
k
là môment tuyệt đối cấp k.
Nếu µ = E(X) thì ta gọi
E(X −E(X))
k
là môment trung tâm cấp k của biến ngẫu nhiên X.
Trong phần này, chúng tôi cũng đưa ra một số quy luật phân phối
xác suất quan trọng áp dụng cho Chương 2
Định nghĩa 1.1.15. (Luật phân phối nhị thức - B(n, p))
Biến ngẫu nhiên X được gọi là có phân phối nhị thức với tham số n, p và
kí hiệu X ∼ B(n, p), n ∈ N
∗
nếu X nhận các giá trị 0, 1, 2, , n với xác
suất tương ứng là
p
k
= P (X = k) = C
k
n
p
k
(1 − p)
n−k
, k = 0, 1, 2, , n.
Mệnh đề 1.1.16. Nếu X ∼ B(n, p), thì
EX = np;
DX = npq.
12
Chứng minh. Ta cã
EX =
n
k=0
k.C
k
n
p
k
(1 − p)
n−k
=
n
k=0
k.
n!
k!(n − k)!
p
k
(1 − p)
n−k
=
n
k=1
k.
n!
(k − 1)!(n − k)!
p
k
(1 − p)
n−k
= np
n
k=1
.
n!
(k − 1)![(n − 1) − (k − 1)]!
p
k−1
(1 − p)
(n−1)−(k−1)
= np
n−1
i=0
.
(n − 1)!
i![(n − 1) − i]!
p
i
(1 − p)
(n−1)−i
, (đặt k − 1 = i).
= np
n−1
i=0
.C
i
n−1
p
i
(1 − p)
(n−1)−i
= np, (vì
n
k=0
C
k
n
p
k
(1 − p)
n−k
= 1).
Ta cũng có
E[X(X − 1)] =
n
k=0
k(k − 1).C
k
n
p
k
(1 − p)
n−k
=
n
k=2
n!
(k − 2)!(n − k)!
p
k
(1 − p)
n−k
= n(n − 1)p
2
.
Do đó
E(X
2
− X) = n(n −1)p
2
.
EX
2
− EX = n(n −1)p
2
.
EX
2
= n(n − 1)p
2
+ np = n
2
p
2
− np
2
+ np.
Suy ra
DX = E(X
2
) − (EX)
2
= −np
2
+ np = np(1 − p) = npq.
Định nghĩa 1.1.17. (Quy luật 0 -1)
Biến ngẫu nhiên X nhận các giá trị 0, 1 với các xác suất tương ứng q, p
(q + p = 1) được gọi là biến ngẫu nhiên tuân theo quy luật 0 -1 với tham
số p.
P (X = x) = p
x
(1 − p)
1−x
.
13
Các số đặc trưng là
E(X) = 0.(1−p)+1.p = p và D(X) = (0−p)
2
(1−p)+(1−p)
2
p = p(1−p).
Tham số p của quy luật 0 -1 là kì vọng.
Định nghĩa 1.1.18. (Luật phân phối Poisson - P (λ))
Biến ngẫu nhiên X tuân theo quy luật Poisson với tham số λ > 0, kí hiệu
X ∼ P (λ) nếu
P (X = k) = e
−λ
λ
k
k!
, k = 0, 1, 2,
Mệnh đề 1.1.19.
X ∼ P (λ) ⇒ EX = DX = λ.
Chứng minh. Từ công thức khai triển hàm e
x
e
x
=
+∞
k=0
x
k
k!
ta có
e
λ
=
+∞
k=0
λ
k
k!
.
Khi đó
+∞
k=0
P
X
(k) = e
−λ
+∞
k=0
λ
k
k!
= e
−λ
.e
λ
= e
0
= 1.
Áp dụng, ta có
EX =
+∞
k=0
k.e
−λ
λ
k
k!
= e
−λ
+∞
k=1
k
λ
k
k!
= e
−λ
+∞
k=1
λ
k
(k − 1)!
= e
−λ
+∞
k=1
λ
k−1
(k − 1)!
.
= e
−λ
+∞
i=0
λ
i
i!
, (đặt k − i = 1)
= λe
−λ
.e
λ
= λ.
14
Ta cũng có
E[X(X − 1)] = E[(X
2
− X)] = λ
2
.
Do vậy
E(X
2
) = E[(X
2
− X)] + EX = λ
2
+ λ
DX = E(X
2
) − (EX)
2
= λ.
Định nghĩa 1.1.20. (Phân phối mũ - E(λ), λ > 0)
Biến ngẫu nhiên X có phân phối mũ với tham số λ > 0, kí hiệu X ∼ E(λ)
nếu hàm mật độ xác suất của X có dạng
f(x) =
λe
−λx
, x ≥ 0
0 , x < 0.
Mệnh đề 1.1.21. Cho X ∼ E(λ), khi đó
i, Hàm phân phối F (x) = 1 −e
−λx
, x > 0.
ii, EX =
1
λ
; DX =
1
λ
2
.
Chứng minh.
i, EX =
+∞
−∞
xf(x)dx =
+∞
0
λxe
−λx
dx = −xe
−λx
|
+∞
0
+
+∞
0
e
−λx
dx
= −(xe
−λx
+
1
λ
e
−λx
) |
+∞
0
=
1
λ
.
ii, E(X
2
) =
+∞
−∞
x
2
f(x)dx =
+∞
0
λx
2
e
−λx
dx = −x
2
e
−λx
|
+∞
0
+2
+∞
0
xe
−λx
dx
= 0 +
2
λ
+∞
0
λxe
−λx
dx =
2
λ
.
1
λ
=
2
λ
2
.
nên DX = E(X
2
) − (EX)
2
=
2
λ
2
− (
1
λ
)
2
=
1
λ
2
.
15
Nhận xét 1.1.22. Cho X
1
, X
2
, , X
n
là các biến ngẫu nhiên độc lập có
phân phối mũ với trung bình λ. Khi đó biến ngẫu nhiên
n
i=1
X
i
có phân
phối Khi-bình phương với tham số n,
1
θ
Định nghĩa 1.1.23. (Phân phối chuẩn N(µ, σ
2
))
Biến ngẫu nhiên X tuân theo quy luật chuẩn, kí hiệu X ∼ N(µ, σ
2
) với
tham số µ và σ
2
nếu hàm mật độ xác suất của nó có dạng
f(x) =
1
σ
√
2π
e
−
(x − µ)
2
2σ
2
.
Mệnh đề 1.1.24. Nếu X ∼ N(µ, σ
2
) thì
EX = µ và DX = σ
2
.
Chứng minh.
EX =
+∞
−∞
xf(x)dx =
+∞
−∞
[µ + (x − µ)]f(x)dx
= µ
+∞
−∞
f(x)dx +
+∞
−∞
(x − µ).
1
σ
√
2π
e
−
(x − µ)
2
2σ
2
dx
= µ.1 + I, với
I =
1
√
2π
+∞
−∞
(x − µ)
σ
e
−
(x − µ)
2
2σ
2
dx, đặt t =
(x − µ)
σ
,
=
σ
√
2π
+∞
−∞
te
−
t
2
2
dt = 0.
16
Vậy EX = µ.
DX = E(X − EX)
2
= E(x − µ)
2
=
+∞
−∞
(x − µ)
2
f(x)dx
=
1
σ
√
2π
+∞
−∞
(x − µ)
2
e
−
(x − µ)
2
2σ
2
dx ; đặt t =
x − µ
σ
√
2
,
=
1
σ
√
2π
+∞
−∞
2σ
2
t
2
e
−t
2
√
2σdt =
2σ
2
√
π
+∞
−∞
t
2
e
−t
2
dt
=
4σ
2
√
π
+∞
0
t
2
e
−t
2
dt.
Đổi biến t =
√
u ⇒ dt =
du
2
√
u
.
=
2σ
2
√
π
+∞
0
u
1
2
e
−u
du
=
2σ
2
√
π
[−u
1
2
e
−u
|
+∞
0
+
1
2
+∞
0
u
−
1
2
e
−u
du] =
σ
2
√
π
+∞
0
u
−
1
2
e
−u
du.
Áp dụng công thức tích phân trong giải tích toán học
+∞
0
x
−
1
2
e
−x
dx =
√
π.
Ta thu được kết quả DX = σ
2
.
Định nghĩa 1.1.25. (Phân phối Khi-bình phương).
Cho X
1
, X
2
, , X
n
là n biến ngẫu nhiên độc lập và có cùng phân phối
chuẩn hóa N(0; 1). Khi đó biến ngẫu nhiên
X = X
2
1
+ X
2
2
+ + X
2
n
17
được gọi là có phân phối Khi-bình phương với n bậc tự do. Chúng ta kí
hiệu
X ∼ χ
2
n
để chỉ rằng X có phân phối Khi-bình phương với n bậc tự do.
Phân vị mức α của biến ngẫu nhiên X có phân phối Khi-bình phương
với n bậc tự do là giá trị χ
2
α,n
của X thỏa mãn
P
X < χ
2
α,n
= α.
Tính chất 1.1.26. Nếu X
1
, X
2
là hai biến ngẫu nhiên độc lập có phân
phối tương ứng χ
2
n
1
và χ
2
n
2
thì X
1
+ X
2
có phân phối χ
2
n
1
+n
2
Định nghĩa 1.1.27. (Phân phối Student - Phân phối t)
Cho X và Y là các biến ngẫu nhiên độc lập tương ứng có phân phối
chuẩn N(0; 1) và phân phối Khi-bình phương với n bậc tự do. Khi đó
phân phối xác suất của biến ngẫu nhiên
T =
X
Y
n
được gọi là phân phối Student (hay phân phối t) với n bậc tự do.
Phân vị mức α của biến ngẫu nhiên T có phân phối Student với n
bậc tự do là số t
α,n
thỏa mãn
P {T < t
α,n
} = α.
1.2 Mẫu ngẫu nhiên
Định nghĩa 1.2.1. Cho X là biến ngẫu nhiên. Mẫu ngẫu nhiên từ X
là một véctơ ngẫu nhiên n chiều (X
1
, , X
n
) trong đó các thành phần là
các biến ngẫu nhiên độc lập với nhau và có cùng phân phối với X.
18
Từ định nghĩa, ta có hàm phân phối đồng thời là
F
n
(x
1
, x
2
, , x
n
) =
n
i=1
F (x
k
).
Ví dụ 1.2.2. Cho X
1
, , X
n
là mẫu ngẫu nhiên từ X ∼ P (λ), λ > 0 thì
hàm phân phối xác suất của véctơ (X
1
, , X
n
) là
P
n
(x
1
, , x
n
) =
n
i=1
P (X
i
= x
i
) =
n
i=1
(e
−λ
λ
x
i
X
i
!
)
= e
−nλ
λ
x
1
+ +x
n
x
1
! x
n
!
, x
1
, , x
n
∈ N.
Ví dụ 1.2.3. Cho X
1
, , X
n
là mẫu ngẫu nhiên từ phân phối mũ E(λ), λ >
0 thì hàm mật độ của véctơ (X
1
, , X
n
) là
f
n
(x
1
, , x
n
) =
n
i=1
f(x
i
) =
n
i=1
λe
−λx
i
= λ
n
e
−λ(x
1
+ +x
n
)
, x
1
> 0, , x
n
> 0.
Định nghĩa 1.2.4. F
n
(x) gọi là hàm phân phối thực nghiệm tương ứng
với mẫu (X
1
, , X
n
) nếu
F
n
(x) =
0 nếu x ≤ min(X
1
, , X
n
),
k
n
nếu có k phần tử trong mẫu bé hơn x
1 nếu x > max(X
1
, , X
n
).
Định nghĩa 1.2.5. Môment mẫu bậc k tương ứng với mẫu (X
1
, , X
n
)
là các đại lượng
α
∗
k
=
+∞
−∞
x
k
dF
n
(x) =
1
n
n
i=1
X
k
i
.
Môment mẫu trung tâm bậc k là
m
k
=
1
n
n
i=1
(X
i
− X)
k
,
trong đó X =
1
n
n
i=1
(X
i
).
19
Định nghĩa 1.2.6. Cho mẫu (X
1
, , X
n
) có hàm phân phối F (x). Hàm
đo được của các quan sát (X
1
, , X
n
) được gọi là một thống kê.
Như vậy, nếu g(X
1
, , X
n
) là một thống kê thì g(X
1
, , X
n
) là một biến
ngẫu nhiên nên nó cũng có quy luật phân phối xác suất.
Định nghĩa 1.2.7. Hàm phân phối của thống kê g(X
1
, , X
n
) được gọi
là hàm phân phối mẫu của g(X
1
, , X
n
).
Sau đây chúng ta xét một số đặc trưng của mẫu.
Định nghĩa 1.2.8. Ta gọi
X =
1
n
n
i=1
(X
i
)
là trung bình mẫu tương ứng với mẫu (X
1
, , X
n
).
Khi đó
E(X) =
1
n
n
i=1
E(X
i
) = µ.
Và
D(X) =
1
n
2
n
i=1
D(X
i
) =
σ
2
n
.
Như vậy, kì vọng của trung bình mẫu bằng kì vọng của biến ngẫu nhiên
lập nên mẫu. Phương sai của trung bình mẫu nhỏ hơn n lần so với phương
sai của biến ngẫu nhiên lập nên nó.
Định nghĩa 1.2.9. Ta gọi
S
2
n
=
1
n
n
i=1
(X
i
− X)
2
là phương sai mẫu tương ứng với mẫu (X
1
, , X
n
). Khi đó
E(S
2
n
) =
1
n
n
i=1
(X
i
− X)
2
=
1
n
n
i=1
E[(X
i
− µ) −(X − µ)]
2
=
n − 1
n
σ
2
20
Vì E(S
2
n
) = σ
2
nên nếu xét đại lượng
S
2
n
=
n − 1
n
S
2
n
=
1
n − 1
n
i=1
(X
i
−
X)
2
thì ta có E(S
2
n
) = σ
2
. Từ đây, ta có định nghĩa
Định nghĩa 1.2.10.
S
2
n
=
1
n − 1
n
i=1
(X
i
− X)
2
gọi là phương sai mẫu điều chỉnh ứng với mẫu (X
1
, , X
n
).
S
n
=
S
2
n
gọi là độ lệch tiêu chuẩn mẫu ứng với mẫu (X
1
, , X
n
).
S
n
=
S
2
n
gọi là độ lệch tiêu chuẩn mẫu điều chỉnh ứng với mẫu
(X
1
, , X
n
).
Cho mẫu (X
1
, X
2
, , X
n
) từ X, mệnh đề sau được suy ra trực tiếp
từ tính chất độc lập và cùng phân phối của các phần tử X
k
của mẫu và
định nghĩa của hàm phân phối.
Mệnh đề 1.2.11.
i, Nếu (X
1
, , X
n
) là mẫu ngẫu nhiên từ biến ngẫu nhiên X có phân phối
nhị thức B(m, p) thì nX =
n
i=1
X
i
cũng có phân phối nhị thức B(m, np).
ii, Nếu X ∼ λ thì
n
i=1
X
i
∼ nλ.
iii, Nếu X ∼ N (µ, σ
2
) thì
n
i=1
X
i
∼ N(nµ, nσ
2
) còn X ∼ N(µ,
σ
2
n
).
Định nghĩa 1.2.12.
Cho tổng thể có kích thước N, trong đó có M phần tử mang dấu hiệu
nghiên cứu (M < N), lấy ra một mẫu ngẫu nhiên kích thước n (n < N)
và trong đó có X phần tử mang dấu hiệu nghiên cứu. Khi đó tần suất
mẫu, kí hiệu p là tỉ số giữa số phần tử mang dấu hiệu nghiên cứu trong
mẫu và kích thước mẫu.
p =
X
n
21
Như vậy p là một biến ngẫu nhiên và
E(p) = E(
X
n
) =
1
n
E(X) =
µ
n
.
Định lý 1.2.13. Nếu X
1
, X
2
, , X
n
là một mẫu của một phân phối chuẩn
N
µ; σ
2
thì X và S
2
là các biến ngẫu nhiên độc lập, với X có phân phối
chuẩn N
µ;
σ
2
n
và (n − 1)
S
2
σ
2
có phân phối χ
2
n−1
.
Hệ quả 1.2.14. Cho X
1
, X
2
, , X
n
là một mẫu từ một phân phối chuẩn
với kỳ vọng µ. Nếu X biểu thị cho trung bình mẫu và S là độ lệch chuẩn
của mẫu thì
√
n
X − µ
S
∼ t
n−1
trong đó,
√
n
X − µ
S
là phân phối t với n − 1 bậc tự do.
CHƯƠNG 2
ƯỚC LƯỢNG KHOẢNG
Phân phối xác suất là đặc trưng cơ bản nhất của các biến ngẫu nhiên
vì biết phân phối xác xuất ta có thể xác định được tất cả các đặc trưng
khác của biến ngẫu nhiên. Tuy nhiên, không phải lúc nào chúng ta cũng
xác định được quy luật phân phối xác suất của các biến ngẫu nhiên.
Trong các tình huống thường gặp, các phân phối xác suất của các biến
ngẫu nhiên thường chưa biết hoặc chỉ biết dưới dạng toán học của chúng
phụ thuộc vào một số tham số chưa biết. Vì vậy, để xác định quy luật
xác suất của biến ngẫu nhiên trước hết phải đưa ra những đánh giá về
các tham số này. Một bài toán quan trọng nhất của thống kê toán là dựa
trên mẫu ngẫu nhiên (X
1
, X
2
, , X
n
) để ước lượng phân phối xác suất
của biến ngẫu nhiên hoặc các đặc trưng của phân phối đó.
Trong chương này, ta sẽ nghiên cứu việc xây dựng ước lượng khoảng
(hoặc khoảng tin cậy) cho các tham số của một phân pối xác suất.
Trong thực tế, chúng ta thường đặt ra câu hỏi: Liệu có thể xây dựng
được các khoảng ngẫu nhiên (khoảng với các đầu mút ngẫu nhiên) chứa
giá rị chân thực của tham số với xác suất cho trước hay không? Ước
lượng khoảng sẽ giúp ta trả lời câu hỏi đó.
Giả sử (X
1
, X
2
, , X
n
) là mẫu ngẫu nhiên từ phân phối F (x, θ) trong
đó F (x, θ) là hàm phân phối phụ thuộc vào θ.
Thống kê θ(X
1
, X
2
, , X
n
) và θ(X
1
, X
2
, , X
n
) được gọi là giới hạn tin
cậy dưới và giới hạn tin cậy trên của độ tin cậy β (β còn được gọi là mức
tin cậy) nếu
P {θ < θ} = β
22
23
P
θ > θ
= β
Còn khoảng với các đầu mút ngẫu nhiên (θ; θ) được gọi là khoảng tin cậy
của tham số θ với độ tin cậy β nếu
P
θ ∈ (θ; θ)
= β
trong đó α được gọi là mức ý nghĩa của khoảng tin cậy (θ; θ) và θ − θ
được gọi là độ dài của khoảng tin cậy (θ; θ).
Với mức tin cậy β đã cho nói chung có vô số khoảng tin cậy.
Chẳng hạn cho (X
1
, X
2
, , X
n
) là mẫu ngẫu nhiên từ phân phối chuẩn
N(µ; σ
2
). Khi đó
X có phân phối chuẩn N
µ;
σ
2
n
. Giả sử σ
2
= 1, có
thể tìm hai số z
α
và z
γ
là phân vị mức α và γ của phân phối chuẩn N (0; 1)
sao cho:
P
X − µ
1
√
n
< z
α
= α (0 < γ < α < 1).
P
X − µ
1
√
n
< z
γ
= γ
Nếu chọn β = α − γ thì
P
X −
z
α
√
n
< µ < X −
z
γ
√
n
= α −γ = β
Ta có thể thay đổi α và γ sao cho α − γ = β không đổi, nhưng khi
đó z
α
và z
γ
đều thay đổi và ta nhận được các khoảng tin cậy mức β
X −
z
α
√
n
; X −
z
γ
√
n
cũng thay đổi.
Chẳng hạn, nếu α = 0, 975, γ = 0, 025 thì z
α
= −z
γ
= 1, 96; nếu
α = 0, 99, γ = 0, 04 thì z
α
= 2, 325, z
γ
= −1, 75 và cả hai khoảng tin cậy
đều có mức tin cậy là β = 0, 95. Tuy nhiên độ dài của khoảng tin cậy
thứ nhất là
3, 92
√
n
còn độ dài của khoảng tin cậy thứ hai là
4, 075
√
n
.
24
Vấn đề đặt ra là ta nên chọn khoảng tin cậy nào khi mức tin cậy β đã
cho. Người ta thường chú ý tới khoảng tin cậy sao cho độ dài của khoảng
là bé nhất so với tất cả các khoảng tin cậy khác có cùng mức tin cậy.
Thông thường khoảng tin cậy đối xứng, tức là khoảng tin cậy (θ
0
− ε; θ
0
+ ε)
sao cho:
P {θ < θ
0
− ε} = P {θ > θ
0
+ ε} =
α
2
là khoảng tin cậy ngắn nhất với mức tin cậy β = 1 − α, trong đó
ε là độ chính xác (hoặc sai số) hay bán kính của khoảng ước lượng
(θ
0
− ε; θ
0
+ ε) .
2.1 Ước lượng khoảng cho trung bình của một phân
phối chuẩn khi biết phương sai σ
2
Cho một mẫu ngẫu nhiên X
1
, X
2
, , X
n
từ một phân phối chuẩn
N(µ, σ
2
) với µ chưa biết và phương sai σ
2
đã biết. Ta cần tìm khoảng
ước lượng cho µ trong trường hợp σ
2
đã biết. Vì
Z :=
X − µ
σ
√
n
∼ N(0, 1)
nên với mức ý nghĩa α
P
−z
α
2
<
X − µ
σ
√
n
< z
α
2
= 1 − α
trong đó, z
α
2
là điểm sao cho Φ(z
α
2
) = 1 −
α
2
. Điều này tương đương với
P
X − z
α
2
σ
√
n
< µ < X + z
α
2
σ
√
n
= 1 − α.
Từ đây ta có kết luận rằng, với độ tin cậy 1 − α, khoảng ước lượng cho
µ của một phân phối chuẩn khi biết phương sai σ
2
là
X − z
α
2
σ
√
n
; X + z
α
2
σ
√
n
.