Mục lục
Lời cảm ơn 3
Mở đầu 4
1 Một số kiến thức chuẩn bị 7
1.1 Xác suất . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.1.1 Phép thử và biến cố . . . . . . . . . . . . . . . . . 7
1.1.2 Quan hệ giữa các biến cố . . . . . . . . . . . . . . . 8
1.1.3 Không gian các biến cố sơ cấp . . . . . . . . . . . . 9
1.1.4 Các tính chất cơ bản của xác suất . . . . . . . . . . 10
1.2 Đại lượng ngẫu nhiên và hàm phân phối xác suất . . . . . 11
1.2.1 Đại lượng ngẫu nhiên . . . . . . . . . . . . . . . . . 11
1.2.2 Hàm phân phối xác suất . . . . . . . . . . . . . . . 12
1.2.3 Hàm mật độ xác suất . . . . . . . . . . . . . . . . . 13
1.3 Các tham số đặc trưng của đại lượng ngẫu nhiên . . . . . 15
1.3.1 Kì vọng toán . . . . . . . . . . . . . . . . . . . . . 15
1.3.2 Phương sai . . . . . . . . . . . . . . . . . . . . . . 17
1.3.3 Mốt . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.3.4 Trung vị (Median) . . . . . . . . . . . . . . . . . . 20
2 Một số quy luật phân phối xác suất thông dụng 22
2.1 Quy luật nhị thức B(n,p) . . . . . . . . . . . . . . . . . . . 22
2.2 Quy luật phân phối chuẩn . . . . . . . . . . . . . . . . . . 24
2.2.1 Các tham số đặc trưng . . . . . . . . . . . . . . . . 27
1
2.2.2 Quy tắc 2σ và 3σ . . . . . . . . . . . . . . . . . . . 28
2.3 Quy luật khi bình phương (χ
2
(n)) . . . . . . . . . . . . . . 29
2.3.1 Tính chất của quy luật khi bình phương . . . . . . 30
2.3.2 Các tham số đặc trưng . . . . . . . . . . . . . . . . 30
2.4 Quy luật Student T (n) . . . . . . . . . . . . . . . . . . . . 31
3 Một số bài toán kiểm định giả thiết thống kê đơn giản 34
3.1 Thiết lập bài toán . . . . . . . . . . . . . . . . . . . . . . 34
3.2 Kiểm định giả thiết về giá trị trung bình của ĐLNN có phân
phối chuẩn . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.2.1 Trường hợp σ
2
đã biết . . . . . . . . . . . . . . . . 37
3.2.2 Trường hợp σ
2
chưa biết . . . . . . . . . . . . . . . 39
3.3 So sánh hai giá trị trung bình của hai ĐLNN có phân phối
chuẩn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.3.1 Trường hợp σ
2
1
, σ
2
2
đã biết . . . . . . . . . . . . . . 42
3.3.2 Trường hợp σ
2
1
, σ
2
2
chưa biết (giả thiết σ
2
1
= σ
2
2
) . . 44
3.4 Kiểm định về xác suất của đại lượng ngẫu nhiên có phân
phối nhị thức . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.5 Kiểm định giả thiết về hai xác suất của hai đại lượng ngẫu
nhiên có phân phối nhị thức . . . . . . . . . . . . . . . . . 50
3.6 Kiểm định giả thiết về tính độc lập của hai dấu hiệu định
tính . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.7 So sánh nhiều tỉ lệ của đại lượng ngẫu nhiên có phân phối
nhị thức . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
Kết luận 59
Tài liệu tham khảo 60
2
LỜI CẢM ƠN
Lời đầu tiên tôi xin bày tỏ lòng biết ơn sâu sắc tới: Ban chủ nhiệm khoa
Toán −Lý −Tin, phòng khảo thí và đảm bảo chất lượng, phòng đào tạo
đại học, các thầy cô trong tổ bộ môn Giải tích, đặc biệt là cô giáo Phạm
Thị Thái, người đã định hướng nghiên cứu, hướng dẫn, cũng như động
viên tôi có thêm nghị lực hoàn thành khóa luận này.
Nhân dịp này tôi xin cảm ơn tới người thân và các bạn sinh viên lớp
K51 ĐHSP Toán và K51 ĐHSP Toán − Lý.
Những ý kiến đóng góp, giúp đỡ, động viên của thầy cô và bạn bè đã
tạo điều kiện thuận lợi để tôi hoàn thành khóa luận.
Tôi xin chân thành cảm ơn!
Sơn la, tháng 5 năm 2014.
Người thực hiện
Sinh viên: Vũ Thị Huệ
3
MỞ ĐẦU
1. Lí do chọn đề tài
Một số quy luật phân phối xác suất và bài toán kiểm định giả thiết thống
kê là một vấn đề có vị trí quan trọng trong xác suất nói riêng và trong toán
học hiện đại nói chung, là một vấn đề mở rộng của lý thuyết xác suất. Một
số quy luật phân phối xác suất và ứng dụng của nó trong bài toán kiểm
định giả thiết thống kê có rất nhiều ứng dụng trong thực tế. Để học tốt
những mảng kiến thức này, trước hết mỗi sinh viên phải tự trang bị cho
mình các kiến thức và phương pháp chủ yếu là tìm đọc tài liệu, tự nghiên
cứu các nội dung liên quan. Trong chương trình Xác Suất Thống Kê ở bậc
đại học do thời gian học có hạn, một số quy luật phân phối xác suất và bài
toán kiểm định giả thiết thống kê chỉ đề cập đến thông qua một số khái
niệm, công thức và thông qua một số tính chất đơn giản mà chưa nêu ra
được mối liên hệ giữa quy luật phân phối xác suất và sử dụng nó trong
bài toán kiểm định giả thiết thống kê. Cũng có rất nhiều cuốn sách trình
bày về vấn đề này như "Xác Suất Thống Kê" của tác giả Đào Hữu Hồ,
"Lý Thuyết Xác Suất Và Thống Kê Toán" của tác giả Nguyễn Cao Văn
Trong chương trình học tập của sinh viên đại học, xác suất được nghiên
cứu chủ yếu trên cơ sở xác suất cổ điển. Để thấy rõ mối quan hệ giữa Lý
thuyết xác suất, cụ thể là: Một số quy luật phân phối xác suất, với thống
kê toán, cụ thể là: Bài toán kiểm định giả thiết thống kê đơn giản. Hơn
nữa cần làm rõ hơn cơ sở xây dựng để giải quyết các bài toán kiểm định
đó.
Xuất phát từ những lí do trên tôi đã mạnh dạn đi vào nghiên cứu "Một
số quy luật phân phối xác suất và ứng dụng của nó trong bài toán kiểm
định giả thiết thống kê đơn giản".
2. Mục đích, đối tượng, nhiệm vụ, phương pháp nghiên cứu, giới
hạn phạm vi nghiên cứu
2.1. Mục đích nghiên cứu
Tìm hiểu một số quy luật phân phối xác suất thông dụng và bài toán
4
kiểm định giả thiết thống kê liên quan đến quy luật phân phối đó. Từ đó
nghiên cứu việc ứng dụng của quy luật phân phối xác suất trong một số
bài toán kiểm định giả thiết thống kê đơn giản.
2.2. Đối tượng nghiên cứu
Đối tượng nghiên cứu của khóa luận là một số quy luật phân phối trong
xác suất thông dụng và bài toán kiểm định giả thiết thống kê đơn giản.
2.3. Nhiệm vụ nghiên cứu
Với mục đích như trên, tôi đã đặt nhiệm vụ tìm hiểu và trình bày lại
các vấn đề kiến thức có liên quan một cách có hệ thống và logic. Từ đó
xây dựng cơ sở để giải quyết các bài toán kiểm định tương ứng. Mỗi bài
toán đều có ví dụ áp dụng nó.
2.4. Phương pháp nghiên cứu
Do đặt ra nhiệm vụ như trên và do đặc thù bộ môn, tôi chọn phương
pháp sưu tầm tài liệu, hỏi ý kiến chuyên gia, giảng viên hướng dẫn, nhóm
nghiên cứu. Từ đó hệ thống lại kiến thức theo nội dung của khóa luận.
2.5. Giới hạn phạm vi nghiên cứu
Phạm vi nghiên cứu là nghiên cứu vấn đề về quy luật phân phối xác
suất thông dụng và một số bài toán kiểm định giả thiết thống kê theo cổ
điển.
3. Bố cục
Từ mục đích và nhiệm vụ đặt ra bố cục của đề tài được sắp xếp như
sau: Ngoài phần mở đầu, kết luận, mục lục, danh mục tài liệu tham khảo,
nội dung đề tài gồm ba chương:
Chương 1: Trình bày các kiến thức cơ sở về xác suất.
Chương đầu là một số nội dung kiến thức cơ bản nên chỉ dẫn nội dung.
Một số kết quả không chứng minh.
Chương 2: Trình bày về một số quy luật phân phối xác suất thông dụng.
Chương 3: Chương này trình bày cơ sở xây dựng tiêu chuẩn kiểm định
của một số bài toán kiểm định giả thiết thống kê.
4. Đóng góp của khóa luận
5
Khóa luận trình bày một cách có hệ thống kiến thức liên quan. Xây
dựng cơ sở kiểm định cho một số bài toán kiểm định gỉa thiết, kèm theo
nó là ví dụ minh họa. Khóa luận là tài liệu tham khảo có giá trị cho các
bạn sinh viên quan tâm đến vấn đề một số quy luật phân phối xác suất và
ứng dụng của nó trong bài toán kiểm định giả thiết thống kê đơn giản.
6
Chương 1
Một số kiến thức chuẩn bị
1.1 Xác suất
1.1.1 Phép thử và biến cố
Trong tự nhiên và xã hội, mỗi hiện tượng đều gắn liền với một nhóm
các điều kiện cơ bản và các hiện tượng đó chỉ có thể xảy ra khi nhóm các
điều kiện cơ bản gắn liền với nó được thực hiện. Do đó khi muốn nghiên
cứu một hiện tượng nào đó ta cần thực hiện nhóm các điều kiện cơ bản
ấy, chẳng hạn nếu muốn quan sát việc xuất hiện mặt sấp hay mặt ngửa
của một đồng xu ta phải tung đồng xu, còn để xem viên đạn trúng bia hay
trượt ta phải bắn các viên đạn.
Việc thực hiện nhóm các điều kiện cơ bản để quan sát một hiện tượng
nào đó xảy ra hay không được gọi là thực hiện một phép thử ngẫu nhiên
(viết tắt là phép thử) và người ta thường kí hiệu phép thử là G hoặc
G
i
, i = 1, n.
Còn hiện tượng có thể xảy ra trong kết quả của phép thử đó được gọi
là biến cố và kí hiệu là A, B, C,
Ví dụ 1.1. Phép thử gieo một con xúc xắc. Ta kí hiệu các biến cố:
B
i
= "Xuất hiện mặt i chấm", i = 1, 6
B
nt
= "Xuất hiện mặt có số chấm là số nguyên tố"
B
c
= "Xuất hiện mặt có số chấm là số chẵn"
B
l
= "Xuất hiện mặt có số chấm là số lẻ".
7
Ví dụ 1.2. Gieo một hạt đậu tương được xem như là một phép thử " Gieo
hạt đậu tương". Kết quả của phép thử này là hạt nảy mầm hoặc không
nảy mầm đó là biến cố. Như vậy biến cố của phép thử là: hạt nảy mầm,
hạt không nảy mầm.
Như vậy một biến cố chỉ có thể xảy ra khi một phép thử gắn liền với nó
được thực hiện.
Trong thực tế có thể xảy ra các loại biến cố sau:
• Biến cố chắc chắn là biến cố nhất định xảy ra khi thực hiện một phép
thử, kí hiệu là Ω.
• Biến cố không thể là biến cố nhất định không xảy ra khi thực hiện một
phép thử, kí hiệu .
• Biến cố ngẫu nhiên là biến cố có thể xảy ra hoặc không xảy ra khi thực
hiện phép thử.
Kí hiệu: A, B, C, hoặc Bi, i = 1, n.
1.1.2 Quan hệ giữa các biến cố
Định nghĩa 1.3. Hai biến cố A và B gọi là xung khắc với nhau nếu chúng
không thể đồng thời xảy ra trong một phép thử. Trường hợp ngược lại, nếu
hai biến cố có thể cùng xảy ra trong một phép thử thì được gọi là không
xung khắc.
Định nghĩa 1.4. Biến cố A được gọi là thuận lợi cho biến cố B nếu biến
cố A xảy ra kéo theo biến cố B cũng xảy ra và kí hiệu A ⊂ B.
Định nghĩa 1.5. Các biến cố A
1
, A
2
, , A
n
được gọi là một nhóm đầy đủ
các biến cố nếu trong kết quả của một phép thử sẽ xảy ra một và chỉ một
trong các biến cố đó.
Nói cách khác các biến cố nói trên sẽ tạo nên một nhóm đầy đủ các biến
cố nếu chúng xung khắc từng đôi với nhau và tổng của chúng là biến cố
chắc chắn.
8
Ví dụ 1.6. Phép thử gieo một con xúc xắc. Ta kí hiệu các biến cố:
B
i
= "Xuất hiện mặt i chấm", i =
1, 6
B
nt
= "Xuất hiện mặt có số chấm là số nguyên tố"
B
c
= "Xuất hiện mặt có số chấm là số chẵn"
B
l
= "Xuất hiện mặt có số chấm là số lẻ".
Khi đó
B
c
và B
l
là hai biến cố xung khắc với nhau
Biến cố B
2
thuận lợi cho biến cố B
c
, kí hiệu B
2
⊂ B
c
Biến cố B
1
, B
2
, B
3
, B
4
, B
5
, B
6
tạo nên một nhóm đầy đủ các biến cố.
Định nghĩa 1.7. Hai biến cố A và A gọi là đối lập với nhau nếu chúng
tạo nên một nhóm đầy đủ các biến cố.
Ví dụ 1.8. Bắn một viên đạn vào bia. Gọi A là biến cố "Đạn bắn trúng
bia", A là biến cố " Đạn bắn trượt bia". Khi đó A và A là hai biến cố đối
lập nhau.
1.1.3 Không gian các biến cố sơ cấp
Định nghĩa 1.9. Khi phép thử được thực hiện có thể xuất hiện nhiều biến
cố khác nhau. Các biến cố không thể chia thành các biến cố khác được nữa
được gọi là các biến cố sơ cấp. Tập hợp các biến cố sơ cấp của một phép
thử được gọi là không gian các biến cố sơ cấp và kí hiệu là Ω.
Định nghĩa 1.10. Xác suất xuất hiện biến cố A trong một phép thử là tỉ
số giữa số biến cố thuận lợi cho A và tổng số các biến cố duy nhất đồng
khả năng có thể xảy ra khi thực hiện phép thử đó.
Nếu kí hiệu P(A) là xác suất của biến cố A, m là số kết cục thuận lợi
cho biến cố A, n là số kết cục duy nhất đồng khả năng của phép thử thì ta có
P (A) =
m
n
.
Nhận xét 1.11. • Biến cố duy nhất đồng khả năng có thể xảy ra khi thực
hiện phép thử chính là biến cố sơ cấp của phép thử đó,
9
• Xác suất của biến cố cho phép ta đánh giá khả năng
xuất hiện biến cố đó.
Ví dụ 1.12. 25 hành khách lên ngẫu nhiên 5 toa tàu. Tìm xác suất để
a) Toa thứ nhất có đúng 4 hành khách.
b) Mỗi toa có 5 hành khách.
Giải.
a) Số cách phân ngẫu nhiên 25 hành khách lên 5 toa tàu là 5
25
.
Gọi A là biến cố "Toa thứ nhất có 4 hành khách".
Số cách phân ngẫu nhiên 25 hành khách lên 5 toa tàu mà toa thứ nhất có
4 hành khách là C
4
25
.4
21
Do đó P (A) =
C
4
25
.4
21
5
25
.
b) Gọi B là biến cố "Mỗi toa có 5 hành khách"
Số cách phân ngẫu nhiên 25 hành khách lên 5 toa tàu mà mỗi toa có 5
hành khách là C
5
25
.C
5
20
.C
5
15
.C
5
10
.C
5
5
=
25!
(5!)
5
Do đó P (B) =
25!
(5!)
5
5
25
=
25!
(5!)
5
.5
25
.
1.1.4 Các tính chất cơ bản của xác suất
• Xác suất của biến cố ngẫu nhiên là một số thuộc đoạn [0; 1], tức là
0 ≤ P (A) ≤ 1.
• Xác suất của biến cố chắc chắn bằng một
P (Ω) = 1.
• Xác suất của biến cố không thể bằng không
P () = 0.
• Nếu A ⊂ B thì P (A) P (B).
• Nếu A, B là hai biến cố bất kì thì
P (A + B) = P (A) + P (B) − P (A.B).
10
Đặc biệt: Nếu A, B là hai biến cố xung khắc thì
P (A + B) = P (A) + P (B).
1.2 Đại lượng ngẫu nhiên và hàm phân phối xác suất
1.2.1 Đại lượng ngẫu nhiên
Định nghĩa 1.13. Hàm X xác định trên không gian biến cố sơ cấp Ω và
nhận giá trị trong không gian R được gọi là đại lượng ngẫu nhiên (ĐLNN)
nếu với x ∈ R tập hợp {w : X(w) < x} là biến cố ngẫu nhiên (w ∈ Ω).
Ta thường kí hiệu đại lượng ngẫu nhiên bằng chữ in hoa X, Y , Z, và
giá trị của nó nhận kí hiệu bằng chữ thường x, y, z,
Ví dụ 1.14. Gọi X là " Số sản phẩm tốt " trong 10 sản phẩm được chọn
ngẫu nhiên từ lô sản phẩm có 100 sản phẩm tốt và 50 phế phẩm. Khi đó
X là ĐLNN mà giá trị nó có thể nhận là: 0, 1, 2, , 10.
Ví dụ 1.15. Gọi Y là " Số con trai trong một lần sinh một con". Khi đó
Y là đại lượng ngẫu nhiên giá trị mà nó có thể nhận là: 0, 1.
Phân loại đại lượng ngẫu nhiên
Định nghĩa 1.16. Đại lượng ngẫu nhiên rời rạc là ĐLNN mà các giá trị
có thể nhận của nó là tập hợp hữu hạn hoặc vô hạn đếm được.
Ví dụ 1.17. Một phân xưởng có 5 máy hoạt động độc lập với nhau. Gọi
X là "Số máy hỏng trong một ca". Khi đó X là ĐLNN rời rạc nhận các
giá trị có thể có là: 0, 1, 2, 3, 4, 5.
Định nghĩa 1.18. ĐLNN được gọi là ĐLNN liên tục nếu các giá trị có
thể có của nó lấp đầy một khoảng nào đó trên trục số.
Ví dụ 1.19. Phép thử bắn một viên đạn vào bia. Nếu gọi X là "Khoảng
cách từ điểm chạm của viên đạn đến tâm bia" thì X là ĐLNN liên tục và
các giá trị có thể của X nằm trong khoảng (a, b) nào đó.
11
1.2.2 Hàm phân phối xác suất
Ta thay kí hiệu (w : X(w) < x) bởi kí hiệu (X < x)
Định nghĩa 1.20. Hàm phân phối xác suất của ĐLNN X, kí hiệu F (x)
là xác suất để ĐLNN X nhận giá trị nhỏ hơn x, với x là một số thực bất
kì, tức là
F (x) = P (X < x), ∀x ∈ R.
Nếu X là ĐLNN rời rạc nhận giá trị có thể x
1
, x
2
, , x
n
, với xác suất
tương ứng p
1
, p
2
, , p
n
, thì hàm phân phối xác suất được xác định bằng
công thức
F (x) =
x
i
<x
P
i
.
Ví dụ 1.21. ĐLNN X có phân phối xác suất như sau:
X 1 3 4
P 0,1 0,5 0,4
Tìm hàm phân phối xác suất của ĐLNN X.
Giải.
Nếu x ≤ 1 thì biến cố (X < x) = , do đó
F (x) = 0.
Nếu 1 < x ≤ 3 biến cố (X < x) chỉ xảy ra khi (X = 1), do đó
F (x) = P (X = 1) = 0, 1.
Nếu 3 < x 4 biến cố (X < x) sẽ xảy ra hoặc khi (X = 1) hoặc khi
(X = 3)
F (x) = P (X = 1) + P (X = 3) = 0, 1 + 0, 5 = 0, 6.
Nếu x > 4 biến cố (X ≤ x) sẽ xảy ra hoặc khi (X = 1) hoặc khi (X = 3)
hoặc khi (X = 4), do đó
F (x) = P (X = 1) + P (X = 3) + P (X = 4) = 0, 1 + 0, 5 + 0, 4 = 1.
Vậy hàm phân phối xác suất của ĐLNN X là
12
F (X) =
0 nếu x 1
0, 1 nếu 1 < x 3
0, 6 nếu 3 < x 4
1 nếu x > 4
Tính chất hàm phân phối xác suất
• Hàm phân phối xác suất luôn nhận giá trị trong đoạn [0; 1], tức là
0 ≤ F (x) ≤ 1, ∀x ∈ R.
• Hàm phân phối xác suất là hàm không giảm, tức là ∀x
1
, x
2
∈ R sao cho
x
2
> x
1
ta có
F (x
2
) F (x
1
).
• Với a, b là hằng số thực ta có
P (a ≤ X < b) = F (b) − F (a),
trong đó F là hàm phân xác suất của ĐLNN X.
• lim
x→−∞
F (x) = 0 lim
x→+∞
F (x) = 1.
1.2.3 Hàm mật độ xác suất
Định nghĩa 1.22. Hàm mật độ xác suất của ĐLNN liên tục (kí hiệu f(x))
là đạo hàm của hàm phân phối xác suất của ĐLNN đó, tức là
f(x) = F
(x), ∀x ∈ R.
Tính chất hàm mật độ
• Hàm mật độ xác suất f(x) 0, ∀x ∈ R.
• Nếu X là ĐLNN có hàm mật độ là f(x) và a, b là hằng số thực thì
P (a < X < b) =
b
a
f(x)dx.
13
Chú ý 1.23. Nếu ĐLNN X liên tục thì
P (a ≤ X < b) = P (a < X ≤ b) = P (a < X < b),
với a, b là hằng số thực
• Hàm phân phối xác suất F (x) =
x
−∞
f(x)dx, ∀x ∈ R.
•
+∞
−∞
f(x)dx = 1.
Như vậy f(x) là hàm mật độ xác suất của ĐLNN X nào đó ⇔ hai điều
kiện sau thỏa mãn:
i) f(x) ≥ 0, ∀x ∈ R,
ii)
+∞
−∞
f(x)dx = 1.
Chứng minh
Thật vậy:
i) f(x) = F
(x) = lim
x→0
F (x+ ) − F (x)
x
0, do F (x) là hàm không giảm.
ii)
+∞
−∞
f(x)dx = lim
a→−∞
b→+∞
b
a
f(x)dx = lim
a→−∞
b→+∞
F (x)|
b
a
= lim
a→−∞
b→+∞
(F (b) − F (a))
= 1.
Ví dụ 1.24. Hàm phân phối xác suất của ĐLNN liên tục X có dạng
F (x) =
0 nếu x 0
ax
2
nếu 0 < x 1
1 nếu x > 1
a) Tìm hệ số a.
b) Tìm hàm mật độ xác suất f(x) của ĐLNN X.
c) Tìm xác suất để ĐLNN X nhận giá trị trong khoảng (0, 25; 0, 75).
Giải.
a) Để F(x) là hàm phân phối xác suất của ĐLNN liên tục X ⇔ F (x) liên
tục trên R ⇔ F (x) liên tục tại x = 0 và x = 1.
14
Hiển nhiên F (x) liên tục tại x = 0.
Xét tại x = 1 ta có lim
x→1
−
F (x) = F (1) = a
lim
x→1
+
F (x) = 1.
Để F(x) liên tục tại x = 1 ⇔ a = 1. Đây chính là điều kiện để F (x) liên
tục trên R.
b) Ta có hàm mật độ
f(x) = F
(x) =
0 nếu x 0
2x nếu 0 < x 1
0 nếu x > 1
c) Theo tính chất hàm phân phối xác suất
P (0, 25 < X < 0, 75) = F (0, 75) − F (0, 25)
= (0, 75)
2
− (0, 25)
2
= 0, 5.
1.3 Các tham số đặc trưng của đại lượng ngẫu nhiên
1.3.1 Kì vọng toán
Định nghĩa 1.25. Giả sử ĐLNN X nhận các giá trị có thể có x
1
, x
2
, , x
n
,
với xác suất tương ứng là p
1
, p
2
, , p
n
, Khi đó nếu
∞
i=1
|x
i
|p
i
< +∞ thì
∞
i=1
x
i
p
i
được gọi là kì vọng toán của ĐLNN X, kí hiệu E(X), tức là
E(X) =
∞
i=1
x
i
p
i
.
Định nghĩa 1.26. Giả sử X là ĐLNN có hàm mật độ là f(x). Khi đó nếu
+∞
−∞
|x|f(x)dx < +∞ thì
+∞
−∞
xf(x)dx được gọi là kì vọng toán của ĐLNN
15
X, tức là
E(X) =
+∞
−∞
xf(x)dx.
Ví dụ 1.27. Tìm kì vọng toán của ĐLNN rời rạc X có bảng phân phối
xác suất như sau:
X 1 3 4
P 0,1 0,5 0,4
Giải.
Theo định nghĩa kì vọng toán của ĐLNN rời rạc ta có
E(X) = 1.0, 1 + 3.0, 5 + 4.0, 4 = 3, 2.
Ví dụ 1.28. Tìm kì vọng toán của ĐLNN liên tục X có hàm mật độ xác
suất như sau
f(x) =
3
4
(x
2
+ 2x) với x ∈ (0; 1)
0 với x /∈ (0; 1)
Giải.
Theo định nghĩa kì vọng toán của ĐLNN liên tục ta có
E(X) =
+∞
−∞
xf(x)dx =
3
4
1
0
x(x
2
+ 2x)dx
=
3
4
(
x
4
4
+
2x
3
3
)
1
0
=
11
6
.
16
Tính chất của kì vọng
• Nếu C là hằng số thì E(C) = C.
• Nếu X là ĐLNN có kì vọng E(X) và C là hằng số thì
E(CX) = CE(X).
• Nếu X, Y là hai ĐLNN có kì vọng tương ứng là E(X), E(Y ) thì
E(X + Y ) = E(X) + E(Y ).
• Mở rộng: Nếu X
1
, X
2
, , X
n
là các ĐLNN có các kì vọng tương ứng là
E(X
1
), , E(X
n
) thì
E(
n
i=1
X
i
) =
n
i=1
E(X
i
).
• Nếu X và Y là hai ĐLNN độc lập có các kì vọng tương ứng là E(X), E(Y )
thì
E(X.Y ) = E(X).E(Y ).
Ví dụ 1.29. Cho hàm phân phối xác suất của ĐLNN X là:
X 0 1
p 1/2 1/2
Tính E(2X + 1), E(X
3
).
Giải.
Áp dụng tính chất của kì vọng ta có E(2X + 1) = 2E(X) + 1.
Mà E(X) = 0.
1
2
+ 1.
1
2
=
1
2
Do đó
E(2X + 1) = 2E(X) + 1 = 2.
1
2
+ 1 = 2.
E(X
3
) = 0
3
.
1
2
+ 1
3
.
1
2
=
1
2
.
1.3.2 Phương sai
Định nghĩa 1.30. Giả sử X là ĐLNN có kì vọng là E(X). Khi đó người
ta gọi kì vọng của ĐLNN [X −E(X)]
2
là phương sai của ĐLNN X, kí hiệu
17
D(X), tức là
D(X) = E[X −E(X)]
2
.
Như vậy: Nếu X là ĐLNN rời rạc nhận giá trị có thể x
1
, x
2
, , x
n
, với
xác suất tương ứng p
1
, p
2
, , p
n
, thì phương sai được xác định bởi công
thức
D(X) =
∞
i=1
[x
i
− E(X)]
2
p
i
.
Nếu X là ĐLNN liên tục có hàm mật độ f(x) thì phương sai được xác
định bởi công thức
D(X) =
+∞
−∞
[x − E(X)]
2
f(x)dx.
Có thể tính phương sai bởi công thức
D(X) = E(X)
2
− [E(X)]
2
.
Tính chất của phương sai
• Phương sai của một hằng số C bằng 0, tức là
D(C) = 0.
• Nếu ĐLNN X có phương sai D(X) và C là hằng số thực thì
D(CX) = C
2
D(X).
• Giả sử X, Y là hai ĐLNN độc lập có phương sai tương ứng là D(X), D(Y )
thì
D(X + Y ) = D(X) + D(Y ).
• Mở rộng: Nếu X
1
, X
2
, , X
n
là các ĐLNN độc lập có phương sai tương
ứng là D(X
1
), D(X
2
), , D(X
n
) thì
D(
n
i=1
X
i
) =
n
i=1
D(X
i
).
18
• Phương sai của tổng một hằng số với một ĐLNN bằng phương sai của
chính ĐLNN đó
D(C + X) = D(X).
• Phương sai của hiệu hai ĐLNN độc lập bằng tổng các phương sai thành
phần của các ĐLNN
D(X −Y ) = D(X) + D(Y ).
Ví dụ 1.31. Gọi X là tổng số chấm thu được khi gieo n con xúc xắc. Tính
phương sai của X.
Giải.
Gọi X
i
là" Số điểm thu được ở con xúc xắc thứ i”, (i = 1, n).
Ta có
X =
n
i=1
X
i
.
Vì các X
i
, (i = 1, n) độc lập với nhau, do đó theo tính chất của phương sai
ta có
D(X) = D(
n
i=1
X
i
) =
n
i=1
D(X
i
).
Ta tìm D(X
i
), i = 1, n theo công thức
D(X
i
) = E(X
i
)
2
− [E(X
i
)]
2
.
Mỗi ĐLNN X
i
đều có phân phối xác suất như sau:
X
i
1 2 3 4 5 6
P 1/6 1/6 1/6 1/6 1/6 1/6
Do đó E(X
i
) =
1
6
(1 + 2 + 3 + 4 + 5 + 6) =
7
2
, i = 1, n.
và E(X
2
i
) =
1
6
(1
2
+ 2
2
+ 3
2
+ 4
2
+ 5
2
+ 6
2
) =
91
6
, i = 1, n.
=⇒ D(X
i
) =
91
6
−
7
2
2
=
35
12
, i = 1, n.
19
Vậy D(X) =
n
i=1
D(X
i
) =
35
12
n.
1.3.3 Mốt
Định nghĩa 1.32. Mốt của ĐLNN X kí hiệu X
mod
là giá trị của ĐLNN
X tương ứng với nó:
• Xác suất lớn nhất nếu X là ĐLNN rời rạc,
• Hàm mật độ xác suất đạt cực đại nếu X là ĐLNN liên tục.
Ví dụ 1.33. Cho ĐLNN X có phân phối xác suất như sau. Tìm X
mod
.
X 0 1 2
P (X = k) 1/6 2/3 1/6
Giải.
Do X là ĐLNN rời rạc có xác suất P (X = 1) =
2
3
lớn nhất trong các xác
suất còn lại. Do đó
X
mod
= 1.
Ví dụ 1.34. Cho ĐLNN X có hàm mật độ như sau. Tìm X
mod
.
f(x) =
1 với x ∈ [0; 1]
0 với x /∈ [0; 1]
Giải.
Do X là ĐLNN liên tục trên đoạn [0; 1] có f[0; 1] = 1 lớn nhất nên
X
mod
= [0; 1].
1.3.4 Trung vị (Median)
Định nghĩa 1.35. Trung vị của ĐLNN X kí hiệu X
me
là giá trị nằm ở
chính giữa tập hợp các giá trị có thể có của ĐLNN. Nói cách khác đó là
giá trị chia phân phối của ĐLNN thành hai phần bằng nhau.
20
• Nếu X là ĐLNN rời rạc nhận giá trị x
1
, x
2
, , x
n
, thì X
me
= x
i
nếu
thỏa mãn
F (x
i
) ≤ 0, 5 < F (x
i+1
).
• Nếu X là ĐLNN liên tục có hàm mật độ xác suất là f(x) thì trung vị
X
me
là giá trị thỏa mãn
X
me
−∞
f(x)dx = 0, 5.
Ví dụ 1.36. Giả sử ĐLNN X có hàm phân phối xác suất như sau. Tìm
X
me
.
F (X) =
0 nếu x 0
x nếu 0 < x 1
1 nếu x > 1
Giải.
Do X là ĐLNN liên tục nên
F
1
2
=
1
2
⇒ X
me
=
1
2
.
21
Chương 2
Một số quy luật phân phối xác suất
thông dụng
Trong chương này ta sẽ nghiên cứu một số quy luật phân phối xác suất
thông dụng nhất với các ĐLNN rời rạc và liên tục. Điều đó làm cho việc
phân loại ĐLNN trong thực tế theo các quy luật phân phối xác suất được
dễ dàng hơn.
Giả sử trong bình có N quả cầu trong đó có M quả cầu trắng và N −M
quả cầu đen. Mỗi phép thử là việc lấy ngẫu nhiên từ bình ra một quả cầu.
Theo những cách lấy khác nhau sẽ dẫn đến những lược đồ khác nhau và
các quy luật phân phối xác suất khác nhau.
2.1 Quy luật nhị thức B(n,p)
Định nghĩa 2.1. ĐNNN rời rạc X nhận một trong các giá trị có thể
0, 1, , n với xác suất tương ứng được tính bằng công thức
P (X = k) = C
k
n
p
k
q
n−k
, p = 1 − q, k = 0, n
gọi là phân phối theo quy luật nhị thức với tham số là n và p.
Quy luật nhị thức được ký hiệu là B(n, p).
Bảng phân phối xác suất của ĐLNN X phân phối theo quy luật nhị thức
có dạng:
22
X 0 1 k n
P C
0
n
p
0
q
n
C
1
n
p
1
q
n−1
C
k
n
p
k
q
n−k
C
n
n
p
n
q
0
Ví dụ 2.2. Trong một phân xưởng có 5 máy hoạt động độc lập. Xác suất
để trong một ngày mỗi máy bị hỏng đều bằng 0, 1. Tìm xác suất để
a) Trong một ngày có hai máy hỏng.
b) Trong một ngày có không quá hai máy hỏng.
Giải.
Gọi X là "Số máy hỏng trong một ngày". Khi đó X có phân phối nhị thức
nhận các giá trị có thể: 0, 1, 2, 3, 4, 5 với xác suất là
P (X = k) = C
k
5
.0, 1
k
.0, 9
5−k
, k = 0, 5.
a)Do đó xác suất để trong một ngày có 2 máy hỏng là
P (X = 2) = C
2
5
(0, 1)
2
(0, 9)
3
= 0, 072.
b) Xác suất để trong một ngày có không quá hai máy hỏng là
P (0 ≤ X ≤ 2) = P (X = 0) + P (X = 1) + P (X = 2)
= C
0
5
.0, 9
5
+ C
1
5
.0, 1.0, 9
4
+ 0, 072
≈ 0, 991.
Các tham số đặc trưng
Nếu ĐLNN X có phân phối theo quy luật nhị thức với tham số (n, p) thì
• Kì vọng toán
E(X) = np.
• Phương sai
D(X) = npq.
• Độ lệch chuẩn
σ(X) =
√
npq.
23
2.2 Quy luật phân phối chuẩn
Định nghĩa 2.3. ĐLNN liên tục X nhận giá trị trong khoảng (−∞; +∞)
gọi là phân phối theo quy luật chuẩn với các tham số a và σ
2
nếu hàm mật
độ xác suất của nó có dạng
f(x) =
1
σ
√
2π
e
−(x − a)
2
2σ
2
.
Kí hiệu X N(a; σ
2
).
Đồ thị của hàm mật độ xác suất f(x) của hàm phân phối chuẩn có dạng
như sau
Hình 2.1.Đồ thị hàm f(x) có phân phối chuẩn.
Qua đồ thị ta thấy khi a và σ thay đổi dạng đồ thị của hàm mật độ xác
suất f(x) cũng thay đổi như sau
Khi a thay đổi thì dạng của đường cong f(x) không thay đổi song nó sẽ
dịch chuyển sang trái hoặc sang phải theo trục Ox. Nếu σ tăng lên thì đồ
thị xuống thấp và phình ra, còn khi σ giảm thì đồ thị cao lên và nhọn thêm
(Hình 2.2).
24
Hình 2.2. Sự thay đổi của f(x) theo σ
Hàm phân phối xác suất của ĐLNN X phân phối theo quy luật chuẩn
được xác định bằng biểu thức
F (x) =
1
σ
√
2π
x
−∞
e
−(u − a)
2
2σ
du, ∀u ∈ R.
Đặc biệt nếu a = 0, σ = 1 thì ta có hàm mật độ xác suất
ϕ(x) =
1
√
2π
e
−x
2
2
, ∀x ∈ R
và khi đó hàm phân phối xác suất tương ứng nó là
Φ(x) =
1
2π
x
−∞
e
−
u
2
2
du, ∀u ∈ R.
Khi đó ĐLNN X gọi là phân phối chuẩn chính tắc, kí hiệu
X N(0, 1).
Định lý 2.4. Nêú X N(a, σ
2
) thì
• Y =
X −a
σ
có phân phối chuẩn dạng N(0, 1).
25