Tải bản đầy đủ (.pdf) (195 trang)

GIÁO TRÌNH XÁC SUẤT THỐNG KÊ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (5.45 MB, 195 trang )

Tóm tắt lý thuyết và bài tâp
Xác suất và thống kê

Nguyễn Đăng Minh


Copyright © 2020 Nguyễn Đăng Minh
Trường Đại học Khoa học Tự nhiên
Detta verk är skyddat av lagen om upphovsrätt. Ingen del av detta verk får reproduceras
eller kopieras utan rättighetsinnehavarens skriftliga medgivande.
Art. No xxxxx
ISBN xxx–xx–xxxx–xx–x
Utgåva 0.0
Thiết kế bìa Cover Designer
Xuất bản bởi Publisher
In tại Minh


Mục lục

1

PHÉP ĐẾM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.1

Lý thuyết

7

1.2



Bài tập

8

2

XÁC SUẤT CƠ BẢN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.1

Khái niệm chung

11

2.2

Xác suất có điều kiện

17

2.3

Xác suất tồn phần - Cơng thức Bayes

20

3

BIẾN NGẪU NHIÊN RỜI RẠC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23


3.1

Khái niệm chung

23

3.2

Phân phối nhị thức

29

3.3

Phân phối siêu bội

32

3.4

Phân phối Poisson

33

4

BIẾN NGẪU NHIÊN LIÊN TỤC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

4.1


Khái niệm chung

37

4.2

Phân phối chuẩn

44

4.3

Phân phối chuẩn xấp xỉ phân phối nhị thức và phân phối Poisson

47

3


5

PHÂN PHỐI XÁC SUẤT ĐỒNG THỜI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

5.1

Lý thuyết

51


5.2

Bài tập

53

6

THỐNG KÊ MÔ TẢ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

6.1

Lý thuyết

55

6.2

Bài tập

59

7

ƯỚC LƯỢNG ĐIỂM - PHÂN PHỐI MẪU . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

7.1

Khái niệm tổng quát về ước lượng điểm
64

7.1.1 Phương pháp moment . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
7.1.2 Phương pháp hợp lí cực đại . . . . . . . . . . . . . . . . . . . . . . . . . 66
7.1.3 Phương pháp Bayesian . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

7.2

Phân phối mẫu và định lí giới hạn trung tâm

8

ƯỚC LƯỢNG KHOẢNG MỘT MẪU . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

8.1

Phương pháp chung

8.2

Khoảng tin cậy cho trung bình của phân phối chuẩn
78
8.2.1 Khoảng tin cậy cho trung bình khi biết phương sai . . . . . . . . . . . . 78
8.2.2 Khoảng tin cậy cho trung bình khi chưa biết phương sai . . . . . . . . . 81

8.3

Khoảng tin cậy cho phương sai

84

8.4


Khoảng tin cậy cho tỉ lệ của phân phối nhị thức

86

9

KIỂM ĐỊNH GIẢ THUYẾT MỘT MẪU . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

9.1

Khái niệm chung

9.2

Kiểm định giá trị trung bình của phân phối chuẩn
90
9.2.1 Kiểm định trung bình khi biết phương sai . . . . . . . . . . . . . . . . . 90
9.2.2 Kiểm định trung bình khi chưa biết phương sai . . . . . . . . . . . . . . 95

9.3

Kiểm định phương sai

100

9.4

Kiểm định tỉ lệ


101

10

KIỂM ĐỊNH GIẢ THUYẾT HAI MẪU . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

10.1

Kiểm định so sánh hai trung bình của hai tổng thể phân phối chuẩn
106
10.1.1 Kiểm định so sánh hai trung bình khi biết phương sai . . . . . . . . . . 106
10.1.2 Kiểm định so sánh hai trung bình khi phương sai bằng nhau chưa biết . 109
10.1.3 Kiểm định so sánh hai trung bình khi phương sai khác nhau chưa biết . 112

10.2

Kiểm định so sánh hai phương sai của hai tổng thể phân phối chuẩn

67

78

88

114


10.3

Kiểm định so sánh hai tỉ lệ của hai tổng thể phân phối nhị thức


116

11

HỒI QUY ĐƠN BIẾN – TƯƠNG QUAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

11.1

Mơ hình và ước lượng bình phương cực tiểu

119

11.2

Tính chất thống kê của ước lượng

120

11.3

Kiểm định giả thuyết trong hồi quy tuyến tính

121

11.4

Khoảng tin cậy

121


11.5

Tiên đốn giá trị quan trắc mới

122

11.6

Hệ số xác định

122

11.7

Hệ số tương quan

122

11.8

Bài tập

123

12

HỒI QUY BỘI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130

12.1


Mơ hình và ước lượng bình phương cực tiểu

130

12.2

Dạng biểu diễn ma trận của mơ hình

131

12.3

Tính chất thống kê của ước lượng

137

12.4

Kiểm định giả thiết trong hồi quy tuyến tính bội
137
12.4.1 Kiểm định ý nghĩa của mơ hình hồi quy . . . . . . . . . . . . . . . . . . 137
12.4.2 Kiểm định từng hệ số của mơ hình . . . . . . . . . . . . . . . . . . . . . 138

12.5

Khoảng tin cậy
140
12.5.1 Khoảng tin cậy cho từng hệ số ước lượng . . . . . . . . . . . . . . . . . 140
12.5.2 Khoảng tin cậy riêng cho trung bình đáp ứng . . . . . . . . . . . . . . . 140


12.6

Tiên đoán giá trị quan trắc mới

13

PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ . . . . . . . . . . . . . . . . . . . . . . . . 144

13.1

Bài toán đặt vấn đề: độ bền của giấy

144

13.2

Phân tích phương sai (ANOVA)

144

13.3

Bài tập

149

14

PHÂN TÍCH PHƯƠNG SAI HAI NHÂN TỐ . . . . . . . . . . . . . . . . . . . . . . . . . 153


14.1

Phân tích phương sai (ANOVA)

153

14.2

Bài tập

155

15

KIỂM ĐỊNH PHI THAM SỐ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156

15.1

Kiểm định dấu trường hợp mẫu cặp

156

15.2

Kiểm định dấu - hạng Wilcoxon trường hợp mẫu cặp

159

141



15.3

Kiểm định Mann-Whitney trường hợp mẫu độc lập

163

16

CHUỖI THỜI GIAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167

16.1

Khái niệm

16.2

Kĩ thuật trơn hóa chuỗi thời gian
16.2.1 Dự báo Naive (Naive Forecasting Models) . . . . . . . . . . . . . .
16.2.2 Trung bình di động (moving averages method) . . . . . . . . . . .
16.2.3 Trung bình di động có trọng số (weighted moving average method)
16.2.4 Làm trơn lũy thừa (exponential smoothing) . . . . . . . . . . . . .

167
.
.
.
.


170
. . 170
. . 170
. . 171
. . 172

16.3

Phân tích thành phần xu thế
176
16.3.1 Hồi qui tuyến tính xu thế . . . . . . . . . . . . . . . . . . . . . . . . . . 176
16.3.2 Hồi qui cầu phương xu thế . . . . . . . . . . . . . . . . . . . . . . . . . 177

16.4

Phân tích thành phần theo mùa

17

ĐỀ THI GIỮA KÌ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180

17.1

Đề giữa kì 2 năm 2018-2019

180

17.2

Đề giữa kì 1 năm 2018-2019


181

17.3

Đề giữa kì 2 năm 2018-2019

181

17.4

Đề giữa kì 1 năm 2017-2018

182

17.5

Đề giữa kì 2 năm 2017-2018

182

17.6

Đề giữa kì năm 2016-2017

183

17.7

Đề giữa kì năm 2015-2016


184

18

ĐỀ THI CUỐI KÌ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188

18.1

Đề cuối kì I năm 2018-2019

188

18.2

Đề cuối kì I năm 2018-2019

189

18.3

Đề 1 cuối kì 1 năm 2017-2018

190

18.4

Đề 2 cuối kì 1 năm 2017-2018

191


18.5

Đề cuối kì 2017-2018

191

18.6

Đề cuối kì hè năm 2017-2018

192

179

Tài liệu tham khảo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194
Sách

194


1. PHÉP ĐẾM

1.1

1.1

Lý thuyết

7


1.2

Bài tập

8

Lý thuyết

Định nghĩa 1.1 (Phép nhân)

Giả sử một thao tác có thể được mơ tả như một chuỗi gồm k bước và
i. số cách hoàn thành bước 1 là n1 và
ii. số cách hoàn thành bước 2 là n2 cho mỗi cách hoàn thành ở bước 1 và
iii. số cách hoàn thành bước 3 là n3 cho mỗi cách hoàn thành ở bước 1 và ...
Tổng số cách hồn thành thao tác là n1 × · · · × nk .
Định nghĩa 1.2 Số hốn vị của n phần tử khác nhau là n! = n × (n − 1) . . . 2 × 1.

Định nghĩa 1.3 Số hoán vị của n = n1 + n2 + · · · + nr phần tử gồm n1 phần tử loại 1, n2

phần tử loại 2...và nr phần tử loại r được tính
n!
.
n1 !n2 !n3 ! . . . nr !
Định nghĩa 1.4 (Chỉnh hợp)

Số hoán vị của các tập con gồm r phần tử được chọn từ một tập hợp n phần tử khác
nhau là
n!
Arn = n × (n − 1) × (n − 2) × · · · × (n − r + 1) =

.
(n − r)!

Định nghĩa 1.5 Số tổ hợp, tập hợp con gồm r phần tử được chọn từ một tập hợp n

7


8

1.2. Bài tập
phần tử, được tính
Cnr =

1.2

n!
.
r!(n − r)!

Bài tập

Bài tập 1.1 Có bao nhiêu cách thiết kế cho một trang web là bao gồm bốn màu, ba

phông chữ và ba vị trí cho một hình ảnh.
Bài tập 1.2 Quảng cáo trên web có thể được thiết kế từ bốn màu khác nhau, ba loại

phơng chữ, năm kích thước phơng chữ, ba hình ảnh và năm cụm từ văn bản. Có thể
thiết kế bao nhiêu mẫu khác nhau? (Đs: 900)
Bài tập 1.3 Một ổ khóa có ba vịng khóa, mỗi vịng có 10 chữ số: 0, 1, 2, 3, 4, 5, 6, 7,


8, 9. Hỏi có tất cả bao nhiêu mã khóa?
Bài tập 1.4 Một thiết kế cho một máy tính có thể chỉ định bất kỳ một trong năm kích
thước bộ nhớ, một trong ba loại màn hình, một trong bốn kích cỡ của một đĩa cứng và
có thể bao gồm hoặc không bao gồm một cây bút điện tử. Có bao nhiêu hệ thống máy
tính khác nhau có thể được thiết kế? (Đs: 120)
Bài tập 1.5 Thiết kế mới cho một bể xử lý nước thải đã được đề xuất với ba hình dạng

có thể, bốn kích thước có thể, ba vị trí cho van đầu vào và bốn vị trí cho van đầu ra.
Có thể thiết kế bao nhiêu sản phẩm khác nhau? (Đs: 144)
Bài tập 1.6 Trong một lớp gồm 30 sinh viên, cần chọn ra 3 sinh viên để làm lớp trưởng,
lớp phó và thủ quỹ. Hỏi có bao nhiêu cách bầu chọn?
Bài tập 1.7 Một hộp đựng 6 bi trắng và 4 bi đen.

a. Có tất cả bao nhiêu cách lấy ra 5 bi?
b. Có bao nhiêu cách lấy ra 5 bi trong đó có 2 bi trắng?
Bài tập 1.8 Một lơ 140 chip bán dẫn được kiểm tra bằng cách chọn một mẫu 5 chip.
Giả sử 10 trong số các chip này không phù hợp với yêu cầu của khách hàng.

a. Có bao nhiêu cách chọn mẫu khác nhau?
b. Có bao nhiêu mẫu trong số năm mẫu chứa chính xác một chip khơng phù hợp?
c. Có bao nhiêu mẫu trong số năm mẫu chứa ít nhất một chip khơng phù hợp?
(Đs: 416.965.528; 113.588.800; 130.721.752)


9

Bài tập 1.9 Xem xét việc thiết kế của một hệ thống truyền thơng.

a. Có bao nhiêu số điện thoại mà ba chữ số đầu tiên được sử dụng để đại diện cho

một khu vực địa lý cụ thể (chẳng hạn như mã vùng) có thể được tạo từ các chữ
số từ 0 đến 9?
b. Như một phần (a), có bao nhiêu số điện thoại mà ba chữ số đầu có thể khơng bắt
đầu bằng 0 hoặc 1, nhưng chứa 0 hoặc 1 làm chữ số giữa?
c. Có thể có bao nhiêu số điện thoại mà có ba chữ số đầu trong đó khơng có chữ số
nào xuất hiện nhiều hơn một lần trong đó?
(Đs: 1000; 160; 720)
Bài tập 1.10 Một thùng chứa 50 phần trong đó 5 phần bị lỗi. Một mẫu 10 phần được

chọn ngẫu nhiên, khơng hồn lại. Có bao nhiêu mẫu chứa ít nhất bốn bộ phận bị lỗi?
(Đs: 41,947,059)
Bài tập 1.11 Trong một nhóm ứng viên gồm 7 nam và 3 nữ.

a. Có bao nhiêu cách thành lập một ủy ban bao gồm 3 người?
b. Có bao nhiêu cách thành lập một ủy ban bao gồm 3 người trong đó có đúng 1 nữ?
c. Có bao nhiêu cách thành lập một ủy ban bao gồm 3 người trong đó có ít nhất 1
nữ?
Bài tập 1.12 Một hộp có 8 bi đỏ, 6 bi trắng, 4 bi vàng. Người ta chọn ra 6 bi từ hộp

đó. Hỏi có bao nhiêu cách chọn nếu:
a. Khơng u cầu gì thêm.
b. Phải có 2 bi đỏ, 2 bi trắng, 2 bi vàng.
c. Có đúng 2 bi vàng.

Bài tập 1.13

a. Có bao nhiêu cách xếp 3 nam và 3 nữ ngồi thành một hàng?

b. Có bao nhiêu cách xếp 3 nam và 3 nữ ngồi thành một hàng nếu mỗi nam và mỗi
nữ ngồi cạnh nhau?

c. Có bao nhiêu cách xếp nếu 3 nam phải ngồi cạnh nhau?
d. Có bao nhiêu cách xếp nếu khơng có hai nam hoặc hai nữ nào được ngồi cạnh
nhau?
Bài tập 1.14 Từ 8 sinh viên nữ và 6 sinh viên nam, một nhóm làm việc gồm 3 nam và

3 nữ phải được lập ra. Có bao nhiêu cách lập nhóm nếu
a. 2 trong số các sinh viên nam không chịu làm việc cùng nhau?


10

1.2. Bài tập
b. 2 trong số các sinh viên nữ không chịu làm việc cùng nhau?
c. 1 nam và 1 nữ không chịu làm việc cùng nhau?


2. XÁC SUẤT CƠ BẢN

2.1

2.1

Khái niệm chung

11

2.2

Xác suất có điều kiện


17

2.3

Xác suất tồn phần - Cơng thức Bayes

20

Khái niệm chung

Định nghĩa 2.1 Một thí nghiệm có thể dẫn đến các kết quả khác nhau, mặc dù nó được

lặp lại theo cùng một cách thức trong mỗi lần thực hiện, được gọi là một thí nghiệm
ngẫu nhiên.
Định nghĩa 2.2 Khơng gian mẫu Ω của một hiện tượng ngẫu nhiên là tập hợp tất cả
các khả năng có thể xảy ra.

i. Nếu |Ω| là hữu hạn hay đếm được thì ta gọi không gian mẫu hữu hạn.
ii. Nếu |Ω| là khoảng con của R thì ta gọi khơng gian mẫu liên tục.
Định nghĩa 2.3 Biến cố là một khả năng hay một tập hợp các khả năng của một thí

nghiệm ngẫu nhiên. Nói cách khác, biến cố là một tập con A của khơng gian mẫu Ω và
kí hiệu là: A ⊂ Ω.
Định nghĩa 2.4 Các tiên đề xác suất:

i. Xác suất P(A) của biến cố A thỏa 0 ≤ P(A) ≤ 1.
ii. Nếu Ω là khơng gian mẫu của mơ hình xác suất thì P(Ω) = 1.
iii. Hai biến cố rời nhau khi chúng khơng có khả năng chung và khơng bao giờ xảy ra
cùng nhau. Khi hai biến cố A, B rời nhau thì
P(A ∪ B) = P(A) + P(B).

Đây là quy tắc cộng cho hai biến cố rời nhau.
iv. Biến cố đối Ac của biến cố A là những khả năng biến cố A không xảy ra. Quy tắc
11


12

2.1. Khái niệm chung
đối là:
P(Ac ) = 1 − P(A).
Định lý 2.1 Xác suất trong không gian mẫu hữu hạn

Khi ta thực hiện phép gán xác suất cho mỗi khả năng riêng rẽ với một số nằm giữa 0
và 1, đồng thời có tổng là 1. Xác suất của một biến cố bất kì là tổng các xác suất của
mỗi khả năng xảy ra trong biến cố đó. Khi đó, ta có được một mơ hình xác suất trong
khơng gian mẫu hữu hạn.
Chú ý, khi ta gán xác suất cho mỗi khả năng bằng nhau thì ta gọi đó là mơ hình xác suất
đồng khả năng.
Định nghĩa 2.5 Hai biến cố độc lập nhau khi biết rằng xác suất xảy ra biến cố này

không làm thay đổi xác suất xảy ra của biến cố kia, khi đó
P(A và B) = P(A)P(B).
Đây là quy tắc nhân của hai biến cố độc lập.
Bài tập 2.1 Hãy chỉ rõ không gian mẫu trong mỗi thí nghiệm ngẫu nhiên sau:

a. Thả một đồng xu.
b. Để một cây bút chì rơi tự do vào một tờ giấy có ghi những chữ số một cách ngẫu
nhiên, sau đó ghi lại số có dấu chấm của đầu bút chì.
c. Thảy một đồng xu 4 lần rồi ghi lại chuỗi kết quả. Hãy liệt kê không gian mẫu.
Hơn nữa, nếu ta chỉ quan tâm tới số lượng mặt ngửa trong chuỗi kết quả. Cho

biết không gian mẫu lúc này.
d. Bạn là nhà thiết kế trang web và bạn thiết lập một trang với 5 liên kết khác nhau.
Người dùng có thể nhấp vào một trong các liên kết hoặc họ có thể rời khỏi trang
đó. Mơ tả khơng gian cho kết quả của khách truy cập vào trang Web của bạn.
Bài tập 2.2 Sử dụng dữ liệu từ Bài 2.1 câu 3, hãy mô tả biến cố A là chuỗi kết quả có

chính xác 2 mặt ngửa xuất hiện.
Bài tập 2.3 Nếu ta tung 1 đồng súc sắc cân bằng thì xác suất để được mặt chẵn hoặc

lớn hơn 4 chấm là bao nhiêu?
Bài tập 2.4 Chọn ngẫu nhiên một số tự nhiên nhỏ hơn 10.

a. Hãy mô tả không gian mẫu của phép thử ngẫu nhiên trên.
b. Tính xác suất số được chọn là số khơng bé hơn 5.
c. Tính xác suất số được chọn là số 3.


13

Bài tập 2.5 Sử dụng biểu đồ Veen, mô tả các khái niệm: hai biến cố rời nhau và hai

biến cố đối nhau.
Bài tập 2.6 Cho ba biến cố được biểu diễn bởi biểu đồ Veen như sau:

Vẽ lại hình trên rồi tô đậm những vùng tương ứng với biến cố sau:
a. Ac

c. (A ∪ B) ∩ C

b. A ∪ B


d. (B ∩ C)c

e. (A ∪ B)c ∩ C

Bài tập 2.7 Cho ba biến cố được biểu diễn bởi biểu đồ Veen như sau:

Vẽ lại hình trên rồi tơ đậm những vùng tương ứng với biến cố sau:
a. Ac

c. (A ∪ B) ∩ C

b. (A ∪ B) ∩ (A ∪ Bc )

d. (B ∩ C)c

e. (A ∪ B)c ∩ C

Bài tập 2.8 Xác suất xảy ra của 5 khả năng trong một thí nghiệm ngẫu nhiên là như

nhau. Khơng gian mẫu Ω = {a, b, c, d, e}. Đặt các biến cố A = {a, b} và B = {c, d, e}. Tính:
a. P(A)

c. P(Ac )

b. P(B)

d. P(A ∩ B)

e. P(A ∪ B)


Bài tập 2.9 Không gian mẫu của một thí nghiệm ngẫu nhiên là Ω = {a, b, c, d, e} với xác
suất tương ứng 0.1, 0.1, 0.2, 0.4 và 0.2. Đặt các biến cố A = {a, b, c} và B = {c, d, e}. Tính:

a. P(A)

c. P(Ac )

b. P(B)

d. P(A ∩ B)

e. P(A ∪ B)

Bài tập 2.10 Không gian mẫu của một phép thử ngẫu nhiên là Ω = {ω1 , ω2 , ω3 , ω4 , ω5 }.


14

2.1. Khái niệm chung
ωi
p

ω1
0.1

ω2
0.1

ω3

0.2

ω4
0.4

ω5
0.2

Đặt biến cố A = {ω1 , ω2 , ω3 , } và biến cố B = {ω3 , ω4 , ω5 }. Tính các xác suất sau:
a. P(A), P(B)

b. P(Ac )

c. P(A ∩ B), P(A ∪ B)

Bài tập 2.11 Cho P(A) = 1/3; P(B) = 1/2 và P(A hoặc B) = 3/4. Tính:

a. P(A và B)

c. P(Ac hoặc Bc )

b. P(Ac và Bc )

d. P(Ac và B)

e. P(A và Bc )

Bài tập 2.12 Cho P(A) = 0.3, P(B) = 0.2 và P(A ∩ B) = 0.1. Tính các xác suất sau:

a. P(Ac )


c. P(Ac ∩ B)

e. P(A ∪ Bc )

b. P(A ∪ B)

d. P(A ∩ Bc )

f. P(Ac ∪ B)

Bài tập 2.13 Cho A, B, C là những biến cố đôi một rời nhau lần lượt có xác suất là:

0.2, 0.3 và 0.4. Tính những xác suất sau:
a. P(A ∪ B ∪ C)

c. P(A ∩ B)

e. P(Ac ∩ Bc ∩ C c )

b. P(A ∩ B ∩ C)

d. P ((A ∪ B) ∩ C)

(Đs: 0.9; 0; 0; 0; 0.1)
Ta xem như một hộ gia đình giàu có nếu thu nhập của họ vượt quá
100,000$ và xem hộ gia đình trí thức nếu chủ nhà hồn thành bậc đại học. Chọn ngẫu
nhiên một hộ gia đình người Mỹ, và xét A là biến cố mà hộ gia đình được chọn là giàu
có và B là biến cố gia đình trí thức. Theo khảo sát dân số hiện tại, người ta thấy xác
suất P(A) = 0.138, P(B) = 0.261 và xác suất một gia đình vừa giàu có vừa trí thức là

P(A và B) = 0.082.
Bài tập 2.14

a. Hãy tính xác suất chọn một gia đình hoặc là giàu có hoặc là trí thức.
b. Vẽ biểu đồ Veen biểu diễn mối quan hệ giữa hai biến cố A và B.
c. Biễu diễn và tính những xác suất sau:
i. {A và B}

ii. {Ac và B}

iii. {A và Bc }

iv. {Ac và Bc }

Bài tập 2.15 Tỷ lệ người mắc bệnh tim trong một vùng dân cư là 9%, mắc bệnh huyết
áp là 12% và mắc cả hai bệnh là 7%. Chọn ngẫu nhiên một người trong vùng. Tính xác
suất để người đó

a. Bị bệnh tim hay bị bệnh huyết áp.


15
b. Không bị bệnh tim cũng không bị bệnh huyết áp.
c. Không bị bệnh tim hay không bị bệnh huyết áp.
d. Bị bệnh tim nhưng không bị bệnh huyết áp.
e. Không bị bệnh tim nhưng bị bệnh huyết áp.
(Đs: 0.14; 0.86; 0.93; 0.02; 0.05)

Bài tập 2.16 Theo Consumer Digest (Tháng 7/8 1996), vị trí của các máy tính để bàn


(PC) trong nhà là như sau:
Phòng ngủ người lớn:
Phòng ngủ trẻ em:
Phòng ngủ khác:
Phòng làm việc:
Các phòng khác:

0.03
0.15
0.14
0.40
0.28

a. Hỏi xác suất để PC trong phòng ngủ là bao nhiêu?
b. Hỏi xác suất để PC khơng ở trong phịng ngủ là bao nhiêu?
c. Giả sử một căn hộ được chọn ngẫu nhiên từ các căn hộ có PC; hỏi bạn kỳ vọng
sẽ thấy PC trong phòng nào?

Bài tập 2.17 Một số tiểu bang đang xem xét luật sẽ cấm sử dụng điện thoại di động
trong khi lái xe vì họ tin rằng lệnh cấm sẽ giảm tai nạn xe hơi liên quan đến điện thoại.
Một nghiên cứu phân loại các loại tai nạn này vào các ngày trong tuần khi chúng xảy
ra. Trong ví dụ này, ta sử dụng các giá trị từ nghiên cứu này làm mơ hình xác suất.
Dưới đây là xác suất:

Thứ
Xác suất

Chủ nhật
0.03


Hai
0.19

Ba
0.18


0.23

Năm
0.19

Sáu
0.16

Bảy
0.02

Hãy kiểm tra các quy tắc xác suất của mơ hình trên. Sau đó, áp dụng các quy tắc xác
suất, tính các trường hợp sau
a. Xác suất xảy ra tai nạn vào ngày nghỉ cuối tuần.
b. Xác suất xảy ra tai nạn vào ngày trong tuần.

Bài tập 2.18 Phân bố các loại máu
Máu người có thể là một trong các nhóm: O, A, B hoặc AB nhưng phân bố các loại
khác nhau giữa các nhóm ở người. Bảng sau là sự phân bố các loại máu cho một người
được chọn ngẫu nhiên tại Hoa Kỳ:


16


2.1. Khái niệm chung
Loại máu
Xác suất

A
0.40

B
0.11

AB
0.04

O
?

a. Tính xác suất của nhóm máu O ở Hoa Kỳ.
b. Maria có máu loại B. Cơ ấy có thể được truyền máu một cách an tồn từ những
người có nhóm máu O và B. Xác suất khi chọn ngẫu nhiên một người Mỹ có thể
hiến máu cho Maria?

Bài tập 2.19 Phân phối Benford

Số giả mạo trong bản khai thuế, hồ sơ thanh tốn, hóa đơn, xác nhận quyền sở hữu tài
khoản và nhiều loại giấy tờ khác thường có ở những mẫu khơng có trong hồ sơ hợp lệ.
Một số mẫu qua mặt quản lí dễ dàng bởi một kẻ lừa đảo thơng minh. Tuy nhiên, có
một nghiên cứu chuyên sâu đã chỉ ra rằng các chữ số đầu tiên của các con số trong hồ
sơ hợp pháp thường theo một phân phối được gọi là quy luật Benford.
Số đầu tiên

Xác suất

1
0.301

2
0.176

3
0.125

4
0.097

5
0.079

6
0.067

7
0.058

8
0.051

9
0.046

Chú ý số 0 không thể đứng đầu tiên.

a. Xét những biến cố: A={chữ số 1 đứng đầu} và B={chữ số đầu là 6 hoặc lớn hơn}.
Hãy tính xác suất của mỗi biến cố.
b. Tính xác suất khi chữ số đầu tiên lớn hơn 1.
c. Sử dụng xác suất biến cố A và B, tính xác suất khi số đầu tiên là 1 hoặc là 6 hoặc
lớn hơn.
d. Tính xác suất biến cố C chữ số đầu tiên là số lẻ. Sau đó suy ra xác suất P(B hoặc C)
và chứng minh nhỏ hơn tổng xác suất 2 biến cố B, C. Giải thích.

Bài tập 2.20 Những kẻ lừa đảo có thể nghĩ rằng chữ số đầu tiên phải được phân phối

”ngẫu nhiên” trong số các chữ số từ 1 đến 9 trong hồ sơ kinh doanh (tức là có xác suất
xuất hiện như nhau). Hãy mơ tả khơng gian mẫu và tính xác suất của biến cố B (phát
biểu ở bài trên). So sánh kết quả với Bài tập 2.19 và rút ra cách nhận biết kẻ lừa đảo
làm giả giấy tờ.

Bài tập 2.21 Giả sử rằng xác suất để một thiết bị điện tử hoạt động trên 6000 giờ là

0.42. Giả sử rằng xác suất thiết bị hoạt động không quá 4000 giờ là 0.04.
a. Hỏi xác suất để tuổi thọ của thiết bị nhỏ hơn hoặc bằng 6000 giờ là bao nhiêu?
b. Hỏi xác suất để tuổi thọ lớn hơn 4000 giờ?


17

Bài tập 2.22 (Biến cố độc lập)

Tính xác suất trong các trường hợp sau:
a. Xác suất có hai mặt ngửa khi tung hai đồng xu đồng chất.
b. Gregor Mendel đã sử dụng đậu Hà Lan trong một số thí nghiệm cho thấy rằng sự
di truyền màu hạt hoạt động một cách ngẫu nhiên. Màu hạt của đậu Hà Lan có

thể là màu xanh lá cây hoặc màu vàng. Hai cây bố mẹ được cho lai tạo (một kiểu
thụ phấn) để tạo ra hạt giống. Mỗi cây bố mẹ mang hai gen cho màu hạt giống,
và mỗi gen này có xác xuất 1/2 được truyền cho một hạt giống. Hai gen mà hạt
giống nhận được một từ bố một mẹ xác định màu của nó. Cha mẹ đóng góp gen
độc lập với nhau.
Giả sử cả cha lẫn mẹ đều mang gen G và Y . Hạt mầm sẽ có màu xanh nếu cả hai
bố mẹ đóng góp một gen G; bằng khơng nó sẽ có màu vàng. Nếu M là biến cố cây
bố đóng góp một gen G và F là biến cố cây mẹ đóng góp một gen G thì xác suất
của một hạt màu xanh lá cây là bao nhiêu?
c. Phân phối nhóm máu của người Hoa khác với phân phối của người Hoa Kỳ (xem
Bài tập 2.18)và được cho bởi bảng sau
Loại máu
Xác suất

A
0.27

B
0.26

AB
0.12

O
0.35

Chọn một người Mỹ và một người Hoa ngẫu nhiên độc lập với nhau. Xác suất mà
cả hai đều có loại máu O là bao nhiêu? Xác suất mà cả hai đều có cùng một loại
máu?


2.2

Xác suất có điều kiện

Định nghĩa 2.6 Khi cần tính xác suất của biến cố B mà ta đã biết trước thông tin của
biến cố A, ta sẽ sử dụng khái niệm xác suất có điều kiện P(B|A) theo cơng thức

P(B|A) =

P(A ∩ B)
,
P(A)

với P(A) > 0.
Bài tập 2.23 Đĩa nhựa polycarbonate từ một nhà cung cấp được phân tích về khả
năng chống trầy xước và sốc. Kết quả từ 100 đĩa được tóm tắt như sau:

Chống xước

Cao
Thấp

Chống sốc
Cao Thấp
70
9
16
5



18

2.2. Xác suất có điều kiện
Đặt A là biến cố một đĩa có khả năng chống sốc cao, và để B là biến cố đĩa có khả năng
chống xước cao. Xác định xác suất sau:
a. P(A)

b. P(B)

c. P(A|B)

d. P(B|A)

Bài tập 2.24 Bảng sau đây tóm tắt phân tích các mẫu thép mạ kẽm cho trọng lượng

lớp phủ và độ nhám bề mặt:

Độ nhám bề mặt

Cao
Thấp

Trọng lượng lớp phủ
Cao
Thấp
12
16
88
34


a. Nếu trọng lượng lớp phủ của mẫu cao, xác suất độ nhám bề mặt cao là bao nhiêu?
b. Nếu độ nhám bề mặt của mẫu cao, xác suất trọng lượng lớp phủ cao là bao nhiêu?
c. Nếu độ nhám bề mặt của mẫu thấp, xác suất trọng lượng lớp phủ thấp là bao
nhiêu?

Trong kì thi cuối kì của ĐH New Harmony có 10000 kết quả thi của
3 khoa chính: khoa nghệ thuật, khoa kĩ thuật và vật lí, khoa sức khỏe được thống kê
trong bảng sau:
Bài tập 2.25

Khoa
Nghệ thuật
Kĩ thuật & vật lí
Sức khỏe

Điểm A
2142
368
882

Điểm B
1890
432
630

Điểm dưới B
2268
800
588


Tổng
6300
1600
2100

Tính xác suất:
a. Lấy ngẫu nhiên được 1 điểm loại dưới B.
b. Lấy ngẫu nhiên được 1 điểm loại dưới B với thông tin điểm đó lấy từ khoa kĩ
thuật.
c. Xác suất là bao nhiêu để điểm lấy ra từ khoa sức khỏe.
d. Lấy ngẫu nhiên được 1 điểm A.
e. Lấy ngẫu nhiên được 1 điểm A với thơng tin điểm đó lấy từ khoa sức khỏe
f. Hãy tính xác suất lấy được một điểm loại A từ trường ĐH New Harmony khoa
nghệ thuật bằng 2 cách: số lượng trong bảng và công thức xác suất điều kiện. So
sánh kết quả.
Hãy giải thích sự khác nhau ở đáp số câu 1 với câu 2; câu 4 với câu 5.


19

Bài tập 2.26 Trong một nhóm sinh viên đại học, người ta phân loại theo giới tính và

mức độ thường xuyên uống rượu bia hay không. Dưới đây là xác suất

Thường xuyên
Không thường xuyên

Nam
0.11
0.32


Nữ
0.12
0.45

Kiểm tra xem bảng xác suất trên có tổng là 1 khơng? Hãy tính xác suất chọn ngẫu
nhiên:
a. Một người không thường uống rượu bia.
b. Một người nam sinh viên không thường uống rượu bia. So sánh với kết quả trên.
c. Một người nam sinh viên thường uống rượu bia; một người nữ sinh viên thường
uống rượu bia.
d. Xác suất một sinh viên thường uống rươu bia với điều kiện phải là sinh viên nam.
Xác suất chọn một sinh viên thường uống rươu bia với điều kiện phải là sinh viên
nữ.
e. Giải thích tại sao lại có kết quả xác suất câu 3 lớn hơn câu 4 ở nữ và nhỏ hơn ở
nam. Rút ra nhận xét.

Bài tập 2.27 Sử dụng số liệu của mơ hình xác suất trong Bài tập 2.14, hãy tính xác
suất chọn ngẫu nhiên một gia đình giáu có biết trước thơng tin là gia đình trí thức?

Bài tập 2.28 Theo dõi dự báo thời tiết trên đài truyền hình (nắng, sương mù, mưa)
và so sánh với thời tiết thực tế xảy ra, ta có bảng thống kê sau:

Thực tế
nắng
sương mù
mưa

nắng
30

4
10

Dự báo
sương mù
5
20
4

mưa
5
2
20

nghĩa là có 30 lần dự báo nắng, trời nắng, 4 lần dự báo nắng, trời sương mù; 10 lần dự
báo nắng, trời mưa,...
a. Tính xác suất dự báo trời nắng của đài truyền hình.
b. Tính xác suất dự báo của đài truyền hình là đúng thực tế.
c. Được tin dự báo là trời nắng. Tính xác suất để thực tế thì trời mưa ? trời sương
mù ? trời nắng ?


20

2.3. Xác suất tồn phần - Cơng thức Bayes

Bài tập 2.29 Xác suất của giai đoạn đầu tiên của sản xuất gia cơng được kiểm sốt

bằng số vịng của các piston đáp ứng các thông số kỹ thuật là 0.90. Thất bại xảy ra
do các biến thể kim loại, liên kết cố định, cắt điều kiện lưỡi dao, độ rung và điều kiện

môi trường xung quanh. Do giai đoạn đầu đáp ứng các thông số kỹ thuật, xác suất mà
giai đoạn gia công thứ hai đáp ứng các thông số kỹ thuật là 0,95. Xác suất mà cả hai
giai đoạn đáp ứng thơng số kỹ thuật là gì? Sử dụng cơng thức xác suất có điều kiện
P(A và B).

2.3

Xác suất tồn phần - Cơng thức Bayes

Định nghĩa 2.7 (Cơng thức xác suất toàn phần)

Giả sử E1 , E2 , . . . , Ek là k tập đôi một rời nhau, khi đó
P(B) = P(B ∩ E1 ) + P(B ∩ E2 ) + · · · + P(B ∩ Ek )
= P(B|E1 )P(E1 ) + P(B|E2 )P(E2 ) + · · · + P(B|Ek )P(Ek )

Biểu đồ cây rất hữu ích để xử lí những bài tốn liên quan tới xác suất có điều kiện và cơng
thức xác suất toàn phần! Từ hai định nghĩa trên, ta suy ra được công thức:
Định lý 2.2 (Công thức Bayes) Giả sử P(A) > 0 và hệ những biến cố đầy đủ
{B1 , B2 , . . . , Bn } có P(Bk ) > 0 với mọi k = 1, n. Khi đó, ta có:

P(Bk |A) =

P(Bn )P(A|Bk )
,
P(B1 )P(A|B1 ) + P(B2 )P(A|B2 ) + · · · + P(Bn )P(A|Bn )

k = 1, n.

Bài tập 2.30 (Sử dụng biểu đồ cây để tính xác suất tồn phần)


Một nhà máy có ba phân xưởng A, B, C tương ứng làm ra 25%, 35% và 40% tổng sản
phẩm của nhà máy. Giả sử xác suất làm ra một sản phẩm hỏng của các phân xưởng
A, B và C lần lượt là 0.01, 0.02 và 0.025. Hãy tính xác suất nhận được một sản phẩm
hỏng. (Đs: 0.0195)
Bài tập 2.31 Một dây chuyền lắp ráp nhận các chi tiết từ hai nhà máy khác nhau.

Tỷ lệ chi tiết do nhà máy thứ nhất cung cấp là 60%, của nhà máy thứ hai là 40%. Tỷ
lệ chính phẩm của nhà máy thứ nhất là 90%, của nhà máy thứ hai là 85%. Lấy ngẫu
nhiên một chi tiết trên dây chuyền và thấy rằng nó tốt. Tìm xác suất để chi tiết đó do
nhà máy thứ nhất sản xuất. (Đs: 0.614)
Bài tập 2.32 Trong một vùng dân cư, cứ 100 người thì có 30 người hút thuốc lá. Biết
tỷ lệ người bị viêm họng trong số người hút thuốc lá là 60%, trong số người không hút
thuốc lá là 30%. Khám ngẫu nhiên một người và thấy người đó bị viêm họng. Tìm xác
suất để người đó hút thuốc lá. Nếu người đó khơng bị viêm họng thì xác suất để người


21
đó hút thuốc lá là bao nhiêu? (Đs: 0.4615; 0.1967)
Bài tập 2.33 Trong một lượng lớn sinh viên đại học quốc gia, 61% tham dự các ĐH 4
năm và các học viên còn lại theo học các ĐH 2 năm. Nam giới chiếm 44% số học sinh
trong các ĐH 4 năm và 41% học sinh trong các ĐH 2 năm.

a. Hãy lập bảng xác suất cho mơ hình trên.
b. Giả sử ta lấy ngẫu nhiên 1 sinh viên nữ từ trường đại học quốc gia, xác suất sinh
viên đó học ĐH 4 năm là bao nhiêu? (Đs: 0.5975)
Bài tập 2.34 Xe cơ giới được bán cho các cá nhân được phân loại là ô tô hoặc xe tải

nhẹ (bao gồm cả xe SUV) và là xe nội địa hoặc nhập khẩu. Trong một năm gần đây,
69% số xe được bán là xe tải nhẹ, 78% là trong nước và 55% là xe tải nhẹ nội địa. Hãy
để A là biến cố một chiếc xe là ô tô và B biến cố nó được nhập khẩu. Hãy tính xác suất:

a. Phương tiện cơ giới là một chiếc bán tải.
b. Phương tiện cơ giới là một chiếc ô tô nhập khẩu.
c. Giả sử có thơng tin một chiếc xe là nhập khẩu, hãy tính xác suất nó là xe bán tải.
d. Có thể khẳng định hai biến cố: chiếc xe là bán tải và chiếc xe nhập khẩu là độc
lập hay không? Giải thích.
Bài tập 2.35 Phịng chat trực tuyến bị chi phối bởi giới trẻ. Thanh thiếu niên là những
người dùng lớn nhất. Nếu chúng ta chỉ thống kê người trưởng thành (từ 18 tuổi trở lên)
dùng Internet, 47% trong nhóm tuổi từ 18 đến 29, cũng như 21% trong nhóm tuổi 30
đến 49 và chỉ 7% trong số 50 người đó trở lên. Để tìm hiểu phần trăm của người dùng
Internet tham gia trị chuyện, ta cũng cần phân tích theo độ tuổi người dùng. Ở đây là:
29% người dùng Internet trưởng thành từ 18 đến 29 tuổi (biến cố A1 ), 47% khác là 30
đến 49 (biến cố A2 ) và 24% còn lại là từ 50 trở lên (biến cố A3 ).

a. Hãy tính xác suất nếu chọn ngẫu nhiên một người sử dụng Internet tham gia trò
chuyện.
b∗ . Bao nhiêu phần trăm người trưởng thành sử dụng Internet để trò chuyện nằm
trong độ tuổi 18 tới 29 tuổi? Tính P(A1 |C).
Bài tập 2.36 Julie vừa tốt nghiệp đại học. Cơ đã học sinh học, hóa học, tính toán và

hy vọng sẽ làm việc như một nhà khoa học pháp y áp dụng kiến thức của mình để điều
tra tội phạm. Một đêm khuya, cô nghĩ về một số công việc mà cô đã nộp đơn xin. Gọi
A, B và C là các biến cố mà Julie xin được một cơng việc bằng cách:
A: văn phịng Giám đốc Y khoa ở Connecticut
B: sở tư pháp hình sự tại New Jersey
C: nhóm hoạt động về thiên tai ở của liên bang


22

2.3. Xác suất tồn phần - Cơng thức Bayes

với xác suất được nhận lần lượt là:
P(A) = 0.7

P(A và B) = 0.3

P(B) = 0.5

P(A và C) = 0.1

P(C) = 0.3

P(B và C) = 0.1

P(A và B và C) = 0

a. Sử dụng biểu đồ Veen mơ tả mơ hình xác suất trên.
b. Xác suất để Julie có được ít nhất một việc làm trong ba việc trên.
c. Nếu Julie đã được nhận làm việc liên bang thì xác suất có điều kiện để cơ ta có
việc ở New Jersey là bao nhiêu? (Đs: 1/3.)
d. Nếu Julie đã được nhận làm việc New Jersey thì xác suất có điều kiện để cơ ta có
việc ở liên bang là bao nhiêu? (Đs: 0.2)
Bài tập 2.37 Một thiết bị gồm 3 cụm chi tiết, mỗi cụm bị hỏng khơng ảnh hưởng gì
đến các cụm khác và chỉ cần một cụm bị hỏng thì thiết bị ngừng hoạt động. Xác suất
để cụm thứ nhất bị hỏng trong ngày là 0.1, cụm thứ hai là 0.05 và cụm thứ ba là 0.15.
Tìm xác suất để thiết bị không ngừng hoạt động trong ngày. (Đs: 0.7267)


3. BIẾN NGẪU NHIÊN RỜI RẠC

3.1


3.1

Khái niệm chung

23

3.2

Phân phối nhị thức

29

3.3

Phân phối siêu bội

32

3.4

Phân phối Poisson

33

Khái niệm chung

Định nghĩa 3.1

i. Biến ngẫu nhiên (random variable) là một biến mà mỗi giá trị của nó được gán

tương ứng với mỗi khả năng có thể xảy ra của hiện tượng ngẫu nhiên.
ii. Biến ngẫu nhiên rời rạc (discrete random variable) X là biến ngẫu nhiên chỉ nhận
đếm được những giá trị. Phân phối xác suất của X là một bảng gồm các giá trị
và xác suất tương ứng của chúng. Người ta cũng có thể mơ tả X bằng đồ thị
histogram (xem Chương 6) và hàm phân phối tích lũy.

Định nghĩa 3.2

i. Cho biến ngẫu nhiên rời rạc X nhận hữu hạn giá trị x1 , . . . , xn , hàm trọng lượng
xác suất (probability mass function) thỏa mãn:
a. f (xi ) ≥ 0

b.

Pn

i=1 f

(xi ) = 0

c. f (xi ) = P(X = xi ).

ii. Hàm phân phối tích lũy F của biến ngẫu nhiên rời rạc X là hàm thỏa
X
F(x) = P(X ≤ x) =
f (xi ).
xi ≤x

Định nghĩa 3.3 Các tham số đặc trưng thống kê


i. Trung bình hay kì vọng (mean, expected value) của biến ngẫu nhiên rời rạc X
nhận giá trị {x1 , x2 , · · · , xk } tương ứng với xác suất {p1 , p2 , · · · , pk } là đại lượng được
23


24

3.1. Khái niệm chung
tính:
EX = µX = x =

k
X

x i pi .

i=1

Tính chất:
a. Nếu X là biến ngẫu nhiên và a, b là số thực cố định thì µa+bX = a + bµX .
b. Nếu X và Y là hai biến ngẫu nhiên thì µX+Y = µX + µY .
ii. Kì vọng của một hàm phụ thuộc vào một biến ngẫu nhiên rời rạc X được tính
X
Eh(X) =
h(xi )pi .
i

Đặc biệt, nếu h(x) = xr ta gọi Eh(X) là moment bậc r. Nếu h(x) = etx thì ta gọi
Eh(X) là hàm gây (sinh) moment. Nếu h(x) = e−itx thì ta gọi Eh(X) là hàm đặc
trưng của biến ngẫu nhiên X.

iii. Phương sai (variance) của biến ngẫu nhiên rời rạc X nhận giá trị {x1 , x2 , · · · , xk }
tương ứng với xác suất {p1 , p2 , · · · , pk } là đại lượng được tính:
VarX

= σX2

=

k
X
i=1

2

(xi − µX ) pi =

k
X

xk2 pk − µ2X .

i=1

iv. Độ lệch chuẩn ( standard deviation) σX của biến ngẫu nhiên rời rạc X là căn bậc
2 của phương sai.
Tính chất:
2
a. Nếu X là biến ngẫu nhiên và a, b là số thực cố định thì σa+bX
= b2 σX2 .
2

b. Nếu X và Y là hai biến ngẫu nhiên độc lập thì σX±Y
= σX2 + σY2 .

c. Nếu X và Y là hai biến ngẫu nhiên có hệ số tương quan ρ thì
2
σX±Y
= σX2 + σY2 ± ρσX σY .

v. Trung vị (median) là số x thỏa điều kiện P(X ≤ x) = P(X ≥ x) = 0.5. Trong trường
hợp xác suất đồng khả năng, để tìm trung vị người ta xếp tập X(Ω) tăng dần,
sau đó nếu số phần tử của X(Ω) là số lẻ thì ta lấy số chính giữa. Ngược lại ta sẽ
lấy trung bình của hai số chính giữa nếu số phần tử của X(Ω) là số chẵn.
vi. Yếu vị (mod) là số x ∈ X(Ω) sao cho P(X = x) lớn nhất.

Code R 3.1 Sử dụng code R để tính trung bình, phương sai, độ lệch chuẩn của biến

ngẫu nhiên rời rạc:
R
R
R
R

>
>
>
>

x <- c(0,1,2,3)
f <- c(1/8, 3/8, 3/8, 1/8)
mu <- sum(x * f)

mu


25
R
R
R
R
R
R

>
>
>
>
>
>

sigma2 <- sum((x-mu)^2 * f)
sigma2
sigma <- sqrt(sigma2)
sigma
F = cumsum(f)
F

hoặc sử dụng thư viên distrEx [74] như sau:
R > library(distrEx)
R > X <- DiscreteDistribution(supp = 0:3, prob = c(1,3,3,1)/8)
R > E(X); var(X); sd(X)
Bài tập 3.1 Trong mỗi tình huống dưới đây, biến ngẫu nhiên là liên tục hay rời rạc.


Hãy cho biết lí do:
a. Trang web của bạn có năm liên kết khác nhau và người dùng có thể nhấp vào
một trong các liên kết hoặc có thể rời khỏi trang. Bạn ghi lại khoảng thời gian
người dùng bỏ ra trên trang web trước khi nhấp vào một trong các liên kết hoặc
rời khỏi trang.
b. Số lần truy cập trên trang web của bạn.
c. Lượng khách truy cập hằng năm của trang web.
Bài tập 3.2 Trò chơi đánh bài Texas bắt đầu với việc mỗi người chơi nhận được 2 là

bài trên tay. Sau đây là bảng phân phối số lượng con bài át trong hai lá bài đó
Số lượng át
Xác suất

0
0.559

1
0.382

2
0.059

a. Hãy kiểm tra xem mơ hình trên có phải là một biến ngẫu nhiên rời rạc?
b. Vẽ biểu đồ histogram cho phân phối trên.
c. Xác suất mà trong hai lá chứa ít nhất một át? Tính tốn bằng hai cách khác
nhau.
Bài tập 3.3 Phần mềm kiểm tra chính tả bắt lỗi “lỗi không phải từ”, là lỗi tạo thành
bởi một chuỗi các chữ cái sắp xếp không tạo thành một từ, ví dụ chữ “the” được nhập
là “teh”. Khi sinh viên đại học được yêu cầu viết một bài luận 250 từ (khơng được kiểm

tra lại lỗi chính tả), và X số lượng từ bị lỗi có phân phối sau:

Giá trị của X
Xác suất

0
0.1

1
0.3

2
0.3

a. Vẽ phân phối xác suất của biến ngẫu nhiên X.

3
0.2

4
0.1


×