Tải bản đầy đủ (.pdf) (450 trang)

Xác suất, thống kê và phân tích số liệu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (16.99 MB, 450 trang )

ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA
Nguyễn Tiến Dũng (Chủ biên)
Nguyễn Đình Huy

XÁC SUẤT - THỐNG KÊ
& PHÂN TÍCH SỐ LIỆU

NHÀ XUẤT BẢN ĐẠI HỌC QUỐC GIA
TP HỒ CHÍ MINH - 2019


Nguyễn Tiến Dũng

Nguyễn Đình Huy

Xác Suất - Thống Kê
& Phân Tích Số Liệu



X Á C

S U Ấ T

T H Ố N G

K Ê

& PHÂN TÍ C H S Ố L I Ệ U


Nguyễn Tiến Dũng
Trường Đại học Bách Khoa TPHCM

Nguyễn Đình Huy
Trường Đại học Bách Khoa TPHC



Mục Lục
Lời tựa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

xi

Chương 1. Mô hình xác suất . . . . . . . . . . . . . . . . . . . . . . . .

1

1 Xác suất cổ điển . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2

2 Không gian xác suất . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3

Không gian mẫu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

4

Độ đo xác suất . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .


6

3 Xác suất có điều kiện . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

9

Khái niệm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

10

Biến cố độc lập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

11

Công thức nhân xác suất . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

17

Công thức xác suất đầy đủ. . . . . . . . . . . . . . . . . . . . . . . . . . . .

19

Công thức Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Lời giải các câu hỏi chương 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Bài tập cuối chương . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

21
24
28


Chương 2. Biến ngẫu nhiên

.........................

31

1 Biến ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

32

2 Hàm phân phối . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

33

Khái niệm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

33

Mối liên hệ giữa hàm phân phối và xác suất . . . . . . . . . . . . . . . . .

34

Phân loại biến ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . . . . . .

35

3 Hàm xác suất/ Hàm mật độ . . . . . . . . . . . . . . . . . . . . . . . . . . . .

37


Biến ngẫu nhiên rời rạc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

37

Biến ngẫu nhiên liên tục . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

41

4 Phân vị và trung vị . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

45

iii


iv
5 Kỳ vọng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

51

Biến ngẫu nhiên rời rạc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

51

Biến ngẫu nhiên liên tục . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

55

6 Phương sai . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .


58

Biến ngẫu nhiên rời rạc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

60

Biến ngẫu nhiên liên tục . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

62

7 Moment bậc cao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Lời giải các câu hỏi chương 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Bài tập cuối chương . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

64
64
66

Chương 3. Một số phân phối đặc biệt . . . . . . . . . . . . . . .

71

1 Phân phối rời rạc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

72

Phân phối đều rời rạc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

72


Phân phối Bernoulli B(p) . . . . . . . . . . . . . . . . . . . . . . . . . . . .

73

Phân phối nhị thức B(n, p) . . . . . . . . . . . . . . . . . . . . . . . . . . .

74

Phân phối siêu bội H(N, m, n) . . . . . . . . . . . . . . . . . . . . . . . . .

80

Phân phối Poisson(λ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

84

Phân phối hình học G(p). . . . . . . . . . . . . . . . . . . . . . . . . . . . .

89

Phân phối nhị thức âm NB(n, p) . . . . . . . . . . . . . . . . . . . . . . . .

93

2 Phân phối liên tục . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

94

Phân phối đều U(a, b) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .


95

Phân phối chuẩn N(µ, σ 2 ) . . . . . . . . . . . . . . . . . . . . . . . . . . . .

97

Phân phối mũ Exp(λ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
Phân phối χ2 (m) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
Phân phối Student t(m) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
Phân phối Fisher F(m, n) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
3 Các định lý giới hạn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
Luật số lớn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
Định lý giới hạn trung tâm. . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
Lời giải các câu hỏi chương 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
Bài tập cuối chương . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116

Chương 4. Vectơ ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . .

121

1 Hàm phân phối của vectơ ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . 122


v
2 Hàm mật độ đồng thời . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
Vectơ ngẫu nhiên rời rạc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
Vectơ ngẫu nhiên liên tục . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
Vectơ ngẫu nhiên kết hợp . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
3 Hàm mật độ lề . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130

Vectơ ngẫu nhiên rời rạc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
Vectơ ngẫu nhiên liên tục . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
Vectơ ngẫu nhiên kết hợp . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
4 Các biến ngẫu nhiên độc lập . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
Vectơ ngẫu nhiên rời rạc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
Vectơ ngẫu nhiên liên tục . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
5 Kỳ vọng và phương sai . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
Kỳ vọng của vectơ ngẫu nhiên rời rạc . . . . . . . . . . . . . . . . . . . . . 141
Kỳ vọng của vectơ ngẫu nhiên liên tục . . . . . . . . . . . . . . . . . . . . 143
Phương sai . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
6 Hiệp phương sai . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
Lời giải các câu hỏi chương 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
Bài tập cuối chương . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151

Chương 5. Thu thập dữ liệu . . . . . . . . . . . . . . . . . . . . . . . . .

153

1 Khái niệm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
Thang đo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
Dữ liệu. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
Thống kê mô tả và thống kê suy diễn . . . . . . . . . . . . . . . . . . . . . 156
Quan sát và thí nghiệm. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
Kết luận thống kê . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
2 Sai lệch hệ thống và các phương pháp chọn mẫu . . . . . . . . . . . . . . 159
Các loại sai lệch hệ thống trong chọn mẫu . . . . . . . . . . . . . . . . . . 159
Phương pháp chọn mẫu thuận tiện . . . . . . . . . . . . . . . . . . . . . . . 162
Phương pháp lấy mẫu ngẫu nhiên đơn giản . . . . . . . . . . . . . . . . . . 162
Phương pháp lấy mẫu ngẫu nhiên phân tầng . . . . . . . . . . . . . . . . . 163
Phương pháp lấy mẫu ngẫu nhiên phân cụm . . . . . . . . . . . . . . . . . 164

Phương pháp lấy mẫu đa tầng . . . . . . . . . . . . . . . . . . . . . . . . . 165


vi
3 Thiết kế thí nghiệm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
Khái niệm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
Nhóm đối chứng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
Nhân tố ngoại lai . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
Bài tập cuối chương . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173

Chương 6. Mô tả dữ liệu . . . . . . . . . . . . . . . . . . . . . . . . . . . .

175

1 Mô tả dữ liệu bằng đồ thị . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
Dữ liệu định tính . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
Dữ liệu định lượng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
2 Mô tả dữ liệu bằng số. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187
Tâm của dữ liệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187
Độ phân tán của dữ liệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
Tổng kết dữ liệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
Một số tính chất của phân phối. . . . . . . . . . . . . . . . . . . . . . . . . 193
Lời giải các câu hỏi chương 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
Bài tập cuối chương . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195

Chương 7. Khoảng tin cậy

. . . . . . . . . . . . . . . . . . . . . . . . . . 197

1 Ước lượng điểm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198

Phân phối của trung bình mẫu . . . . . . . . . . . . . . . . . . . . . . . . . 199
Phân phối của tỉ lệ mẫu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
Ước lượng tham số xác suất của phân phối nhị thức . . . . . . . . . . . . 207
Ước lượng tham số m của phân phối siêu bội H(N, m, k) . . . . . . . . . 208
Ước lượng tham số tỉ lệ của phân phối Poisson . . . . . . . . . . . . . . . 209
Ước lượng tham số tỉ lệ của phân phối mũ Exp(λ) . . . . . . . . . . . . . 211
Ước lượng tham số a và b của phân phối đều U(a, b). . . . . . . . . . . . 212
Khoảng tin cậy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212
2 Phân phối chuẩn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214
Phương sai σ 2 đã biết. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215
Phương sai σ 2 chưa biết . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216
Khoảng tin cậy cho kỳ vọng của phân phối chuẩn với mẫu có kích thước
lớn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219
3 Các phân phối khác . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220


vii
Khoảng tin cậy cho các tham số của một phân phối bất kỳ . . . . . . . . 220
Khoảng tin cậy cho tỉ lệ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222
Lời giải các câu hỏi chương 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225
Bài tập cuối chương . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226

Chương 8. Kiểm định một mẫu. . . . . . . . . . . . . . . . . . . . . .

229

1 Các khái niệm cơ bản . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
Các giả thuyết thống kê . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
Các loại sai lầm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232
2 Kiểm định các tham số của phân phối chuẩn . . . . . . . . . . . . . . . . . 239

Kiểm định kỳ vọng với phương sai đã biết . . . . . . . . . . . . . . . . . . 239
Kiểm định kỳ vọng với phương sai chưa biết . . . . . . . . . . . . . . . . . 241
3 Kiểm định phân phối bất kỳ với mẫu lớn . . . . . . . . . . . . . . . . . . . . 244
4 Kiểm định tỷ lệ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246
Mẫu có kích thước lớn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246
Lời giải các câu hỏi chương 8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
Bài tập cuối chương . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249

Chương 9. Kiểm định hai mẫu. . . . . . . . . . . . . . . . . . . . . . .

251

1 Hai mẫu độc lập có phân phối chuẩn. . . . . . . . . . . . . . . . . . . . . . . 252
So sánh kỳ vọng của hai mẫu với phương sai đã biết . . . . . . . . . . . . 253
So sánh kỳ vọng của hai mẫu với hai phương sai chưa biết và bằng nhau 256
So sánh kỳ vọng của hai mẫu với hai phương sai chưa biết và khác nhau 259
So sánh phương sai của hai mẫu . . . . . . . . . . . . . . . . . . . . . . . . 264
2 Hai mẫu cặp đơi có phân phối chuẩn. . . . . . . . . . . . . . . . . . . . . . . 266
So sánh kỳ vọng của hai mẫu cặp đôi với σD đã biết . . . . . . . . . . . . 267
So sánh kỳ vọng của hai mẫu cặp đôi với σD chưa biết . . . . . . . . . . 268
3 Hai mẫu độc lập có kích thước lớn . . . . . . . . . . . . . . . . . . . . . . . . 270
So sánh kỳ vọng của hai mẫu có phân phối bất kỳ . . . . . . . . . . . . . 270


viii
So sánh kỳ vọng của hai mẫu có phân phối nhị thức . . . . . . . . . . . . 271
Lời giải các câu hỏi chương 9 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 276
Bài tập cuối chương . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280

Chương 10. Kiểm định sự phù hợp của mơ hình


. . . . . 283

1 Kiểm định sự phù hợp của một phân phối cụ thể . . . . . . . . . . . . . . 284
Định lý Pearson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 284
Kiểm định sự phù hợp của một phân phối rời rạc cụ thể . . . . . . . . . . 287
Kiểm định sự phù hợp của một phân phối liên tục cụ thể . . . . . . . . . 290
2 Kiểm định sự phù hợp của một họ các phân phối . . . . . . . . . . . . . . 294
Kiểm định sự phù hợp của một họ các phân phối rời rạc có hữu hạn giá trị294
Kiểm định sự phù hợp của một họ các phân phối rời rạc có vơ hạn giá trị296
Kiểm định sự phù hợp của một họ các phân phối liên tục . . . . . . . . . 299
3 Các phương pháp kiểm định phân phối khác. . . . . . . . . . . . . . . . . . 303
Phương pháp đồ thị xác suất chuẩn . . . . . . . . . . . . . . . . . . . . . . 304
Lời giải các câu hỏi chương 10 . . . . . . . . . . . . . . . . . . . . . . . . . . . 305
Bài tập cuối chương . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 308

Chương 11. Phân tích bảng tiếp liên 2 × 2

. . . . . . . . . . 311

1 Phương pháp kiểm định Fisher . . . . . . . . . . . . . . . . . . . . . . . . . . . 312
2 Kiểm định sự độc lập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 313
3 Kiểm định tính đồng nhất . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 317
4 Các phương pháp kiểm định khác . . . . . . . . . . . . . . . . . . . . . . . . . 321
Thiết kế cặp đôi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321
Phương pháp kiểm định McNemar . . . . . . . . . . . . . . . . . . . . . . . 322
Lời giải các câu hỏi chương 11 . . . . . . . . . . . . . . . . . . . . . . . . . . . 324
Bài tập cuối chương . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 325

Chương 12. Phân tích phương sai . . . . . . . . . . . . . . . . . . .


327

1 Anova một nhân tố . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328
Anova một nhân tố với mẫu cân bằng . . . . . . . . . . . . . . . . . . . . . 329


ix
Kiểm định giả thiết ‘phân phối chuẩn’ . . . . . . . . . . . . . . . . . . . . . 335
Lời giải các câu hỏi chương 12 . . . . . . . . . . . . . . . . . . . . . . . . . . . 336
Bài tập cuối chương . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 337

Chương 13. Hồi quy tuyến tính . . . . . . . . . . . . . . . . . . . . . .

339

1 Mơ hình hồi quy tuyến tính . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 340
Ước lượng đường hồi quy. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 341
Ước lượng các thông số khác của đường hồi quy . . . . . . . . . . . . . . 344
2 Suy diễn thống kê cho các tham số hồi quy . . . . . . . . . . . . . . . . . . 348
Các tính chất thống kê của S . . . . . . . . . . . . . . . . . . . . . . . . . . 348
Các tính chất thống kê của b . . . . . . . . . . . . . . . . . . . . . . . . . . 348
Các tính chất thống kê của a . . . . . . . . . . . . . . . . . . . . . . . . . . 351
Quan hệ thống kê giữa a và b . . . . . . . . . . . . . . . . . . . . . . . . . . 352
Tính chất thống kê của giá trị ước lượng yˆ∗ . . . . . . . . . . . . . . . . . 353
Tính chất thống kê của sai số ước lượng . . . . . . . . . . . . . . . . . . . 355
Tính chất thống kê của hệ số tương quan mẫu . . . . . . . . . . . . . . . 356
3 Kiểm định sự phù hợp của mô hình. . . . . . . . . . . . . . . . . . . . . . . . 358
Tính tuyến tính . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 358
Các phương sai bằng nhau . . . . . . . . . . . . . . . . . . . . . . . . . . . . 359

Tính phân phối chuẩn. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 360
4 Hồi quy phi tuyến. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 361
Hàm hiện . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 361
Hàm ẩn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 363
Lời giải các câu hỏi chương 13 . . . . . . . . . . . . . . . . . . . . . . . . . . . 364
Bài tập cuối chương . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 367

Một số đề thi tham khảo

. . . . . . . . . . . . . . . . . . . . . . . . . . . 371

A Đề thi trắc nghiệm. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 371
B Đề thi tự luận . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 382

Phụ lục . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

391

A Các nguyên lý đếm. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 391
Nguyên lý đếm cơ bản . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 391
Phép hoán vị . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 392


x
Tổ hợp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 393
B Các bảng thống kê . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 395
Bảng phân phối nhị thức B(n, p) . . . . . . . . . . . . . . . . . . . . . . . . 396
Bảng phân phối Poisson Poisson(λ) . . . . . . . . . . . . . . . . . . . . . . 403
Bảng phân phối chuẩn tắc N(0, 1) . . . . . . . . . . . . . . . . . . . . . . . 407
Bảng phân phối Student t(n) . . . . . . . . . . . . . . . . . . . . . . . . . . 410

Bảng phân phối χ2 (n) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413
Bảng phân phối Fisher F(m, n) . . . . . . . . . . . . . . . . . . . . . . . . . 416
C Đáp số một số bài tập cuối các chương. . . . . . . . . . . . . . . . . . . . . 429

Chỉ mục . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

431

Tài liệu tham khảo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

435


Lời tựa
Sự ra đời của lý thuyết xác suất bắt nguồn từ một số câu hỏi liên quan đến cờ bạc được
đặt ra vào thế kỷ thứ 17. Từ đó, các nhà toán học Blaise Pascal, Pierre de Fermat,
Jakob Bernoulli, Abraham de Moivre, và Pierre de Laplace đã có cơng nghiên cứu và
đặt nền tảng cho sự hình thành và phát triển của lý thuyết xác suất. Ngày nay, xác
suất có rất nhiều ứng dụng trong các ngành khoa học kỹ thuật như: xử lý tín hiệu,
tốn sinh, tốn tài chính, dịch tễ,... Khơng chỉ cung cấp các cơng cụ lý thuyết và ứng
dụng cho các ngành khoa học khác, lý thuyết xác suất còn giúp xây dựng cơ sở toán
học cho một ngành khoa học mới: ngành thống kê. Trải qua quá trình phát triển từ thế
kỷ thứ 18 với sự đóng góp của nhiều nhà thống kê xuất sắc như Francis Galton, Karl
Pearson, William Gosset, Ronald Fisher,... thống kê ngày càng phát triển và đóng vai
trị quan trọng trong đời sống hiện đại. Có thể nói, khoa học thống kê có mặt ở hầu
hết các ngành nghề, từ khoa học tự nhiên đến khoa học xã hội, từ các nghiên cứu cơ
bản đến các ứng dụng thực tế. Chúng ta có thể dễ dàng bắt gặp các ứng dụng thống
kê trong các đánh giá về tác hại của các trung tâm công nghiệp đến môi trường, các
nghiên cứu về thói quen và hành vi của người dùng trên các mạng xã hội, hay các đánh
giá về tác dụng của những loại thuốc mới... Không hề quá lời khi nói rằng, so với lý

thuyết xác suất, các phương pháp thống kê được quan tâm và sử dụng rộng rãi bởi các
đối tượng người dùng nhiều hơn và đa dạng hơn trong rất nhiều lĩnh vực.
Nhiều sách thống kê hiện nay được trình bày theo hướng thiên về xác suất với hàm
lượng xác suất rất lớn, các công thức và định lý được chứng minh một cách chặt chẽ và
đầy đủ. Cách tiếp cận này có ưu điểm là xây dựng được cơ sở toán học vững chắc cho
thống kê và thường phù hợp cho các sinh viên ngành toán hoặc có nền tảng tương đối
tốt về tốn. Tuy nhiên, cách tiếp cận này, theo kinh nghiệm của chúng tôi, là không
phù hợp cho các sinh viên không phải ngành tốn. Việc thiếu vắng các ví dụ thực tế
cũng góp phần khiến thống kê trở nên khô khan và xa cách đối với nhiều sinh viên,
và khiến nhiều người lầm tưởng thống kê là một phần của xác suất nói riêng và của
tốn học nói chung. Thực ra, thống kê là một ngành thực nghiệm và xác suất chỉ là
một trong nhiều cơng cụ của nó mà thơi. Khơng chỉ vậy, thống kê còn được sử dụng
trong rất nhiều ngành khoa học thực nghiệm khác như sinh học, hoá học, vật lý, môi
trường,... và gần đây là tin học. Cuốn sách này được biên soạn dựa trên bài giảng về
xác suất, thống kê và phân tích số liệu của các tác giả cho đối tượng là sinh viên của
các ngành kỹ thuật tại Trường Đại học Bách Khoa - Đại học Quốc gia TPHCM. Do
đó, cuốn sách này có thể được sử dụng như một tài liệu tham khảo chính cho các mơn:
Thiết kế thí nghiệm và xử lý dữ liệu, Thống kê và phân tích số liệu, Xác suất thống
kê,...ở Trường Đại học Bách Khoa TPHCM. Cùng với việc tham khảo một số ví dụ
và bài tập của các sách thống kê nước ngồi, giáo trình cũng cập nhật và giới thiệu
xi


xii
một số bài toán thống kê trong nước hay những vấn đề có tính thời sự. Với các ví dụ
đa dạng, chúng tơi hy vọng giáo trình có thể phù hợp với nhiều đối tượng người đọc,
không chỉ cho sinh viên Trường Đại học Bách Khoa TPHCM mà còn cho sinh viên của
các trường đại học và cao đẳng khác.
Giáo trình bao gồm các nội dung: xác suất (các chương chương 1 đến chương 4),
chọn mẫu và thiết kế thí nghiệm (chương 5), thống kê mô tả (chương 6), và thống kê

suy diễn (các chương chương 7 đến chương 13). Đặc biệt, sinh viên đang theo học môn
“Thống kê và phân tích số liệu” hay mơn “Thiết kế thí nghiệm và xử lý dữ liệu” chỉ cần
nắm những khái niệm cơ bản của nội dung xác suất (các chương chương 1 đến chương
4) và tập trung vào các chương còn lại. Đối với sinh viên đang theo học môn “Xác suất
thống kê” thì nội dung xác suất và thống kê cân bằng hơn, và có thể bỏ qua chương 5
và 12.
Chúng tơi chân thành cảm ơn những ý kiến góp ý hữu ích và thẳng thắn của các
đồng nghiệp, giúp chúng tơi hiệu chỉnh và hồn thiện cuốn sách này. Chúng tơi cũng
cảm ơn gia đình đã ln ủng hộ chúng tôi trong suốt thời gian qua. Mặc dù đã có nhiều
cố gắng để đảm bảo tính chính xác và gần gũi của cuốn sách, chúng tơi có lẽ cũng
khơng tránh khỏi có những sai sót trong q trình biên tập. Các ý kiến đóng ý xin gởi
về nhóm tác giả theo địa chỉ “Bộ mơn Tốn ứng dụng, Khoa Khoa học ứng dụng, Đại
học Bách Khoa TPHCM, 268 Lý Thường Kiệt, Phường 14, Quận 10, TPHCM” hoặc
qua email “”. Mọi góp ý, cả về nội dung lẫn hình thức, đều được
biết ơn và trân trọng.


Chương 1

Mơ hình xác suất
1

Xác suất cổ điển

2

Khơng gian xác suất

3


Xác suất có điều kiện

Hãy chọn giá đúng
là phiên bản tiếng
Việt của gameshow
ăn khách của nhiều
nước trên thế giới
The Price is Right,
do Đài truyền hình
Việt Nam thực
hiện; trong đó có
các trị chơi: Ong
tìm chữ, Con số
may mắn, Khơng
mà có, Xúc xắc, Số
7 may mắn, v.v.
Nguồn: />

2

1. XÁC SUẤT CỔ ĐIỂN

Xác suất thường được sử dụng trong ngôn ngữ hằng ngày với một tên gọi khác:
“khả năng xảy ra”. Chắc hẳn bạn đã từng tự hỏi: khả năng trúng vé số của mỗi người
thấp tới mức nào? hay khả năng một người chơi thắng cuộc trong trị chơi truyền hình
“Hãy chọn giá đúng” là bao nhiêu? Thực tế, ta có thể ước tính được các khả năng này
dựa vào các mơ hình xác suất phù hợp.
Ngày nay, xác suất đóng một vai trị quan trọng trong nhiều nghiên cứu khoa học,
đặc biệt là khoa học thực nghiệm. Để minh hoạ, ta nhận thấy tính ngẫu nhiên ln
xuất hiện trong các q trình sinh học hay các phản ứng hố họcdo sự thay đổi của

điều kiện mơi trường, điều kiện thí nghiệm, v.v. Điều này rõ ràng khơng chỉ ảnh hưởng
đến cách ta thiết kế thí nghiệm và lấy mẫu mà còn cách ta đưa ra các kết luận thống
kê. Trong chương này, ta sẽ làm quen với khái niệm xác suất cùng một số tính chất
hữu ích của nó.

1 Xác suất cổ điển
Trong nhiều thí nghiệm, ta có thể giả sử tất cả các kết quả có xác suất xuất hiện giống
nhau. Chẳng hạn, khi tung một đồng xu thì khả năng được mặt sấp hay mặt ngửa là
như nhau; hay khi tung một con xúc xắc thì khả năng được 1,2,3,4,5, hay 6 là như
nhau. Khi đó, xác suất được mặt sấp là 12 , và xác suất được số 3 là 16 . Một cách tổng
quát, xác suất để thắng một trò chơi là tỉ lệ
số lượt thắng
.
số lượt chơi
Ví dụ 1
Tung hai con xúc xắc. Tính xác suất tổng hai mặt trên bằng 7.
Bài giải. Trong 36 kết quả có thể có của việc tung hai con xúc xắc, có 6 trường
hợp tổng bằng 7: (1,6), (2,5), (3,4), (4,3), (5,2), (6,1). Do đó, xác suất cần tìm là
7
.
36
C âu h ỏ i t ư ơ n g t ự 1

Xem lời giải ở trang 24

Chọn ngẫu nhiên 5 quân bài từ bộ bài 52 cây. Tính xác suất để 5 quân bài này có
giá trị khác nhau.
Ví dụ 2
Một hội đồng được chọn ngẫu nhiên từ một nhóm 6 nam và 9 nữ. Tính xác suất
để hội đồng có 3 nam và 2 nữ.

Bài giải. Số cách chọn một hội đồng có 3 + 2 = 5 người từ một nhóm 6 + 9 = 15
người là C515 = 3003. Số cách chọn một hội đồng có 3 nam và 2 nữ là C36 C29 = 720.
720
240
Do đó, xác suất để chọn được hội đồng như yêu cầu là 3003
= 1001
.


CHƯƠNG 1. MƠ HÌNH XÁC SUẤT

C âu h ỏ i t ư ơ n g t ự 2

3
Xem lời giải ở trang 24

Chọn ngẫu nhiên 3 bi từ một hộp chứa 6 bi trắng và 5 bi đen. Tính xác suất để có
1 bi trắng và 2 bi đen.
Ví dụ 3
Giả sử có 4 người trong một phịng. Tính xác suất có ít nhất hai người có cùng
ngày sinh nhật. Ở đây, ta chỉ xét năm không nhuận.
Bài giải. Số cách chọn 4 ngày sinh nhật, mỗi ngày từ 365 ngày trong một năm,
là 3654 . Số cách chọn 4 ngày sinh nhật sao cho chúng khác nhau từng đôi là
365 · 364 · 363 · 362. Vì vậy, xác suất để khơng có hai người nào có cùng ngày sinh
nhật là
365 · 364 · 363 · 362
364 · 363 · 362
=
4
365

3653
Do đó, xác suất có ít nhất hai người có cùng ngày sinh nhật là
364 · 363 · 362
1−
≈ 0.0164.
3653
Tuy nhiên, không phải lúc nào các kết quả đều có xác suất xuất hiện giống nhau.
Chẳng hạn, chỉ có hai khả năng cho một tờ vé số: trúng và trật. Đương nhiên không ai
tin rằng xác suất trúng của một tờ vé số là 12 ! Do đó, việc giả sử các kịch bản ln có
cùng xác suất xảy ra là không phù hợp.
Người ta cũng nghiên cứu xác suất của một sự kiện dựa vào tần số xuất hiện của sự
kiện đó. Chẳng hạn, để biết xác suất xuất hiện mặt sấp khi tung một đồng xu, ta có
thể tung đồng xu 100 lần và đếm số mặt sấp. Nếu số mặt sấp là 50 thì xác suất xuất
50
hiện mặt sấp là 100
= 12 . Điều gì xảy ra nếu ta tung đồng xu thêm một lần nữa? Nếu ta
50
được mặt ngửa thì xác suất xuất hiện mặt sấp sẽ là 101
. Rõ ràng, xác suất tính theo
cách này không cho ta một giá trị duy nhất, một số có thể đặc trưng cho khả năng
xuất hiện mặt sấp. Ngoài ra, cách tiếp cận này chỉ cho phép ta tính xác suất xuất hiện
của các sự kiện đã xảy ra, và hồn tồn khơng thể áp dụng cho các sự kiện sẽ xảy ra ở
thì tương lai!
Do đó, ta cần xây dựng một khái niệm xác suất cho phép các kịch bản có thể xảy
với các xác suất khác nhau, và ứng với mỗi kịch bản, xác suất tương ứng là một số xác
định.

2 Không gian xác suất
Không gian xác suất là một bộ gồm ba đại lượng (Ω, F, P ); trong đó, Ω là khơng gian
mẫu, F là một đại số và P là độ đo xác suất. Một cách vắn tắt, Ω là tập hợp các kết

quả hay kịch bản có thể xảy ra, F là tập hợp các sự kiện mà ta có thể tính được xác
suất, và P là xác suất tương ứng. Các đại lượng này sẽ lần lượt được định nghĩa trong
các mục sau.


4

2. KHƠNG GIAN XÁC SUẤT

2.1 Khơng gian mẫu
Định nghĩa 2.1
Khi ta tiến hành một thí nghiệm, tập Ω tất cả các khả năng có thể xảy ra được
gọi là khơng gian mẫu. Mọi tập con của không gian mẫu Ω được gọi là một biến
cố hay một sự kiện. Một biến cố chỉ chứa một phần tử được gọi là biến cố đơn.
Hai ví dụ sau minh hoạ một số khơng gian mẫu trong trường hợp rời rạc.
Ví dụ 4
(1) Trong thí nghiệm tung một con xúc xắc, khơng gian mẫu là
Ω = {1, 2, 3, 4, 5}
và các tập con {1, 2} , {2, 4, 5},... là các biến cố.
(2) Trong thí nghiệm tung hai đồng xu, khơng gian mẫu là
Ω = {SS, SN, N S, N N }
và các tập con {SS} , {SS, SN, N N },... là các biến cố.
(3) Trong thí nghiệm tung một đồng xu và tung một con xúc xắc, không gian
mẫu là
Ω = {S1, S2, S3, S4, S5, S6, N 1, N 2, N 3, N 4, N 5, N 6}
và các tập con {S1, N 1} , {S2, N 3, N 6},... là các biến cố.
Ví dụ 5
Để kiểm tra chất lượng, bạn chọn ngẫu nhiên một chi tiết máy từ một lơ hàng
được sản xuất trong ngày hơm đó. Gọi A là biến cố chọn trúng một chi tiết máy
bị lỗi. Hãy mô tả không gian mẫu Ω và biến cố A. Từ đó cho biết biến cố A có

phải là một biến cố đơn không?
Bài giải. Không gian mẫu Ω là tập hợp Tốt, Lỗi và biến cố A là tập hợp {Lỗi}.
Vậy A là một biến cố đơn.
Ví dụ sau minh hoạ một số không gian mẫu trong trường hợp liên tục
Ví dụ 6
(1) Khi đo nồng độ một chất, khơng gian mẫu có thể là Ω = {x ∈ R : x ≥ 0}.
(2) Khi đo nhiệt độ (độ C) của một chất, khơng gian mẫu có thể là Ω =
{T ∈ R : T ≥ −273}.
(3) Khi xác định toạ độ của một điểm trên mặt phẳng hai chiều, khơng gian mẫu
có thể là Ω = R.


CHƯƠNG 1. MƠ HÌNH XÁC SUẤT

5

Đ ị n h n g h ĩ a 2 . 2 ( C ác p h é p t oá n c h o b i ế n c ố )
Cho A và B là hai biến cố trong không gian mẫu Ω.
(1) Biến cố tổng A + B (hay tổng hai biến cố A và B) là tập hợp chứa tất cả các
phần tử thuộc A hoặc thuộc B; nghĩa là, biến cố A + B xảy ra khi và chỉ khi biến
cố A xảy ra hoặc biến cố B xảy ra.
(2) Biến cố tích AB (hay tích hai biến cố A và B) là tập hợp chứa tất cả các phần
tử thuộc A và thuộc B; nghĩa là, biến cố AB xảy ra khi và chỉ khi biến cố A xảy
ra và biến cố B xảy ra.
(3) Biến cố hiệu (hay hiệu hai biến cố A và B) là tập hợp chứa tất cả các phần tử
thuộc A nhưng không thuộc B; nghĩa là, biến cố A − B xảy ra khi và chỉ khi biến
cố A xảy ra và biến cố B không xảy ra.
(4) Biến cố bù Ac (hay phần bù của biến cố A) là tập hợp Ω − A; nghĩa là, trong
mọi trường hợp, ln có đúng một trong hai biến cố xảy ra và biến cố còn lại khơng
xảy ra.

Để tiếp tục, ta định nghĩa
• Hai biến cố A và B được gọi là xung khắc (hay rời nhau) nếu AB = ∅; nghĩa là, hai
biến cố A và B khơng đồng thời xảy ra.
• Tập các biến cố A1 , . . . , An được gọi là một họ đầy đủ nếu chúng xung khắc từng
đôi và
n

Ai = Ω.
i=1

Hai định lý sau đây là hai luật quan trọng nhất của các phép toán cho biến cố
(không chứng minh). Luật đầu tiên là luật phân phối của phép cộng đối với phép nhân
hai biến cố, và luật phân phối của phép nhân đối với phép cộng hai biến cố
Đ ị n h lý 2 . 3 ( L u ật p h â n p h ố i )
Cho ba biến cố A, B, C. Thì
A(B + C) = AB + AC và A + (BC) = (A + B)(A + C)
Tổng quát, cho các biến cố A, B1 , . . . , Bn . Thì
n

n

Bi =

A
i=1

n

ABi và A +
i=1


n

Bi =
i=1

(A + Bi )
i=1

Tiếp theo là luật phân phối của phép lấy phần bù đối với phép cộng và nhân.
Đ ị n h lý 2 . 4 ( L u ật D e M o rg a n )
Cho hai biến cố A, B. Thì
(A + B)c = Ac B c và (AB)c = Ac + B c


6

2. KHÔNG GIAN XÁC SUẤT
Tổng quát, cho các biến cố A1 , . . . , An . Thì
c

n

Ai

n

i=1

c


n

=

Aci và

Ai

i=1

i=1

n

=

Aci
i=1

2.2 Độ đo xác suất
Định nghĩa 2.5
Cho Ω là một không gian mẫu, F là tập các biến cố của không gian mẫu, và P là
một ánh xạ trên F. Khi đó, P là một độ đo xác suất (hay gọi tắt là xác suất) trên
Ω nếu nó thoả ba tính chất sau
(1) P (A) ≥ 0 với mọi biến cố A ∈ F.
(2) P (Ω) = 1.
(3) Nếu A và B là hai biến cố xung khắc, nghĩa là AB = ∅, thì
P (A + B) = P (A) + P (B)
Tổng quát, nếu A1 , A2 , . . . là các biến cố xung khắc từng đơi thì





Ai =

P
i=1

P (Ai )
i=1

Mệnh đề 2.6
Độ đo xác suất P thoả mãn các tính chất sau
(1) 0 ≤ P (A) ≤ 1
(3) P (Ac ) = 1 − P (A)
(2) P (∅) = 0
(4) Nếu A ⊂ B thì P (A) ≤ P (B)
Ví dụ 7
Tung ba con xúc xắc. Tính xác suất ba mặt không đồng thời bằng nhau.
Bài giải. Gọi A là biến cố ba mặt không đồng thời bằng nhau. Thì Ac là biến
cố ba mặt giống nhau. Trong số 63 trường hợp có thể xảy ra, có 6 trường hợp ba
mặt giống nhau: (1, 1, 1), (2, 2, 2), . . . , (6, 6, 6). Do đó, P (Ac ) = 663 = 612 . Suy ra
P (A) = 1 − P (Ac ) = 1 − 612 = 35
.
36
Ví dụ 8
Tung hai con xúc xắc. Tính xác suất để
(1) Tích hai mặt là số chẵn.
(2) Tổng hai mặt là số chẵn.

Bài giải. Với i = 1, 2, gọi Ci là biến cố xúc xắc i là số chẵn.
(1) Gọi A là biến cố tích hai mặt là số chẵn. Khi đó, Ac là biến cố cả hai mặt đều


CHƯƠNG 1. MƠ HÌNH XÁC SUẤT

7

là số lẻ; nghĩa là, Ac = C1c C2c . Do đó
P (Ac ) = P (C1c C2c ) = P (C1c )P (C2c ) =
Vì vậy

1 1
1
· =
2 2
4

1
3
= .
4
4
(2) Gọi B là biến cố tổng hai mặt là số chẵn. Khi đó, B xảy ra nếu cả hai xúc
xắc đều cho số chẵn hoặc đều cho số lẻ; nghĩa là, B = C1 C2 + C1c C2c . Do đó
P (B) = P (C1 C2 + C1c C2c ) = P (C1 C2 ) + P (C1c C2c ) = P (C1 )P (C2 ) + P (C1c )P (C2c )
Vì P (C1 ) = P (C2 ) = P (C1c ) = P (C2c ) = 1/2 nên
1 1 1 1
1
P (B) = · + · = .

2 2 2 2
2
P (A) = 1 − P (Ac ) = 1 −

Đ ị n h lý 2 . 7
Nếu A và B là hai biến cố bất kỳ (không nhất thiết xung khắc) thì
P (A + B) = P (A) + P (B) − P (AB)
Tổng quát, nếu A1 , · · · , An là các biến cố bất kỳ thì
n
i=1

Ví dụ 9

P (Ai Aj ) +

P (Ai ) −

Ai =

P

i

i
P (Ai Aj Ak ) − · · ·
i
(P (AB) =⇒ P (A + B))


Giả sử xác suất để có mưa vào ngày thứ 7 và ngày chủ nhật bằng nhau và cùng
bằng 0.5, và xác suất để có mưa vào cả hai ngày là p. Tính xác suất để có mưa
vào cuối tuần.
Bài giải. Gọi A và B lần lượt là biến cố có mưa vào thứ 7 và biến cố có mưa vào
chủ nhật. Khi đó, P (A) = P (B) = 0.5 và P (AB) = p. Vì vậy, xác suất để có mưa
vào một trong hai ngày là
P (A + B) = P (A) + P (B) − P (AB) = 0.5 + 0.5 − p = 1 − p.
Ví dụ 10

(P (A + B) =⇒ P (AB))

Một bệnh nhân đi khám bác sĩ với triệu chứng đau họng và sốt. Sau khi khám
xong, bác sĩ chẩn đoán bệnh nhân bị nhiễm vi khuẩn, virut hoặc cả hai. Hơn nữa,
bác sĩ đánh giá rằng có 70% khả năng bệnh nhân có nhiễm vi khuẩn và 40% khả
năng bệnh nhân có nhiễm virut. Tính xác suất bệnh nhân nhiễm cả vi khuẩn và
virut.
Bài giải. Gọi A và B lần lượt là biến cố bệnh nhân bị nhiễm vi khuẩn và
biến cố bệnh nhân bị nhiễm virut. Vì bệnh nhân chắc chắn bị nhiễm bệnh nên


8

3. XÁC SUẤT CÓ ĐIỀU KIỆN
P (A + B) = 1. Do đó, xác suất bệnh nhân bị nhiễm cả hai là
P (AB) = P (A) + P (B) − P (A + B) = 0.7 + 0.4 − 1 = 0.1.
Ví dụ 11

(P (Ac B c ) =⇒ P (AB))

Giả sử P (A) = 0.3, P (B) = 0.4, P (Ac B c ) = 0.6. Tính P (AB).

Bài giải. Ta có
P (A + B) = 1 − P ((A + B)c ) = 1 − P (Ac B c ) = 1 − 0.6 = 0.4
Suy ra
P (AB) = P (A) + P (B) − P (A + B) = 0.3 + 0.4 − 0.4 = 0.3.
Ví dụ 12

(P (AB) =⇒ P (Ac B c ))

Chọn ngẫu nhiên một số nguyên từ 1 đến 1000. Hãy tính xác suất số đó khơng
chia hết cho 2 và khơng chia hết cho 3.
Bài giải. Gọi A là biến cố số đó khơng chia hết cho 2 và 3. Gọi A2 và A3 lần lượt
là biến cố số đó chia hết cho 2 và chia hết cho 3. Thì
A = Ac2 Ac3 = (A2 + A3 )c
Mặt khác
P (A2 + A3 ) = P (A2 ) + P (A3 ) − P (A2 A3 )
trong đó, A6 = A2 A3 là biến cố số đó chia hết cho 6. Vì có 1001−1
= 500 số chia
2
500
333
hết cho 2 từ 1 đến 1000 nên P (A2 ) = 1000 = 0.5. Tương tự, P (A3 ) = 1000
= 0.333,
166
và P (A6 ) = 1000 = 0.166. Suy ra
P (A2 + A3 ) = 0.5 + 0.333 − 0.166 = 0.667
Do đó
P (A) = 1 − P (A2 + A3 ) = 1 − 0.667 = 0.333.
C âu h ỏ i t ư ơ n g t ự 3

Xem lời giải ở trang 25


Cho bốn cặp vợ chồng ngồi ngẫu nhiên quanh một bàn trịn. Tính xác suất khơng
có người vợ nào ngồi cạnh chồng mình.

3 Xác suất có điều kiện
Ta biết rằng xác suất P (A) là một hằng số mô tả khả năng xảy ra của sự kiện A. Tuy
nhiên, xác suất không thể là một đại lượng bất biến. Chẳng hạn, giả sử A là sự kiện
“Real Madrid vô địch Champion League năm 2016”. Nếu câu hỏi này được đặt ra vào
năm 2015 thì P (A) có giá trị lớn hơn 0 và nhỏ hơn 1 (0 < P (A) < 1). Ngược lại, nếu
câu hỏi này được đặt ra vào năm 2017 thì P (A) bằng 1 vì lúc đó ta đã biết Real Madrid
là nhà vơ địch! Ngồi ra, nếu câu hỏi này được đặt ra vào năm 2017 cho một người
khơng quan tâm đến bóng đá thì xác suất này lại có giá trị từ 0 đến 1 (0 ≤ P (A) ≤ 1).
Do đó, xác suất phải phụ thuộc vào thông tin mà ta đã biết.


CHƯƠNG 1. MƠ HÌNH XÁC SUẤT

9

3.1 Khái niệm
Định nghĩa 3.1
Xác suất có điều kiện của biến cố A biết biến cố B
được định nghĩa bởi
P (AB)
P (A|B) =
P (B)

A

B


Ví dụ 13
Digoxin là một glicozit tim (steroid có hoạt tính ở tim) được chiết xuất từ cây
mao địa hoàng và thường được dùng để điều trị các bệnh liên quan đến tim mạch.
Năm 1971, Bellar đã tiến hành nghiên cứu mối liên hệ giữa nồng độ chất digoxin
trong máu và việc ngộ độc digoxin. Dưới đây là kết quả
Bị ngộ độc (D+) Không bị ngộ độc (D−) Tổng
Nồng độ digoxin cao (T +)
25
14
39
Nồng độ digoxin thấp (T −)
18
78
96
Tổng
43
92
135
39
18
Dễ thấy: P (T +) = 135 = 0.289, P (D+) = 135 = 0.318, ... Nếu kết quả xét nghiệm
máu cho thấy nồng độ digoxin trong máu của một bệnh nhân là cao thì xác suất
bệnh nhân bị ngộ độc là bao nhiêu? Cơng thức xác suất có điều kiện suy ra
25
P (D + |T +) =
= 0.640
39
Ví dụ 14
Tung hai con xúc xắc. Tính xác suất tổng số chấm xuất hiện bằng 6 biết rằng hai

mặt xuất hiện khác nhau.
Bài giải. Gọi A là biến cố tổng số chấm xuất hiện bằng 6 và B là biến cố hai mặt
xuất hiện khác nhau. Khi đó P (A|B) = PP(AB)
. Vì B c là biến cố hai xúc xắc giống
(B)
6
nhau nên P (B c ) = 36
= 16 . Suy ra
5
P (B) = 1 − P (B c ) = .
6
Mặt khác, vì chỉ có 4 trường hợp tổng số chấm xuất hiện bằng 6 với hai mặt khác
4
nhau: (1,5), (2,4), (4,2), (5,1), nên P (AB) = 36
= 19 . Do đó
1/9
2
P (A|B) =
= .
5/6
15
C âu h ỏ i t ư ơ n g t ự 4

Xem lời giải ở trang 25

Tung hai con xúc xắc và gọi T là tổng số chấm xuất hiện. Tính xác suất T < 8
biết rằng T lẻ.


10


3. XÁC SUẤT CÓ ĐIỀU KIỆN

Từ định nghĩa xác suất có điều kiện, ta suy ra
P (AB) = P (A|B)P (B)
Tương tự, ta cũng có
P (AB) = P (B|A)P (A)

(3.1)
(3.2)

Ví dụ 15
Một thùng chứa r quả bóng đỏ và b quả bóng đen. Rút ngẫu nhiên lần lượt hai
quả bóng. Tính xác suất để quả thứ nhất màu đỏ và quả thứ hai màu đen.
Bài giải. Gọi A là biến cố quả thứ nhất màu đỏ và B là biến cố quả thứ hai màu
r
đen. Khi đó, P (A) = r+b
. Nếu biết rằng quả thứ nhất màu đỏ thì trước khi rút
quả thứ hai, trong thùng có r − 1 quả bóng đỏ và b quả bóng đen. Do đó, xác suất
quả thứ hai màu đen biết rằng quả thứ nhất màu đỏ bằng
r−1
P (B|A) =
r+b−1
Xác suất cần tìm là
r−1
r(r − 1)
r
=
.
P (AB) = P (A)P (B|A) =

r+br+b−1
(r + b)(r + b − 1)

3.2 Biến cố độc lập
Ta bắt đầu mục này với khái niệm độc lập vật lý. Hai biến cố được gọi là độc lập vật lý
nếu chúng phụ thuộc vào hai đối tượng vật lý độc lập với nhau. Chẳng hạn, ta lần lượt
tung hai con xúc xắc. Biến cố xúc xắc thứ nhất cho số 1 và biến cố xúc xắc thứ hai cho
số 3 là hai biến cố độc lập vật lý vì hai con xúc xắc là hai đối tượng vật lý độc lập. Tuy
nhiên, trong lý thuyết xác suất, ta quan tâm đến một khái niệm độc lập khác: độc lập
thống kê.
Định nghĩa 3.2
Hai biến cố A và B được gọi là độc lập thống kê, hay đơn giản là độc lập, nếu
P (A|B) = P (A) hay P (B|A) = P (B).
Nghĩa là, việc biết biến cố B xảy ra hay không không ảnh hưởng đến xác suất xảy
ra của biến cố A, và ngược lại.
Hiển nhiên, hai biến cố độc lập vật lý thì độc lập thống kê. Điều ngược lại khơng
đúng. Ví dụ sau cho thấy hai biến cố khơng độc lập vật lý vẫn có thể độc lập thống kê.
Ví dụ 16
Rút ngẫu nhiên một quân bài từ một bộ bài 52 cây. Gọi E là biến cố rút được
một quân át, F là biến cố rút được một quân cơ và G là biến cố rút được qn rơ.
Thì E và F là độc lập vì dù qn bài được rút có là qn át hay khơng thì xác
suất qn bài đó là qn cơ vẫn khơng đổi và bằng 14 . Tuy nhiên, F và G không


×