Tải bản đầy đủ (.pdf) (57 trang)

Phương pháp xác suất trong tổ hợp

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (286.99 KB, 57 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2

KHOA TOÁN

Nguyễn Thị Hường

PHƯƠNG PHÁP XÁC SUẤT TRONG TỔ HỢP

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC

Hà Nội – Năm 2016


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2

KHOA TOÁN

Nguyễn Thị Hường

PHƯƠNG PHÁP XÁC SUẤT TRONG TỔ HỢP

Chuyên ngành: Toán ứng dụng

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC

NGƯỜI HƯỚNG DẪN KHOA HỌC:
TS. Trần Vĩnh Đức

Hà Nội – Năm 2016




LỜI CẢM ƠN
Trước khi trình bày nội dung chính của khóa luận, em xin bày tỏ lòng biết ơn sâu
sắc tới Tiến sĩ Trần Vĩnh Đức - Giảng viên trường Đại học Bách khoa Hà Nội - người
đã tận tình hướng dẫn để em có thể hoàn thành khóa luận này.
Em cũng xin bày tỏ lòng biết ơn chân thành tới toàn thể các thầy cô giáo trong
khoa Toán, Trường Đại học Sư Phạm Hà Nội 2 đã dạy bảo em tận tình trong suốt quá
trình học tập tại khoa.
Nhân dịp này em cũng xin được gửi lời cảm ơn chân thành tới gia đình, bạn bè đã
luôn bên em, cổ vũ, động viên, giúp đỡ em trong suốt quá trình học tập và thực hiện
khóa luận tốt nghiệp.
Hà Nội, tháng 05 năm 2016
Sinh viên
Nguyễn Thị Hường


LỜI CAM ĐOAN
Em xin cam đoan đề tài "Phương pháp xác suất trong tổ hợp" được hoàn
thành, dưới sự hướng dẫn của thầy Trần Vĩnh Đức, không trùng với bất kỳ đề tài nào
khác.
Trong quá trình hoàn thành đề tài, em đã thừa kế những thành tựu của các nhà
khoa học với sự trân trọng và biết ơn.
Hà Nội, tháng 05 năm 2016
Sinh viên
Nguyễn Thị Hường


Mục lục


Lời mở đầu

1

1 CHỨNG MINH BẰNG CÁCH ĐẾM

3

1.1

Ví dụ mở đầu . . . . . . . . . . . . . . . . . . . . . . . .

3

1.2

Hàm Boolean . . . . . . . . . . . . . . . . . . . . . . . .

5

1.3

Bài toán tô hai màu . . . . . . . . . . . . . . . . . . . .

9

2 KHÔNG GIAN XÁC SUẤT HỮU HẠN

13


2.1

Không gian xác suất hữu hạn . . . . . . . . . . . . . . .

13

2.2

Dãy ngẫu nhiên của n số 0 và số 1 . . . . . . . . . . . . .

17

2.3

Hoán vị ngẫu nhiên . . . . . . . . . . . . . . . . . . . . .

18

2.4

Đồ thị ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . .

21

2.5

Biến cố độc lập . . . . . . . . . . . . . . . . . . . . . . .

24


3 BIẾN NGẪU NHIÊN VÀ KỲ VỌNG

29

3.1

Biến ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . .

29

3.2

Kỳ vọng . . . . . . . . . . . . . . . . . . . . . . . . . . .

31

4 MỘT SỐ ỨNG DỤNG
4.1

37

Sự tồn tại của đồ thị con hai phần lớn . . . . . . . . . .
i

37


Khóa luận tốt nghiệp Đại học

Nguyễn Thị Hường


4.2

Tập độc lập . . . . . . . . . . . . . . . . . . . . . . . . .

39

4.3

Số các giao điểm mức ≤ k . . . . . . . . . . . . . . . . .

41

4.4

Số phép so sánh trung bình trong thuật toán QUICKSORT 45

Kết luận . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

50

Tài liệu tham khảo . . . . . . . . . . . . . . . . . . . . . . .

51

ii


Khóa luận tốt nghiệp Đại học


Nguyễn Thị Hường

Lời mở đầu

1. Lý do chọn đề tài
Xác suất là một nhánh toán học được phát triển mạnh mẽ và được sử
dụng rộng rãi trong cuộc sống. Tuy nhiên phương pháp xác suất ứng
dụng trong tổ hợp mới được phát triển trong khoảng 50 năm trở lại đây,
khởi xướng bởi nhà toán học Paul Erd¨os. Hiện nay, nó trở thành một
phương pháp mạnh trong Lý thuyết đồ thị và tổ hợp để giải các bài toán
tồn tại; nó cũng là một trong những phương pháp được dùng phổ biến
nhất trong phân tích thuật toán. Vì vậy, em chọn đề tài "Phương pháp
xác suất trong tổ hợp" cho khóa luận nhằm tìm hiểu một phần ứng dụng
của phương pháp xác suất trong giải các bài toán tổ hợp.

2. Mục đích nghiên cứu
• Giới thiệu phương pháp chứng minh bằng cách đếm và đưa ra ví
dụ điển hình;
• Tìm hiểu khái niệm về không gian xác suất hữu hạn và một số kiến
thức có liên quan;
• Tìm hiểu về biến ngẫu nhiên và kỳ vọng;
• Đưa ra một số ví dụ ứng dụng.

1


Khóa luận tốt nghiệp Đại học

Nguyễn Thị Hường


3. Nhiệm vụ nghiên cứu
Tìm hiểu về phương pháp xác suất trong giải các bài toán tổ hợp.

4. Đối tượng và phạm vi nghiên cứu
• Đối tương nghiên cứu: Các bài toán tổ hợp.
• Phạm vi nghiên cứu: Xác suất tổ hợp và các bài toán trong không
gian xác suất hữu hạn.

5. Cấu trúc đề tài
Phần lớn nội dung của luận văn tham khảo từ chương 10 của cuốn
sách Invitation to Discrete Mathematics của Jiri Matousek và Jaroslav
Nesetril.
Ngoài phần mở đầu, kết luận, danh mục tài liệu tham khảo thì đề tài
bao gồm 4 chương:
• Chương 1. Chứng minh bằng cách đếm.
• Chương 2. Không gian xác suất hữu hạn.
• Chương 3. Biến ngẫu nhiên và kỳ vọng.
• Chương 4. Một số ứng dụng.

2


Chương 1
CHỨNG MINH BẰNG CÁCH
ĐẾM

Chương này trình bày một ví dụ điển hình dùng phương pháp chứng
minh bằng cách đếm. Hai ví dụ đầu tiên sẽ không sử dụng ngôn ngữ xác
suất, mà thay vào đó chúng ta sử dụng các kỹ thuật đếm đơn giản. Các
ví dụ sau nhằm mô tả sự phát triển tự nhiên từ phương pháp đếm đến

phương pháp xác suất.

1.1

Ví dụ mở đầu

Chúng ta bắt đầu bằng một ví dụ mô tả phương pháp đếm để chứng
minh bài toán tồn tại.
Ví dụ 1.1. Xét bộ bài tây gồm 52 cây (các quân bài được xếp theo
một thứ tự nào đó). Chúng ta sẽ xáo trộn bài bằng “dovetail shuffling”:
chúng ta chia bộ bài thành hai phần bằng nhau, và xen kẽ các quân bài
ở phần này với các quân bài từ phần khác, sao cho thứ tự của các quân
3


Khóa luận tốt nghiệp Đại học

Nguyễn Thị Hường

bài trong mỗi phần không đổi (xem hình 1.1). Chúng ta chứng minh
rằng nếu lặp lại thủ tục nhiều nhất 4 lần thì chúng ta không thể có tất
cả các khả năng sắp thứ tự có thể có của các quân bài, và do đó với 4
lần trộn “dovetail shuffing” chắc chắn không thể cho tất cả thứ tự ngẫu
nhiên của các quân bài.

Hình 1.1: Xáo bài kiểu Dovetail shuffling

Chứng minh. Có tất cả 52! cách sắp thứ tự các quân bài. Chúng ta sẽ
đếm số cách sắp thứ tự khác nhau có thể có bằng thủ tục xếp bài đã mô
tả. Có bao nhiêu cách để trộn hai phần riêng biệt của bộ bài (ta có thể

gọi là phần trái và phần phải)? Nếu chúng ta đã biết cách sắp xếp quân
bài trong cả hai phần trái và phải, và nếu chúng ta định rõ quân bài nào
được sắp xếp thứ tự đến từ phần trái hay phần phải thì chúng ta có thể
xây dựng lại một thứ tự khác của bộ bài sau khi hai phần được trộn lẫn.
( )
Do đó, sau lần chia và trộn thứ nhất, có 52
26 cách sắp thứ tự có thể xảy
ra. Và với 4 lần lặp lại như vậy, chúng ta có thể đạt được nhiều nhất
(52)4
cách sắp thứ tự có thể. Số này bé hơn 52!, và do đó với 4 lần lặp
26
như trên sẽ tồn tại một vài cách sắp thứ tự mà không được nhắc tới.
4


Khóa luận tốt nghiệp Đại học

Nguyễn Thị Hường

Cũng không đúng khi nói rằng chúng ta có thể nhận được tất cả các
cách sắp thứ tự bằng 5 lần lặp như trên. Câu hỏi đặt ra là sau bao nhiêu
lần lặp lại thủ tục sắp thứ tự như trên thì ta nhận được một thứ tự ngẫu
nhiên như đã đặt ra? Đây là một câu hỏi khó.

1.2

Hàm Boolean

Định nghĩa 1.1. Hàm Boolean với n biến là một ánh xạ
f : {0, 1}n → {0, 1}.

Nói cách khác, đây là một cách gán giá trị 0 hoặc 1 cho mỗi tổ hợp n
bit của 0 và 1. Ở đây 1 đại diện cho logic giá trị “đúng” và 0 đại diện
cho logic giá trị “sai”.
Hàm Boolean có thể được xác định bởi bảng giá trị hoặc bởi nhiều
cách khác. Chẳng hạn như, bởi một chương trình máy tính đọc n bit nhị
phân đầu vào và tính toán ra câu trả lời là có/không. Tương tự như vậy,
một mạch tích hợp với n dây vào và một dây ra cũng là định nghĩa của
hàm Boolean với n biến.
Chúng ta muốn chỉ ra rằng có tồn tại hàm Boolean rất khó mô tả.
Tức là nó chỉ có thể được định nghĩa bởi một chương trình rất dài, hoặc
bởi một mạch với một số rất lớn thành phần bộ phận cấu thành. . . . Về
mặt kỹ thuật, cách mô tả hàm Boolean đơn giản nhất có lẽ là bằng công
thức logic.

5


Khóa luận tốt nghiệp Đại học

Nguyễn Thị Hường

Một công thức logic với n biến là một chuỗi gồm các ký hiệu
x1 , x 2 , . . . , x n
(một trong số chúng có thể được lặp đi lặp lại nhiều lần), dấu ngoặc
đơn, và các kí hiệu sau cho các phép toán logic:
∧ (phép hội), ∨ (phép tuyển), ⇒ (phép suy ra), ⇔ (phép
tương tương) và ¬ (phép phủ định).
Tất nhiên không phải mọi dãy ký hiệu này là một công thức logic; một
công thức phải thỏa mãn các quy tắc cú pháp cơ bản, ví dụ như quy
tắc đặt dấu ngoặc đúng. Những chi tiết của các quy tắc này không quan

trọng ở đây. Ví dụ dưới đây là một công thức logic hợp lệ với 3 biến số:
(x1 ∧ x2 ) ∨ (x3 ∨ ¬x1 ).
Mỗi một công thức logic với n biến định nghĩa một hàm Boolean n biến:
cho giá trị nhất định của các biến x1 , x2 , . . . , xn thế các giá trị này vào
công thức và đánh giá giá trị chân lý của công thức bằng các quy tắc
của liên kết logic. Ví dụ
0 ∧ 0 = 0 ∧ 1 = 1 ∧ 0 = 0 và 1 ∧ 1 = 1.
Cũng không khó để chỉ ra rằng mỗi hàm Boolean đều có thể được định
nghĩa bởi một công thức logic nào đó. Câu hỏi đặt ra bây giờ là: Công
thức logic như vậy phải dài như thế nào?
Mệnh đề 1.1. Có tồn tại hàm Boolean n biến mà không thể được định
6


Khóa luận tốt nghiệp Đại học

Nguyễn Thị Hường

nghĩa bằng công thức nào với ít hơn 2n / log2 (n + 8) ký hiệu. Ví dụ, với
hàm 23 biến, chúng ta đã cần một công thức với hơn một triệu ký hiệu.
n

Chứng minh. Số lượng tất cả các hàm Boolean của biến n là 22 , trong
đó, số lượng công thức với n biến được viết bởi nhiều nhất m ký hiệu là
không quá (n + 8)m , vì mỗi một vị trí trong m vị trí có thể điền vào bằng
một trong những (n + 7) ký hiệu có thể, hay có thể bằng khoảng trắng.
Với cách này, chúng ta đã đếm thừa rất nhiều dãy ký hiệu vô nghĩa
n

nhưng chúng ta chỉ cần một ước lượng thô là đủ. Nếu 22 > (n + 8)m ,

vậy tồn tại một hàm Boolean mà không thể được xác định bởi một công
thức với ít hơn m ký hiệu. Bằng lấy log trong bất đẳng thức, ta được
m ≥ 2n / log2 (n + 8).
Tương tự như vậy, người ta có thể xem xét các hàm Boolean xác định
bởi các chương trình máy tính trong một số ngôn ngữ lập trình cố định
hoặc bằng mạch tích hợp bao gồm tập hợp của một số thành phần. . . .
Trong mỗi trường hợp như vậy, chứng minh giống ở trên chúng ta thấy
tồn tại các hàm của biến số n không được định nghĩa bởi các chương
trình hay mạch có kích thước nhỏ hơn 2n . (Chúng ta đã chứng minh được
các công thức từ định nghĩa của chúng và từ các phép đếm cơ bản.)
Hai ví dụ trong hai mục trước có chung một sơ đồ. Cho một tập hợp
các đối tượng và chúng ta muốn chỉ ra một số đối tượng được gọi là “tốt”
trong số đó (có một vài tính chất yêu cầu; Trong Ví dụ 1.1, các đối tượng
tốt không thể nhận được chỉ bằng 4 lần trộn). Chúng ta sẽ đếm xem có
tất cả bao nhiêu đối tượng và trong số đó có bao nhiêu đối tượng xấu.
Nếu ta chỉ ra rằng số các đối tượng xấu nhỏ hơn tổng số đối tượng, tức
7


Khóa luận tốt nghiệp Đại học

Nguyễn Thị Hường

là tồn tại một vài đối tượng tốt. Thông thường, ta còn thấy phần lớn
đối tượng là tốt.
Một điều đáng chú ý của phương pháp này là chúng ta không biết
đến các đối tượng tốt cụ thể như thế nào và thậm chí chúng ta không
biết bất cứ điều gì về nó–chúng ta chỉ biết rằng nó tồn tại. Trong Ví
dụ 1.1, chúng ta thấy một vài cách sắp thứ tự của các quân bài không
được đề cập tới, nhưng chúng ta không kể ra bất kỳ trường hợp nào cụ

thể. Trong chứng minh của Mệnh đề 1.1, chúng ta đã không tìm ra hàm
Boolean “khó” nào cả (hàm với công thức ngắn). Tình huống này là rất
phổ biến trong các chứng minh như vậy. Đối với nhiều đối tượng tổ hợp,
chúng ta có thể dễ dàng chứng minh sự tồn tại của một vài đối tượng,
nhưng chỉ ra cách xây dựng nó là điều khá khó.
Các lập luận về các đối tượng tốt và xấu được đề cập trong ngôn ngữ
của xác suất. Hãy tưởng tượng rằng chúng ta lựa chọn một đối tượng từ
tập các đối tượng một cách ngẫu nhiên. Nếu ta được một xác suất khác
0 thì chúng ta chọn được một đối tượng tốt, điều này có nghĩa là có ít
nhất một đối tượng tốt phải tồn tại. Trong các vấn đề phức tạp hơn,
ngôn ngữ xác suất cho phép mô tả lời giải đơn giản hơn phương pháp
đếm các đối tượng; hơn nữa ta có thể áp dụng nhiều kết quả cao cấp
hơn của lý thuyết xác suất để xây dựng các đối tượng đếm cồng kềnh.
Chúng ta sẽ sử dụng ngôn ngữ xác suất trong các ví dụ tiếp theo.

8


Khóa luận tốt nghiệp Đại học

1.3

Nguyễn Thị Hường

Bài toán tô hai màu

Cho X là một tập hữu hạn và cho M là một họ các tập con của X. Ta
nói rằng M là 2-tô màu được nếu ta có có thể tô mỗi một điểm của X
một màu đỏ hoặc trắng sao cho không có tập nào của M mà các điểm
đều cùng màu.

Bài toán 1.1. Giả sử rằng mỗi tập con của M có chính xác k phần tử.
Số nhỏ nhất, m(k), các tập trong họ M để M không là 2-tô màu được
bằng bao nhiêu?
Dễ thấy m(2) = 3 vì ta có ví dụ
X = {a, b, c} và họ M = {{a, b}, {a, c}, {b, c}}
không phải 2-tô màu được; và mọi họ gồm ít hơn 3 tập đều là 2-tô màu
được.
Câu hỏi cho trường hợp k = 3 khó hơn nhiều. Định lý sau đây cho
một chặn trong trường hợp k = 3.
Định lý 1.1. Ta có m(k) ≥ 2(k−1) , tức là một họ bất kỳ bao gồm ít hơn
2(k−1) đều là 2-tô màu được.
Chứng minh. Cho M là họ tập con k phần tử của tập X và giả sử
|M| = m. Chúng ta tô màu mỗi điểm của X bằng màu đỏ hoặc màu
trắng bằng thuật toán ngẫu nhiên sau đây:
Với mỗi điểm x ∈ X, ta tung đồng xu. Nếu đồng xu sấp
thì tô x bằng màu trắng, còn nếu đồng xu ngửa thì tô x bằng
màu đỏ.
9


Khóa luận tốt nghiệp Đại học

Nguyễn Thị Hường

Cho M ∈ M là một tập con k phần tử của hệ đang xét. Xác suất mọi
điểm của M được tô cùng một màu bằng bao nhiêu?
Xác suất cả k điểm của M đều được tô màu trắng là 2−k ; và xác suất
tất cả k điểm này cùng được tô màu đỏ cũng là 2−k . Vậy thì xác suất
để M có cùng màu là 2.2−k = 2(1−k) . Do đó xác suất tồn tại ít nhất một
trong m tập của M cùng màu nhiều nhất bằng m.2(1−k) .

Nếu số này nhỏ hơn 1, tức là nếu m < 2(k−1) , thì thuật toán tô màu
ngẫu nhiên của chúng ta chọn được một 2-tô màu được cho hệ M với
xác suất khác 0. Do đó, ít nhất một 2-tô màu tồn tại. Đây là điều chắc
chắn và không liên quan đến xác suất nữa! Định lý đã được chứng minh.

Chúng ta tiếp tục cải thiện chặn trong định lý trước.
Định lý 1.2. m(3) ≥ 7.
Chúng ta sẽ chỉ ra họ gồm của 6 tập con ba phần tử của một tập
hữu hạn X là 2-tô màu được. Chúng ta phân biệt hai trường hợp theo
số lượng các điểm của X: |X| ≤ 6 và |X| > 6. Chỉ có trường hợp đầu
tiên sẽ được chứng minh bởi lập luận xác suất.
Bổ đề 1.1. Cho X là một tập hợp với nhiều nhất 6 phần tử, và cho M
là một họ với nhiều nhất 6 tập con ba phần tử của X. Khi đó M là 2-tô
màu được.
Chứng minh. Nếu cần thiết, chúng ta có thể thêm điểm để X có chính
xác 6 điểm. Ta xét thuật toán ngẫu nhiên tô màu X như sau:
Ta chọn ngẫu nhiên 3 trong số 6 điểm của X và tô chúng
màu trắng, và 3 điểm còn lại tô màu đỏ.
10


Khóa luận tốt nghiệp Đại học

Vậy ta có

(6)
3

Nguyễn Thị Hường


= 20 khả năng lựa chọn như vậy. Nếu M là bộ ba bất kỳ

lấy từ M, sẽ chỉ có 2 khả năng để M cùng màu:
• hoặc M là màu đỏ và 3 điểm còn lại có màu trắng,
• hoặc M là màu trắng và những điểm còn lại là màu đỏ.
Do đó xác suất mà các điểm M cùng màu là 1/10. Vậy thì xác suất để
một trong 6 bộ ba của M là cùng màu không nhiều hơn 6/10 < 1. Và
do đó tồn tại một 2-tô màu.
Đối với trường hợp thứ hai, chúng ta cần các định nghĩa sau. Cho
(X, M) là một họ các tập, và cho x, y là hai phần tử của X. Ta nói rằng
x và y là liên thông nếu tồn tại một tập M ∈ M chứa cả x và y. Nếu
x và y là hai điểm không liên thông, chúng ta định nghĩa một hệ mới
(X ′ , M′ ) bằng cách "dán" x và y với nhau như sau: Các điểm x và y
được thay thế bởi một điểm z duy nhất, và ta đặt z vào tất cả các tập
trước đó chứa một trong hai phần tử x hoặc y. Viết một cách hình thức,
X ′ = (X \ {x, y}) ∪ {z},
M ′ = {M ∈ M : M ∩ {x, y} = ∅} ∪
{(M \ {x, y}) ∪ {z} : M ∈ M và M ∩ {x, y} ̸= ∅}.
Chúng ta lưu ý rằng nếu điểm x và y không liên thông và M là một hệ
của các bộ ba, khi đó (X ′ , M′ ) cũng là hệ của các bộ ba, và tập hợp X ′
có ít hơn một điểm so với X. Hơn nữa, chúng ta khẳng định rằng nếu
(X ′ , M ′ ) là 2–tô màu được thì (X, M) cũng là 2-tô màu được. Để thấy
điều này, hãy xem xét một 2-tô màu của tập X ′ và tô màu X theo cùng
11


Khóa luận tốt nghiệp Đại học

Nguyễn Thị Hường


cách, ở đó cả x và y nhận màu "dán" bởi điểm z. Dễ thấy rằng không
có tập cùng màu nào có thể phát sinh trong cách này. Do đó, để hoàn
thành chứng minh Định lý 1.2, ta cần chứng minh điều sau đây:
Bổ đề 1.2. Cho (X, M) là một họ của 6 bộ ba với |X| ≥ 7. Khi đó X
chứa hai điểm không liên thông trong M.
Chứng minh. Một bộ ba M ∈ M tạo thành 3 cặp điểm liên thông.
Do đó sáu bộ ba có tối đa 3 · 6 = 18 cặp liên thông. Nhưng tổng số các
()
cặp điểm trên một tập 7 phần tử là 72 = 21, và do đó có một vài cặp
là không liên thông (thực ra là có ít nhất 3).
Người ta vẫn chưa biết giá trị chính xác của m(4) (và tất cả các k lớn
hơn). Dù dễ dàng để thấy rằng m(4) có thể được tính toán bằng cách
xem xét mọi cấu hình (hữu hạn của họ các bộ 4 phần tử). Nhưng số
lượng các cấu hình xuất hiện vượt quá sức tính toán của tất cả các loại
siêu máy tính, ít nhất là nếu sức mạnh đó không kèm theo sự khéo léo
của con người.

12


Chương 2
KHÔNG GIAN XÁC SUẤT HỮU
HẠN
Trong chương này, chúng ta đưa ra một số khái niệm của lý thuyết xác
suất. Chúng ta sẽ chỉ hạn chế trên một số khái niệm cần cho các chứng
minh. Chương này không nhằm hệ thống hóa về lý thuyết xác suất, mà
thay vào đó chúng ta sẽ xem xét các ví dụ điển hình.

2.1


Không gian xác suất hữu hạn

Định nghĩa 2.1. Một không gian xác suất hữu hạn, chúng ta hiểu là
một cặp (Ω, P ), trong đó Ω là một tập hữu hạn và P : 2Ω → [0, 1] là
một hàm gán mỗi giá trị trong khoảng [0, 1] tương ứng với một tập con
của Ω, thỏa mãn
(i) P (∅) = 0,
(ii) P (Ω) = 1, và
(iii) P (A ∪ B) = P (A) + P (B) với hai tập rời rạc bất kỳ A, B ⊆ Ω.
13


Khóa luận tốt nghiệp Đại học

Nguyễn Thị Hường

Tập Ω được gọi là một tập hợp của tất cả các kết quả có thể của một
phép thử. Các phần tử của nó được gọi là các biến cố sơ cấp. Ví dụ, nếu
phép thử là gieo một con xúc xắc, các biến cố sơ cấp có thể xảy ra là
"xuất hiện mặt một chấm", "xuất hiện mặt hai chấm", . . . ,"xuất hiện
mặt sáu chấm". Một cách ngắn gọn, chúng ta có thể kí hiệu những biến
cố sơ cấp này bằng các kí hiệu ω1 , ω2 , . . . , ω6 . Các tập con của Ω được
gọi là biến cố. Một ví dụ về biến cố là "xuất hiện mặt có số chấm là
chẵn", nói cách khác {ω2 , ω4 , ω6 }. Chú ý: Một biến cố sơ cấp không phải
là một biến cố, mà biến cố là một tập biến cố sơ cấp!
Lý thuyết xác suất bao gồm những khái niệm và các phép toán liên
quan đến các biến cố. Ví dụ, "ω ∈ A" có thể hiểu như "biến cố A xảy
ra", " ω ∈ A ∩ B" có thể được hiểu là "cả hai biến cố A và B xảy ra",
"A ∩ B = ∅" có thể được hiểu như là "biến cố A và B là không tương
thích", . . . .

Nếu A ⊆ Ω là một biến cố, số P (A) được gọi là xác suất của biến
cố A. Tiên đề (i)-(ii) chỉ ra giá trị mà xác suất nhận được. Từ điều kiện
(iii), nó cho thấy thật dễ dàng để xác định được giá trị của hàm P của
tất cả các biến cố sơ cấp, do đó xác suất của bất kỳ một biến cố nào
đó bằng tổng xác suất của tất cả các biến cố sơ cấp của nó (chính xác
hơn, bằng tổng xác suất của tất cả các tập con gồm một phần tử của
nó, nhưng ta sẽ đưa về các kí hiệu ngắn gọn). Liên quan đến tiên đề
(iii) trong định nghĩa của một không gian xác suất hữu hạn, ta nhận xét
rằng với bất kỳ hai biến cố A,B ⊆ Ω, và không nhất thiết phải rời rạc,
ta có bất đẳng thức P (A ∪ B) ≤ P (A) + P (B). Ta sẽ chứng minh bất

14


Khóa luận tốt nghiệp Đại học

Nguyễn Thị Hường

đẳng thức này trong ví dụ dưới đây.
Ví dụ 2.1. Chứng minh rằng với hai biến cố A, B bất kỳ trong không
gian xác suất hữu hạn ta có: P (A ∪ B) ≤ P (A) + P (B). Hãy khái quát
cho trường hợp n biến cố.
Chứng minh. Ta có:
A ∪ B = A + B\A
Suy ra
P (A ∪ B) = P (A) + P (B\A)
Mặt khác:
B = A ∩ B + B\A
Tương đương
P (B\A) = P (B) − P (A ∩ B)

Từ đó, ta có:
P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
Tương đương
P (A ∪ B) + P (A ∩ B) = P (A) + P (B)
Vậy
P (A ∪ B) ≤ P (A) + P (B)
Dấu "=" xảy ra khi và chỉ khi A, B là hai biến cố không tương thích.
15


Khóa luận tốt nghiệp Đại học

Nguyễn Thị Hường

Khái quát: Với n sự kiện A1 , A2 , . . . , An ta có:
P

(∪
n

)
Ai



i=1

n



P (Ai )

i=1

Các không gian xác suất hữu hạn đơn giản nhất, và có lẽ cũng là quan
trọng nhất, là không gian với tất cả các biến cố có cùng một xác suất,
tức là hàm P được cho bởi

P (A) =

|A|
|Ω|

với A là biến cố.
Như vậy một không gian xác suất phản ánh cái gọi là định
nghĩa cổ điển của xác suất. Định nghĩa này được xây dựng bởi
Laplace, và trong đó có một giả định rằng tất cả các kết quả
có thể có của một phép thử là đều có khả năng xảy ra. Nếu số
lượng tất cả các kết quả (biến cố sơ cấp) của phép thử là n, và,
trong số này, có m kết quả thuận lợi cho sự kiện A, khi đó xác
suất của sự kiện A được định nghĩa là m/n. Tương đương với:
số kết quả thuận lợi chia cho số kết quả có thể. Đối với việc
định nghĩa xác suất, định nghĩa cổ điển về xác suất là không
thực sự đạt yêu cầu. Hơn nữa, nó không bao gồm các không
gian xác suất vô hạn, nhưng trong nhiều trường hợp cụ thể nó
là một gợi ý hữu ích để tính xác suất.
Về không gian xác suất vô hạn. Với việc hạn chế không gian xác suất
16



Khóa luận tốt nghiệp Đại học

Nguyễn Thị Hường

hữu hạn, chúng ta đã đơn giản hóa một cách đáng kể các tình huống
được xem xét trong toán học. (Một nhà xác suất thực sự có thể nói rằng
chúng ta cũng đã loại bỏ đi tất cả những thứ thú vị.) Nhưng với mô
hình các biến cố thú vị, tức là làm việc với không gian xác suất vô hạn,
kỹ thuật sẽ phức tạp hơn rất nhiều. Ví dụ, nếu chúng ta chọn 5 điểm
ngẫu nhiên trong khoảng [0, 1], trong đó xác suất để lấy ra 2 điểm mà
khoảng cách giữa chúng là

1
10

là bao nhiêu? Ta có thể hỏi hàng nghìn câu

hỏi tương tự như vậy. Ta cần lấy một "điểm ngẫu nhiên trong khoảng
[0, 1]" tức là điểm lấy đầu tiên. Các biến cố sơ cấp là tất cả các điểm
trong [0, 1]. Và xác suất để lấy được mỗi điểm là như nhau, thậm chí
những điểm đó có "phân phối đồng nhất", và bởi vì có vô hạn điểm nên
xác suất để lấy một điểm là bằng 0. Vì vậy không thể xác định xác suất
của hàm P bằng định nghĩa của nó khi chỉ biết một biến cố sơ cấp (như
trong trường hợp hữu hạn). Xác suất của biến cố A là “khả năng xảy
ra” của A trong một trường hợp nào đó. Đây là một khái niệm phức tạp
hơn, nó liên quan chặt chẽ đến sự phát triển và nhiều câu hỏi khác của
các nghiên cứu toán học.
Tiếp theo, chúng ta có một số dạng quan trọng của không gian xác
suất hữu hạn.


2.2

Dãy ngẫu nhiên của n số 0 và số 1

Định nghĩa 2.2. Biến cố sơ cấp của không gian xác suất này là tất cả
các dãy n số hạng được lập bởi các số 0 và 1, tức là các phần tử của tập
{0, 1}n , và tất cả các biến cố sơ cấp đều có cùng xác suất. Do đó số các
17


Khóa luận tốt nghiệp Đại học

Nguyễn Thị Hường

biến cố sơ cấp là 2n , xác suất của biến cố A bất kỳ bằng |A|/2n . Ta ký
hiệu không gian xác suất này là Cn .
Ví dụ về mô hình không gian xác suất này là gieo đồng xu n lần (giả
sử đồng xu là cân đối, đồng chất và xác suất xuất hiện mặt ngửa và mặt
sấp là như nhau). Nếu gieo đồng xu lần thứ i xuất hiện mặt ngửa thì ta
viết 1 trong dãy còn nếu xuất hiện mặt sấp thì ta viết 0. Một ví dụ về
biến cố A = "Mặt ngửa xuất hiện đúng 10 lần", xác suất của biến cố
(n) n
này là 10
/2 .

2.3

Hoán vị ngẫu nhiên

Định nghĩa 2.3. Các biến cố sơ cấp của không gian xác suất này là tất

cả các hoán vị của tập {1, 2, . . . , n}, và xác suất của một biến cố A bằng
|A|/n!. Tập tất cả các hoán vị của tập {1, 2, . . . , n} được ký hiệu là Sn ,
và ta ký hiệu không gian xác suất này là Sn .
Không gian này là một mô hình cho việc sắp xếp n phần tử phân biệt
trong một thứ tự ngẫu nhiên, ví dụ như trộn bài.
Bài toán 2.1. Xác suất để trong một thứ tự ngẫu nhiên của một bộ
bài, quân Át bích đứng trước quân K cơ là bao nhiêu?
Xét lại mô hình xác suất này, xác suất của biến cố A = {π ∈ S52 :
π(1) < π(2)} là gì? Tất nhiên, ta có thể đếm các hoán vị với π(1) < π(2),
nhưng ta cũng có thể xác định xác suất trong câu hỏi này bằng một
xem xét đơn giản: bằng đối xứng, không thể nói rằng một trong hai
biến cố "π(1) < π(2)" và "π(1) > π(2)" biến cố nào có khả năng xảy
18


Khóa luận tốt nghiệp Đại học

Nguyễn Thị Hường

ra cao hơn, và do đó xác suất là 12 . Chính xác hơn, lý luận đó được
xây dựng như sau. Ta xây dựng một song ánh giữa tập hợp A và tập
A′ = {π ∈ S52 : π(1) > π(2)}. Từ một hoán vị π ∈ A, ta gán hoán
vị π ′ với π ′ (1) = π(2), π ′ (2) = π(1), và π ′ (i) = π(i) với i ≥ 2. Do đó
|A| = |A′ |, và do đó A và A′ là độc lập và chúng lập thành không gian
xác suất, ta có P (A) = 21 . Để tạo sự chú ý cho người đọc, bây giờ ta
trình bày một bài toán với một giải pháp đáng ngạc nhiên.
Bài toán 2.2. Chúng ta chơi một trò chơi như sau. Đối thủ của chúng
ta có 100 thẻ trống, và trên mỗi thẻ đó, anh ta viết một con số bất kỳ
theo ý muốn. Sau đó, anh ta xáo trộn các thẻ (hoặc có một người thứ
ba thực hiện việc xáo trộn các tấm thẻ này), và các tấm thẻ đã được

xáo được đặt úp trên một mặt bàn để các con số này không thể nhìn
thấy. Chúng ta bắt đầu rút ra các tấm thẻ từng chiếc một và nhìn số
trên đó. Sau khi đã lật được một số tấm thẻ lên, ta có thể kết thúc trò
chơi. Chúng ta giành chiến thắng nếu thẻ cuối ta lật được có ghi con số
lớn nhất trong số tất cả các thẻ (những thẻ đã lật cũng như những thẻ
vẫn còn nằm trên bàn). Nếu ta thắng, ta nhận được 40 đồng, và nếu ta
thua thì phải trả 10 đồng. Chúng ta có thể mong đợi gì về trò chơi này?
Chứng minh. Ngay từ cái nhìn đầu tiên có vẻ rằng trò chơi này là
không thuận lợi đối với chúng ta. Mặc dù vậy, nếu ta dùng chiến lược
sau:
Lật 50 tấm thẻ đầu tiên, và ghi nhớ số lớn nhất mà chúng
ta thấy ở đó; gọi số đó là M . Sau đó tiếp tục lật lần lượt các
tấm thẻ còn lại, và kết thúc ngay khi ta nhận được một thẻ
19


×