MỘT SỐ MÔ HÌNH XÁC SUẤT TRONG KHOA HỌC MÁY TÍNH

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (284.27 KB, 25 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-----------------------

PHẠM THỊ THU HẰNG

MỘT SỐ MÔ HÌNH XÁC SUẤT
TRONG KHOA HỌC MÁY TÍNH
Chuyên ngành: Lý thuyết Xác suất và Thống kê toán học
Mã số:
60406106

TÓM TẮT LUẬN VĂN THẠC SĨ KHOA HỌC

Hà Nội - Năm 2016

Mục lục
Lời nói đầu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1

Xác suất trong lý thuyết tổ hợp
và đồ thị
1.1 Các ví dụ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1.1 Đồ thị ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . .
1.1.2 Thuật toán Tìm kiếm và Sắp xếp nhanh . . . . . . . . .
1.1.3 Mô hình danh sách tự tổ chức . . . . . . . . . . . . . . .
1.1.4 Sinh hoán vị ngẫu nhiên . . . . . . . . . . . . . . . . . .
1.2 Phương pháp xác suất . . . . . . . . . . . . . . . . . . . . . . . .
1.2.1 Lời giới thiệu . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.2 Ứng dụng xác suất để chứng minh sự tồn tại . . . . . .

1.2.3 Xác định cận từ kỳ vọng . . . . . . . . . . . . . . . . . .
1.2.4 Bài toán tập hợp độc lập có trọng số tối đa: Thuật toán
cận biên và ngẫu nhiên . . . . . . . . . . . . . . . . . . . .
1.2.5 Bài toán phủ tập hợp . . . . . . . . . . . . . . . . . . . .
1.2.6 Phản xích . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.7 Bổ đề rút gọn Lovasz . . . . . . . . . . . . . . . . . . . .
1.2.8 Thuật toán ngẫu nhiên để tính phân hoạch cực tiểu của
một đồ thị . . . . . . . . . . . . . . . . . . . . . . . . . . .

2 Xích Markov và mô phỏng MCMC
2.1 Xích Markov . . . . . . . . . . . . . . . . . .
2.1.1 Giới thiệu . . . . . . . . . . . . . . . .
2.1.2 Phương trình Chapman-Kolmogorov
2.1.3 Phân loại trạng thái . . . . . . . . . .
2.1.4 Xác suất giới hạn và xác suất dừng .
2.1.5 Ứng dụng . . . . . . . . . . . . . . . .
1

.
.
.
.
.
.

.
.
.
.
.

.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.

.
.
.
.

4

.
.
.
.
.
.
.
.
.

6
6
6
7
8
9
9
9
10
10

.
.

.
.

10
11
11
12

. 12

.
.
.
.
.
.

13
13
13
13
14
14
15

Luận văn tốt nghiệp

2.2

2.3
3

Phạm Thị Thu Hằng

2.1.6 Xích Markov với thời gian đảo ngược . . . . . .
Mô phỏng . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2.1 Mô phỏng Monte Carlo . . . . . . . . . . . . . .
2.2.2 Tạo các biến ngẫu nhiên rời rạc . . . . . . . . .
2.2.3 Tạo các biến ngẫu nhiên liên tục: Phương pháp
nghịch . . . . . . . . . . . . . . . . . . . . . . . .
Mô phỏng MCMC . . . . . . . . . . . . . . . . . . . . .

. . . . .
. . . . .
. . . . .
. . . . .
biến đổi
. . . . .
. . . . .

Quá trình Poisson
3.1 Quá trình Poisson không dừng . . . . . . . . . . . . . . .
3.2 Quá trình Poisson dừng . . . . . . . . . . . . . . . . . . .
3.3 Một số tính toán quá trình Poisson . . . . . . . . . . . .
3.4 Phân loại biến cố của một quá trình Poisson không dừng
3.5 Phân phối có điều kiện của các thời điểm đến . . . . . .

2

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.

16

17
17
18

. 18
. 19

.
.
.
.
.

21
21
22
22
22
22

Luận văn tốt nghiệp

Phạm Thị Thu Hằng

Công trình được hoàn thành tại: Trường Đại học Khoa hoc Tự nhiên - Đại
học Quốc gia Hà Nội

Người hướng dẫn khoa học: GS.TSKH Đặng Hùng Thắng

Hội đồng chấm luận văn:
• Chủ tịch: PGS.TS Trần Hùng Thao - Viện Toán học - Viện Hàn lâm KH

và CN Việt Nam
• Phản biện 1: TS. Nguyễn Thịnh - Đại học Khoa học Tự Nhiên - ĐHQGHN
• Phản biện 2: TS. Ngô Hoàng Long - Đại học Sư phạm Hà Nội
• Thư ký: TS. Lê Vỹ - Đại học Khoa học Tự Nhiên - ĐHQGHN
• Ủy viên: TS. Trần Mạnh Cường - Đại học Khoa học Tự Nhiên - ĐHQGHN

Luận văn đã được bảo vệ trước Hội đồng chấm luận văn thạc sĩ họp tại: Khoa
Toán-Cơ-Tin học Trường Đại học Khoa học Tự nhiên (ĐHQGHN) vào 15h giờ
30 ngày 28 tháng 12 năm 2016
Có thể tìm đọc luận văn tại: - Trung tâm thư viện Đại học Quốc gia Hà Nội

3

LỜI NÓI ĐẦU

Trong những năm gần đây, xác suất đã phát triển đa dạng và có nhiều ứng
dụng quan trọng trong lĩnh vực khoa học máy tính. Ví dụ, các chủ đề liên quan
đến thuật toán như thuật toán ngẫu nhiên, thuật toán ước lượng và phân tích
xác suất của thuật toán đều sử dụng phương pháp xác suất.
Trong luận văn này, tôi muốn giới thiệu các loại mô hình và phân tích xác
suất hữu dụng nhất trong khoa học máy tính. Giả sử với một hàm mở đầu trong
xác suất, tôi trình bày một số đề tài quan trọng như phương pháp xác suất,
xích Markov, mô phỏng MCMC và quá trình Poisson không dừng. Luận văn này
cung cấp nhiều ví dụ và bài tập mô tả các đề tài như thuật toán sắp xếp, thuật
toán tìm kiếm và biểu đồ ngẫu nhiên, bài toán tự sắp xếp theo danh sách, phản
xích, phân hoạch cực đại và cực tiểu trong đồ thị và nhiều đề tài khác.

Cấu trúc luận văn được chia làm 3 chương chính:
• Chương 1 đưa ra các ví dụ hay trong khoa học máy tính, đồng thời trình

bày phương pháp xác suất và một số cách ứng dụng phương pháp này.
• Chương 2 viết về xích Markov trên không gian trạng thái rời rạc, phương

pháp Monte Carlo và xích Markov Monte Carlo (MCMC).
• Chương 3 giới thiệu một số lớp quá trình Poisson, từ đó nghiên cứu bài

toán phân loại biến cố của một quá trình Poisson không dừng và bài toán
xác định phân phối có điều kiện của thời điểm đến.
Trong khuôn khổ của luận văn này, do sự hạn hẹp về thời gian cũng như
năng lực của bản thân, vì vậy không thể tránh khỏi những hạn chế về nội dung
cũng như việc trình bầy. Tôi nhận thấy xác suất trong khoa học máy tính còn
rất nhiều điều thú vị khác nữa và tôi rất mong có dịp trình bầy đầy đủ hơn.
Luận văn được hoàn thành dưới sự hướng dẫn tận tâm của GS.TSKH Đặng
Hùng Thắng. Tôi xin được bày tỏ lòng biết ơn và kính trọng sâu sắc của mình
đến thầy. Qua đây tôi xin chân thành gửi lời cảm ơn tới các thầy cô trong Tổ
4

Luận văn tốt nghiệp

Phạm Thị Thu Hằng

bộ môn Xác suất thống kê và Ban Chủ nhiệm khoa Toán - Cơ - Tin học Trường
Đại học Khoa học Tự nhiên - Đại học Quốc gia Hà Nội đã chỉ bảo và hướng
dẫn tận tình giúp tôi hoàn thành luận văn này!
Rất mong nhận được ý kiến đóng góp của các thầy cô và các bạn!
Hà Nội, tháng 11/2015

Phạm Thị Thu Hằng

5

Chương 1
Xác suất trong lý thuyết tổ hợp
và đồ thị
1.1

Các ví dụ

1.1.1

Đồ thị ngẫu nhiên

Giờ hãy xem xét đồ thị với tập hợp đỉnh V = {1, 2, . . . , n} và tập hợp cạnh
A = {(i, X(i)), i = 1, . . . , n} trong đó X(i) là các biến ngẫu nhiên độc lập thỏa
mãn
n

P {X(i) = j} = Pj ,

Pj = 1
j=1

Đồ thị vừa xây dựng là một đồ thị ngẫu nhiên.
Chúng ta sẽ tính xác suất để đồ thị ngẫu nhiên này là đồ thị liên thông. Để
tìm được xác suất này, ta chọn một đỉnh, giả sử đỉnh 1 và lần theo chuỗi các
đỉnh 1, X(1), X 2 (1), . . . , trong đó X n (1) = X(X n−1 (1)) để xác định giá trị của

biến ngẫu nhiên N là chỉ số k nhỏ nhất sao cho X k (1) không là một đỉnh mới.
Tức là,
N = min(k : X k (1) ∈ {1, X(1), . . . , X k−1 (1)})

Đồng thời, gọi
N −1

W = P1 +

PX i (1)
i=1

Nói cách khác, N là số đỉnh tiếp xúc trong chuỗi 1, X(1), X 2 (1), . . . trước khi
một đỉnh xuất hiện hai lần còn W là tổng các xác suất của các đỉnh này.

6

Luận văn tốt nghiệp

Phạm Thị Thu Hằng

Bổ đề 1.1.1. Xét một đồ thị ngẫu nhiên gồm các đỉnh 0, 1, . . . , r, và các cạnh
(i, Yi ), i = 1, . . . , r, trong đó Yi là các biến ngẫu nhiên độc lập và
r

P {Yi = j} = Qj ,

Qj = 1

j = 0, ..., r,
j=0

Đồ thị ngẫu nhiên ở trên bao gồm r đỉnh thông thường (đánh số từ 1 đến r) và
một đỉnh đặc biệt (đánh số 0); cứ mỗi đỉnh thông thường có một cạnh độc lập đi
qua đỉnh j với xác suất Qj ; không có cạnh nào xuất phát từ đỉnh đặc biệt.
Khi đó,
P {đồ thị liên thông} = Q0 .

Mệnh đề 1.1.1. P{đồ thị liên thông} = E[W]
Trường hợp đặc biệt trong đó cạnh xuất phát từ mỗi đỉnh có thể đến mọi
đỉnh của đồ thị với cùng xác suất
Pj =

1
, j = 1, . . . , n
n

.
Hệ quả sau cho ta công thức tính xác suất đồ thị liên thông trong trường
hợp đặc biệt này.
Hệ quả 1.1.1. Khi Pj = 1/n,
(n − 1)!
P {đồ thị là liên thông} =
nn

Hệ quả 1.1.2. Với n lớn, P {đồ thị là liên thông}

1.1.2

n−1

j=0

nj
j!

π/2n

Thuật toán Tìm kiếm và Sắp xếp nhanh

Gọi X là số phép so sánh cần sử dụng. Để tính E[X], trước hết ta biểu diễn
X thành tổng các biến ngẫu nhiên khác theo cách sau. Đầu tiên, ta đánh dấu
cho các giá trị được sắp xếp: 1 biểu thị giá trị nhỏ nhất, 2 biểu thị giá trị nhỏ
nhì, cứ như vậy cho tới hết. Khi đó, với 1 ≤ i < j ≤ n, lấy I(i, j) bằng 1, nếu i
và j được so sánh trực tiếp và bằng 0 nếu i và j không được so sánh trực tiếp.
Tính tổng các biến này với i < j cho ta tổng số phép so sánh. Đó là
n

j−1

X=

I(i, j)
j=2 i=1

7

Luận văn tốt nghiệp

Phạm Thị Thu Hằng

tức là
n

j−1

P { i và j được so sánh }

E[X] =
j=2 i=1

1.1.3

Mô hình danh sách tự tổ chức

Xem xét n phần tử e1 , . . . , en ban đầu được sắp xếp theo một trật tự. Tại mỗi
thời điểm có một yêu cầu đối với một trong số các phần tử này; ei được yêu cầu
độc lập với trước đó, xác suất Pi . Sau khi đáp ứng được yêu cầu, phần tử này
được chuyển lên đầu danh sách.
Chúng ta sẽ xác định vị trí kỳ vọng của phần tử được yêu cầu với giả thiết
quá trình này diễn ra trong thời gian dài. Đặt R là vị trí phần tử được yêu cầu,
ta sẽ tìm E[R] phần tử được chọn bằng cách kiểm tra điều kiện với Y . Ta có
n

E[ vị trí của ei ]Pi

E[R] =
i=1

Dấu bằng cuối cùng dựa trên cơ sở vị trí của ei và biến cố ei được yêu cầu
độc lập với nhau. Điều này có được do xác suất để ei được yêu cầu là Pi cho dù
hiện tại ei có ở vị trí nào đi nữa. Tuy nhiên, ta thấy
vị trí của ei = 1 +

Ii,j
j=i

trong đó
Ii,j =

1,
0,

nếu ej đứng trước ei
ngược lại

ta thu được
E[vị trí của ei ] = 1 +

E[Ii,j ]
j=i

P {ej đứng trước ei }

=1+

(1.1)

j=i

Để xác định P {ej đứng trước ei }, ta thấy ej đứng trước ei nếu lần yêu cầu
cuối cùng với một trong hai phần tử này là lần yêu cầu với ej . Tuy nhiên, biết
rằng một lần yêu cầu có thể yêu cầu hoặc ei hoặc ej nên xác suất để ej được
yêu cầu là
P (ej | ei hoặc ej ) =
8

Pj
Pi + Pj

Luận văn tốt nghiệp

Phạm Thị Thu Hằng

Do đó, P {ej đứng trước ei } = Pj /(Pi + Pj ). Từ kết quả (??) và (1.1) ta có
n

Pi

E[R] = 1 +
i=1

1.1.4

j=i

Pj

P i + Pj

Sinh hoán vị ngẫu nhiên

Ta nói rằng vec-tơ X(1), . . . , X(n) ngẫu nhiên là hoán vị ngẫu nhiên của giá
trị 1, . . . , n nếu
P {(X(1), . . . , X(n)) = (i1 , ...in )} = 1/n!

cho tất cả n! hoán vị i1 , . . . , in của 1, . . . , n. Khi đó, một hoán vị ngẫu nhiên có
thể là bất cứ hoán vị nào trong n! hoán vị của 1, . . . , n. Giả sử trong phần này
X(1), . . . , X(n) là một hoán vị ngẫu nhiên.
Hệ quả 1.1.3.
n

N=

Ij
j=1

trong đó I1 , . . . , In là các biến ngẫu nhiên độc lập sao cho
P {Ij = 1} =

1
= 1 − P {Ij = 0},
n−j+1

j = 1, ..., n

Từ Hệ quả 1.1.3 , có
n

E[N ] =
i=1

1
i

n

Var(N ) =
i=1

i−1
i2

Ngoài ra, khi n lớn, từ Hệ quả 1.1.3 và định lý giới hạn trung tâm, N có hàm
phân phối xấp xỉ chuẩn.

1.2

Phương pháp xác suất

1.2.1

Lời giới thiệu

Phương pháp xác suất là một kỹ thuật phân tích thuộc tính của phần tử
trong một tập hợp bằng cách đưa ra một không gian xác suất cho tập hợp này
và khảo sát một phần tử ngẫu nhiên. Phương pháp này chủ yếu được ứng dụng
để giải quyết các bài toán lý thuyết tổ hợp và đồ thị.

9

Luận văn tốt nghiệp

1.2.2

Phạm Thị Thu Hằng

Ứng dụng xác suất để chứng minh sự tồn tại

Giả sử chúng ta muốn chứng minh một phần tử của tập hợp S có một tính
chất nào đó. Ta có thể nghiên cứu một phần tử ngẫu nhiên X trong tập hợp S
rồi chứng minh xác suất của biến cố đối ,biến cố mà X không có tính chất này,
nhỏ hơn 1.

1.2.3

Xác định cận từ kỳ vọng

Gọi f là hàm của phần tử s thuộc tập hợp hữu hạn S , giả sử ta muốn tìm
m = max f (s)
s∈S

Cận dưới hữu ích có thể được xác định bằng cách sau: gọi X là một phần tử
ngẫu nhiên của S có giá trị kỳ vọng f (X) có thể tính được, với m ≥ f (X) ta có
m ≥ E[f (X)]

Bất đẳng thức mạnh nếu f (X) là một đại lượng ngẫu nhiên không đổi.

1.2.4

Bài toán tập hợp độc lập có trọng số tối đa: Thuật toán
cận biên và ngẫu nhiên

Giả sử mỗi đỉnh i, i = 1, . . . , n có trọng số wi dương liên hợp với nó. Với mỗi
tập hợp đỉnh A thì
w (A) =

wi
i∈A

và
m = max w (A)
A

trong đó lấy cực đại trên các tập hợp A độc lập. m được gọi là số độc lập của
đồ thị.
Gọi Xi , i = 1, . . . , n là các biến ngẫu nhiên lũy thừa độc lập với hệ số λi , i =
1, . . . , n.
Mệnh đề 1.2.1. Với mỗi số dương λi , i = 1, . . . , n,
n

m≥

wi λi /∧i
i=1

10

Luận văn tốt nghiệp

Phạm Thị Thu Hằng

trong đó
∧i =

λj
j∈D(j)

Đây là thuật toán sắp xếp ngẫu nhiên để ước lượng cả m và tập hợp độc lập có
trọng số tối ưu.
Thuật toán ước lượng ngẫu nhiên hóa
1. Đặt λi = (wi /d(i))b với tất cả các đỉnh i trong tập hợp đỉnh V
2. Tạo giá trị cho mỗi biến ngẫu nhiên I theo
λj

P {I = j} =

,

j∈V

λi
i∈V

3. Đặt đỉnh I vào tập hợp độc lập, loại bỏ I và các đỉnh kề nó khỏi tập hợp
đỉnh của đồ thị. Tính lại bậc của các đỉnh còn lại rồi quay lại bước 1.

Lặp lại các bước này thu được tập hợp độc lập có trọng số lớn nhất là một
ước lượng của tập hợp độc lập có trọng số tối đa. Ta có thể chạy lại thuật toán
với cùng giá trị của b hoặc thay giá trị khác sau mỗi lần chạy.

1.2.5

Bài toán phủ tập hợp

Gọi Si , i = 1, . . . , m, là tập con của S = {1, 2, . . . , s}, Gọi ni là số tập hợp con
chứa i, và giả sử ni > 0 với mỗi i = 1, . . . , s. Bài toán phủ tập hợp là bài toán tìm
số tập con nhỏ nhất có thể hợp lại thành tập S . Gọi r là số tập con nhỏ nhất,
sử dụng phương pháp xác suất, chứng minh rằng với mỗi số nguyên k
s

r≤k+
i=1

1.2.6

m−ni
k
m
k

m−k+1
ni + 1

(1.2)

Phản xích

Tập hợp A1 , A2 , . . . , Ar là các tập hợp con của {1, 2, . . . , n}, được gọi là một
phản xích nếu không có tập hợp nào trong các tập hợp này là tập hợp con của
tập khác, tức là Ai ∈
/ Aj với tất cả các cặp i = j . Định lý Sperner chỉ ra rằng
n
số tập hợp lớn nhất trong một phản xích là [n/2]
trong đó [n/2] là số nguyên
lớn nhất nhỏ hơn hoặc bằng n/2. Do đó, tập hợp tất cả các tập hợp con của
{1, 2, . . . , n} kích thước [n/2] tạo thành phản xích lớn nhất.
11

Luận văn tốt nghiệp

1.2.7

Phạm Thị Thu Hằng

Bổ đề rút gọn Lovasz

Xem xét tập hợp các biến cố {Ai , i = 1, . . . , n} với 0 < P (Ai ) < 1, giả sử ta
muốn chứng minh không biến cố nào có thể xảy ra. Rõ ràng đây là trường hợp
các biến cố độc lập với nhau nhưng ngay cả khi chúng không độc lập thì kết quả
này cũng có thể xảy ra khi mỗi biến cố “độc lập lẫn nhau” với mỗi tập hợp con
chứa hầu hết các biến cố khác như định nghĩa sau đây.
Định nghĩa 1.2.1. Biến cố A độc lập lẫn nhau với tập hợp các biến cố
{B1 , . . . , Br } nếu xác suất có điều kiện của A, với điều kiện để Bi xảy ra, bằng
xác suất không điều kiện P (A).
Bổ đề 1.2.1. Bổ đề rút gọn Lovasz Cho các biến cố A1 , . . . , An , nếu với mỗi

i, i = 1, . . . , n, Ai độc lập lẫn nhau với một tập hợp chứa tất cả các biến cố ngoại
trừ nhiều nhất d biến cố Aj khác, j = i và
P (Ai ) ≤

thì

1
e(d + 1)

n

Acj > 0

P
j=1

1.2.8

Thuật toán ngẫu nhiên để tính phân hoạch cực tiểu của
một đồ thị

Giả sử ta muốn tìm một cách phân hoạch có sức chứa nhỏ nhất. Tức là nếu
ta đặt
m0 = min c(X, X c )

thì bài toán trở thành tìm m0 cùng với một phân hoạch sức chứa m0 .
Với X0 , X0c là một phân hoạch có sức chứa nhỏ nhất. Xây dựng một thuật
toán xác suất để cho ra một phân hoạch mà sức chứa của nó bằng c(X0 , X0c ) với
xác suất lớn hơn hoặc bằng 2/n2 . Thuật toán này còn có thể cho ta một phân
hoạch cực tiểu với xác suất cao tùy ý.

12

Chương 2
Xích Markov và mô phỏng MCMC
2.1

Xích Markov

2.1.1

Giới thiệu

Xét quá trình ngẫu nhiên thời gian rời rạc. Nếu Xn = i thì quá trình được
gọi là “trong trạng thái i tại thời điểm n”. Giả sử khi quá trình ở trạng thái i,
có một xác suất cố định Pi,j để trạng thái tiếp theo là trạng thái j . Tức là
P {Xn+1 = j|Xn = i, Xn−1 = in−1 , ..., X0 = i0 } = Pi,j
Pi,j≥0 ,

(2.1)

Pi,j = 1
j

Gọi P là ma trận các xác suất chuyển tiếp một bước Pi,j


P0,0 P0,1
 P1,0 P1,1

P=
 ... ...
Pi,0 Pi,1
... ...

2.1.2

. . . P0,j
. . . P1,j
... ...
. . . Pi,j
... ...

...
... 
... 

...
...

Phương trình Chapman-Kolmogorov

n là xác suất để xích chuyển từ trạng thái i sang trạng thái j sau n bước.
Pi,j

Phương trình Chapman – Kolmogorov giúp ta tính được xác suất n bước này.
Phương trình như sau:
∞

n+m

Pi,j

n m
Pi,k
Pk,j

=
k=0

13

(2.2)

Luận văn tốt nghiệp

2.1.3

Phạm Thị Thu Hằng

Phân loại trạng thái

n > 0 với n ≥ 0,
Ta nói trạng thái i đến được trạng thái j nếu tồn tại Pi,j
kí hiệu i → j .
Hai trạng thái i và j được gọi là liên thông nếu i → j và j → i, kí hiệu i ↔ j
Quan hệ liên thông là quan hệ tương đương. Một Xích Markov được gọi là tối
giản nếu hai trạng thái bất kỳ đều liên thông với nhau. Với mỗi trạng thái i,
gọi fi là xác suất để bắt đầu từ trạng thái i, quá trình sẽ trở lại trạng thái đó.
Trạng thái i được gọi là hồi quy nếu fi = 1 và trạng thái i được gọi là trans nếu

fi < 1.

Mệnh đề 2.1.1. Trạng thái i
∞

n
Pi,i
=∞

hồi quy nếu
n=0
∞

n
Pi,i
<∞

trans nếu
n=0

Hệ quả 2.1.1. Nếu trạng thái i hồi quy và trạng thái i liên thông j thì trạng
thái j hồi quy.

2.1.4

Xác suất giới hạn và xác suất dừng

Nếu trạng thái i hồi quy thì nó được gọi là hồi quy dương nếu bắt đầu từ
i, kỳ vọng thời gian đến khi quá trình quay lại trạng thái i là hữu hạn. Trạng
thái hồi quy dương không tuần hoàn được gọi là giả thiết ergodic.

n
và độc
Định lí 2.1.1. Với một xích Markov tối giản ergodic, tồn tại lim Pi,j
n→∞

lập với i. Gọi
n
πj = lim Pi,j
n→∞

thì πj , j ≥ 0, là nghiệm không âm duy nhất của
πj =

(2.5)

πi Pi,j
i

(2.6)

πj = 1
j

Mệnh đề 2.1.2. Gọi {Xn , n ≥ 1} là xích Markov tối giản với xác suất dừng πj
và gọi r là hàm giới hạn không gian trạng thái. Khi đó, với xác suất 1,
lim

N →∞

N

n=1 r(Xn )

N

=

r(j)πj
j

14

Luận văn tốt nghiệp

2.1.5

Phạm Thị Thu Hằng

Ứng dụng

Mô hình cho hiệu suất thuật toán

Bài toán tối ưu hóa sau đây được gọi là quy hoạch tuyến tính:
cực tiểu biểu thức cx
với điều kiện: Ax = b, x ≥ 0
trong đó A là một ma trận hằng có kích thước m × n, c = (c1 , . . . , cn ) và
b = (b1 , . . . , bm ) là các véc tơ hằng cố định và x = (x1 , .., xn ) ∈ R+ n được chọn để
tối tiểu hóa cx = ni=1 ci xi .
Ta xem xét một mô hình xác suất (xích Markov) đơn giản thể hiện cách
thuật toán di chuyển theo tập hợp các điểm cực biên.

Cụ thể, giả sử nếu tại thời điểm nào đó thuật toán đang ở điểm cực biên tốt
thứ j , nên sau lần lặp tiếp theo, điểm cực biên tìm thấy có thể là bất cứ điểm
nào trong j − 1 điểm cực biên tốt hơn.
Xem xét một xích Markov trong đó P1,1 = 1, và với i > 1
Pi,j =

1
,
i−1

j = 1, ..., i − 1

Gọi Ti là số lần chuyển tiếp cần thiết để đi từ trạng thái i đến trạng thái
1. Ta viết được hàm đệ quy cho E[Ti ] bằng cách lấy xác suất điều kiện với trạng
thái ban đầu:
1
E[Ti ] = 1 +
i−1

i−1

E[Tj ]
j=1
i−1

Chứng minh bằng phương pháp quy nạp, ta có E[Ti ] =

1/j
j=1

Để biểu thị TN một cách hoàn chỉnh hơn, ta sử dụng biểu thức
N −1

TN =

Ij
j=1

trong đó
Ij =

1,
0,

nếu xích ở trạng thái j
nếu ngược lại

15

(2.11)

Luận văn tốt nghiệp

Phạm Thị Thu Hằng

Mệnh đề 2.1.3. Dãy biến ngẫu nhiên I1 , . . . , IN −1 là độc lập, và
P {Ij = 1} = 1/j,
N −1

Hệ quả 2.1.2. (a) E[TN ] =
j=1
N −1

(b) V ar(TN ) =
j=1

j = 1, ..., N − 1

1
j

1
1
(1 − )
j
j

(c) Với n lớn, TN có phân phối xấp xỉ chuẩn với trị số trung bình và phương
sai đều bằng ln N .
Tổng quát, để mô hình hóa số lần lặp của một thuật toán luôn chuyển tới
một trạng tối ưu hơn ta có thể sử dụng một xích Markov có xác suất chuyển
thỏa mãn điều kiện:
Pi,j = 0 nếu0 ≤ i < j
(2.12)
Gọi Di là lượng trạng thái giảm khi chuyển tiếp từ trạng thái i, khi đó
P {Di = k} = Pi,i−k

Mệnh đề 2.1.4. Đặt Nn là số chuyển tiếp cần để một xích Markov có xác suất
chuyển tiếp thỏa mãn điều kiện (2.12) đi từ trạng thái n sang trạng thái 0. Nếu

tồn tại hàm không tăng d(i), i > 0, thoả mãn
E[Di ] ≥ d(i)

thì

n

E[Nn ] ≤
i=1

2.1.6

1
d(i)

(2.13)

Xích Markov với thời gian đảo ngược

Xem xét một xích Markov dừng có xác suất chuyển tiếp là Pi,j và xác suất
dừng πi . Giả sử bắt đầu từ thời điểm n, ta thấy xích trạng thái quay ngược lại
trình tự trước đó. Tức là với một xích các trạng thái Xn , Xn−1 , Xn−2 , . . . bản
thân xích này là một xích Markov với xác suất chuyển tiếp Qi,j trong đó
Qi,j

πj Pj,i
πi

Nếu Qi,j = Pi,j thì xích Markov được gọi là đảo ngược thời gian.
16

Luận văn tốt nghiệp

Phạm Thị Thu Hằng

Định lí 2.1.2. Điều kiện Kolmogorov để đảo ngược thời gian Một xích
Markov có Pi,j = 0 khi Pj,i = 0 có tính đảo ngược thời gian nếu bắt đầu từ trạng
thái i, bất cứ đường đi từ i nào đều có cùng xác suất với đường đi từ hướng ngược
lại. Tức là xích có tính đảo ngược thời gian nếu
Pi,i1 Pi1 ,i2 . . . Pik ,i = Pi,ik Pik ,ik−1 . . . Pi1 ,i

(2.3)

với mọi k và trạng thái i, i1 , . . . , ik .
Khái niệm xích nghịch đảo khá hữu dụng ngay cả khi xích Markov ban đầu
không có tính đảo ngược thời gian. Để mô tả điều này, ta cần sử dụng Mệnh đề
sau.
Mệnh đề 2.1.5. Xem xét một xích Markov tối giản có xác suất chuyển tiếp
Pi,j . Nếu có thể tìm được các số dương πi , i ≥ 0 có tổng bằng 1 và ma trận xác
suất chuyển tiếp Q = [Qi,j ] thỏa mãn
Pi,j = πj Qj,i

(2.4)

thì Qi,j là xác suất chuyển tiếp của xích nghịch đảo và πi là xác suất dừng của
cả xích ban đầu và xích nghịch đảo.

2.2

Mô phỏng

2.2.1

Mô phỏng Monte Carlo

Đặt X = (X1 , . . . , Xn ) là véc tơ ngẫu nhiên có hàm mật độ chung là
f (x1 , . . . , xn ), giả sử ta cần xác định
θ = E[g(X) =

...

g(x1 , ..., xn )f (x1 , ..., xn )dx1 ...dxn

với hàm n chiều g nào đó. Trong nhiều trường hợp, ta không thể tính được cụ
thể tích phân trên hay thậm chí cũng không thể ước lượng được một khoảng
chính xác nào đó. Ta chỉ có thể ước lượng θ bằng cách mô phỏng.
Để ước lượng θ bằng phương pháp mô phỏng, trước hết ta tạo một vec tơ
ngẫu nhiên X(1) có hàm mật độ f, và tìm giá trị Y1 = g(X(1) ). Sau đó tạo ra một
thứ ngẫu nhiên vector X(2) , độc lập đầu tiên, cũng với mật độ f, và sau đó tính
Y2 = g(X(2) ) . Tiếp tục như vậy cho đến khi bạn có tạo ra các giá trị của r, một
17

Luận văn tốt nghiệp

Phạm Thị Thu Hằng

số được xác định trước, của các biến ngẫu nhiên Yi = g(X(i) ), i = 1, ..., r Theo
luật số lớn mạnh ta có:

Y1 + ... + Yr
= E[g(X(1) )] = θ
r→∞
r
lim

Do đó, ta có thể sử dụng trung bình các giá trị tạo được Yi là một ước lượng
của θ. Phương pháp ước lượng E[g(X)] này được gọi là phương pháp mô phỏng
Monte Carlo.

2.2.2

Tạo các biến ngẫu nhiên rời rạc

Giả sử ta cần tạo giá trị của một biến ngẫu nhiên X có hàm phân bố xác
suất
pi = P {X = xj },

Ta có thể thực hiện bằng cách

x0 ,





 x1 ,
.
X = ..




xj ,


..
.

j = 0, 1, ...

tạo một số ngẫu nhiên U và thiết lập
nếu U < p0
nếu p0 ≤ U < p0 + p1
j−1
i=1 pi

nếu

j
i=1 pi

≤U <

Vì P {a ≤ U < b} = b − a với 0 < a < b < 1, ta có
j−1

P {X = xj } = P

j

pi ≤ U <
i=1

2.2.3

pi

= pj

i=1

Tạo các biến ngẫu nhiên liên tục: Phương pháp biến
đổi nghịch

Xem xét một biến ngẫu nhiên liên tục X có hàm phân phối F . Một phương
pháp tổng quát để tạo ra X , được gọi là phương pháp biến đổi nghịch, dựa trên
mệnh đề sau.
Mệnh đề 2.2.1. Gọi U là biến ngẫu nhiên đều (0, 1). Với bất kỳ hàm phân phối
liện tục F , biến ngẫu nhiên X được xác định như sau
X = F −1 (U )

Có phân phối F trong đó F −1 (u) là giá trị của x thỏa mãn F (x) = u.
18

Luận văn tốt nghiệp

2.3

Phạm Thị Thu Hằng

Mô phỏng MCMC

Gọi X là véc tơ ngẫu nhiên rời rạc có tập hợp các giá trị là xj , j ≥ 1.
Đặt P {X = xj }, j ≥ 1 là hàm phân bố xác suất của X và giả sử ta cần tính
h(xj )P {X = xj }

θ = E[h(X)] =
j

Với mọi hàm h cho trước. Trong nhiều trường hợp việc tính tất cả các h(xj ) là
rất phức tạp nên ta thường chuyển sang mô phỏng để ước lượng θ. Một trong
các phương pháp như vậy là Mô phỏng Monte Carlo, nó dùng các số ngẫu nhiên
để tạo ra một dãy các véc tơ ngẫu nhiên độc lập {X1 , X2 , . . . , Xn } có cùng phân
bố P {X = xj }. Theo luật mạnh số lớn
lim

n→∞

n
i=1 h(Xi )

n

=θ

Nên ta có thể ước lượng θ bằng cách chọn n đủ lớn và dùng trung bình các giá
trị của h(Xi ) làm ước lượng.
Tuy nhiên, thông thường rất khó để tạo ra một véc tơ ngẫu nhiên có hàm
phân bố xác suất cho trước, đặc biệt khi X là véc tơ của các biến ngẫu nhiên

phụ thuộc. Hơn nữa, có nhiều ứng dụng trong đó hàm phân bố xác suất của X
chỉ được biết sai khác một hằng số nhân, tức là hàm được cho theo dạng
P {X = xj } = Cbj ,

j≥1

trong đó bj được cho trước nhưng phải tính C . Tuy nhiên, vẫn có một phương
pháp khác bên cạnh phương pháp Monte Carlo thông thường là sử dụng mô
phỏng để ước lượng θ. Bằng cách tạo ra một xích không phải gồm các véc tơ
ngẫu nhiên độc lập mà là các trạng thái liên tiếp của một xích Markov mang
giá trị véc tơ Xn , n ≥ 1,ở đó xác suất dừng là P {X = xj }, j ≥ 1. Khi điều này
được thực hiện, ta có thể áp dụng Mệnh đề 2.1.2 và sử dụng ni=1 h(Xi )/n để
ước lượng θ.
Để hiểu cách tạo một xích Markov với xác suất dừng ngẫu nhiên chỉ được
cho dưới dạng một hàm hệ số bội, gọi b(j), j ≥ 1, là các số dương có tổng
∞
B =
j=1 b(j) hữu hạn. Thuật toán sau đây, được gọi là thuật toán Hastings
Metropolis, được sử dụng để tạo ra một xích Markov đảo ngược thời gian có xác
suất dừng:
π(j) = b(j)/B,
19

j ≥ 1.

Luận văn tốt nghiệp

Phạm Thị Thu Hằng

Gọi Q ma trận xác suất chuyển của xích Markov tối giản có không gian trạng
thái là tập các số nguyên, với q(i, j) biểu diễn giá trị ở hàng i cột j . Giờ ta sẽ
xác định xích Markov {Xn } như sau: Khi Xn = i, tạo một biến Y ngẫu nhiên
sao cho P {Y = j} = q(i, j). Nếu Y = j thì đặt Xn+1 bằng j với xác suất α(i, j) và
đặt bằng i với xác suất 1 − α(i, j), trong đó giá trị của α(i, j) sẽ được cho dưới
đây. Với những điều kiện này, dãy các trạng thái là một xích Markov có xác suất
chuyển tiếp Pi,j thỏa mãn cho bởi
Pi,j = q(i, j)α(i, j),

j=i

q(i, k)[1 − α(i, k)]

Pi,i = q(i, i) +
k=i

xích Markov này có tính khôi phục ngươc thời gian và có xác suất dừng π(j) nếu
π(i)Pi,j = π(j)Pj,i

điều này tương đương với
π(i)q(i, j)α(i, j) = π(j)q(j, i)α(j, i)

(2.5)

Tuy nhiên, nếu ta chọn π(j) = b(j)/B và đặt
α(i, j) = min

π(j)q(j, i)
,1
π(i)q(i, j)

(2.6)

thì đẳng thức (2.5) dễ dàng được thỏa mãn (vì nếu π(j)q(j, i)/π(i)q(i, j) ≤ 1 thì
α(i, j) bằng tỉ lệ này và α(j, i) bằng 1; với một kết quả nghịch đảo nếu tỉ lệ này
lớn hơn 1.) Do vậy, xích Markov là khả nghịch với xác suất dừng π(j) = b(j)/B .
Hơn nữa, từ đẳng thức (2.6) ta thấy
α(i, j) = min

b(j)q(j, i)
,1
b(i)q(i, j)

tức là để xác định xích Markov thì không cần biết giá trị của B mà chỉ cần biết
các giá trị b(j), j ≥ 1 là đủ. Hơn nữa, thường thì π(j) không chỉ là xác suất dừng
mà còn là xác suất giới hạn của xích Markov tìm được. Một điều kiện đủ để
đảm bảo điều này là pi,i > 0 với mọi i.

20

Chương 3
Quá trình Poisson
3.1

Quá trình Poisson không dừng

Một quá trình ngẫu nhiên {N (t), t ≥ 0} được gọi là quá trình đếm nếu các
biến cố xuất hiện ngẫu nhiên trong một thời gian và N (t) là số biến cố xảy ra
trong khoảng thời gian từ 0 đến t.

Định nghĩa 3.1.1. Quá trình đếm N (t), t ≥ 0 được gọi là một quá trình Poisson
không dừng có hàm cường độ λ(t), t ≥ 0, nếu
1. N (0) = 0
2. N (t), t ≥ 0 có gia số độc lập
3. P {N (t + h) − N (t) = 1} = λ(t)h + o(h)
4. P {N (t + h) − N (t) ≥ 2} = o(h)
Nếu ta đặt

1

λ(y)dy

m(t) =
0

thì ta có kết quả sau đây.
Định lí 3.1.1.
n
−[m(s+t)−m(s)] [m(s + t) − m(s)]

P {N (s + t) − N (s) = n} = e

n!

Nghĩa là N (s + t) − N (s) là một biến Poisson ngẫu nhiên có trị số trung bình
m(s + t) − m(s).

21

Luận văn tốt nghiệp

3.2

Phạm Thị Thu Hằng

Quá trình Poisson dừng

Một quá trình Poisson không dừng có
λ(t) ≡ λ

được gọi là quá trình Poisson dừng có tham số λ. Với quá trình Poisson có tham
số λ, gọi T1 là thời gian xảy ra biến cố đầu tiên và Tn , n > 1, là thời gian giữa
biến cố thứ (n − 1) và biến cố thứ n. Dãy Tn , n ≥ 1 được gọi là dãy thời gian các
lần đến liên tiếp.
Mệnh đề 3.2.1. Thời gian các lần đến liên tiếp Tn , n ≥ 1, độc lập và là các
biến lũy thừa ngẫu nhiên có tham số λ phân phối giống hệt nhau.

3.3

Một số tính toán quá trình Poisson

Một phương pháp thường được sử dụng để tính giá trị kỳ vọng của biến ngẫu
nhiên X(t), trong đó t là thời gian và giá trị X(t) phần nào được xác định bởi
quá trình Poisson, là tìm một phương trình vi phân. Ví dụ 3.3.1 và 3.3.2 sẽ mô
tả phương pháp này.

3.4

Phân loại biến cố của một quá trình Poisson

không dừng

Quan sát một quá trình Poisson không dừng {N (t), t ≥ 0} có hàm cường độ
λ(t). Giả sử một biến cố xảy ra tại thời điểm s độc lập với các biến cố trước đó
là một biến cố loại 1 với xác suất p(s) hoặc loại 2 với xác suất 1 − p(s), s ≥ 0. Gọi
Ni (t) là số biến cố loại i xảy ra tính đến thời điểm t. Mệnh đề sau đây thường
được áp dụng trong các bài toán.
Mệnh đề 3.4.1. {N1 (t), t ≥ 0} và {N2 (t), t ≥ 0} là các quá trình Poisson không
dừng độc lập có hàm cường độ tương ứng là λ(t)p(t) và λ(t)(1 − p(t)).

3.5

Phân phối có điều kiện của các thời điểm đến

Với một biến cố riêng trong một quá trình Poisson không dừng xảy ra trước
thời điểm t, ta sẽ tìm phân phối có điều kiện của thời điểm xảy ra biến cố này.
Gọi S1 là thời điểm xảy ra biến cố, khi đó với 0 ≤ s ≤ t,
22

Luận văn tốt nghiệp

Phạm Thị Thu Hằng

Mệnh đề 3.5.1. Biết N (t) = n, n thời điểm biến cố 0 < S1 < S2 < . . . < Sn < t
được phân phối theo thống kê thứ tự từ một tập hợp n biến ngẫu nhiên độc lập
cùng phân phối có hàm mật độ
F (s) =

λ(s)

,
m(t)

23

0≤s≤t

Tài liệu tham khảo
Tiếng Việt
[1] Đặng Hùng Thắng (2012), Mở đầu về lý thuyết xác suất và các ứng dụng,
NXB Giáo dục Việt nam.
[2] Nguyễn Duy Tiến, Vũ Viết Yên (2013), Lý Thuyết Xác suất, NXB Giáo dục
Việt Nam.

Tiếng Anh
[3] Barbour, A.,Holst, L., and Jansen, S. (1992),Poisson Approximations. Oxford University Press.
[4] Bollobas, B. (1999), Random Graphs. 2nd ed., San Diego: Academic Press.
[5] Ross, S. (1996), Stochastic Processes. 2nd ed., NY: Wiley.
[6] Sheldon M.Ross (2002), Probability Models for Computer science, Harcourt/
Academic Press.

24

MỘT SỐ MÔ HÌNH XÁC SUẤT TRONG KHOA HỌC MÁY TÍNH

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về