Chương 1. Tổng quan về các công cụ Toán cho Tin học
• Sơ lược về sự phát triển quá trình tính toán
o Tính toán thông thường (Hard Computing)
o Tính toán mềm (Soft Computing)
o Tính toán khắp nơi và di động (Ubiquitous &Mobile Computing)
• Một số kiến thức toán cơ sở
o Ma trận
o Không gian vecto và phép biến đổi tuyến tính
o Xác suất
TÀI LIỆU THAM KHẢO
[1] Alfio Q., Ricardo S., Fousto S. – Numerical Mathematics – 2008.
[2] Krishman V. – Probability and Random Processes – 2006.
[3] Shores T. S. – Applied Linear Algebra and Matrix Analysis – 2007.
[4] Đào Hữu Hồ - Xác suất thống kê – Nxb ĐHQG Hà Nội – 1998.
§1.1 Sơ lược về sự phát triển quá trình tính toán
1.1.1 Tính toán thông thường (Hard Computing)
1) Khái niêm: Tính toán cứng (HC) là tính toán thông thường.
2) Đặc điểm: HC đòi hỏi một mô hình phân tích trạng thái một cách chính xác và thời gian
tính toán thường rất lớn.
3) Công cụ: Que tính- Bàn tính – Máy tính
Nhược điểm: Nhiều mô hình phân tích chỉ đúng đắn trong các điều kiện lý tưởng. Trong khi
đó, các vấn đề của thế giới thực lại diễn ra trong các điều kiện phi lý tưởng.
1.1.2 Tính toán mềm (Soft Computing)
1) Khái niệm: SC chấp nhận những lập luận mờ và các chân lý không chắc chắn, thiếu
chính xác, chỉ đúng từng phần hoặc gần đúng.
2) Đặc điểm: Mô hình của SC chính là trí tuệ của con người. Nguyên tắc có tính dẫn đường
của SC là: khai thác tính mờ của nó để xây dựng được những công cụ mạnh nhằm giải quyết
các vấn đề phức tạp với chi phí thấp nhất có thể.
3) Công cụ: Máy tính
Nhược điểm: Nhiều mô hình tính toán còn phụ thuộc vào không gian và thời gian.
1.1.3 Tính toán khắp nơi và di động (Ubiquitous&Mobile Computing
1
1) Khái niệm: U&MC là tính toán không giới hạn bởi không gian và thời gian.
2) Đặc điểm: Các thiết bị tính toán gồm những máy tính nhỏ thậm chí là “vô hình” (ẩn trong
môi trường vật lí) và di động.
3) Công cụ : Máy tính và mạng truyền thông.
• Thuật ngữ U&MC do Mark Weiser làm việc tại XEROX đưa ra vào năm 1991.
• Công nghệ U&MC phát triển mạnh tại Nhật Bản, Hàn Quốc, Singapo, …
• Việt Nam cũng đang nghiên cứu và triển khai U&MC.
Mô hình tính toán khắp nơi và di động
2
§1.2 Một số kiến thức toán cơ sở
1.2.1 Ma trận
1. Các khái niệm về ma trận và định thức
- Định nghĩa ma trận
- Các loại ma trận
- Định nghĩa định thức
- Cách tính định thức
2. Các phép toán trên ma trận
- Phép cộng ma trận
- Phép nhân ma trận
- Ma trận nghịch đảo
- Hạng của ma trận
1.2.2 Không gian vector và ánh xạ tuyến tính
1. Không gian vector
- Các khái niệm và các định lí
- Tích vô hướng
2. Ánh xạ tuyến tính
- Các khái niệm và các định lí
- Phép biến đổi tuyến tính
- Trị riêng và vector riêng
- Chéo hóa ma trận
1.2.3. Xác suất
A. Khái niệm và các công thức xác suất
1. Phép thử ngẫu nhiên
Phép thử ngẫu nhiên T là một thí nghiệm hay một hành động mà:
- Kết quả của T không đoán định được trước.
- Có thể xác định được tập hợp tất cả các kết quả có thể xảy ra của T.
Tập hợp tất cả các kết quả có thể xảy ra của T được gọi là không gian mẫu và kí hiệu là Ω.
2. Biến cố ngẫu nhiên
• Biến cố ngẫu nhiên A liên quan với phép thử T là biến cố mà việc xảy ra hay không xảy ra
của A tùy thuộc vào kết quả của T.
• Mỗi kết quả của T làm cho A xảy ra gọi là một kết quả thuận lợi cho A. Tập hợp các kết quả
thuận lợi đó ký hiệu là Ω
A
.
• Biến cố chắc chắn U là biến cố luôn xảy ra.
• Biến cố không thể V là biến cố không bao giờ xảy ra.
3
3. Các phép toán trên biến cố
• Tổng A + B của hai biến cố A và B là một biến cố xảy ra ⇔ A hoặc B xảy ra.
• Tích AB của hai biến cố A và B là một biến cố xảy ra ⇔ A và B đồng thời xảy ra.
• Hiệu A - B của hai biến cố A và B là một biến cố xảy ra ⇔ A xảy ra và B không xảy ra.
4. Quan hệ giữa các biến cố
• Biến cố A kéo theo biến cố B: A ⇒ B ⇔ Nếu xảy ra A thì xảy ra B.
• Biến cố A tương đương biến cố B: A = B ⇔ A ⇒ B và B ⇒ A.
• Hai biến cố A và A* gọi là đối lập ⇔ luôn chỉ xảy ra một trong hai biến cố A hoặc A*.
• Hai biến cố A và B gọi là xung khắc ⇔ A và B không xảy ra đồng thời.
• Họ các biến cố {B
i
}, i =1 n là đầy đủ nếu từng đôi một xung khắc ⇔
1
n
i
i
B
=
= Ω
∑
và mọi biến cố H có thể phân ly dưới dạng tổng của các tích biến cố:
1
n
i
i
H HB
=
=
∑
.
• Biến cố không thể phân ly thành các biến cố khác gọi là biến cố sơ cấp.
5. Định nghĩa xác suất
a) Định nghĩa tiên đề của xác suất:
Tập Ω ≠ φ gọi là không gian các biến cố sơ cấp và với mỗi A ∈ Ω có một số thực P(A) ≥0
gọi là xác suất của A nếu:
• P(Ω ) = 1
• Tính chất cộng tính đối với P thỏa mãn với mọi họ {Ai} các biến ngẫu nhiên xung khắc:
P(∑Ai) = ∑P(Ai).
4
b) Định nghĩa cổ điển:
( )
A
P A
Ω
=
Ω
c) Định nghĩa thống kê:
( )
k
P A
N
=
, trong đó A xuất hiện k lần trong N
phép thử.
d) Định nghĩa hình học: Cho D là miền đo được và A là miền con của D. Lấy ngẫu nhiên
điểm M thuộc D thì xác suất để M thuộc A là: P(A) = Độ đo A / Độ đo D.
6. Tính chất của xác suất
• 0 ≤ P(A) ≤ 1
• P(U) = 1
• P(V) = 0
• P(A*) = 1 – P(A)
• Nếu A ⇒ B thì P(A) ≤ P(B)
7. Các công thức xác suất
a) Xác suất có điều kiện P(A/B) là xác suất xuất hiện A với điều kiện B xuất hiện. Ta có
P(A/B) = P(AB)/P(B).
b) A gọi là độc lập với B nếu P(A/B) = P(A).
c) Công thức nhân: P(AB) = P(A)P(B/A) = P(B)P(A/B).
d) Công thức cộng: P(A+B) = P(A) + P(B) - P(AB)
5
e) Công thức xác suất đầy đủ:
Nếu B
1
, …, B
n
là hệ thống đầy đủ các biến cố và H là một biến cố bất kỳ thì
P(H) = P(B
1
)P(H/B
1
) + … + P(B
n
)P(H/B
n
).
f) Công thức Bayes:
Với mọi k, 1≤ k ≤ n có
P(B
k
/H) =
( ) ( / )
( )
k k
P B P H B
P H
.
8. Ví dụ
1. Một trạm chỉ phát hai tín hiệu A và B với xác suất tương ứng là 0.84 và 0.16. Do có nhiễu
trên đường truyền nên 1/6 tín hiệu A bị méo nên thu được như tín hiệu B và 1/8 tín hiệu B bị
méo thành tín hiệu A.
a) Tìm xác suất thu được tín hiệu A.
b) Giả sử thu được tín hiệu A. Tìm xác suất để thu được đúng tín hiệu lúc phát.
Lời giải
Gọi B1= “Tín hiệu A được phát” ⇒ P(B1)=0.84
Gọi B2 = “Tín hiệu B được phát” ⇒ P(B2)=0.16
Khi đó B
1
, B
2
lập thành hệ thống đầy đủ các biến cố. Gọi H = “Thu được tín hiệu A”.
Ta có P(H/B1) = 1 – 1/6 = 5/6 và P(H/B2) = 1/8.
a) P(H) = P(B1)P(H/B1) + P(B2)P(H/B2) = 0.84(5/6) + 0.16(1/8) = 0.72.
b) Xác suất để thu được tín hiệu đã phát là
P(B1/H) = P(B1)P(H/B1)/P(H) = 0.84(5/6)/0.72 = 0.97
2. Dãy n phép thử T
1
, …, T
n
gọi là n phép thử Bernoulli nếu các điều kiện sau thỏa mãn:
- Dãy n phép thử là độc lập.
- Trong mỗi phép thử không gian mẫu Ω
i
= {A, A*}.
- Xác suất của A trong mọi phép thử P(A) = p.
Tính xác suất để A xuất hiện k lần trong n phép thử trên?
Lời giải
Ta có P(A*) = 1-p.
Biến cố để A xuất hiện k lần là tích H gồm k biến cố A và n-k biến cố A*.
Do A và A* độc lập nên P(H) = p
k
(1-p)
n-k
.
6
Có tất cả C
k
n
tích như vậy.
Từ đó: P
n
(k) = C
k
n
p
k
(1-p)
n-k
.
B. Biến ngẫu nhiên và hàm phân phối xác suất
1. Biến ngẫu nhiên
- Biến ngẫu nhiên X là hàm X: Ω→R sao cho với mọi số thực x ta có tập hợp {A∈Ω: X(A) <
x} là biến cố ngẫu nhiên.
- X là biến ngẫu nhiên rời rạc nếu miền giá trị của X là hữu hạn hoặc vô hạn đếm đươc.
Bảng phân phối xác suất:
- X là biến ngẫu nhiên liên tục nếu miền giá trị của X là tất cả các mọi điểm thuộc khoảng (a;
b).
- Nếu X, Y là các biến ngẫu nhiên, a, b là các hằng số thì
aX + bY, X – Y, X/Y (Y≠φ), max(X,Y), min(X,Y)
cũng là các biến ngẫu nhiên.
7
2. Hàm mật độ xác suất :
Là hàm f(x) không âm và xác định trên toàn trục số thỏa mãn
( ) ( )
B
P X B f x dx∈ =
∫
.
⇒ P(x ≤ X ≤ ∆x) ~ f(x) ∆x ;
( ) 1f x dx
+∞
−∞
=
∫
3. Hàm phân phối xác suất
F(x) = P({A ∈ Ω: X(A) < x│ x ∈ R }) = P(X < x).
Tính chất:
- 0 ≤ F(x) ≤ 1.
- F(x) không giảm: Nếu x
1
≤ x
2
thì F(x
1
) ≤ F(x
2
).
- F’(x) = f(x).
Biến ngẫu nhiên rời rạc:
( ) ( )
i i
i i
x x x x
F x P X x p
≤ ≤
= = =
∑ ∑
Biến ngẫu nhiên liên tục:
( ) ( )
x
F x f x dx
−∞
=
∫
C. Véc tơ ngẫu nhiên
1. Khái niệm
• Xét n biến ngẫu nhiên {X
1
. X
2
, …, X
n
} trên cùng một không gian xác suất. Chúng tạo
thành một vectơ ngẫu nhiên n thành phần.
• Hàm phân phối đồng thời:
8
1 2
, , , 1 2
1
( , , , ) { }
n
n
x x x n i i
i
F x x x P X x
=
= <
÷
I
2. Phân phối đồng thời rời rạc
a) Phân phối đồng thời
Vector ngẫu nhiên 2 chiều (X,Y):
p
ij
= P({X=xi} ∩ {Y=yj}) = P({X=x
i
;Y=y
j
})
Với p
ij
≥ 0 và ∑∑p
ij
= 1.
Hàm mật độ đồng thời rời rạc:
, ,
( , )
0
ij i j
XY
p X x Y y
f X Y
= =
=
b) Hàm mật độ điều kiện
• Xác suất có điều kiện: P({X=x
i
} / {Y=y
j
}) = p
ij
/p
j
hoặc P({Y=y
j
} / {X=x
i
}) = p
ij
/p
i
.
• Hàm mật độ điều kiện của X với Y= y :
/
( , )
( , )
( )
XY
X Y y
Y
f x y
f x y
f y
=
=
• Hàm mật độ điều kiện của Y với X= x :
/
( , )
( , )
( )
XY
Y X x
X
f x y
f x y
f x
=
=
• X và Y độc lập nếu F
XY
(x,y)=F
X
(x) F
Y
(y).
D. Các đại lượng đặc trưng
1. Kỳ vọng (Expectation)
9
-X là biến ngẫu nhiên rời rạc:
1
( )
n
i i
i
E X p x
=
=
∑
.
-X là biến ngẫu nhiên liên tục:
( ) ( )E X xf x dx
+∞
−∞
=
∫
.
Tính chất của kỳ vọng:
• E(c) = c, E(cX) = cE(X), c là hằng số
• E(X+Y) = E(X) + E(Y)
• Nếu X, Y độc lập thì E(XY) = E(X) E(Y)
2. Phương sai (Variance)
V(X) = E(X - E(X))
2
hay V(X) = E(X
2
) – (EX)
2
-X là biến ngẫu nhiên rời rạc:
( )
2
1
( ) ( )
n
i i
i
V X x E X p
=
= −
∑
.
-X là biến ngẫu nhiên liên tục:
2
( ) ( ( )) ( )V X x E X f x dx
+∞
−∞
= −
∫
.
Tính chất của phương sai
• c là hằng số : V(c) = 0, V(cX) = c
2
V(X), V(c+X) = V(X).
• Với X, Y độc lập:
V(X+Y) = V(X) + V(Y), V(X-Y) = V(X)+V(Y).
3. Độ lệch chuẩn
( )V X
σ
=
4. Hệ số tương quan
• Hiệp phương sai của hai biến ngẫu nhiên X, Y là: cov(X,Y)= E(X-EX)(Y-EY).
10
• Hệ số tương quan của hai biến ngẫu nhiên X, Y là :
,
cov( , )
( ) ( )
X Y
X Y
V X V Y
ρ
=
.
5. Ma trận tương quan
• Xét vector ngẫu nhiên X gồm n thành phần. Ma trận K = [cov(Xi,Xj)] gọi là ma trận
covarial hay ma trận tương quan :
1 1 1
1
cov( , ) cov( , )
cov( , ) cov( , )
n
n n n
X X X X
K
X X X X
=
E. Một số phân phối thông dụng
1. Phân phối nhị thức (Binomial Distribution)
• Định nghĩa: Đại lượng ngẫu nhiên X nhận một trong các giá trị 0, 1, …, n với xác suất
tương ứng được tính theo công thức Bernoulli
( )
x x n x
x n
P P X x C p q
−
= = =
gọi là phân phối nhị thức với tham số n và p (q = 1 – p).
• Các tham số đặc trưng: E(X) = np, V(X) = npq.
2. Phân phối Poisson
• Định nghĩa: Đại lượng ngẫu nhiên X nhận một trong các giá trị 0, 1, …, n với xác suất
tương ứng được tính theo công thức Poisson :
( )
!
k
k
P P X k e
k
λ
λ
−
= = =
gọi là phân phối Poisson với tham số λ.
• Các tham số đặc trưng: E(X) = V(X) = λ.
11
3. Phân phối siêu bội
• Định nghĩa: Xét tập hợp gồm N phần tử, trong đó M phần tử có tính chất A. Lấy ngẫu nhiên
(không hoàn lại) n phần tử. Gọi X là số phần tử trong đó có tính chất A :
( )
x n x
M N M
x
n
N
C C
P P X x
C
−
−
= = =
Đại lượng ngẫu nhiên X nhận một trong các giá trị 0, 1, …, n với xác suất tương ứng được tính
theo công thức trên gọi là phân phối siêu bội với các tham số N, M, n.
• Các tham số đặc trưng:
E(X) = np, V(X) =
1
N n
npq
N
−
−
, với q = 1 – p,
M
p
N
=
.
4. Phân phối mũ
• Định nghĩa: Đại lượng ngẫu nhiên X gọi là phân phối mũ với tham số λ > 0 nếu có hàm mật
độ :
, 0
( )
0, 0
x
e x
f x
x
λ
λ
−
>
=
≤
.
• Các tham số đặc trưng:
1
( )E X
λ
=
2
1
( )V X
λ
=
5. Phân phối đều
• Định nghĩa: Đại lượng ngẫu nhiên X gọi là phân phối đều
12
trên [a ; b] nếu có hàm mật độ
1
, [ ; ]
( )
0, [ ; ]
x a b
f x
b a
x a b
∈
=
−
∉
.
• Các tham số đặc trưng:
( )
2
a b
E X
+
=
2
12
( )
( )
b a
V X
−
=
6. Phân phối chuẩn (Karl Gauss)
• Định nghĩa: Đại lượng ngẫu nhiên X gọi là phân phối chuẩn nếu có hàm mật độ
2
2
( )
2
1
( )
2
x
f x e
µ
σ
σ π
−
−
=
.
• Các tham số đặc trưng:
( )E X
µ
=
2
( )V X
σ
=
Ví dụ :
Giả sử tuổi thọ (tính bằng năm) của một mạch điện tử trong máy tính là một đại lượng
ngẫu nhiên có phân phối mũ với kỳ vọng E = 6,25. Thời gian bảo hành của mạch điện tử là 5
năm.
Xét xem có bao nhiêu phần trăm mạch điện tử bán ra phải thay thế trong thời gian bảo
hành ?
13
Giải :
Gọi X là tuổi thọ của mạch điện tử ⇒ X có phân phối mũ với
λ =
1
( )E x
=
1
6,25
.
Có P(X ≤ 5) = F(5) = 1 - e
-
λ
.5
= 1 - e
-0,8
= 1 - 0,499 = 0, 501.
Như vậy, có khoảng 50% số mạch điện tử bán ra phải thay thế trong thời gian bảo hành.
CHƯƠNG 2. CÁC QUÁ TRÌNH NGẪU NHIÊN
§2.1 Mở đầu
2.1.1 Ví dụ
- Xét một hệ thống vật lí tiến triển theo thời gian. Tại thời điểm t ≥ 0 hệ thống có thể rơi vào
một trong ba trạng thái (hay vị trí) 1, 2 hoặc 3 một cách ngẫu nhiên.
- Không gian trạng thái E = {1, 2, 3}.
- Kí hiệu X(0) là vị trí của hệ thống tại thời điểm t = 0
⇒ X(0) là một biến ngẫu nhiên có thể nhận các giá trị 1, 2 hoặc 3 với các xác suất nhất định.
- Kết quả khảo sát thực tế cho bảng phân phối xác suất của X(0) như sau:
Các giá trị của X(0) 1 2 3
Xác suất tương ứng 0,2 0,5 0,3
⇒ phân phối xác suất ban đầu π
(0)
= (0,2; 0,5; 0,3).
- Tại các thời điểm t = 1, 2, 3, … vị trí của hệ thống được mô tả bởi các biến ngẫu nhiên X(1),
X(2), X(3), … với các bảng phân phối xác suất tương ứng.
- Trạng thái của hệ thống tại thời điểm t = s phụ thuộc vào các trạng thái trước đó.
- Quá trình {X(t)} gọi là quá trình ngẫu nhiên với không gian trạng thái E và phân phối xác suất
ban đầu π
(0)
.
2.1.2 Các khái niệm
a) Quá trình ngẫu nhiên:
- X(t) là trạng thái tại thời điểm t của một hệ thống nào đó tiến triển theo thời gian. Với mỗi
thời điểm t, X(t) là một biến ngẫu nhiên mô tả trạng thái của hệ thống.
- Quá trình {X(t)}
t≥0
gọi là quá trình ngẫu nhiên.
14
b) Không gian trạng thái:
- Tập hợp các trạng thái có thể có của hệ thống gọi là không gian trạng thái và kí hiệu là E.
- Trong ví dụ 1.1 thì E = {1, 2, 3}.
c) Bài toán cơ bản:
Input: Trước thời điểm s, hệ thống đã ở trạng thái nào đó và hiện tại X(s) = i;
Output: P(X(t) = j), t > s là thời điểm trng tương lai;
15
§2.2 Quá trình Markov
2. 2.1 Giới thiệu chung
a) Khái niệm
Xét quá trình ngẫu nhiên X(t):
- Nếu P(X(t) = j) = P(X(t) = j|X(s) = i), t > s
⇔ sự tiến triển của hệ thống trong tương lai chỉ phụ thuộc vào hiện tại và hoàn toàn độc lập với
quá khứ (tính không nhớ)
⇔ Quá trình ngẫu nhiên X(t) gọi là quá trình Markov.
- X(t) là quá trình Markov và E đánh số được (đếm được) thì X(t) gọi là xích Markov :
+ Nếu t ∈ {0, 1, 2, …} ⇒ X(t) gọi là xích Markov với thời gian rời rạc;
+ Nếu t ∈ (0, ∝) ⇒ X(t) gọi là xích Markov với thời gian liên tục.
b) Ứng dụng của quá trình Markov
- Các quá trình (xích, hay chuỗi) Markov xuất hiện nhiều trong vật lí, đặc biệt là cơ học thống
kê (statistical mechanics)
- Xích Markov có thể dùng để mô hình hóa nhiều quá trình trong lí thuyết hàng đợi và thống kê.
- Xích Markov ứng dụng trong lý thuyết thông tin
- Xích Markov ứng dụng trong game:
Nhiều loại game của trẻ em (Chutes and Ladders, Candy Land), là kết quả chính xác điển hình
của chuỗi Markov. Ở mỗi vòng chơi, người chơi bắt đầu chơi từ trạng thái định sẵn, sau đó phải
có lợi thế gì đó mới có thể vượt qua được bàn kế tiếp.
- Xích Markov ứng dụng trong quản lý đất đai:
GIS và chuỗi Markov vào phân tích sự thay đổi sử dụng đất (land use change), từ đó dự báo
được tình hình sử dụng đất trong giai đoạn kế tiếp.
- Xích Markov ứng dụng trong các mô hình sinh học, đặc biệt là trong tiến trình dân số
- Xích Markov ứng dụng trong thống kê địa chất.
- Mô hình Markov ẩn được ứng dụng sửa lỗi trong hệ thống điện thoại di động
- Mô hình Markov ẩn được ứng dụng trong nhận dạng tiếng nói và trong tin sinh học, chẳng
hạn để mã hóa vùng/dự đoán gene.
- PageRank của một trang web dùng bởi Google được định nghĩa bằng một xích Markov. Đó là
xác suất để đến được trang i trong phân bố chuẩn (stationary distribution) dựa vào xích Markov
của mọi trang (đã biết):
16
+ Nếu N là số lượng trang web đã biết, và một trang i có k
i
liên kết thì nó có xác suất chuyển
tới là (1-q)/k
i
+ q/N cho mọi trang mà có liên kết tới trang i và q/N cho mọi trang mà không có
liên kết tới trang i;
+ Tham số q thường được chọn là khoảng 0,15.
2. 2.2 Xích Markov
1) Tính Markov
Định nghĩa:
- Xét quá trình ngẫu nhiên X(t) với không gian trạng thái E. X(t) có tính Markov ⇔ với t
0
< t
1
<…< t
n
< t
n+1
< …và i
0
, i
1
,…, i
n-1
, i, j ∈ E có
P{X(t
n+1
) = j | X(t
0
) = i
0
, …, X(t
n-1
) = i
n-1
, X(t
n
) = i}
= P{X(t
n+1
) = j | X(t
n
) = i}
Trong đó : t
n
là hiện tại, t
n+1
là tương lai, còn (t
0
, t
1
, …, t
n-1
) là quá khứ.
- X(t) có tính Markov ⇔ Sự tiến triển của quá trình trong tương lai chỉ phụ thuộc vào hiện tại
và độc lập với quá khứ
- Đặt p(s, i, t, j) = P{X(t) = j | X(s) = i, s < t} là xác suất có điều kiện để hệ chuyển từ trạng thái
i ở thời điểm s sang trạng thái j ở thời điểm t.
⇒ p(s, i, t, j) gọi là xác suất chuyển của hệ.
- Nếu xác suất chuyển của hệ chỉ phụ thuộc h = t – s
⇔ p(s, i, t, j) = p(s + h, i, t + h, j)
⇔ hệ gọi là thuần nhất theo thời gian.
Ví dụ 1:
Có hai bình A, B và d quả cầu đánh số từ 1 đến d. Biết rằng, tại thời điểm ban đầu A chứa a
quả cầu và B chứa d-a quả cầu. Tại mỗi thời điểm n, chọn ngẫu nhiên một số k trong tập {1,
2, d} và chuyển quả cầu thứ k từ bình đang chứa nó sang bình kia. Gọi X
n
là số quả cầu chứa
trong bình A tại thời điểm thứ n, n = 0, 1, 2,
⇒ P(X
n+1
= j | X
0
= a, X
1
= i
1
, …, X
n-1
= i
n-1
, X
n
= i)
= P(X
n+1
= j | X
n
= i)
- Tại thời điểm thứ n, trong A có i quả cầu ⇒ Tại thời điểm thứ n+1, trong A có j= i-1 hoặc j=
i+1 quả cầu
17
- Tại thời điểm thứ n, trong A có i quả cầu nên xác suất quả cầu được chọn để chuyển từ A sang
B là i/d
⇒ P(X
n+1
= i-1 | X
n
= i) = i/d.
- Tại thời điểm thứ n, trong B có d – i quả cầu nên xác suất quả cầu được chọn để chuyển từ B
sang A là (d-i)/d
⇒ P(X
n+1
= i+1 | X
n
= i) = (d-i)/d.
⇒ Xác suất chuyển p(n, i, n+1, j)=
, 1
, 1
0, 1
i
j i
d
d i
j i
d
j i
= −
−
= +
≠ ±
- Kết luận: X(n) là xích Markov thuần nhất.
2) Xích Markov rời rạc và thuần nhất
Cho (X
n
) là xích Markov rời rạc và thuần nhất;
a) Ma trận xác suất chuyển:
Có p
ij
= P{X
n+1
= j X
n
= i}=
P{X
n+1
= j X
0
= i
0
, , X
n-1
= i
n-1
, X
n
= i}
⇒ không phụ thuộc vào n.
- Ma trận xác suất chuyển sau 1 bước: P = (p
ij
)
trong đó, p
ij
là xác suất có điều kiện để hệ tại thời điểm n (hiện tại) ở trạng thái i chuyển sang
trạng thái j tại thời điểm n+1 (tương lai).
- Tính chất của ma trận chuyển P:
• 0 ≤ p
ij
≤ 1, với mọi i, j ∈ E
•
ij
j E
p
∈
∑
= 1
18
Ma trận có tính chất trên gọi là ma trận ngẫu nhiên.
Đặt các biến cố: A= {X
n+1
= j},
B= {X
n
= i} C= {X
0
= i
0
, , X
n-1
= i
n-1
}
Tính Markov ⇔ P(A B) = P(A | BC).
P(AC | B) =
( ) ( ) ( | )
( ) ( )
P ABC P BC P A BC
P B P B
=
=
( ) ( | ) ( | )
( )
P B P C B P A B
P B
= P(C | B) P(A | B).
Kết luận: cho trước hiện tại thì quá khứ và tương lai độc lập với nhau.
- Xác suất chuyển sau n bước:
p
ij
(n)
= P{X
m+n
= j | X
m
= i} = P{X
n
= j | X
0
= i}
⇔ xác suất để tại thời điểm ban đầu hệ có trạng thái i và sau n bước chuyển sang trạng thái j.
- Ma trận xác suất chuyển sau n bước:
P
(n)
= (p
ij
(n)
)
Qui ước:
(0)
1
0
ij
khi i j
p
khi i j
=
=
≠
.
Có p
ij
(1)
= p
ij
19
⇒ với mọi n = 0, 1, 2, có
( 1) ( )n n
ij ik kj
k E
p p p
+
∈
=
∑
(1) ⇒ gọi là phương trình ngược;
( 1) ( )n n
ij ik kj
k E
p p p
+
∈
=
∑
(2) ⇒ gọi là phương trình thuận.
Với mọi m, n= 0, 1, 2, có
( ) ( ) ( )n m n m
ij ik kj
k E
p p p
+
∈
=
∑
(3)
(3) gọi là phương trình Chapman-Kolmogorov.
- Viết dưới dạng ma trận: P
(n+1)
= PP
(n)
P
(n+1)
= P
(n)
P
P
(n+m)
= P
(n)
P
(m)
⇒ P
(n)
= P
n
- Phân phối hữu hạn chiều của quá trình Markov được tính theo các công thức sau:
P(X
0
= i
0
) =
0
i
p
P(X
0
=i
0
,X
1
= i
1
, , X
n-1
= i
n-1
, X
n
= i) =
0 0 1 1
n
i i i i i
p p p
−
b) Phân phối ban đầu:
- Phân phối của hệ tại thời điểm n:
p
j
(n)
= P(X
n
= j); n= 0, 1, 2, ; j ∈ E.
Đặt Π
(n)
= (p
j
(n)
, j ∈ E).
- Phân phối ban đầu của hệ là Π = Π
(0)
.
- Phân phối ban đầu gọi là dừng nếu Π
(n)
không phụ thuộc vào n ⇔ Π = Π
(n)
⇔ Π = ΠP
20
- Qui ước viết Π
(n)
= (p
j
(n)
, j ∈ E) là vector hàng.
Π
(n)
= ΠP
(n)
Π
(n+1)
= Π
(n)
P
Π
(n+1)
= Π
(1)
P
(n)
Π
(n+m)
= Π
(n)
P
(m)
c) Mô hình chung:
Xích Markov rời rạc và thuần nhất là bộ bốn
(E, X
n
, Π, P)
• X
n
là dãy các đại lượng ngẫu nhiên rời rạc
• Π là phân phối ban đầu
• P là ma trận xác suất chuyển.
Ví dụ 2 : Xích Markov có hai trạng thái
Xét xích (X
n
):
- Không gian trạng thái: E = {0, 1}
- Ma trận chuyển P =
1
1
a a
b b
−
÷
−
, 0 < a, b < 1.
- Phân phối ban đầu: P{X
0
= 0} = b,
P{X
0
= 1} = a.
Có : P
2
=
2
2
(1 ) (1 1 )
(1 1 ) (1 )
a ab a a b
b a b b ab
− + −+−
÷
−+− − +
P
n
=
1 (1 )
n
b a a a
a b
b a b b
a b a b
−
− −
+
÷ ÷
−
+ +
Nếu 1 – a - b < 1
21
⇒
lim
n→∞
P
n
=
b a
a b a b
b a
a b a b
÷
+ +
÷
÷
÷
+ +
Kết luận :
- Trong tương lai (xa xôi) hệ sẽ rơi vào trạng thái 0 với xác suất
b
a b+
và rơi vào trạng
thái 1 với xác suất
a
a b+
.
- Trường hợp a = 1 – b ⇔ X
1
, X
2
, … là các biến ngẫu nhiên độc lập, có cùng phân phối với
P{X
n
= 0} = b, P{X
n
= 1} = a.
Ý nghĩa thực tiễn
Xét một tệ nạn xã hội. Ký hiệu :
0 là trạng thái không mắc tệ nạn xã hội,
1 là trạng thái mắc vấn đề tệ nạn xã hội.
Áp dụng mô hình xích Markov để khảo sát.
Bài toán cụ thể :
- Thống kê tình trạng nghiện hút của 1200 sinh viên cho số liệu : 1000 không nghiện và 200
nghiện.
⇒ Phân phối xác suất ban đầu là :
p
0
=
1000 5
1200 6
=
= 0,833 ; p
1
=
200 1
1200 6
=
= 0,1673.
22
- Sau 3 tháng, có những sinh viên trong 1200 người đang xét sẽ từ 0 chuyển sang 1 và từ 1
chuyển sang 0.
• 0 → 0 có nghĩa là trước đây không nghiện và nay vẫn không nghiện.
• 0 → 1 có nghĩa là trước đây không nghiện và nay bị nghiện.
• 1 → 0 có nghĩa là trước đây nghiện và nay không nghiện.
• 1 → 1 có nghĩa là trước đây nghiện và nay vẫn nghiện.
Các số liệu thu thập được cho trong bảng sau :
0 1
0 990 10
1 24 176
⇒ p
00
=
990
1000
= 0,99 , p
01
=
10
1000
= 0,10
p
10
=
24
200
= 0,12 , p
11
=
176
200
= 0,88
- Mô hình xích Markov:
• Không gian trạng thái: E = {0, 1}
• Phân phối ban đầu:
Π
0
= (p
0
, p
1
) = (5/6, 1/6) = (0,833 , 0,167)
• Ma trận xác suất chuyển:
P =
00 01
10 11
p p
p p
÷
=
0,99 0,01
0,12 0,88
÷
- Theo mô hình trên thì a= 0,01 và b= 0,12.
Có 1 – a - b < 1.
23
⇒
lim
n→∞
P
n
=
b a
a b a b
b a
a b a b
÷
+ +
÷
÷
÷
+ +
=
0,923 0,077
0,923 0,077
÷
Kết luận: trong tương lai đủ xa:
• Tỷ lệ người không nghiện xấp xỉ 92 %.
• Tỷ lệ người nghiện xấp xỉ 8 %.
- Tính tốc độ hội tụ của P
n
để chọn n thích hợp với sai số cho trước. Trong trường hợp trên có:
• Sau 3 tháng đầu tiên tỷ lệ người không nghiện và nghiện
Π
(1)
= ΠP = (5/6, 1/6)
0,99 0,01
0,12 0,88
÷
= (0,845, 0,155)
• Sau 3 tháng tiếp theo dự báo tỷ lệ người không nghiện và nghiện là
Π
(2)
= ΠP = (5/6, 1/6)
0,9813 0,0187
0,2244 0,7756
÷
= (0,855, 0,145)
• Dự báo 3 tháng kế tiếp tỷ lệ người không nghiện và nghiện là
24
Π
(1)
= ΠP = (5/6, 1/6)
0,973731 0,026269
0,315228 0,684772
÷
= (0,864, 0,145)
• Khi n= 24x3 tháng, dự báo tỷ lệ người không nghiện và nghiện là
Π
(24)
= ΠP = (5/6, 1/6)
0,9257966 0,0742034
0,8904407 0,1095593
÷
= (0,9199, 0,0801)
3 ) Định lý ergodic
- Xét xích Markov (
n
X
) có E = { 1, 2, , N}là không gian trạng thái; P = (
ij
p
) là ma
trận xác suất chuyển.
- Xích Markov có tính chất ergodic ⇔ thỏa mãn các điều kiện:
+ Tồn tại giới hạn π
j
=
lim
n→∞
p
ij
(n)
độc lập với i;
+ Với mọi j∈ E ⇒ π
j
> 0;
+
j
j E
π
∈
∑
= 1.
Định lý:
• Nếu có
o
n
sao cho
0
( )
,
min
n
ij
i j
p
> 0 (4)
⇒ có
1 2
, , ,
n
π π π
:
j
π
> 0,
1
j
j E
π
∈
=
∑
(5)
25