Tải bản đầy đủ (.pdf) (73 trang)

Bài toán lọc, dừng tối ưu và điều khiển tối ưu quá trình ngẫu nhiên : Luận văn ThS. Toán học: 60 46 15

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (571.96 KB, 73 trang )

I HC QUC GIA H NI

NGUYN THNG NG

Bi toỏn lc, dng ti u v iu khin ti u
quỏ trỡnh ngu nhiờn

luận văn thạc sĩ TON HC

Hà nội - 2012


I HC QUC GIA H NI

NGUYN THNG NG

Bi toỏn lc, dng ti u v iu khin ti u
quỏ trỡnh ngu nhiờn
Mó s

: 60 46 15

luận văn thạc sĩ TON HC

Ngi hng dn khoa hc: GS.TSKH. ng Hựng Thng

Hà nội - 2012


Mục lục
1 Một số kiến thức chuẩn bị


1.1 Một số kiến thức về quá trình ngẫu nhiên . .
1.1.1 Quá trình ngẫu nhiên . . . . . . . . .
1.1.2 Chuyển động Brownian . . . . . . . .
1.1.3 Tính chất của chuyển động Brownian
1.2 Tích phân Itô . . . . . . . . . . . . . . . . . .
1.2.1 Tích phân Itô . . . . . . . . . . . . . .
1.2.2 Một số tính chất của tích phân Itô . .
1.3 Tích phân ngẫu nhiên và công thức Itô . . . .
1.4 Phương trình vi phân ngẫu nhiên . . . . . . .
1.5 Một số ví dụ . . . . . . . . . . . . . . . . . .
2 Bài toán lọc
2.1 Đặt vấn đề . . . . . . . . . . . . . . . . .
2.2 Bài toán lọc tổng quát . . . . . . . . . .
2.2.1 Phát biểu bài toán lọc tổng quát
2.2.2 Giải bài toán lọc tổng quát . . .
2.3 Bài toán lọc Kalman-Bucy . . . . . . . .
2.3.1 Phát biểu bài toán . . . . . . . .
2.3.2 Giải bài toán lọc Kalman-Bucy .
2.4 Một số ví dụ . . . . . . . . . . . . . . . .
3

Bài toán dừng tối ưu
3.1 Đặt vấn đề . . . . . . .
3.2 Bài toán dừng tối ưu .
3.3 Các bước giải bài toán
3.3.1 Bước 1 . . . . .
3.3.2 Bước 2 . . . . .
3.3.3 Bước 3 . . . . .
3.4 Ví dụ minh hoạ . . . .
3.5 Ví dụ áp dụng thực tế


.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.

.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.


.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.


.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

4
4
4
5
5
5
5
7
7

9
10

.
.
.
.
.
.
.
.

16
16
16
16
17
18
18
19
30

.
.
.
.
.
.
.
.


36
36
36
37
37
38
41
45
46

4 Điều khiển tối ưu hệ ngẫu nhiên
51
4.1 Đặt vấn đề . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.2 Bài toán điều khiển tối ưu . . . . . . . . . . . . . . . . . . . . . . . . . . 52
1


4.3
4.4
4.5

Phương trình Hamilton-Jacobi-Bellman . . . . . . . . . . . . . . . . . . 53
Ví dụ minh hoạ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
Ví dụ áp dụng thực tế . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

A Lời giải một số bài tập của 3 chương

2


63


Lời mở đầu
Xác suất thống kê là một bộ phận của toán học nghiên cứu các hiện tượng ngẫu
nhiên, là một lĩnh vực toán học ứng dụng. Ngày nay, Xác suất thống kê đã trở thành
một ngành toán học lớn, chiếm vị trí quan trọng trong cả lý thuyết và ứng dụng. Nó có
vai trò hết sức quan trọng trong vật lý và trong phạm vi khác của khoa học tự nhiên,
trong kỹ thuật quân sự, trong các ngành kỹ thuật khác nhau, trong kinh tế học ...
Lý thuyết quá trình ngẫu nhiên là một trong lý thuyết quan trọng trong xác suất
thống kê. Quá trình ngẫu nhiên cũng có thể được xem như một hàm ngẫu nhiên nào
đó và sự mô tả các hàm ngẫu nhiên này thường được thông qua các phương trình vi
phân ngẫu nhiên. Tính toán ngẫu nhiên phục vụ đắc lực và đóng vai trò then chốt
trong nghiên cứu các hàm ngẫu nhiên nói chung và phương trình vi phân ngẫu nhiên
nói riêng.
Bài toán lọc, dừng tối ưu, điều khiển tối ưu quá trình ngẫu nhiên thuộc vào loại các
bài toán có quan hệ mật thiết với ứng dụng. Cơ sở để để giải quyết bài toán đó là tính
toán ngẫu nhiên.
Vì những lý do trên dưới sự hướng dẫn GS. TSKH. Đặng Hùng Thắng em chọn đề
tài: "Bài toán lọc, dừng tối ưu và điều khiển tối ưu quá trình ngẫu nhiên".
Luận văn của em gồm phần mở đầu, phần kết luận và bốn chương:
•Chương 1: Một số kiến thức chuẩn bị. Chương này nhằm giới thiệu về tích phân
Itô, công thức vi phân Itô, phương trình vi phân ngẫu nhiên. Đây là kiến thức cơ sở
chuẩn bị cho nội dung chính chương 2,3,4
•Chương 2: Bài toán lọc. Chương này giới thiệu về bài toán lọc, cách giải bài
toán lọc Kalman-Bucy.
•Chương 3: Bài toán dừng tối ưu. Chương này giới thiệu về bài toán dừng tối
ưu, các bước giải bài toán dừng tối ưu .
•Chương 4: Bài toán điều khiển tối ưu hệ ngẫu nhiên. Chương này giới thiệu về
bài toán điều khiển tối ưu, phương trình Hamilton-Jacobi-Bellman, cách giải bài toán

điều khiển tối ưu .
Tuy nhiên, do trình độ và thời gian có hạn nên luận văn không thể tránh khỏi thiếu
sót. Em rất mong nhận được sự góp ý phê bình của các thầy, cô để luận văn của em
được hoàn thiện hơn.
Em xin chân thành cảm ơn tới các thầy, cô trong khoa Toán-Cơ-Tin, bộ môn Xác
suất-Thống kê. Đặc biệt em xin bày tỏ lòng biết ơn sâu sắc tới GS. TSKH. Đặng
Hùng Thắng đã tận tình chỉ bảo, giúp đỡ em hoàn thành bản luận văn này.

3


Chương 1

Một số kiến thức chuẩn bị
1.1
1.1.1

Một số kiến thức về quá trình ngẫu nhiên
Quá trình ngẫu nhiên

Định nghĩa 1.1 Một quá trình ngẫu nhiên là họ các biến ngẫu nhiên {Xt }t∈T phụ
thuộc tham số t ∈ T trên không gian xác suất (Ω, F , P).
trong đó T là tập con của đường thẳng thực, tức là T thuộc một trong các tập sau:
(−∞, +∞), [a, +∞), (−∞, b], [a, b], [a, b), (a, b], (a, b)
Chú ý rằng với mỗi t ∈ T ta có biến ngẫu nhiên ω → Xt (ω ); ω ∈ Ω. Đồng thời với
mỗi ω ∈ Ω ta có hàm t → Xt (ω ); t ∈ T
Hàm phân phối của quá trình ngẫu nhiên X = {Xt }t∈T là hàm đo được µt1 ,t2 ,...,tk
xác định trên không gian Rnk , k = 1, 2, 3...,:
µt1 ,t2 ,...,tk (F1 × F2 × ... × Fk ) = P[Xt1 ∈ F1 , ..., Xtk ∈ Fk ]; ti ∈ T


trong đó F1 , ..., Fk là những tập Borel trong Rn
Định lý 1.1 Với mọi t1 , t2 , ...., tk ∈ T và mọi hoán vị σ trên {1, 2, ..., k}, cho họ độ đo
xác suất νt1 ,t2 ,...,tk trên Rnk thoả mãn
νtσ(1) ,tσ(2) ,...,tσ(k) (F1 × F2 × ... × Fk ) = νt1 ,t2 ,...,tk (Fσ −1 (1) × .... × Fσ −1 (k) )


νtσ(1) ,...,tσ(k) (F1 × ... × Fk ) = νt1 ,...,tk ,tk+1 ,...,tk+m (Fσ −1 (1) × ... × Fσ −1 (k) × Rn × ... × Rn )

Khi đó luôn tồn tại không gian xác suất (Ω, F , P) và quá trình ngẫu nhiên {Xt }
với Xt : Ω → Rn thoả mãn
νt1 ,t2 ,...,tk (F1 × F2 × ... × Fk ) = P[Xt1 ∈ F1 , ..., Xtk ∈ Fk ]; ti ∈ T

với mọi ti ∈ T, k ∈ N và mọi tập Borel Fi

Định nghĩa 1.2 Cho {Xt } và {Yt } là các quá trình ngẫu nhiên trên không gian
(Ω, F , P). Khi đó ta nói rằng {Xt } là bản sao của {Yt } nếu
P({ω ; Xt (ω ) = Yt (ω )}) = 1 với mọi t
4


1.1.2

Chuyển động Brownian

Năm 1828 Robert Brown quan sát chuyển động tưởng chừng không theo quy luật của
hạt phấn hoa. Chuyển động được giả thiết giống như chuyển động các hạt trong chất
lỏng đồng chất. Biểu diễn các chuyển động đó người ta sử dụng quá trình ngẫu nhiên
Bt (ω ) để chỉ hạt phấn hoa ω ở thời điểm t
Ta xây dựng {Bt } bởi định lý Kolmogorov với độ đo xác suất {νt1 ,t2 ,...tk }
Với x ∈ Rn ta xác định

n

p(t, x, y ) = (2πt)− 2 exp(−

|x − y|2
) với y ∈ Rn , t > 0
2t

Nếu 0 ≤ t1 ≤ t2 ≤ ... ≤ tk xác định độ đo {νt1 ,t2 ,...tk } trên Rnk
p(t1 , x, x1 )p(t2 − t1 , x1 , x2 )...p(tk − tk−1 , xk−1 , xk )dx1 ...dxk

νt1 ,t2 ,...tk (F1 × ... × Fk ) =
F1 ×...×Fk

Chúng ta sử dụng ký hiệu dy = dy1 ...dyk là độ đo Lebesgue và p(0, x, y )dy = δx (y )
Từ p(t, x, y )dy = 1 với t ≥ 0 và theo định lý Kolmogorov tồn tại không gian xác
Rn

suất (Ω, F , Px) và quá trình ngẫu nhiên {Bt } trên Ω có hàm phân phối {Bt } là
Px (Bt1 ∈ F1 , ..., Btn ∈ Fn ) =

p(t2 − t1 , x1 , x2 )...p(tk − tk−1 , xk−1 , xk )dx1 ...dxk
F1 ×...×Fk

Quá trình đó gọi là chuyển động Brownian bắt đầu tại x (quan sát ban đầu Px (B0 =
x) = 1)
Quá trình Bt = (Bt(1) , ..., Bt(n) ) được gọi là chuyển động Brownian n-chiều nếu mỗi
quá trình {Bt(j) }; t ≥ 0, 1 ≤ j ≤ n độc lập với nhau và là chuyển động Brownian 1-chiều

1.1.3


Tính chất của chuyển động Brownian

1. Bt là quá trình Gaussian tức là với mọi 0 ≤ t1 ≤ ... ≤ tk biến ngẫu nhiên
Z = (Bt1 , ..., Btk ) ∈ Rnk có phân phối chuẩn
2. Bt có số gia độc lập, tức là Bt1 , Bt2 − Bt1 , ..., Btk − Btk−1 độc lập với mọi 0 ≤ t1 <
t2 <, ..., < tk

1.2
1.2.1

Tích phân Itô
Tích phân Itô

Ký hiệu N = N (S, T ) là lớp các hàm
f (t, ω ): [0, ∞)× Ω −→ R
thoả mãn:
5


1. (t, ω ) −→ f (t, ω ) là (B× F )-đo được với B là σ -đại số trên [0, ∞)
2. f (t, ω ) là Ft -tương thích
T

3. E[ f 2 (t, ω )dt] < ∞
S

Với hàm f ∈ N ta xác định tích phân Itô:
T


J [f ](t, ω ) =

f (t, ω )dBt (ω )
S

trong đó Bt là chuyển động Brownian 1-chiều.
Chúng ta có thể xác định tích phân Itô bằng cách: Nghiên cứu lớp J [φ] các hàm
đơn giản φ, sau đó áp dụng tính chất: Với mọi hàm f ∈ N luôn xấp xỉ bằng hàm đơn
giản φ và xác định f dB là giới hạn của của φdB khi φ → f .
Hàm đơn giản: Một hàm φ ∈ N được gọi là hàm đơn giản nếu nó có dạng
φ(t, ω ) =

ej (ω ).χ(tj ,tj+1 ] (t)
j

Khi đó tích phân của hàm đơn giản φ(t, ω ) xác định bởi
T

φ(t, ω )dBt (ω ) =
j≥0

S

ej (ω )[Btj+1 − Btj ](ω )

Tính đẳng cự: Cho φ(t, ω ) là hàm đơn giản bị chặn. Khi đó
T

T


φ(t, ω )dBt(ω ))2 ] = E[

E[(
S

φ(t, ω )2 dt]
S

Định nghĩa 1.3 Với f ∈ N tích phân Itô

T

f (t, ω )dBt(ω ) được định nghĩa

S

T

J [f ](ω ) :=

T

f (t, ω )dBt(ω ) := lim

φn (t, ω )dBt (ω )

n→∞

S


S

trong đó hàm đơn giản φn ∈ N thoả mãn:
T

|f − φn |2 dt] −→ 0

E[
S
T

• Sự tồn tại giới hạn trên do dãy { φn (t, ω )dBt (ω )} là dãy Côsi trong L2 (Ω, P)
S

6

(1.1)


1.2.2

Một số tính chất của tích phân Itô

Tính chất 1 (xem [10], [11]) Cho f, g ∈ N (0, T ) và 0 ≤ S < U < T . Khi đó:
1.

T

U


f dBt =
S

2.

T

f dBt +
S

T

f dBt
U

T

T

(cf + g )dBt = c f dBt +
S

S

gdBt
S

T

3. E[ f dBt ] = 0

S
T

T

S

S

4. E[( f dBt )2 ] = E[ f 2 dt](Đẳng cự Itô)
Tính chất 2 (Bất đẳng thức Doob’s)(xem[8], [10])
Nếu Mt là Martingale và Mt (ω ) liên tục thì ∀p ≥ 0, T ≥ 0 và ∀λ > 0 ta có:
P[ sup [|Mt | ≥ λ] ≤
0≤t≤T

1
λp

E[|MT |p ]

Tính chất 3 Cho f ∈ N (0, T ). Giả sử tồn tại một bản sao t-liên tục của f thoả mãn:
t

f (s, ω )dBs(ω ); 0 ≤ s ≤ T
0

Khi đó tồn tại quá trình ngẫu nhiên liên tục Jt trên (Ω, F , P) thoả mãn:
t

f dB ] = 1 với ∀t : 0 ≤ t ≤ T


P[Jt =
0

1.3

Tích phân ngẫu nhiên và công thức Itô

Định nghĩa 1.4 Cho Bt là chuyển động Brownian 1-chiều trên không gian (Ω, F , P).
Tích phân ngẫu nhiên 1-chiều là quá trình ngẫu nhiên Xt có dạng:
t

Xt = X0 +

t

u(s, ω )ds +
0

v (s, ω )dBs
0

7


trong đó v ∈ N thoả mãn:
t

v 2 (s, ω )ds < ∞ với ∀t ≥ 0] = 1


P[
0

và u là Ht -thích nghi thoả mãn:
t

|u(s, ω )|ds < ∞ với ∀t ≥ 0] = 1

P[
0

Khi đó ta nói rằng Xt có vi phân ngẫu nhiên và
dXt = udt + vdBt
Định lý 1.2 Công thức Itô 1-chiều(xem [3], [5], [8], [10])
Cho Xt là quá trình ngẫu nhiên có vi phân Itô:
dXt = udt + vdBt

Giả sử g (t, x) ∈ C 2 ([0, ∞) × R). Khi đó Yt = g (t, Xt ) là quá trình ngẫu nhiên Itô và
dYt =

∂g
∂g
1 ∂2g
(t, Xt )dt + (t, Xt )dXt +
(t, Xt )(dXt )2
∂t
∂x
2 ∂x2

trong đó dt.dt = dt.dBt = dBt .dt = 0; dBt .dBt = dt

Bây giờ ta mở rộng B (t, ω ) = (B1 (t, ω ), ..., Bm (t, ω ) là chuyển động Brownian m-chiều,
khi đó X = (X1 , X2 , ...Xn ) là vi phân ngẫu nhiên Itô-n chiều biểu diễn bởi:


dX1 = u1 dt + v11 dB1 + ... + v1m dBm





.
.
.
.
.




.





.

.

.


.

.

.

dXn = un dt + vn1 dB1 + ... + vnm dBm

hay dạng ma trận

dX = udt + vdBt

trong đó




X1
 . 
 

X=
 . 
 . 
Xn

 

u1

.
 

u=
.
.
un




v=




v11 ... v1m
.
. 

.
. 
vn1 ... vnm

8






dB1
 . 



dB = 
.


 . 
dBn


Định lý 1.3 Công thức Itô nhiều chiều
Cho dX = udt + vdB là vi phân ngẫu nhiên Itô n-chiều định nghĩa như phần trước.
Nếu g (t, x) = (g1 (t, x), ..., gp (t, x)) là ánh xạ khả vi cấp 2 liên tục từ [0, +∞) × Rn vào
Rp . Khi đó quá trình Y (t, ω ) = g (t, Xt ) là quá trình ngẫu nhiên p-chiều mà mỗi thành
phần được cho bởi:

dYk =

∂gk
(t, X )dt +
∂t

i

1
∂gk
(t, X )dXi +

∂xi
2

i,j

∂ 2 gk
(t, X )dXi dXj
∂xi ∂xj

(1.2)

trong đó dBi dBj = δij dt, dBi dt = dtdBi = 0

1.4

Phương trình vi phân ngẫu nhiên

Phương trình vi phân ngẫu nhiên là phương trình có dạng:
dXt
= b(t, Xt ) + σ (t, Xt )Wt
dt

(1.3)

trong đó b(t, Xt ) ∈ R, σ (t, Xt ) ∈ R là các hàm đo được và Wt là tiếng ồn trắng.
Hoặc:
dXt = b(t, Xt )dt + σ (t, Xt )dBt

trong đó Bt là chuyển động Brownian và Wt =


(1.4)

dBt
dt

Một quá trình ngẫu nhiên Xt (ω ), t ∈ [0, T ] được gọi là nghiệm của phương trình
vi phân với điều kiện ban đầu X0 = Z, (Z là một biến ngẫu nhiên cho trước, độc lập
với W và E(Z 2 ) < ∞) nếu:
(i) Xt là thích nghi với Ft và đo được đối với σ -trường tích B[0,T ] xFt
t

(ii)E Xt2 dt < ∞
0

(iii) Xt thoả mãn phương trình vi phân ngẫu nhiên ban đầu
Định lý 1.4 Tồn tại và duy nhất(xem [3], [5], [10])
Cho T > 0 và b : [0, T ] × Rn → Rn
σ : [0, T ] × Rn → Rn×m
là hàm đo được thoả mãn
|b(t, x)| + |σ (t, x)| ≤ C (1 + |x|); x ∈ R; t ∈ [0, T ], c = const
|b(t, x) − b(t, y )| + |σ (t, x) − σ (t, y )| ≤ D|x − y|; x, y ∈ Rn , t ∈ [0, T ]
Cho Z là biến ngẫu nhiên độc lập với σ -trường F∞ = σ (Bt ; 0 < t < ∞) : E[Z 2 ] < ∞)
Khi đó phương trình vi phân ngẫu nhiên
dXt = b(t, Xt )dt + σ (t, Xt )dBt ; X0 = Z

có nghiệm duy nhất Xt (ω ) liên tục theo t và mỗi thành phần thuộc lớp N [0, T ]
9


1.5


Một số ví dụ

Ví dụ 1.1 Mô hình tăng dân số đơn giản
dNt
= αt Nt ; N (0) = N0
dt

trong đó αt = rt + αt Wt , Wt ="ồn trắng", α = hằng số.
Xác định sự phát triển dân số Nt ?
Giải
Giả thiết rằng rt = r không đổi ta có thể viết:
dNt = rNt dt + αNt dBt



dNt
= rdt + αdBt
Nt
t

dNs
= rt + αBt (B0 = 0)
Ns


0

Sử dụng công thức Itô cho hàm g (t, x) = lnx, x > 0
1


1
2
1

1

(dNt )2
Nt
Nt2
dNt
=
α2 Nt2 dt

Nt
2Nt2
dNt 1 2
− α dt
=
Nt
2

d(lnNt ) =

dNt + (−

Suy ra
dNt
1
= d(lnNt ) + α2 dt

Nt
2

Vì vậy
t

1
(d(lnNs ) + α2 ds) = rt + αBt
2

0

hay
ln

Nt
1
= (r − α2 )t + αBt
N0
2

1
2

Nt = N0 exp((r − α2 )t + αBt )

10


Ví dụ 1.2 Tìm điện tích trong mạch điện

Điện tích Q(t) ở thời điểm t tại một điểm cố định trong mạch điện thoả mãn phương
trình vi phân ngẫu nhiên
1

LQ (t) + RQ (t) +

(1.5)

Q(t) = G(t) + αWt
C
Q(0) = Q0 ; Q (0) = I0

(1.6)

trong đó L là cảm ứng, R là điện trở, C là điện dung, Wt là nhiễu trắng và G(t) + αWt
là nguồn điện thế tại thời điểm t
Xác định điện tích của mạch điện Q(t)?
Giải
Ta đưa vào véc tơ

X1
X2

X = X (t, ω ) =

=

Qt
Qt


do đó
X1 = X2
LX2 = −RX2 −

1
C X1

+ Gt + αWt

hoặc dưới dạng ma trận
dX = AXdt + Hdt + KdBt

trong đó
dX =

dX1
dX2

A=

0
1
− CL

1


R
L


Ht =

0
− L1 Gt

K=

0
α
L

và Bt là chuyển động Brownian 1-chiều
Vì vậy ta có phương trình vi phân ngẫu nhiên 2-chiều
Nhân cả hai vế của phương trình trên với exp(−At) ta có
exp(−At)dX = exp(−(At)AXdt + exp(−At)[Ht dt + KdBt ]
hay
exp(−At)dX − exp(−(At))AXdt = exp(−At)[Ht dt + KdBt ]
Xét vế trái exp(−At)dX − exp(−(At))AXdt Sử dụng công thức Itô cho hàm g =
(g1 , g2 ) : [0, ∞) × R2 → R2 xác định bởi
g (t, x1 , x2 ) = exp(−At)

x1
x2

ta được
d(exp(−At)X ) = −A exp(−At)Xdt + exp(−At)dX

11



Khi đó ta có
t

exp(−At)X − X0 =

t

exp(−As)Hs ds +
0

exp(−As)KdBs
0

Sử dụng tích phân từng phần ta có
t

X = exp(At)[X0 + exp(−At)KBt ] +

exp(−As)[Hs + AKBs ]ds
0

Ví dụ 1.3 Chuyển động Brown trên vòng tròn đơn vị
Cho X = B là chuyển động Brown 1-chiều và g (t, x) = eix = (cos x, sin x) ∈ R2 với
x ∈ R. Khi đó hãy chứng minh
Y = (Y1 , Y2) = g (t, X ) = eiB = (cos B, sin B )

là chuyển động Brown trên vòng tròn đơn vị Y12 + Y22 = 1.
Giải
Theo công thức Itô:
dY1 = − sin B.dB − 21 cos Bdt


dY2 = cos B.dB − 21 sin Bdt

Như vậy quá trình 2-chiều Y = (Y1 , Y2 ) mà ta gọi là chuyển động Brown trên vòng
tròn đơn vị (Y12 + Y22 = 1) là nghiệm của phương trình vi phân ngẫu nhiên
dY1 = − 12 Y1 dt − Y2 dB

dY2 = − 21 Y2 dt + Y1 dB

hoặc dưới dạng ma trận
1
2

dY = − Y dt + KY dB

trong đó
K=

0 −1
1 0

Ví dụ 1.4 Với Bt là chuyển động Brownian 1-chiều. Hãy kiểm tra xem quá trình sau
có phải là nghiệm của phương trình vi phân tương ứng không?
(i)Xt = eBt và dXt = 12 Xt dt + Xt dBt
Bt
1
1
(ii)Xt = 1+t
; B0 = 0 và dXt = − 1+t
Xt dt + 1+t

dBt ; X0 = 0
π π
(iii)Xt = sin Bt với B0 = a ∈ (− 2 , 2 ) và dXt = − 12 Xt dt + 1 − Xt2 dBt
(iv )(X1 (t), X2 (t)) = (t, et Bt ) và
dX1
dX2

=

1
X2

dt +

12

0
eX1

dBt


Giải
(i). Chọn Yt = Bt → dYt = dBt
Sử dụng công thức Itô cho hàm g (t, y ) = ey
dXt =

∂g
∂g
1 ∂2g

(t, Xt )dt + (t, Xt )dYt +
(t, Yt )(dYt )2
∂t
∂y
2 ∂y 2

Trước hết ta tính
∂g
∂g
∂2g
= 0,
= ey , 2 = ey , (dYt )2 = dt
∂t
∂y
∂y

Khi đó
dXt =

1 Yt
e dt + eYt dYt
2

dXt =

1
X dt + Xt dBt
2 t

Vậy quá trình đó là nghiệm của phương trình vi phân tương ứng.

(ii) Chọn Yt = Bt → dYt = dBt
y
Sử dụng công thức Itô cho hàm g (t, y ) =
1+t
dXt =

∂g
∂g
1 ∂2g
(t, Yt )dt + (t, Yt )dYt +
(t, Yt )(dYt )2
∂t
∂y
2 ∂y 2

∂g
∂g
1
1 ∂2g
;
= −Yt
=
;
= 0, (dYt )2 = dt
∂t
1 + t ∂y 2
(1 + t)2 ∂y

dXt = −


1
Yt
1
dYt
dt +
1+t
(1 + t) (1 + t)

dXt = −

1
1
dBt
Xt dt +
1+t
(1 + t)

(iii) Chọn Yt = Bt , dYt = dBt Sử dụng công thức Itô cho hàm g (t, y ) = sin y
dXt =

∂g
1 ∂2g
∂g
dt +
(t, Yt )dYt +
(t, Yt )(dYt )2
∂t
∂x
2 ∂x2


Tính các đại lượng
∂g
∂g
∂2g
= 0;
= cos y ; 2 = − sin y ; (dYt )2 = dt
∂t
∂y
∂y

13


Khi đó
1
2

dXt = − sin Yt dt + cos Yt dYt

1
2

dXt = − Xt dt +

1 − Xt2 dBt

Vậy quá trình đó là nghiệm của phương trình vi phân tương ứng.
(iv ) Sử dụng công thức Itô cho hàm g (t, y ) = (g1 , g2 ) = (t, et Bt ). Khi đó
dXk =


∂gk
(t, Xt )dt +
∂t

1
∂gk
dYi +
∂yi
2

i

i,j

∂ 2 gk
dYi dYj
∂yi ∂yj

∂2g
∂g
∂ 2 g1
∂2g
∂g
∂g1
= 0; 21 = 0; 21 = 0
= 1; 1 = 0; 1 = 0;
∂t
∂y1
∂y2
∂y1 ∂y2

∂y1
∂y2
∂2g
∂g
∂g
∂ 2 g1
∂2g
∂g2
= et Y2 ; 2 = 0; 2 = et ;
= 0; 21 = 0; 21 = 0
∂t
∂y1
∂y2
∂y1 ∂y2
∂y1
∂y2

Do đó
dX1 = dt
dX2 = X2 dt + eX1 dBt

hay
dX =

dX1
dX2

=

1

X2

dt+

0
eX1

dBt

Vậy quá trình đó là nghiệm của phương trình vi phân tương ứng.
Ví dụ 1.5 Chuyển động Brownian trên Ellipse
{(x, y );

x2
y2
+
= 1}
a2
b2

là quá trình ngẫu nhiên Xt = (X1 (t), X2 (t) xác định bởi X1 (t) = a cos Bt , X2 (t) =
b sin Bt . Trong đó Bt là chuyển động Brownian 1-chiều.
Chứng minh rằng Xt là nghiệm của phương trình vi phân ngẫu nhiên
1
2

dXt = − Xt dt + MXt dBt

trong đó



a
0 −
b
M=b
0
a

14


Giải
Chọn Yt = Bt
Sử dụng công thức Itô cho hàm g (t, y ) = (g1 , g2 ) với g1 = a cos y ; g2 = b sin y . Khi đó
1
2
1
dX2 = b cos Yt dYt − b sin Yt dt
2

dX1 = −a sin Yt dYt − a cos Yt dt

do đó
dXt = −

hay

1 a cos Yt
2 b sin Yt



a
0 −
b  a cos Yt dY
dt+ b
t
b sin Yt
0
a

1
2

dXt = − Xt dt + MXt dBt

Vậy Xt = (a cos Bt , b sin Bt )T là nghiệm của phương trình vi phân
1
2

dXt = − Xt dt + MXt dBt

trong đó


a
0 −
b
M=b
0
a


15


Chương 2

Bài toán lọc
2.1

Đặt vấn đề

Để biết nghiệm Q(s) của bài toán, chúng ta thực hiện quan sát Z (s) của Q(s) tại thời
điểm s ≤ t. Tuy nhiên chúng ta không thể quan sát chính xác Q(s) mà chỉ biết dạng
của nó là:
Z (s) = Q(s) + "ồn trắng"

(2.1)

Bài toán đặt ra : Tìm ước lượng tốt nhất của Q(t) trên cơ sở quan sátZs trong công
thức (2.1) với s ≤ t? Bài toán như vậy gọi là bài toán lọc. Bằng trực giác, bài toán
đó là bài toán lọc tiếng ồn từ các quan sát một cách tối ưu.

2.2
2.2.1

Bài toán lọc tổng quát
Phát biểu bài toán lọc tổng quát

Một hệ thống Xt mà sự tiến triển chúng mô tả bởi phương trình:
dXt = b(t, Xt ) + σ (t, Xt )dUt


Khi tiến hành quan sát chúng ta nhận được phương trình quan sát:
dZt = c(t, Xt )dt + γ (t, Xt )dVt ; Z0 = 0

(*)

trong đó Ut , Vt là chuyển động Brownian.
Giả sử có quan sát Zs xác định bởi phương trình (*). Hãy tìm ước lượng tốt nhất
0≤s≤t

ˆt của trạng thái Xt dựa trên các quan sát này?
X
ˆt là một hàm của các quan sát sao cho:
Như vậy X
ˆ
1. Xt được đặt cơ sở trên các quan sát ( Zs ; s ≤ t ) nghĩa là Xt (.)là Gt -đo được với
Gt là σ -đại số sinh ra bởi ( Zs ; s ≤ t )

16


ˆt là ước lượng tốt nhất theo nghĩa trung bình bình phương tức là:
2. X
ˆt |2 dP = E[|Xt − Xˆt |2 ] = inf {E[|Xt − S|2 ]; S ∈ K}
|Xt − X

(2.2)




trong đó
K := K(Z, t) := (S : Ω → Rn ; S ∈ L2 (P ) và S là Gt -đo được)

2.2.2

(2.3)

Giải bài toán lọc tổng quát

Định lý 2.1 Nghiệm của bài toán lọc tổng quát xác định bởi:
ˆt = PK (Xt ) = E[Xt |Gt ]
X
Chứng minh
Trước hết ta xét bổ đề sau:
Bổ đề 2.1 Cho H ⊂ F là một σ -đại số và X∈ L2 (P ) là F -đo được. Đặt N = (S ∈
L2 (P ) S là H- đo được) và cho PN là phép chiếu từ không gian Hilbert L2 (P ) vào
không gian con N . Khi đó
PN (X ) = E[X|H]

(2.4)

Chứng minh bổ đề
- E[X|H] là hàm được xác định duy nhất từ Ω → R thoả mãn:
1. E[X|H] là H-đo được.
2. E[X|H]dP = XdP với mọi A ∈ H
A

A

Thật vậy:

Sự tồn tại và duy nhất của E[X|H suy từ định lý Radon-Nikodym: Cho µ là độ đo
trên H xác định bởi µ(A) = XdP, A ∈ H
A

Khi đó µ là liên tục tuyệt đối. Do đó tồn tại duy nhất hàm dạng P |H và H đo được
F trên Ω thoả mãn:
µ(A) = F dP với mọi H ∈ H
A

Vì vậy E[X|H] = F là hàm tồn tại duy nhất theo độ đo P |H.
- PN (X ) là H-đo được và S (X − PN (X ))dP = 0, ∀S ∈ N


Thật vậy:
PN là phép chiếu L2 (P ) vào N . Khi đó ∀X ∈ L2 (P ) có thể biểu diễn duy nhất:
X = X1 + X2 với X1 = PN (X ) ∈ N và X2 ∈ N ⊥ (phần bù trực giao)
Do đó X1 là F -đo được và
S (X − PN (X ))dP = 0, ∀S ∈ N


Trong trường hợp riêng lấy S = IA , A ∈ F
17


A

hay

(X − PN (X ))dP = 0, ∀A ∈ H
XdP =


A

A

PN (X )dP, ∀A ∈ H

Theo định nghĩa kỳ vọng điều kiện
PN (X ) = E[X|F ]
Chứng minh định lý
Theo lý thuyết không gian Hilber chúng ta thấy nghiệm của bài toán lọc cho bởi
ˆ = PKt (Xt )
X
Mặt khác theo bổ đề 1 ta có
PKt (Xt ) = E[Xt |Gt ]
Do đó

ˆt = PKt (Xt ) = E[Xt |Gt ].
X
Thực tế chúng ta thường gặp bài toán lọc mà phương trình hệ thống và quan sát
ở dạng phương trình vi phân ngẫu nhiên tuyến tính. Bài toán đó là bài toán lọc tuyến
tính hay bài toán lọc Kalman-Bucy

2.3

Bài toán lọc Kalman-Bucy

Vào năm 1960 Kalman và năm 1961 Kalman và Bucy đưa ra bài toán lọc Kalman
-Bucy. Nội dung của bài toán là đưa ra thủ tục để ước lượng trạng thái của hệ thống
được biểu diễn nhiễu dạng phương trình vi phân ngẫu nhiên trên cơ sở của quan sát

nhiễu. Ngay lập tức nó được mang ứng dụng vào các ngành khoa học khác và ngày
nay nó đã ứng dụng rộng rãi. Vì vậy bài toán lọc Kalman-Bucy đã được chứng tỏ là
rất hữu ích.

2.3.1

Phát biểu bài toán

Bài toán lọc Kalman-Bucy
Phương trình hệ thống, quan sát của bài toán lọc có dạng:
Phương trình hệ thống: dXt = F (t)Xt dt + C (t)dUt ; F (t) ∈ Rn×n , C (t) ∈ Rn×p
Phương trình quan sát: dZt = G(t)Xt dt + D(t)dVt ; G(t) ∈ Rm×n, D(t) ∈ Rm×r
ˆt của Xt dựa trên các quan sát này?
Hãy tìm ước lượng tốt nhất X
Để đơn giản chúng ta chỉ xét trường hợp 1-chiều:
Bài toán lọc Kalman-Bucy 1-chiều
Phương trình hệ thống, quan sát của bài toán lọc có dạng:
Phương trình hệ thống: dXt = F (t)Xt dt + C (t)dUt ; F (t), C (t) ∈ R
Phương trình quan sát: dZt = G(t)Xt dt + D(t)dVt ; G(t), D(t) ∈ R
ˆt của Xt dựa trên các quan sát này?
Hãy tìm ước lượng tốt nhất X
Chúng ta giả thiết rằng F, G, C, D là hàm bị chặn trong khoảng bị chặn và Zt =
t

Hs ds; Z0 = 0. X0 có phân phối chuẩn độc lập với Ut , Vt và D (t) bị chặn, khác 0 trên

0

khoảng bị chặn.
18



2.3.2

Giải bài toán lọc Kalman-Bucy

Các bước để giải bài toán lọc Kalman-Bucy
Bước 1
Cho L = L(Z, t) là bao kín trong L2 (Ω) của các tổ hợp tuyến tính dạng
c0 + c1 .Zs1 (ω ) + ... + ck .Zsk (ω ), sj ≤ t, cj ∈ R

(2.5)

Cho PL là phép chiếu từ L2 (Ω) lên L. Khi đó với K xác định như (2.3) thì
ˆt = PK (Xt ) = E[Xt |Gt ] = PL (Xt )
X

(2.6)

Vì vậy ước lượng tốt nhất Z - đo được của Xt trùng với ước lượng Z -tuyến tính
tốt nhất của Xt .
Bước 2
Thay Zt bằng quá trình đổi mới Nt :
t

Nt = Zt −

0

ˆs

(GX )∧s ds trong đó (GX )∧s = PL(N,t) (G(s)Xs ) = G(s)X

(2.7)

Khi đó:
(i)Nt có số gia trực giao tức là E[(Nt1 − Ns1 )(Nt2 − Ns2 ] = 0 với [s1 , t1 ] ∩ [s2 , t2 ] = ∅
ˆt = PL(N,t) (Xt )
(ii)L(N, t) = L(Z, t), ví vậy X
Bước 3
1
Đặt dRt = [D2 (t)]− 2 dNt
Khi đó Rt là chuyển động Brownian 1-chiều.
Hơn nữa L(N, t) = L(R, t)
t


E[Xt Rs ]dRs
∂s

ˆt = PL(N,t) (Xt ) = PL(R,t) (Xt ) = EXt +
X
0

Bước 4
Biểu diễn Xt bằng phương trình vi phân ngẫu nhiên
dXt = F (t)Xt dt + C (t)dUt
Bước 5
Thay công thức Xt từ bước 4 vào E[Xt Rs ] và sử dụng bước 3 nhận được phương
ˆt là:
trình vi phân ngẫu nhiên của X

t

ˆt = ∂ E[Xt Rs ]s=t dRt + (
dX
∂s

∂2
E[Xt Rs ]dRs )dt
∂t∂s

0

Định lý 2.2 (Lọc Kalman-Bucy 1-chiều)
ˆ t = E[Xt |Gt ] của bài toán lọc tuyến tính 1-chiều được xác định bởi phương
Nghiệm X
trình vi phân ngẫu nhiên:
ˆt = (F (t) −
dX

G(t)S (t)
G2 (t)S (t) ˆ
)Xt dt +
dZt
2
D (t)
D 2 (t)

ˆ0 = E[X0 ]
X


(2.8)
(2.9)

19


trong đó:
ˆt )2 ] xác định bởi phương trình Ricacti:
S (t) = E[(Xt − X
dS
G2 (t)S 2 (t)
= 2F (t)S (t) −
+ C 2 (t)
dt
D 2 (t)
S (0) = E[(X0 − E[X0 ])2 ].

Chứng minh
Chúng ta sẽ chứng minh định lý 2.2 thông qua 5 bước:
Bước 1: Ước lượng Z-tuyến tính và Z-đo được
Bổ đề 2.2 Cho X, Zs ; s ≤ t là biến ngẫu nhiên trong L2 (P ).
Giả sử (X, Zs1 , Zs2 , ...Zsn ) ∈ Rn+1 có phân phối chuẩn với mọi s1 , s2 , ...sn ≤ t, n ≥ 1.
Khi đó:
PL (X ) = E[X|G ] = PK (X )
ˆ = PL (X ), X = X − X
ˆ
Chứng minh Đặt X
Như chúng ta đã biết: Véc tơ (Y1 , Y2 , ...Yk ) ∈ Rk là chuẩn nếu và chỉ nếu tổ hợp tuyến
tính c1 Y1 + c2 Y2 + ... + ck Yk là chuẩn với mọi c1 , c2 , c3 , ...ck và giới hạn trong L2 của dãy
các biến ngẫu nhiên chuẩn là chuẩn.

Do đó
(X , Zs1 , ..., Zsn ) là chuẩn với mọi s1 , s2 , ..., sn ≤ 1.
Do E[X Zsj ] = 0, X và Zsj không tương quan với mọi 1 ≤ j ≤ n.
Khi đó
X và (Zs1 , ..., Zsn ) độc lập.
Vì vậy
X độc lập với họ G .
Khi đó
ˆ )] = E[χG X ] = E[χG ]E[X ] = 0 với mọi G ∈ G
E[χG (X − X
ˆ
hay XdP = XdP
G

G

ˆ là G - đo được ta kết luận X
ˆ = E[X|G ].
Do X
Như vậy
PL (X ) = E[X|G ] = PK (X ).
Nhận xét: Ước lượng tốt nhất Z-tuyến tính trùng với ước lượng tốt nhất Z-đo được.
Bổ đề 2.3 Mt =

Xt
∈ R2 là quá trình Gaussian.
Zt

Chứng minh
Ta có thể giả sử rằng Mt là nghiệm của phương trình vi phân 2-chiều

dMt = H (t)M (t)dt + K (t)dBt , M0 =

20

X0

0

(2.10)


trong đó H (t) ∈ R2×2 , K (t) ∈ R2×2 và Bt là chuyển động Brownian 2-chiều.
Sử dụng dãy xấp xỉ Picard tìm nghiệm phương trình có dạng:
t
(n+1)
Mt

t
(n)
H (s)Ms ds +

= M0 +
0

K (s)dBs , n = 0, 1, 2, ...,

(2.11)

0


Khi đó Mt(n) là Gaussian mọi n và Mt(n) −→ Mt trong L2 (P ) và Mt là Gaussian.
Bước 2: Quá trình đổi mới
Kí hiệu L(Z, T ) là bao kín trong L2 (Ω) của tất cả tổ hợp tuyến tính
L(Z, T ) = {c0 + c1 Zt1 + ... + ck Ztk ; 0 ≤ ti ≤ T ; cj ∈ R}.
Bổ đề 2.4 L(Z, T ) = {c0 +

T
0

f (t)dZt ; f ∈ L2 [0, T ]; c0 ∈ R}

Chứng minh
Ký hiệu N (Z, T ) = {c0 +

T
0

f (t)dZt ; f ∈ L2 [0, T ]; c0 ∈ R}. Ta cần chứng minh:

a. N (Z, T ) ⊂ L(Z, T ).
b. N (Z, T ) chứa tất cả các tổ hợp tuyến tính có dạng:
c0 + c1 Zt1 + ... + ck Ztk ; 0 ≤ ti ≤ T
2
c. N (Z, T ) đóng trong L (P ).

.

Thật vậy
a. Ta có


T

f (t)dZt = lim

n→∞ j

0
T

⇒ c0 +

f (j 2−n )(Z(j+1).2−n − Zj.2−n )

f (t)dZt là giới hạn tổ hợp tuyến tính của(Zt1 , ...Ztk )

0

Do đó c0 +

T
0

f (t)dZt ∈ L(Z, T ) hay N (Z, T ) ⊂ L(Z, T ).

b. Giả thiết rằng 0 ≤ t1 ≤ t2 ≤, ..., ≤ tk ≤ T . Khi đó:
k

k−1

cj Z t j =

j=1

j=0

c,j

k−1 tj+1

Zj =
j=0 tj

c,j dZt =

T k−1

(
0 j=0

c,j χ[tj ,tj+1 ] (t)dZt

trong đó Zj = Ztj+1 − Ztj
Do đó L(Z, T ) ⊂ N (Z, T ).
c. Ta có bất đẳng thức:
T

T

f 2 (t)dt ≤ E[(

A0

0

T

f (t)dZt )2 ] ≤ A1
0

f 2 (t)dt
0

21

(2.12)


Thật vậy:
Với f ∈ L2 (P ) ta có:
T

T

f (t)dZt )2 ] = E[(

E[(
0

f (t)(G(t)Xt dt + D (t)dV t))2 ]
0
T


T

f (t)G(t)Xt dt)2 ] + E[(

= E[(
0

f (t)D (t)dVt )2 ]
0

T

+ 2E[(

T

f (t)G(t)X (t)dt(
0

f (t)D (t)dVt )]
0

Từ
T

T

f (t)G(t)Xt dt)2 ] ≤ A1

E[(

0

f 2 (t)dt (Bất đẳng thức Côsi)
0

T

T

f (t)dZt )2 ] =

E[(
0

f 2 (t)D 2 (t)dt (Tính đẳng cự Itô)
0

và {Xt }, {Vt } độc lập, chúng ta kết luận rằng:
T

T

f 2 (t)dt ≤ E[(

A0
0

T

f (t)dZt )2 ] ≤ A1

0

f 2 (t)dt
0

Đồng thời L2 [0, T ] là không gian đầy đủ. Vì vậy N (Z, T ) đóng trong L2 (P ).
Định nghĩa về quá trình đổi mới Nt
t

(GX )∧s ds

Nt = Zt −

(2.13)

0

trong đó (GX )∧s = PL(Z,s) (G(s)Xs ) = G(s)Xˆs
Hay
ˆt )dt + D(t)dVt
dNt = G(t)(Xt − X
Bổ đề 2.5 Với Nt xác định như trên ta có:
1. Nt có số gia trực giao.
22

(2.14)


2. E[Nt2 ] =


t

D 2 (s)ds.

0

3. L(N, t) = L(Z, t) Với mọi t ≥ 0.
4. Nt là quá trình Gaussian.
Chứng minh
1 . Nếu s ≤ t và Y ∈ L(Z, s) ta có:
t

t

ˆr )dr +
G(r )(Xr − X

E[(Nt − Ns )Y ] = E[(
s

D (r )dVr )Y ]
s

t

t

ˆr )Y ]dr + E[(
G(r )E[(Xr − X


=
s

DdV )Y ]
s

ˆr ⊥ Y và V có số gia độc lập)
= 0 (Vì Xr − X
Do đó Nt có số gia trực giao.
2 . Sử dụng công thức Ito cho hàm g (t, x) = x2 ta có:
1
2

d(Nt2 ) = 2Nt dNt + 2(dNt )2 = 2Nt dNt + D 2 dt

Do đó:
t

E[Nt2 ]

= E[

t

D 2 (s)ds

2Ns dNs ] +
0

0


Mặt khác:
t

Ntj [Ntj+1 − Ntj ]

Ns dNs = lim

tj →0

0
t

Ns dNs ] = E[ lim

E[

tj →0

0

=

Ntj [Ntj+1 − Ntj ]]

E[Ntj [Ntj+1 − Ntj ]]

lim

tj →0


= 0 (do Nt có số gia trực giao.)
Vậy
t

E[Nt2 ] =

D 2 (s)ds
0

23


×