Tải bản đầy đủ (.pdf) (49 trang)

Xấp xỉ ngẫu nhiên và một số ứng dụng : Luận văn ThS. Toán học: 60 46 15

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (578.05 KB, 49 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-------------------

NGÔ THỊ TOÁN

XẤP XỈ NGẪU NHIÊN VÀ MỘT SỐ ỨNG DỤNG

LUẬN VĂN THẠC SĨ KHOA HỌC

Hà Nội – Năm 2011


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-------------------

NGÔ THỊ TOÁN

XẤP XỈ NGẪU NHIÊN VÀ MỘT SỐ ỨNG DỤNG
Chuyên ngành: Lý thuyết xác suất và thống kê toán học
Mã số:

60 46 15

LUẬN VĂN THẠC SĨ KHOA HỌC

NGƯỜI HƯỚNG DẪN KHOA HỌC:
TS. NGUYỄN HỮU TIẾN

Hà Nội – Năm 2011




Mục lục
Lời nói đầu

1

Lời cảm ơn

3

Chương 1. Xấp xỉ ngẫu nhiên cho trường hợp một chiều

6

1.1. Khái niệm mở đầu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2. Xấp xỉ ngẫu nhiên cho trường hợp một chiều . . . . . . . . . . . . . . . . . . . . . . .

7

1.2.1. Thuật toán Robbins-Monro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2.2. Thuật toán Kiefer-Wolfowitz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

14

1.2.3. Thuật toán Dvozetky . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Chương 2. Xấp xỉ ngẫu nhiên cho trường hợp nhiều chiều

21


2.1. Thuật toán Robbins-Monro trong không gian n-chiều . . . . . . . . . . . . . . . 21
2.1.1. Nội dung thuật toán . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.1.2. Đánh giá cận trên của sai số trung bình bình phương . . . . . . . . . . . . 22
2.2. Thuật toán Dvozetky trong không gian n-chiều . . . . . . . . . . . . . . . . . . . . . 28
Chương 3. Một số ứng dụng của xấp xỉ ngẫu nhiên

30

3.1. Ứng dụng của xấp xỉ ngẫu nhiên trong ước lượng có định hướng
quyết định . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.2. Ứng dụng của xấp xỉ ngẫu nhiên vào ước lượng tham số . . . . . . . . . . . . . 34
3.3. Ứng dụng của xấp xỉ ngẫu nhiên vào ước lượng hàm phân biệt . . . . . . . 37
3.4. Ứng dụng của xấp xỉ ngẫu nhiên trong các hàm thế . . . . . . . . . . . . . . . . . 41
4


3.5. Ứng dụng của xấp xỉ ngẫu nhiên trong ước lượng hàm mật độ
xác suất . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.5.1. Xấp xỉ tuyến tính . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.5.2. Ước lượng và xấp xỉ cho hàm mật độ trộn chuẩn . . . . . . . . . . . . . . . . 45
Kết luận

49

Tài liệu tham khảo

50

5



Chương 1

Xấp xỉ ngẫu nhiên cho trường
hợp một chiều
1.1

Khái niệm mở đầu

Giả sử µ(x) là một hàm số có nghiệm duy nhất là x = θ nhưng dạng giải tích
của hàm số này chưa biết. Tuy nhiên với mỗi giá trị x, giả sử tồn tại một biến
ngẫu nhiên ξ (x) có hàm mật độ xác suất f (ξ |x) sao cho:
µ(x) = Eξ [ξ (x)] =

ξ (x) f (ξ |x)dξ

(1.1)

Ωξ

hay µ(x) được biểu diễn dưới dạng kì vọng có điều kiện của biến ngẫu nhiên ξ
khi giả thiết x cho trước.
Hàm µ(x) như thế được gọi là hàm hồi quy.
Việc tìm nghiệm hoặc tìm giá trị lớn nhất, nhỏ nhất của hàm hồi quy khi dạng
giải tích của hàm này chưa biết sẽ là đối tượng nghiên cứu của phương pháp xấp
xỉ ngẫu nhiên.
Trong luận văn ta sẽ sử dụng kí hiệu x; x1 ; x2 ; . . . cho các tham biến, ω;t cho các
yếu tố ngẫu nhiên đã được quan sát và ξ cho ước lượng không chệch của µ(x)
hay Eξ = µ(x). Để đơn giản ta quy ước sẽ sử dụng ξ thay cho ξ (x, ω) và ξn
thay cho ξ (xn , ω) ...


6


Chương 1. Xấp xỉ ngẫu nhiên cho trường hợp một chiều

1.2

Xấp xỉ ngẫu nhiên cho trường hợp một chiều

1.2.1

Thuật toán Robbins - Monro

Trong mục này chúng ta sẽ giải quyết bài toán tìm nghiệm của một phương trình
hàm hồi quy cho trường hợp một chiều. Không mất tính tổng quát ta có thể giả
thiết là chỉ cần tìm thuật toán xác định nghiệm của phương trình sau:
µ(x) = 0

(1.2)

Thật vậy, nếu phải tìm nghiệm của phương trình dạng
µ(x) = α

(1.3)

trong đó α là một hằng số thực cho trước.
Khi đó, ta đặt µ(x) := µ(x) − α thì lời giải cho bài toán (1.3) sẽ có thể xác định
từ thuật toán giải bài toán (1.2).
Bây giờ ta xét việc giải phương trình hồi quy (1.2) và có nhận xét là nếu hàm hồi

quy µ(x) đã cho trước thì nghiệm của phương trình (1.2) sẽ được xác định bởi
các thuật toán đã xét ở giải tích số chẳng hạn bởi phương pháp lặp Newton. Vấn
đề đặt ra ở đây là hàm hồi quy µ(x) chưa biết nên để tìm nghiệm của phương
trình hồi quy (1.2), ta cần giả thiết thêm là ứng với mỗi giá trị xác định x = xn
ta thu được một quan sát không chệch cho µ(xn ) là ξn với ∀n ∈ N. Khi đó, thuật
toán tìm nghiệm xấp xỉ cho phương trình hồi quy (1.2) được Robbins - Monro
đề xuất sẽ có dạng sau:
xn+1 = xn − an ξn
(1.4)
trong đó {an } là một dãy số thực được chọn trước thích hợp và dãy đó được gọi
là dãy số hiệu chỉnh.
Kết quả sau đây xác định các điều kiện đủ để thuật toán Robbins - Monro xác
định ở (1.4) hội tụ.
Định lý 1.2.1. Giả sử các điều kiện sau thỏa mãn:
• x1 là một biến ngẫu nhiên tùy ý sao cho E[x12 ] < ∞ và dãy biến ngẫu nhiên
x1 ; x2 ; . . . ; xn ; . . . là các biến ngẫu nhiên độc lập cùng phân phối được xác
định từ thuật toán Robbins - Monro (1.4) trong đó ξn là quan sát không
chệch về hàm hồi quy µ(x) tại x = xn hay E(ξn ) = µ(xn ).
• {an } là một dãy số hiệu chỉnh được chọn trước sao cho




∑ an = ∞; ∑ a2n < ∞

n=1

n=1

7


(1.5)


Chương 1. Xấp xỉ ngẫu nhiên cho trường hợp một chiều

• Tồn tại các hằng số dương 0 < M1 ≤ M2 < ∞ sao cho hàm hồi quy µ(x)
thỏa mãn
M1 (x − θ )2 ≤ µ(x)(x − θ ) ≤ M2 (x − θ )2
(1.6)

[ξ − µ(x)]2 f (ξ |x)dξ ≤ α 2 < ∞

Var[ξ ] =

(1.7)

Ωξ

Khi đó thuật toán Robbins - Monro (1.4) sẽ hội tụ theo trung bình bình phương
về nghiệm θ của phương trình hồi quy (1.2) hay lim E|xn − θ |2 = 0
n→∞

Trước khi chứng minh định lý, ta có một số các nhận xét sau đây về các giả
thiết hội tụ của định lý:
Nhận xét 1. Ta cần chú ý như sau:
• Giả thiết (1.6) cho ta biết hàm µ(x) phải nằm giữa hai đường thẳng có hệ số
góc dương là M1 và M2 tương ứng. Hai đường thẳng này cắt nhau tại x = θ
và điều này đảm bảo cho sự tồn tại nghiệm θ của phương trình (1.2).
• Giả thiết (1.7) có nghĩa là quan sát không chệch của hàm hồi quy có phương

sai hữu hạn.
• Giả thiết (1.5) về dãy hiệu chỉnh {an } được hiểu như sau: do tính ngẫu nhiên
của các quan sát ξn nên hệ số hiệu chỉnh an phải tiến đến 0 khi n tiến ra vô
cùng nếu không thì thuật toán sẽ giao động quanh θ và không bao giờ hội
tụ về giá trị θ này. Mặt khác sự hội tụ về 0 của an cần duy trì ở mức không
quá nhanh nhằm loại trừ khả năng giá trị xấp xỉ xn quẩn quanh nghiệm θ
chứ không tiến dần về nghiệm này. Thật vậy, do thuật toán (1.4) sử dụng
ước lượng không chệch của hàm hồi quy là ξn thay cho giá trị đúng của nó
là µ(xn ) nên thuật toán (1.4) cần đảm bảo rằng quan sát ξn được sử dụng
nhiều lần để ảnh hưởng của nó loại trừ khả năng trên và điều này sẽ được
bảo đảm nếu dãy hiệu chỉnh {an } hội tụ về 0 không quá nhanh. Giả thiết
(1.5) chính là nhằm bảo đảm cho hai điều kiện trên thỏa mãn.
• Việc định nghĩa hàm hồi quy như (1.1) đã nói lên rằng các hàm mật độ
f (ξn |xn ) có cấu trúc hàm giống nhau cho tất cả các n vì vậy, giả thiết về
tính độc lập cùng phân phối của các x1 ; x2 ; . . . ; xn ; . . . sẽ bảo đảm cho điều
kiện nêu trên thỏa mãn.
• Cuối cùng, ta lưu ý rằng giả thiết độc lập cùng phân phối nêu trên có thể
được giảm nhẹ nếu ta thay giả thiết này bởi giả thiết về sự phụ thuộc yếu
của các quan sát ξn vào x1 ; . . . ; xn hay có thể giả thiết ξn có phân phối xác
8


Chương 1. Xấp xỉ ngẫu nhiên cho trường hợp một chiều

suất có điều kiện chỉ phụ thuộc vào kết quả xấp xỉ thứ n là xn chứ không
phụ thuộc trực tiếp vào kết quả xấp xỉ x1 ; . . . ; xn−1 trước đó. Tuy nhiên, để
các chứng minh được dễ hiểu hơn, chúng ta vẫn dùng các giả thiết về sự độc
lập cùng phân phối của các biến ngẫu nhiên x1 ; . . . ; xn ; . . .
Bây giờ ta bắt đầu chứng minh định lý 1.2.1.
Chứng minh. Từ (1.4) ta có:

[xn+1 − θ ]2 = [xn − θ ]2 − 2an ξn (xn − θ )
+ a2n ξn2

(1.8)

2

Đặt Vn := E xn − θ thì Vn gọi là sai số trung bình bình phương của xấp xỉ xn
cho θ
Lấy kỳ vọng hai vế của (1.8) ta được
Vn+1 = Vn − 2an E ξn (xn − θ ) + a2n E ξn2

(1.9)

Theo tính chất kỳ vọng có điều kiện và các giả thiết độc lập, giả thiết (1.6); (1.7)
ta có:
E ξn .(xn − θ ) = E µ(xn ).(xn − θ )
≥ E M1 (xn − θ )2 = M1Vn
E ξn2 = E µ 2 (xn ) +Varξn
≤ E M22 (xn − θ )2 + α 2
= M22Vn + α 2
Khi đó, (1.9) trở thành:
Vn+1 ≤ (1 − 2M1 an + M22 a2n )Vn + a2n α 2

(1.10)

Theo nhận xét trên thì an −→ 0 khi n −→ ∞ nên với ε bất kỳ, 0 ≤ ε < 2 sẽ tồn
tại một số m = m(ε) sao cho với mọi n ≥ m ta có:
1 − 2M1 an + M22 a2n ≤ 1 − (2 − ε)M1 an
0 < 1 − (2 − ε)M1 an ≤ 1

9

(1.11)


Chương 1. Xấp xỉ ngẫu nhiên cho trường hợp một chiều

Khi đó bất đẳng thức (1.10) trở thành:
Vn+1 ≤ Vn 1 − (2 − ε)M1 an + a2n α 2 ,

∀n ≥ m

(1.12)

Ta có thể biểu diễn (1.12) một cách truy hồi như sau:
Vm+1 ≤ Vm 1 − (2 − ε)M1 am + a2m α 2
Vm+2 ≤ Vm+1 1 − (2 − ε)M1 am+1 + a2m+1 α 2
≤ Vm 1 − (2 − ε)M1 am 1 − (2 − ε)M1 am+1
+ α 2 a2m 1 − (2 − ε)M1 am+1 + a2m+1
...

Vn+1 ≤ Vm βm−1,n + α

2

n

∑ a2i βin;

n≥m


(1.13)

i=m

trong đó βin được định nghĩa như sau:




∏nj=i+1 [1 − (2 − ε)M1 a j ] nếu 0 ≤ i < n



βin = 1
nếu i = n





0
nếu i > n.
Áp dụng bất đẳng thức logarit
ln u ≤ u − 1,

u≥0

ta có:
ln[1 − (2 − ε)M1 ai ] ≤ −(2 − ε)M1 ai ,


i≥m

Do ∑∞
i=1 ai phân kỳ nên lim βm−1,n = 0 và do đó
n→∞

lim Vm βm−1,n = 0

n→∞

Lại có, βin = 0 khi i > m nên
α2

n

∑ a2i βin = α 2

i=m

10



∑ a2i βin

i=m

(1.14)



Chương 1. Xấp xỉ ngẫu nhiên cho trường hợp một chiều
2
Do 0 ≤ βin ≤ 1; ∀n; i và ∑∞
i=1 ai hội tụ tuyệt đối nên ta có thể chuyển qua giới
hạn vào tổng. Kết hợp với (1.14) ta thu được:

lim α

n→∞

2

n



a2i βin

= lim α

2

n→∞

i=m

= α2




∑ a2i βin

i=m



lim βin
∑ a2i n→∞

(1.15)

i=m

=0
Từ (1.13); (1.14); (1.15) ta có
lim Vn+1 = lim E xn+1 − θ

n→∞

n→∞

2

=0

Vậy thuật toán (1.4) hội tụ theo nghĩa trung bình bình phương. Định lý 1.2.1
được chứng minh xong.
Chú ý: Với các bài toán có hàm hồi quy không thỏa mãn điều kiện (1.6) với
mọi giá trị của x nhưng ta lại biết giá trị chân thực θ nằm trong một khoảng

[u1 ; u2 ] nào đó và (1.5) thỏa mãn với mọi x ∈ [u1 ; u2 ] thì ta sẽ sử dụng thuật toán
Robbins - Monro chặt cụt có dạng sau:
xn+1 = truncu1 ;u2 [xn − an ξn ]
trong đó




u1



truncu1 ;u2 (u) = u





u2

nếu u < u1
nếu u1 ≤ u ≤ u2
nếu u > u2 .

và hàm này được gọi là hàm chặt cụt. Thuật toán Robbins - Monro chặt cụt sẽ
hội tụ nếu các điều kiện còn lại của định lý 1.2.1 thỏa mãn.
Ta lưu ý là sai số trung bình bình phương Vn = E[xn − θ ]2 trong mỗi bước của
thuật toán rất khó thu được vì thuật toán là một quá trình truy hồi, chẳng hạn x2
phụ thuộc vào phân phối của x1 ; x3 lại phụ thuộc vào phân phối của x2 . . . . Cũng
bởi vậy nên sai số trung bình bình phương chỉ phù hợp cho mỗi cách chọn dãy

hiệu chỉnh an cụ thể. Dưới đây là một cận trên sai số trung bình bình phương do
Dvoretzky đưa ra.
Định lý 1.2.2. Giả sử tồn tại các số dương M1 ; M2 ; α 2 và V1 sao cho các
điều kiện (1.6); (1.7) trong định lý 1.2.1 và điều kiện sau thỏa mãn:
E ξn − µ(xn )|x1 , . . . , xn = 0
11

(1.16)


Chương 1. Xấp xỉ ngẫu nhiên cho trường hợp một chiều

2α 2
E[x1 − θ ] = V1 ≤
M1 (M2 − M1 )
2

(1.17)

Khi đó, tồn tại dãy hiệu chỉnh {an } xác định bởi:
an =

M1V1
α 2 + nM12V1

(1.18)

để sai số trung bình bình phương của thuật toán Robbins - Monro thỏa mãn:
Vn = E[xn − θ ]2 ≤


Chứng minh. Ta có: V1 ≤
⇒ α2 ≥

V1 M1 (M2 − M1 )
2

α 2V1
α 2 + (n − 1)M12V1

(1.19)

2α 2
M1 (M2 − M1 )

M1V1
2V1 M1

α 2 + nM12V1 V1 M1 (M2 − M1 ) + 2nM12V1
2M1
=
M1 (M2 − M1 ) + 2nM12
2

M2 + M1
Vì vậy có 0 ≤ an M1 ≤ 1
Lại có: xn+1 − θ = xn − θ − an µ(xn ) + an [µ(xn ) − ξn ]
Tương tự như trong chứng minh định lý 1.2.1 và từ các điều kiện (1.6), (1.7) và
(1.16) ta có:
⇒ an =


2

Vn+1 ≤ E xn − θ − an µ(xn ) + a2nVarξn
Vn + a2n α 2

2

≤ (1 − an M1 )

Ta sẽ chứng minh (1.19) bằng quy nạp.
Thật vậy: Với n = 1 thì V1 ≤ V1 (1.19) luôn đúng .
Giả sử (1.19) đúng với n, ta sẽ chứng minh đúng với n + 1

12

(1.20)


Chương 1. Xấp xỉ ngẫu nhiên cho trường hợp một chiều

Từ (1.20) và giả thiết quy nạp, ta có:
Vn+1 ≤ (1 − an M1 )2Vn + a2n α 2
α 2V1
+ a2n α 2
2
2
α + (n − 1)M1 V1
M12V1
M12V12 α 2
α 2V1

2
= (1 − 2
) .
+
α + nM12V1 α 2 + (n − 1)M12V1 (α 2 + nM12V1 )2
α 2V1
= 2
α + nM12V1
≤ (1 − an M1 )2 .

⇒ (1.19) đúng với n + 1.
Vậy định lý được chứng minh xong.
Nhận xét 2. Công thức (1.19) cho thấy tốc độ hội tụ của thuật toán Robbins Monro xét theo tiêu chuẩn sai số trung bình bình phương phụ thuộc vào cách
chọn dãy hiệu chỉnh{an }. Dãy {an } chọn trong định lý 1.2.2 là cách chọn gần tối
ưu với những n nhỏ. Tuy nhiên, ta lại quan tâm đến sự hội tụ của thuật toán khi n
d
rất lớn. Do đó ta có cách chọn dãy {an } như sau: Đặt M = M(θ ) = µ(x)|x=θ
dx
và M ≥ M1
• Nếu hàm hồi quy là tuyến tính thì ta chọn an =
Vn =

α2
nM 2

1
và với n đủ lớn thì
nM

• Nếu hàm hồi quy không tuyến tính thì do ta chỉ quan tâm sự tiệm cận của

xấp xỉ đến nghiệm θ nên dãy số hiệu chỉnh {an } sẽ được chọn ở dạng
1
α2
an =
và khi đó ta có lim nVn = 2
n→∞
nM
M
• Với một hàm hồi quy bất kỳ nhưng có các điều kiện của định lý 1.2.1 thỏa
a
mãn và Varξ (x) = α 2 thì ta chọn dãy hiệu chỉnh thỏa mãn an = với
n
xn − θ
2aM > 1. Khi đó, biến ngẫu nhiên √
có phân phối sẽ tiệm cận đến
n
phân phối chuẩn với kỳ vọng bằng 0 và phương sai thỏa mãn nE(xn − θ )2 =
α 2 a2
2aM − 1

13


Chương 1. Xấp xỉ ngẫu nhiên cho trường hợp một chiều

1.2.2

Thuật toán Kiefer - Wolfowitz

Bây giờ ta sẽ nghiên cứu việc tìm lời giải cho bài toán: Tìm giá trị của θ sao

cho tại x = θ hàm hồi quy µ(x) đạt cực đại hoặc cực tiểu. Không mất tính tổng
quát, chúng ta sẽ chỉ đi tìm điểm cực tiểu θ của µ(x), khi đó từ các kết quả của
giải tích ta suy ra θ phải là nghiệm của phương trình µ (x) = 0.
Ta có thể giải bài toán trên bằng cách sử dụng thuật toán Robbins - Monro để
tìm nghiệm của phương trình µ (x) = 0. Thật vậy, thuật toán để tìm điểm x = θ
∂ξ
mà tại đó µ (x) = 0 khi giả thiết hàm µ (x) chưa biết nhưng giả thiết tồn tại
∂x
tại mỗi x = xn theo Robbins - Monro có dạng sau:
xn+1 = xn − an


ξn |x=xn
∂x

Tuy nhiên, thuật toán Robbins - Moro không thể áp dụng được trong việc giải
bài toán tìm cực tiểu này. Sở dĩ như vậy vì:
• Hàm µ(x) chưa chắc đã khả vi. Hơn nữa biến ngẫu nhiên (∂ ξ /∂ x) có thể
không thỏa mãn điều kiện sau:
µ (x) =


∂ξ
Eξ = E
∂x
∂x

• Mặc dù chúng ta sẽ dễ dàng thu được ξ (x) từ các quan sát ứng với giá trị
∂ξ
của x nhưng sẽ không tính toán được giá trị của

.
∂x
Để vẫn tìm được lời giải xấp xỉ cho bài toán trên Kiefer - Wolfowitz giả thiết là
tại mỗi giá trị x = xn có thể thu được một quan sát không chệch cho giá trị µ (x)
từ các quan sát về hàm hồi quy µ(x) ở dạng sau:
ξ (xn + bn ) − ξ (xn − bn )
2bn
trong đó {bn } là dãy số dương có giới hạn tiến tới 0 (khi n → ∞). Từ đó theo ý
tưởng của thuật toán xấp xỉ ngẫu nhiên Robbins - Monro, Kiefer - Wolfowitz đã
đề xuất thuật toán tìm giá trị xấp xỉ của x = θ mà tại đó hàm hồi quy µ(x) có
đạo hàm µ (x) = 0 như sau: Nếu ở bước lặp thứ n ta có giá trị xấp xỉ là x = xn
và giả sử có được hai quan sát không chệch về hàm hồi quy µ(x) tại x = xn − bn
và x = xn + bn thì giá trị xấp xỉ của x = θ tại bước lặp thứ n + 1 là x = xn+1 sẽ
được xác định bởi thuật toán sau:
an
xn+1 = xn −
ξ (xn + bn ) − ξ (xn − bn )
(1.21)
bn
14


Chương 1. Xấp xỉ ngẫu nhiên cho trường hợp một chiều

trong đó {an } và {bn } là các dãy các số dương và rõ ràng số hạng
ξ (xn + bn ) − ξ (xn − bn )
có thể coi như là một ước lượng của ξn tại x = xn . Thuật
2bn
toán (1.21) được gọi là thuật toán Kiefer - Wolfowitz và sự hội tụ của dãy các
xấp xỉ x = xn về x = θ đã được Kiefer - Wolfowitz chứng minh trong định lý

sau:
Định lý 1.2.3. Giả sử các dãy số thực dương là {an } và {bn } thỏa mãn các điều
kiện sau:


∑ an = ∞

n=1


∑ anbn < ∞

n=1


(1.22)
an

∑ ( bn )2 < ∞

n=1


lim bn = 0

n=1

và các quan sát không chệch ξ (x) của hàm hồi quy µ(x) có:
Varξ (x) ≤ α 2 < ∞


(1.23)

đồng thời hàm hồi quy µ(x) thỏa mãn ba điều kiện sau:
1. µ(x) và đạo hàm cấp hai của nó bị chặn.
2. x = θ là điểm cực tiểu địa phương của hàm hồi quy µ(x), tức là với
∀ε > 0; µ(θ ) ≤ µ(x) nếu |x − θ | < ε.
d
3. x = θ là điểm dừng duy nhất của hàm hồi quy µ(x), tức là µ(x) = 0 nếu
dx
x = θ.
Khi đó, thuật toán Kiefer - Wolfowitz (1.21) sẽ hội tụ theo nghĩa trung bình bình
phương tới θ .

1.2.3

Thuật toán Dvoretzky

Thuật toán Dvoretzky được coi như thuật toán tổng quát của các thuật toán xấp
xỉ ngẫu nhiên. Bây giờ chúng ta sẽ nghiên cứu thuật toán này.
Cho µ(x) là một hàm hồi quy có nghiệm tại x = θ . Để tìm nghiệm x = θ của
15


Chương 1. Xấp xỉ ngẫu nhiên cho trường hợp một chiều

phương trình (1.2), ta giả sử có một dãy các quan sát là các biến ngẫu nhiên
ξ1 , ξ2 , . . . , ξn , khi đó thuật toán Dvoretzky sẽ được xác định như sau:
xn+1 = Tn (x1 , . . . , xn ) + ηn

(1.24)


trong đó Tn là một phép biến đổi từ không gian n - chiều vào không gian một
chiều, còn ηn là thành phần ngẫu nhiên thỏa mãn E[ηn |x1 , . . . , xn ] = 0. Sau đây
là các điều kiện để thuật toán Dvoretzky hội tụ.
Định lý 1.2.4. Giả sử phép biến đổi Tn trong thuật toán Dvoretzky (1.24) thỏa
mãn điều kiện sau:
|Tn (x1 , . . . , xn ) − θ | ≤ Fn |xn − θ |

(1.25)

trong đó Fn là dãy các số dương thỏa mãn:


Fn ≤ 1;

∏ Fn = 0

(1.26)

n=1

Khi đó, nếu
E[x12 ] < ∞;



∑ E[ηn2] < ∞

(1.27)


n=1

E ηn |x1 , x2 , . . . , xn = 0

(1.28)

thì thuật toán (1.24) sẽ hội tụ tới θ theo nghĩa trung bình bình phương, nghĩa là
lim E|xn − θ |2 = 0

n→∞

Chứng minh. Từ (1.24) ta có:
[xn+1 − θ ]2 = (Tn − θ )2 + 2ηn (Tn − θ ) + ηn2
→ E[xn+1 − θ ]2 = E(Tn − θ )2 + 2E ηn (Tn − θ ) + E[ηn2 ]

E ηn (Tn − θ ) =

···

ηn f (ηn |x1 , . . . , xn )dηn

× (Tn − θ ) f (x1 , . . . , xn )dx1 , . . . , xn
Vì các giá trị (x1 , . . . , xn ) cho trước và theo (1.28) nên
ηn f (ηn |x1 , . . . , xn )dηn = E ηn |x1 , x2 , . . . , xn = 0
16


Chương 1. Xấp xỉ ngẫu nhiên cho trường hợp một chiều

Do đó E ηn (Tn − θ ) = 0.

Áp dụng giả thiết (1.26) suy ra:
E[xn − θ ]2 = E(Tn − θ )2 + E[ηn2 ]
≤ Fn2 E[xn − θ ]2 + E[ηn2 ]
Đặt Vn = E[xn − θ ]2 và αn2 = E[ηn2 ].
Khi đó, ta có: Vn+1 ≤ Fn2Vn + αn2
Sử dụng bất đẳng thức này với Vn và lặp lại (n − 1) lần ta có :
2
Vn ≤ Fn−1
Vn−1 + αn2
2
2
2
≤ Fn−1
Fn−2
Vn−2 + αn−1
+ αn2
n

≤ · · · ≤ V1 β0n + ∑ α 2j β jn
j=0

trong đó



n
2




l= j+1 Fl


β jn = 1





0

nếu 0 ≤ j < n
nếu j = n
nếu j > n

Chọn i cố định sao cho i < n, ta có:
i−1

Vn+1 ≤ V1 + ∑

α 2j

j=1

n

max β jn + ∑ α 2j β jn

0≤ j

j=i

n
2
2
Xét vế phải của (1.29) ta có: V1 + ∑i−1
j=1 α j max0≤ j2
Mà V1 + ∑i−1
j=1 α j < ∞ và lim max0≤1n→∞

2
Vì vậy V1 + ∑i−1
j=1 α j
Mặt khác: ∑nj=i α 2j β jn

max0≤ j= ∑∞j=i α 2j β jn do β jn = 0 khi j > n
Theo giả thiết có β jn bị chặn đều bởi 1 và theo (1.27) thì ∑∞j=i α 2j < ∞
Do đó: lim ∑nj=i α 2j β jn = ∑∞j=i α 2j lim β jn = 0
n→∞

n→∞

Khi đó, vế phải của (1.29) có giới hạn tiến tới 0 khi n −→ ∞
Suy ra Vn+1 −→ 0(n −→ ∞) hay lim E[xn+1 − θ ]2 = 0
n→∞
Vậy định lý được chứng minh.
17


(1.29)


Chương 1. Xấp xỉ ngẫu nhiên cho trường hợp một chiều

Định lý 1.2.5. : Giả sử các điều kiện ở định lý 1.2.4 thỏa mãn. Khi đó thuật toán
Dvoretzky (1.24) sẽ hội tụ về θ với xác suất 1.
Chứng minh. Theo chứng minh định lý 1.2.4 ta có:
lim Vn = lim E[xn − θ ]2 = 0
n→∞

n→∞

⇒ ∀ε > 0; ∃δ > 0 và k = k(δ , ε) sao cho ∀n ≥ k thì Vn < δ 2 ε
Với k cố định, ta định nghĩa một thuật toán mới như sau:
xm+1 = Tm (x1 , . . . , xm ) + ηm

(1.30)

trong đó: Tm = Tm ; ηm = ηm nếu m < k
còn nếu m ≥ k thì


Tm (x , . . . , x ) nếu |x − θ | < δ
m
m
1
Tm (x1 , . . . , xm ) =


x
nếu |xm − θ | ≥ δ .
m

ηm =



ηm

nếu |xm − θ | < δ


0

nếu |xm − θ | ≥ δ .

Ta sẽ chỉ ra thuật toán (1.30) cũng hội tụ theo nghĩa trung bình bình phương, tức
Vn = E[xn − θ ]2 < δ 2 ε với ∀n ≥ k
Thật vậy, giả sử tồn tại một số nguyên dương l nhỏ nhất sao cho |xl − θ | ≥ δ và
k≤l≤n
⇒ Với k ≤ m ≤ l thì Tm = xm và ηm = 0
⇒ xm+1 = xm với ∀k ≤ m ≤ l
⇒ Vm < δ 2 ε với ∀k ≤ m ≤ l
Khi đó, xl = xl = xl+1 = · · · = xn và Vl = Vl = Vl+1 = · · · = Vn
Sự tồn tại của l tương ứng với |xn − θ | ≥ δ và l tồn tại nếu và chỉ nếu maxm |xm −
θ | ≥ δ với k ≤ m ≤ n
Do đó, P{maxk≤m≤n |xm − θ | ≥ δ } ≤ P{|xn − θ | ≥ δ }
δ 2ε
Cho n −→ ∞ ta thu được P{maxm≥k |xm − θ | ≥ δ } ≤ 2 = ε

δ
Vì vậy ta thu được kết quả tương đương như sau:
P{|xm − θ | ≤ δ ; m = k, k + 1, . . . } > 1 − ε
Do δ và ε là bất kỳ nên thuật toán hội tụ theo xác suất 1.
18


Chương 1. Xấp xỉ ngẫu nhiên cho trường hợp một chiều

Chú ý:
1. Có thể thấy, thuật toán Robbins - Monro là trường hợp đặc biệt của thuật
toán Dvoretzky. Thật vậy, nếu ta lấy:
Tn (x1 , . . . , xn ) = xn − an µ(xn )
ηn = an [µ(xn ) − ξn ]
thì thuật toán Robbins - Monro xác định ở (1.4) sẽ là một dạng của thuật
toán Dvoretzky:
xn+1 = xn − an µ(xn ) − an ξn = Tn + ηn
Do đó để chứng minh tính hội tụ của thuật toán Robbins - Monro ta cần
kiểm tra với các điều kiện của định lý (1.2.1) thì các điều kiện của định lý
1.2.4 thỏa mãn.
Thật vậy, vì x1 , x2 , . . . độc lập cùng phân phối nên ξn chỉ phụ thuộc vào xn
và E[ξn |x1 , . . . , xn ] = E[ξn ] = µ(xn )
Do đó:
E[ηn |x1 , . . . , xn ] = E{an [µ(xn ) − ξn ]|x1 , . . . , xn }
= an {E[µ(xn ) − ξn ]|x1 , . . . , xn }
= an (µ(xn ) − µ(xn ) = 0
Như vậy điều kiện (1.28) được thỏa mãn.
2
Từ các giả thiết: Var[ξ (x) ≤ α 2 < ∞ và ∑∞
n=1 an < ∞ của định lý 1.2.1 ta có:





n=1

E[ηn2 ] =





a2nVar[ξn ] ≤ α 2

n=1



∑ a2n < ∞

n=1

hay điều kiện (1.27) thỏa mãn.
2
Vì ∑∞
n=1 an < ∞ nên tồn tại một số hữu hạn k sao cho với ∀n ≥ k luôn có
M1 an < 1
Đặt Fn = 1 − M1 an .
Áp dụng bất đẳng thức ln(1 − x) ≤ −x∀x ∈ (0; 1) ta thu được:



ln ∏∞
n=k Fn = ∑n=k ln Fn ≤ − ∑n=k M1 an

Sử dụng giả thiết dãy số hiệu chỉnh có ∑∞
n=k an = ∞ ta suy ra ∏n=k Fn = 0
hay điều kiện (1.26) thỏa mãn.

19


Chương 1. Xấp xỉ ngẫu nhiên cho trường hợp một chiều

Lại có:
|Tn (x1 , . . . , xn ) − θ | = |xn − θ − an µ(xn )|
≤ |1 − M1 an ||xn − θ |; ∀n ≥ k
= Fn |xn − θ |
⇒ Điều kiện (1.25) thỏa mãn.
Vậy tất cả các điều kiện của định lý 1.2.4 được thỏa mãn. Theo định lý 1.2.4
thì thuật toán Robbins - Monro hội tụ theo nghĩa trung bình bình phương.
2. Thuật toán Kiefer - Wolfowitz cũng là trường hợp đặc biệt của thuật toán
Dvoretzky. Thật vậy, đặt
Tn (x1 ; . . . ; xn ) = xn +

an
µ(xn + bn ) − µ(xn − bn )
bn

an
− µ(xn + bn ) + µ(xn − bn ) + ξ (xn + bn ) − ξ (xn − bn )

bn
thì thuật toán Kiefer - Wolfowitz xác định ở (1.21) sẽ có dạng tương đương
là xn+1 = Tn (x1 ; . . . ; xn ) + ηn . Vì vậy, thuật toán (1.21) là dạng đặc biệt của
thuật toán Dvoretzky. Do đó, tương tự như trên, ta cũng chứng minh được từ
các điều kiện của định lý 1.2.3 sẽ suy ra các điều kiện của định lý 1.2.4, từ
đó sẽ suy ra tính hội tụ của thuật toán Kiefer - Wolfowitz hay định lý 1.2.3
được chứng minh.
ηn =

20


Chương 2

Xấp xỉ ngẫu nhiên cho trường
hợp nhiều chiều
Trong chương này, chúng ta sẽ khảo sát các mở rộng của các thuật toán xấp
xỉ ngẫu nhiên đã đề cập trong chương 1 vào trong không gian n - chiều.

2.1

Thuật toán Robbins - Monro trong không gian
n - chiều

2.1.1

Nội dung thuật toán

Hàm hồi quy trong không gian n - chiều ký hiệu là µ(x) và có dạng µ(x) =
E[ξ (x)]. Để tìm nghiệm của phương trình µ(x) = 0, ta sử dụng thuật toán Robbins - Monro có dạng sau:

xn+1 = xn − an ξ n

(2.1)

trong đó ξ n = ξ (xn ). Khi đó ta thu được kết quả sau:
Định lý 2.1.1. Giả sử dãy số hiệu chỉnh {an } thỏa mãn




n=1

n=1

∑ an = ∞; ∑ a2n < ∞
21

(2.2)


Chương 2. Xấp xỉ ngẫu nhiên cho trường hợp nhiều chiều

M2 ; 0 < M1 ≤ M2 < ∞ sao cho

đồng thời tồn tại các hằng số M1 ;
2

M1 x − θ

≤ µ(x)T (x − θ ) ≤ M2 x − θ


2

;

Var ξ (x) ≤ α 2 < ∞

(2.3)
(2.4)

Khi đó, thuật toán Robbins - Monro (2.1) sẽ hội tụ theo nghĩa trung bình bình
phương đến θ
Chứng minh của định lý 2.1.1 được trình bày trong công trình của Aryeh
Dvoretzky trong tài liệu tham khảo [1].

2.1.2

Đánh giá cận trên của sai số trung bình bình phương

Hoàn toàn tương tự, chúng ta có thể đánh giá được cận trên cho sai số trung bình
bình phương của thuật toán Robbins - Monro xác định cho trường hợp n - chiều
bởi công thức truy hồi (2.1). Định lý sau sẽ là một kết quả tổng quát của định lý
1.2.2 đã được trình bày ở chương 1.
Định lý 2.1.2. Giả sử các điều kiện sau được thỏa mãn:
(i) Tồn tại các hằng số dương M1 ; M2 ; 0 < M1 ≤ M2 < ∞ sao cho hàm hồi quy
µ(x) có tính chất (2.3).
(ii) Dãy các véc tơ {xn } xác định bởi công thức truy hồi (2.1) và các quan sát
không chệch ξ (x) về hàm hồi quy µ(x) (tương ứng là quan sát không chệch
ξ (xn ) về µ(xn )) có tính chất (2.4) và
E ξ n − µ(xn ) |x1 , . . . , xn = 0


(2.5)

đồng thời
E( x1 − θ

2

2α 2
) = V1 ≤
M1 (M2 − M1 )

(2.6)

(iii) Dãy hiệu chỉnh {an } trong công thức truy hồi (2.1) được cho ở dạng
an =
Khi đó, Vn = E xn − θ

2

M1V1
α 2 + nM12V1

(2.7)

sẽ thỏa mãn bất đẳng thức:
α 2V1
Vn ≤ 2
α + (n − 1)M12V1
22


(2.8)


Chương 2. Xấp xỉ ngẫu nhiên cho trường hợp nhiều chiều

Chúng ta thu được một mở rộng tổng quát hơn của thuật toán Robbins Monro cho trường hợp nhiều chiều khi thuật toán truy hồi (2.1) được xét với dãy
hiệu chỉnh có dạng ma trận. Trong trường hợp này, thuật toán truy hồi (2.1) sẽ
có dạng sau:
xn+1 = xn − An ξ n
(2.9)
trong đó An là ma trận vuông cấp n.
Để khảo sát thuật toán (2.9) ta đặt:
M = M(θ ) = ∇x µ(x)T

T
x=θ

R = Cov[ξ (x)]
đồng thời giả thiết là tất cả các điều kiện khác trong định lý 2.1.2 đều thỏa mãn.
Nếu tồn tại ma trận nghịch đảo M −1 của ma trận M và dãy ma trận hiệu chỉnh
được chọn là
1
An = M −1
n
thì sai số trung bình bình phương của xấp xỉ xn cho θ sẽ là
1
Vn = (M T R−1 M)−1
n
và khi đó tốc độ hội tụ của thuật toán (2.9) sẽ là

lim nVn = lim nTr Vn = Tr M T R−1 M

n→∞

−1

n→∞

với Tr(A) ký hiệu là vết của ma trận A vuông cấp n.
Vì vậy với cách chọn dãy ma trận hệ số hiệu chỉnh An xác định như trên thì thuật
toán (2.9) sẽ là tối ưu theo nghĩa nó sẽ có tốc độ hội tụ tối ưu.
Sau đây chúng ta sẽ xét một trường hợp đặc biệt khi hàm hồi quy được giả thiết
là có dạng tuyến tính.
Định lý 2.1.3. Giả sử hàm hồi quy có dạng tuyến tính sau:
µ(x) = E[ξ (x)] = M(x − θ )

(2.10)

và lược đồ xấp xỉ ngẫu nhiên (2.9) thỏa mãn các điều kiện sau:
cov[ξ (x)] = R

(2.11)

E ξ n − µ(xn )|(x1 , . . . , xn ) = 0

(2.12)

và R là ma trận độc lập với x

23



Chương 2. Xấp xỉ ngẫu nhiên cho trường hợp nhiều chiều

Đặt
Vn = E[(xn − θ )(xn − θ )T ]

(2.13)

trong đó V1 = E[(x1 − θ )(x1 − θ )T ] đã cho trước.
Khi đó nếu chọn dãy ma trận hiệu chỉnh An trong thuật toán (2.9) như sau:
An = (V1−1 + nM T R−1 M)−1 M T R−1
ta sẽ thu được
Vn = V1−1 + (n − 1)M T R−1 M

(2.14)

−1

(2.15)

Kết quả này cũng có nghĩa là thuật toán Robbins - Monro trong (2.9) hội tụ theo
nghĩa trung bình bình phương đến θ .
Chứng minh. Từ (2.9); (2.10); (2.13), ta thu được:
Vn+1 = E[(xn+1 − θ )(xn+1 − θ )T ]
= E (xn − θ ) − An ξ n (xn − θ ) − An ξ n

T

= E[(xn − θ )(xn − θ )T − (xn+1 − θ )An T ξ Tn


(2.16)

+ An ξ n An T ξ Tn ]
= (I − An M)Vn (I − An M)T + An RAn T
trong đó I là ma trận đơn vị.
Ta sẽ chứng minh (2.15) bằng quy nạp.
• Với n = 1 thì V1 = [(V1 )−1 ]−1 = V1 ⇒ (2.15) đúng với n = 1
• Giả sử (2.15) đúng đối với n. Ta sẽ chứng minh (2.15) đúng đối với n + 1.
Thật vậy, từ (2.14) ta có:
I − An M = (V1−1 + nM T R−1 M)−1 (V1−1 + (n − 1)M T R−1 M)
An RAn T = (V1−1 + nM T R−1 M)−1 M T R−1 M
× (V1−1 + nM T R−1 M)−1
Kết hợp (2.17) với giả thiết quy nạp và thế vào (2.16) ta thu được
Vn+1 = (V1−1 + nM T R−1 M)−1

24

(2.17)


Chương 2. Xấp xỉ ngẫu nhiên cho trường hợp nhiều chiều

Vậy (2.15) đúng với mọi n. Từ (2.15) ta suy ra
lim Vn = 0

n→∞

hay thuật toán (2.9) hội tụ theo nghĩa trung bình bình phương.
Nhận xét 3. Định lý trên cho ta thấy:

• Nếu giá trị chân thực θ được biết sẽ nằm trong miền hình chữ nhật bị chặn
nào đó của không gian tham số và (2.11); (2.12) chỉ đúng cho những x nằm
trong miền đó thì ta phải sử dụng phương pháp Robbins - Monro chặt cụt
tương tự như trong trường hợp một chiều.
• Dãy ma trận hiệu chỉnh An xác định trong (2.14) thực chất là dạng ma trận
làm cực tiểu sai số trung bình bình phương ở mỗi bước lặp. Thật vậy, để
đơn giản ta giả sử tồn tại ma trận M −1 và lưu ý là từ (2.16) có thể suy ra là:
Vn+1 =Tr[Vn − An MVn −Vn M T An T
T

T

(2.18)

+ An (R + MVn M )An ]
Khi đó, nếu thay ma trận An bằng đại lượng dAn thì ta thu được
− Tr{dAn [MVn − (R + MVn M T )An T ]
T

T

T

(2.19)

+ [Vn M − An (R + MVn M )dAn ]}
Do đó, để Vn+1 có cực tiểu thì biểu thức (2.19) phải bằng 0 với mọi dAn . Vì
vậy sử dụng tính chất đối xứng ta có:
T
(R + MVn M T )−1 MVn = (Vn−1 M −1 R + M T )−1 := Aˆn


Từ đó suy ra giá trị cực tiểu của Vn+1 là cực tiểu toàn cục vì dạng biểu diễn
(2.18) của nó về cơ bản là dạng toàn phương.
• Với lưu ý là Vn−1 được thay thế từ (2.15) thì dãy ma trận hệ số hiệu chỉnh
(2.14) có dạng sau:
An T = R−1 M(Vn−1 + M T R−1 M)−1
= (Vn−1 M −1 R + M T )−1
= An

T

Như vậy dãy ma trận hệ số hiệu chỉnh An là tối ưu theo nghĩa thuật toán
(2.9) tương ứng có sai số trung bình bình phương được đánh giá như trên.
25


Chương 2. Xấp xỉ ngẫu nhiên cho trường hợp nhiều chiều

Bây giờ ta sẽ đưa ra hai ví dụ về thuật toán Robbins - Monro nhiều chiều,
một ví dụ về ma trận M = M(θ ) đã biết, còn một ví dụ về ma trân M(θ ) chưa
biết.
Ví dụ 2.1.4. Gọi θ là giá trị trung bình chân thực, ξ (x) = x − t. Ta cần ước lượng
véc tơ trung bình.
Với giả thiết trên, hàm hồi quy là
µ(θ ) = E[ξ (θ )] = 0
Khi đó, µ(x) là hàm tuyến tính và M = I. Thuật toán xấp xỉ ngẫu nhiên sẽ là:
xn+1 = xn − An (xn − tn )
Với giả thiết sai số trung bình bình phương V1 ban đầu đã cho trước, theo (2.14)
và (2.15), ta có:
An = V1−1 + nR−1


−1 −1
R

= Vn−1 + R−1

−1 −1
R

Vn = (V1−1 + (n − 1)R−1 )−1 = RATn−1
Suy ra
An = Vn (Vn + R)−1
Vn = R(Vn−1 + R)−1Vn−1
do đó thuật toán trở thành
xn+1 = R(Vn + R)−1 xn +Vn (Vn + R)−1 tn
Trước khi xét ví dụ thứ hai, ta đưa ra khái niệm dãy hàm cơ sở.
Định nghĩa 2.1.5. Dãy các hàm ϕ1 (t), . . . , ϕK (t) được gọi là hàm cơ sở nếu các
hàm này độc lập, tuyến tính và có tính chất:


1 nếu i = j
ϕi (t)ϕ j (t) =

0 nếu i = j.
Ví dụ 2.1.6. Giả sử t là véc tơ ngẫu nhiên có hàm mật độ f (t) chưa biết, hàm
vô hướng đã biết h(t) là một phép biến đổi phi tuyến của t. Ta cần tìm một xấp
xỉ tuyến tính cho hàm số h(t) cho trên tập các hàm cơ sở độc lập tuyến tính
26