Tải bản đầy đủ (.doc) (23 trang)

Luận văn:PHƯƠNG PHÁP HÀM CHẮN VÀ PHƯƠNG PHÁP HÀM PHẠT trong các bài toán tối ưu Chương 2.

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (161.56 KB, 23 trang )

Chơng 2

phơng pháp hàm chắn
Chơng này trình bày phơng pháp hàm chắn cho phép đa bài toán tối u có
ràng buộc bất đẳng thức về bài toán tối u không ràng buộc, để có thể áp dụng đợc các phơng pháp tìm cực tiểu không ràng buộc quen biết. Phơng pháp này đòi
hỏi bài toán có điểm chấp nhận thoả mãn chặt mọi ràng buộc. Nội dung trình
bày ở chơng này chủ yếu dựa trên các tài liệu [2], [3] và [6].

2.1. Mở đầu
Xét bài toán tối u với ràng buộc bất đẳng thức:
(P)

min {f(x) : gi(x) 0, i = 1, , m; x |Rn},

trong đó f(x), gi(x): |Rn |R, i = 1, , m là các hàm lồi, hai lần khả vi liên tục.
Miền ràng buộc (miền chấp nhận đợc) của bài toán (P) là tập
C = {x |Rn : gi(x) 0, i = 1, , m}.
Đặt C0 {x |Rn : gi(x) < 0, i = 1, , m}. Ta giả thiết C 0 , tức là có ít
nhất một điểm x với gi( x ) < 0, i = 1, , m (điều kiện Slater) và C bị chặn.
Ta sẽ đa bài toán (P) về bài toán không ràng buộc để có thể áp dụng đợc các
phơng pháp giải số tìm cực tiểu không ràng buộc. Dễ dàng thấy rằng x* là lời
giải tối u của (P) khi và chỉ khi x* là nghiệm của bài toán cực tiểu không ràng
buộc:
(P)

min {f(x) + I(x) : x |Rn}.

21


trong đó I : |Rn |R {+} là hàm chỉ (indicator function) của tập C, tức là





0 nếu x C,

I(x) = + nếu trái lại.

Tuy nhiên, do hàm mục tiêu không khả vi trên biên của C, nên việc giải bài
toán ( P ) gặp nhiều khó khăn và ta không thể vận dụng trực tiếp các phơng pháp
cổ điển tìm cực tiểu không ràng buộc để giải ( P ). Vì thế, ta sẽ tìm cách sử dụng
những hàm khả vi khác để xấp xỉ I(x). Giải các bài toán không ràng buộc xây
dựng theo cách này ta sẽ đợc các lời giải xấp xỉ của (P).

ý tởng cơ bản của phơng pháp hàm chắn là xấp xỉ hàm I bởi hàm I : |
Rn |R {+} với các tính chất:

(A1) I là hàm lồi khả vi liên tục trên miền hữu hiệu của nó.

(A2) dom I = {x |Rn : gi(x) < 0, i = 1, , m}.


(A3) Nếu xk dom I , xk tiến gần tới biên của C thì I (xk) + .

Một hàm I nh thế đợc gọi là hàm chắn (barrier function) của C, bởi vì hàm
này dần tới vô cùng khi x gần tới biên của C (hàm ngăn x tiến ra biên).
Bài toán xấp xỉ của (P) có dạng
( P )


min {f(x) + I (x) : gi(x) < 0, i = 1, , m}.


22


Sự tồn tại và tính duy nhất nghiệm (lời giải tối u) của bài toán này đợc
khẳng định trong mệnh đề sau.

Mệnh đề 2.1. Giả thiết miền ràng buộc C compac và I là hàm chắn. Khi

đó bài toán ( P ) có nghiệm. Hơn nữa, nếu f + I là hàm lồi chặt thì nghiệm của
bài toán ( P ) là duy nhất.
Chứng minh. Giả sử x0 C0 {x |Rn : gi(x) < 0, i = 1, , m}. Đặt W =


{x C0 : f(x) + I (x) f(x0) + I (x0)}. (W đợc xác định là do giả thiết C0 khác
rỗng). Trớc hết ta chứng minh W là compac. Do C compac và W C0 nên tập W
bị chặn. Ta sẽ chứng tỏ W đóng. Thật vậy, giả sử {w j}j N là một dãy hội tụ bất
kỳ trong W và điểm giới hạn của dãy là w. Do C đóng nên w C và vì thế nếu w
C0 thì w thuộc biên của C. Do w j w nên theo định nghĩa của hàm chắn (điều

kiện A3) thì f(wj) + I (wj) +, điều này trái với sự kiện mỗi

w j thuộc W.


Vậy phải có w C0. Do hàm f + I liên tục tại w và do wj W nên ta có

I j
I 0
j

0
f(w) + I (w) = lim
j [f(w ) + (w )] f(x ) + (x ).

23


Vì thế, w W, nghĩa là W đóng. Cuối cùng, do liên tục trên tập compac W

nên hàm f + I đạt giá trị cực tiểu trên W, chẳng hạn tại điểm x* W. |Rõ ràng,
x* là một nghiệm (lời giải tối u) của bài toán ( P ).
Giả sử x là một nghiệm của bài toán ( P ). Khi đó, x là một xấp xỉ cho
nghiệm của bài toán (P). Nhng xấp xỉ đó nói chung còn thô. Để cải tiến xấp xỉ

này ta nhận xét rằng nếu I là một hàm chắn thì tI cũng là hàm chắn với mọi

t

> 0 và giá trị t càng nhỏ thì hàm chẵn tI xấp xỉ càng tốt hàm chỉ I.
Nh vậy, ý tởng đầu tiên là giải bài toán
( P (t))

min {f(x) + tI (x) : gi(x) < 0, i = 1, , m}.

với t > 0 đủ nhỏ. Tuy nhiên về mặt tính toán cách làm này không thật hợp lý. Lý
do là vì chỉ số điều kiện của ma trận Hessian của hàm mục tiêu trong bài toán (
P (t)) tăng lên khi t giảm và chỉ số điều kiện tăng sẽ gây khó khăn cho việc giải
hệ phơng trình tuyến tính để xác định hớng Newton.
Trong thực hành tốt nhất là ta nên bắt đầu quá trình giải từ một giá trị t 0
không quá nhỏ và giải bài toán ( P (t0)) để nhận đợc nghiệm xấp xỉ x(t0) của bài

toán. Sau đó giảm t0, chẳng hạn đặt t1 = ct0 với hệ số c < 1. Tiếp đó, giải bài toán
( P (t1)), bằng cách xuất phát từ nghiệm x(t 0) đã có trớc đó. Sau đó ta đặt t 2 = ct1,

24


rồi lại giải bài toán ( P (t2)), xuất phát từ nghiệm x(t1) đã có, Trong thực tiễn,
ngòi ta thờng chọn hệ số c = 1/10 và thấy rằng cách chọn này đủ tốt. Đôi khi ngời ta cũng chọn c = 1/12, 1/16, ... Rõ ràng là dãy t k giảm dần và tiến tới 0. Quá
trình này tạo ra dãy điểm {x(tk)} với hy vọng dãy sẽ hội tụ tới điểm x* là một
nghiệm của bài toán (P).
Theo Mệnh đề 2.1, mỗi bài toán ( P (tk)) có nghiệm. Hơn nữa, nếu ta dùng
một trong các phơng pháp tìm cực tiểu không ràng buộc (Cauchy, Newton, tựa
Newton, građiên liên hợp), xuất phát từ một điểm chấp nhận đợc chặt (thuộc C0)
thì mọi điểm lặp tiếp sau sẽ vẫn thuộc C 0 nhờ tính chất A3 của hàm chắn. Tuy
nhiên, việc giải bài toán cực tiểu hàm một biến số (cực tiểu một chiều) cần tiến
hành thận trọng để tránh phải xét các điểm chấp nhận đợc không chặt (thuộc C
nhng không thuộc C0).

2.2. Hàm chắn lôga
Hàm chắn lôga là một lớp hàm đợc sử dụng rộng rãi để xử lý các ràng buộc
gi(x) 0, i = 1, , m. Đó là hàm đợc xác định bởi công thức:
im=1 log(g i ( x )) nếu g i ( x ) < 0, i = 1, , m,
(x) =
+
nếu trái lại.

Có thể thấy là một hàm chắn. Thật vậy, rõ ràng là hàm lồi, trơn trong
C0 và (x) dần tới + khi x tiến gần tới biên của C. Hơn nữa, lồi chặt trên C0,
theo nghĩa: với mọi x1 x2 C0, 0 < < 1 ta có
[x1 + (1 )x2] < (x1) + (1 )(x2).

25


Do (x) lồi, trơn và C bị chặn (theo giả thiết) nên (x) phải có một cực tiểu
trên C0. Hơn nữa, do tính lồi chặt của nên nếu có hai điểm x1 x2 cùng đạt cực
tiểu của (x) trên C0 thì với 0 < < 1:
[x1 + (1 )x2] < (x1) + (1 ) (x2) = (x1) = (x2),
trái với x1, x2 đạt cực tiểu. Vậy chỉ có một điểm cực tiểu duy nhất của trên C0.
Điểm cực tiểu ấy gọi là tâm giải tích của các bất đẳng thức gi(x) 0 i.
Ví dụ 2.1. Xét bài toán: min {x2 + 1 : 2 x 0, x 4 0}.
Nghiệm của bài toán này là x* = 2. Hàm mục tiêu chắn lôga có dạng
B(x, t) = x2 + 1 t.log(x 2) t.log(4 x).
Đồ thị của B(x, t) đợc vẽ ở Hình 2.1 với các giá trị t = 3, 5, 10. Ta có thể
thấy rằng điểm cực tiểu x(t) của B(x, t) dần tới x* = 2 khi t dần tới 0.

26


30

Hình 2.1. Hàm mục tiêu chắn lôga B(x, t)
t1 = 10

25

t2 = 5

20

t3 = 3


15
10
5
x* = 2
0
2.2

x(t3)

2.4

x(t2)

2.6

x(t1)

2.8

3

3.2

3.4

3.6

3.8


Một ví dụ khác về hàm chắn là hàm chắn nghịch đảo đợc xác định bởi
im=11 / g i ( x ) nếu g i ( x ) < 0, i = 1, , m,
(x) =
nếu trái lại.
+
Ví dụ 2.2. Xét bài toán tìm cực tiểu của hàm một biến số f(x) = x với ràng
buộc g(x) = 2 x 0. Rõ ràng giá trị cực tiểu của f bằng 2, đạt tại điểm x* = 2.
Hàm chắn nghịch đảo có dạng: (x) = 1/(x 2). Dùng tham số t ta xét bài
toán không ràng buộc
min {B(x, t) = x + t/(x - 2) : x |R}.
Hình 2.2 vẽ đồ thị của hàm B(x, t) và chỉ ra vị trí các điểm cực tiểu tơng
ứng với các giá trị t = 1; 0,64; 0,25 và 0,09.
27


Hình 2.2. Hàm mục tiêu chắn nghịch đảo
7
6
5
4

q2

3

q4

q1

q3


2
q

1
1.5

2

2.5

3

3.5

4

4.5

Miền ràng buộc nằm ở bên phải đờng thẳng đứng x = 2. Dễ nhận thấy rằng
dãy điểm q1, q2, q3, q4, tiến dần tới điểm q (cực tiểu có ràng buộc của hàm f).
Thật vậy, để tìm cực tiểu của B(x, t) ta lấy đạo hàm của B theo x và cho đạo hàm
này bằng 0, ta nhận đợc
t
dB
2
=12 = 0 (x 2) = t x = 2
(
x


2
)
dx

t.

2t
d2B
Do đó,
=
và cực tiểu của hàm B đạt đợc khi x = 2 +
( x 2) 3
dx 2

t nằm

bên trong miền ràng buộc và giá trị cực tiểu bằng 2 + 2 t . Khi đó, q1 = (3; 4),
q2 = (2,8; 3,6), q2 = (2,5; 3) và q3 = (2,3; 2,6). Rõ ràng khi t 0 thì giá trị cực
tiểu không ràng buộc của B(x, t) tiến tới 2 và điểm cực tiểu là x* = 2.

28


Nói chung ta không thể xác định bằng giải tích vị trí điểm cực tiểu của hàm
B(x, t) mà phải dùng các phơng pháp giải số.

2.3. Đờng trung tâm
Dùng một tham số t > 0 ta đặt B(x, t) = f(x) + t. (x), trong đó là hàm
chắn lôga, và xét bài toán tối u không ràng buộc:
min {B(x, t) : x |Rn}.

Do hàm (x) lồi chặt trên C0 và f(x) lồi trên C nên B(x, t) cũng lồi chặt trên
C0. Do vậy, B(x, t) có một điểm cực tiểu duy nhất trên C0.
Vì thế, từ đây về sau ta giả thiết hàm chắn đợc sử dụng là hàm chắn lôga và
nghiệm của bài toán không ràng buộc: min {f(x) + t(x)} tồn tại và duy nhất. Ta
ký hiệu nghiệm này là x*(t). Tập hợp {x*(t) : t > 0} xác định một đờng cong, đợc gọi là đờng trung tâm (central path) hay quĩ đạo chắn (barrier trajectory).
Ví dụ 2.3. Xét bài toán quy hoạch tuyến tính với hai biến, bốn ràng buộc:
f(x) = x2 min

(P)
với các điều kiện:

0,5x1 x2 0, 3x1 x2 5, 2x1 + x2 10, x2 6.
Điểm x* = (0, 0) là nghiệm của bài toán. Đờng trung tâm đợc xác định bởi
tập điểm x*(t) = argmin B(x, t) với t > 0, trong đó
B(x, t) = x2 t.log(- 0,5x1 + x2) - t.log(5 - 3x1 + x2)
- t.log(10 - 2x1 - x2) - t.log(6 - x2).

29


Bảng sau ghi toạ độ một số điểm thuộc đờng trung tâm và các giá trị tơng
ứng của hàm B(x, t). Các điểm này đợc vẽ ở Hình 2.3 (trang sau).
t

x 1

x 2

B(x*, t)


10

- 1,0686

2,6595

- 24.8288

5

- 1,0225

2,4591

- 11.3029

2,5

- 0,9170

2,1069

- 4.7407

1,25

- 0,6904

1,5788


- 1.7472

0,625

- 0,3502

0,9876

- 0.5482

0,3125

- 0,0921

0,5429

- 0.1341

0,1563

0,0034

0,2870

- 0.0054

0,0781

0,0189


0,1490

0.0252

0,0391

0,0143

0,0762

0.0256

0,0195

0,0085

0,0386

0.0190

0,0098

0,0046

0,0194

0.0125

0,0049


0,0024

0,0097

0.0077

ở mục sau ta sẽ đề cập tới vấn đề hội tụ của dãy {x*(t)} và dãy {f(x*(t))}
khi t 0.

30


3.0
2.5
2.0
1.5
1.0
0.5
0.0
-1.2

-1.0

-0.8

-0.6

-0.4

-0.2


0.0

0.2

Hình 2.3. Đờng trung tâm

2.4. nhân tử Lagrange
Do các hàm f, gi (i = 1, , m) là lồi, khả vi liên tục và do điều kiện Slater đợc thoả mãn, tức là tồn tại điểm x sao cho gi( x ) < 0 với mọi i = 1, , m, nên
điều kiện Karush - Kuhn - Tucker là điều kiện cần và đủ của tối u. Nói chính xác
hơn, x* là một nghiệm của bài toán (P) khi và chỉ khi tồn tại véctơ * = ( 1 , ,
m ) thoả mãn các điều kiện sau đây, gọi tắt là điều kiện KKT:
m



f(x*) + i gi(x*) = 0,
i =1

i gi(x*) = 0, i = 1, 2, , m,
gi(x*) 0, i = 1, 2, , m,

31


i 0, i = 1, 2, , m,
Hơn nữa, ta biết rằng * là một nghiệm của bài toán đối ngẫu với (P):
max {d() infx L(x, ) : 0},

(Q)


m

trong đó L(x, ) = f(x) + i gi(x) là hàm Lagrange của bài toán (P).
i =1

Do điều kiện Slater đợc thoả mãn nên ta có hệ thức đối ngẫu mạnh: d(*) =
f*, giá trị tối u của (P). Sau đây ta sẽ sử dụng đờng trung tâm để đa ra một xấp xỉ
cho véc tơ nhân tử Lagrange * = ( 1 , 2 , , m ).
Muốn thế, ta viết các điều kiện tối u của điểm
x*(t) = argmin {f(x) + t.(x)}
thuộc đờng trung tâm dới dạng:
f(x*(t)) + t.(x*(t)) = 0 với mỗi t > 0.
m

m

i =1

i =1

Do (x) = - log(g i ( x )) nên (x) = - (1 / g i ( x )) gi(x).
Vì thế, đờng trung tâm đợc đặc trng bởi hệ phơng trình
t
gi(x*(t)) = 0.
i =1 g i ( x * ( t ))
m

f(x*(t)) -


So sánh điều kiện này với điều kiện KKT thứ nhất
m



f(x*) + i gi(x*) = 0,
i =1

32


ta thấy nếu x*(t) đủ gần x* thì giá trị
i (t) = -

t
, i = 1, 2, , m
g i ( x * ( t ))

(2.1)

có thể đợc xem nh một xấp xỉ cho các nhân tử Lagrange i , i = 1, 2, , m.
Do t > 0 và gi(x*(t)) < 0, i = 1, 2, , m (vì điểm cực tiểu của f(x) + t (x)
nằm ở phần trong miền chấp nhận) nên ta có i (t) > 0 với mọi i = 1, 2, ,m. Vì
thế, véctơ *(t) thoả mãn các ràng buộc của bài toán đối ngẫu (Q).
Ta cũng để ý rằng cặp véctơ (x*(t), *(t)) thoả mãn gần nh đầy đủ các điều
kiện KKT. Thật vậy, ta có
m




f(x*(t)) + i (t)gi(x*(t)) = 0,
i =1

i (t)gi(x*(t)) = - t, i = 1, 2, , m,

(2.2)

gi(x*(t)) < 0, i = 1, 2, , m,
i (t) > 0, i = 1, 2, , m.
Điểm cực tiểu x*(t) của B(x, t) là một điểm trong của C, vì thế điểm này đợc đặc trng bởi điều kiện cần của tối u:
m

g ( x*)

i
B(x*, t) = f(x*) + t. g ( x*) = 0.
i =1
i

33

(2.3)


Khi t 0+ thì x*(t) dần tới điểm cực tiểu duy nhất của (x), tức là tới tâm
giải tích của hệ bất đẳng thức gi(x) 0 với i = 1, , m. Dễ thấy điều kiện (2.3)
cũng là điều kiện cần và đủ để x* là điểm cực tiểu (trên toàn |Rn) của hàm
m

L(x, *) = f(x) + i g i ( x ) ,

*

i =1

trong đó *i =

t
0. Nhng L(x, ) chính là hàm Lagrange của bài toán (P)
g i ( x*)

và * = *(t) là một lời giải chấp nhận đợc của bài toán đối ngẫu (Q). Tập { *(t)
: t > 0} gọi là đờng trung tâm đối ngẫu.
Ký hiệu f* là giá trị tối u của bài toán (P) ta có
m

*
f* inf
{f(x) + i g i ( x ) }
x
i =1

m

= f(x*) + i g i ( x*) = f(x*) m/ t.
*

i =1

Nh vậy, một điểm x*(t) trên đờng trung tâm gốc cho ta một điểm *(t) trên
đờng trung tâm đối ngẫu, cùng với một cận dới cho giá trị tối u là

f(x*(t)) f* f(x*(t)) m/ t.
Bất đẳng thức này chứng tỏ khi t 0+ thì f(x*(t)) f* và x*(t) dần tới một
lời giải tối u của bài toán (P).

34


Mệnh đề 2.2. Với mọi t > 0, x*(t) là lời giải tối u của (P) sai khác một hằng
số mt > 0, nghĩa là f(x*(t)) mt f*. Hơn nữa, f(x*(t)) f*, giá trị tối u của
(P), khi t 0+.
Chứng minh. Do *(t) thoả mãn các ràng buộc của bài toán đối ngẫu (Q)
nên ta có hệ thức đối ngẫu yếu d( *(t)) f*. Mặt khác, bằng cách lần lợt sử
dụng định nghĩa của hàm đối ngẫu, phơng trình đầu của (2.2) và hệ thức (2.1) ta
nhận đợc:
d(*(t)) = inf
L(x, *(t)) = L(x*(t), *(t)) =
x
m



= f(x*(t)) + i ( t ) gi(x*(t)) = f(x*(t)) mt.
i =1

Vì thế, f(x*(t)) mt = d(*(t)) f*, nghĩa là x*(t) là lời giải tối u của (P)
với độ sai khác mt > 0. Hơn nữa, cho t 0+ trong 0 f(x*(t)) f* mt ta có
f(x*(t)) f*.
Từ những kết quả trên ta suy ra phơng pháp sau đây để giải bài toán (P), gọi
là phơng pháp SUMT (Sequential Unconstrained Minimization Technique - kỹ
thuật liên tiếp cực tiểu không ràng buộc). Thuật toán này là một dạng của phơng

pháp bám đờng (path-following method) và là một trong các phơng pháp điểm
trong đơn giản, tự nhiên nhất:
35


Thuật toán liên tiếp tìm cực tiểu không ràng buộc (SUMT).
Bớc 0. Cho một điểm chấp nhận đợc chặt x C0, một trị t = t0 > 0. Cho các
hệ số 0 < c < 1, > 0.
Bớc 1. Xuất phát từ điểm x, tìm cực tiểu của hàm f(x) + t (x) và nhận đợc
lời giải x*(t). Đặt x := x*(t).
Bớc 2. Nếu m.t (sai số cho phép) thì dừng thuật toán: x là một lời giải
- tối u. Nếu trái lại thì đặt t := ct (giảm t do c < 1) và lặp lại Bớc 1.
Các bài toán không ràng buộc thờng đợc giải bằng cách sử dụng phơng
pháp Newton. Ta nhận xét là tất cả các điểm do thuật toán SUMT tạo ra đều ở
trên đờng trung tâm. Thờng c đợc chọn từ 0,1 đến 0,001. Nếu giá trị c không quá
nhỏ (ví dụ, c = 0,1) thì chỉ cần một vài bớc lặp Newton sẽ nhận đợc x*(t), trong
đó t = ct. Tuy nhiên, cần giải nhiều bài toán phụ không ràng buộc để đạt tới x*,
lời giải tối u (nghiệm) của bài toán (P). Mặt khác, nếu giá trị c nhỏ (ví dụ, c =
0,001) thì cần thực hiện nhiều bớc lặp Newton để nhận đợc x*(t), nhng lại chỉ
cần giải một vài bài toán phụ không ràng buộc để đạt đợc nghiệm x*.
Để thực hiện thuật toán này cần giải quyết hai vấn đề:
1. Tính x*(t) trên đờng trung tâm;
2. Xác định hệ số c, nhân với t để dùng trong bớc lặp sau;

36


Đối với phần lớn các bài toán qui hoạch lồi, các vấn đề trên có thể giải
quyết thoả đáng. Dĩ nhiên cách đơn giản nhất chỉ cần một bớc lặp là ngay từ
đầu lấy t = /m và giải bài toán không ràng buộc:

m
min {f(x) log(g i ( x )) : x |Rn}.
m i=1
Tuy nhiên cách đơn giản này chỉ tốt đối với các bài toán cỡ nhỏ, khi có
điểm xuất phát tốt và sai số cho phép không quá nhỏ. Còn nói chung nó hội tụ
chậm và có thể không thành công do những khó khăn này khác. Trong thực tế,
tốt hơn nên dùng nhiều lần lặp, giải một dãy bài toán không ràng buộc với trị số t
giảm dần.
Sự hội tụ của thuật toán sẽ đợc bảo đảm nếu hàm chắn thoả mãn một số
điều kiện nhất định. Hơn nữa, Nesterov và Nemirovsky đã chứng minh rằng phơng pháp hàm chắn lôga cho các bài toán qui hoạch tuyến tính và qui hoạch lồi
toàn phơng với ràng buộc lồi toàn phơng có độ phức tạp tính toán đa thức.
Định lý 2.1. Phơng pháp giải nêu trên có các tính chất sau đây:
a) B(x, t) f(x) với mọi t > 0, x C;
b) gi(xk) < 0, i = 1, , m;
c) {B(xk, tk)} hội tụ tới giá trị tối u của (P) khi {tk} dần tới 0.
Chứng minh. Tính chất a) là hiển nhiên. Để thấy rõ tính chất b), theo định
nghĩa của hàm B, ta chỉ cần để ý là nếu g i(xk) = 0 thì B(xk, tk) không thể có giá trị
hữu hạn.
37


Để chứng minh tính chất c), giả sử x* là một lời giải tối u của (P). Ta chứng
minh rằng
B(xk, tk) f(x*) khi tk 0.
Thật vậy, theo định nghĩa của hàm B, nếu {tk} là dãy giảm thì {B(xk, tk)}
cũng là dãy giảm. Do dãy sau bị chặn dới (tính chất a), nên nó hội tụ tới một số
nào đó, chẳng hạn B0 f(x*). Nếu B0 > f(x*) thì do các hàm f, gi (i = 1, , m)
liên tục nên ta có thể chọn điểm chấp nhận đợc x0 thoả mãn các hệ thức:
f(x0) < f(x*) + /2, trong đó = B0 f(x*),
gi(x0) < 0, i = 1, , m.

Lấy k đủ lớn sao cho
m

k
tk log(g i ( x )) < /2.
i =1

Khi đó ta có
m

k
B0 B(xk, tk) B(x0, tk) = f(x0) tk log(g i ( x )) <
i =1

< f(x0) + /2 f(x*) + = f(x*) + B0 f(x*) = B0.
điều này không thể xẩy ra. Mâu thuẫn này kết thúc chứng minh định lý.

2.5. ma trận Hessian của hàm chắn
Khó khăn gặp phải khi sử dụng phơng pháp hàm chắn là các bài toán không
ràng buộc: min {f + t} ngày càng trở nên khó giải khi tham số chắn t tiến dần
38


tới 0. Lý do là vì chỉ số điều kiện của ma trận Hessian của hàm mục tiêu f + t
tại điểm cực tiểu ngày càng lớn nh minh hoạ ở ví dụ sau.
Ví dụ 2.4. Xét bài toán:
(P)

min {f(x) = x 12 + x 22 : x1 1 0, x2 + 1 0}.


Dễ thấy rằng x* = (1, 0)T và * = (2, 0)T. Hàm mục tiêu chắn là
B(x, t) = x 12 + x 22 - t.log(x1 1) t.log(x2 + 1).
Hàm này là lồi. Thật vậy, véctơ građiên và ma trận Hesian của nó có dạng
t

2x1

x

1
1
và 2B(x, t) =
B(x, t) =
t

2x 2 x + 1


2

t

2 +
( x1 1) 2


0






.
t

2+
2
( x 2 + 1)
0

Do t > 0 nên ma trận Hessian 2B(x, t) xác định dơng trên miền xác định
của B(., t). Khi đó điểm cực tiểu là nghiệm của hệ phơng trình:
2x1 -

t
= 0,
x1 1

2x2 -

t
= 0,
x2 +1

x1 > 1, x2 > - 1,
nghĩa là
x1(t) = (1/2)( 1 + 1 + 2t ),

39



x2(t) = (1/2)(- 1 + 1 + 2t ).
Khi t 0+ ta có x1(t) 1, x2(t) 0, nghĩa là (x1(t), x2(t)) hội tụ tới
nghiệm x* của bài toán (P). Bây giờ để tính chỉ số điều kiện của 2B(x, t) trớc
hết ta nhận xét rằng
t
1
2t
=
.
( x 1 ( t ) 1) 2
1 + 1 + 2t x1 ( t ) 1
bởi vì x1(t) 1 = (1/2)(- 1 + 1 + 2t ). Do
lim
t 0

2
2t
= lim
= lim
2 1 + 2t = 2
t 0 (1 + 2 t ) 1 / 2
t 0
1 + 1 + 2t

nên ta có
2+

t
+ khi t 0.

( x1 ( t ) 1) 2

Mặt khác, do x2(t) 0 nên ta có
t
0 khi t 0.
( x 2 ( t ) + 1) 2
Vì thế chỉ số điều kiện c(t) của 2B(x(t), t) tiến ra vô cùng khi t 0.
Sự kiện chỉ số điều kiện c(t) + bác bỏ việc sử dụng phơng pháp tìm
cực tiểu không ràng buộc mà tốc độ hội tụ của nó phụ thuộc vào chỉ số điều kiện
của ma trận Hessian tại lời giải (nghiệm). Đó là lý do tại sao các phơng pháp
kiểu Newton thờng là phơng pháp đợc lựa chọn. Tuy nhiên, khi áp dụng vào quy

40


hoạch tuyến tính có duy nhất nghiệm thì phơng pháp hàm chắn không gây ra
điều kiện xấu, nh đợc minh hoạ ở ví dụ sau.
Ví dụ 2.5. Xét bài toán
min {x1 + x2 : x1 0, x2 0}.

(P)

Lời giải tối u là x* = (0, 0)T và véctơ nhân tử Lagrange là * = (1, 1)T. Hàm
mục tiêu chắn có dạng
B(x, t) = x1 + x2 t.logx1 t.logx2.
Do
t

1
x1

và 2B(x, t) =
B(x, t) =
t

1 x

2

t
2
x1

0



0

t
x 22

nên ta có x1(t) = x2(t) = t là điểm cực tiểu của B(., t) và chỉ số điều kiện của
2B(x, t) bằng 1!
Đối với các ràng buộc đẳng thức, các hàm chắn không đợc xác định, bởi vì
phần trong của miền chấp nhận trong trờng hợp này bằng rỗng. Vì thế, khi trong
bài toán có cả ràng buộc đẳng thức và ràng buộc bất đẳng thức thì ta cần giữ lại
ràng buộc đẳng thức ở các bài toán phụ với hàm mục tiêu chắn. Chẳng hạn, nếu
bài toán cần giải có dạng
min {f(x) : Ax = b, x 0}.
thì các bài toán chắn phụ là


41


n

min {f(x) t. log x j : Ax = b, x > 0}.
j=1

Trờng hợp bài toán không lồi
Trên đây ta đã xét trờng hợp bài toán lồi. Ta cũng có thể nhận đợc các kết
quả tơng tự cho trờng hợp bài toán không lồi, nhng chỉ ở lân cận của điểm cực
tiểu địa phơng x*. Chẳng hạn, định lý sau đây đã đợc chứng minh cho bài toán
tối u:
min {f(x) : gi(x) 0, i = 1, 2, , m},

(P)

trong đó f và gi, i = 1, 2, , m, là các hàm hai lần khả vi liên tục. Ta cũng cần
giả thiết phần trong của miền ràng buộc của bài toán là khác rỗng.
Định lý 2.2. Cho x* là một điểm cực tiểu địa phơng của bài toán (P). Giả
sử x* là điểm chính qui và điều kiện đủ cấp hai đợc thoả mãn. Khi đó:
a) Tồn tại duy nhất một hàm x(t) khả vi liên tục xác định với mọi t dơng
đủ nhỏ và là điểm cực tiểu địa phơng của hàm mục tiêu f(x) + t(x)
trong một lân cận của điểm x* sao cho x(t) x* khi t 0.
b) i(t) = -

t
i , nhân tử Lagrange thứ i tơng ứng với x*.
g i ( x ( t ))


c) 2x (f + t)(x) là xác định dơng với t dơng đủ nhỏ.

42


Tóm lại. Chơng này đã trình bày phơng pháp hàm chắn mà thực chất là
phơng pháp hàm phạt điểm trong cho phép đa việc giải bài toán tối u có ràng
buộc về một dãy bài toán tối u không ràng buộc. Hàm chắn hay đợc sử dụng là
hàm chắn lôga và giá trị cực tiểu không ràng buộc sẽ hội tụ tới giá trị cực tiểu có
ràng buộc của bài toán ban đầu.

43



×