Tải bản đầy đủ (.pdf) (61 trang)

Luận văn về điều kiện tối ưu bậc hai cổ điển của các bài toán tối ưu phi tuyến

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (451.32 KB, 61 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
======

BÙI ANH ĐỨC

VỀ ĐIỀU KIỆN TỐI ƯU BẬC HAI CỔ ĐIỂN CỦA
CÁC BÀI TOÁN TỐI ƯU PHI TUYẾN

LUẬN VĂN THẠC SĨ TOÁN HỌC

HÀ NỘI - 2018


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
======

BÙI ANH ĐỨC

VỀ ĐIỀU KIỆN TỐI ƯU BẬC HAI CỔ ĐIỂN CỦA
CÁC BÀI TOÁN TỐI ƯU PHI TUYẾN
Chuyên ngành: Toán Giải tích
Mã số: 8 46 01 02

LUẬN VĂN THẠC SĨ TOÁN HỌC
Người hướng dẫn khoa học: TS. NGUYỄN VĂN TUYÊN

HÀ NỘI - 2018



Lời cảm ơn
Luận văn “Về điều kiện tối ưu bậc hai cổ điển của các bài toán tối
ưu phi tuyến” là kết quả của quá trình cố gắng không ngừng của bản
thân tác giả và được sự giúp đỡ, động viên khích lệ của các thầy cô, bạn
bè đồng nghiệp và người thân.
Tác giả xin bày tỏ lòng biết ơn sâu sắc đối với T.S. Nguyễn Văn
Tuyên đã trực tiếp tận tình hướng dẫn, cũng như cung cấp tài liệu thông
tin khoa học cần thiết cho luận văn này.
Tác giả xin chân thành cảm ơn toàn thể các thầy cô giáo giảng viên
Khoa Toán, các thầy cô phòng Sau Đại học và các thầy cô của Trường
Đại Học Sư Phạm Hà Nội 2 đã giảng dạy cũng như đã tạo điều kiện để
cho tác giả hoàn thành tốt công việc nghiên cứu khoa học của mình.
Cuối cùng tác giả xin chân thành cảm ơn đồng nghiệp, đơn vị công
tác, gia đình và bạn bè đã động viên, tạo điều kiện giúp đỡ tôi trong quá
trình học tập và thực hiện luận văn.


Lời cam đoan
Tôi xin cam đoan rằng số liệu và kết quả nghiên cứu trong luận
văn này là trung thực và không trùng lặp với các đề tài khác. Tôi cũng
xin cam đoan rằng mọi sự giúp đỡ cho việc thực hiện luận văn này đã
được cảm ơn và các thông tin trích dẫn trong luận văn đã được chỉ rõ
nguồn gốc.
Tác giả luận văn

Bùi Anh Đức


Mục lục


1

Một số kiến thức chuẩn bị

8

1.1. Tập lồi và hàm lồi . . . . . . . . . . . . . . . . . . . . . .

8

1.1.1. Các khái niệm cơ bản . . . . . . . . . . . . . . . .

8

1.1.2. Hàm lồi trơn

. . . . . . . . . . . . . . . . . . . .

11

1.2. Nón tiếp tuyến . . . . . . . . . . . . . . . . . . . . . . .

11

1.2.1. Định nghĩa . . . . . . . . . . . . . . . . . . . . .

11

1.2.2. Ràng buộc trơn và tính chính quy metric . . . . .


13

1.3. Điều kiện tối ưu bậc nhất . . . . . . . . . . . . . . . . .

20

1.3.1. Bài toán trơn không có ràng buộc . . . . . . . . .

20

1.3.2. Bài toán trơn có ràng buộc . . . . . . . . . . . . .

22

2 Điều kiện tối ưu bậc hai cổ điển
2.1. Điều kiện MFCQ và điều kiện tối ưu bậc hai cổ điển . .

28
28

2.2. Điều kiện MFCQ cải biên và điều kiện tối ưu bậc hai cổ
điển . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

36

2.2.1. Mở rộng của bổ đề Hestenes . . . . . . . . . . . .

38

1



2.2.2.

Mở rộng bổ đề Yuan . . . . . . . . . . . . . . . .

42

2.2.3.

Kết quả tổng quát

. . . . . . . . . . . . . . . .

43

2.2.4. Kết quả chính . . . . . . . . . . . . . . . . . . . .

44

2.2.5. Một điều kiện chính quy mới . . . . . . . . . . . .

50

2


Mở đầu
1. Lý do chọn đề tài
Trong luận văn này, chúng tôi sẽ tập trung nghiên cứu các điều

kiện cần tối ưu bậc hai cho các bài toán tối ưu phi tuyến có dạng sau
min f (x)

(P)

n

x ∈ X := {x ∈ R : gi (x)

0, i ∈ I, hj (x) = 0, j ∈ J},

ở đó I = {1, . . . , p}, J = {1, . . . , q}, các hàm f : Rn → R, gi : Rn → R, và
hj : Rn → R là các hàm số thực và khả vi liên tục đến cấp hai trên Rn .
Hàm Lagrange suy rộng của bài toán (P) được định nghĩa bởi
p

q

L(x, λ0 , λ, µ) = λ0 f (x) +

λi gi (x) +
i=1

µj hj (x).
j=1

Hàm L(x, λ, µ) := L(x, 1, λ, µ) được gọi là hàm Lagrange của Bài toán
(P).
Với mỗi x ∈ X, tập chỉ số hoạt I(x), nón các hướng tới hạn C(x),
tập các nhân tử Lagrange suy rộng Λ0 (x), và tập các nhân tử Lagrange

Λ(x) được định nghĩa bởi:
I(x) = {i ∈ I | gi (x) = 0},
C(x) = {d | ∇f (x)t d

0, ∇gi (x)t d

0, i ∈ I(x), ∇hj (x)t d = 0, j ∈ J},
3


Λ0 (x) = {(λ0 , λ, µ) = 0 | ∇x L(x, λ0 , λ, µ) = 0,
(λ0 , λ) ∈ Rp+1
+ , λi gi (x) = 0, i ∈ I},
Λ(x) = {(λ, µ) | (1, λ, µ) ∈ Λ0 (x)}.
Như chúng ta biết rằng một nghiệm tối ưu địa phương x∗ của bài
toán (P) thỏa mãn điều kiện cần bậc nhất và bậc hai kiểu Fritz-John
như sau:
(1) Λ0 (x∗ ) = ∅;
(2) với mọi phương d ∈ C(x∗ ), tồn tại một nhân tử Lagrange suy rộng
(λ0 , λ, µ) sao cho
dt ∇2xx L(x∗ , λ0 , λ, µ)d

0;

(0.1)

xem [4]. Điều kiện cần tối ưu bậc hai (0.1) có thể viết lại tương đương
như sau:
sup
(λ0 ,λ,µ)∈Λ0 (x∗ )


dt ∇2xx L(x∗ , λ0 , λ, µ)d

0 ∀d ∈ C(x∗ ).

(0.2)

Điều kiện này có hai hạn chế. Hạn chế thứ nhất đó là nhân tử Lagrange
λ0 của hàm mục tiêu có thể bằng không; tức là khi đó hàm mục tiêu
không đóng vai trò gì trong điều kiện tối ưu này. Hạn chế thứ hai đó là
nhân tử (λ0 , λ, µ) không nhất thiết giống nhau cho tất cả các hướng tới
hạn. Muốn kiểm tra được điều kiện (0.2) ta phải kiểm tra tính nửa xác
định dương của cận trên đúng trên tập tất cả các nhân tử Lagrange của
một dạng toàn phương. Tuy nhiên, việc tính toán tập tất cả các nhân tử
Lagrange của (P) là một bài toán khó. Quan trọng hơn nữa đó là một
thuật toán chỉ đảm bảo được tính xấp xỉ nghiệm cho một cặp nhân tử
Lagrange.
4


Khi nhân tử Lagrange λ0 của hàm mục tiêu khác không, thì ta nói
x∗ thỏa mãn điều kiện tối ưu kiểu Karush–Kuhn–Tucker (KKT). Để đạt
được điều này thì x∗ phải thỏa mãn một điều kiện chính quy nào đó.
Như chúng ta đã biết, x∗ thỏa mãn điều kiện chuẩn hóa ràng buộc
độc lập tuyến tính (LICQ); tức là nếu các véctơ
∇gi (x∗ ), i ∈ I(x∗ ), ∇hj (x∗ ), j ∈ J,
độc lập tuyến tính, thì Λ(x∗ ) = {(λ, µ)} là tập một điểm và ta có
dt ∇2xx L(x∗ , λ, µ)d

0 ∀d ∈ C(x∗ ).


(0.3)

Điều kiện (0.3) được gọi là điều kiện cần tối ưu bậc hai cổ điển cho Bài
toán (P). Như đã phân tích ở trên, các điều kiện tối ưu kiểu này đóng vai
trò quan trọng về cả phương diện lý thuyết và ứng dụng của lý thuyết tối
ưu. Điều kiện (LICQ) là một điều kiện đủ để đảm bảo điều kiện cần tối
ưu bậc hai cổ điển. Tuy nhiên, trong nhiều trường hợp, điều kiện (LICQ)
là rất chặt. Nếu điều kiện (LICQ) không thỏa mãn, thì tập các nhân tử
(KKT) có thể không là tập một điểm và khi đó điều kiện (0.3) không
được thỏa mãn. Điều kiện tối ưu (0.3) đúng trong một số trường hợp đặc
biệt sau (xem [3]):
(i) tất cả các hàm gi và hj là affine;
(ii) các hàm f và gi là lồi, các hàm hj là affine và x∗ thỏa mãn điều kiện
Slater;
(iii) tồn tại (λ, µ) ∈ Rp+ × Rq sao cho (x∗ , λ, µ) là một điểm yên ngựa của
hàm Lagrange của Bài toán (P) khi λ0 = 1.
Gần đây, Baccari [1] đã chỉ ra rằng nếu điều kiện chuẩn hóa ràng
5


buộc Mangasarian–Fromovitz (MFCQ) thỏa mãn tại x∗ thì điều kiện
(0.3) chỉ đúng trong một số trường hợp như sau:
(C1) n
(C2) px∗

2,
2, ở đó px∗ là số ràng buộc hoạt bất đẳng thức tại x∗ .

Sau đó, Baccari và Trad [2] đã đề xuất một số điều kiện mới được

gọi là điều kiện chuẩn hóa ràng buộc Mangasarian-Fromovitz cải biên
(MMF) và điều kiện bù chặt (GSCS). Các tác giả đã chỉ ra rằng các điều
kiện (MMF) và (GSCS) là đủ để đảm bảo cho tính đúng đắn của các
điều kiện tối ưu bậc hai cổ điển.
Trên cơ sở các tài liệu tham khảo được trích dẫn ở trên, trong luận
văn này chúng tôi sẽ khảo sát các điều kiện tối ưu bậc hai cổ điển cho
các bài toán tối ưu phi tuyến với dữ liệu trơn C 2 .

2. Mục đích nghiên cứu
Nghiên cứu các điều kiện tối ưu bậc hai cổ điển cho các bài toán
tối ưu phi tuyến.

3. Nhiệm vụ nghiên cứu
Nghiên cứu các điều kiện chính quy và các điều kiện cần tối ưu bậc
hai cho các bài toán tối ưu phi tuyến với dữ liệu trơn C 2 .

6


4. Đối tượng và phạm vi nghiên cứu
• Đối tượng nghiên cứu: Điều kiện tối ưu bậc hai
• Phạm vi nghiên cứu: Lý thuyết tối ưu

5. Phương pháp nghiên cứu
Tham khảo và cập nhật những nghiên cứu của các tác giả trong
nước cũng như ngoài nước liên quan đến đề tài.

6. Dự kiến đóng góp mới
Luận văn sẽ trình bày một cách hệ thống về các điều kiện tối ưu
bậc hai cổ điển cho các bài toán tối ưu phi tuyến.


7


Chương 1
Một số kiến thức chuẩn bị
1.1.

Tập lồi và hàm lồi

1.1.1.

Các khái niệm cơ bản

Kí hiệu R := R ∪ {±∞} và gọi là tập số thực mở rộng.
Cho f : Rn → R là một hàm số. Miền hữu hiệu và tập trên đồ thị
của f tương ứng được kí hiệu bởi:
domf = {x ∈ Rn : f (x) < +∞} ,
epif = {(x, v) ∈ Rn × R : v ≥ f (x)} .
Định nghĩa 1.1. Một tập X ∈ Rn được gọi là lồi nếu với mọi x1 , x2 ∈ X
và α ∈ [0, 1], ta có (1 − α)x1 + αx2 ∈ X.
Định nghĩa 1.2. Bao lồi của một tập X được kí hiệu là conv X là giao
của tất cả các tập lồi chứa X.
Định nghĩa 1.3. Một điểm x0 của tập lồi X được gọi là điểm cực biên
nếu x0 không là điểm trong của bất cứ đoạn thẳng nào nằm trong X. Tức
là không tồn tại hai điểm x1 , x2 ∈ X và λ ∈ (0; 1) để x0 = λx1 +(1 − λ) x2 .
8


Định nghĩa 1.4. Một tập K ⊂ Rn được gọi là một nón nếu αx ∈ K với

mọi α > 0 và x ∈ K.
Bổ đề 1.1. Giả sử X là một tập lồi. Khi đó tập
cone(X) = {γx : x ∈ X, γ ≥ 0}
là một nón lồi.
Định nghĩa 1.5. Cho K là một nón. Tập hợp
K ◦ := {y ∈ Rn : y, x ≤ 0, ∀x ∈ K}
được gọi là nón cực của K.
Định nghĩa 1.6. Cho X là một tập lồi đóng và x ∈ X. Tập hợp
NX (x) = {v ∈ Rn : ΠX (x + v) = x}
được gọi là nón pháp tuyến của X tại x.
Theo định nghĩa, dễ dàng chứng minh được rằng
NX (x) = [cone(X − x)]◦ .
Định nghĩa 1.7. Một hàm số f được gọi là lồi nếu epif là một tập lồi.
Định nghĩa 1.8. Một hàm f được gọi là lõm nếu −f lồi.
Định nghĩa 1.9. Một hàm f được gọi là chính thường nếu f (x) > −∞
với mọi x và f (x) < +∞ với ít nhất một x.
Bổ đề 1.2. Một hàm f là lồi khi và chỉ khi với mọi x1 , x2 và 0 ≤ α ≤ 1
ta có
f (αx1 + (1 − α)x2 ) ≤ αf (x1 ) + (1 − α)f (x2 ).
9

(1.1)


Định nghĩa 1.10. Một hàm f được gọi là lồi chặt nếu bất đẳng thức
(1.1) là chặt với mọi x1 = x2 và 0 < α < 1.
Bổ đề 1.3. Nếu f lồi thì domf là một tập lồi.
Chứng minh. Nếu x1 ∈ domf và x2 ∈ domf , thì theo Bổ đề 1.2, ta có
f (αx1 + (1 − α)x2 ) < +∞.
Khi đó αx1 + (1 − α)x2 ∈ domf , nên domf là một tập lồi.

Bổ đề 1.4. Nếu fi , i ∈ I, là một họ các hàm lồi, thì
f (x) = sup fi (x)
i∈I

là một hàm lồi.
Bổ đề 1.5. Nếu f là một hàm lồi, thì với mọi x1 , x2 , . . . , xn và α1 ≥
0, α2 ≥ 0, . . . , αm ≥ 0 sao cho α1 + α2 + . . . + αm = 1, ta có
f (α1 x1 + α2 x2 + . . . + αm xm ) ≤ α1 f (x1 ) + α2 f (x2 ) + . . . + αm f (xm ).
Một hàm f : Rn → R được gọi là nửa liên tục dưới, nếu với mỗi
chuỗi hội tụ của các điểm xk thì ta có
f ( lim xk ) ≤ lim inf f (xk ).
k→∞

k→∞

Bổ đề 1.6. Một hàm f : Rn → R nửa liên tục dưới nếu và chỉ nếu tập
epif là một tập đóng.
Bổ đề 1.7. Cho X ⊂ Rn là một tập lồi và f : Rn → R là một hàm lồi.
Khi đó tập X các nghiệm của bài toán tối ưu
min f (x)
x∈X

là tập lồi.
10


1.1.2.

Hàm lồi trơn


Kí hiệu ∇f (x) cho gradient của hàm f tại x,


∂f (x)
 ∂x1 
 ∂f (x) 
 ∂x2 

∇f (x) =  .  ,
 .. 


∂f (x)
∂xn

ở đây x1 , x2 , . . . , xn biểu thị tọa độ của véctơ x.
Định lý 1.1. Giả sử rằng hàm f khả vi liên tục. Khi đó
(i) f lồi nếu và chỉ nếu với mọi x và y
f (y) ≥ f (x) + ∇f (x), y − x ;
(ii) f lồi chặt nếu và chỉ nếu với mọi x = y
f (y) > f (x) + ∇f (x), y − x .

1.2.

Nón tiếp tuyến

1.2.1.

Định nghĩa


Định nghĩa 1.11. Một phương d được gọi là phương tiếp tuyến của tập
X ⊂ Rn tại điểm x ∈ X nếu tồn tại dãy các điểm xk ∈ X và các vô
hướng τk > 0, k = 1, 2, . . . , sao cho τk ↓ 0 và
xk − x
.
d = lim
k→∞
τk
Từ định nghĩa này ta suy ra rằng xk → x vì nếu trái lại thì giới
hạn ở trên không tồn tại.
11


Bổ đề 1.8. Cho X ⊂ Rn và x ∈ X. Tập TX (x) của tất cả các phương
tiếp tuyến của X tại x là một nón đóng.
Chứng minh. Giả sử d ∈ TX (x). Với mọi β > 0 ta có
xk − x
,
k→0 (τk /β)

βd = lim

vì vậy dãy xk và τk /β thỏa mãn Định nghĩa 1.11 với phương βd. Do đó
TX (x) là một nón.
Lấy dj là một phương tiếp tuyến của X tại x và các dãy xj,k và
τj,k , k = 1, 2, . . . , thỏa mãn Định nghĩa 1.11, và limj→∞ dj = d. Vì dj là
phương tiếp tuyến, với mọi j, tồn tại k(j) sao cho
xj,k(j) − x
− dj ≤ dj − d .
τj,k(j)

Do đó

xj,k(j) − x
− d ≤ 2 dj − d .
τj,k(j)

Điều đó kéo theo rằng dãy xj,k(j) và τj,k(j) , j = 1, 2, . . ., thỏa mãn Định
nghĩa 1.11 với phương d. Vì vậy, nón TX (x) là đóng.
Các nón tiếp tuyến đóng vai trò quan trọng trong các điều kiện tối
ưu cho các bài toán tối ưu phi tuyến. Trong Định lí 1.4 (xem Mục 1.3.1.),
chúng ta chỉ ra rằng một tối ưu địa phương của bài toán
min f (x)
x∈X

thỏa mãn hệ thức
− f (ˆ
x) ∈ [TX (ˆ
x)]◦ .
Nói chung, các nón tiếp tuyến có thể không lồi. Điều này làm cho
việc phân tích các điều kiện tối ưu trở nên khó khăn. Tuy nhiên, trong
12


một số trường hợp đặc biệt và có ý nghĩa trong ứng dụng các nón này là
lồi.
Để thuận tiện ta kí hiệu
KX (x) = {d ∈ Rn : d = β(y − x), y ∈ X, β ≥ 0},
và gọi là nón của các hướng chấp nhận được tại x ∈ X.
Bổ đề 1.9. Cho X ⊂ Rn là tập lồi và x ∈ X. Khi đó
TX (x) = KX (x).

Chứng minh. Với mỗi d ∈ KX (x) là phương tiếp tuyến được định nghĩa.
Hơn nữa, KX (x) là nón lồi. Vì nón tiếp tuyến là đóng,
KX (x) ⊂ TX (x).
Nếu các tập này không bằng nhau, thì tồn tại h ∈ TX (x)\KX (x). Từ Định
lí tách [6, Theorem 2.14] tồn tại y = 0 sao cho y, h > 0 và y, d ≤ 0
với tất cả d ∈ KX (x). Từ h là phương tiếp tuyến của X tại x, tồn tại
một dãy các điểm xk của X và một dãy các vô hướng τk ↓ 0 thỏa mãn
Định nghĩa 1.11 với phương h. Do đó, ta được
1
1
y, h = y, lim (xk − x) = lim
y, xk − x .
k→∞ τk
k→∞ τk
Mỗi vectơ xk − x là phần tử của KX (x) và vì thế y, xk − x ≤ 0. Phương
trình hiển thị cuối cùng đưa ra y, h ≤ 0, mâu thuẫn với giả thiết về
tính chất tách của y.

1.2.2.

Ràng buộc trơn và tính chính quy metric

Trong các ứng dụng, ta thường gặp các tập hợp được định nghĩa
bởi một giao của một họ tập hợp có dạng sau
X = X 1 ∩ X2 ∩ . . . ∩ Xm .
13


Với một điểm x ∈ X ta luôn có
TX (x) ⊂ Tx1 (x) ∩ TX2 (x) ∩ ... ∩ TXm (x).

nhưng dấu đẳng thức không được đảm bảo. Mục đích chính của phần
này là đưa ra các điều kiện để đảm bảo đẳng thức này, cho các dạng
đặc biệt của tập Xi . Hơn nữa, chúng ta tính toán được nón cực [TX (x)]◦
trong trường hợp này.
Tập hợp chấp nhận được của các bài toán tối ưu phi tuyến thường
được định nghĩa bởi hệ các bất phương trình và phương trình:
gi (x) ≤ 0, i ∈ I,
hj (x) = 0, j ∈ J.
Ngoài ra, chúng ta có thể có các ràng buộc trừu tượng với dạng x ∈ X0 .
Để thuận tiện ta xét một hệ ràng buộc có dạng tổng quát sau
g(x) ∈ Y0

(1.2)

x ∈ X0 ,
ở đó g : Rn → Rm là khả vi liên tục, Y0 là tập lồi đóng trong Rm và X0
là tập lồi đóng trong Rn . Ví dụ, khi Y0 = {y ∈ Rp : y ≤ 0}, hệ (1.2) chỉ
có những ràng buộc về bất đẳng thức. Khi Y0 = {0} hệ chỉ có các ràng
buộc đẳng thức. Sự kết hợp của các ràng buộc về bất đẳng thức và đẳng
thức có thể nhận được bằng cách biểu diễn Y0 như là tích của các nửa
đường thẳng và các số 0.
Chúng ta sử dụng kí hiệu g (x) để biểu thị Jacobian của hàm g(·)

14


tại điểm x:


∂g1 (x)

 ∂x1
 ∂g2 (x)
 ∂x1

g (x) = 



..
.

∂gm (x)
∂x1

∂g1 (x)
∂x2
∂g2 (x)
∂x2



∂g1 (x)
∂xn

∂g2 (x) 
∂xn 

...
...


..
.

...

..
.

∂gm (x)
∂x2

...

∂gm (x)
∂xn

.



Kí hiệu X là tập hợp được định nghĩa bởi hệ (1.2),
X = {x ∈ X0 : g(x) ∈ Y0 },
và xét điểm x0 ∈ X. Cho d là một phương tiếp tuyến của X tại x0 , điều
đó suy ra d ∈ TX0 (x0 ). Hơn nữa, khi x0 bị nhiễu theo phương d, thì g(x0 )
bị nhiễu theo phương g (x0 )d. Do đó, g (x0 )d ∈ TY0 (y0 ). Vì vậy,
TX (x0 ) ⊂ {d ∈ Rn : d ∈ TX0 (x0 ), g (x0 )d ∈ TY0 (g(x0 ))}.
Bao hàm thức trên trở thành đẳng thức nếu các tập X0 và Y0 là
các tập lồi đa diện và nếu hàm số g(·) là affine.
Tuy nhiên, trong trường hợp tổng quát đẳng thức trên không đúng,
trừ khi hệ (1.2) có thêm tính chất, gọi là tính chính quy metric.

Định nghĩa 1.12. Hệ (1.2) được gọi là chính quy metric tại điểm x0 ∈ X
nếu tồn tại ε > 0 và C sao cho tất cả x˜ và u˜ thỏa mãn x˜ − x ≤ ε và
u˜ ≤ ε ta có thể tìm thấy xR ∈ X0 thỏa mãn
g(xR ) − u˜ ∈ Y0 ,
và sao cho
xR − x˜ ≤ C(dist(˜
x, X0 ) + dist(g(˜
x) − u˜), Y0 )).
Trong [6, Theorem A.10] đã chỉ ra rằng tính chính quy metric tương
đương với điều kiện Robinson sau:
{g (x0 ) − υ : d ∈ KX0 (x0 ), υ ∈ KY0 (g(x0 ))} = Rm .
15

(1.3)


Ta thấy rằng tập hợp vế trái của (1.3) là một nón, và do đó một cách
khác để biểu diễn điều kiện Robinson là
0 ∈ int{g (x0 )(x − x0 ) − (y − g(x0 )) : x ∈ X0 , y ∈ Y0 )}.
Đối với hệ chỉ gồm các ràng buộc đẳng thức g(x) = 0, khi X0 = Rn và
Y0 = 0, tính chính quy metric tương đương với độc lập tuyến tính của
các gradient của các ràng buộc
gi (x0 ), i = 1, . . . , m.
Vai trò của tính chính quy metric được thể hiện trong định lí sau.
Định lý 1.2. Nếu hệ (1.2) là chính quy metric, thì
TX (x0 ) = {d ∈ Rn : d ∈ TX0 (x0 ), g (x0 )d ∈ TY0 (g(x0 ))}.

(1.4)

Chứng minh. Trước tiên chúng ta hãy chứng minh rằng mọi phương tiếp

tuyến d là một phần tử của tập hợp ở vế bên phải của (1.4). Do X ⊂ X0 ,
phương d là một phần tử của Tx0 (x0 ). Từ Định nghĩa 1.11 tồn tại các
điểm xk ∈ X và đại lượng vô hướng τk ↓ 0 sao cho
xk − x
d = lim
.
k→∞
τk
Đặt y k = g(xk ), y0 = g(x0 ). Ta có
y k = y0 + g (x0 )(xk − x) + ok ,
với limk→∞ oτkk = 0. Chia phương trình cuối cùng cho τk và chuyển qua
giới hạn, ta được
yy − y 0
= g (x0 )d.
k→∞
τk
với y k ∈ Y0 , ta nhận được g (x0 )d ∈ TY0 (y0 ). Do đó, bao hàm thức “⊂” là
lim

đúng trong (1.4).
16


Chúng ta cần chứng minh điều ngược lại. Cho d là một phương
trong tập hợp ở vế phải của (1.4). Xét các điểm có dạng
x(τ ) = x0 + τ d,

τ > 0.

Do d ∈ TX0 (x0 ),

dist(x(τ ), X0 ) = o1 (τ ),

(1.5)

với o1 (τ )/τ → 0, khi τ ↓ 0. Như vậy,
g(x(τ )) = g(x0 ) + τ g (x0 )d + o2 (τ ),
với o2 (τ ) /τ → 0, khi τ ↓ 0. Từ g (x0 )d ∈ TY0 (g(x0 )), ta suy ra rằng
dist(g(x(τ )), Y0 ) ≤ o2 (τ ) + dist(g(x0 ) + τ g (x0 )d, Y0 ) = o3 (τ ). (1.6)
với o3 (τ )/τ → 0, khi τ ↓ 0. Do đó, các điểm x(τ ) "hầu hết" thuộc về X0
và "hầu hết" thỏa mãn các ràng buộc g(x) ∈ Y0 . Sai số không đáng kể
đối với τ . Bây giờ, ta có thể sử dụng tính chất của tính chính quy metric.
Đặt x˜ = x(τ ) và u˜ = 0 trong Định nghĩa 1.12, ta suy ra rằng τ đủ nhỏ
τ > 0 ta có thể tìm các điểm xR (τ ) ∈ X sao cho
xR (τ ) − x(τ )

C (dist(x(τ ), X0 ) + dist(g(x(τ )), Y0 )) .

Sử dụng (1.5) và (1.6) ta kết luận rằng
xR (τ ) − x0
= d.
lim
τ ↓0
τ
Do đó d là một phương tiếp tuyến của X tại x0 .
Bây giờ chúng ta có thể dễ dàng đưa ra các dạng đại số của nón
tiếp tuyến của hệ gồm các phương trình và bất phương trình. Xét hệ
gi (x) ≤ 0,

i = 1, . . . , p,


hj (x) = 0,

j = 1, . . . , q,

x ∈ X0 ,
17

(1.7)


với các hàm số khả vi liên tục g : Rn → Rp và h : Rn → Rq và một tập
lồi đóng X0 . Ta xét một điểm x0 thỏa mãn (1.7) và ta xác định tập hợp
các ràng buộc bất đẳng thức hoạt
I(x0 ) = {1 ≤ i ≤ p : gi (x0 ) = 0}.
Hệ (1.7) là một trường hợp đặc biệt của hệ (1.2) với
Y0 = {(y, 0) ∈ Rp × Rq : yi ≤ 0, i ∈ I(x0 )}.
Điều kiện Robinson (1.3) có dạng




 g (x )d − υ
0

 : d ∈ TX0 (x0 ), v ∈ Rm , vi ≤ 0, i ∈ I(x0 ) = Rp × Rq .


h (x0 )d
(1.8)
Vì tập hợp vế bên trái là một nón, nó tương đương với yêu cầu rằng 0

là một điểm trong của tập hợp này. Một điều kiện đủ đơn giản hơn của
tính chính quy metric có thể nhận được như sau.
Bổ đề 1.10. Giả sử rằng tồn tại một điểm xM F ∈ intX0 sao cho

và gradient

gi (x0 ), xM F − x0 < 0,

i ∈ I(x0 )

hj (x0 ), xM F − x0 = 0,

j = 1, . . . , q

(1.9)

hj (x0 ), j = 1, . . . , q là độc lập tuyến tính. Khi đó, hệ (1.7)

là chính quy metric tại x0 .
Chứng minh. Từ xM F là một điểm trong, tồn tại ε > 0 sao cho hình
cầu tâm xM F bán kính ε cũng bao gồm các điểm trong của X. Kí hiệu
B = {s ∈ Rn : s ≤ ε}. Khi đó
xM F − x0 + B ⊂ Kx0 (x0 ).
18


Theo (1.9) ta có thể chọn ε đủ nhỏ luôn dương và δ dương, sao cho
gi (x0 ), xM F − x0 + s < −δ,
Vì các gradient


∀i ∈ I(x0 ),

s ∈ B.

(1.10)

hi (x0 ), i = 1, . . . , p là độc lập tuyến tính, ta có
0 ∈ {h (x0 )s : s ∈ B}.

(1.11)

Chọn δ > 0 đủ nhỏ, ta có thể đảm bảo rằng hình cầu bán kính δ bao hàm
trong tập hợp bên vế phải của (1.11). Để kiểm nghiệm chính thức điều
kiện Robinson (1.11), chọn bất kì y, z ∈ Rp × Rq sao cho (y, z)

δ.

Từ (1.11), ta tìm s ∈ B sao cho h (x0 )s = z. Khi đó, hệ thức thứ hai của
(1.9) cho
h (x0 )(xM F − x0 + s) = z.
Hệ thức (1.10) ý nói rằng ta có thể tìm v ≤ 0 sao cho
g (x0 )(xM F − x0 + s) − υ = y.
Điểu này có nghĩa là phương d = xM F − x0 + s và phần tử υ tương ứng
được chọn ở tập hợp ở vế trái của (1.8) bằng (y, z). Điểu này có thể làm
với mọi (y, z) sao cho (y, z)

δ. Do đó, điều kiện Robinson là đúng

và hệ là chính quy metric.
Chúng ta phải nhấn mạnh rằng điều kiện của Bổ đề 1.10 không

tương đương với tính chính quy metric, bởi vì, chúng ta giả thiết rằng
xM F là điểm trong của X0 . Các giả thiết của Bổ đề 1.10 khi X0 = Rn
được biết đến là điều kiện chuẩn hóa ràng buộc Mangasarian–Fromovitz
(MFCQ). Trong trường hợp này, nó tương đương với tính chính quy
metric.
Bổ đề 1.11. Hệ (1.7) với X0 = Rn thỏa mãn điều kiện điều kiện chuẩn
hóa ràng buộc Mangasarian–Fromovitz tại một điểm x0 nếu và chỉ nếu
nó là chính quy metric tại x0 .
19


1.3.

Điều kiện tối ưu bậc nhất

1.3.1.

Bài toán trơn không có ràng buộc

Trong mục này chúng ta trình bày các điều kiện cần để cho một
điểm là tối ưu địa phương của các bài toán tối ưu. Cho f : Rn → R,
X ⊂ Rn và chúng ta xét bài toán
min f (x)
x∈X

Một điểm xˆ ∈ X được gọi là tối ưu địa phương của bài toán này nếu tồn
tại ε > 0 sao cho
f (y) ≥ f (ˆ
x), với mọi y ∈ X sao cho


y − xˆ ≤ ε.

Nếu f (y) ≥ f (ˆ
x) với mọi x ∈ X, điểm xˆ được gọi là tối ưu toàn cục.
Khi X = Rn , thì bài toán trên được gọi là bài toán tối ưu không
có ràng buộc.
Định lý 1.3. Giả sử f : Rn → R là khả vi tại xˆ.
(i) Nếu f (·) đạt được cực tiểu địa phương không có ràng buộc tại xˆ, thì
f (ˆ
x) = 0.

(1.12)

(ii) Nếu f (·) lồi và (1.12) được thỏa mãn thì xˆ là nghiệm tối ưu toàn
cục không có ràng buộc của f (·).
Chứng minh. (i) Từ định nghĩa về gradient, với mọi y ∈ Rn
f (y) = f (ˆ
x) +

f (ˆ
x), y − x) + r(ˆ
x, y)

trong đó
lim

y→ˆ
x

r(ˆ

x, y)
= 0.
y − xˆ
20


Nếu

f (ˆ
x) = 0 thì ta sẽ xét các điểm
y(τ ) = xˆ − f (ˆ
x), τ > 0.

Ta nhận được
f (y(τ )) − f (ˆ
x) =

f (ˆ
x), y(τ ) − xˆ + r(ˆ
x, y(τ ))

= −τ

f (ˆ
x)

2

(1.13)


+ r(ˆ
x, y(τ )).

Vì phần dư r(ˆ
x, y(τ )) là nhỏ tùy ý so với y(τ ) − xˆ khi τ → 0, ta có
thể chọn τ¯ > 0 sao cho ∀τ ∈ (0, τ¯)
r(ˆ
x, y(τ ))
1

y(τ ) − xˆ
2

f (ˆ
x) .

Điều này có thể biểu diễn tương đương là
r(ˆ
x, y(τ )) ≤

1
2

f (ˆ
x) 2 .

Thay thế bất đẳng thức cuối vào (1.13) ta kết luận rằng với mọi τ ∈ (0, τ¯)
1
f (y(τ )) − f (ˆ
x) ≤ − τ

2

f (ˆ
x) 2 .

Do đó, xˆ không thể là nghiệm tối ưu địa phương.
(ii) Nếu f (·) là lồi thì với mọi y ∈ Rn ta có
f (y) ≥ f (ˆ
x) +

f (ˆ
x, y − xˆ) = f (ˆ
x).

Vì vậy, xˆ là nghiệm tối ưu toàn cục.
Các điểm thỏa mãn điều kiện (1.12) được gọi là điểm dừng của
hàm f .

21


×