ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC KHOA HỌC
LƯƠNG QUỐC ĐĂNG
ĐIỀU KIỆN CHÍNH QUY GUIGNARD VÀ ĐIỀU KIỆN TỐI ƯU
CHO NGHIỆM HỮU HIỆU CỦA BÀI TOÁN TỐI ƯU ĐA MỤC
TIÊU KHÔNG TRƠN
CHUYÊN NGÀNH: TOÁN ỨNG DỤNG
MÃ SỐ: 60460112
2015
Mục lục
Mở đầu
1
1 Điều kiện chính quy Guignard và điều kiện KuhnTucker cho bài toán bán khả vi
3
1.1 Các định nghĩa và khái niệm . . . . . . . . . . . . . . .
3
1.2 Điều kiện chính quy Guignard . . . . . . . . . . . . . .
6
1.3 Điều kiện Kuhn-Tucker mạnh . . . . . . . . . . . . . .
9
2 Điều kiện Kuhn-Tucker cho bài toán tối ưu đa mục
tiêu Lipschitz địa phương
13
2.1 Các khái niệm . . . . . . . . . . . . . . . . . . . . . . .
13
2.2 Các điều kiện cần tối ưu . . . . . . . . . . . . . . . . .
19
2.3 Các điều kiện đủ tối ưu . . . . . . . . . . . . . . . . . .
26
Kết luận
28
Tài liệu tham khảo
29
i
Mở đầu
1. Lý do chọn đề tài
Lý thuyết các điều kiện tối ưu là một bộ phận quan trọng của tối ưu
hóa. Các điều kiện Kuhn - Tucker cho nghiệm hữu hiệu của bài toán
tối ưu đa mục tiêu mà tất cả các nhân tử Lagrange ứng với các thành
phần của hàm mục tiêu là dương và được gọi là các điều kiện Kuhn
- Tucker mạnh. Với điều kiện chính quy kiểu Guignard cho bài toán
tối ưu đa mục tiêu khả vi có ràng buộc bất đẳng thức. V. Preda và I.
Chitescu ([10], 1999) đã phát triển các điều kiện tối ưu kiểu Maeda [8]
cho bài toán tối ưu đa mục tiêu bán khả vi. Với điều kiện chính quy
Guignard, X. J. Long và N. J. Huang ([7], 2014) đã thiết lập các điều
kiện Kuhn - Tucker mạnh cho bài toán tối ưu đa mục tiêu với các hàm
Lipschitz địa phương dưới ngôn ngữ dưới vi phân suy rộng. Đây là đề
tài được nhiều tác giả quan tâm nghiên cứu. Chính vì vậy em chọn đề
tài : “Điều kiện chính quy Guignard và điều kiện tối ưu cho nghiệm hữu
hiệu của bài toán tối ưu đa mục tiêu không trơn”.
2. Mục đích của đề tài
Luận văn trình bày các kết quả nghiên cứu về điều kiện chính quy
Guignard và điều kiện tối ưu Kuhn - Tucker mạnh của V. Preda và
I. Chitescu (1999) và điều kiện Kuhn - Tucker của X. J. Long - N. J.
Huang (2014) cho nghiệm hữu hiệu của bài toán tối ưu đa mục tiêu
1
không trơn có ràng buộc bất đẳng thức.
3. Nội dung đề tài
Luận văn bao gồm phần mở đầu, hai chương, kết luận và danh mục
các tài liệu tham khảo.
Chương 1: Trình bày các kết quả của V. Preda và I. Chitescu về điều
kiện chính quy Guignard và điều kiện Kuhn-Tucker mạnh cho nghiệm
hữu hiệu của bài toán tối ưu đa mục tiêu bán khả vi.
Chương 2: Trình bày các kết quả nghiên cứu của X. J. Long, N. J.
Huang về điều kiện cần tối ưu và điều kiện đủ tối ưu dưới ngôn ngữ
dưới vi phân suy rộng với điều kiện chính quy Guignard.
Nhân dịp này tôi xin bày tỏ lòng biết ơn sâu sắc tới PGS.TS Đỗ Văn
Lưu, người đã tận tình hướng dẫn, giúp đỡ tôi hoàn thành bản luận
văn này.
Tôi xin chân thành cảm ơn Ban chủ nhiệm khoa Toán trường Đại
học Khoa học - Đại học Thái Nguyên cùng các thầy cô giáo đã tham
gia giảng dạy khóa học. Xin chân thành cảm ơn gia đình, bạn bè, đồng
nghiệp và các thành viên lớp Cao học Toán K7A đã luôn quan tâm,
động viên, giúp đỡ tôi trong suốt quá trình làm luận văn.
Thái Nguyên, ngày 16 tháng 04 năm 2015
Tác giả
Lương Quốc Đăng
2
Chương 1
Điều kiện chính quy Guignard và
điều kiện Kuhn-Tucker cho bài
toán bán khả vi
Chương 1 trình bày các kết quả nghiên cứu của V. Preda và I.
Chitescu ([10], 1999) về điều kiện chính quy Guignard cho bài toán
tối ưu đa mục tiêu có ràng buộc bất đẳng thức và điều kiện cần KuhnTucker mạnh cho nghiệm hữu hiệu của bài toán đó với các hàm bán
khả vi.
1.1
Các định nghĩa và khái niệm
Cho hai vectơ x và y trong Rn , ta sử dụng các quy ước sau:
x < y nếu và chỉ nếu xi < yi , ∀i, i = 1, 2, ..., n;
x ≤ y nếu và chỉ nếu x < y nhưng x = y;
x < y nếu và chỉ nếu xi < yi , ∀i, i = 1, 2, ..., n.
Chúng ta xét bài toán quy hoạch toán học đa mục tiêu sau đây:
(VP)
min f (x),
g(x) ≤ 0,
trong đó x ∈ Rn , f : Rn → Rp , f = (f1 , f2 , ..., fp ), g : Rn → Rm , g =
(g1 , g2 , ..., gm ). Kí hiệu
X = { x ∈ Rn | g(x)<0}
3
là tập chấp nhận được của bài toán (VP).
Định nghĩa 1.1.1.
Điểm x0 ∈ X được gọi là nghiệm hữu hiệu của bài toán (VP) nếu
không tồn tại x ∈ X sao cho f (x) ≤ f (x0 ).
Định nghĩa 1.1.2.
Điểm x0 ∈ X được gọi là nghiệm hữu hiệu yếu của bài toán (VP)
nếu không tồn tại x ∈ X sao cho f (x) < f (x0 ).
Định nghĩa 1.1.3.
Giả sử Q là một tập con khác rỗng của Rn . Nón tiếp tuyến của
Q tại x0 ∈ clQ là tập hợp xác định bởi
T (Q; x0 ) = {h ∈ Rn |∃ (xk )k ⊂ Q, với x0 = lim xk ,
k→∞
∃(tk )k , tk
> 0, sao cho h = lim tk (xk − x0 )},
k→∞
trong đó clQ là bao đóng của Q.
Định nghĩa 1.1.4.
Giả sử ϕ : Rn → R là hàm giá trị thực trên Rn .Ta nói rằng ϕ là
bán khả vi tại x0 nếu ϕ+ (x0 , x − x0 ) tồn tại với mọi x ∈ Rn , trong
đó
ϕ+ (x0 , x − x0 ) = lim+ λ−1 [ϕ(λx + (1 − λ)x0 ) − ϕ(x0 )].
λ→0
Nếu ϕ là khả vi Gâteaux theo mọi hướng, tức là với mọi u ∈ Rn , tồn
tại
lim λ−1 [ϕ(x0 + λu) − ϕ(x0 )] =ϕ+ (x0 , u)
λ→0
và ϕ+ (x0 , ·) là ánh xạ tuyến tính liên tục thì ϕ là bán khả vi tại x0 .
Định nghĩa 1.1.5.
Giả sử S ⊆ Rn là tập khác rỗng. Ánh xạ ϕ : S → R là tiền lồi
bất biến trên S nếu tồn tại hàm vectơ n-chiều η(x, u) trên SxS sao
cho với mọi x, u ∈ S và mọi λ ∈ [0, 1], ta có
ϕ(u + λη(x, u)) < λϕ(x) + (1 − λ)ϕ(u).
4
Trong trường hợp này ta nói rằng ϕ là tiền lồi bất biến theo η. Một
hàm vectơ k-chiều ψ : S → Rk là tiền lồi bất biến theo η nếu mỗi thành
phần của nó là tiền lồi bất biến trên S theo η.
Bổ đề 1.1.1. [11]
Giả sử S là một tập khác rỗng trong Rn và ψ : S → Rk là hàm
tiền lồi bất biến trên S theo η. Khi đó,
hoặc ψ(x) < 0 có một nghiệm x ∈ S,
hoặc là λT ψ(x)> 0, ∀x ∈ S, với λ ∈ Rk nào đó, λ ≥ 0,
nhưng không thể đồng thời cả hai. Ở đây
T
là ma trận chuyển vị.
Giả sử rằng các hàm fi , i ∈ P = {1, 2, ..., p} và gj , j ∈ M =
{1, 2, ..., m} là bán khả vi tại các điểm mà ta đang xét. Nếu p > 1
và i ∈ P, ta kí hiệu P i = P \{i}.
Định nghĩa 1.1.6.
Ta nói rằng ϕ : Rn → R bán khả vi tại x0 ∈ Rn là gần tuyến tính
tại x0 , nếu với mọi x ∈ Rn ,
ϕ(x) = ϕ(x0 ) + ϕ+ (x0 , x − x0 ).
Định nghĩa 1.1.7.
Ta nói rằng ϕ : Rn → R bán khả vi tại x0 ∈ Rn là tựa lồi tại x0 ,
nếu suy luận sau đây đúng với x ∈ Rn :
ϕ(x) < ϕ(x0 ) ⇒ ϕ+ (x0 , x − x0 ) < 0.
Hàm ϕ được gọi là tựa lõm tại x0 nếu -ϕ là tựa lồi tại x0 . Hàm ϕ được
gọi là giả lồi tại x0 nếu với x ∈ Rn ,
ϕ(x) < ϕ(x0 ) ⇒ ϕ+ (x0 , x − x0 ) < 0.
Hàm ϕ được gọi là giả lõm tại x0 nếu -ϕ là giả lồi tại x0 .
Rõ ràng là tính gần tuyến tính kéo theo tính tựa lồi (giả lồi) hoặc
tính tựa lõm (giả lõm).
5
1.2
Điều kiện chính quy Guignard
Xét điều kiện chính quy để ta có thể nhận được điều kiện cần KuhnTucker.
Nếu x0 là nghiệm chấp nhận được của bài toàn (VP), ta gọi B(x0 )
là tập các ràng buộc tích cực tại x0 , tức là
B(x0 ) = { j ∈ M| gj (x0 ) = 0}.
Với mỗi i ∈ P, các tập khác rỗng Qi (x0 ) và Q(x0 ) được xác định như
sau:
Q(x0 ) = { x ∈ X| f (x)
Qi (x0 ) = { x ∈ X| fk (x) ≤ fk (x0 ), k ∈ P i }, nếu p > 1,
Qi (x0 ) = Q(x0 ) nếu p = 1.
Định nghĩa 1.2.1.
Nón tuyến tính hóa Q(x0 ) tại x0 được định nghĩa bởi
C(Q(x0 ); x0 ) = { h ∈ Rn | fi+ (x0 , h) < 0, i ∈ P và
gi+ (x0 , h) < 0, j ∈ B(x0 )}.
Mệnh đề 1.2.1.
Nếu fi+ (x0 , ·), i ∈ P và gj+ (x0 , ·), j ∈ B(x0 ) là các hàm lồi trên
Rn thì C(Q(x0 ); x0 ) là nón lồi đóng.
Chứng minh.
Cho α > 0 và h ∈ C(Q(x0 ); x0 ). Khi đó, αh ∈ C(Q(x0 ); x0 ), bởi vì
fi+ (x0 , αh) = αfi+ (x0 , h) < 0, i ∈ P,
và tương tự,
gi+ (x0 , αh) < 0, j ∈ B(x0 ).
Bây giờ, giả sử h1 , h2 ∈ C(Q(x0 ); x0 ), và λ ∈ [0, 1] . Bởi vì các hàm
fi+ (x0 , ·), gi+ (x0 , ·) lồi, ta có với i ∈ P,
fi+ (x0 , λh1 + (1 − λ)h2 ) < λfi+ (x0 , h1 ) + (1 − λ)fi+ (x0 , h2 ) < 0,
6
và tương tự, với i ∈ B(x0 ),
gj+ (x0 , λh1 + (1 − λ)h2 ) < 0.
Cuối cùng, C(Q(x0 ); x0 ) là đóng, do sự kiện là nếu ta lấy một dãy
(hk )k ⊂ C(Q(x0 ); x0 ) sao cho hk → h0 , ta suy ra
fi+ (x0 , hk ) < 0, ∀k,
và do đó,
lim fi+ (x0 , hk ) = fi+ (x0 , h0 ) < 0, i ∈ P.
k
Tương tự, ta nhận được
gj+ (x0 , h0 ) < 0,
j ∈ B(x0 ).
Ta đã sử dụng tính liên tục của các hàm lồi fi+ (x0 , ·), gi+ (x0 , ·) trong
Rn .
Kết quả sau đây chỉ ra mối quan hệ giữa nón tiếp tuyến T (Qi (x0 ); x0 )
và nón tuyến tính hóa C(Q(x0 ); x0 ).
Bổ đề 1.2.1.
Giả sử rằng x0 là nghiệm chấp nhận được của bài toán (VP) và:
(A1) fi+ (x0 , ·), i ∈ P, và gj+ (x0 , ·), j ∈ B(x0 ) là các hàm lồi trên
Rn ;
(A2) fi , i ∈ P, và gj , j ∈ B(x0 ) là các hàm tựa lồi tại x0 .
Khi đó,
clcoT (Qi (x0 ); x0 ) ⊆ C(Q(x0 ); x0 ).
(1.1)
i∈P
Chứng minh.
Ta sẽ chứng minh cho p > 1, chứng minh cho p = 1 tương tự. Với
i ∈ P , ta đặt
C(Qi (x0 ); x0 ) = { h ∈ Rn | fk+ (x0 , h) < 0, k ∈ P i và
gj+ (x0 , h) < 0, j ∈ B(x0 )}.
7
Chứng minh tương tự Mệnh đề 1.2.1, ta có C(Qi (x0 ); x0 ) lồi đóng với
mọi i ∈ P . Rõ ràng là
C(Qi (x0 ); x0 ) = C(Q(x0 ); x0 ).
(1.2)
i∈P
Bây giờ ta sẽ chỉ ra rằng với mọi i ∈ P,
T (Qi (x0 ); x0 ) ⊆ C(Qi (x0 ); x0 ).
(1.3)
Giả sử i ∈ P và d ∈ T (Qi (x0 ); x0 ). Ta có dãy (xk )k ⊆ Qi (x0 ) và dãy
(tk )k trong R với tk > 0 sao cho
lim xk = x0 ,
k→∞
lim tk (xk − x0 ) = d.
k→∞
Với k ≥ 1, ta đặt
dk = tk (xk − x0 ).
Khi đó, với mọi j ∈ B(x0 ) và với mọi k ,
gj (xk ) = gj (x0 + (1/tk )dk ) < 0 = gj (x0 ),
(1.4)
f (x0 + (1/tk )dk ) < f (x0 ).
(1.5)
Sử dụng (1.4) và (1.5) và tính tựa lồi của các hàm fi , i ∈ P và gj ,
j ∈ B(x0 ), theo giả thiết (A2), với mọi k ta có
gj+ (x0 + (1/tk )dk ) < 0,
j ∈ B(x0 ),
(1.6)
fs+ (x0 + (1/tk )dk ) < 0,
s ∈ P i.
(1.7)
Sử dụng (1.6) và (1.7) và tính chất thuần nhất của fs+ và gj+ , với mọi
k , ta có
gj+ (x0 , dk ) < 0,
j ∈ B(x0 ),
(1.8)
fs+ (x0 , dk ) < 0,
s ∈ P i.
(1.9)
Do tính liên tục của các hàm lồi gj+ (x0 , ·), fs+ (x0 , ·) và do
lim dk = d,
k→∞
ta nhận được
gj+ (x0 , d) < 0,
j ∈ B(x0 ),
8
(1.10)
fs+ (x0 , d) < 0,
s ∈ P i,
(1.11)
cho nên (1.3) đúng. Vì vậy, do sự kiện là mọi C(Qi (x0 ); x0 ) lồi đóng,
ta có
co T (Qi (x0 ); x0 ) ⊆ C(Qi (x0 ); x0 ),
clco T (Qi (x0 ); x0 ) ⊆ C(Qi (x0 ); x0 ).
Vì vậy,
clco T (Qi (x0 ); x0 ) ⊆
i∈P
C(Qi (x0 ); x0 ).
i∈P
Theo (1.2), chứng minh được hoàn thành với p > 1. Với p = 1, ta lấy
C(Q(x0 ); x0 ) thay thế cho C(Qi (x0 ); x0 ) và lí luận tương tự ta nhận
được
clco T (Q(x0 ); x0 ) ⊆ C(Q(x0 ); x0 ).
Như vậy chứng minh là đầy đủ cho p > 1.
Nhận xét 1.2.1.
Nói chung, bao hàm thức ngược lại trong Bổ đề 1.2.1 không đúng.
Để nhận được các điều kiện cần cho bài toán (VP), ta đưa vào điều
kiện
C(Q(x0 ); x0 ) ⊆
clco T (Qi (x0 ); x0 ).
(1.12)
i∈P
Điều kiện (1.12) là một tổng quát hóa của điều kiện chính quy Guignard
trong quy hoạch toán học (xem [4], [8]).
Định nghĩa 1.2.2.
Ta nói rằng bài toán (VP) thỏa mãn điều kiện chính quy Guignard
suy rộng (GGCQ) tại x0 nếu (1.12) đúng.
1.3
Điều kiện Kuhn-Tucker mạnh
Trong trường hợp khả vi, điều kiện chính quy suy rộng này quy về
điều kiện chính quy Guignard suy rộng đã sử dụng bởi Maeda [8]. Ta
có điều kiện cần sau đây cho nghiệm hữu hiệu.
9
Định lí 1.3.1.
Giả sử x0 ∈ X là nghiệm hữu hiệu của bài toán (VP); p > 1 và
giả sử rằng:
(B1) Điều kiện chính quy (GGCQ) đúng tại x0 ;
(B2) fk , k ∈ P i , và gj , j ∈ B(x0 ) là tựa lồi tại x0 , fi tựa lõm tại
x0 ;
(B3) fi+ (x0 , ·) là hàm lõm trên Rn ;
(B4) fk+ (x0 , ·), k ∈ P i và gj+ (x0 , ·), j ∈ B(x0 ) là hàm lồi trên Rn .
Khi đó, hệ
fk+ (x0 , d) < 0,
k ∈ P i,
fi+ (x0 , d) < 0,
gj+ (x0 , d) < 0,
(1.13)
(1.14)
j ∈ B(x0 ),
(1.15)
không có nghiệm d ∈ Rn .
Chứng minh.
Giả sử ngược lại tồn tại d ∈ Rn sao cho (1.13)-(1.15) đúng.
Như vậy, ta có d ∈ C(Q(x0 ); x0 ). Sử dụng giả thiết (B1), ta có
clco T (Qi (x0 ); x0 ). Do đó, tồn tại một dãy {dm }m ⊆ co T (Qi (x0 ); x0 )
sao cho
(1.16)
lim dm = d.
m→∞
Nhưng với bất kỳ dm , m = 1, 2, ..., tồn tại các số km , λmp > 0, và
dmp ∈ T (Qi (x0 ); x0 ), p = 1, 2, ..., km , sao cho
km
km
λmk = 1,
k=1
λmk dmk = dm .
k=1
x0 ), tồn tại các dãy
(1.17)
Bởi vì dmk ∈ T (Qi (x0 );
{xnmk }n ⊆ Qi (x0 ) và
{tnmk }n ⊆ R, với tnmk > 0 với mọi n, sao cho với mọi m, k ,
lim xnmk = x0 ,
n→∞
lim tnmk (xnmk − x0 ) = dmk .
n→∞
Nếu
dnmk = tnmk (xnmk − x0 )
10
(1.18)
thì với bất kỳ n, ta có
fs (xnmk ) = fs (x0 + (1/tnmk )dnmk ) < fs (x0 ),
s ∈ P i,
(1.19)
gj (xnmk ) = gj (x0 + (1/tnmk )dnmk ) < 0 = gj (x0 ), j ∈ B(x0 ). (1.20)
Bởi vì x0 là nghiệm hữu hiệu của bài toán (VP), với bất kỳ n, ta có
fi (xnmk ) = fi (x0 + (1/tnmk )dnmk ) > fi (x0 ).
(1.21)
Sử dụng (1.19)-(1.20) và giả thiết (B2), ta nhận được
fi (x0 , dnmk ) > 0,
(1.22)
fs+ (x0 , dnmk ) < 0,
s ∈ P i,
(1.23)
gj+ (x0 , dnmk ) < 0,
j ∈ B(x0 ).
(1.24)
Do (1.16), (1.17), (1.22) và giả thiết (B3), ta nhận được
fi+ (x0 , d) > 0.
(1.25)
Cũng do (1.16)-(1.18), (1.23), (1.24), giả thiết (B4) và tính lồi của
fs+ (x0 , ·) và gj+ (x0 , ·), ta suy ra
fs+ (x0 , d) < 0,
s ∈ P i,
(1.26)
gj+ (x0 , d) < 0,
j ∈ B(x0 ).
(1.27)
Do (1.25)-(1.27), ta suy ra mâu thuẫn. Định lý được chứng minh.
Nhận xét 1.3.1.
Giả thiết (A1) trong Bổ đề 1.2.1 kéo theo giả thiết (B4).
Bây giờ ta trình bày điều kiện cần Kuhn-Tucker sau đây.
Định lí 1.3.2.
Giả sử rằng các giả thiết của Định lý 1.3.1 đúng. Khi đó, tồn tại
các vectơ λ ∈ Rn và µ ∈ Rm sao cho, với d ∈ Rn ,
i∈P
λi fi+ (x0 , d) +
j∈M
µi gj+ (x0 , d) > 0,
µi gj (x0 ) = 0,
(1.28)
(1.29)
j∈M
11
λ > 0,
(1.30)
µ > 0.
Chứng minh.
Giả sử x0 là nghiệm hữu hiệu của bài toán (VP). Theo định lý 1.3.1,
hệ (1.13)-(1.15) không có nghiệm d ∈ Rn . Sử dụng định lý Farkas [9]
trong trường hợp lồi, ta nhận được tồn tại λ ∈ Rp , λ > 0 và các số
thực µi > 0, j ∈ B(x0 ) sao cho với bất kỳ d ∈ Rn ,
µi gj+ (x0 , d) > 0.
λi fi+ (x0 , d) +
i∈P
j∈B(x0 )
Bây giờ, ta chứng minh như Maeda đã làm trong [8].
12
Chương 2
Điều kiện Kuhn-Tucker cho bài
toán tối ưu đa mục tiêu Lipschitz
địa phương
Chương 2 trình bày các kết quả nghiên cứu của X. J. Long và N. J.
Huang ([7], 2014) về điều kiện cần Kuhn-Tucker cho nghiệm hữu hiệu
của bài toán tối ưu đa mục tiêu không trơn với các ràng buộc bất đẳng
thức dưới ngôn ngữ dưới vi phân suy rộng, với điều kiện chính quy kiểu
Guignard. Với điều kiện Kuhn-Tucker mạnh và giả thiết về tính lồi suy
rộng thì một điểm chấp nhận được sẽ là nghiệm hữu hiệu. Các kết quả
trong chương này được tham khảo trong [5], [7].
2.1
Các khái niệm
Giả sử rằng X là không gian Banach thực, không gian đối ngẫu của
X là X ∗ được trang bị tô pô yếu*. Với bất kỳ A ⊂ X , ta kí hiệu clA,
coA và clcoA lần lượt là bao đóng, bao lồi và bao lồi đóng của tập hợp
A. Nón tiếp tuyến liên hoặc nón Bouligand của tập hợp A tại x ∈ clA
là
T (A, x) = {d ∈ X : ∃(tn , dn ) → (0+ , d) sao cho x + tn dn ∈ A}.
Chú ý T (A, x) là nón đóng trong X .
13
Giả sử f : X → R = R ∪ {∞} là hàm giá trị thực mở rộng. Đạo hàm
theo phương Dini dưới và trên của f tại x ∈ X theo phương d ∈ X
được định nghĩa bởi
f (x + td) − f (x)
,
t
t↓0
f (x + td) − f (x)
f + (x; d) = lim sup
.
t
t↓0
f − (x; d) = lim inf
Chú ý rằng nếu f là Lipschitz địa phương tại x thì f − (x; d) và
f + (x; d) liên tục theo d. Hàm f được gọi là khả vi theo phương tại
x ∈ X nếu với mọi phương d ∈ X thì đạo hàm theo phương thông
thường
f (x + td) − f (x)
f (x; d) = lim
t
t↓0
của f tại x theo phương d tồn tại và hữu hạn. Rõ ràng là nếu f khả vi
theo phương tại x ∈ X thì với mọi d ∈ X , ta có
f (x; d) = f − (x; d) = f + (x; d).
Chúng ta nhắc lại một số định nghĩa về dưới vi phân suy rộng (xem
[5]).
Định nghĩa 2.1.1.
Hàm f : X → R được gọi là có dưới vi phân suy rộng dưới
∂∗ f (x) ⊆ X ∗ tại x ∈ X nếu ∂∗ f (x) là đóng yếu* và
f + (x; d) ≥
x∗ ∈
x∗ , d , ∀d ∈ X.
inf
∂∗ f (x)
Định nghĩa 2.1.2.
Hàm f : X → R được gọi là có dưới vi phân suy rộng trên
∂ ∗ f (x) ⊆ X ∗ tại x ∈ X nếu ∂ ∗ f (x) là đóng yếu* và
f − (x; d) ≤
x∗ , d , ∀d ∈ X.
sup
x∗ ∈ ∂ ∗ f (x)
Một tập đóng yếu* ∂∗ f (x) được gọi là dưới vi phân suy rộng của f
tại x nếu nó là dưới vi phân suy rộng trên và dưới của f tại x
14
Nhận xét 2.1.1.
Chú ý rằng dưới vi phân suy rộng không nhất thiết là compact yếu*
hoặc lồi. Chẳng hạn, hàm f : R → R, xác định bởi
√
x,
nếu x ≥ 0;
√
f1 (x) =
− −x, nếu x < 0,
có dưới vi phân suy rộng không compact tại 0 là [α; ∞) với α ∈ R.
Mặt khác, hàm f xác định bởi f (x) = − |x| có dưới vi phân suy
rộng không lồi ∂ ∗ f (0) = {1, −1} tại 0.
Định nghĩa 2.1.3.
Hàm f : X → R được gọi là có dưới vi phân suy rộng bán chính
quy trên ∂ ∗ f (x) ⊆ X ∗ tại x ∈ X nếu ∂ ∗ f (x) là đóng yếu* và
f + (x; d) ≤
x∗ , d , ∀ d ∈ X.
sup
x∗ ∈ ∂ ∗ f (x)
Nhận xét 2.1.2.
Bởi vì f − (x; d) ≤ f + (x; d), ∀d ∈ X , cho nên một dưới vi phân suy
rộng bán chính quy trên là một dưới vi phân suy rộng trên của f tại x.
Nếu f là khả vi theo phương tại x theo mọi phương d thì mọi dưới vi
phân suy rộng trên cũng là dưới vi phân suy rộng bán chính quy của f
tại x.
Giả sử f : X → R là Lipschitz địa phương tại x ∈ X . Đạo hàm theo
phương suy rộng Clarke của f tại x theo phương d ∈ X được xác định
bởi
f (y + td) − f (y)
f 0 (x; d) = lim sup
y→x
t
t↓0
và gradient suy rộng Clarke của f tại x được xác định bởi
∂C f (x) = { ξ ∈ X ∗ | f 0 (x; d) ≥ ξ, d , ∀d ∈ X}.
(xem [2]). Ta có
f 0 (x; d) =
sup
ξ∈ ∂C f (x)
15
ξ, d , ∀d ∈ X.
Chú ý rằng, với mọi x ∈ X , ∂C f (x) là một tập compact yếu* khác
rỗng của X ∗ . Hơn nữa, với mọi x và d ∈ X , ta có
f − (x; d) ≤ f + (x; d) ≤ f 0 (x; d),
cho nên dưới vi phân Clarke ∂C f (x) là một dưới vi phân suy rộng bán
chính quy trên lồi compact yếu* của f tại x. Mặt khác, Ví dụ 2.1 của
[5] chỉ ra rằng bao lồi của dưới vi phân suy rộng trên của một hàm
Lipschitz địa phương có thể bao hàm hẳn trong dưới vi phân Clarke.
Do đó, với bài toán tối ưu bao gồm các hàm Lipschitz địa phương, các
kết quả về điều kiện cần tối ưu biểu diễn dưới ngôn ngữ dưới vi phân
suy rộng bán chính quy trên và dưới vi phân suy rộng trên là tốt hơn
điều kiện tối ưu biểu diễn dưới ngôn ngữ dưới vi phân Clarke.
Giả sử f : X → R hữu hạn tại điểm x ∈ X . Nếu f là nửa liên tục
dưới tại x thì dưới đạo hàm trên Clarke-Rockafellar của f tại x theo
phương v (xem [5]) được xác định bởi
f ↑ (x, v) = lim sup inf [f (x + tv ) − f (x )]/t,
x →f x v →v
t↓0
trong đó x → f x nghĩa là x → x và f (x ) → f (x).
Nếu f là nửa liên tục trên tại x thì dưới đạo hàm dưới ClarkeRockafellar của f tại x theo v được xác định bởi
f ↓ (x, v) = lim sup inf [f (x + tv ) − f (x )]/t.
x →f x v →v
t↓0
Nếu f liên tục tại x thì sự hội tụ x → f x trong các định nghĩa dưới
đạo hàm trên và dưới có thể được đơn giản hóa thành x → x. Dưới
gradients trên và dưới suy rộng của f tại x được cho bởi
∂ ↑ f (x) = x∗ ∈ X ∗ : x∗ , v ≤ f ↑ (x; v), ∀v ∈ X ,
∂ ↓ f (x) = x∗ ∈ X ∗ : x∗ , v ≥ f ↓ (x; v), ∀v ∈ X .
Nếu f ↑ (x; 0) > −∞ thì ∂ ↑ f (x) là tập hợp con khác rỗng, lồi, đóng
yếu* của X ∗ và với mỗi v ∈ X,
f ↑ (x, v) =
sup
x∗ ∈ ∂ ↑ f (x)
16
x∗ , v .
Tương tự, nếu f ↓ (x; 0) < ∞ thì ∂ ↓ f (x) là tập hợp con khác rỗng, lồi,
đóng yếu* của X ∗ và với mỗi v ∈ X,
f ↓ (x, v) =
inf
x∗ ∈ ∂ ↓ f (x)
x∗ , v .
Nếu f là Lipschitz địa phương tại x thì
f ↑ (x, v) = f ◦ (x, v),
f ↓ (x, v) = f◦ (x, v),
trong đó
f ◦ (x, v) = lim sup [f (x + tv) − f (x )]/t,
x →x
t↓0
f◦ (x, v) = lim inf [f (x + tv) − f (x )]/t
x →x
t↓0
là các đạo hàm theo phương suy rộng dưới và trên Clarke của f tại x
theo v . Dưới vi phân suy rộng Clarke được cho bởi
∂ ◦ f (x) = {x∗ ∈ X ∗ : x∗ , v ≤ f ◦ (x; v), ∀v ∈ X} .
Hơn nữa,
f ◦ (x, v) =
max
x∗ ∈ ∂ ◦ f (x)
x∗ , v ,
f◦ (x, v) =
min
x∗ ∈ ∂◦ f (x)
x∗ , v .
Do đó, nếu f là Lipschitz địa phương tại x thì ∂ ◦ f (x) là dưới vi phân
suy rộng của f tại x, bởi vì
fd− (x, v) ≤ f ◦ (x, v) và fd+ (x, v) ≥ f◦ (x, v), với mỗi v ∈ X.
Tương tự, nếu f là Lipschitz địa phương tại x thì đạo hàm theo
phương trên và dưới Michel-Penot của f tại x được xác định bởi
f ♦ (x, v) = sup lim sup λ−1 [f (x + λz + λv) − f (x + λz)],
z∈X
λ↓0
f♦ (x, v) = inf lim inf λ−1 [f (x + λz + λv) − f (x + λz)].
z∈X
λ↓0
Dưới vi phân Michel-Penot được xác định bởi
∂ ♦ f (x) := x∗ ∈ X ∗ : f ♦ (x, v) ≥ (x∗ , v), ∀v ∈ X .
17
Đạo hàm theo phương trên và dưới Michel-Penot f ♦ (x, ·) và f♦ (x, ·)
là hữu hạn, dưới tuyến tính, ∂ ♦ f (x) là lồi, compact yếu* và
f ♦ (x, v) =
max
x∗ ∈ ∂ ♦ f (x)
x∗ , v ,
f♦ (x, v) =
min
x∗ ∈ ∂ ♦ f (x)
x∗ , v .
(xem [5]).Do đó, ∂ ♦ f (x) cũng là dưới vi phân suy rộng của f tại x, bởi
vì
fd− (x, v) ≤ f ♦ (x, v) và fd+ (x, v) ≥ f♦ (x, v), với mỗi v ∈ X.
Hơn nữa, nếu X = Rn thì
∂ ◦ f (x) = co v ∈ Rn : ∃{xk } : xk → x, xk ∈ K, f (xk ) → v .
Như vậy, tập compact
v ∈ Rn : ∃{xk } : xk → x, xk ∈ K, f (xk ) → v
là dưới vi phân suy rộng của f tại x. Ở đây K là tập các điểm của Rn ,
trong đó f khả vi với đạo hàm f (x) tại x. Ví dụ sau đây minh họa cho
bao lồi của dưới vi phân suy rộng của hàm Lipschitz địa phương có thể
nằm hẳn trong cả dưới vi phân Clarke và Michel-Penot.
Ví dụ 2.1.1.
Định nghĩa f : R2 → R bởi
f (x, y) = |x| − |y| .
Ta có
∂ ∗ f (0) = {(1, −1), (−1, 1)}
là một dưới vi phân suy rộng của f tại 0. Ta lại có
∂ ♦ f (0) = ∂ ◦ f (0) = co({(1, 1), (1, −1), (−1, 1), (−1, −1)}).
Chú ý rằng
co(∂ ∗ f (0)) ⊂ ∂ ♦ f (0) = ∂ ◦ f (0).
18
2.2
Các điều kiện cần tối ưu
Xét bài toán tối ưu đa mục tiêu không trơn sau:
(MP)
Minimize f (x) = (f1 (x), f2 (x), ..., fp (x)).
x ∈ S = x ∈ X : g(x) = (g1 (x), g2 (x), ..., gm (x) < 0 ,
trong đó các hàm giá trị thực fi : X → R, i ∈ I := {1, 2, ..., p}, và
gj : X → R, j ∈ J := {1, 2, ..., m} là hàm Lipschitz địa phương trên
X . Kí hiệu J(x) là tập các chỉ số ràng buộc tích cực tại x ∈ S ∗ , tức là
J(x) = {j ∈ J : gj (x) = 0}.
Định nghĩa 2.2.1.
Hàm giá trị vectơ f : X → Rp được gọi là giả lồi mạnh tại x0 ∈ X
nếu với mọi x ∈ X ,
f (x) ≤ f (x0 ) ⇒ f + (x0 ; x − x0 ) ≤ 0.
Định nghĩa 2.2.2.
Hàm giá trị vectơ f : X → Rp được gọi là tựa lồi tại x0 ∈ X nếu
với mọi x ∈ X ,
f (x) < f (x0 ) ⇒ f + (x0 ; x − x0 ) < 0.
Ta định nghĩa các tập sau:
Q(x) = {y ∈ X : f (y) < f (x) và g(y) < 0},
Qi (x) = {y ∈ X : fk (y) < fk (x), k ∈ I\{i} và g(y) < 0},
Qi (x) = Q(x), nếu p = 1,
−
C(Q(x), x) = {d ∈ X : f −
i (x) < 0, i ∈ I, và gj (x) < 0, j ∈ J(x)},
C(Qi (x), x) = {d ∈ X : f −
k (x) < 0, k ∈ I\{i},
và gj− (x) < 0, j ∈ J(x)}.
Kết quả sau chỉ ra mối quan hệ giữa nón tiếp tuyến T (Qi (x), x) và
tập C(Q(x), x).
19
Mệnh đề 2.2.1.
Giả sử x ∈ S . Nếu fi− (x; ·) và gj− (x; ·), với i ∈ I và j ∈ J(x) là
các hàm lồi trên X thì
clcoT (Qi (x), x) ⊆ C(Q(x), x).
i∈I
Chứng minh.
Trước tiên, ta chỉ ra rằng C(Qi (x), x) là lồi và đóng với mọi i ∈ I .
Cho α > 0 và d ∈ C(Qi (x), x) . Khi đó, αd ∈ C(Qi (x), x) bởi vì
fk− (x; αd) = αfk− (x; d) < 0, k ∈ I\{i}
và
gj− (x; αd) < 0, j ∈ J(x).
Bây giờ, lấy d1 , d2 ∈ C(Qi (x), x) và λ ∈ [0, 1] . Bởi vì fi− (x; ·) và
gj− (x; ·) là các hàm lồi, với i ∈ I ta có
fi− (x; λd1 + (1 − λ)d2 ) < λfi− (x; d1 ) + (1 − λ)fi− (x; d2 ) < 0.
Tương tự, với j ∈ J(x),
gj− (x; λd1 + (1 − λ)d2 ) < 0.
Như vậy, C(Qi (x), x) là lồi với mọi i ∈ I .
Bởi vì fi và gj là Lipschitz địa phương và fi− (x; ·) và gj− (x; ·) với
i ∈ I và j ∈ J(x) lồi, ta có fi− (x, ·) và gj− (x, ·) liên tục. Khi đó
C(Qi (x), x) đóng với mọi i ∈ I.
Theo định nghĩa của C(Q(x), x) và C(Qi (x), x),
C(Qi (x), x).
C(Q(x), x) =
i∈I
Do đó,
clcoC(Qi (x), x).
C(Q(x), x) =
i∈I
Bây giờ, ta sẽ chỉ ra rằng, với mọi i ∈ I
T (Qi (x), x) ⊆ C(Qi (x), x).
Phần còn lại của chứng minh ta chứng minh tương tự Bổ đề 1.2.1.
20
Nhận xét 2.2.1.
Chú ý rằng một hàm dưới tuyến tính là một hàm lồi, nhưng điều
ngược lại không đúng. Giả sử, hàm f : [−1, 1] → R được xác định
√
bởi f (x) = 1 − x2 là một hàm lồi nhưng không dưới tuyến tính trên
[−1, 1]. Do đó, Mệnh đề 2.2.1 bổ sung Mệnh đề 3.1 của Li và Zhang [6].
Nhận xét 2.2.2.
Nếu f − (x; d) = f + (x; d) với mọi d ∈ X thì Mệnh đề 2.2.1 bổ sung
cho Mệnh đề 3.1 của Preda và Chitescu [10] bởi vì điều kiện f tựa lồi
tại x có thể bỏ được.
Để nhận được điều kiện cần của bài toán (MP) cho nghiệm hữu hiệu,
ta cần điều kiện chính quy và Bổ đề sau đây.
Định nghĩa 2.2.3.
Ta nói rằng bài toán (MP) thỏa mãn điều kiện chính quy Guignard suy rộng (GGCQ) tại x ∈ S nếu
clcoT (Qi (x), x).
C(Q(x), x) ⊆
i∈I
Bổ đề 2.2.1. [6]
Giả sử x là nghiệm hữu hiệu của bài toán (MP). Nếu fi+0 (x; ·) là
lõm với i0 ∈ X nào đó thì
{d ∈ X : fi+0 (x; ·) < 0} ∩
clcoT (Qi (x), x) = θ.
i∈I
Bây giờ, ta phát biểu điều kiện cần Kuhn-Tucker.
Định lí 2.2.1.
Giả sử x0 ∈ S là nghiệm hữu hiệu của bài toán (MP). Giả sử
rằng
(i) Điều kiện chính quy (GGCQ) đúng tại x0 ;
(ii) fi và gj có dưới vi phân suy rộng bán chính quy trên ∂ ∗ fi (x0 )
và dưới vi phân suy rộng trên ∂ ∗ gj (x0 ) , với i ∈ I và j ∈ J ;
(iii) fi+0 (x0 ; ·) lõm trên X với i0 ∈ I nào đó;
21
(iv) fi+ (x0 ; ·) lồi trên X với mọi i ∈ I ;
(v) gj− (x0 ; ·) lồi trên X với mọi j ∈ J(x0 );
(vi) Tồn tại d ∈ X sao cho gj− (x0 ; d) < 0 với mọi j ∈ J(x0 ).
Khi đó, tồn tại các số thực α = (α1 , ..., αp ) ∈ Rp+ với α = 0 và
β = (β1 , ..., βm ) ∈ Rm
+ sao cho
αi co∂ ∗ fi (x0 ) +
0 ∈ cl(
i∈I
βj co∂ ∗ gj (x0 )),
i∈J
βj gj (x0 ) = 0, j = 1, 2, ...m.
Chứng minh.
Bởi vì x0 ∈ S là nghiệm hữu hiệu của bài toán (MP), cho nên hệ sau
đây không có nghiệm d ∈ X :
fi+0 (x0 ; d) < 0,
fk+ (x0 ; d) < 0,
k ∈ I\{i0 },
gj− (x0 ; d) < 0,
j ∈ J(x0 ).
Thật vậy, giả sử ngược lại tồn tại v ∈ X là nghiệm của hệ trên. Điều
đó kéo theo rằng hệ
fi−0 (x0 ; d) < 0,
fk− (x0 ; d) < 0,
k ∈ I\{i0 },
gj− (x0 ; d) < 0,
j ∈ J(x0 ),
có nghiệm v ∈ X . Từ đó ta có v ∈ C(Q(x0 ), x0 ). Vì vậy, với điều kiện
(i) ta có
v ∈ {d ∈ X :fi+0 (x0 ; d) < 0} ∩
clcoT (Qi (x0 ), x0 ).
i∈I
Điều này mâu thuẫn với Bổ đề 2.2.1.
Do các điều kiện (iv) và (v) và định lý Farkas [9] trong trường hợp
lồi, ta suy ra tồn tại các số thực α = (α1 , ..., αp ) ∈ Rp+ và βj > 0 với
22
j ∈ J(x0 ), không đồng thời bằng không, sao cho
βj gj− (x0 ; d) > 0, ∀d ∈ X.
αi fi+ (x0 ; d) +
i∈I
j∈J(x0 )
Bây giờ ta chứng minh α = 0. Thật vậy, nếu α = 0 thì tồn tại j ∈ J(x0 )
sao cho βj > 0 và
βj gj− (x0 ; d) > 0, ∀d ∈ X.
(2.1)
j∈J(x0 )
Do điều kiện (vi), tồn tại d0 ∈ X sao cho
βj gj− (x0 ; d0 ) < 0.
j∈J(x0 )
Điều này mâu thuẫn với (2.1). Do đó, α = 0.
Sử dụng điều kiện (ii), ta có
αi
i∈I
x∗ , d +
sup
x∗ ∈∂ ∗ fi (x0 )
βj
y ∗ , d > 0, ∀d ∈ X.
sup
y ∗ ∈∂ ∗ gj (x0 )
j∈J(x0 )
Kí hiệu
αi ∂ ∗ fi (x0 ) +
C(x0 ) =
i∈I
βj ∂ ∗ gj (x0 ).
j∈J(x0 )
Ta suy ra
z∗, d
sup
z ∗ ∈C(x0 )
=
αi
i∈I
x∗ , d +
sup
x∗ ∈∂ ∗ fi (x0 )
βj
y∗, d
sup
y ∗ ∈∂ ∗ gj (x0 )
j∈J(x0 )
> 0, ∀d ∈ X .
Do phép tính thông thường của hàm tựa, ta có
αi ∂ ∗ fi (x0 ) +
0 ∈ clco(
i∈I
βj ∂ ∗ gj (x0 )).
j∈J(x0 )
Vì vậy
αi co∂ ∗ fi (x0 ) +
0 ∈ cl(
i∈I
βj co∂ ∗ gj (x0 )).
j∈J(x0 )
23