Tải bản đầy đủ (.pdf) (104 trang)

Điều kiện tối ưu cho một số lớp bài toán tối ưu hai cấp

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (500.97 KB, 104 trang )

ĐIỀU KIỆN TỐI ƯU CHO MỘT SỐ LỚP
BÀI TOÁN TỐI ƯU HAI CẤP
NGUYỄN LÊ DUY
(Học viên Cao Học khóa 16)
NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS. TS. NGUYỄN ĐỊNH
(Trường Đại Học Quốc Tế TP. HCM)
TP.Hồ Chí Minh - Năm 2009
Lời cảm ơn
Lời đầu tiên, tôi xin chân thành cảm ơn sâu sắc tới PGS. TS. NGUYỄN ĐỊNH,
người Thầy đã tận tình chỉ dẫn và truyền đạt kiến thức trong quá trình học tập và
luôn động viên để tôi hoàn thành luận văn này.
Tôi cũng xin bày tỏ lời cảm ơn tới tất cả các Thầy cô của Khoa Toán-Tin trường
Đại Học Khoa Học Tự Nhiên Tp.HCM đã giảng dạy tôi trong suốt quá trình học
tập tại trường.
Tôi xin cảm ơn gia đình đã tạo điều kiện tốt cho việc học của tôi và bạn bè đã hỗ
trợ trong việc hoàn thành luận văn này.
Tp. Hồ Chí Minh, tháng 9 năm 2009
Nguyễn Lê Duy
1
Lời nói đầu
Bài toán tối ưu hai cấp (Bilevel Optimization Problem) lần đầu tiên được
H.V.Stackelberg nghiên cứu vào năm 1934. Sau đó nó chính thức được giới thiệu
trong cộng đồng tối ưu vào thập kỷ 70 của thế kỷ thứ 20. Bài toán phát triển rất
nhanh chóng cả trong lý thuyết và ứng dụng thực tế. Các nhà toán học, nhà kinh tế
học và những kỹ sư đã và đang không ngừng phát triển vấn đề này cùng với đó là
số lượng các bài báo, tạp chí khoa học, ứng dụng trong kinh tế kỹ thuật xuất hiện
ngày càng nhiều hơn.
Bài toán tối ưu hai cấp là một bài toán tối ưu có cấp bậc trong đó một phần
các ràng buộc của bài toán - được gọi là bài toán cấp trên (upper level problem)
là tập nghiệm tối ưu của một bài toán tối ưu thứ hai - được gọi là bài toán cấp
dưới (lower level problem). Do đó bài toán này là một bài toán rất phức tạp. Tuy


nhiên trong thực tế có rất nhiều bài toán có mô hình toán học là bài toán tối ưu
hai cấp. Hơn nữa bài toán tối ưu hai cấp có mối liên hệ chặt chẽ với những bài toán
quan trọng khác, một trong số đó là bài toán MPECs (Mathematical Programs with
Equilibrium Constraints) - là bài toán mở rộng của bài toán đó, cũng có ứng dụng
rộng rãi trong giao thông, điều khiển robot, hệ thống mạng,. . .
Đối với bài toán tối ưu hai cấp, các nhà toán học nghiên cứu nhiều vấn đề: sự
tồn tại nghiệm, điều kiện tối ưu, các thuật toán,. . . Một vấn đề lớn trong việc nghiên
cứu bài toán này là điều kiện tối ưu của nó. Luận văn này trình bày một cách tổng
quan điều kiện tối ưu cho một số lớp bài toán tối ưu hai cấp quan trọng, bao gồm
lớp bài toán trơn, lớp bài toán lồi và tuyến tính, lớp bài toán lipschitz.
Cấu trúc chính của luận văn bao gồm bốn chương. Chương 1 trình bày các kiến
thức cơ bản sẽ sử dụng cho các chương sau. Chương 2 giới thiệu bài toán tối ưu hai
cấp tổng quát và các mô hình các bài toán thực tế.
Phần chính là điều kiện cần tối ưu sẽ trình bày ở chương 3 và chương 4 trong đó đề
cập đến các lớp bài toán tối ưu hai cấp hữu hạn và bài toán tối ưu hai cấp vô hạn.
2
Mục lục
Lời cảm ơn 1
Lời nói đầu 2
1 Một số kiến thức cơ bản 5
1.1 Một số kiến thức cơ bản về giải tích lồi . . . . . . . . . . . . . . . . . 5
1.2 Hàm Lipschitz và dưới vi phân Clarke . . . . . . . . . . . . . . . . . . 11
1.3 Một số kiến thức cơ bản về giải tích đa trị . . . . . . . . . . . . . . . 12
1.4 Dưới vi phân, nón pháp tuyến và đối đạo hàm Mordukhovich . . . . . 16
2 Khái niệm về bài toán tối ưu hai cấp tổng quát 22
2.1 Giới thiệu bài toán . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2 Mô hình các bài toán thực tế . . . . . . . . . . . . . . . . . . . . . . 27
3 Điều kiện tối ưu cho bài toán hai cấp hữu hạn 33
3.1 Điều kiện tối ưu khi bài toán cấp dưới lồi . . . . . . . . . . . . . . . . 34
3.2 Điều kiện tối ưu sử dụng dưới vi phân Mordukhovich . . . . . . . . . 49

3.3 Điều kiện tối ưu sử dụng dưới vi phân Clarke . . . . . . . . . . . . . 62
4 Điều kiện tối ưu cho bài toán hai cấp vô hạn 80
4.1 Bài toán hai cấp vô hạn . . . . . . . . . . . . . . . . . . . . . . . . . 80
4.2 Điều kiện tối ưu cho bài toán DC vô hạn . . . . . . . . . . . . . . . . 81
4.3 Điều kiện tối ưu cho bài toán hai cấp vô hạn . . . . . . . . . . . . . . 87
3
4.4 Điều kiện cần và đủ cho bài toán hai cấp lồi đơn giản . . . . . . . . . 93
Kết luận 99
Tài liệu tham khảo 101
4
Chương 1
Một số kiến thức cơ bản
1.1 Một số kiến thức cơ bản về giải tích lồi
(1) Tập lồi và hàm lồi
Giả sử X là không gian vectơ.
Định nghĩa 1.1.1 [1] Tập K ⊆ X là lồi nếu
∀x, y ∈ K, ∀λ ∈ [0, 1], λx + (1 − λ)y ∈ K.
Với K = ∅, bao lồi của K, ký hiệu là co(K), là tập tất cả các tổ hợp lồi hữu hạn
của K, tức là
co(K) := {

i∈I
α
i
x
i

i
≥ 0, x
i

∈ S, ∀i ∈ I;

i∈I
α
i
= 1, | I |< ∞}.
Như vậy, bao lồi của K là tập lồi nhỏ nhất chứa K.
Định nghĩa 1.1.2 [1] Cho hàm số f : X → R. Khi đó f được gọi là hàm lồi nếu
∀x, y ∈ X, ∀λ ∈ [0, 1], λf (x) + (1 − λ)f (y) ≥ 0.
Cho X, Y là các không gian vectơ. S là nón lồi trong Y .
Định nghĩa 1.1.3 [1] Cho hàm số f : X → Y . Khi đó f được gọi là hàm S–lồi nếu
5
∀x, y ∈ X, ∀λ ∈ [0, 1], λf (x) + (1 − λ)f (y) − f(λx + (1 − λ)y) ∈ S.
Nhận xét 1.1.1 Trường hợp f lồi là một trường hợp đặc biệt của hàm S–lồi khi
S = R
+
.
(2) Dưới vi phân của hàm lồi, đối ngẫu của hàm lồi
(a) Dưới vi phân của hàm lồi
Cho f là hàm số lồi, một hàm số lồi thì có thể không có đạo hàm do đó ta xét
tới khái niệm sau. Chúng ta cần nêu ra vài khái niệm cơ bản:
Hàm số thực mở rộng f : X → R trong đó trong đó R = R

{+∞; −∞}
Miền hữu hiệu (domain) domf := {x ∈ X|f(x) < ∞} và đồ thị trên (epigraph)
epif := {(x, α) ∈ X × R|f(x) ≤ α}.
Định nghĩa 1.1.4 [1] Cho hàm số f : X → R lồi, và X

là không gian đối ngẫu
của không gian vectơ X. Giả sử x

o
∈ X và f(x
o
) = ±∞. Khi đó dưới vi phân của
hàm lồi f tại x
o
được xác định như sau
∂f(x
o
) := {x

∈ X

: x

, x − x
o
 ≤ f(x) − f(x
o
), ∀x ∈ X}. (1.1)
Nếu f không hữu hạn tại x thì ∂f(x
o
) = ∅.
Mỗi thành phần x

∈ ∂f(x
o
) được gọi là dưới gradient của dưới vi phân ∂f(x
o
), khi

đó ∂f(x
o
) còn gọi là tập các dưới gradient.
Đây là định nghĩa dưới vi phân cổ điển của hàm số f. Các phần sau ta sẽ nêu các
định nghĩa dưới vi phân mở rộng.
(b) Đối ngẫu của hàm lồi
Cho X là không gian Banach và hàm f : X → R lồi, luôn luôn proper nghĩa là
f(x) = ∞ trên X. Gọi X

là không gian đối ngẫu của X.
6
Định nghĩa 1.1.5 [1] Hàm đối ngẫu f

: X

→ R của f, được xác định như sau:
f

(x

) := sup{x

, x − f(x)|x ∈ X}.
Nhận xét 1.1.2 Do f(x) = +∞(x ∈ domf) suy ra sup {x

, x − f(x)|x ∈ X}
luôn = ∅ nên f

(x


) cũng = sup {x

, x − f(x)|x ∈ domf}.
Cho hàm f : X → R lồi, là proper nếu f(x) = ∞ trên X. Nhắc lại hàm đối ngẫu
f

: X

→ R đối với f, xác định bởi f

(x

) := sup {x

, x − f(x)| x ∈ X =
sup {x

, x − f(x)| x ∈ domf}.
Cho hàm f : X → R lồi tại x ∈ domf và ε > 0 bất kì, thì dưới vi phân xấp xỉ của
hàm f là ∂
ε
f(x) := {x

∈ X

| x

, x − x ≤ f(x) − f(x) + ε ∀x ∈ X}, ε ≥ 0
Nếu ε = 0 thì ta có ∂
ε

f(x) = ∂
o
f(x) là dưới vi phân cổ điển có dạng như (1.1).
(3) Bài toán quy hoạch lồi và điều kiện tối ưu
(a) Bài toán quy hoạch lồi đơn giản
Xét bài toán (P) :









inff(x)
g
i
(x) ≤ 0 i = 1,. . . , n
x ∈ C
trong đó X là không gian định chuẩn, C là tập lồi đóng trong X, f : X → R là hàm
lồi, g
i
: X → R là hàm lồi liên tục.
Một bài toán tối ưu có dạng như bài toán (P) ở trên được gọi là bài toán quy hoạch
lồi đơn giản. Sau đây ta sẽ xét các điều kiện tối ưu phổ biến của bài toán này.
Điều kiện tối ưu, nói đầy đủ là điều kiện tối ưu cho một số lớp bài toán tối ưu có
nghiệm (nghiệm địa phương hay toàn cục). Thông thường người ta tìm được điều
kiện cần, còn điều kiện đủ thì khó khăn hơn. Các dạng điều kiện phổ biến là điều
kiện tối ưu dạng Fritz John và điều kiện tối ưu dạng KKT (Karush–Kuhn-

Tucker).
Sau đây chúng tôi xin nêu một kết quả về điều kiện tối ưu cho bài toán này.
Phần chứng minh sẽ được làm rõ trong phần bài toán quy hoạch lồi tổng quát ngay
sau đây. Hai điều kiện chính quy sau đây xem trong [1].
7
Định nghĩa 1.1.6 (Điều kiện chính quy Slater) (Slater) ∃ x ∈ C, g
i
(x) < 0, i =
1, . . . , n và f liên tục tại x.
Định lý 1.1.1 [1] (Điều kiện cần và đủ dạng KKT)
Giả sử f, g
i
, i = 1, . . . , n và C thỏa mãn giả thiết của bài toán (P). Giả sử (Slater)
thỏa mãn. Khi đó a ∈ C là nghiệm cực tiểu toàn cục của (P) khi và chỉ khi
∃(λ
1
, . . . , λ
n
) ∈ R
n
+
sao cho



0 ∈ ∂f(a) +

n
i=1
λ

i
∂g
i
(a) + N
C
(a)
λ
i
g
i
(a) = 0∀i = 1, . . . , n
trong đó ∂f(x) kí hiệu cho dưới vi phân của hàm số f tại điểm x.
(b) Bài toán quy hoạch lồi tổng quát
Một bài toán tối ưu có dạng như bài toán sau đây được gọi là bài toán quy hoạch
lồi tổng quát
(P
tq
) :









inff(x)
g(x) ∈ −S
x ∈ C

với giả thiết cơ bản (GTCB) sau: X, Y là các không gian định chuẩn thực, C là một
tập lồi khác rỗng của X, f : X → R là hàm lồi liên tục, S là nón lồi đóng trong Y
và g : X → Y là hàm S–lồi và liên tục.
Mô hình bài toán này là khá tổng quát, rõ ràng khi S = R
n
+
thì đó là bài toán
ta xét ở đầu mục, ngoài ra nó còn bao quát hai dạng bài toán sau:
(U) :















inff(x)
g
i
(x) ≤ 0 i = 1,. . . , n
A
1

x = b
1
x ∈ C
8
trong đó A
1
∈ L(X, R
m
) và b
1
∈ R
m
.
Một bài toán thứ hai cũng tương tự như bài toán (U), chỉ thay A
1
x = b
1
bởi A
2
x = b
2
, và thay i ∈ {1, . . . , n} bởi i ∈ I trong đó I là tập chỉ số tùy ý,
A
2
∈ L(X, Y
2
) với Y
2
là không gian định chuẩn và b
2

∈ Y
2
.
Ta có thể chuyển hai bài toán này về bài toán lồi tổng quát dễ dàng.
Bây giờ, gọi A = {x ∈ X|x ∈ C, g(x) ∈ −S} là tập các điểm chấp nhận được
của (P), rõ ràng tập A là lồi đóng trong X.
Định nghĩa 1.1.7 [1] Nón đối ngẫu dương của nón lồi S, ký hiệu S
+
, được xác
định:
S
+
= {y

∈ Y | < y

, s > ≥ 0, ∀s ∈ S}
Định lý 1.1.2 ([1], Điều kiện cần tối ưu Fritz–John) Xét bài toán (P
tq
) và
các (GTCB) thỏa mãn và intS = ∅ và a ∈ A. Khi đó nếu a là nghiệm của (P) thì
∃λ
o
∈ R
+
, λ ∈ S
+
không đồng thời bằng 0 sao cho:




0 ∈ λ
o
∂f(a) + ∂(λg)(a) + N
C
(a)
λg(a) = 0
trong đó ∂f(x) ký hiệu cho dưới vi phân của hàm số f tại điểm x.
Chứng minh.
Vì a ∈ A là nghiệm của (P
tq
) nên hệ sau vô nghiệm theo x ∈ C :
−(f(x) − f(a)) ∈ intR
+
, g(x) ∈ −S, x ∈ C
Do vậy hệ sau vô nghiệm −(f(x) − f(a), g(x)) ∈ int(R
+
× S), x ∈ C, nghĩa là tồn
tại λ = (λ
o
, λ) ∈ (R
+
× S)
+
với λ = (0, 0) sao cho
λ(f(x) − f(a), g(x)) = λ
0
(f(x) − f(a)) + λg(x) ≥ 0, ∀x ∈ C
hay λ
o

f(x) − λ
0
f(a) + λg(x) ≥ 0, ∀x ∈ C(1), cho x = a ta được λg(x) ≥ 0. Mặt
khác ta có λg(x) ≤ 0 (do λ ∈ S
+
, g(a) ∈ −S), suy ra λg(x) = 0(2).
Từ (1) và (2) ta có: λ
o
f(x)+λg(x) ≥ λ
o
f(a)+λg(a), ∀x ∈ C. Do vậy a là nghiệm
của bài toán lồi sau đây:
9
inf(λ
o
f(x) + λg(x)).
Vì λ
0
f và λg liên tục nên từ đây suy ra 0 ∈ ∂(λ
o
f + λg)(a) + N
C
(a),
Cũng vì λ
0
f và λg liên tục nên suy ra 0 ∈ ∂(λ
o
f)(a) + ∂(λg)(a) + N
C
(a).

Vậy định lý được chứng minh. 
Chú ý : Nếu λ
0
= 0 thì điều kiện sẽ không chứa thông tin gì về hàm mục tiêu f
và do đó sẽ không có giá trị gì. Do đó việc khẳng định λ
0
= 0 là hết sức quan trọng.
Các điều kiện đặt trên các biểu thức sao cho λ
o
= 0 và có thể chọn λ
o
= 1. Một
trong các điều kiện quan trọng là điều kiện chính quy Slater (mở rộng) và điều kiện
chính quy Kartin:
Định nghĩa 1.1.8 Điều kiện chính quy Slater mở rộng (SCQ): ∃ x ∈ C sao
cho −g(x) ∈ intS
Điều kiện chính quy Kartin (KCQ):  λ ∈ S
+
và λ = 0 sao cho λg(x) ≥ 0, ∀x ∈
C.
Định lý 1.1.3 ([1], Điều kiện cần và đủ KKT) Giả sử các giả thiết như trên
Định lý 1.3.2 và thêm (KCQ) thỏa mãn. Khi đó ta có kết luận như trên với λ
o
= 1
nghĩa là a là nghiệm của (P
tq
) khi và chỉ khi tồn tại λ ∈ S
+
sao cho hệ sau thỏa:




0 ∈ ∂f(a) + ∂(λg)(a) + N
C
(a)
λg(a) = 0
Chứng minh. Dựa trên Định lý 1.1.2
a) Điều kiện cần
Theo Định lý 1.1.2, nếu a là nghiệm của bài toán thì tồn tại λ = 0 và λ ∈ R
+
×S
+
sao cho



0 ∈ λ
o
∂f(a) + ∂(λg)(a) + N
C
(a)
λg(a) = 0
Giả sử λ
o
= 0. Khi đó ta có 0 ∈ ∂(λg)(a) + N
C
(a)
Do đó tồn tại x

∈ ∂(λg)(a) sao cho −x


∈ N
C
(a) hay x

(x − a) ≥ 0, ∀x ∈ C. Vậy
(λg)(x) − (λg)(a) ≥ x

(x − a) ≥ 0
10
kết hợp (λg)(a) = 0 suy ra (λg)(x) ≥ 0 mâu thuẫn với (KCQ). Vậy λ
0
= 0 do đó có
thể lấy λ
0
= 1,
nghĩa là ta có hệ cần chứng minh.
b) Điều kiện đủ
Giả sử có λ ∈ S
+
sao cho



0 ∈ ∂f(a) + ∂(λg)(a) + N
C
(a)
λg(a) = 0
hay
0 ∈ ∂(f + λg)(a) + N

C
(a)
điều này tương đương
f(x) + (λg)(x) ≥ f(a) + λg(a) = f(a) (do λg(a) = 0), ∀x ∈ C.
Mặt khác do x ∈ C, g(x) ∈ −S nên λg(x) ≤ 0 , suy ra f(x) ≥ f(a), ∀x ∈ A
nghĩa là x = a là nghiệm của bài toán. 
Các khái niệm thuộc lý thuyết vi phân được đề xuất bởi Clarke vào năm 1973.
Năm 1983 lý thuyết này được Clarke bổ sung và hoàn chỉnh. Ở đây ta chỉ nêu một
phần rất nhỏ của lý thuyết này, về hàm Lipschitz địa phương, đạo hàm theo hướng
Clarke và dưới vi phân Clarke.
1.2 Hàm Lipschitz và dưới vi phân Clarke
Cho hàm số thực f : R
n
→ R, và x ∈ R
n
.
Định nghĩa 1.2.1 [5] (Hàm Lipschitz địa phương) Hàm f được gọi là Lipschitz
địa phương tại x, nếu tồn tại hằng số k và ε > 0 sao cho
|f(x
1
) − f(x
2
)| ≤ k|x
1
− x
2
| ∀x
1
, x
2

∈ x + εB (1.2)
với B là quả cầu đơn vị trong R
n
.
11
Định nghĩa 1.2.2 [5] (Đạo hàm theo hướng của hàm Lipschitz địa phương)
Cho f Lipschitz địa phương tại x, và v là vecto bất kì trong R
n
. Khi đó đạo hàm
theo hướng v của hàm f tại x, kí hiệu f
o
(x; v) xác định như sau:
f
o
(x; v) := lim sup
x

→x, t↓0
f(x

+ tv) − f(x

)
t
Định nghĩa 1.2.3 [5](Dưới vi phân Clarke) Dưới vi phân Clarke của hàm f tại
x, kí hiệu ∂
o
f(x) xác định như sau:

o

f(x) := {ξ ∈ R
n
|f
o
(x; v) ≥ v, ξ, ∀v ∈ R
n
}. (1.3)
Mỗi phần tử ξ ∈ ∂
o
f(x) được gọi là dưới gradient Clarke.
Tính chất[5]
• Khi f trơn (nghĩa là khả vi chặt hay khả vi liên tục) thì ∂
o
f(x) ≡ {∇f(x)}
• Khi f lồi thì ∂
o
f(x) ≡ {ξ|f(x + u) − f(x) ≥ u, ξ}, ∀u ∈ R
n
(tập dưới vi
phân của hàm f tại x, (xem mục 1.1)).
1.3 Một số kiến thức cơ bản về giải tích đa trị
(1) Ánh xạ đa trị
Cho X, Y là hai tập bất kì. Cho F : X ⇒ Y là ánh xạ từ tập X vào toàn bộ các
tập con của Y (được kí hiệu là 2
Y
). Ta nói F là ánh xạ đa trị từ X vào Y. Như vậy
với mỗi x ∈ X, F (x) là một tập con của Y (F (x) có thể = ∅).
Nếu với mỗi x ∈ X, tập F (x) chỉ gồm đúng một phần tử của Y , thì F là ánh xạ đơn
trị từ X vào Y và thay cho kí hiệu F : X ⇒ Y thì ta sử dụng kí hiệu quen thuộc
là F : X → Y .

Định nghĩa 1.3.1 [2, Định nghĩa 1.1.1] Đồ thị và miền hữu hiệu của ánh xạ đa trị
F : X ⇒ Y tương ứng được xác định như sau:
gph F = {(x, y) ∈ X × Y |y ∈ F (x)}, (1.4)
dom F = {x ∈ X|F (x) = ∅}. (1.5)
12
Nhắc lại, nếu ánh xạ đơn trị, là hàm thực mở rộng f : X → R thì miền hữu
hiệu domf := {x ∈ X|f(x) < ∞} và đồ thị trên (epigraph) epif := {(x, α) ∈
X × R|f(x) ≤ α}.
Định nghĩa 1.3.2 [21, Định lý 19.1] Tập M ⊂ R
n
được gọi là tập lồi đa diện
(polyhedral convex set) nếu M có thể biểu diễn được dưới dạng giao của một số hữu
hạn nửa không gian đóng của R
n
, nghĩa là tồn tại các điểm a
1
, . . . , a
p
∈ M và các
phương v
1
, . . . , q ∈ R
n
sao cho
M = {
p

i=1
t
i

a
i
+
n

j=1
λ
j
v
j
: t
i
≥ 0 ∀i = 1, . . . , p,
p

i=1
t
i
= 1,
λ
j
≥ 0 ∀j = 1, . . . , n.}
Bây giờ giả sử X, Y là các không gian metric.
Định nghĩa 1.3.3 [2, Định nghĩa 1.2.1; 1.2.2; 1.2.3] Ta nói F là nửa liên tục trên
(usc) tại x ∈ dom F nếu với mọi tập mở V ⊂ Y thỏa F (x) ⊂ V tồn tại lân cận mở
U của x sao cho
F (x) ⊂ V ∀x ∈ U.
Nếu F usc tại mọi điểm thuộc dom F thì F được gọi là usc trong X
Ta nói F là nửa liên tục dưới (lsc) tại x ∈ dom F nếu với mọi tập mở V ⊂ Y thỏa
F (x) ∩ V = ∅ tồn tại lân cận mở U của x sao cho

F (x) ∩ V = ∅ ∀x ∈ U ∩ dom F.
Nếu F lsc tại mọi điểm thuộc dom F thì F được gọi là lsc trong X
Ta nói F là liên tục tại x ∈ dom F nếu F đồng thời usc và lsc tại x. Nếu F liên tục
tại mọi điểm thuộc dom F thì F được gọi là liên tục trên X.
Xét hàm thực mở rộng f : X → R với X là không gian metric.
Định nghĩa 1.3.4 [2]
Ta nói f là usc tại x ∈ dom f nếu
lim inf
x→x
f(x) ≥ f(x)
13
trong đó
lim inf
x→x
f(x) := inf{β ∈ R|∃x
k
→ x, lim
k→∞
f(x
k
) = β}.
Ta nói f là lsc tại x ∈ dom f nếu
lim sup
x→x
f(x) ≤ f(x)
trong đó
lim sup
x→x
f(x) := sup{β ∈ R|∃x
k

→ x, lim
k→∞
f(x
k
) = β}.
(2) Tính chất của đồ thị trên và dưới vi phân đối với hàm
thực mở rộng
Xét hàm thực mở rộng f : X → R trong đó X là không gian Banach tùy ý. Theo
[3], ta có
epif

=

ε ≥0
{ (x

, x

, x + ε − f (x))| x

∈ ∂
ε
f(x)}.
Trong [3], ta cũng có
epi(f
1
+ f
2
)


= cl

(epif

1
+ epif

2
)
thỏa mãn với mọi hàm lsc và lồi f
i
: X → R, i = 1, 2, trong đó cl

có thể bỏ đi nếu
f
i
liên tục tại điểm x ∈ domf
1
∩ domf
2
. Hơn nữa chúng ta còn có công thức tổng
các dưới vi phân được thiết lập trong [3]. Bổ đề sau đây miêu tả hai yếu tố này:
Bổ đề 1.3.1 [7, 9](Công thức tổng epi và tổng dưới vi phân cho hàm lồi)
Giả sử f
i
: X → R, i = 1, 2 là lsc, lồi và domf
1
∩ domf
2
= ∅. Khi đó hai điều kiện

sau tương đương:
• (i) Tập epif

1
+ epif

2
đóng yếu

trong X

× R.
14
• (ii) Công thức sau thỏa
epi(f
1
+ f
2
)

= (epif

1
+ epif

2
) (1.6)
Hơn nữa, ta có
∂(f
1

+ f
2
)(x) = ∂f
1
(x) + ∂f
2
(x), với x ∈ domf
1
∩ domf
2
, (1.7)
trong đó ∂f(.) là dưới vi phân cổ điển (Định nghĩa 1.1.4).
Chứng minh. (xem [9])
Ngay sau sự ra đời của lý thuyết vi phân Clarke, thì năm 1976, Mordukhovich
đã đề xuất những khái niệm về lý thuyết vi phân của riêng ông, từ đó đến nay thì
ông đã hoàn chỉnh lý thuyết ấy. Thực sự giải tích hiện đại nghiên cứu về các đối
tượng không trơn (nonsmooth) như tập, hàm, ánh xạ đa trị và các công cụ giải tích
mở rộng của phép tính vi phân. Trong mục này chúng ta sẽ sử dụng các đối tượng
đề xuất bởi Mordukhovich, đây là công cụ tính toán mạnh mẽ và đầy đủ, thích
hợp để nghiên cứu về bài toán tối ưu hai cấp.Việc xây dựng lý thuyết vi phân vô
hạn chiều của ông theo các bước chính:
• Định nghĩa khái niệm dưới vi phân của các hàm số nhận giá trị trong tập số
thực suy rộng.
• Sử dụng dưới vi phân để định nghĩa nón pháp tuyến (không lồi) của các tập
hợp.
• Sử dụng nón pháp tuyến để định nghĩa đối đạo hàm (coderivative) của ánh
xạ đa trị.
Sau đây ta xin nêu các khái niệm trong lý thuyết vi phân mở rộng của Mor-
dukhovich. Để tìm hiểu cụ thể xin xem trong ([2], chương 1, 4) và [17, 18] (sách
mới nhất năm 2006) của Mordukhovich.

15
1.4 Dưới vi phân, nón pháp tuyến và đối đạo hàm
Mordukhovich
Xét ánh xạ đa trị F : X ⇒ X

giữa không gian Banach X và không gian đối
ngẫu X

của nó. Kí hiệu
lim sup
x→x
F (x) := {x

∈ X

|∃x
k
→ x, x

k

w

x

, x

k
∈ F (x
k

) ∀k = 1, 2, . . .}. (1.8)
dùng để chỉ giới hạn trên theo dãy theo nghĩa Painlevé-Kuratowski trong tôpô chuẩn
của X và tôpô yếu

(kí hiệu bằng w

) của X

.
Cho hàm f : X → R và tập Ω ⊂ X. Các kí hiệu x →
f
x và x →

x tương ứng
có nghĩa là
x → x với f (x) → f(x) và x → x với x ∈ Ω.
Định nghĩa 1.4.1 ([2], Dưới vi phân Fréchet)
Cho X là không gian Banach, xét hàm f : X → R là hàm thực suy rộng, hữu hạn
tại x. Với mỗi ε ≥ 0, đặt
ˆ

ε
f(x) := {x

∈ X

| lim inf
x→x
f(x) − f(x) − x


, x − x
||x − x||
≥ −ε}. (1.9)
Tập
ˆ

ε
f(x) được gọi là ε− dưới vi phân Fréchet của f tại x, còn các phần tử của
nó là ε− dưới gradient Fréchet của f tại x.
Tập
ˆ
∂f(x) :=
ˆ

o
f(x) được gọi là dưới vi phân Fréchet của f tại x
(rõ ràng
ˆ
∂f(x) ⊂
ˆ

ε
f(x)).
Định nghĩa 1.4.2 ([2], Dưới vi phân Mordukhovich)
Tập hợp
∂f(x) := lim sup
x→
f
x, ε↓0
ˆ


ε
f(x) (1.10)
được gọi là dưới vi phân Mordukhovich, trong đó
ˆ

ε
f(x) là ε− dưới vi phân Fréchet.
16
Ta nhắc lại hai khái niệm khả vi Frechet và khả vi chặt (trơn), (xem [2]).
Hàm f được gọi là khả vi Frechet tại x ∈ X nếu tồn tại x

∈ X

sao cho
lim
x→x
f(x) − f(x) − x

, x − x
||x − x||
= 0,
khi đó x

được gọi là đạo hàm Frechet của f tại x, và dễ thấy {x

} =
ˆ
∂f(x).
Hàm f được gọi là khả vi chặt tại x ∈ X nếu f khả vi Frechet tại x và

lim
x→x, u→x
f(x) − f(x) − x

, x − u
||x − u||
= 0.
Nếu X là không gian hữu hạn chiều thì hai khái niệm này là như nhau (xem [2],
chương 3).
Nhận xét 1.4.1 [2, Mệnh đề 4.2.1; 4.2.2] Nếu f khả vi chặt tại x thì tập ∂f(x) chỉ
chứa một phần tử đó là đạo hàm hàm chặt của f tại x.
Nếu f là hàm lồi thì tập ∂f(x) trùng với dưới vi phân của giải tích lồi (1.1) phần
trên.
Bây giờ chúng ta tìm hiểu cụ thể các đối tượng nón pháp tuyến và đối đạo hàm.
Dựa trên nền tảng các đối tượng giải tích do Mordukhovich đề xuất, ta tách các
trường hợp. Mục đích của việc tách là chúng ta xét hàm thực mở rộng trong trường
hợp không gian Banach tùy ý và trong không gian hữu hạn, sẽ sử dụng cho bài toán
hai cấp vô hạn và bài toán hai cấp hữu hạn (xem cụ thể chương 3 và chương 4
dưới đây).
Trường hợp: f : X → R trong đó X là không gian Banach tùy ý. Nhắc
lại, hàm chỉ số
δ(x; Ω) =



0 nếu x ∈ Ω
∞ nếu otherwise
trong đó Ω ⊂ X.
Bây giờ nhắc lại nón pháp tuyến cổ điển khi tập Ω lồi tại x ∈ Ω, xác định bởi
N(x; Ω) := ∂δ(x; Ω) = {x


∈ X

| x

, x − x ≤ 0 ∀x ∈ Ω} (1.11)
17
Nón pháp tuyến Fréchet được xác định như sau:
ˆ
N(x; Ω) := ∂
ˆ
δ(x; Ω) = {x

∈ X

| lim sup
x→

x
x

, x − x
||x − x||
≤ 0} (1.12)
Và nón pháp tuyến mở rộng Mordukhovich của tập Ω (nói chung là không lồi) tại
x ∈ Ω được xác định tương tự
N(x; Ω) := ∂δ(x; Ω) = {x

∈ X


|∃x
k


x, ε
k
→ 0
+
và x

k

w

x

:
lim sup
x→

x
k
x

, x − x
k

||x − x
k
||

≤ ε
k
}. (1.13)
Bây giờ chúng ta tìm hiểu khái niệm "Đối đạo hàm":
Xét ánh xạ đa trị F : X ⇒ Y giữa các không gian Banach.
Định nghĩa 1.4.3 [2, Đối đạo hàm Fréchet, đối đạo hàm Mordukhovich] Đối đạo
hàm Fréchet của F tại (x, y) ∈ gph F và đối đạo hàm Mordukhovich tại điểm tương
ứng, lần lượt cho bởi
ˆ
D

F (x, y) (y

) :=

x

∈ X

|(x

, −y

) ∈
ˆ
N((x, y); gph F )

, (1.14)
D


F (x, y) (y

) :=

x

∈ X

|(x

, −y

) ∈ N((x, y); gph F )

. (1.15)
Nếu F (x) = f(x) đơn trị, thì chúng ta viết
ˆ
D

f(x) thay cho
ˆ
D

f(x, f(x)) và viết
D

f(x) thay cho D

f(x, f(x)). Khi đó nếu f tương ứng là khả vi Fréchet và khả
vi chặt tại x thì các đối đạo hàm phía trên xác định như sau:

ˆ
D

f(x)(y

) = (∇f(x))

(y

) ∀y

∈ Y

D

f(x)(y

) = (∇f(x))

(y

) ∀y

∈ Y

Lúc này, với mọi y

∈ Y

,

ˆ
D

f(x)(y

) và D

f(x)(y

) là các tập chỉ chứa một phần
tử. Nếu f khả vi chặt, thì hai tập này bằng nhau
D

f(x)(y

) =
ˆ
D

f(x)(y

) = (∇f(x))

(y

) ∀y

∈ Y

.

18
Cuối cùng chúng tôi nêu mối quan hệ giữa đối đạo hàm của ánh xạ đơn trị
Lipschitz địa phương (xem mục 1.2) f : X → Y với dưới vi phân Fréchet của hàm
vô hướng
(y

o
f)(x) := y

, f(x), y

∈ Y

được mô tả bởi công thức sau:
ˆ
D

f(x)(y

) =
ˆ
∂y

, f(x).
Trường hợp: f : X → R trong đó X là không gian hữu hạn chiều
Giả sử X = R
n
, như vậy hàm f trở thành f : R
n
→ R.

Các khái niệm sau xem cụ thể trong ([14], mục 2).
Đầu tiên, chúng ta tìm hiểu khái niệm nón pháp tuyến mở rộng của một tập
khác rỗng.
Cho tập Ω ⊂ R
n
và x ∈ Ω ; khi đó nón pháp tuyến của Ω tại x xác định bởi
N(x; Ω) := lim sup
x→

x
ˆ
N(x; Ω) (1.16)
với
ˆ
N(x; Ω) là nón pháp Fréchet của Ω tại x ∈ Ω, xác định như sau:
ˆ
N(x; Ω) := {v ∈ R
n
| lim sup
u→

x
v, u − x
u − x
≤ 0} (1.17)
trong đó ” lim sup ” là giới hạn trên theo nghĩa Painlevé-Kuratowski của một ánh
xạ đa trị S : R
n
⇒ R
m

với u → x xác định bởi
lim sup
u→x
S(u) := {v ∈ R
m
|∃u
k
→ u, ∃v
k
→ v, v
k
∈ S(u
k
) khi k → ∞}.
Nón (1.16) thường không lồi (ví dụ lấy Ω = gph |x| tại x = (0, 0) ∈ R
2
), trong khi
đó nón pháp Fréchet lồi và là đối ngẫu của nón Contingent (Bouligand) của Ω tại
x ∈ Ω.
Cho một ánh xạ đa trị S : R
n
⇒ R
m
và một điểm (x, y) ∈ gphS với gphS :=
{(u, v) ∈ R
n
× R
m
|v ∈ S(u)}
Xét ánh xạ đa trị: D


S(x, y) : R
m
→ R
n
với giá trị
D

S(x, y)(v) := {u ∈ R
m
|(u, −v) ∈ N((x, y); gphS)}, v ∈ R
m
.
19
Đây chính là ánh xạ đối đạo hàm của S tại (x, y).
Nếu S đơn trị và khả vi chặt tại x với gradient ∇S(x) nghĩa là
lim
x→x,u→x
S(u) − S(v) − ∇S(x), u − x
u − x
= 0
(điều này hiển nhiên vì S khả vi liên tục quanh x) , do đó
D

S(x)(v) = {∇S(x)

v} ∀v ∈ R
n
.
Công thức này là đạo hàm mở rộng của toán tử đạo hàm liên hợp của ánh xạ đơn

trị đối với trường hợp "không trơn".
Bây giờ ta xét một số tính chất của hàm Lipschitz, cho hàm ϕ : R
n
→ R liên
tục lipschitz quanh x, có dưới vi phân như sau:
∂ϕ(x) = lim sup
x→x
ˆ
∂ϕ(x) (1.18)
trong đó
ˆ
∂ϕ(x) là dưới vi phân Fréchet của ϕ tại x. Dưới vi phân (1.18) luôn luôn
khác rỗng và compac với mọi hàm Lipschitz địa phương.
Rõ ràng nếu các hàm là khả vi chặt thì ∂ϕ(x) = {∇ϕ(x)}.
Ngoài ra ∂ϕ(x) = {v ∈ R
n
|(v, −1) ∈ N((x, ϕ(x)); epiϕ)} với N(.) xác định như
(1.16).
Nếu ánh xạ S đơn trị, Lipschitz địa phương thì D

S(x)(v) = ∂v, S(x) v ∈ R
m
trong đó ∂ϕ(.) xác định như (1.18) và v, S(x) = v, S(x)
Chúng ta sử dụng tính chất của bao lồi của dưới vi phân
co∂(−ϕ)(x) = −co∂ϕ(x) (1.19)
Cho ánh xạ đa trị S : R
n
⇒ R
m
và một điểm x với S(x) = ∅, ta nói rằng S là

nửa compac trong (inner semicompact) tại x nếu với mỗi dãy x
v
→ x với S(x
v
) = ∅
thì có một dãy y
v
∈ S(x
v
) chứa một dãy con hội tụ khi v → ∞. Rõ ràng trong
không gian hữu hạn chiều thì "inner semicompactness" thỏa khi S là bị chặn đều
("uniformly bounded") quanh x nghĩa là có một lân cận U của x và tập C bị chặn
⊂ R
m
sao cho
S(x) ⊂ C khi x ∈ U.
20
Tiếp theo ta tìm hiểu một khái niệm khác, cho ánh xạ đa trị S : R
n
⇒ R
m
, ta
nói S là nửa liên tục trong (inner semicontinuous) tại (x, y) ∈ gphS nếu với bất kì
dãy x
v
→ x thì có một dãy y
v
∈ S(x
v
) hội tụ về y khi v → ∞.

Lưu ý rằng tính nửa liên tục trong của S tại (x, y) có liên quan đến tính Lipschitz–
like tại điểm này mà mở rộng tính liên tục Lipschitz địa phương của ánh xạ đa trị
trong không gian Hausdorff.
Ánh xạ đa trị S : R
n
⇒ R
m
thỏa mãn tính chất Lipschitz–like tại điểm (x, y) ∈
gph S nếu có một lân cận U của x, V của y và một hằng số l ≥ 0 sao cho
S(x) ∩ V ⊂ S(u) + lx − uB ∀x, u ∈ U
trong đó B là quả cầu đơn vị đóng. Tính chất này được biết là tương đương với tính
chính quy metric và tính mở tuyến tính của ánh xạ ngược S
−1
, có tầm quan trọng
trong tối ưu và giải tích phi tuyến. Ngoài ra D

S(x, y)(0) = {0} cung cấp đặc tính
đầy đủ của tính Lipschitz–like của S tại (x, y). 
21
Chương 2
Khái niệm về bài toán tối ưu hai
cấp tổng quát
Các kiến thức cơ bản trong chương này chúng tôi tham khảo trong [10], và tổng
quan từ các bài báo [4, 13].
2.1 Giới thiệu bài toán
(1) Bài toán tổng quát và các lớp bài toán chính
Bài toán tối ưu hai cấp tổng quát là một bài toán tối ưu trong đó gồm hai
biến x và y với y được chọn là một nghiệm tối ưu của một bài toán thứ hai chứa
tham số x. Do đó đây là bài toán có cấp bậc theo ý nghĩa các ràng buộc của bài
toán cấp trên (the upper level problem) được xác định bởi một bài toán cấp dưới

(the lower level problem).
Ta xét dạng của bài toán cấp trên:
min
x
F (x, y) sao cho G
k
(x, y) ≤ 0, k ∈ K, x ∈ X, y ∈ Ψ(x), (2.1)
trong đó Ψ(x) là tập nghiệm tối ưu của bài toán cấp dưới:
min
y
f(x, y) sao cho g
i
(x, y) ≤ 0, i ∈ I, h
j
(x, y) = 0, j ∈ J. (2.2)
22
Thông thường khi nghiên cứu điều kiện tối ưu thì người ta ít xét đến các ràng buộc
đẳng thức h
j
(x, y) = 0 (trong luận văn chúng tôi chỉ trình bày bài toán tối ưu hai
cấp bao gồm cả ràng buộc đẳng thức thế này, trong phần đầu của chương 3. Các
phần còn lại của chương 3 và toàn bộ chương 4, chúng tôi bỏ đi ràng buộc đẳng
thức này). Để hiểu một cách rõ ràng hơn, chúng tôi chia làm 3 lớp bài toán khác
nhau.
(a) Lớp bài toán tối ưu hai cấp hữu hạn
Các hàm thực F, G
k
, f, g
i
, h

j
đều xác định trên R
n
× R
m
(R
n
× R
m
→ R).
X đóng ⊆ R
n
, thông thường X = {x ∈ R
n
|G(x) ≤ 0}, G : R
n
→ R. Ψ là ánh xạ
đa trị R
n
⇒ R
m
có Ψ(x) là tập nghiệm tối ưu của bài toán cấp dưới, xác định bởi
Ψ(x) := arg min
y
{f(x, y)|g
i
(x, y) ≤ 0, h
j
(x, y) = 0} gồm ràng buộc đẳng thức
hay Ψ(x) := arg min

y
{f(x, y)|g
i
(x, y) ≤ 0} nếu không gồm ràng buộc đẳng thức.
Số lượng các ràng buộc hữu hạn, nghĩa là i ∈ I hữu hạn, j ∈ J hữu hạn, k ∈ K hữu
hạn.
(b) Lớp bài toán tối ưu hai cấp vô hạn
Các hàm thực mở rộng F, f : X × Y → R, với R = R ∪ {+∞; −∞} trong không
gian Banach X, Y tùy ý.
Hàm thực mở rộng g
t
: R
n
× R
m
→ R với t ∈ T, T là tập chỉ số vô hận.
(c) Lớp bài toán tối ưu hai cấp nửa vô hạn
Tương tự như ở lớp bài toán tối ưu hai cấp vô hạn, nhưng nếu chúng ta xét trong
không gian hữu hạn chiều và giữ nguyên các giả thiết còn lại thì nó trở thành lớp
bài toán tối ưu hai cấp nửa vô hạn.
Trong luận văn chỉ xét hai lớp bài toán (a) và (b).
Tùy các tính chất khả vi liên tục, khả vi chặt, hay lồi, lipschitz. . . mà chúng ta
có các lớp bài toán được chia nhỏ tương ứng, là bài toán trơn, lồi, lồi hoàn toàn,
lipschitz. ... Vấn đề này sẽ được tìm hiểu cụ thể ở các chương sau. Đặt
ϕ(x) := inf
y
{f(x, y) sao cho g(x, y) ≤ 0, h(x, y) = 0}.
thì ϕ được gọi là hàm giá trị tối ưu của bài toán cấp dưới.
23
Bây giờ, để hiểu về quá trình hình thành bài toán, ta hãy đến với mô hình kinh

tế, cũng là mô hình xuất hiện đầu tiên như sau.
(2) Sự ra đời của bài toán và hai dạng bài toán cơ bản
Bài toán hai cấp có cấp bậc theo nghĩa có hai nhân tố quyết định những chọn
lựa trên những mức độ khác nhau về cấp bậc. Trong khi nhân tố thứ nhất – thường
gọi là người quyết định cấp trên hoặc ông chủ, đưa ra các chọn lựa x (lúc này x cố
định) của ông ấy trước, thì nhân tố thứ hai – thường được gọi là người quyết định
cấp dưới hoặc người làm công, xác định giải pháp y sau đó của anh ta theo một
trong các lựa chọn của ông chủ. Do đó biến x đóng một vai trò là tham số trong
(bài toán cần giải quyết) của người làm công.
Hơn nữa ông chủ phải lường trước lựa chọn của người làm công, vì doanh thu của
công ty không chỉ phụ thuộc sự chọn lựa của ông ta mà còn cả sự tác động trở lại
của người làm công.
Theo đó, người làm công phải giải quyết bài toán chứa tham số x như sau:
min
y
f(x, y) sao cho g(x, y) ≤ 0, h(x, y) = 0, (2.3)
với giả thiết f, g
i
, h
j
: R
n
× R
m
→ R, i = 1, . . . , p, j = 1, . . . , q và
g(x, y) = (g
1
(x, y), . . . , g
p
(x, y)), h(x, y) = (h

1
(x, y), . . . , h
q
(x, y)).
Đặt Ψ(x) là tập nghiệm tối ưu của bài toán này,
Ψ(x) := arg min
y
{f(x, y)|g(x, y) ≤ 0, h(x, y) = 0} (2.4)
Như vậy bài toán của ông chủ có dạng như (2.1), bao gồm cực tiểu hóa hàm
F : R
n
× R
m
→ R sao cho y ∈ Ψ(x) và x ∈ X với X tập đóng, X ⊆ R
n
, nghĩa là
giải quyết bài toán sau:
min
x
F (x, y) sao cho x ∈ X, y ∈ Ψ(x). (2.5)
trong đó Ψ(x) xác định như (2.4).
Nguyên nhân bởi vì ông chủ điều khiển chỉ mỗi biến x, do đó bài toán hai cấp chỉ
24

×