Tải bản đầy đủ (.pdf) (60 trang)

luận văn thạc sĩ toán học bài toán quy hoạch lồi

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (403.44 KB, 60 trang )

i
Mục lục
Mục lục . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . i
Lời cảm ơn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ii
Mở đầu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
Chương 1. Các kiến thức cơ bản về tập lồi và hàm lồi . . . . . . . . . 2
1.1. Tập lồi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2. Hàm lồi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Chương 2. Điều kiện cực tiểu hàm lồi . . . . . . . . . . . . . . . . . . . . . . . . 12
2.1. Bài toán quy hoạch lồi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.1.1. Các khái niệm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.1.2. Sự tồn tại nghiệm tối ưu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.1.3. Điều kiện tối ưu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.2. Tối ưu có ràng buộc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.2.1. Đối ngẫu Lagrange. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.2.2. Điều kiện tối ưu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
Chương 3. Một số phương pháp giải bài toán quy hoạch lồi . . 27
3.1. Các thuật toán sử dụng đạo hàm bậc nhất . . . . . . . . . . 27
3.1.1. Thuật toán gradient . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.1.2. Phương pháp chiếu Gradient . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.1.3. Thuật toán chiếu dưới gradient xấp xỉ . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.1.4. Thuật toán Frank-Wolfe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.2. Phương pháp Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.3. Phương pháp hàm phạt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.3.1. Phương pháp hàm phạt điểm ngoài . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.3.2. Phương pháp hàm phạt điểm trong . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
Kết luận. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
Tài liệu tham khảo . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
ii
LỜI CẢM ƠN
Trước khi trình bày nội dung chính của khóa luận, em xin bày tỏ lòng


biết ơn sâu sắc tới GS.TSKH. Lê Dũng Mưu người đã tận tình hướng dẫn
và giúp đỡ em trong suốt quá trình học tập và nghiên cứu để em có thể
hoàn thành khóa luận này.
Em cũng xin bày tỏ lòng biết ơn chân thành tới quý thầy, cô giáo Viện
Toán học - Viện Khoa học và Công nghệ Việt Nam đã giảng dạy và giúp
đỡ em hoàn thành khóa học.
Nhân dịp này em cũng xin chân thành cảm ơn Ban Giám hiệu, các bạn
đồng nghiệp Trường Đại học Công nghệ Thông tin và Truyền thông - Đại
học Thái Nguyên, gia đình và bạn bè đã luôn động viên, giúp đỡ và tạo
điều kiện cho em về mọi mặt trong suốt quá trình học tập và thực hiện
khóa luận tốt nghiệp.
Mặc dù đã có nhiều cố gắng nhưng Luận văn khó tránh khỏi những
thiếu sót. Tác giả rất mong nhận được ý kiến đóng góp của quý thầy, cô
và bạn đọc để luận văn được hoàn thiện hơn.
Xin trân trọng cảm ơn!
Hà Nội, ngày 30 tháng 08 năm 2011
Tác giả
Quách Thị Mai Liên
1
MỞ ĐẦU
Quy hoạch lồi là một lớp bài toán cơ bản của tối ưu hóa. Một đặc
điểm cơ bản nhất của lớp bài toán này là mọi điểm cực tiểu địa phương đều
là cực tiểu tuyệt đối. Tính chất quan trọng này cho phép các lý thuyết có
tính địa phương, như giới hạn, vi phân, có thể áp dụng trực tiếp vào quy
hoạch lồi. Lý thuyết về bài toán quy hoạch lồi đã được quan tâm nghiên
cứu nhiều và đã thu được nhiều kết quả quan trọng dựa trên lý thuyết
của giải tích lồi và tối ưu hóa; về phương diện tính toán, đã có khá nhiều
phương pháp hữu hiệu cho lớp bài toán này. Các phương pháp đó đã được
giới thiệu trong cuốn sách Tối ưu lồi (Convex Optimization) của các tác
giả Stephen Boyd and Lieven Vandenberghe do nhà xuất bản Cambridge

University Press in năm 2004.
Mục đích của bản luận văn này là để trình bày một số phương pháp
cơ bản nhất cho bài toán quy hoạch lồi. Cụ thể luận văn trình bày các
phương pháp sau: các phương pháp sử dụng đạo hàm bậc nhất, phương
pháp Newton và các phương pháp hàm phạt.
Luận văn gồm có 3 chương:
• Chương 1: Giới thiệu các kiến thức cơ bản nhất về giải tích lồi, đặc
biệt chú trọng vào phép chiếu vuông góc lên một tập lồi đóng và tính dưới
vi phân của hàm lồi; chúng được sử dụng trong các chương tiếp theo.
• Chương 2: Trình bày đối ngẫu Lagrange và áp dụng Định lý Krush -
Kuhn - Tucker, Định lý Kuhn - Tucker để giải bài toán quy hoạch lồi và
các định lý về sự tồn tại nghiệm tối ưu của bài toán quy hoạch lồi.
• Chương 3: Trình bày các phương pháp giải bài toán quy hoạch lồi như:
phương pháp dùng đạo hàm bậc nhất gradient, chiếu gradient và trường
hợp tổng quát của nó là chiếu dưới gradient xấp xỉ, thuật toán Frank -
Wolf, phương pháp Newton dùng đạo hàm bậc hai và các phương pháp
hàm phạt.
2
Chương 1
Các kiến thức cơ bản về tập lồi và
hàm lồi
Trong luận văn này, ta chỉ xét không gian hữu hạn chiều IR
n
với tích
vô hướng được ký hiệu là ., . và chuẩn tương ứng được ký hiệu là ..
Chương này trình bày một số kiến thức cơ bản nhất của giải tích lồi
sẽ được sử dụng ở chương sau. Nội dung của chương được trích dẫn chủ
yếu từ tài liệu tham khảo [1] và [3].
1.1. Tập lồi
Định nghĩa 1.1. Cho hai điểm a, b ∈ IR

n
.
(i) Một đường thẳng đi qua hai điểm a, b là tập hợp có dạng
{x ∈ IR
n
: x = αa + βb, α, β ∈ IR, α + β = 1}.
(ii) Đoạn thẳng nối hai điểm a, b trong IR
n
có dạng
{x ∈ IR
n
: x = αa + βb, α ≥ 0, β ≥ 0, α + β = 1}.
Định nghĩa 1.2. Một tập D được gọi là tập affine nếu D chứa mọi đường
thẳng đi qua hai điểm bất kỳ x, y ∈ D, tức là
∀x, y ∈ D, ∀λ ∈ IR ⇒ λx + (1 −λ)y ∈ D.
Mệnh đề 1.1. Tập D = ∅ là tập affine khi và chỉ khi nó có dạng D =
M + a với M là một không gian con của IR
n
và a ∈ IR
n
. Không gian M
được xác định duy nhất và được gọi là không gian con song song của D.
3
Định nghĩa 1.3. Thứ nguyên (hay chiều) của một tập affine D là thứ
nguyên của không gian con song song với D và được ký hiệu là dim D.
Định nghĩa 1.4. Siêu phẳng trong không gian IR
n
là một tập hợp các
điểm có dạng
{x ∈ IR

n
: a
T
x = α},
trong đó a ∈ IR
n
là một vectơ khác 0 và α ∈ IR.
Định nghĩa 1.5. Cho a ∈ IR
n
là một vectơ khác 0 và α ∈ IR. Tập
{x : a
T
x ≥ α},
được gọi là nửa không gian đóng và tập
{x : a
T
x > α}
gọi là nửa không gian mở.
Định nghĩa 1.6. Một tập D được gọi là một tập lồi nếu
∀a, b ∈ D và 0 ≤ λ ≤ 1 ⇒ λa + (1 − λ)b ∈ D.
Định lí 1.1. Tập lồi là đóng với phép giao, phép cộng, phép nhân với một
số thực. Tức là, nếu C và D là hai tập lồi trong IR
n
thì C ∩D, λC + βD
cũng là các tập lồi.
Định nghĩa 1.7. Ta nói x là tổ hợp lồi của các điểm (vectơ) x
1
, , x
k
nếu

x =
k

j=1
λ
j
x
j
, λ
j
≥ 0 (j = 1, , k),
k

j=1
λ
j
= 1.
Mệnh đề 1.2. Tập hợp D là lồi khi và chỉ khi nó chứa mọi tổ hợp lồi của
các điểm của nó. Tức là, D lồi khi và chỉ khi
∀k ∈ IN, ∀λ
1
, , λ
k
≥ 0 :
k

j=1
λ
j
= 1, ∀x

1
, , x
k
∈ D ⇒
k

j=1
λ
j
x
j
∈ D.
Định nghĩa 1.8. Một tập được gọi là tập lồi đa diện nếu nó là giao của
một số hữu hạn các nửa không gian đóng.
4
Định nghĩa 1.9. Bao lồi của một tập D là giao của tất cả các tập lồi
chứa D. Bao lồi của tập D được ký hiệu là coD.
Bao lồi của một tập D là tập lồi nhỏ nhất chứa D.
Định nghĩa 1.10. Thứ nguyên của một tập lồi D được cho bởi thứ nguyên
của đa tạp affine nhỏ nhất chứa D. Đa tạp affine này được gọi là bao affine
của D và được ký hiệu là aff D. Thứ nguyên của tập lồi D sẽ được ký hiệu
là dimD.
Định nghĩa 1.11. Một điểm a của một tập lồi D gọi là điểm trong tương
đối nếu với mọi x ∈ D đều có một số λ > 0 để cho a + λ(x −a) ∈ D. Tập
các điểm trong tương đối của D được ký hiệu riD.
Định nghĩa 1.12. Một tập D được gọi là nón nếu
∀λ > 0, ∀x ∈ D ⇒ λx ∈ D.
Một nón được gọi là nón nhọn nếu nó không chứa đường thẳng. Một nón
được gọi là nón lồi nếu nó đồng thời là tập lồi. Nếu nón lồi này lại là một
tập lồi đa diện thì ta nói nó là nón lồi đa diện.

Định nghĩa 1.13. Cho D ⊆ IR
n
là một tập lồi và x
0
∈ D.
(i) Tập
N
D
(x
0
) := {ω ∈ IR
n
: ω, x − x
0
 ≤ 0, ∀x ∈ D}.
gọi là nón pháp tuyến ngoài của D tại x
0
và tập −N
D
(x
0
) được gọi
là nón pháp tuyến trong của D tại x
0
.
(ii) Tập
N

D
(x

0
) := {ω ∈ IR
n
: ω, x − x
0
 ≤ , ∀x ∈ D}
được gọi là nón pháp tuyến  của D tại x
0
.
Hiển nhiên 0 ∈ N
D
(x
0
) và dùng định nghĩa ta có N
D
(x
0
) là một nón lồi
đóng.
Trong chương 2 và chương 3, ta sẽ sử dụng các định lý tách tập lồi, đây
cũng là những định lý cơ bản nhất của giải tích lồi.
5
Định nghĩa 1.14. Cho hai tập C và D, ta nói rằng siêu phẳng
H := {x : v, x = λ}
(i) tách hai tập C và D nếu
v, a ≤ λ ≤ v, b, ∀a ∈ C, b ∈ D.
(ii) tách chặt C và D nếu:
v, a < λ < v, b, ∀a ∈ C, b ∈ D.
(iii) tách mạnh C và D nếu:
sup

x∈A
v, x < λ < inf
y∈B
v, y.
Định lí 1.2 (Định lý tách 1). Cho C và D là hai tập lồi khác rỗng trong
IR
n
sao cho C ∩ D = ∅. Khi đó có một siêu phẳng tách C và D.
Định lí 1.3 (Định lý tách 2). Cho C và D là hai tập lồi khác rỗng trong
IR
n
sao cho C ∩ D = ∅. Giả sử có ít nhất một tập là compăc. Khi đó hai
tập C và D có thể tách mạnh được bởi một siêu phẳng.
Hệ quả 1.1 (Bổ đề Farkas). Cho a ∈ IR
n
và A là ma trận cấp m × n.
Khi đó a, x ≥ 0 với mọi x thỏa mãn Ax ≥ 0, khi và chỉ khi tồn tại y ≥ 0
thuộc IR
m
sao cho a = A
T
y.
Ý nghĩa hình học của bổ đề Farkas: siêu phẳng đi qua gốc tọa độ
a, x = 0 để nón Ax ≥ 0 về một phía của nó khi và chỉ khi vectơ pháp
tuyến a của siêu phẳng nằm trong nón sinh bởi các hàng của ma trận A.
Định nghĩa 1.15. Cho D = ∅ (không nhất thiết lồi) và y là một vectơ bất
kỳ, đặt:
d
D
(y) := inf

x∈D
x − y.
Ta nói d
D
(y) là khoảng cách từ y đến D. Nếu tồn tại π ∈ D sao cho
d
D
(y) = y − π, thì ta nói π là hình chiếu (vuông góc) của y trên D và
ký hiệu là π = P
D
(y).
6
Theo định nghĩa, ta thấy rằng hình chiếu P
D
(y) của y trên D là
nghiệm của bài toán tối ưu
min
x∈D

1
2
x − y
2
: x ∈ D

.
Nói cách khác việc tìm hình chiếu của y trên D có thể đưa về việc tìm cực
tiểu của hàm toàn phương ||x − y||
2
trên D. Nếu D = ∅ thì d

D
(y) hữu
hạn, vì
0 ≤ d
D
(y) ≤ x − y, ∀x ∈ D.
Mệnh đề 1.3. Cho D là một tập lồi đóng khác rỗng. Khi đó
(i) Với mọi y ∈ IR
n
, π ∈ D hai tính chất sau là tương đương:
a) π = P
D
(y),
b) y − π ∈ N
D
(π).
(ii) Với mọi y ∈ IR
n
, hình chiếu P
D
(y) của y trên D luôn tồn tại và duy
nhất.
(iii) P
D
(x) − P
D
(y) ≤ x − y, ∀x, y ∈ IR
n
(tính không giãn),
(iv) P

D
(x)−P
D
(y)
2
≤ P
D
(x)−P
D
(y), x−y, ∀x, y ∈ IR
n
(tính đồng bức).
1.2. Hàm lồi
Trong phần này ta chỉ xét những hàm f không nhận giá trị −∞.
Định nghĩa 1.16. Một hàm số f xác định trên tập lồi D được gọi là
(i) lồi trên D nếu
f(λx + (1 − λ)y) ≤ λf(x) + (1 − λ)f(y), ∀x, y ∈ D, 0 < λ < 1.
(ii) lồi chặt nếu
f(λx + (1 − λ)y) < λf(x) + (1 − λ)f(y), ∀x, y ∈ D, 0 < λ < 1.
(iii) lõm (lõm chặt) nếu −f là lồi (lồi chặt).
7
Định lí 1.4. Cho f và g là các hàm lồi trên tập lồi C và D tương ứng.
Khi đó các hàm số αf +βg, (∀α, β ≥ 0) và max{f, g} cũng lồi trên C ∩D.
Một hàm lồi có thể không liên tục tại một điểm trên biên miền xác
định của nó. Tuy nhiên, nó liên tục tại mọi điểm trong của tập đó theo
định lý sau:
Định lí 1.5. Một hàm lồi xác định trên tập lồi D thì liên tục tại mọi điểm
trong của D.
Tính chất sau đây đặc trưng cho một hàm lồi khả vi, và thuận lợi để
kiểm tra tính lồi của một hàm số. Ký hiệu f


(a) hoặc ∇f(a) là đạo hàm
của f tại a.
Định lí 1.6. Cho f : D → IR là một hàm khả vi trên tập lồi mở D. Điều
kiện cần và đủ để f lồi trên D là
f(x) + ∇f(x), y −x ≤ f(y), ∀x, y ∈ D.
Nếu f khả vi hai lần thì điều kiện cần và đủ để f lồi trên D là với mọi
x ∈ A ma trận Hessian H(x) của f tại x xác định không âm, tức là
y
T
H(x)y ≥ 0, ∀x ∈ D, y ∈ IR
n
.
Như vậy, một dạng toàn phương x
T
Qx là một hàm lồi khi và chỉ khi Q
xác định không âm. Một dạng toàn phương là một hàm lồi chặt khi và chỉ
khi ma trận của nó xác định dương.
Tính khả vi của một hàm lồi giữ vai trò quan trọng trong các phương
pháp tối ưu hóa. Lớp các hàm lồi có những tính chất khả vi rất đẹp mà
các lớp hàm khác không có. Giả sử f : IR
n
→ IR ∪ {+∞} là hàm lồi. Ta
có các khái niệm sau
Định nghĩa 1.17. Cho  > 0. Một véc tơ w ∈ IR
n
được gọi là một −
dưới gradient của f tại x
0
∈ IR

n
nếu:
w, x −x
0
 ≤ f(x) − f(x
0
) + , ∀x ∈ IR
n
.
8
Tập hợp tất cả các −dưới gradient gọi là − dưới vi phân của hàm f tại
x
0
, kí hiệu là


f(x
0
) := {w ∈ IR
n
: w, x − x
0
 ≤ f(x) − f(x
0
) + , ∀x ∈ IR
n
}.
Định nghĩa 1.18. Véctơ w ∈ IR
n
được gọi là dưới gradient của f tại

x
0
∈ IR
n
nếu:
w, x −x
0
 ≤ f(x) − f(x
0
), ∀x ∈ IR
n
.
Tập hợp tất cả các dưới gradient của hàm f tại x
0
được gọi là dưới vi phân
của f tại x
0
, kí hiệu là:
∂f(x
0
) := {w ∈ IR
n
: w, x − x
0
 ≤ f(x) − f(x
0
), ∀x ∈ IR
n
}.
Hàm f được gọi là khả dưới vi phân tại x

0
nếu ∂f(x
0
) = ∅.
Ví dụ 1.1. Cho D là một tập lồi, khác rỗng của không gian IR
n
. Xét hàm
chỉ trên tập D
δ
D
(x) :=

0 nếu x ∈ D,
+∞ nếu x /∈ D.
Với mọi x
0
∈ D ta có:
w ∈ ∂δ
D
(x
0
) ⇔ δ
D
(x) − δ
D
(x
0
) ≥ w, x − x
0
, ∀x ∈ D

⇔ 0 ≥ w, x − x
0
, ∀x ∈ D ⇔ w ∈ N
D
(x
0
).
Chứng tỏ
∂δ
D
(x
0
) = N
D
(x
0
), ∀x
0
∈ D.
Cũng có trường hợp tồn tại những điểm x

tại đó f không có dưới vi
phân, nghĩa là tập ∂f(x

) có thể là một tập rỗng. Tuy nhiên, đối với hàm
lồi, ta có định lý sau:
Định lí 1.7. Cho f là một hàm lồi (hữu hạn) trên tập lồi D. Lúc đó f có
dưới vi phân tại mọi điểm thuộc riD.
Từ định lý này suy ra rằng nếu f là một hàm lồi trên toàn không gian
IR

n
thì nó có dưới vi phân tại mọi điểm, vì riIR
n
= IR
n
.
9
Định nghĩa 1.19. Ta gọi đạo hàm theo hướng d của một hàm số f (không
nhất thiết là lồi) tại điểm x là đại lượng
f

(x, d) := lim
λ→0
+
f(x + λd) − f(x)
λ
nếu giới hạn này tồn tại.
Định lí 1.8. Nếu f là một hàm lồi trên tập lồi D thì với mọi x ∈ D và
mọi d sao cho x + d ∈ D, đạo hàm theo hướng d của f tại x luôn tồn tại
và nghiệm đúng
f

(x, d) ≤ f(x + d) −f(x).
Ngoài ra với mỗi điểm x cố định, f

(x, .) là một hàm lồi trên tập lồi
{d : x + d ∈ D}.
Từ định lý này dễ dàng suy ra rằng nếu f khả vi thì
f


(x, d) = ∇f(x), d, ∀d. (1.1)
Nói chung một hàm lồi không nhất thiết khả vi tại mọi điểm. Dưới vi
phân là một khái niệm mở rộng của đạo hàm trong trường hợp hàm không
khả vi. Trong trường hợp ∂f(x

) chỉ gồm duy nhất một điểm thì f khả vi
tại x

. Trong phần tiếp theo, ta sẽ định nghĩa về  - nghiệm và  - chiếu
của một hàm lồi.
Định nghĩa 1.20. Cho D ⊆ IR
n
là tập lồi, f : D → IR là hàm lồi và
 ≥ 0. Xét bài toán:
min
x∈D
f(x). (P )
Một điểm ¯x ∈ D được gọi là  - nghiệm của bài toán (P ) nếu:
f(¯x) ≤ min
x∈D
f(x) + .
Mệnh đề 1.4. Vectơ ¯x ∈ D là  - nghiệm của bài toán (P ) khi và chỉ khi
0 ∈ ∂

f(¯x).
10
Chứng minh. Giả sử ¯x ∈ D là  - nghiệm của bài toán (P ). Khi đó
f(¯x) ≤ f(x) + , ∀x ∈ D.
Suy ra
0, x − ¯x ≤ f(x) − f(¯x) + , ∀x ∈ D ⇔ 0 ∈ ∂


(f(¯x)) .
Ngược lại, nếu 0 ∈ ∂

(f(¯x)) thì ta có:
0, x − ¯x ≤ f(x) − f(¯x) + , ∀x ∈ D.
Chứng tỏ ¯x là − nghiệm của bài toán (P ).
Định nghĩa 1.21. Cho D là một tập lồi đóng khác rỗng trong IR
n
, x ∈ IR
n
và  ≥ 0 . Một điểm p
x
∈ D được gọi là  - chiếu của x trên D nếu p
x

một  - nghiệm của bài toán
min
y∈D

1
2
x − y
2

(Q)
nghĩa là:
1
2
x − p

x

2

1
2
x − P
D
(x)
2
+ ,
trong đó P
D
(x) là hình chiếu của x trên D.
Mệnh đề 1.5. Cho D là tập lồi đóng khác rỗng. Khi đó p
x
là  - chiếu
của x trên D khi và chỉ khi
x − p
x
, p
x
− y ≥ −, ∀y ∈ D. (1.2)
Chứng minh. Giả sử p
x
là  − chiếu của x trên D. Ta có
min
y∈D
1
2

x − y
2
⇔ min

1
2
x − y
2
+ δ
D
(y)

(1.3)
trong đó δ
D
(y) là hàm chỉ của y trên tập D. Đặt
f(y) :=
1
2
x − y
2
, x ∈ IR
n
.
11
Theo Định nghĩa 1.21, p
x
là  − nghiệm của bài toán (1.3). Từ Mệnh đề
1.4 ta được
0 ∈ ∂


[f(p
x
) + δ
D
(p
x
)] = ∂

f(p
x
) + ∂

δ
D
(p
x
). (1.4)
Theo Ví dụ 1.1, ∂

δ
D
(p
x
) = N

D
(p
x
) nên từ (1.4) ta có:

0 ∈ {−x + p
x
} + N

D
(p
x
).
Suy ra
(x − p
x
) ∈ N

D
(p
x
) ⇔ x − p
x
, ω −p
x
 ≤ , ∀ω ∈ D.
Ngược lại, giả sử có (1.2). Ta có
x − P
D
(x)
2
= x − p
x

2

+ 2x − p
x
, p
x
− P
D
(x) + p
x
− P
D
(x)
2
≥ x − p
x

2
+ 2x − p
x
, p
x
− P
D
(x).
Suy ra
x − P
D
(x)
2
≥ x − p
x


2
− 2.
Chứng tỏ p
x
là − chiếu của x trên D.
12
Chương 2
Điều kiện cực tiểu hàm lồi
Chương này trình bày một số kiến thức quan trọng phục vụ cho
chương 3. Đó là đối ngẫu Lagrange và áp dụng vào giải bài toán tối ưu lồi;
các định lý cơ bản như Định lý Karush - Kuhn - Tucker, Định lý Kuhn -
Tucker. Nội dung của chương chủ yếu được trích dẫn từ tài liệu tham khảo
[1].
2.1. Bài toán quy hoạch lồi
2.1.1. Các khái niệm
Cho D ⊆ IR
n
và f : IR
n
→ IR. Xét bài toán quy hoạch toán học
min{f(x) : x ∈ D}. (P )
Bài toán này được hiểu là hãy tìm một điểm x

∈ D sao cho f(x

) ≤ f(x)
với mọi x ∈ D. Mỗi điểm x

∈ D được gọi là một phương án chấp nhận

được của bài toán (P ). Tập D được gọi là miền (tập) chấp nhận được, f
được gọi là hàm mục tiêu của bài toán (P ). Thông thường, tập D được
cho như là tập nghiệm của một hệ bất đẳng thức hoặc đẳng thức có dạng
D := {x ∈ X : g
j
(x) ≤ 0, h
i
(x) = 0, j = 1, , m, i = 1, , p}, (2.1)
trong đó ∅ = X ⊆ IR
n
và g
j
, h
i
: IR
n
→ IR (j = 1, m, i = 1, p). Bài
toán (P ) với D cho bởi (2.1) gọi là trơn nếu cả hàm mục tiêu và các ràng
buộc đều trơn (khả vi).
13
Bài toán (P ) có rất nhiều ứng dụng trong các lĩnh vực khác nhau. Ví
dụ, trong kinh tế nó là bài toán xác định phương án sản xuất sao cho chi
phí thấp nhất. Trong ví dụ này, x là phương án sản xuất mà mỗi tọa độ
x
j
của nó là số lượng sản phẩm loại j cần sản xuất, còn f(x) là chi phí
ứng với phương án x. Bài toán (P ) trong mô hình này có nghĩa là tìm một
phương án sản xuất trong tập hợp các phương án chấp nhận được D sao
cho chi phí sản xuất ứng với phương án này là thấp nhất.
Định nghĩa 2.1. Điểm x


∈ D được gọi là lời giải tối ưu địa phương của
bài toán (P) nếu tồn tại một lân cận U của x

sao cho
f(x

) ≤ f(x), ∀x ∈ U ∩ D.
và x

gọi là lời giải tối ưu toàn cục của (P) nếu
f(x

) ≤ f(x), ∀x ∈ D.
2.1.2. Sự tồn tại nghiệm tối ưu
Xét bài toán tối ưu toàn cục (P ). Có 4 trường hợp tồn tại nghiệm tối
ưu của bài toán này
• D = ∅ (Không có nghiệm).
• f không bị chặn dưới trên D

inf
x∈D
f(x) = −∞

.
• inf
x∈D
f(x) < ∞ nhưng giá trị cực tiểu không đạt được trên D.
• tồn tại x


∈ D sao cho f(x

) = min
x∈D
f(x).
Câu hỏi đặt ra: Làm thế nào để kiểm tra được bài toán (P ) có nghiệm
hay không? Câu trả lời là, nói chung điều này là không dễ dàng.
Định lí 2.1. Điều kiện cần và đủ để tồn tại nghiệm tối ưu toàn cục của
bài toán (P ) là
F
+
(D) := {t ∈ IR : f(x) ≤ t, x ∈ D},
đóng và bị chặn dưới.
14
Chứng minh. Nếu x

là nghiệm tối ưu thì F
+
(D) = [f(x

), +∞] đóng (là
phần bù của một tập mở) và bị chặn dưới.
Ngược lại, giả sử F
+
(D) bị chặn dưới. Đặt t

= inf F
+
(D) thì t > −∞.
Do F

+
(D) đóng, t

∈ F
+
D nên tồn tại x

∈ D sao cho f(x

) = t

. Chứng
tỏ x

là một điểm cực tiểu của f trên D.
Định lí 2.2 (Weierstrass). Nếu D là tập compact và f nửa liên tục dưới
trên D, thì bài toán (P ) có nghiệm tối ưu.
Chứng minh. Đặt α := inf
x∈D
f(x). Theo định nghĩa có một dãy {x
k
} ⊂
D sao cho lim
k→+∞
f(x
k
) = α. Do D compact nên có một dãy con hội tụ
về x
0
∈ D, không giảm tính tổng quát có thể coi x

k
→ x
0
. Vì f nửa liên
tục dưới nên α > −∞. Nhưng x
0
∈ D nên theo định nghĩa của α, ta phải
có f(x
0
) ≥ α. Vậy f(x
0
) = α.
Định lí 2.3. Nếu f nửa liên tục dưới trên D và thỏa mãn điều kiện bức
sau
f(x) → +∞ khi x ∈ D, x → +∞
thì f có điểm cực tiểu trên D.
Chứng minh. Đặt D(a) := {x ∈ D : f(x) ≤ f(a)} với a ∈ D. Rõ ràng,
D(a) đóng và bị chặn nên f có điểm cực tiểu trên D(a) và điểm đó cũng
chính là điểm cực tiểu của f trên D.
2.1.3. Điều kiện tối ưu
Định lí 2.4. Giả sử D là tập lồi và f là hàm lồi, khả dưới vi phân trên
D. Khi đó x

là nghiệm tối ưu của bài toán (P) nếu và chỉ nếu
0 ∈ ∂f(x

) + N
D
(x


), (2.2)
trong đó N
D
(x

) ký hiệu nón pháp tuyến của D tại x

.
Chứng minh. ” ⇐ ” : Giả sử có (2.2). Khi đó tồn tại p

sao cho
p

∈ ∂f(x

) ∩ (−N
D
(x

)).
15
Do p

∈ ∂f(x

) nên
p

, x −x


 ≤ f(x) − f(x

), ∀x.
và vì p

∈ N
D
(x

) nên
p

, x −x

 ≥ 0, ∀x ∈ D.
Vậy
f(x) − f(x

) ≥ 0, ∀x ∈ D.
Chứng tỏ x

là nghiệm tối ưu của bài toán (P ).
” ⇒ ” : Giả sử x

là nghiệm tối ưu. Bằng cách lấy không gian affine của
D, ta có thể giả sử D là một tập có số chiều đầy đủ. Do D là tập lồi,
intD = ∅. Xét hai tập sau
E := {(t, x) ∈ IR × IR
n
: t > f(x) − f(x


), x ∈ D}; G := {0} × D.
Cả E và G đều là tập lồi (do D và f lồi). Hơn nữa, G ∩ E = ∅. Áp dụng
định lý siêu phẳng tách tồn tại (u
0
, u) = 0 ∈ IR × IR
n
sao cho
u
0
t + u
T
x ≤ u
0
0 + u
T
y, ∀(t, x) ∈ E, y ∈ D (2.3)
Từ (2.3), cho t → +∞, ta thấy u
0
≤ 0. Cũng từ (2.3) nếu u
0
= 0 thì
u, x −y ≤ 0, ∀x, y ∈ D. (2.4)
Hiển nhiên, 0 ∈ D và bằng phép tịnh tiến ta có thể giả sử 0 ∈ intD. Theo
(2.4) ta có u = 0 (không xảy ra vì u
0
= 0). Do đó u
0
< 0. Chia cả 2 vế
của (2.3) cho −u

0
> 0, ta có
−t + u
T
x ≤ u
T
y, ∀x, y ∈ D.
Cho t → f(x) − f(x

), ta được
−[f(x) − f(x

)] + u
T
x ≤ u
T
y, ∀x, y ∈ D. (2.5)
Thay y = x

vào (2.5), ta được
−[f(x) − f(x

)] + u
T
x ≤ u
T
x

, ∀x ∈ D.
16

Do đó
f(x

) − f(x) + u
T
(x − x

) ≤ 0, ∀x ∈ D. (2.6)
Nếu x ∈ C, bằng cách lấy f(x) = ∞ nên từ (2.6) ta cũng nhận được
f(x

) − f(x) + u
T
(x − x

) ≤ 0, ∀x ∈ X.
nghĩa là u ∈ ∂f(x

). Mặt khác, thay x = x

vào (2.5), ta có
u
T
(y −x

) ≥ 0, ∀y ∈ D.
Suy ra −u ∈ N
D
(x


). Kết hợp với u ∈ ∂f(x

), ta được 0 ∈ ∂f(x

) +
N
D
(x

).
Hệ quả 2.1. Với các giả thiết như Định lý 2.4, nếu x

∈ intD là nghiệm
tối ưu của bài toán (P ) thì 0 ∈ ∂f(x

). Hơn nữa, nếu f khả vi và D = IR
n
thì 0 = ∇f(x

).
2.2. Tối ưu có ràng buộc
2.2.1. Đối ngẫu Lagrange
Đối ngẫu là một phần quan trọng của bài toán tối ưu. Có rất nhiều
kiểu đối ngẫu, nhưng đối ngẫu Lagrange được sử dụng rộng rãi hơn cả.
Đối ngẫu Lagrange dựa trên cơ sở hàm Lagrange. Ta xét bài toán
min{f(x) : x ∈ X, g
j
(x) ≤ 0, j = 1, , m} (P )
trong đó X ⊆ IR
n

là tập lồi khác rỗng. Từ bài toán trên, ta định nghĩa
bài toán tối ưu khác có dạng
max{d(y) : y ∈ Y } (D)
trong đó Y ⊆ IR
m
.
Định nghĩa 2.2. Bài toán (D) được gọi là đối ngẫu của bài toán (P ) nếu
với mọi điểm chấp nhận được x của (P ) và mọi y chấp nhận được của
(D), ta có
f(x) ≥ d(y).
17
Bài toán (D) được gọi là đối ngẫu chính xác của bài toán (P ) nếu (D) là
bài toán đối ngẫu của (P ) và tồn tại x

∈ (P ), y

∈ (D) sao cho
f(x

) ≤ d(y

).
Từ Định nghĩa 2.2 ta thấy rằng, nếu bài toán (D) là đối ngẫu chính
xác của bài toán (P ) thì f(x

) = d(y

) và hiển nhiên (P ) cũng là đối ngẫu
chính xác của (D).
Xét bài toán (P ), ta định nghĩa hàm Lagrange

L(x, y) := f(x) +
m

j=1
y
j
g
j
(x).
Lấy hàm mục tiêu của bài toán đối ngẫu là
d(y) := inf
x∈X
L(x, y). (LD)
và miền ràng buộc của (LD) bằng IR
m
+
. Khi đó bài toán đối ngẫu trở thành
sup
y≥0
d(y) := sup
y≥0
inf
x∈X
L(x, y).
Định lí 2.5. Bài toán (LD) là đối ngẫu của bài toán (P ).
Chứng minh. Ta có
d(y) = inf
x∈X
L(x, y) ≤ f(x) +
m


j=1
y
j
g
j
(x) ≤ f(x), ∀x ∈ X, ∀y ∈ Y.
Chứng tỏ (LD) là đối ngẫu của bài toán (P ).
Nhận xét 2.1. Nhìn chung, một cặp đối ngẫu chưa chắc đã là đối ngẫu
chính xác như ví dụ sau đây sẽ chỉ ra.
Ví dụ 2.1. Xét bài toán
min{f(x) = −x
2
, x ∈ X = [0, 2], x − 1 ≤ 0},
18
Ta thấy
f(1) = min f = −1.
Hàm Lagrange của bài toán là
L(x, y) = −x
2
+ y(x − 1), y ≥ 0, x ∈ X = [0, 2].
Ta thấy
max
y≥0
d(y) = 0.
Vậy cặp đối ngẫu là không chính xác.
Vậy cần thêm điều kiện gì để hai bài toán (P ) và (LD) là cặp đối ngẫu
chính xác? Ta có định lý sau:
Định lí 2.6 (Đối ngẫu chính xác). Giả sử
(i) (P ) có một lời giải tối ưu,

(ii) Các hàm f và g
j
, (j = 1, , m) lồi và liên tục trên X.
(iii) Điều kiện Slater thỏa mãn, nghĩa là có x
0
sao cho g
j
(x
0
) < 0 với mọi
j.
Khi đó (P) và (LD) là cặp đối ngẫu chính xác.
Chứng minh. Giả sử
g(x) := (g
1
(x), . . . , g
m
(x))
T
.
Lấy
A := {(t, z) ∈ IR × IR
n
: t > f(x), z ≥ g(x), x ∈ X}.
Do f và g
j
(j = 1, , m) lồi nên tập A là lồi. Giả sử x

là nghiệm tối ưu
của bài toán (P ) thì (f(x


), 0) ∈ A. Theo định lý tách tồn tại (α, y) = 0
thuộc IR × IR
n
sao cho:
αt + y
T
z ≥ αf(x

), ∀(t, z) ∈ A. (2.7)
19
Do các hàm f và g
j
liên tục, bất đẳng thức trên đúng với mọi (t, z) ∈ A
(A là bao đóng của tập A). Mà (f(x), g(x)) ∈ A,
αf(x) + y
T
g(x) ≥ αf(x

), ∀x ∈ X. (2.8)
Ta chỉ ra rằng (α, y) ≥ 0. Thực vậy, giả sử có chỉ số j thỏa mãn y
j
< 0.
Lấy (t
0
, z
0
) ∈ A. Điểm (t
0
, z) ≡ (t

0
, z
0
+ ξe
j
) ∈ A với mọi ξ ≥ 0 (e
j

vectơ đơn vị thứ j). Thay (t, z) = (t
0
, z) vào (2.7) và cho ξ → +∞. Ta có
vế trái bằng −∞ mà vế phải hữu hạn. Mâu thuẫn này chứng tỏ y ≥ 0.
Chứng minh tương tự ta chỉ ra được α ≥ 0. Hơn nữa, α > 0 vì nếu α = 0
thì y = 0. Trong trường hợp này từ (2.8) ta có:
y
T
g(x) ≥ 0, ∀x ∈ X.
Mâu thuẫn với điều kiện Slater. Chia cả hai vế của (2.7) cho α và theo
định nghĩa của d ta có
d

y
α

≥ f(x

).
Do đó (LD) là đối ngẫu của bài toán (P ) và theo Định lý 2.5, (P ) và (LD)
là cặp đối ngẫu chính xác.
2.2.2. Điều kiện tối ưu

Xét bài toán (P ) định nghĩa bởi
min f(x)
với điều kiện
x ∈ D := {x ∈ X : g
j
(x) ≤ 0, h
i
(x) = 0, j = 1, , m, i = 1, , k}.
trong đó ∅ = X ⊆ IR
n
và f, g
j
, h
i
: IR
n
→ IR (∀j, i). Ta gọi bài toán (P )
là bài toán lồi nếu X là tập lồi đóng và các hàm f, g
j
là lồi, h
i
là hàm
affine.
Định lí 2.7 (Karush-Kuhn-Tucker). Giả sử (P ) là bài toán lồi. Nếu x

là một nghiệm tối ưu của bài toán (P ) thì tồn tại λ

i
≥ 0 (i = 0, 1, , m)
20

và µ

j
(j = 1, , k) không đồng thời bằng 0 sao cho
L(x

, λ

, µ

) = min
x∈X
L(x, λ

, µ

) (Điều kiện đạo hàm triệt tiêu),
λ

i
g
i
(x

) = 0 (i = 1, , m) (Điều kiện bù).
Hơn nữa, nếu intX = ∅ và điều kiện Slater
∃x
0
∈ D : g
i

(x
0
) < 0 (i = 1, , m)
được thỏa mãn và các hàm affine h
i
(i = 1, , k) độc lập tuyến tính trên
X thì λ

0
> 0 và các điều kiện đạo hàm triệt tiêu và điều kiện bù là điều
kiện đủ để điểm chấp nhận được x

là nghiệm tối ưu của bài toán (P ).
Chứng minh. Giả sử x

là một nghiệm tối ưu của bài toán (P ). Đặt
C := {(λ
0
, λ
1
, ··· , λ
m
, µ
1
, ··· , µ
k
) : (∃x ∈ X) :
f(x)−f(x

) < λ

0
, g
i
(x) ≤ λ
i
, h
j
(x) = µ
j
, (i = 1, , m; j = 1, , k)}.
Do X = ∅ lồi, f, g
i
là các hàm lồi và h
j
là hàm affine trên X, nên C là
tập lồi đóng, khác rỗng trong IR
m+k+1
.
Hơn nữa 0 ∈ C vì nếu 0 ∈ C thì tồn tại một điểm chấp nhận được x sao cho
f(x) < f(x

). Điều này mâu thuẫn với giả thiết x

là nghiệm tối ưu của
bài toán (P ). Theo định lý siêu phẳng tách, có các số λ

i
(i = 0, 1, , m),
µ


j
(j = 1, , k) không đồng thời bằng 0 sao cho
m

i=0
λ

i
λ
i
+
k

j=1
µ

j
µ
j
≥ 0, ∀(λ
0
, ··· , λ
m
, µ
1
, ··· , µ
k
) ∈ C. (2.9)
Nếu λ
0

, ··· , λ
m
> 0, thì thay x = x

, ta được:

0
, ··· , λ
m
, 0, , 0) ∈ C
Vì thế có thể xem λ

0
, λ

1
, ··· , λ

m
≥ 0. Hơn nữa, với  > 0 và x ∈ X, ta
lấy:
λ
0
= f(x) −f(x

) + , λ
i
= g
i
(x)(i = 1, , m), µ

j
= h
j
(x)(i = 1, , k)
21
và thay vào (2.9), cho  → 0 ta được:
λ

0
f(x)+
m

i=1
λ

i
g
i
(x)+
k

i=1
µ

i
h
i
(x) ≥ λ

0

f(x

)+
m

i=1
λ

i
g
i
(x

)+
k

i=1
µ

i
h
i
(x

), ∀x ∈ X
(2.10)
hay
L(x

, λ


, µ

) ≤ L(x, λ

, µ

), ∀x ∈ X.
Điều kiện đạo hàm triệt tiêu được chứng minh. Để chứng minh điều kiện
bù, ta thấy, do x

là điểm chấp nhận được, g
j
(x

) ≤ 0 với mọi j. Nếu có
chỉ số i sao cho g
i
(x

) = ξ < 0, thì với mọi  > 0, ta có
(, , ξ, , , , 0, , 0) ∈ C (ξ ở vị trí i + 1).
Thay vào (2.9) và cho  → 0, ta có λ

i
ξ ≥ 0. Nhưng vì ξ < 0, nên λ

i
≤ 0.
Do đó, λ


i
= 0.
Bây giờ ta chứng minh điều kiện đủ. Trước hết, ta có λ

0
> 0. Thật vậy,
nếu λ

0
= 0, do điều kiện đạo hàm triệt tiêu và điều kiện bù, ta có
0 =
m

i=1
λ

i
g
i
(x

) +
k

j=1
µ

j
h

j
(x

) ≤
m

i=1
λ

i
g
i
(x) +
k

j=1
µ

j
h
j
(x), ∀x ∈ X.
(2.11)
Do λ

0
= 0, nên xảy ra 2 trường hợp:
• Trường hợp 1: Tồn tại chỉ số i sao cho λ

i

> 0. Khi đó thay thế x = x
0
vào bất đẳng thức (2.11) ta được:
0 =
m

i=1
λ

i
g
i
(x

) +
k

j=1
µ

j
h
j
(x

) ≤
m

i=1
λ


i
g
i
(x
0
) +
k

j=1
µ

j
h
j
(x
0
) < 0 (vô lý).
• Trường hợp 2: λ

i
= 0 với mọi i và tồn tại j sao cho µ

j
> 0. Ta có
0 =
k

j=0
µ


j
h
j
(x

) ≤
k

j=0
µ

j
h
j
(x), ∀x ∈ X.
Do intX = ∅ và h
j
là hàm affine với mọi j nên ta có
k

j=0
µ

j
h
j
(x) = 0, ∀x ∈ X.
22
Theo giả thiết, các hàm h

j
độc lập tuyến tính trên X, nên µ

j
= 0 với mọi
j. Điều này mâu thuẫn với giả thiết λ

i
và µ

j
không đồng thời bằng 0. Do
đó λ

0
> 0 và chia cả hai vế của (2.10) cho λ

0
> 0, ta có thể giả sử hàm
Lagrange của bài toán (P ) có dạng:
L(x, λ, µ) = f(x) +
m

i=1
λ
i
g
i
(x) +
k


j=1
µ
j
h
j
(x).
Sử dụng điều kiện đạo hàm triệt tiêu và điều kiện bù, với mọi nghiệm chấp
nhận được x

, ta có
f(x

) = f
0
(x

) +
m

i=1
λ

i
g
i
(x

) +
k


j=1
µ

j
h
j
(x

)
≤ f
0
(x) +
m

i=1
λ

i
g
i
(x) +
k

j=1
µ

j
h
j

(x) ≤ f(x).
Điều này chứng tỏ rằng x

là một nghiệm tối ưu của bài toán (P ).
Chú ý 2.1. Nếu X là tập mở (hơn nữa, X là toàn bộ không gian), thì
theo Moreau-Rockafellar, điều kiện đạo hàm triệt tiêu kéo theo
0 ∈ ∂f(x

) +
m

j=1
λ

j
∂g
j
(x

) +
k

i=1
µ

i
∇h
i
(x


).
Khi f và mọi hàm g
j
(j = 1, 2, m) đều khả vi thì điều kiện trên trở thành
0 = λ

0
∇f
0
(x

) +
m

j=1
λ

j
∇g
j
(x

) +
k

i=1
µ

i
∇h

i
(x

).
Định nghĩa 2.3. Một vectơ d = 0 được gọi là một hướng chấp nhận được
của tập D tại x

∈ D nếu:
x

+ λd ∈ D, ∀λ > 0 đủ nhỏ.
Kí hiệu D(x

) là tập tất cả hướng chấp nhận được của D tại x

và D(x

)
là bao đóng của nó.
23
Định lí 2.8. Giả sử hàm f khả vi trên một tập mở chứa D và x

là một
điểm cực tiểu địa phương của f trên D. Khi đó:
d
T
∇f(x

) ≥ 0, ∀d ∈ D(x


). (2.12)
Chứng minh. Khai triển Taylor của f tại x

là:
f(x

+ λd) = f(x

) + λ∇f(x

), d + o(λ||d||). (2.13)
Do x

là cực tiểu địa phương của bài toán (P) nên
f(x

+ λd) − f(x

) ≥ 0, ∀λ > 0 đủ nhỏ.
Từ (2.13) ta được:
d
T
∇f(x

) +
o(λd)
λ
≥ 0, ∀λ > 0 đủ nhỏ.
Suy ra (2.12).
Một điểm x


∈ D mà thỏa mãn điều kiện (2.12) được gọi là điểm dừng
của f trên D. Một điểm dừng chưa chắc là điểm cực tiểu địa phương.
Ví dụ 2.2. Xét bài toán
min f(x) = x
3
trên C = [−1, 2].
Rõ ràng x

= 0 là điểm dừng của f(x) nhưng điểm cực tiểu của f(x) trên
C đạt tại x = −1.
Xét bài toán (P ) :
min f(x)
với điều kiện
x ∈ D := {x ∈ X, g
j
(x) ≤ 0, h
i
(x) = 0, j = 1, , m; i = 1, , k}.
Cho x
0
∈ D và tập
A(x
0
) := {j : g
j
(x
0
) = 0}
được gọi là tập chỉ số tích cực. Đặt S(x

0
) là tập nghiệm của hệ phương
trình tuyến tính sau

∇h
i
(x
0
), d = 0, i = 1, , k
∇g
j
(x
0
), d = 0, j ∈ A(x
0
)

×