Tải bản đầy đủ (.pdf) (43 trang)

Bao lồi và một vài ứng dụng trong tối ưu toàn cục (LV thạc sĩ)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (450.44 KB, 43 trang )

ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC KHOA HỌC

TRƯƠNG THỊ HUỆ

BAO LỒI VÀ MỘT VÀI ỨNG DỤNG
TRONG TỐI ƯU TOÀN CỤC

LUẬN VĂN THẠC SĨ TOÁN HỌC

Thái Nguyên - 2017


ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC KHOA HỌC

TRƯƠNG THỊ HUỆ

BAO LỒI VÀ MỘT VÀI ỨNG DỤNG
TRONG TỐI ƯU TOÀN CỤC

Chuyên ngành: TOÁN ỨNG DỤNG
Mã số:

60.46.01.12

LUẬN VĂN THẠC SĨ TOÁN HỌC

NGƯỜI HƯỚNG DẪN KHOA HỌC
GS. TSKH. LÊ DŨNG MƯU


Thái Nguyên - 2017


i

Mục lục
Lời cảm ơn

ii

Bảng ký hiệu

1

Mở đầu

2

1

Bao lồi và hàm lồi
1.1 Tập lồi, hàm lồi . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Bao lồi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3
3
7

2


Bài toán tối ưu
2.1 Phát biểu bài toán tối ưu . . . . .
2.2 Bài toán tối ưu lồi . . . . . . . .
2.2.1 Bài toán tối ưu lồi . . . .
2.2.2 Áp dụng cho bài toán định
2.3 Bài toán tối ưu toàn cục . . . . .

. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
vị và cực đại hàm lồi
. . . . . . . . . . . .

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.


.
.
.
.
.

16
16
19
27
29
36

Kết luận

38

Tài liệu tham khảo chính

39


ii

Lời cảm ơn
Trước tiên tôi xin được gửi lời cảm ơn đến tất cả quý Thầy Cô đã giảng
dạy trong chương trình Cao học Toán ứng dụng khóa 9 - Trường Đại học
Khoa học - Đại học Thái Nguyên, những người đã truyền đạt kiến thức hữu
ích về ngành Toán ứng dụng làm cơ sở cho tôi hoàn thành luận văn này.

Đặc biệt tôi xin chân thành cảm ơn Thầy giáo GS.TSKH. Lê Dũng Mưu.
Thầy đã dành nhiều thời gian quý báu tận tình hướng dẫn tôi trong suốt
quá trình thực hiện luận văn, đồng thời còn là người giúp tôi lĩnh hội được
kiến thức chuyên môn và rèn luyện cho tôi tác phong nghiên cứu khoa học.
Qua đây, tôi cũng xin được bày tỏ lòng biết ơn sâu sắc tới gia đình, bạn bè
thân thiết là những người luôn sát cánh bên tôi, tạo mọi điều kiện tốt nhất
cho tôi, đã nhiệt tình giúp đỡ, chia sẻ, động viên tôi trong suốt quá trình học
tập, cũng như khi tôi thực hiện và hoàn thành luận văn này.
Mặc dù đã rất cố gắng song luận văn không tránh khỏi có những thiếu
sót. Rất mong nhận được ý kiến đóng góp của các Thầy giáo, Cô giáo và các
anh chị học viên để luận văn hoàn thiện hơn.
Thái Nguyên, ngày 20 tháng 05 năm 2017
Tác giả luận văn

Trương Thị Huệ


1

Bảng ký hiệu
R
Rn
A×B
A∪B
A∩B
A⊂B
A⊆B
∂f (x)
L(x, µ, ν)
., .

∇f

CoE
ConeE
riC
KKT
dimM

trường số thực
không gian Euclide n-chiều
tích Đề các của hai tập A và B
hợp của hai tập A và B
giao của hai tập A và B
A là tập con của B (mọi phần tử của A là phần tử của
B)
A là tập con (có thể bằng) của B
dưới vi phân của hàm lồi f tại x
hàm Lagrange
tích vô hướng trong Rn
Gradient của hàm f
tập rỗng
bao lồi đóng của E
bao nón lồi đóng của E
tập hợp các điểm trong tương đối của C
Karush - Kuhn - Tucker
số chiều của không gian M


2


Mở đầu
Toán học là công cụ hỗ trợ đắc lực để chúng ta khám phá thế giới tự nhiên
xung quanh ta và giải quyết các vấn đề thực tiễn. Giải tích lồi là một bộ môn
quan trọng của Giải tích toán học. Đối tượng nghiên cứu của Giải tích lồi là
tập lồi và hàm lồi. Tập lồi, hàm lồi xuất hiện trong nhiều vấn đề của toán
học, cũng như trong cuộc sống thực tế. Trong giải tích lồi khái niệm bao lồi
là 1 khái niệm cơ bản thông qua đó người ta nghiên cứu tập không lồi. Bao
lồi có phạm vi ứng dụng rất rộng rãi đặc biệt trong tối ưu toàn cục.
Tối ưu toàn cục là 1 lớp bài toán của tối ưu hóa. Hiện nay các bài toán
tối ưu toàn cục đang được nhiều người quan tâm nghiên cứu vì có nhiều ứng
dụng trong thực tế khoa học, kĩ thuật, kinh tế... Vì vậy mục đích của đề tài
là:
- Tìm hiểu và tổng kết lại các kiến thức cơ bản nhất về bao lồi (của cả tập
và hàm lồi)
- Xét đến ứng dụng của bao lồi vào 1 số bài toán tối ưu toàn cục.
Luận văn trình bày một cách có hệ thống về các kiến thức cơ bản nhất
của giải tích lồi như hàm lồi, bao lồi và bài toán tối ưu toàn cục.
Bố cục luận văn gồm phần mở đầu, hai chương trình bày nội dung của
luận văn, phần kết luận và danh mục tài liệu tham khảo.
Chương 1: "Bao lồi của tập lồi và hàm lồi". Chương này trình bày một số
kiến thức của giải tích lồi như tập lồi, hàm lồi, bao lồi của tập lồi là những
kiến thức nền tảng, cần thiết phục vụ cho việc giải quyết 1 số bài toán tối
ưu toàn cục.
Chương 2: "Bài toán tối ưu". Chương này trình bày một cách tổng quan
về bài toán tối ưu, bài toán tối ưu lồi, bài toán định vị, bài toán cực tiểu
hàm lõm trên tập lồi đa diện....


3


Chương 1

Bao lồi và hàm lồi
Chương này trình bày một số kiến thức của Giải tích lồi như: Tập lồi,
Hàm lồi, Cực trị của hàm lồi, Bao lồi và hàm lồi. Đây là những kiến thức
nền tảng, cần thiết phục vụ cho việc nghiên cứu áp dụng vào bài toán định
vị và cực đại hàm lồi.
1.1

Tập lồi, hàm lồi

Định nghĩa 1.1.1 Một tập C ⊆ Rn được gọi là một tập lồi, nếu C chứa mọi
đoạn thẳng đi qua hai điểm bất kỳ của nó. Tức là C lồi khi và chỉ khi
∀x, y ∈ C, ∀λ ∈ [0, 1] ⇒ λx + (1 − λ)y ∈ C.
Ta nói x là tổ hợp lồi của các điểm (véc-tơ) x1 , ..., xk nếu
k

k
j

λj x , λj ≥ 0 ∀j = 1, ..., k,

x=
j=1

λj = 1.
j=1

Tương tự, x là tổ hợp a-phin của các điểm (véc-tơ) x1 , ..., xk nếu
k


k
j

x=

λj x ,
j=1

λj = 1
j=1

Tập hợp của các tổ hợp a-phin của x1 , ..., xk được gọi là bao a-phin của
các điểm này
Định lý 1.1.2 Tập hợp C là lồi khi và chỉ khi nó chứa mọi tổ hợp lồi của


4

các điểm của nó. Tức là: C lồi khi và chỉ khi
k

k
1

∀k ∈ N, ∀λ1 , ..., λk > 0 :

k

λj = 1, ∀x , ..., x ∈ C ⇒

j=1

λj xj ∈ C.
j=1

Chứng minh. Điều kiện đủ là hiển nhiên từ định nghĩa. Ta chứng minh
điều kiện cần bằng quy nạp theo số điểm. Với k = 2, điều cần chứng minh
suy ra ngay từ định nghĩa của tập lồi và tổ hợp lồi. Giả sử mệnh đề đúng với
k − 1 điểm. Ta cần chứng minh với k điểm.
Giả sử x là tổ hợp lồi của k điểm x1 , ..., xk ∈ C. Tức là
k

k
j

λj x , λj > 0 ∀j = 1, ..., k,

x=
j=1

λj = 1.
j=1

Đặt
k−1

ξ=

λj .
j=1


Khi đó 0 < ξ < 1 và
k−1

λj xj + λk xk

x=
j=1
k−1


j=1

Do

λj j
x + λk x k .
ξ

k−1

j=1



λj
=1
ξ

λj

> 0 với mọi j = 1, ..., k − 1, nên theo giả thiết quy nạp, điểm
ξ
k−1

y :=
j=1

λj j
x ∈ C.
ξ

Ta có
x = ξy + λk xk

(1.1)


5

Do ξ > 0, λk > 0 và
k

ξ + λk =

λj = 1,
j=1

nên x là một tổ hợp lồi của hai điểm y và xk đều thuộc C. Vậy x ∈ C.
Lớp các tập lồi là đóng với các phép giao, phép cộng đại số và phép nhân
tích Descartes.

Định lý 1.1.3 Nếu A, B là các tập lồi trong Rn , C là lồi trong Rm , thì các
tập sau là lồi :
A ∩ B := {x| x ∈ A, x ∈ B},
λA + βB := {x| x = αa + βb, a ∈ A, b ∈ B, α, β ∈ R},
A × C := {x ∈ Rn+m | x = (a, c) : a ∈ A, c ∈ C}.
Chứng minh.Dễ dàng được suy ra trực tiếp từ định nghĩa: x ∈ C.

Hình 1.1: Một số tập lồi và tập không lồi trong R2

Định nghĩa 1.1.4 Siêu phẳng trong không gian Rn là một tập hợp các điểm
có dạng
{x ∈ Rn |aT x = α},
trong đó a ∈ Rn là một véc - tơ khác 0 và α ∈ R. Véc - tơ a thường được gọi
là véc - tơ pháp tuyến của siêu phẳng. Một siêu phẳng sẽ chia không gian ra
hai nửa không gian.
Nửa không gian được định nghĩa như sau:


6

Định nghĩa 1.1.5 Một tập C được gọi là tập a-phin nếu nó chứa đường
thẳng đi qua hai điểm bất kỳ của nó, tức là
∀x, y ∈ C, ∀λ ∈ R ⇒ λx + (1 − λ)y ∈ C.
Vậy tập a-phin là một trường hợp riêng của tập lồi. Một ví dụ điển hình của
tập a-phin là các không gian con.
Định nghĩa 1.1.6 Một tập lồi mà là giao của một số hữu hạn nửa không
gian đóng gọi là một tập lồi đa diện. Nói cách khác, đó là tập nghiệm của
một hệ hữu hạn các bất phương trình tuyến tính:
ai , x ≤ bi , i = 1, ..., m (ai ∈ Rn , bi ∈ R),
nghĩa là tập các x nghiệm đúng Ax ≤ b với A là một ma trận cấp m × n và

b ∈ Rm .

Hình 1.2: Tập lồi đa diện

Định nghĩa 1.1.7 Một tập C được gọi là nón nếu
∀λ > 0, ∀x ∈ C ⇒ λx ∈ C.
Theo định nghĩa, ta thấy rằng gốc tọa độ có thể thuộc nón hoặc không thuộc
nón. Dĩ nhiên một nón không nhất thiết là một tập lồi. Ví dụ
C := {x ∈ R|x = 0}
là một nón, nhưng không lồi. Một nón được gọi là nón lồi nếu nó đồng thời
là một tập lồi. Một nón lồi được gọi là nón nhọn nếu nó không chứa đường
thẳng. Khi đó ta nói 0 là đỉnh của nón. Nếu nón lồi này lại là một tập lồi đa
diện thì ta nói nó là nón lồi đa diện. Một ví dụ điển hình của nón lồi đa diện,
thường được sử dụng, là tập hợp nghiệm của hệ bất phương trình tuyến tính


7

có dạng
{x|Ax

0},

với A là một ma trận thực cấp hữu hạn (số dòng và số cột là hữu hạn).
1.2

Bao lồi

Định nghĩa 1.2.1 Bao lồi của một tập E là giao của tất cả các tập lồi chứa
E.

Định lý 1.2.2 Cho E là một tập bất kỳ. Khi đó
(i) coE là tập hợp các tổ hợp lồi của các điểm thuộc E.
(ii) af f E là tập hợp các tổ hợp a-phin của các điểm thuộc E.
(iii) coneE là tập hợp các tổ hợp không âm của các điểm thuộc E.
Chứng minh
(i) Gọi M là tập hợp các tổ hợp lồi của các điểm thuộc E. Vì E ⊂ coE
và coE lồi, nên M ⊂ coE. Vì thế để chỉ ra M = coE, ta chỉ cần chứng tỏ M
là tập lồi. Thật vậy lấy x, y ∈ M. Theo định nghĩa của M , các điểm này có
k

dạng x =
k

h
i

i=1
h

j=1

µj = 1. Khi đó nếu α ∈ (0, 1) thì

λi = 1,
i=1

µj y j , với xi , y j ∈ E, λi > 0, µj > 0 với mọi i, j và

λi x , y =


j=1
k

h
i

z := αx + (1 − α)y =

(1 − α)µj y j .

αλi x +
i=1

j=1

Do 0 < α < 1 và λi > 0, µj > 0 với mọi i, j, và do
k

h

(1 − α)µj = 1,

αλi +
i=1

j=1

nên z là một tổ hợp lồi của các điểm thuộc E. Vậy z ∈ M . Suy ra M lồi, và
do đó M = coE.
(ii) Vẫn như trên, ta gọi M là tập hợp củ a các tổ hợp a-phin của các

điểm thuộc E. Do E ⊆ af f E và af f E là tập a-phin, nên M ⊆ af f E. Ta
chỉ cần chứng tỏ M là tập a-phin. Giả sử x, y ∈ M. Theo định nghĩa của M ,


8
k

h
i

các điểm này có dạng x =
i=1
k

i=1

j=1

h

λi = 1,



µj y j , với xi , y j ∈ E với mọi i, j

λi x , y =

µj = 1. Với α bất kỳ, ta có
j=1

k

h
i

z := αx + (1 − α)y =
i=1

Do

k

j=1

h

(1 − α)µj = 1,

αλi +
i=1

(1 − α)µj y j .

αλi x +

j=1

nên z ∈ M và do đó M là tập a-phin. Suy ra M = af f E.
(iii) Từ tính chất (i) và (ii) vừa chứng minh, suy ra rằng một nón lồi là
đóng với phép cộng hai phần tử của nó và phép nhân một phần tử với một

số dương. Từ đây suy ra coneE là tập hợp gồm các tổ hợp không âm của các
phần tử thuộc E.
Định nghĩa 1.2.3 Một điểm x ∈ C được gọi là điểm cực biên của C, nếu
không tồn tại a, b ∈ C, a = b và 0 < λ < 1 sao cho x = λa + (1 − λ)b.
Định nghĩa 1.2.4 Thứ nguyên (hay chiều) của một tập a-phin M được định
nghĩa bởi thứ nguyên của không gian song song với M và được kí hiệu là
dim M.
Định nghĩa 1.2.5 Một tập F ⊆ C được gọi là một diện của một tập lồi C
nếu F là tập lồi có tính chất là:
∀x, y ∈ C : tx + (1 − t)y ∈ F, 0 < t < 1 ⇒ [x, y] ⊂ F.
Điều này có nghĩa rằng, tập lồi F là một diện của C, nếu như khi F chứa
một điểm của đoạn mở (x, y) thì F chứa toàn bộ khoảng [x, y]. Do C lồi, nên
bản thân C cũng là một diện của chính nó. Ta sẽ nói F là một diện không
tầm thường của C nếu như F ≡ ∅ và F ≡ C. Điểm cực biên là diện có thứ
nguyên bằng 0. Cạnh là diện có thứ nguyên bằng 1. Tia cực biên là một diện
nửa đường thẳng. Như vậy tia cực biên là một cạnh vô hạn. Hướng cực biên
là hướng của tia cực biên. Ta nói hai hướng d và h là khác nhau nếu không
thể biểu diễn được d = αh vơi α > 0. Dễ thấy rằng d là hướng cực biên của


9

một tập lồi, nếu nó không thể biểu diễn bằng tổ hợp tuyến tính dương của
hai hướng khác thuộc tập lồi đó.
Định nghĩa 1.2.6 Một điểm a ∈ C được gọi là điểm trong tương đối của C
nếu nó là điểm trong của C theo tô-pô cảm sinh bởi af f C (tập a-phin nhỏ
nhất của C). Kí hiệu tập hợp các điểm trong tương đối của C là riC.
Định lý 1.2.7 Nếu H là một siêu phẳng tựa của C thì H ∩ C là một diện
của C; diện này là không tầm thường khi và chỉ khi H ∩ riC = ∅.
Định lý 1.2.8 (Biểu diễn tập lồi). Nếu C là một tập lồi đóng không chứa

trọn một đường thẳng nào thì
C = coV (C) + coneU (C),
tức là mọi điểm của C đều biểu diễn được như là tổng của một tổ hợp lồi của
các đỉểm cực biên và tổ hợp không âm của các hướng cực biên của C.
Chứng minh.Ta chứng minh bằng quy nạp theo số chiều. Hiển nhiên định
lý đúng khi số chiều của C là 0 và 1. Giả sử x ∈ C bất kỳ. Xét tia Γ :=
{y = x + λu, λ ≥ 0} với u = 0 sao cho Γ cắt biên của C tại một điểm v. Vậy
v = x + λu. Ta có hai trường hợp sau:
a) Trường hợp u ∈ U (C). Do C lồi đóng và không chứa đường thẳng, nên
tia này phải cắt C tại ít nhất một điểm v nào đó thuộc biên của C. Khi
đó tồn tại một siêu phẳng tựa H của C tại v và tập F := H ∩ C là một
diện của C và dim F < dim C. Hiển nhiên F lồi đóng và cũng không
chứa đường thẳng. Theo giả thiết quy nạp ta có:
v ∈ F = coV (F ) + coneU (F ).
Do F là một diện của C, nên
v ∈ F = coV (F ) + coneU (F ) ⊂ coV (C) + coneU (C).
Do u ∈ U (C) và x = v + λu với λ ≥ 0, nên từ đây suy ra
x = v + λu ∈ coV (C) + coneU (C) + coneU (C) = coV (C) + coneU (C).
b) Trường hợp u ∈ U (C) ( chú ý U (C) có thể bằng rỗng). Trong trường
hợp này tia Γ có thể cắt biên của C tại hai điểm, nhưng định lý cũng


10

được chứng minh hoàn toàn tương tự.
Định nghĩa 1.2.9 Cho C = ∅ (không nhất thiết lồi) và y là một véc-tơ bất
kỳ, đặt
dC (y) := inf x − y .
x∈C


Ta nói dC (y) là khoảng cách từ y đến C. Nếu tồn tại π ∈ C sao cho dC (y) =
π − y , thì ta nói π là hình chiếu (vuông góc) của y trên C .
Định lý 1.2.10 Cho C là một tập lồi đóng khác rỗng. Khi đó:
i) Với mọi y ∈ Rn , π ∈ C hai tính chất sau là tương đương:
a) π = pC (y),
b) y − π ∈ NC (π).
ii) Với mọi y ∈ Rn , hình chiếu pC (y) của y trên C luôn tồn tại và duy nhất.
iii) Nếu y ∈
/ C, thì pC (y) − y, x − pC (y) = 0 là siêu phẳng tựa của C tại
pC (y) và tách hẳn y khỏi C, tức là
pC (y) − y, x − pC (y) ≥ 0, ∀x ∈ C,

pC (y) − y, y − pC (y) < 0.
iv) Ánh xạ y → pC (y) có các tính chất sau:
a) pC (x) − pC (y) ≤ x − y

∀x, ∀y. (tính không giãn),

b) pC (x) − pC (y), x − y ≥ pC (x) − pC (y) 2 , (tính đồng bức).
Định nghĩa 1.2.11 Cho ∅ = C ⊆ Rn lồi và f : C → R . Ta nói f là hàm
lồi trên C, nếu epif là một tập lồi trong Rn+1 .
Định nghĩa 1.2.12 + Hàm f : S → [−∞, +∞] xác định trên một tập hợp
lồi S ⊂ Rn được gọi là một hàm lồi trên S nếu với mọi x1 , x2 ∈ S và mọi số
thực λ ∈ [0, 1] ta có
f [(1 − λ)x1 + λx2 ] ≤ (1 − λ)f (x1 ) + λf (x2 ),
mỗi khi vế phải được xác định, nghĩa là hệ thức trên cần được thỏa mãn trừ
khi f (x1 ) = −f (x2 ) = ±∞ (vì biểu thức +∞ − ∞ không có nghĩa).


11


+ Hàm f gọi là lồi chặt trên S nếu với mọi x1 , x2 ∈ S, x1 = x2 , λ ∈ (0, 1)
ta có
f [(1 − λ)x1 + λx2 ] < (1 − λ)f (x1 ) + λf (x2 ).
+ Hàm f gọi là lõm (lõm chặt) trên S nếu −f là lồi (lồi chặt) trên S;
gọi là tuyến tính a-phin (hay đơn giản là a-phin) trên S nếu f hữu hạn và
vừa lồi vừa lõm trên S. Một hàm a-phin trên Rn có dạng f (x) = a, x + α
với a ∈ Rn , α ∈ R, bởi vì với mọi x1 , x2 ∈ Rn và mọi λ ∈ [0, 1] ta có
f [(1 − λ)x1 + λx2 ] < (1 − λ)f (x1 ) + λf (x2 ). Tuy nhiên, hàm a-phin không
lồi chặt hay lõm chặt.
Ví dụ 1.2.13 (Các ví dụ về hàm lồi)
1. Hàm a-phin. f (x) := aT x + α, trong đó a ∈ Rn , α ∈ R. Dễ dàng kiểm
tra được rằng f là một hàm vừa lồi vừa lõm trên toàn không gian. Khi
α = 0, thì hàm này được gọi là hàm tuyến tính.
Cho C = ∅ là một tập lồi.
2. Hàm chỉ. Đặt
δC (x) :=

0
+∞

nếu x ∈ C
nếu x ∈
/C

Ta nói δC là hàm chỉ của C. Do C lồi, nên δC là một hàm lồi.
3. Hàm mặt cầu. Cho S := {x ∈ Rn | x = 1} là một mặt cầu và h : S → R+
là một hàm không âm bất kỳ. Định nghĩa hàm f như sau:



nếu x < 1
0
f (x) :=
h(x) nếu x = 1

 +∞ nếu x > 1
Hàm này được gọi là hàm mặt cầu. Dễ thấy rằng f là một hàm lồi trên
RN , mặc dù h là một hàm không âm bất kỳ trên mặt cầu S.
4. Hàm tựa. Hàm dưới đây được gọi là hàm tựa của C.
sC (y) := sup y, x .
x∈C

5. Hàm khoảng cách. Cho C lồi đóng, hàm khoảng cách đến tập C được
định nghĩa bởi
dC (x) := min x − y .
y∈C


12

6. Hàm chuẩn. Giả sử x = (x1 , ..., xn ).
f (x) := x

1

:= max |xi |
i

Hoặc
1


f (x) := x := (x12 + ... + x2n ) 2 .
7. Hàm tổng chập. Cho f1 , ..., fm là các hàm lồi chính thường trên Rn . Khi
đó hàm f được xác định bởi
m

m
j

f (x) := inf

xj = x

fj (x ) :
j=1

j=1

được gọi là hàm tổng chập của các hàm f1 , ..., fm . Hàm tổng chập này
thường được ký hiệu là f1 ⊕ ... ⊕ fm .
Định lý 1.2.14 Giả sử f là một hàm lồi chính thường trên Rn . Khi đó f
liên tục tại mọi điểm x ∈ int(domf ).
Cho f và g là hai hàm xác định trên C và không nhận giá trị −∞. Như
thường lệ, với mọi x ∈ C, ta định nghĩa các hàm:
(f + g)(x) := f (x) + g(x),
(λf )(x) := λf (x), λ là số thực.
Mệnh đề dưới đây suy ra trực tiếp từ định nghĩa, nhưng rất bổ ích.
Định lý 1.2.15 (i) Cho f và g là các hàm lồi lần lượt trên các tập lồi A
và B, với A ∩ B = ∅. Khi đó hàm (λf ) + (βg) lồi trên A ∩ B, với mọi
λ, β ≥ 0.

(ii) Giới hạn theo từng điểm của một dãy các hàm lồi cũng là một hàm lồi.
Tức là: nếu fi : C → R(i ∈ N ) và dãy số {fi (x)} hội tụ với mỗi x ∈ C,
thì hàm f (x) := lim f i(x) cũng lồi trên C.
i→∞

(iii) Nếu f : C → R lồi trên tập lồi C và hàm một biến ϕ : I → R không
giảm trên khoảng I, sao cho f (C) ⊆ I, thì hàm hợp ϕ ◦ f lồi trên C.
Hệ quả 1.2.16 Giả sử f là một hàm lõm nhận giá trị hữu hạn trên tập đa
diện lồi C ⊂ Rn với dim C = k. Khi đó hàm bao lồi cof được xác định như


13

sau:
k+1

k+1
j

F (x) = min

j

λj v , v ∈ V (C), λj ≥ 0,

λj f (v )|x =
j=1

k+1
j


j=1

λj = 1 .
j=1

Định nghĩa 1.2.17 Một tập S ⊂ Rn được gọi là một đơn hình có thứ nguyên
bằng k nếu S là tổ hợp lồi của k + 1 véc - tơ đọc lập a-phin. Các véc - tơ này
được gọi là đỉnh của đơn hình.
Định nghĩa 1.2.18 Một tập S ⊂ Rn được gọi là một đơn hình có thứ nguyên
bằng k nếu S là tổ hợp lồi của k + 1 véc - tơ đọc lập a-phin. Các véc - tơ này
được gọi là đỉnh của đơn hình.
Định lý 1.2.19 Giả sử S ⊆ Rn là một đơn hình có các đỉnh là v 0 , ..., v n và
f : S → R là một hàm lõm. Khi đó hàm bao lồi của f trên S là một hàm
a-phin l(x) = aT x + b, trong đó a ∈ Rn và b ∈ R là nghiệm của hệ phương
trình tuyến tính
aT v j + b = f (v j ), j = 0, 1, ..., n.
Chứng minh. Lấy mỗi phương trình của hệ
aT v j + b = f (v j ), j = 0, 1, ..., n,
trừ cho phương trình đầu tiên, ta được
(v 0 − v j )T a = f (v 0 ) − f (v j ), j = 1, ..., n.
Do các véc - tơ v 0 − v j (j = 1, ..., n) độc lập tuyến tính, nên nghiệm a của hệ
trên được xác định duy nhất, và từ đó b cũng được xác định duy nhất.
Ta thấy rằng hàm l là hàm nón của f , vì mọi x ∈ S đều biểu diễn được
n

λj v j . Do f lõm trên S, nên

dưới dạng x =
j=0


n

f (x) = f

n

λj v

j

j=0

n
j



λj l(v j ) = l(x).

λj f (v ) =
j=0

j=0

Hơn nữa, nếu F là một hàm lồi nón của f trên S, thì
n

n
j


λj v ) ≤

F (x) = F (
j=0

j

λj F (v ) ≤
j=0

n

n
j

λj l(v j ) = l(x).

λj fj (v ) =
j=0

j=0


14

Chứng tỏ l là hàm lồi nón lớn nhất trong các hàm lồi nón của f trên S.
Định nghĩa 1.2.20 Cho C ⊆ Rn khác rỗng và f : Rn → R. Một điểm
x∗ ∈ C được gọi là cực tiểu địa phương của f trên C nếu tồn tại một lân cận
U của x∗ sao cho

f (x∗ ) ≤ f (x) ∀x ∈ U ∩ C.
Điểm x∗ ∈ C được gọi là cực đại địa phương nếu
f (x) ≤ f (x∗ ) ∀x ∈ U ∩ C.
Nếu
f (x) ≥ f (x∗ ) ∀x ∈ C,
thì x∗ được gọi là cực tiểu toàn cục hay cực tiểu tuyệt đối của f trên C, và
nếu
f (x) ≤ f (x∗ ) ∀x ∈ C,
thì x∗ được gọi là cực đại toàn cục hay cực đại tuyệt đối của f trên C.
Định lý 1.2.21 Cho f : Rn → R ∪ {+∞} lồi. Khi đó mọi điểm cực tiểu địa
phương của f trên một tập lồi đều là cực tiểu toàn cục. Hơn nữa tập hợp các
điểm cực tiểu của f là một tập lồi. Nếu f lồi chặt, thì điểm cực tiểu, nếu
tồn tại, sẽ duy nhất.
Chứng minh. Cho C ⊆ Rn . Giả sử x∗ là điểm cực tiểu địa phương của f
trên C. Khi đó tồn tại lân cận U của x∗ sao cho
f (x) ≥ f (x∗ ) ∀x ∈ U ∩ C.
Với mọi x ∈ C, và 0 < λ < 1, do C lồi và U là lân cận của x∗ ∈ C, nên
điểm xλ := (1 − λ)x∗ + λx ∈ C ∩ U khi λ đủ nhỏ. Dof (x∗ ) ≤ f (xλ) và f lồi,
ta có
f (x∗ ) ≤ f (xλ) ≤ (1 − λ)f (x∗ ) + λf (x).
Từ đây suy ra f (x∗ ) ≤ f (x). Chứng tỏ x∗ là cực tiểu toàn cục của f trên C.
Giả sử x∗ , y ∗ ∈ C là các điểm cực tiểu của f trên C. Vậy f (x∗ ) = f (y ∗ ) ≤
f (x) với mọi x ∈ C. Lấy z ∗ := λx∗ + (1 − λ)y ∗ , với 0 < λ < 1. Do C lồi, nên


15

z ∗ ∈ C và do f lồi, nên
f (z ∗ ) ≤ λf (x∗ ) + (1 − λ)f (y ∗ ) ≤ f (x).
Suy ra z ∗ cũng là điểm cực tiểu của f trên C. Chứng tỏ tập các điểm cực

tiểu của f trên C là lồi. Dễ thấy rằng tập hợp này chỉ gồm nhiều nhất một
điểm khi f lồi chặt.


16

Chương 2

Bài toán tối ưu
Chương này trình bày các kiến thức cơ bản về Bài toán tối ưu. Phát biểu
bài toán tối ưu, bài toán tối ưu lồi, áp dụng cho bài toán định vị và cực đại
hàm lồi.
2.1

Phát biểu bài toán tối ưu

Trong không gian véc - tơ Rn , cho D ⊆ Rn là một tập khác rỗng và
f : D −→ R là một hàm số thực tùy ý. Bài toán tối ưu có dạng
min{f (x) : x ∈ D}

(P)

là bài toán tìm véctơ (điểm) x∗ ∈ D sao cho f (x∗ ) ≤ f (x) với mọi x ∈ D.
Định nghĩa 2.1.1 Hàm f gọi là hàm mục tiêu hay hàm chi phí, tập D gọi
là tập ràng buộc hay miền chấp nhận được. Một véc - tơ (điểm) x ∈ D gọi là
một phương án (lời giải, nghiệm) chấp nhận được. Véc - tơ x∗ ∈ D sao cho
f (x∗ ) ≤ f (x) với mọi x ∈ D gọi là một phương án (lời giải, nghiệm) tối ưu
của bài toán.
Trường hợp D = Rn ta có bài toán tối ưu không ràng buộc:
min{f (x) : x ∈ Rn } hay minn f (x).

x∈R

Trái lại, (P ) là bài toán tối ưu có ràng buộc. Khi ấy tập D thường được
cho bởi
D = {x ∈ Rn : gi (x) ≤ 0, i = 1, ..., m, hj (x) = 0, j = 1, ..., p}
với gi , hj : Rn −→ R là các hàm số cho trước, gọi là các hàm ràng buộc, và


17

bài toán (P ) có thể viết dưới dạng (gọi là dạng chuẩn):
f (x) −→ min,
với điều kiện
gi (x) ≤ 0, i = 1, ..., m,

(2.1)

hj (x) = 0, j = 1, ..., p.

(2.2)

Các hệ thức gi (x) ≤ 0 gọi là các ràng buộc bất đẳng thức, các hệ thức
hj (x) = 0 gọi là các ràng buộc đẳng thức. Ràng buộc bất đẳng thức dạng
xj ≥ 0(−xj ≤ 0) gọi là ràng buộc không âm hay ràng buộc về dấu.
Nhận xét 2.1.2 Ràng buộc bất đẳng thức có thể biến đổi thành ràng buộc
đẳng thức và ngược lại. Thật vậy, các ràng buộc (2.1) có thể được biểu diễn
nhờ hệ thức
gi (x) + yi2 = 0, i = 1, ..., m
với yi là các số thực, gọi là các biến bù. Ngược lại, mỗi ràng buộc đẳng thức
(2.2) tương đương với hai ràng buộc bất đẳng thức

hj (x) ≤ 0, −hj (x) ≤ 0, j = 1, ..., p.
Với nhận xét vừa nêu, không giảm tính tổng quát đôi khi ta xét bài toán
tối ưu chỉ với ràng buộc đẳng thức hoặc chỉ với ràng buộc bất đẳng thức.
Nhận xét 2.1.3 Do min{f (x) : x ∈ D} = − max{−f (x) : x ∈ D} nên bài
toán tìm cực tiểu đưa được về bài toán tìm cực đại và ngược lại.
Định nghĩa 2.1.4 Điểm x∗ ∈ D được gọi là nghiệm cực tiểu toàn cục của
f trên D nếu f (x∗ ) ≤ f (x) với mọi x ∈ D. Nếu f (x∗ ) < f (x) với mọi
x ∈ D, x = x∗ thì x∗ được gọi là nghiệm cực tiểu toàn cục chặt của f trên D.
Các khái niệm nghiệm cực đại địa phương và nghiệm cực đại toàn cục được
định nghĩa tương tự. Đối với hàm tùy ý f trên tập D, ký hiệu tập tất cả các
nghiệm cực tiểu (cực đại) toàn cục của f trên D là Argminx∈D f (x)
(Argmaxx∈D f (x)).
Khi xét một bài toán tối ưu ta mong muốn tìm nghiệm cực trị (cực tiểu,
cực đại) toàn cục của nó. Tuy nhiên, một nghiệm như thế có thể không tồn
tại. Chẳng hạn, hàm một biến f (x) = x và f (x) = ex không có nghiệm cực


18

Hình 2.1: Cực tiểu (cực đại) địa phương (toàn cục)

tiểu toàn cục trên tập số thực R do hàm f (x) = x giảm vô hạn tới −∞ khi
x dần tới −∞, còn hàm f (x) = ex luôn nhận giá trị dương và giảm tới 0 khi
x dần tới −∞.
Tập {f (x) : x ∈ D} được gọi là miền trị của hàm f . Có hai khả năng:
a) Tập {f (x) : x ∈ D} bị chặn dưới, nghĩa là có một số m sao cho m ≤ f (x)
với mọi x ∈ D. Trong trường hợp này cận dưới lớn nhất của {f (x) : x ∈
D} là một số thực và được ký hiệu là inf f (x). Chẳng hạn, inf ex = 0.
x∈D


x∈D

b) Tập {f (x) : x ∈ D} không bị chặn dưới (tức là tập này chứa các số thực
nhỏ tùy ý). Trong trường hợp này ta viết inf f (x) = −∞.
x∈D

Nghiệm cực trị toàn cục thường được tìm trong số các nghiệm cực trị địa
phương. Nhưng việc tìm này nói chung cũng không dễ vì một bài toán có thể
có rất nhiều cực trị địa phương giá trị khác nhau, trừ khi có những giả thiết
đảm bảo nghiệm cực trị địa phương cũng là nghiệm cực trị toàn cục. Vì thế
trên thực tế, trong nhiều trường hợp ta phải bằng lòng với một nghiệm cực
trị địa phương và đôi khi tìm được một nghiệm cực trị địa phương cũng là
đủ.


19

2.2

Bài toán tối ưu lồi

Xét bài toán tối ưu có ràng buộc ở dạng chuẩn (gồm đẳng thức và bất
đẳng thức)
min {f (x) : gi (x) ≤ 0, i = 1, ..., m; hj (x) = 0, j = 1, ..., p}

(P)

với f, gi , hj : Rn −→ R là những hàm khả vi liên tục. Trong số các ràng buộc
bất đẳng thức có thể có ràng buộc không âm dạng −xk ≤ 0 (hay xk ≥ 0) với
k nào đó.

Phương pháp Lagrange, có thể tìm nghiệm bài toán tối ưu có ràng buộc
đẳng thức và bất đẳng thức như sau:
Phát biểu toán học bài toán đặt ra dưới dạng bài toán (P ).
Viết điều kiện cần tối ưu (điều kiện KKT) đối với nghiệm tối ưu. Các
điểm thoả mãn điều kiện KKT gọi là các điểm KKT.
Tìm nghiệm tối ưu trong số các điểm KKT (chẳng hạn bằng cách chỉ rõ
sự tồn tại nghiệm tối ưu, dùng điều kiện đủ tối ưu hay tính và so sánh
giá trị hàm mục tiêu tại các điểm KKT) hoặc chỉ ra nghiệm tối ưu không
tồn tại.
Để tiện sử dụng sau đây sẽ nhắc lại hệ điều kiện KKT và phân tích một
số trường hợp vận dụng điều kiện này để tìm nghiệm tối ưu (cực tiểu hay
cực đại) của (P ).
Xét bài toán

min f (x) với các điểu kiện



 g (x) ≤ 0, i = 1, ..., m,
i
(OP )

hj (x) = 0, j = 1, ..., p,



x∈X
trong đó X ⊆ Rn là một tập lồi đóng khác trống và f, gi (i = 1, ..., m) là các
hàm lồi hữu hạn trên X, còn hj (j = 1, ..., k) là các hàm a-phin hữu hạn trên
tập a-phin của X. Bài toán (OP ) này được gọi là một quy hoạch lồi.

Định lý 2.2.1 (Định lý tách 1). Cho C và D là hai tập lồi khác rỗng trong
Rn sao cho C ∩ D = ∅. Khi đó có một siêu phẳng tách C và D.
Định lý tách vừa nêu có thể suy ra ngay từ Bổ đề 1.1.21 dưới đây, chính
là định lý tách một tập lồi và một phần tử không thuộc nó.


20

Bổ đề 2.2.2 (Bổ đề liên thuộc). Cho C ⊂ Rn là một tập lồi khác rỗng. Giả
sử x0 ∈ C. Khi đó tồn tại t ∈ Rn , t = 0 thỏa mãn
t, x ≥ t, x0 ∀x ∈ C.

(2.1)

Chứng minh Định lý 2.2.1. Do C và D là lồi, nên C − D cũng lồi. Hơn
nữa 0 ∈
/ (C − D), vì C ∩ D = ∅. Theo bổ đề trên áp dụng với x0 = 0, tồn
tại véc-tơ t ∈ Rn , t = 0 sao cho t, z ≥ 0 với mọi z ∈ C − D. Vì z = x − y
với x ∈ C, y ∈ D, nên ta có
t, x ≥ t, y ∀x ∈ C, y ∈ D.
Lấy
α := sup t, y ,
y∈D

khi đó siêu phẳng t, x = α tách C và D.
Định lý 2.2.3 (Karush-Kuhn-Tucker) Nếu x∗ là nghiệm của bài toán quy
hoạch lồi (OP ), thì tồn tại λ∗i ≥ 0 (i = 0, 1, ..., m) và µ∗j (j = 1, ..., k) không
đồng thời bằng 0 sao cho
L(x∗ , λ∗ , µ∗ ) = min L(x∗ , λ∗ , µ∗ ) (điều kiện đạo hàm triệt tiêu)
x∈X


λ∗i gi (x∗ ) = 0(i = 1, .., m) (điều kiện độ lệch bù).
Hơn nữa nếu intX = ∅ và điều kiện Slater sau thoả mãn
∃x0 ∈ D : gi (x0 ) < 0 (i = 1, ..., m)
thì λ∗0 > 0 và hai điều kiện đạo hàm triệt tiêu và độ lệch bù ở trên, cũng
là điều kiện đủ để điểm chấp nhận được xa st là nghiệm tối ưu của bài toán
(OP ).
Chứng minh. Giả sử x∗ là nghiệm của (OP ). Đặt
C := {(λ0 , λ1 , ..., λm , µ1 , ..., µk )|(∃x ∈ X) :
f (x) − f (x∗ ) < λ0 , gi (x) ≤ λi , i = 1, ..., m, hj (x) = µj , j = 1, ..., k}
Do X = ∅ lồi, f , gi lồi và hj a-phin hữu hạn trên X, nên C là một tâp lồi,
khác trống trong Rm+k+1 . Hơn nữa 0 ∈
/ C. Thật vậy, vì nếu trái lại 0 ∈ C,


21

thì tồn tại một điểm chấp nhận được x thoả mãn f (x) < f (x∗ ). điều này
mâu thuẫn với việc x∗ là nghiệm tối ưu của (OP).
Khi đó theo Định lý tách 1, tồn tại λ∗i (i = 0, 1, ..., m), µ∗j (j = 1, ..., k)
không đồng thời bằng 0 sao cho
m

k

λ∗i λi

µ∗j µj ≥ 0 ∀(λ0 , ..., λm , µ1 , ..., µk ) ∈ C.

+


i=1

j=1

Chú ý rằng với mọi λ0 , ..., λm > 0, thì (λ0 , ..., λm , 0, ..., 0) ∈ C, vì theo
định nghĩa của C ta chỉ lấy x = x∗ . Từ chú ý này, ta suy ra ngay tất cả
λ∗0 , λ∗1 , ..., λ∗m ≥ 0. Hơn nữa, với mọi > 0 và x ∈ X, ta lấy λ0 = f (x) −
f (x∗ ) + , λi = gi (x) (i = 1, ..., m), µj = hj (x) (i = 1, ..., k) rồi thay vào bất
đẳng thức trên và cho → 0, sẽ được
m

λ∗0 f (x)

k

λ∗i gi (x)

+
i=1

j=1

m

λ∗0 f (x)

k

λ∗i gi (x∗ )


+

µ∗j hj (x) ≥

+

µ∗j hj (x∗ ) ∀x ∈ X.

+

i=1

j=1

Hay
L(x∗ , λ∗ , µ∗ ) ≤ L(x, λ∗ , µ∗ ) ∀x ∈ X.
Đây chính là điều kiện đạo hàm triệt tiêu.
Để chứng minh điều kiện độ lệch bù, ta chú ý rằng do x∗ chấp nhận được,
nên gi (x∗ ) ≤ 0 với mọi i. Nếu như tồn tại một i nào đó mà gi (x∗ ) = ξ < 0,
thì với mọi > 0, ta có
( , ..., ξ, , ...., , 0, ..., 0) ∈ C (ξ ở vị trí thứ i + 1).
Khi đó, cho → 0, ta thấy λ∗i ξ ≥ 0. Nhưng ξ < 0, nên λ∗i ≤ 0. Suy ra λ∗i = 0.
Điều kiện độ lệch bù do đó cũng được thỏa mãn.
Để chứng minh điều kiện đủ, ta giả sử điều kiện Slater thỏa mãn. Ta có
λ∗0 > 0. Thật vậy, vì nếu λ∗0 = 0, thì do điều kiện đạo hàm triệt tiêu và điều
kiện độ lệch bù, ta có
m

k


λ∗i gi (x∗ )

0=
i=1

m

µ∗j hj (x∗ )

+
j=1

k

λ∗i gi (x)


i=1

µ∗j hj (x) ∀x ∈ X.

+
j=1


×