ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC KHOA HỌC
HOÀNG THỊ HƯƠNG
VỀ BÀI TOÁN CỰC ĐẠI HÀM
LỒI VÀ ỨNG DỤNG CỦA NÓ
Chuyên ngành: TOÁN ỨNG DỤNG
LUẬN VĂN THẠC SĨ TOÁN HỌC
Người hướng dẫn khoa học:
GS.TSKH. LÊ DŨNG MƯU
THÁI NGUYÊN - NĂM 2014
Mục lục
Mục lục i
Lời cảm ơn ii
Mở đầu 1
1 Bài toán cực đại hàm lồi trên tập lồi đa diện 3
1.1 Tập lồi đa diện và hàm lồi . . . . . . . . . . . . . . . . . . . . . 3
1.1.1 Tập lồi đa diện . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.2 Hàm lồi . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2 Bài toán cực đại hàm lồi . . . . . . . . . . . . . . . . . . . . . . 14
1.2.1 Tồn tại và điều kiện tối ưu . . . . . . . . . . . . . . . . 14
1.2.2 Tính chất cực đại hàm lồi . . . . . . . . . . . . . . . . . 17
1.2.3 Ví dụ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2 Một số thuật toán giải bài toán cực đại hàm lồi 23
2.1 Hàm bao lồi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.2 Thuật toán nhánh cận . . . . . . . . . . . . . . . . . . . . . . . 27
2.2.1 Phép chia đơn hình vét kiệt . . . . . . . . . . . . . . . . 27
2.2.2 Thuật toán . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.3 Thuật toán xấp xỉ ngoài . . . . . . . . . . . . . . . . . . . . . . 37
2.4 Thuật toán xấp xỉ trong . . . . . . . . . . . . . . . . . . . . . . 41
Kết luận 45
Tài liệu tham khảo 46
i
Lời cảm ơn
Trong suốt quá trình làm luận văn, tôi luôn nhận được sự hướng dẫn và
giúp đỡ nghiêm túc, nhiệt tình của GS.TSKH. Lê Dũng Mưu (Viện Toán học,
Viện Hàn lâm Khoa học và Công nghệ Việt Nam). Tôi xin bày tỏ lòng biết
ơn sâu sắc đến Thầy và kính chúc Thầy cùng gia đình luôn mạnh khỏe.
Tôi xin chân thành cảm ơn các quý thầy, cô giảng dạy tại Đại học Thái
Nguyên, Viện Toán học, Viện Hàn lâm Khoa học và Công nghệ Việt Nam,
đã mang lại cho tôi nhiều kiến thức và quan tâm giúp đỡ tôi trong suốt quá
trình học tập, nghiên cứu.
Tôi cũng xin cảm ơn các bạn cùng lớp đã giúp đỡ tôi trong suốt thời gian
học tập tại Đại học Thái Nguyên và trong quá trình hoàn thành luận văn
này.
Cuối cùng, con xin cảm ơn bố mẹ. Nhờ có bố mẹ gian khó, vất vả tạo mọi
điều kiện tốt nhất để con có được thành quả ngày hôm nay.
Thái Nguyên, tháng 6 - 2014
Người viết Luận văn
Hoàng Thị Hương
ii
Mở đầu
Giải tích lồi là một phần quan trọng của toán học. Hầu hết các ngành
như tối ưu hóa, giải tích hàm, hình học, toán kinh tế, đều liên quan đến lý
thuyết về các tập lồi và hàm lồi. Đã có rất nhiều nhà toán học nghiên cứu về
vấn đề này và đưa ra nhiều lý thuyết cũng như ứng dụng thực tế. Một trong
những tính chất cơ bản của hàm lồi cho chúng ta sử dụng rộng rãi trong bài
toán tối ưu đó là tính chất đạt giá trị cực đại trên biên.
Trong toán học ứng dụng ta thường gặp bài toán tìm cực đại của hàm lồi
trên một tập lồi. Bài toán này có nhiều ứng dụng trong thực tế, hơn nữa một
số bài toán khác của tối ưu toàn cục có thể quy về bài toán này. Bài toán
này có những tính chất rất cơ bản, tuy nhiên tính chất quan trọng của bài
toán cực đại hàm lồi trên một tập lồi vẫn là nghiệm tối ưu (toàn cục) luôn
đạt trên một điểm cực biên. Lợi dụng tính chất này, người ta đã đưa ra các
thuật toán giải bài toán trên.
Mục đích của luận văn này là giới thiệu bài toán cực đại hàm lồi trên tập
lồi đa diện, trong đó ta đi trình bày điều kiện nghiệm tối ưu và các tính chất
của bài toán. Tiếp đó là trình bày ba thuật toán cơ bản để giải bài toán trên.
Cụ thể luận văn trình bày ba thuật toán sau: thuật toán nhánh cận, thuật
toán xấp xỉ ngoài và thuật toán xấp xỉ trong.
Luận văn gồm mục lục, hai chương, kết luận và tài liệu tham khảo.
Chương 1: Trình bày các kiến thức cơ bản của giải tích lồi. Đó là tập lồi,
tập lồi đa diện và hàm lồi cùng với những tính chất đặc trưng của nó. Tiếp
theo giới thiệu bài toán cực đại của hàm lồi trên một tập lồi cùng với điều
kiện nghiệm tối ưu (toàn cục), tính chất cực đại hàm lồi và xét một số ví dụ
về bài toán cực đại của hàm lồi.
Chương 2: Giới thiệu một số kiến thức cơ bản về hàm bao lồi. Trình bày
1
ba thuật toán cơ bản giải bài toán tìm cực đại hàm lồi trên một tập lồi. Đó
là thuật toán nhánh cận, thuật toán xấp xỉ ngoài và thuật toán xấp xỉ trong.
Sau mỗi thuật toán sẽ có một ví dụ minh họa cho thuật toán.
Luận văn được hoàn thành tại trường Đại học Khoa học, Đại học Thái
Nguyên dưới sự hướng dẫn trực tiếp của GS. TSKH. Lê Dũng Mưu. Mặc dù
tác giả đã hết sức cố gắng nhưng do vấn đề được nghiên cứu là khá phức tạp
và kinh nghiệm nghiên cứu còn hạn chế nên khó tránh khỏi thiếu sót. Trong
quá trình viết luận văn cũng như xử lý văn bản chắc chắn không tránh khỏi
những sai sót nhất định. Tác giả mong nhận được sự góp ý của các quý thầy
cô và các bạn để luận văn được hoàn thiện hơn.
2
Chương 1
Bài toán cực đại hàm lồi trên tập
lồi đa diện
Trong chương này ta trình bày các khái niệm cơ bản của tập lồi, tập lồi đa
diện và hàm lồi cùng với những tính chất đặc trưng của nó. Tiếp theo trình
bày điều kiện cần và đủ của nghiệm tối ưu, tính chất cực đại hàm lồi và xét
một số ví dụ về bài toán cực đại của hàm lồi. Các kiến thức trình bày trong
chương này được tham khảo chủ yếu từ các tài liệu [1], [2], [3], [6], [7].
1.1 Tập lồi đa diện và hàm lồi
1.1.1 Tập lồi đa diện
Định nghĩa 1.1. Một đường thẳng đi qua hai điểm (hai véc-tơ) a, b trong
R
n
là tập hợp tất cả các véc-tơ x ∈ R
n
có dạng
{x ∈ R
n
: x = αa + βb, α, β ∈ R, α + β = 1}.
Định nghĩa 1.2. Đoạn thẳng nối hai điểm a và b trong R
n
là tập hợp các
véc-tơ x có dạng
{x ∈ R
n
: x = αa + βb, α ≥ 0, β ≥ 0, α + β = 1}.
Định nghĩa 1.3. Một tập C ⊆ R
n
được gọi là một tập lồi nếu C chứa mọi
đoạn thẳng đi qua hai điểm bất kỳ của nó. Tức là C lồi khi và chỉ khi
∀x, y ∈ C, λ ∈ [0, 1] ⇒ λx + (1 − λ)y ∈ C.
3
Định nghĩa 1.4. Điểm x ∈ R
n
có dạng x = λ
1
a
1
+λ
2
a
2
+ +λ
k
a
k
với a
i
∈ R
n
,
λ
i
≥ 0, λ
1
+ λ
2
+ + λ
k
= 1 gọi là một tổ hợp lồi của các điểm a
1
, a
2
, , a
k
.
Định nghĩa 1.5. Thứ nguyên (hay số chiều) của một tập lồi C, ký hiệu dimC,
là số chiều của bao affine của nó.
Một tập lồi C trong R
n
gọi là có thứ nguyên đầy nếu dimC = n.
Định nghĩa 1.6. Tập C ⊆ R
n
gọi là một tập affine (hay đa tạp tuyến tính)
nếu C chứa trọn cả đường thẳng đi qua hai điểm bất kỳ của nó, tức là
∀a, b ∈ C, ∀λ ∈ R ⇒ (1 − λ)a + λb ∈ C.
Nhận xét 1.1. Nếu C là một tập affine và a ∈ R
n
thì
i) a + C = {a + x : x ∈ C} cũng là một tập affine.
ii) C là một tập affine chứa gốc khi và chỉ khi C là một không gian con,
nghĩa là nếu a, b thuộc C thì mọi điểm λa + µb cũng thuộc C với λ, µ ∈ R.
Định nghĩa 1.7. Điểm x ∈ R
n
có dạng x = λ
1
a
1
+ λ
2
a
2
+ + λ
k
a
k
với a
i
∈ R
n
và λ
1
+ λ
2
+ + λ
k
= 1 gọi là một tổ hợp affine của các điểm a
1
, a
2
, , a
k
.
Định nghĩa 1.8. Thứ nguyên (hay số chiều) của một tập affine C, ký hiệu
dimC, là số chiều của không gian con song song với nó.
Ta quy ước: dim∅ = −1.
Định nghĩa 1.9. Một tập C ⊂ R
n
được gọi là nón nếu
∀λ > 0, ∀x ∈ C ⇒ λx ∈ C.
Một nón được gọi là nón lồi nếu nó đồng thời là một tập lồi. Một nón được
gọi là nón nhọn nếu nó không chứa đường thẳng. Nếu nón này là một tập lồi
đa diện thì ta nói nó là nón lồi đa diện.
Định nghĩa 1.10. Cho C ⊆ R
n
là một tập lồi và x ∈ C.
(i) Tập
N
C
(x) := {w ∈ R
n
: w, y −x ≤ 0, ∀y ∈ C},
được gọi là nón pháp tuyến ngoài của C tại x và tập −N
C
(x) được gọi là nón
pháp tuyến trong của C tại x.
4
(ii) Tập
N
C
(x) := {w ∈ R
n
: w, y −x ≤ , ∀y ∈ C},
được gọi là nón pháp tuyến của C tại x.
Hiển nhiên 0 ∈ N
C
(x) và dùng định nghĩa ta có N
C
(x) là một nón lồi đóng.
Định nghĩa 1.11. Bao lồi của một tập C là giao của tất cả các tập lồi chứa
C. Bao lồi của một tập C được ký hiệu là coC.
Bao lồi đóng của một tập C là tập lồi đóng nhỏ nhất chứa C. Ta ký hiệu
bao đóng của một tập C là coC.
Bao affine của C là giao của tất cả các tập affine chứa C. Bao affine của
một tập C được ký hiệu là aff C.
Định nghĩa 1.12. Siêu phẳng trong không gian R
n
là một tập hợp các điểm
có dạng
{x ∈ R
n
: a, x = α},
trong đó a ∈ R
n
là một véc-tơ khác 0 và α ∈ R. Véc-tơ a thường được gọi là
véc-tơ pháp tuyến của siêu phẳng.
Định nghĩa 1.13. Nửa không gian đóng là một tập hợp có dạng
{x ∈ R
n
: a, x ≥ α},
trong đó a = 0 và α ∈ R.
Tập
{x ∈ R
n
: a, x > α},
là nửa không gian mở.
Một siêu phẳng sẽ chia không gian ra làm hai nửa không gian, mỗi nửa
không gian ở về một phía của siêu phẳng. Nếu hai nửa không gian này là
đóng thì phần chung của chúng chính là siêu phẳng đó.
Định nghĩa 1.14. Cho hai tập C và D khác rỗng.
(i) Ta nói siêu phẳng a, x = α tách C và D nếu
a, x ≤ α ≤ a, y, ∀x ∈ C, ∀y ∈ D.
5
(ii) Ta nói siêu phẳng a, x = α tách chặt C và D nếu
a, x < α < a, y, ∀x ∈ C, ∀y ∈ D.
(iii) Ta nói siêu phẳng a, x = α tách mạnh C và D nếu
sup
x∈C
a, x < α < inf
y∈D
a, y.
Định lý 1.1. (Định lý tách 1). Cho C và D là hai tập lồi khác rỗng trong R
n
sao cho C ∩ D = ∅. Khi đó có một siêu phẳng tách C và D.
Định lý 1.2. (Định lý tách 2). Cho C và D là hai tập lồi đóng khác rỗng sao
cho C ∩ D = ∅. Giả sử có ít nhất một tập là compact. Khi đó hai tập này có
thể tách mạnh được bởi một siêu phẳng.
Hệ quả 1.1. (Bổ đề Farkas) Cho a ∈ R
n
và A là ma trận cấp m ×n. Khi đó
a, x ≥ 0, với mọi x thỏa mãn Ax ≥ 0, khi và chỉ khi tồn tại y ≥ 0 thuộc R
m
sao cho a = A
T
y.
Ý nghĩa hình học của bổ đề Farkas: Siêu phẳng đi qua gốc tọa độ a, x = 0,
để nón Ax ≥ 0 về một phía của nó khi và chỉ khi véc-tơ pháp tuyến a của siêu
phẳng nằm trong nón sinh bởi các hàng của ma trận A.
Định nghĩa 1.15. Một tập con lồi F của một tập lồi C gọi là một diện của
C nếu x, y ∈ C mà (1 −λ)x + λy ∈ F, 0 < λ < 1 thì [x, y] ⊂ F, nghĩa là nếu một
đoạn thẳng bất kỳ thuộc C có một điểm trong tương đối thuộc F thì cả đoạn
thẳng ấy phải nằm trọn trong F .
Một diện có số chiều 0 gọi là một điểm cực biên của C.
Một diện có số chiều 1 gọi là một cạnh của C.
Nếu một tập lồi C có diện là một nửa đường thẳng thì véc-tơ chỉ phương
của nửa đường thẳng này gọi là một phương cực biên của C.
Tính chất 1.1. Các tính chất sau về diện của các tập lồi
• Một diện của một nón lồi là một nón lồi.
• Một diện của một diện của C cũng là một diện của C.
• Một diện E của một tập lồi đóng C là một tập lồi đóng.
• Giao của tập lồi C với một siêu phẳng tựa của C là một diện của C.
6
• Giả sử F ⊂ R
n
là một tập bất kỳ và C = convF. Khi đó, mọi điểm cực
biên của C đều thuộc F.
Định nghĩa 1.16. Một tập lồi mà là giao của một số hữu hạn nửa không
gian đóng gọi là một tập lồi đa diện. Nói cách khác, đó là tập nghiệm của một
hệ hữu hạn các bất phương trình tuyến tính
a
i
, x ≤ b
i
, i = 1, 2, , m (a
i
∈ R
n
, b
i
∈ R), (1.1)
nghĩa là tập các x nghiệm đúng Ax ≤ b với A là một ma trận cấp m × n và
b ∈ R
m
.
Vì một phương trình tuyến tính có thể biểu diễn tương đương bằng hai
bất phương trình tuyến tính nên một tập lồi đa diện cũng là tập nghiệm của
một hệ các phương trình và bất phương trình tuyến tính
a
i
, x = b
i
, i = 1, 2, , p
a
i
, x ≤ b
i
, i = p + 1, , m.
Hạng của hệ bất phương trình tuyến tính (1.1) được định nghĩa bằng hạng
của ma trận A. Nếu hạng của hệ này bằng m thì ta nói hệ độc lập tuyến tính.
Nhận xét 1.2. i) Một tập lồi đa diện có thể không bị chặn (không giới nội).
ii) Một tập lồi đa diện bị chặn còn được gọi là một đa diện lồi.
iii) Mỗi điểm cực biên của một tập lồi đa diện còn được gọi là một đỉnh
của nó. Tập các đỉnh của C ký hiệu là V (C). Mỗi cạnh vô hạn của một tập
lồi đa diện tương ứng với một phương cực biên của nó.
Cho tập lồi đa diện D = ∅ xác định bởi hệ bất phương trình tuyến tính
(1.1). Khi đó mỗi bất phương trình (1.1) gọi là một ràng buộc của D. Ta nói
điểm x
0
∈ D thỏa mãn chặt ràng buộc i
∗
nếu a
i
∗
, x
0
= b
i
. Với mỗi x ∈ D, ký
hiệu I(x) = {i : a
i
, x = b
i
} là tập chỉ số của những ràng buộc thỏa mãn chặt
tại x.
Ký hiệu I
0
= {i : a
i
, x = b
i
, ∀x ∈ D}. Tính chất đặc trưng của các diện,
các đỉnh và cạnh của D được cho trong định lý sau.
7
Định lý 1.3. Một tập con khác rỗng F ⊂ D là một diện thực sự của D khi
và chỉ khi
F = {x : a
i
, x = b
i
, i ∈ I; a
i
, x ≤ b
i
, i /∈ I},
với I là tập chỉ số sao cho I
0
⊂ I ⊂ {1, , m} (I- tập chỉ số xác định diện F ).
Hơn nữa, ta có dimF = n −rank{a
i
: i ∈ I} và dimD = n −rank{a
i
: i ∈ I
0
}.
Hệ quả 1.2. Nếu D là một tập lồi đa diện xác định bởi hệ (1.1) thì
a) Điểm x
0
∈ D là một đỉnh của D khi và chỉ khi
rank{a
i
: i ∈ I(x
0
)} = n,
nghĩa là x
0
thỏa mãn chặt n ràng buộc độc lập tuyến tính của hệ (1.1).
b) Nếu một đoạn thẳng (nửa đường thẳng hay cả đường thẳng) Γ ⊂ D là
một cạnh của D thì Γ được xác định bởi một tập chỉ số I sao cho
rank{a
i
: i ∈ I} = n − 1,
tức là mọi x ∈ riΓ cùng thỏa mãn chặt n −1 ràng buộc độc lập tuyến tính của
hệ (1.1).
Mỗi tập lồi đa diện có một số hữu hạn đỉnh và cạnh (hữu hạn hay vô hạn).
Hình 1.1: Tập lồi đa diện
Định lý 1.4. a) Mỗi đa diện lồi C bằng bao lồi của tất cả các đỉnh của nó:
C = conv V (C) hay x ∈ C khi và chỉ khi x = λ
1
v
1
+ + λ
p
v
p
với mọi λ
i
≥ 0,
λ
1
+ + λ
p
= 1 và v
i
(i = 1, , p) là các đỉnh của C.
8
b) Với tập lồi đa diện C không giới nội, mỗi x ∈ C có thể biểu diễn dưới
dạng một tổ hợp lồi của các đỉnh của C cộng với một tổ hợp tuyến tính không
âm của các phương cực biên của C, nghĩa là x ∈ C khi và chỉ khi
x = λ
1
v
1
+ + λ
p
v
p
+ µ
1
u
1
+ + µ
q
u
q
,
với mọi λ
i
≥ 0, λ
1
+ + λ
p
= 1, µ
j
≥ 0, p, q ≥ 0 là số nguyên, v
i
là đỉnh của
C (i = 1, , p), u
j
(j = 1, , q) là phương của các cạnh vô hạn của C.
Với tập lồi đa diện C không có đỉnh thì trong biểu diễn trên chỉ cần các
v
i
∈ C và các u
j
∈ rec C.
Định lý trên cho thấy ứng với mỗi tập lồi đa diện C cho trước có hai nhóm
hữu hạn véc-tơ, sao cho tập lồi ấy chính là tập tất cả các điểm có thể biểu
diễn thành tổng của một tổ hợp lồi của các véc-tơ thuộc nhóm thứ nhất và
một tổ hợp tuyến tính không âm của các véc-tơ thuộc nhóm thứ hai. Các
véc-tơ trong nhóm thứ nhất đều là các đỉnh của C, các véc-tơ trong nhóm
thứ hai đều là các phương vô hạn của C. Nếu C bị chặn thì trong biểu diễn
trên chỉ còn lại tổng thứ nhất.
Ngược lại, có thể chứng minh được rằng nếu cho trước hai nhóm hữu hạn
véc-tơ thì tập tất cả các điểm có biểu diễn như trên xác định một tập lồi đa
diện.
1.1.2 Hàm lồi
Định nghĩa 1.17. Hàm f : C → R ∪ {+∞} xác định trên một tập hợp lồi
C ⊆ R
n
.
Hàm f được gọi là hàm lồi trên C nếu
f[(1 −λ)x + λy] ≤ (1 − λ)f(x) + λf(y), ∀x, y ∈ C, x = y, ∀λ ∈ [0, 1].
Hàm f được gọi là hàm lồi chặt trên C nếu
f[(1 −λ)x + λy] < (1 − λ)f(x) + λf(y), ∀x, y ∈ C, x = y, ∀λ ∈ (0, 1).
Hàm f được gọi là hàm lõm (lõm chặt) trên C nếu hàm −f là hàm lồi (lồi
chặt) trên C.
9
Hàm f được gọi là hàm tuyến tính affine (hay hàm affine) trên C nếu f
hữu hạn và vừa lồi vừa lõm trên C.
Hàm lồi f : C → R ∪ {+∞} có thể được mở rộng thành hàm lồi xác định
trên toàn không gian R
n
bằng cách đặt f(x) = +∞ với mọi x /∈ C. Vì vậy để
đơn giản ta thường xét hàm lồi trên toàn R
n
.
Nhận xét 1.3. i) Hàm affine không lồi chặt hay lõm chặt.
ii)Một hàm lồi chặt là lồi, nhưng điều ngược lại không đúng.
Định nghĩa 1.18. Cho hàm bất kỳ f : C → R ∪ {+∞} với C ⊆ R
n
.
Miền hữu dụng của f là tập
domf = {x ∈ C : f(x) < +∞}.
Tập trên đồ thị của f là
epif = {(x, α) ∈ C × R : f(x) ≤ α}.
Nếu domf = ∅ và f(x) > −∞, ∀x ∈ C thì f được gọi là hàm lồi chính
thường.
Chú ý 1.1. Ta có thể chứng minh hàm f lồi trên C khi và chỉ khi
i) Tập trên đồ thị epif là một tập lồi, hoặc
ii) f(
m
k=1
λ
k
x
k
) ≤
m
k=1
λ
k
f(x
k
) với mọi x
k
∈ C,
m
k=1
λ
k
= 1 và λ
k
≥ 0 với mọi
k, trong đó m ≥ 2, m là số nguyên (bất đẳng thức Jensen).
Ví dụ 1.1. Cho C là một tập lồi, khác rỗng của không gian R
n
. Hàm chỉ của
C được định nghĩa bởi
δ
C
(x) =
0 nếu x ∈ C,
+∞ nếu x /∈ C.
là hàm lồi.
Định nghĩa 1.19. Hàm f(x) xác định trên một tập lồi C ⊂ R
n
được gọi là
lồi mạnh trên C, nếu tồn tại hằng số ρ > 0 (hằng số lồi mạnh) sao cho với
mọi x, y ∈ C và mọi số λ ∈ [0, 1] ta có bất đẳng thức
f[λx + (1 −λ)y] λf(x) + (1 − λ)f(y) − λ(1 −λ)ρ x − y
2
.
10
Ta có thể chứng minh hàm f(x) lồi mạnh khi và chỉ khi f(x) − ρ x
2
là hàm lồi. Một hàm lồi mạnh thì lồi chặt, nhưng điều ngược lại không chắc
đúng. Chẳng hạn, hàm e
x
, x ∈ R, lồi chặt nhưng không lồi mạnh.
Các hàm lồi mạnh có vai trò đặc biệt quan trọng trong nghiên cứu các bài
toán tối ưu.
Ví dụ 1.2. Hàm f(x
1
, x
2
) = x
2
1
+ x
2
2
lồi mạnh. Tổng quát, xét hàm bậc hai
f(x) =
1
2
x, Qx+ p, x,
với Q là một ma trận vuông đối xứng cấp n xác định dương và p ∈ R
n
. Tính
lồi mạnh của f được suy ra từ hệ thức
f[λx + (1 −λ)y] ≤ λf(x) + (1 − λ)f(y) − λ(1 −λ)x −y, Q(x − y)
≤ λf(x) + (1 − λ)f(y) − λ(1 −λ)ρ x − y
2
,
chú ý rằng với 0 ≤ λ ≤ 1 thì λ
2
≤ λ, (1 − λ)
2
≤ (1 −λ) và vì rằng
x −y, Q(x − y) ≥ ρ x − y
2
,
trong đó ρ là giá trị riêng nhỏ nhất (dương) của ma trận Q.
Tính chất 1.2. Bốn phép toán cơ bản bảo toàn hàm lồi
• Nếu f
i
: R
n
→ R (i = 1, , m) là hàm lồi thì α
1
f
1
+ + α
m
f
m
lồi với mọi
α
i
≥ 0 và lồi chặt nếu ít nhất một trong các hàm f
i
lồi chặt với α
i
> 0.
• Nếu f
i
(i ∈ I) : R
n
→ R là hàm lồi thì hàm f(x) = sup
i∈I
f
i
(x) là hàm lồi.
• Nếu A : R
n
→ R
m
là biến đổi tuyến tính và g : R
m
→ R là hàm lồi thì
hàm hợp f(x) = g(Ax) là hàm lồi.
• Nếu g : D ⊆ R
n
→ R là hàm lồi và h : R → R là hàm lồi không giảm thì
hàm hợp f(x) = h(g(x)) là hàm lồi.
Định lý 1.5. Giả sử f : S → R ∪ {+∞} là một hàm lồi trên R
n
và α ∈
R ∪{+∞}.
Khi đó, các tập mức dưới
C
α
= {x : f(x) < α}, C
α
= {x : f(x) ≤ α}
11
là tập lồi.
Tương tự, nếu f là một hàm lõm trên R
n
thì các tập mức trên
D
β
= {x : f(x) > β}, D
β
= {x : f(x) ≥ β}
là tập lồi.
Nhận xét 1.4. i) Mệnh đề đảo của định lý trên không đúng.
ii) Một hàm f mà mọi tập mức dưới là tập lồi gọi là một hàm tựa lồi.
Ví dụ 1.3. f(x) = x
3
hay f(x) =
x trên R là hàm tựa lồi nhưng không
là hàm lồi.
Định lý 1.6. Cho C là một tập lồi, khác rỗng trong R
n
và f : R
n
→ R là
một hàm lồi. Mọi điểm cực tiểu địa phương của f trên C đều là điểm cực tiểu
toàn cục. Tập Argmin
x∈C
f(x) là tập con lồi của C.
Hệ quả 1.3. Bất cứ điểm cực đại địa phương nào của một hàm lõm trên một
tập lồi cũng là điểm cực đại toàn cục. Tập tất cả các điểm cực đại của một
hàm lõm trên một tập lồi là lồi.
Định lý 1.7. Hàm f(x), x ∈ R
n
, là hàm lồi khi và chỉ khi hàm một biến số
ϕ(λ) ≡ f(x + λd) là hàm lồi theo λ với mỗi x, d ∈ R
n
.
Định lý 1.8. Hàm lồi chính thường f trên R
n
liên tục tại mọi điểm trong
của miền hữu dụng của nó (f liên tục trên int(domf)).
Nhận xét 1.5. Một hàm lồi chính thường chỉ có thể gián đoạn tại những
điểm biên của miền hữu dụng của nó.
Ví dụ 1.4. Xét hàm một biến số xác định trên tập C = [0, +∞) có dạng:
f(x) = e
x
với mọi x > 0 và f(0) = 2. Dễ thấy epif là tập lồi nên f là hàm lồi
trên C. Hàm f liên tục tại mọi điểm trong x > 0 và gián đoạn tại điểm biên
x = 0. Tại x = 0 hàm f nửa liên tục trên trên C.
Định lý 1.9. Cho một tập lồi C ⊂ R
n
và hàm f : R
n
→ R khả vi trên C.
a) Hàm f lồi trên C khi và chỉ khi
f(y) ≥ f(x) + f(x), y − x,
12
với mọi x, y ∈ C.
b) Nếu
f(y) > f(x) + f(x), y − x,
với mọi x, y ∈ C và x = y thì hàm f lồi chặt trên C.
Định lý 1.10. Cho một tập lồi mở C ⊂ R
n
và hàm f : R
n
→ R hai lần khả
vi liên tục trên C.
2
f(x) là ma trận các đạo hàm riêng cấp hai của f tại x.
a) Nếu
2
f(x) nửa xác định dương với mỗi x ∈ C (tức là y,
2
f(x)y 0
với mọi y ∈ R
n
) hoặc nếu
2
f(x) có mọi giá trị riêng không âm thì hàm f lồi
trên C.
b) Nếu
2
f(x) xác định dương với mỗi x ∈ C (tức là y,
2
f(x)y > 0, với
mọi y ∈ R
n
\ {0}) hoặc nếu
2
f(x) có mọi giá trị riêng dương thì hàm f lồi
chặt trên C.
c) Nếu C = R
n
và hàm f lồi thì
2
f(x) nửa xác định dương với mọi x ∈ R
n
.
Hệ quả 1.4. (Điều kiện cần cho hàm lồi/ lõm). Giả sử f : R
n
→ R là một
hàm hai lần khả vi liên tục và f
”
jj
(x) là đạo hàm riêng hai lần của f theo cùng
biến x
j
.
• Nếu f(x) lồi thì f
”
jj
(x) ≥ 0, j = 1, , n với mọi x.
• Nếu f(x) lõm thì f
”
jj
(x) ≤ 0, j = 1, , n với mọi x.
• Nếu f(x) lồi chặt thì f
”
jj
(x) > 0, j = 1, , n với mọi x.
• Nếu f(x) lõm chặt thì f
”
jj
(x) < 0, j = 1, , n với mọi x.
Định lý 1.11. Cho Q là một ma trận vuông đối xứng thực cấp n × n. Hàm
toàn phương f(x) = x, Qx lồi khi và chỉ khi Q nửa xác định dương. Hơn nữa,
hàm f lồi chặt khi và chỉ khi Q xác định dương.
Hệ quả 1.5. Hàm bậc hai f(x) =
1
2
x, Qx + c, x + α lồi (lồi chặt) trên R
n
khi và chỉ khi ma trận Q nửa xác định dương (xác định dương) và f lõm (lõm
chặt) trên R
n
khi và chỉ khi ma trận Q nửa xác định âm (xác định âm).
Ví dụ 1.5. Xét hàm f(x) = f(x
1
, x
2
) = x
2
1
− 2x
1
x
2
+ 3x
2
2
. Ta thấy
f(x) =
2x
1
− 2x
2
−2x
1
+ 6x
2
và
2
f(x) =
2 −2
−2 6
.
13
Do
2
f(x) xác định dương ∀x nên hàm f đã cho lồi chặt trên R
2
.
Định nghĩa 1.20. Với d ∈ R
n
\ {0}, nếu tồn tại giới hạn (hữu hạn hay vô
hạn)
lim
λ→0
f
x
0
+ λd
−f(x
0
)
λ
thì giới hạn đó gọi là đạo hàm theo hướng d của hàm f tại x
0
, ký hiệu là
f
(x
0
, d).
Định nghĩa 1.21. Cho hàm lồi chính thường f trên R
n
, véc-tơ p ∈ R
n
gọi là
dưới đạo hàm của f tại điểm x
0
nếu
p, x −x
0
+ f(x
0
) ≤ f(x), ∀x ∈ R
n
.
Tập tất cả các dưới đạo hàm của f tại x
0
gọi là dưới vi phân của f tại x
0
và
ký hiệu là ∂f(x
0
). Hàm f được gọi là khả dưới vi phân tại x
0
nếu ∂f(x
0
) = ∅.
Ví dụ 1.6. Dưới vi phân của hàm chỉ δ
C
(x) của một tập lồi C = ∅ tại một
điểm x
0
∈ C chính là nón pháp tuyến ngoài của C
∂δ
C
(x
0
) = {p : p, x −x
0
≤ 0, ∀x ∈ C}.
1.2 Bài toán cực đại hàm lồi
Do min{f(x) : x ∈ C} = −max{−f(x) : x ∈ C} và tập nghiệm của hai bài
toán này trùng nhau nên lý thuyết cực tiểu (hay cực đại) hàm lồi cũng chính
là lý thuyết cực đại (hay cực tiểu) hàm lõm.
1.2.1 Tồn tại và điều kiện tối ưu
Sự tồn tại nghiệm tối ưu
Xét bài toán
max{f(x) : x ∈ C ⊆ R
n
} (P )
Có bốn trường hợp tồn tại nghiệm tối ưu
• C = ∅ (không có điểm chấp nhận được).
• f không bị chặn trên trên C (sup
x∈C
f(x) = +∞).
14
• sup
x∈C
f(x) < ∞ nhưng không có nghiệm.
• Tồn tại x
∗
∈ C sao cho f(x
∗
) = max
x∈C
f(x).
Định lý 1.12. Điều kiện cần và đủ cho sự tồn tại nghiệm tối ưu của Bài
toán (P ) là
F
+
(C) := {t ∈ R : f(x) ≥ t, x ∈ C},
đóng và bị chặn trên.
Chứng minh. Nếu x
∗
là nghiệm tối ưu thì F
+
(C) = [−∞, f(x
∗
)] là đóng
(phần bù của một tập mở) và rõ ràng là bị chặn trên.
Ngược lại, giả sử F
+
(C) bị chặn trên. Đặt t
∗
= sup F
+
(C) < +∞. Vì F
+
(C) là
đóng, t
∗
∈ F
+
(C) nên tồn tại x
∗
∈ C sao cho f(x
∗
) = t
∗
. Chứng tỏ x
∗
là một
nghiệm cực đại của f trên C.
Định lý 1.13. (Weistrass) Nếu C là tập compact khác rỗng và f là hàm nửa
liên tục trên trên C, thì Bài toán (P ) có nghiệm tối ưu.
Chứng minh. Đặt α := sup
x∈C
f(x). Theo định nghĩa có một dãy {x
k
} ⊂ C sao
cho lim
k→−∞
f(x
k
) = α. Do C compact nên ta có một dãy con hội tụ về x
0
∈ C,
không giảm tính tổng quát ta có thể coi x
k
→ x
0
. Vì f nửa liên tục trên nên
α < +∞. Nhưng x
0
∈ C nên theo định nghĩa của α, ta phải có f(x
0
) ≤ α. Vậy
f(x
0
) = α.
Hệ quả 1.6. Nếu C là tập đóng khác rỗng, f là hàm nửa liên tục trên trên
C và thỏa mãn điều kiện bức sau
f(x) → −∞ khi x ∈ C, x → +∞,
thì f có điểm cực đại trên C.
Chứng minh. Đặt
C(a) := {x ∈ C : f(x) ≥ f(a)}, với a ∈ C.
Ta thấy C(a) đóng và bị chặn nên f có điểm cực đại trong C(a) mà điểm
đó cũng là điểm cực đại của f trên C.
15
Điều kiện tối ưu
Mệnh đề 1.1. Giả sử C ⊂ R
n
là tập lồi và f : C → R là hàm lồi. Nếu f(x)
đạt cực đại trên C tại điểm trong tương đối x
0
của C (x
0
∈ riC) thì f(x) bằng
hằng số trên C. Tập Argmax
x∈C
f(x) là hợp của một số diện của C.
Chứng minh. Giả sử f đạt cực đại trên C tại điểm x
0
∈ riC và giả sử x là
điểm tuỳ ý thuộc C. Do x
0
∈ riC nên tìm được y ∈ C sao cho x
0
= λx+(1−λ)y
với λ nào đó thuộc (0, 1).
Khi đó
f(x
0
) ≤ λf(x) + (1 −λ)f (y).
Vì thế
λf(x) ≥ f(x
0
) −(1 −λ)f(y) ≥ f(x
0
) −(1 −λ)f(x
0
) = λf(x
0
).
Như vậy f(x) ≥ f(x
0
). Từ đó f(x) = f(x
0
) hay f (x) bằng hằng số trên C. Mặt
khác, nếu một điểm trong tương đối của một diện là điểm cực đại, thì mọi
điểm của diện đều là điểm cực đại.
Mệnh đề 1.2. Giả sử C là tập lồi, đóng và f : C → R là hàm lồi. Nếu C
không chứa đường thẳng nào và f(x) bị chặn trên trên mọi nửa đường thẳng
trong C thì
max{f(x) : x ∈ C} = max{f(x) : x ∈ V (C)},
trong đó V (C) là tập các điểm cực biên của C, nghĩa là nếu cực đại của f(x)
đạt được trên C thì cũng đạt được trên V (C).
Chứng minh. Ta có C = coV (C) + K, trong đó K là nón lồi sinh bởi các
phương cực biên của C. Một điểm bất kỳ thuộc C mà nó không phải là điểm
cực biên, sẽ thuộc nửa đường thẳng xuất phát từ một điểm v nào đó thuộc
V (C) theo phương của một tia trong K. Do f(x) hữu hạn và bị chặn trên trên
nửa đường thẳng này, nên cực đại của nó trên đường thẳng này đạt được tại
v. Như vậy max của f(x) trên C bằng max của f trên coV (C). Khi đó, vì bất
kỳ x ∈ coV (C) đều có dạng
x =
i∈I
λ
i
v
i
với v
i
∈ V (C) và λ
i
≥ 0,
i∈I
λ
i
= 1,
16
cho nên
f(x) ≤
i∈I
λ
i
f(v
i
) ≤ max
i∈I
f(v
i
).
Hệ quả 1.7. Hàm lồi f trên tập lồi đa diện C, không chứa đường thẳng nào,
hoặc không bị chặn trên trên một cạnh vô hạn nào đó của C, hoặc đạt cực đại
tại một đỉnh của C.
1.2.2 Tính chất cực đại hàm lồi
Định nghĩa 1.22. Cho C ⊆ R
n
khác rỗng và f : R
n
→ R. Một điểm x
∗
∈ C
được gọi là cực đại địa phương của f trên C nếu tồn tại một lân cận U của
x
∗
sao cho
f(x) ≤ f(x
∗
) ∀x ∈ U ∩ C.
Nếu
f(x) ≤ f(x
∗
) ∀x ∈ C,
thì x
∗
được gọi là cực đại toàn cục hay cực đại tuyệt đối của f trên C.
Chú ý 1.2. Ta thấy rằng cực đại địa phương của một hàm lồi không nhất
thiết là cực đại tuyệt đối. Ví dụ hàm f(x) = x
2
có điểm cực đại địa phương
trên đoạn [−1, 2] là x = −1, nhưng điểm cực đại tuyệt đối lại là x = 2. Nếu xét
hàm này trên đoạn [−2, 2] ta thấy tập các điểm cực đại tuyệt đối của nó trên
đoạn này là không lồi vì nó chỉ gồm hai điểm −2 và 2. Dưới đây, nếu không
nói gì thêm, ta luôn hiểu cực đại là cực đại tuyệt đối.
Từ định nghĩa hàm lồi, ta thấy rằng, nếu f lồi chính thường trên một tập
lồi C và a, b ∈ C, thì với mọi x thuộc đoạn [a, b], tức là
x = λa + (1 −λ)b, 0 < λ < 1,
ta có
f(x) ≤ λf(a) + (1 −λ)f (b) ≤ max{f(a), f(b)}.
Từ đây suy ra rằng cực đại của một hàm lồi f trên một đoạn [a, b] đạt tại đầu
mút của đoạn đó. Một cách tổng quát ta có.
17
Mệnh đề 1.3. i) Giả sử f là một hàm lồi chính thường trên R
n
và C ⊆ R
n
là một tập lồi. Khi đó nếu f đạt cực đại tại một điểm trong tương đối của C,
tại đó f có giá trị hữu hạn, thì f là hằng số trên C.
ii) Nếu f là một hàm lồi, chính thường, bị chặn trên trong một tập affine,
thì nó là hằng số trên tập này.
Chứng minh. i) Giả sử a ∈ riC là điểm tại đó f đạt cực đại của nó trên C.
Theo tính chất của điểm trong tương đối, nên với mọi x ∈ affC, đều tồn tại
y ∈ C sao cho a ∈ (x, y). Theo nhận xét ở trên và do f(x) ≤ f(a), f(y) ≤ f(a),
và f lồi, suy ra f(x) = f(a) hoặc f(y) = f(a).
ii) Nếu f không là hằng số trên tập affine M, có nghĩa là tồn tại a, b ∈ M
sao cho f(a) < f(b). Mọi điểm x thuộc nửa đường thẳng xuất phát từ a và có
hướng b − a đều có dạng x = a + λ(b −a) với λ > 0. Khi đó
b =
1
λ
x +
λ −1
λ
a.
Với mọi λ > 1, theo tính lồi của f ta có
f(b) ≤
1
λ
f(x) +
λ −1
λ
f(a).
Từ đây và do giả thiết f(x) ≤ m < ∞ với mọi x ∈ M, ta suy ra
f(b) −f(a) ≤
1
λ
f(x) −
1
λ
f(a) ≤
1
λ
[m −f(a)].
Điều này đúng với mọi λ > 1, nên khi cho λ → +∞ ở vế phải, do f(a) hữu hạn,
nên vế phải tiến tới 0, trong khi đó theo giả thuyết, vế trái f(b) − f(a) > 0.
Mâu thuẫn. Vậy f phải là hằng số trên tập affine M.
Hệ quả 1.8. Nếu một hàm lồi đạt cực đại trên một tập lồi có điểm cực biên,
thì cực đại sẽ đạt tại một điểm cực biên của tập lồi đó.
Chứng minh. Giả sử x
∗
là điểm cực đại của f trên tập lồi C. Nếu x
∗
không
phải điểm cực biên của C, thì tồn tại a, b ∈ C và λ ∈ (0, 1) sao cho
x
∗
= λa + (1 −λ)b.
Theo (i) của Mệnh đề 1.3, ta có: f(x
∗
) = f(x) với mọi x ∈ [a, b].
18
Hệ quả 1.9. Cho Γ := {λd | λ ≥ 0} và Γ
a
:= a + Γ với a, d ∈ R
n
. Giả sử f
là một hàm lồi chính thường trên R
n
và f bị chặn trên trên nửa đường thẳng
song song với Γ
a
. Ngoài ra cực đại của f trên nửa đường thẳng Γ
a
đạt tại đầu
mút của nó.
Chứng minh. Do f bị chặn trên trên tia Γ
a
⊂ domf. Nếu Γ
a
Γ
b
, thì Γ
b
⊂
domf.
Theo Hệ quả 1.10 tính bị chặn trên của một hàm lồi trên một nửa đường
thẳng không phụ thuộc vào đầu mút của nửa đường thẳng mà chỉ phụ thuộc
vào hướng của nó.
1.2.3 Ví dụ
Ví dụ 1
Bài toán tìm phương án sản xuất trong kinh tế
Bài toán cực đại hàm lồi có rất nhiều ứng dụng trong các lĩnh vực khác nhau.
Trong kinh tế nó là bài toán xác định phương án sản xuất sao cho chi phí
thấp nhất, khi đó hàm lợi nhuận là cao nhất. Gọi x là phương án sản xuất mà
mỗi tọa độ x
i
(a
i
≤ x
i
≤ b
i
); a
i
, b
i
∈ R
+
, a
i
≤ b
i
của nó là số lượng sản phẩm
loại i (i = 1, , n) cần sản xuất, còn f
i
: [a
i
, b
i
] → R
+
là hàm tuyến tính. Khi
đó f(x) là hàm chi phí sản xuất ứng với phương án x. Ta có hàm mục tiêu
f(x) =
m
i=1
f
i
(x
i
) là hàm tuyến tính. Tính chất tuyến tính có nghĩa là chi phí
để sản xuất một đơn vị sản phẩm là như nhau, không phụ thuộc vào số lượng
hàng hóa. Trong thực tế chi phí sản xuất cho một đơn vị sản phẩm phụ thuộc
vào số lượng sản phẩm, thông thường là sản xuất càng nhiều thì chi phí cho
một đơn vị sản phẩm càng giảm. Do đó trong thực tế hàm chi phí thường là
hàm lõm.
Như vậy trong thực tế ta phải cực tiểu hàm chi phí (cực đại hàm lợi nhuận).
Tức là ta phải cực tiểu một hàm lõm (tức là cực đại của hàm lồi).
19
Hình 1.2: 1.2a Hàm tuyến tính; 1.2b Hàm phụ phí cố định; 1.2c Hàm lõm
Ví dụ 2
Quy hoạch song tuyến tính
Bài toán quy hoạch song tuyến tính có dạng sau
min f(x, y) = p
T
x + x
T
Qy + q
T
y, x ∈ X, y ∈ Y (1.2)
trong đó X, Y là các đa diện lồi trong R
n
và R
m
tương ứng, và p ∈ R
n
, q ∈ R
m
,
Q ∈ R
n×m
. Cho V (X), V (Y ) kí hiệu các tập đỉnh X, Y tương ứng.
Mệnh đề 1.4. Bài toán (1.2) có thể quy về bài toán quy hoạch lõm với ràng
buộc tuyến tính.
Chứng minh. Ta đã biết theo quy hoạch tuyến tính với mọi x ∈ X cố định,
nghiệm bài toán quy hoạch tuyến tính
min{f(x, y) : y ∈ Y }
có lời giải tại một đỉnh của Y.
Bài toán (1.2) có thể viết lại như sau
min
x∈X,y∈Y
f(x, y) = min
x∈X
{min
y∈Y
f(x, y)} = min
x∈X
{ min
y∈V (Y )
f(x, y)} = min
x∈X
g(x)
20
trong đó
g(x) := min
y∈V (Y )
f(x, y) = p
T
x + min{(q + Q
T
x)
T
y : y ∈ V (Y )}.
Vì tập V (Y ) là hữu hạn và với mỗi y ∈ V (Y ), f(x, y) là hàm tuyến tính của x,
ta thấy
f(x) := min{(q + Q
T
x)
T
y : y ∈ V (Y )}
là cực tiểu từng điểm của một họ hữu hạn của hàm affine. Vậy Bài toán (1.2)
là hàm lõm và tuyến tính từng khúc.
Hoán vị vai trò của x và y trong Mệnh đề 1.4 ta được một công thức tương
đương
min
y∈Y
{q
T
y + min{(p + Qy)
T
x : x ∈ X}}.
Mệnh đề 1.5. Nếu (x, y) với x ∈ V (X), y ∈ V (Y ) là cặp nghiệm tối ưu của
(1.2) thì
min
x∈y
f(x, y) = f(x, y) = min
y∈Y
f(x, y) (1.3)
Điều kiện (1.3) không là điều kiện đủ để (x, y) là nghiệm tối ưu của (1.2).
Mệnh đề 1.6. Cho (x, y) thỏa mãn điều kiện (1.3). Nếu y là cực tiểu duy
nhất của f(x, y) trên Y , thì x là cực tiểu địa phương của
f(x) = min{f(x, y) : y ∈ Y }
trên X.
Chứng minh. Ta có
f(x, y) < f(x, y), ∀y ∈ Y, y = y.
Hàm f(x, y) liên tục với mỗi y ∈ Y , y = y, do đó tồn tại một lân cận mở U(y)
của x sao cho
f(x, y) < f(x, y), ∀x ∈ U(y).
Vì thế, với mọi
x ∈ U = ∩{U(y) : y ∈ V (y), y = y},
ta có
21
f(x, y) < f(x, y), ∀y ∈ V (Y ), y = y.
Vì
f(x, y) = min{f(x, y) : x ∈ X},
nên
f(x, y) ≤ min{f(x, y) : y ∈ V (Y )} = min{f(x, y) : y ∈ Y }, ∀x ∈ U(y).
Tức là x là cực tiểu địa phương của f(x).
22