Tải bản đầy đủ (.pdf) (52 trang)

Toán tử chiếu và ứng dụng vào bài toán tối ưu lồi không trơn

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (268.7 KB, 52 trang )

ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC KHOA HỌC

BÙI VĂN HOAN

TOÁN TỬ CHIẾU VÀ ỨNG DỤNG VÀO BÀI
TOÁN TỐI ƯU LỒI KHÔNG TRƠN

LUẬN VĂN THẠC SĨ TOÁN HỌC

Thái Nguyên - 2016


ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC KHOA HỌC

BÙI VĂN HOAN

TOÁN TỬ CHIẾU VÀ ỨNG DỤNG VÀO BÀI
TOÁN TỐI ƯU LỒI KHÔNG TRƠN

LUẬN VĂN THẠC SĨ TOÁN HỌC

Chuyên ngành: Toán ứng dụng
Mã số:
60 46 01 12

NGƯỜI HƯỚNG DẪN KHOA HỌC
GS.TSKH. LÊ DŨNG MƯU

Thái Nguyên - 2016




i

Mục lục
Mục lục

i

Các kí hiệu và danh mục các từ viết tắt

ii

Mở đầu

1

1 Tập lồi, hàm lồi và toán tử chiếu

3

1.1

Tập lồi . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.2

Hàm lồi . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.3


Toán tử chiếu . . . . . . . . . . . . . . . . . . . . . . . . 14

2 Bài toán tối ưu lồi
2.1

2.2

3

24

Bài toán tối ưu lồi . . . . . . . . . . . . . . . . . . . . . 24
2.1.1

Phát biểu bài toán tối ưu lồi . . . . . . . . . . . 24

2.1.2

Sự tồn tại nghiệm của bài toán tối ưu lồi . . . 26

2.1.3

Điều kiện tối ưu với ràng buộc hình học . . . . 29

Phương pháp chiếu dưới đạo hàm giải bài toán tối
ưu lồi không trơn . . . . . . . . . . . . . . . . . . . . . . 39

Kết luận


47

Tài liệu tham khảo

48


ii

Danh mục các kí hiệu và các từ viết tắt

• Rn : Không gian Euclide n-chiều trên trường số thực.
• ⟨, ⟩: Tích vô hướng.
• ∥.∥: Chuẩn.
• A: Bao đóng của A.
• coA: Bao lồi của A.
• affA: Bao affine của A.
• intA: Tập hợp các điểm trong của A.
• riA: Tập hợp các điểm trong tương đối của A.
• NC (x): Nón pháp tuyến ngoài của C tại x.
• NCϵ (x): ϵ-nón pháp tuyến của C tại x.
• PC (x): Hình chiếu của x lên C .
• dC (x): Khoảng cách từ điểm x đến tập C .
• domf : Tập hợp hữu dụng của f .
• epif : Trên đồ thị của f .
• ∇f hay f ′ (x): Đạo hàm của f tại x.
• f ′ (x, d): Đạo hàm theo phương d của f tại x.
• ∂f (x): Dưới vi phân của f tại x.
• ∂ϵ f (x): ϵ-dưới vi phân của f tại x.



1

MỞ ĐẦU

Giải tích lồi nghiên cứu về tập lồi và hàm lồi có một vị trí quan trọng
trong toán học, liên quan đến hầu hết các lĩnh vực khác nhau của toán
học ứng dụng như trong tối ưu hóa, bài toán cân bằng, . . .
Bài toán cực tiểu hàm lồi trên môt tập lồi, thường được gọi là quy hoạch
lồi, là lớp bài toán quan trọng của Quy hoạch toán học. Bài toán này xuất
hiện trong nhiều ứng dụng khác nhau. Nó cũng là bài toán phụ trong
nhiều phương pháp giải các bài toán tối ưu, bất đẳng thức biến phân và
cân bằng. Một hướng nghiên cứu cho đến nay vẫn được quan tâm là xây
dựng các phương pháp giải hữu hiệu, đặc biệt là cho bài toán tối ưu lồi,
không trơn.
Mục đích của luận văn này là trình bày bài toán cực tiểu hàm lồi với
ràng buộc lồi và sử dụng toán tử chiếu để giải bài toán tối ưu lồi. Cụ thể,
luận văn đi sâu vào việc trình bày thuật toán chiếu dưới đạo hàm, là một
kết quả mới thu được trong thời gian gần đây.
Nội dung của luận văn gồm hai chương:
Chương 1: Tập lồi, hàm lồi và toán tử chiếu
Trong chương này, ta trình bày các kiến thức về tập lồi, hàm lồi, toán tử
chiếu và cùng với các tính chất đặc trưng của nó.


2

Chương 2: Bài toán tối ưu lồi
Trong chương này, ta trình bày các khái niệm và các tính chất cơ bản của
bài toán cực tiểu hàm lồi với ràng buộc lồi. Đó là sự tồn tại nghiệm tối ưu

và điều kiện tối ưu của bài toán lồi trơn và không trơn. Nội dung chính
của chương này là trình bày một thuật toán giải bài toán cực tiểu hàm
không trơn như thuật toán chiếu dưới đạo hàm.
Qua luận văn này, tôi xin bày tỏ lòng biết ơn sâu sắc tới thầy giáo hướng
dẫn GS.TSKH. Lê Dũng Mưu, người thầy đã tận tình hướng dẫn, giúp đỡ
tôi trong suốt quá trình làm và hoàn thiện luận văn. Tôi cũng xin gửi lời
cảm ơn tới các thầy giáo, cô giáo trong Trường Đại học Khoa học, Đại học
Thái Nguyên đã tận tình giảng dạy và giúp đỡ tôi trong suốt quá trình
học tập. Đồng thời, tôi cũng gửi lời cảm ơn tới gia đình và bạn bè đã luôn
động viên, giúp đỡ tôi trong suốt quá trình học tập và làm luận văn tốt
nghiệp.
Thái Nguyên, tháng 6 năm 2016
Tác giả
Bùi Văn Hoan


3

Chương 1

Tập lồi, hàm lồi và toán tử chiếu
Trong chương này, ta trình bày những khái niệm cơ bản nhất của tập lồi,
hàm lồi, toán tử chiếu và cùng với các tính chất đặc trưng của nó. Nội
dung của chương được trích dẫn chủ yếu từ tài liệu tham khảo [1], [2], [3]
và [4].

1.1

Tập lồi


Trong luận văn này chúng ta kí hiệu Rn là không gian Euclide thực n
chiều. Một phần tử x = (x1 , x2 , . . . , xn )T ∈ Rn là một vectơ cột với n
thành phần là các số thực.
Định nghĩa 1.1. Một đường thẳng đi qua hai điểm a và b trong Rn là tập
hợp các điểm x ∈ Rn có dạng

{x ∈ Rn : x = λa + (1 − λ)b, ∀λ ∈ R}.
Định nghĩa 1.2. Một đoạn thẳng đi qua hai điểm a và b trong Rn là tập
hợp các điểm x ∈ Rn có dạng

{x ∈ Rn : x = λa + (1 − λ)b, ∀λ ∈ [0, 1]}.
Tập lồi là một khái niệm cơ bản nhất của giải tích lồi, nó được định
nghĩa như sau:


4

Định nghĩa 1.3. Một tập hợp C ⊂ Rn được gọi là lồi nếu:

∀a, b ∈ C, 0 ≤ λ ≤ 1 ⇒ λa + (1 − λ)b ∈ C.
Ví dụ 1.4. + Tập rỗng là một tập lồi.
+ Toàn bộ không gian là tập lồi.
+ Các không gian con là các tập lồi.
+ Các hình tam giác, hình tròn trong mặt phẳng là các tập lồi.
+ Hình cầu C = {x :∥ x ∥≤ 1} là tập lồi.
+ Đường tròn trong mặt phẳng là tập không lồi.
Một số hình vẽ về tập lồi và tập không lồi trong R2 :

Hình 1.1


Định nghĩa 1.5. Ta nói x là tổ hợp lồi của các điểm x1 , . . . , xk nếu

x=

k


λj x , λj > 0, ∀j = 1, . . . , k,
j

j=1

k


λj = 1.

j=1

Tương tự, x là tổ hợp affine của các điểm x1 , . . . , xk nếu

x=

k

j=1

j

λj x ,


k


λj = 1.

j=1

Mệnh đề 1.6. Tập hợp C là lồi khi và chỉ khi nó chứa mọi tổ hợp lồi của
các điểm của nó. Tức là C lồi khi và chỉ khi
k
k


1 2
k
∀k ∈ N, ∀λ1 , λ2 , . . . , λk > 0 :
λj = 1, ∀x , x , . . . , x ∈ C ⇒
λj xi ∈ C.
j=1

j=1


5

Chứng minh. Điều kiện đủ là hiển nhiên từ định nghĩa. Ta chứng minh
điều kiện cần bằng quy nạp theo số điểm. Với k = 2, điều cần chứng minh
được suy ra ngay từ định nghĩa của tập lồi và tổ hợp lồi. Giả sử mệnh đề
đúng với k − 1 điểm. Ta cần chứng minh đúng với k điểm.

Giả sử x là tổ hợp lồi của k điểm x1 , x2 , . . . , xk ∈ C . Tức là

x=

k


λj x , λj > 0, ∀j = 1, . . . , k,
j

j=1

k


λj = 1.

j=1

Ta đặt

k−1


γ=

λj .

j=1


Khi đó 0 < γ < 1 và

x=

k−1


j

k

λj x + λk x = γ

j=1

Do

∑k−1 λj
j=1 γ

= 1 và

λj
γ

k−1

λj
j=1


γ

xj + λk xk .

> 0, ∀j = 1, . . . , k − 1 nên theo giả thiết quy nạp,

điểm

y :=

k−1

λj
j=1

γ

xj ∈ C.

Suy ra

x = γy + λk xk .
Do γ > 0, λk > 0 và

γ + λk =

k


λj = 1,


j=1

nên x là tổ hợp lồi của hai điểm y và xk đều thuộc C . Vậy x ∈ C.
Mệnh đề 1.7. Nếu A, B là các tập lồi trong Rn , C là lồi trong Rm thì
các tập sau là tập lồi:

A ∩ B := {x|x ∈ A và x ∈ B},
αA + βB := {x : x = αa + βb, a ∈ A, b ∈ B},
A × C := {x ∈ Rn+m |x = (a, c), a ∈ A, c ∈ C}.


6

Định nghĩa 1.8. Tập C được gọi là tập affine nếu nó chứa đường thẳng
đi qua hai điểm bất kì của nó, tức là:

∀x, y ∈ C, ∀λ ∈ R ⇒ λx + (1 − λ)y ∈ C.
Một ví dụ về tập affine là siêu phẳng trong Rn , được định nghĩa như
sau.
Định nghĩa 1.9. Siêu phẳng trong không gian Rn là một tập hợp các điểm

x có dạng
H = {x ∈ Rn |aT x = α},
trong đó a ∈ Rn là vectơ khác 0, gọi là vectơ pháp tuyến của H và α ∈ R.
Trong Rn , siêu phẳng H chia Rn thành hai nửa không gian.
Định nghĩa 1.10. Nửa không gian đóng là một tập hợp có dạng

{x ∈ Rn |aT x ≥ α}.
Nửa không gian mở là một tập hợp có dạng


{x ∈ Rn |aT x > α}.
Mệnh đề 1.11. Cho M ̸= Ø là một tập affine khi và chỉ khi M = a + L,
với L là một không gian con và a ∈ M . Không gian con L này xác định
và duy nhất.
Định nghĩa 1.12. Một tập được gọi là một tập lồi đa diện nếu nó là giao
của một số hữu hạn các nửa không gian đóng.
Định nghĩa 1.13. Một điểm a của tập lồi C gọi là điểm trong tương đối
nếu với mọi x ∈ C đều có một số λ > 0 để cho a + λ(x − a) ∈ C . Tập các
điểm trong tương đối của C được kí hiệu là riC .
Định nghĩa 1.14. Một tập C được gọi là nón nếu

∀λ > 0, ∀x ∈ C ⇒ λx ∈ C.
Định nghĩa 1.15. Tập C được gọi là nón lồi nếu C đồng thời là một nón
và là một tập lồi.


7

Mệnh đề 1.16. Một tập C là nón lồi khi và chỉ khi nó có các tính chất
sau đây:
i) λC ⊆ C,
ii) C + C ⊆ C.
Định nghĩa 1.17. Cho C là một tập lồi trong Rn và x ∈ C .
Tập NC (x) := {w|⟨w, y − x⟩ ≤ 0, ∀y ∈ C} được gọi là nón pháp tuyến
ngoài của C tại x.
Tập −NC (x) := {w|⟨w, y − x⟩ ≥ 0, ∀y ∈ C} được gọi là nón pháp tuyến
trong của C tại x.
Tập NCϵ (x) = {w|⟨w, y − x⟩ ≤ ϵ, ϵ > 0, ∀y ∈ C} được gọi là ϵ-nón pháp
tuyến của C tại x.

Định nghĩa 1.18. Cho C là một tập lồi khác rỗng và x ∈ C . Ta nói

d ∈ Rn là hướng chấp nhận được của C nếu tồn tại t0 sao cho
x + td ∈ C, 0 ≤ t ≤ t0 .
Tập tất cả các hướng chấp nhận được là một nón lồi chứa gốc. Ta kí hiệu
là FC (x), gọi là nón các hướng chấp nhận được.
Định nghĩa 1.19. Cho hai tập lồi C và D khác rỗng, ta nói siêu phẳng

H = {x ∈ Rn |aT x = α} tách C và D nếu
aT x ≤ α ≤ aT y, ∀x ∈ C, ∀y ∈ D.

(1.1)

Ta nói siêu phẳng H tách chặt C và D nếu

aT x < α < aT y, ∀x ∈ C, ∀y ∈ D.

(1.2)

Ta nói siêu phẳng H tách mạnh C và D nếu

supaT x < α < inf aT y.
x∈C

y∈D

(1.3)

Bổ đề 1.20 (Bổ đề liên thuộc). Cho C ⊂ Rn là một tập lồi khác rỗng.
Giả sử x0 ∈

/ C . Khi đó tồn tại t ∈ Rn , t ̸= 0 thỏa mãn

⟨t, x⟩ ≥ ⟨t, x0 ⟩.

(1.4)


8

Định lý 1.21 (Định lý tách 1). Cho C và D là hai tập lồi khác rỗng
trong Rn sao cho C ∩ D = Ø. Khi đó có một siêu phẳng tách C và D.
Chứng minh. Do C và D là hai tập lồi nên C − D là tập lồi. Hơn nữa
ta có 0 ∈
/ (C − D), vì C ∩ D = Ø. Theo bổ đề trên áp dụng với x0 = 0,
tồn tại véc tơ t ∈ Rn , t ̸= 0 sao cho ⟨t, z⟩ ≥ 0, ∀z ∈ C − D. Vì z = x − y
với x ∈ C, y ∈ D, nên ta có

⟨t, x⟩ ≥ ⟨t, y⟩, ∀x ∈ C, ∀y ∈ D.
Lấy

α := sup⟨t, y⟩,
y∈D

khi đó siêu phẳng ⟨t, x⟩ = α tách C và D.
Bổ đề 1.22. Cho C ⊂ Rn là một tập lồi đóng khác rỗng sao cho 0 ∈
/ C.
Khi đó tồn tại véc tơ t ∈ Rn và α > 0 sao cho

⟨t, x⟩ ≥ α > 0, ∀x ∈ C.
Theo bổ đề này thì C và điểm gốc tọa độ có thể tách mạnh, ví dụ bởi

siêu phẳng

⟨t, x⟩ =

α
.
2

Chứng minh. Do C đóng và 0 ∈
/ C nên tồn tại quả cầu B tâm ở gốc tọa
độ, bán kính r > 0 sao cho C ∩ B = Ø. Áp dụng định lý tách 1 cho hai
tập C và B , ta có t ∈ Rn , t ̸= 0 và α ∈ R, sao cho

⟨t, x⟩ ≥ α ≥ ⟨t, y⟩, ∀x ∈ C, ∀y ∈ B.
Bằng cách chuẩn hóa, ta có thể xem ∥ t ∥= 1 và do đó khoảng cách từ gốc
đến siêu phẳng ít nhất là bằng α ≥ r.
Vậy ⟨t, x⟩ ≥ α ≥ r > 0.
Định lý 1.23 (Định lý tách 2). Cho C và D là hai tập lồi đóng khác
rỗng trong Rn sao cho C ∩ D = Ø. Giả sử có ít nhất một tập là compact.
Khi đó hai tập này tách mạnh bởi một siêu phẳng.


9

Chứng minh. Giả sử C là tập compact. Ta chỉ ra tập C − D là tập
đóng. Thật vậy, giả sử z k ∈ C − D và z k → z . Ta có z k = xk − y k , với

xk ∈ C, y k ∈ D. Vì C compact nên có một dãy con xkj → x khi j → +∞.
Vậy y kj = z kj − xkj → z − x ∈ D. Vậy z k = xk − y k ∈ C − D. Chứng tỏ
tập C − D là tập đóng. Do 0 ∈

/ C − D nên theo bổ đề trên, tồn tại t ̸= 0,
sao cho
⟨t, x − y⟩ ≥ α > 0, ∀x ∈ C, ∀y ∈ D.
Vậy

inf ⟨t, x⟩ −

x∈C

α
α
≥ sup⟨t, y⟩ + .
2
2
y∈D

Chứng tỏ C và D là tách mạnh.
Trong định lý, ta không thể bỏ điều kiện một trong hai tập là compact.
Hãy xét ví dụ sau.
Ví dụ 1.24. Cho hai tập

C := {(x, t) ∈ R2 |x ≥ 0, t = 0}, D := {(x, t) ∈ R2 |t >

1
, t > 0, x > 0}.
x

Hình 1.2

Đó là hai tập lồi, đóng và không có điểm chung, nhưng chúng không thể

tách mạnh được.


10

Một số hình vẽ minh họa các trường hợp tách của hai tập hợp

Hình 1.3: (a) - Hai tập lồi C và D được tách chặt bởi một siêu phẳng; (b) - Hai tập lồi C và D tách
nhưng không tách mạnh; (c) - Tập C và D giao nhau bằng rỗng nhưng không thể tách được vì D
không phải tập lồi.

1.2

Hàm lồi

Trong phần này ta chỉ xét những hàm f không nhận giá trị −∞.
Định nghĩa 1.25. Cho một hàm số f xác định trên tập lồi C ⊂ Rn .
Hàm f được gọi là hàm lồi trên C nếu

f (λx + (1 − λ)y) ≤ λf (x) + (1 − λ)f (y), ∀x, y ∈ C, ∀λ ∈ (0, 1).
Hàm f được gọi là hàm lồi chặt trên C nếu

f (λx + (1 − λ)y) < λf (x) + (1 − λ)f (y), ∀x, y ∈ C, x ̸= y, ∀λ ∈ (0, 1).
Hàm f được gọi là hàm lồi mạnh trên C với hệ số η > 0nếu
1
f (λx + (1 − λ)y) < λf (x) + (1 − λ)f (y) − ηλ(1 − λ) ∥ x − y ∥2 ,
2
∀x, y ∈ C, x ̸= y, ∀λ ∈ (0, 1).
Miền hữu dụng của f là tập
domf := {x ∈ C|f (x) < +∞}.



11

Trên đồ thị của hàm f là tập
epif := {(x, µ) ∈ C × R|f (x) ≤ µ}.
Hàm f được gọi là hàm lõm (lõm chặt) trên C nếu −f là hàm lồi (lồi
chặt) trên C .
Ví dụ 1.26. Sau đây là một số hàm lồi, hàm lồi chặt, hàm lồi mạnh
(C ∈⊂ Rn là một tập lồi khác Ø):

+ Hàm chuẩn Euclid ∥ x ∥= ⟨x, x⟩, x ∈ Rn .
0
khi x ∈ C,
+ Hàm chỉ của C : δC (x) =
+∞ khi x ∈
/ C.
+ Hàm tựa của C : SC (x) = sup⟨y, x⟩.
y∈C

+ Hàm khoảng cách từ điểm x ∈ Rn tới C : dC (x) = inf ∥ x − y ∥ .
y∈C

2

x

+ Hàm một biến f (x) = x và f (x) = e là hàm lồi chặt.
+ Hàm hai biến f (x1 , x2 ) = x21 + 2x22 là hàm lồi mạnh trên R2 .
Định nghĩa 1.27. Cho hàm lồi f xác định trên tập lồi C ⊂ Rn , hàm

lồi g xác định trên tập lồi D ⊂ Rn và số thực λ > 0. Các phép toán

λf, f + g, max{f, g} được định nghĩa như sau:
(λf )(x) := λf (x);
(f + g)(x) := f (x) + g(x);
max{f, g} := max{f (x), g(x)}, x ∈ C ∩ D.
Định lý 1.28. Cho f, g là các hàm lồi xác định trên tập lồi C và D tương
ứng. Khi đó các hàm số αf + βg, (∀α, β ≥ 0) và max{f, g} cũng là hàm
lồi trên C ∩ D.
Định lý 1.29. Một hàm lồi xác định trên một tập lồi C thì liên tục tại
mọi điểm trong của C .
Sự gián đoạn của hàm lồi chỉ có thể xảy ra tại biên của tập xác định.


12

Ví dụ 1.30. Xét hàm một biến trên tập X = (−∞, 1],

x2 khi x < 1,
f (x) =
2 khi x = 1.
Ta thấy epif ⊂ R2 là tập lồi. Do đó f là hàm lồi trên X . Hàm f là liên
tục trên X \ {1}. Tại x = 1 thì f không liên tục.
Đạo hàm của f (x) tại x ∈ Rn đươc kí hiệu là f ′ (x) hoặc ∇f (x).
Các tính chất sau đặc trưng cho một hàm lồi khả vi và thuận tiện cho việc
kiểm tra tính lồi của một hàm số.
Định lý 1.31. Cho f : C −→ R là hàm khả vi trên tập lồi mở C . Điều
kiện cần và đủ để f lồi trên C là

f (x) + ⟨∇f (x), y − x⟩ ≤ f (y), ∀x, y ∈ C.

Định lý 1.32. Cho hàm f : C −→ R là hàm khả vi hai lần trên tập lồi
mở C . Khi đó,
i) Hàm f lồi trên C khi và chỉ khi ma trận Hesian H(x) của f tại x xác
định không âm trên C , tức là

y T H(x)y ≥ 0, ∀x ∈ C, y ∈ Rn .
ii) Hàm f lồi chặt trên C nếu ma trận Hesian H(x) của f tại x xác định
dương trên C , tức là

y T H(x)y > 0, ∀x ∈ C, y ∈ Rn .
Định nghĩa 1.33. Ta gọi đạo hàm theo hướng d của một hàm f (không
nhất thiết là lồi) tại điểm x là đại lượng

f (x + λd) − f (x)
,
λ→0
λ

f ′ (x, d) := lim
nếu giới hạn này tồn tại.

Định lý 1.34. Nếu f là hàm lồi trên tập lồi C thì với mọi x ∈ C và mọi

d sao cho x + d ∈ C , đạo hàm theo hướng d của f tại x luôn tồn tại và
nghiệm đúng
f ′ (x, d) ≤ f (x + d) − f (x).


13


Ngoài ra với mỗi điểm x cố định, f ′ (x, .) là một hàm lồi trên trên tập lồi

{d : x + d ∈ C}.
Từ định lý này dễ dàng suy ra rằng nếu f khả vi thì

f ′ (x, d) = ⟨∇f (x), d⟩, ∀d.

(1.5)

Định nghĩa 1.35. Véctơ w được gọi là dưới đạo hàm của f tại x0 ∈ Rn
nếu

⟨w, x − x0 ⟩ ≤ f (x) − f (x0 ).
Tập hợp tất cả các dưới đạo hàm của f tại x0 được gọi là dưới vi phân của

f tại x0 , kí hiệu là
∂f (x0 ) := {w ∈ Rn : ⟨w, x − x0 ⟩ ≤ f (x) − f (x0 ), ∀x ∈ Rn }.
Hàm f được gọi là khả dưới vi phân tại x0 nếu ∂f (x0 ) ̸= Ø.
Tập hợp

∂ϵ f (x0 ) := {w ∈ Rn : ⟨w, x − x0 ⟩ ≤ f (x) − f (x0 ) + ϵ, ϵ > 0, ∀x ∈ Rn }.
được gọi là ϵ-dưới vi phân của f tại x0 .
Nói chung một hàm lồi không nhất thiết khả vi tại mọi điểm. Dưới vi
phân là một khái niệm mở rộng của đạo hàm trong trường trường hợp
hàm không khả vi.
Trong trường hợp ∂f (x0 ) chỉ gồm duy nhất một điểm thì f khả vi tại x0 .
Ví dụ 1.36. Cho C là một tập lồi khác Ø. Hàm chỉ

0
khi x ∈ C,

f (x) = δC (x) =
+∞ khi x ∈
/ C.
Hãy tìm ∂f (x0 ), x0 ∈ C.
Lời giải. Tại x0 ∈ C , ta có

∂f (x0 ) = ∂δC (x0 ) = {w : ⟨w, x − x0 ⟩ ≤ δC (x), ∀x}.


14

Nếu x ∈
/ C thì δC (x) = +∞, nên bất đẳng thức này luôn đúng.
Nếu x ∈ C thì

∂f (x0 ) = ∂δC (x0 ) = {w : ⟨w, x − x0 ⟩ ≤ 0, ∀x ∈ C} = NC (x0 ).
Vậy dưới vi phân của hàm chỉ của một tập lồi C khác Ø tại một điểm

x0 ∈ C chính là nón pháp tuyến ngoài của C tại x0 .
Cũng có trường hợp tồn tại những điểm x0 tại đó f không có dưới vi phân,
nghĩa là tập ∂f (x0 ) = Ø.
Đối với hàm lồi ta có đinh lý sau:
Định lý 1.37. Cho f là hàm lồi (hữu hạn) trên tập lồi C . Lúc đó f có
dưới vi phân tại mọi điểm thuộc riC .
Từ định lý này suy ra rằng nếu f là một hàm lồi hữu hạn trên toàn
không gian Rn thì nó có dưới vi phân tại mọi điểm, vì riRn = Rn .

1.3

Toán tử chiếu


Định nghĩa 1.38. Cho C ̸= Ø (không nhất thiết lồi) và y là một véc tơ
bất kỳ. Ta nói

dC (y) := inf ∥ x − y ∥,
x∈C

là khoảng cách từ y đến C .
Nếu tồn tại π ∈ C sao cho dC (y) =∥ y − π ∥, thì ta nói π là hình chiếu
(vuông góc) của y trên C và kí hiệu là π = PC (y) hoặc P (y).
Theo định nghĩa, ta thấy hình chiếu PC (y) của y trên C là nghiệm của
bài toán tối ưu

1
min{ ∥ x − y ∥2 }.
x∈C 2
Nói cách khác, việc tìm hình chiếu của y trên C có thể đưa về tìm cực tiểu
của hàm toàn phương ∥ x − y ∥2 trên C .
Nếu C ̸= Ø thì dC (y) hữu hạn, vì
0 ≤ dC (y) ≤∥ x − y ∥, ∀x ∈ C.


15

Cho C ⊂ Rn . Ta nhớ lại là nón pháp tuyến (ngoài) của tập C tại x0 là
tập hợp

NC (x0 ) = {w|wT (x − x0 ) ≤ 0, ∀x ∈ C}.

Hình 1.4: Hình chiếu vuông góc.


Mệnh đề 1.39. Cho C là một tập lồi đóng khác rỗng. Khi đó:
i) Với mọi y ∈ Rn hai tính chất sau là tương đương:
a) π = PC (y),
b) y − π ∈ NC (π).
ii) Với mọi y ∈ Rn , hình chiếu PC (y) luôn tồn tại và duy nhất.
iii) Nếu y ∈
/ C , thì ⟨PC (y) − y, x − PC (y)⟩ = 0 là siêu phẳng tựa của C
tại PC (y) và tách hẳn y khỏi C . Tức là

⟨PC (y) − y, x − PC (y)⟩ ≥ 0, ∀x ∈ C,


⟨PC (y) − y, y − PC (y)⟩ < 0.
iv) Ánh xạ y −→ PC (y) có các tính chất sau:
a) ∥ PC (x) − PC (y) ∥≤∥ x − y ∥, ∀x, y (tính không giãn) ,
b) ⟨PC (x) − PC (y), x − y⟩ ≥∥ PC (x) − PC (y) ∥2 , (tính đồng bức).
Chứng minh. (i)
+ Đầu tiên ta chứng minh cho a) ⇒ b).


16

Giả sử có a). Lấy x ∈ C và λ ∈ (0, 1). Đặt

xλ := λx + (1 − λ)π.
Do x, π ∈ C và C lồi, nên xλ ∈ C . Hơn nữa do π là hình chiếu của y , nên
suy ra

∥ π − y ∥≤∥ y − xλ ∥ .

Hay

∥ π − y ∥2 ≤∥ λ(x − π) + π − y ∥2 .
Khai triển vế phải, ước lược và chia hai vế cho λ > 0, ta có

λ ∥ x − π ∥2 +2⟨x − π, π − y⟩ ≥ 0.
Điều này đúng với mọi x ∈ C và λ ∈ (0, 1). Do đó khi cho λ → 0, ta được

⟨π − y, x − π⟩ ≥ 0, ∀x ∈ C.
Vậy

y − π ∈ NC (π).
+ Bây giờ giả sử có b). Với mọi x ∈ C , có

0 ≥ (y −π)T (x−π) = (y −π)T (x−y +y −π) =∥ y −π ∥2 +(y −π)T (x−y).
Từ đây và b), dùng bất đẳng thức Cauchy-Schwarz ta có:

∥ y − π ∥2 ≤ (y − π)T (x − y) ≤∥ y − π ∥∥ y − x ∥ .
Suy ra

∥ y − π ∥≤∥ y − x ∥, ∀x ∈ C.
Do đó π = PC (y).
(ii)
Do dC (y) = inf ∥ y − x ∥ nên theo định nghĩa của cân dưới đúng (infix∈C

mum), tồn tại một dãy {xk } ⊂ C sao cho

lim ∥ xk − y ∥= dC (y) < +∞.

k→+∞



17

Vậy dãy xk bị chặn, do đó nó có một dãy con xkj hội tụ đến một điểm π
nào đó. Do C đóng, nên π ∈ C . Vậy

∥ π − y ∥= lim ∥ xkj − y ∥= dC (y).
j→+∞

Chứng tỏ π là hình chiếu của y trên C .
Bây giờ ta chỉ ra tính duy nhất của hình chiếu. Thật vậy, nếu tồn tại hai
điểm π và π 1 đều là hình chiếu của y trên C , thì y − π ∈ NC (π), y − π 1 ∈

NC (π 1 ).
Tức là
⟨π − y, π 1 − π⟩ ≥ 0,


⟨π 1 − y, π − π 1 ⟩ ≥ 0.
Cộng hai bất đẳng thức này ta suy ra ∥ π − π 1 ∥≤ 0 , do đó π = π 1 .
(iii)
Do y − π ∈ NC (π), nên

⟨π − y, x − π⟩ ≥ 0, ∀x ∈ C.
Vậy ⟨π − y, x⟩ = ⟨π − y, π⟩ là một siêu phẳng tựa của y tại π .
Siêu phẳng này tách y khỏi C vì y ̸= π , nên

⟨π − y, y − π⟩ = − ∥ π − y ∥2 < 0.
(iv)

Theo phần (ii) ánh xạ x −→ P (x) xác định khắp nơi. Do

z − P (z) ∈ NC (P (z)), ∀z.
Ta áp dụng với z = x và z = y được:

⟨x − P (x), P (y) − P (x)⟩ ≤ 0,


⟨y − P (y), P (x) − P (y)⟩ ≤ 0.


18

Cộng hai bất đẳng thức lại, ta có

⟨P (y) − P (x), P (y) − P (x) + x − y⟩ ≤ 0.
Từ đây và theo bất đẳng thức Cauchy-Schwarz, suy ra

∥ P (y) − P (x) ∥≤∥ x − y ∥ .
Để chứng minh tính đồng bức, áp dụng tính chất b) của (i), lần lượt với

P (x) và P (y), ta có:
⟨P (x) − x, P (x) − P (y)⟩ ≤ 0,
⟨y − P (y), P (x) − P (y)⟩ ≤ 0.
Cộng hai bất đẳng thức ta được

⟨P (x) − P (y) + y − x, P (x) − P (y)⟩ ≤ 0.
⇔⟨P (x) − P (y), y − x⟩+ ∥ P (x) − P (y) ∥2 ≤ 0.
Chuyển vế ta có


⟨P (x) − P (y), x − y⟩ ≥∥ P (x) − P (y) ∥2 .
Đây chính là tính đồng bức cần được chứng minh.
Sau đây là một số công thức xác định hình chiếu của một điểm lên siêu
hộp, hình cầu và không gian con của Rn .
Bài toán 1. Trong Rn , cho siêu hộp K có phương trình:

K = {x = (x1 , x2 , . . . , xn )T ∈ Rn : ai ≤ xi ≤ bi , i = 1, 2, . . . , n},
trong đó a = (a1 , a2 , . . . , an )T , b = (b1 , b2 , . . . , bn )T ∈ Rn . Hãy tìm hình
chiếu của y = (y1 , y2 , . . . , yn )T lên K .
Lời giải.
Đặt c = (c1 , c2 , . . . , cn )T trong đó:



a khi yi < ai ,

 i
ci = yi khi yi ∈ [ai , bi ],



b khi y > b .
i
i
i


19

Vì ai ≤ ci ≤ bi , ∀i = 1, 2, . . . , n nên c ∈ K . Ta chứng minh c là hình chiếu

của y trên K .
Thật vậy: ∀x = (x1 , x2 , . . . , xn ) ∈ K , ta có:

∥y−x∥ =
2

n


(yi − xi )2 ,

(1.6)

(yi − ci )2 .

(1.7)

i=1

∥y−c∥ =
2

n

i=1

Theo cách xác định của ci ta có:

(yi − xi )2 ≥ (yi − ci )2 , ∀i = 1, 2, . . . , n.


(1.8)

Từ (1.6), (1.7) và (1.8), ta suy ra:

∥ y − x ∥≥∥ y − c ∥ .
Vậy c là hình chiếu của y trên K .
Bài toán 2. Giả sử C là hình cầu tâm I = (a1 , a2 , . . . , an )T ∈ Rn và
bán kính r:

C = {x ∈ R :
n

n


(xi − ai )2 ≤ r2 },

i=1

và b = (b1 , b2 , . . . , bn ) ∈ Rn . Tìm hình chiếu của b trên C .
Lời giải.
Xét hai trường hợp:
+Nếu b ∈ C thì PC (b) = b.
+Nếu b ∈
/ C thì hình chiếu của b lên C là giao điểm của đường thẳng nối

b và tâm I của C với mặt cầu:
S = {x ∈ R :
n


n


(xi − ai )2 = r2 }.

i=1

Phương trình tham số của đường thẳng này như sau:
n

n
δ = {x ∈ R :
xi = ai + t(bi − ai ), ∀i = 1, 2, . . . , n, t ≥ 0}.
i=1


20

Thay xi = ai + t(bi − ai ) vào phương trình của S ta được:
2

t

n


(bi − ai )2 = r2 .

i=1


Do đó

r
.
2
(b

a
)
i
i=1 i

t = √∑n

Vậy hình chiếu PC (b) của b lên C có tọa độ là:
r
xi = ai + (bi − ai ) √∑n
, i = 1, 2, . . . , n.
2
(b

a
)
i
i=1 i
Bài toán 3. Cho C ⊂ Rn là một không gian con k chiều với một cơ sở

B = (η1 , η2 , . . . , ηk ). Giả sử x ∈ Rn và y = ki=1 yi ηi ∈ C , trong đó yi là
các hệ số thực sao cho: w = x − y thỏa mãn ⟨w, ηi ⟩ = 0, ∀i = 1, 2, . . . , k .
Chứng minh y là hình chiếu của x lên C . Tìm biểu thức tọa độ của y .

Lời giải.
Thật vậy, vì w trực giao nên với mọi véctơ trong cơ sở của C nên ta có:

∥ x − z ∥2 = ⟨x − y + y − z, x − y + y − z⟩
= ⟨x − y, x − y⟩ + ⟨y − z, y − z⟩ + 2⟨w, y − z⟩
=∥ x − y ∥2 + ∥ y − z ∥2
≥∥ x − y ∥2 , ∀z = (z1 , z2 , . . . , zn ) ∈ C.
Vì vậy y là hình chiếu của x lên C .
Xác định biểu thức tọa độ của y :
Với mọi i = 1, 2, . . . , k , ta có:

⟨w, ηi ⟩ = 0.
⇔⟨x − y, ηi ⟩ = 0.
⇔⟨x −

k


yj ηj , ηi ⟩ = 0.

j=1
k


⟨ηj , ηi ⟩yj = ⟨x, ηi ⟩.
j=1


21


Với 1 ≤ i, j ≤ k , ta đặt:

aij = ⟨ηi , ηj ⟩, bj = ⟨x, ηj ⟩.
Khi đó, ta thu được một hệ tuyến tính k phương trình có k ẩn:

Ay T = b,
trong đó A = (aij ), b = (b1 , b2 , . . . , bk )T .
Hơn nữa, theo định nghĩa A là ma trận xác định dương nên detA ̸= 0 hay
hệ phương trình trên có nghiệm duy nhất y T = A−1 b.
Do đó, hình chiếu của x lên C là:

y=

k


yj η j ,

j=1

trong đó y T = A−1 b.
Trong trường hợp B được chọn làm cơ sở trực chuẩn trong C , ta có:

0 khi i ̸= j,
⟨ηi , ηj ⟩ =
1 khi i = j.
Khi đó, ma trận A là ma trận đơn vị. Do đó, ta có:

yj = bj = ⟨x, ηj ⟩, i = 1, 2, . . . , k.
Vậy


y=

k


⟨x, ηj ⟩ηj .

j=1

Định nghĩa 1.40. Cho C ⊂ Rn là tập lồi, f : C −→ R là hàm lồi và

ϵ ≥ 0. Xét bài toàn quy hoạch
min{f (x)|x ∈ C}.

(P )

Một điểm xϵ ∈ C được gọi là điểm ϵ-cực tiểu của f trên C nếu

f (xϵ ) ≤ f (x) + ϵ, ∀x ∈ C.
Mệnh đề 1.41. Véctơ xϵ ∈ C được gọi là điểm ϵ-tối ưu của bài toán (P )
khi và chỉ khi 0 ∈ ∂ϵ f (xϵ ).


×