Tải bản đầy đủ (.pdf) (58 trang)

Giải bài toán Fermat–Torricelli tổng quát bằng kĩ thuật trơn hóa Nesterov_2

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (623.57 KB, 58 trang )

Header Page 1 of 54.

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
——————–o0o——————–

PHẠM THỊ HỒNG DUYÊN

GIẢI BÀI TOÁN FERMAT-TORICELLI TỔNG
QUÁT BẰNG KĨ THUẬT TRƠN HÓA NESTEROV

LUẬN VĂN THẠC SĨ TOÁN HỌC

Hà Nội - 2018
Footer Page 1 of 54.


Header Page 2 of 54.

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
——————–o0o——————–

PHẠM THỊ HỒNG DUYÊN

GIẢI BÀI TOÁN FERMAT-TORICELLI TỔNG
QUÁT BẰNG KĨ THUẬT TRƠN HÓA
NESTEROV

Chuyên ngành: Toán giải tích
Mã số: 8 46 01 02



LUẬN VĂN THẠC SĨ TOÁN HỌC

NGƯỜI HƯỚNG DẪN KHOA HỌC: TS. BÙI VĂN ĐỊNH

Hà Nội - 2018
Footer Page 2 of 54.


Header Page 3 of 54.
i

Lời cảm ơn
Trước khi trình bày nội dung chính của khóa luận, em xin bày tỏ lòng
biết ơn sâu sắc tới TS. Bùi Văn Định, người đã tận tình hướng dẫn để
em có thể hoàn thành khóa luận này.
Em cũng xin bày tỏ lòng biết ơn chân thành tới phòng sau đại học,
các thầy cô giáo khoa Toán, trường Đại học Sư phạm Hà Nội 2 đã dạy
bảo em tận tình trong suốt quá trình học tập tại trường.
Nhân dịp này em cũng xin được gửi lời cảm ơn chân thành tới gia
đình, bạn bè đã luôn bên em, cổ vũ, động viên, giúp đỡ và tạo điều kiện
thuận lợi cho em trong suốt quá trình học tập và thực hiện khóa luận
tốt nghiệp.
Xin chân thành cảm ơn!

Hà Nội, ngày tháng 6 năm 2018
Tác giả

Phạm Thị Hồng Duyên


Footer Page 3 of 54.


Header Page 4 of 54.
ii

Lời cam đoan
Khóa luận được hoàn thành sau quá trình tự tìm hiểu, nghiên cứu
của bản thân và sự hướng dẫn của TS. Bùi Văn Định, luận văn chuyên
ngành Toán Giải tích với đề tài “Giải bài toán Fermat-Toricelli tổng quát
bằng kĩ thuật trơn hóa Nesterov”.
Trong khóa luận em có tham khảo các kết quả nghiên cứu của các
nhà khoa học trong và ngoài nước. Em xin cam đoan kết quả của khóa
luận này là không sao chép từ bất cứ khóa luận nào. Em xin chịu hoàn
toàn trách nhiệm về lời cam đoan của mình.

Hà Nội, ngày tháng 6 năm 2018
Tác giả

Phạm Thị Hồng Duyên

Footer Page 4 of 54.


Header Page 5 of 54.
iii

Mục lục

Lời cảm ơn


i

Lời cam đoan

ii

Mở đầu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

vii

Nội dung chính . . . . . . . . . . . . . . . . . . . . . . . . .

x

1 Kiến thức chuẩn bị
1.1

1

Một số khái niệm và kết quả cơ bản từ giải tích lồi . . .

1

1.1.1

Tập lồi . . . . . . . . . . . . . . . . . . . . . . . .

1


1.1.2

Hàm lồi . . . . . . . . . . . . . . . . . . . . . . .

5

1.2

Phương pháp gradient . . . . . . . . . . . . . . . . . . .

10

1.3

Kĩ thuật trơn hóa Nesterov và tăng tốc thuật toán gradient 14
1.3.1

Kĩ thuật trơn hóa Nesterov . . . . . . . . . . . .

14

1.3.2

Tăng tốc thuật toán gradient . . . . . . . . . . .

20

1.3.3

Nguyên lý MM . . . . . . . . . . . . . . . . . . .


21

2 Bài toán Fermat - Torricelli đối với hệ hữu hạn điểm

23

2.1

Phát biểu bài toán Fermat - Torricelli . . . . . . . . . . .

23

2.2

Phương pháp giải . . . . . . . . . . . . . . . . . . . . . .

25

2.2.1

Thuật toán 2.1 . . . . . . . . . . . . . . . . . . .

26

2.2.2

Chú ý . . . . . . . . . . . . . . . . . . . . . . . .

27


Footer Page 5 of 54.


Header Page 6 of 54.
iv

3 Bài toán Fermat–Torricelli đối với hệ hữu hạn tập hợp

28

3.1

Phát biểu bài toán Fermat–Torricelli . . . . . . . . . . .

28

3.2

Phương pháp giải . . . . . . . . . . . . . . . . . . . . . .

30

3.2.1

Thuật toán 2.2 . . . . . . . . . . . . . . . . . . .

30

3.2.2


Một số ví dụ . . . . . . . . . . . . . . . . . . . . .

39

Tài liệu tham khảo . . . . . . . . . . . . . . . . . . . . . . .

45

Footer Page 6 of 54.


Header Page 7 of 54.

Các kí hiệu

Rn
bdF
N (x, Θ)
dF (x, Θ)
πF (x, Θ)
∂f (x)

Footer Page 7 of 54.

Không gian Euclid n - chiều
Biên của F
Nón pháp tuyến của Θ tại x
Hàm khoảng cách suy rộng
Hình chiếu suy rộng

dưới gradient của f tại x


Header Page 8 of 54.
vi

Danh sách hình vẽ
1.1

Tập lồi, Tập không lồi . . . . . . . . . . . . . . . . . . .

2

1.2

Hàm lồi, Hàm lõm . . . . . . . . . . . . . . . . . . . . .

5

1.3

Nếu ∇f (x) = 0, ta có f (x − α∇f (x)) < f (x), ∀α ∈ (0, σ).

11

1.4

Hướng d tạo với ∇f (x) một góc lớn hơn 900 khi đó ∇f (x) d <
0 và f (x − α∇f (x)) < f (x), ∀α ∈ (0; σ). . . . . . . . . .


3.1

Thuật toán MM đối với một bài toán Fermat-Torricelli
suy rộng. . . . . . . . . . . . . . . . . . . . . . . . . . . .

3.2

11

30

Bài toán Fermat-Torricelli suy rộng với các chuẩn khác
nhau . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

40

3.3

Bài toán Fermat-Torricelli với các thành phố của Mỹ. . .

41

3.4

Bài toán Fermat-Torricelli suy rộng với phương pháp MM. 42

Footer Page 8 of 54.


Header Page 9 of 54.

vii

Mở đầu
1. Lý do chọn đề tài
Vào năm 1643, nhà toán học nổi tiếng người Pháp Pierre de Fermat
đã đưa ra trong cuốn sách Treatise on Maxima and Minima bài toán:
Cho ba điểm trong mặt phẳng, tìm điểm thứ tư sao cho tổng khoảng
cách từ điểm này tới ba điểm trên là nhỏ nhất. Bài toán này đã được giải
bởi nhà toán học người Ý Evangaelista Torricelli (1608-1647) và được
gọi là bài toán Fermat-Torricelli. Kể từ đó tới nay, bài toán đã thu hút
được sự quan tâm nghiên cứu của nhiều nhà toán học khi tổng quát hóa
bài toán từ hệ 3 điểm sang hệ k điểm trong mặt phẳng cũng như trong
không gian hữu hạn chiều; từ tổng các khoảng cách trong hệ điểm không
có trọng số đến tổng các khoảng cách có trọng số và từ hệ hữu hạn điểm
cho đến hệ hữu hạn tập. Ngày nay, bài toán này đã và đang tìm được
nhiều ứng dụng trong khoa học và kĩ thuật.
Một trong những vấn đề quan trọng đặt ra khi tiếp cận bài toán
Fermat-Torricelli tổng quát là xây dựng các thuật toán hữu hiệu để giải,
vì vậy mục tiêu của bản luận văn là nhằm xây dựng một số thuật toán
giải bài toán Fermat-Torricelli cho hệ hữu hạn điểm và bài toán FermatTorricelli cho hệ hữu hạn tập. Do bài toán này có thể được viết dưới
dạng một bài toán tối ưu với hàm mục tiêu là không trơn, nên chúng tôi
trình bày cách tiếp cận bài toán bằng cách sử dụng kĩ thuật trơn hóa
hàm mục tiêu của Nesterov và sử dụng thuật toán gradient cải biên để
Footer Page 9 of 54.


Header Page 10 of 54.
viii

giải bài toán.

Từ những lí do trên, chúng tôi chọn đề tài nghiên cứu của luận văn
là: “GIẢI BÀI TOÁN FERMAT-TORICELLI TỔNG QUÁT
BẰNG KĨ THUẬT TRƠN HÓA NESTEROV” nhằm có điều
kiện tiếp cận sâu hơn, làm phong phú kiến thức của mình và ứng dụng
vào giải một lớp các bài toán nảy sinh từ thực tế.

2. Mục đích nghiên cứu
Nghiên cứu một số kĩ thuật giải Bài toán Fermat-Torricelli tổng quát
và ứng dụng giải một số bài tập nảy sinh trong thực tế.

3. Nhiệm vụ nghiên cứu
[1] Xây dựng các thuật toán số hữu hiệu giải bài toán Fermat-Torricelli
đối với hệ hữu hạn điểm.
[2] Xây dựng các thuật toán số hiệu quả giải bài toán Fermat-Torricelli
đối với hệ hữu hạn tập.

4. Đối tượng - Phạm vi nghiên cứu
Đối tượng nghiên cứu: Bài toán Fermat-Torricelli tổng quát.
Phạm vi nghiên cứu: Tìm hiểu các bài báo và tài liệu liên quan đến
bài toán Fermat-Torricelli tổng quát để xây dựng thuật toán giải bài
toán Fermat-Torricelli.

Footer Page 10 of 54.


Header Page 11 of 54.
ix

5. Phương pháp nghiên cứu
Sử dụng các công cụ của giải tích lồi, lý thuyết tối ưu, kĩ thuật trơn

hóa Nesterov và phương pháp Gradient cải biên.

6. Dự kiến đóng góp mới của đề tài
Đề tài hệ thống một số các kết quả gần đây về bài toán FermatTorricelli cho hệ hữu hạn điểm và bài toán Fermat-Torricelli cho hệ
hữu hạn tập.

Footer Page 11 of 54.


Header Page 12 of 54.
x

Nội dung chính
1. Kết cấu nội dung.
Luận văn gồm 3 chương:
• Chương 1: Kiến thức chuẩn bị.
1.1 Một số khái niệm và kết quả có bản từ giải tích lồi
1.1.1 Tập lồi
1.1.2 Hàm lồi
1.2 Phương pháp gradient
1.3 Kĩ thuật trơn hóa Nesterov và tăng tốc thuật toán gradient
1.3.1 Kĩ thuật trơn hóa Nesterov
1.3.2 Tăng tốc thuật toán gradient
1.3.3 Nguyên lý MM
• Chương 2: Bài toán Fermat-Toricelli đối với hệ hữu hạn
điểm
2.1 Phát biểu bài toán
2.2 Phương pháp giải
2.2.1 Thuật toán 2.1
2.2.2 Một số ví dụ

• Chương 3. Bài toán Fermat-Toricelli đối với hệ hữu
hạn tập hợp
3.1 Phát biểu bài toán
Footer Page 12 of 54.


Header Page 13 of 54.
xi

3.2 Phương pháp giải
3.2.1 Thuật toán 2.2
3.2.2 Một số ví dụ

Footer Page 13 of 54.


Header Page 14 of 54.
1

Chương 1
Kiến thức chuẩn bị
Trong chương này chúng tôi trình bày một số kiến thức cơ bản về tập
lồi, hàm lồi trên không gian Euclid n chiều - Rn , phương pháp gradient, kĩ thuật trơn hóa của Nesterov, tăng tốc thuật toán gradient, cùng
nguyên lý MM để giải bài toán tối ưu có cấu trúc.

1.1

Một số khái niệm và kết quả cơ bản từ giải tích
lồi


1.1.1

Tập lồi

Định nghĩa 1.1.1. Tập F ⊂ Rn được gọi là lồi nếu F chứa mọi đoạn
thẳng nối hai điểm bất kì của nó. Nói cách khác, F là tập lồi khi và chỉ
khi với mọi x, y ∈ F và với mọi t ∈ [0; 1] ta có tx + (1 − t)y ∈ F .

Footer Page 14 of 54.


Header Page 15 of 54.
2

Hình 1.1: Tập lồi, Tập không lồi

Ví dụ 1.1.1. Các tam giác và hình tròn trong mặt phẳng là các tập lồi.
Hình cầu đơn vị trong không gian Rn là tập lồi.
Định nghĩa 1.1.2. Giả sử Θ là một tập con lồi, đóng, và khác rỗng của
Rn và x
¯ ∈ Θ. Nón pháp tuyến của Θ tại x¯ được xác định như sau:

N (¯
x; Θ) := {v ∈ Rn | v, x − x¯ ≤ 0, ∀x ∈ Θ} .
Từ định nghĩa trên ta thấy ánh xạ nón pháp tuyến N (.; Θ) có đồ thị
đóng, tức là với mọi dãy xk → x¯ và vk → v¯ trong đó vk ∈ N (xk ; Θ) thì
ta có v¯ ∈ N (¯
x; Θ).
Với v ∈ Rn , ta thấy {v} := {λv|λ ≥ 0} là một nón. Nó được gọi là
nón sinh bởi {v}.

Định nghĩa 1.1.3. Tập F được gọi là trơn nếu với mỗi x ∈ bdF đều
tồn tại ax ∈ Rn sao cho N (x; F ) = cone {ax } .
Định nghĩa 1.1.4. Tập lồi F được gọi là tròn nếu N (x; F ) = N (y; F )
với mọi x, y ∈ bdF, x = y.
Với ma trận A xác định dương cho trước, chuẩn sinh bởi A được xác
định bởi


x

X

Dễ thấy tập F := {x ∈ Rn | x

:=
A

xT Ax.

≤ 1} trơn do với

N (x; F ) = cone {Ax}; xem [8, Mệnh đề 2.48].
Footer Page 15 of 54.

x

X

= 1 ta có



Header Page 16 of 54.
3

Cho một tập hợp lồi, compact F ⊂ Rn chứa điểm gốc tọa độ là một
điểm trong, ta định nghĩa hàm
σF (u) := sup { u, x |x ∈ F } .

(1.1)

Mệnh đề sau cho ta một số tính chất của hàm σF .
Mệnh đề 1.1.1. Với hàm σF xác định bởi công thức (1.1), các tính chất
sau là đúng với mọi u, v ∈ Rn và λ ≥ 0.
(i) σF (u) − σF (v) ≤ F

u − v ở đó F := sup{ f |f ∈ F };

(ii) σF (u + v) ≤ σF (u) + σF (v);
(iii) σF (λu) = λσF (u) và σF (u) = 0 khi và chỉ khi u = 0;
(iv) σF là chuẩn nếu ta giả sử thêm F đối xứng, tức là F = −F ;
(v) γ u ≤ σF (u) trong đó γ := sup{r > 0|B(0; r) ⊂ F }.
Kí hiệu
BF∗ := {u ∈ Rn |σF (u) ≤ 1}
.
Định nghĩa 1.1.5. Tập con lồi Θ ⊂ Rn được gọi là lồi chặt nếu:
tu + (1 − t)v ∈ intΘ với mọi u, v ∈ Θ và t ∈ (0, 1).
Mệnh đề 1.1.2. Tập F là trơn khi và chỉ khi tập BF∗ là lồi chặt.
Chứng minh. Giả sử F trơn. Chọn u, v ∈ BF∗ với u = v và t ∈
(0, 1). Chúng ta sẽ chỉ ra tu + (1 − t)v ∈ intBF∗ hoặc tương đương
σF (tu + (1 − t)v) < 1. Ta chỉ cần xét trường hợp σF (u) = σF (v) = 1.

Chọn x¯, y¯ ∈ F sao cho:
u, x¯ = σF (u) = 1, v, y¯ = σF (v) = 1,

Footer Page 16 of 54.


Header Page 17 of 54.
4

và chọn e ∈ F sao cho tu + (1 − t)v, e = σF (tu + (1 − t)v). Dễ thấy
σF (tu + (1 − t)v) ≤ 1.
Ngược lại, giả sử σF (tu + (1 − t)v) = 1. Khi đó
1 = tu + (1 − t)v, e = t u, e +(1−t) v, e ≤ t u, x¯ +(1−t) v, y¯ = 1.
Từ đó, ta thấy u, e = u, x¯ = 1 = σF (u) và v, e = v, y¯ = 1 = σF (v).
Nên
u, x ≤ u, e , ∀x ∈ F
suy ra u ∈ N (e, F ). Tương tự ta có v ∈ N (e, F ). Do F trơn nên u = λv
trong đó λ > 0. Vậy
1 = u, e = λv, e = λ v, e = λ.
Do λ = 1 và u = v, là mâu thuẫn.
x, F ) và u, v = 0.
Giả sử BF∗ lồi chặt. Chọn x¯ ∈ bdF , với mọi u, v ∈ N (¯
Với α := σF (u) và β := σF (v).
u, x ≤ u, x¯ , ∀x ∈ F và v, x ≤ v, x¯ , ∀x ∈ F
Theo đó, u, x¯ = α và v, x¯ = β
Ngoài ra,
σF (u + v) ≥ u, x¯ + v, x¯ = α + β = σF (u) + σF (v),
và σF (u + v) = σF (u) + σF (v). Ta có u/α, v/β ∈ BF∗ và
v β
u α

+
= 1.
αα +β βα +β
u
v
Do BF∗ lồi chặt, ta có = và u = λv, trong đó λ := α/β > 0. Hoàn
α
β
thành điều phải chứng minh.
σF

Chú ý 1.1.1. Giả sử F trơn. Từ kết quả chứng minh Mệnh đề 1.1.2 với
u, v ∈ Rn trong đó u, v = 0, ta có σF (u + v) = σF (u) + σF (v) khi và chỉ
khi u = λv với một số λ > 0.
Footer Page 17 of 54.


Header Page 18 of 54.
5

1.1.2

Hàm lồi

Định nghĩa 1.1.6. Cho F ⊂ Rn là một tập lồi và f : Rn → R là một
hàm số. Hàm f được gọi là lồi trên F nếu với mọi x, y ∈ F và với mọi
t ∈ [0; 1] ta có f (tx + (1 − t)y) ≤ tf (x) + (1 − t)f (y). Nếu −f là hàm lồi
trên F thì ta nói f là hàm lõm trên F.

Hình 1.2: Hàm lồi, Hàm lõm


Ví dụ 1.1.2.

1. Hàm hằng f : F → R; f (x) = α với mọi x ∈ F , là

một hàm lồi.
2. Hàm aphin f : Rn → R; f (x) = c, x + α, là một hàm lồi.
3. Hàm f : R → R, f (x) = x3 , là một hàm không lồi trên R. Thật vậy,
1
1
với x = −1, y = 0, t = , ta có f (tx + (1 − t)y) = − , tf (x) + (1 −
2
8
1
t)f (y) = − , chứng tỏ f (tx + (1 − t)y) > f (x) + (1 − t)f (y). Do đó
2
3
f (x) = x không lồi trên R.
Định nghĩa 1.1.7. Hàm f được gọi là hàm lồi mạnh trên F với hệ số
α > 0 nếu với mọi x, y ∈ F và t ∈ [0; 1] ta có
f (tx + (1 − t)y) ≤ tf (x) + (1 − t)f (y) −

Footer Page 18 of 54.

α
(1 − t) x − y 2 .
2


Header Page 19 of 54.

6

Định nghĩa 1.1.8. Hàm khoảng cách suy rộng xác định bởi F tới tập
Θ được xác định bởi
dF (x, Θ) := inf {σF (x − w)|w ∈ Θ} .

(1.2)

Nếu F là hình cầu đơn vị đóng của Rn , thì hàm khoảng cách suy rộng
(1.2) trở thành hàm khoảng cách thông thường
dF (x, Θ) := inf { x − w |w ∈ Θ} .

(1.3)

Hình chiếu suy rộng từ một điểm x ∈ Rn đến tập hợp Θ được xác định
dựa theo hàm khoảng cách suy rộng (1.2) như sau:
πF (x; Θ) := {w ∈ Θ|σF (x − w) = dF (x; Θ)} .

(1.4)

Chú ý rằng hình chiếu suy rộng của một điểm có thể không duy nhất.
Chúng ta trình bày một số tính chất quan trọng của hàm khoảng cách
suy rộng và hình chiếu suy rộng sẽ được sử dụng về sau.
Mệnh đề 1.1.3. Cho tập lồi, đóng, khác rỗng Θ, xét hàm khoảng cách
suy rộng (1.2) và hình chiếu suy rộng (1.4). Những khẳng định sau đây
là đúng.
(i) Với x¯ ∈ Rn , tập hợp πF (¯
x; Θ) là khác rỗng;
(ii) Với x¯ ∈ Rn , dF (¯
x; Θ) = 0 ⇔ x¯ ∈ Θ;

(iii) Nếu x¯ ∈
/ Θ và w¯ ∈ πF (¯
x; Θ) thì w¯ ∈ bdΘ;
(iv) Nếu F trơn, thì πF (¯
x; Θ) là duy nhất đối với mọi x¯ ∈ Rn , và ánh
xạ hình chiếu πF (.; Θ) là liên tục.
Chứng minh. Các khẳng định (i) và (ii) được suy ra trực tiếp từ định
nghĩa.

Footer Page 19 of 54.


Header Page 20 of 54.
7

(iii) Giả sử ngược lại rằng w¯ ∈ intΘ. Chọn t ∈ (0, 1) đủ nhỏ sao cho
wt := w¯ + t(¯
x − w)
¯ ∈ Θ.
Khi đó
σF (¯
x − wt ) = σF ((1 − t)(¯
x − w))
¯ = (1 − t)σF (¯
x − w)
¯
= (1 − t)dF (¯
x; Θ)
< dF (¯
x; Θ),

điều này mâu thuẫn.
(iv) Nếu x¯ ∈ Θ, thì πF (¯
x; Θ) = {¯
x}. Xét trường hợp nếu x¯ ∈
/ Θ. Giả sử
ngược lại rằng tồn tại w¯1 , w¯2 ∈ πF (¯
x; Θ) với w¯1 = w¯2 . Khi đó
γ := σF (¯
x − w¯1 ) = σF (¯
x − w¯2 ) > 0.
Theo tính thuần nhất dương của σF
x¯ − w¯2
x¯ − w¯1
∈ BF∗ và
∈ BF∗ .
γ
γ
Từ Mệnh đề 1.1.2, ta có tập BF∗ lồi chặt, do đó
1
2

x¯ − w¯1 x¯ − w¯2
+
γ
γ

∈ intBF∗

Kéo theo
x¯ − (w¯1 + w

¯2 )/2
∈ intBF∗ .
γ
Cũng từ tính thuần nhất dương của σF ta có
σF (¯
x − (w¯1 + w
¯2 )/2) < γ = dF (¯
x; Θ),
điều này là mâu thuẫn.
Định nghĩa 1.1.9. Giả sử f : Rn → R là một hàm lồi. Với x¯ ∈ Rn , dưới
gradient của f tại x¯ là một véctơ v ∈ Rn thỏa mãn
v, x − x¯ ≤ f (x) − f (¯
x), ∀x ∈ Rn .
Footer Page 20 of 54.


Header Page 21 of 54.
8

Tập hợp tất cả các dưới gradient của f tại x¯ được gọi là dưới vi phân
của f tại x¯ và được kí hiệu là ∂f (¯
x).
Định lý 1.1.1.

• Giả sử fi : Rn → R, i = 1, . . . , m là các hàm lồi,

khi đó ta có:
m




m

∂fi (x), x ∈ Rn .

fi (x) =
i=1

i=1

• Cho f : Rn → R là một hàm lồi. Điểm x¯ là một điểm cực tiểu tuyệt
đối của f trên tập lồi Ω khi và chỉ khi
0 ∈ ∂f (¯
x) + N (¯
x; Ω).
Mệnh đề 1.1.4. Cho một tập lồi, đóng và khác rỗng Θ, xét hàm khoảng
cách suy rộng (1.2). Khi đó ta có:
(i) |dF (x; Θ) − dF (y; Θ)| ≤ F

x − y , ∀x, y ∈ Rn ;

(ii) Hàm dF (.; Θ) là hàm lồi, và với mọi x¯ ∈ Rn ,
∂dF (¯
x; Θ) = ∂σF (¯
x − w)
¯ ∩ N (w;
¯ Θ),
với w¯ ∈ πF (x; Θ) và phép biểu diễn này không phụ thuộc vào việc
lựa chọn w.
¯

(iii) Nếu F là trơn và tròn, thì hàm σF (.) khả vi tại mọi điểm khác
không, và hàm dF (.; Θ) là khả vi liên tục trên tập phần bù của Θ
trong Rn với
∇dF (¯
x; Θ) = ∇σF (¯
x − w),
¯
ở đó x¯ ∈
/ Θ và w¯ := πF (¯
x; Θ).
Chứng minh.
(i) Kết luận này được rút ra từ sự dưới cộng tính và tính chất Lipschitz
của hàm σF
Footer Page 21 of 54.


Header Page 22 of 54.
9

(ii) Hàm dF (.; Θ) có thể được biểu thị theo hàm tích chập infimal như
sau:
dF (x; Θ) = inf {σF (x − w) + δ(w; Θ)|w ∈ Rn } = (g ⊕ σF )(x),
với g(x) := δ(x; Θ) là hàm đặc trưng của Θ. Tức là, δ(x; Θ) = 0
nếu x ∈ Θ, và δ(x; Θ) = ∞ nếu x ∈ Θ. Với w¯ := πF (¯
x; Θ), ta có
σF (¯
x − w)
¯ + g(w)
¯ = σF (¯
x − w)

¯ = dF (¯
x; Θ).
Theo [8, Hệ quả 2.65], ta có
∂dF (¯
x; Θ) = ∂σF (¯
x − w)
¯ ∩ ∂g(w)
¯ = ∂σF (¯
x − w)
¯ ∩ N (w;
¯ Θ).
(iii) Trước tiên ta chứng minh tính khả dưới vi phân của σF (.) tại x¯ = 0.
Từ [8, Định lý 2.68], ta có
∂σF (¯
x) = S(¯
x),
với S(¯
x) := {p ∈ F | x¯, p = σF (¯
x)}. Ta sẽ chỉ ra S(¯
x) là duy nhất.
Bằng phản chứng, giả sử rằng tồn tại p1 , p2 ∈ S(¯
x) với p1 = p2 . Từ
định nghĩa, ta có:
x¯ ∈ N (p1 ; F ) = cone {a1 } , x¯ ∈ N (p2 ; F ) = cone {a2 } .
Nên tồn tại λ1 , λ2 > 0 sao cho x¯ = λ1 a1 = λ2 a2 , và do đó N (p1 ; F ) =
N (p2 ; F ) mâu thuẫn với tính trơn và kín của F . Do đó, ∂σF (¯
x) =
S(¯
x) là duy nhất, và do đó σF khả vi tại x¯ theo [8, Định lý 3.3].
Ta thấy ∂dF (¯

x; Θ) là khác rỗng. Do ∂dF (¯
x; Θ) = ∂σF (¯
x − w)
¯ ∩
N (w;
¯ Θ) = ∇σF (¯
x − w)
¯ ∩ N (w;
¯ Θ), rõ ràng rằng ∇σF (¯
x − w)
¯ ∈
N (w;
¯ Θ) và ∂dF (¯
x; Θ) = {∇σF (¯
x − w)}.
¯ Nên tính khả dưới vi phân
của dF (.; Θ) tại x¯ được suy ra từ [8, Định lý 3.3]. Do ΘC là một tập
mở và ∂dF (x; Θ) là duy nhất với mọi x ∈ ΘC , hàm dF (.; Θ) khả vi,
liên tục trên tập hợp này, xem hệ quả [3, Mệnh đề 2.2.2].
Footer Page 22 of 54.


Header Page 23 of 54.
10

Hệ quả 1.1.1. Đối với một tập hợp lồi, đóng và khác rỗng Θ, dưới vi
phân của hàm khoảng cách suy rộng (1.3) cho bởi công thức sau:

¯ Θ) ∩ B, x¯ ∈ Θ,
 N (w;

x¯ − π(¯
x; Θ)
∂dF (¯
x; Θ) =

, x¯ ∈
/ Θ.
d(¯
x; Θ)

1.2

Phương pháp gradient

Phương pháp gradient là một trong những phương pháp cơ bản quan
trọng được sử dụng để giải các bài toán cực tiểu không rằng buộc vì nó
đơn giản, thuận tiện trong quá trình tính toán và có thể áp dụng cho các
lớp khá rộng các hàm khả vi. Ý tưởng của phương pháp này là tại mỗi
bước lặp thứ k ta chọn hướng giảm dk = −∇f (xk ) đây chính là hướng
mà hàm mục tiêu f giảm nhanh nhất tại xk . Vì vậy người ta còn gọi
phương pháp gradient là phương pháp hướng giảm nhanh nhất.
Cho vectơ x thuộc Rn với ∇f (x) = 0, ta xét dáng điệu của hàm f
dọc theo tia xuất phát từ điểm x theo hướng −∇f (x):
xα = x − α∇f (x), ∀α ≥ 0.
Từ khai triển Taylor trong lân cận của x ta có:
f (xα ) = f (x) + ∇f (x)(xα − x) + 0( xα − x )
= f (x) − α ∇f (x)

2


+ 0(α ∇f (x) ).

Do vậy chúng ta cũng có thể viết:
f (xα ) = f (x) − α ∇f (x)

2

+ 0(α).

Khi cho α đủ nhỏ, f (xα ) nhỏ hơn f (x) (như minh họa Hình 1.3).

Footer Page 23 of 54.


Header Page 24 of 54.
11

Hình 1.4: Hướng d tạo với ∇f (x)
một góc lớn hơn 900 khi đó
Hình 1.3: Nếu ∇f (x) = 0, ta có

∇f (x) d < 0 và f (x − α∇f (x)) <

f (x−α∇f (x)) < f (x), ∀α ∈ (0, σ).

f (x), ∀α ∈ (0; σ).

Ở đây véctơ có hướng d ∈ Rn tạo với ∇f (x) một góc lớn hơn 900 ,
nghĩa là: ∇f (x) d < 0 theo định lý Taylor, chúng ta có:
f (xα ) = f (x) + α∇f (x) d + 0(α).

Từ đó suy ra, khi α đủ nhỏ, ta có f (x + αd) nhỏ hơn f (x). Như hình
minh họa trong Hình 1.4.
Từ quan sát trên ta có thuật toán hướng giảm sau:
Thuật toán. Chọn x0 ∈ Rn và độ dài bước αk > 0. Tại mỗi bước lặp
k = 0, 1, ... có xk thực hiện các bước sau:
Bước 1. Tính ∇f (xk ). Nếu ∇f (xk ) = 0 thì thuật toán kết thúc và xk
là điểm dừng. Trái lại chuyển sang Bước 2.
Bước 2. Tính
xk+1 := xk − λk ∇f (xk ),
trong đó λk > 0 (độ dài bước) sao cho f (xk+1 ) ≤ f (xk ). Thay k := k + 1
và quay về bước lặp k.
Footer Page 24 of 54.


Header Page 25 of 54.
12

Một số cách xác định độ dài bước là:
1. Quy tắc chính xác: αk = argmin{f (xk + λdk ) : λ ≥ 0}.
2. Quy tắc Armijo: Lấy số tự nhiên nhỏ nhất m sao cho
f (xk − ξ/2m ∇f (xk )) − f (xk ) ≤ − ξ/2m ∇f (xk ) 2 ,
trong đó 0 < < 1, ξ > 0 cho trước. Khi đó, lấy αk =

(A)

ξ
2m .

Định lý 1.2.1. Giả sử f bị chặn dưới và gradient ∇f là Lipschitz, nghĩa


∃L > 0 :

∇f (x) − ∇f (y) ≤ L x − y , ∀ x, y.

Khi đó thuật toán gradient với quy tắc Armijo là hội tụ theo nghĩa
∇f (xk ) → 0 khi k → +∞.
Chứng minh. Giả sử dk = −∇f (xk ). Theo định lý giá trị trung bình có
x ∈ (xk , xk+1 ) sao cho
f (xk+1 ) − f (xk ) = ∇f (x), xk+1 − xk .
Do đó, từ xk+1 = xk − αk ∇f (xk ), ta có
f (xk+1 )−f (xk ) = αk dk , ∇f (x) = −αk ∇f (xk ), ∇f (xk )−∇f (xk )+∇f (x)
= −αk ∇f (xk )
≤ −αk ∇f (xk )

2

2

+ αk ∇f (xk ), ∇f (x) − ∇f (xk )

+ αk ∇f (xk ) . ∇f (xk ) − ∇f (x) .

(1.5)

Sử dụng tính Lipschitz của ∇f và x ∈ (xk , xk+1 ), ta có
∇f (xk )−∇f (x) ≤ L xk −x ≤ L xk −xk+1 = αk L ∇f (xk ) . (1.6)
Từ (1.8) và (1.6), do αk =

ξ
, ta có:

2t

f (xk+1 ) − f (xk ) ≤ −αk ∇f (xk )

Footer Page 25 of 54.

2

+ (αk )2 L ∇f (xk )

2


×