Tải bản đầy đủ (.pdf) (70 trang)

Cực tiểu địa phương hàm toàn phương trên nón lồi

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (570.78 KB, 70 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
—————————————-

TRẦN BÍCH NGỌC

CỰC TIỂU ĐỊA PHƯƠNG HÀM TOÀN PHƯƠNG
TRÊN NÓN LỒI

LUẬN VĂN THẠC SĨ TOÁN HỌC

Hà Nội - 2016


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
—————————————-

TRẦN BÍCH NGỌC

CỰC TIỂU ĐỊA PHƯƠNG HÀM TOÀN PHƯƠNG
TRÊN NÓN LỒI

Chuyên ngành: Toán giải tích
Mã số:

60 46 01 02

LUẬN VĂN THẠC SĨ TOÁN HỌC

Người hướng dẫn khoa học:


PGS. TS. TẠ DUY PHƯỢNG

Hà Nội - 2016


LỜI CẢM ƠN
Luận văn được hoàn thành tại trường Đại học Sư phạm Hà Nội 2
dưới sự hướng dẫn của thầy giáo PGS TS Tạ Duy Phượng. Sự giúp đỡ
và hướng dẫn tận tình, nghiêm túc của thầy trong suốt quá trình thực
hiện luận văn này đã giúp tác giả trưởng thành hơn rất nhiều trong cách
tiếp cận một vấn đề mới. Tác giả xin bày tỏ lòng biết ơn, lòng kính trọng
sâu sắc nhất đối với thầy.
Tác giả xin trân trọng cảm ơn Ban giám hiệu trường Đại học Sư
phạm Hà Nội 2, phòng sau Đại học, các thầy cô giáo trong nhà trường,
gia đình cùng các bạn học viên đã giúp đỡ, động viên và tạo điều kiện
thuận lợi để tác giả hoàn thành khóa học Thạc sĩ và hoàn thành luận
văn này!
Hà Nội, tháng 07 năm 2016
Tác giả luận văn

Trần Bích Ngọc


LỜI CAM ĐOAN
Tôi xin cam đoan luận văn này là kết quả nghiên cứu của riêng tôi
dưới sự hướng dẫn của PGS TS Tạ Duy Phượng.
Trong quá trình nghiên cứu và hoàn thành luận văn tôi đã kế thừa
những thành quả khoa học của các nhà khoa học và đồng nghiệp với sự
trân trọng và biết ơn.
Tôi xin cam đoan rằng các thông tin trích dẫn trong luận văn đã

được chỉ rõ nguồn gốc.
Hà Nội, tháng 07 năm 2016
Tác giả luận văn

Trần Bích Ngọc


Danh mục kí hiệu thường dùng

R

Tập hợp số thực

R+

Tập số thực không âm

Rn

Không gian vectơ Euclid n-chiều



Tập rỗng

AT

Ma trận chuyển vị của ma trận A

Ξ(Rn )


Tập tất cả các nón lồi đóng trong Rn

||x||

Chuẩn Euclid của vectơ x

x, y

Tích vô hướng của x và y

Sym(n)

Tập tất cả các ma trận đối xứng trên Rn

[a, b]

Tập hợp x ∈ R với a ≤ x ≤ b

riK

Phần trong tương đối của K

∀x, ∃x

Với mọi x, tồn tại x

x ∈ M, y ∈
/M


Phần tử x thuộc M , phần tử y không thuộc M

M ⊂N

M là tập con của N

intD, clD

Phần trong, bao đóng của tập D

infD, supD

Cận dưới đúng của D, cận trên đúng của D

A ∩ B, M ∪ N

Giao của 2 tập M và N , hợp của 2 tập M và N

spanK

Không gian căng của tập K

affS

Tập affin nhỏ nhất chứa S

coneD

Hình nón sinh bởi tập D


cardD

Lực lượng của tập D

0+ C

Nón lùi xa của C

B(x, )

Hình cầu mở tâm x, bán kính

specE

Phổ của ma trận đối xứng E

3


Mục lục

Danh mục kí hiệu thường dùng

3

Mở đầu

6

1 Kiến thức cơ bản


9

1.1. Một số kiến thức của đại số tuyến tính . . . . . . . . . .

9

1.2. Một số kiến thức của giải tích lồi . . . . . . . . . . . . .

11

1.3. Bài toán tối ưu có hạn chế . . . . . . . . . . . . . . . . .

13

1.4. Tối ưu hàm toàn phương . . . . . . . . . . . . . . . . . .

14

1.4.1. Bài toán tối ưu hàm toàn phương với ràng buộc
tuyến tính . . . . . . . . . . . . . . . . . . . . . .

14

1.4.2. Tối ưu hàm toàn phương lồi . . . . . . . . . . . .

16

1.4.3. Tối ưu hàm toàn phương trên mặt cầu . . . . . .


16

1.4.4. Tối ưu hàm toàn phương trên nón . . . . . . . . .

17

2 Bài toán tối ưu hàm toàn phương trên giao của nón với
mặt cầu

18

2.1. Điều kiện cần tối ưu . . . . . . . . . . . . . . . . . . . .

18

4


2.2. Bài toán đối ngẫu . . . . . . . . . . . . . . . . . . . . . .

21

2.3. Nghiệm địa phương và nghiệm toàn cục . . . . . . . . . .

25

2.4. Số giá trị cực tiểu địa phương . . . . . . . . . . . . . . .

27


2.5. Một số vấn đề khác . . . . . . . . . . . . . . . . . . . . .

35

2.5.1. Quy tắc hai từ ba (The two-out-of-three rule) . .

35

2.5.2. Tiền tích cực (Pre-activity) như là giảm bớt cực
tiểu địa phương . . . . . . . . . . . . . . . . . . .

43

2.5.3. Kết quả cụ thể đối với nón đối ngẫu cực tiểu . . .

52

2.5.4. Sự chặt chẽ của ràng buộc nón . . . . . . . . . .

60

Kết luận

67

Tài liệu tham khảo

67

5



Mở đầu
1. Lý do chọn đề tài
Giả sử không gian Euclid Rn được trang bị một tích vô hướng
x, y = xT y và chuẩn . tương ứng. Kí hiệu Sn = {x ∈ Rn : x = 1}
là hình cầu đơn vị trong Rn và Ξ(Rn ) là tập các nón lồi đóng trong Rn .
Cho A ∈ Rn×n là ma trận, b ∈ Rn là một vectơ, và r > 0 là một số thực.
Bài toán con miền tin cậy (the trust - region subproblem) ứng với bộ ba
{A, b, r} là bài toán tối ưu toàn phương trên hình cầu (xem [1])
1
min f (x) := xT Ax + bT x : x
2
n

trong đó x =
i=1



T

r ,

x2i là chuẩn Euclid của vectơ x = (x1 , . . . , xn )T ∈ Rn

là dấu chuyển vị.

Cho A ∈ Rn×n , D ∈ Rn×n là các ma trận đã cho, b ∈ Rn và d ∈ Rm là
các vectơ có số chiều tương ứng.

Bài toán tối ưu toàn phương với hạn chế tuyến tính (với tập hạn chế là
tập đa diện) là bài toán tối ưu dạng (xem [2])
1
min f (x) := xT Ax + bT x : Dx ≥ d .
2
Bài toán con miền tin cậy và bài toán tối ưu toàn phương với hạn chế
đa diện đã được nghiên cứu khá kĩ (xem, thí dụ, [1], [2], [5] và các tài
6


liệu trích dẫn trong đó), mặc dù còn khá nhiều câu hỏi mở.
Gần đây, Alberto Segger và Mounir Torki đã viết hai bài báo, mỗi bài
dài 28 trang, nghiên cứu bài toán tìm cực tiểu địa phương hàm toàn
phương trên giao của nón lồi và mặt cầu, tức là bài toán (xem [3], [4])
1
min f (x) := xT Ax : x ∈ K ∩ Sn ,
2

(1)

trong đó K là một nón lồi đóng và Sn := {x ∈ Rn : x = 1} là mặt cầu
đơn vị trong Rn .
Ta nói x là nghiệm địa phương của bài toán (1) nếu x ∈ K ∩ Sn , và tồn
tại một lân cận N (x) của x sao cho với mọi x ∈ K ∩ Sn ∩ N (x) ta có
f (x) ≤ f (x).
Bài toán tối ưu phát biểu như trên là mô hình của nhiều bài toán thực
tế, xem, thí dụ, [3].
Bài toán này cũng có thể được phát biểu và nghiên cứu trong không
gian Hilbert hoặc thay chuẩn Euclid . bằng chuẩn Frobenius x


B

=

x, Bx , trong đó B là một ma trận xác định dương cho trước.
Bài báo [3] đã nghiên cứu khá chi tiết bài toán (1).
Các kết quả của bài báo này liên quan và soi sáng nhiều kết quả của bài
toán tối ưu hàm toàn phương, và chắc chắn có thể phát triển được nữa,
thí dụ có thể sử dụng và cải tiến các kết quả lý thuyết và xây dựng dãy
lặp tìm nghiệm trong [1], [2] và [5] để giải bài toán (1).
Đó chính là lí do để tôi chọn đề tài Cực tiểu địa phương hàm toàn phương
trên nón lồi làm đề tài luận văn cao học.

2. Mục đích nghiên cứu
Mục đích chính của Luận văn là trình bày các kết quả của bài toán
tìm cực tiểu địa phương hàm toàn phương trên giao của nón lồi đóng
7


với mặt cầu.

3. Nhiệm vụ nghiên cứu
Nghiên cứu và trình bày các kết quả về bài toán tìm cực tiểu địa
phương hàm toàn phương trên giao của nón lồi đóng với mặt cầu.

4. Đối tượng và phạm vi nghiên cứu
• Đối tượng nghiên cứu: Các bài toán tối ưu hàm toàn phương.
• Phạm vi nghiên cứu: Các bài toán tối ưu hàm toàn phương, đặc
biệt là bài toán tìm cực tiểu địa phương hàm toàn phương trên giao của
nón lồi đóng với mặt cầu.


5. Phương pháp nghiên cứu
Tổng hợp, phân tích, hệ thống các kiến thức trong các tài liệu về
bài toán tìm cực tiểu địa phương hàm toàn phương trên giao của nón
lồi đóng với mặt cầu.

6. Dự kiến đóng góp của luận văn
Luận văn trình bày một cách có hệ thống về bài toán tìm cực tiểu
địa phương hàm toàn phương trên giao của nón lồi đóng với mặt cầu.

8


Chương 1
Kiến thức cơ bản
Chương 1 trình bày các kiến thức cơ bản của bài toán tối ưu hàm
toàn phương. Chủ yếu dựa trên các tài liệu [2] và [3].

1.1.

Một số kiến thức của đại số tuyến tính

Định nghĩa 1.1. Ma trận
Cho m, n là hai số tự nhiên. Một m × n - ma trận (ma trận cấp m × n)
là một bảng số hình chữ nhật

a11

a
 21


 .

am1

gồm m dòng và n cột

a12 · · · a1n

a22 · · · a2n 

.
. ···
. 

am2 · · · amn

Các số (thực hoặc phức) aij được gọi là các phần tử ở dòng i cột j
(i = 1, m, j = 1, n) của ma trận.
Ma trận được viết dưới dạng thu gọn A = (aij ).
Khi cần chỉ rõ cấp của ma trận thì ta viết A = (aij )m×n .
Khi m = n thì ta có ma trận vuông cấp n. Kí hiệu ma trận vuông cấp
n là An .
9







x1


 x 
 2 
Ma trận A có cấp m × 1 được gọi là vectơ cột x = 
 số chiều m.
 ··· 


xm
Ma trận A có cấp 1 × n được gọi là vectơ hàng x = (x1 , x2 , . . . , xn ) số
chiều n.
Định nghĩa 1.2. Ma trận đối xứng (Symmetric matrix)
Ma trận đối xứng cấp n là ma trận A = (aij )n×n sao cho các phần tử
ở vị trí đối xứng nhau qua đường chéo chính thì bằng nhau, nghĩa là
aij = aji với mọi i, j = 1, . . . n.
Kí hiệu: Sym(n) là tập tất cả các ma trận đối xứng trên Rn .
Nhận xét: Dễ dàng chứng minh được Sym(n) là một không gian vectơ.
Định nghĩa 1.3. Ma trận xác định không âm
Ma trận An được gọi là xác định không âm trên Rn nếu x, Ax ≥ 0, với
mọi x ∈ Rn .
Định nghĩa 1.4. Ma trận xác định dương
Ma trận An được gọi là xác định dương trên Rn nếu x, Ax > 0, với mọi
x = 0.
Một số tài liệu gọi ma trận xác định không âm là ma trận nửa xác định
dương (hoặc ma trận xác định dương), còn ma trận xác định dương là
ma trận xác định dương chặt. Trong luận văn này chúng tôi sử dụng
thuật ngữ như đã nêu trên (ma trận xác định không âm và ma trận xác
định dương).

Nếu ma trận A là xác định không âm thì ta ký hiệu A ≥ 0.
Nếu ma trận A là xác định dương thì ta ký hiệu A > 0.

10


Định nghĩa 1.5. Một số phức λ và một vectơ v = 0 thỏa mãn Av = λv
được gọi là giá trị riêng và vectơ riêng tương ứng của ma trận A, cặp
(λ, v) được gọi là cặp riêng của ma trận A.
Định nghĩa 1.6. Phổ của ma trận A là tập hợp gồm tất cả các giá trị
riêng phân biệt của nó trong mặt phẳng phức. Kí hiệu Λ(A) là phổ của
ma trận A. Khi đó ta có
Λ(A) = {λ ∈ C : det(A − λI) = 0} .

1.2.

Một số kiến thức của giải tích lồi

Định nghĩa 1.7. Tập lồi
Một tập K ⊆ Rn được gọi là một tập lồi, nếu K chứa một đoạn thẳng
đi qua hai điểm bất kì của nó, tức là K lồi khi và chỉ khi ∀ x, y ∈ K, ∀
λ ∈ [0; 1] ⇒ λx + (1 − λ)y ∈ K.
Định nghĩa 1.8. Nón
Một tập K ⊂ Rn được gọi là nón nếu ∀ x ∈ K và ∀ λ ≥ 0 ta có λx ∈ K.
Định nghĩa 1.9. Nón lồi
Một nón được gọi là nón lồi nếu nón đó là một tập lồi.
Một tập K là nón lồi khi và chỉ khi nó có các tính chất sau:
(i) λC ⊆ C ∀ λ ≥ 0,
(ii) C + C ⊆ C.
Thật vậy, giả sử C là một nón lồi. Do C là một nón nên ta có (i). Do

1
C là một tập lồi nên ∀x, y ∈ C thì (x + y) ∈ C. Vậy theo (i) ta có
2
x + y ∈ C.
Ngược lại, giả sử rằng có (i) và (ii). Từ (i) suy ra ngay C là một nón.

11


Giả sử x, y ∈ C và λ ∈ [0, 1]. Từ (i) suy ra λx ∈ C và (1 − λ)y ∈ C.
Theo (ii) ta có λx + (1 − λ)y ∈ C. Vậy C là một nón lồi.
Định nghĩa 1.10. Nón đóng
Một nón được gọi là nón đóng nếu nón đó là một tập đóng.
Kí hiệu Ξ(Rn ) là tập các nón lồi đóng trên Rn .
Định nghĩa 1.11. Nón đa diện
Nếu một nón là tập đa diện thì ta nói nón đó là nón đa diện.
Định nghĩa 1.12. Nón nhọn
Nón C ∈ Rn được gọi là nón nhọn nếu lC := C ∩ −C = {0}.
Định nghĩa 1.13. Ma trận đối xứng E được gọi là K- đồng dương (đồng
dương trên nón K) nếu u, Eu ≥ 0 với mọi u ∈ K.
Kí hiệu: PK là tập tất cả các ma trận đồng dương trên nón K.
Nhận xét: PK là nón lồi đóng trong không gian tuyến tính Sym(n).
0 với mọi u ∈ K (do λ

Thật vậy, vì u, λEu = λ u, Eu
λ u, Eu

0 và

0 với mọi u ∈ K), với E ∈ PK nên λE ∈ PK với λ ≥ 0. Vậy


PK là nón.
Với mọi α ∈ [0; 1], E1 , E2 ∈ PK , ta có:
u, αE1 + (1 − α)E2 u = α u, E1 u + (1 − α) u, E2 u
với mọi u ∈ K (vì α ∈ [0; 1] và u, Ei u

0

0 với i = 1, 2). Vậy PK lồi.

Tính đóng: giả sử En ∈ PK và En → E cần chứng minh E ∈ PK . Thật
vậy, với En ∈ PK ta có u, En u ≥ 0 với mọi u ∈ K ⇒ lim u, En u ≥ 0
n→∞

với mọi u ∈ K. Do tính liên tục của tích vô hướng nên u, ( lim En )u ≥
n→∞

0 với mọi u ∈ K ⇒ u, Eu ≥ 0 với mọi u ∈ K. Vậy PK đóng.

12


Định nghĩa 1.14. Nón liên hợp (đối ngẫu) không âm
Giả sử K là một tập nào đó trong Rn .
Kí hiệu K + := {y ∈ Rn : y, x ≥ 0 ∀x ∈ K} là nón đối ngẫu của K.
Nhận xét: K + là nón đóng vì với y ∈ K + ⇒ y, x
x ∈ K. Ta có λy, x = λ y, x

0 với mọi


0 và với mọi x ∈ K

0 với mọi λ

⇒ λy ∈ K + ⇒ K + là nón.
K + đóng, giả sử yn ∈ K + và yn → y ta cần chứng minh y ∈ K + . Thật
vậy, với yn ∈ K + ⇒ yn , x ≥ 0 với mọi x ∈ K ⇒ lim yn , x ≥ 0 với
n→∞

mọi x ∈ K. Do tính liên tục của tích vô hướng ⇒

lim yn , x ≥ 0 với

n→∞

mọi x ∈ K ⇒ y, x ≥ 0 với mọi x ∈ K ⇒ y ∈ K + . Vậy K + đóng.
Định nghĩa 1.15. Nón lùi xa
Cho C là một tập trong Rn . Một vectơ y = 0 được gọi là hướng lùi xa
của C, nếu mọi tia xuất phát từ một điểm bất kì của C theo hướng y
đều nằm trọn trong C, tức là: y là hướng lùi xa khi và chỉ khi
x + λy ∈ C

∀x ∈ C, ∀λ

0.

Một hướng lùi xa còn được gọi là hướng vô hạn. Ký hiệu tập hợp tất cả
các hướng lùi xa của C cùng với điểm gốc là 0+ C. Khi ấy 0+ C là một
nón và được gọi là nón lùi xa của C.


1.3.

Bài toán tối ưu có hạn chế

Xét bài toán tối ưu
(P)

min{f (x) : x ∈ ∆},

trong đó f : Rn → R được gọi là hàm mục tiêu, ∆ ⊆ Rn được gọi là tập
hạn chế.
13


Định nghĩa 1.16. x được gọi là nghiệm địa phương của (P) nếu tồn tại
N (x) sao cho f (x) ≤ f (x) với mọi x ∈ ∆ ∩ N (x).
Ta có điều kiện cần tối ưu sau.
Định lý 1.1. Giả sử f : Rn → R là hàm khả vi và x là nghiệm địa phương
của (P) thì ∇f (x), x − x ≥ 0 với mọi x ∈ ∆.

(∗)

Điểm x thỏa mãn (*) được gọi là điểm tới hạn của bài toán (P).

1.4.

Tối ưu hàm toàn phương

Định nghĩa 1.17. Hàm toàn phương
Hàm f : Rn → R gọi là hàm toàn phương nếu có dạng

1
1
f (x) = xT Ax + bT x + α = x, Ax + b, x + α
2
2
n
n
n
1
aij xi xj +
bi xi + α,
=
2 i=1 j=1
i=1
trong đó A là ma trận cấp n × n, b là một vectơ n chiều, α là một số.

1
xT Ax = xT (A + AT )x, ∀x ∈ Rn
2
nên ta có thể giả thiết ma trận A là ma trận đối xứng (A = AT ).

1.4.1.

Bài toán tối ưu hàm toàn phương với ràng buộc tuyến
tính

Cho A ∈ Rn×m và A ∈ Rm×n là các ma trận, c ∈ Rn và b ∈ Rm là các
vectơ. Giả sử A là ma trận đối xứng.
Xét bài toán quy hoạch toàn phương với hạn chế tuyến tính:
1

min{f (x) := xT Ax + cT x|Dx ≥ b}.
2
14

(P1)


Kí hiệu: ∆ = {x ∈ Rn : Dx ≥ b} là tập chấp nhận được của (P1),
θ = inf{f (x): x ∈ ∆}.
Nếu ∆ = ∅ thì ta quy ước θ = +∞.
Nếu ∆ = ∅ thì ta có hai trường hợp:
Trường hợp 1. θ ∈ R,
Trường hợp 2. θ = −∞.
Khi A không phải là ma trận xác định dương, thì (P1) là bài toán tối
ưu toàn phương không lồi.
Tính chất định tính của tập nghiệm cũng như phương pháp số để tìm
nghiệm của (P1) đã được thảo luận trong nhiều sách và tài liệu nghiên
cứu, xem, thí dụ, [2], [5] và các tài liệu trích dẫn trong đó. Ta có định lí
về sự tồn tại nghiệm của bài toán (P1) như sau.
Định lý 1.2. (Định lí Frank-Wolfe, xem [2], trang 30)
Nếu θ = inf{f (x): x ∈ ∆} là số thực hữu hạn thì bài toán (1) có nghiệm.
Giả sử A là ma trận đối xứng. Khi ấy bài toán
(P 2)

1
min{ xT Ax + cT x : x ∈ Rn , Dx ≥ b, Cx = d}
2

có nghiệm khi và chỉ khi các điều kiện sau thỏa mãn:
1. ∆ = {x ∈ Rn : Dx ≥ b, Cx = d} = ∅.

2. Nếu ν ∈ Rn , Dν ≥ 0, Cv = 0 thì ν T Aν ≥ 0.
3. Nếu ν ∈ Rn , x ∈ Rn sao cho Dν ≥ 0, Cν = 0, ν T Aν = 0, Dx ≥ b và
Cx = d thì (Ax + c)T ν ≥ 0.
Định lý 1.3. (Định lí Majthay 1971, Contese 1980 xem [2], trang 52)
Điều kiện cần và đủ để x ∈ Rn là nghiệm địa phương của bài toán (P2)
là tồn tại một cặp vectơ (λ, µ) = (λ1 , . . . , λm , µ1 , . . . , µs ) ∈ Rm × Rs sao
cho:
15


i) Hệ

T
T


 Ax − D λ − C µ + c = 0
Dx − b ≥ 0, Cx = d, λ ≥ 0


 T
λ (Dx − b) = 0
được thỏa mãn, và
ii) Nếu ν ∈ Rn \{0} sao cho DI1 ν = 0, DI2 ν ≥ 0, Cν = 0, trong đó
I1 = {i : Di x = bi , λi > 0}, I2 = {i : Di x = bi , λi = 0}
thì ν T Aν ≥ 0.
Một số điều kiện cần và đủ của bài toán (P1) có thể xem trong [2], trang
46-52.

1.4.2.


Tối ưu hàm toàn phương lồi

Bài toán tối ưu hàm toàn phương
(P )

min{f (x) : x ∈ ∆},

trong đó f là hàm toàn phương với tập hạn chế
∆ = {x : x ∈ Rn , Ax ≥ b},
là tập đa diện.
Nếu f là lồi thì (P) được gọi là bài toán tối ưu hàm toàn phương lồi.

1.4.3.

Tối ưu hàm toàn phương trên mặt cầu

Bài toán tối ưu hàm toàn phương trên mặt cầu là bài toán
min f (x) : ||x||2 = r2 ,
trong đó r là số thực dương.
16


1.4.4.

Tối ưu hàm toàn phương trên nón

Bài toán tối ưu hàm toàn phương trên nón giao với mặt cầu là bài toán
1
min f (x) := xT Ax : x ∈ K ∩ Sn ,

2
trong đó A ∈ Rn×n là ma trận đối xứng, K là một nón lồi đóng và
Sn := {x ∈ Rn : ||x|| = 1} là mặt cầu đơn vị trong Rn .
Trong luận văn này, để ngắn gọn, ta gọi bài toán trên là bài toán
tối ưu hàm toàn phương trên nón. Nội dung của chương sau là nghiên
cứu bài toán tối ưu hàm toàn phương trên nón.

17


Chương 2
Bài toán tối ưu hàm toàn phương
trên giao của nón với mặt cầu
Dựa chủ yếu theo tài liệu [3] và [4], có tham khảo thêm một số tài
liệu khác, Chương 2 trình bày bài toán tối ưu toàn phương trên giao của
nón với mặt cầu.

2.1.

Điều kiện cần tối ưu

Xét bài toán tìm cực tiểu địa phương hàm toàn phương trên nón, tức là
bài toán tìm nghiệm địa phương của bài toán
1
min f (x) := xT Ax : x ∈ K ∩ Sn ,
2

(1)

trong đó A ∈ Rn×n là ma trận đối xứng, K là một nón lồi đóng và

Sn := {x ∈ Rn : ||x|| = 1} là mặt cầu đơn vị trong Rn .
Định nghĩa 2.1. Điểm x ∈ Rn được gọi là nghiệm cực tiểu địa phương
của bài toán (1) nếu x ∈ K ∩ Sn và tồn tại lân cận N (x) của x sao cho
xT Ax ≤ xT Ax với mọi x ∈ K ∩ Sn ∩ N (x).

18


Định lý 2.1. ([3], Theorem 1) Với A ∈ Sym (n) và K ∈ Ξ (Rn ). Giả sử
x ∈ Rn là nghiệm địa phương của bài toán (1). Khi ấy x là vectơ tới hạn
(critical vector) của (1), nghĩa là
x ∈ K ∩ Sn

và Ax − xT Ax x ∈ K + .

(2)

Hơn nữa, x thỏa mãn điều kiện cần cực trị cấp hai
h, [A − xT Ax I]h ≥ 0 với mọi h ∈ CK (x) ,

(3)

trong đó
CK (x) := cl{ Ax − (xT Ax)x



∩ R+ (K − x)}

là nón lồi đóng không tầm thường trong Rn .

Chứng minh. Chúng ta nghiên cứu dạng toàn phương
x ∈ Rn → qA (x) = x, Ax .
Chọn hướng h ∈ K − x và xét đường cong ψ : [0, ε] → Rn được cho bởi
ψ(t) =

x + th
,
||x + th||

t ∈ [0, ε].

(4)

Vì x là nghiệm địa phương của (1) nên x ∈ Sn , tức là ||x|| = 1 hay x = 0.
Do đó, với ε ∈ [0, 1] đủ nhỏ, thì mẫu số trong (4) không bị triệt tiêu.
Nhận xét rằng ψ(t) tương ứng với chuẩn hóa của γ(t) = x + th ∈ K. (Vì
h ∈ K −x mà K là nón ⇒ tồn tại số t sao cho th ∈ K −x ⇒ x+th ∈ K).
Nghĩa là γ(t) ∈ K, còn ||ψ(t)|| = 1, hay ψ(t) ∈ Sn và ψ(t) ∈ K vì K là
nón. Do đó ψ là đường cong chấp nhận được xuất phát từ x theo nghĩa
ψ(0) = x và ψ(t) ∈ K ∩ Sn với mọi t ∈ [0, ε]. Do x là nghiệm địa phương
của (1), nghĩa là f (x) ≤ f (x) với mọi x ∈ K ∩ Sn ∩ N (x) nên t = 0 là
cực tiểu địa phương với hàm một biến g(t):
t ∈ [0, ] → g(t) = qA (ψ(t)) =
19

γ(t), Aγ(t)
.
||γ(t)||2



Theo điều kiện cần tối ưu cho hàm một biến, ta có:
x + th, A(x + th)
||x + th||2
x, Ax + 2t x, Ah + t2 h, Ah
=
x + th, x + th
x, Ax + 2t x, Ah + t2 h, Ah
=
x + x + 2t x, h + t2 h, h
u(t)
=
v(t)

g(t) =

Ta có: u (t) = 2 x, Ah + 2t h, Ah ,
v (t) = 2 x, h + 2t h, h .
Suy ra
u (t)v(t) − u(t)v (t)
v 2 (t)
||x + th||2 [2 x, Ah + 2t h, Ah ]
=
v 2 (t)
x, Ax + 2t x, Ah + t2 h, h [2x, h + 2t h, h

.
v 2 (t)

g (t) =


Vậy
g (0) = 2 Ax − x, Ax x, h ≥ 0.
Nhưng h ∈ K − x là tùy ý, vì vậy vectơ y := Ax − x, Ax x thuộc nón
đối ngẫu của K. Vậy (2) được chứng minh.
Để có được (3) chúng ta dựa vào khai triển Maclaurin
1
g(t) = g(0) + tg (0) + t2 g (0) + t2 δ(t),
2
trong đó δ(t) → 0 khi t → 0+ . Nếu xét hướng h ∈ K − x là trực giao với
y, khi đó g (0) = 0 và
g (0) =

2
g(t) − g(0) − t2 δ(t) .
2
t
20


Vì g(t) − g(0) > 0, δ(t) → 0 với δ(t) đủ nhỏ khi t đủ nhỏ nên đạo hàm
phải cấp hai tại 0,
g (0) = 2 h, [A − x, Ax I]h
là không âm. Điều này chứng tỏ
h, [A − x, Ax I]h ≥ 0 ∀h ∈ y ⊥ ∩ (K − x).
Vậy (3) được chứng minh.
Nhận xét: Các bất đẳng thức trên có thể được mở rộng với h ∈ Y ⊥ ∩
R+ (K − x) bằng cách sử dụng một đối số thuần nhất dương và sau đó
để h ∈ CK (x) bằng cách sử dụng một đối số liên tục. Khi đó CK (x) là
nón lồi đóng không tầm thường trong Rn .
Kí hiệu:

σlocmin (A, K) = { x, Ax : x là nghiệm cực tiểu địa phương của (1)}.
σ(A, K) = { x, Ax : x là vectơ tới hạn của (1)}.
λmin (A, K) := min xT Ax.
x∈K∩Sn

Tính chất: 1) σlocmin (A, K) ⊂ σ(A, K).
2) λmin (A, K) = min {λ : λ ∈ σlocmin (A, K)}
= min {λ : λ ∈ σ(A, K)} .

2.2.

(∗∗)

Bài toán đối ngẫu

Giả sử E ∈ Sym(n) và λmin (E, K) := min xT Ex. Khi ấy tập tất cả
x∈K∩Sn

các ma trận
℘K := {E ∈ Sym(n) : λmin (E, K) ≥ 0}

21


là một tập lồi đóng trong không gian tuyến tính Sym(n).
Xây dựng bài toán đối ngẫu của (1) như sau: Tìm
β(A, K) := sup{λ ∈ R : A − λI ∈ ℘K }.

(5)


Định lý 2.2. (Định lí đối ngẫu [3], Proposition 1) Giả sử A ∈ Sym(n)
và K ⊆ Rn là nón lồi đóng. Khi ấy ta có
(1) Hàm Lagrange L(x, λ) := xT Ax − λ( x, x − 1) đạt điểm yên ngựa
trên K × R, tức là
sup inf L(x, λ) = inf sup L(x, λ).
λ∈R x∈K

x∈K λ∈R

(2)
λmin (A, K) = β(A, K).
(3) Bài toán đối ngẫu (5) có đúng một nghiệm toàn cục, chính là λ =
λmin (A, K).
Chứng minh. Cơ bản trong chứng minh là dựa vào tính đồng nhất dương.
Bài toán đối ngẫu của (1) liên quan đến cực đại hóa hàm ψ : R →
R ∩ {−∞} được cho bởi
ψ(λ) := inf L(x, λ) = inf ( x, Ax + λ − λ x, x )
x∈K

x∈K

= inf (λ + x, (A − λI) x )
x∈K

= λ + inf x, (A − λI)x
 x∈K

λ,
nếu A − λI ∈ ℘K ;
=


−∞, nếu A − λI ∈
/ ℘K .
Trường hợp 1: Nếu A − λI ∈ ℘K tức là λmin (A − λI, K) ≥ 0 hay
min xT (A − λI)x ≥ 0 thì inf x, (A − λI)x = 0 hay ψ(λ) = λ.

x∈K∩Sn

x∈K

22


Thật vậy, giả sử α = inf x, (A − λI)x < 0, khi đó tồn tại x ∈ K và
x∈K

x = 0 sao cho x, (A − λI)x < 0.
x
Đặt x =
, thì x ∈ Sn ∩ K. Khi đó:
||x||
x

x , (A − λI)x =

, (A − λI)

x

||x||

||x||
1
x, (A − λI)x
=
||x||2
<0

điều này là vô lí vì min xT (A − λI)x ≥ 0.
x∈K∩Sn

Vậy inf x, (A − λI)x = 0 hay ψ(λ) = λ + 0 = λ.
x∈K

Trường hợp 2: Nếu λI ∈
/ ℘K ⇒ min xT (A − λI)x < 0. Khi ấy tồn tại
x∈K∩Sn

x ∈ K ∩ Sn sao cho x, A − λI)x < 0. Đặt y δ = δx ∈ K ta có
y δ , A − λI)y δ = δx, (A − λI)δx
= δ 2 x, (A − λI)x .
Do đó, y δ , (A − λI)y δ → −∞ khi δ → +∞.
Chứng tỏ inf x, [A − λI]x = −∞. Vậy ψ(λ) = −∞.
x∈K

Hàm ψ có thể viết lại một cách hoàn toàn khác, cụ thể:
ψ(λ) = λ + inf Γλ (ρ),
ρ≥0

với
Γλ (ρ) := min [ x, Ax − λ x, x ] = ρ2 [λmin (A, K) − λ] .

x∈K

||x||=ρ

Thật vậy, kí hiệu α1 = min [ x, Ax − λ x, x ], α2 = λmin (A, K) − λ,
x∈K∩Sn
||x||=ρ

n

Sn (ρ) = {x ∈ R : ||x|| = ρ}. Vì K ∩ Sn (ρ) là tập compact, hàm ψ(x) =
x, Ax − λ x, x là hàm liên tục nên tồn tại x ∈ K ∩ Sn (ρ) sao cho
23


×