Tải bản đầy đủ (.doc) (34 trang)

luận văn thạc sĩ bài toán cực tiểu hàm toàn phương trên hình cầu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (182.63 KB, 34 trang )

I. MỞ ĐẦU
1. Lý do chọn đề tài
Bài toán cực tiểu hàm toàn phương trên hình cầu có tên là Bài toán miền
tin cậy (trust region subproblem). Đây là bài toán được đặc biệt quan
tâm trong tối ưu hoá và trong toán học ứng dụng. Nó đóng một vai trò
quan trọng trong việc nghiên cứu những phương pháp giải các bài toán
tối ưu phi tuyến ([5], [7], [8], [9]).
Nhiều tác giả đã quan tâm nghiên nghiên cứu bài toán này theo những
khía cạnh khác nhau. Đã có nhiều tính chất của bài toán được thiết lập
([3], [4]). Mới rồi, một số tính chất ổn định của bài toán này lần đầu tiên
đã được nghiên cứu trong [3]. Tuy vậy, một số vấn đề về ổn định của nó
vẫn còn bỏ ngỏ; chẳng hạn, sự ổn định của tập nghiệm địa phương, sự ổn
định của bài toán theo tất cả các dữ liệu...([3]).
Sau khi được học những kiến thức về Toán giải tích, với mong muốn
tìm hiểu sâu hơn về những kiến thức đã học, mối quan hệ và ứng dụng của
chúng, tôi đã chọn đề tài nghiên cứu:
“Bài toán cực tiểu hàm toàn phương trên hình cầu ”
2. Mục đích nghiên cứu
Nắm vững những tính chất khác nhau của bài toán cực tiểu hàm toàn
phương trên hình cầu và ứng dụng
3. Đối tượng và phạm vi nghiên cứu
Những khía cạnh khác nhau của bài toán cực tiểu hàm toàn phương
trên hình cầu: Điều kiện cực trị, nghiệm, nghiệm địa phương, điểm dừng, giá
trị tối ưu, sự ổn định

1


4. Phương pháp nghiên cứu
Tổng hợp kiến thức thu thập được qua những tài liệu liên quan đến đề
tài, sử dụng các phương pháp nghiên cứu của giải tích, giải tích lồi, tối ưu


hóa và giải tích đa trị
5. Dự kiến đóng góp mới
Một số tính chất về ổn định của bài toán
II. NỘI DUNG
Những vấn đề chính được nghiên cứu:
Chương 1. Cực tiểu hàm toàn phương trên hình cầu
1. Phát biểu bài toán

2. Lịch sử và tầm quan trọng của bài toán
3. Điều kiện cần/đủ cực trị
4. Điểm dừng, nghiệm và nghiệm địa phương
5. Đối ngẫu
Chương 2. Sự ổn định của bài toán
1. Sự ổn định của tập điểm dừng
2. Sự ổn định của tập nghiệm
3. Sự ổn định của tập nghiệm địa phương
4. Tính liên tục và khả vi của hàm giá trị tối ưu

2


Các kí hiệu và chữ viết tắt
¡ : đường thẳng thực
¡ n : Không gian Euclid n - chiều
S n : Tập hợp tất cả các ma trận đối xứng cấp n × n
S +n : Tập hợp tất cả các ma trận đối xứng cấp n × n nửa xác định dương
A f 0 : Ma trận A nửa xác định dương
I : Ma trận đơn vị
diag ( α1 , α 2 ,..., α n ) : Ma trận đường chéo cấp n
F : X →→ Y : Ánh xạ đa trị từ X vào Y

xT : Véctơ hàng là chuyển vị của véctơ cột x
x : chuẩn của véctơ x
QT : Ma trận chuyển vị của ma trận Q
Q
¡

m× n

chuẩn của ma trận Q
tập hợp các ma trận thực cấp m × n

x, y tích vô hướng của các véctơ x và y
B ( x, δ ) hình cầu mở có tâm x , bán kính δ
B ( x, δ ) hình cầu đóng có tâm x , bán kính δ
∂f ( x ) : dưới vi phân Mordukhovich của f tại x, hoặc dưới vi phân của hàm

lồi f tại x.
W: Kết thúc chứng minh.

3


Chương 1. Cực tiểu hàm toàn phương trên hình cầu
1. Phát biểu bài toán:
Chúng ta xem xét bài toán cực tiểu hàm toàn phương trên một hình
cầu:

{

min q ( x ) : x ≤ r 2

2

{

min q ( x ) : x = r 2
2

}

(1)

}

(2)
1
2

Với f : ¡ → ¡ n là một hàm tuyến tính cho bởi q ( x ) := xT Qx + cT x
Ở đây Q ∈ ¡

n×n

là ma trận đối xứng cấp n × n , c ∈ ¡

n

là một vectơ, T kí hiệu

chuyển vị, và . là chuẩn Euclid, r là một số thực dương.
2

n
n
Đặt g ( x, r ) := x − r 2 , Br := { x ∈ ¡ : g ( x, r ) < 0} , Br := { x ∈ ¡ : g ( x, r ) ≤ 0} .

Hàm Lagrange liên kết với bài toán (1) là hàm số
L ( x, λ ) :=

(

1 T
2
x Qx + cT x + λ x − r 2
2

)

Chúng ta đều biết rằng nếu x ∈ ¡ n là một nghiệm của địa phương của bài
toán (1), thì ở đó tồn tại duy nhất λ ∈ ¡ ( ta gọi là nhân tử Lagrange tương
ứng với x) sao cho

( Q + λ I ) x = −c, λ g ( x, r ) = 0, λ ≥ 0, g ( x, r ) ≤ 0 (3)
Ở đây I là ma trận đơn vị n × n . Tính duy nhất của nhân tử Lagrange λ
tương ứng một nghiệm địa phương x ≠ 0 suy ra từ (3).
Nghĩa là, từ phương trình đầu tiên của (3), ta có:
λ=−

1 T
x Qx + cT x ) ( 4)
2 (
r

4


khi x = r .
Từ phương trình thứ 2 trong (3) suy ra λ = 0 khi x ∈ Br .
Ta nói rằng x là một điểm Karush- Kuhn- Tucker ( kí hiệu là điểm KKT) của
(1) nếu tồn tại λ ∈ ¡ thoả mãn (3).
Một cách tương tự như nghiệm địa phương, với mỗi điểm KKT x, tồn tại
duy nhất nhân tử Lagrange λ thoả mãn (3).Ta kí hiệu (viết tắt) tập hợp các
điểm KKT, tập hợp các nghiệm địa phương, và tập hợp các nghiệm toàn cục
của (2) tương ứng là
S ( Q, c, r ) , loc ( Q, c, r ) và Sol ( Q, c, r ) .

Giá trị tối ưu của (1) kí hiệu là ϕ ( Q, c, r ) . Để thuận tiện, đôi khi ta sẽ viết
ϕ ( r)

thay vì viết ϕ ( Q, c, r ) .
Rõ ràng là Sol ( Q, c, r ) ⊂ loc ( Q, c, r ) ⊂ S ( Q, c, r ) và do đó,
ϕ ( Q, c, r ) = min { q ( x) : x ∈ Sol ( Q, c, r ) } ≥ min { q ( x) : x ∈ S ( Q, c, r ) }

Bài toán (1) có những đặc điểm riêng dưới đây:
(i)

Một điểm x ∈ B r là một nghiệm toàn cục nếu và chỉ nếu tồn tại
λ ≥ 0 sao cho (2) đúng và Q + λ I là một ma trận nửa xác định

dương.Nếu Q + λ I là xác định dương, thì (1) có duy nhất một
nghiệm toàn cục.
(ii)


Ở đó tồn tại nhiều nhất một nghiệm không toàn cục địa phương
của bài toán (1). Nếu x là một nghiệm như vậy , thì g ( x, r ) = 0 .

5


Hơn nữa, nếu n ≥ 2 thì (2) đúng với λ ∈ ( − µ2 , − µ1 ) , trong đó
µ1 < µ2 là hai giá trị riêng nhỏ nhất của Q.

(iii)

Ở đó tồn tại nhiều nhất min { 2m + 2, 2n + 1} điểm KKT phân biệt rõ
ràng với nhân tử Lagrange, ở đây m là số các giá trị riêng âm
của Q.

2. Lịch sử và tầm quan trọng của bài toán
Bài toán cực tiểu hàm toàn phương trên hình cầu có tên là Bài toán miền tin
cậy (trust region subproblem) vì nó được giải trong mỗi bước của thuật toán
miền tin cậy. Đây là bài toán được đặc biệt quan tâm trong tối ưu hoá và
trong toán học ứng dụng. Nó đóng một vai trò quan trọng trong việc nghiên
cứu những phương pháp giải các bài toán tối ưu phi tuyến ([5], [7], [8], [9]).
Những bài toán dạng này xuất hiện trong nhiều ứng dụng khác bao gồm
phương pháp chính qui cho bài toán đặt không chỉnh và bài toán phân chia
đồ thị.
Phương pháp giải bài toán này, đặc biệt trong trường hợp qui mô lớn, đã
được nghiên cứu trong một số bài báo.

3. Điều kiện cần / đủ cực trị
Địnhlý 1: Điều kiện cần và đủ để x* là một nghiệm tối ưu toàn cục của bài
toán (2) là tồn tại µ * thỏa mãn

(i) Qx* + c = µ * x* (5)

6


(ii) Q − µ * I là nửa xác định dương (6)
*
(iii) x = r (7)

Chứng minh
Ta thấy rằng điều kiện (7) là điều kiện cần cho nghiệm tối ưu x* .Cũng vậy
(5) chỉ là điều kiện tiêu chuẩn KKT cho nghiệm tối ưu của phương trình phi
tuyến (1). Còn lại chứng minh (6).
1
2

1
2

Đặt f ( x) := xT Qx + cT x và F ( x) := xT (Q − µ I ) x + cT x
*
*
Chú ý rằng với bất kỳ x ∈ ¡ n sao cho x − x , x ≠ 0 ở đó tồn tại một số θ ≠ 0
*
*
*
*
sao cho θ x − x , x < 0 và x′ = x + θ ( x − x ) thỏa mãn x′ = r . Sau đó ta có

thể viết

2

2

F ( x′) − F ( x* ) = f ( x′) − f ( x* ) − µ * ( x′ − x* ) = f ( x′) − f ( x* ) ≥ 0

Vì x* là cực tiểu f ( x) trên tập hợp x = r . Mặt khác, từ phương trình

(Q−µ I) x
*

*

+ c = 0 ta suy ra

F ( x′) − F ( x* ) =

T
1
x ′ − x* ) ( Q − µ * I ) ( x′ − x * )
(
2

Do đó,
T
1
θ2
* T
*
*



0 ≤ ( x − x ) ( Q − µ I ) ( x − x ) = ( x − x* ) ( Q − µ * I ) ( x − x * )
2
2
*
*
Và vì vậy, ( x − x* ) ( Q − µ * I ) ( x − x* ) ≥ 0 với mọi x sao cho x − x , x ≠ 0 . Vì
T

ν
*
*
bất kỳ x ∈ ¡ n là giới hạn của 1 chuỗi xν sao cho x − x , x ≠ 0 , vì tính liên

tục của nó suy ra rằng ( x − x* ) ( Q − µ * I ) ( x − x* ) ≥ 0 với mọi x ∈ ¡ n , có nghĩa là
T

7


Q − µ * I là nửa xác định dương. Như vậy, điều kiện (5) – (7) là những điều

kiện cần cho nghiệm tối ưu.
Ngược lại, giả sử tồn tại µ * ≤ 0 thảo mãn (5) – (7). Theo điều kiện (4) thì
hàm toàn phương F ( x) :=

1
x, (Q − µ * I ) x + c, x là lồi và vì (5) đạt tới
2


∇F ( x* ) = 0 , suy ra rằng x* là một cực tiểu của F ( x) trên ¡ n .
1
2

1
2

Nhưng cho x = r ta có F ( x) := xT Qx + cT x − µ *r , do đó x* cũng là một cực
1
2

tiểu của f ( x) := xT Qx + cT x trên hình cầu x = r .
Chú ý:Đối với những bài toán không lồi điều kiện (5) – (7) là cần nhưng
thường không phải điều kiện đủ thậm chí cho bài toán tối ưu địa phương.
Thực tế thì nghiệm tối ưu toàn cục có thể có đầy đủ các đặc trưng bởi điều
kiện tương tự (5) - (7) là rất cao không bình thường trong tối ưu hóa không
lồi.Cũng lưu ý rằng bởi một kết qủa gần đây của Martinez (1994)(TRS) có
nhiều nhất một nghiệm không toàn cục địa phương.

Địnhlý 2: x* là một nghiệm tối ưu của bài toán (1) nếu và chỉ nếu tồn tại λ *
thỏa mãn
*
( i ) ( Q + λ I ) là nửa xác định dương (8)
*
*
( ii ) ( Q + λ I ) x = −c (9)
*
*
*

( iii ) λ ( x − r ) = 0, x ≤ r , λ * là duy nhất (10 )

Địnhlý 3: x* là một nghiệm tối ưu của bài toán (2) nếu và chỉ nếu tồn tại λ *
thỏa mãn
8


*
( i ) ( Q + λ I ) là nửa xác định dương (11)
*
*
( ii ) ( Q + λ I ) x = −c (12)
*
( iii ) x = r , số λ * này là duy nhất (13 )

4. Điểm dừng, nghiệm và nghiệm địa phương
4.1. Điểm dừng
n
Một điểm KKT của bài toán (1) là một cặp ( x, λ ) ∈ ¡ × ¡ thỏa mãn (3).

Hơn nữa, ta nói rằng bổ xung tính ngặt vẫn đúng tại một cặp điểm KKT

( x, λ ) nếu

2

λ > 0 cho x = r 2 .

4.2. Nghiệm
*


Một điểm x* sao cho x ≤ r 2 là một nghiệm toàn cục của bài toán (1) nếu và
*
*
chỉ nếu tồn tại duy nhất λ * ≥ 0 sao cho cặp điểm ( x , λ ) thỏa mãn điều kiện

KKT

(Q+λ I) x
*

(

2

*

= −c

)

λ * x* − r 2 = 0
*
*
Và ma trận ( Q + λ I ) là nửa xác định dương. Nếu ( Q + λ I ) là xác định dương

thì bài toán (1) có duy nhất một nghiệm toàn cục.
4.3. Nghiệm địa phương
Mệnh đề


9


Tồn tại nhiều nhất một cực tiểu địa phương x của bài toán (1).
2
Hơn nữa, ta có x = r và điều

5. Đối ngẫu
Ta viết lại ràng buộc của bài toán (1) và (2) dưới dạng tương đương:
1 2
1 2
2
2


n 1
n 1
 x ∈ ¡ : x ≤ r  và  x ∈ ¡ : x = r 
2
2 
2
2 



Kí hiệu λ1 ≤ λ2 ≤ .... ≤ λn là những giá trị riêng của Q và µ1 , µ2 ,..., µn cấu
thành(thiết lập) thành cơ sở trực giao của ¡ n . Dễ dàng thấy rằng nghiệm của
phương trình tuyến tính cho bởi

( Q + λ I ) x = −c (14)

Cho bởi
ui x ( λ ) =
T

−u Ti c

λi + λ

i = 1,..., n

( 9)

Ta viết bài toán (1) và (2) dưới dạng tương đương, ta kí hiệu bài toán là ( C1 )
và ( C2 )
1
1 2 1 

α1 = min q ( x ) := xT Qx + cT x : x ≤ r 2 
2
2
2 


( C1 )

1
1 2 1 

α 2 = min q ( x ) := xT Qx + cT x : x = r 2 
2

2
2 


( C2 )

Hàm Lagrange của bài toán ( C1 ) và ( C2 ) xác định bởi

10


1 T
1
2

T
2
α1 = x Qx + c x + ( x − r ) if λ ≥ 0
L1 ( x, λ ) = 
2
2
 −∞
otherwise
L2 ( x, λ ) =

1 T
1
2
x Qx + cT x + ( x − r 2 ) , λ ∈ ¡
2

2

n

Với mỗi λ ≥ 0 cố định ta đặt

λ 
1
g1 ( λ ) = infn  xT ( Q + λ I ) x + cT x − r 2 
x∈¡  2
2 
g 2 ( λ ) = infn { L2 ( x, λ ) : x ∈ ¡
x∈¡

n

(C )
1
λ

}

Rõ ràng, g1 là hàm lõm.
Bài toán đỗi ngẫu của ( C1 ) là
β1 = sup { g1 ( λ ) : λ ≥ 0}

( D1 )

Bài toán đỗi ngẫu của ( C2 ) là
β 2 = sup { g 2 ( λ ) : λ ∈ ¡ }


( D2 )

11


Chương 2. Sự ổn định của bài toán
1. Sự ổn định của tập điểm dừng
1.1.Nửa liên tục trên và nửa liên tục dưới
Một hàm đa trị F : Z ⇒ ¡ n xác định trên một tập con Z của một không gian
định chuẩn được gọi là nửa liên tục trên (viết tắt là usc) tại z ∈ Z nếu cho
mỗi tập mở V ⊂ ¡

n

thỏa mãn F ( z ) ⊂ V , ở đó tồn tại δ > 0 sao cho F ( z ) ⊂ V

khi z − z < δ .
Nếu cho mỗi tập mở V ⊂ ¡

n

thỏa mãn F ( z ) ∩ V ≠ ∅ ở đó tồn tại δ > 0 sao cho

F ( z ) ∩ V ≠ ∅ khi z − z < δ thì F là nửa liên tục dưới (lsc) tại z ∈ Z .

Nếu F đồng thời vừa là ucs và lsc tại z , ta nói rằng nó liên tục tại z .

1.2. Sự ổn định của tập điểm dừng
Trước tiên ta chứng minh tính chất nửa liên tục dưới của hàm đa trị S ( .) .

Địnhlý 2.1 Cho bài toán (1) với tập dữ kiện { Q, c, r} cố định. Hàm đa trị
S :Z ⇒ ¡

n

là ucs tại ( Q, c, r ) ∈ Z .

Chứng minh
n
, r ) ∈ Z : r%− r < 1} ta có S ( Q%
, c%%
, r ) ⊂ K với
Vì K := { u ∈ ¡ : u ≤ r + 1} và W := { ( Q%, c%%

,r) ∈W .
mọi ( Q%, c%%

Điều này chứng tỏ hàm đa trị S ( .) bị chặn đều khắp nơi ( Q, c, r ) ∈ Z .Vì vậy để
chứng tỏ rằng S ( .) là usc tại ( Q, c, r ) ta cần chỉ ra rằng nó thỏa mãn đóng tại

( Q , c, r ) .
12


k
k
k
k
k
k

k
Giả sử rằng x ∈ S ( Q , c , r ) , ( Q , c , r ) ∈ Z với mọi k ∈ N ,

( Q , c , r ) → ( Q, c , r )
k

k

k

và x k → x .

Với mỗi k , ở đó tồn tại duy nhất nhân tử λ k thỏa mãn

(Q

k

+ λ k I ) x k = −c k , λ k g ( x k , r k ) = 0, r k ≥ 0, g ( x k , r k ) ≤ 0 (15)

Ta chia thành 2 trường hợp
k
k
k
k
Trường hợp 1: Tồn tại một dãy { x } của { x } sao cho x < r với mọi
j

j


j

j∈N .
k
k
k
Từ (15) suy ra λ k = 0 , do đó Q x = −c .
j

j

j

j

Cho j → ∞ , ta có Qx = −c .
Chọn λ = 0 , ta có cặp điểm ( x, λ ) thỏa mãn (3); do vậy x ∈ S ( Q, c, r )
k
k
Trường hợp 2: Tồn tại k ∈ N sao cho x = r , ∀k ≥ k .

Suy ra có x = α .
Từ phương trình đầu tiên trong (15) ta có
λk = −

1

(r )

k 2


(( x )

k T

Qk xk + ( ck ) xk
T

)

(16)

với mọi k ≥ k .

λk = λ .
Xác định λ bằng (4). Thế thì (16) suy ra rằng lim
k →∞

Kết hợp phương trình đầu tiên của (15) ta kết luận ( Q + λ I ) x = −c .
Từ đó (3) thỏa mãn, đúng với cả x ∈ S ( Q, c, r ) . Có nghĩa là tính chất đóng của
S ( .) tại ( Q, c, r ) đã được chứng minh. Như vậy ta có địnhlý được chứng

minh.

13


Ta có hệ que suy ra trực tiếp từ địnhlý 2.1
Hệ quả 2.1
n

n
Đối với bất kỳ ( Q, c, r ) ∈ Z ánh xạ S ( Q, c, r ) : ¡ ⇒ ¡ là usc tại c.

Địnhlý dưới đây đưa ra điều kiện cần cho tính nửa liên tục dưới của ánh xạ
tập hợp điểm KKT.
Định lý 2.2
n
n
Cho ( Q, c, r ) ∈ Z tùy ý. Nếu hàm đa trị S ( Q, c, r ) : ¡ ⇒ ¡ là lsc tại c, thì

S ( Q, c, r ) là một tập hữu hạn.

Chứng minh
Giả sử S ( Q, c, r ) là lsc tại c. Trước hết ta chứng minh rằng S ( Q, c, r ) ∩ Br là
hữu hạn ( có thể ∅ ).
Giả sử ngược lại rằng có vô số các điểm KKt trong Br . Từ (3) suy ra hệ
phương trình tuyến tính Qx = −c có vô số nghiệm.
Do đó det Q = 0 và vì vậy Im Q := { Qx : x ∈ ¡

n

}

là không gian con thực sự của

¡ n.
k
n
k
Từ c ∈ Im Q , ta có thể tìm được dãy { c } ⊂ ¡ sao cho { c } ∉ Im Q, ∀k ∈ N và


ck → c .
k
Sau đó ta có S ( Q, c , r ) ∩ Br = ∅, ∀k ∈ N .

Do đó, ta không thể tìm thấy bất kỳ một lân cận U nào của c sao cho
S ( Q, c%
, r ) ∩ Br ≠ ∅, ∀c%∈ U

Điều này chứng tỏ rằng hàm đa trị S ( Q, c, r ) không là lsc tại c, một mâu
thuẫn.
14


Chứng minh hoàn thành nếu ta có thể chỉ ra rằng S ( Q, c, r ) ∩ S r , ở đây
S r := Br \ Br , là hữu hạn.
k
Giả sử rằng tồn tại một dãy { x } của các điểm KKT riêng biệt của (1) sao cho

{ x } ⊂ S ( Q, c , r ) ∩ S
k

r

với mọi k ∈ N .

Vì Q là một ma trận đối xứng, nên tồn tại một ma trận trực giao M sao cho

{


M T QM = diag µ 1 ,..., µ n

}

ở đây µ ≤ µ 2 ≤ ... ≤ µ là những giá trị riêng của Q.
1

n

Thực hiện phép biến đổi trực giao x = My và sử dụng hệ tọa độ y = ( y1 ,..., yn )
(nếu cần thiết ) ngay từ đầu ta có thể gỉa sử rằng

{

}

Q = diag µ 1 ,..., µ n , µ 1 ≤ ... ≤ µ n

(17)

Vì số điểm KKT là phân biệt rõ ràng với nhân tử Lagrange là hữu hạn, nên
k
k
k
phải tồn tại một dãy con { x } của { x } sao cho mọi điểm x , j ∈ N có chung
j

j

nhân tử Lagrange λ .

Với mỗi j kết hợp phương trình đầu tiên trong (3) với (17) suy ra



i

+ λ ) xi j = −ci ( ∀ i = 1,..., n )
k

(18)

k
ở đây kí hiệu xi và ci tương ứng là thành phần thứ i của x k và c .
j

j

Nếu λ = 0 , thì từ (18) ta có Qx k = −c và Qx k = −c . Do đó, với bất kỳ
1

2

t ∈ ( 0,1) các cặp điểm ( x, λ ) ứng với x := ( 1 − t ) x k1 + tx k2 và λ = 0 thỏa mãn (3).

Điều này có nghĩa là

( 1 − t ) xk

1


+ tx k2 ∈ S ( Q, c, r ) ∩ Br

Với mọi t ∈ ( 0,1) , mâu thuẫn với sự hữu hạn của tập hợp S ( Q, c, r ) ∩ Br . Suy
ra rằng nhân tử Lagrange xuất hiện (ở trong ) trong (18) là dương.
15


Nếu µ i + λ ≠ 0, ∀i = 1,..., n , thì vectơ x k được xác định duy nhất bởi
j

k
(18). Điều này mâu thuẫn với những tính chất là các vectơ x , j ∈ N từng
j

đôi một phân biệt rõ ràng.
Vậy thì , phải tồn tại số i0 nào đó i0 ∈ { 1,..., n} sao cho µ i + λ = 0 .
0

Không mất tính tổng quát ta có thể gải sử rằng i0 là số mũ nhỏ nhất trong các
số i0 ∈ { 1,..., n} với tính chất là µ i + λ = 0 .
Vì λ > 0 ta có µ i < 0 .Giả sử l biểu thị sự vô số của các giá trị riêng của µ i .
0

0

Trường hợp 1: l = 1 . Đối với mỗi j ∈ N , do (18) ta có
k

xi j = −


ci
a bất cứ khi nào i ≠ i0 (19)
µ +λ
i

k
Từ x ∈ Sr , nên có
j

n

i =1

( ci )

2

( ) = ∑( µ +λ) +( x )

r =∑ x
2

kj
i

2

n

i =1


2

kj
i0

2

(20)

i

k
Rõ ràng không thể tồn tại nhiều hơn hai giá trị xi thỏa mãn (20).
j

0

k
Kết hợp điều này với (20), ta kết luận rằng những vectơ x , j ∈ N , không
j

k
thể từng đôi phân biệt rõ ràng. Điều này mâu thuẫn với sự lựa chọn dãy { x }

.
Trường hợp 2: l ≥ 2 .
Từ λ = − µ i , ta có ci = 0 , với bất kỳ i ∈ I 0 := { i0 ,..., i0 + l − 1} .
0


Do (18), ứng với mỗi j ∈ N ta có
k

xi j = −

ci
µ − µ i0
i

( ∀i ∉ I 0 )

(21)

16


k
Vì x ∈ Sr , nên có
j

∑( x
i∈I 0

kj
i

)

2


= r −∑
2

i∉I 0



( ci )
i

2

− µ i0

)

(22)

2

2

ci )
(
2

Ta phải có β :=  r − ∑ i i0
i∉I 0 µ − µ



(

)

2






1

2

>0.

k
Thật vậy, nếu β = 0 thì (22) suy ra rằng xi = 0 với bất kỳ j ∈ N và i ∈ I 0 .
j

k
Do đó từ (21) suy ra rằng { xi } là một chuỗi không đổi.
j

Λ
Các điều kiện (20) và (21) mô tả một hình cầu, kí hiệu là S β , có bán kính

β > 0 trong đa tạp aphin


c

Λ := u = ( u1 ,..., un ) ∈ ¡ n : ui = − i i i0 , ∀i ∉ I 0 
µ −µ


Λ
Λ
Ta có dim Λ = l , và, do đó, dim S β = l − 1 ≥ 1 . Như vậy, S β có vô số các phần

tử.
Λ
Dễ dàng thấy rằng S β là tập hợp các điểm KKT của (1) với các nhân tử

chung Lagrange λ > 0 . Để có được sự mâu thuẫn, ta có thể tiến hành như
sau.
ε
ε
ε
ε
Giả sử cho ε > 0 tùy ý. Đặt c = ( c1 ,..., cn ) , ở đây ci = ci , ∀i ∉ { i0 , i0 + 1} và

ciε0 = ciε0 +1 = ε .
ε
ε
Giả sử x ∈ S ( Q, c , r ) và λ ε là nhân tử Lagrange tương ứng với xε .

Từ (3) và (17) ta có

17



( µ i + λ ε ) xiε = −ci if i ∉ { i0 , i0 + 1}


µ i0 + λ ε xiε0 = −ε


µ i0 + λ ε xiε0 +1 = −ε


(

(

)

)

(23)

ε

ε
ε
Từ đó có µ i + λ ε ≠ 0 và xi = xi +1 = − µ i + λ ε
0

0


0

0

(24)

Λ
Lấy bất kỳ x ∈ S β . Vì cε → c khi ε → 0+ và S ( Q,., r ) là lsc tại c , cho mỗi

ε
εk
chuỗi ε k → 0+ ở đó tồn tại một chuỗi xε → x sao cho x ∈ S ( Q, c , r ) ∀k ∈ N
k

k

Từ (3) ta có
λ εk = −

(( x

1
r2

)

εk T

( )


Qxε k + cε k

T

)

Qxε k → −

1 T
x Qx + cT x ) = λ
2 (
r

Do đó, với bất kỳ i ∉ I 0 ,

(

)

lim µ i + λ ε k = µ i + λ = µ i − µ i0 ≠ 0
k →∞

Như vậy, ở đó tồn tại k ∈ N sao cho với mọi i ∉ I 0 và k ≥ k .
Từ (23),
xiε k = −

ci
, ∀i ∉ I 0 và k ≥ k . (25)
µ + λ εk
i


Mặt khác, theo (23) và tính chất ci = 0 cho i ∈ I 0 , ta có



i0

)

+ λ ε k xiε k = 0, ∀i ∈ I 0 \ { i0 , i0 + 1}

ε
Bởi vì µ i + λ ε ≠ 0 do (24), nên suy ra xi = 0, ∀i ∈ I 0 \ { i0 , i0 + 1} .
0

k

k

λ ε = λ > 0 , không mất tính tổng quát ta có thể giả sử rằng
Từ lim
k →∞
k

λ ε k > 0, ∀k ∈ N

Sau đó xε ∈ Sr ∀k . Từ (24) và (25) ta suy ra
k

18



( )
εk
i0

2 x

2

(

εk
i0 +1

=2 x

)

2

=

2( εk )



εk

εk


0

0

i0



Vì vậy, hoặc xi = xi +1 →

2

εk

)

= r −∑
2

2

i∉I



( ci )
i

2




εk

)

2

→ β2

khi k → ∞ .

εk
εk
2
2
β hoặc xi0 = xi0 +1 → −
β.
2
2

Λ
Do đó chỉ có hai sự lựa chọn có thể cho x ∈ S β . Dẫn đến sự mâu thuẫn, trong

đó chỉ ra rằng Sol ( Q, c, r ) ∩ S r là hữu hạn.
Vậy địnhlý được chứng minh. W
Chú ý 2.1.
Nếu tập hợp S ( Q, c, r ) ∩ Br ≠ ∅ và hữu hạn, thì nó là duy nhất.
Thật vậy, giả sử rằng tồn tại x, u ∈ S ( Q, c, r ) ∩ Br sao cho x ≠ u .

Thế thì Qx = −c và Qu = −c . Vì vậy Q ( ( 1 − t ) x + tu ) = −c ∀t ∈ [ 0,1] , và ta có

( 1 − t ) x + tu ∈ S ( Q, c, r ) ∩ Br

∀t ∈ [ 0,1] , mâu thuẫn.

Ví dụ 2.1
 −1

Cho n = 2, Q = 
0

0
0
÷, c =  ÷ và r = 1 . Thế thì bài toán (1) trở thành
−1
0

 1

min  − ( x12 + x22 ) : x12 + x22 ≤ 1
 2


Sử dụng (3) ta có thể kiểm tra
S ( Q, c, r ) = { ( 0, 0 ) } ∪ { ( x1 , x2 ) : x12 + x22 = 1}

Vì S ( Q, c, r ) là vô hạn, S ( Q, c, r ) không phải là lsc tại c do địnhlý 2.2.
Rõ ràng, nếu S ( .) là lsc tại ( Q, c, r ) thì S ( Q,., r ) là lsc tại c. Như vậy địnhlý
2.3 cũng cung cấp một điều kiện cần cho tính chất lsc của ánh xạ S ( .) .

19


Hệ quả 2.2
Nếu ánh xạ S ( .) : Z ⇒ ¡

n

là lsc tại ( Q, c, r ) ∈ Z thì S ( Q, c, r ) là hữu hạn.

Một điều đáng chú ý rằng, nói chung, sự hữu hạn của tập hợp S ( Q, c, r )
không phải là điều kiện đủ cho tính nửa liên tục dưới của ánh xạ S ( Q, c, r ) .
Ví dụ 2.2
Xem xét bài toán (1) với n = 1, Q = ( −1) , c = 1 và r = 1 .
Ta có S ( Q, c, r ) = { −1,1} nhưng, với mỗi ε > 0 , thì có S ( Q,1 + ε , r ) = { −1} .
Điều này chứng tỏ rằng S ( Q,., r ) là không lsc tại c = 1 .
Bây giờ ta đi thiết lập một số điều kiện đủ cho tính nửa liên tục dưới của
S ( Q,., r ) .

Địnhlý 2.3
Giả sử rằng S ( Q, c, r ) là hữu hạn. Hàm đa trị S ( Q,., r ) là lsc tại c nếu với mỗi
x ∈ S ( Q, c, r ) với nhân tử Lagrange tương ứng kí hiệu là λ , ít nhất một trong

ba điều kiện sau đây được thỏa mãn:
(i) x ∈ Br ;
(ii) x = r , λ > 0, − λ không phải là một giá trị riêng của Q, và
n

1− ∑
i =1


2 µ i ci2

r2 ( µi + λ )

n

3

+∑
i =1

ci2

r2 ( µi + λ )

2

≠0

ở đây µ 1 ≤ ... ≤ µ n là các giá trị riêng của Q;
(iii) Q + λ I là xác định đương.
Chứng minh
20


Vì S ( Q, c, r ) ≠ ∅ ,để chứng minh rằng S ( Q,., r ) là lsc tại c, điều kiện đủ cần chỉ
ra rằng với bất kỳ x ∈ S ( Q, c, r ) và bất kỳ lân cận mở U x của x , ở đó tồn tại
δ > 0 sao cho
S ( Q, c′, r ) ∩ U x ≠ ∅


(28)

∀c′ ∈ B ( c, δ ) := { c′ − c < δ } .

Giả sử x ∈ S ( Q, c, r ) , λ ≥ 0 là nhân tử Lagrange tương ứng của x, và U x
là một lân cận mở của x.
Theo giả thiết của ta, ít nhất một trong những điều kiện (i) – (iii) là thỏa
mãn.
Đầu tiên ta xem xét trường hợp (i) đúng , đó là x ∈ Br . Do (3) ta có λ = 0 và
x là một nghiệm của hệ phương trình tuyến tính
Qx = −c

(29)

Vì x là một điểm trong của Br , kết hợp với thực tế cuối với giả thiết rằng
S ( Q, c, r ) là hữu hạn, ta có thể kết luận rằng x là một nghiệm duy nhất của

(29).
Do đó ma trận Q là không suy biến và x = −Q −1c .Sau đó, rõ ràng tồn tại δ > 0
sao cho x′ := −Q −1c′ thuộc vào U x ∩ Br với mỗi c′ ∈ B ( c, δ ) . Từ đó
Qx′ = −c′,

2

x′ − r 2 < 0

Suy ra x′ ∈ S ( Q, c.r ) ∩ U x . Như vậy ta đã chỉ ra (28) là hợp lệ (thỏa mãn) với
mỗi c′ ∈ B ( c, δ ) .


21


Bây giờ giả sử (ii) đúng. Không mất tính tổng quát, ta có thể gỉa sử rằng Q
là một ma trận đường chéo của dạng (17).Vì −λ không phải giá trị riêng của
Q , ma trận Q + λ I là không suy biến. từ (3) và giả thiết ta suy ra

λ=−

1 T
( x Qx + cT x ) > 0
r2

(30)

Để có được một số δ > 0 thỏa mãn (28), ta sẽ tìm thấy một vài số δ > 0 như
vậy mà cho bất kỳ c′ ∈ B ( c, δ ) hệ phương trình

( Q + λ ′I ) x′ = −c′,

λ ′g ( x′, r ) = 0, λ ′ ≥ 0, g ( x′, r ) ≤ 0

(31)

Có một nghiệm ( x′, λ ′ ) với x′ ∈ U x .
Nếu λ ′ > 0 thì g ( x′, r ) = 0 và do (31) ta có
λ=−

1
r2


( ( x′ )

T

Q ( x′ ) + ( c ′ )

T

( x′ ) )

Nếu λ ′ đủ gần tới λ , thế thì từ phương trình đầu tiên trong (31) có được
xi′ = −

ci′
µ i + λ′

( i = 1,..., n )

(33)

Thế những biểu thức này vào (32) ta được những phương trình sau:

( )

2

n

µi ci′


i =1

r 2 ( µ i + λ ′)

Φ ( λ ′, c′ ) = λ ′ + ∑

Từ Φ ( λ ′, c′ ) = 0 do (30) và

2



n

( )
ci′

∑ r( µ
i =1

i

2

+ λ ′)

= 0 ( i = 1,..., n ) (34)

∂Φ

( λ , c ) ≠ 0 do các giả thiết của (17), sử dụng
∂λ ′

địnhlý hàm ẩn cổ điển ta có thể tìm được δ > 0 sao cho bất kỳ c′ ∈ B ( c, δ ) ,(34)
chấp nhận một nghiệm duy nhất λ ′ = Φ ( c′ ) trong một lân cận của λ .

22


Mặt khác, λ = φ ( c ) và φ ( .) là một hàm liên tục. Do đó, nếu chọn được λ > 0
đủ nhỏ, ta có λ ′ = φ ( c′ ) >

∀c′ ∈ B ( c, δ ) .

Phương trình (33) chỉ ra rằng x′ là một hàm liên tục, nói x′ = f ( c′ ) trong c′ .
Lưu ý rằng f ( c ) = x .
Lấy một số giá trị nhỏ hơn δ > 0 , nếu cần thiết, ta có x′ = f ( c′ ) ∈ U x ,
∀c′ ∈ B ( c, δ ) ; vì vậy (28) thỏa mãn.

Cuối cùng, ta xem xét trường hợp (iii) đúng. Vì Q + λ I là xác định dương, x
là nghiệm toàn cục duy nhất của (1). Từ sự khẳng định của địnhlý 3.1 từ
phần tiếp theo, ở đó tồn tại δ > 0 sao cho Sol ( Q, c′, r ) ∩ U x ≠ ∅ với mỗi
c′ ∈ B ( c, δ ) . Cuối cùng ta có tính chất (28).

Ví dụ 2.3 Xem xét bài toán (1) với n = 1, Q = ( −1) , c =

1
và α = 1 .
2


1

Ta có S ( Q, c, r ) = −1,1,  và nhân tử Lagrange tương ứng với x1 = −1, x 2 = 1


và x3 =

2

1
3
1
là λ 1 = , λ 2 = và λ 3 = 0 . Đối với mỗi điểm KKT x ∈ S ( Q, c.r ) và
2
2
2

nhân tử Lagrange tương ứng λ , ít nhất là một trong những điều kiện của (i)
– (iii) của địnhlý 2.3 đúng. Thật vậy, (iii) và (i) là hợp lệ ( thỏa mãn ), cho

( x, λ ) = ( x1 , λ1 ) và ( x, λ ) = ( x3 , λ 3 ) .
2
2
Cho ( x, λ ) = ( x , λ ) , ta có λ > 0, −λ = −

1
không phải là một giá trị riêng của
2

Q, và


23


2µ c

2
i i

n

1− ∑
i =1

r

2

2
i

c

n

( µi + λ )

3

+∑

i =1

r

2

( µi + λ )

2

= 1−

2 × ( −1) ×

1
4+
3

1

 −1 + ÷
2


1
4

2

1


 −1 + ÷
2


= −6 ≠ 0 .

Vì vậy, theo địnhlý 2.3 ta có S ( Q,., r ) là lsc tại c.
Chú ý 2.2
Các điều kiện đủ trong địnhlý 2.3 không thể áp dụng cho bài toán mô tả
trong ví dụ 2.2 vì cho điểm KKT x = 1 ta có λ = 0 , và không một yêu cầu nào
(i) – (iii) thỏa mãn.
3. Sự ổn định của tập nghiệm
Định lý tiếp theo đưa ra một đặc trưng đầy đủ cho tính liên tục của nghiệm
toàn cục ánh xạ Sol ( Q,., r ) .
Định lý 3.1 Với bất kỳ ( Q, c, r ) ∈ Z các khẳng định sau đây là đúng:
(i)

Hàm đa trị Sol ( Q,., r ) là usc tại c;

(ii)

Hàm đa trị Sol ( Q,., r ) là lsc tại c nếu và chỉ nếu Sol ( Q, c, r ) là duy
nhất;

(iii)

Hàm đa trị Sol ( Q,., r ) là liên tục tại c nếu và chỉ nếu Sol ( Q, c, r ) là
duy nhất;


Chứng minh
(i)

Giả sử ngược lại rằng Sol ( Q,., r ) không phải là nửa liên tục trên

tại c. Thế thì, tồn tại một tập hợp mở Ω ⊂ ¡ n có chứa Sol ( Q, c, r ) , một
k
chuỗi c k → c , và một chuỗi { x } sao cho

x k ∈ Sol ( Q, c k , r ) \ Ω

∀k ∈ N .

24


k
k
k
Từ đó { x } ⊂ Br , { x } có một dãy con { x } hội tụ tới một số x ∈ Br . Với
i

mỗi

(

)

x ∈ Br , vì x ki ∈ Sol Q, c ki , r ta có
1 T

x Qx + c ki
2

( )

T

x≥

1 ki
x
2

( )

T

( )

Qx ki + c ki

T

x ki

∀i ∈ N

Chuyển các bất đẳng thức trên qua giới hạn, ta có
1 T
1

T
T
T
x Qx + ( c ) x ≥ ( x ) Qx + ( c ) x
2
2

Điều này có nghĩa là x ∈ Sol ( Q, c, r ) ⊂ Ω , mâu thuẫn vì x k ∉ Ω với mọi i và Ω
i

là mở.
(ii) Cần. Ngược lại, giả sử rằng Sol ( Q,., r ) là nửa liên tục dưới tại c, nhưng
Sol ( Q, c, r ) không phải là duy nhất. Vì Sol ( Q, c, r ) ≠ ∅ , ở đó tồn tại
x , y ∈ Sol ( Q, c, r ) sao cho x ≠ y . Chọn c ∈ ¡

n

T
T
sao cho c = 1, c x > c y

(35)
Rõ ràng, tồn tại một lân cận mở U của x sao cho
cT x > cT y

∀x ∈ U

(36)

Với bất kỳ δ > 0 , ta cố định một số ε ∈ ( 0, δ ) và đặt cε = c + ε c . Do (23),

cε − c = ε < δ . Mục đích tiếp theo của ta là chỉ ra Sol ( Q, cε , α ) ∩ U = ∅ .

Với mỗi x ∈ Bα ∩ U , từ x , y ∈ Sol ( Q, c, r ) , do (24) ta có

25


×