Tải bản đầy đủ (.pdf) (52 trang)

Điều kiện tối ưu cần và đủ với hàm nhân tử Lagrange

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (332.41 KB, 52 trang )

TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
KHOA TOÁN
————oOo————

BÙI THỊ QUỲNH LƯU

ĐIỀU KIỆN TỐI ƯU CẦN VÀ ĐỦ
VỚI HÀM NHÂN TỬ LAGRANGE

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
Chuyên ngành

: Giải tích

HÀ NỘI, 05/2017


TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
KHOA TOÁN
————oOo————

KHÓA LUẬN TỐT NGHIỆP

ĐIỀU KIỆN TỐI ƯU CẦN VÀ ĐỦ
VỚI HÀM NHÂN TỬ LAGRANGE

Sinh viên thực hiện

: BÙI THỊ QUỲNH LƯU

Giảng viên hướng dẫn : ThS. BÙI NGỌC MƯỜI



HÀ NỘI, 05/2017


Lời cảm ơn
Trước khi trình bày nội dung chính của khóa luận, em xin bày tỏ lòng
cảm ơn tới các thầy cô khoa Toán, trường Đại Học Sư Phạm Hà Nội 2, các
thầy cô trong tổ bộ môn Giải tích cũng như các thầy cô tham gia giảng
dạy đã tận tình truyền đạt những tri thức quý báu và tạo điều kiện thuận
lợi để em hoàn thành tốt nhiệm vụ khóa học và khóa luận.
Đặc biệt, em xin bày tỏ sự kính trọng và lòng biết ơn sâu sắc tới ThS.
Bùi Ngọc Mười, người đã trực tiếp hướng dẫn, chỉ bảo tận tình giúp đỡ để
em có thể hoàn thành khóa luận này.
Do thời gian, năng lực và điều kiện bản thân còn hạn chế nên bản khóa
luận không thể tránh khỏi những sai sót. Vì vậy, em rất mong nhận được
những ý kiến góp ý quý báu của các thầy cô và các bạn.
Hà Nội, tháng 5 năm 2017
Sinh viên

Bùi Thị Quỳnh Lưu

i


Lời cam đoan

Khóa luận tốt nghiệp "Điều kiện tối ưu cần và đủ với hàm nhân
tử Lagrange" được hoàn thành do sự cố gắng, nỗ lực tìm hiểu, nghiên
cứu của bản thân cùng với sự giúp đỡ hướng dẫn tận tình của thầy Bùi
Ngọc Mười.

Tôi xin cam đoan khóa luận tốt nghiệp này không trùng lặp với kết quả
của các tác giả khác.

Hà Nội, tháng 5, năm 2017
Sinh viên

Bùi Thị Quỳnh Lưu

ii


Mục lục

Lời nói đầu

1

Một số kí hiệu

5

1 BÀI TOÁN TỐI ƯU VỚI NHỮNG RÀNG BUỘC ĐẲNG
THỨC

6

1.1

Không gian tiếp xúc . . . . . . . . . . . . . . . . . . . . . .


6

1.2

Điều kiện cần bậc nhất . . . . . . . . . . . . . . . . . . . .

9

1.3

Điều kiện tối ưu bậc hai . . . . . . . . . . . . . . . . . . . . 12
1.3.1. Điều kiện cần bậc hai . . . . . . . . . . . . . . . . . 12
1.3.2. Điều kiện đủ bậc hai . . . . . . . . . . . . . . . . . 14

1.4
2

Một số ví dụ . . . . . . . . . . . . . . . . . . . . . . . . . . 16

BÀI TOÁN TỐI ƯU VỚI RÀNG BUỘC TỔNG QUÁT 19
2.1

Điều kiện cần của cực tiểu . . . . . . . . . . . . . . . . . . 19

2.2

Điều kiện đủ của cực tiểu . . . . . . . . . . . . . . . . . . . 38

iii



Lời nói đầu
Bài toán tối ưu có ràng buộc là quá trình tối ưu hóa hàm mục tiêu
với các ẩn thỏa mãn một số điều kiện cho trước. Hàm mục tiêu là hàm
giá cả hoặc hàm năng lượng là những hàm cần giảm thiểu, hay là hàm
phần thưởng hoặc hàm tiện ích là những hàm cần tối đa hóa.
Xem xét một bài toán quy hoạch không tuyến tính hữu hạn chiều có
dạng:
minimize f (x)

(1)

điều kiện là g(x) ≤ 0, h(x) = 0, x ∈ X0 ,
trong đó X0 là tập con của Rn , g và h là hàm giá trị vector, g =
(g1 , ..., gm ) và h = (h1 , ...hr ). Khi đó, f là một hàm mục tiêu. Những
ràng buộc g(x) ≤ 0 và h(x) = 0 được gọi là những ràng buộc hàm số,
trong đó ràng buộc x ∈ X0 là một ràng buộc hình học. Ta nói gi (x) ≤ 0;
i = 1, ..., m là ràng buộc bất đẳng thức, hj (x) j = 1, ..., r là rằng buộc
đẳng thức. Một điểm x ∈ X0 đáp ứng đầy đủ những ràng buộc trên được
cho là chấp nhận được. Ta gọi C là tập điểm chấp nhận được của (1).
Phương pháp nhân tử của hàm Largrange là một cách tìm kiếm cực
đại địa phương và cực tiểu địa phương của một hàm số với ràng buộc
đẳng thức và ràng buộc bất đẳng thức trong bài toán tối ưu. Xem xét
(1) trong trường hợp tại đó X0 = Rn và định nghĩa hàm Largrange

1


2


L(x, λ, µ) với x ∈ Rn , λ ∈ Rn , µ ∈ Rn bằng cách thiết lập
m

L(x, λ, µ) = f (x) +

r

λi gi (x) +
i=1

µj hj (x).

(2)

j=1

Hoặc
L(x, λ, µ) = f (x) + λ, g(x) + µ, h(x)
trong đó λ = (λ1 , ...λm ), µ = (µ1 , ..µr ) và
Rm
+ := {v = (v1 , ..., vm )|vi ≥ 0 với i = 1, ...m}.
Ý tưởng của Largrange là thay thế bài toán ràng buộc (1) bởi một trong
những bài toán không bị ràng buộc sau:
min{L(x, λ, µ)|x ∈ Rn }.
Cụ thể là nếu f, gi , hi là hàm khả vi liên tục, x∗ là cực đại địa phương
của (1) và là một ràng buộc chính quy (nói rằng ràng buộc chính quy
Magarian-Fromovitz được đề nghị bởi O.L Mangsarian và S.Fromovitz
năm 1967) thỏa mãn tại điểm x∗ , thì tồn tại nhân tử Largrange λ∗ =




r
(λ1 , ..., λm ) ∈ Rm
+ và µ = (µ1 , ...µr ) ∈ R .

Sao cho:
m






r


∇x L(x , λ , µ ) = ∇f (x) +



µ∗j hj (x∗ ) = 0,

λ ∇gi (x ) +
i=1

(3)

j=1

trong đó ∇x L(x∗ , λ∗ , µ∗ ) dùng để chỉ đạo hàm của L(x∗ , λ∗ , µ∗ ) tại x∗ .

Lưu ý rằng nếu x∗ là cực tiểu địa phương của L(x∗ , λ∗ , µ∗ ) trên Rn thì
(3) đúng theo quy tắc Fermat. Largrange đã chỉ xem xét đến ràng buộc
đẳng thức. Trong trường hơp bao gồm ràng buộc bất đẳng thức trong
điều kiện tối ưu bậc nhất thì mới được nghiên cứu ra từ thế kỉ trước.
Điều kiện cần tối ưu bậc hai cho (1) sẽ là có nhiều điều kiện tham gia
hơn nữa. Những công thức này dựa trên đạo hàm cấp hai ∇2xx L(x∗ , λ∗ , µ∗ )


3

của L(x∗ , λ∗ , µ∗ ) tại x. Chủ yếu dựa vào công trình nghiên cứu [4], khóa
luận tốt nghiệp này nhằm mục đích nghiên cứu điều kiện tối ưu bậc
nhất và bậc hai, cả điều kiện cần và điều kiện đủ mà sẽ sử dụng nhân
tử Largrange. Chúng ta tập trung vào các bài toán quy hoạch toán học
khả vi liên tuc. Khóa luận này gồm có hai chương
Chương 1: "Bài toán tối ưu với những ràng buộc đẳng thức"
Chỉ tập trung vào ràng buộc đẳng thức, cung cấp điều kiện tối ưu bậc
nhất và bậc hai cho bài toán cổ điển và một vài ví dụ minh họa.
Chương 2: "Bài toán tối ưu với ràng buộc tổng quát"
Nghiên cứu điều kiện tối ưu bậc nhất và bậc hai cho bài toán có cả ràng
buộc đẳng thức và ràng buộc bất đẳng thức.


4


5

Bảng kí hiệu
A := B


A được xác định là B.

Rn

Không gian Ơclit thực n- chiều.

< x, y >

Phép nhân vô hướng của véc tơ, x, y ∈ Rn .

x

Chuẩn của véctơ x.

x = (x1 , x2 , ...xn )

Một vectơ x với các thành phần x1 , x2 , ...xn .

∇f (x) hoặc f (x)

Gradien hoặc đạo hàm Fre’chet của hàm
vô hướng f tại x.

∇2 f (x) hoặc f (x) Đạo hàm bậc hai của hàm số.
∇g(x) hoặc g’(x)

Ma trận Jacobi của đạo hàm Fre’chet của một
hàm vectơ g tại x.


L(x, λ)

Hàm Lagrange.

∇x L(x, λ)

Đạo hàm của L(x, λ) đối với x.

∇2xx L(x, λ)

Đạo hàm cấp hai của L(x, λ) đối với x.

C1

Lớp hàm thực khả vi liên tục trên không gian
Euclide.

PQ (x)

Phép chiếu của x vào trong tập Q.

AT

Phép chuyển vị của ma trận A.

A≥B

A − B là ma trận nửa dương.

A>B


A − B là ma trận dương.

A

Chuẩn của ma trận A.


Chương 1
BÀI TOÁN TỐI ƯU VỚI NHỮNG
RÀNG BUỘC ĐẲNG THỨC
Chương này sẽ chia làm bốn phần. Phần đầu tiên là nhắc lại một số
định nghĩa, hệ thống kí hiệu và định lý Lyusternik’s về không gian tiếp
xúc trong hình học. Phần thứ hai giải thích về điều kiên cần tối ưu bậc
nhất. Phần ba sẽ nghiên cứu về điều kiện tối ưu bậc hai. Một vài ví dụ
minh họa sẽ được đưa ra ở phần thứ tư.

1.1

Không gian tiếp xúc

Các định nghĩa

Cho hi : Rn → R (i = 1, ....r) là các hàm khả vi liên tục. Để
ngắn gọn, chúng ta nói rằng hi là các hàm C 1 . Các lớp hàm khả vi liên
tục sẽ được kí hiệu là C 1 .
Xét hệ các phương trình:
h1 (x) = 0, ........hr (x) = 0,

(1.1)


hay còn được viết là h(x) = 0 với h(x) := (h1 (x), ..., hr (x)) là một hàm
vector. Cho Q là viết tắt tập nghiệm của (1.1). Quan sát thấy rằng dưới
6


Chương 1. BÀI TOÁN TỐI ƯU VỚI NHỮNG RÀNG BUỘC ĐẲNG THỨC

7

một điều kiện quy tắc thích hợp thì Q trơn trên Rn .
Kết hợp với một điểm trên bề mặt trơn là một không gian tiếp xúc
tại điểm đó. Để hợp thức hóa các khái niệm chung, chúng ta bắt đầu
định nghĩa đường cong trên bề mặt S.
Một đường cong trên bề mặt S là tập hợp các điểm x(t) ∈ S liên tục
với tham số t sao cho a ≤ t ≤ b. Đường cong là khả vi nếu x˙ ≡

d
d(t) x(t)

tồn tại và là khả vi hai lần nếu đạo hàm bậc hai x¨(t) tồn tại.
Một đường cong x(t) a ≤ t ≤ b được nói rằng đi qua điểm x∗ nếu
x∗ = x(t∗ ) với một vài t∗ . Đạo hàm x(t)
˙
của đường cong tại x∗ được định
nghĩa là:

dx(t)
x(t) − x(t∗ )
|t=t∗ = lim∗

.
t→t
dt
t − t∗
Vì thế x(t
˙ ∗ ) là một vector trên Rn , hay là tiếp tuyến đến S tại điểm
x(t
˙ ∗) =

x(t∗ ). Như vậy sau khi tham số hóa lại và theo định nghĩa thì vector s ∈ R
được gọi là hướng tiếp tuyến đến S tại điểm x nếu tất cả τ > 0 đủ nhỏ thì
chúng ta có thể tìm ra những điểm x(τ ) ∈ S sao cho x(τ ) = x+τ s+o(τ ).
Chắc chắn rằng các hướng tiếp tuyến đến S tại x tạo thành một hình
nón. Bây giờ chúng ta xem xét vi phân tất cả những đường cong trên S
qua điểm x∗ ∈ S. Không gian tiếp xúc tại x∗ được định nghĩa là tập hợp
các tiếp tuyến có hướng tại x∗ của tất cả các đường cong vi phân đó. Ta
thấy rằng không gian tiếp xúc là một bề mặt của Rn .
Định nghĩa 1.1.1. Một điểm x∗ thỏa mãn ràng buộc h(x∗ ) = 0 được gọi
là điểm chính quy của ràng buộc nếu các vector gradien ∇h1 x∗ , ..., ∇hr x∗
độc lập tuyến tính.
Chú ý rằng nếu h là affin, h(x) = A(x) + B, điều kiện chính quy là
tương đương với A có hạng bằng r, và điều kiện này không phụ thuộc
vào x.


Chương 1. BÀI TOÁN TỐI ƯU VỚI NHỮNG RÀNG BUỘC ĐẲNG THỨC

8

Định lí 1.1.1. (Định lý Lyusternik, xem [2, p.235]). Tại một điểm chính

quy x∗ của bề mặt S được xác định bởi h(x) = 0, không gian tiếp xúc
bằng:
M = {S ∈ Rn | ∇h (x∗ ), s = 0}.
Chứng minh. Cho Ts (x∗ ) là không gian tiếp xúc đến S tại x∗ . Rõ ràng là
Ts (x∗ ) ⊂ M vậy liệu x∗ có phải là cung chính quy hay không. Thật vậy
cho mỗi S ∈ Ts (x∗ ) , theo định nghĩa có tồn tại một đường cong trên
S được cho bởi x(t) = x∗ + ts + o(t) với t ∈ R đủ nhỏ, theo khai tiển
Taylor ta có:
0 = h(x(t)) = h(x∗ ) + ts + o(t))
= (x∗ ) + t ∇h(x∗ ), s + o(t)
= 0 + t ∇h(x(∗ )), s + o(t).
Điều này nghĩa là ∇h(x∗ ), s = 0 vì thế s ∈ M .
Để chứng minh rằng S ⊂ M thì ta cần chỉ ra đó là một đường cong
trên S đi qua x∗ với đạo hàm S. Để xây dựng một đường cong như vậy
chúng ta xét phương trình:
h(x∗ + ts + ∇h(x∗ )T u(t)) = 0,

(1.2)

tại đó với t nhất định, chúng ta giải thích u(t) ∈ Rm là một đại lượng
chưa biết. Đó là một hệ phi tuyến của m phương trình và m chưa biết,
tham số m liên tục theo t.
Tại t = 0 là một nghiệm của u(0) = 0. Ma trận Jacobi của hệ đối với u
tại t = 0 là một ma trận m × n
∇h(x∗ )∇h(x∗ )T
là không suy biến bởi vì h(x∗ ) là có hạng tối đại nếu x∗ là một điểm
chính quy. Như vậy dựa vào định lý hàm ẩn, (xem [6, p.223]) đó là hàm


Chương 1. BÀI TOÁN TỐI ƯU VỚI NHỮNG RÀNG BUỘC ĐẲNG THỨC


9

chính quy khả vi liên tục u(t) trong một khoảng −a ≤ t ≤ a. Đường
cong x(t) = x∗ +ts+∇(hx∗ )T u(t) được xây dựng như là một đường cong
trên S. Bằng cách vi phân hệ (1.1.2) đối với t tại t = 0 chúng ta có được
0=


h(x(t))|t=0 = ∇h(x∗ ), s + ∇h(x∗ )∇h(x∗ )T u(0).
∂t

Theo định nghĩa của s chúng ta có ∇h(x∗ ), s = 0 tiếp theo, lại vì
∇h(x∗ )∇h(x∗ ) là không suy biến chúng ta kết luận rằng u(0)
˙
= 0. Vì
thế:
u(0)
˙
= s + ∇h(x∗ )T u(0)
˙
= s,
và đường cong đã xây dựng có đạo hàm s tại x.
Để hiểu chi tiết về không gian tiếp xúc, chúng ta tham khảo [2].

1.2

Điều kiện cần bậc nhất

Bây giờ chúng ta xem xét một trường hợp đặc biệt của những bài

toán ràng buộc khi chỉ chứa rằng buộc đẳng thức
minf (x)
h(x) = 0,

(P)

x ∈ Rn ,
với h = (h − 1, ..., hr ). Cho Q là một tập ràng buộc chấp nhận được của
(P), đó là tập nghiệm của hệ phương trình (1.1).
Nguồn gốc của điều kiện cần và đủ để một điểm là cực tiểu địa phương
phụ thuộc vào ràng buộc đẳng thức là khá đơn giản, bởi vì sự biểu diễn
của không gian tiếp xúc là đã biết. Chúng ta bắt đầu bằng việc phát
sinh điều kiện cần bậc nhất.


Chương 1. BÀI TOÁN TỐI ƯU VỚI NHỮNG RÀNG BUỘC ĐẲNG THỨC

10

Bổ đề 1.2.1. Cho x∗ là một điểm chính quy của hệ ràng buộc h(x) = 0
và một điểm cực trị địa phương (một cực đại hoặc cực tiểu) của f phụ
thuộc vào những ràng buộc đó. Thì mọi s ∈ Rn đáp ứng
∇h(x∗ ), s = 0
cũng phải thỏa mãn f (x∗ ), s = 0.
Chứng minh. Cho s là một vector bất kì trong không gian tiếp xúc với
S tại x và cho x(t) là một đường cong trơn bất kì trên bề mặt ràng buộc
đi qua x∗ với đạo hàm s tại x∗ ; đó là : x(0) = x∗ , x(0)
˙
= s và h(x(t)) = 0
cho −a ≤ 0 ≤ a với một vài a > 0.

Vì x∗ là một điểm chính quy, mặt phẳng tiếp xúc tương đương với một
tập của s thỏa mãn ∇h(x∗ ), s = 0. Tiếp đó, vì x∗ là một điểm ràng
buộc cực trị địa phương của s.
Chúng ta có:

f (x(t))|t=0 = 0,
∂t
hay tương đương với ∇f (x∗ ), s = 0.
Chứng minh của bổ đề đã hoàn thành.
Bổ đề trên cho rằng ∇f (x∗ ) trực giao với mặt phẳng tiếp xúc. Tiếp
theo chúng ta sẽ thấy rằng điều này ngụ ý rằng ∇f (x∗ ) là một tổ hợp
tuyến tính của các gradien ∇hi (x∗ ), i = 1, ...m một quan hệ dẫn đến sự
giới thiệu về nhân tử Largrange.
Chứng minh của định lý tiếp theo sẽ được đưa ra trong phần tiếp
theo.
Định lí 1.2.1. (Điều kiện cần tối ưu bậc nhất); xem [4, Theorem
1,p.224]. Cho x∗ là một điểm cực tiểu trong bài toán (P), và cho các
hàm số f (x), hi (x) là hàm khả vi liên tục trong lân cận x∗ . Khi đó chúng


Chương 1. BÀI TOÁN TỐI ƯU VỚI NHỮNG RÀNG BUỘC ĐẲNG THỨC

11

ta có thể nhận thấy rằng tồn tại λ∗0 , λ∗1 , ..., λ∗r không đồng thời bằng không
0, sao cho


r






λ∗i ∇hi (x∗ ) = 0,
λ0 ∇f (x ) +




i=1

hi (x∗ ) = 0,
i = 1, ....., r,


r



∗ 2


 (λi ) = 1.

(1.3)

i=0

Định lí 1.2.2. (Quy tắc nhân tử Lagrange; xem [4, Theorem 1,p.225])

Theo các giả thiết của Định lý 1.2.1 nếu x∗ là điểm cực tiểu chính quy
thì chúng ta có thể tìm được λ∗1 , ..., λ∗r sao cho
r


λ∗i ∇hi (x∗ ) = 0,

∇f (x ) +

(1.4)

i=1

hi (x∗ ) = 0,

i = 1, ..., r,

(1.5)

Chứng minh. Định lý này được suy ra trực tiếp từ định lý 1.2.1. Thật vậy,
r

λ∗i ∇hi (x∗ ) = 0,

vì x∗ là một điểm chính quy, λ∗0 = 0 (Nếu không thì
i=1

không phải tất cả

λ∗1 , ..., λ∗r


đồng thời bằng không ,mâu thuẫn với sự độc

lập tuyến tính của gradients ∇hi (x∗ ). Chia phương trình đầu của (1.1)
cho λ∗0 , chúng ta có được quan hệ đầu tiên trong (1.2).

Chú ý 1.2.1. Nếu Định lý 1.2.2 được chứng minh, thì định lý 1.2.1 cũng
có thể dễ dàng chứng minh. Thật vậy nếu x∗ là một điểm cực tiểu của
(P) nếu gradient ∇hi (x∗ ), i = 1, ..r, là độc lập tuyến tính, thì bằng Định
lý 1.2.2 chúng ta có thể tìm λ∗1 , ..., λ∗r sao cho 1.2 được thỏa mãn. Do đó
với λ∗0 = 1 phương trình 1.1 được thỏa mãn. Bây giờ, giả sử rằng gradien
∇hi (x∗ ); i = 1, ...r là độc lập tuyến tính. Khi đó tồn tại λ∗1 , ..., λ∗r không
r

λ∗i ∇hi (x∗ ) = 0, vậy (1.1) được thỏa

đồng thời bằng không sao cho
i=1


Chương 1. BÀI TOÁN TỐI ƯU VỚI NHỮNG RÀNG BUỘC ĐẲNG THỨC

12

mãn nếu chúng ta lựa chọn λ∗0 = 0.
Các nhân tử λ∗1 , ..., λ∗r được gọi là các nhân tử Largrange. Thực tế là
nhìn chung các nhân tử largrange chỉ được quy định bởi những điều kiên
chính quy có thể dễ dàng nhìn ra từ những ví dụ đơn giản.
Ví dụ 1.2.1. Cho f (x) = x2 , h1 (x) = (x1 − 1)2 + x22 − 1, h2 (x) =
(x1 + 1)2 + x22 − 1. Thì Q = (0, 0), thật vậy x∗ = (0, 0) là điểm cực tiểu.

Chú ý rằng các gradien ∇h1 (0, 0) = (−2, 0) và ∇h2 (0, 0) = (2, 0) là độc
lập tuyến tính, vì vậy x∗ là một điểm cực tiểu chính quy của (P). Có thể
dễ dàng thấy rằng không tồn tại λ∗1 , λ∗2 thỏa mãn (1.2).
Chúng ta sẽ xây dựng hàm Largrange
r

L(x, λ) = f (x) + (λ, h(x)) = f (x) +

λi hi (x)
i=0

n

r

được định nghĩa trong R × R . Tại đây và trong phần tiếp theo
chúng ta sử dụng vector ký hiệu là x = (x1 , ..., xn ), λ = (λ1 , λr ) và
h(x) = (h1 (x), ...., hr (x)). Thì quy tắc của nhân tử Largrange là
∇x L(x∗ , λ∗ ) = 0,

∇λ L(x∗ , λ∗ ) = 0,

trong đó ∇x L, ∇λ L là kí hiệu đạo hàm với các biến tương ứng. Biểu thức
trên tiện lợi do tính đối xứng của nó với biến x và λ. Chúng ta gọi x và
λ lần lượt là biến ban đầu và biến đối ngẫu của (P).

1.3
1.3.1.

Điều kiện tối ưu bậc hai

Điều kiện cần bậc hai

Điều kiện cần tối ưu bậc hai cho phép chúng ta loại trừ một số điểm
thỏa mãn điều cần tối ưu bậc nhất trong Định lý 1.2.2 từ những ứng
viên cho cực tiểu địa phương.


Chương 1. BÀI TOÁN TỐI ƯU VỚI NHỮNG RÀNG BUỘC ĐẲNG THỨC

13

Định lí 1.3.1. Cho x∗ là một điểm cực tiểu chính quy trong bài toán P,
cho f (x) và hi (x) là các hàm khả vi liên tục đến cấp hai trong lân cận
của x∗ , và cho λ∗ , i = 1, ...r, là nhân tử Lagrange tương ứng với x∗ . Thì
r

∇2xx L(x∗ , λ∗ )s, s

2



λ∗i ∇2 hi (x∗ ))s, s ≥ 0

(1.6)

λ∗i ∇2 hi (x∗ ), s = 0, i = 1, ..., r}.

(1.7)


= (∇ f (x ) +
i=1

với mọi
r




s ∈ S := {s| ∇ f (x ) +
i=1

Nói cách khác, ma trận ∇2xx L(x∗ , λ∗ ) là ma trận xác định không âm trong
mặt phẳng tiếp xúc S của Q tại x∗ .
Chứng minh. Cho s ∈ S bằng Định lý 1.1.1 chúng ta có thể có các
điểm x(τ ) sao cho x∗ + τ s − x(τ ) = o(τ ). Từ đó ∇x L(x∗ , λ∗ ) = 0 và
∇λ L(x∗ , λ∗ ) = 0 bằng cách chọn λ∗ chúng ta có
f (x∗ ) ≤ f (x(τ )),
= L(x(τ ), λ∗ )
= L(x∗ , λ∗ ) + ∇x L(x∗ λ∗ , x(τ ) − x∗ )
+ ∇2xx L(x∗ , λ∗ (x(τ ) − x∗ , x(τ ) − x∗ ) /2 + o(τ 2 )
= f (x∗ ) + (τ 2 /2) ∇2xx L(x∗ , λ∗ )s, s + o(τ 2 ),

vì vậy với τ đủ nhỏ. Kết quả ∇2xx L(x∗ , λ∗ )s, s ≥ 0. Như vậy chúng ta
chứng minh rằng (1.3.1) có giá trị cho tất cả s với tính chất (1.3.2).


Chương 1. BÀI TOÁN TỐI ƯU VỚI NHỮNG RÀNG BUỘC ĐẲNG THỨC

1.3.2.


14

Điều kiện đủ bậc hai

Điều kiện đủ bậc hai tiếp theo đảm bảo rằng một điểm thỏa mãn
dạng củng cố của điều kiện đưa ra trong Định lý 1.3.1 là một cực tiểu
địa phương.
Định lí 1.3.2. Cho hi (x∗ ) = 0, i = 1, ..., r, cho các hàm số f (x)
và hi (x) là khả vi liên tục đến cấp hai trong lân cận của x∗ , và cho
∇hi (x∗ ), i = 1, ..., r là độc lập tuyến tính. Hơn nữa, cho điều kiện cần
của cực tiểu: ∇x L(x∗ , λ∗ ) = 0, ∇λ L(x∗ , λ∗ ) = 0 được thỏa mãn và
∇2xx L(x∗ , λ∗ )s, s > 0
với tất cả s = 0 sao cho hi (x∗ , λ∗ ), s = 0, i = 1, ..., r. Khi đó x∗ là cực
tiểu địa phương trong bài toán (P). Nói cách khác nếu x∗ thỏa mãn điều
kiện cần tối ưu bậc nhất và ma trận ∇2xx L(x∗ , λ∗ ) là ma trận xác định
dương trong mặt phẳng tiếp xúc S, thì x∗ là điểm cực tiểu.
Chứng minh. Chúng ta lập luận bằng phản chứng. Giả sử rằng x∗ không
phải một cực tiểu địa phương. Thì khi đó tồn tại dãy y k của điểm chấp
nhận được sao cho y k → x∗ và f (y k ) ≥ f (x∗ ). Nhưng
y k − x∗
s = k
.
y − x∗
k

Bởi vì sk = 1 với mỗi k, không mất tính tổng quát ta giả sử rằng
lim sk = s tại đó s ∈ Rn và s = 1. Theo khai triển Taylor ta có

k→∞


hi (y k ) = hi (x∗ ) + ∇hi (x∗ ), y k − x∗ + o( y k − x∗ ).
Vì hi (y k ) = hi (x∗ ) = 0 với i = 1, ..., r, chia cả hai vế của phương trình
cuối cho y k − x∗ và cho k → ∞, ta có
hi (x∗ ), s = 0, i = 1, ..., r.


Chương 1. BÀI TOÁN TỐI ƯU VỚI NHỮNG RÀNG BUỘC ĐẲNG THỨC

15

Theo giả định của chúng ta
r






λ∗ , ∇hi (x∗ ) = 0.

∇x L(x , λ ) = ∇f (x ) +

(1.8)

i=1

Với mỗi i ∈ 1, .., r theo khai triển Taylor ta có
0 = hi (y k ) = hi (x∗ ) + ∇hi (x∗ ), y k − x∗
1

+ ∇2 hi (x∗ )(y k − x∗ ), y k − x∗ + o( y k − xk 2 ),
2

(1.9)


0 ≥ f (y k ) − f (x∗ ) = ∇f (x∗ ), y k − x∗
1
+ ∇2 f (x∗ )(y k − x∗ ), y k − x∗ + o( y k − xk 2 ).
2
(1.10)
Nhân (1.9) với λ∗ và cộng kết quả vào (1.10), kết hợp với (1.8) ta có
0≥

1 2
∇xx L(x∗ , λ∗ )(y k − x∗ ), y k − x∗ + o( y k − xk 2 ).
2

Chia cả hai vế của (1.11) cho y k − x∗
đối với k

2

(1.11)

chúng ta có quan hệ lớn hơn

1 2
( y k − x∗ 2 )


∗ k k
0 ≥ ∇xx L(x , λ )s , s +
.
2
y k − x∗ 2

Cho k → ∞, theo bất đẳng thức cuối cùng chúng ta có thể suy luận
rằng
∇2xx L(x∗ , λ∗ )s, s ≤ 0
điều này mâu thuẫn vói giả thiết của định lý. Chứng minh được hoàn
thành.


Chương 1. BÀI TOÁN TỐI ƯU VỚI NHỮNG RÀNG BUỘC ĐẲNG THỨC

1.4

16

Một số ví dụ

Bây giờ chúng ta sẽ trình bày một số ví dụ minh họa.
Ví dụ 1.4.1. Xem xét bài toán
x1 x2 + x2 x3 + x3 x1

minimize

x1 + x2 + x3 = 3.

điều kiện là


Dế dàng để thấy rằng điều kiện chính quy được thỏa mãn tại điểm bất
kỳ.
Do đó điều kiện cần tối ưu trong định lý 1.2.1 trở thành
x2 + x3 + λ = 0,
x1 + x3 + λ = 0,
x1 + x2 + λ = 0.
Đây là ba phương trình cùng với phương trình ràng buộc đưa ra bốn
phương trình có thể giải được với bốn ẩn x1 , x2 , x3 , λ. Nghiệm duy nhất
là: x1 = x2 = x3 = 1, λ = −2. Do đó bài toán đưa ra có duy nhất một
điểm được nghi ngờ là cực tiểu địa phương.
Ví dụ 1.4.2. Xem xét bài toán
n

xi

minimize
i=1
n

x2i = 1.

Điều kiện là
i=1

Hàm lagrange là
n

L(x, λ) =


n

x2i − 1).

xi + λ(
i=1

i=1


Chương 1. BÀI TOÁN TỐI ƯU VỚI NHỮNG RÀNG BUỘC ĐẲNG THỨC

17

Vì điều kiện chính quy là chắc chắn được thỏa mãn tại mọi điểm chấp
nhận được ,điều kiện cần tối ưu trong định lý 1.2.2 cho chúng ta hệ

∂L(x,λ)



∂x1




∂L(x,λ)




 ∂x2
...




∂L(x,λ)


∂xn




 ∂L(x,λ)
∂λ

= 1 + 2λx1 = 0
= 1 + 2λx2 = 0
= ...
= 1 + 2λxn = 0
n
2
i=1 xi

=

− 1 = 0.

1

< 0 và
=
−2λ

n

x∗2
=
= ... =
i = 1 nó
i=1

−1
− n
. Trong bài toán này một điều phải có là
cho ta x∗i = √ , λ =
2
n
Giải hệ này ta có

x∗1

x∗2

x∗n

n

x2i = 1, vì vậy ∇h(x∗ ) = (−2, −2, ..., −2)T . Vì thế mặt phẳng


h(x) =
i=1

n


n

tiếp xúc S tại x là S = {s ∈ R |

si = 0}. Lưu ý rằng
i=1

√

n
2

∂ 2 L(x∗ , λ∗ ) 
=
0
∂x2
0
Dễ dàng thấy rằng ma trận

∂ 2 L(x∗ ,λ∗ )
∂x2




0

...

0

n
2

...


.
0
√ 

0

...



n
2

là ma trận xác định dương. vậy

với mỗi s ∈ S\{0} ∇2xx L(x∗ , λ)s, s > 0. Vì thế x∗ là điểm cực tiểu địa
phương theo Định lý 1.2.2.
Ví dụ 1.4.3. Xét bài toán

minimize
Điều kiện là

x1 + x2 + x23
x1 = 1,
x21 + x22 = 1.


Chương 1. BÀI TOÁN TỐI ƯU VỚI NHỮNG RÀNG BUỘC ĐẲNG THỨC

18

Dễ dàng để kiểm tra rằng điểm cực tiểu duy nhất là x∗ = (x∗1 , x∗2 , x∗3 ) =
(1, 0, 0). Hàm Lagrange tương ứng là
L(x, λ) = x1 + x2 + x23 + λ1 (1 − x1 ) + λ2 (1 − x21 + x22 ).
Quan sát thấy rằng
∂L ∗
(x , λ1 , λ2 ) = 1
∂x22
Vậy thì

∂L
∂x22

với mọiλ1 , λ2 .

không bị triệt tiêu tại điểm tối ưu. Để giải thích điều

này ta có: Cho h1 (x) = x1 − 1, h2 (x) = x21 + x22 − 1, chúng ta có
∇h1 (x∗ )


=

(1, 0, 0), ∇h2 (x∗ ) = (2, 0, 0). Những gradient đó là độc

lập tuyến tính. Tuy nhiên x∗ = (1, 0, 0) vẫn là một điểm cực tiểu. Như
vậy chúng ta đã được thấy một vài điều kiện cần tối ưu trong Định lý
1.2.4 không được thỏa mãn tại điểm cực tiểu.


Chương 2
BÀI TOÁN TỐI ƯU VỚI RÀNG
BUỘC TỔNG QUÁT
Trong chương này chúng ta sẽ xem xét các bài toán tổng quát của
quy hoạch không tuyến tính.
Cho f, gi , i = 1..., m; hj , j = 1, ..., r là các hàm thực khả vi liên tục
xác định trên Rn . Bây giờ chúng ta sẽ xem xét bài toán
minf (x)
gi (x) ≤ 0, i = 1, ..., m,

(P 1)

hj (x) = 0, j = 1, ..., r.
Phần 2.1 dưới đây sẽ giới thiệu điều kiện cần của bậc nhất và bậc
hai những điều kiện mà được xây dựng dựa trên các ràng buộc hạn chế
độc lập tuyến tính (LICQ) và ràng buộc hạn chế Magasarian-Fromovitz
(MFCQ). Điều kiện cần tối ưu sẽ được giới thiệu trong phần 2.2.

2.1


Điều kiện cần của cực tiểu

Cho C := {x ∈ Rn |gi (x) ≤ 0, i = 1, .., m, hj (x) = 0, j = 1, .., r} là
một tập ràng buộc (một tập chấp nhận được) và Q := {x ∈ Rn |hj (x) =
0, j = 1, .., r}. Với bất kì điểm x0 chấp nhận được chúng ta giới thiệu
19


Chương 2. BÀI TOÁN TỐI ƯU VỚI RÀNG BUỘC TỔNG QUÁT

20

tập các chỉ số hoạt với ràng buộc bất đẳng thức là:
I ∗ (x0 ) := {i|gi (x0 ) = 0, i = 1, ..., m}
và tập hợp chỉ số không hoạt I(x0 ) := {1, ..m}\I ∗ (x0 ).
Bằng việc chúng ta xem bất kì ràng buộc đẳng thức hi (x) = 0 như
là hoạt tại điểm chấp nhận được bất kì. Ràng buộc hoạt tại một điểm
chấp nhận được x hạn chế một miền chấp nhận được trong lân cận của
x, mặt khác hạn chế không hoạt không có ảnh hưởng gì trong lân cận
của x. Vì thế trong khi nghiên cứu về tính chất của điểm cực tiểu địa
phương chúng ta có thể chỉ tập trung chú ý vào ràng buộc hoạt.
Định lí 2.1.1. (Điều kiện cần tối ưu bậc nhất, Karush-Jonhs); xem [4,
Theorem 1,p.271]) Cho x∗ là một điểm cực tiểu địa phương trong P(1).
Khi đó chúng ta có thể tìm λ∗0 , λ∗i , i ∈ I ∗ (x∗ ), µ∗j , j = 1, ..., r sao cho
m

(i)

λ∗0 ∇f (x∗ )


r

λ∗i ∇gi (x∗ )

+
i=1

µ∗j (x∗ ) = 0,

+
j=1

(ii) λ∗i gi (x∗ ) = 0, i ∈ 1, ..., m,

(2.1)

r

(iii)

λ∗2
0

λ2i

+
i∈I∗(x∗ )




∗ ∗
µ∗2
j > 0, λ0 ≥ 0, λi ≥ 0, i ∈ I (x ).

+
j=1

Chứng minh. Đầu tiên chúng ta sẽ xét trường hợp khi {∇hj (x∗ )|j =
1, .., r} là độc lập tuyến tính, khi đó sẽ tồn tại µ∗1 , ..., µ∗r không đồng thời
bằng 0 sao cho

r


j=1 λi ∇hj (x )

= 0. Bây giờ đặt λ∗0 = λ∗i = 0, i ∈ I ∗ (x∗ ),

ta có (i) và (ii). Thứ hai nếu {∇hj (x∗ )|j = 1, .., r} là độc lập tuyến tính.
Bằng định lý 1.2, một vector s ∈ TQ (x∗ ) (hình nón tiếp xúc của Q tại x∗ )
nếu và chỉ nếu ∇hj (x∗ ), s = 0, j = 1, .., r. Tiếp theo chúng ta đi xây
dựng hai tập trong Rm+r+1 và kí hiệu các thành phần của z ∈ Rm+r+1
là z0 , z1 , .., zm+r :
A := { z ∈ Rm+r+1 |z0 = ∇gi (x∗ ), s , i ∈ I ∗ (x∗ ),


×