Tải bản đầy đủ (.pdf) (50 trang)

Phương pháp hàm phạt cho bài toán cực trị có điều kiện

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.18 MB, 50 trang )

ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC SƯ PHẠM
——————————–

ĐOÀN THỊ HOÀNG TRANG

PHƯƠNG PHÁP HÀM PHẠT CHO BÀI TỐN
CỰC TRỊ CĨ ĐIỀU KIỆN

LUẬN VĂN THẠC SĨ TOÁN HỌC

ĐÀ NẴNG - NĂM 2018


ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC SƯ PHẠM
——————————–

ĐOÀN THỊ HOÀNG TRANG

PHƯƠNG PHÁP HÀM PHẠT CHO BÀI TỐN
CỰC TRỊ CĨ ĐIỀU KIỆN
Chun ngành: Tốn giải tích
Mã số: 8.46.01.02

LUẬN VĂN THẠC SĨ TOÁN HỌC

Người hướng dẫn khoa học:
TS. Phạm Quý Mười

ĐÀ NẴNG - NĂM 2018




LỜI CAM ĐOAN

Tơi xin cam đoan đây là cơng trình nghiên cứu của riêng tôi. Các số
liệu, kết quả nêu trong luận văn là trung thực và chưa từng được ai cơng
bố trong bất kỳ cơng trình nghiên cứu nào khác.
Tác giả

Đoàn Thị Hoàng Trang


LỜI CẢM ƠN

Lời đầu tiên của luận văn tác giả xin gửi lời cảm ơn sâu sắc tới thầy
giáo hướng dẫn TS. Phạm Quý Mười đã tận tình hướng dẫn tác giả trong
suốt quá trình thực hiện để tác giả có thể hồn thành được luận văn này.
Tác giả cũng xin gửi lời cảm ơn chân thành nhất đến tất cả các thầy
cơ giáo đã tận tình dạy bảo tác giả trong suốt thời gian học tập của
khóa học.
Đồng thời, tác giả cũng xin gửi lời cảm ơn đến các anh chị em trong
lớp Tốn giải tích K32 đã nhiệt tình giúp đỡ tác giả trong quá trình học
tập tại lớp.
Tác giả
Đoàn Thị Hoàng Trang




MỤC LỤC

MỞ ĐẦU . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
CHƯƠNG 1. KIẾN THỨC CHUẨN BỊ . . . . . . . . . . . . . . . . . . . . . 3
1.1. Các kí hiệu đại số

................................................3

1.2. Các kí hiệu tơpơ

................................................. 5

1.3. Tập mở, tập đóng và tập compact
1.4. Hàm liên tục

................................... 6

....................................................6

1.5. Hàm khả vi liên tục

.............................................. 7

1.6. Định lý giá trị trung bình và cơng thức Taylor
1.7. Định lí hàm ẩn

......................... 8

.................................................. 9

1.8. Tập lồi và hàm lồi


. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

CHƯƠNG 2. BÀI TỐN TỐI ƯU CĨ ĐIỀU KIỆN CHO
BỞI PHƯƠNG TRÌNH VÀ BẤT PHƯƠNG TRÌNH. . . . .11
2.1. Tổng quan bài tốn tối ưu có điều kiện

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.2. Bài tốn tối ưu có điều kiện cho bởi phương trình

. . . . . . . . . . . . . . . . . . . . . .12

2.3. Bài tốn tối ưu có điều kiện cho bởi phương trình và bất phương trình

. . . . . 15

CHƯƠNG 3. PHƯƠNG PHÁP HÀM PHẠT . . . . . . . . . . . . . . 17
3.1. Phương pháp hàm phạt cho bài toán (ECP)

. . . . . . . . . . . . . . . . . . . . . . . . . . 17

3.2. Phương pháp hàm phạt cho bài toán (ICP)

. . . . . . . . . . . . . . . . . . . . . . . . . . . 21

Kết luận . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
TÀI LIỆU THAM KHẢO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34


DANH MỤC CÁC KÝ HIỆU


Ký hiệu
Rn
λi
ei
|·|
∂f (x)/∂xi

φ
x∗
L(x, λ)

Tên tiếng Anh
n-dimensional vectors
real eigenvalues
real eigenvectors
standard Euclidean norm
partial derivative
gradient
implicit function
local minimum
Lagrange function

Ý nghĩa
không gian các vector thực n chiều
các giá trị riêng thực
các vector riêng thực
chuẩn Euclide
các đạo hàm riêng theo biến xi
gradient

hàm ẩn
cực tiểu địa phương
hàm số Lagrange


DANH MỤC CÁC THUẬT NGỮ

Từ viết tắt Thuật ngữ tiếng Anh
CP
constrained problem
ECP
equality constrained
problem
ICP
inequality constrained
problem
NLP
nonlinear programming
NDP
nondifferentiable problem
QP
quadratic programming

Thuật ngữ tiếng Việt
bài tốn cực trị có điều kiện
bài tốn có điều kiện cho bởi
phương trình
bài tốn có điều kiện cho bởi
bất phương trình
bài tốn quy hoạch phi tuyến tính

bài tốn khơng khả vi
bài tốn quy hoạch tồn phương


1

MỞ ĐẦU

1. Lý do chọn đề tài
Phương pháp hàm phạt là một phương pháp được dùng để tìm nghiệm
cho bài tốn cực trị có điều kiện. Ý tưởng chính của phương pháp là chuyển
việc giải bài tốn cực trị có điều kiện thơng qua việc giải các bài tốn cực
trị tự do. Các loại hàm phạt thường dùng là hàm phạt điểm ngoài, hàm
phạt điểm trong, hàm phạt Lagrange. Trong chương trình tốn đại học,
phương pháp này hầu như chưa được giới thiệu. Hơn nữa, hầu hết các giáo
trình tiếng Việt, chưa trình bày một cách đầy đủ về cơ sở lý thuyết của
phương pháp hàm phạt.
Các bài toán dạng này thường xuất hiện trong các tài liệu, giáo trình
dành cho học viên cao học. Vì vậy, việc nắm vững lý thuyết về bài tốn
cực trị có điều kiện và các phương pháp giải là cần thiết cho học viên, giúp
học viên có cái nhìn tổng quan và mạch lạc hơn đối với vấn đề cực trị của
hàm nhiều biến. Việc nắm chắc cở sở lý thuyết về bài toán cực trị có điều
kiện và các phương pháp giải cũng giúp cho học viên có khả năng giải và
sáng tạo ra các bài tốn mới.
Với mong muốn tìm hiểu sâu hơn về bài tốn cực trị có điều kiện, cũng
như các phương pháp hàm phạt để giải các bài toán đó; được sự đồng ý
hướng dẫn của thầy giáo TS. Phạm Quý Mười, em đã chọn đề tài: “Phương
pháp hàm phạt cho bài tốn cực trị có điều kiện” cho luận văn thạc sĩ của
mình.
2. Mục đích nghiên cứu

- Nắm được bài tốn cực trị có điều kiện, định nghĩa và điều kiện cần
và đủ của cực trị.
- Phương pháp hàm phạt và ứng dụng để giải bài toán cực trị.
- Sáng tạo được bài toán mới vận dụng phương pháp này.


2

3. Đối tượng và phạm vi nghiên cứu
Phương pháp hàm phạt giải bài tốn cực trị trong hình học và đại số
trong chương trình tốn ở cấp đại học và trong một số ứng dụng.
4. Phương pháp nghiên cứu
Nghiên cứu các tài liệu liên quan đến đề tài, bao gồm các tài liệu trong
và nước ngoài. Trao đổi, thảo luận với cán bộ hướng dẫn.
5. Ý nghĩa khoa học và thực tiễn
Tổng hợp tài liệu để có một báo cáo tổng quan khá đầy đủ về phương
pháp hàm phạt cho bài tốn cực trị có điều kiên cũng như phương pháp
giải các bài tốn đó.
6. Cấu trúc luận văn
Luận văn gồm 3 chương:
Chương 1: Trong chương này, trình bày một số kí hiệu, định nghĩa,
định lí liên quan đến luận văn. Cụ thể, định nghĩa tập mở, tập đóng, tập
compact, tập lồi và một số định lí quan trọng như định lí giá trị trung
bình và đa thức Taylor.
Chương 2: Chương này trình bày một số bài tốn tối ưu có điều kiện
cho bởi phương trình và bất phương trình.
Chương 3: Trình bày phương pháp hàm phạt, nêu các hàm phạt khả
vi, khơng khả vi của bài tốn cực trị có điều kiện cho bởi phương trình và
bất phương trình.



3

CHƯƠNG 1

KIẾN THỨC CHUẨN BỊ

Trong chương này, trình bày một số kí hiệu, các định nghĩa tập mở, tập
đóng, tập compact, tập lồi và một số định lí quan trọng như định lí giá trị
trung bình và đa thức Taylor.
1.1. Các kí hiệu đại số
Chúng ta kí hiệu R là trường số thực và Rn là không gian gồm tất cả các
vector thực n chiều. Cho bất kỳ tập con S ⊂ R bị chặn trên (chặn dưới),
chúng ta kí hiệu sup S (inf S) là cận trên nhỏ nhất (cận dưới lớn nhất) của

S . Nếu S không bị chặn trên (dưới), chúng ta viết sup S = ∞ (inf S =
−∞). Trong luận văn này, mỗi vector được xem xét là một vector cột. Phép
chuyển vị của ma trận A cỡ m × n được kí hiệu là A′ . Một vector x ∈ Rn
được xem như một ma trận cỡ n × 1, và do đó x′ là một ma trận cỡ 1 × n
hoặc vector hàng. Nếu x1 , ..., xn là các tọa độ của vector x ∈ Rn , ta viết
x = (x1 , x2 , ..., xn )T . Chúng ta cũng viết
x ≥ 0 nếu xi ≥ 0, ∀i = 1, ..., n,

x ≤ 0 nếu xi ≤ 0, ∀i = 1, ..., n.

Một ma trận đối xứng A cỡ n × n được gọi là nửa xác định dương nếu

x′ Ax ≥ 0, ∀x ∈ Rn . Trong trường hợp này chúng ta viết
A ≥ 0.


Một ma trận đối xứng A được gọi là xác định dương nếu x′ Ax > 0, ∀x ∈
Rn , x = 0 và viết

A > 0.
Chúng ta biết rằng một ma trận A đối xứng cỡ n × n có n giá trị

riêng thực γ1 , γ2 , ..., γn và tương ứng có n vector riêng thực khác không


4

e1 , e2 , ..., en đôi một trực giao. Khi đó, ta có
(1.1)

γx′ x ≤ x′ Ax ≤ Γx′ x, ∀x ∈ Rn ,

trong đó

γ = min{γ1 , ..., γn }, Γ = max{γ1 , ..., γn }.
Cho x là vector riêng ứng với giá trị riêng Γ(γ), bất phương trình ở
bên phải (trái) trong cơng thức (1.1) sẽ trở thành phương trình. Do đó,
A > 0 (A ≥ 0), nếu và chỉ nếu các giá trị riêng của A là dương (khơng
âm).

Nếu A xác định dương thì tồn tại duy nhất một ma trận xác định dương
có bình phương bằng A. Đây là ma trận có cùng các vector riêng như ma
trận A và có giá trị riêng bằng căn bậc hai giá trị riêng của A. Chúng ta
kí hiệu ma trận này là A1/2 .
Cho A và B là hai ma trận vuông và C là một ma trận có kích thước
phù hợp. Đẳng thức thường được sử dụng:


(A + CBC ′ )−1 = A−1 − A−1 C(B −1 + C ′ A−1 C)−1 C ′ A−1

là đúng nếu tất cả các ma trận nghịch đảo xuất hiện ở trên tồn tại. Đẳng
thức có thể được chứng minh bằng cách nhân phía bên phải bởi (A +
CBC ′ ).
Xét một ma trận vng M có dạng

M=

AB
CD

.

Khi đó, ta có:

M −1 =
trong đó

Q − QBD−1
−D−1 CQ D−1 + D−1 CQBD−1

,

Q = (A − BD−1 C)−1 ,
với điều kiện tất cả các ma trận nghịch đảo xuất hiện ở trên tồn tại. Chứng
minh được thực hiện bằng cách nhân M với biểu thức cho M −1 nêu trên.



5

1.2. Các kí hiệu tơpơ
Chúng ta sẽ sử dụng chuẩn Euclide trong khơng gian Rn và được kí hiệu
là | · |, tức là, đối với một vector x ∈ Rn , chúng ta viết

|x| = x′ x.

Chuẩn Euclide của một ma trận A cỡ m × n sẽ được kí hiệu là | · |. Nó

được xác định bởi

|Ax|
= max
|A| = max
x=0
x=0 |x|



x′ A′ Ax

.
x′ x

Từ công thức (1.1), ta có

|A| =

giá trị riêng lớn nhất của(A′ A).


Nếu ma trận A là đối xứng, và λ1 , ..., λn là các giá trị riêng (thực) của

A, thì các giá trị riêng của A2 là λ21 , ..., λ2n , và chúng ta thu được
|A| = max{|λ1 |, ..., |λn |}.

Một dãy các vectơ x0 , x1 , ..., xk , ..., trong Rn , được kí hiệu là {xk }, được

gọi là hội tụ đến một vector x nếu |xk − x| → 0 khi k → ∞ (có nghĩa
là, với mọi ǫ > 0, luôn tồn tại một số tự nhiên N sao cho với mọi k ≥ N
chúng ta có |xk − x| < ǫ). Nếu {xk } hội tụ đến x, chúng ta viết xk → x

hoặc lim xk = x. Tương tự, cho một dãy các ma trận {Ak } cỡ m × n,
k→∞

chúng ta viết Ak → A hoặc lim Ak = A nếu |Ak − A| → 0 khi k → ∞.
k→∞

Sự hội tụ của cả dãy vector và ma trận tương đương với sự hội tụ của mỗi
dãy các tọa độ hoặc các phần tử cùng một vị trí của chúng.

Cho dãy {xk }, dãy con {xk |k ∈ K} tương ứng với một tập chỉ số vô

hạn K ⊂ N được kí hiệu {xk }K . Một vector x được gọi là một điểm giới
hạn của dãy {xk } nếu có một dãy con {xk }K hội tụ đến x.

Mọi dãy các số thực {rk } đơn điệu tăng (giảm), tức là thỏa mãn rk ≤

rk+1 (rk ≥ rk+1 ) với mọi k , phải hội tụ đến một số thực hoặc +∞ (−∞).
Trong trường hợp sau cùng chúng ta viết lim rk = +∞ ( lim rk = −∞).

k→∞

k→∞

Cho bất kì dãy số thực bị chặn {rk }, chúng ta xét dãy {sk } trong đó

sk = sup{ri |i ≥ k}. Vì dãy này đơn điệu giảm và bị chặn dưới, nên nó có


6

giới hạn, được gọi là giới hạn trên của {rk } và được kí hiệu bởi lim sup rk .
k→∞

Chúng ta định nghĩa tương tự cho giới hạn dưới của {rk } và kí hiệu bằng

lim inf rk . Nếu {rk } khơng bị chặn trên, chúng ta có lim sup rk = +∞,
k→∞

k→∞

và nếu nó khơng bị chặn dưới, chúng ta có lim inf rk = −∞.
k→∞

1.3. Tập mở, tập đóng và tập compact

Cho một vector x ∈ Rn và một số thực ǫ > 0, chúng ta kí hiệu hình cầu
mở với tâm tại x với bán kính ǫ > 0 bởi S(x; ǫ), tức là,

S(x; ǫ) = {z||z − x| < ǫ}.


(1.2)

Định nghĩa 1.3.1. Một tập con S của Rn được gọi là tập mở, nếu với
mọi vector x ∈ S , tồn tại một ǫ > 0 sao cho S(x; ǫ) ⊂ S .
Nếu S là tập mở và x ∈ S , thì S(x; ǫ) ⊂ S được gọi là một lân cận của
x. Phần trong của một tập S ⊂ Rn là tập tất cả các phần tử x ∈ S sao

cho tồn tại ǫ > 0 thỏa mãn S(x; ǫ) ⊂ S .

Định nghĩa 1.3.2. Một tập con S được gọi là tập đóng nếu và chỉ nếu

phần bù của nó trong Rn là tập mở.
Phát biểu một cách tương đương khác: S được gọi là tập đóng nếu và
chỉ nếu mỗi dãy xk , với các phần tử trong S , hội tụ đến một điểm x thì x
thuộc về S .
Định nghĩa 1.3.3. Một tập con S của Rn được gọi là tập compact nếu
và chỉ nếu nó là tập đóng và bị chặn (tức là, nó là tập đóng và tồn tại một
số M > 0 sao cho |x| ≤ M, ∀x ∈ S ).
Một kết quả quan trọng nữa là nếu S0 , S1 , ..., Sk , ... là một dãy các tập
compact khác rỗng trong R sao cho Sk ⊃ Sk+1 với mọi k thì giao
n

là một tập khác rỗng và compact.



Sk

k=0


1.4. Hàm liên tục
Một hàm f là một ánh xạ từ một tập con khác rỗng S1 ⊂ Rn vào một
tập S2 ⊂ Rm , được kí hiệu bởi f : S1 → S2 . Hàm f được gọi liên tục tại

x ∈ S1 nếu với mọi ǫ > 0 luôn tồn tại δ > 0 sao cho với mọi y thỏa mãn


7

|y − x| < δ và y ∈ S1 ta có |f (y) − f (x)| < ǫ.

Hàm f được gọi là liên tục trên S1 (hoặc đơn giản là liên tục) nếu nó

liên tục tại mỗi điểm x ∈ S1 . Nếu S1 , S2 , và S3 là các tập khác rỗng và
f1 : S1 → S2 và f2 : S2 → S3 là các hàm, thì hàm f2 ◦ f1 : S1 → S3 được
xác định bởi (f2 ◦ f1 )(x) = f2 [f1 (x)] được gọi là hàm hợp của f1 và f2 .
Nếu f1 : Rn → Rm và f2 : Rm → Rp là liên tục, khi đó f2 ◦ f1 cũng liên
tục.

1.5. Hàm khả vi liên tục
Một hàm giá trị thực f : X → R trong đó X ⊂ Rn là một tập mở được

goị là khả vi liên tục nếu các đạo hàm riêng ∂f (x)/∂x1 , ..., ∂f (x)/∂xn tồn
tại, với mọi x ∈ X và là các hàm liên tục tại x.

Trong trường hợp này chúng ta viết f ∈ C 1 trên X . Một cách tổng
quát, chúng ta viết f ∈ C p trên X cho một hàm f : X → R nếu tất cả

các đạo hàm riêng của f bậc p tồn tại và liên tục trên X . Nếu f ∈ C p trên

Rn , thì chúng ta viết đơn giản là f ∈ C p . Nếu f ∈ C 1 trên X , gradient
của f tại một điểm x ∈ X được định nghĩa là vector cột
 ∂f (x) 
∂x1

..
.


∇f (x) = 

∂f (x)
∂xn

∇2 f (x) =

∂ 2 f (x)
∂xi ∂xj


.

Nếu f ∈ C 2 , ma trận Hessian của f tại x được định nghĩa là ma trận
đối xứng cỡ n × n có ∂ 2 f (x)/∂xi ∂xj là phần tử nằm ở hàng i cột j , tức
là:

.

Nếu f : X → Rm trong đó X ⊂ Rn , thì f được biểu diễn bởi vector
cột của các hàm thành phần f1 , f2 , ..., fm :



f1 (x)
f (x) =  ...  .
fm (x)
Nếu X là tập mở, chúng ta viết f ∈ C p trên X nếu f1 ∈ C p , f2 ∈

C p , ..., fm ∈ C p trên X . Chúng ta sẽ sử dụng kí hiệu

∇f (x) = [∇f1 (x) · · · ∇fm (x)].


8

Như vậy, ma trận ∇f cỡ n×m có các cột là các gradient ∇f1 (x), ..., ∇fm (x).
Thỉnh thoảng chúng ta sẽ cần xem xét các gradient của các hàm số ứng

với một biến số nào đó. Kí hiệu sẽ như sau:
Nếu f : Rn+r → R là một hàm giá trị thực của (x, y) trong đó x =

(x1 , ..., xn ) ∈ Rn , y = (y1 , ..., yr ) ∈ Rr , chúng ta viết

 ∂f (x,y) 
∂x1


∇x f (x, y) = 

∇xx f (x, y) =


..
.

∂f (x,y)
∂xn
∂f (x,y)
∂xi ∂xj



 , ∇y f (x, y) = 

, ∇xy f (x, y) =

∇yy f (x, y) =

∂f (x,y)
∂yi ∂yj

∂f (x,y)
∂y1

..
.

∂f (x,y)
∂yr
∂f (x,y)
∂xi ∂yj





,

,

.

Nếu f : Rn+r → Rm , f = (f1 , ..., fm ), chúng ta viết

∇x f (x, y) = [∇x f1 (x, y) . . . ∇x fm (x, y)],
∇y f (x, y) = [∇y f1 (x, y) . . . ∇y fm (x, y)].

Cho h : Rr → Rm và g : Rn → Rr , xét hàm f : Rn → Rm được xác

định bởi

f (x) = h[g(x)].
Khi đó nếu h ∈ C p và g ∈ C p , chúng ta cũng có f ∈ C p và

∇f (x) = ∇g(x)∇h[g(x)].

1.6. Định lý giá trị trung bình và cơng thức Taylor
Cho f : X → R, và f ∈ C 1 trên tập mở X ⊂ Rn . Giả sử rằng X chứa
đoạn thẳng nối hai điểm x, y ∈ X . Định lý giá trị trung bình khẳng định
rằng tồn tại một số thực α với 0 < α < 1 sao cho

f (y) = f (x) + ∇f [x + α(y − x)]′ (y − x).


Nếu thêm điều kiện f ∈ C 2 , thì tồn tại một số thực α với 0 < α < 1

sao cho

1
f (y) = f (x) + ∇f (x)′ (y − x) + (y − x)′ ∇2 f [x + α(y − x)](y − x).
2


9

Cho f : X → Rm và f ∈ C 1 trên tập mở X ⊂ Rn . Giả sử X chứa đoạn
thẳng nối hai điểm x, y ∈ X . Công thức Taylor bậc nhất tại x được cho

bởi phương trình

1

f (y) = f (x) +
0

∇f [x + α(y − x)]′ (y − x)dα.

Nếu thêm điều kiện f ∈ C 2 , thì chúng ta có
ξ

1

f (y) = f (x)+∇f (x)′ (y −x)+


0

( (y −x)′ ∇2 f [x+α(y −x)](y −x)dα)dξ.
0

1.7. Định lí hàm ẩn
Xét hệ n phương trình với m + n biến

h(x, y) = 0,
trong đó h : Rm+n → Rn , x ∈ Rm , và y ∈ Rn . Các định lí hàm ẩn nhằm

vào câu hỏi liệu người ta có thể giải được hệ phương trình cho vector y
theo vector x hay khơng? Tức là có tồn tại một hàm φ, được gọi là hàm
ẩn, sao cho h[x, φ(x)] = 0 hay không? Các định lý hàm ẩn cổ điển sau đây
khẳng định rằng điều này là có thể theo nghĩa địa phương, nghĩa là, trong
một lân cận của một nghiệm (¯
x, y¯) sao cho ma trân trận gradient của h
đối với y không suy biến.
Định lí 1.7.1 (Định lí hàm ẩn). Cho S là một tập con mở của Rm+n ,
và h : S → Rn là một hàm, sao cho tồn tại p ≥ 0, h ∈ C p trên S và giả
sử ∇y h(x, y) tồn tại và liên tục trên S . Cho (¯
x, y¯) ∈ S là một vector sao
cho h(¯
x, y¯) = 0 và ma trận ∇y h(¯
x, y¯) là ma trận khơng suy biến. Khi đó,
tồn tại số thực ǫ > 0 và δ > 0 và hàm số φ : S(¯
x; ǫ) → S(¯
y ; δ) sao cho

φ ∈ C p trên S(¯

x; ǫ), y¯ = φ(¯
x), và h[x, φ(x)] = 0 với mọi x ∈ S(¯
x; ǫ). Hàm
số φ là duy nhất, tức là, nếu x ∈ S(¯
x; ǫ), y ∈ S(¯
y ; δ), và h(x, y) = 0, thì
y = φ(x). Hơn nữa, nếu p ≥ 1, thì với mọi x ∈ S(¯
x; ǫ) ta có:
∇φ(x) = −∇x h[x, φ(x)][∇y h[x, φ(x)]]−1 .


10

1.8. Tập lồi và hàm lồi
Định nghĩa 1.8.1. Một tập S ⊂ Rn được gọi là tập lồi nếu với mọi

x, y ∈ S và với mọi α ∈ [0, 1] ta có αx + (1 − α)y ∈ S . Một hàm số
f : S → R được gọi là hàm lồi trên tập lồi S nếu với mọi x, y ∈ S và với
mọi α ∈ [0, 1], ta có:
f [αx + (1 − α)y] ≤ αf (x) + (1 − α)f (y).
Nếu f là hàm lồi và f ∈ C 1 trên tập lồi mở S , thì

f (y) ≥ f (x) + ∇f (x)′ (y − x), ∀x, y ∈ S.

(1.3)

Nếu thêm điều kiện f ∈ C 2 trên S , thì ∇2 f (x) ≥ 0, ∀x ∈ S . Ngược lại,

nếu f ∈ C 1 trên S và (1.3), thì hàm số f là hàm lồi trên tập lồi S .



11

CHƯƠNG 2

BÀI TỐN TỐI ƯU CĨ ĐIỀU KIỆN CHO BỞI
PHƯƠNG TRÌNH VÀ BẤT PHƯƠNG TRÌNH

Trong chương này, luận văn nghiên cứu bài tốn tối ưu có điều kiện. Trước
hết, luận văn trình bày bài tốn tối ưu có điều kiện tổng quát và nghiên
cứu điều kiện tối ưu cho bài tốn này. Sau đó, luận văn tập trung vào bài
tốn tối ưu có điều kiện cho bởi phương trình và bất phương trình. Ngồi
ra, trong chương này cũng trình bày mối liên hệ giữa bài tốn tối ưu có
điều kiện cho bởi bất phương trình và bài tốn tối ưu có điều kiện cho bởi
phương trình. Từ đó, các điều kiện tối ưu cho bài tốn tối ưu có điều kiện
cho bởi bất phương trình(NLP) có thể nhận được thơng qua các kết quả
đã biết về bài toán tối ưu có điều kiện cho bởi phương trình(ECP).
2.1. Tổng quan bài tốn tối ưu có điều kiện
Trước hết, chúng ta xét bài tốn tối ưu có điều kiện (CP)

min f (x)
với điều kiện x ∈ X , trong đó f : Rn → R là một hàm số cho trước và X
là một tập con của Rn .
Chúng ta nhắc lại các khái niệm cơ bản sau:
Vector x∗ ∈ X được gọi là cực tiểu địa phương của hàm f (của bài toán

(CP)) nếu tồn tại một số ǫ > 0 sao cho

f (x∗ ) ≤ f (x), ∀x ∈ S(x∗ ; ǫ), x ∈ X.


Vector x∗ ∈ X được gọi là cực tiểu địa phương chặt của hàm f nếu tồn
tại một số ǫ > 0 sao cho

f (x∗ ) < f (x), ∀x ∈ S(x∗ ; ǫ), x ∈ X, x = x∗ .

Vector x∗ ∈ X được gọi là cực tiểu toàn cục của hàm f (của bài toán


12

(CP)) nếu

f (x∗ ) ≤ f (x), ∀x ∈ X.
Như vậy, nghiệm của bài tốn (CP) chính là cực tiểu toàn cục của hàm

f . Mệnh đề sau đây đưa ra điều kiện cần cho nghiệm của bài toán tối ưu
(CP):
Mệnh đề 2.1.1 ([2]). Giả sử X là một tập lồi và x∗ ∈ X, f ∈ C 1 trên
S(x∗ ; ǫ) với một số ǫ > 0 nào đó.
a) Nếu x∗ là một cực tiểu địa phương của f thì

∇f (x∗ )′ (x − x∗ ) ≥ 0, ∀x ∈ X.

(2.1)

b) Nếu f là tập lồi trên X và thỏa mãn (2.1) thì x∗ là một cực tiểu tồn
cục của f , tức là x∗ là một nghiệm của bài tốn tối ưu (CP).
2.2. Bài tốn tối ưu có điều kiện cho bởi phương trình
Trong phần này, chúng ta xét một trường hợp đặc biệt của bài toán
(CP). Chúng ta xét bài tốn cực trị có điều kiện cho bởi phương trình (gọi

là bài tốn (ECP)):
min f (x)
h(x) = 0.
trong đó f : Rn → R và h : Rn → Rm , với m ≤ n. Các thành phần của h

được kí hiệu là h1 , ..., hm .

Định nghĩa 2.2.1. Giả sử x∗ là một vector sao cho h(x∗ ) = 0 và h ∈ C 1

trên S(x∗ ; ǫ) với một số thực ǫ > 0 nào đó. Khi đó, x∗ được gọi là một điểm
chính quy nếu các vector gradient ∇h1 (x∗ ), ..., ∇hm (x∗ ) độc lập tuyến tính.
Xét hàm số Lagrange L : Rn+m → R được định nghĩa bởi:

L(x, λ) = f (x) + λ′ h(x).
Chúng ta có kết quả cổ điển sau:
Mệnh đề 2.2.2 ([1]). Giả sử x∗ là một cực tiểu địa phương của bài toán
(ECP), và f ∈ C 1 , h ∈ C 1 trên S(x∗ ; ǫ) với ǫ > 0 là một số thực dương
nào đó. Khi đó, nếu x∗ là một điểm chính quy thì tồn tại duy nhất một


13

vector λ∗ ∈ Rm sao cho

∇x L(x∗ , λ∗ ) = 0.

(2.2)

Nếu thêm điều kiện f ∈ C 2 và h ∈ C 2 trên S(x∗ ; ǫ) thì


∀z ∈ Rn thỏa mãn ∇h(x∗ )′ z = 0, ta có: z ′ ∇2xx L(x∗ , λ∗ )z ≥ 0.

(2.3)

Định lí sau đây đưa ra một điều kiện đủ cho cực tiểu địa phương:

Mệnh đề 2.2.3 ([2]). Cho x∗ thỏa mãn h(x∗ ) = 0 và f ∈ C 2 và h ∈ C 2
trên S(x∗ ; ǫ) với một số ǫ > 0 nào đó. Giả sử tồn tại một vector λ∗ ∈ Rm
sao cho

∇x L(x∗ , λ∗ ) = 0

(2.4)

∀z = 0, ∇h(x∗ )′ z = 0 : z ′ ∇2xx L(x∗ , λ∗ )z > 0.

(2.5)



Khi đó, x∗ là một cực tiểu địa phương của bài toán (ECP).
Bổ đề 2.2.4 ([2]). Giả sử x∗ là một cực tiểu địa phương của bài tốn
(ECP) và là một điểm chính, và cùng với vector nhân tử Lagrange λ∗ thỏa
mãn các giả thuyết của Mệnh đề 2.2.3 Khi đó, ma trận J cỡ (n + m) ×
(n + m) xác định bởi

J=
là ma trận không suy biến.

∇2xx L(x∗ , λ∗ ) ∇h(x∗ )

∇h(x∗ )′
0

(2.6)

Chứng minh: Nếu ma trận J suy biến, thì tồn tại y ∈ Rn và z ∈ Rm

sao cho (y, z) khác không và thỏa mãn



∇2xx L(x∗ , λ∗ )y + ∇h(x∗ )z = 0,

(2.7)

∇h(x∗ )′ y = 0.

(2.8)

Nhân vào phương trình (2.7) với y ′ và sử dụng phương trình (2.8), ta


y ′ ∇2xx L(x∗ , λ∗ )y = 0.
Do đó theo Mệnh dề 2.2.3, ta suy ra y = 0. Điều này suy ra ∇h(x∗ )z =

0. Mặt khác vì x∗ là điểm chính quy nên ∇h(x∗ ) có hạng bằng m. Vì thế,


14


ta suy ra z = 0. Điều này mâu thuẫn vì y và z khơng thể đồng thời bằng
0.
Mệnh đề 2.2.5 ([2]). Giả sử các giả thuyết Bổ đề 2.2.4 là đúng. Khi đó,
tồn tại một số thực δ > 0 và các hàm khả vi liên tục x(·) : S(0; δ) →

Rn , λ(·) : S(0; δ) → Rm sao cho x(0) = x∗ , λ(0) = λ∗ , và với mọi
u ∈ S(0; δ), {x(u), λ(u)} là một cặp nhân tử Lagrange địa phương của bài
toán sau:

min f (x)
h(x) = u.

(2.9)

Hơn nữa,

∀u ∈ S(0; δ) : ∇u f [x(u)] = −λ(u).
Chứng minh: Xét hệ phương trình với các biến (x, λ, u):

∇f (x) + ∇h(x)λ = 0
h(x) − u = 0.

Hệ phương trình này có nghiệm (x∗ , λ∗ , 0). Hơn nữa Jacobi của hệ tương
ứng với (x, λ) tại nghiệm này là ma trận nghịch đảo J của (2.6). Do đó theo
định lí hàm ẩn (Mục 1.7), tồn tại δ > 0 và hàm số x(·) ∈ C 1 , λ(·) ∈ C 1
trong S(0; δ) sao cho

∇f [x(u)] + ∇h[x(u)]λ(u) = 0
, ∀u ∈ S(0; δ).
h[x(u)] = u


(2.10)

Điều này cho thấy các vector x(u), λ(u) thỏa mãn điều kiện đủ cho bài
tốn (2.9). Do đó, {x(u), λ(u)} là cặp nhân tử Lagrange địa phương cho
bài tốn (2.9).

Từ phương trình (2.10), ta có

hoặc

∇u x(u)∇f [x(u)] + ∇u x(u)∇h[x(u)]λ(u) = 0
∇u f [x(u)] = −∇u x(u)∇h[x(u)]λ(u).

(2.11)

Theo mối quan hệ vi phân h[x(u)] = u, ta có

I = ∇u h[x(u)] = ∇u x(u)∇h[x(u)].

(2.12)


15

Kết hợp phương trình (2.11) và (2.12), ta có

∇u f [x(u)] = −λ(u),

như vậy mệnh đề được chứng minh.


2.3. Bài tốn tối ưu có điều kiện cho bởi phương trình và bất
phương trình
Bây giờ chúng ta xét bài tốn tối ưu có điều kiện hỗn hợp gồm phương
trình và bất phương trình [gọi là bài tốn quy hoạch phi tuyến (NLP)]

min f (x)
h(x) = 0
g(x) ≤ 0,
n
trong đó các hàm số f : R → R, h : Rn → Rm , g : Rn → Rr là các
hàm số đã cho với m ≤ n. Các thành phần của hàm số g được kí hiệu
là g1 , g2 , ..., gr . Đầu tiên chúng ta giới thiệu khái niệm "điểm chính quy"
trong trường hợp này. Cho vector x thỏa mãn g(x) ≤ 0, ta kí hiệu
A(x) = {j|gj (x) = 0}.

(2.13)

Định nghĩa 2.3.1. Giả sử x∗ là một vector thỏa mãn h(x∗ ) = 0, g(x∗ ) ≤
0, h ∈ C 1 và g ∈ C 1 trên S(x∗ ; ǫ) với một số thực ǫ > 0 nào đó. Khi đó, x∗

được gọi là một điểm chính quy nếu các vector gradient ∇h1 (x∗ ), ..., ∇hm (x∗ )
và ∇gj (x∗ ), j ∈ A(x∗ ) là độc lập tuyến tính.
Định nghĩa hàm Lagrange L : Rn+m+r → R cho bài tốn (NLP) như

sau:

L(x, λ, µ) = f (x) + λ′ h(x) + µ′ g(x),
với µ ∈ Rr .


Mệnh đề 2.3.2 ([2]). Cho x∗ là một cực tiểu địa phương cho bài toán
(NLP) và f ∈ C 1 , h ∈ C 1 , g ∈ C 1 thuộc S(x∗ ; ǫ) với một số thực ǫ > 0
nào đó và x∗ là một điểm chính quy thì tồn tại duy nhất vector λ∗ ∈

Rm , µ∗ ∈ Rr sao cho

∇x L(x∗ , λ∗ , µ∗ ) = 0,

(2.14)

∀j = 1, ..., r, µ∗j ≥ 0 : µ∗j gj (x∗ ) = 0.

(2.15)


16

Nếu thêm điều kiện f ∈ C 2 , h ∈ C 2 , và g ∈ C 2 trên S(x∗ ; ǫ), thì với
mọi z ∈ Rn thỏa mãn ∇h(x∗ )′ z = 0 và ∇gj (x∗ )′ z = 0, j ∈ A(x∗ ), ta có

z ′ ∇2xx L(x∗ , λ∗ , µ∗ )z ≥ 0.

(2.16)

Mệnh đề tiếp theo đưa ra điều kiện đủ cho cực tiểu của bài toán (NLP):
Mệnh đề 2.3.3 ([2]). Cho x∗ thỏa mãn h(x∗ ) = 0, g(x∗ ) ≤ 0, và f ∈
C 2 , h ∈ C 2 , và g ∈ C 2 trên S(x∗ ; ǫ) với một số thực ǫ > 0 nào đó. Giả sử
tồn tại các vector λ∗ ∈ Rm , µ∗ ∈ Rr sao cho

∇x L(x∗ , λ∗ , µ∗ ) = 0,


∀j = 1, ..., r µ∗j ≥ 0 : µ∗j gj (x∗ ) = 0,

(2.17)
(2.18)

và với mọi z = 0 thỏa mãn ∇h(x∗ )′ z = 0, ∇gj (x∗ )′ z ≤ 0, với mọi j ∈
A(x∗ ), và ∇gj (x∗ )′ z = 0, với mọi j ∈ A(x∗ ) với µ∗j > 0, ta có

z ′ ∇2xx L(x∗ , λ∗ , µ∗ )z > 0.

(2.19)

Khi đó, x∗ là một cực tiểu địa phương nghiêm ngặt cho bài toán (NLP).


×