Tải bản đầy đủ (.pdf) (67 trang)

Điều kiện cần cực trị của bài toán biến phân (LV thạc sĩ)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (428.38 KB, 67 trang )

ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC KHOA HỌC

HOÀNG THỊ QUỲNH NHƯ

ĐIỀU KIỆN CẦN CỰC TRỊ

CỦA BÀI TOÁN BIẾN PHÂN

Chuyên ngành: Toán ứng dụng
Mã số: 60.46.01.12

LUẬN VĂN THẠC SĨ TOÁN HỌC

NGƯỜI HƯỚNG DẪN KHOA HỌC
PGS. TS. TẠ DUY PHƯỢNG

Thái Nguyên - 2017


2

Mục lục
Chương 1. Kiến thức chuẩn bị
1.1 Không gian tuyến tính định chuẩn . . . . . . . .
1.1.1 Khái niệm về không gian tuyến tính . . .
1.1.2 Khái niệm về không gian tuyến tính định
1.2 Phép tính vi phân . . . . . . . . . . . . . . . . .
1.2.1 Dưới vi phân của hàm lồi . . . . . . . .
1.2.2 Đạo hàm Gâteaux . . . . . . . . . . . .
1.2.3 Đạo hàm Fréchet . . . . . . . . . . . . .



. . . .
. . . .
chuẩn
. . . .
. . . .
. . . .
. . . .

.
.
.
.
.
.
.

5
5
5
6
7
7
7
8

Chương 2. Điều kiện cần cực trị cho bài toán tối ưu trong
không gian vô hạn chiều
13
2.1 Định lí Fermat . . . . . . . . . . . . . . . . . . . . . . . 14

2.1.1 Bài toán trơn không có ràng buộc . . . . . . . . . 14
2.1.2 Bài toán lồi không có ràng buộc . . . . . . . . . . 16
2.2 Qui tắc nhân tử Lagrange . . . . . . . . . . . . . . . . . 19
Chương 3. Điều kiện cần cho bài toán biến phân
30
3.1 Bài toán biến phân cơ sở . . . . . . . . . . . . . . . . . . 33
3.2 Phương trình Euler . . . . . . . . . . . . . . . . . . . . . 34
3.3 Bổ đề Du Bois-Reymond và bài toán Bolza . . . . . . . . 42
3.4 Ví dụ của Hilbert . . . . . . . . . . . . . . . . . . . . . . 49
3.5 Điều kiện Weierstrass . . . . . . . . . . . . . . . . . . . . 51
3.6 Điều kiện Legendre . . . . . . . . . . . . . . . . . . . . . 53
3.7 Điều kiên Jacobi . . . . . . . . . . . . . . . . . . . . . . 55
3.8 Bài toán đẳng chu . . . . . . . . . . . . . . . . . . . . . 59
3.9 Bài toán điều khiển tối ưu và nguyên lý cực đại Pontriagin 62
3.9.1 Dẫn tới bài toán điều khiển tối ưu . . . . . . . . . 62
3.9.2 Bài toán điều khiển tối ưu . . . . . . . . . . . . . 63


3

Tài liệu tham khảo

66


3

Lời nói đầu
Điều kiện cần cực trị cho bài toán tối ưu được Fermat phát biểu
cách đây hơn 300 năm. Lí thuyết điều kiện cần cực trị trong không

gian hữu hạn chiều cho bài toán có hạn chế được phát triển qua nhiều
thời kì bởi các nhà toán học Lagrange, Euler, Kuhn, Tucker,...
Năm 1696, Johann I. Bernoulli đã phát biểu bài toán đường đoản
thời (brachistochrone): Cho trước hai điểm A và B trên một mặt phẳng
thẳng đứng. Hãy xác định đường AM B để dưới tác động của lực trọng
trường một vật thể M chuyển động trên đó từ A đến B trong thời gian
ngắn nhất.
Vấn đề này bắt nguồn từ thực nghiệm của G. Galilei: Nếu cho hai
viên bi giống nhau lăn trên dây cung và trên cung tròn thì viên bi lăn
trên cung tròn có thể đến điểm cuối nhanh hơn (mặc dù đường đi dài
hơn, nhưng tốc độ lớn hơn).
Giả sử y(x) là hàm mô tả đường cong chuyển động của viên bi trên
hệ trục tọa độ (x, y) với y(x0 ) = 0, y(x) ≤ 0 khi x ≥ x0 . Điểm A có
tọa độ là A(x0 , 0) và điểm B có tọa độ là B(x1 , y1 ) cho trước.
Giả thiết lực ma sát là không đáng kể, theo định luật rơi Galilei, ta
có vận tốc của viên bi là −2gy(x), trong đó g ≈ 9, 8m/s2 là gia tốc
rơi tự do. Quãng đường đi được sau thời gian dt là ds = 1 + y 2 (x)dx.
ds
Vì v(t) =
nên
dt

−2gy(x) =

1 + y 2 (x)dx
hay dt =
dt
x1

Thời gian đi từ A(x0 , 0) đến B(x1 , y1 ) sẽ là: T =

x0

1 + y 2 (x)
−2gy(x)

1 + y 2 (x)
−2gy(x)

dx.

dx.

Bài toán trở thành: Trong số tất cả các quỹ đạo (đường cong)
y(x) nối hai điểm A(x0 , 0) đến B(x1 , y1 ) cho trước, hãy tìm đường cong


4
x1

1 + y 2 (x)

làm cực tiểu phiếm hàm

−2gy(x)

x0

dx.

Đây là bài toán cực trị có ràng buộc:

x1

1 + y 2 (x)

T =

−2gy(x)

x0

dx → inf

(1)

y(x0 ) = 0, y(x1 ) = y1 .

(2)

Bài toán (1)–(2) là bài toán tối ưu trong không gian vô hạn chiều
(không gian tất cả các đường cong trơn nối hai điểm cho trước).
Sau Bernoulli, bài toán này được tổng quát thành bài toán biến phân:
t1

L(t, x(t), x(t))dt
˙
→ inf

J(x(.)) =
t0


(x(t0 ), x(t1 )) ∈ Γ,
trong đó [t0 , t1 ] ⊂ R cho trước, Γ ⊂ Rn × Rn , L là hàm liên tục trên
miền nào đó của R × Rn × Rn .
Mục đích của luận văn là trình bày các khái niệm nghiệm yếu và
nghiệm mạnh địa phương và toàn cục của bài toán biến phân, các điều
kiện cực trị cấp một và cấp hai của bài toán biến phân.
Tác giả xin bày tỏ lòng biết ơn sâu sắc tới PGS.TS. Tạ Duy Phượng
đã tận tình hướng dẫn và giúp đỡ em trong suốt quá tình học tập và
nghiên cứu. Em cũng xin bày tỏ lòng biết ơn chân thành tới các Giáo
sư, Phó giáo sư, Tiến sĩ, quý thầy cô giáo giảng dạy tại Đại học Khoa
học, Đại học Thái Nguyên và tại Viện Toán học, Viện Hàn lâm Khoa
học và Công nghệ Việt Nam, đã mang đến cho em nhiều kiến thức bổ
ích trong nghiên cứu khoa học. Đồng thời, tôi xin gửi lời cảm ơn tới
gia đình và các bạn đồng môn đã luôn giúp đỡ và động viên tôi trong
thời gian học tập và trong quá trình hoàn thành luận văn.
Thái Nguyên, tháng 05 năm 2017.
Tác giả
Hoàng Thị Quỳnh Như


5

Chương 1

Kiến thức chuẩn bị
1.1
1.1.1

Không gian tuyến tính định chuẩn
Khái niệm về không gian tuyến tính


Định nghĩa 1.1.1 Tập X = ∅ gồm các đối tượng nào đó được gọi là
một không gian tuyến tính trên trường số thực R, nếu trên đó:
(I) Có qui tắc cho ứng với hai phần tử x, y bất kỳ thuộc X một phần
tử z cũng thuộc X được gọi là “tổng” của x và y, ký hiệu z = x + y;
(II) Có qui tắc cho ứng với một phần tử α ∈ R và một phần tử x ∈ X
một phần tử p cũng thuộc X gọi là tích giữa α với x, ký hiệu là p = αx.
(III) Các qui tắc cho ở (I) và (II) phải thỏa mãn tám tiên đề sau đây:
(1) ∀x, y ∈ X : x + y = y + x (tính giao hoán);
(2) ∀x, y, z ∈ X : (x + y) + z = x + (y + z) (tính kết hợp);
(3) ∃θ (phần tử 0) sao cho ∀x ∈ X : θ + x = x + θ = x;
(4) ∀x ∈ X : ∃x (phần tử đối) sao cho: x + x = x + x = θ;
(5) ∀x ∈ X : 1x = x; (1 ∈ R);
(6) ∀α ∈ R, ∀x, y ∈ X : α(x + y) = αx + αy;
(7) ∀α, β ∈ R, ∀x ∈ X : (αβ)x = α(βx);
(8) ∀α, β ∈ R, ∀x ∈ X : (α + β)x = αx + βx.
Ví dụ 1.1.2 Không gian các hàm liên tục từ [a, b] vào R, kí hiệu là
C[a, b] là một không gian tuyến tính.
Tương tự, không gian các hàm khả vi liên tục trên [a, b], kí hiệu là
C1 [a, b] cũng là không gian tuyến tính.


6

Thật vậy, với định nghĩa
(i) z = x + y ⇔ z(t) = x(t) + y(t) ∀t ∈ [a, b];
(ii) z = λ.x ⇔ z(t) = λx(t) ∀t ∈ [a, b].
thì tám tiên đề trên được thỏa mãn. Vậy không gian các hàm liên tục
hoặc các hàm khả vi liên tục trên [a, b] là một không gian tuyến tính.
1.1.2


Khái niệm về không gian tuyến tính định chuẩn

Không gian tuyến tính X trên R được gọi là không gian (tuyến tính)
định chuẩn, nếu trên đó có qui tắc cho ứng với mỗi phần tử x ∈ X bất
kỳ một số thực không âm gọi là chuẩn (hoặc độ dài) của x, ký hiệu là
x , thỏa mãn các tính chất sau đây:
(i) ∀x ∈ X : x ≥ 0 và x = 0 ⇔ x = 0 (tính không âm);
(ii) ∀x ∈ X, ∀λ ∈ R : λx = |λ| x (tính đồng nhất);
(iii) ∀x, y ∈ X : x + y ≤ x + y (Bất đẳng thức tam giác).
Ví dụ 1.1.3 Không gian C[a, b] các hàm liên tục ϕ : R → R và không
gian C1 [a, b] là không gian tuyến tính định chuẩn với chuẩn tương ứng
là x C[a,b] = max |x(t)| và
a≤t≤b

x

C1n [a,b]

= max{ x

C[a,b] ,



C[a,b]

= max{max |x(t)|, max |x(t)|}.
˙
a≤t≤b


a≤t≤b

Khi ấy ba tiên đề về chuẩn được thỏa mãn.

x1 (t)
 ... 


n
Ví dụ 1.1.4 Giả sử: x(·) : [a, b] → R , tức là: x(t) = 
 ∈
 ... 
xn (t)


x˙ 1 (t)
 ... 


Rn ∀t ∈ [a, b], ta định nghĩa x(t)
˙
=
.
 ... 
x˙ n (t)
Kí hiệu: C n [a, b] và C1n [a, b] là các không gian tuyến tính trên [a, b]
với định nghĩa thông thường về phép toán cộng véctơ và nhân một số




7

với một véctơ.
Ta định nghĩa:
x

C n [a,b]

= max { xi
1≤i≤n

C[a,b] }


x

C1n [a,b]

= max { xi
1≤i≤n

C1 [a,b] }.

Khi ấy C n [a, b] và C1n [a, b] là các không gian tuyến tính định chuẩn.
1.2

Phép tính vi phân

1.2.1


Dưới vi phân của hàm lồi

Cho f là một hàm lồi thật (hàm lồi chính thường) trên X. Tập
∂f (x) := {x∗ ∈ X ∗ | f (z) − f (x) ≥ x∗ , z − x ∀z ∈ X}.

(1.1)

được gọi là dưới vi phân của f tại x.
Ví dụ 1.2.1 (Dưới vi phân của hàm chỉ)
Với mọi x ∈ A thì ∂δ(x|A) khác rỗng vì nó đều chứa 0. Từ định
nghĩa ta suy ra
∂δ(x | A) = N (x | A),

(1.2)

N (x|A) := {x∗ ∈ X ∗ | x∗ , z − x ≤ 0 ∀z ∈ A}

(1.3)

trong đó

là nón pháp tuyến (normal cone) của tập A tại điểm x.
1.2.2

Đạo hàm Gâteaux

Cho X và Y là hai không gian tô pô tuyến tính, V là một lân cận
của x ∈ X và F : X → Y. Nếu
δF (x, h) := lim t−1 (F (x + th) − F (x))

t→0

tồn tại với mọi h ∈ X thì ánh xạ h → δF (x, h) được gọi là biến phân
bậc nhất của F tại x.
Nếu tồn tại một toán tử tuyến tính liên tục Λ : X → Y sao cho
Λh = δF (x, h) ∀h ∈ X


8

thì Λ được gọi là đạo hàm Gâteaux, ký hiệu là FG (x). Khi ấy ta nói:
F khả vi Gâteaux tại x. Điều này xảy ra khi và chỉ khi tồn tại toán tử
tuyến tính liên tục Λ : X → Y sao cho
F (x + th) = F (x) + tΛh + o(t) ∀h ∈ X.
Ví dụ 1.2.2 Cho r và ϕ là tọa độ cực của x ∈ R2 và f (x) = r cos 3ϕ.
Ta có δf (0.h) = f (h). Vì δf (0.h) không tuyến tính nên f không khả
vi Gâteaux tại 0 ∈ R2 .
Trong Giải tích lồi, dưới vi phân đóng vai trò của đạo hàm. Nếu một
hàm lồi khả vi Gâteaux tại một điểm thì dưới vi phân tại điểm đó có
một phần tử duy nhất là đạo hàm Gâteaux.
1.2.3

Đạo hàm Fréchet

Nếu X và Y là không gian Banach, F : X → Y khả vi Fréchet tại x
nếu tồn tại toán tử tuyến tính liên tục Λ : X → Y sao cho
F (x + h) = F (x) + Λh + r(h)

lim


với

h

X →0

r(h) Y
= 0.
h X

Khi đó Γ là đạo hàm Fréchet, ký hiệu là FF (x) hay F (x). Ánh xạ F
được gọi là chính qui tại x nếu nó khả vi Fréchet tại x và ImF (x) = Y.
Kí hiệu L(X, Y ) không gian của các toán tử tuyến tính liên tục từ
X và Y, trang bị chuẩn
Λ = sup
x

Λx

Y.

X =1

Nếu F : X → Y khả vi Fréchet tại mọi điểm trong tập mở V và ánh
xạ x → F (x) liên tục trên V (hay tại x0 ∈ V ) theo tô pô L(X, Y ) thì
ta nói F khả vi liên tục trên V (hay tại x0 ,) hay F thuộc vào lớp C1 .
Nếu F là một phiếm hàm và F (x) = 0 thì x được gọi là một điểm
dừng.
Ví dụ 1.2.3 (Đạo hàm Fréchet của ánh xạ afin)
Một ánh xạ A : X → Y từ không gian tuyến tính X vào không gian

tuyến tính Y có dạng
A(x) = Λx + a,


9

với a ∈ X và Λ là một ánh xạ tuyến tính từ X vào Y , được gọi là ánh
xạ afin. Nếu X và Y là không gian Banach và Λ liên tục thì A khả vi
Fréchet khắp nơi và AF (x) = Λ.
Mệnh đề 1.2.4 a) Nếu F khả vi Fréchet tại x thì F liên tục và khả
vi Gâteaux tại đây FG (x) = FF (x).
b) Nếu F khả vi Gâteaux tại x thì F biến phân bậc nhất tồn tại ở
đó và δF (x, h) = FG (x)h.
Chứng minh:
Xem [4], p. 35.
Ví dụ 1.2.5 Hàm

1 nếu x = (x )2 và x = 0,
1
2
2
f (x1 , x2 ) =
0 trường hợp còn lại
khả vi Gâteaux tại (0, 0) ∈ R2 nhưng không liên tục tại đó nên theo
Mệnh đề 1.2.4 thì nó không thể khả vi Fréchet được.
Ta có
Định lý 1.2.6 (Định lí giá trị trung bình)
Cho X và Y là các không gian tô pô tuyến tính, U là một tập mở
của X, ánh xạ F : U → Y khả vi Gâteaux tại mọi điểm trên đoạn nối
[x, x + h] ⊂ U. Khi đó ta có:

a) Nếu ánh xạ z → FG (z) là một ánh xạ liên tục của [x, x + h] vào
Y thì
1

F (x + h) − F (x) =

FG (x + th)h dt.
0

b) Nếu X và Y là không gian Banach thì
F (x + h) − F (x) ≤ sup FG (x + th) · h
0≤t≤1

và với mỗi Λ ∈ L(X, Y ) :
F (x + h) − F (x) − Λh ≤ sup FG (x + th) − Λ · h .
0≤t≤1


10

Đặc biệt, với mọi z ∈ [x, x + h] thì
F (x + h) − F (x) − FG (z)h ≤ sup FG (x + th) − FG (z) · h .
0≤t≤1

Chứng minh:

Xem [4], p. 38.

Mệnh đề 1.2.7 Cho X là một không gian Banach và F là một ánh xạ
liên tục từ một lân cận U của x0 ∈ X vào không gian Banach Y. Giả

thiết rằng F khả vi Gâteaux tại mọi điểm của U và ánh xạ x → FG (x)
từ U vào L(X, Y ) liên tục. Khi đó F khả vi Fréchet trên U và
FG (x) = FF (x) ∀x ∈ U.
Chứng minh:

Xem [4], p. 39.

Ví dụ 1.2.8 (Đạo hàm Fréchet của hàm vector)
Cho g1 (t, x), . . . , gm (t, x) là các hàm thực, liên tục trên U ⊂ R × Rn
và khả vi liên tục theo x. Đặt
(g(t, x) = g1 (t, x), . . . , gm (t, x))
[G(x(·))](t) = g(t, x(t)),

t0 ≤ t ≤ t1 .

Như vậy G : C n ([t0 , t1 ]) → C m ([t0 , t1 ]). Gọi x0 (·) là một hàm liên tục
[t0 , t1 ] → Rn có ảnh nằm trong U. Ta sẽ chỉ ra rằng G khả vi Fréchet
tại x0 (·).
Vì U là tập mở nên tồn tại > 0 sao cho |x0 (t) − x| < kéo theo
(t, x) ∈ U. Nếu x(·) − x0 (·) C < ta có
lim

λ→0

G(x(·) + λz(·)) − G(x(·))
(t) = gx (t, x(t))z(t),
λ

nghĩa là
[GG (x(·))z(·)](t) = gx (t, x(t))z(t).

Vì (t, x) → gx (t, x) liên tục nên x(·) → GG (x(·)) cũng liên tục. Áp
dụng Mệnh đề 1.2.7 ta nhận được tính khả vi Fréchet tại x0 (·) và
[GF (x0 (·))z(·)](t) = gx (t, x0 (t))z(t).


11

Nếu với mọi h ∈ X, hàm ϕh (t) := F (x + th) khả vi ít nhất n lần tại
t = 0 thì
dn
δ F (x, h) := n ϕh (t)|t=0
dt
n

(1.4)

được gọi là biến phân bậc n của F tại x.
Đạo hàm Fréchet bậc n có thể được định nghĩa qui nạp: Nếu đạo
hàm Fréchet (bậc nhất) F của F tồn tại trong một lân cận của x thì
đạo hàm Fréchet của F tại x là Đạo hàm Fréchet bậc hai của F tại x.
Nếu ánh xạ x → F (x) tồn tại và liên tục trong lân cận của một điểm
thì ta nói F khả vi liên tục hai lần tại điểm đó.
Định lý 1.2.9 (Qui tắc dây chuyền)
Cho X, Y và Z là các không gian Banach, U là một tập mở của X,
V là một tập mở của Y, F : U → Y và G : V → Z. Cho x ∈ U với
F (x) ∈ V. Nếu F khả vi Fréchet tại x và G khả vi Fréchet tại F (x) thì
ánh xạ H = G ◦ F cũng khả vi Fréchet tại x, tức là
H(x) = G ◦ F (x) = G(F (x)).
Thì
H (x) = G (F (x)) ◦ F (x).

Ví dụ 1.2.10 (Đạo hàm Fréchet của hàm Lagrange)
Cho L(t, x, y) là một ánh xạ từ W ⊂ R × Rn × Rn vào Rm , liên tục
và khả vi liên tục theo x và y. x0 (·) là một hàm liên tục trên [t0 , t1 ]
sao cho (t, x0 (t), x˙ 0 (t)) ∈ W với mọi t ∈ [t0 , t1 ].
Xét ánh xạ
M : C1n ([t0 , t1 ]) → C m ([t0 , t1 ]),

[M (x(·))](t) = L(t, x(t), x(t)),
˙

Ta có
M = M2 ◦ M1 ,
trong đó
[M1 (x(·))](t) = (x(t), x(t)),
˙

t0 ≤ t ≤ t1

t ∈ [t0 , t1 ].


12


t0 ≤ t ≤ t1 .

[M2 (x(·), y(·))](t) = L(t, x(t), y(t)),
Ví dụ 1.2.8 cho ta

[M2 (x(·), y(·))(r(·), s(·))](t) = Lx (t, x(t), y(t))r(t) + Ly (t, x(t), y(t))s(t).

Mặt khác dễ dàng nhận thấy
[M1 (x(·))z(·)](t) = (z(t), z(t)).
˙
Áp dụng Định lí 1.2.9 ta có
[M (x0 (·))z(·)](t) = Lx (t, x0 (t), x˙ 0 (t))z(t) + Ly (t, x0 (t), x˙ 0 (t))z(t).
˙
Ví dụ 1.2.11 (Đạo hàm Fréchet của tích phân hàm Lagrange)
Với giả thiết như trong Ví dụ 1.2.10, ta xét phiếm hàm
t1

F(x(·)) =

L(t, x(t), x(t))dt.
˙
t0

Có thể tách F thành F = F2 ◦ F1 , trong đó
[F1 (x(·))](t) = L(t, x(t), x(t)),
˙


t0 ≤ t ≤ t1

t1

F2 (α(·)) =

α(t)dt.
t0


F2 là một ánh xạ tuyến tính, nên sử dụng kết quả của Ví dụ 1.2.3
và 1.2.10 cùng với Định lí 1.2.9 ta thu được
t1

F (x(·))z(·) =

[Lx (t, x(t), x(t))z(t)
˙
+ Ly (t, x(t), x(t))
˙
z(t)]dt.
˙
(1.5)
t0


13

Chương 2

Điều kiện cần cực trị cho bài toán
tối ưu trong không gian vô hạn
chiều
Chương này trình bày điều kiện cần cực trị cho bài toán tối ưu trong
không gian hữu hạn chiều, như là những kiến thức chuẩn bị và là cầu
nối để hiểu bài toán tối ưu trong không gian vô hạn chiều trong Chương
3. Khoảng năm 1629, P. de Fermat đã đưa ra phương pháp tìm điểm
cực đại và cực tiểu của một số hàm đơn giản. Theo ngôn ngữ toán học
ngày nay, có thể phát biểu điều kiện này như sau: Nếu một đa thức có
các điểm cực trị thì đạo hàm của nó tại đó phải bằng 0. Đây là một

trong những phát hiện quan trọng nhất của toán học. Điều đáng nói
là lúc đó khái niệm đạo hàm chưa ra đời. Mãi sau này, G. W. Leibniz
mới đưa ra khái niệm đạo hàm và chứng minh f (x∗ ) = 0 nếu x∗ là
điểm cực trị địa phương. Ngày nay, những kết quả kiểu này được gọi
là Định lí Fermat.
Những điều kiện cần cực trị đầu tiên chỉ phát biểu cho bài toán trơn
(cho các hàm mục tiêu khả vi) và không có ràng buộc. Năm 1744, L.
Euler giải Bài toán đẳng chu, đưa ra cách tiếp cận đầu tiên cho bài
toán tối ưu có ràng buộc. Để giải quyết một số vấn đề cơ học dưới
dạng bài toán cực trị có ràng buộc đẳng thức, Lagrange đã xây dựng
Qui tắc nhân tử Lagrange.
Trong khuôn khổ Qui hoạch lồi, Kuhn và Tucker chứng minh điều


14

kiện cần cực trị (Định lí Kuhn-Tucker) cho bài toán có ràng buộc bất
đẳng thức.
2.1
2.1.1

Định lí Fermat
Bài toán trơn không có ràng buộc

Cho X là một không gian tô pô và f : X → R. Xét bài toán
f (x) → inf .

(2.1)

Định lý 2.1.1 (Định lí Fermat)

Giả thiết rằng x∗ là một nghiệm cực tiểu địa phương của (2.1) và
tồn tại biến phân bậc nhất δf (x∗ , h). Khi đó
δf (x∗ , h) = 0 ∀h ∈ X.
Nếu X là một không gian Banach và f khả vi Fréchet tại x∗ thì
f (x∗ ) = 0.
Chứng minh:(xem [1], trang 31) Ta có
δf (x∗ , h) ≥ 0 và δf (x∗ , h) = −δf (x∗ , −h) ∀h ∈ X.
Điều này kéo theo
δf (x∗ , h) = 0 ∀h ∈ X.
Nếu X là một không gian Banach và f khả vi Fréchet tại x∗ thì theo
Mệnh đề 1.2.4 ta có
f (x∗ )h = fF (x∗ )h = fG (x∗ )h = δf (x∗ )h = 0 ∀h ∈ X.
Ví dụ 2.1.2 (Fermat, Huygens, l’Hospital)
Cho hai môi trường đồng chất, nằm hai phía của một mặt phẳng,
và hai điểm a, b nằm trong lòng hai môi trường đó. Tìm đường đi của
ánh sáng từ a tới b.


15

Không làm mất tính tổng quát, cho a = (a1 , 0, 0), b = (b1 , b2 , 0), a1 >
0 > b1 , b2 ≥ 0 và mặt phẳng ngăn cách là {x = (x1 , x2 , x3 ) ∈ R3 |x1 =
0}. Theo Nguyên lí Fermat, ánh sáng truyền theo đường mà thời gian
đi là ngắn nhất. Vì trong môi trường đồng chất, vận tốc ánh sáng
không thay đổi, nên nó phải truyền theo đường thẳng. Như vậy, chỉ
còn việc xác định điểm z = (0, z2 , z3 ), nơi mà ánh sáng truyền từ môi
trường này sang môi trường kia. Gọi v1 và v2 là vận tốc ánh sáng trong
hai môi trường ấy, thì thời gian truyền trong môi trường là |z − a|/v1
và |z − b|/v2 . Do đó, ta phải giải bài toán:
|z − a| |z − b|

+
→ inf .
v1
v2
Dễ nhận thấy nghiệm tối ưu tồn tại. Theo Định lí Fermat,
z2
z2 − b2
+
= 0,
v1 |z − a| v2 |z − b|

z3
z3
+
= 0.
v1 |z − a| v2 |z − b|

Từ phương trình thứ hai suy ra z3 = 0 và z2 được xác định duy nhất
từ phương trình đầu. Gọi α1 và α2 là góc giữa pháp tuyến và tia sáng.
Khi đó
sin α1 =

z2
.
|z − a|

sin α2 = −

z2 − b2
.

|z − b|

Cho nên
sin α1
v1
= .
sin α2
v2
Đây chính là một kết luận quen biết của quang học.
Ví dụ 2.1.3 Xét bài toán Fermat về tìm điểm có tổng khoảng cách
ngắn nhất tới ba điểm đã cho (xem [1], trang 13). Cho ba điểm y1 , y2
và y3 thuộc R2 . Tìm điểm thuộc R2 có tổng bình phương khoảng cách
(Euclid) từ nó tới ba điểm kia là nhỏ nhất. Tức là
f (x) = |x − y1 |2 + |x − y2 |2 + |x − y3 |2 → inf;

x ∈ R2 .

(2.2)

Nếu x∗ là điểm tối ưu của bài toán (2.2) thì theo Định lí Fermat ta


16


f (x∗ ) = 2(3x∗ − y1 − y2 − y3 ) = 0.
Bài toán (2.2) có nghiệm tối ưu (xem [1], trang 13), nên
1
x∗ = (y1 + y2 + y3 )
3

chính là điểm cần tìm.
Sử dụng kiến thức về hàm một biến và định nghĩa của biến phân
bậc cao, có thể chứng minh dễ dàng điều kiện cần bậc cao sau đây.
Định lý 2.1.4 Giả thiết rằng x∗ là một nghiệm cực tiểu địa phương
của 2.1 và tồn tại biến phân bậc n > 1. Khi đó tồn tại một số tự nhiên
l sao cho 2l ≤ n và
δf (x∗ , h) = 0, . . . , δ 2l−1 f (x∗ , h) = 0,
δ 2l f (x∗ , h) ≥ 0
với mọi h ∈ X.
Nếu X là một không gian Banach và f khả vi Fréchet liên tục hai
lần tại x∗ thì
f ”(x∗ ) ≥ 0 1 .
2.1.2

Bài toán lồi không có ràng buộc

Cho hàm lồi f : X → R. Xét bài toán
f (x) → inf .

(2.3)

Định lý 2.1.5 (Định lí Fermat cho bài toán lồi)
Hàm lồi f nhận giá trị cực tiểu (toàn cục) tại x∗ khi và chỉ khi
0 ∈ ∂f (x∗ ).

(2.4)


17


Chứng minh:

Từ (1.1) ta có

f (x∗ ) ≤ f (x) ∀x ∈ X ⇐⇒ f (x) − f (x∗ ) − 0, x − x∗ ≥ 0 ∀x ∈ X
⇐⇒ 0 ∈ ∂f (x∗ ).
Ví dụ 2.1.6 (Bài toán Fermat-Torricelli) Cho ba điểm trên một mặt
phẳng. Tìm điểm trên mặt phẳng đó sao cho tổng khoảng cách tới ba
điểm kia là nhỏ nhất.
Mô hình toán học là
f (x) = |x − y1 | + |x − y2 | + |x − y3 | → inf;

x ∈ R2 .

(2.5)

Ở đây hàm f biểu diễn tổng các khoảng cách tới ba điểm y1 , y2 và
y3 cho trước.
Có thể chỉ ra rằng bài toán cực trị (2.5) có nghiệm tối ưu (xem [1],
trang 13).
Hàm f lồi, nhưng không trơn. Theo Định lí 2.1.5 thì điều kiện cần
và đủ để x∗ là nghiệm tối ưu là
0 ∈ ∂f (x∗ ).
Áp dụng Định lí Moreau-Rockafellar (xem [1], trang 26) ta có
0 ∈ ∂x |x∗ − y1 | + ∂x |x∗ − y2 | + ∂x |x∗ − y3 |.

(2.6)

Ta đã biết rằng (xem [1], trang 25): Dưới vi phân của chuẩn trong
không gian Euclid tại 0 là hình tròn đơn vị, còn tại điểm khác 0 là véc

tơ đơn vị từ 0 hướng tới điểm ấy. Do đó, nếu x∗ = yi , i = 1, 2, 3, thì
(2.6) kéo theo
e1 + e2 + e3 = 0,

trong đó ei =

x ∗ − yi
, i = 1, 2, 3.
|x∗ − yi |

Có nghĩa là: góc giữa ba đoạn [x∗ , y1 ], [x∗ , y2 ] và [x∗ , y3 ] đều là 120o .
Điểm X∗ có tính chất này được gọi là điểm Torricelli.
Nếu x∗ trùng với một trong ba điểm yi , chẳng hạn với y3 , thì (2.6)
cho ta
e1 + e2 + z = 0,

trong đó |z| ≤ 1.


18

Có nghĩa là: góc giữa [y3 , y1 ], [y3 , y2 ] không nhỏ hơn 120o .
Như vậy, nghiệm của (2.5) là: Nếu một trong ba góc của tam giác
tạo bởi ba điểm đã cho không nhỏ hơn 120o thì điểm cần tìm chính là
đỉnh đó; trong trường hợp còn lại, nghiệm tối ưu là điểm Torricelli.
Bài toán lồi có ràng buộc bao hàm thức
Xét bài toán
f0 (x) → inf;

x ∈ A.


(2.7)

Định lý 2.1.7 Cho X là một không gian tôpô tuyến tính lồi địa phương,
f0 : X → R là một hàm lồi trên X và liên tục tại x∗ , và A ⊂ X là một
tập lồi. Khi đó, x∗ là nghiệm cực tiểu (toàn cục) của bài toán (2.7)
nếu và chỉ nếu
0 ∈ ∂f0 (x∗ ) + ∂(δ(x∗ | A)).

(2.8)

Điều này tương đương với
∃y ∗ ∈ ∂f0 (x∗ ) : −y ∗ ∈ N (x∗ | A).
Chứng minh:
26) ta có:

(2.9)

Áp dụng Định lí Moreau-Rockafellar (xem [1], trang

∂(f0 (x∗ ) + δ(x∗ | A)) = ∂f0 (x∗ ) + ∂(δ(x∗ | A)).
Thêm vào đó, (1.2) chỉ ra rằng
∂(δ(x∗ | A)) = N (x∗ | A).
Vì hàm f (x) = f0 (x) + δ(x | A) lồi và có cùng nghiệm cực tiểu như
f0 nên điều phải chứng minh suy ra từ Định lí 2.1.5.
Hệ quả 2.1.8 Cho y ∗ ∈ X ∗ và A ⊂ X lồi. Điều kiện cần và đủ để x∗
là nghiệm cực tiểu (toàn cục) của bài toán
y ∗ , x → inf;
là −y ∗ ∈ N (x∗ | A).


x∈A


19

2.2

Qui tắc nhân tử Lagrange

Bài toán trơn với ràng buộc đẳng thức
Ta xét một bài toán tối ưu đơn giản sau đây:
f0 (x) := x21 + 4x22 → min,

(2.10)

trong đó x := (x1 , x2 )T ∈ R2 . Để xác định nghiệm cực tiểu của bài
toán tối ưu lồi này, ta áp dụng Định lí Fermat:
f0 (x) = (2x1 , 8x2 )T = (0, 0)T .

(2.11)

Dễ thấy rằng điều kiện cần cực trị này cho một nghiệm duy nhất
x∗ = (x1∗ , x2∗ )T = (0, 0)T , đó cũng chính là điểm cực tiểu toàn cục của
f0 (·).
Nếu thêm ràng buộc vào phương trình (2.10), ví dụ:
f1 (x) := −x1 − x2 + 5 = 0,

(2.12)

thì không có điểm x ∈ R2 nào thỏa mãn cả ràng buộc này cùng với

(2.11), nghĩa là (2.11) không còn là điều kiện cần cực trị nữa. Vì hai
điểm này tiếp xúc nên hai véc tơ f0 (∗) và f1 (∗) phải song song với
nhau:
f0 (x) = x21 + 4x22 → inf
với x = (0, 0) nên f0 (0, 0) ≤ f0 (x) với mọi x ∈ R2 . Từ ràng buộc (2.12)
ta có: x2 = −x1 + 5 thay vào (2.10) ta được
f0 (x) = x21 + 4[−x1 + 5]2
= x21 + 4x21 − 40x1 + 100
= 5x21 − 40x1 + 100
= 5[x21 − 8x1 + 20]
= 5(x1 − 4)2 ≥ 20
có nghiệm x1 = 4, x2 = 1.
Vì f0 (0, 0) = 0, f0 (x) > 0 với mọi x thỏa mãn fx (x) = 0 và vì giá trị
của f0 (x) tăng dần khi tiến từ x = 0 đến đường thẳng f1 (x) = 0, f0 (·)
sẽ đạt được giá trị cực tiểu tại điểm tiếp xúc x∗ giữa đường thẳng
f1 (x) = 0 và một đường mức của f0 (·). Vì hai đường này tiếp xúc nên


20

hai véc tơ f0 (x∗ ) và f1 (x∗ ) phải song song với nhau, tức là
f0 (x∗ ) + λ1 f1 (x∗ ) = 0

(*)

với λ1 là một số thực. Vì f0 (x) = (−2x1 , 8x2 ) và f1 (x) = (−1, −1) nên
(*) trở thành
2x1∗ − λ1 = 0,

8x2∗ − λ1 = 0.


Kết hợp với (2.12) ta có
λ1 = 8, x1∗ = 4, x2∗ = 1.

Đây chính là nghiệm tối ưu của bài toán (2.10) với ràng buộc (2.12).
Xét bài toán tổng quát hơn sau đây: Cho fi : R → R với i =
0, 1, . . . , m. Xét bài toán
f0 (x) → inf;
f1 (x) = 0, . . . , fm (x) = 0.

(2.13)

J. Lagrange đã xây dựng phương pháp để giải bài toán cực trị có
ràng buộc đẳng thức. Năm 1797, ông viết trong quyển sách Lý thuyết
hàm giải tích (xem [1], trang 34) như sau: “Nếu cần tìm cực đại hay cực
tiểu của một hàm nhiều biến, kèm theo một hay nhiều phương trình


21

ràng buộc các biến đó, thì chỉ cần cộng hàm mục tiêu với các hàm phải
bằng không, sau khi đã nhân mỗi hàm với một đại lượng không xác
định, rồi tìm cực đại hay cực tiểu của hàm thu được, như thể các biến
hoàn toàn độc lập. Những phương trình tìm ra sẽ được sử dụng cùng
với các điều kiện ràng buộc để xác định các ẩn số”.
Như vậy, để giải bài toán (2.13), ta tìm cực tiểu của hàm
L(x, λ1 , . . . , λm ) = f0 (x) + λ1 f1 (x) + · · · + λm fm (x).
Theo Định lí Fermat, ta có điều kiện cần cực trị sau:
Lx (x, λ1 , . . . , λm ) = f0 (x) + λ1 f1 (x) + · · · + λm fm (x) = 0.
Cùng với n phương trình ràng buộc

f1 (x) = 0, . . . , fm (x) = 0
đã cho, ta có n+m phương trình cho n+m ẩn số x = (x1 , . . . , xn ), λ1 , . . . , λm .
Như vậy, về nguyên tắc, ta có thể giải hệ phương trình này để thu
được nghiệm cần tìm.
Ví dụ sau đây chỉ ra rằng, điều này không phải lúc nào cũng đúng.
Ví dụ 2.2.1
x1 → inf;

x31 − x22 = 0.

Dễ thấy rằng (0, 0) là điểm cực tiểu. Song điều kiện cần cực trị của
L(x1 , x2 , λ1 ) = x1 + λ1 (x31 − x22 )
dẫn đến mâu thuẫn
Lx1 (x1 , x2 , λ1 ) = 1 + 3λ1 x21 = 0 và Lx2 (x1 , x2 , λ1 ) = −2λ1 x21 = 0.
Lí do ở đây là đạo hàm f1 không thỏa mãn điều kiện chính qui.
Để khắc phục, vào đầu thế kỉ 20, khi xét bài toán đẳng chu, Hahn và
Kneser (xem [1], trang 35) đã nhân thêm λ0 với phiếm hàm mục tiêu.


22

Nếu điều kiện này được thực hiện với Ví dụ 2.2.1 thì
L(x1 , x2 , λ0 , λ1 ) = λ0 x1 + λ1 (x31 − x22 ) → inf .
Áp dụng Định lí Fermat, ta có
Lx1 (x1 , x2 , λ0 , λ1 ) = λ0 + 3λ1 x21 = 0,
Lx2 (x1 , x2 , λ0 , λ1 ) = −2λ1 x2 = 0.
Điều này hoàn toàn đúng với λ0 = 0, λ1 = 1 và x1 = x2 = 0.
Như vậy, để giải bài toán (2.13), cần xét hàm Lagrange
m


L(x, λ0 , . . . , λm ) :=

λi fi (x),

(2.14)

i=0

trong đó λi ∈ R, i = 0, 1, . . . , m, được gọi là các nhân tử Lagrange. Ta
có:
Định lý 2.2.2 (Qui tắc nhân tử Lagrange)
Giả thiết rằng: fi , i = 0, 1, . . . , m, khả vi liên tục trong lân cận
V ⊂ Rn của x∗ . Nếu x∗ là nghiệm cực tiểu địa phương của (2.13) thì
tồn tại các nhân tử Lagrange λi , i = 0, 1, . . . , m, sao cho chúng không
cùng triệt tiêu và thỏa mãn
m

Lx (x∗ , λ0 , . . . , λm ) :=

λi fi (x) = 0.

(2.15)

i=0

Nếu f1 (x∗ ), . . . , fm (x∗ ) độc tập tuyến tính thì λ0 = 0 và ta có thể chọn
λ0 = 1.
Định lí này là trường hợp đặc biệt của kết quả sau đây.
Cho X và Y là không gian Banach, f0 : X → R và F : X → Y . Xét
bài toán

f0 (x) → inf;
F (x) = 0.

(2.16)

Với λ0 ∈ R và y ∗ ∈ Y ∗ , gọi là nhân tử Lagrange, ta định nghĩa hàm


23

Lagrange:
L(x, λ0 , y ∗ ) := λ0 f0 (x) + y ∗ , F (x) .

(2.17)

Năm 1934, L. A. Lyusternik (xem [1], trang 35) đã chứng minh Qui
tắc nhân tử Lagrange sau:
Định lý 2.2.3 Giả thiết rằng: f và F khả vi Fréchet tại x∗ , F (x∗ ) = 0
và ảnh của X qua ánh xạ x → F (x∗ ) là đóng. Nếu x∗ là nghiệm cực
tiểu địa phương của (2.16) thì tồn tại nhân tử Lagrange λ0 và y ∗ sao cho
chúng không cùng triệt tiêu và thỏa mãn phương trình Euler-Lagrange
Lx (x∗ , λ0 , y ∗ ) := λ0 f (x∗ ) + F ∗ (x∗ )y ∗ = 0.

(2.18)

Nếu F khả vi liên tục và chính qui tại x∗ (tức F (x∗ )X = Y ) thì
λ0 = 0 và ta có thể chọn λ0 = 1.
Điều kiện đảm bảo cho λ0 = 0 được gọi là điều kiện chính qui.
Chứng minh: (xem [1], trang 36) Theo giả thiết thì L = F (x∗ )X là
không gian con đóng của Y. Hai khả năng có thể xảy ra là: trường hợp

chính qui L = Y và trường hợp không chính qui L = Y.
Xét trường hợp L = Y. Định lí Lyusternik (xem [1], trang 22) chỉ ra
rằng
Tx∗ {x ∈ X | F (x) = 0} = KerF (x∗ ).
Nếu h ∈ KerF (x∗ ) thì theo định nghĩa véc tơ tiếp tuyến (xem [1],
trang 25) ta có biến phân x(t, h) = x∗ + th + r(t) của x∗ sao cho
F (x(t, h)) = 0 với

− ≤t≤ ,

> 0 và

lim r(t) /t = 0.
t→0

Vì hàm ϕ(t) := f (x(t, h)) nhận giá trị cực tiểu địa phương tại t = 0
nên Qui tắc dây chuyền (Định lí 1.2.9) cho ta
ϕ (0) = f (x∗ ), h = 0.


24

Điều này đúng với mọi h ∈ KerF (x∗ ). Vì vậy
f (x∗ ) ∈ (KerF (x∗ ))⊥ .
Theo Bổ đề về linh hóa tử (xem [1], trang 13) thì
∃y ∗ ∈ Y ∗ : f (x∗ ) = −F ∗ (x∗ )y ∗ ,
tức là
f (x∗ ) + F ∗ (x∗ )y ∗ = 0.
Ở đây λ0 = 1. Trong trường hợp chính qui λ0 không thể bằng 0 vì nếu
vậy thì

y ∗ , F (x∗ )x = F (x∗ )y ∗ , x ∀x ∈ X,
kéo theo y ∗ = 0 (vì F (x∗ )X = Y ), mâu thuẫn với điều kiện không
đồng thời triệt tiêu của các nhân tử Lagrange.
Bây giờ ta xét trường hợp L = Y. Vì L là một không gian con đóng
nên theo Hệ quả (xem [1], trang 13) thì L⊥ có chứa một phần tử y ∗ = 0,
tức là
0 = y ∗ , F (x∗ )x = F ∗ (x∗ )y ∗ , x ∀x ∈ X.
Với λ0 = 0 ta có
Lx (x∗ , λ0 , y ∗ ) = F ∗ (x∗ )y ∗ = 0.

Chú ý rằng trong trường hợp đặc biệt (2.13) thì điều kiện chính qui
F (x∗ )X = Y chính là điều kiện độc lập tuyến tính của f1 (x∗ ), . . . , fm (x∗ )
như đã nêu ở Định lí 2.2.2.
Ta biết rằng dưới điều kiện chính qui có thể đặt λ0 = 1. Song trên
thực tế, nhiều khi kiểm tra điều kiện chính qui còn khó hơn việc chỉ ra
nếu λ = 0 thì kéo theo các nhân tử Lagrange đều bị triệt tiêu, trái với


×