Tải bản đầy đủ (.pdf) (81 trang)

LUẬN VĂN THẠC SĨ TOÁN HỌC: NGHIỆM VISCOSITY ĐỐI VỚI BÀI TOÁN ĐIỀU KHIỂN TỐI ƯU

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (469.07 KB, 81 trang )

ĐẠI HỌC HUẾ
TRƯỜNG ĐẠI HỌC SƯ PHẠM

BÙI THỊ KIM HOA

NGHIỆM VISCOSITY ĐỐI VỚI
BÀI TOÁN ĐIỀU KHIỂN TỐI ƯU
Chuyên ngành: TOÁN GIẢI TÍCH
Mã số: 60460102

LUẬN VĂN THẠC SĨ TOÁN HỌC

Người hướng dẫn khoa học:
PGS.TS. NGUYỄN HOÀNG

Thừa Thiên Huế, năm 2016


LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên
cứu của riêng tôi, các số liệu và kết quả nghiên
cứu ghi trong Luận văn là trung thực, được
đồng tác giả cho phép và chưa từng công bố
trong bất kì một công trình nào khác.

Tác giả

Bùi Thị Kim Hoa

ii



LỜI CẢM ƠN
Trong quá trình học tập và làm luận văn tốt nghiệp, tôi đã nhận được sự khích
lệ và hỗ trợ của nhiều thầy cô, bạn bè và người thân. Tôi thành thật cảm kích.
Trước hết, tôi xin bày tỏ lòng biết ơn sâu sắc đến PGS.TS. Nguyễn Hoàng.
Thầy không những là người định hướng đề tài, tận tình hướng dẫn mà còn tạo
cho tôi động lực vượt qua những khó khăn trong học tập, luôn nhắc nhở tôi giữ
gìn sức khỏe để học tốt.
Tôi cũng xin chân thành cảm ơn tất cả quý thầy, cô khoa Toán của Trường
Đại học Sư phạm Huế đã tận tình giảng dạy và truyền đạt những kiến thức bổ
ích trong suốt khóa học tại Trường Đại học Sư phạm Huế.
Chân thành cảm ơn các Bạn, Anh Chị học viên Cao học khóa 23, đặc biệt là
các Anh, Chị chuyên ngành Toán Giải tích và cũng như tất cả bạn bè của tôi đã
luôn hỗ trợ tôi suốt quá trình tôi học tập.
Cuối cùng tôi xin cảm ơn Ba, Mẹ và toàn thể gia đình tôi-những người đã
động viên tôi rất nhiều và cũng là động lực giúp tôi hoàn thành Luận văn này.
Mặc dù đã cố gắng hết sức nhưng Luận văn sẽ không tránh khỏi những thiếu
sót. Tôi rất mong các thầy cô giáo cùng các bạn đánh giá, góp ý để Luận văn
được hoàn chỉnh hơn.

Bùi Thị Kim Hoa

iii


Mục lục

Trang phụ bìa

i


Lời cam đoan

ii

Lời cảm ơn

iii

Mục lục

1

Danh mục các kí hiệu

3

Lời nói đầu

4

Chương 1.
1.1

1.2

1.3

6


Các khái niệm cơ bản của giải tích . . . . . . . . . . . . . . . . .

6

1.1.1

Hàm nửa liên tục. . . . . . . . . . . . . . . . . . . . . . . .

6

1.1.2

Hàm liên tục Lipschitz. . . . . . . . . . . . . . . . . . . . .

6

1.1.3

Tập lồi và hàm lồi. . . . . . . . . . . . . . . . . . . . . . .

6

1.1.4

Hàm nửa lõm. . . . . . . . . . . . . . . . . . . . . . . . . .

8

1.1.5


Hàm đa trị. . . . . . . . . . . . . . . . . . . . . . . . . . .

8

Trên vi phân và dưới vi phân . . . . . . . . . . . . . . . . . . . .

9

1.2.1

Vi phân một phía. . . . . . . . . . . . . . . . . . . . . . .

9

1.2.2

Vi phân trên của hàm nửa lõm. . . . . . . . . . . . . . . . 10

1.2.3

Hàm marginal. . . . . . . . . . . . . . . . . . . . . . . . . 11

Nghiệm của phương trình vi phân . . . . . . . . . . . . . . . . . . 12
1.3.1

Nghiệm cổ điển của phương trình vi phân thường . . . . . 12

1.3.2

Nghiệm viscosity của phương trình Hamilton-Jacobi . . . . 13


Chương 2.
2.1

Kiến thức chuẩn bị

Những bài toán điều khiển tối ưu

15

Bài toán Mayer . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.1.1

Mở đầu. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.1.2

Giới thiệu bài toán Mayer. . . . . . . . . . . . . . . . . . . 18

1


2.2

2.1.3

Hàm giá. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2.1.4


Những điều kiện tối ưu. . . . . . . . . . . . . . . . . . . . 33

Bài toán Bolza . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

Chương 3.

Một số ví dụ áp dụng

70

3.1

Giới thiệu bài toán Bolza dạng đơn giản. . . . . . . . . . . . . . . 70

3.2

Một vài ví dụ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

Kết luận

77

Tài liệu tham khảo

78

2


DANH MỤC CÁC KÍ HIỆU

Ký hiệu

Ý nghĩa ký hiệu

R

Tập hợp các số thực

Rn

Không gian Euclid n-chiều

X

Tập con của Rn



Tập con mở của Rn

p, q hay p.q

Tích vô hướng của hai vector p và q trong Rn

| . | hay .

Chuẩn Euclid thông thường trong Rn

∂Ω


Biên của tập Ω

BR

Hình cầu mở tâm 0, bán kính R

[x, y]

Đoạn [x, y] = {λx + (1 − λ)y, λ ∈ [0, 1]}

coS

Bao lồi của tập S

Du(x)

Gradient của hàm u tại x

D+ u(x), D− u(x)

Vi phân trên và vi phân dưới của hàm u tại x

∇V (t, x)

∇V (t, x) = (Vx1 (t, x), Vx2 (t, x), . . . , Vxn (t, x))

l.s.c

Nửa liên tục dưới


u.s.c

Nửa liên tục trên

h.k.n

Hầu khắp nơi

C(X)

Tập các hàm liên tục từ X vào R

C 1 (Ω)

Tập các hàm khả vi liên tục từ X vào R

Lip(Rn )

Tập các hàm Lipschitz trên Rn

SC(Ω)

Tập các hàm nửa lõm trên Ω

SCL(Ω)

Tập các hàm nửa lõm với môđun tuyến tính trên Ω

C 1,1 (Ω)


Tập các hàm thuộc C 1,1 (Ω) và có đạo hàm cấp 1 Lipschitz

L1 (Ω)

Tập các hàm khả tích trên Ω

3


LỜI NÓI ĐẦU

Lịch sử phát triển điều khiển tự động được ghi nhận từ trước công nguyên,
bắt đầu từ đồng hồ nước có phao điều chỉnh Ktesibios ở Hy Lạp. Hệ điều chỉnh
nhiệt độ đầu tiên do Cornelis Drebble (1572-1633) người Hà Lan sáng chế. Hệ
điều chỉnh mức đầu tiên là của P olzunou người Nga (1756). Hệ điều chỉnh tốc
độ ứng dụng trong công nghệ đầu tiên là của Jame W att (1769). Thế chiến lần
thứ hai đòi hỏi sự phát triển về lý thuyết và ứng dụng để có những máy bay lái
tự động, những hệ điều khiển vị trí của pháo, điều khiển các loại vũ khí khác,
điều khiển tự động rada . . .
Những năm 1950, các phương pháp toán học và phân tích đã phát triển và
ứng dụng nhanh chóng. Các nguyên lý cực đại P ontryagin (1956), phương pháp
quy hoạch động Bellman (1957) của lý thuyết điều khiển tối ưu hiện đại là
những phương pháp rất hiệu quả để giải quyết nhiều bài toán. Vào năm 1766,
Euler và Lagrangre đưa ra phương pháp biến phân cổ điển. Từ những năm
1980, máy tính số bắt đầu sử dụng rộng rãi, cho phép điều khiển các đối tượng
khác nhau. Các nguyên tắc điều khiển thích nghi, điều khiển bền vững, điều
khiển mở, các “hệ thông minh” . . . ra đời và được áp dụng hiệu quả vào thực
tiễn.
Lý thuyết điều khiển tối ưu là một phần mở rộng của phép tính biến phân, là
một phương pháp tối ưu hóa cho các lý thuyết điều khiển phát sinh. Điều khiển

tối ưu có thể được xem như là một chiến lược điều khiển trong lý thuyết điều
khiển tự động. Lý thuyết điều khiển tối ưu có quan hệ mật thiết với phương
trình Hamilton - Jacobi; hàm giá là nghiệm viscosity của bài toán Cauchy của
phương trình Hamilton - Jacobi.
Các nghiên cứu ngày càng trở nên quan trọng và bức thiết hơn do nhu cầu
ứng dụng của lý thuyết điều khiển tối ưu vào các lĩnh vực khác như điều khiển
4


học, khoa học-kỹ thuật, quản lý kinh tế-tài chính . . . nên việc nghiên cứu các
mô hình điều khiển tối ưu mới cùng với phương pháp giải trong từng lĩnh vực
đã và đang được nhiều tác giả trong và ngoài nước quan tâm.
Dựa vào phương pháp tiếp cận trên, dưới sự hướng dẫn khoa học của PGS.TS
Nguyễn Hoàng, tôi chọn đề tài “Nghiệm viscosity đối với bài toán điều
khiển tối ưu”.
Trong luận văn này tôi sẽ mô tả cách tiếp cận bài toán điều khiển, tập trung
chú ý tính nửa lõm và kì dị của nghiệm. Điều khiển tối ưu có ứng dụng rộng
rãi, đa dạng, tôi không đưa ra cách giải quyết trọn vẹn bài toán mà chọn một
vài bài toán mẫu và phát biểu định lý trong trường hợp đó. Tôi sẽ trình bày về
bài toán điều khiển tối ưu với thời gian hạn chế và không hạn chế về mặt không
gian, đó là các bài toán Mayer và Bolza.
Cuốn luận văn được chia thành ba chương:
Chương 1. Kiến thức chuẩn bị
Chương này trình bày ngắn gọn các kiến thức cơ bản về hàm liên tục Lipschitz,
hàm lồi, hàm nửa lõm, hàm đa trị; trên vi phân và dưới vi phân của hàm nửa
lõm và các kết quả về nghiệm cổ điển của phương trình vi phân thường, nghiệm
viscosity của phương trình Hamilton-Jacobi nhằm phục vụ cho những chứng
minh ở chương sau.
Chương 2. Những bài toán điều khiển tối ưu
Chương này dành để trình bày các kết quả về sự tồn tại và duy nhất của điều

khiển tối ưu, tính chất của hàm giá V , nguyên lý cực đại Pontryagin của bài
toán điều khiển tối ưu với thời gian giới hạn và không gian không hạn chế đó là
các bài toán Mayer và Bolza.
Chương 3. Một số ví dụ áp dụng
Chương này dành để trình bày các kết quả về điều kiện cần và đủ để tồn tại
điều khiển tối ưu cho bài toán Bolza dạng đơn giản và khảo sát ví dụ minh họa.

5


Chương 1
Kiến thức chuẩn bị
1.1. Các khái niệm cơ bản của giải tích
Cho X là tập con khác rỗng của Rn .

1.1.1. Hàm nửa liên tục.
Định nghĩa 1.1.1. Một hàm f : X → R được gọi là nửa liên tục dưới (l.s.c)
tại x0 ∈ X nếu với mỗi ε > 0 tồn tại δ > 0 sao cho nếu x ∈ B(x0 , δ) thì
f (x) ≥ f (x0 ) − ε. Hàm f gọi là l.s.c trên X nếu f là l.s.c tại mọi điểm x0 ∈ X.
Hàm f : X → R được gọi là nửa liên tục trên nếu −f là l.s.c. Hiển nhiên hàm
số f : X → R là liên tục khi và chỉ khi nó vừa là l.s.c vừa là u.s.c.

1.1.2. Hàm liên tục Lipschitz.
Định nghĩa 1.1.2. Cho hàm số f : X → R. Ta nói hàm f là liên tục Lipschitz
trên X nếu tồn tại L > 0 sao cho: | f (x1 ) − f (x2 ) |≤ L. | x1 − x2 |, ∀ x1 , x2 ∈ X.
Định nghĩa 1.1.3. Hàm số f : X → R được gọi là liên tục Lipschitz địa phương
trên X nếu với mỗi x ∈ X tồn tại lân cận Ux của x sao cho f liên tục Lipschitz
trên Ux .
Định lý 1.1.1. (Định lý Rademacher) Nếu hàm f : X → R là hàm liên tục
Lipschitz địa phương thì f khả vi hầu khắp nơi trên X.


1.1.3. Tập lồi và hàm lồi.
Định nghĩa 1.1.4.
6


(i) Một tập C ⊂ Rn là tập lồi nếu với mọi x0 , x1 ∈ C, đoạn thẳng [x0 , x1 ] được
chứa trong C .
(ii) Một hàm L : C −→ R, với C ⊂ Rn lồi, được gọi là lồi nếu
λL(x) + (1 − λ)L(y) ≥ L(λx + (1 − λ)y), ∀ x, y ∈ C, λ ∈ [0, 1].
(iii) Một hàm L : C −→ R, với C ⊂ Rn lồi, được gọi là lồi chặt nếu
λL(x) + (1 − λ)L(y) > L(λx + (1 − λ)y), ∀ x, y ∈ C, λ ∈ (0, 1).
(iv) Một hàm L : C −→ R được gọi là lõm nếu −L là lồi.
Định lý 1.1.2. Một hàm L : A −→ R, với A ⊂ Rn lồi mở, là lồi nếu và chỉ nếu
nó liên tục và thỏa mãn
L(x + h) + L(x − h) − 2L(x) ≥ 0
với mọi x, h sao cho x ± h ∈ A.
Định nghĩa 1.1.5. Cho V ⊂ Rn là một tập lồi. Với v¯ ∈ V, nón trực giao với V
tại v¯ là tập hợp
NV (¯
v ) = {p ∈ Rn : p.(¯
v − v) ≥ 0, ∀ v ∈ V }.
Định nghĩa 1.1.6. Hàm giá của một tập lồi được cho bởi
σV (p) = sup v.p, p ∈ Rn .
v∈V

Định nghĩa 1.1.7. Cho S ⊂ Rn , bao lồi của S là tập hợp tất cả các tổ hợp lồi
của những điểm thuộc S và được kí hiệu là coS.
Định lý 1.1.3. Cho S ⊂ Rn là một tập compact và đặt T = coS. Khi đó
max x.p = σT (p), ∀ p ∈ Rn .

x∈S

Định lý 1.1.4. Cho V, M ⊂ Rn là những tập lồi, với V compact. Hai tính chất
sau là tương đương:
(i) ∃ v¯ ∈ V : M ⊂ NV (¯
v );
7


(ii) σV (tp0 + (1 − t)p1 ) = tσV (p0 ) + (1 − t)σV (p1 ), ∀ p0 , p1 ∈ M, ∀ t ∈ [0, 1].
Định lý 1.1.5. Cho v ∈ L1 ([0, T ], Rn ) sao cho v(t) ∈ C hầu khắp nơi, với
C ⊂ Rn là một tập đóng và lồi. Khi đó
T

1
T

v(t)dt ∈ C.
0

1.1.4. Hàm nửa lõm.
Định nghĩa 1.1.8. Hàm u : X → R là hàm nửa lõm nếu tồn tại một hàm nửa
liên tục dưới không giảm ω : R+ → R+ mà lim+ ω(ρ) = 0 và
ρ→0

λu(x) + (1 − λ)u(y) − u(λx + (1 − λ)y) ≤ λ(1 − λ) | x − y | ω(| x − y |),
với bất kì cặp x, y ∈ X sao cho [x, y] chứa trong X và với bất kì λ ∈ [0, 1]. Ta
gọi ω là môđun nửa lõm của u trên X.
Nếu ω(h) =


C
2h

thì hàm nửa lõm được gọi là hàm nửa lõm với môđun tuyến

tính. Hằng số C được gọi là hằng số nửa lõm của u trên X.
Một hàm v được gọi là nửa lồi trên X nếu −v là nửa lõm.
Định lý 1.1.6. Cho A ⊂ Rn là một tập mở. Một hàm u : A → R là nửa lõm
với môđun tuyến tính nếu và chỉ nếu nó liên tục trên A và tồn tại C ≥ 0 sao
cho
2

u(x + h) + u(x − h) − 2u(x) ≤ C |h| ,
với x, h ∈ Rn sao cho [x − h, x + h] ⊂ A.

1.1.5. Hàm đa trị.
Định nghĩa 1.1.9. Một hàm đa trị Γ : Rm

Rn là một hàm sao cho tương

ứng với mỗi x ∈ Rm là một tập hợp Γ(x) ⊂ Rn (có thể rỗng). Tập hợp
D(Γ) = {x ∈ Rm : Γ(x) = ∅}.
được gọi là miền xác định của Γ.

8


Định nghĩa 1.1.10. Cho Γ : Rm

Rn là một hàm đa trị.


(i) Γ được gọi là có giá trị đóng (tương ứng lồi, compact) nếu Γ(x) là đóng (tương
ứng lồi, compact) với mỗi x ∈ Rm .
(ii) Γ được gọi là đo được nếu với mỗi tập mở A ⊂ Rn , ảnh ngược của Γ cho bởi
A
Γ−1 (A) := {x ∈ Rm : Γ(x) ∩ A = ∅}
là đo được.
Định lý 1.1.7. Cho Γ : Rm

Rn là một hàm đa trị đo được và có giá trị đóng.

Khi đó Γ có một phép chọn đo được. Nghĩa là tồn tại φ : D(Γ) → Rm sao cho
∀ x ∈ D(Γ), φ(x) ∈ Γ(x) và φ đo được.
Định lý 1.1.8. Cho Γ : Rm

Rn là một hàm đa trị và giả sử rằng đồ thị của

Γ, cho bởi
{(x, y) : x ∈ Rm , y ∈ Γ(x)},
là đóng. Khi đó Γ đo được và có giá trị đóng.

1.2. Trên vi phân và dưới vi phân
Cho A ⊂ Rn là một tập mở.

1.2.1. Vi phân một phía.
Định nghĩa 1.2.1. Cho u : A → R là một hàm xác định trên tập mở A ⊂ Rn .
Vi phân trên của hàm u tại điểm x, kí hiệu là D+ u(x) và được định nghĩa là:
D+ u(x) = {p ∈ Rn : lim sup
y→x


u(y) − u(x) − p, y − x
≤ 0}.
|y−x|

Một cách tương tự, vi phân dưới của hàm u tại điểm x được định nghĩa là:
D− u(x) = {p ∈ Rn : lim inf
y→x

u(y) − u(x) − p, y − x
≥ 0}.
|y−x|

Định lý 1.2.1. Cho u : A → R và x ∈ A. Khi đó những tính chất sau đúng.
(i) D+ u(x) và D− u(x) là những tập lồi đóng (có thể rỗng).
9


(ii) D+ u(x) và D− u(x) đều là tập không rỗng nếu và chỉ nếu u khả vi tại x, trong
trường hợp này ta có
D+ u(x) = D− u(x) = {Du(x)}.
Định nghĩa 1.2.2. Cho u : A → R là một hàm Lipschitz địa phương. Một
vectơ p ∈ Rn được gọi là một građien tới được của u tại x ∈ A nếu có một dãy
{xk } ⊂ A\{x} sao cho u khả vi tại xk với mỗi k ∈ N, và
lim xk = x,

k→∞

lim Du(xk ) = p.

k→∞


Tập hợp tất cả các građien tới được của của u tại x được ký hiệu bởi D∗ u(x).

1.2.2. Vi phân trên của hàm nửa lõm.
Sau đây là một số mệnh đề và định lý liên quan đến hàm nửa lõm cần thiết
cho chương 2. Các chứng minh xem ở tài liệu [2].
Mệnh đề 1.2.1. Cho u : A → R là hàm nửa lõm với môđun ω và cho x ∈ A.
Khi đó, một vector p ∈ Rn thuộc D+ u(x) nếu và chỉ nếu
u(y) − u(x) − p, y − x ≤| y − x | ω(| y − x |)
với bất kì y ∈ A mà [y, x] ⊂ A.
Mệnh đề 1.2.2. Cho u : A → R là hàm nửa lõm với môđun ω và lấy x ∈ A.
Khi đó những tính chất sau đúng.
(a) Nếu {xk } là một dãy trong A hội tụ đến x và nếu pk ∈ D+ u(xk ) hội tụ đến
một vectơ p ∈ Rn , khi đó p ∈ D+ u(x).
(b) D∗ u(x) ⊂ ∂D+ u(x).
(c) D+ u(x) = ∅.
(d) Nếu D+ u(x) là tập đơn tử, khi đó u khả vi tại x.
(e) Nếu D+ u(y) là tập đơn tử với mỗi y ∈ A, khi đó u ∈ C 1 (A).

10


Mệnh đề 1.2.3. Cho u : A → R là hàm nửa lõm và lấy x ∈ A. Khi đó
D+ u(x) = coD∗ u(x).
Hệ quả 1.2.1. Cho A ⊂ Rn là một tập lồi mở và u : A → R vừa nửa lồi và
nửa lõm với môđun tuyến tính với hằng số C. Khi đó u ∈ C 1,1 (A) với hằng số
Lipschitz của Du bằng C.
Bổ đề 1.2.1. Với bất kì u ∈ SC((0, T ) × A), ta có
D+ u(t, x) = ∇+ u(t, x) ∀(t, x) ∈ (0, T ) × A.
x


Định lý 1.2.2. Cho một miền mở Ω ⊂ Rn . Cho x0 ∈ Ω là điểm kì dị của hàm
u ∈ SCL(Ω) nghĩa là u không khả vi tại x0 . Giả sử rằng
∂D+ u(x0 )\D∗ u(x0 ) = ∅.
Khi đó tồn tại một cung kì dị Lipschitz x : [0, ρ] → Rn của u, với x(0) = x0 và
một số dương δ sao cho
lim+

s→0

x(s) − x0
=0
s

diam(D+ u(x(s))) ≥ δ ∀ s ∈ [0, ρ].
Hơn nữa, x(s) = x0 với bất kì s ∈ (0, ρ].

1.2.3. Hàm marginal.
Định nghĩa 1.2.3. Cho một hàm u : A → R được gọi là hàm marginal nếu nó
có thể được viết dưới dạng
u(x) = inf F (s, x),
s∈S

với S là một không gian tôpô và hàm F : S × A → R trơn theo biến x.
Định lý 1.2.3. Cho A ⊂ Rn là một tập mở và S ⊂ Rm là một tập compact.
Cho hàm F = F (s, x) và đạo hàm riêng Dx F liên tục trên S × A, ta đặt u(x) =
min F (s, x). Với x ∈ A, ta đặt
s∈S

M (x) = {s ∈ S : u(x) = F (s, x)},

11

Y (x) = {Dx F (s, x) : s ∈ M (x)}.


Khi đó, với bất kì x ∈ A

D− u(x) =

D+ u(x) = coY (x)


{p} nếu Y (x) = {p}

∅

nếu Y (x) không đơn tử.

1.3. Nghiệm của phương trình vi phân
1.3.1. Nghiệm cổ điển của phương trình vi phân thường
Định nghĩa 1.3.1. Cho một tập mở Ω ⊂ R × Rn và một hàm F : Ω → Rn , ta
xét phương trình vi phân
x (t) = F (t, x(t)).

(1.1)

Trên Ω ta giả sử,
(C) Hàm x → F (t, x) liên tục với bất kì t cố định và hàm t → F (t, x) là đo được
với bất kì x cố định.
Ta nói rằng x : I → Rn , với I ⊂ R là một khoảng, là nghiệm của (1.1) nếu nó

liên tục tuyệt đối và thỏa
∀ t ∈ I, (t, x(t)) ∈ Ω,

x (t) = F (t, x(t)), t ∈ I hầu khắp nơi.

Định lý 1.3.1. Cho F : Ω → Rn thỏa (C) và giả sử thêm rằng với mỗi tập
compact K ⊂ Ω tồn tại MK , LK > 0 để mà
|F (t, x)| ≤ MK , ∀ (t, x) ∈ K,
|F (t, x1 ) − F (t, x2 )| ≤ LK |x1 − x2 |, ∀ (t, x1 ), (t, x2 ) ∈ K.
Khi đó với bất kì (t0 , x0 ) ∈ Ω tồn tại δ > 0 sao cho bài toán Cauchy
x = F (t, x), x(t0 ) = x0
có một nghiệm duy nhất trên khoảng t ∈ (t0 − δ, t0 + δ).
12


Định lý 1.3.2. (Bất đẳng thức Gronwall) Cho z : [t0 , t1 ] → R là một hàm liên
tục tuyệt đối không âm thỏa
t

z(t) ≤ k(t) +

z(s)v(s)ds, t ∈ [t0 , t1 ],
t0

với k ∈ C 1 ([t0 , t1 ]), v ∈ C([t0 , t1 ]), k, v ≥ 0. Khi đó
 t

t
z(t) ≤ k(t0 )exp 


v(s)ds +

t0



k (s)exp 
t0



t

v(r)dr ds
s

với mọi t ∈ [t0 , t1 ]. Đặc biệt, nếu k(t) ≡ k và v(t) ≡ L ta có
z(t) ≤ keL(t−t0 ) , ∀ t ∈ [t0 , t1 ].
Định lý 1.3.3. Cho F : Ω → Rn thỏa điều kiện của Định lý 1.3.1 và giả sử thêm
là toán tử Jacobi Fx đối với biến x tồn tại và liên tục đối với x. Cho (t0 , x0 ) ∈ Ω
và đặt xˆ(.) = x(.; t0 , x0 ). Lấy I là một khoảng compact để mà xˆ(t) được xác định.
Với v¯ ∈ Rn , gọi v(t) là một nghiệm của bài toán Cauchy tuyến tính
v (t) = Fx (t, xˆ(t))v(t)
với điều kiện đầu v(t0 ) = v¯. Khi đó, với bất kì t ∈ I, ta có
lim

ε→0

x(t; t0 , x0 + ε¯
v ) − xˆ(t)

− v(t) = 0
ε

giới hạn là đều với t ∈ I, |¯
v | ≤ 1.

1.3.2. Nghiệm viscosity của phương trình Hamilton-Jacobi
Cho Ω ⊂ Rn là một tập mở và H ∈ C(Ω × R × Rn ). Ta xét phương trình phi
tuyến tính cấp 1
H(x, u, Du) = 0, x ∈ Ω ⊂ Rn ,

(1.2)

với u : Ω → R.
Định nghĩa 1.3.2. Một hàm u ∈ C(Ω) được gọi là một nghiệm dưới viscosity
của phương trình (1.2) nếu, với bất kì x ∈ Ω, ta có
H(x, u(x), p) ≤ 0,
13

∀ p ∈ D+ u(x).

(1.3)


Một cách tương tự, một hàm u ∈ C(Ω) được gọi là một nghiệm trên viscosity
của phương trình (1.2) nếu, với bất kì x ∈ Ω, ta có
H(x, u(x), p) ≥ 0,

∀ p ∈ D− u(x).


(1.4)

Nếu u thỏa cả hai tính chất trên, nó được gọi là một nghiệm viscosity của phương
trình (1.2).
Định lý 1.3.4. Cho uk ∈ C(Ω) là nghiệm dưới viscosity (tương ứng là nghiệm
trên viscosity) của
Hk (x, uk , Duk ) = 0
với Hk ∈ C(Ω × R × Rn ). Giả sử rằng uk → u và Hk → H là hội tụ đều trên
từng tập con compact của Ω và Ω × R × Rn tương ứng. Khi đó u là một nghiệm
dưới viscosity (tương ứng là nghiệm trên viscosity) của
H(x, u, Du) = 0.
Định lý 1.3.5. Cho H ∈ C([0, T ] × Rn × Rn ) thỏa
|H(t, x, p) − H(t, x, q)| ≤ K(|x| + 1)|p − q|, ∀ t, x, p, q
với K > 0. Giả sử rằng với mọi R > 0, tồn tại mR : [0, ∞) → [0, ∞) liên tục,
không giảm, với mR (0) = 0 và sao cho
|H(t, x, p) − H(t, y, p)| ≤ mR (|x − y|) + mR (|x − y||p|),
∀ x, y ∈ BR , p ∈ Rn , t ∈ [0, T ].
Cho u1 , u2 ∈ C([0, T ] × Rn ) theo thứ tự là một nghiệm dưới và trên viscosity của
phương trình
ut + H(t, x, ∇u(t, x)) = 0 (t, x) ∈ (0, T ) × Rn .
Khi đó
sup (u1 − u2 ) ≤ sup(u1 (0, .) − u2 (0, .)).
Rn ×[0,T ]

Rn

14


Chương 2

Những bài toán điều khiển tối ưu
Nội dung của chương được trích dẫn ở tài liệu [3].

2.1. Bài toán Mayer
2.1.1. Mở đầu.
Định nghĩa 2.1.1. Một hệ điều khiển là cặp (f, U ) với U ⊂ Rm là một tập
đóng và f : Rn × U → Rn là một hàm liên tục. Tập U được gọi là tập điều khiển,
f được gọi là động lực của hệ điều khiển. Phương trình trạng thái của hệ điều
khiển là


y (t) = f (y(t), u(t)), t ∈ [t0 , ∞) (hầu khắp nơi)

(2.1)


y(t ) = x
0
với t0 ∈ R, x ∈ Rn và u ∈ L1loc ([t0 , ∞), U ). Hàm u được gọi là một chiến lược
điều khiển hoặc đơn giản là một điều khiển. Ta kí hiệu nghiệm của (2.1) bởi
y(.; t0 , x, u) và ta gọi nó là quỹ đạo của hệ ứng với điều kiện đầu y(t0 ) = x và
điều khiển u.
Ta cần một số giả thiết cho hệ điều khiển, sẽ được dùng cho hầu hết các kết
quả của chương.
(H0) Tập điều khiển U là tập compact.
(H1) Tồn tại K1 > 0 mà |f (x2 , u)−f (x1 , u)| ≤ K1 |x2 −x1 | với x1 , x2 ∈ Rn , u ∈ U .

15



(H2) fx tồn tại và liên tục, hơn nữa tồn tại K2 > 0 sao cho
fx (x2 , u) − fx (x1 , u) ≤ K2 |x2 − x1 | với mỗi x1 , x2 ∈ Rn , u ∈ U .
Giả thiết (H1) suy ra f Lipschitz theo biến x nên tồn tại duy nhất nghiệm toàn
cục cho phương trình trạng thái (2.1) với bất kì t0 , x và u. Theo (H0), (H1) và
f liên tục suy ra
|f (x, u)| ≤ C + K1 |x|,

x ∈ Rn , u ∈ U,

(2.2)

với C = max |f (0, u)|.
u∈U

Bổ đề 2.1.1. Cho t0 , t1 , với t0 < t1 .
(i) Cho f thỏa (H0) và (H1). Khi đó với mỗi r > 0 tồn tại R > 0 để
|y(t; t0 , x, u)| ≤ R, ∀ t ∈ [t0 , t1 ]

(2.3)

với mọi điều khiển u : [t0 , t1 ] → U và với mọi x ∈ Br .
(ii) Cho f thỏa (H1). Khi đó, tồn tại c > 0 sao cho
|y(t; t0 , x0 , u) − y(t; t0 , x1 , u)| ≤ c|x0 − x1 |, ∀ t ∈ [t0 , t1 ]

(2.4)

với mọi u : [t0 , t1 ] → U và với mọi x0 , x1 ∈ Rn .
(iii) Nếu f thỏa (H1) và (H2), khi đó hằng số c trong (ii) được chọn sao cho
y(t; t0 , x0 , u) + y(t; t0 , x1 , u) − 2y(t; t0 ,


x0 + x1
, u) ≤ c|x0 − x1 |2
2

đúng với mọi u : [t0 , t1 ] → U, x0 , x1 ∈ Rn và t ∈ [t0 , t1 ].
Chứng minh. Để đơn giản, ta đặt y(.) = y(.; t0 , x, u). Theo (2.2), ta có
t

|y(t)| ≤ |x| +

(C + K1 |y(s)|)ds
t0
t

≤ |x| + C(t1 − t0 ) + K1

|y(s)|ds.
t0

16

(2.5)


Theo Định lý 1.3.2, suy ra
|y(t)| ≤ [|x| + C(t1 − t0 )]eK1 (t1 −t0 ) , t ∈ [t0 , t1 ]
≤ [r + C(t1 − t0 )]eK1 (t1 −t0 )
nên ta có (2.3). Để chứng minh (2.4), ta đặt yi (t) := y(t; t0 , xi , u), với i = 0, 1.
Theo (H1) ta có
t


[f (y0 (s), u(s)) − f (y1 (s), u(s))]ds

|y0 (t) − y1 (t)| = x0 − x1 +
t0

t

≤ |x0 − x1 | + K1

|y0 (s) − y1 (s)|ds.
t0

Theo Định lý 1.3.2, suy ra
|y0 (t) − y1 (t)| ≤ |x0 − x1 |eK1 (t1 −t0 )
≤ c|x0 − x1 |.
Theo (H2) ta có
f (x0 , u) + f (x1 , u) − 2f
1

=

fx
0
1



x0 + x1
,u

2
1

x1 − x0
x1 − x0
x0 + x1
+t
,u .
dt −
2
2
2

fx x0 + t

x1 − x0
x1 − x0
,u .
dt
2
2

0

K2

x0 + x1
x1 − x0
K2
2

− x0
dt =
|x1 − x0 |
2
2
4

0

với mọi x0 , x1 ∈ Rn , u ∈ U . Hơn nữa, theo (H1) ta có
|f (x0 , u) + f (x1 , u) − 2f (x2 , u)| ≤ f (x0 , u) + f (x1 , u) − 2f (
+ 2 f(


x1 + x0
, u)
2

x1 + x0
, u) − f (x2 , u)
2

K2
2
|x1 − x0 | + K1 |x0 + x1 − 2x2 |
4

với mọi x0 , x1 , x2 ∈ Rn , u ∈ U . Ta đặt y0 (t) := y(t; t0 , x0 , u), y1 (t) := y(t; t0 , x1 , u),
17



0
y2 (t) := y(t; t0 , x1 +x
2 , u). Theo Định lý 1.3.2 và (2.4), ta được

t

[f (y0 (s), u(s)) + f (y1 (s), u(s)) − 2f (y2 (s), u(s))]ds

|y0 (t) + y1 (t) − 2y2 (t)| =
t0

t

t

K2

4

2

t0
t

t0



|y0 (s) + y1 (s) − 2y2 (s)| ds


|y0 (s) − y1 (s)| ds + K1

K2 2
2
c (t1 − t0 ) |x0 − x1 | + K1
4

|y0 (s) + y1 (s) − 2y2 (s)| ds
t0

K2 2
2
c (t1 − t0 ) |x0 − x1 | eK1 (t1 −t0 ) ,

4
ta được (2.5).

2.1.2. Giới thiệu bài toán Mayer.
Một bài toán điều khiển tối ưu bao gồm việc chọn chiến lược điều khiển u
trong phương trình trạng thái (2.1) nhằm cực tiểu hóa hàm mục tiêu đã cho.
Bây giờ, ta giới thiệu bài toán Mayer, một dạng bài toán điều khiển tối ưu sẽ
được tìm hiểu sau đây.
Cho g : Rn → R là hàm liên tục và cho T > 0. Với mỗi (t, x) ∈ [0, T ] × Rn , ta
xét bài toán sau:
(MP) cực tiểu hóa hàm g(y(T ; t, x, u)) với tất cả điều khiển u : [t, T ] → U .
Định nghĩa 2.1.2. Một điều khiển u : [t, T ] → U mà infimum của (MP) đạt
được thì u được gọi là một điều khiển tối ưu cho bài toán (MP) với điểm đầu
(t, x). Khi đó nghiệm y(.) = y(.; t, x, u) tương ứng của phương trình trạng thái
được gọi là quỹ đạo điều khiển hoặc một cực tiểu hóa.

Hàm g được gọi là chi phí cuối của bài toán Mayer. Một bài toán điều khiển
tối ưu mà ta quan tâm đến dáng điệu của những quỹ đạo tới một thời gian hạn
chế cho trước được gọi là bài toán với thời gian hạn chế.
Bây giờ ta sẽ tìm hiểu sự tồn tại điều khiển tối ưu cho bài toán Mayer.

18


Định lý 2.1.1. Cho f thỏa (H0), (H1), g ∈ C(Rn ) và giả sử
f (x, U ) := {f (x, u) : u ∈ U }.

(2.6)

là tập lồi với x ∈ Rn . Khi đó với mọi (t, x) ∈ [0, T ] × Rn tồn tại một điều khiển
tối ưu cho bài toán (MP).
Để chứng minh Định lý 2.1.1, ta dùng kết quả của hai Định lý sau.
Để đơn giản, ta đặt F(x) = f (x, U ). Một hàm số liên tục tuyệt đối y : [t0 , t1 ] →
Rn là nghiệm của bao hàm thức vi phân
y ∈ F(y)

(2.7)

nếu nó thỏa y (t) ∈ f (y(t), U ) với mỗi t ∈ [t0 , t1 ] hầu khắp nơi. Nếu y là nghiệm
của phương trình trạng thái (2.1) cho mỗi trạng thái điều khiển u, khi đó nó là
nghiệm của bao hàm thức vi phân (2.7). Kết quả sau nói lên điều ngược lại vẫn
đúng.
Định lý 2.1.2. (Bổ đề Filippov) Cho y : [t0 , t1 ] → Rn là một nghiệm của bao
hàm thức vi phân (2.7). Khi đó tồn tại một hàm đo được u : [t0 , t1 ] → U sao cho
y (t) ∈ f (y(t), u(t)) với mỗi t ∈ [t0 , t1 ] hầu khắp nơi.
Định lý 2.1.3. Giả sử (H0), (H1) thỏa mãn và f (x, U ) là tập lồi với mọi x ∈ Rn .

Cho {yk } là một dãy các quỹ đạo của (2.1) trên [t0 , t1 ] là yk (.) = y(.; t0 , xk , uk )
với mỗi xk ∈ Rn và uk : [t0 , t1 ] → U . Nếu các quỹ đạo yk bị chặn đều, khi đó
tồn tại một dãy con {ykn } hội tụ đều đến một cung y¯ : [t0 , t1 ] → Rn là quỹ đạo
của (2.1).
Chú ý 2.1.1. Nếu f (x, U ) không lồi, tính compact của các quỹ đạo có thể không
đúng. Xét ví dụ hệ thống một chiều y = u, u ∈ U với U = {−1, 1}. Khi đó ta
có thể xét hệ điều khiển uk : [0, 1] → U lần lượt nhận giá trị 1 và -1 trên các
khoảng có độ dài 1/k. Ta đặt yk (.) = yk (.; 0, 0, uk ). Khi đó yk → y¯ hội tụ đều
với y¯ ≡ 0. Tuy nhiên y¯ không là một quỹ đạo của hệ thống vì y¯ ≡ 0 ∈
/ U.

19


Chứng minh. (Chứng minh Định lý 2.1.1)
Cố định (t, x) ∈ [0, T )×Rn , ta có thể tìm một dãy các điều khiển uk : [t, T ] → U ,
đặt yk (.) = y(.; t, x, uk ), sao cho
lim g(yk (T )) =

k→∞

inf

g(y(T ; t, x, u)).

(2.8)

u:[t,T ]→U

Một dãy uk như vậy được gọi là dãy cực tiểu. Ta sẽ chứng minh rằng dãy con

của dãy {yk } hội tụ đến một quỹ đạo tối ưu. Do f thỏa (H0), (H1) nên theo Bổ
đề 2.1.1, tất cả các quỹ đạo của hệ thống bắt đầu tại (t, x) bị chặn trên [t, T ].
Theo Định lý 2.1.3, tồn tại một dãy con của dãy {yk } cũng kí hiệu là {yk } hội
tụ đều đến cung y¯ : [t, T ] → Rn mà là một quỹ đạo của hệ thống. Ta có y¯(t) = x
vì yk (t) = x với mọi k. Hơn nữa do g liên tục, theo (2.8)
g(¯
y (T )) = lim g(yk (T )) =
k→∞

inf

g(y(T ; t, x, u)),

u:[t,T ]→U

nên y¯ là tối ưu của bài toán (MP).

2.1.3. Hàm giá.
Trong suốt mục này ta giả sử các giả thiết (H0), (H1) được thỏa mãn.
Định nghĩa 2.1.3. Cho (t, x) ∈ [0, T ] × Rn , ta định nghĩa
V (t, x) = inf{g(y(T ; t, x, u)) : u : [t, T ] → U đo được }.
Hàm V được gọi là hàm giá của bài toán điều khiển (MP).
Từ tính liên tục của hàm g và đánh giá (2.3) ta thấy rằng V hữu hạn khắp
nơi.
Định lý 2.1.4. Với mỗi (t, x) ∈ (0, T ) × Rn và mỗi s ∈ [t, T ], ta có
V (t, x) =

inf

V (s; y(s; t, x, u)).


(2.9)

u:[t,s]→U

Ngoài ra, một điều khiển u : [t, T ] → U là tối ưu với (t, x) nếu và chỉ nếu
V (t, x) = V (s, y(s; t, x, u)) với mọi s ∈ [t, T ].
20

(2.10)


Nếu hàm V thỏa các tính chất của Định lý 2.1.4, thì ta nói V thỏa nguyên
lý quy hoạch động.
Chứng minh. Với bất kì s ∈ [t, T ], u ∈ L1 ([t, s], U ) và để đơn giản ta đặt x1 =
y(s; t, x, u). Với bất kì ε > 0, ta có thể tìm v ∈ L1 ([s, T ], U ) sao cho
g(y(T ; s, x1 , v)) ≤ V (s, x1 ) + ε.
Ta định nghĩa ω ∈ L1 ([t, T ], U ) như sau

ω(τ ) =



u(τ ), t ∈ [t, s]

v(τ ), t ∈ (s, T ].

Khi đó, ta có y(T ; t, x, ω) = y(T ; s, x1 , v). Hơn nữa
V (t, x) ≤ g(y(T ; t, x, ω)) = g(y(T ; s, x1 , v)) ≤ V (s, x1 ) + ε.
Do ε > 0 tùy ý, suy ra

V (t, x) ≤ V (s, x1 ) = V (s, y(s; t, x, u)), ∀u ∈ L1 ([t, s], U ).
Suy ra V (t, x) ≤

inf

V (s; y(s; t, x, u)).

u:[t,s]→U

Ngược lại, cố định ε > 0 và lấy ω ∈ L1 ([t, T ], U ) sao cho V (t, x) ≥ g(y(T ; t, x, ω))−
ε. Ta gọi u, v lần lượt là hai hàm hạn chế của ω trên [t, s] và [s, T ]. Ta đặt
x1 = y(s; t, x, u), ta có
V (s, x1 ) ≤ g(y(T ; s, x1 , v)) = g(y(T ; t, x, ω)) ≤ V (t, x) + ε.
Vì ε > 0 tùy ý nên ta có V (s, x1 ) ≤ V (t, x). Suy ra V (t, x) ≥

inf

V (s; y(s; t, x, u)).

u:[t,s]→U

Do đó có được (2.9).
Giả sử u là nghiệm tối ưu của bài toán. Với mỗi s ∈ [t, T ], suy ra g(y(T ; t, x, u)) =
V (t, x) =

inf

g(y(T ; t, x, u)). Nên với mọi ε > 0, ta có V (t, x) ≥ g(y(T ; t, x, u))−

u:[t,s]→U


ε. Gọi v, ω lần lượt là hai hàm hạn chế của u trên [t, s] và [s, T ]. Ta đặt
x1 = y(s; t, x, v), tương tự như trên ta có g(y(T ; s, x1 , ω)) = g(y(T ; t, x, u)).
Hơn nữa
V (s, x1 ) ≤ g(y(T ; s, x1 , ω)) = g(y(T ; t, x, u)) ≤ V (t, x) + ε.
21


Vì ε > 0 tùy ý, suy ra V (s, y(s; t, x, v)) ≤ V (t, x), hay V (s, y(s; t, x, u)) ≤ V (t, x).
Theo (2.9), ta có được (2.10).
Ngược lại, giả sử có (2.10), ta chọn s = T , khi đó V (t, x) = V (T, y(T ; t, x, u))
và theo (2.9) suy ra u là điều khiển tối ưu của bài toán.
Định lý 2.1.5. Cho f thỏa (H0), (H1) và g ∈ Liploc (Rn ). Khi đó V ∈ Liploc ([0, T ]×
Rn ).
Chứng minh. Với mọi r > 0, ta muốn chứng minh rằng V liên tục Lipschitz trên
[0, T ] × Br . Theo đánh giá (2.3), tồn tại R > 0 sao cho tất cả các quỹ đạo chấp
nhận được bắt đầu từ (t, x) với x ∈ Br nằm trong BR . Khi đó ta kí hiệu Kg
là hằng số Lipschitz của g trên BR và Mf = sup |f (x, u)| với (x, u) ∈ Br × U .
Ta lấy x1 , x2 ∈ Br , t ∈ [0, T ] và giả sử V (t, x1 ) ≤ V (t, x2 ). Với mọi ε > 0, theo
định nghĩa của V , ta có thể tìm được một điều khiển u : [t, T ] → U sao cho
g(y(T ; t, x1 , u)) ≤ V (t, x1 ) + ε. Đặt x¯1 = y(T ; t, x1 , u), x¯2 = y(T ; t, x2 , u), theo
(2.4), ta có |¯
x1 − x¯2 | ≤ c |x1 − x2 |, với c > 0 hằng số. Ta có
V (t, x2 ) ≤ g(¯
x2 ) ≤ g(x¯1 ) + Kg |¯
x1 − x¯2 |
≤ V (t, x1 ) + ε + cKg |x1 − x2 | .
Vì ε > 0 tùy ý, ta được
|V (t, x1 ) − V (t, x2 )| ≤ cKg |x1 − x2 | .


(2.11)

Lấy hai điểm bất kì (t1 , x1 ), (t2 , x2 ) ∈ [0, T ] × Br và giả sử t1 < t2 . Với mọi ε > 0,
theo (2.9) ta có thể tìm u : [t1 , t2 ] → U sao cho, với x¯ = y(t2 ; t1 , x1 , u), ta có
0 ≤ V (t2 , x¯) − V (t1 , x1 ) ≤ ε.
Mặt khác theo (2.11), ta có
|V (t2 , x¯) − V (t2 , x2 )| ≤ cKg (|¯
x − x1 | + |x1 − x2 |)
≤ cKg (Mf |t2 − t1 | + |x1 − x2 |).

22

(2.12)


×