Tải bản đầy đủ (.pdf) (72 trang)

Bài toán điều khiển tối ưu toàn phương mô tả bởi hệ phương trình vi phân đại số tuyến tính

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (474.81 KB, 72 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2

CHU THỊ HỒNG

BÀI TOÁN ĐIỀU KHIỂN TỐI ƯU TOÀN PHƯƠNG
MÔ TẢ BỞI HỆ PHƯƠNG TRÌNH
VI PHÂN ĐẠI SỐ TUYẾN TÍNH

LUẬN VĂN THẠC SĨ TOÁN HỌC

HÀ NỘI, 2015


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2

CHU THỊ HỒNG

BÀI TOÁN ĐIỀU KHIỂN TỐI ƯU TOÀN PHƯƠNG
MÔ TẢ BỞI HỆ PHƯƠNG TRÌNH
VI PHÂN ĐẠI SỐ TUYẾN TÍNH

Chuyên ngành: Toán giải tích
Mã số: 60 46 01 02

LUẬN VĂN THẠC SĨ TOÁN HỌC

Người hướng dẫn khoa học: PGS. TS. TẠ DUY PHƯỢNG

HÀ NỘI, 2015




Lời cảm ơn
Luận văn được thực hiện và hoàn thành dưới sự hướng dẫn khoa học của
PGS. TS. Tạ Duy Phượng. Tôi xin được gửi lời cảm ơn sâu sắc đến Thầy hướng
dẫn khoa học của mình, người đã giao đề tài và tận tình hướng dẫn trong suốt
quá trình tìm hiểu, nghiên cứu để tôi có thể hoàn thành luận văn này.
Nhân dịp này, tôi cũng xin chân thành cảm ơn tới toàn thể các Thầy Cô giáo
khoa Toán đặc biệt là chuyên ngành Toán Giải tích, Phòng Sau đại học, trường
Đại học Sư phạm Hà Nội 2 đã giảng dạy và giúp đỡ tôi trong suốt quá trình học
tập và nghiên cứu tại trường.
Cuối cùng, tôi xin gửi lời cảm ơn chân thành tới gia đình và bạn bè đã cổ vũ,
động viên, giúp đỡ tôi trong quá trình học tập và thực hiện luận văn này.
Hà Nội, tháng 6 năm 2015
Người thực hiện

Chu Thị Hồng


Lời cam đoan
Tôi xin cam đoan, dưới sự hướng dẫn của PGS. TS. Tạ Duy Phượng, luận văn
chuyên ngành Toán giải tích với đề tài: Bài toán điều khiển tối ưu toàn phương
mô tả bởi hệ phương trình vi phân đại số tuyến tính được hoàn thành bởi sự
nhận thức và tìm hiểu của bản thân tác giả.
Trong quá trình nghiên cứu và thực hiện luận văn, tác giả đã kế thừa những
kết quả của các nhà khoa học với sự trân trọng và biết ơn.
Hà Nội, tháng 6 năm 2015
Người thực hiện

Chu Thị Hồng



2

Mục lục

Danh mục kí hiệu và viết tắt

4

Mở đầu

5

1

Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô tả bởi
hệ phương trình vi phân thường tuyến tính

8

1.1

Bài toán điều khiển tối ưu . . . . . . . . . . . . . . . . . . . .

8

1.1.1

Các khái niệm cơ bản . . . . . . . . . . . . . . . . . .


8

1.1.2

Bài toán điều khiển tối ưu . . . . . . . . . . . . . . . . 16

1.1.3

Nguyên lí cực đại Pontryagin . . . . . . . . . . . . . . 22

1.2

Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô tả
bởi hệ phương trình vi phân tuyến tính . . . . . . . . . . . . . 25
1.2.1

Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương
mô tả bởi hệ phương trình vi phân tuyến tính . . . . . . 25

1.2.2
2

Phương trình Riccati . . . . . . . . . . . . . . . . . . 26

Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô tả bởi
hệ phương trình vi phân đại số tuyến tính
2.1

33


Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô tả
bởi hệ phương trình vi phân đại số tuyến tính . . . . . . . . . . 34
2.1.1

Các khái niệm cơ bản . . . . . . . . . . . . . . . . . . 34

2.1.2

Điều kiện cần và đủ tối ưu . . . . . . . . . . . . . . . . 44


3

2.2

Cấu trúc Hamilton . . . . . . . . . . . . . . . . . . . . . . . . 51

2.3

Nghiệm của bài toán điều khiển tối ưu với điều khiển liên hệ
ngược . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.3.1

Điều khiển tối ưu liên hệ ngược

. . . . . . . . . . . . 55

2.3.2


Nghiệm của hệ phương trình DAE Riccati . . . . . . . 58

2.3.3

Nghiệm của bài toán hệ đóng . . . . . . . . . . . . . . 63

2.3.4

Phương trình Riccati và hệ Hamilton . . . . . . . . . . 64

Kết luận

67

Tài liệu tham khảo

68


4

Danh mục kí hiệu và viết tắt
Các kí hiệu thường dùng
Rm : Không gian Euclide m chiều

X ∗ : Không gian liên hợp của X
detA: Định thức của ma trận A
I : Toán tử đồng nhất (toán tử đơn vị )
A∗ : Ma trận chuyển vị A
A−1 : Toán tử ngược của ma trận A

Mn,m (R): Tập các ma trận n hàng, m cột với các hệ số trong R
Kerf : Hạt nhân của ánh xạ tuyến tính Kerf = {x ∈ X|f (x) = 0Y }
Imf : Ảnh của ánh xạ tuyến tính Imf = {f (x) ∈ Y |x ∈ X}
L(Rn , Rm ) : Không gian các ánh xạ tuyến tính liên tục từ Rn tới Rm
L(Rn ): Không gian các ánh xạ tuyến tính từ Rn tới Rn
L2 [a, b]: Không gian các hàm khả tích trên [a, b]
C[a, b]: Không gian các hàm liên tục trên đoạn [a, b]
C1 [a, b]: Không gian các hàm khả vi, liên tục trên đoạn [a, b]
C1B [a, b] = x ∈ C[a, b] : Bx ∈ C1 [a, b]

Các kí hiệu viết tắt
DAE

Phương trình vi phân đại số

ODE

Phương trình vi phân thường


5

Mở đầu
1. Lí do chọn đề tài
Do yêu cầu thực tiễn, bài toán điều khiển tối ưu mô tả bởi hệ phương trình
vi phân thường đã được nghiên cứu khá trọn vẹn và đã đạt được các kết quả cơ
bản, điển hình là nguyên lí cực đại Pontryagin và phương pháp qui hoạch động.
Cũng do những yêu cầu của kĩ thuật, khoa học và công nghệ, bắt đầu từ những
năm 1980, phương trình vi phân đại số (Differential-Algebraic Equations) mô
tả các hệ thống phức tạp (trong cơ học người máy, hóa học, điều khiển tàu vũ

trụ,. . . ) đã được nghiên cứu mạnh mẽ trên thế giới. Bài toán điều khiển tối ưu
với hàm mục tiêu toàn phương mô tả bởi hệ phương trình vi phân đại số tuyến
tính đã được một số nhóm nghiên cứu trên thế giới (Nga, Đức,...) cố gắng giải
quyết (xem, thí dụ [4], [7], [9]).
Với mong muốn tìm hiểu sâu hơn về một hướng nghiên cứu tương đối thời sự
hiện nay là bài toán điều khiển tối ưu mô tả bởi hệ phương trình vi phân thường
và phương trình vi phân đại số, tôi chọn đề tài Bài toán điều khiển tối ưu toàn
phương mô tả bởi hệ phương trình vi phân đại số tuyến tính làm luận văn cao
học.

2. Mục đích nghiên cứu
1) Tìm hiểu và trình bày bài toán điều khiển tối ưu với hàm mục tiêu toàn
phương mô tả bởi hệ phương trình vi phân thường tuyến tính trong không gian


6

hữu hạn chiều, chủ yếu theo Tài liệu [8] và một số tài liệu khác.
2) Tìm hiểu và trình bày lí thuyết hệ phương trình vi phân đại số tuyến tính,
chủ yếu theo Tài liệu [7].
3) Tìm hiểu và trình bày bài toán điều khiển tối ưu với hàm mục tiêu toàn
phương mô tả bởi hệ phương trình vi phân đại số tuyến tính theo [9].

3. Nhiệm vụ nghiên cứu
1) Nghiên cứu bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô
tả bởi hệ phương trình vi phân thường trong không gian hữu hạn chiều.
2) Nghiên cứu hệ phương trình vi phân đại số.
3) Nghiên cứu bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô
tả bởi hệ phương trình vi phân đại số tuyến tính.


4. Đối tượng và phạm vi nghiên cứu
Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô tả bởi hệ phương
trình vi phân thường và phương trình vi phân đại số tuyến tính.

5. Phương pháp nghiên cứu
1) Thu thập các tài liệu liên quan tới Bài toán điều khiển tối ưu với hàm mục
tiêu toàn phương mô tả bởi hệ phương trình vi phân.
2) Phân tích, tổng hợp và hệ thống các kiến thức liên quan tới Bài toán điều
khiển tối ưu với hàm mục tiêu toàn phương mô tả bởi hệ phương trình vi phân
thường và phương trình vi phân đại số tuyến tính.


7

6. Đóng góp mới
Xây dựng Luận văn thành một tài liệu tổng quan tốt cho sinh viên và học viên
cao học về đề tài Bài toán điều khiển tối ưu toàn phương mô tả bởi hệ phương
trình vi phân thường và phương trình vi phân đại số tuyến tính trong không gian
hữu hạn chiều.


8

Chương 1
Bài toán điều khiển tối ưu với hàm mục
tiêu toàn phương mô tả bởi hệ phương
trình vi phân thường tuyến tính
1.1
1.1.1


Bài toán điều khiển tối ưu
Các khái niệm cơ bản

Định nghĩa 1.1.1. Cho X , Y là hai không gian vectơ trên trường số thực R.

A : X → Y được gọi là ánh xạ tuyến tính từ X vào Y nếu thỏa mãn điều kiện
A(αx) = αA(x), với mọi x ∈ X, α ∈ R,
A(x + y) = A(x) + A(y), với mọi x, y ∈ X .
Định nghĩa 1.1.2. Cho x1 , x2 , ..., xk ∈ Rn , Rn là không gian vectơ trên trường
số thực. Khi đó
Tổ hợp tuyến tính trên R của x1 , x2 , ..., xk là

α1 x1 + ... + αk xk ,

với αi ∈ R, i = 1, 2, . . . , k.

Tập tất cả các tổ hợp tuyến tính của x1 , x2 , ..., xk là một không gian con được
gọi là span của x1 , x2 , ..., xk , được xác định bởi

span{x1, x2 , ..., xk } := {x =α1 x1 + ... + αk xk : αi ∈ R, i = 1, 2, . . . , k}.
Tập các vectơ x1 , x2 , ..., xk được gọi là độc lập tuyến tính trên R nếu

α1 , α2 , ..., αk ∈ R


9

thỏa mãn hệ thức

α1 x1 + ... + αk xk = 0,

chỉ xảy ra khi và chỉ khi α1 = α2 = . . . = αn = 0.
Hệ vectơ x1 , x2 , ..., xk được gọi là phụ thuộc tuyến tính nếu nó không độc lập
tuyến tính.
Định nghĩa 1.1.3. Ma trận chuyển vị của ma trận A cấp m × n được kí hiệu là

A∗ là ma trận có cột thứ j là hàng thứ j của ma trận A (j = 1, 2, ..., m).
Định nghĩa 1.1.4. Ma trận A được gọi là ma trận đối xứng (symmetric matrix)
nếu A = A∗ .
Ma trận A = (aij ) là đối xứng khi và chỉ khi nó là ma trận vuông và (a)ij =

(a)ji với mọi i, j .
Ma trận A cấp n × n gọi là ma trận nửa xác định dương (semi-positive
definite) được kí hiệu bởi A ≥ 0, nếu x∗ Ax ≥ 0 với mọi x ∈ Rn .
Ma trận A cấp n × n được gọi là ma trận xác định dương (positive definite)
được kí hiệu bởi A > 0, nếu x∗ Ax > 0 với mọi x = 0.
Ví dụ 1.1. Ma trận A =

1 0
0 4

,x=

x1
x2

, x = 0.

Ta có

x∗ Ax = ( x1 x2 )


1 0
0 4

Vậy A là ma trận xác định dương.
1 0
x
Ma trận B = 0 0 , x = x1
2
Ta có

x∗ Bx = ( x1 x2 )

x1
x2

= x21 + 4x22 > 0

, x = 0.
1 0
0 0

x1
x2

= x21 ≥ 0

Vậy ma trận B là ma trận nửa xác định dương.
Định nghĩa 1.1.5. Một ma trận vuông A cấp n × n được gọi là suy biến (singular) nếu định thức của nó bằng 0. Ma trận vuông có định thức khác 0 được
gọi là ma trận không suy biến (nonsingular).



10

Định nghĩa 1.1.6. Cho E, F ∈ L(Rm ). Cặp ma trận (E, F ) được gọi là chính
quy nếu ∃λ sao cho det(λE + F ) = 0. Nếu det(λE + F ) ≡ 0 với mọi λ thì
cặp ma trận (E, F ) được gọi là suy biến.
Tập hợp các ma trận dạng (λE + F ) được gọi là chùm ma trận.
Định nghĩa 1.1.7. Cho A là ma trận vuông cấp n, ma trận A gọi là ma trận khả
nghịch nếu tồn tại ma trận B vuông cấp n sao cho AB = BA = En (En là ma
trận đơn vị cấp n).
Nếu A là ma trận khả nghịch thì ma trận B thỏa mãn điều kiện trên là duy nhất,
và B gọi là ma trận nghịch đảo (inverse matrix) của ma trận A, kí hiệu là A−1 .
Vậy ta luôn có AA−1 = A−1 A = En .
Ta thấy rằng A khả nghịch khi và chỉ khi A không suy biến (tức là detA = 0).
Nếu A, B khả nghịch thì AB cũng khả nghịch và (AB)−1 = B −1 A−1 .
Định nghĩa 1.1.8. ([7], p. 589-590)
Cho ma trận M ∈ L(Rn , Rm ). Ta gọi ma trận M − ∈ L(Rm , Rn ) là ma trận
nghịch đảo suy rộng (generalized inverse matrix) của M nếu thỏa mãn điều
kiện

M −M M − = M −.
Ví dụ 1.2.

M=

1 0
0 0

, M− =


1 0
0 0

do M − M M − = M − nên M − là ma trận nghịch đảo suy rộng của M .
Định nghĩa 1.1.9. Hạng của ma trận là giá trị lớn nhất của số hàng hoặc số cột
độc lập tuyến tính. Hạng của ma trận A kí hiệu là rankA.
Ma trận A ∈ Rm×n được gọi là có hạng dòng đầy đủ nếu m < n và

rank(A) = m.
Ma trận A được gọi là có hạng cột đầy đủ nếu n ≤ m và rank(A) = n.


11

Nếu rank(A) bằng số cột hoặc số dòng của A thì A được gọi là có hạng đầy
đủ.
Ma trận vuông có hạng đầy đủ là một ma trận không suy biến.
Định nghĩa 1.1.10. ([2], p. 57) Ta gọi không gian định chuẩn (hay không gian
tuyến tính định chuẩn) là không gian tuyến tính X trên trường P (P = R hoặc

P = C) cùng với một ánh xạ từ X vào tập số thực R, kí hiệu là . và đọc là
chuẩn, thỏa mãn các tiên đề sau đây:
(1) ∀x ∈ X : x ≥ 0, x = 0 ⇔ x = θ (θ là kí hiệu phần tử không của X );
(2) ∀x ∈ X, ∀α ∈ P : αx = |α| x ;
(3) ∀x, y ∈ X : x + y ≤ x + y .
Số x được gọi là chuẩn của véctơ x. Ta cũng kí hiệu không gian định chuẩn
là X . Các tiên đề trên được gọi là hệ tiên đề chuẩn.
Định nghĩa 1.1.11. Cho X là không gian định chuẩn và {xn }n∈N là dãy các
phần tử trong X . Ta nói rằng dãy {xn }n∈N hội tụ theo chuẩn đến x ∈ X ,


xn → x
nếu

lim x − xn = 0.

n→∞

Định nghĩa 1.1.12. Cho U là một tập mở trong Rn và f : U → Rm . Hàm f
được gọi là khả vi tại điểm a = (a1 , a2 , ..., an ) ∈ U nếu tồn tại một ánh xạ
tuyến tính A : Rn → Rm sao cho

lim

h→0

f (a + h) − f (a) − A (h)
= 0,
h

hay

f (a + h) − f (a) − A (h) = ε (h) h ,
trong đó h = (h1 , h2 , ..., hn ) → Rn , ε (h) → 0 khi h → 0.
Ánh xạ A được gọi là đạo hàm của hàm f và thường được kí hiệu là f (a).


12

Cho tập X = ∅ và họ F các tập con của X .

Định nghĩa 1.1.13. ([3], p. 30) F được gọi là một σ− đại số nếu nó thỏa mãn
các điều kiện
(i) X, ∅ ∈ F .
(ii) A ∈ F ⇒ Ac ∈ F , trong đó Ac := X\A.


(iii) Ak ∈ F, k = 1, 2, ... ⇒ ∪ Ak ∈ F .
k=1

Nếu F là σ− đại số các tập con của X thì cặp (X, F) được gọi là một không
gian đo được và mỗi tập A ∈ F được gọi là tập đo được (đo được với F hay

F− đo được).
Định nghĩa 1.1.14. Độ đo µ : F → R+ là một hàm tập xác định trên σ− đại
số F trên X và thỏa mãn các tính chất sau:
1) µ (A) ≥ 0 với mọi A ∈ F ;
2) Tập hợp rỗng có độ đo bằng không: µ (∅) = 0;
3) µ là σ− cộng tính tức là


 Ai ∈ F, i = 1, 2, ...
Ai ∩ Aj = ∅;
⇒µ



∪ Ai ∈ F
t=1




∪ Ai

i=1



=

µ (Ai ).
i=1

Định nghĩa 1.1.15. Cho không gian metric X , một σ− đại số F với độ đo µ
¯ = R ∪ {±∞} là tập gồm tất cả các số thực và hai
và một tập A ∈ F. Kí hiệu R
kí hiệu ±∞.
Hàm số f : X → R được gọi là đo được trên tập A đối với σ− đại số F nếu

∀a ∈ R : {x ∈ A : f (x) < a} ∈ F.
Định nghĩa 1.1.16. Trong một không gian metric X bất kì, cho một σ− đại số

F và một độ đo µ trên F . Ta nói một điều kiện α (x) được thỏa mãn với hầu


13

hết mọi x ∈ A, hay được thỏa mãn hầu khắp nơi trên A nếu có tập B ⊂ A sao
cho µ (B) = 0 và α (x) được thỏa mãn với mọi x ∈ A\B .
Ví dụ f (x) = g(x) hầu khắp nơi trên A có nghĩa là ∃B ⊂ A, µ (B) = 0 và


∀x ∈ A\B, f (x) = g (x).
Định nghĩa 1.1.17. Một hàm f : X → R được gọi là hàm đơn giản nếu nó đo
được và chỉ nhận hữu hạn giá trị.
Định lý 1.1.1. Nếu f là hàm đo được, không âm thì tồn tại dãy các hàm đơn
giản, không âm fn sao cho

fn+1 (x) ≥ fn (x) , lim fn (x) = f (x) , ∀x ∈ A.
n→∞

Như vậy, nếu f là hàm đo được, không âm thì ta định nghĩa

f (t)dµ = lim

fn (t)dµ.

n→∞

A

A

Nếu f là hàm đo được bất kỳ thì

f + (t) := max {f (t), 0} ≥ 0,

f − (t) := max {−f (t), 0} ≥ 0.

cũng là các hàm đo được, không âm và ta có f (t) = f + (t) − f − (t).

f + dµ, f − dµ, là số hữu hạn thì ta định


Nếu ít nhất một trong các tích phân
A

nghĩa

A

Ta nói f khả tích trên A nếu

f − dµ,

f + dµ −

f dµ =
A

A

A

f dµ tồn tại và hữu hạn.
A

Một hàm được gọi là khả tích địa phương trên [0, +∞), nếu nó khả tích trên
mọi đoạn hữu hạn.
Định nghĩa 1.1.18. Cho hai không gian metric M1 = (X, d1 ), M2 = (Y, d2 ),
ánh xạ f : M1 → M2 .



14

Ánh xạ f được gọi là liên tục tại điểm x0 ∈ X , nếu ∀ε > 0, ∃δ > 0, sao cho
với mọi x ∈ X mà d1 (x, x0 ) < δ thì d2 (f (x), f (x0 )) < ε.
Ánh xạ f gọi là liên tục trên tập A ⊂ X nếu ánh xạ f liên tục tại mọi điểm

x ∈ A. Khi A = X thì ánh xạ f được gọi là liên tục.
Định nghĩa 1.1.19. Một ánh xạ f từ một tập X vào tập các số thực mở rộng
¯ = R ∪ {±∞} được gọi là một hàm số thực nếu f (X) ⊂ R tức là f (x) không
R
lấy các giá trị ±∞ thì hàm số được gọi là hữu hạn. Một hàm số hữu hạn và liên
tục theo nghĩa ánh xạ liên tục được gọi là hàm số liên tục.
Định nghĩa 1.1.20. Hàm x : (a, b) → Rn được gọi là liên tục tuyệt đối, nếu với
mỗi ε > 0 tồn tại số δ > 0 sao cho với mọi hệ hữu hạn khoảng đôi một không
cắt nhau

(ak , bk ) ⊂ (a, b) ,

k = 1, 2, ..., N,

N

có tổng độ dài nhỏ hơn δ :

(bk , ak ) < δ , bất đẳng thức sau được thỏa mãn:
k=1
N

x (bk ) − x (ak ) < ε.
k=1


Ví dụ 1.3. Hàm x(.) : (a, b) → Rn thỏa mãn điều kiện Lipschsitz

x (t1 ) − x (t2 ) ≤ L |t1 − t2 | , t1 , t2 ∈ (a, b)
ε
).
L
Chọn N = 1 ta có, hàm liên tục tuyệt đối là liên tục đều trên (a, b).
là liên tục tuyệt đối (chọn δ =

Định lý 1.1.2. (Lebesgue) Nếu hàm x : (a, b) → Rn là liên tục tuyệt đối trên

(a, b), thì nó khả vi hầu khắp nơi trên (a, b), đạo hàm x (.) của nó khả tích trên
(a, b) và công thức Newton-Leibniz
t

x (t) − x (τ ) =

x (s)ds.
τ


15

đúng với mọi t, τ ∈ (a, b).
Nếu hàm ξ : (a, b) → Rn khả tích trên (a, b) và τ ∈ (a, b), thì hàm số x (t) =
t

ξ (s)ds là liên tục tuyệt đối và x (t) = ξ (t) hầu khắp nơi.
τ


Ta nói hàm x = (x1 , x2 , ..., xn ) : (a, b) → Rn là đo được và khả tích nếu
mỗi hàm số xi : (a, b) → R là đo được và khả tích. Và theo định nghĩa,
b

b

x (t) dt =
a

b

x1 (t) dt, ...,
a

xn (t)dt .
a

Định nghĩa 1.1.21. Cho không gian metric M = (X, d). Tập

B (¯
x, r) := {x ∈ X : d (x, x¯) < r}
được gọi là hình cầu mở tâm x
¯ ∈ X bán kính r. Mọi tập chứa hình cầu mở tâm

x¯ bán kính r > 0 được gọi là lân cận của x¯ ∈ X trong không gian M .
Định nghĩa 1.1.22. Một tập C trong một không gian vectơ thực hay phức được
gọi là lồi nếu:

a, b ∈ C ⇒ αa + (1 − α) b ∈ C.

Tập hợp các điểm có dạng αa + (1 − α) b ∈ C với 0 ≤ α ≤ 1 được gọi là đoạn
thẳng nối a với b. Có thể định nghĩa một tập là lồi nếu nó chứa mọi đoạn thẳng
nối hai điểm bất kì của nó.
Một hàm f xác định trên một tập lồi C và có thể lấy giá trị +∞ được gọi là
hàm lồi nếu:

a, b ∈ C, 0 ≤ α ≤ 1 ⇒ f (αa + (1 − α) b) ≤ αf (a) + (1 − α) f (b) .
Định nghĩa 1.1.23. Cho A là toán tử tuyến tính bị chặn ánh xạ không gian
Hilbert X vào không gian Hilbert Y . Toán tử B ánh xạ không gian Y vào
không gian X gọi là toán tử liên hợp với toán tử A nếu

Ax, y = x, By , ∀x ∈ X, ∀y ∈ Y.
Toán tử liên hợp B được kí hiệu là A∗ .


16

Định nghĩa 1.1.24. Toán tử tuyến tính bị chặn A ánh xạ không gian Hilbert H
vào chính nó gọi là tự liên hợp nếu

Ax, y = x, Ay , ∀x, y ∈ H.
Toán tử tự liên hợp còn gọi là toán tử đối xứng.

1.1.2

Bài toán điều khiển tối ưu

Xét hệ phương trình vi phân thường

x = f (t, x) , t ∈ (a, b) ⊂ R, x ∈ Rn ,


(1.1)

với điều kiện ban đầu

x (t0 ) = x0 , t0 ∈ (a, b) .

(1.2)

Ở đây (a, b) ⊆ R, a có thể bằng −∞, b có thể bằng +∞, G là tập mở trong Rn

D = (a, b) × G ⊆ R × Rn .
Hàm f : D → Rn xác định và liên tục trên tập mở D.
Một hàm khả vi x : (a, b) → G được gọi là nghiệm của hệ phương trình vi
phân (1.1) trên khoảng (a, b) nếu nó thỏa mãn hệ phương trình (1.1) với mọi
dx (t)
t ∈ (a, b), tức là
= f (t, x (t)) đúng với mọi t ∈ (a, b).
dt
Định lý 1.1.3. (Định lý tồn tại nghiệm của phương trình vi phân)
Giả sử f : (a, b) × G → Rn là hàm Lipshitz theo x đều theo t, tức là:

f (t, x1 ) − f (t, x2 ) ≤ L x1 − x2 , ∀t ∈ (a, b) , ∀x1 , x2 ∈ G mở ⊆ Rn .
Khi đó phương trình (1.1) có duy nhất nghiệm địa phương thỏa mãn điều kiện
ban đầu

x (t0 ) = x0 , t0 ∈ (a, b).


17


Chú ý 1.1.1. Để ngắn gọn, ta thường gọi hệ phương trình (1.1) là phương trình
vi phân, ta hiểu rằng đây là phương trình vi phân vectơ hay hệ phương trình vi
phân. Tương tự, đôi khi ta cũng gọi các hàm vectơ x(t) và f (t, x) là các hàm
số.
Bài toán tìm nghiệm của hệ phương trình (1.1) thỏa mãn điều kiện (1.2) được
gọi là bài toán giá trị ban đầu hay bài toán Cauchy của hệ phương trình vi phân
thường.
Trong lý thuyết điều khiển tối ưu, ta thường làm việc với hệ phương trình vi
phân thường có dạng

dx
= f (t, x, u) , t ≥ 0
dt

(1.3)

với các thời điểm t0 , T > t0 là cho trước và cố định.
Các hàm u : [0, ∞) → Rm là hàm đo được (hoặc liên tục từng khúc) trên [t0 , T ]
và thỏa mãn hạn chế

u(t) ∈ U,

∀t ∈ [0, T ] ,

(1.4)

được gọi là điều khiển chấp nhận được. Ở đây U ⊆ Rm là một tập nào đó trong
không gian hữu hạn chiều Rm và được gọi là tập hạn chế trên biến điều khiển.
Vế phải f (·, ·, ·) là hàm (vectơ) liên tục theo cả ba biến (t, x, u). Khi hàm điều

khiển u (·) đã được chọn, hệ (1.3) trở thành phương trình vi phân thường

x (t) = f (t, x (t) , u (t)) = f˜ (t, x (t)) ,

t ∈ [t0 , T ] .

(1.5)

Vì u (·) là một hàm cho trước, liên tục từng khúc và thậm chí là hàm đo được
nên cho dù hàm f (·, ·, ·) có thể là đủ tốt (liên tục, thậm chí tuyến tính hoặc khả
vi theo cả ba biến), sau khi thay hàm u(.) vào f (·, ·, ·) thì vế phải của phương
trình (1.5) có thể không còn là một hàm liên tục, các khái niệm theo nghĩa cổ
điển về tồn tại nghiệm (khả vi liên tục) không còn đúng. Ta xét ví dụ sau


18

Ví dụ 1.4. Cho x = u. Vế phải f (t, x, u) = u liên tục theo (t, x, u). Nếu chọn

0, t < 0
1, t = 0

u1 (t) =

0, t < 0,
1, t = 0 không liên tục.
0, t < 0,
Với u(t) đã chọn thì x = u (t) =
1, t = 0 chỉ có thể có nghiệm liên tục
nhưng không khả vi tại t = 0.

thì f (t, x, u) =

Thật vậy, xét t < 0 : x ≡ 0 ⇒ x (t) ≡ c1 , ∀t < 0
Với t ≥ 0 : x = 1 ⇒ x (t) = t + c2 .
Để x(t) liên tục tại t = 0 thì c1 = x (0) = c2 , hay

x (t) =

c1 , t < 0,
t + c1 , t ≥ 0.

Nếu x (0) = 0 thì c1 = c2 = 0, hay

x (t) =

0, t < 0,
t, t ≥ 0.

Nghiệm x(t) không khả vi tại t = 0.

Chọn u2 (t) =

1, t < 0,
0, t = 0. thì
f (t, x, u (t)) =

1, t < 0,
0, t = 0.

không liên tục tại t = 0. Khi ấy


x = u (t) =

1, t < 0,
0, t ≥ 0.

có nghiệm không khả vi tại t = 0.
Với mọi t < 0 : x ≡ 0 ⇒ x (t) ≡ t + c1 ;
Với t ≥ 0 : x = 1 ⇒ x (t) = c2
Để x(t) liên tục tại t = 0 thì 0 + c1 = x (0) = c2 . Suy ra


19

x (t) =

t + c1 , t < 0,
c1 , t ≥ 0.

Nếu x (0) = 0 thìc1 = c2 = 0 và

x (t) =

t, t < 0,
0, t ≥ 0.

Nghiệm x(t) không khả vi tại x = 0.
Vì vậy ta phải mở rộng khái niệm nghiệm của phương trình vi phân (1.1)
Định nghĩa 1.1.25. Hàm số x = ϕ (t) liên tục tuyệt đối trên khoảng


(t0 − δ, t0 + δ) ⊂ (a, b)
(do đó có đạo hàm hầu khắp nơi trên (t0 − δ, t0 + δ) thỏa mãn phương trình vi
phân (1.1) hầu khắp nơi trên (t0 − δ, t0 + δ) được gọi là nghiệm suy rộng địa
phương trong lân cận t0 của phương trình vi phân (1.1) trên khoảng (a, b).
Nếu điều kiện của Định lí Caratheodory được thỏa mãn, thì phương trình vi
phân (1.5) có nghiệm (suy rộng) x (t).
Ta nhắc lại Định lí Caratheodory về tồn tại nghiệm suy rộng của phương trình
vi phân với vế phải đo được.
Định lí Caratheodory Cho hàm f : D → Rn , trong đó

D = {(t, x) : |t − t0 | ≤ a, x − x0 ≤ b}
Giả sử:
1) Hàm f (t, x) liên tục theo x với mỗi t cố định và đo được theo t với mỗi x cố
định.
2) Tồn tại hàm khả tích m(t) xác định trên Ta = {t : |t − t0 | ≤ a} sao cho:

f (t, x) ≤ m (t) , ∀ (t, x) ∈ D.


20

Khi ấy tồn tại một số c > 0 sao cho phương trình vi phân (1.1) có nghiệm suy
rộng trên Tc = {t : |t − t0 | ≤ c} thoả mãn điều kiện ban đầu x (t0 ) = x0 .
Theo định lý Caratheodory với mỗi điều khiển chấp nhận được hệ (1.3) có
một và chỉ một nghiệm x(t), x(t) liên tục tuyệt đối từ I tới Rn thỏa mãn điều
kiện x(t0 ) = x0 .
Với u(.) đã chọn thì (1.3) nói chung có nghiệm địa phương x(.). Nghiệm x(.)
được gọi là quỹ đạo ứng với điều khiển u(.).
Bài toán (x0 , x1 )- điều khiển được được phát biểu như sau: Cho trước x0 , x1 ∈
Rn , hệ (1.3) được gọi là (x0 , x1 ) - điều khiển được nếu tồn tại T > 0, điều

khiển chấp nhận được u(.) sao cho quỹ đạo tương ứng x(t) đi từ x0 tới x1 , tức
là x(0) = x0 , x(T ) = x1 .
Hệ (1.3) được gọi là hoàn toàn điều khiển được nếu với mỗi vectơ x(0) =

x0 ∈ Rn , x1 ∈ Rn , với mỗi T > 0 và một hàm đo được u(t) trên [0, T ],
u(t) ∈ Rn sao cho quỹ đạo tương ứng của hệ (1.3) thỏa mãn điều kiện x0 ∈ Rn
và x(T ) = x1 . Nghĩa là, tồn tại một điều khiển chuyển hệ từ vị trí (trạng thái)

x0 ∈ Rn sang vị trí (trạng thái) x1 ∈ Rn sau thời gian T .
Bài toán điều khiển tối ưu (optimal control problem) được phát biểu như sau:
Trong số tất cả các điều khiển đưa quỹ đạo từ x0 đến x1 hãy tìm điều khiển u(t)
sao cho nó cực tiểu hóa một tiêu chuẩn J (u), J (u) được gọi là hàm mục tiêu.
Định nghĩa 1.1.26. Tập các trạng thái có thể đạt được từ trạng thái ban đầu x0
sau thời gian T , T > 0, được định nghĩa bởi

Acc (x0 , T ) = {xu (T ) , u (t) ∈ U } ,
trong đó xu (.) là nghiệm của hệ (1.7) sinh bởi điều khiển chấp nhận được u(.),
và thỏa mãn điều kiện ban đầu xu (0) = x0 , U là tập lồi trong không gian hữu
hạn chiều. Ta đặt Acc(x0 , 0) = x0 .
Tập Acc (x0 , T ) được gọi là tập đạt được của hệ (1.7) tại thời điểm T xuất phát
từ điểm x0 .


21

Mệnh đề 1.1.1. Nếu U là lồi thì Acc (x0 , T ) là tập lồi với mọi T > 0.
Chứng minh. Lấy xT1 , xT2 ∈ Acc (x0 , T ). Khi ấy tồn tại ui (t),i = 1, 2 là điều
khiển chấp nhận được sao cho xi (t) là nghiệm của (1.7) tương ứng với ui (t)
thỏa mãn điều kiện ban đầu x(0) = x0 . Khi ấy


x i (t) = A(t)xi (t) + B(t)ui (t) + f (t); i = 1, 2, t ∈ [0, T ]
Cho λ ∈ [0, 1], ta chứng minh λxT1 + (1 − λ) xT2 ∈ Acc (x0 , T ).
Ta đã biết, nghiệm của phương trình vi phân tuyến tính thường có dạng
t

M (s)−1 B (s) ui (s) ds

xi (t) = M (t) x0 + M (t)
0

với M (t) ∈ Mn,n (R) thỏa mãn M (t) = A (t) M (t) , M (0) = I .
Ta đặt u (t) = λu1 (t) + (1 − λ) u2 (t), do U là lồi, nên u(t) ∈ U mọi t ∈

[0, T ]. Do ui (.) là đo được nên u(t) là đo được hay u(t) là điều khiển chấp
nhận được.
Cho x(t) là nghiệm tương ứng với u(t). Ta có
T

M (s)−1 B (s) u (s) ds,

x (T ) = M (T ) x0 + M (T )
0

và x (T ) ∈ Acc (x0 , T ). Mặt khác
T

λx1 (T ) + (1 − λ) x2 (T ) = λ M (T ) x0 + M (T )

M −1 (s) B (s) u1 (s) ds


0
T

+ (1 − λ) M (T ) x0 + M (T )

T

0

M −1 (s) B (s) u2 (s) ds


M (s)−1 B (s) u1 (s) ds

= M (T ) x0 + λ M (T )
0
T



M (s)−1 B (s) u2 (s) ds

+ (1 − λ) M (T )
0

= x(T ).





22

Khi đó

λxT1 (T ) + (1 − λ) xT2 (T ) ∈ Acc (x0 , T ) .
Vậy Acc (x0 , T ) là tập lồi với mọi T > 0.

1.1.3

Nguyên lí cực đại Pontryagin

Xét hệ phương trình vi phân có điều khiển

x = f (x, u) ,

x ∈ Rn ,

x (0) = x0 ∈ Rn cho trước, u ∈ U ⊂ Rm .
Hàm mục tiêu được cho bởi
T

L (x, u)dt + V (x (T )) ,

J (x, u) =
0

trong đó f (x, u) = (f1 (x, u) , ...., fn (x, u)) : Rn × Rm → Rn , L(x, u) =

Ax + Bu là hàm dưới dấu tích phân, V (x(T )) = xT (T ) Wx (T ) là hàm phụ
thuộc vào điểm cuối của quỹ đạo. Ta tìm cực tiểu hàm mục tiêu J(x, u) với

ràng buộc cuối ψ (x (T )) = 0.
Hàm ψ : Rn → Rq cho q ràng buộc là các hạn chế tại điểm cuối, tức là

ψ1 (x (T )) = 0,



.
.
ψ (x (T )) = 0 ⇔

.


ψq (x (T )) = 0.
Bài toán điều khiển tối ưu được phát biểu như sau: Trong số tất cả các điều
khiển chấp nhận được u(.) trên [0, T ], hãy tìm điều khiển u∗ (.) sao cho

J (x∗ , u∗ ) ≤ J (x, u) ,
với mọi điều khiển chấp nhận được u (·), x (·) là quỹ đạo sinh bởi u (·).
Bộ (x∗ , u∗ ) làm cực tiểu phiếm hàm J(x, u) được gọi là quá trình tối ưu.


×