Tải bản đầy đủ (.pdf) (81 trang)

Nguyên lý cực đại pontriagin trong lý thuyết điều khiển tối ưu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (908.86 KB, 81 trang )

Bộ giáo dục và đào tạo
Tr-ờng đại học s- phạm hà nội 2

NGUYN PHI LONG

NGUYấN Lí CC I PONTRIAGIN
TRONG Lí THUYT IU KHIN TI U

Chuyờn ngnh: Toỏn gii tớch
Mó s: 60 46 01 02

LUN VN THC S TON HC
Ngi hng dn khoa hc: TS. TRN VN BNG

Hà Nội, 2013


LỜI CẢM ƠN

Tác giả xin được bày tỏ lòng biết ơn chân thành tới TS. Trần Văn Bằng, người thầy
đã truyền thụ kiến thức và hướng dẫn tận tình tác giả hoàn thành luận văn này. Tấm
gương nghiên cứu khoa học nghiêm túc và sự chỉ bảo ân cần của thầy Trần Văn Bằng
trong suốt quá trình tác giả viết luận văn đã giúp cho tác giả có ý thức trách nhiệm
và quyết tâm cao khi hoàn thành luận văn của mình.
Tác giả cũng xin được gửi lời cảm ơn chân thành và lòng biết ơn các thầy giáo dạy
cao học chuyên ngành Toán giải tích, Ban giám hiệu, Phòng Sau đại học Trường Đại
học sư phạm Hà Nội 2 đã truyền thụ kiến thức, đóng góp ý kiến và giúp đỡ tác giả
trong suốt quá trình học tập, nghiên cứu và hoàn thành luận văn này.
Nhân đây tôi xin bày tỏ lòng biết ơn sâu sắc tới gia đình, ban giám hiệu trường
THPT Tự Lập - Mê Linh - Hà Nội cùng bạn bè, đồng nghiệp đã tạo kiều kiện, động
viên và giúp đỡ tôi rất nhiều trong suốt quá trình học tập, nghiên cứu.



Hà Nội, tháng 06 năm 2013
Học viên

Nguyễn Phi Long


LỜI CAM ĐOAN

Tôi xin cam đoan luận văn là công trình nghiên cứu của riêng tôi dưới sự hướng
dẫn của TS. Trần Văn Bằng.
Trong khi nghiên cứu luận văn, tôi đã kế thừa thành quả khoa học của các nhà
khoa học với sự trân trọng và biết ơn.

Hà Nội, tháng 06 năm 2013
Học viên

Nguyễn Phi Long


Mục lục

Mở đầu

1

Nội dung

3


1 Kiến thức chuẩn bị

3

1.1. Một số khái niệm trong lý thuyết độ đo . . . . . . . . . . . . . . . . . .

4

1.2. Tập lồi, không gian con afin và nón . . . . . . . . . . . . . . . . . . . .

5

1.3. Một số kết quả của giải tích hàm . . . . . . . . . . . . . . . . . . . . .

13

1.4. Hệ điều khiển và bài toán điều khiển tối ưu . . . . . . . . . . . . . . .

16

1.4.1. Hệ điều khiển . . . . . . . . . . . . . . . . . . . . . . . . . . . .

16

1.4.2. Điều khiển và quỹ đạo . . . . . . . . . . . . . . . . . . . . . . .

17

1.4.3. Hai bài toán tổng quát trong điều khiển tối ưu . . . . . . . . . .


20

1.5. Một số điều kiện cần trong phép tính biến phân . . . . . . . . . . . . .

23

2 Nguyên lý cực đại Pontriagin trong lý thuyết điều khiển tối ưu

32

2.1. Nguyên lý cực đại Pontriagin . . . . . . . . . . . . . . . . . . . . . . .

32

2.2. Sự biến thiên điều khiển . . . . . . . . . . . . . . . . . . . . . . . . . .

37

ii


iii
2.2.1. Phương trình biến phân và phương trình liên hợp . . . . . . . .

38

2.2.2. Biến phân nhọn . . . . . . . . . . . . . . . . . . . . . . . . . . .

43


2.2.3. Biến phân đa nhọn . . . . . . . . . . . . . . . . . . . . . . . . .

46

2.2.4. Biến phân trên khoảng tự do

. . . . . . . . . . . . . . . . . . .

48

2.3. Tập hợp khả tới và sự xấp xỉ biên bởi các nón . . . . . . . . . . . . . .

50

2.3.1. Nón tiếp xúc trên khoảng cố định . . . . . . . . . . . . . . . . .

51

2.3.2. Nón tiếp xúc trên khoảng tự do . . . . . . . . . . . . . . . . . .

52

2.3.3. Xấp xỉ tập khả tới bởi các nón . . . . . . . . . . . . . . . . . . .

54

2.3.4. Liên hệ giữa các nón tiếp xúc và hàm Hamilton . . . . . . . . .

55


2.3.5. Các quỹ đạo được điều khiển trên biên của tập khả tới . . . . .

58

2.4. Chứng minh của nguyên lý cực đại . . . . . . . . . . . . . . . . . . . .

61

2.4.1. Hệ mở rộng . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

61

2.4.2. Các quỹ đạo tối ưu nằm trên biên của tập khả tới của hệ mở rộng 62
2.4.3. Các tính chất của phản hồi liên hợp và của hàm Hamilton . . .

63

2.4.4. Các điều kiện hoành . . . . . . . . . . . . . . . . . . . . . . . .

65

2.5. Điều khiển tối ưu toàn phương tuyến tính . . . . . . . . . . . . . . . .

69

Kết luận

75

Tài liệu tham khảo


76


MỞ ĐẦU

1. Lý do chọn đề tài
Lý thuyết điều khiển tối ưu là một trong những lý thuyết gắn liền với hầu hết các
lĩnh vực khoa học cũng như thực tiễn. Tuy nhiên các mô hình điều khiển thường rất
phức tạp. Có rất nhiều công trình nghiên cứu về các điều kiện tối ưu, tuy nhiên hầu
hết chỉ là điều kiện cần hoặc điều kiện đủ.
Điều kiện đủ quan trọng nhất là phương trình Hamilton-Jacobi-Bellman, trong
khi đó một trong các điều kiện cần quan trọng nhất phải kể đến Nguyên lý cực đại
Pontriagin mà trường hợp đặc biệt của nó là phương trình Euler-Lagrange. Nguyên lý
này được Pontriagin và các học trò của ông phát hiện và công bố năm 1956. Tuy nhiên
đây là một trong những điều kiện cần rất trừu tượng trong việc hiểu, vận dụng, đặc
biệt là trong chứng minh.
Với mong muốn có thêm hiểu biết về nguyên lý cực đại này cùng những ứng dụng
của nó đối với lý thuyết điều khiển tối ưu, tôi đã chọn đề tài:
Nguyên lý cực đại Pontriagin trong lý thuyết điều khiển tối ưu.

2. Mục đích nghiên cứu
Tìm hiểu về Nguyên lý cực đại Pontriagin và ứng dụng trong lý thuyết điều khiển
tối ưu.

3. Nhiệm vụ nghiên cứu
Nghiên cứu nguyên lý cực đại Pontriagin, chứng minh nguyên lý và ứng dụng của
nguyên lý đối với bài toán điều khiển tối ưu toàn phương.



2

4. Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu: Điều kiện cần và đủ cho bài toán điều khiển tối ưu toàn
phương.
Phạm vi nghiên cứu: Bài toán điều khiển tối ưu tất định đặc biệt là bài toán điều
khiển tối ưu toàn phương.

5. Phương pháp nghiên cứu
- Sử dụng một số phương pháp của Giải tích hàm, của lý thuyết điều khiển tối ưu.
- Phân tích, tổng hợp kiến thức.

6. Giả thuyết khoa học
Nghiên cứu bài toán điều khiển tối ưu tất định đặc biệt là bài toán điều khiển tối
ưu toàn phương.
Nội dung của luận văn bao gồm hai chương:
Chương 1, trình bày một số kiến thức chuẩn bị về: lý thuyết độ đo, giải tích lồi,
phương trình vi phân đo được theo thời gian, giải tích hàm, lý thuyết biến phân, lý
thuyết điều khiển tối ưu...cần thiết cho chương sau. Nội dung của chương này được
tham khảo từ các tài liệu [3, 1, 2, 4].
Chương 2, trình bày về nguyên lý cực đại Pontriagin, bao gồm: phát biểu nguyên
lý, chứng minh nguyên lý và ứng dụng của nguyên lý đối với bài toán điều khiển tối ưu
toàn phương. Nội dung của chương này cơ bản dựa trên bài giảng của Giáo sư Andrew
D. Lewis ([3]).


Chương 1
Kiến thức chuẩn bị
Trong luận văn này chúng tôi sử dụng các kí hiệu chính sau đây:
1. R là tập số thực và R = {−∞} ∪ R ∪ {∞} là tập số thực mở rộng.

2. Tập các ánh xạ tuyến tính từ Rm vào Rn kí hiệu là L (Rm ; Rn ).
3. Tích vô hướng trong Rn được kí hiệu ·, · và chuẩn được kí hiệu bởi · .
Chúng ta cũng sử dụng · cho chuẩn của các ánh xạ tuyến tính và đa tuyến tính.
4. Cho x ∈ Rn và r > 0,ta kí hiệu:
B (x, r) = {y ∈ Rn | y − x < r} ,
B (x, r) = {y ∈ Rn | y − x ≤ r}
là hình cầu mở và hình cầu đóng bán kính r có tâm tại x.
5. Chúng ta kí hiệu
Sn = {x ∈ Rn+1 | x = 1}
là mặt cầu đơn vị n chiều và
Dn = {x ∈ Rn | x ≤ 1}
là hình cầu đơn vị n chiều.
6. Phần trong, biên và bao đóng của tập hợp A ⊂ Rn được kí hiệu theo thứ tự là
int (A), bd (A) và cl (A). Nếu A ⊂ Rn thì tôpô trên A là họ tất cả các tập có dạng
U ∩ A với U ⊂ Rn mở. Nếu S ⊂ A ⊂ Rn thì intA (S) là phần trong của S đối với tôpô
3


4
cảm sinh trên A.
7. Nếu U ⊂ Rn là một tập mở và φ : U → Rm là ánh xạ khả vi thì đạo hàm của φ
tại x ∈ U được kí hiệu bởi Dφ (x) và nó là một ánh xạ tuyến tính từ Rn vào Rm . Đạo
hàm cấp r của φ tại x kí hiệu là Dr φ (x) và nó là một ánh xạ đa tuyến tính đối xứng
từ (Rn )r vào Rm .
8. Nếu Ua ⊂ Rna , a ∈ {1, ..., k} là các tập hợp mở và nếu
φ : U1 × · · · × Uk → Rm
là hàm khả vi thì ta kí hiệu Da φ (x1 , ..., xk ), đạo hàm riêng thứ a với a ∈ {1, ..., k}, và
nó được định nghĩa là một đạo hàm tại xa của ánh xạ từ Ua vào Rm xác định bởi:
x → φ (x1 , ..., xa−1 , x, xa+1 , ..., xk ) .
Chúng ta kí hiệu Dar φ là đạo hàm riêng cấp r theo thành phần thứ a.

9. Cho U ⊂ Rn là một tập mở. Ánh xạ φ : U → Rm được gọi thuộc lớp C r nếu nó
khả vi r lần liên tục.
.

10. f được kí hiệu là đạo hàm của hàm f : R → Rk theo biến “thời gian” trong các
bài toán này.
11. Chúng ta kí hiệu o ε

k

là một hàm liên tục của ε thỏa mãn limε→0

nó còn được gọi là vô cùng bé bậc cao hơn εk khi ε → 0.

o εk
= 0,
εk

12. Ma trận đơn vị cấp n được kí hiệu là In và ma trận không cấp m × n được kí
hiệu là 0m×n .

1.1.

Một số khái niệm trong lý thuyết độ đo

Định nghĩa 1.1.1 (Hàm bị chặn cốt yếu liên tục tuyệt đối). Cho I ⊂ R là một khoảng
và f : I → R đo được.
(i) Nếu với mỗi khoảng con compact J ⊂ I, hàm f |J là khả tích thì f được gọi là
khả tích địa phương.



5
(ii) Nếu tồn tại M > 0 sao cho λ ({t ∈ I| |f (t)| > M }) = 0 thì hàm f được gọi là
bị chặn cốt yếu và ta đặt
esssupt∈I |f (t)| = inf {M ∈ R|λ ({t ∈ I| |f (t)| > M }) = 0} .
(iii) Nếu tồn tại một hàm khả tích địa phương g : I → R và t0 ∈ I sao cho
(g | [t0 , t]) dλ,

f (t) =
[t0 ,t]

thì f được gọi là liên tục tuyệt đối địa phương. Nếu I là compact thì liên tục tuyệt đối
địa phương sẽ được gọi là liên tục tuyệt đối.
Chú ý 1. Một hàm liên tục tuyệt đối có đạo hàm hầu khắp nơi. Hơn nữa, nếu
t

f (t) =

g (τ ) dτ
t0

.

với g là hàm khả tích địa phương thì f (t) = g (t) tại hầu hết t. Ngược lại, nếu một
hàm liên tục tuyệt đối có đạo hàm bằng 0 hầu khắp nơi thì nó là hằng số.
Định nghĩa 1.1.2 (Điểm Lebesgue). Cho I ⊂ R là một khoảng và f : I → R là hàm
khả tích địa phương. Điểm t0 ∈ I là một điểm Lebesgue của f nếu
t0 +ε

1

lim
ε→0 2ε

|f (t) − f (t0 )| dt = 0.
t0 −ε

Ta có phần bù của tập hợp các điểm Lebesgue có độ đo bằng 0.
Tất cả các khái niệm trên đối với hàm giá trị trong R đều có thể được áp dụng với
các hàm giá trị trong Rn bằng việc áp dụng các định nghĩa trên đối với từng thành
phần.

1.2.

Tập lồi, không gian con afin và nón

Một phần quan trọng trong chứng minh nguyên lý cực đại là sử dụng các nón và
nón lồi để xấp xỉ tập khả tới. Dưới đây là các định nghĩa cơ bản và các tính chất mà
ta sẽ sử dụng.


6

Hình 1.1: Tập lồi, 2 nón lồi và không gian con afin
Định nghĩa 1.2.1 (Tập lồi, nón, nón lồi và không gian con afin).
(i) Tập con C ⊂ Rn là lồi nếu với mỗi x1 , x2 ∈ C ta có
{sx1 + (1 − s) x2 |s ∈ [0, 1]} ⊂ C.
(ii) Tập con K ⊂ Rn là một nón nếu với mỗi x ∈ K ta có
{λx|λ ∈ R≥0 } ⊂ K.
(iii) Tập con K ⊂ Rn là một nón lồi nếu nó vừa lồi và vừa là một nón.
(iv) Một tập con A ⊂ Rn là một không gian con afin nếu với mỗi x1 , x2 ∈ A, ta có

{sx1 + (1 − s) x2 |s ∈ R} ⊂ A.


7
Chú ý tập hợp {sx1 + (1 − s) x2 |s ∈ [0, 1]} là đoạn thẳng trong Rn nối x1 và x2 . Do
đó một tập lồi là lồi khi đoạn thẳng nối hai điểm bất kỳ trong tập đó đều nằm trong
tập đó. Tương tự {λx|λ ∈ R≥0 } là tia xuất phát từ 0 ∈ Rn qua điểm x. Một tập là một
nón khi các tia xuất phát từ 0 qua một điểm bất kỳ của tập đó đều nằm trong tập đó.
Không gian con afin là một tập hợp mà mọi đường thẳng qua hai điểm bất kỳ thuộc
tập hợp đó đều nằm trong tập đó. Ta sẽ minh họa bằng trực giác trên Hình 1.1.
Ta sẽ quan tâm đến các bao lồi, bao nón và không gian con afin sinh bởi các tập
đã cho.
Định nghĩa 1.2.2 (Bao lồi, bao nón, bao nón lồi, bao afin). Cho S ⊂ Rn là tập khác
rỗng.
(i) Một tổ hợp lồi của S là một tổ hợp tuyến tính trong Rn có dạng
k

k

k ∈ Z>0 , λ1 , ..., λk ∈ R≥0 ,

λj vj ,
j=1

λj = 1, v1 , ..., vk ∈ S.
j=1

(ii) Bao lồi của S, kí hiệu là conv (S) là tập lồi nhỏ nhất của Rn chứa S.
(iii) Bao nón của S kí hiệu là cone (S) là nón nhỏ nhất trong Rn chứa S.
(iv) Một tổ hợp nón lồi của S là một tổ hợp tuyến tính trong Rn có dạng

k

λj vj ,

k ∈ Z>0 , λ1 , ..., λk ∈ R≥0 , v1 , ..., vk ∈ S.

j=1

(v) Bao nón lồi của S kí hiệu là conv cone (S) là nón lồi nhỏ nhất trong Rn chứa
S.
(vi) Một tổ hợp afin của S là một tổ hợp tuyến tính trong Rn có dạng
k

k

λj vj ,
j=1

k ∈ Z>0 , λ1 , ..., λk ∈ R≥0 ,

λj = 1, v1 , ..., vk ∈ S
j=1

(vii) Bao afin của S, kí hiệu là af f (S) là không gian con afin nhỏ nhất của Rn
chứa S.


8
Chú ý 2. Các định nghĩa của conv (S), cone (S) , conv cone (S) và aff (S) có nghĩa bởi
giao của các tập hợp là lồi, giao của các nón là nón và giao của các không gian con

afin là không gian con afin.
Thuật ngữ “bao nón” và “bao nón lồi” còn được gọi lần lượt là “nón sinh bởi S” và
“nón lồi sinh bởi S”.
Mệnh đề 1.2.1 (Bao lồi là họ tất cả các tổ hợp lồi). Cho S ⊂ Rn là tập không rỗng
và kí hiệu C (S) là tập hợp tất cả các tổ hợp lồi từ S. Khi đó C (S) = conv (S).
Mệnh đề 1.2.2 (Tập hợp tất cả các bội số dương của một tập là bao nón). Cho
S ⊂ Rn là không rỗng và kí hiệu
K (S) = {λx|x ∈ S, λ ∈ R≥0 } .

Khi đó K (S) = cone (S).
Mệnh đề 1.2.3 (Bao nón lồi là họ tất cả các tổ hợp nón lồi). Cho S ⊂ Rn là không
rỗng và kí hiệu K (S) là tập hợp tất cả các tổ hợp nón lồi từ S. Khi đó K (S) =
conv cone (S) .
Mệnh đề 1.2.4 (Đặc trưng của không gian con afin). Một tập con không rỗng A ⊂ Rn
là một không gian con afin khi và chỉ khi tồn tại x0 ∈ Rn và một không gian con U ⊂ Rn
sao cho
A = {x0 + u|u ∈ U } .
Mệnh đề 1.2.5 (Bao afin là họ tất cả các tổ hợp afin). Cho S ⊂ Rn là không rỗng và
kí hiệu A (S) tập hợp tất cả các tổ hợp afin từ S khi đó A (S) = aff (S) .

Bây giờ ta sẽ nói về topo của tập lồi. Do mỗi tập lồi là một tập con của bao afin
của nó nên nó có phần trong trong bao afin đó.
Định nghĩa 1.2.3 (Phần trong tương đối và biên tương đối). Nếu C ⊂ Rn là một tập
lồi thì tập hợp
rel int (C) = x ∈ C|x ∈ intaff(C) (C)
là phần trong tương đối của C và tập rel bd (C) = cl (C) \rel int (C) là biên tương đối
của C.


9

Định nghĩa 1.2.4 (Số chiều của một tập lồi). Cho C ⊂ Rn là tập lồi và U ⊂ Rn là
một không gian con sao cho aff (S) = {x0 + u|u ∈ U } với một x0 ∈ Rn . Số chiều của
C kí hiệu bởi dim (C) được định nghĩa là số chiều của không gian con U .
Ta sẽ có kết quả dưới đây.
Mệnh đề 1.2.6 (Bao đóng, phần trong tương đối của tập lồi, nón lồi tương ứng là
tập lồi và nón lồi). Cho C ⊂ Rn là một tập lồi và K ⊂ Rn là một nón lồi. Khi đó:
(i) cl (C) là lồi và cl (K) là một nón lồi,
(ii) rel int (C) là lồi và rel int (K) là một nón lồi.
Hơn nữa, aff (C) = aff (cl (C)) và aff (K) = aff (cl (K)).
Bổ đề 1.2.1. Nếu C là một tập lồi, x ∈ rel int (C) và nếu y ∈ cl (C) thì
[x, y) := {sx + (1 − s) y|s ∈ [0, 1]}
chứa trong rel int (C).
Mệnh đề 1.2.7 (Bao đóng của phần trong tương đối). Nếu C ⊂ Rn là một tập lồi thì
cl (rel int (C)) = cl (C) .
Các ví dụ đặc biệt của tập lồi và nón lồi các đơn hình và nón đơn hình:
Định nghĩa 1.2.5 (Sự độc lập affine, đơn hình, nón đơn hình). Cho n ∈ Z>0 .
(i) Tập hợp {x0 , x1 , ..., xk } ⊂ Rn là độc lập afin nếu tập hợp {x1 − x0 , ..., xk − x0 }
là độc lập tuyến tính.
(ii) Một k−đơn hình là bao lồi của tập hợp {x0 , x1 , ..., xk } các điểm độc lập affine.
(iii) Một nón k−đơn hình là bao nón lồi của một tập hợp {x1 , ..., xk } độc lập tuyến
tính.
Ví dụ 1.2.1 (n−đơn hình chuẩn, nón n−đơn hình chuẩn). 1. n-đơn hình chuẩn là tập
con của Rn

n

∆n =

n


x ∈ R |x1 , ..., xn ≥ 0,

xj ≤ 1 .
j=1


10
Như vậy ∆n là bao lồi của n- vectơ cơ sở chính tắc và gốc tọa độ.
2. Nón n-đơn hình chuẩn là tập con của Rn
Kn = {x ∈ Rn |x1 , ..., xn ≥ 0} .
Chú ý Kn là bao nón lồi của n-vectơ cơ sở chính tắc. Trong hình B.2 ta minh họa
n-đơn hình chuẩn và nón n-đơn hình chuẩn khi n = 2.

Hình 1.2: 2−đơn hình chuẩn và 2−nón đơn hình chuẩn
Kết quả dưới đây về số chiều của đơn hình và nón đơn hình.
Mệnh đề 1.2.8 (Chiều của đơn hình và của nón đơn hình). Nếu C, K ⊂ Rn lần lượt
là k-đơn hình và nón k-đơn hình thì
dim (C) = dim (K) = k.
Mệnh đề 1.2.9 (Sự tồn tại của các lân cận đơn hình). Cho C ⊂ Rn là lồi và có số
chiều k, cho x0 ∈ rel int (C) và U là một lân cận của x0 trong Rn . Khi đó tồn tại một
k đơn hình C0 ⊂ C sao cho C0 ⊂ U và x0 ∈ rel int (C0 ).
Bổ đề 1.2.2. Nếu V là không gian thực hữu hạn chiều có tích vô hướng và nếu
{v1 , ..., vn } là một cơ sở của V thì tồn tại v0 ∈ V sao cho v0 , vj < 0 với mọi j ∈
{1, ..., n} .
Với các nón ta có kết quả tương tự.
Mệnh đề 1.2.10 (Sự tồn tại của các lân cận nón đơn hình). Cho K ⊂ Rn là một nón
lồi k chiều, cho x0 ∈ rel int (K) \ {0} và U là một lân cận của x0 ∈ Rn . Khi đó tồn
tại một nón k-đơn hình K0 ⊂ K sao cho K0 ⊂ cone (U ) và x0 ∈ rel int (K0 ) .



11
Nếu C là đơn hình nhận được bằng cách lấy bao lồi của các điểm {x0 , x1 , ..., xk } ,
thì mọi điểm x ∈ C có biểu diễn duy nhất
k

x=

λ j xj
j=0

với λ0 , λ1 , ..., λk ∈ R≥0 có tổng bằng 1. Chú ý rằng tập hợp các λ xuất hiện trong các
tổ hợp tuyến tính như vậy có tính chất: điểm
k

λj ej
j=0

nằm trong k-đơn hình chuẩn nếu ta quy ước e0 = 0. Thật vậy ánh xạ
k

k

λj ej →
j=0

λ j xj
j=0

là một phép đồng cấu giữa ∆k và C. Sử dụng tham số đơn hình C bởi λ0 , λ1 , ..., λk ta
có một hệ tọa độ trọng tâm cho C.

Một phép xây dựng tương tự được thực hiện cho một nón k-đơn hình:
K = conv cone ({x1 , ..., xk }) .
Ta cố định vectơ v0 ∈ rel int (K) \ {0} và cho Pv0 là phần bù trực giao của v0 . Ta giả
sử
x1 , ..., xk ∈ {v0 + x|x ∈ Pv0 } ,
tức là các điểm x1 , ..., xk nằm trên một mặt phẳng song song với Pv0 và qua v0 . Ta xác
định một (k − 1)- đơn hình Cv0 ⊂ Pv0 bởi
Cv0 = {x ∈ Pv0 |x + v0 ∈ K}
(có thể thấy Cv0 là (k − 1) đơn hình). Gọi (λ1 , ..., λk ) là tọa độ trọng tâm của Cv0 . Một
x, v0
và λ (x)
điểm x ∈ K được xác định duy nhất bởi (l (x) , λ (x)) trong đó l (x) =
v0
là các tọa độ trọng tâm trong Cv0 đối với điểm l (x) x − v0 . Ta gọi (l, λ) là các K tọa
độ trọng tâm. (xem hình 1.3)
Định nghĩa 1.2.6 (Siêu phẳng, nửa không gian, siêu phẳng giá).
(i) Một siêu phẳng trên Rn là một tập con có dạng


12

Hình 1.3: Tọa độ trọng tâm của nón đơn hình x = l (x) (λ1 (x) x1 + ... + λk (x) xk ) .
{x ∈ Rn | λ, x = a},
.

với λ ∈ Rn \ {0} và a ∈ R. Siêu phẳng này được kí hiệu là Pλ,a .
(ii) Một nửa không gian trên Rn là một tập con có dạng
{x ∈ Rn | λ, x > a}
.


với λ ∈ Rn \ {0} và a ∈ R. Ta sẽ kí hiệu

Hλ,a
= {x ∈ Rn | λ, x < a} ,

+
= {x ∈ Rn | λ, x > a} .
Hλ,a

(iii) Nếu A ⊂ Rn , một siêu phẳng giá của A là một siêu phẳng Pλ,a sao cho
+
A ⊂ Hλ,a

Pλ,a .

(iv) Cho các tập con A, B ⊂ Rn , một siêu phẳng tách A và B là một siêu phẳng
Pλ,a sao cho


13
+
A ⊂ Hλ,a

Pλ,a ,


B ⊂ Hλ,a

Pλ,a .


Định lý 1.2.1 (Các tập lồi có siêu phẳng giá). Nếu C ⊂ Rn là một tập lồi khác Rn
thì C có một siêu phẳng giá.
Hệ quả 1.1 (Sự tách tập lồi và điểm). Nếu C ⊂ Rn là lồi và x0 ∈
/ int (C) thì tồn tại
một siêu phẳng tách {x0 } và C.
Hệ quả 1.2 (Các tập lồi rời nhau là tách được). Nếu C1 , C2 ⊂ Rn là các tập lồi rời
nhau thì tồn tại một siêu phẳng tách C1 và C2 .
Định lý 1.2.2 (Định lý tách tổng quát). Nếu C1 , C2 ⊂ Rn là các tập lồi thì chúng có
một siêu phẳng tách khi và chỉ khi một trong hai điều kiện sau thỏa mãn:
(i) Tồn tại một siêu phẳng P sao cho C1 , C2 ⊂ P ;
(ii) rel int (C1 )

1.3.

rel int (C2 ) = ∅.

Một số kết quả của giải tích hàm

Trong mục này ta sẽ trình bày một số kết quả cần thiết cho vấn đề xấp xỉ tập khả
tới bởi các nón sinh bởi các biến phân nhọn và trong việc thiết lập các điều kiện hoành.
Với n ∈ Z>0 ta kí hiệu
Sn = {x ∈ Rn+1 | x = 1} ,

Dn = {x ∈ Rn | x ≤ 1} .

Định lý 1.3.1 (Định lý hình cầu Hairy). Giả sử n ∈ Z>0 là số chẵn. Nếu f : Sn → Rn+1
là liên tục và có tính chất f (x) , x = 0 với ∀x ∈ Sn thì tồn tại x0 ∈ Sn sao cho
f (x0 ) = 0.
Bổ đề 1.3.1. Cho A ⊂ Rn là compac, U là một lân cận của A, và g : U → Rk thuộc
lớp C 1 . Khi đó, tồn tại M ∈ R>0 sao cho

g (y) − g (x) ≤ M y − x ,

x, y ∈ A.


14
Bổ đề 1.3.2. Cho A ⊂ Rn+1 là tập compac, U là một lân cận của A, g : U → Rn+1
thuộc lớp C 1 , và với s ∈ R, hs : A → Rn+1 xác định bởi hs (x) = x + sg (x) . Khi đó
tồn tại ε ∈ R>0 sao cho
(i) với mỗi s ∈ [ε, ε] , hs là đơn ánh và
(ii) hàm s → vol (hs (A)) là một đa thức.
Bổ đề 1.3.3. Cho f : Sn → Rn+1 có các tính chất sau:
(i) f (x) , x = 0 với mọi x ∈ Sn ,
(ii) f (x) = 1 với mọi x ∈ Sn .
Cho U là một lân cận của Sn và f : U → Rn+1 là một thác triển khả vi liên tục của
f , và với mỗi s ∈ R, xác định hs : U → Rn+1 bởi hs (x) = x + sf (x) . Khi đó với |s| đủ
nhỏ, f ánh xạ Sn lên hình cầu
Sn
có bán kính





1 + s2 = x ∈ Rn+1 | x =



1 + s2


1 + s2 .

Ta hình dung định lý hình cầu Hairy như sau: Do f (x) , x = 0 với mọi x ∈ Sn
nên f (x) cho ta một vectơ tiếp xúc với Sn tại x, nói cách khác f là một trường vectơ
tiếp xúc trên Sn . Định lý khẳng định rằng khi n chẵn thì mọi trường vectơ tiếp xúc
trên Sn đều phải triệt tiêu tại ít nhất một điểm. Kết quả yêu cầu n là chẵn nếu n lẻ
thì hàm
f (x1 , ..., xn+1 ) = (x2 , −x1 , x4 , −x3 , ..., xn , −xn+1 ),
xác định một trường vectơ đơn vị tiếp xúc với Sn nhưng không triệt tiêu trên Sn .
Định lý 1.3.2 (Định lý điểm bất động Brouwer). Nếu f : Dn → Dn là liên tục thì tồn
tại x0 ∈ Dn sao cho f (x0 ) = x0 .
Từ định lý điểm bất động Brouwer ta có hai hệ quả sau. Chúng được sử dụng khi
xấp xỉ tập khả tới bởi các nón biến phân nhọn và khi thiết lập các điều kiện hoành.


15
Bổ đề 1.3.4 (Một tính chất của các ánh xạ trên các tập lồi compac). Cho K ⊂ Rn là
compac và lồi với int (K) = 0 và cho f : K → Rn liên tục. Nếu x0 ∈ int (K) có tính
chất
f (x) − x < x − x0
với mọi x ∈ bd (K) thì x0 ∈ image (f ) .
Bổ đề này được minh họa qua Hình 1.4. Nó nói rằng, nếu biên của tập K không
biến đổi quá nhiều qua ánh xạ liên tục f , thì tập K sẽ biến đổi đủ ít theo nghĩa nếu có
một miền chứa ảnh của biên f (bdK) mà không chứa x0 thì ảnh f (K) này sẽ chứa x0 .
Kết quả tiếp theo nói về giao của các mặt phẳng ngang qua ảnh của một ánh xạ
liên tục.

Hình 1.4: Đường tròn biểu diễn biên của K, miền mờ là nơi biên của K sẽ được ánh xạ vào.

Bổ đề 1.3.5 (Giao của các ảnh liên tục của các mặt phẳng ngang). Cho n, k ∈ Z>0

với k < n. Xác định
C n = {(x1 , ..., xn ) |max {|x1 | , ..., |xn |} ≤ 1} ,
P1 = (x1 , ..., xn ) ∈ C n |xk+1 = ... = xn = 0 ,
P2 = (x1 , ..., xn ) ∈ C n |x1 = ... = xk = 0 .
Giả sử fa : Pa → Rn , a ∈ {1, 2} là các ánh xạ liên tục sao cho


16
1
fa (xa ) − xa < ,
4
thì f1 (P1 )

xa ∈ Pa , a ∈ {1, 2} .

f2 (P2 ) = ∅.

Trong hình 1.5 ta minh họa Bổ đề 1.3.5. Nó nói rằng, nếu các mặt phẳng P1 và P2
không bị biến dạng quá nhiều tương ứng qua các ánh xạ f1 và f2 thì ảnh của chúng sẽ
giao nếu trước đó chúng giao nhau "đủ mạnh".

Hình 1.5: Đường thẳng đứng biểu diễn P1 , đường thẳng ngang biểu diễn P1 , vùng mờ là nơi
mà P1 , P2 sẽ được ánh xạ vào.

1.4.

Hệ điều khiển và bài toán điều khiển tối ưu

Mục này nhằm trình bày khái niệm hệ điều khiển và các kí hiệu cần thiết và một
số lớp các quỹ đạo của hệ. Chúng tôi cũng thiết lập một số bài toán điều khiển tối ưu

cụ thể làm tiền đề cho việc thảo luận về nguyên lý cực đại Pontriagin.

1.4.1.

Hệ điều khiển

Định nghĩa 1.4.1 (Hệ điều khiển). Hệ điều khiển là một bộ ba Σ = (X, f, U ) trong
đó: X ⊂ Rn là một tập mở, U ⊂ Rm và f : X × cl (U ) → Rn là hàm liên tục sao cho


17
ánh xạ x → f (x, u) thuộc lớp C 1 với mỗi u ∈ cl (U ).
Phương trình vi phân gắn với hệ điều khiển Σ = (X, f, U ) là
.

ξ (t) = f (ξ (t) , µ (t)) .

(1.1)

Phương trình (1.1) và hàm f thường được gọi là hệ động lực.
Ví dụ 1.4.1 (Hệ afin-điều khiển). Hệ afin-điều khiển là một hệ điều khiển trong đó
hệ động lực f là một hàm afin của điều khiển u:
f (x, u) = f0 (x) + f1 (x) · u,
với f0 : X → Rn và f1 : X → L (Rm ; Rn ) là các ánh xạ thuộc lớp C 1 .
Ví dụ 1.4.2 (Hệ điều khiển tuyến tính). Cho A : Rn → Rn và B : Rm → Rn là các
ánh xạ tuyến tính. Hệ điều khiển tuyến tính là hệ điều khiển (Rn , f, U ) với
f (x, u) = A (x) + B (u) .
Khi đó, ta thường kí hiệu hệ điều khiển tuyến tính này là Σ = (A, B, U ). Như vậy,
phương trình vi phân ứng với hệ điều khiển tuyến tính là
.


ξ (t) = A (ξ (t)) + B (µ (t)).

Nghiệm của phương trình vi phân này với điều kiện ban đầu ξ (0) tại thời điểm
t = 0 là

t

exp (A (t − τ )) Bµ (τ ) dτ,

ξ (t) = exp (At) ξ (0) +
0

trong đó exp (·) là hàm mũ ma trận.

1.4.2.

Điều khiển và quỹ đạo

Trong luận văn này chúng tôi xét các loại điều khiển và quỹ đạo sau đây:

(1.2)


18
Định nghĩa 1.4.2 (Điều khiển chấp nhận được, quỹ đạo được điều khiển, cung được
điều khiển). Cho Σ = (X, f, U ) là một hệ điều khiển.
(i) Một điều khiển chấp nhận được là một ánh xạ đo được µ : I → U trên một
khoảng I ⊂ R sao cho t → f (x, µ (t)) khả tích địa phương với mỗi x ∈ X. Tập hợp tất
cả các điều khiển chấp nhận được trên I được kí hiệu là U (I).

(ii) Một quỹ đạo được điều khiển là một cặp (ξ, µ) sao cho có một đoạn I ⊂ R,
µ ∈ U (I) và ξ : I → X thỏa mãn (1.1).
Chúng ta gọi I là khoảng thời gian của quỹ đạo được điều khiển (ξ, µ).
(iii) Một cung được điều khiển là một quỹ đạo được điều khiển trên khoảng thời
gian compact. Nếu (ξ, µ) là một quỹ đạo được điều khiển thì chúng ta gọi ξ là quỹ đạo
và µ là điều khiển.
Cho x0 ∈ X và t0 ∈ I. Kí hiệu t → ξ (µ, x0 , t0 , t) là nghiệm của phương trình vi
phân (1.1) thỏa mãn ξ (µ, x0 , t0 , t0 ) = x0 và ξ (µ, x0 , t0 , ·) là ánh xạ t → ξ (µ, x0 , t0 , t).
Tương ứng với các điều khiển chấp nhận được chúng ta đặt:
Ctraj (Σ) = {(ξ, µ) | (ξ, µ) là một quỹ đạo được điều khiển },
Carc (Σ) = {(ξ, µ) | (ξ, µ) là một cung được điều khiển},
Ctraj (Σ, I) = {(ξ, µ) | (ξ, µ) là một quỹ đạo được điều khiển
với khoảng thời gian I},
Carc (Σ, I) = {(ξ, µ) | (ξ, µ) là một cung được điều khiển
với khoảng thời gian I }.

Sự tồn tại và duy nhất của các điều khiển chấp nhận được được khẳng định trong
các định lý sau:
Định lý 1.4.1 (Định lý tồn tại và duy nhất Caratheodory). Cho X ⊂ Rn là tập mở,
I ⊂ R là một khoảng và giả sử f : I × X → Rn có tính chất t → f (t, x) là khả tích
địa phương với mỗi x ∈ X và x → f (t, x) thuộc lớp C 1 với mỗi t ∈ I. Cho t0 ∈ I và
x0 ∈ X. Khi đó tồn tại một khoảng J ⊂ I sao cho int (J) = ∅, t0 ∈ J và một đuờng
cong liên tục tuyệt đối địa phương ξ : J → X sao cho
(i) ξ (t0 ) = x0 ,


19
.

(ii) ξ (t) = f (t, ξ (t)) tại hầu hết t ∈ J.

Hơn nữa nếu J và ξ : J → X cũng có các tính chất (i) - (ii) thì ξ (t) = ξ (t) với
mỗi t ∈ J

J.

Đối với một hệ điều khiển gắn với một điều khiển chấp nhận được, khẳng định cuối
ở trên có nghĩa là: các quỹ đạo được điều khiển tồn tại và duy nhất trên khoảng thời
gian đủ nhỏ quanh thời điểm ban đầu.
Ta thường phải sử dụng tính chất phụ thuộc liên tục của nghiệm của phương trình
vi phân vào điều kiện ban đầu và vào chính phương trình vi phân. Điều đó được chỉ
ra trong định lý dưới đây.
Định lý 1.4.2 (Sự phụ thuộc liên tục vào điều kiện ban đầu và các tham số). Cho
X ⊂ Rn là một tập mở, t0 , t1 ∈ R thỏa mãn t0 < t1 , δ > 0. Giả sử f, h : [t0 , t1 ]×X → Rn
thỏa mãn
(i) t → f (t, x) và t → h (t, x) khả tích với mỗi x ∈ X và
(ii) x → f (t, x) và x → h (t, x) thuộc lớp C 1 với mỗi t ∈ [t0 , t1 ] .
Cho ξ : [t0 , t1 ] → X là một nghiệm của phương trình vi phân
.

ξ (t) = f (t, ξ (t)) ,
và giả sử {x ∈ Rn | x − ξ (t) ≤ δ, t ∈ [t0 , t1 ]} ⊂ X.
Đặt
t

H (t) =

h (τ, ξ (τ )) dτ,

Hmax = sup {H (t) |t ∈ [t0 , t1 ]} .


t0

Giả sử z0 ∈ X và α : [t0 , t1 ] → R≥0 sao cho
(iii) α là khả tích,
t1

δ − α(t)dt
,
(iv) max {Hmax , ξ (t0 ) − z0 } ≤ e t0
2


20
(v) f (t, x1 ) + h (t, x1 ) − f (t, x2 ) − h (t, x2 ) ≤ α (t) x1 − x2 với x1 , x2 ∈ X và
t ∈ [t0 , t1 ] .
Khi đó nghiệm của bài toán giá trị ban đầu
.

ς (t) = f (t, ς (t)) + h (t, ς (t)) ,

ς (t0 ) = z0 ,

tồn tại trên [t0 , t1 ] và thỏa mãn
t1

α(s)ds

ξ (t) − ς (t) ≤ ( ξ (t0 ) − z0 + Hmax ) et0

,


với mọi t ∈ [t0 , t1 ] .
Đôi khi chúng ta chỉ hạn chế xét các điều khiển không chỉ khả tích mà còn phải
bị chặn vì vậy ta kí hiệu U bdd (I) là tập các điều khiển chấp nhận được trên khoảng
I ⊂ R và bị chặn.
Trong một số bài toán chúng ta chỉ xét các quỹ đạo xuất phát từ một điều kiện
ban đầu đặc biệt và sự tồn tại của chúng được bảo đảm trong một khoảng thời gian
nhất định. Điều này dẫn đến khái niệm sau.
Định nghĩa 1.4.3. Cho Σ = (X, f, U ) là một hệ điều khiển x0 ∈ X và I ⊂ R là một
khoảng, t0 ∈ I. Chúng ta kí hiệu U (x0 , t0 , I) là tập hợp các điều khiển chấp nhận được
sao cho nghiệm của bài toán ban đầu:
.

ξ (t) = f (ξ (t) , µ (t)) , ξ (t0 ) = x0 ,
tồn tại với mọi t ∈ I.

1.4.3.

Hai bài toán tổng quát trong điều khiển tối ưu

Định nghĩa 1.4.4 (Hàm Lagrange, hàm mục tiêu). Cho Σ = (X, f, U ) là một hệ điều
khiển.


×