Tải bản đầy đủ (.pdf) (39 trang)

Tính điều khiển được của hệ ô tô nôm tuyến tính

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (564.69 KB, 39 trang )

TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
KHOA TOÁN

NGUYỄN THỊ BÉ

TÍNH ĐIỀU KHIỂN ĐƯỢC
CỦA HỆ Ô-TÔ-NÔM TUYẾN TÍNH

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
Chuyên nghành: Giải tích

HÀ NỘI - 2017


TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
KHOA TOÁN

NGUYỄN THỊ BÉ

TÍNH ĐIỀU KHIỂN ĐƯỢC
CỦA HỆ Ô-TÔ-NÔM TUYẾN TÍNH

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
Chuyên nghành: Giải tích

Người hướng dẫn khoa học
TS. TRẦN VĂN BẰNG

HÀ NỘI - 2017



Mục lục

Lời cảm ơn

1

Lời nói đầu

4

Một số kí hiệu

7

1 Kiến thức chuẩn bị

8

1.1

1.2

Bài toán điều khiển tối ưu . . . . . . . . . . . . . . . . . . . .

8

1.1.1

Khái niệm cơ bản . . . . . . . . . . . . . . . . . . . . .


8

1.1.2

Thiết lập toán học của bài toán điều khiển . . . . . . . 10

1.1.3

Tính điều khiển được . . . . . . . . . . . . . . . . . . . 12

1.1.4

Điều khiển tối ưu . . . . . . . . . . . . . . . . . . . . . 14

Động cơ xe lửa . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2 Tính điều khiển được của hệ Ô-tô-nôm tuyến tính

22

2.1

Tính điều khiển được của hệ Ô-tô-nôm tuyến tính . . . . . . . 22

2.2

Ứng dụng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

Kết luận


35

Tài liệu tham khảo

36

1


Lời cảm ơn
Trước khi trình bày nội dung chính của khóa luận, em xin bày tỏ lòng
cảm ơn tới các thầy cô khoa Toán, trường Đại Học Sư Phạm Hà Nội 2, các
thầy cô trong tổ bộ môn Giải tích cũng như các thầy cô tham gia giảng dạy
đã tận tình truyền đạt những tri thức quý báu và tạo điều kiện thuận lợi để
em hoàn thành tốt nhiệm vụ khóa học và khóa luận.
Đặc biệt, em xin bày tỏ sự kính trọng và lòng biết ơn sâu sắc tới TS.
Trần Văn Bằng, người đã trực tiếp hướng dẫn, chỉ bảo tận tình giúp đỡ để
em có thể hoàn thành khóa luận này.
Hà Nội, tháng 4 năm 2017
Sinh viên

Nguyễn Thị Bé

2


Lời cam đoan

Dưới sự hướng dẫn tận tình của thầy giáo TS. Trần Văn Bằng luận
văn chuyên ngành toán giải tích với đề tài "Tính điều khiển được của hệ

Ô-tô-nôm tuyến tính" được hoàn thành bởi chính sự nhận thức của bản
thân, không trùng với bất cứ luận văn nào khác.
Trong khi nghiên cứu hoàn thành đề tài nghiên cứu này em đã tham khảo
một số tài liệu đã ghi trong phần tài liệu tham khảo.
Hà Nội, tháng 4 năm 2017
Sinh viên

Nguyễn Thị Bé

3


Lời nói đầu
1. Lý do chọn đề tài
Theo thời gian, toán học ngày càng phát triển và được chia thành hai lĩnh
vực chính: toán học lý thuyết và toán học ứng dụng.
Điều khiển là bài toán có ý nghĩa quan trọng trong đời sống, đặc biệt là
trong lĩnh vực điện tử, viễn thông...(xem [3], [4]). Với sự phát triển của khoa
học công nghệ, chúng ta mong muốn ngày càng có thể tự động hóa các quá
trình điều khiển. Điều khiển tối ưu có thể được xem như là một chiến lược
điều khiển trong lý thuyết điều khiển tự động. Mặt khác, về mặt lý thuyết,
điều khiển tối ưu là một phần mở rộng của phép tính biến phân. Do vậy, lý
thuyết điều khiển tối ưu có thể coi là cầu nối giữa hai lĩnh vực toán học lý
thuyết và toán học ứng dụng.
Xuất phát từ nhận thức trên với sự hướng dẫn tận tình của thầy giáo
TS.Trần Văn Bằng, em mạnh dạn chọn đề tài "Tính điều khiển được
của hệ Ô-tô-nôm tuyến tính" để thực hiện khóa luận tốt nghiệp của
mình.
Nội dung chính của khóa luận gồm có 2 chương:
Chương 1 : Kiến thức chuẩn bị: Trong chương này trình bày những kiến

thức cơ sở về bài toán điều khiển tối ưu, cần thiết cho việc nghiên cứu trong
chương sau. Các khái niệm được minh họa cụ thể thông qua mô hình điều
khiển xe lửa.
Chương 2 : Tính điều khiển được của hệ Ô-tô-nôm tuyến tính: Trong
chương này tập trung tìm hiểu tập hợp các trạng thái có thể điều khiển được
về mục tiêu thông qua hệ điều khiển Ô-tô-nôm tuyến tính. Ứng dụng xét tính
4


điều khiển được của một số hệ Ô-tô-nôm tuyến tính cụ thể.

2. Mục đích nghiên cứu
Tìm hiểu và nghiên cứu tính điều khiển được của hệ Ô-tô-nôm tuyến tính.

3. Nhiệm vụ nghiên cứu
- Nghiên cứu tính điều khiển được của hệ Ô-tô-nôm tuyến tính;
- Ứng dụng xét tính điều khiển được của một số hệ Ô-tô-nôm tuyến tính
cụ thể.

4. Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu: Bài toán Ô-tô-nôm tuyến tính.
Phạm vi nghiên cứu: Tính điều khiển được.

5. Phương pháp nghiên cứu
Tổng hợp kiến thức thu thập được qua những tài liệu liên quan đến đề tài
và sử dụng các phương pháp nghiên cứu của giải tích.

6. Đóng góp của đề tài
Xây dựng luận văn thành một tài liệu tổng quan tốt cho sinh viên về đề
tài Tính điều khiển được của hệ Ô-tô-nôm tuyến tính.

Do là lần đầu tiên thực tập nghiên cứu, thời gian có hạn và năng lực bản
thân còn hạn chế nên chắc bài nghiên cứu này khó tránh khỏi những sai sót.
Em rất mong nhận được những đóng góp, ý kiến của các thầy cô giáo và bạn
đọc để đề tài được hoàn chỉnh và đạt kết quả cao hơn.
Em xin chân thành cảm ơn!
5


6


Bảng kí hiệu
C, C[u(.)] Hàm chi phí.
C

Tập điều khiển được.

C (t)

Tập điều khiển được tại thời điểm t.

CBB

Tập điều khiển sử dụng điều khiển bang-bang.

CBB (t)

Tập điều khiển sử dụng điều khiển bang-bang ở thời điểm t.

CBBP C


Tập điều khiển sử dụng điều khiển bang-bang hằng từng khúc.

K(t; x0 )

Tập khả đạt ở thời điểm t với điểm xuất phát là x0 .

RC

Nón khả đạt.

Rn

Không gian Euclid n-chiều.

T (t)

Trạng thái mục tiêu.



Hình lập phương đơn vị trong Rm .

Um (t0 , t1 ) Lớp hàm đo được từ [t0 , t1 ] đến Ω.
Um

∪t1 >t0 Um (t0 , t1 )

UP C


Lớp các hàm hằng từng khúc trong Um .

UBB

Lớp của hàm trong Um theo đó |ui (t)| = 1.

xi

Thành phần thứ i của x.

xT

Chuyển vị của x.

< x, y >

Tích vô hướng thông thường của hai véc tơ x và y :

ix

Lớp các điều khiển thành công; chúng hướng trạng thái
ban đầu đến mục tiêu.
7

i i

y


Chương 1

KIẾN THỨC CHUẨN BỊ
1.1
1.1.1

Bài toán điều khiển tối ưu
Khái niệm cơ bản

Lý thuyết điều khiển quan tâm đến quản lý trạng thái của một hệ bằng
cách sử dụng các điều khiển. Bản chất là chúng ta có một hệ biến đổi nào đó
và chúng ta cố gắng để tác động đến trạng thái của hệ thông qua các điều
khiển. Động lực học của hệ là cách thức mà trạng thái thay đổi dưới ảnh
hưởng của các điều khiển, nó có thể rất phức tạp trong thực tế. Ngoài ra
có hai khái niệm nữa là các ràng buộc đối với điều khiển và trạng thái mục
tiêu. Ví dụ sau sẽ cho chúng ta thấy cách điều khiển trạng thái của một hệ
và những ràng buộc đối với điều khiển và mục tiêu của hệ.
Ví dụ 1.1 (Mô hình động cơ xe lửa). Xét một chiếc xe lửa chạy trên đường
ray theo một hướng, có khối lượng một (đơn vị) và được trang bị hai động
cơ phản lực ở hai đầu (Hình 1.1).
Vấn đề đặt ra là ta phải điều khiển xe từ vị trí cho trước đến một địa
điểm định sẵn gọi là mục tiêu hay đích. Để đơn giản, chúng ta đặt đích ở

Hình 1.1: Mô hình động cơ xe lửa
8


Hình 1.2: (Di chuyển sang phải) Lực hướng sang trái khi u(t∗ ) < 0

gốc tọa độ và kí hiệu vị trí của tâm xe là p(t). Nếu xe ở vị trí p0 tại thời
điểm t = 0, với vận tốc v0 , chúng ta phải kích hoạt hai động cơ theo một số
phương thức (mô hình, chương trình) để đưa xe đến mục tiêu p = 0 và dừng

lại (tức là vận tốc bằng 0) tại một thời điểm t1 > 0. Trong mô hình này,
ta có thể xác định hệ gồm có chiếc xe và đường ray, trạng thái là vectơ hai
chiều x(t) = (p(t), p(t));
˙
trạng thái ban đầu (p0 , v0 ) được giả thiết đã cho. Lý
do ta sử dụng vectơ hai chiều cho trạng thái chỉ đơn giản là ta muốn biết vị
trí và tốc độ của xe như thế nào. Mục tiêu của hệ là trạng thái (0, 0). Điều
khiển u(t) là hàm giá trị thực, biểu diễn lực tác động của động cơ lên xe tại
thời điểm t. Tại một thời điểm t∗ , nếu chúng ta kích hoạt động cơ bên phải
chúng ta sẽ nói lực tác động là âm, nếu chúng ta kích hoạt động cơ bên trái
thì chúng ta nói lực tác động là dương.
Khi đó động lực của hệ được xác định bởi định luật Newton F = ma, cụ
thể là p¨(t) = u(t). Ở dạng vectơ ta có:

x(t) =

p(t)
p(t)
˙

,

˙
x(t)
=

0 1
0 0

x(t) + u(t)


0
1

.

Có những ràng buộc về độ lớn của u(t), dựa trên kích thước của các động
cơ phản lực và giới hạn chịu áp lực của xe.
Một giả thiết hợp lý về mặt toán học là u(t) đo được bị chặn, và để đơn
giản ta sẽ giả thiết |u(t)| ≤ 1. Có một lớp điều khiển tự nhiên hơn đó là lớp
điều khiển liên tục từng khúc.
Đã cho một điều khiển u(t) nghĩa là cho một phương thức kích hoạt động
cơ, chẳng hạn:

9



+1,
u(t) =
 −1 ,

0≤t≤1
1
2

nghĩa là ta kích hoạt động cơ bên trái hoàn toàn trong một đơn vị thời gian,
sau đó kích hoạt động cơ bên phải bằng một nửa khả năng trong hai đơn vị
thời gian tiếp theo.

Nếu (p0 , v0 ) là vị trí của xe ở thời điểm t = 0 thì ta có thể tích phân hai
lần phương trình rồi sử dụng tích phân từng phần để được:
t

t

(t − r)u(r)dr;

p(t) = p0 + v0 t +

p(t)
˙ = v0 +

0

u(r)dr.
0

Do đó mỗi điều khiển u(·), tạo ra một phản hồi x[t] = x(t; x0 , u(·)) (bỏ
qua thời điểm ban đầu t0 , vì chúng ta luôn giả định t0 = 0. Với hệ không
phụ thuộc t một cách tường minh thì điều đó là hoàn toàn phù hợp). Chúng
ta dùng u(·) để nói về hàm u(t), trên miền xác định của nó. Nếu phản hồi
x(t; x0 , u(·)) đạt đến mục tiêu (0, 0) tại thời điểm t1 > 0, thì u(·) là một điều
khiển thành công.
1.1.2

Thiết lập toán học của bài toán điều khiển

Cho m, n là các số tự nhiên. Nếu x, y là các vectơ cột trong Rn , ta kí hiệu
thành phần thứ i của các vectơ đó tương ứng là xi , y i . Gọi xT là chuyển vị

của x, và ta kí hiệu tích vô hướng và hai chuẩn thường dùng:
n
T

xi y i ,

< x, y >= x y =
i=1
n

|xi |,

|x| =

1

x =< x, x > 2 .

i=1

Ta viết bình phương của hàm vô hướng Φ(t), là [Φ(t)]2 , còn x2 (t) có nghĩa
là thành phần thứ hai của hàm giá trị vectơ x(t). Kí hiệu Ω là hình lập
phương đơn vị trong Rm , nghĩa là,
10


Ω = {c|c ∈ Rm , |ci | ≤ 1, i = 1, 2, ..., m}.
Với t1 ≥ 0, ta định nghĩa
Um [0, t1 ] = {u(·)|u(t) ∈ Ω và u(·) đo được trên [0, t1 ]},
Um =


Um [0, t1 ].
t1 >0

Trừ khi nói rõ ràng, nếu không ta luôn giả thiết điều khiển u(·) thuộc Um .
Định nghĩa này cho phép mỗi điều khiển chấp nhận được có một tập xác
định riêng [0, t1 (u)].
Giả sử với mỗi t ≥ 0 ta có một tập hợp các mục tiêu T (t) ⊂ Rn , trong đó
T (t) là một tập đóng. Để đơn giản ta thường xét T (t) ≡ 0 ∈ Rn .
Giả sử động lực của hệ, tức là sự tiến hóa của trạng thái x(t) dưới một
điều khiển u(t) đã cho được xác định bởi một phương trình vi phân thường
vectơ:
˙
x(t)
= f (t, x(t), u(t)),

x(t0 ) = x0 .

(1.1)

i

i

∂f ∂f
Ta sẽ luôn giả thiết f (t, x, u), ∂x
j , ∂uk liên tục (i, j = 1, ..., n, k = 1, ..., m)

trên [0, ∞) × Rn × Rm , mặc dù hầu hết các kết quả vẫn đúng dưới các điều
kiện yếu hơn. Giả thiết này đảm bảo sự tồn tại địa phương và tính duy nhất

nghiệm của (1.1) với mỗi u(·) ∈ Um đã cho. Vì u(·) chỉ giả định đo được và
bị chặn, nên vế phải của phương trình x˙ = f (t, x, u(t)) liên tục theo x, nhưng
chỉ đo được và bị chặn theo t đối với mỗi x. Do đó, nghiệm được hiểu là hàm
liên tục tuyệt đối và thỏa mãn (1.1) hầu khắp nơi. Mỗi nghiệm của (1.1) với
u(·) đã cho sẽ được gọi là một phản hồi đối với u(·); và ta kí hiệu nó bởi
x[t] = x(t; x0 , u(·)). Bài toán điều khiển là bài toán xác định x0 và u(·) ∈ Um
sao cho phản hồi tương ứng thỏa mãn x[t1 ] ∈ T (t1 ) với một t1 > 0. Khi đó
chúng ta nói rằng điều khiển u(·) hướng x0 đến mục tiêu.
Nếu điều khiển u(·) xác định trên [0, t1 ), (t1 ≤ +∞), thì điều đó không
có nghĩa là phản hồi tương ứng có thể thác triển lên [0, t1 ), có thể phản hồi

11


x(t; x0 , u(·)) chỉ xác định trên một khoảng con của [0, t1 ). Nhưng với phương
trình tuyến tính,
˙
x(t)
= A(t)x(t) + B(t)u(t),

(1.2)

với A(t) và B(t) liên tục trên [0, t1 ), thì nghiệm luôn thác triển được lên
[0, t1 ).
Do đó, bài toán điều khiển bao gồm một lớp điều khiển chấp nhận được
Um , một phương trình vi phân vectơ (1.1) mô tả động lực của hệ, và một họ
các tập mục tiêu T (t). Một bài toán cơ bản là mô tả các trạng thái ban đầu
x0 ∈ Rn mà có thể hướng đến mục tiêu, và gọi đó là các trạng thái điều khiển
được. Hơn nữa, nếu T (t) là tập đóng, bị chặn với phần trong khác rỗng thì
ta muốn phản hồi đi xuyên qua T (t) hơn là tiếp xúc với T (t). Bài toán này

dẫn tới xác định điều kiện cắt ngang, tức là điều kiện để quỹ đạo không phải
là tiếp tuyến (mà là cắt) biên của T (t).
1.1.3

Tính điều khiển được

Cho bài toán điều khiển:
x˙ = f (t, x, u),

u(·) ∈ Um ,

T (t) đã cho.

(1.3)

Chúng ta sẽ thảo luận về tính điều khiển được, tức là, mô tả những trạng
thái ban đầu x(0)=x0 sao cho tồn tại ít nhất một điều khiển thành công u(·).
Ta định nghĩa tập hợp điều khiển được C =

t1 >0 C (t1 ),

trong đó

C (t1 ) = {x0 ∈ Rn |∃u(·) ∈ Um sao cho x(t1 ; x0 , u(·)) ∈ T (t1 )}
hay đơn giản là tập những trạng thái mà có thể hướng đến mục tiêu ở thời
điểm t1 . Hai vấn đề lớn về tính điều khiển được là:
(a) miêu tả tập C ;
(b) miêu tả cách C thay đổi nếu chúng ta thay đổi tập điều khiển Um .
Liên quan đến các lớp điều khiển đặc biệt, có 3 tập con của Um mà chúng
ta sẽ xét:


12


(a) UP C [0, t1 ]={u(·) ∈ Um [0, t1 ]|u(·) hằng từng khúc trên [0, t1 ]}, trong đó
hàm u(·) là hằng từng khúc nếu tồn tại một phân hoạch (phụ thuộc
vào u(·)) 0 = S0 < S1 < ... < Sl = t1 sao cho u(t) là hằng số trên mỗi
khoảng [Sk−1 , Sk ). Từ quan điểm thực tế, UP C =

t1 >0 UP C [0, t1 ]

bao

gồm các điều khiển dễ sử dụng so với điều khiển thuộc Um nói chung.
(b) Uε [0, t1 ]={u(·) ∈ Um [0, t1 ]|u(·) liên tục tuyệt đối, u(0) = u(t1 ) = 0,
˙
|u(t)| ≤ 1 và |u(t)|
≤ ε hầu khắp nơi trên [0, t1 ]},
trong đó ε > 0 cố định, Uε =

t1 >0 Uε [0, t1 ]

là lớp các điều khiển trơn

(không thay đổi đột ngột)- chẳng hạn là việc điều khiển một chiếc xe.
(c) UBB [0, t1 ]={u(·) ∈ Um [0, t1 ]||ui (t)| ≡ 1 trên [0, t1 ], i = 1, ..., m}, là lớp
điều khiển "bang-bang". Điều khiển từ lớp UBB =

t1 >0 UBB [0, t1 ]


sử

dụng năng lượng tối đa cho phép (nhớ rằng u(t) ∈ Ω) tại mọi thời điểm.
Lớp các điều khiển bang-bang hằng từng khúc trên [0, t1 ] được ký hiệu
là UBBP C [0, t1 ] và UBBP C =

t1 >0 UBBP C [0, t1 ].

Để nghiên cứu tính điều khiển được đối với một trạng thái ban đầu x0 , ta
gọi K(t; x0 ) là tập khả đạt ở thời điểm t, và RC(x0 ) là nón khả đạt. K(t; x0 )
là tập hợp các trạng thái trong Rn mà có thể đạt được ở thời điểm t, khởi
đầu từ trạng thái x0 ở thời điểm t0 = 0, trong đó sử dụng tất cả các điều
khiển chấp nhận được, tức là:
K(t, x0 ) = {x(t; x0 , u(·))|u(·) ∈ Um };

RC(x0 ) = {(t, x(t; x0 , u(·)))|t ≥ 0, u(·) ∈ Um } =

t × K(t; x0 ).
t≥0

Để đơn giản, lấy t0 = 0 (nếu chúng ta cho phép t0 là tùy ý thì ta sẽ phải
xác định K(t; t0 , x0 ), RC(t0 , x0 ) theo cách tương tự). Hình 1.3 phác họa hai
tập K(t; x0 ), RC(x0 ) trong trường hợp n = 2. Hai phản hồi phác họa trong
đó cho ta hình dung về biên của RC(x0 ).
13


Hình 1.3:

Hình 1.4:


RC(x0 ) trông giống như hình nón và K(t, x0 ) là lát cắt của nón tại thời
điểm t. Các tập hợp K(t, x0 ) trong thực tế là các tập trong không gian (x1 , x2 ),
vì vậy chúng ta nên chiếu chúng trở lại không gian (x1 , x2 ), như được phác
họa trong Hình 1.4. Khi đó chúng ta sẽ nhìn thấy trực tiếp sự biến đổi của
tập khả đạt theo thời gian (luôn bắt đầu từ x0 tại t0 = 0).
1.1.4

Điều khiển tối ưu

Bài toán điều khiển cơ bản thường liên quan tới một hàm chi phí hoặc
một tiêu chí thực hiện. Chúng ta sẽ chỉ giải quyết với hàm chi phí có dạng
t1

f 0 (x[t], u(t))dt,

C[u(·)] =

x[t] ≡ x(t; x0 , u(·)),

0

trong đó f 0 là hàm giá trị thực đã cho. Bài toán điều khiển tối ưu là điều
khiển x0 đến mục tiêu, bằng cách dùng điều khiển u(·) từ lớp nào đó, theo
14


cách làm cho C[u(·)] nhỏ nhất. Chính xác hơn, gọi tập các điều khiển thành
công được là ∆, tức là,
∆ = {u(·) ∈ Um |∃t1 ≥ 0 sao cho x(t1 ; x0 , u(·)) ∈ T (t1 )}.

Khi đó điều khiển u∗ (·) ∈ Um là tối ưu nếu nó thành công, tức là, u∗ (·) ∈ ∆,

C(u∗ (·)) ≤ C(u(·)) với mọi u(·) ∈ ∆.
Trong lý thuyết điều khiển tối ưu, có hai vấn đề cơ bản:
(a) Chứng minh sự tồn tại của điều khiển tối ưu, và
(b) Tìm (xây dựng) một điều khiển tối ưu, hay, đưa ra một công thức để
điều khiển đến mục tiêu một cách tối ưu.
Ngoài ra cũng có một số vấn đề liên quan khác như tính duy nhất của
điều khiển tối ưu và tính thực tế của nó. Cuối cùng là các điều kiện cần mà
điều khiển tối ưu phải thỏa mãn là gì? Ở đây cần tới mô hình mạnh của
phép tính biến phân. Trong phép tính biến phân, hàm thực y(·) cực tiểu hóa
b

g 0 (t, y(t), y(t))dt,
˙
trên lớp các hàm khả vi liên tục thỏa

phiếm hàm thực
a

mãn y(a)=y(b)=0 phải là nghiệm của phương trình Euler-Lagrange
d ∂g 0
∂g 0
[
(t, y(t), y(t))]
˙

(t, y(t), y(t))
˙
= 0.

dt ∂ y˙
∂y
Điều này rất quan trọng trong việc tìm hàm cực tiểu hóa, vì nghiệm của
phương trình Euler-Lagrange thường dễ mô tả. Trong lý thuyết điều khiển
tối ưu, một điều kiện cần tương tự cho điều khiển tối ưu u(·) là nguyên lý
cực đại Pontryagin.

1.2

Động cơ xe lửa

Chúng ta sẽ thông qua mô hình động cơ xe lửa để minh họa các tập
K(t; x0 ), RC(x0 ) và các khái niệm: tính điều khiển được, xây dựng điều
khiển tối ưu và tính tối ưu.
15


Chúng ta sẽ sử dụng (p(t), q(t)), gồm vị trí và vận tốc là vectơ trạng thái
thay vì (x1 , x2 ), nên động lực được mô tả bởi
p(t)
˙ = q(t),

q(t)
˙ = u(t),

−1 ≤ u(t) ≤ 1,

u(·) đo được,

(R)


với (p(t), q(t)) bằng (p0 , q0 ) tại t = 0. Mục tiêu của chúng ta là T (t) ≡ (0, 0)
nên ta muốn (p(t1 ), q(t1 )) = (0, 0), trong đó t1 > 0 chưa xác định cụ thể. Để
định nghĩa phiếm hàm chi phí thích hợp, ta xét một số vấn đề sau:
(a) Toàn bộ quá trình phải được thực hiện trong một khoảng thời gian hợp
lý (nhưng không xác định cụ thể). "Tiêu chí thực hiện" được đo bởi
t1

dt. (Cận trên t1 là thời điểm một phản hồi đạt được tới gốc, và nói
0

chung nó phụ thuộc vào u(·))
(b) Động năng của hệ phải được giới hạn để có thể kiểm soát được sự hao
t1

[q(t)]2 dt.

mòn máy móc. Một cách để đo động năng là
0

(c) Tiêu thụ nhiên liệu phải được giữ trong giới hạn hợp lý (nhưng không
t1

|u(t)|dt (giả

xác định cụ thể). Điều này có thể được đo thông qua
0

thiết nhiên liệu tiêu thụ tỉ lệ với lực sinh ra)
Để kết hợp toàn bộ các tiêu chí thực hiện ở trên, chúng ta định nghĩa:

t1

(λ1 + λ2 [q(t)]2 + λ3 |u(t)|)dt,

C[u(·)] =
0

trong đó λk ≥ 0 (k = 1, 2, 3), λ1 + λ2 + λ3 = 1. Mỗi λk đại diện cho mức quan
trọng của chi phí tương ứng. Phương trình vi phân vectơ (R) là tuyến tính,
nên cho mỗi một điều khiển u(·) và trạng thái ban đầu (p0 , q0 ) sẽ có một phản
hồi duy nhất, x[t], xác định với mọi t ≥ 0. Đầu tiên chúng ta nghiên cứu bài
toán điều khiển tối ưu xe lửa với u(·) ∈ UBBP C . Tập hợp khả đạt tương ứng
16


Hình 1.5:

sẽ được kí hiệu KBBP C (t; x0 ) để phân biệt nó với tập khả đạt K(t; x0 ) khi
chúng ta sử dụng điều khiển bất kì từ U1 .
Nếu u(t) ≡ 1 trên một khoảng thời gian khởi điểm ở t = 0, thì
p˙ = q,

q˙ = 1 ⇒ q q˙ = p˙ ⇒ [q(t)]2 − q02 = 2[p(t) − p0 ];

(+)

Nếu u(t) ≡ −1 trên một khoảng như vậy thì
p˙ = q,

˙ ⇒ [q(t)]2 − q02 = −2[p(t) − p0 ].

q˙ = −1 ⇒ q q˙ = −p

(-)

Do đó các phản hồi tương ứng là các parapol ±2p = q 2 + α trong đó α là
hằng số (Hình 1.5). (Để nhấn mạnh parabol, chúng ta đã phác họa cả phần
không có bởi nét đứt).
Nếu chúng ta thay giá trị của u(t) giữa ±1 trên một vài khoảng thời gian
kế tiếp thì ta nhận được các quỹ đạo (phản hồi) như trong Hình 1.6(a),(b).
Dấu của điều khiển tương ứng được chỉ ra trong dấu ngoặc đơn bên cạnh
quỹ đạo. Điểm trong không gian (p, q) nơi chúng ta chuyển giá trị của điều
khiển (điểm chuyển mạch) được kí hiệu bởi ✷.
Chúng ta cũng phác họa một phần không có của parabol bởi nét đứt để
giúp hình dung quỹ đạo là parabol. Để ý rằng khi q = 0, sau đó p˙ = 0 và
p¨ = q˙ = ±1, nên khi đó p sẽ đạt cực tiểu hoặc cực đại.
Phương trình vi phân (R) là Ô-tô-nôm (không liên quan trực tiếp tới t).
Do đó kết quả của hệ với u(t) ≡ +1 (chẳng hạn) không phụ thuộc vào thời
17


Hình 1.6:

Hình 1.7:

điểm chúng ta chuyển sang điều khiển này từ u(t) ≡ −1 (thời điểm chuyển
mạch); phản hồi chỉ phụ thuộc vào trạng thái khi chúng ta chuyển. Trong
Hình 1.6(a) trạng thái tại điểm s1 xác định quỹ đạo tiếp theo chứ không phụ
thuộc vào thời điểm hệ đạt tới s1 là 108 hay 10−8 . Chúng ta dùng cùng một
kí hiệu s1 trong cả hai Hình 1.6 (a) và 1.6(b) để chỉ ra rằng quỹ đạo sau đó
là đồng nhất.

Để mô tả tập khả đạt KBBP C (t1 ; x0 ), chúng ta cố định t1 > 0 và lấy
x0 = (p0 , 0) cho đơn giản. Trong Hình 1.7(a) chúng ta phác họa 2 phản hồi
cơ bản tương ứng với trường hợp u(t) ≡ −1 trên [0, t1 ], và u(t) ≡ +1 trên
[0, t1 ]. Trong Hình 1.7(b) chúng ta đã phác họa toàn bộ trạng thái có thể đạt
được bằng cách chuyển điều khiển trong một khoảng thời gian cố định [0, t1 ].
Tất nhiên là ta càng đi xa theo quỹ đạo cơ bản trước khi chuyển mạch, thì
ta càng còn ít thời gian trên quỹ đạo mới sau khi chuyển. Vì thế tập khả tới
có dạng hình bầu dục.
Biên của "hình bầu dục" trong Hình 1.7(b) là tập các điểm khả tới
18


Hình 1.8:

x(t1 ; x0 , u(.)), với một lần chuyển điều khiển. Do đó KBBP C (t1 ; x0 ) chính
là toàn bộ miền đóng bên trong biên đó. Chúng ta sẽ chỉ ra cách để đi đến
điểm trong bất kì của hình bầu dục tại thời gian chính xác t1 , bằng cách
sử dụng điều khiển bang-bang hằng từng khúc, vì vậy KBBP C (t1 ; x0 ) ít nhất
chứa toàn bộ miền bầu dục.
Để thuyết phục người đọc rằng, bất kì điểm z nào bên trong "miền bầu
dục" đều có thể sắp xếp để đạt đến z ở chính xác thời điểm t = t1 bằng
cách sử dụng điều khiển bang-bang hằng từng khúc, chúng ta sẽ chỉ ra cách
"lãng phí" một lượng thời gian tùy ý. Hình 1.8, từ trạng thái z, ta chuyển
động lùi theo parabol (-) cho đến khi chạm đến parabol (+) cơ bản. Vì hệ
là Ô-tô-nôm nên ta mất một lượng thời gian t∗ (t∗ < t1 ) để đi từ trạng thái
x0 = (p0 , 0) "lên" đến trạng thái ✷ và "xuống" trạng thái z, vì vậy chúng ta
cần phải lãng phí một khoảng thời gian t1 − t∗ . Ý tưởng là ta sẽ chạy quanh
vòng quanh theo chu trình L trong khoảng thời gian t1 − t∗ (kết thúc tại x0
), sau đó tiếp tục đi đến trạng thái ✷ và z.
Ta đi mô tả tập điều khiển được CBBP C đối với động cơ xe lửa, nghĩa là,

những trạng thái ban đầu có thể điều khiển được tới 0 bởi các điều khiển
bang-bang hằng từng khúc.
CBBP C = {x0 |∃u(·) ∈ UBBP C và t1 > 0 sao cho x(t1 , x0 , u(·)) = 0}.
Trong Hình 1.9, đầu tiên ta phác họa phản hồi [q]2 = 2p đối với u(t) ≡ +1,
19


Hình 1.9: (+), (−) là đường cong chuyển điều khiển

Hình 1.10: Một cơ chế điều khiển cho xe lửa

t ∈ [0, ∞), đi qua (0, 0); tương tự ta phác họa phản hồi [q]2 = −2p ứng với
u(t) ≡ −1, t ∈ [0, ∞).
Hai phản hồi này (kí hiệu (+),(-), tương ứng, trong Hình 1.9) tất nhiên
đều đi qua mục tiêu (0, 0), vì vậy với bất kì trạng thái x0 = (p0 , q0 ), chúng
ta chỉ cần điều khiển nó tới một trong hai quỹ đạo cơ bản trên. Mà điều
này luôn luôn có thể thực hiện được. Bởi vì động lực được xác định bởi một
phương trình vi phân Ô-tô-nôm, nên ta có thể xác định một điều khiển chỉ
phụ thuộc vào trạng thái (điều khiển phản hồi): nếu x0 ở bên trên hợp của
quỹ đạo (+) và (-) thì ta đặt u(t) ≡ −1 cho đến khi trạng thái đạt tới đường
cong (+) (s1 trong Hình 1.9) thì chuyển sang u(t) ≡ +1. Nếu x0 ở dưới của
quỹ đạo (+) và (-) thì đặt u(t) ≡ +1 cho đến khi trạng thái đạt tới đường
cong (-) thì chuyển sang u(t) ≡ −1. Chú ý rằng trong tất cả các trường hợp,
u(t) chỉ phụ thuộc vào trạng thái x(t).

20


Tiếp theo chúng ta sẽ thảo luận vắn tắt về bài toán điều khiển tối ưu xe
lửa. Phiếm hàm chi phí là

t1

{λ1 + λ2 [q(t)]2 + λ3 |u(t)|}dt,

C[u(·)] =
0
3

λk = 1,

λk

0 với k = 1, 2, 3,

1

trong đó u(·) ∈ U1 .
*Bài toán điều khiển tối ưu thời gian (λ1 = 1, λ2 = λ3 = 0)
Bằng trực giác, có vẻ ta nên sử dụng một điều khiển bang-bang để thay
đổi trạng thái nhanh nhất. Do đó cách xây dựng cơ chế điều khiển trên đây
là tối ưu.
*Bài toán điều khiển tối ưu nhiên liệu (λ1 = λ2 = 0, λ3 = 1)
Bằng trực giác, ta thấy sẽ không có nghiệm tối ưu khi q(0) = 0. Điều này
xuất phát từ thực tế là nếu xe lửa bắt đầu ở trạng thái tĩnh, chúng ta có
thể kích hoạt để tăng tốc một chút rồi sau đó để xe từ từ đi về đích. Cơ chế
điều khiển như vậy đòi hỏi một thời gian rất dài vì chỉ kích hoạt một ít, và
sẽ không có cực tiểu hóa u(·)- chúng ta có thể tiêu tốn ít nhiên liệu nhưng
chúng ta sẽ phải tốn một thời gian dài để đạt đến mục tiêu.
Để kiểm chứng phân tích trên ta xét trạng thái ban đầu (p0 , 0) với p0 < 0.
Đặt uα (t) = +1 khi 0 ≤ t ≤ α và uα (t) = −1 khi |(p0 /α)| ≤ t ≤ α + |p0 /α|,

và u(t) ≡ 0 trong các trường hợp còn lại. Khi đó chi phí tương ứng là
C[uα (·)] = 2α, vì vậy infU1 C[u(·)] = 0. Nếu u0 (·) là một điều khiển tối ưu,
thì C[u0 (·)] = 0, hay u(t) = 0 hầu khắp nơi. Nhưng từ phương trình chuyển
động của xe lửa, p¨(t) = u(t), ta có p(t) ≡ p0 , do đó điều khiển như vậy sẽ
không thành công.

21


Chương 2
TÍNH ĐIỀU KHIỂN ĐƯỢC CỦA
HỆ Ô-TÔ-NÔM TUYẾN TÍNH
Trong Chương 1, chúng ta đã chỉ ra những vấn đề cơ bản của lý thuyết
điều khiển tối ưu. Trong chương này, chúng ta sẽ tập trung tìm hiểu vấn đề
đầu tiên, đó là nghiên cứu các tính chất của tập hợp tất cả các trạng thái có
thể điều khiển thành công về mục tiêu thông qua hệ Ô-tô-nôm tuyến tính:
x˙ = Ax + Bu,

A, B là các ma trận hằng số,

(LA)

với mục tiêu T (t) ≡ 0.

2.1

Tính điều khiển được của hệ Ô-tô-nôm tuyến tính

Theo lý thuyết phương trình vi phân (xem [1]), cho trước một điều khiển
u(·) ∈ Um nghiệm của (LA) với trạng thái ban đầu x0 tại thời điểm t = 0,

được cho bởi công thức phản hồi
t
−1

X(t)X−1 (s)B(s)u(s)ds,

x[t] ≡ x(t; x0 , u(·)) = X(t)X (0)x0 +

(2.1)

0

trong đó X(t) là ma trận cơ bản bất kì của phương trình thuần nhất x(t)
˙
=
Ax(t). Đặc biệt, x0 ∈ C (t1 ) (ta đạt mục tiêu T (t) = 0 tại thời điểm t1 ) khi
và chỉ khi có một u(·) ∈ Um sao cho
t1

−1

X(t1 )X (0)x0 +

X(t1 )X−1 (s)B(s)u(s)ds = 0.

0

22

(**)



Định lí 2.1. Cho hệ (LA), tập có thể điều khiển được C ∈ Rn là đối xứng
và lồi.
Chứng minh. Sử dụng (**) ta thấy rằng, x0 ∈ C (t1 ) khi và chỉ khi có một
t1 > 0 và một u(·) ∈ U [0, t1 ] sao cho:
t1

x0 = −X0

X−1 (s)B(s)u(s)ds.

(2.2)

0

Nhờ (2.2), nếu x0 ∈ C (t1 ) (sử dụng u(·)), thì −x0 ∈ C (t1 ) (sử dụng −u(·)),
nên C =

C (t1 ) là đối xứng.
t1 >0

Vì phép lấy tích phân là tuyến tính và Um [0, t1 ] là lồi nên từ (2.2) ta suy
ra C (t1 ) là lồi.
Thật vậy, nếu x0 ∈ C (t1 ) với điều khiển u0 (·) và x∗ ∈ C (t1 ) với điều khiển
u∗ thì [αx0 + (1 − α)x∗ ] ∈ C (t1 ) với điều khiển [αu0 + (1 − α)u∗ ]. Nhưng hợp
C =

C (t1 ) của các tập lồi có thể không lồi. Thực tế để chứng minh C
t1 >0


lồi, ta lấy x0 ∈ C (t1 ), x∗ ∈ C (t∗ ), khi đó (2.2) đúng với x0 và x∗ thỏa mãn
t∗

x∗ = −X(0)

X−1 (s)B(s)u∗ (s)ds.

0

Không mất tính tổng quát, giả sử t1 < t∗ .
Nếu ta xác định một điều khiển mới u0 (t) bằng u(t) từ (2.2) trên [0, t1 ]
và bằng 0 trên (t1 , t∗ ] thì (2.2) được viết thành
t∗

x0 = −X(0)

X−1 (s)B(s)u0 (s)ds,

0

Điều đó có nghĩa là x0 ∈ C (t∗ ). Vì C (t∗ ) là lồi nên tổ hợp bất kì của x∗ và
x0 cũng thuộc C (t∗ ) ⊂ C .

Nhận xét 2.1.

1. Định lí trên vẫn đúng (chứng minh tương tự) với A(t), B(t)

là các ma trận liên tục, không nhất thiết là các ma trận hằng số.
2. Định lí trên được áp dụng cho bất kì lớp điều khiển U có cả tính đối

xứng và tính lồi. Vì vậy, định lí này đúng với cả các lớp điều khiển UP C
23


×