1
NHỮNG HẠN CHẾ VỀ NGUYÊN TẮC CỦA CÁC LÝ THUYẾT ĐIỀU KHIỂN TỐI
ƯU HIỆN NAY VÀ NHỮNG HIỂU SAI THƯỜNG GẶP KHI VẬN DỤNG
TS . Lê Văn Ngự
Viện NC Điện tử, Tin học, Tự động hóa
Tóm tắt
Cho đến nay việc giải các bài toán điều khiển tối ưu chủ yếu dựa trên cơ sở của các nguyên
lý Bellmal, nguyên lý cực đại Pontriagin hoặc các lý thuyết khác. Những lý thuyết này còn có
chung hạn chế về nguyên tắc là ở chỗ nó chỉ là những điều kiện cần mà không đủ. Khi vận
dụng còn có yếu tố kinh nghiệm trực quan và có thể dẫn đến hiểu sai. Từ những kết quả
nghiên cứu theo hướng tiếp cận khác bài báo đã chỉ rõ một số trường hợp hiểu sai ngay ở các
bài toán được coi là kinh điển trong các sách giáo khoa bậc Đại học và các tài liệu khác của
các tác giả trong và ngoài nước.
1. Thiết lập bài toán
Đến nay ở hầu hết các tài liệu bài toán được đặt ra như sau.
Cho đối tượng điều khiển có mô hình động lực học dạng
( ) ( )
u,xftx =
&
(1)
Trong đó : x(
x
n
x
i
x
x
,,,,
2
,
1
LL
) là biến (vec tơ ) trạng thái
()
u
r
u
i
uu
u
,,,,
2
,
1
KK
là vec tơ điều khiển
với điều kiện hạn chế
uu
u
maxmax
≤≤−
(2)
Hàm mục tiêu có dạng :
() ()
dttuxGtuxQ
T
∫
=
0
,,,, (3)
Trong đó G(x,u,t) là hàm đối với x,u và thời gian t .
Vec tơ điều khiển
)(
*
tu
cần phải xác định để chuyển đối tượng từ trạng thái ban đầu x(t
o
)
đến trạng thái cuối x(T) để hàm mục tiêu Q đạt giá trị nhỏ nhất gọi là điều khiển tối ưu.Quỹ
đạo trạng thái tương ứng từ x(t
o
) đến x(T) gọi là quĩ đạo tối ưu. Khi G=1 thì được gọi là bài
toán tối ưu tác động nhanh.
Đây là bài toán rất khó , đến nay vẫn chưa có cách giải hoàn chỉnh.Là bài toán được thiết
lập cho hệ thống nhiều biến có liên quan đến những khái niệm trừu tượng và phải được hiểu
chính xác.Những khó khăn này tồn tại ở ngay bước thiết lập bài toán.
Thứ nhất là điều kiện hạn chế của u trong trường hợp tổng quát là đại lượng biến đổi phụ
thuộc vào trạng thái của đối tượng mà không phải luôn luôn ở dạng
uu
u
maxmax
≤≤−
(mặc dù
các thành phần có thể hạn chế ở dạng
maxmax
iii
uuu
≤≤−
)
Thứ hai là hàm mục tiêu được thiết lập ở dạng tích phân của biến thời gian. Điều này gặp
phải khó khăn là ngay ở những trường hợp đơn giản cũng không tìm được hàm tường minh
của các đại lượng theo thời gian.Trường hợp tác động nhanh khi G=1 thì hàm mục tiêu
∫
=
T
dtQ
0
.1
không biểu hiện rõ quan hệ của nó với các đại lượng khác của bài toán ,ngay cả
khoảng thời gian xảy ra quá trình cũng chưa biết và thực tế thời gian không được tính theo
biểu thức này.Các lí thuyết áp dụng cho trường hợp này phải qua các bước tính toán rất phức
tạp nhưng kết quả vẫn bị hạn chế do bản thân các lí thuyết chưa hoàn chỉnh .Dưới đây xin
trình bày hướng tiếp cận mới.
2. Hướng tiếp cận mới
Mục tiêu cơ bản của bài toán không thay đổi nhưng hướng tiếp cận mới được thể hiện ở
các nội dung sau
2
2.1
Quan niệm sự biến thiên trạng thái động học như là một thuộc tính của đối tượng. Do đó
việc khảo sát sự biến thiên trạng thái được thực hiện độc lập với tác động điều khiển (là
nguyên nhân gây ra biến đổi trạng thái ,thường có liên quan trực tiếp hay gián tiếp đến quá
trình biến đổi năng lượng)
2.2.
Xác lập hàm mục tiêu là hàm của các biến trạng thái
( )
XXQ
&
,
mà không theo biến thời
gian.Thời gian được coi như một tham số ,khi cần nó có thể được xác định theo các biến
trạng thái.
2.3
Xác định quĩ đạo tối ưu đồng thời với điều khiển tối ưu dựa trên các quan hệ của các biến
trạng thái đối với
( )
XXQ
&
, và
( )
XU
&
X,
3 Các bước thực hiện
3.1. Sự biến thiên trạng thái động học
Ở đây khảo sát sự biến thiên trạng thái mà không quan tâm đến tác động điều khiển là
nguyên nhân gây ra nó nên gọi là biến thiên trạng thái động học.Không gian trạng thái được
biểu diễn bởi trục hoành là X và trục tung là
X
&
(hình 1)
Mục tiêu là phải điều khiển đối tượng từ trạng thái ban đầu đến trạng thái cuối để
Q
min
,tức là phải xác định quĩ đạo tối ưu.
Trước khi xác định quĩ đạo tối ưu ta hãy xét quĩ đạo trạng thái nói chung,tức là quan hệ
giữa
⋅
X
và X. Tại mỗi điểm ta có
dt
dX
dt
Xd
dX
Xd
⋅
⋅
=
X
X
dX
Xd
&&&&
=
(4)
Đây là phương trình vi phân của quĩ đạo trạng thái của đối tượng bất kì. Ý nghĩa hình học
của (4) là độ dốc của quĩ đạo tại điểm (X,
X
&
).Nó phụ thuộc vào các biến trạng thái và có quan
hệ với u từ mô hình động lực học.
Tại một điểm đã cho có
X
&
đã biết, độ dốc chỉ phụ thuộc
X
&&
và bị hạn chế trong giới
hạn
XX
X
&&&&
&&
maxmin
≤≤
do u bị hạn chế .Các giá trị giới hạn này hoàn toàn xác định được từ
mô hình động lực học .
Nếu tại một điểm ta dựng các vecto tiếp tuyến với các quỹ đạo ứng với
XX
&&&&
minmax
,
và góc
giữa chúng là
α
thì các quĩ đạo đi qua điểm đó phải nằm trong góc
α
.Vì thế góc
α
biểu thị
phạm vi điều khiển tại một điểm .Góc
α
biến thiên theo
XX
&&
,
tăng thì
α
giảm
α
= π khi
X
&
= 0 (trên trục hoành )
α
= 0 khi
XX
&&&&
minmax
= và tại đó chỉ tồn tại duy nhất một quĩ đạo điều khiển .Tốc độ
mà tại đó
XX
&&&&
minmax
=
gọi là tốc độ giới hạn
X
gh
&
và luôn luôn xác định được .Tập hợp các
điểm có tốc độ giới hạn tạo thành quĩ đạo giới hạn .Việc điều khiển không thực hiện được ở
tốc độ cao hơn tốc độ giới hạn .
3
Nếu trên quỹ đạo giới hạn có
X
&&
là dương thì tồn tại điểm K tại đó
0
X
min
=
&&
và đổi dấu từ
âm sang dương,vì thế quĩ đạo ứng với
X
min
&&
là cực tiểu.Trên khoảng từ K đến quĩ đạo giới
hạn luôn có
X
&&
>0 ,vì thế quĩ đạo luôn luôn tăng .Tương tự nếu trên quĩ đạo giới hạn có
X
&&
là
âm thì tồn tại điểm H tại đó
X
&&
max
=0 và đổi dấu từ dương sang âm vì thế quĩ đạo ứng với
X
&&
max
là cực tiểu .Trên khoảng từ H đến quĩ đạo giới hạn luôn có
X
&&
<0 ,quĩ đạo luôn luôn
giảm .Tập hợp các điểm K và H tạo thành quĩ đạo gọi là quĩ đạo không (đường nét đứt hình
1)Quĩ đạo này chia không gian trạng thái thành ba miền có các tính chất khác nhau là :
1.Miền có thể tăng hoặc giảm (ở dưới điểm K và H)
2.Miền chỉ có thể tăng (ở trên điểm K).Là miền điều khiển không bền vững
3.Miền chỉ có thể giảm (ở trên điểm H)
3.2.
Điều khiển từ trạng thái đầu đến trạng thái cuối
Việc điều khiển từ trạng thái đầu
( )
xxA
&
,
đến trạng thái cuối
( )
xxB
&
,
cũng chỉ có thể thực
hiện được trong phạm vi nhất định.Ta dựng các nhánh quĩ đạo ứng với
X
&&
max
và
X
min
&&
đi ra
khỏi A và đi tới B ,nếu chúng cắt nhau trong miền tốc độ giới hạn thì các quĩ đạo điều khiển
từ A đến B nằm trong miền giới hạn của các đường này (Hình 2.a)
nếu chúng cắt nhau ở ngoài miền tốc độ cho phép thì phải xét cụ thể điều kiện có thể thiết lập
được đoạn quĩ đạo nối các nhánh với nhau H.2,b hay không, nhất là ở miền gần quĩ đạo giới
hạn.
3.3. Áp dụng cho bài toán tối ưu tác động nhanh
Ví dụ khảo sát bài toán tối ưu tác động nhanh cho đối tượng có mô hình động lực học
UX =
&&
,
1≤U
. Ta thấy ngay quĩ đạo tối ưu với thời gian ngắn nhất là quĩ đạo ứng với tốc độ
cao nhất , khi
X
&&
max
=1 và
X
min
&&
=
−
1
X
&
A
B
X
X
&
A
B
X
a b
H.2. Mi
ền điều khiển từ A đến B
α
O
x
K
H
H .1 .Các miền biến thiên trạng thái
X
&
4
Từ phương trình (4) khi
X
&&
max
=1 ta có
dXXdX =
&&
. Tích phân biểu thức này được:
0CX2X
2
=+−
&
Tương tự khi
X
min
&&
=
−
1 có:
0CX2X
2
=++
&
Đó là các nhánh Parabol , đúng như cách tính theo nguyên lí Pontriagin.Khi đã xác định được
quĩ đạo tối ưu ta dễ dàng tính được thời gian theo biểu thức Xd/dXdT
&
=
4. Đối chiếu với một số tác giả khác
Phần này nhằm làm rõ hơn một số nội dung đã được đề cập ở một số tài liệu khác
4.1 Nguyên lý cực đại Pontriagin
Về nguyên tắc không thể áp dụng nguyên lý cực đại Pontriagin vì nó chỉ là điều kiện cần.
Nếu không thỏa mãn nguyên lý này thì kết luận là không tối ưu, còn khi thỏa mãn thì chưa thể
kết luận được là tối ưu.
4.2 Sự biến thiên của quỹ đạo tối ưu
Lời chú thích không đúng với sự biến thiên của quỹ đạo điều khiển ở một số khoảng (quĩ
đạo là tăng tốc thì chú thích là giảm, quĩ đạo là giảm tốc thì chú thích là tăng tốc) của các tác
giả [6] vì quĩ đạo điều khiển ở những miền chỉ tăng tốc hoặc chỉ giảm tốc. Những miền này
không tồn tại ở những trường hợp đơn giản thường gặp mà ở đó gia tốc lớn nhất và nhỏ nhất
luôn trái dấu nhau. Sự nhầm lẫn của các tác giả này là ở chỗ cho rằng gia tốc lơn nhất luôn là
dương, nhỏ nhất là âm.
Quỹ đạo tối ưu ở trường hợp tổng quát không tiếp tuyến với quỹ đạo tốc độ giới hạn.
Khi nói về cách dựng quỹ đạo tối ưu ở trường hợp các nhánh qua điểm đầu và điểm cuối
của quỹ đạo không cắt nhau trong miền tốc độ cho phép thì dựng các đoạn tối ưu ứng với
max
λ
&&
hoặc
min
λ
&&
tiếp tuyến với quỹ đạo tốc độ giới hạn để nối chúng với nhau. Vì ở tốc độ giới
hạn chỉ tồn tại một quỹ đạo điều khiển duy nhất qua đó và nó hoàn toàn đã được xác định và
nói chung không là tiếp tuyến với quỹ đạo tốc độ giới hạn (khác với các tác giả [1], [6]).
4.3 Không thể thay thế tương đương đường cong tối ưu bằng đường gẫy khúc
Khi áp dụng vào thực tế người ta thường thay thế quỹ đạo tối ưu lý thuyết bằng quỹ đạo
gần đúng. Việc thay thế này về nguyên tắc phải thực hiện điều khiển được trên thực tế. Trong
tính toán để tính gần đùng người ta thường thay thế đường cong bằng đường gãy khúc gồm
ngững đoạn thẳng có điểm giao nhau với đường cong. Tuy nhiên đối với đường cong điều
khiển tối ưu thì việc thay thế như trên nói chung là không đúng. Lý do vì tại mỗi điển các quỹ
đạo điều khiển tối ưu là biên của phạm vi điều khiển, nếu thay bằng đoạn thẳng giao nhau với
đường cong thì sẽ có phần vượt ra khỏi phạm vi điều khiển.
λ
D
C
B
A
λ
&
0
Accelerate Decelerate
Accelerate Decelerate
H.3. Lời chú thích sai
5
Ví dụ tại điểm P có hai nhánh quỹ đạo cong tối ưu đi qua (Hình 4). Nếu ta thay các cung
cong bằng các đoạn thẳng PN và PM thì toàn bộ đoạn thẳng PN và phần cuối của đoạn thăng
PM nằm ngoài phạm vi điều khiển (vì tại M hướng của quỹ đạo thảng nằm ngoài phạm vi
điều khiển). Ta có thể xác định được đoạn nào trên PM nằm ngoài phạm vi điều khiển.
Dưới đây sẽ xét trường hợp không đúng khi thay thế đường cong chuyển đổi tối ưu bằng
một đường gẫy khúc để điều khiển tối tượng về gốc tọa độ của [2] hình 5.a, b
Trường hợp ở hình 5a là thay thế việc điều khiển theo đường cong tối ưu là Parabol bằng
đường thẳng (theo chế độ trượt) về gốc tọa độ khi điều khiển đối tượng được mô tả bởi
phương trình d
2
y/dt
2
= U với | U | ≤ 1. Trường hợp này đã được đề cập ở [5]
Trường hợp ở hình 5b là thay thế quỹ đạo chuyển đổi tối ưu lý thuyết là Parabol bằng
đượng gẫy khúc ANOPB để tại đó đổi chiều tác động nhằm điều khiển đối tượng theo các quỹ
đạo tối ưu dầnhội tụ về gốc tạo độ. Theo tài liệu đã dẫn thì quá trình được thực hiện như sau.
P
M
N
H.4. Không thể điều khiển theo đoạn thẳng
y
1
y
2
B
Q
P
M
2
M
C
N
L
A
y
2
B
P
M
2
M
1
N
A
y
1
a) b)
H.5. Không điều khiển được về 0
c)
O
O