Lời nói đầu
Một trong những mục tiêu hàng đầu trong tổng hợp hệ thống điều
khiển là tính hiệu quả cao. Hệ thống càng phức tạp, quy mô càng lớn, thì
việc đưa ra các quyết định điều khiển để hệ thống cho hiệu quả càng khó
khăn, ngay cả đối với những chuyên gia nhiều kinh nghiệm. Bởi vậy cần
phải có những phương pháp tổng quát, chặt chẽ về mặt lý thuyết, làm nền
tảng trợ giúp cho công việc trên và đó chính là mục đích của điều khiển tối
ưu.
Điều khiển tối ưu là một chuyên ngành trong điều khiển tự động có
vai trò xác lập và tạo lập những luật điều khiển cho hệ thống để hệ thống
đạt được chỉ tiêu về tính hiệu quả đã được định trước dưới dạng (phiếm)
hàm mục tiêu Q. Miền nghiên cứu của điều khiển tối ưu không chỉ riêng ở
các hệ thống kỹ thuật mà có thể tìm thấy ở hầu hết các hệ thống không
phải là kỹ thuật khác như hệ sinh học, hệ kinh tế
Bài toán điều khiển có ba cấu trúc cơ bản đó là:
* Điều khiển hở
Về bản chất, hình thức điều khiển này cũng giống như bài toán tìm
tín hiệu điều khiển thích hợp đặt ở đầu vào của đối tượng, nhưng được bổ
sung thêm bộ điều khiển để tạo ra được tín hiệu điều khiển đó.
Ví dụ để điều khiển tàu thuỷ đi được theo một quỹ đạo y(t) mong
muốn (tín hiêu đầu ra), người ta phải tác động bằng lực
)(t
ω
vào tay lái để
tạo ra được vị trí u(t) của bánh lái một cách thích hợp. Trong ví dụ này hệ
thống tay lái – bánh lái có vai trò của một bộ điều khiển.
Hình thức điều khiển hở này là điều khiển một chiều và chất lượng
điều khiển phụ thuộc vào độ chính xác của mô hình toán học mô tả đối
tượng cũng như phải có giả thiết rằng không có tác động nhiễu không
mong muốn vào hệ thống trong suốt quá trình điều khiển.
1
Bộ điều
khiển
Đối tượng điều
khiển
)(t
ω
u(t)
y(t)
Hình 1. Cấu trúc điều khiển hở
* Điều khiển phản hồi trạng thái
Ở đối tượng điều khiển, các tín hiệu trạng thái
)(), ,(),(
21
txtxtx
n
,
được viết chung dạng vector
=)(tx
(
)(), ,(),(
21
txtxtx
n
)
T
, là thành phần chứa
đựng đầy đủ nhất các thông tin chất lượng động học hệ thống, kể cả những
tác động nhiễu không mong muốn. Bởi vậy, để có thể tạo ra được cho đối
tượng một chất lượng mong muốn, ổn định với tác động nhiễu, cần phải có
một tín hiệu áp đặt ở đầu vào là u(t) phản ứng kịp theo những thay đổi
trạng thái của đối tượng
Hình 2. biểu diễn nguyên tắc điều khiển phản hồi trạng thái. Bộ điều khiển
sử dụng tín hiệu trạng thái
)(tx
của đối tượng để tạo ra được tín hiệu đầu
vào u(t) cho đối tượng. Vị trí của bộ điều khiển có thể là ở mạch truyền
thẳng hoặc ở mạch hồi tiếp.
Hệ thống điều khiển phản hồi trạng thái có khả năng giữ được ổn
định chất lượng mong muốn cho đối tượng, mặc dù trong quá trình điều
khiển luôn có những tác động nhiễu. Như vậy hệ thống điều khiển phản
hồi trạng thái tối ưu đã giải quyết triệt để mục tiêu của bài toán điều khiển
đó là chất lượng điều khiển đạt tốt nhất.
Tuy vậy hệ thống điều khiển phản hồi trạng thái có nhược điểm, trong
nhiều trường hợp trạng thái của đối tượng điều khiển không đo được trực
tiếp gây khó khăn cho việc nhận dạng đối tượng điều khiển vì vậy người ta
phải thay bộ điều khiển phản hồi trạng thái bằng bộ điều khiển phản hồi tín
hiệu ra.
2
Bộ điều
khiển
Đối tượng
điều khiển
±
x
y
u
e
ω
Bộ điều
khiển
Đối tượng
điều khiển
±
x
y
u
ω
Hình 2. Điều khiển phản hồi trạng thái
Bộ điều
khiển
Đối tượng
điều khiển
±
y
u
e
ω
Bộ điều
khiển
Đối tượng
điều khiển
±
y
u
ω
Hình 3. Điều khiển phản hồi đầu ra
Bộ điều khiển sử dụng tín hiệu đầu ra y(t) của đối tượng để tạo
ngược ra được tín hiệu đầu vào u(t) cho nó. Tuy nhiên, cho tới nay bài toán
điều khiển phản hồi tín hiệu ra vẫn còn là một bài toán mở và chưa có lời
giải tổng quát cuối cùng, vì tín hiệu ra y(t) thường không mang được đầy
đủ thông tin động học của đối tượng.
Với những ưu nhược điểm của bài toán phản hồi trạng thái và điều khiển
phản hồi tín hiệu ra, từ những lý thuyết đã nghiên cứu luận văn trình bày
thuật toán thiết kế bộ điều khiển tối ưu phản hồi tín hiệu ra dựa trên sự kết
hợp của hai bộ điều khiển: Bộ điều khiển phản hồi trạng thái và bộ điều
khiển phản hồi đầu ra áp dụng cho đối tượng điều khiển là đối tượng tuyến
tính để chất lượng điều khiển là tối ưu.
Sau một thời gian học tập và nghiên cứu đến nay bản luận văn của tôi
đã được hoàn thành. Nhân dịp này tôi xin chân thành cảm ơn PGS.TS
Nguyễn Doãn Phước - Thầy giáo hướng dẫn trực tiếp, người đã đưa ra
hướng nghiên cứu tận tình giúp đỡ, chỉ bảo và tạo mọi điều kiện thuận lợi
để tôi hoàn thành luận văn này.
Tôi xin cảm ơn tất cả các thầy cô giáo đã tham gia giảng dạy, giúp
đỡ tôi trong suốt quá trình học tập, nâng cao trình độ kiến thức.
Tôi xin gửi lời cảm ơn đến tất cả bạn bè, đồng nghiệp và người thân
đã giúp đỡ tôi trong suốt quá trình vừa qua.
Vì điều kiện về thời và khả năng của bản thân có hạn nên bản luận văn
này không tránh khỏi những thiếu sót. Tôi rất mong các thầy cô cùng các
bạn đồng nghiệp góp ý sửa đổi, bổ xung thêm để bản luận văn thêm hoàn
thiện.
3
Chương 1
PHÂN TÍCH HỆ THỐNG TRONG MIỀN KHÔNG GIAN TRẠNG THÁI
1.1. Những nhiệm vụ cơ bản của công việc phân tích
Các nhiệm vụ cơ bản của công việc phân tích chất lượng động học
của một hệ thống bao gồm:
- Tính ổn định
- Sai lệch tĩnh, độ quá điều chỉnh, thời gian quá độ.
- Chất lượng bền vững.
Tuy nhiên, do đặc thù là được mô tả trong không gian trạng thái với mô
hình:
+=
+=
uDxCy
uBxA
dt
xd
(1.1)
Mà ở đó rất có thể có những biến trạng thái thừa, nên công việc phân
tích hệ thống trong không gian trạng thái còn cần phải làm rõ thêm:
1) Hiểu biết về sự phân bố các điểm cân bằng của hệ thống. Một điểm
trạng thái x
e
được gọi là điểm cân bằng nếu như khi hệ đang ở điểm trạng
thái x
e
và không có một tác động nào từ bên ngoài thì hệ sẽ nằm nguyên tại
đó. Theo định nghĩa như vậy thì điểm cân bằng x
e
của hệ thống phải là
nghiệm của:
0== xA
dt
xd
(1.2)
Điều này cũng dễ hiểu, vì theo định nghĩa, điểm cân bằng là điểm mà
hệ thống sẽ nằm im tại đó, tức là trạng thái của nó không bị thay đổi
= 0
dt
xd
khi không có sự tác động từ bên ngoài (u=0).
Ta có thể thấy ngay được từ (1.2) là hệ tuyến tính cân bằng tại mọi
điểm trạng thái thuộc không gian Ker (A) và nếu ma trận A của mô hình
trạng thái (1.1) không suy biến thì hệ (1.1) chỉ có một điểm cân bằng duy
nhất là gốc toạ độ 0.
2) Hiểu biết về tính ổn định Lyapunow của hệ thống. Một hệ thống
được gọi là ổn định Lyapunow tại điểm cân bằng x
e
nếu sau khi có một tác
4
động tức thời (chẳng hạn như nhiễu tức thời) đánh bật hệ ra khỏi điểm cân
bằng x
e
thì sau đó hệ có khả năng tự quay về được lân cận điểm cân bằng
x
e
ban đầu (không cần có tín hiệu điều khiển u). Nếu hệ không những tự
quay về được lân cận của x
e
mà còn tiến tới x
e
thì nó được gọi là ổn định
tiệm cận Lyapunow tại x
e
.
3) Hiểu biết về tính điều khiển được của hệ thống tại một điểm trạng
thái cho trước.
Nhiệm vụ chính của điều khiển là tìm được tín hiệu điều khiển mang
lại cho hệ thống một chất lượng mong muốn, tức là phải tìm ra được một
tín hiệu thoả mãn chất lượng đề ra trong số các tín hiệu có khả năng đưa hệ
thống từ điểm trạng thái x
0
ban đầu tới được điểm trạng thái đích x
T
. Nếu
như không tồn tại bất cứ một tín hiệu điều khiển nào đưa được hệ từ x
0
tới
x
T
thì sự cố gắng tổng hợp hay đi tìm tín hiệu điều khiển như trên sẽ trở
nên vô nghĩa (bài toán không có lời giải). Bởi vậy, để công việc điều khiển
có thể có kết quả ta phải biết được rằng có tồn tại hay không ít nhất một tín
hiệu điều khiển đưa được hệ thống từ x
0
về x
T
trong khoảng thời gian T hữu
hạn. Nếu như tồn tại một tín hiệu điều khiển làm được việc đó thì ta nói hệ
thống là điều khiển được tại điểm trạng thái x
0
.
4) Hiểu biết về tính quan sát được của hệ thống tại một điểm trạng
thái cho trước.
Hay quay lại vấn đề chính xác là xây dựng bộ điều khiển cho hệ
thống để minh hoạ. Nếu sau khi đã biết là công việc xây dựng bộ điều
khiển có thể có kết quả (hệ điều khiển được tại x
0
) thì công việc tiếp theo
là phải xác định được x
0
để từ đó bộ điều khiển có thể tạo ra được tín hiệu
điều khiển thích hợp đưa hệ từ x
0
về x
T
. Công việc xác định điểm trạng thái
x
0
có thể được tiến hành bằng cách đo trực tiếp (nhờ các bộ cảm biến,
sensor) nhưng có khi phải tính toán, phải quan sát khi không thể đo được
trực tiếp x
0
, chẳng hạn như gia tốc không thể đo được trực tiếp mà phải
được suy ra từ việc đo tốc độ trong một khoảng thời gian cho phép. Trong
trường hợp phải quan sát, người ta nói điểm trạng thái x
0
của một hệ là
quan sát được nếu ta có thể xác định được nó thông qua việc đo các tín
hiệu vào/ra trong một khoảng thời gian hữu hạn.
1.2 Phân tích tính ổn định
1.2.1. Định lý Gerchgorin.
5
Định lý 1.1. (Gerschgorin): Với mỗi giá trị riêng s
k
của ma trận phức
(các phần tử là những số phức):
=
nnnn
n
n
aaa
aaa
aaa
A
21
22221
11211
luôn tồn tại một chỉ số i=1,2,…,n sao cho s
k
nằm trong đường tròn
tâm a
ii
bán kính R
i
=a
ii
+… +a
ii-1
+a
ii+1
+….a
in
(hình 1.1)tức là:
∑
≠
=
=≤−
n
j
j
ijiiik
aRas
1
1
Định lý 1.2 (Hệ quả Gerschgorin): Ký hiệu
∑
≠
=
=
n
j
j
iji
aR
1
1
. Vậy thì hệ
(1.1) với a
ij
∈R sẽ ổn định nếu a
ii
+R
i
<0 với mọi i = 1, 2,…,n.
Định lý 1.3. Hệ (1.1) ổn định BIBO khi và chỉ khi nó ổn định tiệm cận
Lyapunov, tức là khi và chỉ khi các qũy đạo trạng thái tự do có hướng tiến
về gốc toạ độ và kết thúc tại đó.
Định lý 1.4 (Lyapunov): Nếu tồn tại hàm V(x), thoả mãn các điều kiện:
a) Khả vi, xác định dương, tức là V(x)>0 với x≠0 và V(x)=0 ⇔x = 0
b)
,0<
dt
dV
với
dt
dV
là đạo hàm của V(x) dọc theo qũy đạo trạng thái tự
do.
thì hệ sẽ ổn định tiệm cận Lyapunov tại 0 (ổn định BIBO). Hàm V(x)
khi đó được gọi là hàm Lyapunov. Nói cách khác, hệ ổn định tiệm cận tại 0
nếu nó có hàm Lyapunov.
Định lý 1.5 (Hệ quả Lyapunov): Cho một hệ tuyến tính mô tả bởi mô
hình trạng thái (1.1). Hệ sẽ ổn định nếu một trong hai điều sau được thoả mãn:
a) Tồn tại ma trận vuông P∈ R
n xn
xác định dương sao cho ma trận
( )
PAPA
T
+
xác định âm, tức là
( )
PAPA
T
+−
xác định dương.
6
.
ii
a
i
R
ω
j
σ
Hình 1.1. Minh họa định lý 1.1
b) Tồn tại một ma trận đối xứng, xác định dương Q sao cho phương
trình
( )
QPAPA
T
−=+
(1.4)
có nghiệm P cũng đối xứng, xác định dương. Phương trình (1.4) có
tên gọi là phương trình Lyapunov.
Cuối cùng, và cũng để việc sử dụng định lý 1.5 được thuận tiện, thì
định lý của Sylvester cho sau đây như một công cụ xác định tính xác định
dương của một ma trận đối xứng cho trước.
Định lý 1.6 (Sylvester): Cần và đủ để ma trận vuông, đối xứng:
,
21
22221
11211
=
nnnn
n
n
qqq
qqq
qqq
Q
kiik
qq
=
xác định dương là các ma trận đường chéo của nó có định thức
dương:
,0
11
>q
,0det
2221
1211
>
qq
qq
, 0det
333231
232221
131211
>
qqq
qqq
qqq
Tất nhiên rằng định lý Sylvester nêu trên cũng được sử dụng để xác
định tính xác định âm của một ma trận Q bằng cách kiểm tra xem ma trận
-Q có xác định dương hay không. Nếu -Q xá định dương thì Q xác định
âm.
1.3. Phân tích tính điều khiển được
1.3.1. Khái niệm điều khiển được và điều khiển được hoàn toàn
Định nghĩa 1.1. Một hệ thống tuyến tính, liên tục được gọi là điều
khiển được nếu tồn tại ít nhất một tín hiệu điều khiển đưa được nó từ một
điểm trạng thái ban đầu x
0
(tuỳ ý) để được gốc tọa độ 0 trong khoảng thời
gian hữu hạn.
7
1.3.2. Các tiêu chuẩn xét tính điều khiển được cho hệ tham số hằng
Xét hệ tuyến tính tham số hằng mô tả bởi:
với
nxmnxn
RBRA ∈∈ ;
(1.5)
1. Tiêu chuẩn Hautus
Định lý 1.7. (Hautus): Cần và đủ để hệ tuyến tính (1.5) điều khiển được
là:
Rank(sI - A,B) = n với mọi
Cs
∈
2. Tiêu chuẩn Kalman
Định lý 1.8. (Kalman): Cần và đủ để hệ tuyến tính (1.5) điều khiển
được là:
Rank (B, AB,… A
n-1
B)=n
1.4. Phân tích tính quan sát được
1.4.1. Khái niệm quan sát được và quan sát được hoàn toàn
Định nghĩa 1.2. Một hệ thống có tín hiệu vào u(t) và tín hiệu ra y(t)
được gọi là:
a) Quan sát được tại thời điểm t
0
, nếu tồn tại ít nhất một giá trị hữu
hạn T>t
0
để điểm trạng thái x(t) = x
0
xác định được một cách chính xác
thông qua vector các tín hiệu vào ra u(t), y(t) trong khoảng thời gian [t
0
, T].
b) Quan sát được hoàn toàn tại thời điểm t
0
, nếu với mọi T>t
0
, điểm
trạng thái x
0
= x(t
0
) luôn xác định được một cách chính xác từ vector các
tín hiệu vào ra u(t), y(t) trong khoảng thời gian [t
0
, T].
Chú ý: Yêu cầu phải đo trong khoảng thời gian hữu hạn là rất quan
trọng. Khoảng thời gian quan sát càng ngắn sẽ càng tốt cho công việc điều
khiển sau này. Nếu thời gian quan sát quá lớn, điểm trạng thái x
0
vừa xác
định được sẽ mất ý nghĩa ứng dụng cho bài toán điều khiển, ví dụ khi có
được x
0
thì có thể hệ đã chuyển đến một điểm trạng thái mới cách rất xa
điểm trạng thái x
0
.
1.4.2. Một số kết luận chung về tính quan sát được của hệ tuyến tính
Một cách tổng quát, sau đây ta sẽ xét hệ tuyến tính có thể không
dừng với:
8
uBxA
dt
xd
+=
( ) ( )
+=
+=
utDxtCy
utBxtA
dt
xd
)()(
(1.10)
trong đó
nn
RtA
×
<)(
,
mn
RtB
×
<)(
,
nr
RtC
×
<)(
,
mr
RtD
×
<)(
là những ma trận có
phần tử có thể là hàm số phụ thuộc t.
Định lý 1.9. Hệ không dừng (1.10) sẽ
a) Quan sát được tại t
0
khi và chỉ khi tồn tại ít nhất một giá trị T>t
0
hữu hạn sao cho các vector cột của ma trận C(t)Φ(t-t
0
)
độc lập tuyến tính
trong khoảng thời gian t
0
≤
t<T.
b) Quan sát được hoàn toàn tại t
0
khi và chỉ khi với mọi giá trị T>t
0
, các
vector cột của ma trận C(t)Φ(t-t
0
)
độc lập tuyến tính trong khoảng thời gian t
0
≤
t<T.
Định lý 1.10. Nếu hệ không dừng (1.10) quan sát được tại thời điểm
t
0
nếu tồn tại T
1
>t
0
hữu hạn sao cho các vector cột của
)(
0
ttC −Φ
không phụ
thuộc tuyến tính trên tòn khoảng [t
0
, T
1
]. Vì C là ma trận hằng nên
)(
0
tt −Φ
là thành phần duy nhất phụ thuộc t trong tích
)(
0
ttC −Φ
. Do
)(
0
tt −Φ
không
suy biến với mọi t (định lý 3.12 – Lý thuyết điều khiển nâng cao, Nguyễn
Doãn Phước tr263) nên điều này cũng đúng với mọi khoảng [t
0
, T
1
], trong
đó T là số tuỳ ý lớn hơn t
0
.
Định lý 1.11: Nếu hệ không dừng (1.10) quan sát được tại thời điểm
t
0
thì nó cũng quan sát được mọi thời điểm t
≠
0
1.4.3. Tính đối ngẫu và các tiêu chuẩn xét tính quan sát được của hệ
tham số hằng
Cho hệ tuyến tính, tham số hằng mô tả bởi:
+=
+=
uDxCy
uBxA
dt
xd
với
nn
RA
×
<
,
mn
RB
×
<
,
nr
RC
×
<
,
mr
RD
×
<
(1.12)
Một hệ tuyến tính khác được suy ra từ hệ trên với mô hình:
+=
+=
uDxBy
uCxA
dt
xd
TT
TT
(1.13)
được gọi là hệ đối ngẫu với hệ (1.12) đã cho.
9
Có thể thấy ngay được là từ là ma trận truyền đạt của hệ (1.12):
DBAsICsG +−= )()(
ta cũng có ma trận truyền đạt G
T
(s)cho hệ đối ngẫu (1.13) với nó.
Định lý 1.12: Hệ tham số hằng (1.12) quan sát được khi và chỉ khi
hệ (1.13) đối ngẫu với nó điều khiển được.
Định lý 1.13: Cho hệ tham số hằng (1.12). Các phát biểu sau là
tương đương:
a) Hệ quan sát được.
b)
n
C
AsI
=
−
Rank
với mọi s, và I là ma trận đơn vị (Hautus, 1969).
c)
n
CA
CA
C
n
=
−1
Rank
(Kalman, 1969).
10
Chương 2.
THIẾT KẾ BỘ ĐIỀU KHIỂN PHẢN HỒI TRẠNG THÁI TỐI ƯU
2.1. Phương pháp biến phân
2.1.1. Nội dung phương pháp
Biến
phân
là
một
phương
pháp
được
xây
dựng
từ
điều
kiện
cần
phải
có
của nghiệm
tối
ưu
u(t)
của
bài
toán
tối
ưu
động,
liên
tục,
có
khoảng
thờ
i
gian
T
xác định,
cho
trước
và
không
bị
ràng
buộc
bở
i
điều
kiện
U,
hoặc
nếu
có
bị
ràng
buộc
thì
tập
U
của
các
(vector)
tín
hiệu
điều
khiển
thích
hợp
phải
là
một
tập
hở.
Ý
tưởng
chính
của
biến
phân
có
thể
được
tóm
t
ắt
như
sau:
-
Từ
giả
thiế
t
u(t)
là
t
ín
hiệu
điều
khiển
tối
ưu,
x(t)
là
quỹ
đạo
trạng
thái
tối
ưu, ngườ
i
ta
xây
dựng
một
tín
hiệu
điều
khiển
khác
có
một
sai
lệch
nhỏ
so
vớ
i
nó
là:
)()()(
~
ttutu
u
δ
+=
, trong đó:
)(t
u
δ
là rất nhỏ. (2.1)
Và xem
)(
~
tu
chưa phải là tín hiệu tối ưu.
-
Tiếp
theo,
ngườ
i
ta
giả
thiết
quỹ
đạo
trạng
thái
)(
~
tx
do
)(
~
tu
tạo ra
cho hệ thống cũng chỉ có một sai lệch rất nhỏ so với quỹ đạo trạng thái tối
ưu
)(tx
, tức là:
)()()(
~
ttxtx
x
δ
+=
cũng có
)(t
x
δ
rất nhỏ. (2.2)
-
Cuối
cùng,
từ
điều
kiện
phải
có
của
tín
hiệu
điều
khiển
tối
ưu:
Q(x, u)
)
~
,
~
( uxQ≤
(2.3)
Người ta xác định tính chất của điều khiển tối ưu u(t), gọi là tính
chất biến phân.
Cho hệ có mô hình:
uBxA
dt
xd
+=
, A
∈
R
nxn
,
B
∈
R
nxm
(2.4)
Xét bài toán tìm bộ điều khiển R tĩnh, phản hồi trạng thái để điều
khiển đối tượng (2.4). Mục đích của phương pháp thiết kế bộ điều khiển R
sao cho sau khi bị nhiễu đánh bật ra khỏi điểm cân bằng (hoặc điểm làm
việc ) đến một điểm trạng thái x
0
nào đó, bộ điều khiển R sẽ kéo được hệ từ
x
0
về toạ độ 0 (hay điểm làm việc cũ) và trong quá trình trở lại này sự tổn
hao năng lượng, đánh giá bởi phiếm hàm mục tiêu:
( )
∫
∞
→+=
0
min)(
2
1
, dtuFuxExuxQ
TT
(2.5)
11
Giả sử u(t) là tín hiệu điều khiển được tạo ra bởi R đã thoả mãn điều
kiện tối ưu (2.5), tức là trong số tất cả các tín hiệu
)(
~
tu
đưa hệ từ x
0
về gốc
toạ độ 0 thì u(t) sẽ là vector tín hiệu mà:
( ) ( )
∫∫
∞∞
+=≤+=
00
)
~~~
(
2
1
~
)(
2
1
dtuFuxExuQdtuFuxExuQ
TTTT
(2.6)
Bây giờ ta xét đáp ứng của đối tượng với một tín hiệu khác có sai
lệch nhỏ
u
δ
so với u(t), tức là ứng với
)()()(
~
ttutu
u
δ
+=
. Gọi
)()()(
~
ttxtx
x
δ
+=
là
quỹ đạo trạng thái tương ứng của đối tượng cũng đi từ x
0
về gốc toạ độ 0
khi được kích thích bởi
)(
~
tu
. Vậy thì:
xBxA
dt
xd
+=
và
( )
)()(
ux
x
uBxA
dt
xd
δδ
δ
+++=
+
Suy ra:
ux
x
BA
dt
d
δδ
δ
+=
⇔
0=−−
ux
x
BA
dt
d
δδ
δ
(2.7)
Ngoài ra, do quỹ đạo
)()()(
~
ttxtx
x
δ
+=
cũng đi từ x
0
về gốc toạ độ 0
giống như x(t) nên
0)()0( =∞=
xx
δδ
(2.8)
Tiếp theo, ta xét ảnh hưởng của sự biến phân u(t) thành
)()( ttu
u
δ
+
đối
với giá trị của phiếm hàm mục tiêu:
( ) ( ) ( ) ( )
[ ]
dtuFuxExuQQ
u
T
ux
T
xu
Q
∫
∞
+++++=+=+
0
)(
2
1
δδδδδδ
Trừ vế với vế của (2.8) và (2.6) được:
( ) ( )
uQuQ
u
Q
−+=≤
δδ
0
( )
dtFuFFuExEEx
u
T
u
T
uu
T
x
T
x
T
xx
T
∫
∞
+++++=
0
2
1
δδδδδδδδ
( )
dtFuEx
u
T
x
T
∫
∞
+=
0
δδ
(2.9)
vì E, F là hai ma trận đối xứng và do
u
δ
,
x
δ
<<0 nên (
u
T
x
T
x
FuE
δδδ
+
) ≈ 0.
12
Để kết hợp được điều kiện biên (2.7) với (2.9) ta tạo ra tích vô hướng
của vector 0 trong (2.7) bằng cách nhân hai vế của nó với một vector p
T
bất
kỳ:
0)(
=−−
ux
x
T
BA
dt
d
p
δδ
δ
(2.10)
rồi cộng với (2.9) sẽ được:
dtBA
dt
d
pEuEx
ux
x
T
u
T
x
T
Q
∫
∞
−−++=
0
)(
δδ
δ
δδδ
(tích phân toàn phần)
dtExAp
dt
pd
FuBpp
x
TT
T
u
TT
x
T
∫
∞
∞
+−+−+−+=
0
0
)()(
δδδ
dtExAp
dt
pd
FuBp
x
TT
T
u
TT
∫
∞
+−+−+−=
0
)()(
δδ
Nếu như trong vô số các vector p
T
thoả mãn (2.10) ta chọn:
( )
xEpAExAp
dt
pd
TT
TT
−−=−−= )(
và sử dụng ký hiệu hàm Hamilton:
)(
2
1
)( uFuxExuBxApH
TTT
+−+=
(2.11)
thì
dt
u
H
u
Q
δδ
∫
∞
∂
∂
−=
0
(2.12)
trong đó
u
H
∂
∂
là ký hiệu chỉ ra ma trận Jacobi của H, tức là:
), ,(
1 r
u
H
u
H
u
H
∂
∂
∂
∂
=
∂
∂
Chú ý: Ký hiệu đạo hàm được sử dụng là đạo hàm Jacobi:
T
L
xd
Lxd
L
xd
xLd
T
==
)(
,
)(
Từ (2.10) và (2.12) ta có các tính chất của tín hiệu điều khiển tối ưu
như sau:
Định lý 2.1: Nếu u(t) là tín hiệu điều khiển tối ưu thì tín hiệu đó phải
thoả mãn:
T
u
H
0=
∂
∂
13
trong đó H là hàm Hamilton định nghĩa theo (2.11). Ngoài ra, cùng
với ký hiệu của hàm Hamilton thì:
T
p
H
dt
xd
∂
∂
=
,
T
x
H
dt
pd
∂
∂
−=
và chúng được gọi là phương trình Euler - Lagrange.
Định lý 2.2: Nếu u(t) là tín hiệu điều khiển tối ưu thì tín hiệu đó phải
thoả mãn:
u(t) = F
-1
B
T
p(t)
2.1.2. Ứng dụng phương pháp biến phân để thiết kế bộ điều khiển
phản hồi trạng thái tối ưu
1. Thiết kế bộ điều khiển LQR phản hồi dương.
Thuật toán tìm bộ điều khiển R, tối ưu theo nghĩa (2.14), phản hồi
dương trạng thái, gồm hai bước như sau:
1) Xác định ma trận K đối xứng, xác định âm là nghiệm của phương
trình Riccati (2.13). Ma trận K xác định âm khi và chỉ khi ma trận -K xác
định dương.
2) Xác định R từ K theo (2.14).
2. Thiết kế bộ điều khiển LQR phản hồi âm
Thuật toán tìm bộ điều khiển R tối ưu được sửa đổi lại cho nguyên lý
phản hồi âm gồm hai bước như sau:
1) Xác định ma trận L đối xứng, xác định dương là nghiệm của phương
trình Riccati (2.16)
2) Xác định R từ L theo (2.15)
( ) ( )
5,3
5
3
3
3
1,0
1
=
==
−
LBFR
T
3. Các phương pháp tìm nghiệm của phương trình Riccati trực tiếp
a. Phương pháp MacFarlane – Potter
14
b. Phương pháp Kleinman.
2.2. Nguyên lý cực đại
2.2.1. Điều kiện cần
2.2.2. Điều kiện hoành (Điều kiện trực giao)
2.3. Phương pháp quy hoạch động
2.3.1. Nội dung phương pháp
Nguyên lý tối ưu của Bellman
2.3.2 Mở rộng cho hệ liên tục và phương trình Hamilton - Jacobi - Bellman
15
Chương 3
THIẾT KẾ BỘ ĐIỀU KHIỂN TỐI ƯU NGẪU NHIÊN ĐỘNG
3.1. Bộ lọc Wiener
3.1.1.Mục đích của bộ lọc
Hình 3.1. Bộ lọc Winner
y(t) = u
0
(t)
Do tín hiệu nhiễu n(t) không có cùng nguồn phát như u
0
(t) nên ở đây
ta có thể xem chúng là không tương quan với nhau. Nếu có thêm giả thiết
nhiễu n(t) có giá trị trung bình (kỳ vọng) bằng 0, thì khi đó sẽ có:
( )
0
0
=
τ
nu
r
=>
( )
=
+=
)()(
)()(
00
0
ωω
ωωω
jSjS
jSjSjS
uuu
nuu
Nhiệm vụ của bộ lọc là tạo ra tín hiệu y(t) ở đầu ra giống như tín hiệu
không bị lẫn nhiễu u
0
(t) ở đầu vào. Đánh giá cho sự sai khác giữa y(t) và
u
0
(t) là hàm sai lệch:
∫
∞
−−=−=
0
00
)()()()()()( tudtugtutyte
τττ
Trong đó g(t) là hàm trọng lượng của bộ lọc, tức là hàm có ảnh Laplace là
G(s)
Nếu ta đơn thuần chỉ lập hàm đo chất lượng của bộ lọc theo
∫
∞
=
0
2
)(
~
dtteQ
(3.1)
thì rõ ràng
Q
~
không những phụ thuộc vào g(t) cần phải xác định mà còn
phụ thuộc cả vào tín hiệu nhiễu n(t) có lẫn trong u(t), tức là
Q
~
=
),(
~
ngQ
. Vì
vậy không thể hy vọng rằng thông qua việc xác định:
min),(
~
→
ngQ
lại có thể nhận được một hàm g(t) bất biến với nhiễu n(t).
16
G(s)
u(t)
n(t)
y(t)
u
0
(t)
Để có thể tránh được sự xuất hiện n(t) trong hàm đo chất lượng bộ
lọc, người ta đã không sử dụng (3.46) mà thay vào đó là kỳ vọng của nó:
[ ]
∫
−
∞→
==
T
T
T
dtte
T
teMQ )(
2
1
lim)(
22
(3.2)
và như vậy bài toán thiết kế bộ lọc Wiener trở thành một bài toán tối ưu ngẫu
nhiên.
Do n(t) không tương quan với u
0
(t) nên Q được lập theo (3.47) cũng
sẽ không phụ thuộc vào n(t), tức là:
Q = Q(g)
và ta đi đến dạng chuẩn của bài toán tối ưu tìm hàm trọng lượng g(t) mô tả
bài toán thiết kế bộ lộc Wiener như sau:
min)(
2
1
lim)(
2
→=
∈
−
∞→
∫
Pg
T
T
T
dtte
T
gQ
(3.3)
trong đó P là tập hàm trọng lượng của các khâu tuyến tính và ổn định.
Nghiệm tối ưu g(t) của bài toán (3.3) được phát biểu như sau:
3.1.2. Thuật toán xác định nghiệm tối ưu của bài toán (3.3).
1) Tính mật độ phổ S
u
(s) của u(t), tức là tính ảnh Laplace của hàm tự
tương quan r
u
(
τ
) của tín hiệu u(t). Trong nhiều trường hợp, khi mà chỉ biết
trước mật độ phổ
)(
0
sS
u
của u
0
(t) và S
n
(s) của nhiễm n(t), thì do u
0
(t), n(t)
không tương quan, ta cũng có được.
2) Viết lại S
u
(s) thành:
S
u
(s) = A
-
(s) A
+
(s) =>
−=−=
+
−++−
A
S
GAASAGAH
uu
uu
0
0
Trong đó A
-
(s) là hàm thực hữu tỷ có các điểm không và điểm cực
đều nằm bên trái trục ảo (pha cực tiểu) và A
+
(s) là hàm thực - hữu tỷ có
các điểm không và điểm cực nằm bên phải trục ảo.
3) Tính tỷ số:
( )
)(
)(
0
sA
sS
sR
uu
+
=
17
Trong đó
)(
0
sS
uu
là ảnh Laplace của hàm hỗ tương quan
)(
0
ττ
uu
giữa
u(t) và u
0
(t). Nếu thay vì
)(
0
sS
uu
ta chỉ có
)(
0
sS
u
của u
0
(t) thì do tính không
tương quan giữa u
0
(t), n(t) ta cũng sẽ có
)(
0
sS
uu
=
)(
0
sS
u
.
4) Tách R(s) thành:
R(s) = B
-
(s) + B
+
(s) => H = A
+
(GA
-
-B
-
-B
+
)
Trong đó B
-
(s) là hàm bền (giải tích trong nửa mặt phẳng phức bên
phải) và B
+
(s) là hàm giải tích trong nửa mặt phẳng phức bên trái, tức là có
các điểm cực nằm bên phải trục ảo (hàm phản bền).
5) Chọn:
( )
)(
)(
sA
sB
sG
−
−
=
tức là chọn G(s) sao cho GA
-
-B
-
-B
+
=-B
+
, để được H(s) = -A
+
(s)B
+
(s) là
hàm phản bền.
3.2. Bộ quan sát trạng thái Kalman (lọc Kalman)
3.2.1. Mục đích của bộ quan sát
3.2.2. Thuật toán xác định bộ quan sát trạng thái Kalman.
1) Giải bài toán tối ưu (3.16) để có được ma trận R = L
T
là bộ điều
khiển tối ưu phản hồi âm trạng thái (bộ điều khiển LQR cho đối tượng đối
ngẫu). Các ma trận N
x
, N
y
được xác định từ nhiễu n
x
(t), n
y
(t) theo công thức
(3.9), (3.11) trong đó N
x
phải là ma trận xác định bán dương và N
y
phải xác
định dương. Ở nhiều bài toán ứng dụng thực tế, khi mà thông tin ban đầu
về nhiễu n
x
(t), n
y
(t) quá ít để có thể xác định được cụ thể N
x
, N
y
người ta
thường hay chọn chúng là những ma trận đơn vị có số chiều phù hợp với
số chiều của x và u .
2) Gán L tìm được vào công thức (3.11) để có hoàn chỉnh mô hình bộ
quan sát trạng thái cho đối tượng (3.8).
18
Chương 4
XÂY DỰNG THUẬT TOÁN THIẾT KẾ BỘ ĐIỀU KHIỂN
PHẢN HỒI TÍN HIỆU RA
4.1. Nội dung bộ điều khiển
Cho đối tượng tuyến tính tham số hằng bị tác động bởi nhiễu ồn
trắng n
x
(t) vào hệ thống và n
y
(t) ở đầu ra, mô tả bởi mô hình trạng thái:
++=
++=
y
x
nuDxCy
nuBxA
dt
xd
Hãy thiết kế bộ điều khiển phản hồi tín hiệu ra sao cho hệ được ổn
định tối ưu theo nghĩa khi bị một tác động không mong muốn đánh bật ra
khỏi điểm cân bằng (điểm làm việc), bộ điều khiển đó sẽ đưa được hệ quay trở
về điểm cân bằng cũ (điểm làm việc cũ) và chi phí cho quá trình quay về đó
tính theo:
dtuFuxExQ
TT
∫
∞
+=
0
)(
2
1
đạt giá trị nhỏ nhất.
Bài toán trên được gọi là bài toán thiết kế bộ điều khiển LQG (Hay là
điều khiển đối tượng bền vững với nhiễu).
Giữa bài toán thiết kế bộ điều khiển LQG và bộ điều khiển LQR có
hai điểm khác rất cơ bản. Đó là:
- Bộ điều khiển là phản hồi tín hiệu ra, chứ không phải phản hồi trạng
thái
- Đối tượng có nhiễu tác động cả vào hệ thống lẫn đầu ra.
Vì tín hiệu ra không mang đầy đủ thông tin động học của đối tượng, nên
để bộ điều khiển LQG đem lại chất lượng điều khiển mong muốn thì hệ
tuyến tính phải thõa mãn nguyên lý tách được để bộ điều khiển là sự kết
hợp của hai bộ điều khiển: Bộ điều khiển phản hồi trạng thái và bộ điều
khiển phản hồi đầu ra.
4.2. Nguyên lý tách được
4.3. Thuật toán thiết kế bộ điều khiển phản hồi tín hiệu ra.
Khi hệ tuyến tính thoả mãn nguyên lý tách được thì bài toán thiết kế
bộ điều khiển phản hồi tín hiệu ra LQG sẽ chuyển được về bài toán thiết kế
bộ điều khiển phản hồi trạng thái LQR. Nói cách khác, bộ điều khiển LQG
19
sẽ được thiết kế gồm một bộ điều khiển tối ưu phản hồi trạng thái LQR và
một bộ quan sát trạng thái Kalman mắc nối tiếp nhau như mô tả ở hình 4.1.
Ta đi đến thuật toán thiết kế bộ điều khiển LQG với các bước sau:
1) Thiết kế bộ điều khiển tối ưu R
LQR
phản hồi (âm) trạng thái x(t),
tức là bộ điều khiển LQR, cho bài toán:
→+=
+=
∫
∞
min)(
2
1
0
u
TT
uFuxExQ
uBxA
dt
xd
(4.1)
bằng thuật toán đã trình bày tại chương II. Nói cách khác là phải tính:
∞
−
=
LBFR
T
LQR
1
:
trong đó L
∞
là nghiệm xác định bán dương của phương trình đại số Riccati
EALLALBBFL
TT
=−−
∞∞∞
−
∞
1
Điều kiện để bài toán này có nghiệm là E xác định bán dương và F
xác định dương. Chú ý rằng bộ điều khiển phản hồi trạng thái LQR tìm
được như trên chưa đảm bảo chắc chắc làm ổn định đối tượng (4.1) vì nó
đã được thiết kế theo phương pháp biến phân cho bài toán tối ưu (4.1) có
điểm trạng thái cuối x
T
tuỳ ý. Nhưng vì ở đây có khoảng thời gian xảy ra
quá trình tối ưu T =
∞
nên theo định lý Barbalas ta cũng phải có:
( )
0lim =+
→
uFuxEx
TT
Tt
⇔
0limlim ==
→→
uFuxEx
T
Tt
T
Tt
⇔
0lim
=
→
xEx
T
Tt
và
0lim =
→
uFu
T
Tt
Vì F là ma trận xác định dương. Vậy điểm cuối x
T
phải là điểm cân
bằng của hệ kín. Điểm cân bằng này sẽ là gốc toạ độ (và khi đó hệ kín sẽ
ổn định) nếu E cũng là ma trận xác định dương hoặc hệ kín chỉ cân bằng
duy nhất tại gốc toạ độ. Để kiểm tra xem hệ kín có cân bằng duy nhất tại
gốc 0 hay không, ta chỉ cần kiểm tra xem ma trận hệ thống A-BR
LQR
có khả
nghịch hay không là đủ, tức là:
( )
0det
:
≠−
LQR
BRA
⇔ x
T
=0
2) Thiết kế bộ quan sát trạng thái Kalman để có được trạng thái xấp
xỉ gần đúng từ các tín hiệu đo được u(t), y(t) làm tín hiệu đầu vào cho bộ
20
điều khiển R
LQR
. Tức là lại tìm bộ điều khiển tối ưu phản hồi âm trạng thái
L
T
(bộ điều khiển LQR) cho bài toán:
→+=
+=
∫
∞
min)(
2
1
0
dtuNuxNxQ
uCxA
dt
xd
y
T
x
T
TT
Trong đó N
x
, N
y
là các ma trận hàm tương quan của nhiễu ồn trắng
n
x
(t), n
y
(t). Cuối cùng, thay L vào công thức (3.52) để được mô hình động
của bộ quan sát:
+−=
y
u
LBxLCA
dt
xd
),(
~
)(
~
21
Chương 5
MÔ PHỎNG VÀ KẾT LUẬN
5.1. Nội dung bài toán
Cho đối tượng mô tả bởi:
x
nux
dt
xd
+
−−
−−
−−
+
−−
−−−
−−−
=
00
6.016.0
5.066.0
5.219
0001
065.10001.01
2.3264.16014.00
02.130006.08.0
y
nxy +
−
=
1100
1000
Với
x
n
,
y
n
là các tín hiệu nhiễu ồn trắng với:
N
x
=
01.0000
001.000
0001.00
00001.0
;N
y
=
01.00
001.0
Thiết kế bộ điều khiển LQG cho đối tượng trên với:
min]
6.30
06.3
672.0000
02.800
00000025.00
0000365.0
[
2
1
0
→
+
=
∫
∞
dtuuxxQ
TT
Áp dụng các bước thuật toán đã trình bày ở chương IV.
5.2. Các bước thiết kế
5.2.1. Giải bài toán tìm nghiệm R
LQR
là nghiệm của:
→
+
=
−−
−−
−−
+
−−
−−−
−−−
=
∫
∞
min]
6.30
06.3
672.0000
02.800
00000025.00
0000365.0
[
2
1
00
6.016.0
5.066.0
5.219
0001
065.10001.01
2.3264.16014.00
02.130006.08.0
0
dtuuxxQ
ux
dt
xd
TT
5.2.2. Thiết kế bộ quan sát trạng thái Kalman
5.2.3. Kết quả mô phỏng bộ điều khiển LQG
Bộ điều khiển LQG như đã trình bày ở chương 4 gồm bộ quan sát trạng
thái Kalman mắc nối tiếp với bộ điều khiển tĩnh R
LQR
.
Sơ đồ mô phỏng:
22
Kết quả mô phỏng:
Kết luận:
- Bộ điều khiển LQG đáp ứng được chất lượng động học của hệ thống.
23
Đáp ứng đầu ra 2
Đáp ứng đầu ra 2
5.2.4. So sánh chất lượng bộ điều khiển LQR và bộ điều khiển LQG
5.2.5. Mô phỏng bộ điêu khiển LQG khi có nhiễu ồn trắng tác động.
So sánh với bộ điều khiển LQR.
Sơ đồ mô phỏng bộ điều khiển LQG khi có nhiễu ồn trắng tác động vào đối
tượng:
Kết quả:
Hình 5.10. Kết quả mô phỏng bộ điều khiển LQG khi có nhiễu tác động
Kết luận:
- Bộ điều khiển LQG có khả năng lọc nhiễu rất tốt.
So sánh với bộ điều khiển LQR khi có nhiễu tác động
24
Hình 5.9. Bộ điều khiển LQG khi có nhiễu tác động
Sơ đồ mô phỏng:
Hình 5.11. Sơ đồ mô phỏng so sánh hai bộ điều khiển LQR và LQG khi có
nhiễu tác động
Kết quả:
Hình 5.12. Kết quả mô phỏng bộ điều khiển LQR và LQG khi có nhiễu
tác động
Kết luận:
- Khi có nhiễu tác động, bộ điều khiển LQR lọc nhiễu không tốt. Bộ
điều khiển LQG có khả năng lọc nhiễu rất tốt.
25