Thuật toán PID thích nghi dùng mạng nơ ron điều khiển hệ con lắc ngược đơn p2

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (534.48 KB, 19 trang )

CHƯƠNG 2

CƠ SỞ LÝ THUYẾT

Mơ hình con lắc ngược quay
Phần này mơ tả việc xây dựng mơ hình con lắc ngược quay trên mô phỏng cũng như
thực nghiệm và các vấn đề liên quan
Mơ hình con lắc ngược quay với phần cứng được xây dựng dựa vào các tham số tham
khảo từ các mơ hình đã được cơng bố chạy thực nghiêm thành cơng, điển hình là mơ
hình của hang QUANSER [16], và các mơ hình đã được thực hiện. Mơ hình này chưa
bao gồm thơng số cơ cấu chấp hành là động cơ tạo moment
Mơ hình phần cứng
Encoder

PCI 6221

Encoder

Rotary
Inverted
Pendulum

Motor DC
PC

Amplifier
driver

Hình 2.1 Cấu trúc mơ hình dùng cho thực nghiệm
Cấu trúc mơ hình được dung để thực nghiệm trong luận văn như hinh. Phần cứng
được sử dụng bao gồm:

• Máy tính PC cài đặt Matlab 2013b thực hiện các thuật tốn điều khiển thơng qua
cơng cụ Real-Time Windows Target trong Matlab
• Board thu thập dữ liệu (DAQ) PCI 6221 của National Instrument
• Động cơ DC Minertia 27V/70W 2000RPM kèm encoder 240 xung/vòng. Khi
dùng bộ QEI đọc giá trị Encoder và dùng phương pháp lấy đạo hàm để ra vận tốc
góc, sai số góc và vận tốc góc khi lấy mẫu ở 100Hz ±0.00654 𝑟𝑎𝑑 và ±0.654
𝑟𝑎𝑑/𝑠.

6

• Mạch điều khiển động cơ có thơng số chịu tải 300W (25V, 15A)
• Encoder 1000 xung/vịng thu thập dữ liệu vị trí tay máy, có sai số góc và sai số
vận tôc tại thời gian lấy mẫu ±0.00157 rad và ±0.157 rad/s.
Các thuật toán điều khiển hệ thống sẽ được mơ phỏng theo mơ hình và thơng số được
trình bày ở phần sau. Khi thực hiện với mơ hình thực đã thi công sẽ được điều chỉnh
các thông số cho phù hợp.
Phương trình động lực học của hệ thống
Mơ hình tốn hệ con lắc ngược quay được xây dựng theo phương trình Euler –
Lagrange như sau

Hình 2.2 Sơ đồ mô tả chuyển động con lắc ngược quay

7

Bảng 2.1 Bảng thơng số hệ thống RIP
Đặc tính vật lý

Ký hiệu

Đơn vị

Khối lượng con lắc

m

kg

Chiều dài con lắc

Lp

m

Lp/2

m

Mô-men quán tính con lắc

Jp

Nrad

Chiều dài tay máy

La

M

Mơ-men qn tính tay máy

Ja

Nrad

Vị trí góc quay tay máy

θ

rad

Vị trí góc quay con lắc

α

rad

ba, bp

N/m/s

Khoảng cách trọng tâm con lắc đến trục quay

Hệ số ma sát các trục quay

Phương trình thể hiện tọa độ trọng tâm hệ con lắc:
𝑥𝑝 = 𝑙𝑎 . cos𝜃 + 𝑙𝑝 . sin𝜃. 𝑠𝑖𝑛𝛼
{𝑦𝑝 = 𝑙𝑎 . sin𝜃 − 𝑙𝑝 . cos𝜃. 𝑠𝑖𝑛𝛼

𝑧𝑝 = 𝑙𝑏 . cos𝛼

(2-1)

Lấy đạo hàm theo thời gian ta được phương trình vận tốc con lắc
𝑣𝑝𝑥 = 𝑥̇ 𝑝 = −𝜃̇. 𝑙𝑎 . sin𝜃 + 𝜃̇. 𝑙𝑝 . cos𝜃. 𝑠𝑖𝑛𝛼 + 𝛼̇ . 𝑙𝑝 . sin𝜃. 𝑐𝑜𝑠

(2-2)

𝑣𝑝𝑦 = 𝑦̇𝑝 = 𝜃̇. 𝑙𝑎 . cos𝜃 + 𝜃̇. 𝑙𝑝 . sin𝜃. 𝑠𝑖𝑛𝛼 − 𝛼̇ . 𝑙𝑝 . cos𝜃. 𝑐𝑜𝑠𝛼

(2-3)

𝑣𝑝𝑧 = 𝑧̇𝑝 = −𝛼̇ . 𝑙𝑝 . sin𝛼

(2-4)

Động năng hệ thống
𝐾 = 𝐾𝑝 + 𝐾𝑎 =

1
2

𝐽𝑝 𝛼̇ 2 +

1
2

2
2

2
) +
𝑚(𝑣𝑝𝑥
+ 𝑣𝑝𝑦
+ 𝑣𝑝𝑧

8

1

̇2

𝐽 𝜃
2 𝑎

(2-5)

K=

1

𝐽 𝛼̇
2 𝑝

2

+

1

2

1
𝑚(𝑙𝑎2 𝜃̇ 2 + 𝑙𝑝2 𝜃̇ 2 𝑠𝑖𝑛2 𝛼 + 𝑙𝑝2 𝛼̇ 2 − 2𝑙𝑎 𝑙𝑝 𝛼̇ 𝜃̇𝑐𝑜𝑠𝛼) + 𝐽𝑎 𝜃̇ 2 (2-6)
2

Thế năng con lắc (gốc thế năng tại mặt phẳng xy)
𝑈 = 𝑈𝑝 + 𝑈𝑎 = 𝑚𝑔𝑙𝑝 𝑐𝑜𝑠𝛼

(2-7)

Phương trình Euler – Lagrange cho hệ RIP
𝑑 𝜕𝐿
𝜕𝐿
( )−
= Τ;
𝑑𝑡 𝜕𝑞̇
𝜕𝑞
(2-8)
𝑞1
𝜏 − 𝑏𝑎 𝜃̇
𝜃
]
𝑞 =[𝑞 ]= [ ] ; Τ=[
−𝑏𝑝 𝛼̇
2
𝛼

(2-9)

Với moment tác động được cung cấp bởi động cơ DC có hàm truyền
𝜏=

𝑘𝑡 𝑘𝑢

𝑢−

𝑅

𝑘𝑡 𝑘𝑢

→ Τ=[

𝑅

𝑘𝑡 𝑘𝑏
𝑅

𝜃̇

𝑢 − ( 𝑏𝑎 +
−𝑏𝑝 𝛼̇

(2-10)
𝑘𝑡 𝑘𝑏
𝑅

) 𝜃̇

]

(2-11)

Trong đó hàm năng lượng Lagrange
𝐿 = 𝐾𝑡 − 𝑈𝑡 = 𝐾𝑎 + 𝐾𝑝 − (𝑈𝑎 + 𝑈𝑝 )
1
1
1
𝐽𝑎 𝜃̇ 2 + 𝐽𝑝 𝛼̇ 2 + 𝑚(𝑙𝑎2 𝜃̇ 2 + 𝑙𝑝2 𝜃̇ 2 𝑠𝑖𝑛2 𝛼 + 𝑙𝑝2 𝛼̇ 2 − 2𝑙𝑎 𝑙𝑝 𝛼̇ 𝜃̇𝑐𝑜𝑠𝛼)
2
2
2
− 𝑚𝑔𝑙𝑝 𝑐𝑜𝑠𝛼
1
1
𝐿 = (𝐽𝑎 + 𝑚𝑙𝑎2 + 𝑚𝑙𝑝2 𝑠𝑖𝑛2 𝛼)𝜃̇ 2 + (𝐽𝑝 + 𝑚𝑙𝑝2 )𝛼̇ 2 − 𝑚𝑙𝑎 𝑙𝑝 𝛼̇ 𝜃̇𝑐𝑜𝑠𝛼 − 𝑚𝑔𝑙𝑝 𝑐𝑜𝑠𝛼
2
2
(2-12)
𝐿=

Đặt các hằng số như sau:
𝑃1 = 𝐽𝑎 + 𝑚𝑙𝑎2 ; 𝑃2 = 𝑚𝑙𝑝2 ; 𝑃3 = 𝑚𝑙𝑎 𝑙𝑝 ; 𝑃4 = 𝐽𝑝 + 𝑚𝑙𝑝2 ; 𝑃5 = 𝑚𝑔𝑙𝑝 ;
𝑃6 = 𝑏𝑎 ; 𝑃7 = 𝑏𝑝
Ta được

9

1

𝐿 = (𝑃1 + 𝑃2 𝑠𝑖𝑛2 𝛼)𝜃̇ 2 +
2

Τ=[

1

𝑃 𝛼̇
2 4

2

− 𝑃3 𝛼̇ 𝜃̇𝑐𝑜𝑠𝛼 − 𝑃5 𝑐𝑜𝑠𝛼

𝑢 − 𝑃6 𝜃̇
]
−𝑃7 𝛼̇

(2-13)
(2-14)

𝜕𝐿
= (𝑃1 + 𝑃2 𝑠𝑖𝑛2 𝛼)𝜃̇ − 𝑃3 𝛼̇ 𝑐𝑜𝑠𝛼
̇
𝜕𝜃
𝑑 𝜕𝐿
( ) = (𝑃1 + 𝑃2 𝑠𝑖𝑛2 𝛼)𝜃̈ + 2𝑃2 𝛼̇ 𝜃̇ 𝑠𝑖𝑛𝛼𝑐𝑜𝑠𝛼 − 𝑃3 𝛼̈ 𝑐𝑜𝑠𝛼 + 𝑃3 𝛼̇ 2 𝑠𝑖𝑛𝛼
𝑑𝑡 𝜕𝜃̇
𝜕𝐿
= 𝑃4 𝛼̇ − 𝑃3 𝜃̇𝑐𝑜𝑠𝛼

𝜕𝛼̇
𝑑 𝜕𝐿
( ) = 𝑃4 𝛼̈ − 𝑃3 𝜃̈𝑐𝑜𝑠𝛼 + 𝑃3 𝛼̇ 𝜃̇𝑠𝑖𝑛𝛼
𝑑𝑡 𝜕𝛼̇
𝜕𝐿
= 𝑃2 𝜃̇ 2 𝑠𝑖𝑛𝛼𝑐𝑜𝑠𝛼 + 𝑃3 𝛼̇ 𝜃̇𝑠𝑖𝑛𝛼 + 𝑃5 𝑠𝑖𝑛𝛼
𝜕𝛼
𝜕𝐿
=0
𝜕𝜃
(𝑃1 + 𝑃2 𝑠𝑖𝑛2 𝛼)𝜃̈ + 2𝑃2 𝛼̇ 𝜃̇𝑠𝑖𝑛𝛼𝑐𝑜𝑠𝛼 − 𝑃3 𝛼̈ 𝑐𝑜𝑠𝛼 + 𝑃4 𝛼̇ 2 𝑠𝑖𝑛𝛼 = 𝑢 − 𝑃6 𝜃̇
𝑃4 𝛼̈ − 𝑃3 𝜃̈𝑐𝑜𝑠𝛼 + 𝑃3 𝛼̇ 𝜃̇ 𝑠𝑖𝑛𝛼 − (𝑃2 𝜃̇ 2 𝑠𝑖𝑛𝛼𝑐𝑜𝑠𝛼 + 𝑃3 𝛼̇ 𝜃̇𝑠𝑖𝑛𝛼 + 𝑃5 𝑠𝑖𝑛𝛼) = −𝑃7 𝛼̇
(𝑃1 + 𝑃2 𝑠𝑖𝑛2 𝛼)𝜃̈ + (𝑃3 𝑐𝑜𝑠𝛼 )𝛼̈ + 𝑃2 𝛼̇ 𝜃̇𝑠𝑖𝑛2𝛼 + 𝑃3 𝛼̇ 2 𝑠𝑖𝑛𝛼 = 𝑢 − 𝑃6 𝜃̇
{
1
(𝑃3 𝑐𝑜𝑠𝛼 )𝜃̈ + 𝑃4 𝛼̈ − 𝑃2 𝜃̇ 2 𝑠𝑖𝑛2𝛼 − 𝑃5 𝑠𝑖𝑛𝛼 = −𝑃7 𝛼̇

(2-15)

2

Phương trình (2-12) có thể viết lại như sau:
𝑃1 + 𝑃2 𝑠𝑖𝑛2 𝛼
[
𝑃3 𝑐𝑜𝑠𝛼

𝑃3 𝑐𝑜𝑠𝛼 𝜃̈
][ ]
𝑃4
𝛼̈

1
1
𝑃2 𝑞̇ 2 sin(2𝑞2 ) −𝑃4 𝑞̇ 2 𝑠𝑖𝑛(𝑞2 ) + 𝑃2 𝑞̇ 1 sin (2𝑞2 ) ̇
2
] [𝜃 ]
+[ 2
1
𝛼̇
− 𝑃2 𝑞̇ 1 sin(2𝑞2 )
0
2
𝑃 𝑞̇
0
𝑢
] + [ 6 1] = [ ]
+[
−𝑃5 𝑠𝑖𝑛𝛼
0
𝑃7 𝑞̇ 2

Phương trình (2-13) có dạng

10

𝑀(𝑞). 𝑞̈ + 𝑉 (𝑞, 𝑞̇ ). 𝑞̇ + 𝐺 (𝑞) = 𝜏

(2-16)

𝑞1

𝑃 + 𝑃2 𝑠𝑖𝑛2 𝛼
𝜃
trong đó: 𝑞 = [ 𝑞 ] = [ ] ; 𝑀(𝑞) = [ 1
𝑃3 𝑐𝑜𝑠𝛼
2
𝛼
1
𝑃2 𝑞̇ 2 sin(2𝑞2 )
2
𝑉 (𝑞, 𝑞̇ ) = [
1
− 𝑃2 𝑞̇ 1 sin(2𝑞2 )
2
𝐺 (𝑞 ) = [

𝑃3 𝑐𝑜𝑠𝛼
];
𝑃4

1
−𝑃4 𝑞̇ 2 𝑠𝑖𝑛(𝑞2 ) + 𝑃2 𝑞̇ 1 sin (2𝑞2 )
2
];
0

𝑃 𝑞̇
0
𝑢
] ; 𝑓𝑣 (𝑞̇ ) = [ 6 1 ] ; 𝜏 = [ ]
−𝑃5 𝑠𝑖𝑛𝛼

0
𝑃7 𝑞̇ 2

(2-17)

Từ (2-14) ta suy ra được phương trình động học mơ tả hệ thống:
1
𝜃̈ = [𝑃4 (−𝑃7 𝜃̇ − 𝑃2 𝛼̇ 𝜃̇𝑠𝑖𝑛2𝛼 − 𝑃3 𝛼̇ 2 𝑠𝑖𝑛𝛼) + 𝑃3 𝑐𝑜𝑠𝛼 (−𝑃7 𝛼̇ + 𝑃2 𝜃̇ 2 𝑠𝑖𝑛2𝛼 +
2

2

𝑃5 𝑠𝑖𝑛𝛼) + 𝑃4 𝑢] [(𝑃1 + 𝑃2 𝑠𝑖𝑛 𝛼)𝑃4 − (𝑃3 𝑐𝑜𝑠𝛼

)2 ]−1

(2-18)

𝛼̈ = [𝑃3 𝑐𝑜𝑠𝛼(−𝑃6 𝜃̇ − 𝑃2 𝛼̇ 𝜃̇𝑠𝑖𝑛2𝛼 − 𝑃3 𝛼̇ 2 𝑠𝑖𝑛𝛼) + (𝑃1 + 𝑃2 𝑠𝑖𝑛2 𝛼) (−𝑃7 𝛼̇ +
1

̇ 2 𝑠𝑖𝑛2𝛼 + 𝑃5 𝑠𝑖𝑛𝛼) + (𝑃3 𝑐𝑜𝑠𝛼)𝑢] [(𝑃1 + 𝑃2 𝑠𝑖𝑛2 𝛼)𝑃4 − (𝑃3 𝑐𝑜𝑠𝛼 )2 ]−1 (2-19)

𝑃𝜃
2 2

Đặt các biến trạng thái của hệ thống
𝑥1 = 𝜃; 𝑥2 = 𝛼; 𝑥3 = 𝜃̇; 𝑥4 = 𝛼̇
Phương trình trạng thái của hệ thống
𝑥̇ = 𝑓 (𝑥) + 𝑔(𝑥)𝑢

𝑓 (𝑥) = [𝑥3 𝑥4 𝑓1 (𝑥) 𝑓2 (𝑥)]′ ; 𝑔(𝑥) = [ 0 0 𝑔1 (𝑥) 𝑔2 (𝑥)]′ ;
Trong đó
1
𝑓1 = [𝑃3 𝑐𝑜𝑠𝑥2 ( 𝑃2 𝑥3 2 𝑠𝑖𝑛2𝑥2 + 𝑃5 𝑠𝑖𝑛𝑥2 − 𝑃7 𝑥4 )
2
− 𝑃4 (𝑃2 𝑥3 𝑥4 𝑠𝑖𝑛2𝑥2 + 𝑃3 𝑥4 2 𝑠𝑖𝑛𝑥2 + 𝑃6 𝑥3 )] [(𝑃1 + 𝑃2 𝑠𝑖𝑛2 𝑥2 )𝑃4
− (𝑃3 𝑐𝑜𝑠𝑥2 )2 ]−1
(2-20)

11

1
𝑓2 = [(𝑃1 + 𝑃2 𝑠𝑖𝑛2 𝑥2 ) ( 𝑃2 𝑥3 2 𝑠𝑖𝑛2𝑥2 + 𝑃5 𝑠𝑖𝑛𝑥2 − 𝑃7 𝑥4 )
2
− 𝑃3 𝑐𝑜𝑠𝑥2 (𝑃2 𝑥3 𝑥4 𝑠𝑖𝑛2𝑥2 + 𝑃3 𝑥4 2 𝑠𝑖𝑛𝑥2
+ 𝑃6 𝑥3 )] [(𝑃1 + 𝑃2 𝑠𝑖𝑛2 𝑥2 )𝑃4 − (𝑃3 𝑐𝑜𝑠𝑥2 )2 ]−1
(2-21)
𝑔1 = 𝑃4 [(𝑃1 + 𝑃2 𝑠𝑖𝑛2 𝑥2 )𝑃4 − (𝑃3 𝑐𝑜𝑠𝑥2 )2 ]−1

(2-22)

𝑔2 = (𝑃3 𝑐𝑜𝑠𝑥2 )[(𝑃1 + 𝑃2 𝑠𝑖𝑛2 𝑥2 )𝑃4 − (𝑃3 𝑐𝑜𝑠𝑥2 )2 ]−1

(2-23)

Thơng số mơ hình
Trong phạm vi đề tài thực hiện, các thuật toán điều khiển hạn chế dựa vào tham số
mơ hình. Việc nhận dạng các thơng số mơ hình thật sẽ khơng được trình bày trong
luận văn do khi vận hành, mơ hình khơng chế tạo khơng tốt, các thơng số nhận dạng

được khơng chính xác và thay đổi rất nhiều trong q trình hoạt động. Các thơng số
mơ hình ở đây được tham khảo trong [17] [18], dung cho mục đích mơ phỏng.
Bảng 2.2 Bảng các giá trị tham số dùng mô phỏng
Ký hiệu

Giá trị

Đơn vị

P1

0.0619

kg.m2/rad

P2

0.0149

kg.m2/rad

P3

0.0185

kg.m2/rad

P4

0.0131

kg.m2/rad

P5

0.5076

kg.m2/rad

P6

0.0083

N.m.rad/s

P7

0.0007

N.m.rad/s

Phương pháp điều khiển PID
Bộ điều khiển PID- Proportional Integral Derivative) là 1 bộ điều khiển với cơ chế
phản hồi vòng điều khiển (bộ điều khiển) tổng quát được sử dụng rộng rãi trong các

12

hệ thống điều khiển công nghiệp – bộ điều khiển PID được sử dụng phổ biến nhất
trong số các bộ điều khiển phản hồi [19] [20]. Một bộ điều khiển PID tính tốn một

giá trị "sai số" là hiệu số giữa giá trị đo thông số biến đổi và giá trị đặt mong muốn.
Bộ điều khiển sẽ thực hiện giảm tối đa sai số bằng cách điều chỉnh giá trị điều khiển
đầu vào. Trong trường hợp khơng có kiến thức cơ bản về quá trình, bộ điều khiển
PID là bộ điều khiển tốt nhất. Tuy nhiên, để đạt được kết quả tốt nhất, các thơng số
PID sử dụng trong tính tốn phải điều chỉnh theo tính chất của hệ thống-trong khi
kiểu điều khiển là giống nhau, các thông số phải phụ thuộc vào đặc thù của hệ thống.
Giải thuật tính tốn bộ điều khiển PID bao gồm 3 thơng số riêng biệt, do đó đơi khi
nó cịn được gọi là điều khiển ba khâu: các giá trị tỉ lệ, tích phân và đạo hàm, viết tắt
là P, I, và D. Giá trị tỉ lệ xác định tác động của sai số hiện tại, giá trị tích phân xác
định tác động của tổng các sai số quá khứ, và giá trị vi phân xác định tác động của
tốc độ biến đổi sai số. Tổng chập của ba tác động này dùng để điều chỉnh q trình
thơng qua một phần tử điều khiển như vị trí của van điều khiển hay bộ nguồn của
phần tử gia nhiệt. Nhờ vậy, những giá trị này có thể làm sáng tỏ về quan hệ thời gian:
P phụ thuộc vào sai số hiện tại, I phụ thuộc vào tích lũy các sai số quá khứ, và D dự
đoán các sai số tương lai, dựa vào tốc độ thay đổi hiện tại.

Hình 2.3 Sơ đồ điều khiển PID
Bộ điều khiển PID được mơ tả bằng mơ hình vào/ra:
u (t ) = K p e(t ) + K D

de(t )
+ K I  e(t )dt
dt

13

(2-24)

Điều khiển tuyến tính hóa hồi tiếp cho hệ phi tuyến

Tuyến tính hóa hồi tiếp dựa trên ý tưởng về sự tồn tại của luật điều khiển hồi tiếp
trạng thái u mà phép biến đổi đại số động lực học của hệ phi tuyến thành một (đầy đủ
hoặc một phần) hệ thống tuyến tính tương đương. Nói một cách đơn giản, tuyến tính
hóa hồi tiếp có nghĩa là hủy bỏ tính phi tuyến tính trong một hệ thống để động lực
học vịng kín biến thành tuyến tính. [21][22] [23][17]
Xét hệ phi tuyến SISO mơ tả bởi phương trình vi phân
{

𝑥̇ = 𝑓 (𝑥) + 𝑔(𝑥)𝑢
𝑦 = ℎ (𝑥 )

𝑥 = [𝑥1 𝑥2 … .. 𝑥𝑛 ]𝑇 ∈ ℜ𝑛 là vector trạng thái của hệ thống,
𝑢 ∈ ℜ là vector tín hiệu vào
𝑦 ∈ ℜ là tín hiệu ra,
𝑓 (𝑥) ∈ ℜ𝑛 , 𝑔(𝑥) ∈ ℜ𝑛 là các hàm trơn mô tả động học của hệ thống
ℎ(𝑥) ∈ ℜ là hàm trơn xác định quan hệ giữa biến trạng thái và tín hiệu ra
Bài tốn đặt ra là điều khiển tín hiệu ra y(t) bám theo tín hiệu đặt ym(t).
Theo luật điều khiển hồi tiếp tuyến tính hóa
𝑦̇ =

𝜕ℎ
𝜕𝑥

[𝑓 (𝑥) + 𝑔(𝑥)𝑢 ] ≜ 𝐿𝑓 ℎ(𝑥) + 𝐿𝑔 ℎ(𝑥)𝑢,

𝐿𝑓 ℎ(𝑥) =

𝜕ℎ
𝜕𝑥

𝑓 (𝑥 )

(2-25)
(2-26)

Gọi là đạo hàm Lie của h đối với f.
Luật điều khiển hồi tiếp tuyến tính hóa u
u=

1

1
 − Lf h( x ) +   =
 −a( x) +  
Lg L f h( x )
b( x )
 −1

14

(2-27)

Trong đó 𝜐 là vector tín hiệu vào hệ thống động đã được tuyến tính hóa. Đặc biệt, khi
phương trình trạng thái được tuyến tính hóa hồn tồn thơng qua đầu vào biến đổi u,
tức là, độ tương đối ρ bằng bậc của hệ n, nó đã biết như trạng thái đầy đủ hoặc tuyến
tính hóa trạng thái đầu vào. Mặt khác, khi chỉ có đầu vào - đầu ra tuyến tính hóa trong
khi phương trình trạng thái chỉ được tuyến tính hóa một phần (nghĩa là bậc tương đối
1 ≤ ρ < n), nó được gọi là tuyến tính hóa đầu vào - đầu ra.
Cuối cùng, động lực học đầu ra vòng hở trong (2.20) là một chuỗi tuyến tính đơn giản

của ρ tích phân, mơ tả mối quan hệ giữa đầu ra và đầu vào mới v được xác định. Đầu
vào điều khiển mới này có thể được chọn làm
𝜐 = −𝑘0 𝑦 − 𝑘1 𝑦̇ − ⋯ − 𝑘𝜌−1 𝑦 𝜌−1 ,

( 2-28)

Động học ngõ ra vòng kín cho bởi
𝑦 𝜌 + 𝑘𝜌−1 𝑦 𝜌−1 + ⋯ + 𝑘1 𝑦̇ + 𝑘0 𝑦 = 0

(2-29)

với các hằng số dương ki được chọn sao cho đa thức có tất cả các cực nằm trong phần
bên trái mặt phẳng phức. Điều này đảm bảo rằng y (t) 0 với một tỷ lệ hội tụ theo hàm
mũ. Tuy nhiên, việc lựa chọn v không phải là duy nhất. Dạng đơn giản hơn của động
lực đầu ra trong (2.5) cũng có thể được sử dụng để phát triển các bộ điều khiển thích
nghi, bền vững hoặc bộ điều khiển phi tuyến dựa trên mạng thần kinh, như được trình
bày trong các nghiên cứu ở chương sau.
Khái niệm trên cũng được mở rộng cho hệ thống nhiều ngõ vào và nhiều ngõ ra
(MIMO). Xét trường hợp hệ thống hệ thống MIMO có số ngõ vào và số ngõ ra tương
đương nhau
{

𝑥̇ = 𝑓 (𝑥) + 𝐺 (𝑥)𝑢
𝑦 = ℎ (𝑥 )

(2-30)

Khi x là vector trạng thái,
Tương tự hệ thống SISO, để tuyến tính hóa vào ra cho hệ thống MIMO, điều cần thiết
là đạo hàm y theo thời gian cho đến khi xuất hiện tín hiệu u. Giả sử rằng bậc tương

15

đối ri là số nguyên dương nhỏ nhất để tín hiệu ui xuất hiện, khi đó đáp ứng động ngõ
ra vịng kín của hệ MIMO có thể mơ tả như sau
(𝑟 )
𝑟
𝑢1
𝑦1 1
𝐿11 ℎ1 (𝑥)
[ … ]= [
] + 𝐸 (𝑥) [ … ],
…
𝑟𝑚
(𝑟𝑚 )
𝑢𝑚
𝐿1 ℎ𝑚 (𝑥)
𝑦1

(2-31)

Với ma trận 𝐸 (𝑥) ∈ 𝑅𝑚𝑥𝑚 được định nghĩa như sau
𝑟 −1

𝑟 −1

𝐿𝑔1 𝐿𝑓1 ℎ1 …. 𝐿𝑔𝑚 𝐿𝑓1 ℎ1
…
]

𝐸 (𝑥 ) = [
𝑟1 −1
𝑟1 −1
𝐿𝑔1 𝐿𝑓 ℎ𝑚 …. 𝐿𝑔𝑚 𝐿𝑓 ℎ𝑚

(2-32)

được gọi là ma trận tách cho hệ thống MIMO. Nếu ma trận tách là khơng kỳ dị ít
trong một vùng xung quanh điểm gốc, thì tín hiệu điều khiển hồi tiếp cho hệ thống
được chọn
𝑟
𝜈1
𝐿11 ℎ1 (𝑥)
−1
−1 …
]+ 𝐸 [ ]
𝑢 = −𝐸 [
…
𝑟𝑚
𝜈𝑚
𝐿1 ℎ𝑚 (𝑥)

(2-33)

Dẫn đến quan hệ vi phân tuyến tính giữa đầu ra y và đầu vào mới v như sau
(𝑟 )
𝜈1
𝑦1 1
[ … ] = […]
(𝑟 )

𝜈𝑚
𝑦1 𝑚

(2-34)

Vì mối quan hệ đầu vào-đầu ra ở trên được tách riêng, luật điều khiển tách trong
(2.10) có thể được sử dụng để thiết kế bộ điều khiển theo dõi hoặc ổn định bằng cách
sử dụng SISO thiết kế trên mỗi quan hệ yi - vi. Cuối cùng, khái niệm về mức độ tương
đối cho hệ thống MIMO có thể được chính thức hóa như sau:
Định nghĩa 2.6: Hệ thống (2.21) có bậc tương đối (r1, …, rm) tại x0 nếu tồn tại lân cân
B của x0
𝑟

𝐿𝑔𝑖 𝐿𝑓𝑘 ℎ𝑗 (𝑥) = 0, 0 ≤ 𝑘 ≤ 𝑟𝑖 − 1, 1 ≤ 𝑖, 𝑗 ≤ 𝑚
E(x) không kỳ dị

16

(2-35)

Tổng mức độ tương đối hệ thống xác định bởi
𝑟 = 𝑟1 + ⋯ + 𝑟𝑚

(2-36)

Mạng Nơ-ron (Neural Network - NN)
Khái niệm
Mạng thần kinh là mơ hình tốn học đơn giản của bộ não người. Mạng thần kinh gồm
các tế bào thần kinh kết nối với nhau bởi các liên kết. Mỗi liên kết kèm theo một trọng

số, đặc trưng cho tính kích thích hay ức chế giữa các tế bào thần kinh [5]. Hình 3 mơ
tả sơ đồ một nơ ron nhân tạo, trong đó x1, x2, …xm là các tín hiệu vào tế bào thần
kinh và w1, w2…wm là các trọng số của tế bào thần kinh.

Hình 2.4 Mô tả tế bào thần kinh
𝑥 = [𝑥1 , 𝑥2 , … . , 𝑥𝑚 ]𝑇 : vector tín hiệu vào
𝑤 = [𝑤1 , 𝑤2 , … . , 𝑤𝑚 ]𝑇 : vector trọng số của tế bào thần kinh
Quá trình xử lý thơng tin của tế bào thần kinh có thể chia thành hai phần: xử lý ở ngõ
vào và xử lý ở ngõ ra. Hàm xử lý ở ngõ vào thường sử dụng hàm tổng dạng hàm
tuyến tính (linear function)
𝑇
𝑓 = 𝑛𝑒𝑡 = (∑𝑚
𝑗=1 𝑤𝑗 . 𝑥𝑗 ) − 𝜃 = 𝑤 𝑥 − 𝜃

(2-37)

𝜃 : là mức ngưỡng của tế bào thần kinh
Ngõ ra của mỗi tế bào thần kinh được cho bởi biểu thức
𝑦 = 𝑎 (𝑓 )

(2-38)

17

Hàm a(.) gọi là hàm tác động (activation function) hay hàm truyền (transfer function).
Các dạng hàm tác động thường dùng là hàm nấc, hàm dấu, hàm tuyến tính, hàm dạng
S đơn cực, hàm dạng S lưỡng cực
Hàm Sigmod lưỡng cực
𝑎 (𝑓 ) =

2
1+𝑒 −𝜆𝑓

−1

(2-39)

Mạng thần kinh có nhiều kiểu như mạng truyền thẳng nhiều lớp với luật cập nhật
trọng số mạng thuật toán lan truyền ngược. Hàm mục tiêu được chọn:
𝐽=

1
2

(𝑦𝑑 − 𝑦)2

(2-40)

Với yd là giá trị ngõ ra mong muốn và y là giá trị ngõ ra thực tế.
Trọng số được cập nhật theo phương pháp gradient (steepest descent), nghĩa là:
𝑤(𝑘 + 1) = 𝑤 (𝑘 ) − 𝜂∇𝐽

(2-41)

Với η > 0 là hằng số học, ảnh hưởng đến tốc độ học và tính hội tụ của trọng số mạng
nơ-ron.
Mạng nhiều lớp

Hình 2.5 Cấu trúc mạng truyền thẳng 3 lớp

Tổng có trọng số tín hiệu vào tế bào thần kinh thứ q ở lớp ẩn
𝑛𝑒𝑡𝑞 = ∑𝑚
𝑗=1 𝑣𝑞𝑗 . 𝑥𝑗

(2-42)

Ngõ ra tế bào thần kinh thứ q ở lớp ẩn

18

𝑧𝑞 = 𝑎ℎ (𝑛𝑒𝑡𝑞 ) = 𝑎ℎ (∑𝑚
𝑗=1 𝑣𝑞𝑗 . 𝑥𝑗 )

(2-43)

Tổng có rọng số tín hiệu vào tế bào thần kinh thứ i ở lớp ra
𝑛𝑒𝑡𝑖 = ∑𝑚
𝑞=1 𝜔𝑖𝑞 . 𝑧𝑗

(2-44)

Ngõ ra tế bào thần kinh thứ i ở lớp ra
𝑦𝑖 = 𝑎𝑜 (𝑛𝑒𝑡𝑖 ) = 𝑎𝑜 (∑𝑙𝑞=1 𝜔𝑖𝑞 . 𝑧𝑞 )

(2-45)

Cập nhật trọng số lớp ra
𝜔𝑖𝑞 (𝑘 + 1) = 𝜔𝑖𝑞 (𝑘 ) + 𝜂𝛿𝑜𝑖 (𝑘 )𝑧𝑞 (𝑘 )

(2-46)

𝑡𝑟𝑜𝑛𝑔 đó: 𝛿𝑜𝑖 (𝑘 ) = [𝑑𝑖 (𝑘 ) − 𝑦𝑖 (𝑘 )][𝑎𝑜′ (𝑛𝑒𝑡𝑖 (𝑘))]

(2-47)

Cập nhật trọng số lớp ẩn
𝑣𝑞𝑗 (𝑘 + 1) = 𝑣𝑞𝑗 (𝑘 ) + 𝜂𝛿ℎ𝑞 (𝑘 )𝑧𝑗 (𝑘 )

(2-48)

𝑡𝑟𝑜𝑛𝑔 đó: 𝛿ℎ𝑞 (𝑘 ) = [∑𝑛𝑗=1 𝛿𝑜𝑖 (𝑘 ). 𝑤𝑖𝑞 (𝑘 )][𝑎𝑜′ (𝑛𝑒𝑡𝑖 (𝑘))]

(2-49)

Nếu các hàm kích hoạt lớp ngõ ra σy(.) như một vectơ của các hàm tác đọng tuyến
tính, mơ hình tốn học tổng qt của mạng nơron được cho trong (2.30) có thể được
đơn giản hóa như
𝑦(𝑡 ) = 𝑊 𝑇 𝜎ℎ (𝑉 𝑇 𝑥)

(2-50)

Đặc tính xấp xỉ hàm tổng quát của mạng nơ-ron
Thuộc tính xấp xỉ hàm phổ biến của mạng nơ-ron đã được được nghiên cứu áp dụng
cho điều khiển rất sớm và có tính ứng dụng tốt [24] [25], và nó đã được chứng minh
là có tầm quan trọng cơ bản trong các thiết bị điều khiển. Kết quả cơ bản của tính gần
đúng phổ biến của mạng nơ-ron có ít nhất hai lớp, vì mạng nơ-ron một lớp thường
khơng có khả năng xấp xỉ chính xác. Có thể khẳng định rằng, bất kỳ hàm trơn f (x)
nào đều có thể được ước lượng gần đúng tùy ý trên một tập hợp nhỏ gọn bằng cách
sử dụng mạng nơron với trọng số thích hợp.

19

Định lý 2: Cho hàm f(x): ℛ 𝑛 ⟶ ℛ 𝑚 là một hàm trơn, một tập kín 𝑆 ∈ ℛ 𝑛 và một
số dương 𝜀𝑁 , tồn tại một mạng nơ-ron hai lớp với vector ngõ vào 𝑥 ∈ ℛ 𝑛+1 , vector
trọng số 𝑉 ∈ ℛ [𝑛+1]𝑥𝐿 , vector hàm tác động 𝜎 ∈ ℛ 𝐿 , và một vector trọng số ngõ ra
𝑊 ∈ ℛ [𝐿+1]𝑥𝑚 , có phương trình mơ tả như sau
𝑦(𝑡 ) = 𝑊 𝑇 𝜎ℎ (𝑉 𝑇 𝑥) + 𝜀,

(2-51)

Với sai số xấp xỉ ‖𝜀‖ < 𝜀𝑁 , với mọi 𝑥 ∈ 𝑆 và số lượng lớp ẩn L đủ lớn
Thuộc tính này đảm bảo sự tồn tại của một mạng nơ-ron với "trọng số thích hợp" xấp
xỉ f (x), nhưng nó khơng chỉ ra cách xác định các trọng số như vậy. Vấn đề này khơng
dễ dàng một, nhưng nó có thể được giải quyết bằng cách sử dụng các thuật toán lan
truyền ngược và luật thích nghi các trọng số bằng phương pháp phân tích quỹ đạo của
hệ thống vịng kín
Điều khiển thích nghi
Hệ thống điều khiển thích nghi là hệ thống điều trong đó thơng số, cấu trúc của bộ
điều khiển thay đồi trong quá trình vận hành nhằm đảm bảo chất lượng điều khiển
khi có sự hiện diện của các yếu tố bất định hoặc biến đổi không biết trước. [26]
[27][15]
Xét hệ phi tuyến SISO mô tả bởi phương trình vi phân
{

𝑥̇ = 𝑓 (𝑥) + 𝑔(𝑥)𝑢
𝑦 = ℎ (𝑥 )

(2-52)

𝑥 = [𝑥1 𝑥2 … .. 𝑥𝑛 ]𝑇 ∈ ℜ𝑛 là vector trạng thái của hệ thống,
𝑢 ∈ ℜ là vector tín hiệu vào
𝑦 ∈ ℜ là tín hiệu ra,
𝑓 (𝑥) ∈ ℜ𝑛 , 𝑔(𝑥) ∈ ℜ𝑛 là các hàm trơn mô tả động học của hệ thống
ℎ(𝑥) ∈ ℜ là hàm trơn xác định quan hệ giữa biến trạng thái và tín hiệu ra
Bài tốn đặt ra là điều khiển tín hiệu ra y(t) bám theo tín hiệu đặt ym(t).

20

𝑒 = 𝑦𝑚 − 𝑦
Xét hàm lọc sai số bám theo dạng PID
r = e + k1e + k 2  e

(2-53)

Xét hàm Lyapunov sau
V=

1 T
r r → V = rT r
2

V = r T (e + k1e + k2e)

V = r T ( ym − f ( x) − g ( x)u + k1e + k2e)

Nếu chọn tín hiệu điều khiển
u (t ) =

1
 ym − f ( x) + k1e + k2e + k3r  với k3>0
g ( x)

(2-54)

Ta suy ra
V = −r T k3r  0, r
Chứng tỏ tín hiệu điều khiển đã chọn làm hệ thống ổn định và bộ lọc sai số tiến về
zero. Tuy nhiên, luật điều khiển (2-29) khó thực thi vào hệ thống điều khiển thực vì:
-

Khơng có kiến thức tồn vẹn về đặc tính động học của hệ và mơ hình tốn,
thơng số hệ thống mơ tả khó chính xác các hàm g(x), f(x)

-

Do hệ thống có tính phi tuyến cao, nên việc chọn cố định các thông số PID chỉ
đáp ứng tốt quanh điểm làm việc được thiết kế, hơn nữa khi điều kiện làm việc
thay đổi (có nhiểu, thơng số hệ thống biến đổi…) chất lượng đáp ứng điều khiển
khơng tốt.
Điều khiển thích nghi dạng gián tiếp

Nhận dạng trực tuyến g(x) và f(x) dung mơ hình gˆ ( x), fˆ ( x) sau đó tính tín hiệu điều
khiển theo nguyên lý chắc chắn tương đương.

21

uce =

1
 ym − f ( x) + k1e + k2e + k3r 
g ( x)

(2-55)

Mơ hình gˆ ( x), fˆ ( x) có thể là mơ hình mờ, mạng thần kinh hoặc mơ hình hộp đen phi
tuyến tổng qt
𝑔̂(𝑥) = 𝜃𝑔𝑇 𝜉𝑔 (𝑥)

(2-56)

𝑓̂(𝑥) = 𝜃𝑓𝑇 𝜉𝑓 (𝑥)

(2-57)

Các vector 𝜃𝑎 , 𝜃𝑏 là vector thơng số của mơ hình và được cập nhật trực tuyến để tiệm
cận tiến tới giá trị tối ưu
𝜃𝑔∗ = arg min {sup |𝜃𝑔𝑇 𝜉𝑔 (𝑥) − 𝑔(𝑥)|}

(2-58)

𝜃𝑓∗ = arg min {sup |𝜃𝑓𝑇 𝜉𝑓 (𝑥) − 𝑓(𝑥)|}

(2-59)

𝜃𝑔 ∈Ω𝑔 𝑥∈S
𝑥

𝜃𝑓 ∈Ω𝑓 𝑥∈S
𝑥

Gọi 𝜀𝑓 (𝑥), 𝜀𝑔 (𝑥) là sai số giữa mơ hình tối ưu và đặc tính động học chính xác của đối
tượng. Mơ hình đúng của đối tượng có thể biểu diễn như sau
𝑓 (𝑥) = 𝜃𝑓∗𝑇 𝜉𝑓 (𝑥) + 𝜀𝑓 (𝑥)

(2-60)

𝑔(𝑥) = 𝜃𝑔∗𝑇 𝜉𝑔 (𝑥) + 𝜀𝑔 (𝑥)

(2-61)

Sai lệch giữa mơ hình xấp xỉ và mơ hình đúng của hệ thống
𝑓̂(𝑥) − 𝑓(𝑥) = 𝜃̃𝑓𝑇 𝜉𝑓 (𝑥) − 𝜀𝑓 (𝑥)

(2-62)

𝑔̂(𝑥) − 𝑔(𝑥) = 𝜃̃𝑔𝑇 𝜉𝑔 (𝑥) − 𝜀𝑔 (𝑥)

(2-63)

Trong đó
𝜃̃𝑓 = 𝜃𝑓 − 𝜃𝑓∗

(2-64)

𝜃̃𝑔 = 𝜃𝑔 − 𝜃𝑔∗

(2-65)

Sai số mơ hình ln tồn tại trong các trường hợp thực tế. Để đảm bảo hệ thống ổn
định ta sử dụng them thành phần điều khiển trượt bù sai số us.

22

Các giả thiết để thực hiện bộ điều khiển
• g(x) bị chặn
0 < 𝑔 (𝑥 ) ≤ 𝑔 (𝑥 ) ≤ 𝑔 (𝑥 ) < ∞

(2-66)

• Quỹ đạo mong muốn ym(t) khả vi liên tục bị chặn đến bậc r và các đạo hàm
(𝑟)

𝑦̇𝑚 , … , 𝑦𝑚 có thể đo được. Sai số cấu trúc giữa mơ hình và đặc tính chính xác
của đối tượng bị chặn bởi các cận biết trước
|𝜀𝑓 (𝑥)| ≤ 𝜀̅𝑓 (𝑥) ∈ ℒ ∞

(2-67)

|𝜀𝑔 (𝑥)| ≤ 𝜀̅𝑔 (𝑥) ∈ ℒ ∞

(2-68)

Điều khiển thích nghi dạng trực tiếp
Dùng mơ hình phi tuyến nhận dạng trực tiếp 𝑢∗ (𝑥)
𝑢̂(𝑥) = 𝜃𝑢𝑇 𝜉𝑢 (𝑥)

(2-69)

Mơ hình 𝑢̂(𝑥) có thể là mơ hình mờ, mạng thần kinh hoặc mơ hình hộp đen phi tuyến
tổng quát.
𝜉𝑢 (𝑥) là vector độ đúng của mệnh đề điều kiện của mơ hình mờ, vector ngõ ra lớp ẩn
của mạng thần kinh, hoặc vector hàm cơ sở phi tuyến tổng quát
𝜃𝑢 là vector thông số của mơ hình và được cập nhật trực tuyến để tiệm cận tiến tới
giá trị tối ưu
𝜃𝑢∗ = arg min {sup |𝜃𝑢𝑇 𝜉𝑢 (𝑥) − 𝑢(𝑥)|}
𝜃𝑢 ∈Ω𝑢 𝑥∈S
𝑥

(2-70)

Gọi 𝜀𝑢 (𝑥) là sai số giữa mơ hình tối ưu và và luật điều khiển hồi tiếp tuyến tính hóa
lý tưởng. Luật điều khiển hồi tiếp tuyến tính hóa có thể biểu diễn như sau
𝑢∗ (𝑥) = 𝜃𝑢∗𝑇 𝜉𝑢 (𝑥) + 𝜀𝑢 (𝑥)

(2-71)

Sai lệch giữa luật điều khiển ước lượng được và luật điều khiển tuyến tính hóa
𝑢̂(𝑥) − 𝑢∗ (𝑥) = 𝜃̃𝑢𝑇 𝜉𝑢 (𝑥) − 𝜀𝑢 (𝑥)

(2-72)

23

Trong đó 𝜃̃𝑢 = 𝜃𝑢 − 𝜃𝑢∗

(2-73)

Sai số xấp xỉ luôn tồn tại trong thực tế, để đảm bảo hệ thống ổn định ta sử dụng thêm
thành phần điều khiển trượt us.
Tương tự như điều khiển thích nghi gián tiếp, ta cũng có các giả thiết cần để thực
hiện bộ điều khiển và then một giả thiết đạo hàm theo thời gian của b(x) phải bị chặn
bởi cận biết trước
|𝑏̇(𝑥)| ≤ 𝐷𝑏 (𝑥)

(2-74)

24

Thuật toán PID thích nghi dùng mạng nơ ron điều khiển hệ con lắc ngược đơn p2

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về