Tải bản đầy đủ (.pdf) (10 trang)

Tổng hợp hệ thống điều khiển bám thích nghi bền vững cho đối tượng phi tuyến bất định

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (441.28 KB, 10 trang )

Nghiên cứu khoa học công nghệ

TỔNG HỢP HỆ THỐNG ĐIỀU KHIỂN BÁM THÍCH NGHI BỀN
VỮNG CHO ĐỐI TƯỢNG PHI TUYẾN BẤT ĐỊNH
Nguyễn Trung Kiên*, Lê Ngọc Quyết
Tóm tắt: Bài báo giới thiệu phương pháp tổng hợp hệ điều khiển bám cho đối
tượng phi tuyến bất định, dưới tác động của nhiễu ngoài. Khả năng thích nghi của
hệ thống được thiết lập trên cơ sở nhận dạng các thành phần bất định, bao gồm cả
các hàm phi tuyến bất định, sử dụng mạng nơ-ron RBF; khả năng hoạt động bền
vững của hệ thống được thiết lập nhờ sử dụng điều khiển mode trượt.
Từ khóa: Hệ thống bám; Chế độ trượt; Mạng nơ-ron.

1. MỞ ĐẦU
Trong lĩnh vực quân sự, vấn đề xây dựng các hệ thống bám với độ chính xác
cao trong điều kiện đối tượng điều khiển phi tuyến bất định, lại chịu sự tác động
của nhiễu từ bên ngoài, đồng thời đầu vào của hệ thống thay đổi với độ phức tạp
cao đang trở nên ngày càng cấp thiết. Mặc dù đã được các nhà khoa học quan tâm
giải quyết, song cho đến nay vẫn chưa được giải quyết thỏa đáng. Huang cùng các
cộng sự đã sử dụng mạng nơ-ron xuyên tâm RBF (Radial Basic Function) để đánh
giá (nhận dạng) các hàm phi tuyến bất định, kết quả nhận dạng được sử dụng trong
bộ điều khiển trên cơ sở kết hợp với bộ điều khiển PID tối ưu [1]. Tuy nhiên, luật
cập nhật được đề xuất ở đây còn có nhược điểm là tốc độ hiệu chỉnh các trọng số
cho mạng RBF phụ thuộc vào sai số của hệ thống, trong lúc sai số này phụ thuộc
vào rất nhiều yếu tố, đặc biệt là phụ thuộc vào sự biến đổi của đầu vào của hệ
thống bám. Trong [2] đã đề xuất bộ điều khiển cho đối tượng SISO bậc hai chứa
hàm phi tuyến bất định trong điều kiện không có nhiễu ngoài tác động. Tuy bộ điều
khiển đảm bảo được ổn định, song chất lượng của hệ thống bị hạn chế do tốc độ
hội tụ kém của quá trình nhận dạng hàm phi tuyến bất định với nhược điểm tượng
tự như ở công trình [1] nêu trên. Các công trình [3], [4] đã đề xuất phương pháp
tổng hợp hệ thống điều khiển cho đối tượng phi tuyến bất định trên cơ sở sử dụng
mạng nơ-ron RBF với luật cập nhật các trọng số có ưu điểm nổi bật là tốc độ hiệu


chỉnh các trọng số của mạng chỉ phụ thuộc vào tín hiệu sai lệch giữa đầu ra của đối
tượng và đầu ra của mô hình nhận dạng và không phụ thuộc vào các yếu tố khác.
Hơn nữa, trong [4] đã đề xuất phương pháp xây dựng hệ thống tự động bám cho
các đối tượng mà động học của chúng gồm phần tuyến tính bậc hai và phần phi
tuyến bất định dưới tác động của nhiễu ngoài, đảm bảo tính thích nghi bền vững và
cận tối ưu theo tác động nhanh.
Dưới đây, vấn đề tổng hợp hệ điều khiển bám thích nghi bền vững cho lớp đối
tượng, mà động học của chúng bao gồm phần tuyến tính và phần phi tuyến bất
định, được nghiên cứu giải quyết, nhằm đáp ứng yêu cầu bức thiết về xây dựng các
hệ thống tự động bám chất lượng cao.
2. ĐẶT VẤN ĐỀ
Giả sử động học của đối tượng điều khiển được mô tả bằng hệ phương trình:

Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san TĐH, 04 - 2019

79


Kỹỹ thuật điều khiển & Tự
ự động hóa

̇ =
⎧ ̇ =

⎪ … … … … … … … … …

(1)
⎨ ̇ =
+ ( , ,…, ) + ( , ,…, ) +



⎩ =
Trong đó:
, , … , là các thành ph
phầnn ccủaa véc tơ tr
trạng
ng thái = [ , , … , ] ;
, =1
1, … , là các th
tham
am ssố
ố động học phần tuyến tín
tính;;
là tác đđộng
ộng điều khiển | | ≤ U;
(. ), (. )là
là các hàm phi tuy
tuyến
n trơn, bbấấtt định
đ nh; là nhi
nhiễu
u ngoài;
ngoài là đđầu
ầu ra.
Bài toán đđặt
ặt ra llàà ph
ải xây dựng hệ thống thích nghi bền vững cho đối ttượng
ợng
phải
(1) đđảm

ảm bảo bám sát đầu vvào
ào ( ), trong đó ( ) có th
thểể llàà hàm có đđộ
ộ phức tạp
cao, các tham ssố
ố , = 1, … , và thoả
thoả mãn
mãn gi
giảả thiết ccơ
ơ bbản
ản của lý thuyết nhận
dạng
ạng vvàà điều
điều khiển thích nghi llàà các quá trình “c
“cận
ận dừng”, m
màà theo đó, ttốc
ốc độ thay
đổi
ổi của các tham số nnày
ậm hơn
hơn nhi
nhiều
ều so với động học của đối ttượng
ợng điều khiển.
ày ch
chậm
3. GI
GIẢI
ẢI BÀI

BÀI TOÁN T
TỔNG
ỔNG HỢP HỆ ĐIỀU KHI
KHIỂN
ỂN BÁM
3.1. Xây d
dựng
ựng cấu trúc hệ thống
Cấu trúc của hệ thống đđược
Cấu
ợc thể hiện tr
trên
ên hình 1.

Hình 1. Sơ đồ
đồ cấu trúc hệ thống
thống..
Trong đó: NN1: kh
khối
ối nhận dạng 1; NN2: khối nhận dạng 22;;
MH: mô hình; ĐTĐK: đđối
ối tư
tượng
ợng điều khiển.
khiển

80

N. T. Kiên, L. N. Quy
ết, “Tổng hợp hệ thống điều khiển … đđối

ối ttượng
ợng phi tuy
ất định
định.”

Quyết,
tuyến bất


Nghiên cứu khoa học công nghệ

Để làm rõ ý tưởng chủ đạo của phương pháp tổng hợp hệ thống, ta xây dựng
cấu trúc hệ thống trên cơ sở cách tiếp cận giải bài toán tổng hợp. Các hàm phi
tuyến bất định (. ), (. ) là các hàm trơn, vì vậy để nhận dạng, đánh giá chúng, ta
sử dụng mạng nơ-ron RBF. Kết quả đánh giá có thể đạt tới độ chính xác tùy ý.
Việc nhận dạng các tham số , = 1, … , phải được đồng thời cùng với việc nhận
dạng các hàm phi tuyến bất định. Kết quả (. ), được sử dụng để bù trừ tác động
của (. ), lên hệ thống.
Tiếp theo, cần tổng hợp bộ điều khiển mode trượt trên cơ sở tín hiệu sai lệch
của hệ thống và bộ tham số nhận dạng , = 1, … , .
3.2. Xây dựng thuật toán nhận dạng
Theo cấu trúc hệ thống trên hình 1, phân hệ nhận dạng được xây dựng trên cơ
sở mô hình (MH) và khối hiệu chỉnh thích nghi (HCTN). Khối này thực hiện các
thuật toán nhận dạng và thực hiện hiệu chỉnh các tham số của mô hình trên cơ sở
tín hiệu sai lệch giữa véc tơ trạng thái của đối tượng và véc tơ trạng thái của mô
hình.
Để giải quyết được các yếu tố bất định, hệ thống sẽ sử dụng công cụ nhận dạng
trên cơ sở mạng nơ-ron [5], [6], [7]. Kết quả nhận dạng được sử dụng trong luật
điều khiển, vì vậy hệ thống trở nên thích nghi với các yếu tố bất định. Luật điều
khiển còn được xây dựng trên cơ sở mode trượt, nhờ vậy hệ thống bám sát đầu vào

với các tính chất thích nghi và bền vững.
Phương trình (1) được viết lại dưới dạng:
̇=
(2)
+ (. ) + (. ) +
Với:
0 1 0 . . . 0
0 0 1 . . . 0
=
;
.
.
. . . . .
. . .
(. )] ;
(. ) = [0 0 . . .
(. )] ;
(. ) = [0 0 . . .
]
= [0 0 . . .
Các hàm (. ), (. )là các hàm trơn, vì vậy có thể được xấp xỉ bằng mạng nơron xuyên tâm RBF với độ chính xác tuỳ ý [6], [7]:

⎪ ( )=

⎪ ( )=




( )+




(3)


( )+



Với:
( ) là các hàm cơ sở, ∗ , = 1, … , , ∗ , = 1, … , là các trọng số
tối ưu, đảm bảo với số lượng nơ-ron tương ứng là , , đầu ra của mạng thứ
nhất cho sai lệch so với ( )là ∗ , của mạng thứ hai cho sai lệch so với ( )

Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san TĐH, 04 - 2019

81


Kỹ thuật điều khiển & Tự động hóa

là ∗ . Các sai số ∗ và ∗ được chọn trước, tuỳ theo mức độ chính xác cần thiết.
Trên mô hình MH, các mạng nơ-ron tương ứng được sử dụng với các đầu ra là
( )và ( ).

⎪ ( )=

( )


(4)

( )
⎪ ( )=

Với
, = 1, … , ;
, = 1, … , là các trọng số được hiệu chỉnh (cập

nhật) để

;
→ ∗ .
Phương trình động học của MH có dạng:
̇ =
(5)
+ (. ) + (. ) +
. . .
] ;
Với:
=[
(. )]
(. ) = [0 0 . . .
(. ) = [0 0 . . .
(. )] ;
(. ) = [0 0 . . .
(. )] .
Khối hiệu chỉnh thích nghi HCTN có nhiệm vụ hiệu chỉnh tham số của mô hình
sao cho:
→ ;

→ ∗;
→ ∗ ; → .
Biến đổi phương trình (1) và (5) thu được phương trình mô tả sai lệch của véc
tơ trạng thái của mô hình so với véc tơ trạng thái của đối tượng = −
̇ =
(6)
+
+ (. ) + (. ) +
Trong đó:
(7)
= −
, = −
0
1
0
. .
0
0
0
1
. .
0
=
.
.
.
. .
.




. .

(8)
0 1 0 . . 0
0 0 1 . . 0
=
.
.
. . . .
. .
(. )]
(. ) = [0 0 . .
(. ) = [0 0 . .
(9)
(. )]
]
= [0 0 . .


(. ) = (. ) − (. ) =

(. ) =

82

( )+




,

( )+

=









( )

(10)

N. T. Kiên, L. N. Quyết, “Tổng hợp hệ thống điều khiển … đối tượng phi tuyến bất định.”


Nghiên cứu khoa học công nghệ


(. ) = (. ) − (. ) =
(. ) =

( )+




,



( )+

=



( )



(11)

(12)



(13)
= −
Vấn đề đặt ra tiếp theo là phải xây dựng các luật hiệu chỉnh các tham số
, = 1, … , ;
, = 1, … , ;
, = 1, … , , và đảm bảo cho hệ (6) ổn
định.
Chọn hàm Lyapunov cho hệ (6) dưới dạng:
=


+

+

+

+

Trong đó là ma trận đối xứng xác định dương, kích thước ( × ).
Định lý sau đây xác lập điều kiện đủ để hệ thống (6) ổn định.
Định lý: Giả sử hệ thống động học (6) có ma trận luôn là Hurwitz. Hệ thống
(6) sẽ ổn định thực tế (practical stability) nếu thoả mãn đồng thời các điều kiện sau
đây:
̇

=− ( )
̇

=−

, = 1, … ,

( )

̇ =−

(14)

, = 1, … ,


(15)

, = 1, … ,

(16)

̇=−
‖ ‖>
Trong đó

=[

(17)
(



+



.

)‖ ‖
( )
. .

(18)
] là ma trận dòng thứ


của ma trận .

Chứng minh:
Lấy đạo hàm theo thời gian của hàm Lyapunov ( ) dọc theo quỹ đạo của hệ (6),
sau khi biến đổi, ta thu được:
̇ =
(. )
+
+2
+2
+2 (. )
+2
(19)
̇
̇
̇
̇ +2
+2
+2
+2


là ma trận đối xứng xác định dương, ma trận

luôn là Hurwitz, nên ta có [8]

Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san TĐH, 04 - 2019

83



Kỹ thuật điều khiển & Tự động hóa

[ + ] =−
(20)
Với là ma trận đối xứng xác định dương. Chú ý đến các biểu thức (7) ÷ (13) và
(20), biểu thức (19) được viết lại dưới dạng:
̇ =−

+ 2

+2



+2

( )

+2
( )

+2
̇

+2

+
̇


+2

+2



(21)
̇ +2

̇

Từ (21) ta rút ra các điều kiện đủ để cho đạo hàm ̇ luôn có giá trị âm, tức là điều
kiện đủ để hệ thống (6) ổn định:
( )

( )
2

+
+

+

̇

+

=0


(22)

̇

(23)

=0

̇ =0

(24)

̇=0

(25)

(26)

+ ( ∗ + ∗)
<0
Từ (22)  (25) ta dễ dàng thu được các luật hiệu chỉnh (14)  (17) trong định lý
nêu trên. Đối với bất phương trình (26), ta có nhận xét sau: Ma trận trong thành
phần thứ nhất là ma trận xác định dương và tác động điều khiển trong thành phần
thứ ba thoả mãn điều kiện chặn | | ≤ . Vì vậy ta có [8]:
( )‖ ‖ ≤
( )‖ ‖
(27)

Thành phần thứ ba trong vế trái của (26) thoả mãn bất đẳng thức:
‖ ∗

‖ < ∗ ‖ ‖‖ ‖
(28)
Từ (26), (27) và (28) ta có:
( )‖ ‖ + ( ∗ + ∗ )‖ ‖‖ ‖

+ ( ∗ + ∗)
<−
(29)
<0
Bất phương trình (29) sẽ thoả mãn nếu thoả mãn bất đẳng thức (18) trong định
lý trên. Nói cách khác từ (29) ta thu được bất đẳng thức (18). Định lý đã được
chứng minh ■
Thế

;

từ (10) và (12) vào (14) và (15). Vì ̇
̇

84

=

( )

, = 1, … ,



= 0 và ̇




= 0 ta được:
(30)

N. T. Kiên, L. N. Quyết, “Tổng hợp hệ thống điều khiển … đối tượng phi tuyến bất định.”


Nghiên cứu khoa học công nghệ

̇
Thế

từ (7) vào (16) và

( )

=

, = 1, … ,



(31)

từ (13) vào (17) ta có:
̇




, = 1, … ,

=

(32)

̇=

(33)

thoả mãn điều kiện “cận dừng” [10] ̇ ≈ 0; ̇ ≈ 0.

Như vậy, ta đã tổng hợp được các luật hiệu chỉnh thích nghi đảm bảo cho quá
trình nhận dạng hội tụ.
3.3. Tổng hợp luật điều khiển bám trên cơ sở kết quả nhận dạng, sử dụng
mode trượt
Để tiện cho việc tổng hợp luật điều khiển bám, ta biến đổi từ phương trình (1)
và dựa vào cấu trúc hệ thống để có được phương trình động học trong không gian
sai lệch. Đặt:
= −
= −
(34)
= ̇ , = 2, … ,
Từ (1) và (34) ta thu được:
̇ =

⎪ =
… … … … … … … … … … … … … … … . … … ….
(35)


(
)
+

+ (. ) + (. ) +
⎪ ̇ =

Luật điều khiển trên cơ sở mode trượt cho (35) có sử dụng với các kênh bù có
dạng:
=
+
1
1
(. ) +
=


(36)
(. )
(. )
=
+
Với
là điều khiển tương đương và
là thành phần điều khiển dạng relay
[9]. Thế

từ (36) vào (35) ta có:
̇ =

⎧ ̇ =

… … … … … … … … … … … … … … ..
(37)

(. ) − (. )
(ℎ + ℎ )
+ (. )
+
⎪ ̇ =
(. )

Trong đó:
ℎ =

(

)



; ℎ = (. ) +

Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san TĐH, 04 - 2019

(38)

85



Kỹ thuật điều khiển & Tự động hóa

Phương trình cuối của (37), nếu chú ý đến (7), (11) sẽ có dạng:
̇ =∑

(

+

) + [ (. ) + (. )]

− (. )[ℎ + ℎ ]

(.)

Từ đây ta có:
+ (. )

̇ =

+ (. )

+

(39)
1
− (. )[ℎ + ℎ ]
(. )
Do quá trình nhận dạng hội tụ, nên ta có
→ 0, = 1, … , ;

→ ∗ với ∗
được chọn trước nhỏ bao nhiêu tùy ý. Vì vậy các thành phần liên quan đến

(. ) có giá trị rất nhỏ, thậm chí tiến tới không. Đặt
như sau:
=

+ (. )

− (. )[ℎ + ℎ ]

1
(. )

(40)

Với
là giá trị rất bé. Từ (37), (39) và (40) viết lại phương trình của hệ thống
trong không gian sai lệch:
̇ =
⎧ ̇ =

… … … … … … ..
(41)

+ (. )
+
⎪ ̇ =

Trong đó

là giá trị đánh giá của ; (. ) là giá trị đánh giá của (. ) do kết
quả nhận dạng mang lại,
được xem như nhiễu do sai số nhận dạng gây ra. Như
vậy, trên cơ sở các đánh giá do nhận dạng mang lại, ta sử dụng (41) để tổng hợp
luật điều khiển theo mode trượt. Mặt trượt S được chọn dưới dạng:
(42)
=∑
+
Trong đó, các hệ số
được chọn sao cho đa thức đặc tính
+∑

đa thức Hurwitz. Thành phần điều khiển tương đương
được tổng hợp sao cho
̇ = 0 trong điều kiện chưa tính đến nhiễu . Thành phần
được chọn sao cho
đảm bảo điều kiện đủ cho sự tồn tại chế độ trượt trong sự tồn tại của nhiễu . Lấy
đạo hàm theo thời gian dọc theo quỹ đạo của hệ (41) ta được:
̇=

+

+ (. )

+

+




(43)

Chọn hàm Lyapunov dạng:
1
(44)
2
Điều kiện đủ để tồn tại chế độ trượt của hệ (41) trên mặt S là:
̇ = . ̇<0
(45)
Như vậy, cần tổng hợp

sao cho thoả mãn bất phương trình (45). Từ
(43) ta có thể chọn:
=

86

N. T. Kiên, L. N. Quyết, “Tổng hợp hệ thống điều khiển … đối tượng phi tuyến bất định.”


Nghiên cứu khoa học công nghệ

=

1
(. )
=−

+


(

1
(. )



+

)

(46)
(47)

| |
từ (46), (47) vào (45), ta được:
̇ = . ̇=− . .
(48)
<0
Rõ ràng luật điều khiển trượt
=
+
với các thành phần (46), (47)
đảm bảo cho hệ (41) chế độ trượt trên mặt trượt . Vì mặt trượt thoả mãn điều
kiện Hurwitz nên hệ thống trượt trên mặt và tiến về gốc toạ độ. Điều đó có ý
nghĩa là hệ thống tự động bám với sai số tĩnh → 0, = 1,2, … , .
Với:
Thế

=



4. KẾT LUẬN
Bài báo đã tổng hợp được các luật hiệu chỉnh thích nghi (30), (31), (32), (33)
cho mô hình MH có sử dụng mạng nơ-ron RBF. Nhờ đó, quá trình nhận dạng các
thành phần bất định được hội tụ. Phương pháp đề xuất trên đây cho phép tổng hợp
hệ thống điều khiển bám thích nghi bền vững cho lớp đối tượng phi tuyến bất định,
trong đó, đối tượng điều khiển có phần tuyến tính bất định, phần phi tuyến cũng
bất định và chịu tác động của nhiễu bên ngoài. Kết quả nhận dạng được sử dụng để
tổng hợp luật điều khiển trượt, đảm bảo đầu ra của hệ thống bám sát đầu vào với
các thành phần của véc tơ sai lệch tiến về không → 0, = 1,2, … , . Hệ thống
vừa có khả năng thích nghi vừa có tính bền vững và có khả năng kháng nhiễu cao.
TÀI LIỆU THAM KHẢO
[1]. Huang S. N., Tan K. K., Lee T. H (2011), “Combined PID/adaptive
controller for a class of nonlinear systems”, Automatica No.37, pp. 611-618.
[2]. Liu J. (2013), “Radial Basic Function (RBF) Neural Network Control For
Mechanical Systems: Design, Analysis and Matlab Simulation”, Beijing and
Springer-Verlag Berlin Heidelberg.
[3]. Cao Tiến Huỳnh, Nguyễn Vũ, Nguyễn Trung Kiên, Ngô Trí Nam Cường
(2012), “Về một phương pháp tổng hợp hệ điều khiển thích nghi cho một lớp
đối tượng phi tuyến dưới tác động của nhiễu bên ngoài”, Tạp chí Nghiên cứu
khoa học và công nghệ quân sự, Số 17, trang 6-15.
[4]. Nguyễn Trung Kiên (2014), “Xây dựng phương pháp tổng hợp hệ thống điều
khiển các đài quan sát tự động định vị các đối tượng di động từ xa”, Luận án
Tiến sĩ kỹ thuật, Viện KH-CN quân sự.
[5]. Hornik K. , Stinchcombe M. & White H. (1989), “Multillayer feedforward
networks are universal approximator”, Neural Networks, pp. 359-365.
[6]. Gomn J.B. , Yu D.L. (2000), “Selecting radial basic function networks
centers with recursive orthogonal least squares training”, IEEE Trans. on
Neural Networks, Vol. 11, Issue 2, pp. 306-314.

[7]. Neil E. Cotter (1990), “The Stone-Weiestrass Theorem and its Application to
Neural networks”, IEEE Trans. on Neural Networks. Vol. 1, No. 4, pp. 290-295.

Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san TĐH, 04 - 2019

87


Kỹ thuật điều khiển & Tự động hóa

[8]. Ortega J.M. (1987), “Matrix Theory”, Plenum Press, Newyork.
[9]. Christopher E., Sarah K. (1998), “Sliding Mode Control: Theory and
Applications”, Taylor & Francis, UK.
[10]. Gangtao (2003), “Adaptive Control Design and Analysis”, John Wiley &
Son, Inc Publication.
ABSTRACT
DEVELOPMENT OF METHOD TO SYNTHESIZE AN ADAPTIVE AND
ROBUST CONTROLLER FOR AUTO TRACKING SYSTEMS
This paper presents new results used to synthesize the control system based on a
combination of adaptive and robust control, using neural network and sliding mode
control together for autotracking systems with large parameter uncertainties to
guarantee very high control quality such as insensitivity disturbances, high accuracy
and robustness.
Keywords: Autotracking systems; Sliding mode; Neural network.

Nhận bài ngày 08 tháng 01 năm 2019
Hoàn thiện ngày 06 tháng 3 năm 2019
Chấp nhận đăng ngày 15 tháng 3 năm 2019
Địa chỉ: Viện Tự động hóa KTQS.
*

Email:

88

N. T. Kiên, L. N. Quyết, “Tổng hợp hệ thống điều khiển … đối tượng phi tuyến bất định.”



×