Tải bản đầy đủ (.pdf) (7 trang)

Một phương pháp tổng hợp bộ điều khiển cho lớp đối tượng phi tuyến bất định hàm trên cơ sở điều khiển trượt và mạng nơ ron RBF

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (245.2 KB, 7 trang )

Kỹ thuật Điều khiển – Tự động hóa

MỘT PHƯƠNG PHÁP TỔNG HỢP BỘ ĐIỀU KHIỂN CHO LỚP ĐỐI
TƯỢNG PHI TUYẾN BẤT ĐỊNH HÀM TRÊN CƠ SỞ ĐIỀU KHIỂN
TRƯỢT VÀ MẠNG NƠ RON RBF
Ngô Trí Nam Cường*
Tóm tắt: Bài báo đề xuất một phương pháp tổng hợp bộ điều khiển cho một lớp
đối tượng phi tuyến bất định trên cơ sở điều khiển trượt và mạng nơ ron RBF nhằm
làm giảm hiện tượng rung trên mặt trượt. Trọng số mạng nơ ron được cập nhật
thích nghi theo một tiêu chuẩn tối ưu. Kết quả mô phỏng đã một lần nữa xác nhận
bằng thực nghiệm hiệu quả của luật cập nhật và bộ điều khiển đề xuất đảm bảo hệ
bám tín hiệu đầu vào mong muốn.
Từ khóa: Điều khiển trượt; Mạng nơ ron RBF; Hệ phi tuyến bất định.

1. ĐẶT VẤN ĐỀ
Trong công nghiệp, giao thông vận tải và năng lượng thường gặp các đối tượng điều
khiển phi tuyến có mô hình bất định hàm. Việc tổng hợp hệ thống điều khiển cho các đối
tượng dạng này sao cho đầu ra của hệ bám theo được tín hiệu đặt mong muốn mà không phụ
thuộc vào các thành phần bất định hàm đó cũng như chất lượng bám là tốt, không dao động
hoặc nếu có thì cũng nằm trong phạm vi dao động cho phép là vấn đề thời sự hiện nay.
Chúng thu hút sự chú ý của các nhà khoa học trong lĩnh vực điều khiển và tự động hóa.
Trong các thập kỷ gần đây, có nhiều nghiên cứu để tổng hợp luật điều khiển cho các
đối tượng phi tuyến bất định bằng các phương pháp khác nhau. Đặc biệt phương pháp tổng
hợp luật điều khiển trên cơ sở ưu điểm của điều khiển trượt và mạng nơ ron đang được
quan tâm, đã thu được nhiều kết quả, đơn cử [1, 2, 3]. Tuy vậy, các luật học của mạng nơ
ron trong các công trình trên còn phụ thuộc vào mặt trượt S , trong khi đó tín hiệu điều
khiển trên mặt trượt luôn dao động với tần số cao, do đó ảnh hưởng rất lớn đến quá trình
hội tụ của thuật toán, thậm chí khi biên độ dao động của S lớn còn có thể gây mất ổn định
của hệ thống, nhất là đối với các hệ bám. Dưới đây, bài báo đề xuất một phương pháp tổng
hợp bộ điều khiển cho lớp đối tượng phi tuyến bất định trên cơ sở điều khiển trượt kết hợp
mạng nơ ron RBF để khắc phục nhược điểm trên.


2. TỔNG HỢP LUẬT ĐIỀU KHIỂN
Giả sử động học của đối tượng điều khiển được mô tả bằng hệ phương trình:

 xi  xi 1 , i  1, 2,  , n  1

 xn  f ( x)  bu , b  0
y  x1



trong đó, x  x1 , x2 ,, xn

T



(1)

là véc tơ trạng thái; u là đầu vào, y là đầu ra và chúng

đều có giá trị thực, f ( x) là hàm phi tuyến trơn bất định của mô hình, b là tham số động
học của đối tượng đã biết. Với đối tượng đối tượng phi tuyến bất định nêu trên, luật điều
khiển sau đây sẽ được thiết lập dưới dạng:

u  usmc  u fb

(2)

với usmc là thành phần điều khiển được xây dựng trên cơ sở lý thuyết điều khiển trượt và


u fb là thành phần điều khiển phản hồi trạng thái:

88

Ngô Trí Nam Cường, “Một phương pháp tổng hợp bộ điều khiển … và mạng nơ ron RBF.”


Nghiên cứu khoa học công nghệ

u fb   K x b

(3)

có K   k1 , k2 , , kn  với các hệ số k1 , k2 , , kn của một đa thức Hurwitz:

P ( p )  p n  kn p n1    k2 p  k1 .

(4)

Tiếp đến, thay luật (2) cùng chú ý (3),(4) vào hệ (1), được:

 xi  xi 1

 xn  k1 x1  k2 x2    kn xn  busmc  f ( x)

(5)

y  x1.
Bởi vậy nếu đặt:
1 ... 0 

 0
0
 0 
 



  
   


A
, B    , F ( x)  
 0
0
 0 
0  1 


 


b 
 f ( x) 
  k1 k2   kn 
thì công thức (5) ở trên viết lại được thành:

 x  Ax  Busmc  F ( x)

 y  C x, C  1,0,  ,0.


(6)

Cấu trúc hệ thống điều khiển được thể hiện ở hình vẽ dưới đây, trong đó, ĐT là đối
tượng điều khiển; SMC là bộ điều khiển trượt; M là mô hình; K là ma trận phản hồi; ND là
khối nhận dạng.

Hình 1. Sơ đồ cấu trúc rút gọn của hệ thống điều khiển kết hợp SMC và mạng RBF.
2.1. Tổng hợp luật cập nhật trọng số mạng nơ ron
Vấn đề đặt ra tiếp theo là xác định cấu trúc thuật toán của khối ND. Để bộ ND thực
hiện chức năng nhận dạng véc tơ hàm phi tuyến bất định F ( x) trên cơ sở mạng nơ ron
RBF. Kết quả nhận dạng này sẽ được ta ký hiệu bởi Fˆ ( x) với:
Fˆ ( x)  [0,  ,0, fˆ ( x)]T .

Giả sử đã có Fˆ ( x) . Thay kết Fˆ ( x) vào mô hình (6), khi đó do giữa F ( x) và Fˆ ( x) có
sai số nên tương ứng ta sẽ không thu được x mà chỉ là x m có một sai lệch kéo theo so với
x , tức là lúc này hệ (6) trở thành:

Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san FEE, 08 - 2018

89


Kỹ thuật Điều khiển – Tự động hóa

x m  Ax m  Busmc  Fˆ ( x)
m

(7)


m T

trong đó, x m  [ x1 ,  , xn ] . Nhiệm vụ chỉnh định mạng nơ ron là phải làm cho sai
lệch trạng thái E  x  x m giữa (6) và (7) tiến về 0. Sai lệch này được biểu diễn bởi:

E  x  x m  AE  F ( x)

(8)

với:

F ( x)  F ( x)  Fˆ ( x)  [0,  ,0, f ( x)  fˆ ( x)]T  [0,  ,0, f ( x)]T
trong đó, f ( x)  f ( x)  fˆ ( x) là sai số nhận dạng. Vì f ( x) được giả thiết là hàm trơn,
nên trong một miền compact và thông qua bộ cơ sở thích hợp, cùng các các trọng số lý
tưởng w *i , nó luôn biểu diễn được bằng một mạng nơ ron RBF:
m

f ( x)   wi*  i ( x )

(9)

i 1

có x là tổ hợp các đầu vào của nơ ron thứ i .
Chọn các hàm cơ sở:



i ( x )  exp x  ci


2



2 i2 .

(10)

Trong đó: ci là véc tơ có chiều bằng chiều của véc tơ x ,  i là độ trải rộng của hàm
cơ sở thứ i , i =1,2… m .
Khi đó, việc nhận dạng hàm bất định f ( x) với bộ hàm cơ sở này là tương đương với
việc hiệu chỉnh trọng số wˆ i của:
m

fˆ ( x)   wˆ i  i ( x )

(11)

i 1

sao cho có được fˆ ( x)  f ( x) , tức là f ( x)  0 , hay hệ (8) là ổn định. Ký hiệu:

w i  wi*  wˆ i

(12)

rồi sử dụng ứng hàm Lyapunov sau có ma trận đối xứng xác định dương P nào đó:
m

V  E T PE   w i2 ,


(13)

i 1

ta sẽ có:
m

V  E T PE  E T PE  2 w i w i .

(14)

i 1

Tiếp theo, thay (8) vào (14) sẽ được:
m

V  E T ( AT P  PA) E  2 E T PF ( x)  2 w i w i

(15)

i 1

và cùng với (9),(11),(12) có:
m

m

i 1


i 1

V  E T ( AT P  PA) E  2 E T P[0,.  ,0,  w i  i ( x )]T  2 w i w i .

90

(16)

Ngô Trí Nam Cường, “Một phương pháp tổng hợp bộ điều khiển … và mạng nơ ron RBF.”


Nghiên cứu khoa học công nghệ

Bởi vậy để có được V  0 là điều kiện hiệu chỉnh trọng số mạng nơ ron, ta cần có từ
công thức (16) hai điều kiện sau:

E T ( AT P  PA) E  0

(17)


m

m

i 1

i 1

2 E T P[0,  ,0,  w i  i ( x )]T  2 w i w i  0 .


(18)

Xét điều kiện thứ nhất (17). Do A là Hurwitz nên phương trình Lyapunov:

AT P  PA  Q
với mọi ma trận đối xứng xác định dương cho trước Q luôn có nghiệm P cũng đối xứng
xác định dương. Sử dụng ma trận P này cho hàm Lyapunov (13) ta sẽ có từ (17):
 E T QE  0 .

(19)

Tiếp theo, từ điều kiện thứ hai (18) ta có:

w i   E T Pni ( x )
*

trong đó Pn là vector cột thứ n của P . Cuối cùng, do wi  const nên cùng với (12) ta
có luật cập nhật trọng số wˆ i cho mạng nơ ron như sau:

wˆ i  E T Pni ( x ) .

(20)

2.2. Tổng hợp bộ điều khiển trượt
Sau đây ta sẽ xây dụng luật điều khiển usmc của khối SMC. Trước tiên ta ký hiệu
vector sai lệch giữa véc tơ trạng thái mong muốn x d  ( yd , y d ,  , yd

( n 1) T


) và véc tơ

trạng thái x của hệ (6) là:

e  xd  x .

(21)

Khi đó với mặt trượt:

s  Se

(22)

có S   s1 ,  , sn  được chọn để từ s  0 suy ra được e  0 , cũng như khi sử dụng ứng
2
hàm Lyapunov V  s 2 , thì để có s  0 rõ ràng ta phải có V  ss  0 . Hiển nhiên ta
sẽ có được điều kiện đủ này nếu có:

s   sgn( s ) ,
với   0 tùy chọn. Như vậy, sau khi đạo hàm hai vế (22) thì cùng với (23) ta được:
s  Se  S ( x d  x )   sgn( s ) .

(23)
(24)

Cuối cùng, thay (6) vào (24) có:

S  x d  Ax  Busmc  F ( x)    sgn( s ) ,


(25)

1
  SAx  SF ( x)  S x d   sgn(s)  .
SB

(26)

hay:
usmc 

Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san FEE, 08 - 2018

91


Kỹ thuật Điều khiển – Tự động hóa

2.3. Kết hợp bộ điều khiển trượt và mạng nơ ron
Bộ điều khiển trượt (26) có chứa thành phần bất định hàm f ( x) nên không sử dụng
được trực tiếp. Khi thay nó bằng kết quả nhận dạng (11) theo luật cập nhật (20) từ mạng
nơ ron thì cùng với (2) ta sẽ có bộ điều khiển kết hợp (2) gồm (26) có thêm cơ cấu nhận
dạng và (3) cho hệ (1) như sau:

u

m
1 
T
 1

  SAx  S [0,  ,0,  wˆ i  i ( x )]  S x d   sgn( s )   K x . (27)
i 1
SB 
 b

Định lý: Bộ điều khiển (27) với luật cập nhật (20) sẽ đưa được đầu ra y của hệ phi tuyến
bất định hàm (1) bám tiệm cận theo được tín hiệu mẫu yd khả vi n lần.
Chứng minh:
Ta thấy ngay rằng bộ điều khiển (27) đã cho chính là:

u

1
1
 SAx  SFˆ ( x)  S x d   sgn( s )  K x .
SB
b





(28)

Tiếp theo, do (26) là bộ điều khiển trượt cho hệ (6) ứng với mọi hàm bất định F ( x)
trơn nên nó cũng đúng khi F ( x) trong (6) được thay bởi Fˆ ( x) . Lúc này (26) sẽ trở thành:

1
 SAx  SFˆ ( x)  S x d   sgn( s )
SB

và tất nhiên bộ điều khiển usmc đó sẽ làm cho đầu ra ym  C x m của hệ rõ (7), là hệ
tương ứng với (6), bám tiệm cận theo được tín hiệu mẫu yd khả vi n lần. Suy ra, khi
được kết hợp thêm thành phần u fb cho trong công thức (3) thì nó trở thành bộ điều khiển



usmc 



(28) ở trên và bộ điều khiển này cũng sẽ làm đầu ra ym của hệ rõ tương ứng với hệ bất
định (1) ban đầu, được hiểu là hệ:

 xim  xim1 , i  1, 2,  , n  1
 m ˆ
 xn  f ( x)  bu

(29)

ym  x1m
bám tiệm cận theo được yd , hay ym  yd .
Cuối cùng, do cơ cấu nhận dạng bằng mạng nơ ron với luật cập nhật (20) luôn làm cho
sai lệch E  x  x m tiến tiệm cận về gốc nên nó cũng sẽ làm cho sai số đầu ra y và ym
giữa hai hệ (1) và (29) tiến về 0, tức là có y  ym . Kết hợp với kết luận trên ta đên được

y  ym  yd và đó là đ.p.c.m.
3. KẾT QUẢ MÔ PHỎNG
Xét đối tượng có mô hình:

 x1  x2


4
 x2  2( x1  1) x2  ( x1  tanh( x1 ))  3u

(30)

y  x1.
92

Ngô Trí Nam Cường, “Một phương pháp tổng hợp bộ điều khiển … và mạng nơ ron RBF.”


Nghiên cứu khoa học công nghệ

trong đó, f ( x)  2( x14  1) x2  ( x1  tanh( x1 )) được xem như hàm bất định của đối tượng.
Sử dụng bộ điều khiển (27) cùng với luật cập nhật (20) có các tham số cụ thể là:

k1  0.0002, k2  0.03, s1  2, s2  1,   0.1
ta sẽ thu đươc kết quả mô phỏng bằng phần mềm Matlab-Simulink như thể hiện ở hình 2
và 3, trong đó hình 2 là đồ thị hàm f ( x) cùng kết quả nhận dạng fˆ ( x ) của nó bằng
mạng nơ ron RBF với luật cập nhật trọng số cho ở công thức (20), còn hình 3 là quỹ đạo
đặt yd và tín hiệu đầu ra y của hệ khi sử dụng bộ điều khiển kết hợp (27).
Hình 2 cho thấy kết quả nhận dạng fˆ ( x) cho hàm phi tuyến f ( x) hoàn toàn đúng
như yêu cầu, tức là sai số nhận dạng đã tiệm cận về 0. Kết quả mô phỏng ở hình 3 khẳng
định chất lượng điều khiển đã được đảm bảo, tức là đáp ứng của hệ thống y đã bám chặt
theo được tín hiệu đặt mong muốn yd . Như vậy, những kết quả mô phỏng này đã lần nữa
minh chứng bằng thực nghiệm tính hiệu quả của thuật toán điều khiển đề xuất.

Hình 2. Kết quả nhận dạng.


Hình 3. Đáp ứng của hệ thống.
4. KẾT LUẬN

Với công cụ của lý thuyết điều khiển trượt và mạng nơ ron RBF bài báo đã tổng hợp
được hệ thống điều khiển cho đối tượng có phương trình động học (1). Xây dựng được
thuật toán nhận dạng cho hàm phi tuyến bất định f ( x) trên cơ sở sử dụng công cụ mạnh
của mạng nơ ron nhân tạo. Luật nhận dạng đơn giản, hiệu quả, dễ thực hiện trong kỹ thuật.
Đặc biệt, phương pháp nhận dạng bài báo đề xuất có ứu điểm quá trình hiệu chỉnh luật
nhận dạng chỉ diễn ra khi f ( x) thay đổi, nghĩa là khi có sai lệch E giữa đối tượng và mô
hình mà không phụ thuộc vào yếu tố nào khác; luật cập nhật trọng số mạng nơ ron khắc
phục được một số nhược điểm hiện có ở [1, 2, 3]. Đã thiết lập được luật điều khiển trượt
đảm bảo hệ thống kín hoạt động trong chế độ trượt trên mặt trượt s  0 . Kết quả mô
phỏng thể hiện tính đúng đắn của phương pháp.
TÀI LIỆU THAM KHẢO
[1].T. Zhang, S. S. Ge, and C. C. Hang, “Stable Adaptive Control for a Class of Nonlinear
Systems Using a Modified Lyapunov Function,” IEEE Transactions on automatic
control, Vol. 45, No. 1, January 2000,pp 129-131.
[2]. L. X. Wang, “A Course in Fuzzy Systems and Fuzzy Control”, Englewood Cliffs, NJ,
USA: Prentice-Hall, 1997.
[3]. Mou Chen, Shuzhi Sam Ge,” Direct Adaptive Neural Control for a Class of Uncertain
Nonaffine Nonlinear Systems Based on Disturbance Observer”, IEEE Transactuons
on cyberynetics, vol. 43, no. 4, august, pp.1213 -1225.

Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san FEE, 08 - 2018

93


Kỹ thuật Điều khiển – Tự động hóa


[4]. Ngô Trí Nam Cường ,” Một phương pháp nhận dạng và bù trừ các thành phần bất
định cho một lớp đối tượng phi tuyến,” Tạp chí Nghiên cứu khoa học và công nghệ
Quân sự, số 50, tháng 08 năm 2017, trang 53-61.
[5].Utkin, Vadim, “Sliding Modes in Control and Optimization,” Springer – Verlag
Berlin, Heidelberg 1992.
[6]. James M. Ortega ,“Matrix Theory,” Plenum Press 1987.
ABSTRACT
A METHOD OF SYNTHESIZING ADAPTIVE CONTROLLER FOR A CLASS OF
UNCERTAIN NONLINEAR PLANTS BASED ON THE THEORY OF SLIDING
MODE CONTROL AND NEURAL RBF NETWORK
The paper proposes a method for the systhesis of adaptive control system for
a class of uncertain nonlinear plants based on the theory of sliding mode control
and neural RBF network to reduce the vibration in the sliding surface. Weights of
the neural network are updated to adapt to an optimal standard. The simulation
result has once again verified by experiment the effectiveness of proposed weight
updating and control law rules in assuring the tracking desirable input signals of
the system.
Keywords: Sliding mode control; RBF neural network; Uncertain nonlinear systems.

Nhận bài ngày 01 tháng 7 năm 2018
Hoàn thiện ngày 10 tháng 9 năm 2018
Chấp nhận đăng ngày 20 tháng 9 năm 2018

Địa chỉ: Công ty CP Systemtec, Phòng 2207 nhà CT1-B2 khu đô thị Xa La, phường Phúc La, Hà
Đông, Hà Nội;
*
Email:

94


Ngô Trí Nam Cường, “Một phương pháp tổng hợp bộ điều khiển … và mạng nơ ron RBF.”



×