Tải bản đầy đủ (.pdf) (35 trang)

Nghiên cứu phát triển giải thuật tối ưu cấu trúc mạng nơ ron ứng dụng trong điểu khiển hệ phi tuyến tt

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.23 MB, 35 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO

BỘ GIAO THÔNG VẬN TẢI

TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI TP.HCM

PHẠM THANH TÙNG

NGHIÊN CỨU PHÁT TRIỂN GIẢI THUẬT TỐI ƯU
CẤU TRÚC MẠNG NƠ-RON ỨNG DỤNG TRONG
ĐIỀU KHIỂN HỆ PHI TUYẾN

Chuyên ngành: Kỹ thuật điều khiển và tự động hóa
Mã số: 9520216

TÓM TẮT LUẬN ÁN TIẾN SĨ KỸ THUẬT

TP.HCM – 2019


Công trình được hoàn thành tại Trường Đại học Giao Thông Vận
Tải Thành Phố Hồ Chí Minh

Người hướng dẫn khoa học 1: PGS.TS. Đồng Văn Hướng
Người hướng dẫn khoa học 2: PGS.TS. Nguyễn Chí Ngôn

Phản biện độc lập 1: PGS.TS. Hoàng Đức Tuấn
Phản biện độc lập 2: TS. Hoàng Minh Trí

Phản biện 1:
Phản biện 2:


Phản biện 3:

Luận án sẽ được bảo vệ trước Hội đồng chấm luận án họp
tại…………………………………………………………..……….…
………………………………………………………………………...
Vào lúc ……. giờ ……. ngày ……. tháng ……. năm …….

Có thể tìm hiểu luận án tại thư viện
- Thư viện Quốc gia Việt Nam
- Thư viện Trường Đại học Giao Thông Vận Tải TP. HCM


1
CHƯƠNG 1: GIỚI THIỆU
1.1. Đặt vấn đề
Bộ điều khiển trượt là một trong các phương pháp điều khiển hiệu quả
hệ phi tuyến với ưu điểm là tính ổn định bền vững ngay cả khi hệ thống
nhiễu hoặc thông số của mô hình thay đổi theo thời gian [6, 21] và đáp
ứng nhanh [44]. Tuy nhiên, tín hiệu điều khiển trượt tồn tại hiện tượng
dao động với tần số cao (chatterring) của quỹ đạo pha quanh mặt trượt
[56, 98]. Để nâng cao chất lượng điều khiển, các nghiên cứu [3, 34, 58,
61] đã đề xuất một bộ điều khiển trượt thích nghi; [51] trượt thích nghi
dùng mạng nơ-ron; [100] trượt cuốn chiếu; [17] trượt cuốn chiếu thích
nghi; [56, 107] trượt cuốn chiếu tích phân thích nghi. Kết quả mô phỏng
cho thấy rằng các phương pháp đề xuất loại bỏ được hiện tượng chattering,
tính bền vững được cải thiện, ít sai số và độ hội tụ nhanh hơn.
Trong các phương pháp trên, mạng nơ-ron nổi lên như bộ điều khiển
thích nghi, góp phần nâng cao chất lượng điều khiển của bộ điều khiển
trượt. Khó khăn trong huấn luyện mạng nơ-ron là lựa chọn phù hợp số nơron lớp ẩn, tâm, ngưỡng và trọng số kết nối [60, 67, 104, 109]. Ngoài ra,
giải thuật huấn luyện mạng nơ-ron cũng cần được quan tâm để tăng cường

hiệu suất của mạng, trong đó giải thuật Gradient Descent [10, 24, 29, 51]
thường được sử dụng. Tuy nhiên, giải thuật này còn hạn chế như: tốc độ
hội tụ chậm, dễ rơi vào cực tiểu địa phương và khả năng tìm kiếm toàn
cục kém hiệu quả [22, 37].
Nghiên cứu đề xuất sử dụng giải thuật di truyền để tối ưu cấu trúc của
mạng nơ-ron. Sau khi tối ưu, mạng nơ-ron được huấn luyện trực tuyến
bằng giải thuật Quasi-Newton dựa trên các tín hiệu hồi tiếp ở ngõ ra. Mạng
này đóng vai trò như một bộ điều khiển thích nghi trong luật điều khiển
trượt thích nghi. Bộ điều khiển đề xuất được ứng dụng để điều kiển hệ phi
tuyến. Kết quả mô phỏng được thực hiện trên MATLAB/SIMULINK.


2
1.2. Giới hạn của luận án
Luận án tập trung nghiên cứu hệ thống phi tuyến MIMO - robot di
động đa hướng và phát triển giải thuật tối ưu cấu trúc của mạng nơ-ron –
mạng RBF (Radial Basic Function) để điều khiển bám quỹ đạo đối tượng
nhằm nâng cao chất lượng điều khiển.
1.3. Mục tiêu của luận án
1.3.1. Mục tiêu tổng quát
Tối ưu cấu trúc của mạng nơ-ron RBF để điều khiển bám quỹ đạo đối
tượng phi tuyến - robot di động đa hướng, nhằm nâng cao chất lượng điều
khiển hệ thống.
1.3.2. Mục tiêu cụ thể
- Thiết kế bộ điều khiển trượt để điều khiển đối tượng phi tuyến bám
theo quỹ đạo cho trước.
- Xây dựng giải thuật huấn luyện trực tuyến mạng nơ-ron để xấp xỉ các
hàm phi tuyến trong luật điều khiển trượt.
- Mô phỏng bộ điều khiển trượt thích nghi với mạng nơ-ron cho đối
tượng phi tuyến nhằm nâng cao chất lượng điều khiển của hệ thống.

- Đánh giá và lựa chọn cấu trúc mạng nơ-ron thích hợp trong điều
khiển hệ phi tuyến.
- Nghiên cứu giải thuật di truyền để tối ưu cấu trúc mạng nơ-ron.
- Mô phỏng bộ điều khiển trượt thích nghi với mạng nơ-ron được tối
ưu bằng giải thuật di truyền để điều khiển hệ phi tuyến.
- Kiểm chứng giải thuật đề xuất trong điều khiển bám quỹ đạo robot
di động đa hướng ở trạng thái danh định; khi có sự hiện diện của nhiễu và
sự thay đổi các thông số của đối tượng.


3
1.4. Phương pháp nghiên cứu, cách tiếp cận
- Nghiên cứu tài liệu: thu thập; phân tích, tổng hợp tài liệu, xác định
ưu điểm làm cơ sở khoa học cho luận án, đồng thời tiến hành cải tiến
những tồn tại trong các tài liệu đó.
- Thực nghiệm mô hình toán học hệ phi tuyến (robot di động đa hướng)
trên MATLAB/SIMULINK.
- Xử lý thông tin: quan sát đáp ứng của hệ thống và điều chỉnh các
thông số của bộ điều khiển (nếu có) sao cho đáp ứng thỏa mãn các chỉ tiêu
chất lượng điều khiển.
1.5. Đối tượng và phạm vi nghiên cứu
- Đối tượng nghiên cứu: hệ thống phi tuyến MIMO được mô tả toán
học bằng mô hình trạng thái phi tuyến.
- Phạm vi nghiên cứu: Tập trung nghiên cứu phương pháp mô tả toán
học cho hệ thống phi tuyến MIMO (robot di động đa hướng), điều khiển
thích nghi, mạng nơ-ron nhân tạo và giải thuật di truyền.
1.6. Ý nghĩa khoa học và thực tiễn
1.6.1. Ý nghĩa khoa học
Nghiên cứu đề xuất thuật toán tối ưu cấu trúc mạng nơ-ron nhân tạo
điều khiển hệ thống phi tuyến bám theo quỹ đạo cho trước, sai số bám tiến

về không và ít bị ảnh hưởng của nhiễu.
1.6.2. Ý nghĩa thực tiễn
Kiểm chứng được khả năng ứng dụng thực tế của giải thuật tối ưu cấu
trúc mạng nơ-ron nhân tạo điều khiển hệ thống phi tuyến được đề xuất
bằng các công cụ mềm.


4
1.7. Những đóng góp của luận án về mặt khoa học
1.7.1. Về mặt lý thuyết
- Xây dựng được giải thuật xấp xỉ trực tuyến ma trận phi tuyến sử dụng
giải thuật Quasi-Newton dựa vào các tín hiệu hồi tiếp từ ngõ ra của hệ
thống.
- Xây dựng được giải thuật tối ưu trực tuyến cấu trúc mạng nơ-ron ứng
dụng giải thuật di truyền.
1.7.2. Về mặt thực tiễn
- Mô phỏng được bộ điều khiển trượt thích nghi với mạng nơ-ron để
điều khiển hệ thống phi tuyến sử dụng giải thuật Quasi-Newton đạt các
chỉ tiêu chất lượng tốt.
- Cải thiện chất lượng điều khiển của bộ điều khiển trượt với giải thuật
Quasi-Newton so với giải thuật Gradient Descent truyền thống.
- Ứng dụng kết quả tối ưu cấu trúc mạng nơ-ron dùng giải thuât di
truyền điều khiển hệ thống phi tuyến đạt các chỉ tiêu chất lượng vượt trội
hơn so với cấu trúc mạng nơ-ron được khởi tạo ngẫu nhiên.
1.8. Bố cục của luận án
Chương 1 là giới thiệu; Chương 2 trình bày điều khiển trượt thích nghi
hệ phi tuyến với mạng nơ-ron; đánh giá hiệu quả giải thuật Quasi-Newton
trong điều khiển bám quỹ đạo hệ phi tuyến là Chương 3. Chương 4 trình
bày phương pháp tối ưu cấu trúc mạng nơ-ron sử dụng giải thuật di truyền
và Chương 5 là kết quả, kết luận và kiến nghị



5
CHƯƠNG 2: ĐIỀU KHIỂN TRƯỢT THÍCH NGHI HỆ PHI
TUYẾN VỚI MẠNG NƠ-RON
2.1. Giới thiệu
Chương này trình bày phương pháp thiết kế bộ điều khiển trượt thích
nghi sử dụng mạng nơ-ron (RBF: Radial Basic Function) để điều khiển
bám quỹ đạo hệ phi tuyến MIMO (robot di động đa hướng). Bộ điều khiển
trượt được thiết kế để đảm bảo quỹ đạo thực tế của robot bám theo quỹ
đạo cho trước. Mạng RBF đóng vai trò như một bộ điều khiển thích nghi
được huấn luyện trực tuyến bằng giải thuật Gradient Descent. Kết quả mô
phỏng được so sánh với luật điều khiển trượt truyền thống thông qua các
chỉ tiêu chất lượng đạt được của hệ.
2.2. Mục tiêu
- Xây dựng cấu trúc hệ thống điều khiển đối tượng phi tuyến sử dụng
bộ điều khiển trượt thích nghi.
- Thiết kế bộ điều khiển trượt đối tượng phi tuyến
- Sử dụng mạng nơ-ron hàm cơ sở xuyên tâm để ước lượng trực tuyến
hàm phi tuyến trong luật điều khiển trượt ứng dụng điều khiển hệ phi
tuyến.
- Giải thuật điều khiển nghiên cứu được áp dụng điều khiển bám quỹ
đạo robot di động đa hướng.
2.3. Mô hình hóa đối tượng phi tuyến (robot di động đa hướng)
Robot di động đa hướng đã được biết đến để thực hiện bởi sự phát
triển của bánh xe đặc biệt [47] hoặc cơ chế di chuyển [47, 82]. Giả sử rằng
hệ tọa độ tuyệt đối Ow − X wYw được cố định trên mặt phẳng và hệ tọa độ
chuyển động Om − X mYm được cố định trên tâm của trọng lực cho robot di
chuyển như Hình 2.1.



6

Hình 2.1: Mô hình của robot di chuyển đa hướng [47]
Phương trình động lực học robot như (2.1):
−a2d 0   xw   b1 1
 xw   a1
 y  = a 
a1
0   yw  + b1 3
 w  2 d
w   0
0
a3  w   b2
= AW β + BW U + D f

b1 2
b1 4
b2

2b1 cos    u1   D fx 


2b1 sin   u2  +  D fy 
b2   u3   D f  

(2.1)
Với D f =  D fx

D fy


T

D f   là nhiễu hệ thống chưa biết.

Trong đó:

 a1

AW =  a2
 0


−a2
a1
0

0
 b1 1

0  ; BW = b1 3

 b2
a3 

U = u1 u2

a2 = 1 − a2 =

b1 2

b1 4
b2

2b1 cos  
2b1 sin   ;
b2 

u3 

T

3I w
;  1 = − 3 sin  − cos  ;  2 = 3 sin  − cos 
(3I w + 2Mr 2 )

 3 = 3 cos  − sin  ;  4 = − 3 cos  − sin 
2.4. Thiết kế luật điều khiển trượt robot di động đa hướng
2.4.1. Thiết kế luật điều khiển trượt cho robot
Bộ điều khiển trượt được trình bày nhằm đảm bảo quỹ đạo thực tế của
robot bám theo quỹ đạo cho trước.


7
Luật điều khiển trượt được định nghĩa như (2.2) [108]:



(




)

U = − BW −1 AW  +  d + ke +  sign ( S )
−1
W

(2.2)

* Chứng minh ma trận khả nghịch B
Ta có:
b1 − 3 sin  − cos 

BW =  b1 3 cos  − sin 

b2


(
(

) b ( 3 sin  − cos )
) b ( − 3 cos  − sin  )
1

1

b2

2b1 cos  


2b1 sin   (2.3)
b2 


Suy ra: det ( BW ) = 6 3b12b2  0
kr
krL
Với: b1 =
; b2 =
2
(3I w + 2Mr )
(3I w + I v r 2 )

(2.4)

Chứa các thông số của robot như: bán kính của mỗi bánh xe (r); mômen quán tính của robot (Iv); khối lượng của robot (M); mô-men quán tính
của bánh xe (Iw) và khoảng cách từ mỗi bánh xe đến tâm robot (L).
−1
Điều đó chứng tỏ ma trận BW khả nghịch và cho thấy ma trận BW tồn

tại. Như vậy, tồn tại luật điều khiển (2.2) cho robot.

Hình 2.2. Cấu trúc bộ điều khiển trượt cho robot
Để chứng minh tính ổn định của luật điều khiển ta cần chứng minh mặt
trượt hội tụ về 0 theo Lyapunov. Hàm Lyapunov được định nghĩa như
(2.5):


8

V=

1 T
S S 0
2

(2.5)

Lấy đạo hàm của V ta có :
V = S T − AW  −  sign ( S )

(

(

)

)

= − S T  +  sign ( S )  0
2.4.2. Thông số và kết quả mô phỏng bộ điều khiển trượt
Mô phỏng bộ điều khiển trượt để điều khiển robot di động đa hướng
nhằm đảm bảo các nội dung sau:
- Lựa chọn mặt trượt thích hợp để sai số động học của hệ thống hội tụ
về 0.
- Bộ điều khiển trượt được xác định để đảm bảo quỹ đạo trạng thái
không chỉ hội tụ đến mặt trượt trong thời gian hữu hạn mà còn duy trì trên
mặt trượt ngay cả khi các thông số của hệ thống có sự thay đổi.
- Sự ổn định của bộ điều khiển trượt khi quỹ đạo thực tế của robot lệch
khỏi quỹ đạo tham khảo do tác động của các điều kiện thực tế hoặc do

thay đổi các thông số của đối tượng.
Bảng 2.1. Các thông số của robot di động đa hướng [47]


Ý nghĩa

Giá trị

Đơn vị

11.25

kgm 2

9.4

kg

0.178

m

hiệu
Iv

Mô-men quán tính của robot

M

Khối lượng của robot


L

Khoảng cách từ mỗi bánh xe đến
tâm robot

k

Hệ số truyền động

0.448

c

Hệ số ma sát nhớt

0.1889

I

Mô-men quán tính của bánh xe

0.02108

kgm2 / s
kgm 2

r

Bán kính mỗi bánh xe


0.0245

m


9
Bảng 2.2. Các tham số của bộ điều khiển trượt
Ý nghĩa
Ký hiệu
Giá trị
 20 0 0 
 x 0 0 
 0 20 0 




 0 y 0 
 0 0 20 
 0 0  


Thông
số trượt
 25 0 0 
kx 0 0 
 0 25 0 





 0 ky 0 
 0 0 58
 0 0 k 


➢ Trường hợp 1: ngõ vào hàm nấc đơn vị

Hình 2.3. Đáp ứng giữa

Hình 2.4. Sai số của xw , yw ,w và

xw , yw ,w và xd , yd ,d với hàm

xd , yd ,d với hàm nấc đơn vị

nấc đơn vị
Bảng 2.3. Các chỉ tiêu chất lượng với hàm nấc đơn vị
Đáp

Các chỉ tiêu chất lượng

ứng

POT (%)

exl (mm)

tqđ (s)


xw

0.20

0.22

0.45

yw

0.22

0.024

0.45

w

0.15

0.15

1.0


10

➢ Trường hợp 2: hàm nấc đơn vị khi khối lượng tăng 25% và 50%


Hình 2.5. Đáp ứng của xw khi khối

Hình 2.6. Đáp ứng của yw khi

lượng tăng 25% và 50%.

khối lượng tăng 25% và 50%.

➢ Trường hợp 3: ngõ vào là hàm nấc đơn vị khi nhiễu tác động ở ngõ ra

Hình 2.7. Đáp ứng của xw, yw và

Hình 2.8. Sai số của xw, yw và w

khi có nhiễu tác động ở ngõ ra
w khi có nhiễu tác động ở ngõ ra
Tổng hợp các kết quả mô phỏng với luật điều khiển trượt ở trên ta thấy
rằng bộ SMC đã điều khiển tốt robot bám theo quỹ đạo tham chiếu. Tuy
nhiên, đáp ứng của bộ SMC vẫn chưa cho kết quả tối ưu với các chỉ tiêu
chất lượng đạt được. Vì thế, để nâng cao chất lượng điều khiển của bộ
SMC, nghiên cứu đề xuất sử dụng mạng nơ-ron hàm cơ sở xuyên tâm
(RBF: Radial Basic Function) để ước lượng hàm phi tuyến trong luật điều
khiển SMC. Mạng nơ-ron RBF sẽ được huấn luyện trực tuyến bằng giải


11
thuật Gradient Descent và đóng vai trò như bộ điều khiển thích nghi với
các tín hiệu hồi tiếp từ ngõ ra của robot.
2.5. Thiết kế luật điều khiển trượt thích nghi với mạng nơ-ron cho
robot

2.5.1. Điều khiển trượt thích nghi sử dụng mạng nơ-ron RBF
Trong phần này, nghiên cứu sử dụng giải thuật Gradient Descent để
xấp xỉ trực tuyến ma trận AW trong luật điều khiển trượt (2.2). Đây là ma
trận chứa các thông số đặc trưng của robot như: bán kính của mỗi bánh xe
(r); mô-men quán tính của robot (Iv) và khối lượng của robot (M).
Thuật toán của mạng nơ-ron RBF như (2.6) [41]:
 X −c 2 
i
ij

hij = exp  −
2


2bij

 i =1,3; j =1,5

(2.6)

Cấu trúc mạng RBF được sử dụng để xấp xỉ thành phần fi trong ma trận
AW như Hình 2.9:

Hình 2.9: Cấu trúc mạng nơ-ron RBF xấp xỉ thành phần fi
Trong đó:
 X1   e (1) e (1)  d (1)  d (1)  d (1) 


X i =  X 2  = e ( 2 ) e ( 2 )  d ( 2 )  d ( 2 )  d ( 2 ) 
 X 3   e ( 3) e ( 3)  d ( 3)  d ( 3)  d ( 3) 


(2.7)


12
hij

wij

=  hi1

hi 2

hi 3

hi 4

=  wi1

wi 2

wi 3

wi 4

i =1,2,3

i =1,2,3

hi 5 


(2.8)

wi 5 

(2.9)

Ngõ ra fi như (2.10): fi = wijT hij

(2.10)

Kết quả xấp xỉ trực tuyến ma trận AW sử dụng mạng nơ-ron RBF dựa
trên giải thuật Gradient Descent như (2.11):
 w1jT h1j − w2jT d h2j
0 
 T

T
ˆ
AW =  w2j h2j
w1j h1j
0 
 0
0
w3jT h3j 


(2.11)

Luật điều khiển trượt thích nghi dùng mạng nơ-ron RBF với giải thuật

Gradient Descent (GD-ASMC-RBF) như (2.12):
U = − B −1 Aˆ  + (  + ke ) +  sign ( S )
W



W



d

(2.12)

Khi quỹ đạo thực tế của robot lệch khỏi quỹ đạo tham khảo do tác động
của các điều kiện thực tế như ma sát mặt đường, mô-men quán tính thay
đổi, …. thì sai số thay đổi. Khi đó, mạng RBF sẽ được tự động cập nhật
bằng giải thuật Gradient Descent, dẫn đến Aˆ cũng thay đổi theo sao cho
W

sai số đạt giá trị tối thiểu. Ta nói luật điều khiển (2.12) thích nghi theo
điều kiện hoạt động của robot.
Để chứng minh tính ổn định của luật điều khiển ta cần chứng minh mặt
trượt hội tụ về 0 theo Lyapunov. Hàm Lyapunov được định nghĩa như
(2.13):
V=

1 T
S S 0
2


(2.13)

Lấy đạo hàm của V ta có :
V = S T − AˆW  −  sign ( S ) = S T − −  sign ( S )

(

)

(

(

)

)

= − S T  +  sign ( S )  0

2.5.2. Thông số và kết quả mô phỏng
Mô phỏng bộ điều khiển đề xuất nhằm đảm bảo các nội dung sau:


13
- Bộ điều khiển trượt được xác định để đảm bảo quỹ đạo trạng thái
không chỉ hội tụ đến mặt trượt trong thời gian hữu hạn mà còn duy trì trên
mặt trượt ngay cả khi các thông số của hệ thống có sự thay đổi.
- Hiệu quả của phương pháp Gradient Descent trong xấp xỉ trực tuyến
ma trận phi tuyến của luật điều khiển trượt.

- Sự ổn định của bộ điều khiển trượt thích nghi khi quỹ đạo thực tế của
robot lệch khỏi quỹ đạo tham khảo do tác động của các điều kiện thực tế
hoặc do thay đổi các thông số của đối tượng.
Thông số của mạng nơ-ron RBF được huấn luyện trực tuyến sử dụng
giải thuật Gradient Descent (GD-ASMC-RBF) được trình bày trong Bảng
2.4:
Bảng 2.4. Các tham số trong mạng nơ-ron RBF
Ký hiệu

cij

bj
 w1j 
 
 w 2j 
 w 3j 
 

i
j

Ý nghĩa

Véc-tơ trung tâm
của mạng RBF

Ngưỡng kích hoạt

Véc-tơ trọng số
khởi tạo ban đầu


Số mạng RBF
Số nơ-ron lớp ẩn
của mỗi mạng

 −1
 −1

 −1

 −1
 −1

1

Giá trị
−0.5 0
−0.5 0
−0.5 0
−0.5 0
−0.5 0

0.5
0.5
0.5
0.5
0.5

1
1

1

1
1

1 1 1 1

T

0.4588 
 −0.1347 0.7094
 0.2546 0.2970 0.9450 


 0.9174 0.7919 −0.0617 


 0.8973 0.2517 −0.5407 
 0.6460 −0.0970 0.4458 

3
5

T


14
➢ Trường hợp 1: ngõ vào hàm nấc đơn vị

Hình 2.10. Đáp ứng của GD-


Hình 2.11. Sai số của GD-

ASMC-RBF và SMC với hàm

ASMC-RBF và SMC với hàm

nấc đơn vị

nấc đơn vị

Bảng 2.5. Các chỉ tiêu chất lượng của GD-ASMC-RBF với hàm nấc đơn
vị
Các chỉ tiêu chất lượng

Đáp
ứng

POT (%)

exl (mm)

tqđ (s)

xw

0.15

0


0.3

yw

0.62

0.55

0.3

w

0.80

0

0.4

Bảng 2.6. Các hiệu suất sai số giữa GD-ASMC-RBF và SMC
Đáp

SMC

GD-ASMC-RBF

ứng

ADD

MSE


RMSE

ADD

MSE

RMSE

xw

1.4×10-4

3.9×10-8

2.0×10-4

4.9×10-5

4.9×10-9

7.0×10-5

yw

1.1×10-4

2.5×10-8

1.6×10-4


8.6×10-5

1.5×10-8

1.2×10-4

w

2.3×10-5

1.1×10-9

3.3×10-5

4.2×10-5

3.6×10-9

6.0×10-5


15

➢ Trường hợp 2: ngõ vào hàm nấc đơn vị khi nhiễu tác đông ở ngõ ra

Hình 2.12. Đáp ứng của GD-

Hình 2.13. Sai số của GD-


ASMC-RBF và SMC với hàm

ASMC-RBF và SMC với

nấc đơn vị khi nhiễu tác động

hàm nấc đơn vị khi nhiễu tác

ở ngõ ra

động ở ngõ ra

Kết quả mô phỏng của bộ điều khiển GD-ASMC-RBF cho robot di
động đa hướng có kết quả bám tốt, sai số xác lập hội tụ về 0 ngay cả khi
có nhiễu tác động vào hệ thống. Đây là ưu điểm nổi bật của bộ điều khiển
trượt cũng như giải thuật Gradient Descent trong việc xấp xỉ trực tuyến
ma trận Aw trong luật điều khiển trượt. Điều đó thể hiện tính khả thi của
bộ điều khiển GD-ASMC-RBF trong điều khiển hệ phi tuyến.


16
CHƯƠNG 3: ĐÁNH GIÁ HIỆU QUẢ GIẢI THUẬT QUASINEWTON TRONG ĐIỀU KHIỂN BÁM QUỸ ĐẠO HỆ THỐNG
PHI TUYẾN
3.1. Đặt vấn đề
Chương 2, tác giả đã sử dụng mạng nơ-ron RBF để ước lượng các hàm
phi tuyến trong luật điều khiển trượt được tính toán dựa trên lý thuyết ổn
định Lyapunov của bộ điều khiển trượt thích nghi dựa trên mạng nơ-ron
RBF. Kết quả mô phỏng với MATLAB/SIMULINK cho thấy rằng giải
thuật đề xuất có hiệu quả, đáp ứng của robot bám theo quỹ đạo cho trước
với sai số trạng thái tiến về 0, thời gian lên khoảng 0.3±0.001(s). Tuy

nhiên, giải thuật Gradient Descent còn hạn chế như: tốc độ hội tụ chậm,
dễ rơi vào cực tiểu địa phương và khả năng tìm kiếm toàn cục kém hiệu
quả [22, 37]. Trong Chương 3 này, nghiên cứu đề xuất sử dụng giải thuật
Quasi-Newton để huấn luyện trực tuyến mạng nơ-ron RBF, đồng thời
nghiên cứu cũng tiến hành khảo sát sự ảnh hưởng của các thông số của
mạng nơ-ron (số nơ-ron lớp ẩn) đến chất lượng điều khiển của bộ điều
khiển trượt thích nghi.
3.2. Mục tiêu
- Huấn luyện trực tuyến mạng nơ-ron RBF sử dụng giải thuật QuasiNewton với các thông số ban đầu được khởi tạo ngẫu nhiên.
- Giải thuật điều khiển nghiên cứu được áp dụng điều khiển bám quỹ
đạo robot di động đa hướng.
- Khảo sát sự ảnh hưởng của số nơ-ron lớp ẩn đến chất lượng điều
khiển của bộ điều khiển trượt thích nghi với mạng nơ-ron RBF.
3.3. Đánh giá hiệu quả giải thuật Quasi-Newton trong điều khiển bám
quỹ đạo hệ thống phi tuyến
3.3.1. Giải thuật huấn luyện Quasi-Newton
Giải thuật Quasi-Newton bao gồm 4 bước với k lần lặp


17
Bước 1 : Khởi tạo hướng tìm kiếm theo (3.1)

d k = − H k−1 gk .

(3.1)

Bước 2 : Tìm kiếm theo hướng dk nhằm tìm độ dài bước  k .
f ( wk +  k d k ) = min ( f ( wk +  k d k ) ) .
 0


E ( wk +  k d k )  E ( wk ) +  k gkT d k
g ( wk +  k d k )  − gkT d k
T

(3.2)

Quá trình cập nhật trọng số được trình bày như (3.3)
wk +1 = wk +  k d k

Bước 3 : Quá trình cập nhật ma trận Hessian như (3.4)
g g T H   T H
H k +1 = H k + k T k − k T k k k
gk  k
 k H k k

(3.3)

(3.4)

Bước 4 : Kiểm tra sự hội tụ bằng một số tiêu chuẩn. Thông thường,
tiêu chuẩn này được xác định như một hướng của hàm mục tiêu phải đảm
bảo nhỏ hơn một giá trị cho trước để dừng quá trình lặp như (3.5)
gkT gk   .

(3.5)

Quá trình lặp bắt đầu khi k = 0 , quá trình khởi tạo trọng số là ngẫu
nhiên, ma trận Hessian H 0 là ma trận đối xứng và là một ma trận xác định
dương có giá trị khởi tạo H 0 = I .
3.3.2. Huấn luyện trực tuyến mạng nơ-ron RBF bằng giải thuật QuasiNewton ứng dụng trong điều khiển trượt thích nghi robot di động đa

hướng
Trong phần này, nghiên cứu sử dụng giải thuật Quasi-Newton để xấp
xỉ AW trong luật điều khiển trượt (2.2) thay cho giải thuật Gradient
Descent.
Thuật toán của mạng nơ-ron RBF như (2.6).
Cấu trúc mạng RBF được sử dụng để xấp xỉ thành phần fi trong ma trận
AW như Hình 2.9 ở Chương 2:
Trong đó thành phần Xi và hij như (2.7) và (2.8).


18


t ij

i =1,2,3

= ti1 ti 2

ti 3

ti 4

ti 5 

(3.6)

Ngõ ra fi như (3.7): fi = tijT hij

(3.7)


Kết quả xấp xỉ ma trận AW sử dụng mạng nơ-ron RBF dựa trên giải
thuật Quasi-Newton như (3.8):
 t1jT h1j

AˆW =  t 2jT h2j
 0


−t 2jT d h2j
t1jT h1j
0

0 

0 
t3jT h3j 

(3.8)

Luật điều khiển trượt thích nghi dùng mạng nơ-ron RBF được huấn
luyện trực tuyến bằng giải thuật Quasi-Newton (QN-ASMC-RBF) như
(3.9):



(

)




U = − BW −1 AˆW  +  d + ke +  sign ( S )

(3.9)

Kết quả huấn luyện trực tuyến mạng nơ-ron RBF với giải thuật QuasiNewton (BSGS) được trình bày như Hình 3.1 với MSE (Mean Square
Error) nhỏ hơn giải thuật Gradient Descent. Điều này có ý nghĩa lớn trong
việc cải thiện đáp ứng của bộ điều khiển, đặc biệt trong kỹ thuật huấn
luyện trực tuyến bộ điều khiển.

Hình 3.1. So sánh MSE của Quasi-Newton (BSGS) và Gradient Descent


19
Sơ đồ mô phỏng bộ điều khiển QN-ASMC-RBF trong MATLAB
/SIMULINK điều khiển robot di động đa hướng với các số liệu mô phỏng
của robot vẫn sử dụng như ở Chương 2.
➢ Trường hợp 1: ngõ vào hàm nấc đơn vị

Hình 3.2. Đáp ứng xw, yw và w

Hình 3.3. Sai số xw, yw và w của

của bộ QN-ASMC-RBF với

bộ QN-ASMC-RBF với hàm

hàm nấc đơn vị


nấc đơn vị

Bảng 3.1. Chỉ tiêu chất lượng của bộ điều khiển QN-ASMC-RBF với
hàm nấc đơn vị
Đáp

QN-ASMC-RBF

ứng

POT (%)

exl (mm)

tqđ (s)

xw

0

1.5

0.2

yw

0.19

0


0.2

w

0.05

0

0.18

Bảng 3.2. Các hiệu suất sai số giữa GD-ASMC-RBF và QN-ASMC-RBF
Đáp

QN-ASMC-RBF

GD-ASMC-RBF

ứng

ADD

MSE

RMSE

ADD

MSE

RMSE


xw

9.8×10-4

1.9×10-6

0.0014

2.2×10-4

9.4×10-8

3.0×10-4

yw

7.1×10-4

1.0×10-6

1.0×10-3

2.6×10-4

1.5×10-7

3.7×10-4

w


2.0×10-5

8.3×10-10

2.9×10-5

9.2×10-5

1.6×10-8

1.3×10-4


20
➢ Trường hợp 2: ngõ vào hàm nấc đơn vị khi có nhiễu tác động ở ngõ ra

Hình 3.4. Đáp ứng xw, yw và

Hình 3.5. Sai số xw, yw và w

w của bộ điều khiển QN-

của bộ điều khiển QN-

ASMC-RBF với hàm nấc

ASMC-RBF với hàm nấc

đơn vị khi có nhiễu tác động


đơn vị khi có nhiễu tác động

ở ngõ ra

ở ngõ ra

Ưu điểm của bộ điều khiển này là tốc độ hội tụ của phương pháp BFGS
nhanh hơn phương pháp Gradient Descent; các chỉ tiêu chất lượng của bộ
điều khiển trượt thích nghi với mạng nơ-ron được huấn luyện trực tuyến
bằng giải thuật Quasi-Newton với BFGS nhỏ hơn giải thuật Gradient
Descent trong cùng cấu trúc mạng; luật điều khiển thích nghi theo điều
kiện hoạt động của robot. Tuy nhiên, các thông số của mạng nơ-ron như:
số nơ-ron lớp ẩn, ngưỡng và trọng số khởi tạo được lựa chọn ngẫu nhiên.
Vấn đề này sẽ được giải quyết ở Chương 4 để đảm bảo cấu trúc mạng là
tối ưu.
3.3.3. Khảo sát sự ảnh hưởng của các thông số của mạng nơ-ron RBF
đến chất lượng điều khiển của bộ điều khiển trượt thích nghi
Tác giả tiến hành khảo sát sự ảnh hưởng của cấu trúc mạng nơ-ron (số
nơ-ron lớp ẩn) đến chất lượng điều khiển của bộ điều khiển trượt thích
nghi. Quá trình khảo sát với sự thay đổi của số nơ-ron lớp ẩn lần lượt là
1, 3, 5, 7, 9, 11, 13, 15, 17 và 19. Kết quả cập nhật trọng số và các hiệu
suất khác nhau của giải thuật được trình bày trong Bảng 3.4 và 3.5.


21
CHƯƠNG 4: TỐI ƯU CẤU TRÚC MẠNG NƠ-RON SỬ DỤNG
GIẢI THUẬT DI TRUYỀN
4.1. Giới thiệu
Trong Chương 4 này, nghiên cứu thực hiện tối ưu cấu trúc và thông số

của mạng RBF bằng giải thuật di truyền. Đầu tiên, giải thuật di truyền
được sử dụng để xác định số nơ-ron lớp ẩn của mạng RBF; sau đó sử dụng
kết quả này để tìm các giá trị tốt nhất của tâm, ngưỡng và trọng số khởi
tạo ban đầu. Sau khi xác định được cấu trúc và các thông số, mạng nơ-ron
RBF được hiệu chỉnh trực tuyến bằng thuật toán Quasi-Newton trong điều
khiển trượt thích nghi để điều khiển bám quỹ đạo robot di động đa hướng.
4.2. Hiệu chỉnh cấu trúc và thông số mạng sử dụng giải thuật di truyền
Sơ đồ tổng thể hiệu chỉnh cấu trúc và thông số mạng sử dụng giải thuật
di truyền được thể hiện như Hình 4.1:

Hình 4.1: Sơ đồ điều khiển GA-ASMC-RBF
Các tham số để xây dựng giải thuật GA hoàn chỉnh được thể hiện
trong Bảng 4.1.
➢ Sử dụng các sai số huấn luyện và số nơ-ron trên lớp ẩn để xác
định hàm mục tiêu tương ứng. Giả sử sai số huấn luyện là E; số lượng nơron lớp ẩn là s và giới hạn trên của số nơ-ron lớp ẩn là smax. Như vậy:
- Điều kiện ràng buộc:


22

{

𝑠 ≤ 𝑠𝑚𝑎𝑥
𝐸 ≤ 25 × 10−6 (𝑚2 )

(4.1)

- Hàm mục tiêu F của GA được định nghĩa như (4.7) [90, 104]:
s
(4.2)

F =C−E
( m)
smax
Trong đó, C (m2) là hằng số được chọn thông qua thực nghiệm, smax
là số nơ-ron lớp ẩn tối đa, ở đây ta chọn smax = 50.
➢ Trong mỗi thế hệ của GA, chúng ta sử dụng công thức (4.3) để
làm hàm mục tiêu cho giải thuật Quasi-Newton để cập nhật bộ thông số
của mạng nơ-ron [75, 104].
1
(4.3)
E = ( d −  w )2
2
Trong đó: E là sai số bình phương trung bình (mục tiêu huấn luyện

là E ≤ 25×10-6 (m2)), βd là ngõ vào mong muốn, βw là ngõ ra của đối tượng.
Bảng 4.1. Các tham số của thuật toán GA
Tối ưu cấu trúc

Tối ưu bộ thông

mạng RBF

số mạng RBF

Số thế hệ

15

15


Kích thước quần thể

20

30

Tần suất lai ghép

0.7

0.7

Xác suất đột biến

0.01 – 0.001

0.01 – 0.001

Roulette

Roulette
1
E = ( d −  w )2
2

Tham số

Chọn lọc
Hàm mục tiêu


F =C−E

s
smax

Kết quả tối ưu mạng nơ-ron RBF sử dụng GA được trình bày ở Hình
4.2 và 4.3.


23

Hình 4.2. Biểu đồ thể hiện giá trị

Hình 4.3. Biểu đồ thể hiện giá trị

của hàm mục tiêu có mức độ thích

của hàm mục tiêu có mức độ

nghi tốt nhất trong quá trình tối

thích nghi tốt nhất trong quá

ưu cấu trúc mạng RBF.

trình tối ưu thông số mạng RBF.

Số nơ-ron lớp ẩn và các thông số của mạng nơ-ron RBF sau khi được
tối ưu bằng giải thuật di truyền được trình bày trong Bảng 4.2.
Bảng 4.2. Kết quả tối ưu cấu trúc và tham số mạng RBF sử dụng GA



Giá trị

hiệu
b
cij

T1
T2
T3

j

 12.41
 −4.39

 −1.65

 6.25
13.58

10.6022
−0.47 −1.73 −12.08 9.89
1.76 −11.01
1.19 −13.67 −2.88
9.83 10.35 −13.91
12.30
7.07
−9.59

3.02 −3.92 −12.82 

5.15 −2.06 −2.69 −10.11 −2.20 3.98 
4.00 −0.88 −3.90 −1.98 4.42 −1.46 

 4.81 0.77 −1.24 0.90 −1.78 1.58 −2.41
−3.92 0.87 −1.86 −1.48 −2.24 −2.00 −2.45
3.57 −2.82 2.38 −1.16 −4.50 4.18 1.77
7


×