Tải bản đầy đủ (.pdf) (122 trang)

Xây dựng phương pháp tổng hợp hệ điều khiển thích nghi bền vững cho một lớp đối tượng phi tuyến bất định

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.43 MB, 122 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO

BỘ QUỐC PHÒNG

VIỆN KHOA HỌC VÀ CƠNG NGHỆ QN SỰ

NGƠ TRÍ NAM CƯỜNG

XÂY DỰNG PHƯƠNG PHÁP TỔNG HỢP HỆ
ĐIỀU KHIỂN THÍCH NGHI BỀN VỮNG CHO
MỘT LỚP ĐỐI TƯỢNG PHI TUYẾN BẤT ĐỊNH

LUẬN ÁN TIẾN SĨ KỸ THUẬT

HÀ NỘI - 2021


BỘ GIÁO DỤC VÀ ĐÀO TẠO

BỘ QUỐC PHÒNG

VIỆN KHOA HỌC VÀ CƠNG NGHỆ QN SỰ

NGƠ TRÍ NAM CƯỜNG

XÂY DỰNG PHƯƠNG PHÁP TỔNG HỢP HỆ
ĐIỀU KHIỂN THÍCH NGHI BỀN VỮNG CHO
MỘT LỚP ĐỐI TƯỢNG PHI TUYẾN BẤT ĐỊNH
Chuyên ngành: Kỹ thuật điều khiển và tự động hóa
Mã số: 9 52 02 16


LUẬN ÁN TIẾN SĨ KỸ THUẬT

NGƯỜI HƯỚNG DẪN KHOA HỌC
GS.TSKH CAO TIẾN HUỲNH

HÀ NỘI - 2021


i

LỜI CAM ĐOAN
Tôi xin cam đoan luận án này là cơng trình nghiên cứu của riêng tơi. Các kết
quả nghiên cứu trong luận án là trung thực và chưa được cơng bố trong bất kỳ
cơng trình nào khác. Các dữ liệu tham khảo được trích dẫn đầy đủ.
Tác giả Luận án

NGƠ TRÍ NAM CƯỜNG


ii

LỜI CẢM ƠN
Tác giả xin được bày tỏ lòng biết ơn sâu sắc tới thầy giáo hướng dẫn khoa
học GS.TSKH Cao Tiến Huỳnh, đã ln quan tâm, giúp đỡ, đóng góp ý kiến
quý báu và tạo mọi điều kiện để tác giả thực hiện và hoàn thành luận án.
Tác giả chân thành cảm ơn Viện Khoa học và Công nghệ quân sự, Viện tự
động hóa kỹ thuật quân sự, tập thể phịng Đào tạo sau đại học đã ln quan tâm
và giúp đỡ tác giả trong quá trình học tập và nghiên cứu.
Tác giả chân thành cảm ơn các nhà giáo, các nhà khoa học và đồng nghiệp đã
đóng góp ý kiến trong quá trình thực hiện luận án.

Tác giả Luận án


iii

MỤC LỤC
Trang
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ CÁI VIẾT TẮT .................

v

DANH MỤC CÁC HÌNH VẼ ................................................................

vi

MỞ ĐẦU ................................................................................................

1

CHƯƠNG 1. TỔNG QUAN VỀ ĐIỀU KHIỂN HỆ PHI TUYẾN
BẤT ĐỊNH ............................................................................................

4

1.1. Giới thiệu hệ phi tuyến bất định ......................................................

4

1.2. Phương pháp Backstepping trong tổng hợp hệ phi tuyến bất định ..


5

1.3. Điều khiển thích nghi bền vững hệ phi tuyến bất định bằng phương
pháp bù các thành phần bất định ............................................................

7

1.4. Điều khiển thích nghi bền vững hệ phi tuyến bất định trên cơ sở điều
khiển trượt ..............................................................................................

15

1.5. Kết luận chương 1 ...........................................................................

23

CHƯƠNG 2. XÂY DỰNG PHƯƠNG PHÁP TỔNG HỢP HỆ ĐIỀU
KHIỂN CHO ĐỐI TƯỢNG PHI TUYẾN BẤT ĐỊNH DƯỚI TÁC
ĐỘNG CỦA NHIỄU ............................................................................

24

2.1. Tổng hợp hệ thống điều khiển thích nghi bền vững cho lớp hệ phi
bất định tham số hằng ........................................................................

25

2.1.1. Xây dựng cấu trúc mạch phản hồi trạng thái đảm bảo phần tuyến
tính tham số hằng ổn định .......................................................................


27

2.1.2. Xây dựng phương pháp nhận dạng và bù các thành phần bất
định.....................................................................................................

30

2.1.3. Xây dựng luật điều khiển trượt .....................................................

36

2.2. Tổng hợp hệ thống điều khiển thích nghi bền vững cho lớp hệ phi
tuyến bất định MIMO..........................................................................

41


iv

2.2.1. Xây dựng luật nhận dạng tham số của phần động học tuyến tính 43
và các thành phần bất định .....................................................................
2.2.2. Xây dựng thuật toán điều khiển cấu trúc biến đổi hoạt động trong
chế độ trượt .............................................................................................

49

2.3. Tổng hợp hệ thống điều khiển thích nghi bền vững cho hai lớp hệ
phi tuyến trơn bất định khơng mơ hình hóa được dưới dạng cơng thức
tốn học tường minh............................................................................


54

2.3.1. Tổng hợp bộ điều khiển thích nghi bền vững cho lớp phi tuyến
trơn bất định phân tách được tín hiệu đầu vào .......................................

55

2.3.1.1. Tổng hợp luật nhận dạng các thành phần bất định ....................

56

2.3.1.2. Tổng hợp luật điều khiển trượt ..................................................

63

2.3.2. Tổng hợp bộ điều khiển thích nghi bền vững cho lớp phi tuyến
trơn bất định khơng phân tách được tín hiệu đầu vào ............................

65

2.3.2.1. Xây dựng thuật toán nhận dạng .................................................

66

2.3.2.2. Xây dựng luật điều khiển trượt .................................................

71

2.4. Kết luận chương 2 ...........................................................................


78

CHƯƠNG 3. ÁP DỤNG THUẬT TỐN ĐIỀU KHIỂN THÍCH
NGHI BỀN VỮNG CHO HỆ LÁI TỰ ĐỘNG TÀU THỦY ............
3.1. Mô hình tốn học tàu thủy dạng phương trình vi phân phi tuyến ...

80
80

3.2. Tổng hợp hệ điều khiển thích nghi bền vững hệ lái tự động tàu
thủy.....................................................................................................

81

3.3. Mô phỏng và kiểm chứng kết quả ....................................................

87

3.4. Kết luận chương 3 ...........................................................................

91

KẾT LUẬN ...........................................................................................

92

DANH MỤC CÁC CƠNG TRÌNH KHOA HỌC ĐÃ CƠNG BỐ .......

94


TÀI LIỆU THAM KHẢO ......................................................................

95

PHỤ LỤC ...............................................................................................

107


v

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ CÁI VIẾT TẮT
A∈ 𝑅𝑛×𝑛 , B ∈ 𝑅𝑛×𝑚

Ký hiệu ma trận tham số động học

𝐷(t)

Véc tơ nhiễu ngồi khơng đo được

̂ (t)
𝐷

Đánh giá véc tơ nhiễu ngoài 𝐷(t)

𝐹(𝑋, 𝑈)

Véc tơ hàm phi tuyến bất định

𝐹̂ (𝑋, 𝑈)


Đánh giá véc tơ hàm phi tuyến bất định F(X,U)

𝐺(X)

Véc tơ hàm phi tuyến bất định

𝐺̂ (X)

Đánh giá véc tơ hàm phi tuyến bất định 𝐺(X)

S

Mặt trượt

X = [𝑥1 , 𝑥2 … , 𝑥𝑛 ]𝑇

Véc tơ trạng thái của đối tượng

𝑋𝑚 = [𝑥1𝑚 , 𝑥2𝑚 … 𝑥𝑛𝑚 ]𝑇

Véc tơ trạng thái mơ hình

X d  [ x1d , x2d ,...xnd ]T

Véc tơ đặt mong muốn

𝑦

Tín hiệu đầu ra hệ thống


𝑦𝑑

Tín hiệu đặt mong muốn

U =[𝑢1 , 𝑢2 … , 𝑢𝑛 ]𝑇

Véc tơ đầu vào

∅𝑖𝑗

Ký hiệu hàm cơ sở của mạng nơ ron RBF

𝜓

Góc hành trình của tàu [độ]

𝛿

Góc bánh lái của tàu [độ]

SISO

Hệ một vào một ra

MIMO

Hệ nhiều đầu vào ra

LQR


Luật điều khiển LQR

PID

Luật điều khiển PID

SMC

Bộ điều khiển mode trượt

VSC

Bộ điều khiển cấu trúc biến đổi

RBF

Mạng nơ ron nhân tạo RBF

LTĐTT

Hệ lái tự động tàu thủy


vi

DANH MỤC CÁC HÌNH VẼ
Trang
Hình 1.1. Sơ đồ cấu trúc hệ điều khiển thích nghi bằng phương pháp
Backstepping/ mạng nơ ron ....................................................................


6

Hình 1.2. Sơ đồ cấu trúc rút gọn hệ thống điều khiển Thích nghi/PID .

10

Hình 1.3. Sơ đồ cấu trúc rút gọn nhận dạng mơ hình bằng mạng nơ ron
với mơ hình song song [68-69],[71],[86].............................................

11

Hình 1.4. Sơ đồ cấu trúc hệ thống điều khiển PID / với có cấu nhận
dạng thích nghi sử dụng mạng nơ ron RBF..........................................

13

Hình 1.5. Sơ đồ cấu trúc rút gọn hệ thống điều khiển SMC/nơ ron RBF

19

Hình 2.1. Sơ đồ cấu trúc hệ thống điều khiển thích nghi bền vững trên
cơ sở kết hợp SMC/với cơ cấu nhận dạng phi tuyến và nhiễu ...............

26

Hình 2.1a. Cấu trúc mạng nơ ron xấp xỉ hàm phi tuyến f ( X , u) ..........

32


Hình 2.2. Trạng thái x1 , xm1 của đối tượng và mơ hình ...........................

39

Hình 2.3. Trạng thái x2 , xm 2 của đối tượng và mơ hình .........................

39

Hình 2.4. Kết quả nhận dạng hàm phi tuyến và nhiễu ngồi bất định ...

39

Hình 2.5. Sai số nhận dạng .....................................................................

40

Hình 2.6. Đáp ứng hệ thống với tín hiệu đặt đầu vào yd  1(t ) .............

40

Hình 2.7. Đáp ứng hệ thống với tín hiệu đặt đầu vào yd  sin(0.2t  2)

40

Hình 2.8. Sơ đồ hệ thống điều khiển kết hợp mạng nơ ron RBF và hệ có
cấu trúc biến đổi hoạt động trong chế độ trượt ......................................

42

Hình 2.8a. Sơ đồ mạng nơ ron RBF xấp xỉ véc tơ hàm phi tuyến


F  X ,U  .................................................................................................

44

Hình 2.9. Các trạng thái của đối tượng x1 , xm1 và sai số nhận dạng e1

53

Hình 2.10. Các trạng thái của đối tượng x2 , xm 2 và sai số nhận dạng e2

53

Hình 2.11. Đáp ứng của hệ thống tín hiệu đặt mong muốn xd 1  1.51(t )

53

Hình 2.12. Đáp ứng của hệ thống tín hiệu đặt mong muốn xd 2  1(t ) ...

53


vii

Hình 2.13. Đáp ứng của hệ thống với véc tơ tín hiệu đặt mong muốn

X d  [xd1 xd 2 ]T  [1.51(t ) 1(t )]T .............................................................

54


Hình 2.14. Sơ đồ cấu trúc hệ thống điều khiển thích nghi bền vững cho
lớp hệ phi tuyến bất định phân tích được tín hiệu đầu vào ....................

55

Hình 2.15. Sơ đồ cấu trúc hệ thống điều khiển thích nghi bền vững cho
lớp hệ phi tuyến bất định phân tích được tín hiệu đầu vào ....................

65

Hình 2.16. Kết quả nhận dạng f1 ( X , u ) ................................................

73

Hình 2.17 Sai số nhận dạng f1 ( X , u ) ...................................................

73

Hình 2.18. Kết quả nhận dạng f 2 ( X , u ) ................................................

73

Hình 2.19. Sai số nhận dạng f 2 ( X , u ) ..................................................

74

Hình 2.20. Kết quả nhận dạng G( X ) ...................................................

74


Hình 2.21. Sai số nhận dạng G( X ) .......................................................

74

Hình 2.22. Đáp ứng đầu ra của hệ thống khi tín hiệu đặt hàm 1 t  .......

74

Hình 2.23. Đáp ứng đầu ra của hệ thống khi tín hiệu đặt hàm bậc thang

74

Hình 2.24. Trạng thái x1 , xm1 của đối tượng và mơ hình nhận dạng .......

75

Hình 2.25. Sai số e1  x1  xm1 giữa đối tượng và mơ hình nhận dạng ..

76

Hình 2.26. Trạng thái x2 , xm 2 của đối tượng và mơ hình nhận dạng .....

76

Hình 2.27. Sai số e2  x2  xm 2 giữa đối tượng và mơ hình nhận dạng .

76

Hình 2.28. Đáp ứng của hệ thống khi tín hiệu đặt yd  1(t ) ..................


76

Hình 2.29. Đáp ứng của hệ thống khi tín hiệu đặt yd  sin(0.1t  1) .....

76

Hình 3.1. Sơ đồ cấu trúc rút gọn hệ thống điều khiển thích nghi bền vững
cho hệ điều khiển lái tự động tàu thủy ...................................................

81

Hình 3.2. Kết quả nhận dạng hàm phi tuyến và nhiễu ngồi bất định ...

88

Hình 3.3. Sai số nhận dạng các thành phần bất định ..............................

88

Hình 3.4. Trạng thái x1 của hệ thống .....................................................

88

Hình 3.5.Trạng thái x2 của hệ thống ......................................................

88


viii
Hình 3.6. Trạng thái x3 của hệ thống .....................................................


88

0
Hình 3.7. Đáp ứng quĩ đạo của tàu thủy với quĩ đạo đặt yd  30 ........

88

0
Hình 3.8. Đáp ứng quĩ đạo của tàu thủy với quĩ đạo đặt yd  30

89

.....

Hình 3.9. Đáp ứng quĩ đạo của tàu thủy với quĩ đạo đặt yd  30sin(0.006t  1)0

89

Hình 3.10. Đáp ứng quĩ đạo của tàu thủy với bộ điều khiển thích nghi
0
bền vững luận án đề xuất với quĩ đạo đặt yd  30

89

Hình 3.11. Thành phần phi tuyến và nhiễu ngồi có biên độ Dm  0.22 89
Hình 3.13. Đáp ứng quĩ đạo của tàu thủy với bộ điều khiển bền vững
0
khi quĩ đạo đặt yd  30


............................................................................................

90

Hình 3.14. Đáp ứng quĩ đạo của tàu thủy với bộ điều khiển thích nghi
0
bền vững luận án đề xuất với quĩ đạo đặt yd  30 .........................................

90

Hình 3.15. Thành phần phi tuyến và nhiễu ngồi có biên độ Dm  0.22

90

Hình 3.16. Đáp ứng quĩ đạo của tàu thủy với bộ điều khiển bền vững
0
khi quĩ đạo đặt yd  30 .............................................................................................

90


1

MỞ ĐẦU
1. Tính cấp thiết của đề tài luận án
Trong các lĩnh vực công nghiệp, giao thông vận tải, năng lượng và các lĩnh
vực khác thường gặp các đối tượng phi tuyến bất định và chịu tác động của
nhiễu từ bên ngoài. Điều khiển các đối tượng dạng này gặp rất nhiều khó khăn,
nhất là đối với trường hợp đối tượng điều khiển phi tuyến bất định hàm F ( X ,U )
và có nhiễu tác động từ bên ngồi khơng đo được, thì khó khăn đó càng tăng

lên gấp bội. Nhìn chung các đối tượng vừa nêu trên, với các bộ điều khiển
truyền thống như PI, PID, LQR,... không phát huy hiệu quả, thậm chí khơng
bảo đảm tính ổn định. Để đáp ứng yêu cầu khắt khe về công nghệ, sản phẩm có
chất lượng cao trong thực tiễn, địi hỏi phải có các phương pháp điều khiển hiện
đại đảm bảo độ chính xác cao và kháng nhiễu tốt ln là vấn đề bức thiết. Điều
khiển các lớp đối tượng này đang là vấn đề thời sự, cuốn hút sự quan tâm đặc
biệt của nhiều nhà khoa học trên thế giới nghiên cứu và đã thu được nhiều kết
quả tốt đẹp. Tuy vậy, vẫn còn tồn tại nhiều vấn đề chưa được giải quyết một
cách thỏa đáng, cần phải tiếp tục nghiên cứu. Đó chính là động lực thúc đẩy đề
tài nghiên cứu của luận án.
2. Mục tiêu nghiên cứu
- Mục tiêu thứ nhất nhắm tới việc nghiên cứu lý thuyết trên cơ sở công cụ
hiện đại, để tạo ra các phương pháp tổng hợp hệ thống điều khiển chất lượng
cao cho một lớp rất rộng các đối tượng phi tuyết bất định dưới tác động của
nhiễu bất định.
- Mục tiêu thứ hai nhắm tới việc áp dụng kết quả theo mục tiêu thứ nhất để
giải quyết một vấn đề bức thiết của thực tế, thơng qua đó làm nổi bật khả năng
áp dụng và hiệu quả của các phương pháp đề xuất.


2

3. Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu của luận án là hệ thống điều khiển thích nghi bền
vững cho đối tượng phi tuyến bất định có nhiễu tác động từ bên ngoài.
Phạm vi nghiên cứu: Các phương pháp nhận dạng hệ phi tuyến và nhiễu bất
định; tổng hợp hệ thống điều khiển cho các lớp hệ phi tuyến bất định.
4. Nội dung nghiên cứu
- Nghiên cứu phương pháp nhận dạng các lớp hệ phi tuyến và nhiễu ngoài
bất định.

- Nghiên cứu xây dựng các phương pháp tổng hợp hệ thống điều khiển cho
các lớp đối tượng phi tuyến bất định trên cơ sở lý thuyết điều khiển thích nghi,
điều khiển trượt và mạng nơ ron RBF.
- Nghiên cứu áp dụng thuật tốn điều khiển thích nghi, bền vững cho hệ
thống điều khiển lái tự động tàu thủy.
- Mô phỏng trên Matlab - Simulink để kiểm chứng các kết quả nghiên cứu.
5. Ý nghĩa khoa học và thực tiễn
Với nội dung nghiên cứu nêu trên, các kết quả đạt được của luận án có đóng
góp mới về mặt khoa học và thực tiễn. Các phương pháp nhận dạng và tổng
hợp hệ thống điều khiển được phát triển trên cơ sở lý thuyết hiện đại, như điều
khiển thích nghi, mạng nơ ron, điều khiển Sliding mode. Các kết quả nghiên
cứu được kiểm chứng bằng mô phỏng nhằm minh chứng tính đúng đắn và hiệu
quả của phương pháp đề xuất.
Các kết quả nghiên cứu của luận án vừa có giá trị về khoa học và thực tiễn,
có thể phục vụ vào việc thiết kế, chế tạo, nâng cấp hệ thống điều khiển cho
nhiều đối tượng phù hợp trong thực tiễn. Trong khuôn khổ luận án, áp dụng
một phần các kết quả nghiên cứu vào thực tế đó là tổng hợp hệ điều khiển thích
nghi bền vững cho hệ lái tự động tàu thủy.


3

6. Phương pháp nghiên cứu
Để hoàn thành được nội dung đề tài luận án và đạt được kết quả, luận án sử
dụng phương pháp phân tích, tổng hợp và vận dụng cơng cụ mạnh của lý thuyết
điều khiển thích nghi, Sliding mode, điều khiển phi tuyến bất định, mạng nơ
ron nhân tạo,... Để kiểm chứng kết quả của luận án, sử dụng công cụ mô phỏng
Matlab - Simulink.
7. Bố cục của luận án
Mở đầu: Nêu lên tính bức thiết của các vấn đề về tổng hợp hệ thống điều khiển

hệ phi tuyến bất định, từ đó đặt vấn đề nghiên cứu cho luận án.
Chương 1: Tổng quan về điều khiển hệ phi tuyến bất định
- Tổng quan các phương pháp chủ yếu để tổng hợp hệ thống điều khiển cho
các lớp phi tuyến bất định.
- Đề xuất hướng nghiên cứu của luận án
Chương 2: Xây dựng phương pháp pháp tổng hợp hệ điều khiển cho đối
tượng phi tuyến bất định dưới tác động của nhiễu
- Xây dựng các phương pháp nhận dạng cho các lớp đối tượng phi tuyến bất
định có nhiễu ngồi tác động khơng đo được, trên cơ sở lý thuyết điều khiển
thích nghi và mạng nơ ron RBF.
- Tổng hợp hệ thống điều khiển thích nghi bền vững cho các hệ phi tuyến bất
định có nhiễu ngồi khơng đo được trên có sở điều khiển trượt.
Chương 3: Áp dụng thuật tốn điều khiển thích nghi bền vững cho hệ lái
tự động tàu thủy
- Tổng hợp bộ điều khiển thích nghi bền vững cho hệ lái tự động tàu thủy.
- Mô phỏng trên Matlab - Simulink để kiểm chứng các kết quả thu được.
Kết luận


4

CHƯƠNG 1
TỔNG QUAN VỀ ĐIỀU KHIỂN HỆ PHI TUYẾN BẤT ĐỊNH
1.1. Giới thiệu hệ phi tuyến bất định
Trong thực tế thường gặp các lớp hệ phi tuyến không thể hoặc rất khó mơ
hình hóa trong q trình xây dựng phương trình vi phân và có nhiễu ngồi
khơng đo được. Việc thiết kế hệ thống điều khiển cho các đối tượng dạng này
đóng một vai trị quan trọng nhằm đáp ứng các yêu cầu của khoa học và thực
tiễn. Phân tích và tổng hợp hệ thống điều khiển phi tuyến bất định luôn là vấn
đề thời sự, thu hút sự quan tâm đặc biệt của các nhà khoa học trong lĩnh vực

điều khiển và tự động hóa. Trong thực tế, khơng tồn tại hệ tuyến tính lý tưởng
như sensor, cơ cấu chấp hành,... làm việc vượt quá giới hạn, các phần tử tuyến
tính có thể chuyển thành phi tuyến; hoặc động học của đối tượng điều khiển
được mô tả dưới dạng các phương trình vi phân phi tuyến bất định; hoặc các
đối tượng điều khiển có đặc tính phi tuyến khơng thể mơ hình hóa dưới dạng
cơng thức tốn học tường minh. Việc điều khiển những đối tượng dạng này gặp
rất nhiều khó khăn; đặc biệt tính phức tạp càng tăng lên gấp bội, khi đặc tính
phi tuyến được mơ tả dưới dạng hàm trơn bất định F ( X ,U ) và có nhiễu ngồi
khơng đo được.
Trong các thập kỷ qua, đã có nhiều cơng trình nghiên cứu tổng hợp hệ thống
điều khiển cho các đối tượng có đặc tính phi tuyến và nhiễu ngoài bất định nêu
trên, đã thu được nhiều kết quả tốt đẹp. Tuy vậy, vẫn còn nhiều vấn đề chưa
được giải quyết một cách thỏa đáng. Bởi vậy, vấn đề nghiên cứu xây dựng các
phương pháp tổng hợp các hệ điều khiển cho các đối tượng nêu trên vẫn tiếp
tục là yêu cầu bức thiết, cả về ý nghĩa khoa học và thực tiễn.


5

Trong khuôn khổ những vấn đề liên quan đến đề tài luận án, có thể nêu ra
các phương pháp chủ yếu để tổng hợp hệ thống điều khiển cho hê phi tuyến bất
định được trình bày sau đây.
1.2. Phương pháp Backstepping trong tổng hợp hệ phi tuyến bất định
Phương pháp Backstepping được quan tâm nghiên cứu và phát triển cho hệ
phi tuyến [110],[111]. Phương pháp Backstepping xuất hiện vào khoảng đầu
những năm 90, được đánh giá như một phương pháp thiết kế hệ điều khiển
nhiều triển vọng cho đối tượng phi tuyến. Phương pháp này là công cụ tổng
hợp hệ thống với mục đích tạo nên một hệ kín đảm bảo hệ thống ổn định tồn
cục, dựa trên cách tính tốn đệ qui, cho phép ta tính dần hàm điều khiển
Lyapunov. Tuy vậy, phương pháp này không áp dụng trực tiếp được cho các

hệ phi tuyến bất định mà phải kết hợp với một số công cụ khác. Phương pháp
tổng hợp bộ điều khiển trên cơ sở backstepping kết hợp bộ xấp xỉ logic mờ cho
các đối tượng phi tuyến bất định đang được quan tâm nghiên cứu
[14],[15],[16],[17],[18],[19]. Phương pháp xây dựng bộ quan sát trạng thái sử
dụng logic mờ cho hệ phi tuyến bất định từ đó ứng dụng Backstepping để thiết
kế bộ điều khiển phản hồi trạng thái đảm bảo hệ ổn định toàn cục [19],[20].
Phương pháp tổng hợp bộ điều khiển kết hợp giữa Backstepping và mạng nơ
ron được ứng dụng để giải nhiều bài toán phi tuyến bất định, bằng cách xác
định các ma trận phản hồi, trên cơ sở mạng nơ ron, trong đó luật học của các
trọng số được hiệu chỉnh thích nghi [21-25].
Giả sử động học của đối tượng được mô tả bằng hệ phương trình:
x1  f1 ( x1 )  g1 ( x1 ) x2
x2  f 2 ( x1 , x2 )  g 2 ( x1 , x2 ) x3
x3  f3 ( x1 , x2 , x3 )  g3 ( x1 , x2 , x3 ) x4
xm  f m ( x1 , x2 ,...xm )  g m ( x1 , x2 ...xm )u

trong đó fi ( x), gi ( x) là các hàm trơn.

(1.1)


6

Phương pháp thiết kế được mơ tả ở hình vẽ 1.1.
NN1

x1
x1
NN2


x2

x1
NN(m-1)

xm1

x1
NN(m)

Fˆ1
x1d

x2d

Fˆm1

Fˆ2
x3d

xmd

xm

Fˆm

u

X  F  x, u 


x1
x2
xm1
xm

Hình 1.1. Sơ đồ cấu trúc hệ điều khiển thích nghi bằng phương pháp
Backstepping/mạng nơ ron
Véc tơ sai lệch giữa tín hiệu đặt và đối tượng em  xm  xmd bằng phương
pháp truy hồi, luật điều khiển có dạng sau [21]:
u  Gm1 ( Fˆm  xmd  Kmem  GmT 1em1 ),

(1.2)

với K m là hệ số dương, Fˆm là véc tơ nhận dạng của véc tơ hàm bất định Fm
với fˆi  wˆ i i ( x), Gm đã biết.
Luật học của mạng nơ ron:
wˆ i  i i ( x)eiT  kwi [e1T , e2T ,...emT ]T wi ; i  1,2,..m; kw  const  0.
 i là phần tử của ma trận hằng số   diag (1 , 1 ,...m ) .
Nhận xét:

(1.3)

Tổng hợp hệ thống điều khiển sử dụng kỹ thuật Backstepping cho hệ phi
tuyến bất định trên cơ sở kết hợp với logic mờ là phương pháp hiện đại để xây
dựng các bộ điều khiển cho hệ phi tuyến bất định, ưu điểm lớn nhất của giải
pháp này là tổng hợp được bộ điều khiển đảm bảo ổn định toàn cục trên cơ sở
các bộ xấp xỉ vạn năng mờ, nhược điểm của bộ điều khiển logic mờ là phụ
thuộc vào tri thức chuyên gia nên việc ứng dụng vào vùng khơng có trí thức
chun gia gặp nhiều khó khăn. Phương pháp tổng hợp bộ điều khiển sử dụng
kỹ thuật Backstepping kết hợp với mạng nơ ron, có ưu điểm là cho phép thiết

kế bộ điều khiển phản hồi trạng thái đảm bảo hệ ổn định toàn cục.


7

Tuy vây, phương pháp Backstepping kết hợp với mạng nơ ron ở các cơng trình
trên, q trình tổng hợp hệ thống phụ thuộc vào kinh nghiệm của người thiết

kế, ví dụ ở (1.2) thời gian hội tụ thuật toán phụ thuộc vào hệ số chọn

Km .

Việc

chọn hệ số K m để đáp ứng nhiều chỉ tiêu chất lượng điều khiển thì hầu như
khơng thực hiện được mà chỉ dừng lại ở mức ổn định tồn cục. Cùng với đó,
với phương pháp nêu trên luật cập nhật trong số mạng nơ ron (1.3) phụ thuộc
vào nhiều biến trong đó có biến sai số hệ thống em  xm  xmd , điều này cũng
tương tự như các phương pháp [21-25], gây ra nhiều bất lợi. Đặc biệt đối với
các hệ thống bám khi đầu vào thay đổi nên luật cập nhật trọng số phải hiệu
chỉnh liên tục, việc cập nhật trọng số liên tục có thể dẫn đến hệ thống mất ổn
định khi có nhiễu ngồi lớn. Mặt khác, phương pháp Backstepping kết hợp với
logic mờ hoặc mạng nơ ron chưa nói rõ thời gian q trình q độ và chất lượng
điều khiển của hệ thống, nếu hệ thống cần đáp ứng trong khoảng một thời gian
và đảm bảo sai số cho trước thì phương pháp trên gặp rất nhiều khó khăn, nhiều
khi không thể thực hiện được về mặt kỹ thuật; hơn nữa các phương pháp nói
trên khơng áp dụng được cho các hệ có nhiễu từ bên ngồi.
1.3. Điều khiển thích nghi bền vững hệ phi tuyến bằng phương pháp bù
các thành phần bất định
Phương pháp điều khiển thích nghi bền vững cho hệ phi tuyến bất định bằng

giải pháp bù trừ, được quan tâm nghiên cứu trong nhiều thập kỷ qua.
Giả sử động học của đối tượng điều khiển được mơ tả bằng phương trình:

X  F ( X )  G( X )u  F ( X ) ,

(1.4)

trong đó: F  x  , G  x  đã biết; F ( X ) là đặc tính phi tuyến chưa biết.
Nhiệm vụ đặt ra là phải thiết kế hệ thống điều khiển phản hồi trạng thái. Gần
đây với cơng cụ hình học vi phân người ta đã đi đến phương pháp tổng quát
cho tất cả các hệ có cấu trúc X  F ( X )  G( X )u với F  X  và G  X  đã biết
[6]. Các đặc tính phi tuyến F ( X ) tồn tại trong hệ thống rất đa dạng như sensor,


8

cơ cấu chấp hành…, hoặc đặc tính phi tuyến là hàm phi tuyến bất định phụ
thuộc vào nhiều biến trạng thái v.v. Việc tồn tại đặc tính phi tuyến trong hệ
thống làm ảnh hưởng xấu đến chất lượng điều khiển, trong nhiều trường hợp
có thể gây mất ổn định. Như vậy, bài tốn cịn lại là tìm lời giải để hệ thống
bất biến với F ( X ) vẫn là vấn đề bức thiết. Một trong những phương pháp để
giải quyết vấn đề nêu trên, đó là phương pháp bù trừ ảnh hưởng của F ( X )
trên cơ sở lý thuyết điều khiển thích nghi.
Lý thuyết điều khiển thích nghi được đề xuất từ những năm 1950 [48],[49]
và được phát triển như vũ bão. Mục đích của phương pháp này nhằm tự động
chỉnh định các bộ điều chỉnh trong mạch vịng điều khiển để thực hiện hay duy
trì ở mức độ nhất định chất lượng của hệ khi các thơng số, đặc tính phi tuyến,
của đối tượng điều khiển và nhiễu ngoài...thay đổi. Hạn chế của phương pháp
là khá phức tạp khó thực hiện trong kỹ thuật analog trong thời kỳ đầu ứng dụng
vào thực tiễn. Cho đến nay, với sự phát triển của công nghệ bán dẫn và công

nghệ số đã tạo ra các bộ vi xử lý tốc độ cao và dung lượng bộ nhớ lớn, cho phép
cài đặt được các thuật tốn điều khiển thích nghi phức tạp, do vậy những hạn
chế của phương pháp đã được giải quyết.
Cùng với sự phát triển của công nghệ số và sự trợ giúp của nhiều ngành khoa
học khác nhau, phương pháp điều khiển thích nghi cho các hệ phi tuyến bất
định đã có nhiều bước tiến cả về số lượng và chất lượng. Theo đó, phương pháp
điều khiển thích nghi để bù trừ các thành phần bất định, làm cho hệ thống trở
nên bền vững phát huy hiệu quả rất cao. Có thể kể đến một số cơng trình:
Phương pháp phản hồi phi tuyến nhờ các mạch phản hồi để hệ phi tuyến có tính
chất động học tuyến tính [110].
Phương pháp bù trừ đặc tính phi tuyến bất định bằng cơng cụ mạng nơ ron
[10],[28],[29],[30],[31],[32],[33], [34]. Ta có thể lấy cơng trình [10] để phân
tích rõ phương pháp tổng hợp hệ thống điều khiển cho lớp đội tượng phi tuyến
bất định, có tham số phần tuyến tính cố định.


9

Động học của đối tượng điều khiển được mô tả bằng phương trình:
x  ax  bx  cu  c  f ( x, x)]  d (t )  ,

(1.5)

trong đó f  x, x  là hàm trơn không biết trước, d  t   d m là nhiễu bị chặn;

a, b, c là các tham số cố định.
Sai số giữa tín hiệu đặt và tín hiệu ra e(t )  xd (t )  x(t ), biến đổi phương
trình (1.5) được phương trình:
a
b 

 1
e  ae  be  cu  cf ( x, x)  cd  c   xd  xd  xd  ,
c
c 
 c

1
c

a
c

(1.6)

b
c

đặt: d   xd  xd  xd  d , và viết lại (1.6) thành:

e  ae  be  cu  c  f ( x, x)  d .

(1.7)

T

t

tiếp tục đặt z    e(t )d (t ), e, e  khi đó (1.7) thành:
0


Z  AZ  Bu  B  f ( x, x)  d ,

(1.8)

trong đó,

0 1 0 
0
A  0 0 1  , B   0  .


 
0 a b 
 c 
Các tác giả [10] xây dựng phương pháp xấp xỉ thành phần bất định bằng
mạng nơ ron RBF và tạo tín hiệu bù trừ các thành phần bất định này. Đối với
thành phần Z  AZ  Bu luật điều khiển được thiết lập trên cơ sở PID.
Luật điều khiển [10]:
(1.9)
u  KZ  fˆ ( x, x)  sign( Z T PB)dˆ ,
trong đó fˆ ( x, x) là đánh giá của f ( x, x) , dˆ là đánh giá của d , P ma trận
xác định dương.
Luật nhận dạng nhiễu [10]:

dˆ (t )  r 2 Z T PB  r2dˆ ;

(1.10)


10


luật nhận dạng hàm phi tuyến bất định:
m

fˆ ( x, x)   wˆ i i ( x, x),

(1.11)

i 1

với luật cập nhật trọng số mạng nơ ron RBF:
wˆ i  r 2 Z T PBi  r2 wˆ i .
Sơ đồ hệ thống điều khiển (1.5) được mô tả trên hình vẽ 1.2,

(1.12)

Hình 1.2. Sơ đồ cấu trúc rút gọn hệ thống điều khiển Thích nghi/PID.
trong đó: ĐT là đối tượng điều khiển; NDN là khối nhận dạng nhiễu; NDFT là
khối nhận dạng hàm phi tuyến bất định.
Nhìn chung, xét về mặt tốn học ở cơng trình [10] với phương pháp xấp xỉ
hàm phi tuyến bất định bằng mạng nơ ron RBF, các tác giả đã vận dụng công
cụ tốn học giải tích và đại số hiện đại để chứng minh thuật toán nhận dạng hội
tụ một cách chặt chẽ. Tuy vậy, thuật tốn nhận dạng cịn phức tạp, khó thực
hiện trong kỹ thuật; luật nhận dạng nhiễu (1.10), luật cập nhật trọng số của
mạng nơ ron (1.12) phụ thuộc vào biến sai số hệ thống Z ," sai số giữa tín hiệu
đặt và tín hiệu đầu ra " mặt khác biến Z luôn thay đổi, đặc biệt là hệ thống
bám. Do vậy, việc học của mạng nơ ron diễn ra liên tục hay nói cách khác luật
nhận dạng hàm phi tuyến luôn được nhận dạng kể cả khi hàm phi tuyến đã được
xác định gây nhiều bất lợi, hơn nữa hệ thống có thể mất ổn định khi có nhiễu
ngồi lớn, đây cũng là tồn tại của các cơng trình [28-34].

Như chúng ta đã biết, muốn bù trừ ảnh hưởng của các thành phần bất định
nhất thiết phải nhận dạng được đặc tính phi tuyến. Phương pháp nhận dạng đặc


11

tính phi tuyến trên cơ sở mạng nơ ron bằng mơ hình song song [1],
[68],[69],[71],[86]. Các phương pháp theo hướng này có thể tóm tắt như sau.
u

ĐT

y

OUT
NN

e

ym
MH

Hình 1.3. Sơ đồ cấu trúc rút gọn nhận dạng mơ hình bằng mạng nơ ron - với
mơ hình song song [68-69],[71],[86].
Trong đó: ĐT là đối tượng; MH là mơ hình; y là đầu ra; u là đầu vào, e là sai lệch
giữa đầu ra của đối tượng và đầu ra của mơ hình; OUT là kết quả nhận dạng.

Ý tưởng của giải pháp sử dụng mơ hình song song để nhận dạng các thành
phần phi tuyến, tham số... của đối tượng điều khiển diễn ra như sau: Quá trình
nhận dạng là quá trình hiệu chỉnh trọng số mạng nơ ron sao cho mô hình (MH)

tiến về đối tượng điều khiển (ĐT), có nghĩa là e  0 . Khi thuật toán nhận dạng
hội tụ thì MH

ĐT, và khi đó việc hiệu chỉnh trọng số mang nơ ron kết thúc.

Ta dễ thấy rằng, quá trình học của mạng nơ ron dựa vào véc tơ sai lệch giữa
véc tơ trạng thái đối tượng và véc tơ trạng thái mơ hình, khơng phụ thuộc vào
sai số Z của hệ thống. Do đó, q trình nhận dạng chỉ xẩy ra khi đối tượng
điều khiển thay đổi và không phụ thuộc vào bất kỳ yếu tố nào khác. Như vậy,
phương pháp nhận dạng trên cơ sở mạng nơ ron vừa đề cập có ưu điểm nổi trội
hơn các phương pháp ở tài liệu [10], [28-34]. Phương pháp nhận dạng động
học đối tượng điều khiển ở các tài liệu [68],[69] được đề xuất vào năm 19891990 của các tác giả K.S.Narendra, K.Parthasarathy là những cơng trình đầu tiên,
tiêu biểu áp dụng mạng nơ ron vào tổng hợp hệ thống điều khiển. Hai công


12

trình này có thể xem là bước ngoặt quan trọng mở ra hướng áp dụng mạng nơ
ron vào điều khiển thích nghi, và nhờ đó đã tháo gỡ được nhiều vấn đề cịn tồn
tại trước đó, kể cả cho tới ngày nay.
Mạng nơ ron được sử dụng trong các công trình [68],[69],[71],[86] là mạng
truyền thẳng nhiều lớp, trong đó luật học của mạng nơ ron sử dụng phương
pháp hạ gradient tìm nghiệm tối ưu tồn cục. Bàn về phương pháp: hạn chế của
phương pháp hạ gradient để tìm nghiệm tối ưu tồn cục là khơng bảo đảm sẽ
tìm ra cực tiểu toàn cục của hàm sai số, mà chỉ ở mức cực tiểu địa phương đây
là tồn tại lớn nhất của phương pháp. Như chúng ta đã biết đầu ra của đối tượng
điều khiển phi tuyến là các dạng đường cong phức tạp, đặc biệt khi có nhiễu
ngồi bất định không đo được tác động lên hệ hoặc đầu ra có các điểm kỳ dị
thì tính phức tạp tăng lên rất nhiều. Do vậy, trong lĩnh vực điều khiển học kỹ
thuật việc ứng dụng mạng nơ ron truyền thẳng với phương pháp học dựa trên

cơ sở tìm nghiệm tối ưu tồn cục bằng phương pháp hạ gradient là rất khó khăn,
khơng phải lúc nào cũng thực hiện được. Đã có cơng trình nghiên cứu để tránh
các cực tiểu địa phương trong q trình luyện mạng nơ ron, nhưng các cơng
trình này vẫn chưa đề cập đến tốc độ hội tụ của thuật tốn. Cùng với đó, phương
pháp luyện mạng bằng phương pháp hạ Gradient địi hỏi khối lượng tính tốn
lớn; thời gian hội tụ của thuật toán phụ thuộc vào trọng số khởi tạo, hệ số học
và hình dạng của đặc tính đầu ra của đối tượng điều khiển,.... Hiện nay, chưa
có phương pháp tổng quát nào để giải quyết vấn đề này. Như chúng ta đã biết
trong các luật điều khiển thích nghi cần tốc độ hội tụ của luật nhận dạng nhanh
“online”, nếu tốc độ hội tụ chậm sẽ xuất hiện hiệu ứng trễ trong hệ thống, do
vậy, trong nhiều trường hợp sẽ gây ra hiện tượng dao động trong hệ. Phương
pháp [68],[69],[71],[86] phù hợp với đối tượng điều khiển có hình dạng đặc
tính đầu ra có biên độ thay đổi nhỏ, tần số dao động thấp và nhiễu ngồi có
biên độ nhỏ.


13

Nếu đối tượng điều khiển là phi tuyến bất định và nhiễu ngồi lớn thì cần
phải cân nhắc khi sử dụng phương pháp này.
Phương pháp tổng hợp hệ điều khiển thích nghi cho lớp đối tượng bậc hai
phi tuyến dưới tác động của nhiễu bên ngoài [1]. Luật điều khiển được xây
dựng có sự kết hợp PID và luật điều khiển thích nghi. Phương pháp được mơ
tả trên hình vẽ 1.4. Trong cơng trình [1] đối tượng điều khiển là hệ phi tuyến
có thành phần tuyến tính tham số hằng và ổn định, thành phần phi tuyến trơn
bất định có nhiễu ngồi khơng đo được.
Luật nhận dạng thành phần phi tuyến và nhiễu ngoài được xây dựng trên cơ
sở lý thuyết điều khiển thích nghi và mạng no ron RBF. Trong đó luật học của
mạng nơ ron và luật nhận dạng nhiễu ngồi được xác định thơng qua tiêu chuẩn
ổn định Lyapunov cho phương trình sai số giữa đối tượng và mơ hình.

d t 
Xd

u

PID
fˆ  x1 , x2 

X

ĐT

dˆ  t 

ND

E

XM
MH

Hình 1.4. Sơ đồ cấu trúc hệ thống điều khiển PID / với có cấu nhận dạng
thích nghi sử dụng mạng nơ ron RBF[1].
Kết quả đạt được như sau:
Luật hiệu chỉnh thích nghi thành phần phi tuyến bất định bằng mạng nơ ron:
n

fˆ ( X )   wˆ ii ( X ) .

(1.13)


i 1

Luật cập nhật trọng số của mạng nơ ron:

wˆ i  ( p21e1  p22e2 )i ( X ).

(1.14)


14

Luật hiệu chỉnh thích nghi đánh giá của nhiễu tác động từ bên ngoài:
dˆ (t )  p12e1  p22e2 .

(1.15)

Ta thấy rằng các thuật tốn thích nghi (1.14) và (1.15) đơn giản, vì vậy dễ
dàng thực hiện trong kỹ thuật. Bên cạnh đó các thuật tốn thích nghi đều dựa
vào tín hiệu sai lệch giữa đối tượng và mơ hình e1 , e2 mà khơng phụ thuộc vào
sai số Z của hệ thống. Do vậy, quá trình hiệu chỉnh thích nghi chỉ xẩy ra khi
hàm phi tuyến và nhiễu ngồi thay đổi. Cùng với đó, luật học của mạng nơ ron
RBF[1] phát huy hiệu quả cao hơn phương pháp tổng hợp hệ thống điều khiển
thích nghi bằng mạng nơ ron truyền thẳng nhiều lớp trên cơ sở mơ hình song
song, với việc học của mạng nơ ron được xây dựng dựa trên công cụ hạ
gradient[68],[69],[71],[86] . Vấn đề đặt ra của phương pháp [1] là luật học của
mạng nơ ron được xây dựng dựa trên phương pháp Lyapunov cho phương trình
sai số giữa đối tượng phi tuyến bất định và mơ hình nhận dạng. Phương pháp
Lyapunov là một phương pháp tổng quát để xét tính ổn định của hệ tuyến tính,
phi tuyến. Tuy vậy, hiện nay chưa có phương pháp chung nhất để tìm hàm

Lyapunov. Mặt khác, như chúng ta đã biết trong thực tế tồn tại nhiều đối tượng
điều khiển phi tuyến đa dạng và phong phú; do vậy, tùy từng lớp phi tuyến cụ
thể để có lời giải phù hợp vẫn tiếp tục là vấn đề bức thiết.
Nhận xét:
Phương pháp tổng hợp bộ điều khiển cho hệ phi tuyến bằng phản hồi các
thành phần phi tuyến: nhược điểm của phương pháp là ln phải tính đến vấn
đề ổn định. Phương pháp bù trừ thích nghi sử dụng mạng nơ ron [28-34], [10],
hạn chế lớn nhất của các cơng trình này như trình bày ở trên, q trình hiệu
chỉnh của mạng nơ ron phụ thuộc vào biến sai số Z của hệ thống. Phương pháp
[68],[69],[71],[86] tổng hợp hệ thống điều khiển thích nghi trên cơ sở mơ hình
song song và sử dụng mạng nơ ron truyền thẳng để nhận dạng đối tượng phi
tuyến với luật học dựa trên cơng cụ hạ gradient để tìm nghiệm tối ưu tồn cục,


15

tồn tại lớn nhất của phương pháp là không bảo đảm sẽ tìm ra cực tiểu tồn
cục của hàm sai số, mà chỉ ở mức cực tiểu địa phương. Hơn nữa, phương pháp
này địi hỏi khối lượng tính tốn lớn, nên trong nhiều trường hợp xuất hiện hiệu
ứng trễ trong hệ thống gây ra nhiều bất lợi.
Phương pháp được để xuất [1] phát huy hiệu quả cao cho lớp đội tượng phi
tuyến bất định trong đó thành phần tuyến tính tham số hằng ổn định, đặc tính
phi tuyến trơn bất định có nhiễu ngồi. Hướng nghiên cứu thứ nhất của luận
án là xây dựng phương pháp tổng hợp hệ thống điều khiển thích nghi bền vững
cho lớp đối tượng có phần tuyến tính tham số hằng khơng ổn định, phần phi
tuyến trơn bất định và có nhiễu ngồi khơng đo được. Lớp đối tượng điều khiển
này thường gặp trong thực tế, ví dụ như: cẩu trục, robot, thiết bị bay, công
nghệ điện hạt nhân,... và nhiều thiết bị và công nghệ khác phù hợp.
1.4. Điều khiển thích nghi bền vững hệ phi tuyến bất định trên cơ sở điều
khiển trượt

Trong thực tế ta thường gặp nhiều đối tượng phi tuyến được mơ tả bằng
phương trình:

X  F ( X ,U ),

(1.16)

T
T
trong đó X  [x1, x2 ,..., xn ] ; U  [u1, u2 ,..., un ] ;

F ( X ,U )  [f1 ( X ,U ), f 2 ( X ,U ),..., f n ( X ,U )]T là véc tơ hàm phi tuyến.
Tổng hợp hệ thống điều khiển cho các đối tượng phi tuyến có phương trình
nêu trên luôn là vấn đề bức thiết và thời sự. Hệ phi tuyến (1.16) được phân ra
nhiều dạng hệ khác nhau, trong đó có ba dạng hệ cơ bản rất phổ biến đó là:
Dạng hệ được mơ tả bởi mơ hình tốn học tường minh; Dạng hệ phi tuyến trong
đó có thành phần tuyến tính và phần phi tuyến bất định; Dạng hệ khơng mơ
hình hóa được dưới dạng cơng thức toán học tường minh.
Đối với các lớp hệ phi tuyến được mơ tả bởi mơ hình tốn học tường minh,
các phương pháp chủ yếu để tổng hợp hệ thống điều khiển cho lớp hệ này đó


×