ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH
TR
ƯỜNG ĐẠI HỌC BÁCH KHOA
NGUY
ỄN ĐỨC MINH
ĐIỀU KHIỂN TRƯỢT THÍCH NGHI
H
Ệ THỐNG ĐỘNG PHI TUYẾN
LU
ẬN ÁN TIẾN SĨ KỸ THUẬT
TP. H
Ồ CHÍ MINH NĂM 2012
ĐẠI HỌC QUỐC GIA TP. HCM
TRƯỜNG ĐẠI HỌC BÁCH KHOA
NGUY
ỄN ĐỨC MINH
ĐIỀU KHIỂN TRƯỢT THÍCH NGHI
H
Ệ THỐNG ĐỘNG PHI TUYẾN
Chuyên ngành: TỰ ĐỘNG HÓA
Mã số chuyên ngành: 6252600
Phản biện độc lập 1: GS.TSKH NGUYỄN XUÂN QUỲNH
Phản biện độc lập 2: PGS.TS NGUYỄN NGỌC PHƯƠNG
Phản biện 1: TS. NGUYỄN CHÍ NGÔN
Phản biện 2: PGS.TSKH HỒ ĐẮC LỘC
Phản biện 3: PGS.TS NGUYỄN TẤN TIẾN
NGƯỜI HƯỚNG DẪN KHOA HỌC
1. PGS. TS DƯƠNG HOÀI NGHĨA
2. TS NGUYỄN ĐỨC THÀNH
i
LỜI CAM ĐOAN
Tác giả xin cam đoan đây là công trình nghiên cứu của bản thân tác giả. Các kết
quả nghiên cứu và các kết luận trong luận án này là trung thực, và không sao chép từ
bất kỳ một nguồn nào và dưới bất kỳ hình thức nào. Việc tham khảo các nguồn tài liệu
(nếu có) đã được thực hiện trích dẫn và ghi nguồn tài liệu tham khảo đúng theo yêu
cầu.
Tác giả luận án
__________________________________
Nguyễn Đức Minh
ii
TÓM TẮT LUẬN ÁN
Điều khiển có cấu trúc thay đổi VSC (Variable Structure Control) với chế độ
trượt, hay điều khiển trượt SMC (Sliding Mode Control) được biết đến như là một
phương pháp điều khiển phi tuyến bền vững đơn giản, hiệu quả. Phương pháp điều
khiển này có nhiều ưu điểm như: (i) ít nhạy với sự biến thiên của các thông số của hệ
thống; (ii) có khả năng chống nhiễu tốt; (iii) đ áp ứng động học nhanh. Tuy nhiên do tín
hiệu điều khiển trượt cổ điển có dạng chuyển mạch nên tồn tại hiện tượng dao động có
tần số cao (chattering) của các quỹ đạo pha xung quanh mặt trượt. Hơn nữa, khi thiết
kế điều khiển SMC yêu cầu phải biết trước giá trị chặn trên của các thành phần bất
định của hệ thống. Các thành phần bất định thường bao gồm các thành phần động học
không mô hình, sự biến thiên của các thông số và nhiễu loạn. Nếu giá trị chặn trên
thực vượt quá giá trị chặn trên được giả thiết trong khi thiết kế bộ điều khiển, sự ổn
định của hệ thống sẽ không được bảo đảm. Ngoài ra cũng giống như các phương pháp
điều khiển kinh điển khác, việc thiết kế bộ điều khiển trượt yêu cầu phải biết mô hình
toán học cùng các thông số của mô hình của đối tượng. Điều này sẽ ảnh hưởng tới chất
lượng điều khiển trong một số ứng dụng mà ở đó mô hình toán học của đối tượng được
điều khiển khó xác định một cách chính xác và các thông số có tầm biến thiên rộng.
Luận án tiến sĩ nghiên cứu phương pháp điều khiển trượt thích nghi dùng mạng
nơ ron áp dụng cho hệ phi tuyến động bất định không rõ thông số mô hình với ba nội
dung chính:
Kết hợp lý thuyết điều khiển trượt và mạng nơ ron để thiết kế bộ điều khiển trượt
thích nghi dùng mạng nơ ron áp dụng cho hệ thống phi tuyến động bất định không rõ
thông số mô hình. Bộ điều khiển mới có các đặc điểm: (i) là một mạng nơ ron được
dùng làm bộ điều khiển trực tiếp; (ii) không cần nhận dạng trước các thông số của mô
hình đối tượng, luật điều khiển được suy ra trực tiếp trong quá trình huấn luyện trực
tuyến; (iii) có khả năng thích nghi trước sự thay đổi của các chặn trên của các thành
phần bất định và có khả năng kháng nhiễu tốt.
Phát triển bộ điều khiển trượt thích nghi nêu trên thành bộ điều khiển trượt thích
nghi phân ly DANSMC cho hệ phi tuyến đa biến.
Áp dụng các nghiên cứu về điều khiển trượt thích nghi phân ly lên hệ con lắc
ngược xoay và con lắc ngược hai chiều thông qua mô phỏng và thực nghiệm.
iii
LỜI CÁM ƠN
Tôi xin tỏ lòng biết ơn sâu sắc đến PGS. TS Dương Hoài Nghĩa và TS. Nguyễn
Đức Thành, hai người thầy đã hướng dẫn tận tình trong suốt thời gian tôi làm nghiên
cứu sinh tại Đại học Bách Khoa. Những gợi ý đúng lúc hết sức quý báu cùng những ý
kiến phản biện sâu sắc của các thầy đã giúp tôi nhận thức, định hướng đúng và hoàn
thiện nghiên cứu của mình. Trong những năm cùng làm nghiên cứu với các thầy, tôi
không chỉ học được các phương pháp nghiên cứu khoa học mà còn học được nhiều
điều về tư cách, đạo đức trong cuộc sống
Xin chân thành cảm ơn các thầy cô Bộ môn Tự Động ĐHBK TPHCM vì đã
truyền đạt cho tôi những kiến thức nền tảng hết sức quý báu trong thời gian tôi còn học
cao học, cũng như những góp ý khoa học và những phản biện thẳng thắn trong khi tôi
thực hiện các chuyên đề tiến sĩ là những cơ sở hết sức có giá trị giúp tôi hoàn chỉnh
luận án của mình.
Xin cảm ơn vợ, và các con tôi đã cùng chia xẻ trong những ngày khó khăn nhất
cả về vật chất và tinh thần để tôi có thể yên tâm thực hiện luận án này.
Xin gửi lời cảm ơn đến các đồng nghiệp là các giảng viên của Khoa tin học
trường Đại học Yersin và bạn bè thân hữu, những người luôn giúp đỡ và động viên tôi
trong những năm tháng làm luận án.
Mặc dù đã cố gắng hết sức nhưng luận án không tránh khỏi những thiếu xót.
Tác giả rất mong được sự góp ý của quý thầy cô và các bạn đồng nghiệp.
iv
MỤC LỤC
1
TỔNG QUAN 1
1.1
Đặt vấn đề 1
1.2
Mục tiêu và phương pháp nghiên cứu của luận án 4
2
LÝ THUYẾT CƠ SỞ 8
2.1
Lý thuyết điều khiển trượt 9
2.1.1
Đối tượng điều khiển 9
2.1.2
Mặt trượt 9
2.1.3
Luật điều khiển trượt kinh điển 10
2.1.4
Điều khiển trượt cho hệ thống MIMO 12
2.1.5
Đặc điểm của điều khiển trượt 14
2.2
Xấp xỉ hàm của mạng nơ-ron truyền thẳng 15
2.3
Một số mô hình điều khiển trượt dùng mạng nơ ron 18
2.3.1
Mô hình sử dụng mạng nơ ron làm thành phần điều khiển tương đương 19
2.3.2
Mô hình điều khiển trượt phân ly dùng mạng nơ ron 20
3
ĐIỀU KHIỂN TRƯỢT THÍCH NGHI PHÂN LY DÙNG MẠNG NƠ RON 28
3.1
Điều khiển trượt thích nghi dùng mạng nơ ron 28
3.1.1
Mô tả bộ điều khiển 28
3.1.2
Luật cập nhật thích nghi để huấn luyện mạng 29
3.2
Điều khiển trượt thích nghi phân ly dùng mạng nơ ron DANSMC 33
4
KẾT QUẢ MÔ PHỎNG VÀ THỰC NGHIỆM 38
4.1
Điều khiển trượt thích nghi phân ly con lắc ngược hai bậc xoay tự do 38
4.1.1
Mô tả con lắc ngược xoay 38
4.1.2
Phân tích điều khiển 39
4.1.3
Mô tả quá trình và các kết quả mô phỏng 42
4.1.4
Mô tả quá trình và các kết quả thực nghiệm 56
4.2
Điều khiển trượt thích nghi phân ly con lắc hai chiều 66
5
KẾT LUẬN 73
6
CÁC TÀI LIỆU CÔNG BỐ CỦA TÁC GIẢ 77
7
Tài liệu tham khảo 78
v
DANH MỤC CÁC HÌNH ẢNH
Hình 2-1 Tín hiệu điều khiển trượt có dạng chuyển mạch 14
Hình 2-2 Mô phỏng quỹ đạo pha và hiện tượng chattering 15
Hình 2-3 Mạng nơ-ron một lớp ẩn trong bộ điều khiển DNNSMC 23
Hình 2-4 Hệ thống DNNSMC của Lon-Chen Hung và Hung Yuan Chung 24
Hình 2-5 Mô hình điều khiển trượt phân ly dùng thuật toán SPSA 25
Hình 2-6 Đáp ứng góc con lắc ngược của điều khiển DNNSMC so với DFSM 25
Hình 3-1 Mạng nơ ron dùng làm bộ điều khiển 29
Hình 3-2 Mô hình điều khiển trượt thích nghi phân ly 35
Hình 4-1 Mô hình con lắc ngược xoay 39
Hình 4-2 Mô hình con lắc ngược trên simulink 41
Hình 4-3 Mô phỏng điều khiển DANSMC lên con lắc ngược xoay 41
Hình 4-4 Mô phỏng điều khiển DNNSMC lên con lắc ngược xoay trong 10s đầu tiên
45
Hình 4-5 Mô phỏng điều khiển DNNSMC lên con lắc ngược xoay trong 0.5s đầu tiên
46
Hình 4-6 Đáp ứng của tín hiệu mặt trượt của điều khiển DNNSMC 47
Hình 4-7 Quỹ đạo pha các biến trạng thái của điều khiển DNNSMC 48
Hình 4-8 Quỹ đạo pha các biến trạng thái của điều khiển DNNSMC trong quá trình
quá độ 49
Hình 4-9 Quá trình huấn luyện và hội tụ bộ điều khiển DANSMC 50
Hình 4-10 Đáp ứng của tín hiệu trượt qua các phiên huấn luyện của điều khiển
DANSMC 51
Hình 4-11 Đáp ứng của điều khiển DANSMC 52
Hình 4-12 Đáp ứng của tín hiệu mặt trượtcủa điều khiển DASMC 53
Hình 4-13 Quỹ đạo pha các biến trạng thái của điều khiển DANSMC 54
Hình 4-14 So sánh đáp ứng của điều khiển DNNSMC và DANSMC 55
Hình 4-15 Kết cấu phần cứng mô hình thực nghiệm để điều khiển trượt thích nghi
phân ly con lắc ngược xoay dùng mạng nơ ron 57
Hình 4-16 Mô hình thực con lắc ngược trong phòng thí nghiệm 58
Hình 4-17 Sơ đồ khối chip vi điều khiển TMS320 2812 59
Hình 4-18 Đáp ứng của trong 30 giây.(lật lên và ổn định) 62
Hình 4-19 Đáp ứng của trong 30 giây 62
Hình 4-20 Tín hiệu điều khiển u trong 30 giây 63
Hình 4-21 Đáp ứng của góc khi thay đổi khối lượng và chiều dài con lắc 64
Hình 4-22 Đáp ứng của góc khi thay đổi khối lượng và chiều dài con lắc 65
Hình 4-23 Con lắc ngược hai chiều 66
Hình 4-24 Biểu diễn hệ tọa độ con lắc ngược hai chiều 67
Hình 4-25 Mô hình điều khiển DANSMC cho con lắc ngược hai chiều 69
Hình 4-26 Kết quả phiên huấn luyện thứ nhất 70
Hình 4-27 Kết quả của phiên huấn luyện thứ hai 70
Hình 4-28 Quỹ đạo x-y của phiên huấn luyện thứ nhất và thứ hai 71
Hình 4-29 Mô phỏng với biên độ nhiễu biến thiên 71
Hình 4-30 Mô phỏng với biên độ nhiễu biến thiên mạnh 72
vi
DANH M
ỤC BẢNG BIỂU
Bảng 1 Bộ trọng số thu được sau phiên huấn luyện đầu tiên 43
Bảng 2 Bộ trọng số thu được sau phiên huấn luyện cuối 44
vii
DANH MỤC CÁC TỪ VIẾT TẮT VÀ THUẬT NGỮ ĐỐI CHIẾU
ANSMC (Adapative Neural Sliding Mode Control): Điều khiển trượt thích nghi dùng
mạng nơ ron
CCS (Code Composer Studio): phần mềm hỗ trợ lập trình và giao tiếp với bo mạch xử
lý tín hiệu số
Chattering: Hiện tượng dao động xung quanh mặt trượt
DANSMC (Decoupled Adaptive Neural Sliding Mode Control): Điều khiển trượt
thích nghi phân ly dùng mạng nơ ron
DNNSMC (Decoupled Neural Network Sliding Mode Control): Điều khiển trượt phân
ly dùng mạng nơ ron
DSP ( Digital Signal Processing): Xử lý tín hiệu số
Lyapunov: Lý thuyết ổn định được phát biểu bởi Lyapunov
NN (Neural Network): Mạng nơ ron
SMC (Sliding Mode Control): Điều khiển trượt
SHL (Single Hidden Layer): Mạng nơ ron một lớp ẩn
RBFN (Radial Basic Funtion Network): Mạng hàm cơ sở xuyên tâm
MLP (Multiple Layer Perceptron): Mạng nơ ron nhiều lớp
Perceptron: Một đơn vị trong mạng nơ ron
Swinging up: Điều khiển lật lên (cho con lắc ngược)
Sliding surface : mặt trượt
VSC (Variable Structure Control): điều khiển có cấu trúc thay đổi
1
1 TỔNG QUAN
1.1 Đặt vấn đề
Giới thiệu về điều khiển trượt
Điều khiển trượt là một phương pháp điều khiển phi tuyến đơn giản hiệu quả,
dựa vào hồi tiếp các biến trạng thái của hệ thống. Bộ điều khiển được thiết kế sao cho
các trạng thái của hệ thống luôn luôn hướng về một mặt phẳng Hurwitz của các trạng
thái, một khi các trạng thái đã nằm trên mặt trượt thì chúng sẽ tiến về gốc tọa độ. Vì
vậy mục đích điều khiển ổn định trạng thái trở thành điều khiển ổn định tiệm cận các
trạng thái bám trên mặt trượt.
Điều khiển trượt có hai thành phần là thành phần điều khiển tương đương và
thành phần điều khiển bền vững. Thành phần điều khiển bền vững mà trong nhiều tài
liệu còn gọi là thành phần điều khiển hiệu chỉnh có nhiệm vụ chính là điều khiển quỹ
đạo các trạng thái hướng về mặt trượt. Khi quỹ đạo các trạng thái đã ở lân cận mặt
trượt thì thành phần điều khiển tương đương có tác dụng điều khiển các trạng thái bám
chặt trên mặt trượt.
Để thiết kế thành phần điều khiển tương đương trong điều khiển trượt cần phải
biết rõ các hàm toán học phi tuyến của mô hình đối tượng và để thiết kế thành phần
điều khiển bền vững trong điều khiển trượt thì cần phải biết các chặn trên của các
thành phần bất định của mô hình. Trong đó các dạng của thành phần bất định của hệ
thống bao gồm: nhiễu ảnh hưởng lên hệ thống, nhiễu đo đạc, và sai số mô hình do các
thông số của đối tượng biến thiên theo thời gian.
Ưu điểm của điều khiển trượt là nó ít nhạy với sự biến động của các thông số của
mô hình và ảnh hưởng của nhiễu bên ngoài.
Điều khiển trượt đã được áp dụng khá thành công để thiết kế các bộ điều khiển
bền vững trong phòng thí nghiệm và ứng dụng rộng rãi trong thực tiễn.
Một số vấn đề của điều khiển trượt cổ điển
Tuy nhiên khi thiết kế các bộ điều khiển trượt có một số vấn đề thường gặp phải
như sau:
2
- Thành phần điều khiển bền vững trong điều khiển trượt có dạng hàm dấu kết
hợp với hiện tượng trễ vật lý của các đối tượng gây nên hiện tượng chattering các
trạng thái xung quanh mặt trượt. Thông thường để hạn chế hiện tượng chattering người
thường thay thế hàm dấu trong thành phần điều khiển bền vững bằng hàm bão hòa.
- Việc xác định các giá trị chặn trên của các thành phần bất định thường không
chính xác. Người ta thường dùng các giá trị hằng để ước lượng các giá trị này. Khi
thiết kế thành phần điều khiển bền vững, nếu việc chọn giá trị chặn trên quá lớn sẽ làm
gia tăng hiện tượng chattering, làm tổn hao năng lượng điều khiển không cần thiết và
xảy ra nhiều hiện tượng không mong muốn. Còn khi giá trị chặn trên thực lớn hơn giá
trị chặn trên theo thiết kế thì hệ thống sẽ mất tính ổn định.
Bài toán điều khiển trượt khi áp dụng cho các hệ thống đa biến là một bài toán
khá phức tạp. Trong tài liệu [1] được giới thiệu năm 2000 dựa trên nhiều nghiên cứu
trước đó, Utkin đã giới thiệu một số các phương pháp thiết kế các bộ điều khiển trượt
phân ly áp dụng được cho các hệ thống phi tuyến bậc bốn. Các phương trình vi phân
biểu diễn mô hình động học của đối tượng được đề nghị biến đổi để đưa về dạng hệ
phương trình chuẩn đã được định nghĩa trước đó. Sau đó bài toán phân ly biến số được
giải quyết dựa trên việc xét từng trường hợp riêng với một loạt các phép biến đổi toán
học và chỉ có thể áp dụng lên từng đối tượng cụ thể chứ không có phương pháp biến
đổi tổng quát. Các nghiên cứu đã được thực hiện phân tích mô hình động học và thiết
kế bộ điều khiển phân ly các đối tượng phi tuyến có độ bất ổn cao như hệ xe con lắc
Thành phần ñiều
khiển tương ñương
Thành phần ñiều
khiển bền vững
Luật ñiều khiển
trượt cổ ñiển
Thông số ñối tượng
phi tuyến thông qua
nhận dạng
Thông số, mô hình
nhiễu và các chặn
trên của các thành
phần bất ñịnh
Hình 1-1 Các thành phần của điều khiển trượt cổ điển
3
đơn, hệ xe con lắc đôi và hệ con lắc xoay hai bậc tự do. Tuy nhiên, các bài toán cho
thấy độ phức tạp cao và không dễ dàng thành công nếu áp dụng lên những đối tượng
phi tuyến khác.
Điều khiển trượt thích nghi dùng mạng nơ-rôn
Trong những năm gần đây ứng dụng khả năng học được để xấp xỉ thích nghi các
hàm phi tuyến, một số nghiên cứu đã sử dụng mạng nơ-rôn hoặc nơ-rôn mờ để thay
thế một phần hoặc hoàn toàn bộ điều khiển trượt cổ điển.
Thông thường để thiết kế thành phần điều khiển tương đương của điều khiển
trượt cổ điển cần phải nhận dạng trước các thông số của mô hình đối tượng. Nhận
dạng thông số mô hình đối tượng thường phức tạp (có khi không thực hiện được) nhất
là đối với các đối tượng có tính phi tuyến và độ bất ổn cao. Tín hiệu điều khiển sau khi
thiết kế không như mong muốn do sai số nhận dạng và thường phải bù sai số nhận
dạng bằng các phương pháp điều khiển thích nghi.
Ưu điểm của các bộ điều khiển trượt dùng mạng nơ-rôn là không cần biết trước
các thông số cũng như các chặn trên của các hàm phi tuyến của mô hình động học, và
hạn chế được hiện tượng chattering so với điều khiển trượt cổ điển.
Trong một số nghiên cứu [2], [3], [4], [5], [6] [7] thành phần điều khiển bền vững
được tách ra và hoạt động ở vùng xa mặt trượt, còn ở lân cận mặt trượt thì mạng nơ-
rôn hoặc nơ-rôn mờ được dùng để thay thế thành phần điều khiển tương đương của
điều khiển trượt cổ điển.
Trong một số nghiên cứu khác [8], [9], [10] hàm dấu trong thành phần điều khiển
bền vững được thay thế bằng hàm bão hòa để hạn chế hiện tượng chattering và mạng
nơ-rôn hoặc nơ-rôn mờ cũng được dùng để thay thành phần điều khiển tương đương
với mục đích là để bù cho các sai số mô hình và các thành phần bất định của đối tượng
Trong tất cả các nghiên cứu trên, các mạng nơ-rôn hoặc nơ-rôn mờ được huấn
luyện trực tuyến với các luật cập nhật được đề nghị khá đơn giản chủ yếu dựa trên tín
hiệu hồi tiếp là tín hiệu mặt trượt. Các chứng minh về sự ổn định của hệ thống, sự hội
tụ của các luật điều khiển trượt mạng nơ-rôn thường dựa trên lý thuyết ổn định của
Lyapunov.
Đặc điểm của các phương pháp nghiên cứu này là chúng vẫn sử dụng luật điều
khiển trượt cổ điển làm cơ sở. Mạng nơ-rôn chỉ dùng để thay thế thành phần điều
4
khiển tương đương. Hàm dấu trong thành phần điều khiển bền vững thường được thay
thế bằng hàm bảo hòa để hạn chế hiện tượng chattering. Tuy nhiên các chặn trên dùng
trong thiết kế thành phần điều khiển bền vững vẫn là các giá trị hằng được chọn trước,
vì vậy chất lượng điều khiển vẫn phụ thuộc vào việc lựa chọn các giá trị hằng khi thiết
kế thành phần điều khiển bền vững.
Vì bài toán điều khiển trượt dùng mạng nơ-rôn hay nơ-rôn mờ không có mô hình
toán học rõ ràng nên không thể áp dụng các phương pháp điều khiển trượt phân ly cổ
điển [1], nên trong các tài liệu [7], [8], [9], [10] các tác giả đã đề nghị một mô hình
điều khiển trượt phân ly đơn giản nhưng rất hiệu quả để kết hợp với bộ điều khiển
trượt dùng mạng nơ-rôn thành bộ điều khiển trượt phân ly dùng mạng nơ-rôn áp dụng
để điều khiển cho các hệ thống đa biến.
Các kết quả nghiên cứu bằng lý thuyết cũng như mô phỏng và thực nghiệm trên
nhiều đối tượng con lắc ngược, hệ cầu banh, cánh tay máy…, đã cho thấy các bộ điều
khiển phân ly dùng mạng nơ-rôn có khả năng điều khiển thích nghi trong những điều
kiện không biết trước các hàm phi tuyến của đối tượng và có khả năng hạn chế được
hiện tượng chattering.
Tuy nhiên việc tách thành phần điều khiển bền vững với thành phần điều khiển
tương đương hoặc việc thay thế hàm dấu bằng hàm bão hòa trong thành phần điều
khiển bền vững đã làm giảm tính bền vững của hệ thống trước nhiễu ở vùng sát mặt
trượt.
1.2 Mục tiêu và phương pháp nghiên cứu của luận án
Mục tiêu nghiên cứu của luận án
Mục tiêu luận án là phát triển các nghiên cứu về điều khiển trượt cổ điển và điều
khiển trượt dùng mạng nơ-rôn để thiết kế bộ điều khiển trượt thích nghi phân ly
DANSMC áp dụng cho hệ phi tuyến đa biến sử dụng mạng truyền thẳng làm bộ điều
khiển trực tiếp kết hợp được cả hai thành phần điều khiển tương đương và điều khiển
bền vững trong điều kiện không biết trước các thông số mô hình của đối tượng và các
chặn trên của các thành phần bất định hoặc hơn nữa các thông số của mô hình và các
giá trị chặn trên có thể bị thay đổi trong quá trình điều khiển. Luật điều khiển trượt
được nghiên cứu thiết kế theo hướng sao cho nó không chứa hàm có dấu nhằm khắc
5
phục hiện tượng chattering; vừa phải bảo đảm được tính bền vững của hệ thống trước
nhiễu.
Ứng dụng các kết quả nghiên cứu về điều khiển trượt thích nghi dùng mạng nơ-
rôn lên các đối tượng phi tuyến có độ bất ổn cao như con lắc ngược xoay và con lắc
ngược hai chiều. Các ứng dụng bộ điều khiển nêu trên để điều khiển ổn định hệ thực
con lắc ngược xoay nhằm kiểm chứng khả năng của bộ điều khiển khi áp dụng lên các
hệ thực. (Kỹ thuật điều khiển con lắc ngược dùng mạng nơ-rôn có thể phát triển để
điều khiển các đối tượng phi tuyến khác như rô-bốt di chuyển cân bằng trên hai bánh,
tên lửa, cánh tay rô-bốt ….)
Phương pháp nghiên cứu trong luận án
Về lý thuyết
- Nghiên cứu thiết kế một luật điều khiển trượt không có thành phần chuyển
mạch. Tín hiệu phản hồi bao gồm cả tín hiệu mặt trượt và đạo hàm của nó cho phép
xác định một quỹ đạo cho trước của tín hiệu mặt trượt nhằm khắc phục hiện tượng
chattering.
- Nghiên cứu sử dụng một mạng truyền thẳng với ngõ vào là các sai số trạng thái
và ngõ ra là tín hiệu điều khiển làm bộ điều khiển trượt thích nghi. Luật cập nhật thích
nghi với tín hiệu hồi tiếp bao gồm tín hiệu mặt trượt và đạo hàm của nó. Giải thuật
huấn luyện mạng được xây dựng sao cho quỹ đạo pha của hệ thống hội tụ về mặt trượt
theo một quỹ đạo cho trước trong điều kiện đối tượng bất định. Mạng truyền thẳng
được sử dụng làm bộ điều khiển trượt thích nghi trực tiếp cho cả hai thành phần điều
khiển tương đương và hiệu chỉnh. Nhờ đó mà không chỉ các thông số của mô hình đối
tượng mà cả các giá trị chặn trên cũng được cập nhật đầy đủ cho thành phần điều
khiển bền vững.
Về ứng dụng
- Cuối cùng luận án nghiên cứu kết hợp giữa điều khiển trượt dùng mạng nơ-rôn
với lý thuyết điều khiển phân ly để hình thành bộ điều khiển trượt thích nghi phân ly
áp dụng được cho các hệ thống đa biến.
Các luật điều khiển và luật cập nhật được chứng minh dựa vào các hàm điều
khiển Lyapunov.
6
Các kết quả mô phỏng trên hệ thống con lắc ngược hai bậc xoay tự do và con lắc
ngược hai chiều với đầy đủ các quy trình từ huấn luyện ban đầu nhằm kiểm chứng tính
hội tụ của luật cập nhật thích nghi, đến các kết quả điều khiển bám theo quỹ đạo và các
kết quả thực nghiệm trên hệ thực con lắc ngược xoay nhằm kiểm tra chất lượng của bộ
điều khiển trong điều kiện các thông số mô hình thay đổi liên tục và ảnh hưởng mạnh
của nhiễu từ bên ngoài. Các mô phỏng dựa trên phần mềm matlab và simulink, còn
thực nghiệm dựa trên nền của board xử lý tín hiệu số DSP TMS320-2812 kết hợp với
phần mềm CCS (Code Composer Studio).
Nội dung của luận án
Luận án được chia thành bốn chương chính với các nội dung như sau:
Chương một là chương tổng quan về điều khiển trượt, điều khiển trượt dùng
mạng nơ-rôn, mục đích cũng như phương pháp nghiên cứu của luận án.
Chương hai giới thiệu các kiến thức cơ sở về mạng nơ-ron và lý thuyết điều
khiển trượt, và một số mô hình điều khiển trượt dùng mạng nơ-ron. Phần đầu của
chương này giới thiệu mạng truyền thẳng với đầy đủ các cấu trúc cơ bản, khả năng xấp
xỉ các hàm phi tuyến và các phương pháp huấn luyện mạng. Phần tiếp theo giới thiệu
lý thuyết điều khiển trượt cổ điển được đưa ra cùng một số phân tích về ưu nhược
điểm. Phần cuối của chương này giới thiệu một số mô hình điều khiển trượt phân ly
dùng mạng nơ-ron đã được phát triển trong những năm gần đây.
Chương ba bao hàm nội dung chính của luận án. Trong chương này một bộ điều
khiển trượt thích nghi phân ly dùng mạng nơ-ron DANSMC được đề nghị với luật điều
khiển trượt mới không có các thành phần chuyển mạch nhằm khắc phục hiện tượng
chattering. Hơn nữa, khác với các phương pháp điều khiển trượt dùng mạng nơ-ron
khác được trình bày ở chương hai, mạng nơ-ron ở đây được dùng để thay thế cả hai
thành phần điều khiển tương đương và điều khiển bền vững với tín hiệu hồi tiếp huấn
luyện mạng bao gồm cả tín hiệu mặt trượt và đạo hàm của nó (trong khi các phương
pháp khác chỉ sử dụng tín hiệu mặt trượt), có khả năng học được luật điều khiển mới
và khả năng cập nhật thích nghi, tự điều chỉnh luật điều khiển phù hợp nhằm bảo đảm
chất lượng điều khiển khi các thông số của đối tượng bị thay đổi.
Chương bốn mô tả ứng dụng phương pháp điều khiển trượt thích nghi phân ly
DANSMC được giới thiệu trong chương ba vào hai mô hình con lắc ngược hai bậc
7
xoay tự do và con lắc ngược hai chiều là các mô hình phi tuyến cao, bất ổn và không
cực tiểu pha cùng với các kết quả mô phỏng và thực nghiệm. Trong các thí nghiệm
này, các mạng nơ-ron được khởi tạo với giá trị ngẫu nhiên ban đầu nhỏ, với vùng
không gian trạng thái được thu hẹp xung quanh điểm cân bằng ngược, và được mở
rộng dần ra, cùng với chất lượng điều khiển được tăng dần. Các mô phỏng trên con lắc
hai chiều được thực hiện trong điều kiện con lắc di chuyển theo một quỹ đạo cho trước
trên một mặt phẳng trong điều kiện bị tác động mạnh của nhiễu bên ngoài và sự biến
thiên lớn các thông số của con lắc. Các kết quả mô phỏng trên matlab và simulink và
trên thực nghiệm thông qua phần mềm CCS đã cho thấy khả năng thích nghi trước sự
thay đổi của các thông số mô hình và tính bền vững của bộ điều khiển được đề nghị
dưới tác động mạnh của nhiễu bên ngoài. Cũng trong chương này, một số kết quả mô
phỏng điều khiển DNNSMC trên con lắc ngược xoay cũng được đưa ra nhằm so sánh
với phương pháp điều khiển DANSMC.
Chương năm khái quát lại sự khác biệt và các kết quả đạt được của các phương
pháp nghiên cứu trong luận án so với các phương pháp nghiên cứu khác và nêu lên
một số tồn tại cũng như phương hướng nghiên cứu khắc phục.
8
2 LÝ THUYẾT CƠ SỞ
Hình thành và phát triển từ thập niên năm mươi của thế kỷ hai mươi, điều khiển
trượt đã trở nhanh chóng trở thành một trong những phương pháp kinh điển được ưa
chuộng trong các phương pháp điều khiển các hệ phi tuyến. Nhờ vào tính năng giảm
bậc, ít nhạy đối với nhiễu, với sự biến thiên của các thông số của đối tượng, điều khiển
trượt trở thành một công cụ mạnh để điều khiển các hệ thống động học bậc cao, phức
tạp dưới các điều kiện bất định của hệ thống.
Các nghiên cứu lý thuyết và thực hành điển hình về điều khiển trượt cổ điển đã
được trình bày đầy đủ trong các tài liệu [1], [11], [12], [13], [14].
Trong những năm gần đây nhiều công trình nghiên cứu kết hợp giữa điều khiển
trượt cổ điển và điều khiển thông minh đã được công bố nhằm khắc phục một số
nhược điểm còn tồn tại của điều khiển trượt cổ điển về tính tối ưu của tín hiệu điều
khiển, hiện tượng chattering của các biến trạng thái xung quanh mặt trượt…, cũng như
phát triển các luật điều khiển trượt mà không cần biết chính xác các thông số của đối
tượng.
Tổng hợp từ các nghiên cứu trên, chương này và trình bày lại một số nội dung
chính, làm cơ sở để phát triển cho mô hình điều khiển trượt phân ly DANSMC sẽ được
trình bày trong chương ba:
- Mô hình toán học của điều khiển trượt cổ điển dưới dạng tổng quát và phát triển
mô hình toán học của bộ điều khiển nhằm áp dụng cho các hệ thống phi tuyến bậc cao
MIMO.
- Mô hình toán học và các công thức để huấn luyện của mạng nơ-ron truyền
thẳng nhiều lớp làm cơ sở để phát triển cho các mô hình điều khiển trượt dùng mạng
nơ-ron và mô hình điều khiển trượt ANSMC được trình bày trong chương ba.
- Một số nghiên cứu về điều khiển trượt thích nghi ứng dụng mạng nơ-rôn đã
được công bố trong và ngoài nước được trình bày lại theo thứ tự phát triển từ những ý
tưởng nghiên cứu ban đầu tới các công trình lý thuyết và thực tiễn đã được công bố
trong những năm gần đây.
9
2.1 Lý thuyết điều khiển trượt
2.1.1 Đối tượng điều khiển
Xét hệ thống phi tuyến biểu diễn bởi phương trình vi phân
duyygyyfy
nnn
++=
−−
).,.,.,,(),.,.,(
)1()1()(
(2.1)
Trong đó d là nhiễu
Đặt
)1(
321
,,,
−
====
n
n
yxyxyxyx
&&&
(2.2)
và
T
n
xxxx ] ,,[
21
=
ta được biểu diễn trạng thái :
++=
=
=
=
−
duxgxfx
xx
xx
xx
n
nx
).()(
1
32
21
&
&
M
&
&
1
xy
=
(2.3)
Bài toán điều khiển được đặt ra là xác định tín hiệu điều khiển u sao cho tín hiệu
ra y bám theo tín hiệu đặt r.
2.1.2 Mặt trượt
Định nghĩa tín hiệu sai lệch
r
y
e
−
=
(2.4)
và tín hiệu s
ecececes
n
n
n
12
)2(
1
)1(
++++=
−
−
−
&
(2.5)
Trong đó c
1
, , c
n-1
, là các hệ số được chọn trước sao cho đa thức đặc trưng của
phương trình vi phân sau Hurwitz (có tất cả các nghiệm với phần thực âm)
0
12
)2(
1
)1(
=++++
−
−
−
ececece
n
n
n
&
(2.6)
Nếu thực hiện được luật điều khiển sao cho s = 0, tín hiệu sai lệch e là nghiệm
của phương trình (2.6). Do các nghiệm của phương trình đặc trưng của (2.6) đều nằm
bên trái mặt phẳng phức, nên e(t) sẽ tiến tới 0 khi t tiến tới ∞. Phương trình s=0 xác
định một mặt cong S trong không gian n chiều gọi là mặt trượt (sliding surface) S.
10
Vấn đề đặt ra là xác định luật điều khiển u để đưa các quỹ đạo pha của hệ thống
về mặt trượt và duy trì trên mặt trượt một cách bền vững đối với các biến động của
( )
f x
và
( )
g x
.
Vấn đề chọn lựa các hệ số cho mặt trượt S.
Như đã phân tích ở trên, nếu có thể điều khiển được các trạng thái tiến tới mặt
trượt (s=0), thì các tín hiệu sai lệch e sẽ tiến tới 0 khi t tiến tới ∞. Đ áp ứng của các sai
số trạng thái khi tiến về 0 phụ thuộc vào cách chọn lựa các hệ số cho mặt trượt.
Để làm rõ điều này, chúng ta lấy một ví dụ đơn giản sau :
Cho một mặt trượt được biểu diễn bằng sai số trạng thái như sau :
eecs
&
+
=
.
(2.7)
Để phương trình :
0
.
=
+
e
e
c
&
Hurwitz, ta chỉ cần chọn c>0.
Giả sử, ta đã tìm được các luật điều khiển sao cho s đạt tới giá trị không. Khi đó
phương trình (2.7) có thể viết lại :
e
c
e
.
−
=
&
(2.8)
(2.8) cho thấy e(t) có dạng hàm mũ và đạt tới giá trị lân cận 0, sau khoảng thời
gian
c
t
/
3
.
3
=
≈
τ
.
Một cách tổng quát, để chọn các giá trị cho các hệ số của s, cần phải chọn trước
đáp ứng của sai số trạng thái theo mong muốn, chọn các cực tương ứng nằm bên trái
mặt phẳng phức, từ đó suy ra các hệ số cần tìm.
2.1.3 Luật điều khiển trượt kinh điển
Lấy đạo hàm (2.50), ta có:
nn
n
n
n
n
n
n
n
ruxgdecececxf
ecececrduxgxf
ecececes
−++++++=
++++−++=
++++=
−
−
−
−
−
−
).( )(
).()(
12
)1(
1
12
)1(
1
)(
12
)1(
1
)(
&&&
&&&
&&&&
(2.9)
Nếu chọn luật điều khiển sao cho
)(. ssignks
−
=
&
,
0
>
k
(2.10)
Lúc đó
0.
<
ss
&
nên
0
>
−
s
khi
t
− > ∞
Luật điều khiển trượt cổ điển có thể tính chính xác bằng cách thay (2.10) vào
(2.9) và rút u ra như sau:
11
(
)
)(
12
)1(
1
)( )(
)(
1
nn
n
rdssignkecececxf
xg
u +−+++++−=
−
−
&&&
(2.11)
Luật điều khiển trượt có tính đến các thành phần bất định
Trong thực tế luật điều khiển trượt cần tính tới các thành phần bất định như nhiễu
hệ thống cũng như sự biến thiên theo thời gian của
)(xf
và
)(xg
.
Gọi
),( txf
∆
,
),( txg
∆
là các thành phần bất định của
),( txf
và
),( txg
của hệ
thống
),()(),(
0
txfxftxf ∆+=
(2.12)
Và
),()(),(
0
txgxgtxg ∆+=
(2.13)
Trong đó
)(
0
xf
và
)(
0
xg
là các hàm danh định của hệ thống
Giả sử rằng
),( txf
∆
,
),( txg
∆
và nhiễu d là không tính được tại từng thời điểm
nhưng có thể biết được các chặn trên và dưới cụ thể là:
max
),(
ftxf ∆≤∆
,
min
),(
gtxg ∆≥∆
, và
Dtd ≤
)(
(2.14)
Định nghĩa hàm V
2
1
2
V s
=
(2.15)
Điều kiện của luật điều khiển trượt là
0<V
&
(2.16)
Ta có :
( ) ( )( )
usgxgxgxgs
ustxgdecececrtxfsssV
n
n
)(.)(.
.).,() ),(.(.
min0min0
12
)1(
1
∆++∆+≤
+++++−==
−
−
δ
&&&&
&
(2.17)
Trong đó :
),()()(
max0
txxx
δδδ
+=
(2.18)
Với
( )
) )((
)(
1
)(
12
)1(
1
)(
0
min0
0
ecececrxf
gxg
x
n
n
n
&&&
++++−
∆+
=
−
−
δ
(2.19)
Và
( )
( )
Df
gxg
tx +∆
∆+
=
max
min0
max
)(
1
),(
δ
(2.20)
12
Nếu luật điều khiển u được chọn sao cho
0<V
&
, khi đó
0
>
−
s
, khi
∞
>
−
t
Từ (2.62) suy ra luật điều khiển trượt có tính đến các thành phần bất định như
sau:
0 max
( ). ( ( )). ( ) ( , ). ( ( )). ( )
equivalent corrective
u u u
x sign g x sign s x t sign g x sign s
δ δ
= + =
− −
(2.21)
Trong đó
)()).(().(
0
ssignxgsignxu
equivalent
δ
−=
là thành phần điều khiển phụ thuộc
vào mô hình danh định của hệ thống còn gọi là thành phần điều khiển tương đương.
)()).((),.(
max
ssignxgsigntxu
corrective
δ
−=
là thành phần điều khiển bền vững, còn gọi
là thành phần điều khiển hiệu chỉnh có tác dụng bù cho các thành phần bất định của hệ
thống và có giá trị phụ thuộc vào các chặn trên của các thành phần bất định của hệ
thống. Thường thì
max
δ
được chọn bằng một hệ số dương k với
( )
( )
Df
gxg
k
x
+∆
∆+
=
max
min0
)(
1
sup
(2.22)
2.1.4 Điều khiển trượt cho hệ thống MIMO
Xét một hệ thống phi tuyến MIMO
( ) ( )
x= f x +g x .u
&
( )
y h x
=
(2.23)
Trong đó
[
]
1
, ,
T
n
x x x
=
[
]
1
( ) ( ) . . ( )
T
n
f x f x f x
=
11
22
( 1)( 1)
( ) 0 0 0
0 ( ) 0 0
( )
0 0 ( ) 0
0 0 0 ( )
n m
nm
g x
g x
g x
g x
g x
− −
=
(2.24)
1
]
[ , ,
T
m
u u u
=
(2.25)
1
( ) [ ( ) ( )]
T
p
h x h x h x
=
Hệ thống có bậc tương đối
13
.
f g f
h
y x L h L h.u L h
x
∂
= = + =
∂
& &
( )
2 2
.
f
f g f f
L h
y f g u L h L L h L h
x
∂
= + = + =
∂
&&
M
( 1) 1
m m
f
y L h
− −
=
( ) ( 1)
.
m m m
f g f
y L h L L h u
−
= +
(2.26)
Định nghĩa tín hiệu sai lệch
e y r
= −
(2.27)
Và
( 1) ( 2)
1 1
m m
m
s e c e c e
− −
−
= + + +
(2.28)
Trong đó
1
c
, …
1
m
c
−
là các ma trận (
p p
×
) được chọn sao cho (2.28) Hurwitz
Định nghĩa
1
2
T
V s s
=
(2.29)
Luật điều khiển trượt được xác định sao cho
( )
. . . . ( ( ))
T T
dV V d s
V s s k s diag sign s
dt s dt
∂
= = = = −
∂
&
&
(2.30)
Ta có
( ) ( 1)
1 1
( ) ( 1) ( ) ( 1)
1 1
. ( ( ))
.
m m
m
m m m m
f g f m
s k diag sign s e c e c e
L h L L hu r c e c e
−
−
− −
−
= − = + + +
= + − + + +
& &
&
(2.31)
Rút u ra ta có:
(
)
( )
(
)
1
( 1) ( ) ( 1)
1 1
. ( )
m m m
g f f m
u L L h L h c e c e k diag sign s
−
− −
−
= − + + + +
&
(2.32)
(2.32) thực hiện được khi số ngõ vào bằng số ngõ ra và bằng bậc của hệ thống
(
m p n
= =
). Trong trường hợp đó hệ thống (2.23) được gọi là hệ thống chuẩn. Trong
thực tế nhiều hệ thống phi tuyến có số ngõ vào điều khiển ít hơn số bậc của hệ thống,
điển hình là các hệ thống cơ khí như xe con lắc ngược hoặc con lắc ngược xoay …, lúc
đó bài toán thiết kế điều khiển trượt trở nên phức tạp hơn. Trong [1], Utkin đã trình
bày một số phương pháp thiết kế điều khiển trượt phân ly áp dụng được cho các hệ
thống phi tuyến đa biến có số ngõ vào điều khiển ít hơn số bậc của hệ thống. Các
14
phương pháp này dựa trên cơ sở phép đổi biến để đưa hệ thống trở về dạng chuẩn, và
đã áp dụng thành công cho các hệ thống bậc bốn.
2.1.5 Đặc điểm của điều khiển trượt
Hình 2-1 Tín hiệu điều khiển trượt có dạng chuyển mạch
Từ mục 2.1.3 và 2.1.4 cho thấy để tính toán thành phần điều khiển tương đương
của điều khiển trượt đòi hỏi phải biết đầy đủ các hàm danh định của đối tượng, và để
tính toán thành phần điều khiển bền vững cần phải biết các chặn trên của hệ thống và
nhiễu.
Hàm dấu trong thành phần điều khiển của điều khiển trượt cổ điển tạo nên hiện
tượng đảo cực trong tín hiệu điều khiển (tín hiệu điều khiển có dạng chuyển mạch) với
tần số cao nhất bằng tần số lấy mẫu và cộng với hiện tượng trễ vật lý của các đối
tượng được điều khiển tạo nên hiện tượng dao động của các quỹ đạo pha xung quanh
mặt trượt, còn gọi là hiện tượng chattering.
15
Hình 2-2 Mô phỏng quỹ đạo pha và hiện tượng chattering
Nếu hệ số k được chọn càng lớn thì tính bền vững của hệ thống càng cao, đồng
thời hiện tượng chattering xuất hiện càng mạnh. Hiện tượng chattering gây ra một số
hiệu ứng không mong muốn như : phát sinh sai số điều khiển; làm phát nóng mạch
điện tử; mài mòn các bộ phận cơ khí; kích động các mode tần số cao không mô hình
hóa làm giảm chất lượng điều khiển hoặc mất ổn định.
Bài toán điều khiển trượt áp dụng cho các hệ thống đa biến cần kết hợp giữa điều
khiển trượt và điều khiển phân ly. Các phương pháp này dựa trên việc phân tích mô
hình toán học cụ thể của từng đối tượng và rất phức tạp.
2.2 Xấp xỉ hàm của mạng nơ-ron truyền thẳng
Ánh xạ vào ra của mạng hai lớp được biểu diễn như sau:
0 0
1 1
l n
i o ik h kj j k i
k j
u w v x v w
σ σ
= =
= + +
∑ ∑
;
mi , 2,1
=
(2.33)
Hoặc biểu diễn dưới dạng ma trận
(
)
(
)
(
)
(
)
T T T T T
o h v w o h
w v x b b w v
σ σ σ σ
= + + =
u x
(2.34)
Mạng một lớp ẩn SHL
Biểu diễn vào ra của mạng SHL
16
0 0
1 1
l n
i ik h kj j k i
k j
u w v x v w
σ
= =
= + +
∑ ∑
(2.35)
Mạng một lớp ẩn SHL và mạng hàm cơ sở xuyên tâm RBF là hai loại mạng nơ
ron căn bản thường được dùng để nhận dạng các hàm phi tuyến hoặc được sử dụng
như bộ điều khiển trực tiếp
Gọi x, u
r
là cặp tín hiệu vào ra mong muốn của một hàm phi tuyến f . Giả sử ta
muốn xấp xỉ f bởi mạng
(
)
(
)
ˆ
,
f N= =
u x x w
.
Định nghĩa hàm mục tiêu J như sau:
1
.
2
T
=
J e e
(2.36)
với
= −
r
e u u
.
Huấn luyện một mạng nơ ron nhiều lớp
(
)
wxN ,
để xấp xỉ hàm f là quá trình cập
nhật hiệu chỉnh lặp các tham số của mạng sao cho
min
− >
J
.
Lấy đạo hàm (2.36) ta có :
. . .
T T
d
dt
∂
= =
∂
&
& &
J e
= J e e e w
w
(2.37)
Vì
0
J >
điều kiện để
min
− >
J
khi
∞
>
−
t
là
0
<
&
J
nên có thể chọn
. .
T
e
µ
∂
= −
∂
&
e
w
w
(2.38)
trong đó
µ
là một hằng số dương
Quá trình huấn luyện mạng được thực hiện trong các khoảng thời gian rời rạc.
Gọi
τ
là thời gian lấy mẫu luật cập nhật cho
w
tại thời điểm k như sau
( )
( ) . . ( )
( )
T
k
k k
w k
η
∂
∆ = −
∂
e
w e
(2.39)
τ
µ
η
.
=
được gọi là hệ số học.
Áp dụng cụ thể vào mạng một lớp ẩn SHL
Xét một mạng SHL như đã mô tả ở mục (2.1.2), hàm tích hợp của các nơ ron ở
lớp ẩn là hàm tuyến tính
Định nghĩa: