Tải bản đầy đủ (.docx) (163 trang)

Xây dựng phương pháp điều khiển thích nghi trên nền tối ưu cho hệ lái tàu thủy

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.72 MB, 163 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC BÁCH KHOA HÀ NỘI

XÂY DỰNG PHƯƠNG PHÁP ĐIỀU KHIỂN THÍCH NGHI TRÊN NỀN TỐI ƯU
CHO HỆ LÁI TÀU THỦY


BỘ GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC BÁCH KHOA HÀ NỘI

XÂY DỰNG PHƯƠNG PHÁP ĐIỀU KHIỂN THÍCH NGHI TRÊN NỀN TỐI ƯU
CHO HỆ LÁI TÀU THỦY

Ngành: Kỹ thuật điều khiển và tự động hóa
Mã số: 9520216


Lời cam đoan

Tơi xin cam đoan đây là cơng trình nghiên cứu của cá nhân tôi dưới sự hướng dẫn của giáo viên
hướng dẫn và các nhà khoa học. Tài liệu tham khảo trong luận án được trích dẫn đầy đủ. Các
kết quả nghiên cứu của luận án là trung thực và chưa từng được các tác giả khác công bố.
Hà Nội, ngày …. . tháng …. năm 2022

Tập thể hướng dẫn

Nghiên cứu sinh

PGS. TS. GS. TS.

i




i


LỜI CẢM ƠN

Đầu tiên, nghiên cứu sinh xin gửi lời cảm ơn chân thành, sâu sắc nhất đến GS. TS. P, PGS. TS.
đã dành nhiều thời gian, tâm huyết để hướng dẫn, định hướng, tạo động lực nghiên cứu và hỗ trợ
nghiên cứu sinh về mọi mặt để hoàn thành luận án.
Cho phép nghiên cứu sinh được bày tỏ sự biết ơn sâu sắc tới các Thầy Cơ trong nhóm cơ sở Lý
thuyết điều khiển tự động đã có những chia sẻ quý báu về kiến thức, về phương pháp nghiên cứu
và những lời động viên tới NCS trong suốt tiến trình nghiên cứu đề tài.
Trong suốt quá trình học tập, nghiên cứu nghiên cứu sinh luôn luôn nhận được sự giúp đỡ tận
tình của các Thầy Cơ của Khoa Tự động hóa, Trường Điện-Điện tử và Phịng Đào tạo, Đại học Bách
Khoa Hà Nội đã tận tình giúp đỡ về mặt chuyên môn, hỗ trợ các thủ tục trong q trình học tập và
hồn thành luận án.
Nghiên cứu sinh cũng xin được gửi lời cảm ơn đến Ban Giám Hiệu trường Đại học Hải Phòng, đặc
biệt Khoa Điện Cơ, nơi tôi công tác đã tạo mọi điều kiện thuận lợi nhất cho NCS trong quá trình
thực hiện đề tài nghiên cứu.
Cuối cùng, nghiên cứu sinh xin được gửi lời biết ơn tới đồng nghiệp, gia đình, người thân đã luôn
động viên, chia sẻ, ủng hộ và giúp đỡ NCS trong suốt toàn bộ thời gian thực hiện nghiên cứu.
Hà Nội, ngày … tháng… năm 2022

Nghiên cứu sinh

ii


MỤC LỤC


MỤC LỤC

iii

DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT.................................................................................. vi
DANH MỤC CÁC BẢNG.................................................................................................................. x
DANH MỤC HÌNH VẼ...................................................................................................................... x
MỞ ĐẦU

..............................................................................................................................1

1. Tính cấp thiết của đề tài............................................................................................................... 1
2. Mục đích nghiên cứu.................................................................................................................... 2
3. Đối tượng và phạm vi nghiên cứu của luận án............................................................................. 2
4. Ý nghĩa khoa học và thực tiễn của luận án.................................................................................... 2
5. Phương pháp nghiên cứu............................................................................................................. 2
6. Bố cục của luận án........................................................................................................................ 3
Chương 1
1. 1

TỔNG QUAN VỀ MƠ HÌNH ĐỘNG LỰC HỌC TÀU THỦY VÀ TÌNH HÌNH NGHIÊN CỨU.
4
Mơ hình động lực học tổng qt của tàu thủy...................................................................... 4
1. 1. 1 Các chuyển động của tàu thủy trong hệ quy chiếu................................................... 4
1. 1. 2 Mơ hình động lực học của tàu thủy sáu bậc tự do.................................................... 7
1. 1. 3 Mơ hình động lực học của tàu thủy ba bậc tự do trên mặt phẳng nằm ngang....... 13

1. 2 Tổng quan tình hình nghiên cứu trong và ngồi nước về điều khiển chuyển động của tàu
thủy 15

1. 2. 1 Tổng quan tình hình nghiên cứu trong nước.......................................................... 15
1. 2. 2 Tổng quan tình hình nghiên cứu ngồi nước.......................................................... 16
1. 3

Hướng nghiên cứu của luận án........................................................................................... 19

1. 4

Cơ sở phương pháp luận của luận án.................................................................................. 19
1. 4. 1 Mạng nơ-ron xấp xỉ hàm......................................................................................... 19
1. 4. 2 Ổn định UUB........................................................................................................... 20
1. 4. 3 Giải thuật quy hoạch động thích nghi cho hệ phi tuyến.......................................... 22

1. 5
Chương 2
2. 1

Kết luận chương 1............................................................................................................... 32
ĐIỀU KHIỂN BÁM TỐI ƯU TÀU THỦY KHI CÓ MƠ HÌNH..........................................33
Tổng hợp bộ điều khiển cho hệ lái tàu thủy........................................................................ 33
2. 1. 1 Biến đổi mơ hình của tàu thủy................................................................................ 33
iii


2. 1. 2 Mơ tả bài tốn điều khiển tối ưu cho tàu thủy....................................................... 35
2. 1. 3 Thiết kế bộ điều khiển bám tối ưu dựa trên cấu trúc Actor-Critic........................... 35
2. 1. 4 Phát biểu định lý và chứng minh về tính ổn định của hệ kín................................... 39
2. 1. 5 Mô phỏng kiểm chứng............................................................................................ 42
2. 2 Thiết kế bộ điều khiển bám tối ưu dựa trên cấu trúc ADP-RISE cho tàu thủy có nhiễu đầu
vào 46

2. 2. 1 Tổng hợp bộ điều khiển bám tối ưu dựa trên cơ sở cấu trúc Actor-Critic................46
2. 2. 2 Thiết kế bộ điều khiển phản hồi RISE...................................................................... 49
2. 2. 3 Phát biểu định lý và chứng minh tính ổn định của hệ kín....................................... 51
2. 2. 4 Mô phỏng so sánh và đánh giá................................................................................ 56
2. 3 Thiết kế bộ điều khiển bám tối ưu dựa trên giải thuật ADP kết hợp với bộ ước lượng nhiễu
DO cho tàu có nhiễu đầu vào...................................................................................................... 65
2. 3. 1 Thiết kế điều khiển bù nhiễu................................................................................... 65
2. 3. 2 Tổng hợp bộ điều khiển bám tối ưu dựa trên cơ sở cấu trúc Actor-Critic................67
2. 3. 3 Phương pháp xác định véc-tơ hàm kích hoạt.......................................................... 69
2. 3. 4 Phát biểu định lý và chứng minh tính ổn định của hệ kín....................................... 72
2. 3. 5 Mô phỏng, so sánh và đánh giá............................................................................... 76
2. 4
Chương 3
3. 1

Kết luận chương 2............................................................................................................... 83
ĐIỀU KHIỂN BÁM TỐI ƯU TÀU THỦY KHI KHƠNG CĨ MƠ HÌNH..............................84
Phương trình HJI bám quỹ đạo và sự ổn định của phương pháp........................................ 84
3. 1. 1 Biến đổi mơ hình của tàu thủy................................................................................ 84
3. 1. 2 Phương trình Hamilton-Jacobi-Isaacs cho bài tốn điều khiển bám tối ưu quỹ đạo...
85
3. 1. 3 Sự suy giảm nhiễu và độ ổn định của giải pháp cho phương trình HJI.........................
87

3. 2

Thuật tốn off-policy IRL để giải phương trình HJI bám quỹ đạo........................................ 88
3. 2. 1 Thuật toán off-policy RL cho điều khiển tối ưu bền vững....................................... 88
3. 2. 2 Phân tích sự hội tụ của thuật toán 3. 1.................................................................. 89
3. 2. 3 Thuật toán off-policy IRL cho điều khiển tối ưu bền vững...................................... 95

3. 2. 4 Phân tích sự hội tụ của thuật tốn 3. 2.................................................................. 97
3. 2. 5 Thuật toán off-policy IRL cho điều khiển tối ưu bền vững sử dụng mạng nơ-ron... 98
3. 2. 6 Mô phỏng, so sánh và đánh giá............................................................................. 101

3. 3

Kết luận chương 3............................................................................................................. 108

iv


KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN CỦA LUẬN ÁN................................................................... 109
DANH MỤC CÁC CƠNG TRÌNH ĐƯỢC CƠNG BỐ....................................................................... 111
TÀI LIỆU THAM KHẢO.............................................................................................................. 112
PHỤ LỤC

118

v


v


DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT
Danh Mục Các Ký Hiệu

STT

Ký hiệu


1

¡

2

¡

3

¡

Giải thích
Tập các số thực

n

Khơng gian các tọa độ thực (khơng gian Euclide)

n

chiều.

Tập các ma trận có kích thước n ´ m chứa các phần tử số
thực

n´ m

Wx Ì ¡


n

4

Wx

5

Y (W)

Tập của các luật điều khiển chấp nhận được

6

C (v)

Ma trận Coriolis và lực hướng tâm của phương tiện hàng hải

7

C A (v)

8

D

Ma trận suy giảm thủy động lực học tuyến tính

9


Dn (v)

Ma trận suy giảm thủy động lực học phi tuyến

10

D (v)

Ma trận suy giảm thủy động lực học

11

g(h)

Véc-tơ lực đẩy và lực trọng trường

12

I0

13

J 1(h)

Ma trận quay chuyển đổi vận tốc dài

14

J 2(h)


Ma trận quay chuyển đổi vận tốc góc

15

J (h)

Ma trận quay chuyển đổi vận tốc dài và vận tốc góc

16

m

17

MA

Ma trận qn tính hệ thống của khối lượng nước kèm

18

M RB

Ma trận quán tính hệ thống vật rắn

19

t = [t T1 , t T2 ]T

20


t1 = é
X Y
ê
ë

Tập compact

Ma trận Coriolis và lực hướng tâm thủy động lực học khối
lượng nước kèm

Ma trận quán tính hệ thống xung quanh điểm O

Khối lượng của vật rắn

Lực và mô-men tác động lên thân tàu trong hệ tọa độ gắn thân
tàu (b-frame)
T


ú
û

Véc-tơ lực tác động lên thân tàu trong hệ tọa độ (b-frame)

vi


21


t2 = é
K
ê
ë

M

T


ú
û

Véc-tơ mô-men tác động lên thân tàu trong hệ tọa độ (b-frame)

22

tD

Véc-tơ lực và momem suy giảm

23

tH

Véc-tơ lực và momen thủy động lực

24

tw


Véc-tơ lực và mô-men do nhiễu tác động bên ngồi (sóng, gió,
dịng chảy,…)

25

t RB

Véc-tơ lực và mô-men tổng quát tác động lên tàu trong khung
tọa độ gắn thân

26

h = [hT1 , hT2 ]T

Véc-tơ biểu diễn vị trí và góc hướng của tàu trong hệ tọa độ
gắn trái đất

27

h1 = [x, y, z]T

Véc-tơ biểu diễn vị trí của tàu trong hệ tọa độ gắn trái đất

28

h2 = [f ,q, y ]T

Véc-tơ biểu diễn góc hướng của tàu trong hệ tọa độ gắn trái đất


29

v = [vT1 , vT2 ]T

Véc-tơ vận tốc dài và vận tốc góc trong hệ tọa độ gắn thân

30

v1 = [u, v, w]T

Véc-tơ vận tốc dài trong hệ tọa độ gắn thân

31

v2 = [p,q, r ]T

Véc-tơ vận tốc góc trong hệ tọa độ gắn thân

32

Tốc độ trượt dọc của tàu

34

u
v
w

35


p

Tốc độ lắc ngang của tàu

36

q

Tốc độ lắc dọc của tàu

37

Tốc độ quay trở của tàu

38

r
x

39

y

Tọa độ của tàu theo phương y hệ tọa độ NED

40

z

Tọa độ của tàu theo phương


41

f

Góc lắc ngang của tàu

42

q

Góc lắc dọc của tàu

43

y

Góc hướng, xung quanh trục

44

W

Ma trận trọng số lý tưởng của NN

45

f (x)

Véc-tơ hàm kích hoạt của NN


33

Tốc độ trượt ngang của tàu
Tốc độ trượt đứng của tàu

Tọa độ của tàu theo phương

vii

x

hệ tọa độ NED

z

hệ tọa độ NED

z

của tàu


46

J (x, u)

Hàm chi phí

47


V *(x)

Hàm Bellman

48

u

Véc tơ đầu vào điều khiển

49

u*

Véc tơ đầu vào điều khiển tối ưu

50

d

Véc-tơ nhiễu của hệ thống

51

In

Ma trận đơn vị có chiều n ´ n
Khụng gian Banach, nu


L2[0, Ơ )

52

Ơ

ũ

" d ẻ L2[0, Ơ )

thì

2

d dt < ¥

0

Danh Mục Các Chữ Viết Tắt

Ký hiệu
ADP

Thuật ngữ tiếng Anh

Giải thích

Adaptive Dynamic Programming

Quy hoạch động thích nghi


Actor-Critic Neural Netwoks

Cấu trúc điều khiển Actor-Critic
trong của giải thuật gồm hai NN:
Mạng critic xấp xỉ hàm đánh giá tối
ưu, mạng actor xấp xỉ luật điều khiển
tối ưu

Neural Netwok

Mạng nơ-ron nhân tạo

Actor NN

Actor Neural Network

Mạng nơ-ron actor

Critic NN

Critic Neural Network

Mạng nơ-ron critic

MLP

Multi-Layer Perceptron

NN truyền thẳng nhiều lớp


ARE

Algebraic Riccati Equation

Phương trình đại số Riccati

HJB

Hamilton-Jacobi-Bellman

Phương trình vi phân đạo hàm riêng
HJB

HJI

Hamilton-Jacobi-Isaacs

Phương trình vi phân đạo hàm riêng
HJI

PE

Persistence of Excitation

Điều kiện PE

PI

Policy Iteration


Thuật toán lặp để xấp xỉ luật điều
khiển tối ưu của giải thuật quy hoạch
động thích nghi

VI

Value Iteration

Thuật lặp giá trị để xấp xỉ hàm đánh
giá tối ưu của giải thuật quy hoạch
động thích nghi

AC-NNs

NN

viii


RL

Reinforcement Learning

Học tăng cường

Unifomly Ultimate Bounded

Bị chặn tới hạn đều


Ultimate Bounded

Bị chặn tới hạn

Globally Uniformly Ultimately
Bounded

Bị chặn tới hạn đều toàn cục

GUB

Globally Uniformly Bounded

Bị chặn đều toàn cục

ZDGT

Zero-sum Differential Game
Theory

UUB
UB
GUUB

LS

Lý thuyết trị chơi sai phân tổng bằng khơng
ứng dụng trong lý thuyết điều khiển tối ưu




Least Square

Phương pháp bình phương tối thiểu

Robust Integral of the Sign of
the Error

Tích phân bền vững hàm dấu sai lệch bám

Disturbance Observer

Bộ quan sát nhiễu

Off-Policy Integral
Reinforcement Learning

Học tăng cường tích phân với luật điều khiển
ngoại tuyến

Degree Of Freedom

Bậc tự do

Body–fixed reference frame

Khung tọa độ quy chiếu gắn với thân tàu

CG


Center of gravity

Trọng tâm

CB

Center of buoyancy

Tâm nổi

GPS

Global Positioning System

Hệ thống định vị toàn cầu

INS

Inertial Navigation System

Hệ thống dẫn đường quán tính

IFAC

International Federation of
Automatic Control

Hiệp hội quốc tế về tự động hóa

NED


North-East-Down

Hệ tọa độ có các trục hướng bắc – hướng
đông – hướng tâm trái đất

SNAME

Society of Naval Architects
and Marine Engineers

Hiệp hội kiến trúc hải quân và hàng hải

ECI

The Earth-centered inertial
frame

Khung tọa độ quán tính gốc trùng tâm trái
đất

ECEF

Earth-centered Earth-fixed
reference frame

Khung tọa độ tham chiếu có gốc trùng tâm
trái đất

RISE

DO
Off-Policy
IRL
DOF
BODY

ix


DANH MỤC CÁC BẢ
Bảng 1. 1 Các ký hiệu của SNAME (nguồn: [17]).............................................................................5Y
Bảng 2. 1 Các thông số của bộ điều khiển......................................................................................78
Bảng 2. 2 RMSE của hai bộ điều khiển............................................................................................81

DANH MỤC HÌNH
Hình 1. 1 Mơ tả các chuyển động của tàu đại dương (nguồn: [19]).................................................4
Hình 1. 2 Các khung tọa độ quy chiếu (nguồn: [18])........................................................................5
Hình 1. 3 Mơ tả động lực học tàu thủy trong khung tọa độ quy chiếu quán tính gắn với trái đất và
khung tọa độ gắn thân tàu (nguồn:[17])...........................................................................................8
Hình 1. 4 Mơ tả các thành phần chuyển động của tàu thủy trong mặt phẳng nằm ngang.............13
Hình 1. 5 Xấp xỉ hàm bằng mạng MLP một lớp ẩn..........................................................................20
Hình 1. 6 Cấu trúc AC-NNs xấp xỉ nghiệm phương trình HJB........................................................24Y
Hình 2. 1 Cấu trúc điều khiển hệ thống lái tàu thủy sử dụng giải thuật ADP..................................39
Hình 2. 2 Sự hội tụ của ma trận trọng số AC-NNs trong quá trình học và điều khiển.....................43
Hình 2. 3 Quỹ đạo bám – quỹ đạo đường tròn sử dụng giải thuật ADP cấu trúc AC-NNs...............43
Hình 2. 4 Sai lệch bám quỹ đạo theo trục x - quỹ đạo hình trịn....................................................44
Hình 2. 5 Sai lệch bám quỹ đạo theo trục y - quỹ đạo hình trịn....................................................44
Hình 2. 6 Sai lệch bám quỹ đạo theo góc

y


- quỹ đạo hình trịn...................................................44

Hình 2. 7 Đầu vào điều khiển của hệ thống – quỹ đạo hình trịn...................................................44
Hình 2. 8 Cấu trúc điều khiển ADP-RISE cho hệ lái tàu thủy...........................................................51
Hình 2. 9 Sự hội tụ của ma trận trọng số AC-NNs trong quá trình học và điều khiển.....................57
Hình 2. 10 So sánh điều khiển bám quỹ đạo trịn, khi chưa có nhiễu.............................................58
Hình 2. 11 So sánh sai số điều khiển bám quỹ đạo tròn theo trục x, khi chưa có nhiễu.................58
Hình 2. 12 So sánh sai số điều khiển bám quỹ đạo tròn theo trục y, khi chưa có nhiễu.................58
Hình 2. 13 So sánh sai số điều khiển bám quỹ đạo tròn theo trục

y , khi chưa có nhiễu..............59

Hình 2. 14 So sánh điều khiển bám quỹ đạo tròn, nhiễu hàm “1” tác động...................................59
x


Hình 2. 15 So sánh sai số điều khiển bám quỹ đạo trịn theo trục x...............................................59
Hình 2. 16 So sánh sai số điều khiển bám quỹ đạo tròn theo trục y...............................................60
Hình 2. 17 So sánh sai số điều khiển bám quỹ đạo trịn theo trục

y ............................................60

Hình 2. 18 So sánh điều khiển bám quỹ đạo tròn, nhiễu hàm “2” tác động...................................60
Hình 2. 19 Sai lệch bám quỹ đạo theo trục x - quỹ đạo đường trịn..............................................61
Hình 2. 20 Sai lệch bám quỹ đạo theo trục y - quỹ đạo đường trịn.............................................61
Hình 2. 21 Sai lệch bám quỹ đạo theo góc

y - quỹ đạo đường trịn..............................................61


Hình 2. 22 Sai lệch ước lượng thành phần bất định và nhiễu đầu vào f1 + t n1 ...........................62
Hình 2. 23 Sai lệch ước lượng thành phần bất định và nhiễu đầu vào f2 + t n 2 ...........................62
Hình 2. 24 Sai lệch ước lượng thành phần bất định và nhiễu đầu vào f3 + t n 3 ...........................62

x


Hình 2. 25 Đầu vào điều khiển trên trục x ....................................................................................63
Hình 2. 26 Đầu vào điều khiển trên trục y ....................................................................................63
Hình 2. 27 Đầu vào điều khiển trên trục y ...................................................................................63
Hình 2. 28 Cấu trúc bộ điều khiển tối ưu sử dụng giải thuật ADP cấu trúc AC-NNs.......................72
Hình 2. 29 Sự hội tụ của ma trận trọng số AC-NNs trong quá trình học và điều khiển...................78
Hình 2. 30 So sánh điều khiển bám quỹ đạo tròn của bộ điều khiển đề xuất ADP-DO với bộ điều
khiển AOBC [63]..............................................................................................................................79
Hình 2. 31 So sánh sai số bám trục x của hai bộ điều khiển...........................................................80
Hình 2. 32 So sánh sai số bám trục y của hai bộ điều khiển...........................................................80
Hình 2. 33 So sánh sai số bám trục y của hai bộ điều khiển.........................................................80
Hình 2. 34 Ước lượng thành phần bất định và nhiễu đầu vào

h1

của bộ DO và............................81

Hình 2. 35 Ước lượng thành phần bất định và nhiễu đầu vào

h2

của bộ DO và............................81

Hình 2. 36 Ước lượng thành phần bất định và nhiễu đầu vào


h3

của bộ DO và............................82

Hình 2. 37 Đầu vào điều khiển của hệ thống theo các trục

x, y, y

8

Hình 3. 1 Cấu trúc điều khiển tối ưu bền vững cho mơ hình tàu thủy sử dụng............................100
Hình 3. 2 So sánh điều khiển bám quỹ đạo tròn của Actor-Critic và off-policy IRL, khi khơng có
nhiễu tác động..............................................................................................................................102
Hình 3. 3 So sánh sai số bám trục x của Actor-Critic và off-policy IRL...........................................102
Hình 3. 4 So sánh sai số bám trục y của Actor-Critic và off-policy IRL...........................................102
Hình 3. 5 So sánh sai số bám trục y của Actor-Critic và off-policy IRL........................................103
Hình 3. 6 So sánh điều khiển bám quỹ đạo tròn của Actor-Critic và off-policy IRL, khi chịu tác động
của nhiễu hàm “1”.........................................................................................................................103
Hình 3. 7 So sánh sai số bám trục x của của off-policy IRL và Actor-Critic, khi chịu tác động của
nhiễu hàm “1”...............................................................................................................................104
Hình 3. 8 So sánh sai số bám trục y của của off-policy IRL và Actor-Critic, khi chịu tác động của
nhiễu hàm “1”...............................................................................................................................104
xi


Hình 3. 9 So sánh sai số bám trục y của off-policy IRL và Actor-Critic khi chịu tác động của nhiễu
hàm “1”.........................................................................................................................................104
Hình 3. 10 So sánh điều khiển bám quỹ đạo tròn của Actor-Critic và off-policy IRL, khi chịu tác
động của nhiễu hàm “2”................................................................................................................105

Hình 3. 11 Sai số bám theo trục

x

của off-policy IRL với nhiễu hàm “2”....................................105

Hình 3. 12 Sai số bám theo trục y của off-policy IRL với nhiễu hàm “2”....................................106
Hình 3. 13 Sai số bám theo trục

y

của off-policy IRL với nhiễu hàm “2”....................................106

Hình 3. 14 Đầu vào điều khiển trên trục

x

của off-policy IRL với...............................................106

Hình 3. 15 Đầu vào điều khiển trục y của off-policy IRL với.......................................................107
Hình 3. 16 Đầu vào điều khiển trục

y

của off-policy IRL với.......................................................107

xi


MỞ ĐẦU

1. Tính cấp thiết của đề tài
Vận tải biển đóng một vai trị rất quan trọng trong thương mại quốc tế bởi vì khoảng 80% lượng
hàng hóa xuất nhập khẩu được vận chuyển qua đường biển. Vận tải biển là một thị trường lớn và
vì lợi ích thiết yếu của nó, chẳng hạn như phạm vi vận chuyển rộng, khối lượng vận chuyển lớn,
chi phí vận chuyển thấp…Vì vậy, những nghiên cứu cải thiện hệ thống điều khiển bám quỹ đạo của
tàu thủy nhằm nâng cao hiệu quả vận chuyển và đảm bảo an tồn hàng hải ln là cấp thiết và có
ý nghĩa to lớn. Tuy nhiên, việc điều khiển chuyển động của tàu thủy đạt được chất lượng cao là
một thách thức đối với các nhà khoa học vì những lý do chính sau đây:
1) Phương tiện hàng hải hoạt động trong môi trường động, phức tạp, khơng có cấu trúc xác định
và chịu ảnh hưởng của nhiễu đầu vào không dự báo được đối với hệ thống điều khiển, ví dụ như:
dịng chảy đại dương, sóng, gió,. . . nên hiệu suất bám quỹ đạo bị giảm đáng kể [1].
2) Mơ hình động lực học của tàu thủy là mơ hình phi tuyến bất định và các tham số của mơ hình
phụ thuộc vào các biến trạng thái của tàu. Động lực học của tàu thường được mơ tả là hệ
phương trình vi phân phi tuyến bậc cao. Động học của tàu thủy có các tính chất đặc thù như:
hằng số thời gian quán tính lớn, biên độ dự trữ ổn định nhỏ và có dao động [2, 3]. Để nâng cao
độ chính xác bám quỹ đạo cho tàu thủy, có rất nhiều phương pháp điều khiển khác nhau đã được
nghiên cứu, đề xuất [2,4–9]. Mặc dù vậy, việc đảm bảo bám quỹ đạo và ổn định trong mơi
trường có nhiễu tác động đối với tàu thủy ln ln là một thách thức.
Trong khi đó, nguồn năng lượng lữu trữ trên tàu là hữu hạn do vậy để đảm bảo tàu chuyển động
trên quãng đường dài, bài toán tối ưu năng lượng cũng cần được đề cập tới. Tuy nhiên, cho đến
nay, có rất ít các cơng trình nghiên cứu phương pháp điều khiển tối ưu cho tàu thủy. Thơng
thường, bài tốn điều khiển tối ưu cho tàu thủy là bài toán phi tuyến, nên để tìm nghiệm tối ưu
người ta thường đưa về bài tốn tìm nghiệm của phương trình HJB [10]. Đối với hệ tuyến tính
phương trình HJB trở thành phương trình Riccati. Cho đến nay, chưa có lời giải tổng qt cho
phương trình HJB vì việc tìm nghiệm của phương trình này rất khó khăn. Trong những năm gần
đây nghiên cứu xấp xỉ nghiệm của phương trình HJB bằng quy hoạch động thích nghi (ADP) được
quan tâm phát triển [10, 11, 12, 13]. Giải thuật ADP sử dụng NN để xấp xỉ các hàm giá trị, đặc
điểm chung của cấu trúc điều khiển ADP thường sử dụng hai NN hoặc ba NN để xấp xỉ hàm.
Trong đó, một NN xấp xỉ luật điều khiển tối ưu (actor NN), một NN còn lại xấp xỉ hàm chi phí tối
ưu (critic NN), một NN (disturber NN) có thể được thêm vào cấu trúc ADP để xấp xỉ luật nhiễu xấu

nhất. Nghiệm xấp xỉ trên cơ sở giải thuật ADP thường được giải trực tuyến.
Những năm gần đây, ứng dụng giải thuật ADP trong bài toán bám tối ưu quỹ đạo cho các hệ thống
phi tuyến liên tục được nghiên cứu và phát triển mạnh mẽ [14, 15], nhưng riêng áp dụng cho hệ
thống lái tàu thủy được nghiên cứu rất ít. Chính vì vậy, việc nghiên cứu phát triển áp dụng giải
thuật ADP trong điều khiển bám tối ưu quỹ đạo cho tàu thủy luôn là thách thức và động lực đối
với các nhà khoa học. Đây cũng chính là động lực thúc đẩy việc lựa chọn đề tài nghiên cứu của
tác giả.

1


2. Mục đích nghiên cứu
Mục đích của đề tài là nghiên cứu, đề xuất và phát triển những bộ điều khiển bám tối ưu quỹ đạo
mới nhằm nâng cao chất lượng điều khiển, tiết kiệm nặng lượng và đảm bảo tính ổn định cho hệ
lái tự động tàu thủy trong điều kiện có nhiễu tác động. Để thực hiện được mục tiêu này, luận án
đặt ra những nhiệm vụ chính sau:
- Nghiên cứu mơ hình động lực học của tàu thủy và các phương pháp điều khiển hiện đại cho hệ
lái tàu thủy đã cơng bố trong nước và ngồi nước những năm gần đây, từ đó tìm ra hướng nghiên
cứu mới cho luận án.
- Nghiên cứu, đề xuất thuật toán điều khiển bám tối ưu mới dựa trên giải thuật ADP có cấu trúc
điều khiển AC-NNs kết hợp với bộ ước lượng nhiễu.
- Nghiên cứu, đề xuất giải thuật điều khiển tối ưu bền vững dựa trên thuật toán off-policy IRL cho
hệ lái tàu thủy trong điều kiện có nhiễu tác động.
3. Đối tượng và phạm vi nghiên cứu của luận án
Đối tượng nghiên cứu của luận án: Hệ thống lái tàu nổi như tàu tuần tra, tàu dịch vụ…, có mơ
hình phi tuyến bất định, chịu ảnh hưởng của nhiễu ngồi khơng biết trước (sóng, gió, dịng chảy…)
và đủ cơ cấu chấp hành.
Phạm vi nghi cứu của luận án: Luận án tập trung xây dựng bộ điều khiển bám tối ưu mới cho hệ
thống dựa trên lý thuyết điều khiển phi tuyến và lý thuyết điều khiển tối ưu, cho các tàu hoạt
động trên biển trong điều kiện có các nhiễu (sóng, gió, dịng chảy…) bị chặn.

4. Ý nghĩa khoa học và thực tiễn của luận án
Luận án đã đưa ra được cấu trúc điều khiển mới. Các bộ điều khiển này được phân tích ổn định
dựa trên lý thuyết ổn định Lyapunov và được đánh giá thông qua mơ phỏng bằng phần mềm
Matlab, kết quả phân tích lý thuyết và mơ phỏng hồn tồn phù hợp và đáp ứng được các chỉ tiêu
chất lượng cho hệ thống lái tàu tự động. Luận án sẽ góp phần bổ sung các phương pháp điều
khiển bám tối ưu quỹ đạo mới cho hệ lái tàu thủy. Chính vì vậy, kết quả nghiên cứu của luận án
vừa có ý nghĩa khoa học vừa có ý nghĩa thực tiễn.
5. Phương pháp nghiên cứu
Để đạt được mục tiêu đề ra, phương pháp nghiên cứu của luận án tiến hành như sau:
- Phân tích các tài liệu khoa học, các cơng trình mới nhất đã được cơng bố trong và ngồi nước về
điều khiển tàu thủy. Đặc biệt là các phương pháp điều khiển hiện đại áp dụng cho mơ hình tàu
thủy đủ cơ cấu chấp hành, trên cơ sở đó đưa ra định hướng nghiên cứu các giải thuật điều khiển
mới cho hệ lái tàu thủy.
- Dựa trên lý thuyết điều khiển phi tuyến và điều khiển tối ưu xây dựng bài toán điều khiển bám
tối ưu cho hệ lái tàu thủy có xét tới ảnh hưởng của nhiễu.
- Chuyển bài toán xác định nghiệm tối ưu về bài tốn tìm nghiệm cho phương trình HJB, HJI.
Nghiên cứu, xấp xỉ nghiệm của HJB dựa trên giải thuật ADP kết hợp các phương pháp kháng
nhiễu.
2


- Các giải thuật mới được đề xuất, phân tích tính ổn định dựa trên lý thuyết Lyapunov và khảo sát
đánh giá thông qua mô phỏng bằng phần mềm Matlab.
6. Bố cục của luận án
Luận án được trình bày trong 3 chương với nội dung chính được tóm tắt như sau:
Chương 1: Tổng quan về mơ hình động lực học tàu thủy và tình hình nghiên cứu
Phân tích mơ hình động học và động lực học của tàu thủy, phân tích đặc điểm của mơ hình tàu
thủy. Nghiên cứu tổng quan các phương pháp điều khiển tàu thủy trong nước và ngồi nước đã
cơng bố và đề xuất hướng nghiên cứu của luận án. Trình bày một số cấu trúc điều khiển cơ bản
của giải thuật ADP như: AC-NNs, off-policy IRL được luận án sử dụng để phục vụ cho việc xây dựng

bộ điều bám tối ưu quỹ đạo mới ở các chương tiếp theo.
Chương 2: Điều khiển bám tối ưu cho tàu thủy khi có mơ hình
Xây dựng bộ điều khiển bám tối ưu cho tàu thủy ba bậc tự do có xét tới ảnh hưởng của nhiễu dựa
trên cấu trúc điều khiển AC-NNs. Các thành phần bất định của mơ hình và nhiễu đầu vào được
đưa về dạng véc-tơ hàm bất định và được ước lượng bởi các bộ ước lượng RISE và DO. Bộ điều
khiển bám tối ưu cho hệ lái tàu thủy được đề xuất trên cơ sở kết hợp giữa ADP và các bộ ước
lượng RISE, DO. Các định lý về tính ổn định của hệ kín được phát biểu và chứng minh chặt chẽ.
Các kết quả phân tích lý thuyết được đánh giá thơng qua mô phỏng bằng phần mềm Matlab.
Chương 3: Điều khiển bám tối ưu cho tàu thủy khi khơng có mơ hình
Trong chương 3, luận án tập trung nghiên cứu xây dựng bộ điều khiển bám tối ưu bền vững cho
mô hình tàu thủy. Bộ điều khiển tối ưu bền vững được thiết kế cho hệ lái tàu thủy dựa trên thuật
tốn off-policy IRL khơng u cầu thơng tin động học của hệ thống, có xét tới ảnh hưởng của
nhiễu đầu vào. Sự hội tụ của thuật tốn được trình bày và chứng minh trong các định lý. Các kết
quả phân tích lý thuyết được đánh giá thơng qua mơ phỏng bằng phần mềm Matlab.

3



×