Tải bản đầy đủ (.pdf) (54 trang)

Ứng dụng mạng rnn để ước lượng trạng thái kích hoạt sự kiện cho một số lớp hệ điều khiển

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.61 MB, 54 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC QUY NHƠN

——————————

PHẠM NỮ NGỌC DIỆP

ỨNG DỤNG MẠNG RNN ĐỂ ƯỚC
LƯỢNG TRẠNG THÁI KÍCH HOẠT

SỰ KIỆN CHO MỘT SỐ LỚP HỆ
ĐIỀU KHIỂN

ĐỀ ÁN THẠC SĨ KHOA HỌC DỮ LIỆU ỨNG DỤNG

Bình Định - Năm 2023

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC QUY NHƠN

——————————

PHẠM NỮ NGỌC DIỆP

ỨNG DỤNG MẠNG RNN ĐỂ ƯỚC
LƯỢNG TRẠNG THÁI KÍCH
HOẠT SỰ KIỆN CHO MỘT SỐ
LỚP HỆ ĐIỀU KHIỂN

Ngành: Khoa học dữ liệu ứng dụng
Mã số: 8904648



Người hướng dẫn 1: PGS.TS. Đinh Công Hướng
Người hướng dẫn 2: TS. Lê Quang Thuận

Lời cam đoan

Đề án với đề tài “Ứng dụng mạng RNN để ước lượng trạng thái kích hoạt
sự kiện cho một số lớp hệ điều khiển” được hoàn thành tại Trường Đại học Quy
Nhơn dưới sự hướng dẫn của PGS.TS. Đinh Công Hướng và TS. Lê Quang Thuận. Tơi
xin cam đoan đây là cơng trình nghiên cứu của tôi. Các kết quả trong đề án là trung
thực, được các đồng tác giả cho phép sử dụng và chưa từng được ai cơng bố trước đó.

Người hướng dẫn thứ nhất Người hướng dẫn thứ hai Học viên thực hiện

PGS.TS. Đinh Công Hướng TS. Lê Quang Thuận Phạm Nữ Ngọc Diệp

iii

Lời cảm ơn

Để hoàn thành tốt đề án này, ngoài sự cố gắng của bản thân, tơi cịn nhận được sự
giúp đỡ nhiệt tình của các giảng viên trong và ngoài trường Đại học Quy Nhơn cùng
tồn thể các bạn học viên.

Tơi xin gửi lời cảm ơn chân thành và sự tri ân sâu sắc đến PGS.TS. Đinh Công
Hướng - Giảng viên Trường Đại học Cơng nghiệp Thành phố Hồ Chí Minh đã định
hướng và dẫn dắt trong suốt q trình tơi theo học và hoàn thành đề án.

Tơi xin chân thành cảm ơn tồn thể giảng viên của Trường Đại học Quy Nhơn
nói chung và Khoa Tốn-Thống kê nói riêng vì đã tận tâm dạy bảo các học viên hoàn

thành các học phần trong năm học; đặc biệt sự góp ý và nhận xét của TS. Lê Quang
Thuận đối với đề án này.

Do hạn chế về kiến thức, kinh nghiệm, thời gian tìm hiểu và thực hiện nên đề án
mặc dù đã được chỉnh sửa nhiều lần nhưng khó tránh khỏi những thiếu sót và gây cho
người đọc cảm giác khó hiểu. Tơi rất mong sẽ nhận được nhiều ý kiến đóng góp của
thầy, cơ và các bạn để tơi có được cái nhìn sâu sắc hơn về vấn đề này.

Quy Nhơn, ngày 12 tháng 11 năm 2023
Học viên thực hiện

Phạm Nữ Ngọc Diệp

iv

Mục lục

Lời cam đoan iii

Lời cảm ơn iv

Một số ký hiệu vii

1 Kiến thức chuẩn bị 5

1.1 Lý thuyết ước lượng trạng thái các hệ điều khiển . . . . . . . . . . . . 5

1.2 Học máy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.3 Các kiến thức liên quan . . . . . . . . . . . . . . . . . . . . . . . . . . 12


2 Ước lượng trạng thái kích hoạt sự kiện cho một số lớp hệ điều khiển

phi tuyến bậc nguyên 17

2.1 Xấp xỉ một số lớp hệ điều khiển phi tuyến bởi các recurrent neural network 17

2.2 Ước lượng trạng thái kích hoạt sự kiện cho các recurrent neural network 20

2.2.1 Thiết kế các bộ quan sát kích hoạt sự kiện . . . . . . . . . . . . 20

2.2.2 Điều kiện tồn tại bộ quan sát trạng thái kích hoạt sự kiện . . . 21

2.2.3 Ví dụ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

3 Ước lượng trạng thái kích hoạt sự kiện cho một số lớp hệ điều khiển

phi tuyến bậc phân thứ 32

3.1 Thiết kế các bộ quan sát kích hoạt sự kiện . . . . . . . . . . . . . . . . 32

3.2 Điều kiện tồn tại bộ quan sát trạng thái kích hoạt sự kiện . . . . . . . 34

3.3 Ví dụ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

v

vi

Kết luận 43


Tài liệu tham khảo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

4

Một số ký hiệu

R tập các số thực
tập các số thực mở rộng
R hợp rời nhau các tập A1, A2, . . . , An

n không gian vectơ n-chiều
ma trận khơng âm cỡ m × n
Ai dãy tổng bình phương
ma trận chuyển vị của M
i=1 (M )ij ≤ (N )ij
chuẩn Euclide
Rn xT P x > 0, ∀x̸ = 0
M + MT
m×n
1
R+
ℓ2 0T ∥f (t)∥2 dt 2
f : [0, T ] → Rn : ∥f ∥Ln2 ([0,T ]) < ∞
MT {s : [0, ∞) → Rr, ||s||∞ = supt∈[0,∞) ||s(t)|| < ∞}
max(0, M )
M M +M
∥.∥ C([0, ∞), Rs)
φ ∈ Cs : φ(σ) ∈ Rs+, σ ∈ [0, ∞)

P >0 ma trận nghịch đảo Moore-Penrose của M
trục hoành của ma trận M
sym{M } giá trị của phiếm hàm tuyến tính x∗ tại x
hạng của ma trận A
∥ f ∥ L n ([0,T ])
2

Ln2 ([0, T ])

Lr∞

M

M

|M |

Cs

C s+
M‡

µ(M )

⟨x∗, x⟩

rank(A)

vii


Mở đầu

1. Lý do chọn đề tài

Các hệ điều khiển thực tế như hệ thống điện, nước, mạng lưới truyền thông,...
thường được thực hiện trên nền tảng kỹ thuật số. Do bộ điều khiển giao tiếp với các
thiết bị thông qua cùng một kênh kỹ thuật số, nên thông tin của thiết bị trước tiên
được lấy mẫu và sau đó được truyền đến bộ điều khiển. Một kỹ thuật điều khiển kỹ
thuật số truyền thống là lấy mẫu được kích hoạt định kỳ, cho phép chúng ta thiết kế
và phân tích hiệu suất của bộ điều khiển bằng cách sử dụng lý thuyết hệ thống dữ liệu
được lấy mẫu quen biết [1], [2]. Tuy nhiên, cách tiếp cận lấy mẫu được kích hoạt định
kỳ thường địi hỏi nhiều năng lượng, khối lượng tính tốn và các kênh truyền thơng,
trong khi những tài ngun đó có thể được sử dụng cho các nhiệm vụ khác [3 − 4].
Do vậy, kỹ thuật điều khiển kích hoạt sự kiện là một cách tiếp cận hấp dẫn khắc phục
những hạn chế của phương pháp điều khiển kích hoạt định kỳ cổ điển [6 − 8]. Dưới
tác động của kỹ thuật điều khiển kích hoạt sự kiện, các mẫu dữ liệu không được cập
nhật định kỳ mà chỉ được cập nhật khi một số sự kiện đã xảy ra, và do đó nó là hiệu
quả hơn trong việc sử dụng nguồn năng lượng và kênh giao tiếp hạn chế. Cho đến nay,
kỹ thuật điều khiển kích hoạt sự kiện đã được áp dụng để giải quyết nhiều bài toán
quan trọng như bài tốn ổn định hóa [5], bài tốn truy lùng [9], [10], bài toán điều
chỉnh đầu ra [11], [12]. Hầu hết các cơng trình trên tập trung vào phát triển kĩ thuật
thiết kế các cơ chế kích hoạt sự kiện. Một đặc trưng chung của các cơ chế kích hoạt
sự kiện được thiết kế trong các cơng trình trên là một nguyên tắc tĩnh đặt trên trạng
thái của hệ thống. Bằng cách thêm một biến động lực trong vào cơ chế kích hoạt sự
kiện một cơ chế kích hoạt sự kiện động lực cho các hệ điều khiển [7]. So sánh với cơ
chế kích hoạt sự kiện tĩnh thì cơ chế kích hoạt sự kiện động lực thuận lợi hơn vì biến

1

2


động lực trong cho phép làm lớn khoảng thời gian giữa hai sự kiện liên tiếp trong dãy
các sự kiện được thiết kế. Chú ý rằng, trong cơng trình [7], tác giả chủ yếu tập trung
vào nghiên cứu tính chất ổn định của hệ đóng sử dụng cơ chế kích hoạt sự kiện mà
khơng đề cập đến việc thiết kế điều khiển.

Như chúng ta đã biết, thông tin trạng thái của hệ thống đóng vai trị quan trọng
trong việc thiết kế điều khiển cũng như nhiều áp dụng kỹ thuật khác. Tuy nhiên, trong
thực tế, thường rất khó khăn hoặc thậm chí khơng thể đo được đầy đủ thơng tin này.
Do đó, bài toán thiết kế quan sát trạng thái đã được sử dụng trong nhiều ứng dụng kỹ
thuật như bài toán ổn định hệ động lực bằng thông tin trạng thái phản hồi [13], bài
toán phát hiện lỗi [14], v.v. Nhiều phương pháp thiết kế quan sát trạng thái đã được
đề xuất, chẳng hạn như đối với các hệ tuyến tính [15] và các hệ phi tuyến [16]. Chú ý
rằng các phương pháp thiết kế quan sát trạng thái hiện có (xem, ví dụ [15], [16] và các
tham chiếu trong đó) dựa trên giả thiết rằng vectơ đầu ra của một hệ thống ln có
sẵn trong thời gian thực và hệ thống không chịu bất kỳ hạn chế nào đối với tài nguyên
truyền thông. Tuy nhiên, trong nhiều ứng dụng thực tế như hệ thống máy bay trực
thăng [17] và hệ thống robot [18], điều cần thiết là phải tính đến những hạn chế của
tài nguyên truyền thông. Để khắc phục hạn chế này, phương pháp thiết kế quan sát
trạng thái kích hoạt sự kiện đã được đề xuất [19], [20]. Cụ thể là, trong nghiên cứu
[19], một quan sát trạng thái kích hoạt sự kiện đã được đề xuất cho các hệ phi tuyến
không chắc chắn chịu tác động của nhiễu. Các tác giả đã đề xuất một bộ quan sát
trạng thái kích hoạt sự kiện cho một lớp các hệ động lực rời rạc [20]. Tuy nhiên, cho
đến nay, theo hiểu biết của tác giả, các quan sát trạng thái kích hoạt sự kiện cho các
lớp hệ tổng quát hơn như lớp hệ phi tuyến Lipschitz một phía, có trễ thời gian, chịu
tác động của nhiễu, lớp hệ ghép nối kích thước lớn, có trễ thời gian, chịu tác động của
nhiễu, ... vẫn chưa được giải quyết.

Trong thời gian gần đây, học máy (machine learning) đã trở thành một vấn đề thời
sự của cuộc cách mạng công nghiệp lần thứ 4. Được xây dựng dựa trên ba khối kiến

thức tốn học chính: Đại số tuyến tính, Giải tích và Xác suất thống kê, học máy đang
len lỏi vào mọi lĩnh vực trong đời sống, hỗ trợ rất nhiều cho con người trong cuộc
sống như xe tự hành của Google và Tesla, hệ thống tự tag khuôn mặt trong ảnh của
Facebook, trợ lý ảo Siri của Apple, hệ thống gợi ý sản phẩm của Amazon, hệ thống gợi

3

ý phim của Netflix, máy chơi cờ vây AlphaGo của Google DeepMind [21]. Việc nghiên
cứu, khai thác thế mạnh của các thuật toán học máy (machine learning algorithms) để
làm tăng hiệu suất của các bộ quan sát và các bộ điều khiển dựa trên thông tin trạng
thái ước lượng là một nhiệm vụ rất quan trọng, có ý nghĩa lớn trong khoa học cũng
như trong thực tiễn. Liên quan đến nhiệm vụ này, năm 2017 các tác giả của cơng trình
[22] đã đề xuất một bộ quan sát trượt (sliding observer) cho một lớp hệ phi tuyến bậc
cao không chắc chắn. Bộ quan sát này được kiểm tra từ một cơ chế học giám sát đã
được nhúng trong bộ quan sát trượt này. Cụ thể, hệ thống chủ hoạt động như một
điều phối viên, nó điều phối các hệ thống con để đạt được sự hội tụ thời gian hữu
hạn. Trong quá trình học, các hệ thống con buộc phải học các thuộc tính hội tụ thời
gian hữu hạn của động lực lỗi của hệ thống tổng thể bằng cách nhúng các thành phần
chuyển mạch vào các hệ thống con. Năm 2019, trong nghiên cứu [23], các tác giả đề
xuất một lược đồ sử dụng một bộ lọc (unscented Kalman filter) cùng với một cơ chế
học máy để giải quyết bài toán ước lượng trạng thái cho một lớp hệ động lực thực tế.
Một đặc tính quan trọng của lược đồ này là các thuật toán học máy được thiết kế và
sử dụng với vai trò là những hệ thống hỗ trợ nhằm nâng cao hiệu suất của bộ lọc trong
việc ứng xử với hiện tượng lỗi đường truyền cũng như các nhiễu hệ thống. Tuy nhiên,
cho đến nay, theo hiểu biết của nhóm nghiên cứu, các kết quả về bài toán thiết kế các
bộ quan sát nói chung (các bộ quan sát kích hoạt sự kiện nói riêng) với sự hỗ trợ của
các thuật tốn học máy cịn rất hạn chế, do đó bài tốn này cần được quan tâm nghiên
cứu, phát triển hơn nữa.

2. Nội dung và mục tiêu nghiên cứu


Đề án tập trung nghiên cứu một số phương pháp mới, hiệu quả để ước lượng trạng
thái kích hoạt sự kiện cho một số lớp hệ điều khiển với sự hỗ trợ của học máy.

3. Phương pháp nghiên cứu

Tìm hiểu tổng quan lý thuyết điều khiển, lý thuyết ước lượng, các cơ chế học máy.
Nghiên cứu thuật toán tối ưu sử dụng bất đẳng thức ma trận tuyến tính cho việc

4
thiết kế điều khiển kích hoạt sự kiện dựa trên thông tin trạng thái ước lượng với sự hỗ
trợ của thuật toán học máy.

4. Ý nghĩa khoa học và thực tiễn của đề tài

Có thể giải quyết với hiệu suất cao bằng phương pháp trong đề tài này cho các bài
toán thực tế trong công nghiệp hiện đại.

Chương 1

Kiến thức chuẩn bị

1.1 Lý thuyết ước lượng trạng thái các hệ điều
khiển

Trong lý thuyết điều khiển, một bộ quan sát trạng thái là một hệ động lực phản
ánh dáng điệu của một hệ thống vật lý, nó được thiết kế dựa trên các thông tin đo
được của đầu vào và đầu ra của hệ để cung cấp một ước lượng của các trạng thái bên
trong của hệ động lực đó. Yêu cầu đầu tiên trong việc thiết kế một bộ quan sát trạng
thái là trạng thái của bộ quan sát phải hội tụ tới giá trị thực tế của các trạng thái hệ

thống. Yêu cầu tiếp theo đó là đưa ra các điều kiện để tồn tại bộ quan sát trạng thái.
Một số ứng dụng trực tiếp của bài toán quan sát trạng thái bao gồm: sử dụng thông
tin trạng thái do ước lượng được để thiết kế điều khiển cho hệ động lực đang xem xét;
sử dụng thơng tin ước lượng để giải quyết bài tốn phát hiện, cô lập và ước lượng các
lỗi đường truyền cũng như lỗi cảm biến.

Từ những năm 60 của thế kỷ XX, cùng với sự phát triển của bài tốn điều khiển
thì bài tốn quan sát trạng thái cũng được bắt đầu nghiên cứu. Trên thực tế, khơng
phải lúc nào ta cũng ước lượng được tồn bộ vectơ trạng thái của hệ điều khiển. Mặt
khác, nếu ta có thể ước lược được tất cả các thành phần của vectơ trạng thái thì đơi
khi ta cũng khơng sử dụng tồn bộ thơng tin ước lượng được. Bởi vì khi sử dụng tồn
bộ thơng tin trạng thái ước lượng thì bậc của bộ quan sát sẽ cao hơn dẫn đến độ phức
tạp sẽ tăng lên, các thiết bị tương ứng đi kèm theo phải nhiều hơn, do đó chi phí vận

5

6

hành sẽ tăng lên. Để giảm chi phí, độ phức tạp khi vận hành, ta chỉ cần ước lượng một
số thành phần cần thiết của trạng thái mà thôi. Tổng quát cho vấn đề này là chỉ cần
ước lượng một hàm của biến trạng thái. Vì tính ứng dụng hữu hiệu cho nhiều bài tốn
điều khiển thực tế, nên hướng nghiên cứu về thiết kế quan sát hàm trạng thái cho các
hệ điều khiểu chịu tác động của trễ và nhiễu đã thu hút sự quan tâm sâu rộng của
nhiều nhà nghiên cứu trong và ngoài nước.

Trên thực tế có nhiều hệ thống mà có nhiều độ trễ xuất hiện ở biến trạng thái cũng
như đầu ra. Năm 2015, 2016, 2018, 2019, D.C. Huong, H. Trinh và V.T. Huynh (Đại
học Deakin, Úc) đã đề xuất một phương pháp mới để nhận được các phép chuyển đổi
trạng thái cho một lớp hệ phương trình vi phân tuyến tính có nhiều trễ trong biến
trạng thái và thông tin đầu ra. Các phép chuyển đổi này có thể được dùng để chuyển

các hệ phương trình vi phân tuyến tính có trễ trên về các hệ phương trình vi phân
tuyến tính có trễ (trễ trong biến trạng thái và thông tin đầu ra được chuyển về trễ
trong thông tin đầu vào và thông tin đầu ra). Với các hệ mới này ta dễ dàng thiết kế
được bộ quan sát dạng Luenberger. Từ đó ta có thể ước lượng được tồn bộ các biến
trạng thái khơng bị trễ hoặc toàn bộ các biến trạng thái với một độ trễ hoặc một số
biến trạng thái không bị trễ và một số biến trạng thái bị trễ. Phương pháp này bộc lộ
nhiều ưu việt hơn phương pháp của M. Hou, P. Zitek và R.J. Patton. Các hệ dương
là các hệ động lực mà trạng thái của chúng là không âm đối với bất kỳ điều kiện ban
đầu không âm và bất kỳ đầu vào khơng âm. Có rất nhiều hệ thống trong y học, sinh
học, cơ học được mô tả bởi hệ dương. Đã có nhiều kết quả về thiết kế các bộ quan sát
trạng thái với bậc đầy đủ cho các hệ dương. Tuy nhiên, chưa có nhiều kết quả về thiết
kế bộ quan sát giảm bậc hay bộ quan sát hàm cho lớp các hệ dương. Gần đây, năm
2017, H. Trinh, D.C. Huong, L.V. Hien và S. Nahavandi đã đề xuất bộ quan sát trạng
thái dương cho một lớp hệ tuyến tính dương, có trễ. Cũng vậy, các hệ ghép nối bao
gồm nhiều hệ con kết nối với nhau thường được dùng để mô tả các hệ thống thực tế
phức tạp như hệ thống điện, nước, các hệ có cấu trúc mạng,...Trên thực tế cũng đã có
một số kết quả về việc thiết kế bộ quan sát trạng thái để ước lượng trạng thái của các
lớp hệ dạng này, chẳng hạn, năm 2018, H. Trinh và D.C. Huong đã thiết kế được bộ
quan sát trạng thái cho một lớp hệ ghép nối dương. Mặc dù đã có nhiều kết quả về bài
toán thiết kế quan sát hàm trạng thái cho các lớp hệ phi tuyến nhưng đối với những

7

hàm phi tuyến chỉ thỏa điều kiện Lipschitz một phía thì các kết quả hiện có khơng
thể áp dụng được. Để vượt qua khó khăn này, M.V. Thuan, D.C. Huong, N.H. Sau và
Q.T. Hà, năm 2019, đã đề xuất phương pháp mới để thiết kế quan sát hàm trạng thái
cho các hệ phi tuyến có nhiễu, trong đó hàm phi tuyến chỉ thỏa điều kiện Lipschitz
một phía. Trong thực tế, việc xác định chính xác thời gian trễ của một hệ thống là rất
khó khăn. Vì vậy, việc nghiên cứu lớp hệ có trễ biến thiên có ý nghĩa rất quan trọng
trong lý thuyết và thực tiễn. Năm 2017, D.C. Huong và M.V. Thuan đã đề xuất một

phương pháp giải số để nhận được một phép biến đổi tọa độ, chuyển một lớp hệ tuyến
tính có trễ biến thiên về một hệ mới mà độ trễ không xuất hiện trong biến trạng thái,
rất thuận tiện cho việc thiết kế bộ quan sát trạng thái dạng Luenberger. Ngày nay,
các yêu cầu đối với hệ kỹ thuật (giảm độ phức tạp của thiết bị vận hành, hạ bậc điều
khiển, chống được các hiện tượng hỏng hóc bất thường, vận hành được cho nhiều hệ
thống, tăng độ ổn định của hệ thống, v.v.) ngày càng cao hơn. Do đó, việc giải quyết
bài toán quan sát hàm trạng thái và áp dụng vào bài tốn phát hiện lỗi đường truyền
khơng những có ý nghĩa về mặt lý thuyết mà cịn đem lại nhiều tiềm năng ứng dụng
trong thực tế với hiệu quả cao và chi phí thấp. Liên quan đến vấn đề này, năm 2014,
D.C. Huong, H. Trinh, H.M. Tran và T. Fernando đã đề xuất một phương pháp mới
để thiết kế bộ quan sát nhằm phát hiện lỗi đường truyền trong một lớp hệ động lực
tuyến tính có trễ . Năm 2013, H. Trinh, T. Fernando, K. Emami, D.C. Huong đã giải
quyết bài toán phát hiện lỗi cho một số lớp hệ động lực bằng phương pháp thiết kế
các bộ quan sát hàm bậc nhất.

Mặc dù đã có nhiều kết quả về bài tốn ước lượng trạng thái cho các lớp hệ điều
khiển, cho đến nay, các kết quả về bài toán thiết kế các bộ quan sát với sự hỗ trợ của
các thuật toán học máy cịn rất hạn chế, do đó bài tốn này cần được quan tâm nghiên
cứu, phát triển hơn nữa.

1.2 Học máy

Học máy (Mechine Learning - ML) là một lĩnh vực điều tra nhằm tìm hiểu và xây
dựng các phương pháp học, tức là các phương pháp tận dụng dữ liệu để cải thiện hiệu
suất trên một số nhiệm vụ. Nó được xem như một phần của trí tuệ nhân tạo. Các

8

thuật toán học máy xây dựng một mơ hình dựa trên dữ liệu mẫu, được gọi là dữ liệu
đào tạo, để đưa ra dự đoán hoặc quyết định mà khơng được lập trình rõ ràng. ML có

nhiều ứng dụng chẳng hạn như nội suy, dự báo, phân lớp, phân cụm; nhận dạng chữ
viết tay, nhận dạng ảnh; phát hiện cấu trúc, các yếu tố tác động, các quy luật; điều
khiển thông minh; hỗ trợ ra quyết định; phân tích trong y khoa, nơng nghiệp, khoa
học xã hội, luật pháp, marketing, phân tích tài chính, v.v.

Theo định nghĩa của tác giả T.Metchell về machine learning như sau: Một chương
trình máy tính được gọi là học để thực hiện một nhiệm vụ T từ kinh nghiệm E, nếu
hiệu suất thực hiện công việc T của nó được đo bởi chỉ số hiệu suất P và được cải thiện
bởi kinh nghiệm E theo thời gian. Ví dụ: Một cỗ máy thực hiện chơi cờ (nhiệm vụ T),
có thể học từ dữ liệu các ván cờ trước đó hoặc chơi với một chuyên gia (kinh nghiệm
E). Khả năng chơi của cỗ máy là tỉ lệ số ván mà nó chiến thắng khi chơi với con người
(hiệu suất P).

Tùy thuộc vào phương thức tiếp cận, ML được phân loại như sau:

(i) Học có giám sát (Supervised Learning): Xác định giá trị/nhãn cho dữ liệu mới
dựa trên quy luật được phát hiện từ tính chất của tập dữ liệu. Giám sát được
thể hiện qua giá trị hoặc nhãn của dữ liệu mẫu. Vì vậy, tập dữ liệu mẫu để học
theo phương pháp này phải có giá trị đầu ra/nhãn đã được xác định trước. Các
bài toán hồi quy (Regresstion) và phân lớp (Classification) thuộc loại này.

(ii) Học không giám sát (Unsupervised Learning): Tập dữ liệu mẫu để học khơng có
nhãn. Học không giám sát kết luận những đối tượng có tính gần giống nhau để
suy ra một kết luận, hỗ trợ quyết định, ngồi ra cịn phát hiện cấu trúc của tập
dữ liệu mẫu. Bài toán phân cụm dữ liệu (Clustering) và tìm quy luật kết hợp
(Association) thuộc loại này.

(iii) Học bán giám sát (Semisupervised Learning): Tập dữ liệu mẫu của bài toán này,
một số có nhãn và một số khơng có nhãn. Kết hợp hai phương thức học có giám
sát và khơng có giám sát.


(iv) Học tăng cường (Reinforcement Learning): Học theo chuỗi các hành vi, từng bước
để đạt được kết quả khi thực hiện hồn tất chuỗi biến đổi. Chẳng hạn mơ hình
Markov ẩn. Học tăng cường được ứng dụng trong các trò chơi, điều khiển tự động.

9

Để thực hiện chuyển đổi từ input thành output mong muốn, chúng ta có thể sử
dụng các mơ hình khác nhau. Machine learning có rất nhiều thuật tốn khác nhau
nhưng phổ biến nhất là các thuật toán như:

(i) Support Vector Machines (SVM): Một thuật toán cố gắng xây dựng một siêu mặt
phẳng trong không gian nhiều chiều để phân biệt các đối tượng ở các lớp khác
nhau, làm sao cho khoảng cách giữa hai đối tượng khác label gần nhau nhất có
khoảng cách cực đại. Ý tưởng của thuật tốn cực kỳ đơn giản, nhưng mơ hình
này lại rất phức tạp và có hiệu quả. Thực tế, ở một số bài tốn, SVM là một mô
hình machine learning cho hiệu quả tốt nhất.

(ii) Mơ hình xác suất (Probabilistic Models): Các mơ hình này cố gắng giải quyết bài
toán bằng phân bố xác suất. Một thuật toán phổ biến nhất là phân loại Naive
Bayes; nó sử dụng lý thuyết Bayes và giả thiết các đặc trưng là độc lập. Điểm
mạnh của mơ hình xác suất là đơn giản nhưng hiệu quả. Đầu ra của nó khơng
chỉ là label mà còn đi kèm xác suất thể hiện độ chính xác cho kết quả đó.

(iii) Học sâu (Deep learning): Hiện đang là xu hướng trong machine learning dựa trên
các mơ hình mạng nơ-ron nhân tạo (Artificial Neural Networks). Mạng nơ-ron có
cách tiếp cận kết nối và sử dụng ý tưởng theo cách bộ não con người làm việc.
Chúng bao gồm số lượng lớn các nơ-ron liên kết với nhau; được tổ chức thành
các lớp (layers). Học sâu liên tục được phát triển với các cấu trúc mới sâu hơn;
nó khơng chỉ cố gắng học mà còn xây dựng các cấu trúc biểu diễn các đặc trưng

quan trọng một cách tự động.

Có nhiều loại mạng nơ-ron, với các cấu trúc phù hợp với các loại nhiệm vụ khác nhau.

(i) Mạng nơ-ron cổ điển là mạng kết nối đầy đủ, thường được xác định bằng các
perceptron đa lớp. (Perceptron là một thuật tốn đơn giản, cho phép tìm một
ranh giới siêu phẳng cho các bài toán phân lớp nhị phân). Mạng nơ-ron cổ điển
được thiết kế bởi Fran Rosenblatt vào năm 1958, chủ yếu được sử dụng cho các
bài tốn phân lớp nhị phân. Có ba loại hàm thường được sử dụng trong mơ hình
này là: hàm tuyến tính; hàm phi tuyến: gồm có hàm sigmoid, hàm tanh và hàm
ReLU (Rectified Linear Unit). Kiến trúc mạng nơ-ron cổ điển tương đối đơn giản,

10

phù hợp nhất với các bộ dữ liệu có dạng bảng hoặc những bài toán phân loại, hồi
quy có đầu vào là giá trị thực.

(ii) Generative Adversarial Networks (GAN) là lớp mơ hình có mục tiêu tạo ra dữ
liệu giả giống với thật, tên của mạng được dựa trên kiến trúc gồm hai mạng có
mục tiêu đối nghịch nhau: Generator và Discriminator. Trong đó, Generator học
cách sinh dữ liệu giả để lừa mơ hình Discriminator, cịn Discriminator lại học
cách phân biệt giữa dữ liệu giả và dữ liệu thật. Thơng qua q trình huấn luyện
thì cả hai mơ hình này đều cùng cải thiện được khả năng của mình. Một số ứng
dụng phổ biến của GAN là: tạo khuôn mặt người, thay đổi độ tuổi khuôn mặt,
sinh ảnh vật thể, tạo nhân vật hoạt hình,. . .

(iii) Mạng nơ-ron tích chập (Convolutional Neural Network – CNN) là một kiến trúc
mạng nơ-ron nhân tạo nâng cao, được xây dựng để giải quyết các bài toán phức
tạp, đặc biệt là liên quan đến xử lý hình ảnh. Tích chập là một khái niệm trong
xử lý tín hiệu số nhằm biến đổi thơng tin đầu vào qua một phép tích chập với

bộ lọc, nhằm trả về đầu ra là một tín hiệu mới. Tín hiệu này sẽ giảm bớt những
đặc trưng mà bộ lọc không quan tâm, giữ lại những đặc trưng chính và quan
trọng nhất. Bên cạnh input layer và output layer, mơ hình CNN cịn có thêm một
sampling layer để giới hạn số lượng nơ-ron tham gia vào các layer tương ứng. Dựa
vào những đặc điểm của mình, các ứng dụng phổ biến nhất của mạng CNN gồm
có: nhận diện, phân tích và phân khúc hình ảnh, phân tích video, xử lý ngôn ngữ
tự nhiên,. . .

(iv) Mạng nơ-ron hồi quy (Recurrent Neural Network - RNN): là một thuật toán nổi
tiếng. Trong các mơ hình mạng nơ-ron truyền thống, đầu vào và đầu ra độc lập
với nhau, tuy nhiên RNN thực hiện cùng một tác vụ cho tất cả phần tử của một
chuỗi với đầu ra phụ thuộc vào cả các phép tính trước đó. Vì vậy, mạng RNN có
khả năng nhớ các thông tin được tính tốn trước đó.

Các thuật tốn ML này sử dụng các mơ hình, kỹ thuật khác nhau để thực hiện quá
trình học tập và thể hiện kiến thức về những gì nó được học. Mọi thuật toán ML đều
cố gắng đưa ra những giả thiết đơn giản nhất mà có thể đúng với hầu hết các mẫu

11

trong tập dữ liệu huấn luyện.
Để xem xét vấn đề chuyển đổi trạng thái kích hoạt sự kiện với sự hỗ trợ của học

máy cho các hệ thống phi tuyến chịu nhiễu bên ngoài trong trạng thái và vectơ đầu ra;
đầu tiên, phát triển một thuật toán mạng nơ-ron hồi quy (RNN) để dự đoán các hệ
thống phi tuyến. Thứ hai, thiết kế một cơ chế kích hoạt sự kiện theo thời gian rời rạc
và một trình quan sát trạng thái dựa trên cơ chế này cho mơ hình RNN. Bộ quan sát
trạng thái kích hoạt sự kiện theo thời gian rời rạc này làm giảm đáng kể việc sử dụng
tài nguyên truyền thông. Thứ ba, thiết lập một điều kiện đủ để đảm bảo rằng bộ quan
sát trạng thái có thể ước tính một cách mạnh mẽ vectơ trạng thái của mạng nơ-ron

hồi quy. Cuối cùng, cung cấp một ví dụ minh họa để xác minh giá trị của phương pháp
được đề xuất.

Trong nhiều lĩnh vực kỹ thuật, thông tin về vectơ trạng thái của hệ thống động
lực thường được yêu cầu cho thiết kế điều khiển khi phát hiện lỗi. Tuy nhiên, vì lý do
kỹ thuật hoặc kinh tế, các vectơ trạng thái thực của hệ thống khơng có sẵn. Do đó,
ước lượng trạng thái động học trở thành một ứng dụng quan trọng trong các lĩnh vực
khác nhau, từ kỹ thuật điều khiển robot, theo dõi và điều hướng. Có nhiều cách tiếp
cận trong tài liệu liên quan đến việc thiết kế các quan sát trạng thái cho mục đích xác
định thời gian trạng thái. Cần lưu ý rằng tất cả các quan sát trạng thái được thiết kế
dựa trên các sơ đồ kích hoạt thời gian, tức là, các thiết kế quan sát yêu cầu dữ liệu
hệ thống cho mỗi thời điểm lấy mẫu, điều này có thể dẫn đến sự lãng phí tài nguyên
truyền thông trong ứng dụng thực tế. Để khắc phục nhược điểm này, một số trạng thái
kích hoạt sự kiện các quan sát đã được đề xuất để duy trì hiệu suất mong muốn trong
khi giảm việc sử dụng các nguồn thông tin liên lạc. Cụ thể, một bộ quan sát trạng thái
mở rộng do sự kiện kích hoạt đã được đề xuất cho các hệ thống phi tuyến có nhiễu,
trong đó các chức năng phi tuyến liên tục có thể phân biệt được, trong khi bộ quan sát
trạng thái mạnh mẽ dựa trên cơ chế kích hoạt sự kiện động liên tục đã được xây dựng
cho một loại hệ thống phi tuyến trong đó hàm phi tuyến thỏa mãn điều kiện Lipschitz
một phía và điều kiện giới hạn bên trong bậc hai. Lưu ý rằng các hàm phi tuyến được
xây dựng có một số hạn chế, do đó các bộ quan sát trạng thái kích hoạt sự kiện trong
các tham chiếu này không thể áp dụng cho các hệ thống phi tuyến nói chung. Hơn
nữa, vì cơ chế kích hoạt sự kiện động phụ thuộc vào giám sát điều kiện do sự kiện điều

12

khiển, nó có thể gây ra yêu cầu nghiêm ngặt. Mặt khác, trong những năm gần đây,
học máy đã thu hút rất nhiều sự chú ý nghiên cứu do sự gia tăng các ứng dụng của
nó trong nhiều hồ sơ như điều khiển chịu lỗi, điều khiển thời gian thực an ninh mạng
và các vấn đề tối ưu hóa với sự phát triển nhanh chóng của các tài ngun tính tốn,

các kỹ thuật học máy đã được sử dụng rộng rãi để giải quyết các vấn đề quan trọng
như phân loại và hồi quy. RNN thuộc về kỹ thuật học máy đã nhận được sự quan tâm
đáng kể trong những năm gần đây do những ưu điểm của chúng trong khả năng học
tập, tính tốn song song, tự động hóa cơng nghiệp và xấp xỉ hàm. Các tác giả đã xem
xét việc thiết kế các hệ thống điều khiển dự đốn mơ hình cho các q trình phi tuyến
sử dụng một tập hợp các mơ hình để dự đoán động lực học phi tuyến. Đầu tiên, họ đã
đào tạo mơ hình RNN bằng cách sử dụng dữ liệu mơ phỏng vịng mở rộng để nắm bắt
động thái của quy trình trong một vùng hoạt động nhất định sao cho sai số mơ hình
hóa giữa mơ hình RNN và mơ hình quy trình phi tuyến thực tế là đủ nhỏ. Sau đó, họ
sử dụng mơ hình RNN làm mơ hình dự đốn để trạng thái vịng kín hội tụ đến điểm
gốc. Tuy nhiên, vấn đề nhiễu bên ngoài trong RNN cũng như việc thiết kế các quan
sát trạng thái kích hoạt sự kiện theo thời gian rời rạc cho mơ hình dự đốn RNN đã
khơng xem xét.

1.3 Các kiến thức liên quan

Định nghĩa 1.3.1. Cho K là một trường, bảng gồm mn phần tử aij ∈ K(i = 1, m, j =
1, n) được sắp xếp như sau:

 

a11 a12 a13 ... a1n

 

 a21 a22 a23 ... a2n 

 

 a31 a32 a33 ... a3n 


 ... ... ... ... ... 

 
 

 

am1 am2 am3 ... amn

được gọi là một ma trận kích thước m × n trên K. Tập hợp các ma trận kích thước
m × n trên K được kí hiệu là Km×n.

Chú ý 1.3.1. Gọi ma trận được theo định nghĩa trên là A, khi đó:

13

+ aij được gọi là phần tử ở cột thứ j, dòng thứ i của ma trận trên.

+ Vectơ cột thứ j của ma trận A được ký hiệu là Aj


a1j


 a2j 
Aj =   .
.
 .. 



amj

+ Vectơ dòng thứ i của ma trận A được ký hiệu là Ai
Ai = ai1 ai2 · · · ain .

+ Khi đó ma trận A có thể được viết như sau



A1



 A2 
A=
 . 

 .. 



Am

hoặc

A = A1 A2 · · · An

hoặc ngắn gọn hơn là A = (aij) ∈ Km×n.


+ Nếu m = n thì ta gọi A là một ma trận vng cấp n. Khi đó dãy các phần tử
a11, a22, ..., ann được gọi là đường chéo chính của A. Một ma trận có các phần tử
trên đường chéo chính bằng 1 và các phần tử còn lại đều bằng 0 được gọi là ma
trận đơn vị, kí hiệu là In hay đơn giản là I.

Định nghĩa 1.3.2. Cho A ∈ Rn×n là một ma trận đối xứng. A được gọi là ma trận
xác định dương nếu với mọi x ∈ Rn×1 thì P (x) = xT Ax > 0. Tương tự A được gọi là
ma trận xác định âm nếu với mọi x ∈ Rn×1 thì P (x) = xT Ax < 0. A được gọi là ma
trận nửa xác định dương nếu với mọi x ∈ Rn×1 thì P (x) = xT Ax ≥ 0, còn A là ma
trận nửa xác định âm nếu với mọi x ∈ Rn×1 thì P (x) = xT Ax ≤ 0.


×