Tải bản đầy đủ (.doc) (122 trang)

Nghiên cứu phát triển hệ thống điều hướng thông minh cho robot tự hành trong môi trường bất định

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (4.63 MB, 122 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO

BỘ QUỐC PHÒNG

VIỆN KHOA HỌC VÀ CÔNG NGHỆ QUÂN SỰ

-------------------------------------

ĐỖ NAM THẮNG

NGHIÊN CỨU PHÁT TRIỂN HỆ THỐNG ĐIỀU HƯỚNG THÔNG MINH
CHO ROBOT TỰ HÀNH TRONG MÔI TRƯỜNG BẤT ĐỊNH

LUẬN ÁN TIẾN SĨ KỸ THUẬT

HÀ NỘI – 2021


BỘ GIÁO DỤC VÀ ĐÀO TẠO

BỘ QUỐC PHÒNG

VIỆN KHOA HỌC VÀ CÔNG NGHỆ QUÂN SỰ

-------------------------------------

ĐỖ NAM THẮNG

NGHIÊN CỨU PHÁT TRIỂN HỆ THỐNG ĐIỀU HƯỚNG THÔNG MINH
CHO ROBOT TỰ HÀNH TRONG MÔI TRƯỜNG BẤT ĐỊNH


Chuyên ngành: Kỹ thuật điều khiển và tự động hóa
Mã số: 9 52 02 16

LUẬN ÁN TIẾN SĨ KỸ THUẬT

NGƯỜI HƯỚNG DẪN KHOA HỌC:
1. PGS.TS Phạm Trung Dũng
2. PGS.TS Nguyễn Quang Hùng

HÀ NỘI – 2021


i

LỜI CAM ĐOAN
Tơi xin cam đoan đây là cơng trình nghiên cứu của riêng tôi. Các số
liệu, kết quả được trình bày trong luận án này là trung thực và chưa được
ai cơng bố ở bất kỳ cơng trình nào khác, các dữ liệu tham khảo được
trích dẫn đầy đủ.
Ngày

tháng năm 2021

Tác giả luận án


ii

LỜI CẢM ƠN
Tơi xin bày tỏ lịng biết ơn sâu sắc tới PGS.TS Phạm Trung Dũng và

PGS.TS Nguyễn Quang Hùng, đã định hướng nghiên cứu và tận tình chỉ bảo,
hướng dẫn, giúp đỡ tôi thực hiện luận án.
Tôi xin trân trọng cảm ơn Thủ trưởng Viện Khoa học và Công nghệ
qn sự, Phịng Đào tạo/Viện Khoa học và Cơng nghệ quân sự đã luôn ủng
hộ, hướng dẫn, giúp đỡ tôi trong q trình thực hiện và bảo vệ luận án.
Tơi xin trân trọng cảm ơn Thủ trưởng Viện Tự động hóa KTQS, Khoa
Kỹ thuật điều khiển/Học viện kỹ thuật quân sự đã quan tâm, giúp đỡ, tạo điều
kiện thuận lợi cho tơi hồn thành luận án.
Tơi xin bày tỏ sự biết ơn sâu sắc đến gia đình, người thân cùng bạn bè,
đặc biệt là TS Trương Xuân Tùng đã luôn quan tâm, cổ vũ, động viên và tạo
điều kiện tốt nhất cho tôi thực hiện tốt luận án này.
Tác giả

Đỗ Nam Thắng


iii
MỤC LỤC
DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT.....................................vi
DANH MỤC CÁC BẢNG....................................................................... viii
DANH MỤC CÁC HÌNH VẼ....................................................................ix
MỞ ĐẦU....................................................................................................... 1
Chƣơng 1. TỔNG QUAN VỀ HỆ THỐNG ĐIỀU KHIỂN THIẾT BỊ
TỰ HÀNH.................................................................................................... 4
1.1 Giới thiệu một số loại thiết bị tự hành................................................... 4
1.1.1. Nền tảng robot di động...................................................................... 4
1.1.2. Mơ hình động học của robot tự hành................................................. 6
1.2 Cấu trúc điều khiển cơ bản của robot tự hành........................................ 8
1.2.1 Hệ thống thu thập và xử lý thông tin.................................................. 9
1.2.2 Hệ thống xác định vị trí và xây dựng bản đồ...................................... 9

1.2.3 Hệ thống thiết kế quỹ đạo chuyển động cho robot............................ 10
1.2.4 Hệ thống điều khiển truyền động...................................................... 10
1.3. Hệ thống phát hiện và bám sát đối tượng............................................ 10
1.3.1. Hệ thống phát hiện đối tượng.......................................................... 10
1.3.2. Hệ thống bám sát đối tượng............................................................. 12
1.4. Các kỹ thuật học sâu........................................................................... 14
1.4.1 Mạng nơron tích chập....................................................................... 14
1.4.2. Kỹ thuật Faster R –CNN.................................................................. 15
1.4.3 Kỹ thuật học sâu SSD....................................................................... 18
1.4.4. Kỹ thuật học sâu YOLO.................................................................. 20
1.5. Tổng quan về tình hình nghiên cứu trong và ngồi nước.................... 25
1.5.1. Tình hình nghiên cứu ngồi nước.................................................... 25
1.5.2 Tình hình nghiên cứu trong nước...................................................... 29
1.6. Kết luận chương 1.............................................................................. 31
Chƣơng 2. XÂY DỰNG HỆ THỐNG PHÁT HIỆN VÀ BÁM SÁT
NHIỀU ĐỐI TƢỢNG CHO ROBOT TỰ HÀNH.................................33


iv
2.1. Bài toán phát hiện và bám sát đối tượng người................................... 33
2.2.1. Hệ thống điều hướng robot trong môi trường bất định..................... 35
2.2.2. Các khối chức năng của hệ thống điều hướng robot di động
có nhận thức tương tác.............................................................................. 37
2.2.3 Đề xuất hệ thống phát hiện và bám sát nhiều đối tượng....................42
2.3. Đề xuất hệ thống dự đoán ý định tương tác của người đối với robot. .50
2.3.1 Hệ thống dự đoán ý định tương tác................................................... 51
2.3.2. Xử lý dữ liệu cho hệ thống dự đoán ý định tương tác......................54
2.4. Kết luận chương 2.............................................................................. 55
Chƣơng 3. XÂY DỰNG HỆ THỐNG ĐIỀU HƢỚNG THƠNG MINH
CHO ROBOT TỰ HÀNH........................................................................56

3.1 Thuật tốn học sâu tăng cường DQN cho bài toán tránh vật cản động. 56
3.1.1 Thuật toán Q – Learning................................................................... 56
3.1.2. Thuật toán DQN cho bài toán tránh vật cản.................................... 56
3.1.3 Xây dựng mơ hình thuật tốn............................................................ 61
3.2. Thuật tốn A3C ứng dụng trong hệ thống điều hướng cho robot
di động trong môi trường bất định............................................................. 62
3.2.1. Sơ đồ kiến trúc nhiều tầng A3C....................................................... 63
3.2.2. Thuật toán A3C................................................................................ 64
3.3. Xây dựng hệ thống điều hướng cho robot tự hành trong môi trường
bất định...................................................................................................... 67
3.3.1. Mơ tả bài tốn.................................................................................. 67
3.3.2. Hệ thống điều hướng cho robot tự hành trong môi trường bất định. 69
3.3.3. Khối hình thành tọa độ khơng gian.................................................. 71
3.3.4 Thiết lập không gian hoạt động......................................................... 72
3.3.5 Cấu trúc mạng.................................................................................. 72
3.3.6 Hàm thưởng...................................................................................... 73
3.4. Các chỉ tiêu đánh giá độ an toàn và thoải mái của con người khi di
chuyển trong môi trường bất định.............................................................. 75


v
3.4.1. Chỉ số cá nhân................................................................................. 76
3.4.2 Chỉ số nhóm...................................................................................... 77
3.4.3. Chỉ số chuyển động tương đối......................................................... 77
3.5. Kết luận Chương 3.............................................................................. 78
Chƣơng 4. MƠ PHỎNG VÀ THỰC NGHIỆM.....................................79
4.1. Mơ phỏng hệ thống phát hiện và bám sát nhiều đối tượng.................79
4.1.1 Thiết lập mô phỏng........................................................................... 79
4.1.2 Kết quả mô phỏng............................................................................ 80
4.2. Mơ phỏng đánh giá hệ thống dự đốn ý định tương tác của người

đối với robot.............................................................................................. 84
4.2.1. Mô tả bài toán.................................................................................. 84
4.2.2. Huấn luyện mạng và kiểm tra.......................................................... 84
4.2.3. Kết quả thử nghiệm với các trường hợp tiếp cận riêng biệt.............88
4.2.4. Kết quả thử nghiệm với trường hợp người đi kết hợp tiếp cận
nhiều hướng khác nhau.............................................................................. 89
4.3. Mô phỏng đánh giá khả năng ứng dụng thuật toán DQN trong
bài tốn tránh vật cản................................................................................. 89
4.3.1. Thiết lập mơ phỏng.......................................................................... 90
4.3.2 Kết quả mô phỏng............................................................................ 92
4.4 Mô phỏng đánh giá hệ thống điều hướng robot di động trong
môi trường bất định................................................................................... 95
4.4.1 Thiết lập mô phỏng........................................................................... 95
4.4.2 Kết quả mô phỏng............................................................................ 97
4.5 Kết luận chương 4............................................................................... 98
KẾT LUẬN................................................................................................99
DANH MỤC CÁC CÔNG TRÌNH KHOA HỌC ĐÃ CƠNG BỐ......101
TÀI LIỆU THAM KHẢO......................................................................102


vi

0
0

γ

DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT
Vận tốc người
Vận tốc đối tượng

Trạng thái đối tượng
Trạng thái người

α

Hướng chuyển động của người

ε

Hướng chuyển động của đối tượng

βi

Hệ số khấu hao
Chu kỳ tối đa mạng toàn cục

φi

Bước tối đa của mỗi chu kỳ
Tần số cập nhật

V(s)

Hệ số học

П(s)

Hệ số suy giảm

A3C


Góc giữa hướng robot và vector được

AI
CSDL
CNN
CONV

chiếu từ robot đến người pi
Góc giữa hướng của con người và
vector được chiếu từ người pi tới robot
Hàm giá trị
Hàm chính sách
Thuật tốn học sâu tăng cường sử dụng Asynchronous methods for
phương pháp bất đồng bộ
Trí tuệ nhân tạo

deep reinforcement
Artificial Intelligence

Cơ sở dữ liệu
Mạng nơron tích chập
Lớp tích chập

Convolutional Neural
Network
Convolutional


vii

DQN

Học tăng cường

Deep Q-Network

DL

Học sâu

Deep Learning

EKF

Bộ lọc kalman mở rộng

Extended Kalman Filter

Gazebo Hệ thống cho phép mô phỏng môi
trường robot
IOU

Hàm đánh giá độ chính xác phát hiện Intersection over union
đối tượng

LSTM Mạng bộ nhớ ngắn - dài hạn
RL

Học tăng cường


Long-Short Term Memory
Reinforcement Learning

RBTH Robot tự hành
ReLU

Hàm kích hoạt tuyến tính chỉnh lưu Rectified Linear Unit

ROS

Hệ điều hành điều khiển robot

Robot Operating System

Nền tảng lập trình thuật tốn trí tuệ

Tensor Flow

TF

nhân tạo
RMI

Chỉ số chuyển động tương tác

Relative motion index

SSD

Phát hiện nhiều khung một lượt


Single Shot Multibox
Detection

SII

Chỉ số cá nhân

Social individual index

SGI

Chỉ số nhóm

Social group index

WRNs Mạng rộng dư

Wide Residual Networks

YOLO Phát hiện đối tượng thời gian thực

You Only Look Once


viii

DANH MỤC CÁC BẢNG
Trang
Bảng 4.1. Một số kết quả huấn luyện mạng............................................... 85

Bảng 4.2.Các vị trí 9 mục tiêu được sử dụng trong quá trình đào tạo........91
Bảng 4.3 Bảng tham số mạng trong quá trình đào tạo và kiểm tra.............96


ix
DANH MỤC CÁC HÌNH VẼ
Trang
Hình 1.1: Hai nền tảng robot di động sử dụng trong luận án.......................5
Hình 1.2. Mơ tả robot tự hành chuyển động bằng 2 bánh dạng vi sai..........6
Hình 1.3. Tính cơ động và đổi hướng của robot tự hành hai bánh vi sai......8
Hình 1.4. Sơ đồ khối quá trình điều khiển robot tự hành............................. 8
Hình 1.5. Sơ đồ khối hệ thống phát hiện đối tượng kiểu truyền thống.......11
Hình 1.6. Sơ đồ khối của hệ thống bám sát đối tượng............................... 13
Hình 1.7 Kiến trúc một mạng nơron tích chập........................................... 14
Hình 1.8. Kiến trúc mạng R-CNN............................................................. 16
Hình 1.9. Kiến trúc mạng Fast R-CNN...................................................... 17
Hình 1.10. Kiến trúc Faster R-CNN.......................................................... 17
Hình 1.11. Kiến trúc SSD.......................................................................... 18
Hình 1.12. Kiến trúc của multi-scale convulution prediction được
sử dụng trong SSD.................................................................................... 19
Hình 1.13. Khả năng nhận diện đối tượng của kỹ thuật học sâu YOLO....20
Hình 1.14. Chia lưới trong kỹ thuật học sâu YOLO.................................. 21
Hình 1.15. Thơng số IOU.......................................................................... 22
Hình 1.16. Chuẩn hóa các thơng số........................................................... 22
Hình 1.17. Biểu diễn các lớp mạng trong thuật tốn YOLO......................23
Hình 1.18. Cấu trúc mạng trong thuật tốn YOLO.................................... 24
Hình 2.1. Hệ thống điều hướng robot di động có nhận thức tương tác......36
Hình 2.2.Trung tâm và hình dạng của khơng gian tương tác...................... 39
Hình 2.3. Dự đốn tư thế tiếp cận của một người đang di chuyển.............41
Hình 2.4. Cấu trúc hệ thống thị giác máy tính sử dụng kỹ thuật học sâu. . .42

Hình 2.5. Mơ hình hệ thống bám sát đa mục tiêu sử dụng kỹ thuật học sâu.. 43

Hình 2.6. Sơ đồ khối tổng quan kỹ thuật học sâu WRNs........................... 48
Hình 2.7 Lưu đồ hệ thống dự đoán ý định tương tác của người đối với robot .. 51
Hình 2.8. Nhận dạng tư thế người bằng OpenPose.............................................52


x
Hình 2.9 Kiến trúc mạng của OpenPose..................................................... 53
Hình 2.10 Cấu trúc của LSTM................................................................... 54
Hình 2.11. Cửa sổ tạo dữ liệu đào tạo ........................................................ 54
Hình 2.12. Quy trình tạo các tập dữ liệu ..................................................... 55
Hình 3.1. Cấu trúc mạng đề xuất ............................................................... 57
Hình 3.2. Lưu đồ thuật tốn huấn luyện robot………………………………57

Hình 3.3. Mơ hình học sâu tăng cường điều khiển robot ............................. 61
Hình 3.4 Hàm tính reward tại thời điểm t ................................................... 62
Hình 3.5. Sơ đồ kiến trúc nhiều tầng của A3C. ........................................... 63
Hình 3.6. Quy trình huấn luyện của mỗi robot trong A3C ........................... 65
Hình 3.7. Vị trí tương đối giữa một người và robot..................................... 68
Hình 3.8. Khơng gian cá nhân xung quanh con người; (b) khơng gian
tương tác nhóm người; (c) không gian tương tác con người – vật thể. ......... 68
Hình 3.9. Hệ thống điều hướng cho robot tự hành ở môi trường bất định
sử dụng học sâu tăng cường A3C .............................................................. 70
Hình 3.10. Khơng gian trạng thái của robot di động.................................... 71
Hình 3.11. Cấu trúc mạng của khung điều hướng đề xuất ........................... 73
Hình 3.12. Đồ thị của SII và SGI, trong đó= 0.45 và

9.........


76

Hình 4.1. Kết quả mô phỏng của hệ thống phát hiện và bám sát
nhiều đối tượng được đề xuất. ................................................................... 80
Hình 4.2 Kết quả thực nghiệm hệ thống phát hiện và bám sát
trường hợp một người di chuyển................................................................ 81
Hình 4.3 Kết quả thực nghiệm hệ thống phát hiện và bám sát
trường hợp hai người di chuyển ................................................................. 81
Hình 4.4 Kết quả mơ phỏng đầu ra của hệ thống thiết kế quỹ đạo chuyển động
của hệ thống điều hướng robot di động được đề xuất trong trường hợp 01 người
di chuyển............................................................................................................................. 82
Hình 4.5 Mơ tả chỉ số cá nhân của hệ thống điều hướng robot di động
được đề xuất trong trường hợp 01 người di chuyển..................................... 82


xi
Hình 4.6. Kết quả mơ phỏng đầu ra của hệ thống thiết kế quỹ đạo
chuyển động của hệ thống điều hướng robot di động được đề xuất
trường hợp 02 người di chuyển................................................................. 83
Hình 4.7 Mơ tả chỉ số cá nhân của hệ thống điều hướng robot di động
được đề xuất trong trường hợp 02 người di chuyển................................... 83
Hình 4.8 Mơ tả chỉ số nhóm của hệ thống điều hướng robot di động
được đề xuất trong trường hợp 02 người di chuyển................................... 83
Hình 4.9. Kết quả thử nghiệm mạng với tập dữ liệu kiểm tra.................... 85
Hình 4.10. Kết quả thử nghiệm với tập kiểm tra thể hiện trên
ma trận confusion...................................................................................... 86
Hình 4.11. Kết quả thử nghiệm mạng với tập dữ liệu kiểm tra..................86
Hình 4.12. Kết quả thử nghiệm với tập kiểm tra thể hiện trên
ma trận confusion...................................................................................... 87
Hình 4.13. Kết quả dự đốn,...................................................................... 88

Hình 4.14 Trường hợp kết hợp các hướng tiếp cận.................................... 89
Hình 4.15 Sơ đồ các thành phần trong module phần mềm......................... 89
Hình 4.16. Mơi trường mơ phỏng trong bài toán tránh vật cản sử dụng
thuật toán học sâu tăng cường DQN.......................................................... 90
Hình 4.17 Khu vực đào tạo trong mơi trường mơ phỏng........................... 91
Hình 4.18 Tổng số phần thưởng đạt được trong 100 chu kỳ huấn luyện
đầu tiên...................................................................................................... 92
Hình 4.19 Tổng số phần thưởng từ chu kỳ thứ 700 đến 750......................93
Hình 4.20. Giá trị Q tối đa trung bình từ các chu kỳ thứ 700 đến 750.......94
Hình 4.21. Tổng số phần thưởng sau khi hồn thành q trình đào tạo.....94
Hình 4.22. Giá trị Q tối đa trung bình sau khi hồn thành q trình
đào tạo....................................................................................................... 94
Hình 4.23 Mơi trường mơ phỏng............................................................... 95
Hình 4.25. Mơ tả chỉ số cá nhân................................................................ 97
Hình 4.26. Mơ tả chỉ số nhóm................................................................... 97


1
MỞ ĐẦU
1. Tính cấp thiết của đề tài luận án
Hơn nửa thế kỷ qua, ngành cơng nghiệp robot đã có những bước phát
triển và đạt được những thành tựu đáng kể. Xu hướng sử dụng robot sẽ ngày
một gia tăng, điều này càng thúc đẩy mạnh mẽ các hướng nghiên cứu về
robot. Các robot tự hành được ứng dụng trong đời sống ngày càng nhiều như
robot vận chuyển hàng hóa, robot kiểm tra nguy hiểm, robot xe lăn cho người
khuyết tật, robot phục vụ sinh hoạt gia đình. Trong quân đội, ứng dụng của các
robot tự hành là khá đa dạng nhằm nâng cao khả năng sinh tồn của binh sỹ
trên chiến trường, nó có thể thực hiện các nhiệm vụ nguy hiểm với tính mạng
con người như: Phát hiện và xử lý bom mìn, vật liệu nổ tự chế, cứu hộ trong
các tòa nhà, những nơi bị nhiễm chất độc, những nơi có nhiệt độ cao, các khu

vực nhiễm chất phóng xạ, robot trinh sát. Ngày nay robot tự hành cịn được
trang bị vũ khí và được lập trình để tiêu diệt các mục tiêu khác nhau...

Khả năng hoạt động điều hướng độc lập, an toàn, đáng tin cậy trong
các mơi trường như nhà cửa, văn phịng, bảo tàng, sân bay, trung tâm mua
sắm, và môi trường đô thị là rất quan trọng đối với các robot tự hành. Nếu
chúng ta muốn triển khai các dịch vụ robot tự hành trong các môi trường
như vậy, vấn đề đầu tiên và quan trọng nhất là robot không chỉ phải tránh
những trở ngại thơng thường mà cịn phải đảm bảo an tồn cho con người
khi di chuyển trong mơi trường bất định. Để thiết lập robot tự hành có thể
điều hướng an tồn cho con người trong mơi trường bất định, robot phải
nhận thức được các hành vi của con người và nhóm người thơng qua việc
khai thác các đặc tính khơng gian của con người và sau đó kết hợp các
thơng tin đó vào hệ thống tránh vật cản cho robot tự hành.
Đã có nhiều phương pháp tránh vật cản cho robot tự hành, tuy nhiên ở các
phương pháp này, robot coi con người như là những vật cản bình thường do đó
những hành vi của robot có thể gây ra cảm giác khó chịu và mất an tồn cho con


2
người, ví dụ: Robot có thể đi xun qua một nhóm người đang nói chuyện, đi qua
mặt của một người đang chú ý quan sát một vật nào đó hoặc đi quá gần con
người.... Những phương pháp tránh vật cản cho robot tự hành có tính đến các

đặc trưng xã hội của con người cịn chưa phổ biến. Vì vậy, việc nghiên cứu,
phát triển hệ thống điều hướng thông minh robot tự hành trong mơi trường
bất định (mơi trường có con người hoạt động) là cần thiết, có ý nghĩa khoa
học và thực tiễn cao.
2. Mục tiêu của luận án
Mục tiêu của luận án là nghiên cứu phát triển hệ thống điều hướng

thông minh cho robot tự hành trong môi trường bất định. Trên cơ sở các
phương pháp đã sử dụng trước đây ứng dụng cho robot di chuyển trong mơi
trường đã biết trước, phát triển thuật tốn điều khiển nhằm nâng cao chất
lượng cho hệ thống khi robot di chuyển trong môi trường bất định.
3. Đối tƣợng, phạm vi nghiên cứu
Nghiên cứu điều khiển chuyển động của robot tự hành trong môi
trường bất định.
Tập trung nghiên cứu phát triển hệ thống phát hiện và bám sát nhiều
đối tượng, hệ thống dự đoán ý định tương tác của người đối với robot và hệ
thống điều hướng cho robot tự hành trong môi trường bất định.
4. Nội dung nghiên cứu
Nghiên cứu các giải pháp kỹ thuật trên cơ sở áp dụng các lý thuyết
hiện đại về điều khiển tối ưu, kỹ thuật học máy, điều khiển thông minh.
Nghiên cứu xây dựng các giải pháp kỹ thuật trên cơ sở phân tích áp
dụng các mơ hình sát thực tế.
Nghiên cứu ứng dụng các công cụ mô phỏng hiện đại: các công cụ mơ
phỏng máy tính Matlab, Ros, Rviz và Gazeboo.
5. Ý nghĩa khoa học và thực tiễn
- Kết quả nghiên cứu của luận án là cơ sở khoa học để nghiên cứu,


3
giảng dạy cho hệ thống phát hiện và bám sát nhiều đối tượng, hệ thống dự
đoán ý định tương tác của người đối với robot và hệ thống tránh vật cản
trong môi trường bất định.
- Kết quả luận án là cơ sở để áp dụng khi thiết kế các hệ thống điều
khiển cho robot tự hành trong môi trường bất định.
6. Phƣơng pháp nghiên cứu
Nghiên cứu từ tổng quan đến chi tiết, kế thừa các kết quả nghiên cứu đã
được công bố. Kết hợp chặt chẽ giữa nghiên cứu lý thuyết với mô phỏng để kiểm

nghiệm. Áp dụng các công cụ và các kỹ thuật điều khiển thông minh để xây
dựng các hệ thống điều hướng cho robot tự hành trong môi trường bất định.

7. Bố cục luận án
Luận án bao gồm phần giới thiệu, bốn chương và phụ lục cùng tài liệu
tham khảo.
Chương 1: Tổng quan về hệ thống điều khiển thiết bị tự hành, tình
hình nghiên cứu trong và ngoài nước, các kỹ thuật học sâu và nhiệm vụ yêu
cầu các bài toán cần giải quyết trong luận án.
Chương 2: Trên cơ sở nghiên cứu hệ thống phát hiện và bám sát đối
tượng, các kỹ thuật học sâu, đề xuất hệ thống phát hiện và bám sát nhiều
đối tượng và hệ thống dự đoán ý định tương tác của người đối với robot cho
hệ thống điều hướng robot trong môi trường bất định. Nội dung chương 2
đã được cơng bố trong cơng trình [CT01], [CT04].
Chương 3: Xây dựng hệ thống điều hướng cho robot di động trong
môi trường bất định trên cơ sở ứng dụng các thuật toán học sâu tăng cường
có tính đến các chỉ số tương tác người-sự vật, người-người. Nội dung
chương 3 được công bố trong cơng trình [CT02], [CT03].
Chương 4: Trình bày các kết quả mô phỏng, thực nghiệm để đánh giá
hiệu quả của thuật toán và phương pháp đã đề xuất.


4
Chƣơng 1
TỔNG QUAN VỀ HỆ THỐNG ĐIỀU KHIỂN THIẾT BỊ TỰ HÀNH
Chương 1 giới thiệu về một số loại thiết bị tự hành và tập trung vào hai
loại nền tảng robot di động được sử dụng trong mô phỏng và thực nghiệm để
minh chứng tính hiệu quả của hệ thống và thuật tốn đề xuất. Ngồi ra, trong
chương 1 trình bày hệ thống phát hiện và bám sát đối tượng truyền thống, các
kỹ thuật học sâu và tình hình nghiên cứu trong, ngoài nước đối với vấn đề

luận án nghiên cứu và xác định các vấn đề cần giải quyết trong luận án.

1.1 Giới thiệu một số loại thiết bị tự hành
Thiết bị tự hành là một loại xe (Robot) có khả năng tự dịch chuyển,
tự vận động (có thể lập trình lại được) như hệ thống điền khiển tự động để
thực hiện thành công công việc được giao. Theo lý thuyết, mơi trường hoạt
động của robot di động có thể là trên mặt đất, dưới nước, trong khơng khí,
khơng gian vũ trụ hay sự tổ hợp giữa chúng. Địa hình bề mặt mà robot di
chuyển trên đó có thể bằng phẳng hoặc thay đổi, lồi lõm và có các loại vật
cản khác nhau bao gồm vật cản tĩnh và vật cản động.
Robot tự hành được chia làm 2 loại chính đó là robot tự hành chuyển
động bằng chân và robot tự hành chuyển động bằng bánh. Ngoài ra, một số
loại robot hoạt động trong các môi trường đặc biệt như dưới nước hay trên
khơng trung thì chúng được trang bị cơ cấu di chuyển đặc trưng.
Để xác minh hiệu suất, tính hiệu quả và tính khả thi của thuật tốn và
hệ thống đề xuất, luận án sẽ trình bày hai nền tảng robot và mơ hình động
học điển hình của robot truyền động vi sai sẽ được sử dụng trong mô phỏng
và thực nghiệm.
1.1.1. Nền tảng robot di động
Hai nền tảng robot sẽ được sử dụng để mô phỏng và thực nghiệm trong
chương 4 của luận án bao gồm nền tảng robot di động trong thế giới thực


5
được trang bị cảm biến Microsoft Kinect và laser finder như trong Hình 1.1
(a) và nền tảng robot di động TurtleBot3 trong Hình 1.1 (b).
Cảm
biến
kinect


Máy quét
Laser

(a)

(b)

Hình 1.1. Hai nền tảng robot di động sử dụng trong luận án
1.1.1.1. Robot di động được trang bị cảm biến kinect và laser
Nền tảng robot di động này được trang bị máy quét laser là UGR-04LX-UG01
và được đặt ở độ cao 0,4 [m]. Nó có thể đo khoảng cách lên đến 6,0 [m] và cung cấp
0
trường nhìn góc 24 . Trong khi đó, cảm biến Kinect của Microsoft có thể cung cấp độ
sâu hình ảnh và hình ảnh RGB và nó được đặt ở độ cao 1,35 [m] so với mặt đất. Độ
phân giải của hình ảnh RGB là 640 x 480 pixel và tốc độ khung hình tối đa là 30 khung
hình/giây. Phần cứng này có thể cung cấp dải hình ảnh độ sâu từ 0,8 [m] đến 6,0 [m]
0
0
với góc nhìn ngang là 57 và góc nhìn dọc là 43 .


6
1.1.1.2. Robot TurtleBot3
TurtleBot3 là một robot di động nhỏ, có thể lập trình, dựa trên ROS
để sử dụng trong nghiên cứu. Công nghệ cốt lõi của TurtleBot3 là xây dựng
bản đồ và điều hướng. TurtleBot3 có thể được sử dụng theo nhiều cách
khác nhau tùy thuộc vào cách tái tạo các bộ phận cơ khí và sử dụng các bộ
phận tùy chọn như máy tính và cảm biến. Ngồi ra, TurtleBot3 được phát
triển với máy tính bảng hiệu quả, phù hợp với hệ thống nhúng và được
trang bị cảm biến khoảng cách 360 độ.

1.1.2. Mơ hình động học của robot tự hành
Trong luận án này, mơ hình robot hai bánh chuyển động vi sai và
thêm 2 điểm tiếp xúc được sử dụng, như Hình 1.2. Trong đó, hai bánh ở
giữa là hai bánh chủ động được điều khiển bởi hai động cơ độc lập, hai
bánh phía trước và phía sau là hai bánh điều hướng thụ động.
YG
YR

R

νl

θ

(x,y)

XR

νR

ΔsR=(r+L).Δθ
ΔsL=r.Δθ
Δθ

ωt

L
XG

Hình 1.2. Mơ tả robot tự hành chuyển động bằng 2 bánh dạng vi sai Trong

đó (XG, YG) là các trục hệ tọa độ tồn cục, cịn (XR, YR) là các

trục hệ tọa độ cục bộ gắn với tâm robot.
Trong trường hợp tổng quát vị trí của robot tự hành trong hệ trục tọa độ
toàn cục được miêu tả bởi véc tơ trạng thái xx, y,T , trong đó (x, y) là tọa
độ tâm robot và θ là góc được tạo thành giữa hướng của robot dọc theo


7
trục XR so với trục XG của hệ trục tọa độ toàn cục. Giả sử trong khoảng thời
gian Δt đủ nhỏ robot di chuyển một khoảng là Δx theo trục X G, Δy theo
phương YG, và quay đi một góc Δθ, khi đó các giá trị Δx, Δy, Δθ được tính
như sau:



xs cos  /2



ys sin / 2
 s RsL



(1.1)
(1.2)
(1.3)

L

Trong đó L là khoảng cách giữa hai bánh của robot, Δs R và ΔsL là
khoảng cách mà lần lượt bánh phải và bánh trái của robot đi được, còn quãng
đường Δs mà tâm của robot dịch chuyển được trong khoảng thời gian Δt là:
s s R sL
2

(1.4)

Vậy phương trình trạng thái của robot tại thời điểm k trong hệ tọa độ
toàn cục được cập nhật từ thời điểm k-1 như sau:
 xk  xk1  s cos(   / 2)
k
k 1
k

 k1
k1
y   y    s sin(  k / 2)
(1.5)





   k1  k




 k


 k 




Về khả năng cơ động và sự thay đổi hướng của robot tự hành dạng vi
k

sai được thể hiện trên Hình 1.3. Trong đó, nếu hai bánh chuyển động với
cùng vận tốc thì robot chuyển động thẳng Hình 1.3(a), hai bánh chuyển
động ngược chiều với vận tốc bằng nhau thì robot quay tại chỗ Hình 1.3(d),
hai bánh chuyển động cùng chiều với vận tốc khác nhau thì robot sẽ di
chuyển sang trái hoặc sang phải như hình Hình 1.3(b) và 1.3(c).


8

Hình 1.3. Tính cơ động và đổi hướng của robot tự hành hai bánh vi
sai 1.2 Cấu trúc điều khiển cơ bản của robot tự hành
Để robot tự hành có thể tự di chuyển trong các mơi trường khác nhau
thì chúng phải có một hệ thống dẫn đường hiệu quả. Dẫn đường là một trong
những vấn đề thách thức nhất của RBTH. Hệ thống dẫn đường hoàn chỉnh

[45] bao gồm các thành phần chính sau: (1) Hệ thống thu thập và xử lý
thơng tin (robot sử dụng tín hiệu từ các cảm biến của nó để trích xuất dữ
liệu có ý nghĩa); (2) Hệ thống xác định vị trí và xây dựng bản đồ (robot
phải xác định được vị trí của nó trong mơi trường); (3) Hệ thống thiết kế
quỹ đạo chuyển động cho robot (robot phải quyết định làm thế nào để hành
động đạt được mục tiêu của nó); (4) Hệ thống điều khiển truyền động

(robot phải điều chỉnh đầu ra động cơ của nó để đạt được quỹ đạo mong
muốn). Cụ thể sơ đồ khối chức năng của robot tự hành theo Hình 1.4
Thu thập
và xử lý
thơng tin
(1)

Xác định
vị trí và
xây dựng
bản đồ(2)

Thiết kế
quỹ đạo
chuyển
động (3)

Điều
khiển
truyền
động (4)

Mơi trường

Hình 1.4. Sơ đồ khối quá trình điều khiển robot tự hành


9
1.2.1 Hệ thống thu thập và xử lý thông tin
Chức năng của khối này là sử dụng các cảm biến để thu thập thông

tin về môi trường xung quanh robot, sau đó trích xuất các thơng tin có ích
cho q trình định vị vị trí và xây dựng bản đồ của robot tự hành.
Một trong những nhiệm vụ quan trọng nhất của một hệ thống tự hành
dưới bất kỳ hình thức nào là thu thập thông tin về môi trường. Điều này
được thực hiện bằng cách sử dụng các cảm biến khác nhau để đo lường các
thông số của môi trường và sau đó trích xuất thơng tin có ý nghĩa cho q
trình định vị vị trí và xây dựng bản đồ.
Có nhiều loại cảm biến được sử dụng trong các robot di động. Một số
cảm biến được sử dụng để đo các giá trị đơn giản như nhiệt độ bên trong
của một thiết bị điện tử của robot hoặc tốc độ quay của động cơ. Các cảm
biến phức tạp hơn khác có thể được sử dụng để thu được thơng tin về mơi
trường của robot. Bởi vì một robot tự hành di chuyển, nó sẽ thường xuyên
gặp các đặc tính mơi trường khơng xác định được trước.
1.2.2 Hệ thống xác định vị trí và xây dựng bản đồ
Hệ thống định vị vị trí nhằm trả lời câu hỏi: Robot đang ở đâu bây
giờ? Vị trí hiện tại là tương đối so với một số điểm mốc (thường là điểm
gốc hoặc điểm đích đến). Các kỹ thuật định vị vị trí có thể làm việc tốt cho
một robot trong một mơi trường và có thể khơng hoạt động tốt ở một hoặc
ở tất cả các mơi trường khác. Ví dụ, việc bản địa hóa hoạt động tốt trong
mơi trường ngồi trời có thể là vơ ích trong nhà.
Tất cả các kỹ thuật định vị vị trí thường cung cấp hai thơng tin cơ bản:

- Vị trí hiện tại của robot ở một số môi trường?
- Định hướng hiện tại của robot trong mơi trường đó là gì?
Thơng tin có thể ở dạng tọa độ Đề các hoặc tọa độ cực hoặc vĩ độ và
kinh độ. Loại thứ hai có thể là sự kết hợp giữa độ cao và nghiêng hoặc la bàn.


10
Khối này sử dụng những thơng tin trích xuất từ khối thu thập và xử lý

thông tin để xác định vị trí và hướng của robot.
1.2.3 Hệ thống thiết kế quỹ đạo chuyển động cho robot
Robot tự hành là robot hoạt động mà khơng có người điều khiển. Để đạt
được các nhiệm vụ, robot tự hành phải tự quyết định hành động của chúng.
Khi robot tự hành quyết định hành động, cần phải lên kế hoạch tối ưu tùy
thuộc vào nhiệm vụ. Hơn nữa, nó là cần thiết để lên kế hoạch một đường đi
giảm thiểu va chạm, giảm chi phí, thời gian, năng lượng và khoảng cách. Khi
một robot tự hành di chuyển từ điểm bắt đầu đến điểm đích trong mơi trường
thì đường đi cần được thiết kế tối ưu hoặc khả thi tránh những trở ngại đối với
nó. Vì vậy, quy hoạch đường đi cho phép robot tìm ra con đường ngắn nhất
hoặc tối ưu giữa hai điểm hoặc có thể là các đường dẫn giảm thiểu số lần
quay, số lần phanh hoặc bất kỳ ứng dụng cụ thể nào yêu cầu.

1.2.4 Hệ thống điều khiển truyền động
Hệ thống này được sử dụng để tạo ra các tín hiệu điều khiển, điều
khiển các động cơ của robot sao cho robot có thể bám theo quỹ đạo mà hệ
thống thiết kế quỹ đạo chuyển động đã tạo ra. Hệ thống điều khiển truyền
động là tổ hợp của nhiều thiết bị và phần tử điện cơ dùng để biến đổi điện
năng thành cơ năng và ngược lại.
Phần tiếp theo của chương 1, luận án trình bày hệ thống phát hiện và
bám sát đối tượng truyền thống và một số kỹ thuật học sâu phục vụ cho
hướng nghiên cứu của luận án.
1.3. Hệ thống phát hiện và bám sát đối tƣợng
1.3.1. Hệ thống phát hiện đối tượng
Các hệ thống thị giác máy tính có thể là một hệ thống kỹ thuật hồn
chỉnh riêng biệt và cũng có thể là một hệ thống con nằm trong một hệ thống
kỹ thuật. Do vậy cấu trúc, yêu cầu, chức năng của hệ thống thị giác máy tính
rất đa dạng phụ thuộc vào phạm vi ứng dụng của chúng. Các chức năng hoạt



11
động của nó được bảo đảm nhờ các phương tiện kỹ thuật, phần mềm hay
kết hợp giữa phần mềm và phần cứng. Sơ đồ khối chức năng của hệ thống
phát hiện đối tượng kiểu truyền thống như hình 1.5
ThuTHUTHnhận

ảnh

Tiền xử lý

Trích chọn

đặc trưng

Bộ phân loại

Hình 1.5. Sơ đồ khối hệ thống phát hiện đối tượng kiểu truyền thống
Chức năng của các thành phần có thể tóm tắt như sau:
Thu nhận ảnh: có thể gồm các khâu quang học (đơn giản nhất gồm
một thấu kính đơn và gương cầu), khâu cơ - điện, quang - điện tử bảo đảm
thu nhận được các tín hiệu ảnh. Khi này yêu cầu đặt ra cho nó là cần phải
bảo đảm các địi hỏi về phổ tín hiệu, năng lượng, độ phân giải khơng gian thời gian, tỉ số tín/tạp, ... Tuy nhiên, trong một số HTTGMT (Hệ thống thị
giác máy tính) ngồi chức năng thu nhận các bức xạ, biến đổi thành tín hiệu
ảnh các cảm biến cũng có thể hồn thành một số nhiệm vụ khác như lọc
nhiễu, xác định các đặc tính phổ của bức xạ ...
Tiền xử lý: Là quá trình dùng để nâng cao chất lượng ảnh đầu vào, tinh
giảm dữ liệu, để phục vụ cho các quá trình xử lý tiếp theo. Quá trình này được
sử dụng để khử nhiễu và loại trừ thông tin không liên quan và không cần thiết.
Nhiễu là thông tin không mong muốn, thường là kết quả của quá trình thu
nhận ảnh. Các bước xử lý khác có thể bao gồm lượng tử hố khơng gian hay

tìm ra các vùng quan tâm để xử lý tiếp theo. Trong q trình này, các thuật
tốn, các kỹ thuật, các toán tử được sử dụng để thực hiện các xử lý khởi đầu
để làm tinh giảm dữ liệu và giúp cho cơng việc phân tích được dễ dàng hơn.
Chúng gồm các thao tác liên quan đến trích chọn vùng quan tâm hay còn gọi
là vùng cụ thể trong ảnh nghiên cứu, thực hiện các phép toán đại số cơ bản
trên ảnh, nâng cao các đặc tính cụ thể của ảnh, và tinh giảm dữ liệu về cả độ


12
phân giải và độ sáng.
Trích chọn đặc trưng: đây là q trình có ý nghĩa đặc biệt quan trọng
nhằm chọn ra những đặc trưng quan trọng nhất của đối tượng. Các dấu hiệu đó
được sử dụng trong bài tốn phát hiện để mô tả những đặc trưng quan trọng
nhất của đối tượng. Việc phát hiện đối tượng thông qua những đặc trưng quan
trọng nhất của đối tượng giúp cho dữ liệu về đối tượng được tinh giảm đi rất
nhiều mà vẫn đảm bảo được nội dung về đối tượng đó. Đồng thời, các dấu
hiệu được chọn đó phải đảm bảo tính bất biến đối với các phép biến đổi như
phép quay, phép dịch, phép thay đổi tỷ lệ của đối tượng …Đây cũng chính là
bước biểu diễn các mẫu bằng các đặc trưng của đối tượng. Trong quá trình
này, số liệu ảnh sẽ được thu gọn lại. Điều này hết sức cần thiết vì sẽ làm nhỏ
được dung lượng bộ nhớ cần dùng và thời gian tính tốn. Một phương pháp
trích trọn đặc trưng tốt nếu như duy trì và làm nổi bật được các nét đặc trưng
của đối tượng mà những đặc trưng đó sẽ giúp cho việc phân biệt được các lớp
mẫu khác nhau, đồng thời nó cũng miễn trừ được những biến đổi do các thiết
bị thu nhận ảnh tạo ra. Mục tiêu của trích chọn đặc trưng là tìm dạng biểu diễn
đặc trưng chính, chủ yếu của đối tượng và giảm độ dư thừa thông tin.
Bộ phân loại: đây là quá trình nhận dạng nhằm phân biệt các lớp đối
tượng khác nhau dựa trên những dấu hiệu đặc trưng của chúng. Nhận dạng là
quá trình phân loại các đối tượng được biểu diễn theo một mô hình nào đó và
gán cho chúng vào một lớp dựa theo những quy luật và các mẫu chuẩn.


1.3.2. Hệ thống bám sát đối tượng
Thành phần bám sát đối tượng là một trong những thành phần quan
trọng của hệ thống thị giác máy tính có nhiệm vụ bám sát các đối tượng cần
quan tâm tùy theo mục đích của ứng dụng. Sơ đồ khối của hệ thống bám sát
đối tượng như Hình 1.6


×