Tải bản đầy đủ (.pdf) (16 trang)

nghiên cứu thuật toán tìm đường đi tối ưu tránh va chạm dành cho robot tự hành di chuyển trên mặt đất

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.87 MB, 16 trang )

<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">

ĐẠI HỌC BÁCH KHOA HÀ NỘITRƯỜNG ĐIỆN – ĐIỆN TỬ

</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2">

B. Mơ hình từ đầu đến cuối (end-to-end) : ...7

C. Huấn luyện mô hình... 7

D. Triển khai kế hoạch chuyển động... 8

IV. Thử nghiệm...8

A. Nền tảng robot...8

B. Đào tạo dữ liệu... 9

C. Đánh giá từng khung hình...9

D. So sánh quỹ đạo trong mơi trường mô phỏng...10

E. Điều hướng trong thế giới thực tế... 12

F. Phản ứng đối với thay đổi đột ngột ...13

V. THẢO LUẬN...14

VI. KẾT LUẬN...14

Tài liệu tham khảo :... 14

</div><span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3">

Tóm tắt :

Lập kế hoạch cho robot là chìa khóa cho robot trong điều hướng , di chuyển tự động . Vì vậy , đề tàinghiên cứu được đưa ra là thu thập dữ liệu , xây dựng thuật tốn và bản đồ cho lộ trình của robot .Trong bài nghiên cứu này , tơi xin trình bày mơ hình có khả năng ánh xạ từ dữ liệu được xác địnhthơng qua laser 2D và một vị trí mục tiêu , để đưa ra các lệnh di chuyển cần thiết cho robot . Mơ hìnhđiều hướng end-to-end (nhận cảm biến và trực tiếp đưa ra lệnh thực thi) hướng mục tiêu cho nềntảng hoạt động của robot . Tôi đánh giá chất lượng của việc lập kế hoạch chuyển động thông quamạng nơ-ron (DNN) và so sánh với phương pháp thông dụng của lập kế hoạch chuyển động dựa trênphương pháp toàn cầu trên lưới , so sánh trong cả trường hợp thực tế và mô phỏng . Từ việc đưa rađược kết quả so sánh trên mô phỏng và thực tế của phương pháp nghiên cứu , dự kiến có thể ápdụng trong thực tế , sử dụng trong đa môi trường .

I. Giới thiệu :

Trong những năm gần đây , với sự tiến bộ nhanh chóng của máy tính và cảm biến , người ta đã cóthể ứng dụng robot di chuyển tự động trên mặt đất trong các lĩnh vực xây dựng , quy hoạch đườngđi , bánh lái tự động và vô số ứng dụng vô cùng thiết thực trong đời sống .

Một trong những thách thức trong việc chế tạo robot là đáp ứng được nhu cầu của con người . Vềđiều hướng , vấn đề này được định nghĩa là việc đi từ vị trí hiện tại đến vị trí mục tiêu , thực hiệnchính sách điều hướng mong muốn . Tuy nhiên , để có thể hiểu rõ được đường đi ngắn nhất , tránhvật cản thì cần sự can thiệp thủ công của con người tốn nhiều thời gian . Ngoài ra , các giải pháp lậpkế hoạch chuyển động cổ điển yêu cầu một số bước tiền xử lý dữ liệu thường được tách riêng . Bảnđồ môi trường phải được cung cấp từ trước , dữ liệu cảm biến được xử lý trước và các đối tượngtiềm năng phải được phát hiện để người lập kế hoạch có thể phản ứng phù hợp cho giai đoạn sau .Robot được thiết lập sẵn chặng đường sẽ khơng có khả năng phản ứng với những tiềm ẩn bất ngờ ,những chướng ngại vật số lượng lớn gây cản trở và không thể hiện được chức năng của một robot tựđộng .

Với mục đích giảm số lượng điều chỉnh thủ cơng , đạt được hiệu suất mong muốn , tăng khả năng tựđộng di chuyển của robot , tơi trình bày cách tiếp cận ngược lại : lập kế hoạch di chuyển dựa trên dữliệu thực tế . Robot được cung cấp dữ liệu thực thi nhất định từ môi trường đào tạo ảo . Bằngphương pháp này , người điều khiển có thể hiển thị mong muốn và chiến lược điều hướng của bảnthân cho robot . Trong quá trình điều hướng , robot sẽ được học lặp đi lặp lại lộ trình cụ thể từ dữliệu của chuyên gia cung cấp (Reinforcement learning) , không chỉ vậy , robot cần hiểu được cácchiến lược tránh va chạm và chuyển chúng sang môi trường (Supervised Learning) . Kết luận lại, lậpkế hoạch đóng vai trị quan trọng trong việc điều hướng cho các loại robot di chuyển tự động . Đểlập một kế hoạch chuyển động lý tưởng , chúng ta cần một thuật tốn giải quyết những điểm khơngchắc chắn trong mơ hình thế giới nhận thức để giảm thiểu tác động của các vật thể lên tiến trình củarobot và tìm đường đi tối ưu trong thời gian ngắn .

</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4">

Hình 1 : Nền tảng robot có khả năng điều hướng an tồn qua một môi trường giống như mê cung chỉbằng cách sử dụng thơng tin laser và mục tiêu cục bộ (phía trên bên trái). Quỹ đạo đã đi qua cuốicùng được hiển thị trên bản đồ (bên phải). Hình ảnh tầm nhìn của robot chỉ được hiển thị để minhhọa mục đích và không được sử dụng làm đầu vào cho thuật tốn từ đầu đến cuối.

Cách hoạt động của robot khơng yêu cầu bản đồ có sẵn để điều hướng . Với dữ liệu cảm biến và vị trítương đối , robot có thể tự động điều hướng đến vị trí mong muốn và tránh được những vật thểngẫu nhiên . Với thiết kế nhận diện vật thể thông qua cảm biến , xác định vị trí tương đối thì robotkhơng bị giới hạn di chuyển bất kỳ môi trường nào . Tuy nhiên , bài nghiên cứu này sẽ tập trung vàorobot di chuyển trong môi trường tĩnh .

Dữ liệu cảm biến sẽ được gửi tới robot thông qua cảm biến từ laser . Phương pháp học máy dựatrên mạng thần kinh (Deep Neural Network) có tiềm năng lớn nhất để mơ hình hóa các phần phụthuộc phức tạp. Nó đã cho thấy tiềm năng trong các ứng dụng khác nhau [1],[2],[3] cùng một số ứngdụng khác . Để đào tạo kế hoạch chuyển động từ đầu đến cuối , tơi sử dụng phương pháp đường đitồn cầu để đưa ra quỹ đạo hồn chỉnh từ vị trí bắt đầu đến mục tiêu , cụ thể là dùng công cụ tìmphạm vi laser với góc qt 270 độ hướng vế phía trước làm cảm biến cho robot .

Hiệu suất của mơ hình chuyển động từ đầu đến cuối được kiểm tra cả trong mô phỏng và trên nềntảng robot thực . Để phân tích tổng qt hóa của mơ hình lập kế hoạch chuyển động cục bộ , điềuquan trọng là tiến hành trong các môi trường chưa từng thấy trước đây , mơi trường này khó xácđịnh dữ liệu hơn môi trường được sử dụng để đào tạo .

Những phần chính trong nghiên cứu là :

● Cơng cụ lập kế hoạch chuyển động toàn diện dựa trên dữ liệu được nhận diện từ phạm vi laser ,đến các lệnh chuyển động

● Triển khai và thử nghiệm robot trên môi trường chưa xác định

● Đưa ra kế hoạch di chuyển cụ thể , đánh giá hiệu quả của phương pháp học sâu (Deep NeuralNetwork) với phương pháp lập kế hoạch chuyển động với lộ trình có sẵn và chỉnh sửa , điều chỉnh lộtrình theo thủ cơng .

Cấu trúc phần còn lại của tài liệu : Ở phần 2 , trình bày tổng quan nghiên cứu . Phần 3 trình bày vấnđề và cách tiếp cận . Phần 4 sẽ nghiên cứu thực nghiệm : thu thập dữ liệu và phân tích dữ liệu . Phần5 thảo luận về kết quả . Phần 6 rút ra kết luận .

</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5">

II. Công việc liên quan :

Lập kế hoạch chuyển động từ end-to-end dựa trên dữ liệu bao gồm nhiều lĩnh vực nghiên cứu, cả từphía nhận thức và lập kế hoạch chuyển động. Trên phía nhận thức, phần hiểu cảnh đặc biệt quantrọng. Dữ liệu đầu vào phải được xử lý để trích xuất thơng tin liên quan.

Vì va chạm với các đối tượng xung quanh cần được tránh và mục tiêu phải được đạt được, trongcông việc của chúng tôi, đặc biệt là phần hiểu cảnh vật lý hoặc chính xác hơn là hiểu biết khơng gianphải được xác định. Fragkiadaki et al. [1] đã chỉ ra rằng có thể học một mơ hình về động học của quảbóng và tường dựa trên các mơ phỏng được thể hiện cho mơ hình trong q trình huấn luyện. Màkhông cần bất kỳ kiến thức trước về động học và va chạm của quả bóng, mơ hình này có thể dự đốnchuyển động của một số quả bóng bi-a trong cấu hình chưa từng thấy trước đó. Điều này chỉ ra rằngcó thể mơ hình hóa tương tác vật lý/khơng gian bằng DNNs. Chen et al. [4] trình bày một phươngpháp trích xuất thơng tin khơng gian từ dữ liệu hình ảnh và sử dụng các đặc trưng được trích xuất đểlập kế hoạch chuyển động của một ơ tô tự động. Phương pháp không phải là từ đầu đến cuối vì nóbao gồm nhiều lớp xử lý, tuy nhiên, nó đã chứng minh rằng thơng tin trích xuất có thể được sử dụngtrực tiếp bởi một lập kế hoạch chuyển động. Ondurska et al. [5] trình bày một ứng dụng từ đầu đếncuối của các mạng nơ-ron cho theo dõi đối tượng động sử dụng dữ liệu laser. Cơng việc của họ chỉ rarằng mạng nơ-ron có thể được sử dụng để trích xuất thơng tin khơng gian quan trọng từ dữ liệulaser hai chiều (2D).

Trên phía lập kế hoạch chuyển động, các nghiên cứu trước đây đã chỉ ra sự tăng cường hiệu suấtbằng cách sử dụng các mơ hình chuyển động dựa trên học. Abbeel et al. [6] chỉ ra sự áp dụng củahọc nghề nghiệp để học các chiến lược điều hướng của con người trên một bãi đỗ xe. Ứng dụng nàycó thể giảm đáng kể lượng điều chỉnh thủ công cho lập kế hoạch chuyển động. Tuy nhiên, kiến thứcvề bản đồ và mạng đường là cần thiết, làm cho phương pháp này chỉ áp dụng cho môi trường đơn.Các phương pháp của Kuderer et al. [7], Pfeiffer et al. [8] và Kretzschmar et al. [9] sử dụng các kỹthuật học máy ngược ngun tắc entropy tối đa cho các mơ hình chuyển động nhận thức tương tác.Các mơ hình tương tác đã học cho người đi bộ dựa trên hành vi được thể hiện trong môi trườngđang chiếm dụng. Những ứng dụng này cũng chỉ ra rằng lượng điều chỉnh thủ công của các mơ hìnhchuyển động và tương tác có thể giảm bằng cách áp dụng các kỹ thuật học máy và mơ hình chuyểnđộng đã học có thể vượt qua các mơ hình được thiết kế bằng tay.

Đối với các ứng dụng yêu cầu sự phối hợp chặt chẽ giữa nhận thức và điều khiển, như lập kế hoạchđường cho một cánh tay robot đóng nắp chai, Levine et al. [10] chỉ ra rằng các phương pháp học từđầu đến cuối có thể mang lại lợi ích và vượt qua các phương pháp đa tầng. Một vấn đề tìm kiếmchính sách được chuyển đổi thành một vấn đề học tăng cường sâu sâu sử dụng mạng nơ-ron tíchchập (CNN) cho ánh xạ phức tạp giữa trạng thái và hành động. Mơ hình đã học có thể lập kế hoạchthành cơng cho mã lực của một cánh tay robot, dựa trên dữ liệu hình ảnh ngun thơ. Phương phápkhác dựa trên học tăng cường sâu sâu dựa trên hình ảnh để lập kế hoạch/chưa định được trình bàybởi Mnih et al. [11]. Họ chỉ ra rằng có thể học chơi nhiều trị chơi máy tính dựa trên dữ liệu pixelmàn hình và thậm chí vượt qua người chơi con người.

Liên quan đến ứng dụng robot di động của việc học từ đầu đến cuối, Ross et al. [12] trình bày mộtphương pháp học bộ điều khiển trái/phải cho một phương tiện bay khơng người lái (UAV) dựa trêndữ liệu hình ảnh. UAV có thể tự động điều hướng qua rừng và tránh va chạm với cây trong hầu hếtcác trường hợp. Tuy nhiên, chỉ có thể kiểm sốt chuyển động trái/phải trong khi lệnh chuyển động

</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6">

tiến vẫn được chọn bởi một nhà điều khiển con người. Kim et al. [13] mở rộng phương pháp này chomột ứng dụng hành lang nơi họ học về vận tốc dịch và xoay. Tuy nhiên, phương pháp chỉ được thửnghiệm trong những hành lang trống trải khơng có vật cản nào chặn đường đi của UAV. Phươngpháp tránh va chạm từ đầu đến cuối dựa trên hình ảnh khác được trình bày bởi Muller et al. [14]. Họtập trung vào việc trích xuất đặc trưng hình ảnh và khả năng chuyển giao giữa các điều kiện môitrường khác nhau. Chứng minh rằng việc tránh va chạm hoạt động, tuy nhiên, hiệu suất điều hướngcủa robot khơng được phân tích.

Sergeant et al. [15] trình bày một phương pháp lập kế hoạch chuyển động từ đầu đến cuối dựa trênlaser và dữ liệu được điều khiển bởi máy nén sâu. Khả năng tránh va chạm của phương pháp nàyđược thể hiện trong mô phỏng và trên một nền tảng robot. Khác với khung cơng việc của chúng ta,khơng có vị trí mục tiêu của robot nào được xem xét, do đó, nó khơng thể áp dụng như một kỹ thuậtlập kế hoạch chuyển động cục bộ nếu một mục tiêu phải được đạt đến. Với phương pháp này, robotcó thể di chuyển trên các đường đi hợp lý, tuy nhiên, không thể đạt được một mục tiêu cụ thể .

Để robot đưa ra được quyết định đúng – di chuyển robot tới vị trí mong muốn (bao gồm hướng dichuyển) – robot phải vượt qua nhiều giai đoạn . Đầu tiên , trích xuất được dữ liệu từ bộ cảm biến .Thứ hai , sử dụng thơng tin này , tìm ra mơ hình mối quan hệ giữa các quan sát và hành động cầnthực thi . Thứ ba , trong quá trình triển khai , mơ hình phải đưa ra được quyết định đúng ngay khixuất hiện quan sát mới(xác định môi trường nhanh chóng trong trường hợp xuất hiện chướng ngạivật đột xuất) .

Phương pháp tính trực tiếp các lệnh di chuyển thích hợp dựa trên dữ liệu cảm biến và mục tiêu . Vớicác mô phỏng , tôi đưa ra hàm :

� =�<small>�</small>(y, g)y : dữ liệu cảm biến nhận được .

g : thông tin mục tiêu .

u : hàm thực thi lệnh mong muốn , ánh xạ trực tiếp dữ liệu cảm biến y và thông tin mục tiêu g thànhcác lệnh di chuyển .

Hàm được tham số hóa bởi vecto tham số� . Trong quá trình huấn luyện robot , chúng ta sẽ tìm cáctham số hàm� mà xử lý dữ liệu tốt nhất . Tiêu chí tối ưu được đánh giá thông qua sai lệch so vớithực thi thông qua điều khiển thủ công từ các chuyên gia :

����<sub>�</sub>(y, g)−�<sub>���</sub>

</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7">

� (y, g)<sub>�</sub> : lệnh di chuyển theo dự đoán .

�<small>���</small>: lệnh di chuyển được cung cấp bởi các chuyên gia .

Trong quá trình triển khai , các tham số mơ hình� đã được xác định và các lệnh thực thi có thể đượctính tốn dựa trên y , g .

B. Mơ hình từ đầu đến cuối (end-to-end) :

Hình 2 : Cấu trúc của CNN. Dữ liệu laser được xử lý bởi phần tích chập, bao gồm hai khối xây dựngdư thừa như trình bày trong [16]. Phần FC của mạng kết hợp các đặc trưng được trích xuất và thơngtin mục tiêu. Kích thước đầu vào/đầu ra của mơ hình tổng thể được hiển thị trên các kết nối. Chínhsách đề xuất L1 được áp dụng cho tất cả các tham số của mơ hình.

Mối quan hệ từ đầu đến cuối giữa dữ liệu đầu vào và các lệnh thực thi có thể dẫn đến một mơ hìnhphức tạp bất kỳ. Trong số nhiều phương pháp học máy khác nhau, DNNs/CNNs được biết đến vớikhả năng như một hàm xấp xỉ siêu tham số để mơ hình các phụ thuộc phức tạp và phi tuyến. Trongcông việc này, chúng ta sẽ sử dụng một Convolutional Neural Networks (mạng nơ-ron tích chập) đểbiểu diễn hàm�<sub>�</sub>. Tồn bộ quy trình xử lý từ việc trích xuất thơng tin đến việc tìm ra các lệnh thựcthi phải được bao phủ bởi một mơ hình duy nhất. Như đã đề cập trước đó, các đầu vào được đo bởicác đo lường của bộ dò phạm vi laser 2D và vị trí mục tiêu tương đối, có nghĩa là vị trí của mục tiêu(tọa độ cực) trong một hệ tọa độ tâm của robot. Để có được các đặc trưng hiểu biết về không gian,dữ liệu laser được xử lý bởi một CNN trước khi đầu ra của mạng con đó được kết hợp với thơng tinmục tiêu và xử lý bởi các lớp kết nối đầy đủ (FC – Fully Connected Layer – một loại lớp trong nơ-ronnhân tạo, thường xuất hiện ở cuối của mơ hình và thực hiện nhiệm vụ phân loại dữ liệu) của mơhình . Cấu trúc của mơ hình mạng nơ-ron được hiển thị trong Hình 2. Mạng bao gồm hai khối xâydựng còn lại bao gồm các kết nối tắt như đề xuất trong [18], chỉ ra rằng có thể giảm thiểu độ phứctạp của quá trình huấn luyện bằng cách sử dụng các mạng dư, so với việc xếp các tích chồng lên nhau.Trong bài nghiên cứu này sẽ nêu ra hai mơ hình . Đối với phiên bản đầu tiên (CNN smallFC), ba kíchthước lớp FC là (256, 256, 256) trong khi đối với phiên bản thứ hai (CNN bigFC), kích thước củachúng được tăng lên là (1024, 1024, 512). Phần tích chập của cả hai mạng khơng thay đổi, như đượchiển thị trong Hình 2. Việc triển khai mơ hình mạng nơ-ron của chúng tơi dựa trên frameworkTensorFlow của Google [17].

C. Huấn luyện mơ hình

Mục tiêu cuối cùng của phương pháp được trình bày là khả năng học một đặc điểm di chuyển đượcchuyển cho robot bởi một người điều khiển chuyên gia theo một cách được giám sát . Để tránh gánhnặng của việc thu thập dữ liệu di chuyển của con người ở quy mô lớn, chúng tôi dựa vào mô phỏngnơi một kế hoạch chuyển động toàn cầu được sử dụng như một chuyên gia. Điều này là một đặc

</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8">

điểm rất quan trọng trong các ứng dụng robot nơi việc thu thập dữ liệu đắt đỏ. Đối với mỗi bướcthời gian i , bộ dữ liệu :

γᵢ=(yᵢ, gᵢ, uᵢₑₓₚ, ᵢ)yᵢ:đo lường laser

gᵢ : thông tin mục tiêu

uᵢₑₓₚ, ᵢ : lệnh di chuyển được cung cấp bởi chuyên gia.

Ở đây, lệnh tốc độ u=(v,ω) bao gồm vận tốc dịch chuyển và vận tốc xoay. Để giảm thiểu các tươngquan thời gian trong dữ liệu huấn luyện đến mức tối thiểu, các bộ dữ liệu được ngẫu nhiên hóatrước khi sử dụng cho việc huấn luyện. Q trình tối ưu hóa được thực hiện bằng cách sử dụng trìnhtối ưu hóa Adam [18] với huấn luyện theo lô nhỏ. Hàm mất mát cho mỗi bước học giám sát k đượccho bởi công thức :

�<small>�</small>(Γ<small>�</small>)=�<sup>1</sup><sub>�</sub><sup>.</sup><small>� = ��+��</small>

�<sub>�</sub><sub>�</sub>(y<sub>�</sub>, g<sub>�</sub>)−�<sub>���,�</sub>

Trong đóΓ = [γᵢ , …, γ<sub>�</sub> <sub>�+ �</sub><sub>�</sub>] bao gồm nhiều mẫu của bộ huấn luyện . �<sub>�</sub><sub>�</sub>đại diện cho mơ hình tạibước hn luyện hiện tại

D. Triển khai kế hoạch chuyển động

Một ưu điểm của các mơ hình mạng nơ-ron so với các phương pháp khác là thời gian truy vấn dựkiến của chúng trong quá trình kiểm thử. Trong khi độ phức tạp của các phương pháp đa giai đoạncó thể tăng lên nếu môi trường trở nên phức tạp hơn, độ phức tạp của mạng nơ-ron không bị ảnhhưởng bởi môi trường của robot và truy vấn vẫn giữ ngun. Vì khơng cần xử lý trước dữ liệu lasertừ bên ngoại, độ phức tạp tính tốn và do đó cũng thời gian truy vấn cho một lệnh lái chỉ phụ thuộcvào độ phức tạp của mơ hình, mà sau khi được đào tạo là hằng số.

Mơ hình mạng nơ-ron được trình bày tính tốn các lệnh thực thi theo từng khung hình. Khơng có bộnhớ nội hoặc ngoại vi được sử dụng để xem xét các đầu ra trước đó và đầu vào.

IV. Thử nghiệm

Phần này bao gồm các thí nghiệm đã được tiến hành và đánh giá kết quả. Đầu tiên, nền tảng robotđược giới thiệu, nó được sử dụng trong tất cả các thí nghiệm, cả trong mơ phỏng và thực tế. Tiếptheo, quá trình tạo dữ liệu đào tạo được mơ tả trước khi bốn thí nghiệm (hai trong mơ phỏng, haitrên nền tảng thực) được trình bày để đánh giá. Sau đây , mơ hình lập kế hoạch chuyển động dựatrên mạng nơ-ron sẽ được gọi là lập kế hoạch sâu.

A. Nền tảng robot

Sử dụng một TurtleBot dựa trên Kobuki làm nền tảng robot của mình. Thêm một cảm biến laserHokuyo UTM1 hướng về phía trước với góc nhìn (FOV) là 270 độ và khoảng quét tối đa là 30 m chorobot lái chuyển với bánh lái cấp độ. Cảm biến laser có độ phân giải góc là 0,25 độ, dẫn đến 1080 lần

</div><span class="text_page_counter">Trang 9</span><div class="page_container" data-page="9">

đo trong mỗi quét. Sử dụng một máy tính Intel NUC với bộ vi xử lý i7-5557U 3,10 GHz chạy Ubuntu14.04 làm máy tính trên bảng và Robot Operating System (ROS) làm middleware.

B. Đào tạo dữ liệu

Hình 3 : Thống kê lỗi của lỗi từng khung giữa ROS (chuyên gia) và bộ lập kế hoạch sâu. Dữ liệu đánhgiá không được sử dụng để huấn luyện trước đó. Ba hình nhỏ minh họa các bản đồ mà đánh giáđược thực hiện. Việc xem bản đồ được cải thiện khi phóng to trên màn hình máy tính.

Chúng ta sử dụng mạng lưới điều hướng 2D của ROS cho lớp điều hướng hai cấp độ (toàn cầu và cụcbộ). Trên cấp độ toàn cầu, chúng ta sử dụng lập kế hoạch Dijkstra dựa trên lưới, trong khi mộtphương pháp tiếp cận cửa sổ động (DWA) được sử dụng ở cấp độ cục bộ. Chúng ta sử dụng Stage 2Dnhư một bộ mô phỏng động trong quá trình tạo dữ liệu đào tạo. Trong quá trình tạo dữ liệu, robot dichuyển đến 30 vị trí mục tiêu ngẫu nhiên, sử dụng lập kế hoạch điều hướng của chuyên gia. Dữ liệuđào tạo được tạo ra trên bản đồ "train" và dữ liệu đánh giá được tạo ra trên hai bản đồ "eval1" và"eval2" [Hình 3]. Bản đồ "train" gốc được hiển thị trong cột bên trái của Hình 3 và Hình 4 . Đối vớicác thử nghiệm thực tế, chúng tôi sử dụng dữ liệu đào tạo từ cả bản đồ "train" và bản đồ "eval2".Bản đồ "eval2" bao gồm những vật thể lộn xộn và khác nhau mà robot có thể gặp phải trong thửnghiệm thực tế. Chúng tôi tạo ra 6000 quỹ đạo trên bản đồ "train" và 4000 quỹ đạo trên bản đồ"eval2" với mơ hình chạy trên GPU Nvidia GeForce GTX 980 Ti, tương ứng với khoảng 2,1 triệu và 2,2triệu cặp dữ liệu đầu vào/đầu ra .

C. Đánh giá từng khung hình

Thí nghiệm này tập trung vào đánh giá lỗi của mơ hình CNN liên quan đến các lệnh thực thi di chuyểnđược tính tốn. Như đã đề cập trong Phần IV-B, mơ hình được đào tạo với các mẫu từ bản đồ huấnluyện duy nhất. Thí nghiệm này được thực hiện bằng cách sử dụng mơ hình CNN smallFC. Để độc lậpvới GPU trong quá trình kiểm thử, việc truy vấn phải được thực hiện bằng CPU duy nhất. Trên mộtmáy tính có bộ xử lý Intel i7-4810MQ với tốc độ 2.8GHz, thời gian truy vấn trung bình của mơ hình là4.3 ms.

Đối với q trình đánh giá, chúng tôi tạo các cặp dữ liệu đầu ra/đầu vào cho ba bản đồ bao gồm train,eval1 và eval2, bằng cách di chuyển đến 30 vị trí mục tiêu ngẫu nhiên mỗi lần, sử dụng lập kế hoạchchuyển động của chuyên gia. Dựa trên dữ liệu này (không thấy trong quá trình đào tạo), lỗi giữa cáclệnh lái dịch chuyển và xoay của mơ hình và lập kế hoạch chuyển động của chun gia được tínhtốn cho mỗi cặp dữ liệu đầu ra/đầu vào.

Như thống kê lỗi trong Hình 3 đã cho thấy, lỗi đánh giá nhỏ nhất có thể quan sát được trên bản đồhuấn luyện. Chúng tôi nhận thấy rằng những giá trị lớn ngoại vi của lệnh vận tốc quay thường xuấthiện khi quay chỗ, ví dụ như quay 180° về phải hoặc trái có ảnh hưởng lớn đến lỗi vận tốc quay

</div><span class="text_page_counter">Trang 10</span><div class="page_container" data-page="10">

nhưng chỉ ảnh hưởng nhỏ đến hành vi thực tế của robot. Bản đồ eval1 có cấu trúc khác biệt so vớibản đồ huấn luyện, nhưng các vật cản có hình dạng tương tự. Điều này dẫn đến tăng lỗi đánh giá,đặc biệt là lệnh vận tốc quay. Chuyển đến bản đồ eval2, cả phần dịch chuyển và phần quay của lỗiđánh giá tăng lên thêm nữa.

Kết quả này xác nhận mong đợi của chúng tơi. Mơ hình có khả năng chuyển đổi kiến thức về hiểubiết cảnh và điều hướng từ môi trường này sang môi trường khác. Tuy nhiên, nếu sự chênh lệchtrong cấu trúc môi trường lớn, chẳng hạn như giữa bản đồ huấn luyện và bản đồ eval, hiểu biết cảnhđúng đắn có thể khơng đảm bảo, dẫn đến sự chênh lệch lớn hơn giữa lệnh lái của chun gia và mơhình CNN.

D. So sánh quỹ đạo trong mơi trường mơ phỏng

Thí nghiệm trước đã chứng minh khả năng của việc phân tích từng khung hình. Trong phần này,phân tích hiệu suất của mơ hình điều hướng khi triển khai nó như một trình lập kế hoạch chuyểnđộng trên nền tảng robot . Thí nghiệm này sẽ cho chúng ta biết liệu các đặc điểm điều hướng cóđược từ chuyên gia hay có sự chệch lệch đặc biệt trên một bản đồ cụ thể khơng. Mơ hình CNN và dữliệu huấn luyện giống như trong thí nghiệm trước. Cả cho môi trường đào tạo và môi trường eval1,các nhiệm vụ với vị trí mục tiêu cố định được tạo ra. Trong khi trình lập kế hoạch ROS có thơng tintồn cầu về bản đồ như trong q trình đào tạo, mơ hình điều hướng sâu chỉ nhận thơng tin mụctiêu tương đối (điểm đỏ, Hình 4) và kết quả của cảm biến laser ở mỗi bước thời gian như một đầuvào. Vì mơ phỏng là xác định, chỉ có một nhiệm vụ cho mỗi trình lập kế hoạch được đánh giá. Khảnăng tái tạo của phương pháp sẽ được kiểm tra trong thí nghiệm thế giới thực kế tiếp.

Vì cấu trúc lập kế hoạch được sử dụng cho việc đào tạo là một phương pháp lập kế hoạch chuyểnđộng theo lớp, nó khơng thể được mơ tả trong một hàm chi phí đơn. Do đó, ngồi việc kiểm tra trựcquan, quỹ đạo cũng được đánh giá dựa trên các chỉ số sau đây, được lấy cảm hứng từ [23]:

�<small>����</small>: khoảng cách từ vị trí cuối cùng của quỹ đạo đến điểm mục tiêu được tổng hợp qua tất cả cácquỹ đạo.

�<sub>�����</sub>: giá trị tuyệt đối tích hợp của gia tốc dịch chuyển qua tất cả các quỹ đạo.E<small>���</small>: giá trị tuyệt đối tích hợp của gia tốc xoay qua tất cả các quỹ đạo.dist : tổng quãng đường đã đi được cho nhiệm vụ.

time : tổng thời gian di chuyển cho nhiệm vụ.

</div>

×