bài tập lớn xây dựng chương trình giao tiếp với hệ cơ điện tử ứng dụng xử lý ảnh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (7.89 MB, 22 trang )

<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">

<b>TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI</b>

MSSV: 20184563MSSV: 123456MSSV: 123456

</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2">

<b>Đánh giá của giảng viên hướng dẫn</b>

Giảng viên hướng dẫn

</div><span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3">

<b>CHƯƠNG 3. MƠ HÌNH THỰC NGHIỆM VÀ PHÂN TÍCH3</b>

</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4">

<b>1TỔNG QUAN VỀ ĐỀ TÀI1.1 Giới thiệu chung</b>

Hiện nay, nền Công nghiệp đang hướng tới Công nghiệp 4.0, là sự kết hợp cácCông nghệ lại với nhau, làm mờ ranh giới giữa vật lý, kỹ thuật số và sinh học. Từ đó, các thiết bị điện tử thơng minh đang ngày càng xuất hiện phổ biến. Trong đó phải kể đến

một vài ứng dụng của xử lý ảnh, như các ứng dụng của nó trong y tế trong việc phát hiện các mầm mống bệnh từ những chiếc máy xử lý hình ảnh hiện đại để phát hiện bệnh một cách rõ ràng. Ngoài ra, được áp dụng hiệu quả trongsản xuất như phân loại hay kiểm tra sản phẩm.

Có lẽ trong vài năm trở lại đây, object detection là một trong những đề tài rất hot của deep learning bởi khả năng ứng dụng cao, dữ liệu dễ chuẩn bị và kết quả ứng dụng thì cực kì nhiều. Các thuật tốn mới của object detection như YOLO, SSD có tốc độ khá nhanh và độ chính xác cao nên giúp cho Object Detection có thể thực hiện được các tác vụ dường như là real time, thậm chí lànhanh hơn so với con người mà độ chính xác khơng giảm. Các mơ hình cũng trở nên nhẹ hơn nên có thể hoạt động trên các thiết bị IoT để tạo nên các thiết bị thông minh.

Đề tài “ Sử dụng thuật toán yolo để phân loại sản phẩm trên Raspberry-pi” sẽ ứng dụng sự phát triển deep learning để áp dụng trong công việc phân loại sản phẩm

<b>1.2 Nguyên lý hoạt động của hệ thống</b>

● Hệ thống phân loại sản phẩm theo ứng dụng thuật Yolo và Raspberry-pi hoạtđộng theo sơ đồ dưới đây:

</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5">

Hình 1: nguyên lý hoạt động của hệ thống phân loại sản phẩmbắt đầu

camera thu ảnh trực tiếp

Yolo xử lý ảnh

Khu vực chấp hành

</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6">

<b>1.3 Các thành phần cơ bản của hệ thống</b>

Giới thiệu các thành phần cơ bản của hệ thống và các thơng số chính.● Hệ thống bao gồm các thành phần sau:

o Hệ thống băng truyềno 3 servo

o Raspberryo webcam

o Đèn chiếu sáng: đèn flash trên điện thoạio Laptop để xử lý ảnh từ webcam

● Raspberry-pi Raspberry Pi là một máy vi tính rất nhỏ gọn, kích thước hai cạnh chỉ cỡ một cái thẻ ATM, trong đó đã tích hợp mọi thứ cần thiết để bạn sử dụng như một máy vi tính. hỗ trợ một loạt các IDE bao gồm Mu, một trình soạn thảo Python được đề xuất trên trang web chính thức của Pi.

● Yolo

Yolo (You Only Look Once) là một mơ hình mạng CNN cho việc phát hiện, nhận dạng, phân loại đối tượng. Yolo được tạo ra từ việc kết hợp giữa các convolutional layers và connected layers.

Yolo có thể đạt được được tốc độ gàn như realtime mà độ chính xác khơng q giảm so với các model khác.

</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7">

<b>2THIẾT KẾ PHẦN MỀM ĐIỀU KHIỂN</b>

<b>2.1 Thuật toán xử lý ảnh</b>

<b>2.1.1 Giới thiệu Xử lý ảnh trong Yolov4</b>

Cấu trúc của v4 được tác giả chia làm bốn phần:Backbone( xương sống).

Neck (cổ).Head

<b>Backbone( Xương sống) – Trích xuất đặc trưng.</b>

Mạng xương sống cho nhận dạng vật thể thường được đào tạo trước ( train)thông qua bài tốn phân loại ImageNet. Pre-train có nghĩa là trọng số của mạng đã được điều chỉnh để xác định các đặc điểm liên quan trong một hình ảnh, mặc dù chúng sẽ được tinh chỉnh trong nhiệm vụ mới là phát hiện đối tượng. Tác giả xem xét sử dụng các xương sống:

<b>Darknet53: Yolov4 sử dụng CSPDarknet53</b> để làm backbone vì theo tác giả, <b>CSPDarknet53</b> có độ chính xác trong task object detection cao hơn so với

</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8">

ResNet; và mặc dù ResNet có độ chính xác trong task classification cao hơn, hạn chế này có thể được cải thiện nhờ hàm activation Mish và một vài kỹ thuật sẽ được đề cập phía dưới.

<b>Neck ( phần cổ) – Tổng hợp đặc trưng.</b>

Neck có nhiệm vụ trộn và kết hợp các bản đồ đặc trưng(features map) đã họcđược thơng qua q trình trích xuất đặc trưng( backbone) và quá trình nhận dạng( YOLOv4 gọi là Dense prediction).

Với mỗi lần thực hiện detect với các kích thước ảnh rescale khác nhau tác giảđã thêm các luồng đi từ dưới lên và các luồng đi từ trên xuống vào cùng nhautheo từng hoặc được nối với nhau trước khi đưa vào head( phần đầu), từ đó lớp nhận dạng sẽ chứa thông tin phong phú hơn.

YOLOv4 sử dụng phần head giống như YOLOv3 với các hộp neo (anchor box) và nhận dạng với ảnh có kích thước khác nhau.

</div><span class="text_page_counter">Trang 10</span><div class="page_container" data-page="10">

- giúp xác định bounding box. Trong đó là toạ độ tâm là kích thước dài và rộng của bouning box.

Đầu ra của xử lý hình ảnh là các toạ độ của sự vật, hình ảnh có gắn nhãn nên việc phân loại sẽ diễn ra 1 cách linh hoạt và nhanh chóng

<b>2.1.2 Lập trình xử lý ảnh bằng Yolov4</b>

Các thư viện được sử dụng:

● <small>tạo project Sử dụng command line để clone git project </small>

● xây dựng môi trường để chạy file darknet.py

● Tải dữ liệu đã train từ trước

</div><span class="text_page_counter">Trang 11</span><div class="page_container" data-page="11">

đây là bộ thư viện đã được train từ trước gồm 80 loại dữ liệu gần màu sắc, hình dạng, các lồi động vật

● Mơ hình Darknet

Kiểm tra thuật tốn

Chạy Yolov4 trên webcam và test thuật toán

</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13">

● khởi tạo camera

● phát hiện và đưa đối tượng nhận diện ra khung ảnh khác.

<b>2.2 Thiết kế giao diện</b>

</div><span class="text_page_counter">Trang 14</span><div class="page_container" data-page="14">

<b>3MƠ HÌNH THỰC NGHIỆM VÀ PHÂN TÍCH</b>

<b>3.1 Kết quả thực nghiệm</b>

Ta có các kết quả thực nghiệm về xử lý ảnh nhận dạng

</div><span class="text_page_counter">Trang 18</span><div class="page_container" data-page="18">

<b>3.2 Thảo luận kết quả thực nghiệm</b>

Ta có thể thấy tốc độ xử lý và nhận dạng vật nhanh. Độ chính xác cao dù vật có thayđổi vị trí hay hướng nghiêng khác nhau.

Tuy nhiên độ chính xác và tốc độ xử lý sẽ phụ thuộc vào các yêu tố, Độ chính xác sẽ phụ thuộc và đầu vào thư viện , những dữ liệu đã được train từ trước. Để có 1 thưviện chuẩn, đa dạng sẽ yêu cầu có thời gian để train và yêu cầu thiết bị đúng yêu cầu,

Đầu ra của Xử lý ảnh bằng yolo ta có Ảnh nhận dạng

</div><span class="text_page_counter">Trang 19</span><div class="page_container" data-page="19">

Sau khi nhận dạng ta nhận được một bảng thơng tin trong đó có các thơng số:“45” “50” “49” là các nhãn được được gắn cho từng vật ví dụ 50 là chỉ người.

Kế bên đó là thơng số toạ độ của vật.

Các data này sẽ được Raspberry sẽ tiếp nhận và xử lý để điều khiển bộ chấp hành.

</div><span class="text_page_counter">Trang 20</span><div class="page_container" data-page="20">

Nội dung phần kết luận này tùy thuộc vào từng đề tài. Lưu ý trong phần kết luận khơng nên có bất cứ phương trình, biểu đồ hay bảng biểu nào. Cần trình bày rõnội dung đề tài đã đáp ứng đầy đủ các yêu cầu của đề bài hay chưa. Trình bày về ý nghĩa của các kết quả thu được, các đánh giá nhận xét về tính khả thi, tính chính xáccủa kết quả, tính thực tế của đề tài …Cần lưu ý hạn chế sử dụng các tính từ, trạng từmạnh trong khi miêu tả kết quả đạt được, cần đảm bảo tính trung thực của các kết luận.

Trình bày các kiến thức mà sinh viên đã đạt được sau khi thực hiện đề tài. Đồng thời trình bày về các kỹ năng đã học được (kỹ năng tự tìm kiếm tài liệu, tổng hợp thông tin, kỹ năng chế bản, kỹ năng trình bày, viết báo….).

<b>4.2 Hướng phát triển của đề tài trong tương lai</b>

Nêu tóm tắt hướng mở rộng của đề tài trong tương lai nếu có. Đây là mục tùy chọn vì phụ thuộc vào loại đề tài.

</div><span class="text_page_counter">Trang 21</span><div class="page_container" data-page="21">

[1]

Trần Bách, Lưới điện và hệ thống điện, Nhà xuất bản Khoa học Kỹ thuật, 2004.

[2]

Abe Masayuki, “A Practical Approach to Accurate Fault Location on Extra High Voltage Teed Feeders,” IEEE Transaction on Power Delivery, pp. 159-168, 1995.

[3]

Microsoft, "Add citations in a Word document," 2017.

</div><span class="text_page_counter">Trang 22</span><div class="page_container" data-page="22">

</div>