Tải bản đầy đủ (.docx) (4 trang)

Xây dựng mô hình trí tuệ nhân tạo

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (612.5 KB, 4 trang )

1 HỘI NGHỊ TỔNG KẾT HOẠT ĐỘNG SINH VIÊN NGHIÊN CỨU KHOA HỌC VÀ NHÓM SRT NĂM HỌC 2019-2020

XÂY DỰNG MƠ HÌNH TRÍ TUỆ NHÂN TẠOVÀO PHÂN LOẠI RÁC THẢI TRÊN THIẾT BỊ NHÚNG

BUILDING AI MODEL TO CLASSIFY WASTES ON EMBEDDED DEVICE

SVTH: Phạm Duy Thanh
Lớp 18T2, Khoa Điện – Điện Tử, Trường Đại học Sư phạm Kỹ thuật - Đại học Đà Nẵng

GVHD: TS. Phạm Tuấn
Khoa Điện – Điện Tử, Trường Đại học Sư phạm Kỹ thuật - Đại học Đà Nẵng

Tóm tắt - Mức sống cao hơn dẫn đến nhiều vấn đề về môi Abstract - Higher standard of living leads to numerous
trường, và vấn đề đáng báo động nhất là rác thải. Rác thải ngày environmental issues, and the most alarming issue is waste.
nay vẫn được thu gom và phân loại bằng các phương pháp thủ Waste today is still collected and classified by manual methods
công sử dụng nhiều lao động và ảnh hưởng đến sức khỏe của that are labor-intensive and affect the health of workers. Realizing
người lao động. Nhận thấy sự bất cập trong quy trình phân loại the inadequacies in the waste classification process, this project
chất thải, dự án này đã phát triển mơ hình Trí tuệ nhân tạo để developed an Artificial Intelligence model for classifying wastes
phân loại chất thải như lon, chai nhựa và túi nhựa trên các thiết bị such as cans, plastic bottles and plastic bags on embedded
nhúng. Mơ hình này sử dụng kiến trúc mạng SSD (Phát hiện một devices. This model uses the SSD network architecture (Single
lần chụp) để giúp mơ hình trả về kết quả nhanh chóng và chính Shot Detector) to help the model return results quickly and
xác. Thành công của dự án này có thể tạo cơ hội cho các dự án accurately. The success of this project can produce a chance for
lớn hơn có thể giúp ích rất nhiều cho các vấn đề liên quan đến larger projects that can help a lot in waste-related issues such as:
chất thải như: chế tạo phương tiện tự lái nhằm thu gom và phân building self-driving vehicles aims to collect and classify wastes
loại chất thải tự động và máy tự động để phân loại chất thải. automatically and automatic machine for classifying waste.

Từ khóa - phân loại rác bằng trí tuệ nhân tạo; ứng dụng trí Key words - Waste classification by AI, Application of
tuệ nhân tạo; ứng dụng deep learning; phân loại rác trên thiết bị artificial intelligence, Deep learning application, Waste
nhúng classification, Waste separation on embedded equipment

1. Cơ sở lý thuyết Hình 1: Mơ hình chung cho bài tốn học sâu


1.1. Khái niệm học sâu – Deep learning sát, ta chỉ có đầu vào mà thơi.
1.2.1. Giai đoạn huấn luyện
Deep learning là một nhánh của máy học với đặc điểm Giai đoạn huấn luyện là bước quan trọng để xây dựng
là sử dụng các mơ hình phi tuyến tính có chiều sâu để dự mơ hình Trí tuệ nhân tạo. Ở giai đoạn huấn luyện cần dữ
đoán. Mạng nơ-ron nhân tạo nền tảng của deep learning, liệu vào và tập dữ liệu nhãn mong muốn.
là một dạng mơ hình được lấy ý tưởng từ bộ não con Dữ liệu vào là tất cả các thơng tin ta biết về dữ liệu. Ví
người với nhiều lớp chồng lên nhau nhằm học được các dụ: với ảnh thì là giá trị của từng pixel, với văn bản thì là
khái niệm từ đơn giản đến phức tạp. Hiện tại, mạng nơ- từng từ, từng câu; với file âm thanh thì nó là một đoạn tín
ron nhân tạo đang nắm giữ hầu hết các kỉ lục trên các bài hiệu; với cơ sở dữ liệu Iris thì nó là độ dài các cánh hoa
tốn máy học phổ thơng và là con đường phát triển của
máy học trong tương lai.

Một số đặc điểm của Python Deep Learning là:
 Nó sử dụng một loạt các lớp của các đơn vị xử lý
phi tuyến để trích xuất các tính năng và thực hiện
chuyển đổi; đầu ra ở một lớp là đầu vào tiếp theo.
 Nó học theo những cách được giám sát và không
giám sát (ví dụ bao gồm phân loại và phân tích mẫu
tương ứng).
 Nó học nhiều cấp độ biểu diễn cho các mức độ
trừu tượng khác nhau.
1.2. Mơ hình chung cho bài tốn học sâu
Huấn luyện một mơ hình trí tuệ nhân tạo cần có hai
giai đoạn là giai đoạn huấn luyện và giai đoạn kiểm thử.
Với các bài tốn học có giám sát ta có các cặp dữ liệu
(đầu vào, đầu ra), cịn với các bài tốn học khơng có giám

Phạm Duy Thanh 2

và đài hoa, … Dữ liệu thô này thường không ở dạng sản phẩm

vector, khơng có số chiều như nhau. Thậm chí có thể có  Tensorflow hỗ trợ huấn luyện trên nhiều GPU
số chiều như nhau nhưng số chiều quá lớn, như một bức phân rã
ảnh màu 1000 pixel x 1000 pixel thì số phần tử đã là 3 x 1.5. Giới thiệu về tập dữ liệu rác thải
106 (3 vì ảnh màu thường có 3 kênh: đỏ, lục, xanh). Đây TACO là một bộ dữ liệu hình ảnh mở của chất thải
là một con số quá lớn, không lợi cho lưu trữ và tính tốn. trong tự nhiên. Nó chứa hình ảnh của rác được chụp trong
môi trường đa dạng, từ các bãi biển nhiệt đới đến đường
Đầu ra mong muốn của mơ hình đã được xác định phố London. Những hình ảnh này được dán nhãn thủ
trước dựa vào tập nhãn của bộ dữ liệu. Quá trình huấn công và phân đoạn theo phân loại phân cấp để đào tạo và
liệu sẽ ép buộc mơ hình học theo tập dữ liệu nhãn. Sau đánh giá các thuật toán phát hiện đối tượng.
khi học được trích xuất đặc trưng thì ta cũng sẽ thu được Hiện tại máy chủ có 1500 hình ảnh với 4784 chú
đặc trưng đã trích xuất cho dữ liệu thơ đầu vào data. thích. Những chú thích này được dán nhãn trong 60 các
Những đặc trưng đã trích xuất này được dùng để huấn danh mục thuộc về 28 mục lớn hơn
luyện các thuật toán phân loại, phân cụm, quy hồi…ở
phía sau. Hình 3: Một vài hình ảnh trong TACO
1.2.2. Giai đoạn kiểm thử 2. Xây dựng mô hình
2.1. Mô tả vấn đề
Bước này đơn giản hơn nhiều. Với dữ liệu thô đầu vào
mới, ta sử dụng mơ hình đã huấn luyện ở trên để tạo ra Xã hội ngày càng đông đúc và phát triển, đồng nghĩa
các vector đặc trưng. Vector đặc trưng được đưa vào thuật với vấn đề giải quyết vệ sinh và rác thải đang dần trở
tốn chính đã được học ở giai đoạn huấn luyện để dự thành một trong những bài tốn khó đối với chính quyền
đốn đầu ra. ở nhiều tỉnh và thành phố, việc sử dụng các nhân công vệ
1.3. Kỹ thuật Single Shot Multibox Detector sinh để thu gom rác là một trong những phương án rất phổ
biến hiện nay. Chiếc xe thu gom rác xuất hiện trên mọi
Single Shot Multibox Detector (SSD) là một thuật nẻo đường đã trở thành hình ảnh quen thuộc với người
toán phổ biến trong phát hiện đối tượng. Nó thường dân lẫn khách du lịch đến nơi đây. Nhưng sử dụng lao
nhanh hơn Faster Region-based Convolutional Network động tay chân khi tiếp xúc với rác thải hay điều kiện thời
(Faster RCNN) được thiết kế để phát hiện đối tượng trong tiết khơng thuận lợi có thể gây ra nhiều vấn đề về tính
thời gian thực. hiệu quả và cả sức khoẻ con người. Việc thuê nhân công,
áp dụng các biện pháp bảo hộ, sản xuất các loại xe của
Tên của mơ hình có ý nghĩa: các công ty môi trường làm tốn kém một lượng chi phí to

 Single Shot: Có nghĩa là việc định vị và phân loại lớn, chưa kể đến chất lượng sống thấp và sức khoẻ của
đối tượng được thực hiện trên một phase duy nhất từ một bộ phận người công nhân lao động.
đầu đến cuối.
 MultiBox: Tên của kĩ thuật về khung vị trí. Nhận thấy những vấn đề nảy sinh của biện pháp thu
 Detector: Mạng này có khả năng nhận biết và phân gom rác truyền thống vốn chiếm vị trí độc tơn trong
loại được đối tượng. những biện pháp thu gom rác thải ở nước ta, đi kèm đó là
sự phát triển vượt bậc về công nghệ trong những năm gần
Hình 2: Rác thải được đinh vị bởi SSD đây, những ứng dụng thực tiễn của máy móc trong cuộc
1.4. Ứng dụng thư viện Tensorflow của Python để xây sống đang dần dần cải thiện chất lượng sống của con
dựng mơ hình nhận dạng rác người, đặc biệt là khả năng tiềm tàng của trí tuệ nhân tạo
đang dần giải phóng chúng ta khỏi những công việc đặt
Tensorflow là một khung xương mã nguồn mở cho nặng về sức khoẻ và tính mạng của con người.
deep learning được viết bằng Python. Với các API bậc
cao, dễ sử dụng, dễ mở rộng, Tensorflow giúp người dùng Tác giả đề xuất nghiên cứu đề tài “Xây Dựng Mô
xây dựng các deep learning mô hình một cách đơn giản. Hình Trí Tuệ Nhân Tạo Vào Phân Loại Rác Thải Trên

Những lý do nên chọn Tensorflow để bắt đầu:
 Tensorflow ưu tiên trải nghiệm của người lập trình
 Tensorflow đã được sử dụng rộng rãi trong doanh
nghiệp và cộng đồng nghiên cứu
 Tensorflow giúp dễ dàng biến các thiết kế thành

3 HỘI NGHỊ TỔNG KẾT HOẠT ĐỘNG SINH VIÊN NGHIÊN CỨU KHOA HỌC VÀ NHÓM SRT NĂM HỌC 2019-2020

Thiết Bị Nhúng”, nếu thành công sẽ tạo tiền đề để ứng Số nhãn là 5 gồm 1 backround, và 4 nhãn phân loại
dụng, mở rộng mơ hình đó cho việc phát triển hoàn thiện chính (can, bottle, plastic bag, other). Batch size=32, và
biện pháp thu gom rác mới và có thể thay thế hồn toàn learning rate=0.005.
và giải quyết những vấn đề của biện pháp cũ đã mang lại. 2.4. Tối ưu hố mơ hình trên máy tính nhúng
Việc sử dụng biện pháp mới với máy móc thay vì nhân
cơng sẽ hiệu quả hơn, chất lượng sống tốt hơn và đặc biệt Để giảm số lượng tính tốn cần thiết khi mơ hình chỉ

là mang đến mơi trường sạch sẽ và thấy rõ bước tiến của được sử dụng cho việc kiểm thử, chúng ta có thể loại bỏ
cơng nghệ hiện đại trong đời sống. một số phần của mơ hình chỉ cần cho huấn luyện. Ví dụ:
2.2. Xây dựng dữ liệu
 Loại bỏ các tính tốn chỉ được sử dụng cho huấn
TACO cung cấp cho nghiên cứu này 1500 bức hình. luyện.
Những bức hình đó sẽ được chia thành hai tập hợp:  Loại bỏ các phần của mơ hình khơng được sử dụng
trong quá trình kiểm thử.
 Bộ dữ liệu để huấn luyện: 1200 bức hình ngẫu  Chuyển đổi Float32 sang int8.
nhiên. 3. Triển khai và đánh giá
 Bộ dữ liệu để kiểm thử: 300 bức hình cịn lại. 3.1. Kết quả đánh giá trên tập dữ liệu kiểm thử
Mơ hình trí tuệ nhân tạo cần có một số lượng lớn dữ
liệu để có thể trích xuất các đặc trưng. Tuy TACO đã Hình 5: Bottle được phát hiện
cung cấp 1500 bức ảnh khá đa dạng và phong phú về rác Trong một bài tốn phát hiện đơi tượng cần có rất
thải nhưng thật sự là không đủ so với nhu cầu của mô nhiều thơng số, cũng như là khái niệm như Intersection
hình, do đó phải làm giàu dữ liệu để đáp ứng nhu cầu của over Union (IoU), độ chính xác, mất mát…. để đánh giá
mơ hình bằng cách xoay trái, phải lật hình, kéo hình,... từ một mơ hình.
đó làm tăng thêm số bức ảnh đầu vào. IoU đơn giản chỉ là một chỉ số đánh giá. Mọi thuật
2.3. Thiết lập các thông số cho Tensorflow tốn có khả năng dự đốn ra các khung vị trí làm đầu ra
Mơ hình lõi của SSD là mobilenet V2 có tên gọi là đều có thể được đánh giá thơng qua IoU. Để áp dụng
Bottleneck Residual block, trong 1 block có 3 nhóm: được IoU để đánh giá một object detector bất kì ta cần:
 Nhóm đầu tiên là 1x1 convolution với ReLU6  Những khung định vị đúng của đối tượng được
 Nhóm thứ 2 là depthwise convolution
 Lớp thứ 3 là một tổ hợp 1×1 convolution khác khoanh vùng và đánh nhãn bằng tay sử dụng trong
nhưng khơng có sự phi tuyến tính. tập test.
 Những khung định vị dự đốn được mơ hình sinh
Hình 4: Mơ hình mobilenet V2 với 3 lớp ra.
Mơ hình lõi được khởi tạo từ mơ hình đã huấn luyện IoU được tính bằng cách lấy diện tính phần chồng lên
của Google thay vì khởi tạo ngẫu nhiên nhau giữa khung định vị dự đoán và khung định vị đúng
của đối tượng. chia cho diện tích phần hợp - hay đơn giản
hơn là diện tích mà hai khung định vị này đang chiếm. Ở

mơ hình này, IoU phải lớn hơn 50% mới được trả về
khung định vị dự đoán.
Độ chính xác và mất mát là hai thông số quan trọng
trong việc đánh giá tính hiệu quả của mơ hình. Độ chính
xác được tính bằng số nhãn dự đốn đúng chia cho tổng
số nhãn của mơ hình. Mất mát được tính bằng số nhãn dự
đoán thiếu chia cho tổng số nhãn của mơ hình. Bên cạnh
đó dự đốn sai cũng là một thông số dùng để đánh giá
một mô hình. Dự đốn sai được tính bằng số nhãn dự
đoán sai chia cho tổng số nhãn dự đoán được. Dưới đây là
thơng số của mơ hình này.
 Độ chính xác trung bình: 0.440
 Mất mát trung bình: 0.560
 Dự đoán sai: 0.414

Phạm Duy Thanh 4

3.2. Xây dựng giao diện kiểm thử phải lớn hơn 0.5).
3.3. Đánh giá kết quả

Kết quả mơ hình trả về độ chính xác khá khả quan,
cho thấy sự hiệu quả của mơ hình, từ đó có thể đem mơ
hình áp dụng trong các hệ thống hay thiết bị lớn hơn
nhằm đem lại lợi ích to lớn.

Hình 6: Giao diện kiểm thử của mô hinh Tài liệu tham khảo
Tại giao diện này, chúng ta có thể thấy được các
khung định vị, nhãn và chỉ số IoU của vật thể (chỉ số này [1] Các bài báo định vị vật thể bằng trí tuệ nhân tạo
[2] Cái bài báo về phân loại vật thể bằng trí tuệ nhân tạo
[3] Các tài liệu về tensorflow

[4] Các tài liệu về tối ưu hóa mơ hình
[5] />
union-iou-for-object-detection/
[6] />
model-image-classification-8febb490e61c

[7] />
[8] /> featureengineering/


×