Tải bản đầy đủ (.pdf) (88 trang)

Xây dựng ứng dụng đếm phương tiện giao thông bằng cách tiếp cận deep learning

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (6.63 MB, 88 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC QUY NHƠN

NGÔ TUẤN LĨNH

XÂY DỰNG ỨNG DỤNG ĐẾM PHƢƠNG TIỆN GIAO THÔNG
BẰNG CÁCH TIẾP CẬN DEEP LEARNING

ĐỀ ÁN/LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Bình Định – Năm 2023

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC QUY NHƠN

NGÔ TUẤN LĨNH

XÂY DỰNG ỨNG DỤNG ĐẾM PHƢƠNG TIỆN GIAO THÔNG
BẰNG CÁCH TIẾP CẬN DEEP LEARNING

Ngành: Khoa học máy tính
Mã số: 8480101
Ngƣời hƣớng dẫn: TS. LÊ XUÂN VINH

Bình Định – Năm 2023

LỜI CAM ĐOAN

Tơi xin cam đoan đây là cơng trình nghiên cứu của riêng tôi và được sự hướng
dẫn khoa học của TS. Lê Xuân Vinh; Các nội dung nghiên cứu, kết quả trong đề tài
này là trung thực và chưa công bố dưới bất kỳ hình thức nào trước đây. Những số


liệu, hình ảnh trong các bảng biểu phục vụ cho việc phân tích, nhận xét, đánh giá
được chính tác giả thu thập từ các nguồn khác nhau có ghi rõ trong phần tài liệu
tham khảo.

Ngồi ra, trong luận văn cịn sử dụng một số nhận xét, đánh giá cũng như số
liệu của các tác giả khác, cơ quan tổ chức khác đều có trích dẫn và chú thích nguồn
gốc.

Nếu phát hiện có bất kỳ sự gian lận nào tơi xin hồn tồn chịu trách nhiệm về
nội dung luận văn của mình. Trường Đại học Quy Nhơn khơng liên quan đến những
vi phạm tác quyền, bản quyền do tôi gây ra trong q trình thực hiện (nếu có).

Bình Định, ngày 08 tháng 10 năm 2023
Người thực hiện

Ngô Tuấn Lĩnh

LỜI CẢM ƠN

Em xin chân thành cảm ơn các Thầy, các Cô Khoa Công nghệ Thông tin
Trường Đại học Quy Nhơn đã tận tình dạy dỗ, truyền đạt cho em nhiều kiến thức
quý báu.

Em xin tỏ lòng biết ơn sâu sắc đến thầy TS. Lê Xuân Vinh, người đã tận tình
giúp đỡ và truyền đạt nhiều kinh nghiệm để đề tài có thể được thực hiện và hồn
thành. Xin chân thành cảm ơn các bạn trong lớp Cao học Khoa học máy tính K24B,
các bạn Khoa Cơng Nghệ Thơng Tin, Trường Đại học Quy Nhơn đã giúp đỡ, động
viên tơi rất nhiều trong q trình thực hiện đề tài.
Em xin chân thành cảm ơn!


Bình Định, ngày 08 tháng 10 năm 2023
Tác giả

Ngô Tuấn Lĩnh

MỤC LỤC Trang

MỞ ĐẦU ............................................................................................................................... 1
1. Lý do chọn đề tài ........................................................................................................ 1
2. Tổng quan tình hình nghiên cứu đề tài .......................................................................... 1
2.1 Tình hình nghiên cứu trong nước ............................................................................ 1
2.2 Tình hình nghiên cứu ngồi nước ............................................................................ 2
3. Mục tiêu nghiên cứu. .................................................................................................. 3
4. Đối tượng và phạm vi nghiên cứu ................................................................................. 3
4.1 Đối tượng nghiên cứu .............................................................................................. 3
4.2 Phạm vi nghiên cứu ................................................................................................. 3
5. Nội dung nghiên cứu......................................................................................................3
6. Phương pháp luận và phương pháp nghiên cứu.............................................................3

CHƢƠNG I. KIẾN THỨC CƠ SỞ VỀ HỌC MÁY VÀ HỌC SÂU ............................... 5
1.1 Học máy .................................................................................................................. 5
1.1.1 Định nghĩa ............................................................................................................ 5
1.1.2 Phân loại học máy ................................................................................................ 6
1.1.3 Các bước giải quyết bài toán trong học máy........................................................7
1.1.4 Ứng dụng của học máy ......................................................................................... 8
1. 2. Mạng nơ-ron (Neural Network).................................................................................8
1.2.1 ng quan v mạng nơ-ron...................................................................................8
1.2.2 Các thành phần cơ bản của mạng nơ-ron nhân tạo ............................................. 9
1.2.3 Kiến trúc ANN.....................................................................................................13
1.2.4 Hoạt động của ANN ............................................................................................ 14

1.3. Mạng nơ-ron tích chập (CNN)..................................................................................15
1.3.1 Cấu trúc của CNN...............................................................................................16
1.4 Đánh giá mạng trong học máy .............................................................................. 21
1.4.1 Dữ liệu đánh giá ................................................................................................. 21
1.4.2 Các khái niệm, độ đo khi đánh giá mơ hình ....................................................... 22

1.5 Học sâu..................................................................................................................25
1.5.1 Các thành phần cuả mạng học sâu ..................................................................... 25
1.5.2 Hoạt động của mạng học sâu ............................................................................. 27
1.5.3 Ứng dụng ............................................................................................................ 27

1.6 Tổng kết chương I ................................................................................................. 28
CHƢƠNG II. PHÁT HIỆN ĐỐI TƢỢNG BẰNG HỌC SÂU ...................................... 29

2.1 Bài toán phát hiện đối tượng ................................................................................. 29
2.2 Một số cách tiếp cận bài toán phát hiện đối tượng dựa trên học sâu .................... 29

2.2.1 R-CNN.................................................................................................................30
2.2.2 Fast R-CNN........................................................................................................30
2.2.3 Faster R-CNN ..................................................................................................... 31
2.2.4 Single Shot Detector-SSD .................................................................................. 31
2.2.5 Mơ hình YOLO....................................................................................................32
2.3 Thuật toán YOLO ................................................................................................. 32
2.3.1 Giới thiệu v YOLO ............................................................................................ 32
2.3.2 Kiến trúc của Yolo .............................................................................................. 33
2.3.3 Các tính năng trong Yolo....................................................................................34
2.3.4 Các bước chính của thuật tốn YOLO................................................................38
2.4 YOLOV5...............................................................................................................41
2.4.1 Các thành phần ................................................................................................... 42
2.4.2 Kỹ thuật tăng cường dữ liệu trong YOLOv5.......................................................44

2.4.3 Huấn luyện trong YOLOv5 ................................................................................. 46
2.4.4 Các tính năng b sung ....................................................................................... 47
2.5 Tổng kết chương II................................................................................................52
CHƢƠNG III. XÂY DỰNG ỨNG DỤNG ĐẾM PHƢƠNG TIỆN GIAO THÔNG ... 53
3.1 Phát biểu bài toán .................................................................................................. 53
3.2 Phương pháp được sử dụng...................................................................................53
3.2.1 Đào tạo lại mơ hình ............................................................................................ 54
3.2.2 Sử dụng mơ hình đã huấn luyện để nhận dạng và đếm các phương tiện............ 55

3.3 Tiến hành...............................................................................................................57
3.3.1 Đào tạo lại mơ hình ............................................................................................ 57

3.4 Xây dựng ứng dụng ................................................................................................... 69
3.4.1 T chức dữ liệu ................................................................................................... 69
3.4.2 Nhận dạng và đếm phương tiện .......................................................................... 70
3.4.3 Kết quả thực hiện ............................................................................................... 71

3.5 Tổng kết chương III .............................................................................................. 73
KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN........................................................................74
TÀI LIỆU THAM KHẢO ................................................................................................. 75

DANH MỤC THUẬT NGỮ VIẾT TẮT

ANN Artificial Neural Network
BiFPN Bidirectional Feature Pyramid Network
BN Batch Normalization
CNN Convolution Neural Networks
Conv Convolution
CPU Central Processing Unit
CSP-PAN Cross-Stage Partial Network- Path Aggregation

Network
DSC Depthwise Separable Convolution
FPN Feature Pyramid Network
IoU Intersection over Union
KNN k-Nearest Neighbors
LR Label Binarizer
PANet Path Aggregation Network
R-CNN Region-based Convolutional Neural Network
ReLU Rectifier Layer Units
ROI Region of Interest
RPN Region Proposal Network
SPP Spatial Pyramid Pooling
SPPF Spatial Pyramid Pooling Fusion
SSD Single Shot MultiBox Detector
SVM Support Vetor Machines

DANH MỤC CÁC BẢNG

Bảng 3.1 Kết quả demo video Hoaithanh.mp4 (file Hoaithanh.xlsx)
Bảng 3.2 Kết quả demo video TranHungDao_9h.mp4 (file THD_9h.xlsx)
Bảng 3.3 Kết quả demo video Muitau_TamQuan.mp4 (file Tamquan.xlsx)

DANH MỤC CÁC HÌNH

Hình 1.1: Mơ hình mạng nơ-ron
Hình 1.2 Đơn vị xử lí trong mạng nơ-ron
Hình 1.3 Hàm đồng nhất (Identity function)
Hình 1.4 Hàm bước nhị nhập (Binary step function)
Hình 1.5 Hàm Sigmoid
Hình 1.6 Hàm sigmoid lưỡng cực

Hình 1.7 Đồ thị hàm ReLU
Hình 1.8 Một số hàm truyền phổ biến
Hình 1.9 Kiến trúc 3 phần của mạng ANN
Hình 1.10 Mạng nơ-ron nhiều lớp
Hình 1.11 Tế bào mạng nơ-ron nhân tạo
Hình 1.12 Cấu trúc cơ bản của mạng Nơ-ron Tích chập (Lecun, 1989)
Hình 1.13 Kiến trúc mạng tích chập tiêu biểu
Hình 1.14 Minh họa việc áp dụng phép tính Conv
Hình 1.15 Minh họa hoạt động của lớp pooling
Hình 1.16 Minh hoạ hoạt động của lớp pooling
Hình 1.17 Cấu trúc nơ-ron
Hình 1.18 Kiến trúc mạng học sâu
Hình 2.1 Kiến trúc mạng SSD
Hình 2.2 Sơ đồ kiến trúc mạng YOLO
Hình 2.3: Kiến trúc một output của model YOLO.
Hình 2.4 Các bản đồ đặc trưng của mạng YOLOv3
Hình 2.5 Xác định hộp neo cho một vật thể.
Hình 2.6 Cơng thức hàm Loss
Hình 2.7 Cơng thức ước lượng hộp bao từ anchor box.
Hình 2.8 Non-max suppression
Hình 2.9 Chia ảnh thành ơ lưới
Hình 2.10 Dự đốn hộp bao
Hình 2.11 Xác định đối tượng và lọc dự đoán

Hình 2.12 Ghép nối các dự đốn
Hình 2.13 Kết quả đầu ra
Hình 2.14 Sự khác nhau giữa Residual Block và CSPBlock
Hình 2.15 Kỹ thuật tăng cường khảm

Hình 2.16 Sao chép bản vá lỗi


Hình 2.17 Biến đổi tuyến tính ngẫu nhiên
Hình 2.18 Kỹ thuật kết hợp
Hình 2.19 Thay đổi ngẫu nhiên đối vưới màu sắc, độ bão hịa và giá trị của
hình ảnh
Hình 2.20 Lật ngang ngẫu nhiên
Hình 2.21 Dự đốn hộp bao
Hình 2.22 So sánh độ lệch tâm
Hình 2. 23 So sánh tỷ lệ chiều cao và chiều rộng (so với neo) trước và sau khi
điều chỉnh
Hình 2.24 Tính tỷ lệ kích thước hộp thực tế với mẫu neo
Hình 2.25 Khớp hộp dự đốn với neo
Hình 2.26 Gán neo phù hợp cho các ơ thích hợp
Hình 2.27 Độ chính xác của các kiến trúc trong mơ hình Yolov5
Hình 3.1 Sơ đồ đào tạo lại mơ hình trong Yolov5
Hình 3.2 Sơ đồ thuật toán phát hiện và đếm đối tượng
Hình 3.3 Hình ảnh bộ dữ liệu huấn luyện
Hình 3.4 Hình ảnh bộ dữ liệu Test
Hình 3.5 Hình ảnh bộ dữ liệu Validation
Hình 3.6 Cấu trúc thưc mục Vehicledatafull
Hình 3.7 Thơng tin huấn luyện
Hình 3.8 Biểu đồ kết quả huấn luyện với kiến trúc yolov5n
Hình 3.9 Đánh giá hiệu suất của mơ hình
Hình 3.10 Phân lớp các đối tượng
Hình 3.11 Gắn nhãn các đối tượng
Hình 3.12 Gắn nhãn và độ tin cậy cho đối tượng

Hình 3.13 Nhận dạng đối tượng bằng mơ hình được đào tạo lại yolov5n
Hình 3.14 Biểu đồ kết quả huấn luyện với kiến trúc yolov5s
Hình 3.15 Đánh giá hiệu suất của mơ hình yolov5s

Hình 3.16 Phân lớp các đối tượng với yolov5s
Hình 3.17 Gắn nhãn các đối tượng
Hình 3.18 Gắn nhãn và độ tin cậy cho đối tượng
Hình 3.19 Nhận dạng đối tượng bằng mơ hình được đào tạo lại yolov5s
Hình 3.20 Biểu đồ kết quả huấn luyện với kiến trúc yolov5m
Hình 3.21 Đánh giá hiệu suất của mơ hình yolov5m
Hình 3.22 Phân lớp các đối tượng với yolov5m
Hình 3.23 Gắn nhãn các đối tượng
Hình 3.24 Gắn nhãn và độ tin cậy cho đối tượng
Hình 3.25 Nhận dạng đối tượng bằng mơ hình được đào tạo lại với yolov5m
Hình 3.26 Tổ chức dữ liệu
Hình 3.27 Kết quả chạy demo video Hoaithanh.mp4
Hình 3.28 Kết quả demo video TranHungDao_9h.mp4
Hình 3.29 Kết quả demo với video Muitau_Tamquan.mp4

1

MỞ ĐẦU

1. Lý do chọn đề tài
Hiện nay, tình hình tắc nghẽn giao thông trong những giờ cao điểm ngày càng

trở nên thường xuyên hơn. Việc tắc nghẽn giao thông dẫn đến các vấn đề khác như:
tốn nhiều thời gian di chuyển của người tham gia giao thông; dễ xảy ra va chạm
trong giao thông… Một trong những nguyên nhân dẫn đến tình trạng trên là có
những thời điểm nhiều phương tiện cùng tham gia giao thông. Đặc biệt, đối với học
sinh các trường thường ra về cùng một thời điểm nên làm cho việc tắc nghẽn giao
thông thêm trầm trọng, tiềm ẩn nhiều nguy cơ xảy ra tai nạn. Do đó việc xây dựng
một ứng dụng nhằm phát hiện, đếm phương tiện tham gia giao thông là rất cần thiết.
Từ kết quả của việc đếm phương tiện giao thông ta sẽ có được thơng tin về các thời

điểm thường xảy ra tắc nghẽn giao thông và đưa ra các đề xuất hợp lí về thời gian ra
về của học sinh.

Hiện nay có nhiều cách tiếp cận để giải quyết vấn đề này: Xử lý ảnh, phát hiện
chuyển động, thuật toán trừ nền,…đã giải quyết được. Trong đề án này bài toán
được giải quyết theo một cách tiếp cận khác đó là bằng học sâu. Cụ thể là đề án sẽ
sử dụng thuật toán Yolo và xây dựng mơ hình phát hiện đối tượng, nghiên cứu bổ
sung cách đếm đối tượng để đạt được mục tiêu.

Xuất phát từ nhu cầu trên tôi chọn đề tài nghiên cứu “Xây dựng ứng dụng
đếm phƣơng tiện giao thơng bằng cách tiếp cận Deep learning”.

2. Tổng quan tình hình nghiên cứu đề tài
2.1 Tình hình nghiên cứu trong nước

- Bài báo “Nghiên cứu thuật tốn phân loại phương tiện giao thơng dựa trên thị giác
máy tính” của TS. Nguyễn Mạnh Cường , ThS. Vũ Văn Rực- Trường Đại học Hàng
Hải Việt Nam, Tạp chí Khoa học cơng nghệ, tháng 7/2021 [1]. Trong bài báo này
các tác giả nghiên cứu phát triển thuật toán mới cho phép nhận diện và phân loại
phương tiện trong luồng video trực tiếp, thuật toán được đề xuất sử dụng mạng

2

nơron triển khai trên thuật toán Yolo và ứng dụng thuật toán Sort trong theo dõi và
phát hiện đối tượng.

- Bài báo “Ứng dụng học máy trong dự đốn lưu lượng giao thơng” của Giang Thị
Thu Huyền và Lê Quý Tài, Học viện Ngân hàng, Tạp chí Khoa học cơng nghệ Việt
Nam, tháng 5 năm 2022 [2]. Bài báo này trình bày khái quát về dự đốn lưu lượng
giao thơng và những kỹ thuật học máy nhằm dự đốn lưu lượng giao thơng đang

được sử dụng.

- Bài báo “Xử lí vi phạm vượt đèn đỏ và dừng đỗ sai dựa trên học sâu” của các tác
giả Huỳnh Hữu Hưng, Nguyễn Văn Phú, Nguyễn Tường, Trường Đại học Bách
Khoa- Đại học Đà Nẵng [3], Tạp chí Khoa hcọ và cơng nghệ, ISSN 1859-1531,
VOL. 18, NO.5.1, 2020. Bài báo đề xuất sử dụng mạng tích chập YOLOv3 để trích
xuất hình ảnh các đối tượng, sau đó thơng tin về vị trí của phương tiện được xác
định qua thuật toán theo dõi sẽ được dùng để phân loại vi phạm.

2.2 Tình hình nghiên cứu ngoài nước
- Phát hiện đối tượng theo thời gian thực bằng cách sử dụng học sâu: Phương
pháp tiếp cận dựa trên webcam (Real Time Object Detection using Deep Learning:
A Webcam Based Approach), Sandipan Chowdhury, Government College of
Engineering and Ceramic Technology, Prabuddha Sinha, Indian Institute of
Technology Ropar, tháng 01 năm 2019 [4]. Bài báo đề xuất một phương pháp phát
hiện đối tượng thông qua webcam. Phương pháp được sử dụng là sự kết hợp giữa
mạng đề xuất khu vực (RPN) và Fast R-CNN, trong đó các đề xuất khu vực chất
lượng cao được tạo bằng cách đào tạo RPN từ đầu đến cuối, đến lượt nó được Fast
R-CNN sử dụng để phát hiện. Hai mô-đun này kết hợp để tạo ra một hệ thống phát
hiện đối tượng có tên Faster R-CNN.

- Phát hiện đối tượng theo thời gian thực với YOLO (Real-Time Object
Detection with Yolo), Geethapriya. S, N. Duraimurugan, S.P. Chokkalingam, Tạp chí
Quốc tế về Kỹ thuật và cơng nghệ (IJEAT), ISSN: 2249 – 8958, Tập-8, Số phát hành-
3S, tháng 2 năm 2019. Bài báo giới thiệu phương pháp phát hiện đối tượng bằng
Yolo [5]

3

- Phương pháp tiếp cận học sâu nâng cao để đếm nhiều đối tượng trong môi

trường xe cộ đô thị (An Advanced Deep Learning Approach for Multi-Object
Counting in Urban Vehicular Environments), Ahmed Mukhtar Dirir, Henry
Ignatious, Hesham Elsayed, Manzoo Ahmed Khan, November 2021, Future
Internet 13(12):306, DOI:10.3390/fi13120306, License CC BY 4.0 [6]. Bài báo này
đề xuất một cách tiếp cận hiệu quả sử dụng các khái niệm học sâu và các bộ lọc
tương quan để đếm và theo dõi nhiều đối tượng.

3. Mục tiêu nghiên cứu.
- Nghiên cứu nhằm củng cố, nâng cao hiểu biết về học sâu

- Nghiên cứu phương pháp đếm phương tiện giao thơng bằng mơ hình học sâu
YOLO để nhận dạng và đếm phương tiện giao thông trên hình ảnh, video.

- Ứng dụng kiến thức vào việc giải quyết các vấn đề thực tiễn

4. Đối tƣợng và phạm vi nghiên cứu
4.1 Đối tượng nghiên cứu

- Mạng Nơ-ron nhân tạo.
- Mô hình học sâu dựa trên mạng CNN.
- Mơ hình YOLOv5 trong phát hiện, nhận dạng đối tượng.
- Nhận dạng, đếm phương tiện giao thông trong video được quay từ camera.

4.2 Phạm vi nghiên cứu

Phạm vi nghiên cứu của đề tài liên quan đến phát hiện, nhận dạng đối tượng
trong học sâu bằng mơ hình YOLOv5 và ứng dụng để đếm phương tiện giao thông.

5. Nội dung nghiên cứu
- Học máy và học sâu

- Mô hình YOLOv5.
- Phát hiện, nhận dạng và đếm đối tượng trong video.

6. Phƣơng pháp luận và phƣơng pháp nghiên cứu
- Phương pháp nghiên cứu lý thuyết
+ Tìm hiểu kiến thức cơ sở về học máy.

4

+ Tìm hiểu mơ hình học sâu dựa trên mạng CNN.
+ Tìm hiểu lý thuyết về mơ hình YOLOv5 trong phát hiện, nhận dạng đối

tượng.
+ Nghiên cứu kỹ thuật đếm đối tượng trong video.
- Phương pháp nghiên cứu thực hành
Vận dụng mơ hình YOLOv5 để nhận dạng phương tiện giao thông thông qua
video của camera.

5

CHƢƠNG I. KIẾN THỨC CƠ SỞ VỀ HỌC MÁY VÀ HỌC SÂU

Tóm tắt nội dung chương: Giới thiệu những kiến thức cơ sở v Học máy và
Học sâu; Tìm hiểu v cấu trúc, cách hoạt động và ứng dụng của Mạng nơ-ron nhân
tạo (ANN) và Mạng Nơ-ron tích chập (CNN).
1.1 Học máy

Học máy là một nhánh của trí tuệ nhân tạo cho phép máy học và phát triển mà
khơng cần lập trình rõ ràng. Học máy liên quan đến việc thiết kế các chương trình
phần mềm có thể thu thập dữ liệu và tự học.


Máy học phân tích dữ liệu, diễn giải dữ liệu, học hỏi từ dữ liệu trong một lĩnh
vực cụ thể và đưa ra quyết định tốt nhất có thể dựa trên cơ sở học hỏi bằng cách sử
dụng một bộ thuật toán học tập (thuật toán học tập có giám sát hoặc khơng giám
sát). Các chun gia máy học sử dụng các kỹ thuật thống kê và khái niệm khoa học
máy tính để cho phép máy học từ dữ liệu hiện tại và dần dần cải thiện mà không cần
phải được đào tạo cụ thể. Các thuật toán SVM, K-mean phân cụm, Nave Bayes, hồi
quy tuyến tính, hồi quy logistic, mạng thần kinh, phương pháp tập hợp và cây quyết
định là những ví dụ về việc sử dụng rộng rãi các thuật toán học máy.

1.1.1 Định nghĩa
Một chương trình máy tính được gọi là học từ dữ liệu, kinh nghiệm E đối với
lớp nhiệm vụ và độ đo mức thực hiện P nếu việc thực hiện các nhiệm vụ T của nó
khi đo bằng P được cải tiến nhờ dữ liệu hoặc kinh nghiệm E [7].

rong đó:
- T ( Task)- nhiệm vụ: Là nhiệm vụ mà chưng trình máy tính được thiết kế để
thực hiện.
- E (Experience)- Kinh nghiệm: Là dữ liệu hoặc thông tin mà máy sử dụng để
học.
- P (Performance Measure)- độ đo hiệu suất: đo lường độ chính xác của
chương trình đối với một nhiệm vụ cụ thể.

6

1.1.2 Phân loại học máy
Chủ yếu có bốn loại học máy sau:
Học có giám sát
Để dự đốn các kịch bản trong tương lai, thuật tốn học máy có giám sát áp
dụng các kinh nghiệm dựa trên dữ liệu đã có cho dữ liệu mới bằng cách sử dụng các

dữ liệu mẫu được gắn nhãn. Học có giám sát có các loại:
+ Regession: Hồi quy
+ Classification: Phân lớp
Học không giám sát
Học không giám sát đề cập đến một loại học máy trong đó máy học từ dữ liệu
mà không cần sự trợ giúp của con người. Các mơ hình khơng được giám sát có thể
được đào tạo với tập dữ liệu khơng được gắn nhãn, khơng được phân và thuật tốn
phải xử lý dữ liệu mà không cần giám sát. Học không giám sát có các loại:
+ Clustering: Phân cụm
+ Association: Kết hợp
K-means Clustering, Apriori Algorithm, Eclat, v.v., là những ví dụ về thuật tốn
học tập khơng giám sát.
Học bán giám sát
Học bán giám sát tương tự như học có giám sát, ngoại trừ nó kết hợp cả dữ liệu
được gắn nhãn và không được gắn nhãn. Dữ liệu được gắn nhãn là thơng tin có các
nhãn quan trọng để thuật tốn có thể diễn giải nó, trong khi dữ liệu khơng được gắn
nhãn khơng có các nhãn đó. Các hệ thống máy học có thể học cách xác định dữ liệu
chưa được gắn nhãn bằng sự kết hợp này.
Học tăng cường
Học tăng cường là một nhánh của học máy cho phép một hệ thống con, được
gọi là tác nhân, hiểu bằng cách thử nghiệm trong không gian ảo, mô phỏng tương

7

tác, hỗ trợ kết quả bằng cơ chế phản hồi được tạo bằng cách sử dụng phản hồi từ
các sự kiện và trải nghiệm của chính nó.

Học tăng cường sử dụng thuật toán Q-Learning.

1.1.3 Các bước giải quyết bài toán trong học máy

Bước 1. Thu thập dữ liệu
Bước đầu tiên là thu thập dữ liệu huấn luyện, là dữ liệu mà mơ hình sẽ học từ
đó. Dữ liệu này có thể được thu thập từ nhiều nguồn bên ngoài hoặc được tạo ra
bằng cách gắn nhãn cho các dữ liệu đã có.
Bước 2. Tiền xử lí dữ liệu
Dữ liệu thu thập được thường chưa được hoàn thiện và cần được xử lí trước khi
sử dụng chúng để huấn luyện cho mơ hình. Tiền xử lí có thể bao gồm các việc xử lí
dữ liệu cịn thiếu, loại bỏ nhiễu, chuẩn hóa dữ liệu và chuyển đổi dữ liệu văn bản
hoặc hình ảnh thành định dạng phù hợp để đưa vào mơ hình học máy.
Bước 3. Chọn mơ hình
Chọn mơ hình học máy phù hợp. Có nhiều loại mơ hình học máy như học có
giám sát (supervised learning), học khơng giám sát (unsupervised learning), học bán
giám sát (semi- supervised learning), học tăng cường (reinforcement learing) và
nhiều mơ hình khác như cây quyết định (decision trees), mạng nơ-ron (neural
networks), máy vector hỗ trợ (support vector machines), hồi quy tuyến tính (linear
regession).
Bước 4. Huấn luyện mơ hình
Sau khi chọn mơ hình, dữ liệu huấn luyện sẽ được sử dụng để huấn luyện mơ
hình. Q trình này bao gồm đưa dữ liệu huấn luyện vào mơ hình, tính tốn và điều
chỉnh các tham số của mơ hình để giúp nó đạt được hiệu suất tốt nhất trên dữ liệu
huấn luyện.
Bước 5. Đánh giá mô hình

8

Sau khi mơ hình đã được huấn luyện, nó cần được đánh giá để đo lường hiệu
suất của nó trên dữ liệu độc lập. Điều này giúp đảm bảo rằng mơ hình khơng chỉ
học được từ dữ liệu huấn luyện mà cịn có khả năng dự đốn chính xác trên dữ liệu
mới. Việc đánh giá mơ hình được dựa trên các độ đo đánh giá: độ chính xác
(accuracy), độ đo F1 (F1- score), độ đo RMSE (Root Mean Squared Error…).


Bước 6. Tinh chỉnh mơ hình

Dựa trên kết quả đánh giá, mơ hình có thể được tinh chỉnh để cải thiện hiệu
suất. Điều này có thể bao gồm thay đổi các tham số của mơ hình, tinh chỉnh dữ liệu
huấn luyện hoặc thay đổi kiến trúc mơ hình.

Bước 7. Triển khai mơ hình

Sau khi mơ hình được huấn luyện và tinh chỉnh, nó sẽ được triển khai và sử
dụng trong môi trường thực tế.

1.1.4 Ứng dụng của học máy
- Nội suy, dự báo, phân lớp, phân cụm.
- Nhận dạng chữ viết tay, nhận dạng ảnh.
- Phát hiện cấu trúc, các yếu tố tác động, các quy luật.
- Điều khiển thông minh.
- Hỗ trợ ra quyết định.
- Phân tích y khoa, nơng nghiệp.
- Khoa học xã hội, luật pháp.
- Marketing, phân tích tài chính.
1. 2. Mạng nơ-ron (Neural Network)
1.2.1 T ng quan v mạng nơ-ron
Mạng nơ-ron nhân tạo (Artificial Neuron Netwwork- ANN) là một loại mơ
hình tính tốn được lấy cảm hứng từ cấu trúc và hoạt động của mạng nơ-ron trong
não người. Nó là một hệ thống mơ hình hóa chức năng của não bao gồm nhiều nơ-
ron nhân tạo (hay còn gọi là nút) được kết nối với nhau để xử lí thơng tin.



×