Tải bản đầy đủ (.pdf) (92 trang)

Ứng dụng mô hình yolo xây dựng hệ thống giám sát thí sinh trong phòng thi

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (6.89 MB, 92 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC QUY NHƠN

TRẦN VĂN MẠNH

ỨNG DỤNG MƠ HÌNH YOLO
XÂY DỰNG HỆ THỐNG GIÁM SÁT THÍ SINH

TRONG PHÒNG THI

Ngành: Khoa học dữ liệu ứng dụng
Mã số: 8.90.46.48

Ngƣời hƣớng dẫn: TS. LÊ XUÂN VINH

LỜI CAM ĐOAN
Tôi Trần Văn Mạnh cam đoan rằng Đề án thạc sĩ "Ứng dụng mơ hình
YOLO xây dựng hệ thống giám sát thí sinh trong phịng thi" là kết quả
nghiên cứu của bản thân tôi dƣới sự hƣớng dẫn của TS. Lê Xuân Vinh. Tôi
xin cam đoan rằng tất cả các kết quả nghiên cứu trong đề án này là trung thực
và chƣa từng đƣợc cơng bố trƣớc đó; Các tƣ liệu, dữ liệu và thơng tin từ
nguồn bên ngồi đƣợc trích dẫn và tham khảo rõ ràng trong Đề án; Tôi không
sao chép, vay mƣợn hoặc lạm dụng các ý tƣởng, nội dung hoặc cơng trình của
ngƣời khác mà khơng đƣợc phép; Tơi chịu trách nhiệm hồn tồn về những
sai sót hay thiếu sót có thể xuất hiện trong đề án.
Tôi hiểu rõ về tầm quan trọng của việc tuân thủ đạo đức nghiên cứu và
những hậu quả có thể xảy ra nếu phát hiện có gian lận hay vi phạm quy tắc
trong quá trình thực hiện đề án.

Bình Định, ngày 21 tháng 11 năm 2023
Người thực hiện



Trần Văn Mạnh

LỜI CẢM ƠN
Để hoàn thành Đề án thạc sĩ này, em xin tỏ lòng biết ơn sâu sắc đến
thầy TS. Lê Xuân Vinh đã tận tình hƣớng dẫn trong suốt quá trình viết báo
cáo đề án thạc sĩ.
Em chân thành cảm ơn q Thầy, Cơ trong Khoa Cơng Nghệ Thơng
Tin, Khoa Tốn và Thống kê, Phòng Đào tạo Sau Đại học, Trƣờng Đại học
Quy Nhơn đã tận tình truyền đạt kiến thức trong những năm em học tập. Với
vốn kiến thức đƣợc tiếp thu trong q trình học khơng chỉ là nền tảng cho q
trình nghiên cứu khoa học mà cịn là hành trang quý báu để em bƣớc vào đời
một cách vững chắc và tự tin.
Em chân thành cảm Trung tâm trí tuệ nhân tạo - FPT Software đã cho
phép và tạo điều kiện thuận lợi để em thực tập tại công ty.
Cuối cùng em kính chúc quý thầy, cô dồi dào sức khỏe và thành công
trong sự nghiệp cao quý.

Bình Định, ngày 21 tháng 11 năm 2023

Trần Văn Mạnh

MỤC LỤC

MỞ ĐẦU ........................................................................................................... 1
1. Lý do chọn đề tài ..................................................................................... 1
2. Tổng quan tình hình nghiên cứu đề tài ................................................. 2
3. Mục tiêu nghiên cứu................................................................................ 2
4. Đối tƣợng và phạm vi nghiên cứu.......................................................... 3
4.1. Đối tượng nghiên cứu ........................................................................... 3

4.2. Phạm vi nghiên cứu .............................................................................. 3
5. Nội dung nghiên cứu ............................................................................... 3
6. Phƣơng pháp nghiên cứu........................................................................ 3

CHƢƠNG 1. KIẾN THỨC CƠ SỞ CỦA HỌC MÁY VÀ HỌC SÂU ........... 4
1.1. Giới thiệu............................................................................................... 4
1.1.1. Khái niệm ........................................................................................... 4
1.1.2. Ứng dụng của học máy ...................................................................... 4
1.1.3. Phân loại các phương pháp học máy................................................ 5
1.1.4. Các bước tiến hành trong bài toán học máy..................................... 7
1.2. Mạng Nơ-ron (Neural Network) ......................................................... 8
1.2.1. Mơ hình nơ-ron nhân tạo .................................................................. 8
1.2.2. Mơ hình mạng nơ-ron nhân tạo ..................................................... 10
1.2.3. Quy tắc delta..................................................................................... 11
1.2.3.1. Quy tắc đào tạo delta ..................................................................... 11
1.2.3.2. Hàm kích hoạt ................................................................................ 13
1.2.4. Thuật tốn lan truyền ngược........................................................... 14
1.3. Học sâu (Deep Learning) ................................................................... 18
1.3.1. Giới thiệu về học sâu (Deep Learning) ........................................... 18
1.3.2.Cấu trúc mạng CNN ......................................................................... 19
1.3.2.1 Lớp tích chập (Convolutional Layer) ............................................. 20

1.3.2.2. Bước nhảy (Stride) ......................................................................... 23
1.3.2.3. Đường viền (Padding).................................................................... 23
1.3.2.4. Lớp hiệu chỉnh (Hàm phi tuyến- ReLU) ........................................ 24
1.3.2.5. Lớp gộp (Pooling Layer)................................................................ 25
1.3.2.6. Lớp kết nối đầy đủ (Fully Connected- FC) .................................... 27
1.3.2.7. Lớp đầu ra (Output Layer)............................................................. 28
1.3.3. Các kỹ thuật cơ bản trong Học sâu (Deep Learning) .................... 29
1.4. Kết luận chƣơng 1 .............................................................................. 30

CHƢƠNG 2. MƠ HÌNH MẠNG YOLO VÀ THUẬT TỐN SORT
(SIMPLE ONLINE REALTIME OBJECT TRACKING) ............................. 31
2.1. Giới thiệu chung về YOLO ............................................................... 31
2.2. Kiến trúc của YOLO.......................................................................... 32
2.2.1. Kiến trúc YOLO................................................................................ 32
2.2.1.1 Kiến trúc mạng YOLO..................................................................... 32
2.2.1.2. Cách YOLO hoạt động ................................................................... 34
2.2.1.3. Hàm đánh giá độ chính xác (Intersection Over Union-IOU) ........ 35
2.2.1.4. Hàm lỗi (Loss Function) ............................................................... 36
2.2.2. Kiến trúc YOLO v7........................................................................... 39
2.2.2.1. Mạng tổng hợp lớp hiệu quả mở rộng (E-ELAN) .......................... 40
2.2.2.2. Nhân rộng mô hình (Model scaling) hợp chất YOLO v7............... 41
2.2.3. Các phương pháp BoF (Bag-of-freebies) trong YOLO v7 ............. 43
2.2.3.1. Tích chập tái tham số hóa theo kế hoạch....................................... 43
2.2.3.2. Thô cho phụ trợ và tốt cho mất mát ............................................... 46
2.2.3.3. Kiến thức tiềm ẩn (Implicit Knowledge) ........................................ 48
2.3. Thuật toán SORT (Simple Online Realtime Object Tracking)..... 48
2.3.1. Giải thuật Hungary .......................................................................... 51
2.3.2. Bộ lọc Kalman (Kalman Filter)....................................................... 54
2.4. Kết luận chƣơng 2 .............................................................................. 58

CHƢƠNG 3. ỨNG DỤNG YOLO XÂY DỰNG MƠ HÌNH HỖ TRỢ GIÁM
SÁT THÍ SINH TRONG PHỊNG THI .......................................................... 59

3.1. Giới thiệu và phân tích bài tốn ....................................................... 59
3.2. Xây dựng chƣơng trình thử nghiệm................................................. 60
3.3. Kiểm tra và đánh giá kết quả............................................................ 61
3.3.1. Huấn luyện mơ hình ........................................................................ 61
3.3.1.1 Tiền xử lý ảnh (dữ liệu huấn luyện) ............................................... 61
3.3.1.2. Nhận diện đối tượng....................................................................... 63

3.3.1.3. Để tính khoảng cách ...................................................................... 67
3.3.1.4. Kiểm tra khoảng cách .................................................................... 71
3.3.1.5. Hiển thị kết quả .............................................................................. 74
3.3.2. Đánh giá mơ hình ............................................................................ 77
3.4. Kết luận chƣơng 3 .............................................................................. 78
KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN ...................................................... 79
TÀI LIỆU THAM KHẢO............................................................................... 81

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT

Chữ viết tắt Nguyên mẫu Diễn giải
AI Artificial Intelligence Trí tuệ nhân tạo
DL Deep Learning Học sâu

ML Machine Learning Học máy
YOLO You Only Look Once Bạn Chỉ Nhìn Một Lần

IoT Internet of Things Internet vạn vật
SSD
mAP Solid State Drive Là ổ đĩa bán dẫn, ở thể
FPS đặc, dạng rắn

BoF Mean Average Precision trung bình cộng giá trị
AP của các class khác
nhau

Frames per second là thông số đo lƣờng số
lƣợng hình ảnh mà bộ
xử lý đồ họa (GPU) có
thể kết xuất và hiển thị

trên màn hình của bạn
trong mỗi giây.

Bag of Features Túi đặc trƣng

SORT SIMPLE ONLINE Theo dõi đối tƣợng trực
CNN REALTIME OBJECT tuyến thời gian thực
VGG TRACKING
đơn giản

Convolutional Neural Mạng học sâu tích chập
Network

Visual Geometry Group Nhóm hình học thị giác

DANH MỤC CÁC BẢNG

Bảng 1.1. Các phƣơng pháp padding. ............................................................. 24
Bảng 1.2. Một số biến thể của hàm ReLU. ..................................................... 25
Bảng 1.3. Các dạng pooling. ........................................................................... 26
Bảng 2.1. Các layer trong mạng darknet-53. .................................................. 33
Bảng 2.2. Các Layer của mạng YOLO. .......................................................... 39

DANH MỤC CÁC HÌNH

Hình 1.1. Mơ hình nơ- ron sinh học.................................................................. 8
Hình 1.2. Mơ hình nơ- ron trong tốn học. ....................................................... 8
Hình 1.3. Kiến trúc mạng Nơ-ron nhân tạo (Neural network)........................ 10
Hình 1.4. Đơn vị xử lý. ................................................................................... 11
Hình 1.5. Đồ thị hàm Sigmoid. ....................................................................... 14

Hình 1.6. Đồ thị hàm ReLU. ........................................................................... 14
Hình 1.7. Mạng nơ-ron.................................................................................... 15
Hình 1.8. Cấu trúc cơ bản của mạng CNN (Lecun, 1998).............................. 19
Hình 1.9. Minh họa việc áp dụng phép tốn Conv. ........................................ 21
Hình 1.10. Minh họa việc áp dụng phép tốn Conv. ...................................... 21
Hình 1.11. Minh họa việc áp dụng phép tốn Conv. ...................................... 22
Hình 1.12. Minh họa sự kết hợp của hình ảnh với các bộ lọc khác nhau. ...... 22
Hình 1.13. Lớp tích chập hoạt động với stride là 2......................................... 23
Hình 1.14. Minh họa thêm các số 0 vào vùng này.......................................... 23
Hình 1.15. Minh họa lớp ReLU. ..................................................................... 25
Hình 1.16. Minh họa lớp pooling phổ biến..................................................... 26
Hình 1.17. Minh họa lớp pooling.................................................................... 26
Hình 1.18. Minh họa lớp pooling với kích thƣớc ảnh 224 x 224. .................. 27
Hình 1.19. Bố trí các biến đổi hình thành nên cấu trúc mạng CNN. .............. 27
Hình 2.1. Sơ đồ kiến trúc mạng YOLO. ......................................................... 32
Hình 2.2. Minh hoạt việc chia ơ của các đối tƣợng trong ảnh. ....................... 34
Hình 2.3. Minh họa giá trị hàm Localization.................................................. 37
Hình 2.4. So sánh các mơ hình........................................................................ 40
Hình 2.5: Cách thức hoạt động của YOLO v7................................................ 41
Hình 2.6. Mơ hình thử nghiệm tái tham số hóa. ............................................. 43
Hình 2.7. Model thơng thƣờng (trái) và model có Aux Head (phải). ............. 44

Hình 2.8. Các cách sử dụng Auxiliary Head. Assigner là quá trình Label
Assignment, GT là ground truth, Aux Head là Auxiliary Head,
Lead Head là head sẽ dùng để đƣa ra kết quả prediction trong quá
trình inference. .............................................................................. 45

Hình 2.9. Auxiliary head trong Inceptionv3. .................................................. 46
Hình 2.10. Minh họa sự khác nhau giữa cách chọn positive sample của


RetinaNet và FCOS. ..................................................................... 47
Hình 2.11. Minh họa sự khác nhau giữa cách predict Box của RetinaNet và

FCOS............................................................................................. 47
Hình 2.12. Implicit Knowledge trong YOLOR. ............................................. 48
Hình 2.13. Minh họa SORT. ........................................................................... 49
Hình 2.14. Mơ hình bộ lọc Kalman. ............................................................... 56
Hình 3.1. Hình ảnh hoặc video đầu vào. ......................................................... 62
Hình 3.2. Một số hình ảnh thu thập................................................................. 64
Hình 3.3. Kết quả huấn luyện minh họa. ........................................................ 65
Hình 3.4. YOLO nhận diện đối tƣợng là học sinh. ......................................... 67
Hình 3.5. Hình ảnh minh họa ý tƣởng cơ bản................................................. 69
Hình 3.6. Hình ảnh minh họa khoảng cách đầu dãy và cuối dãy.................... 70
Hình 3.7. Minh họa kiểm tra khoảng cách...................................................... 72
Hình 3.8. Kết quả train- batch. ........................................................................ 73
Hình 3.9. Hiển thị kết quả đầu ra. ................................................................... 74
Hình 3.10. Hiển thị kết quả đầu ra. ................................................................. 75
Hình 3.11. Hiển thị kết quả đầu ra giờ kiểm tra giữa kỳ 7E. .......................... 76
Hình 3.12. Hiển thị kết quả đầu ra giờ kiểm tra giữa kỳ 9G. ......................... 77
Hình 3.13. Kết quả hiển thị (results). .............................................................. 78

1

MỞ ĐẦU

1. Lý do chọn đề tài
Những năm gần đây, khả năng tính tốn của máy tính ngày càng đƣợc

nâng cao và lƣợng dữ liệu (big data) khổng lồ đƣợc thu thập từ các nguồn dữ
liệu khác nhau dễ dàng hơn. Học máy (Machine Learning) ngày càng phát

triển đặc biệt học sâu (Deep Learning) là một phƣơng thức nghiên cứu để xây
dựng các ứng dụng trong lĩnh vực trí tuệ nhân tạo (AI). Mơ hình học sâu có
thể nhận diện nhiều hình mẫu phức tạp trong hình ảnh, văn bản, âm thanh và
các dữ liệu khác để tạo ra thơng tin chun sâu và dự đốn chính xác. Ta có
thể sử dụng các phƣơng pháp học sâu để tự động hóa các tác vụ thƣờng địi
hỏi trí tuệ con ngƣời, chẳng hạn nhƣ mơ tả hình ảnh hoặc chép lời một tập tin
âm thanh. Nhiều doanh nghiệp sử dụng các mơ hình học sâu để phân tích dữ
liệu và đƣa ra dự đoán trong nhiều ứng dụng khác nhau. Một số ví dụ nhƣ sau:

Xe tự lái sử dụng các mơ hình học sâu để tự động phát hiện biển báo
giao thông và ngƣời đi bộ.

Hệ thống quốc phịng sử dụng mơ hình học sâu để tự động gắn cờ các
khu vực đƣợc quan tâm trong ảnh vệ tinh.

Phân tích hình ảnh y khoa sử dụng học sâu để tự động phát hiện các tế
bào ung thƣ trong chẩn đoán y tế.

Các nhà máy sử dụng ứng dụng học sâu để tự động phát hiện con ngƣời
hoặc vật thể khi những đối tƣợng này đang nằm trong khoảng cách khơng an
tồn của máy móc.

Trong giáo dục, đào tạo, cụ thể trong khảo thí: Với phƣơng pháp phân
tích dữ liệu, hiển thị dữ liệu sẽ giúp cho giám thị có thể giám sát tự động thí
sinh, phát hiện sử dụng tài liệu, quay cóp khi làm bài thi. Bản thân học sinh

2

khi biết có hệ thống nhƣ vậy thì cũng nghiêm túc hơn trong phịng thi. Hệ
thống cũng sẽ hỗ trợ cho các hội đồng coi thi. Mục tiêu chính của tơi là nâng

cao chất lƣợng giáo dục trong nhà trƣờng và thúc đẩy ý thức học tập của học
sinh. Chính vì vậy, tơi đã quyết định chọn Đề án "Ứng dụng mơ hình YOLO
xây dựng hệ thống giám sát thí sinh trong phịng thi" nhƣ một hƣớng nghiên
cứu tiềm năng. Đây là sự kết hợp khoa học và công nghệ để đảm bảo công
bằng và khách quan trong việc đánh giá học sinh trong các bài kiểm tra, nhằm
đáp ứng các yêu cầu đổi mới trong lĩnh vực giáo dục nói chung và trong nhà
trƣờng nói riêng.

2. Tổng quan tình hình nghiên cứu đề tài

Hiện nay, thuật toán phát hiện đối tƣợng là một trong những bài tốn
quan trọng trong lĩnh vực thị giác máy tính và trí tuệ nhân tạo. Các thuật tốn
mới của phát hiện đối tƣợng nhƣ YOLO, SSD có tốc độ khá nhanh và độ
chính xác cao nên giúp cho phát hiện đối tƣợng có thể thực hiện đƣợc các tác
vụ dƣờng nhƣ là thời gian thực, thậm chí là nhanh hơn so với con ngƣời. Các
mơ hình cũng trở nên nhẹ hơn nên có thể hoạt động trên các thiết bị IoT để
tạo nên các thiết bị thông minh.

Ngồi ra, một thuật tốn phát hiện đối tƣợng có thể tạo ra những ứng
dụng rất đa dạng nhƣ: Đếm số lƣợng vật thể, thanh toán tiền tại quầy hàng,
chấm công tự động, phát hiện vật thể nguy hiểm nhƣ súng, dao,…. và rất
nhiều các ứng dụng khác. Có thể nói dƣờng nhƣ bất kì lĩnh vực nào cũng đều
có nhu cầu phát hiện đối tƣợng.

Bên cạnh đó nguồn dữ liệu ảnh hiện nay cũng khá phong phú, dễ thu
thập giúp việc huấn luyện mơ hình phát hiện đối tƣợng trở nên dễ dàng hơn.

3. Mục tiêu nghiên cứu

Nghiên cứu và ứng dụng YOLO để xây dụng mơ hình giám sát thí sinh


3

trong phòng thi. Đề án nghiên cứu về ý tƣởng, cấu trúc của mô hình YOLO,
các thuật tốn đƣợc sử dụng trong mơ hình YOLO.

Xây dựng chƣơng trình YOLO để nhận diện trên ảnh, trên video cung
cấp sẵn.
4. Đối tƣợng và phạm vi nghiên cứu
4.1. Đối tượng nghiên cứu

Nghiên cứu cơ sở lý thuyết về học máy, học sâu và mơ hình YOLO.
4.2. Phạm vi nghiên cứu

+ Về không gian: tại trƣờng THCS Quảng Phú, thành phố Quảng Ngãi,
tỉnh Quảng Ngãi.

+ Nội dung: Ứng dụng mô hình YOLO xây dựng hệ thống giám sát
thí sinh trong phòng thi.
5. Nội dung nghiên cứu

- Lý thuyết và mơ hình YOLO
- Ứng dụng mơ hình YOLO xây dựng hệ thống giám sát thí sinh trong
phịng thi.
6. Phƣơng pháp nghiên cứu
Đề án sử dụng nhiều phƣơng pháp khác nhƣ phƣơng pháp thu thập
thông tin và xử lý thông tin nhƣ tiến hành sƣu tầm các sách, báo, tạp chí,
nguồn Internet… các cơng trình liên quan đến học máy và học sâu, các lớp
mơ hình phát hiện đối tƣợng, tiến hành sử dụng phƣơng pháp xử lý thơng tin,
ngồi ra đề án còn sử dụng các phƣơng pháp khác nhƣ phân tích thực trạng,

và sử dụng phƣơng pháp so sánh, tổng hợp, hệ thống hóa các vấn đề đƣợc
nghiên cứu làm cơ sở lý luận và thực tiễn cho các nội dung nghiên cứu.

4

CHƢƠNG 1. KIẾN THỨC CƠ SỞ CỦA HỌC MÁY VÀ HỌC SÂU
Trong chƣơng 1 sẽ trình bày một số kiến thức tổng quan về học máy,

mạng nơron, học sâu để làm cơ sở nghiên cứu về mô hình YOLO.
1.1. Giới thiệu
1.1.1. Khái niệm

Học máy (Machine Learning) là một lĩnh vực của trí tuệ nhân tạo (AI)
liên quan đến việc nghiên cứu và xây dựng các kĩ thuật cho phép các hệ thống
"học" tự động từ dữ liệu để giải quyết những vấn đề cụ thể.

Các định nghĩa về học máy:
- Một q trình nhờ đó một hệ thống cải thiện hiệu suất (hiệu quả hoạt
động) của nó. (Simon, 1983).
- Một q trình mà một chƣơng trình máy tính cải thiện hiệu suất của
nó trong một cơng việc thơng qua kinh nghiệm (Mitchell, 1997).
- Việc lập trình các máy tính để tối ƣu hóa một tiêu chí hiệu suất dựa
trên các dữ liệu ví dụ hoặc kinh nghiệm trong quá khứ (Alpaydin, 2020).
Định nghĩa sau đây thƣờng đƣợc sử dụng nhƣ một hình thức hóa bài
tốn học máy: "Một chƣơng trình máy tính đƣợc gọi là học từ dữ liệu, kinh
nghiệm E đối với lớp nhiệm vụ T và độ đo mức thực hiện P nếu việc thực
hiện các nhiệm vụ T của nó khi đo bằng P đƣợc cải tiến nhờ dữ liệu hoặc kinh
nghiệm E" (Mitchell, 1997).
1.1.2. Ứng dụng của học máy
Học máy đã có ứng dụng rộng rãi trong nhiều lĩnh vực khác nhau. Dƣới

đây là một số ứng dụng tiêu biểu của học máy:

5

- Thị giác máy tính: Học máy đƣợc sử dụng để giải quyết các bài toán
trong lĩnh vực thị giác máy tính nhƣ nhận diện khn mặt, nhận diện vật thể,
phân tích hình ảnh y tế, phát hiện giả mạo.

- Xử lý ngôn ngữ tự nhiên: Học máy đƣợc sử dụng để phân loại văn
bản, dịch thuật tự động, tổng hợp tiếng nói, trả lời câu hỏi tự động.

- Cơng nghệ tài chính: Học máy đƣợc sử dụng để dự báo giá chứng
khoán, phân tích tín dụng, định giá tài sản, quản lý rủi ro.

- Y tế: Học máy đƣợc sử dụng để hỗ trợ chẩn đốn bệnh, phát hiện ung
thƣ, dự đốn tình trạng bệnh nhân và tối ƣu hóa điều trị.

- Marketing: Học máy đƣợc sử dụng để phân tích dữ liệu khách hàng,
dự đốn hành vi tiêu dùng và tối ƣu hóa chiến lƣợc marketing.

- Tự động hóa sản xuất: Học máy đƣợc sử dụng để tối ƣu hoá quá trình
sản xuất, dự báo lỗi sản xuất, giảm thiểu chi phí và tăng năng suất.

- Thông tin địa lý: Học máy đƣợc sử dụng để phân tích dữ liệu địa lý,
dự báo tình trạng thời tiết, tìm kiếm địa điểm, tối ƣu hố lộ trình.

Các ứng dụng của học máy rất đa dạng và liên tục đƣợc phát triển,
đóng góp quan trọng vào sự tiến bộ và cải thiện trong nhiều khía cạnh của
cuộc sống và nền kinh tế. Khả năng tự động hóa, dự đoán và học hỏi của học
máy đã thúc đẩy sự phát triển của nhiều lĩnh vực, từ công nghiệp đến y tế, từ

khoa học đến giáo dục.
1.1.3. Phân loại các phương pháp học máy

Có bốn phƣơng pháp học máy: học có giám sát (supervised learning),
học không giám sát (unsupervised learning), học máy bán giám sát (semi-
supervised learning) và học tăng cƣờng (reinforcement learning):

6

- Học có giám sát (Supervised learning): Đây là phƣơng pháp học máy
trong đó mơ hình học từ các cặp dữ liệu đầu vào-vào đầu ra đã đƣợc gán
nhãn. Mục tiêu của phƣơng pháp này là tìm ra một quy luật ánh xạ giữa các
đầu vào và đầu ra để có thể dự đốn các đầu ra mới. Các thuật tốn học có
giám sát bao gồm: Hồi quy tuyến tính (Linear regression), Hồi quy Logistic
(Logistic regression), Cây quyết định (Decision tree), Rừng ngẫu nhiên
(Random forest), Mơ hình Naive Bayes, Máy Vector hỗ trợ (Support Vector
Machine), Mơ hình mạng nơron (Neural Networks).

- Học không giám sát (Unsupervised learning): Đây là phƣơng pháp
học máy trong đó mơ hình học từ các dữ liệu đầu vào mà khơng có thơng tin
về đầu ra mong muốn. Mục tiêu của phƣơng pháp này là tìm ra các đặc trƣng,
cấu trúc hay mối quan hệ giữa các dữ liệu đầu vào. Các thuật tốn học khơng
giám sát bao gồm: Phân cụm (Clustering), khai thác luật kết hợp (Association
Rule Mining).

- Học máy bán giám sát (semi-supervised learning) là một phƣơng pháp
học máy nằm giữa hai phƣơng pháp chính là học có giám sát và học khơng
giám sát. Trong học máy bán giám sát, tập dữ liệu đƣợc sử dụng để huấn
luyện mơ hình bao gồm cả dữ liệu có nhãn (labeled data) và dữ liệu không
nhãn (unlabeled data).


- Học tăng cƣờng (Reinforcement learning): Đây là phƣơng pháp học
máy trong đó mơ hình phải tƣơng tác với một môi trƣờng để đạt đƣợc các
mục tiêu cụ thể. Mục tiêu của phƣơng pháp này là tìm ra một chiến lƣợc tối
ƣu để đạt đƣợc mục tiêu cụ thể thông qua các tƣơng tác với môi trƣờng. Các
thuật toán học tăng cƣờng bao gồm: Q-learning, Policy Gradient, Actor-
Critic.

7

1.1.4. Các bước tiến hành trong bài toán học máy
Có nhiều bƣớc tiến hành trong một bài tốn học máy. Dƣới đây là các

bƣớc chính để thực hiện một bài toán học máy:

Bước 1. Xác định vấn đề: Đầu tiên, ta cần xác định vấn đề cần giải
quyết. Đây có thể là bài toán phân loại, dự đoán, phân cụm, hoặc bất kỳ loại
bài toán nào khác.

Bước 2. Chuẩn bị dữ liệu: Sau khi xác định vấn đề, ta cần chuẩn bị dữ
liệu cho bài tốn. Điều này có thể bao gồm thu thập dữ liệu, tiền xử lý dữ liệu,
và chia dữ liệu thành tập huấn luyện và tập kiểm tra.

Bước 3. Chọn mơ hình: Tiếp theo, ta cần chọn một mơ hình học máy
phù hợp cho bài tốn. Các mơ hình học máy khác nhau có các đặc tính và ƣu
điểm khác nhau, do đó ta cần lựa chọn một mơ hình phù hợp với vấn đề cần
giải quyết.

Bước 4. Huấn luyện mơ hình: Sau khi chọn đƣợc mơ hình, ta cần huấn
luyện mơ hình trên tập dữ liệu huấn luyện. Mục tiêu là để mơ hình học đƣợc

mối quan hệ giữa đầu vào và đầu ra, để có thể dự đốn kết quả cho các dữ liệu
mới.

Bước 5. Đánh giá mơ hình: Sau khi huấn luyện mơ hình, ta cần đánh
giá mơ hình trên tập dữ liệu kiểm tra. Điều này giúp ta đánh giá hiệu suất của
mơ hình và xác định xem liệu mơ hình có thể đƣợc sử dụng để dự đốn cho
dữ liệu mới hay khơng.

Bước 6. Tinh chỉnh và cải thiện mơ hình: Nếu mơ hình chƣa đạt đƣợc
hiệu suất mong muốn, ta cần tinh chỉnh và cải thiện mơ hình. Điều này có thể
bao gồm việc thay đổi các siêu tham số của mơ hình hoặc thay đổi cấu trúc
của mơ hình.

8
Bƣớc 7: Triển khai mơ hình: Cuối cùng, sau khi đã huấn luyện một mơ
hình học máy tốt, ta có thể triển khai mơ hình trong ứng dụng thực tế để dự
đoán kết quả cho dữ liệu mới.
1.2. Mạng Nơ-ron (Neural Network)
1.2.1. Mơ hình nơ-ron nhân tạo
Mơ hình nơ-ron nhân tạo là một mơ hình tính tốn đƣợc lấy cảm hứng
từ cấu trúc của các tế bào thần kinh trong hệ thống thần kinh của con ngƣời.
Mơ hình nơ-ron nhân tạo bao gồm một số lƣợng lớn các "nơ-ron", đƣợc kết
nối với nhau thông qua các "liên kết" và "trọng số". Mỗi nơ-ron nhân tạo nhận
đầu vào từ các nơ-ron khác và tính tốn đầu ra dựa trên các liên kết và trọng
số giữa chúng.

Hình 1.1. Mơ hình nơ- ron sinh học.

Hình 1.2. Mơ hình nơ- ron trong tốn học.


9

Từ hình 1.2 ta có:

x1, ..., xn: là các đầu vào (input).

w1,...,wn: các trọng số tƣơng ứng.

Net= ∑ : Tổng hợp các tín hiệu.

0i =f ( ∑ ): Đầu ra (output).

f: Là hàm kích hoạt.

Các mơ hình nơron nhân tạo đƣợc sử dụng rộng rãi trong học máy và
trí tuệ nhân tạo để giải quyết các bài toán phức tạp nhƣ phân loại, dự đốn,
nhận dạng, xử lý ngơn ngữ tự nhiên và thị giác máy tính.

Các thành phần chính của một mơ hình nơ-ron nhân tạo bao gồm:

Nơ-ron: Là đơn vị tính tốn cơ bản của mơ hình. Mỗi nơ-ron nhận đầu
vào từ các nơ-ron khác, tính tốn một giá trị và truyền đầu ra đến các nơ-ron
khác.

Liên kết: Là các đƣờng kết nối giữa các nơ-ron.

Trọng số: Là giá trị số của liên kết giữa các nơ-ron với nhau. Trọng số
đƣợc sử dụng để điều chỉnh đầu ra của một nơ-ron dựa trên đầu vào của nó.

Hàm kích hoạt: Là hàm số đƣợc sử dụng để tính tốn đầu ra của một

nơ-ron dựa trên đầu vào và trọng số.

Lớp: Là một tập hợp các nơ-ron cùng mức. Các lớp thông thƣờng đƣợc
chia thành lớp đầu vào, lớp ẩn và lớp đầu ra.

Thuật toán huấn luyện: Là phƣơng pháp đƣợc sử dụng để tìm tập các
trọng số tối ƣu trong mơ hình. Các thuật tốn huấn luyện thơng thƣờng đƣợc
sử dụng để tối ƣu hóa hàm mất mát và tìm trọng số tối ƣu để kết quả dự đoán
phù hợp với dữ liệu đầu ra.


×