ĐỒ ÁN CƠ SỞ Tìm hiểu RCNN ứng dụng phát hiện có xe hơi trên đường

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.71 MB, 27 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC NGUYỄN TẤT THÀNH
KHOA CƠNG NGHỆ THƠNG TIN

ĐỒ ÁN CƠ SỞ
Tìm hiểu R-CNN ứng dụng phát hiện có xe hơi trên đường

Giảng viên hướng dẫn:

Th.S Vương Xn Chí

Sinh viên thực hiện:

Hồng Quốc Hải

MSSV:

2000002072

Chun ngành:

Khoa học Dữ liệu

Mơn học:
Đồ án Cơ sở
Khóa:

2020 – 2024

TP.HCM, tháng 9 năm 2022

Trường Đại học Nguyễn Tất Thành

-

Kết luận

YÊU CẦU:

Khoa Công Nghệ Thơng Tin
🙜🙜🙜🙜

-

CỘNG HỊA XÃ HỘI CHỦ NGHĨA
VIỆT NAM
Độc lập – Tự do – Hạnh phúc
🙜🙜🙜🙜

-

NHIỆM VỤ ĐỒ ÁN CHUYÊN
NGÀNH/CƠ SỞ
(Sinh viên phải đóng tờ này vào báo cáo)

Có kiến thức, đam mê, hiểu biết về
công nghệ mới như Mạng neural,
Machine Learning, Deep
Learning…. Đọc hiểu tài liệu tiếng
Anh, kỹ năng trình bày văn bản trên

máy tính tốt.
Có tác phong làm việc chăm chỉ,
tinh thần trách nhiệm cao, có khả
năng làm việc độc lập hoặc làm việc
trong nhóm tốt.

Nội dung và yêu cầu đã được thơng qua
Bộ mơn.

Họ và tên: Hồng Quốc Hải
MSSV: 2000002072
Chuyên nghành: Khoa học Dữ liệu
Lớp: 20DTH1D

Q. TRƯỞNG BỘ
MÔN

Email:
SĐT: 0379813013

(Ký và ghi rõ họ
tên)

Tên đề tài: Tìm hiểu R-CNN ứng dụng
phát hiện có xe hơi trên đường.

TP.HCM, ngày 26
tháng 06 năm 2022
GIÁO VIÊN
HƯỚNG DẪN

(Ký và ghi rõ họ
tên)

Giá viên hướng dẫn: Vương Xuân Chí
Thời gian thực hiện: 20/6/2022 đến
20/9/2022

ThS. Vương Xn
Chí

MƠ TẢ ĐỀ TÀI:
Deep Learning là một nhánh của Machine
Learning sử dụng mạng lưới thần kinh với
nhiều lớp. Một mạng lưới thần kinh sâu
phân tích dữ liệu với các biểu diễn đã học
tương tự như cách một người nhìn vào một
vấn đề.
NỘI DUNG VÀ PHƯƠNG PHÁP:
-

-

-

Giới thiệu học sâu Deep learning,
các phương pháp tiếp cận học máy
Machine learning
R-CNN sử dụng Selective Search để
extract các regions từ image đầu vào
và check sự xuất hiện bất kì của

object, tìm ra các specific features
để detect ra các objects.
Đưa ra ý tưởng để xây dựng ứng
dụng phát hiện có xe hơi trên đường.
1

ThS. Vương Xuân
Chí

LỜI CẢM ƠN
Lời đầu tiên, xin gửi lời cảm ơn đến
gia đình em, gia đình ln tạo điều
kiện, động lực quý báu cho em trong
quá trình học tập cũng như hồn
thành bài báo cáo này.
Tiếp theo, xin gửi đến lịng biết ơn
sâu sắc đến giảng viên Vương Xuân
Chí ở Khoa CNTT Trường Đại học
Nguyễn Thành người đã hướng dẫn,
giúp đỡ em trong q trình hồn thiện
bài báo cáo này.

2

LỜI MỞI ĐẦU
Với sự phát triển của xã hội hiện đại,
AI – Artifical Intelligence Trí tuệ
nhân tạo khơng cịn gì xa lạ với mỗi

chúng ta. Chúng đang hiện diện phổ
biến trong mọi lĩnh vực trong cuộc
sống của chúng ta, từ kinh tế, giáo
dục, y khoa, giải trí và ngay cả trong
qn sự quốc phịng của các quốc gia.
Theo đó, sự bùng nổ của dữ liệu lớn
Big Data giúp cho việc khai thác và
sử dụng chúng trở nên phổ biến và dễ
dàng hơn. Các phần cứng để sử dụng
cho mục đích phát triển ứng dụng liên
quan đến AI ngày càng rẻ và hiệu
năng năng tốt hơn góp phần phổ biến
đến người dùng. Từ đó bất kỳ ai cũng
có thể sáng tạo, tham gia phát triển
các AI phục vụ con người trong mọi
lĩnh vực.

3

NHẬN XÉT CỦA GIẢNG
VIÊN HƯỚNG DẪN
Điểm đồ án:
TPHCM, Ngày
…… tháng ……
năm….
Giáo viên hướng
dẫn
(Ký tên, đóng
dấu)

4

MỤC LỤC
Chương 1 Giới thiệu Artificial Intelligence, Machine learning, Deep learning
1.1

Artificial Intelligence

1
1

1.1.1

AI - Trí tuệ nhân tạo là gì?

1

1.1.2

Triết lý về AI

1

1.1.3

Mục tiêu của AI

2

1.1.4

Những đóng góp của AI

2

1.1.5

Các loại AI

3

1.1.6

Ứng dụng của AI

4

1.1.7

Trí tuệ nhân tạo hoạt động như thế nào?

5

1.1.8

Các cách triển khai AI

5

2.1

Machine learning

5

2.1.1

Machine Learning là gì?

5

2.1.2

Một số định nghĩa

6

2.1.3

Quy trình học máy

7

2.1.4

Các loại học máy

7

2.1.5

Các vấn đề giải quyết bằng học máy

9

3.1

Deep learning

10

3.1.1

Deep Learning là gì?

10

3.1.2

Neural Networks

11

3.1.3

Deep Learning hoạt động như thế nào?

12

3.1.4

Các loại mạng nơ-ron

14

Chương 2 R-CNN

18

Chương 3 Ý tưởng ứng dụng phát hiện xe hơi

19

Chương 4 Kết luận

20

Chương 5 Tài liệu tham khảo

20

DANH MỤC BẢNG HÌNH
Hình 1 Những đóng góp của AI

3

Hình 2 Machine Learning là gì?

6

Hình 3 Quy trình học máy

7

Hình 4 Supervised Learning

8

Hình 5 Unsupervised Learning

8

Hình 6 Các vấn đề giải quyết bằng học máy

9

Hình 7 Trí tuệ nhân tạo so với Học máy và Học sâu

11

Hình 8 Các thành phần mạng thần kinh nhân tạo

12

Hình 9 Kiến trúc Deep neural network

13

Hình 10 Forward propagation in neural networks

14

Hình 11 Convolutional Neural Networks

15

Hình 12 The Recurrent Neural Networks architecture

16

Hình 13 Generative adversarial networks

17

Hình 14 Transformer Neural Networks

18

Hình 15 R-CNN

19

Chương 1

Giới thiệu Artificial Intelligence, Machine learning,

Deep learning
1.1

Artificial Intelligence

Kể từ khi phát minh ra máy tính hoặc máy móc, khả năng thực hiện các nhiệm vụ
khác nhau của họ đã tăng lên theo cấp số nhân. Con người đã phát triển sức mạnh
của hệ thống máy tính về các lĩnh vực làm việc đa dạng, tốc độ ngày càng tăng và
giảm kích thước theo thời gian.
Một nhánh của Khoa học Máy tính có tên Trí tuệ nhân tạo theo đuổi việc tạo ra các
máy tính hoặc máy móc thơng minh như con người.
1.1.1

AI - Trí tuệ nhân tạo là gì?
Theo cha đẻ của Trí tuệ nhân tạo, John McCarthy, đó là “Khoa học và kỹ thuật

tạo ra các máy thông minh, đặc biệt là các chương trình máy tính thơng minh”.
Trí tuệ nhân tạo là một cách làm cho một máy tính, một robot điều khiển bằng
máy tính hoặc một phần mềm suy nghĩ một cách thông minh, theo cách tương tự như
suy nghĩ của con người thông minh.
AI được hoàn thiện bằng cách nghiên cứu cách bộ não con người suy nghĩ và
cách con người học, quyết định và làm việc trong khi cố gắng giải quyết một vấn đề,
sau đó sử dụng kết quả của nghiên cứu này làm cơ sở phát triển phần mềm và hệ
thống thông minh.
1.1.2

Triết lý về AI
Trong khi khai thác sức mạnh của hệ thống máy tính, sự tị mị của con người

khiến anh ta tự hỏi, “Liệu một cỗ máy có thể suy nghĩ và hành xử như con người
khơng?”
Do đó, sự phát triển của AI bắt đầu với ý định tạo ra trí thơng minh tương tự
trong các máy móc mà chúng ta tìm thấy và đánh giá cao ở con người.
1.1.3

Mục tiêu của AI
Tạo ra hệ thống Chuyên gia: Hệ thống thể hiện hành vi thông minh, học hỏi,

chứng minh, giải thích và tư vấn cho người dùng của nó.
1

Để triển khai trí thơng minh của con người trong máy móc: Tạo ra các hệ
thống hiểu, suy nghĩ, học hỏi và hành xử như con người.
1.1.4

Những đóng góp của AI
Trí tuệ nhân tạo là một ngành khoa học và cơng nghệ dựa trên các ngành như

Khoa học máy tính, Sinh học, Tâm lý học, Ngơn ngữ học, Tốn học và Kỹ thuật. Một
lực đẩy chính của AI là phát triển các chức năng máy tính liên quan đến trí thông
minh của con người, chẳng hạn như lý luận, học tập và giải quyết vấn đề.
Trong số các lĩnh vực sau, một hoặc nhiều lĩnh vực có thể góp phần xây dựng
một hệ thống thông minh.

H

1.1.5

Các loại AI
-

Purely Reactive: Những máy này khơng có bất kỳ bộ nhớ hoặc dữ liệu

nào để làm việc, chỉ chuyên về một lĩnh vực cơng việc. Ví dụ, trong một trị
2

chơi cờ vua, máy quan sát các nước đi và đưa ra quyết định tốt nhất có thể
để giành chiến thắng.
-

Limited Memory: Các máy này thu thập dữ liệu trước đó và tiếp tục

thêm nó vào bộ nhớ của chúng. Họ có đủ trí nhớ hoặc kinh nghiệm để đưa
ra quyết định đúng đắn, nhưng trí nhớ là rất ít. Ví dụ: máy này có thể đề
xuất một nhà hàng dựa trên dữ liệu vị trí đã được thu thập.
-

Theory of Mind: Loại AI này có thể hiểu được suy nghĩ và cảm xúc,

cũng như tương tác xã hội. Tuy nhiên, một máy dựa trên loại này vẫn chưa
được chế tạo.
-

Self-Aware: Máy móc tự nhận thức là thế hệ tương lai của những công

nghệ mới này. Chúng sẽ thông minh, có tri giác và có ý thức.
1.1.6

Ứng dụng của AI
Gaming: AI đóng vai trị quan trọng trong các trị chơi chiến lược như cờ vua,

poker, tic-tac-toe, v.v., nơi máy có thể nghĩ ra một số lượng lớn các vị trí có thể dựa
trên kiến thức kinh nghiệm.
Natural Language Processing: Có thể tương tác với máy tính để hiểu ngơn ngữ
tự nhiên của con người.
Expert Systems: Hệ thống chuyên gia - Có một số ứng dụng tích hợp máy
móc, phần mềm và thông tin đặc biệt để truyền đạt lý luận và tư vấn. Họ cung cấp lời
giải thích và lời khuyên cho người dùng.
Vision Systems: Các hệ thống này hiểu, diễn giải và lĩnh hội đầu vào trực quan
trên máy tính. Ví dụ:
-

Các bác sĩ sử dụng hệ thống chuyên gia lâm sàng để chẩn đoán

cho bệnh nhân.
-

Cảnh sát sử dụng phần mềm máy tính có thể nhận dạng khn

mặt của tội phạm với bức chân dung được lưu trữ do nghệ sĩ pháp y thực
hiện.
Speech Recognition: Một số hệ thống thơng minh có khả năng nghe và hiểu
ngơn ngữ dưới dạng câu và ý nghĩa của chúng trong khi con người nói chuyện với nó.
Nó có thể xử lý các trọng âm khác nhau, từ lóng, tiếng ồn trong nền, thay đổi tiếng ồn
của con người do lạnh, v.v.
3

Handwriting Recognition: Phần mềm nhận dạng chữ viết tay đọc văn bản được
viết trên giấy bằng bút hoặc trên màn hình bằng bút cảm ứng. Nó có thể nhận ra hình
dạng của các chữ cái và chuyển nó thành văn bản có thể chỉnh sửa.
Intelligent Robots: Robot có thể thực hiện các nhiệm vụ do con người giao.
Chúng có các cảm biến để phát hiện dữ liệu vật lý từ thế giới thực như ánh sáng, sức
nóng, nhiệt độ, chuyển động, âm thanh, va đập và áp suất. Chúng có bộ xử lý hiệu
quả, nhiều cảm biến và bộ nhớ khổng lồ, để thể hiện trí thơng minh. Ngồi ra, họ có
khả năng học hỏi từ những sai lầm của mình và họ có thể thích nghi với mơi trường
mới.
1.1.7

Trí tuệ nhân tạo hoạt động như thế nào?
Nói một cách đơn giản, các hệ thống AI hoạt động bằng cách hợp nhất lớn với

các thuật tốn xử lý thơng minh, lặp đi lặp lại. Sự kết hợp này cho phép AI học hỏi từ
các mẫu và tính năng trong dữ liệu được phân tích. Mỗi khi hệ thống Trí tuệ nhân tạo
thực hiện một vịng xử lý dữ liệu, nó sẽ kiểm tra và đo lường hiệu suất của nó và sử
dụng kết quả để phát triển thêm kiến thức chuyên môn.
1.1.8

Các cách triển khai AI

Học máy - Machine Learning: Đó là học máy cung cấp cho AI khả năng học hỏi.
Điều này được thực hiện bằng cách sử dụng các thuật toán để khám phá các mẫu
và tạo ra thông tin chi tiết từ dữ liệu mà chúng được tiếp xúc.
Học sâu - Deep Learning: Học sâu, là một nhanh con của học máy, cung cấp cho AI
khả năng bắt chước mạng thần kinh của não người. Nó có thể tạo ra cảm giác về
các mẫu, nhiễu và các nguồn gây nhầm lẫn trong dữ liệu.
1.2

Machine learning

1.2.1

Machine Learning là gì?

Nói một cách dễ hiểu, Học máy là một nhánh con của Trí tuệ nhân tạo (AI) cung
cấp cho máy móc khả năng học hỏi tự động và cải thiện từ kinh nghiệm mà khơng
cần được lập trình rõ ràng để làm như vậy. Theo nghĩa, đó là việc thực hành để
Máy móc giải quyết vấn đề bằng cách đạt được khả năng suy nghĩ.

4

Hình 2 Machine Learning là gì?

1.2.2

Một số định nghĩa

Algorithm: Thuật toán Học máy là một tập hợp các quy tắc và kỹ thuật thống kê
được sử dụng để học các mẫu từ dữ liệu và rút ra thông tin quan trọng từ nó. Đó là
logic đằng sau một mơ hình Học máy. Một ví dụ về thuật tốn Học máy là thuật
tốn Hồi quy tuyến tính.
Model: Mơ hình là thành phần chính của Học máy. Một mơ hình được đào tạo
bằng cách sử dụng Thuật toán học máy. Một thuật tốn ánh xạ tất cả các quyết
định mà một mơ hình phải thực hiện dựa trên đầu vào đã cho, để có được đầu ra
chính xác.
Predictor Variable: Là (các) đặc điểm của dữ liệu có thể được sử dụng để dự

đốn kết quả đầu ra.
Response Variable: Là tính năng hoặc biến đầu ra cần được dự đoán bằng cách sử
dụng (các) biến dự đốn.
Training Data: Mơ hình Học máy được xây dựng bằng cách sử dụng dữ liệu đào
tạo. Dữ liệu đào tạo giúp mơ hình xác định các xu hướng chính và các mẫu cần
thiết để dự đốn kết quả đầu ra.
Testing Data: Sau khi mơ hình được đào tạo, nó phải được kiểm tra để đánh giá
mức độ chính xác của nó có thể dự đốn một kết quả. Điều này được thực hiện
bởi tập dữ liệu thử nghiệm.
1.2.3

Quy trình học máy

5

Hình 3 Quy trình học máy

1. Thu thập dữ liệu: Thu thập dữ liệu mà thuật toán sẽ học từ đó.
2. Chuẩn bị dữ liệu: Định dạng và thiết kế dữ liệu thành định dạng tối ưu,

trích xuất các tính năng quan trọng và thực hiện giảm kích thước.
3. Huấn luyện: Còn được gọi là giai đoạn lắp ráp, đây là nơi thuật toán Học

máy thực sự học bằng cách hiển thị cho nó dữ liệu đã được thu thập và
chuẩn bị.
4. Đánh giá: Kiểm tra mơ hình để xem nó hoạt động tốt như thế nào.
5. Điều chỉnh: Tinh chỉnh mơ hình để tối đa hóa hiệu suất của nó.
1.2.4

Các loại học máy

Supervised Learning
Học tập có giám sát là một kỹ thuật trong đó chúng ta dạy hoặc đào tạo máy bằng
cách sử dụng dữ liệu được gắn nhãn rõ ràng

6

Hình 4 Supervised Learning

Hãy xem xét hình trên. Ở đây chúng ta đang cung cấp cho máy các hình ảnh Tom và
Jerry và mục đích là để máy xác định và phân loại các hình ảnh thành hai nhóm
(hình ảnh Tom và hình ảnh Jerry). Tập dữ liệu đào tạo được cung cấp cho mơ hình
được gắn nhãn, như trong, chúng ta đang nói với máy, 'đây là hình dáng của Tom và
đây là Jerry'. Làm như vậy, bạn đang đào tạo máy bằng cách sử dụng dữ liệu được
gắn nhãn. Trong Học tập có giám sát, có một giai đoạn đào tạo được xác định rõ
được thực hiện với sự trợ giúp của dữ liệu được gắn nhãn.
Unsupervised Learning
Học không giám sát liên quan đến việc đào tạo bằng cách sử dụng dữ liệu không
được gắn nhãn và cho phép mơ hình hoạt động trên thơng tin đó mà khơng cần
hướng dẫn.

Hình 5 Unsupervised Learning

7

Ví dụ: nó xác định các đặc điểm nổi bật của Tom như tai nhọn, kích thước lớn
hơn, v.v., để hiểu rằng hình ảnh này thuộc loại 1. Tương tự, nó tìm thấy các đặc

điểm như vậy ở Jerry và biết rằng hình ảnh này thuộc loại 2. Do đó, nó phân loại
các hình ảnh thành hai lớp khác nhau mà không cần biết Tom hay Jerry là ai.
Reinforcement Learning
Học tăng cường là một phần của Học máy trong đó tác nhân được đưa vào một
môi trường và anh ta học cách cư xử trong môi trường này bằng cách thực hiện
một số hành động nhất định và quan sát phần thưởng mà nó nhận được từ những
hành động đó.
Học tăng cường chủ yếu được sử dụng trong các lĩnh vực Học máy nâng cao như
ô tô tự lái, AplhaGo, v.v.
1.2.5

Các vấn đề giải quyết bằng học máy

Hình 6 Các vấn đề giải quyết bằng học máy

Hãy xem xét hình trên, có ba dạng vấn đề chính có thể được giải quyết trong Học
máy:
1. Regression - Hồi quy: Trong dạng bài toán này, đầu ra là một đại lượng

liên tục. Vì vậy, ví dụ, nếu bạn muốn dự đốn tốc độ của một chiếc ơ tơ
trong qng đường, đó là một bài toán Hồi quy. Các vấn đề hồi quy có thể
được giải quyết bằng cách sử dụng các thuật tốn Học có Giám sát như Hồi
quy Tuyến tính - Linear Regression.
8

2. Classification - Phân loại: Trong loại này, đầu ra là một giá trị phân

loại. Phân loại email thành hai lớp, spam và không spam là một vấn đề phân
loại có thể được giải quyết bằng cách sử dụng các thuật toán phân loại

Supervised Learning như Support Vector Machines, Naive Bayes, Logistic
Regression, K Nearest Neighbor, v.v.
3. Clustering - Phân cụm: Loại vấn đề này liên quan đến việc gán đầu vào

thành hai hoặc nhiều cụm dựa trên sự giống nhau về tính năng. Ví dụ: nhóm
người xem thành các nhóm tương tự dựa trên sở thích, độ tuổi, địa lý, v.v.
của họ có thể được thực hiện bằng cách sử dụng thuật tốn Học khơng
giám sát như K-Means Clustering.
1.3

Deep learning

1.3.1

Deep Learning là gì?

Deep Learning (học sâu) có thể được xem là một lĩnh vực con của Machine
Learning (học máy) – ở đó các máy tính sẽ học và cải thiện chính nó thơng qua các
thuật tốn. Deep Learning được xây dựng dựa trên các khái niệm phức tạp hơn rất
nhiều, chủ yếu hoạt động với các mạng nơ-ron nhân tạo để bắt chước khả năng
tư duy và suy nghĩ của bộ não con người.
Các mơ hình học sâu hiện đại sử dụng mạng nơ-ron nhân tạo hoặc đơn giản là
mạng nơ-ron để trích xuất thơng tin.
Các mạng nơ-ron này được tạo thành từ một hàm tốn học đơn giản có thể xếp
chồng lên nhau và sắp xếp dưới dạng các lớp, tạo cho chúng cảm giác về chiều
sâu, do đó có thuật ngữ Deep Learning.
Học sâu cũng có thể được coi là một phương pháp tiếp cận Trí tuệ nhân tạo, một
sự kết hợp thông minh giữa phần cứng và phần mềm để giải quyết các cơng việc
địi hỏi trí tuệ con người.

9

Hình 7 Trí tuệ nhân tạo so với Học máy và Học sâu

1.3.2

Neural Networks

Mạng lưới thần kinh là trung tâm của các mơ hình học sâu và ban đầu nó được
thiết kế để bắt chước hoạt động của các tế bào thần kinh trong não người.

10

Hình 8 Các thành phần mạng thần kinh nhân tạo

1.3.3

Deep Learning hoạt động như thế nào?

Mạng thần kinh sâu có nhiều lớp nơ-ron nhân tạo được kết nối với nhau hoặc các
nút được xếp chồng lên nhau. Mỗi nút này có một hàm tốn học đơn giản thường
là một hàm tuyến tính thực hiện việc trích xuất và ánh xạ thơng tin.
Có ba lớp đối với một mạng nơ-ron sâu: lớp đầu vào (Input Layer), lớp ẩn
(Hidden Layer) và lớp đầu ra (Output Layer).

11

Hình 9 Kiến trúc Deep neural network

Mỗi nút trong lớp đầu vào sẽ nhập dữ liệu và chuyển nó sang lớp tiếp theo, tức là
các lớp ẩn. Các lớp ẩn này ngày càng trích xuất các tính năng từ lớp đầu vào đã
cho và biến đổi nó bằng cách sử dụng hàm tuyến tính.
Các lớp này được gọi là các lớp ẩn vì các tham số - parameter (trọng số - weight và
độ lệch - bias) trong mỗi nút là không xác định; các lớp này thêm các tham số ngẫu
nhiên để biến đổi dữ liệu, mỗi tham số sẽ cho kết quả đầu ra khác nhau.
Kết quả thu được từ các lớp ẩn sau đó được chuyển đến lớp cuối cùng được gọi
là lớp đầu ra, nơi tùy thuộc vào nhiệm vụ, nó phân loại, dự đốn hoặc tạo mẫu.
Quá trình này được gọi là quá trình chuyển tiếp - forward propagation.

Hình 10 Forward propagation in neural networks

12

Trong một quy trình khác được gọi là backpropagation, một thuật tốn, giống như
gradient descent, tính tốn sai số bằng cách lấy sự khác biệt giữa đầu ra dự đoán
và đầu ra ban đầu.
Sau đó, lỗi này được điều chỉnh bằng cách tinh chỉnh trọng số và độ lệch của hàm
bằng cách di chuyển lùi qua các lớp.
Cả hai, quá trình lan truyền chuyển tiếp và lan truyền ngược cho phép mạng nơron giảm lỗi và đạt được độ chính xác cao trong một tác vụ cụ thể. Với mỗi lần
lặp, thuật tốn dần trở nên chính xác hơn.
1.3.4

Các loại mạng nơ-ron

CNN
Convolutional Neural Networks hay CNNs chủ yếu được sử dụng cho các nhiệm

vụ liên quan đến thị giác máy tính hoặc xử lý hình ảnh.
CNN cực kỳ tốt trong việc mơ hình hóa dữ liệu khơng gian như hình ảnh và video
2D hoặc 3D. Nó có thể trích xuất các tính năng và mẫu trong một hình ảnh, cho
phép các tác vụ như phân loại hình ảnh hoặc phát hiện đối tượng.

13

Hình 11 Convolutional Neural Networks

RNN
Recurrent Neural Networks hay RNN chủ yếu được sử dụng để lập mơ hình dữ
liệu tuần tự, chẳng hạn như văn bản, âm thanh hoặc bất kỳ loại dữ liệu nào đại
diện cho trình tự hoặc thời gian. Chúng thường được sử dụng trong các nhiệm vụ
liên quan đến xử lý ngôn ngữ tự nhiên (NLP).
14

Hình 12 The Recurrent Neural Networks architecture

GAN
Generative adversarial networks or GANs là các khuôn khổ được sử dụng cho các
nhiệm vụ liên quan đến việc học tập khơng có giám sát. Loại mạng này về cơ bản
học cấu trúc của dữ liệu và các mẫu theo cách mà nó có thể được sử dụng để tạo
ra các ví dụ mới, tương tự như của tập dữ liệu gốc.

15

Hình 13 Generative adversarial networks

Transformers
Transformers là mơ hình học sâu lớp mới được sử dụng chủ yếu cho các tác vụ liên
quan đến mơ hình hóa dữ liệu tuần tự, giống như trong NLP. Nó mạnh hơn nhiều
so với RNN và chúng đang thay thế chúng trong mọi nhiệm vụ.
Gần đây, transformers cũng đang được ứng dụng trong các tác vụ thị giác máy
tính và chúng đang tỏ ra khá hiệu quả so với CNN truyền thống.

16

Hình 14 Transformer Neural Networks

Chương 2

R-CNN

Giới thiệu
Với bài tốn phân loại, kiến trúc CNN chỉ có một đầu vào là đối tượng cụ thể như
chữ số hay loài hoa. Tuy nhiên, trong một hình ảnh bình thường chúng ta khơng
biết được bao nhiêu đối tượng trong nó. Và ta quan tâm đến vị trí của đối tượng
trong hình ảnh và từ đó sinh ra bài tốn Object Detection hay phát hiện đối tượng.
Ta thấy, CNN hông thể giải quyết được vấn đề Object Detection vì nó khơng biết
được bao nhiêu đối tượng trong bức ảnh. Và R-CNN (Region-based Convolutional
Neural Network) ra đời.
17

ĐỒ ÁN CƠ SỞ Tìm hiểu RCNN ứng dụng phát hiện có xe hơi trên đường

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về