Tải bản đầy đủ (.pdf) (57 trang)

Báo cáo nghiên cứu khoa học sinh viên đề tài xây dựng ứng dụng nhận diện biển báo giao thông trên thiết bị di động

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.94 MB, 57 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC MỎ - ĐỊA CHẤT
----------

BÁO CÁO NGHIÊN CỨU KHOA HỌC SINH VIÊN
ĐỀ TÀI:
XÂY DỰNG ỨNG DỤNG NHẬN DIỆN BIỂN BÁO GIAO
THÔNG TRÊN THIẾT BỊ DI ĐỘNG

Hà Nội, 05/2023


tài: Xây dng ng dng nhn din bin báo giao thông trên thit b di ng

Mục Lục
LỜI CẢM ƠN................................................................................................................3
LỜI MỞ ĐẦU................................................................................................................4
CHƯƠNG 1: KHẢO SÁT MƠ TẢ BÀI TỐN.........................................................6
1.1 Khảo sát bài toán...................................................................................................6
1.2. Tổng quan về phát hiện và nhận diện biển báo....................................................8
1.3. Mục tiêu và nhiệm vụ nghiên cứu......................................................................10
1.4. Đối tượng và phạm vi nghiên cứu......................................................................12
1.5. Phương pháp để nghiên cứu bài toán.................................................................14
CHƯƠNG 2: CÁC KIẾN THỨC NỀN TẢNG.........................................................17
2.1 Artificial Intelligence, Machine leaning, deep leaning.......................................17
2.2 Thuật toán YOLO................................................................................................20
2.2.1 Giới thiệu......................................................................................................20
2.2.2 Các phiên bản của YOLO............................................................................23
2.2.3 Kiến trúc.......................................................................................................28
2.3 Lập trình di động.................................................................................................31
CHƯƠNG 3: XÂY DỰNG ỨNG DỤNG TRÊN THIẾT BỊ DI ĐỘNG.................34


3.1 Xây dựng mơ hình..............................................................................................34
3.1.1 Mơi trường huấn luyện.................................................................................34
3.1.2 Chuẩn bị dữ liệu...........................................................................................36
3.1.3 Training model.............................................................................................41
3.1.4 Kết quả.........................................................................................................43
3.2 Xây dựng ứng dụng.............................................................................................46
3.2.1 Lựa chọn framework....................................................................................46


tài: Xây dng ng dng nhn din bin báo giao thơng trên thit b di ng
3.2.2 Phân tích thiết kế hệ thống ứng dụng...........................................................48
3.2.3 Triến khai ứng dụng.....................................................................................48
ĐÁNH GIÁ KẾT QUẢ VÀ HƯỚNG PHÁT TRIỂN..............................................53
1.Đánh giá kết quả của đề tài....................................................................................53
2. Hướng phát triển đề tài..........................................................................................53
DANH MỤC TÀI LIỆU THAM KHẢO...................................................................55


tài: Xây dng ng dng nhn din bin báo giao thông trên thit b di ng

LỜI CẢM ƠN
Chúng em xin gửi lời cảm ơn chân thành và sự tri ân sâu sắc đối với các
thầy cô của trường Đại học Mỏ- Địa chất và đặc biệt là các thầy cô khoa Công
Nghệ Thông Tin của trường đã tạo điều kiện cho chúng em có cơ hội tham gia
vào đề tài NCKH.
Chúng em cũng xin chân thành cảm ơn Thầy Lê Hồng Anh đã nhiệt tình
hướng dẫn chỉ bảo, hỗ trợ chúng em trong quá trình thực hiện đề tài.
Mặc dù đã cố gắng hoàn thành báo cáo trong phạm vi và khả năng cho
phép nhưng chắc chắn sẽ không tránh khỏi những thiết sót. Chúng em rất mong
nhận được sự thơng cảm, góp ý và tận tình chỉ bảo của quý thầy cô và các bạn.


Nghiên cứu khoa học lần thứ 36


tài: Xây dng ng dng nhn din bin báo giao thông trên thit b di ng

LỜI MỞ ĐẦU
Tại Việt Nam, tình trạng an tồn giao thơng đường bộ vẫn cịn diễn biến
phức tạp, số người chết vì tai nạn giao thơng vẫn ở mức cao do tình trạng xâm
phạm các cơng trình giao thơng vẫn cịn xảy ra phổ biến, hạ tầng giao thông
kém, biển báo dày đặc nên gây ra rất nhiều khó khăn cho người tham gia giao
thơng. Cụ thể, năm 2022, Toàn quốc xảy ra 10.316 vụ tai nạn giao thông, làm
chết 5.810 người và bị thương 6.945 người. So với cùng kỳ năm 2019 (khi chưa
có dịch Covid-19), số vụ giảm 35%, số người chết giảm 16,6% và số người bị
thương giảm gần 43%. Tuy nhiên, nếu so với cùng kỳ năm ngối, 2 tiêu chí số
vụ và số người chết tăng tương ứng 2% và 13%, còn số người bị thương giảm
gần 2%. Riêng ùn tắc giao thông xảy ra 75 vụ, giảm 41 vụ so với cùng kỳ năm
ngoái. Các vụ tai nạn dẫn đến chết người xảy ra trên các tuyến quốc lộ có chiều
hướng gia tăng. Theo đánh giá của Bộ Cơng an và các nhà chức năng, nguyên
nhân của những vụ tai nạn giao thông trên chủ yếu do người điều khiển phương
tiện đi sai phần đường, tránh vượt sai quy định, vi phạm tốc độ, chuyển hướng
không quan sát hết biển báo giao thông.
Ở thời đại công nghệ 4.0 ngày nay, trí tuệ nhân tạo (Artificial Intelligence AI) đang trở thành một trong những lĩnh vực phát triển mạnh nhất. Trong đó, AI
nhận diện biến báo giao thơng đóng vai trị quan trọng trong việc giảm thiểu tai
nạn giao thơng và tăng cường an toàn cho những người tham gia giao thơng. Trí
tuệ nhân tạo đang được áp dụng trong việc nhận diện biển báo giao thông tại
Việt Nam nhằm cải thiện tính an tồn và đảm bảo an tồn giao thông. Việc này
đang được triển khai trong một số dự án thử nghiệm và có tiềm năng để được
phát triển rộng rãi trong tương lai. Ứng dụng của trí tuệ nhân tạo trong nhận diện
biển báo giao thơng có thể giúp giảm thiểu các tai nạn giao thông và cải thiện

tính an tồn trên các tuyến đường. Ngồi ra, nó cịn có thể giúp quản lý giao
thơng một cách thông minh hơn, bằng cách tự động cập nhật thông tin về biển
Nghiên cứu khoa học lần thứ 36


tài: Xây dng ng dng nhn din bin báo giao thông trên thit b di ng

báo giao thông và đưa ra các giải pháp phù hợp với tình huống giao thông thực
tế.
Tuy nhiên, để triển khai thành công các hệ thống nhận diện biển báo giao
thơng, cần có sự đầu tư và phát triển hạ tầng công nghệ cũng như đào tạo nhân
lực với kỹ năng và kiến thức về trí tuệ nhân tạo. Việc này địi hỏi sự hợp tác
giữa các đơn vị chức năng và các công ty công nghệ tại Việt Nam để đưa ra các
giải pháp tiên tiến và hiệu quả trong việc giải quyết các vấn đề giao thông trên
địa bàn.
Nghiên cứu về AI nhận diện vật thể giao thơng là một lĩnh vực cịn khá là
mới tại Việt Nam nhưng đầy triển vọng. Nó sử dụng các kỹ thuật học máy và
mơ hình học sâu để phân loại và nhận diện các vật thể giao thơng trong các hình
ảnh hoặc video được chụp từ các camera giám sát hoặc cảm biến trên các
phương tiện giao thông. Ở thời đại công nghệ hiện nay, việc áp dụng trí tuệ nhân
tạo vào giải quyết các vấn đề trong đời sống trở nên ngày càng phổ biến và
mang lại nhiều lợi ích hơn bao giờ hết đặc biệt trong lĩnh vực giao thông đường
bộ, nhận dạng biển báo giao thông bằng mobile app là một ứng dụng rất hữu ích
giúp cho người dùng có thể nhận biết các biển báo trên đường một cách dễ dàng
và thuận tiện.
Trong nghiên cứu này, chúng em tập trung vào việc phát triển một mơ hình
AI nhận diện vật thể giao thơng hiệu quả và chính xác. Chúng em sẽ xem xét các
kỹ thuật tiên tiến nhất trong lĩnh vực này và thử nghiệm chúng trên các bộ dữ
liệu thực tế. Mục tiêu của nghiên cứu này là tạo ra một mơ hình AI có thể nhận
diện biển báo giao thơng được sử dụng để giảm thiểu tai nạn giao thông và nâng

cao chất lượng cuộc sống cho cộng đồng.

Nghiên cứu khoa học lần thứ 36


tài: Xây dng ng dng nhn din bin báo giao thơng trên thit b di ng

CHƯƠNG 1: KHẢO SÁT MƠ TẢ BÀI TỐN
1.1 Khảo sát bài tốn
Nói về giao thơng trên địa bàn nước Việt Nam ta ngày nay, tình trạng ùn
tắc và tai nạn giao thông trên các địa bàn đặc biệt là thành phố lớn luôn được coi
là vấn đề bức thiết.
Việt Nam là một trong những nước có mật độ giao thơng đường bộ cao
nhất thế giới. Tuy nhiên, tình trạng tai nạn giao thơng và vi phạm luật giao thông
tại Việt Nam cũng rất phổ biến. Theo thống kê từ Cục Đăng kiểm Việt Nam,
tính đến tháng 6 năm 2021, số lượng xe cộ tham gia giao thông đường bộ tại
Việt Nam là hơn 48 triệu chiếc, trong đó có hơn 38 triệu xe máy và 10 triệu ô tô
và xe tải. Điều này đặt ra nhiều thách thức trong việc quản lý và duy trì an tồn
giao thơng. Ngồi ra, theo Bộ Giao thơng Vận tải Việt Nam, trong năm 2020,
toàn quốc xảy ra 18.220 vụ tai nạn giao thông, làm chết 8.279 người và bị
thương 14.802 người. Số lượng vụ tai nạn tăng 4,57% so với năm 2019, trong
đó, tai nạn xảy ra trên đường cao tốc chiếm tỷ lệ cao nhất. Các yếu tố gây ra tai
nạn giao thông được xác định bao gồm thiếu tầm nhìn, thiếu thơng tin về biển
báo, nhận thức của người tham gia giao thơng cịn hạn chế, tốc độ, và sự không
tuân thủ luật giao thông. Trong đó, việc khơng tn thủ luật giao thơng được cho
là nguyên nhân chính dẫn đến tai nạn và thương vong. Dữ liệu về tình trạng giao
thơng đường bộ tại Việt Nam cho thấy tình trạng giao thơng ở nước ta đang diễn
ra khá phức tạp và nguy hiểm. Xuất hiện những tình trạng đó khơng thể khơng
kể đến nhận thức của người Việt Nam về biển báo giao thông:
Nhận thức chung: Người Việt Nam có nhận thức tổng quát về tầm quan

trọng của biển báo giao thông và tầm quan trọng của việc tuân thủ quy tắc giao
thông. Hầu hết mọi người hiểu rằng biển báo giao thông được sử dụng để cung
cấp thông tin và quy định để đảm bảo an toàn và trật tự trên đường.

Nghiên cứu khoa học lần thứ 36


tài: Xây dng ng dng nhn din bin báo giao thông trên thit b di ng

Hiểu biết cơ bản về biển báo: Đa số người Việt Nam có kiến thức cơ bản về
một số biển báo giao thông phổ biến như biển cấm, biển hiệu lệnh và biển chỉ
dẫn cơ bản. Họ hiểu ý nghĩa của những biểu tượng và màu sắc được sử dụng
trên biển báo để nhận biết các hạn chế và quy tắc giao thông.
Khả năng nhận diện biển báo: Mặc dù người Việt Nam có một mức độ
nhận diện biển báo tương đối tốt, nhưng có thể xảy ra những trường hợp khơng
nhận diện chính xác một số biển báo đặc biệt hoặc không quen thuộc. Điều này
có thể do sự thiếu hiểu biết hoặc bị mất tập trung khi lái xe.
Cải thiện nhận thức thông qua giáo dục: Các chương trình giáo dục giao
thơng được triển khai trong hệ thống giáo dục Việt Nam nhằm nâng cao nhận
thức và hiểu biết về biển báo giao thơng. Những người tham gia khóa đào tạo lái
xe cũng được học về biển báo và quy tắc giao thông liên quan.
Thách thức về sự thay đổi: Một thách thức cho nhận thức của người Việt
Nam về biển báo giao thông là sự thay đổi liên tục của các biển báo và quy tắc
giao thông. Việc cập nhật và thông báo sự thay đổi này đôi khi không đồng nhất
và có thể gây nhầm lẫn hoặc khơng nhận biết được các biển báo mới.

Hình 1.1 Giao thơng một góc phố tại Hà Nội
Nghiên cứu khoa học lần thứ 36



tài: Xây dng ng dng nhn din bin báo giao thông trên thit b di ng

Thực tế, ngành giao thông vận tải tại Việt Nam đã trải qua nhiều thay đổi
trong những năm vừa qua. Để tạo ra những bước đột phá mang tính cách mạng,
cơng nghệ là yếu tố khơng thể thiếu. Trí tuệ nhân tạo hiện đang là một trong
những công nghệ được ứng dụng hiệu quả hàng đầu hiện nay.
Nhiều nghiên cứu đã chỉ ra tiềm năng phát triển của trí tuệ nhân tạo trong
lĩnh vực giao thơng vận tải với dự báo thị trường tồn cầu sẽ đạt 3.870.000.000
USD vào năm 2026.
Đó là dấu hiệu tích cực cho thấy các công nghệ tiên tiến như AI, Computer
Vision (Thị giác máy tính) và Machine Learning (Máy học) sẽ góp phần quan
trọng trong việc định hình tương lai của ngành giao thông vận tải. Những con
đường thông minh sẽ được tạo ra, mang lại nhiều lợi ích thiết thực cho đời sống
xã hội.
Việc nghiên cứu ra app nhận diện biển báo giao thông giúp người tham gia
giao thông hiểu rõ hơn về biển báo, hỗ trợ người dùng dễ dàng nhận diện biển
báo, nâng cao đồng thời cải thiện giao thông đường bộ nước ta.
1.2. Tổng quan về phát hiện và nhận diện biển báo
Bài toán phát hiện và nhận dạng biển báo giao thông cụ thể gồm qua 2 giai
đoạn: Giai đoạn phát hiện biển báo giao thông và giai đoạn nhận dạng biển báo
giao thông. Trong các phần sau sẽ trình bày cụ thể từng giai đoạn:
1.2.1 Phát hiện biển báo giao thông

Phát hiện biển báo giao thơng là thuật tốn xuất phát từ thuật tốn phát hiện
vật thể, được sử dụng trong các ứng dụng nhận diện và phân tích ảnh. Khi cho
một nguồn ảnh đầu vào (có thể hình ảnh từ camera hoặc từ tệp video định dạng
AVI), thuật toán xác định biển báo giao thơng trong khung hình nhận được đó là
những hình ảnh có phải biển báo giao thơng hay khơng. Nếu có, thuật tốn sẽ
xác định vị trí và phạm vi chiếm chỗ của biển báo giao thơng đó trong ảnh. Điều
Nghiên cứu khoa học lần thứ 36



tài: Xây dng ng dng nhn din bin báo giao thông trên thit b di ng

này rất quan trọng đối với các ứng dụng phân tích vật thể và biển báo giao thơng
nói riêng, vì nó giúp cho hệ thống có thể xác định được biển báo giao thơng
đang được áp dụng tại địa điểm và thời điểm hiện tại.
Để phát hiện biển báo giao thơng, thuật tốn phát hiện vật thể sử dụng các
kỹ thuật xử lý ảnh để tìm kiếm các đặc điểm đặc trưng của biển báo giao thơng,
chẳng hạn như màu sắc, hình dạng và kích thước. Khi đã tìm thấy các đặc điểm
này, thuật tốn sẽ phân loại biển báo giao thông dựa trên các quy tắc và hướng
dẫn được lập trình trước.
Thuật tốn phát hiện biển báo giao thông là một phần quan trọng của các hệ
thống nhận diện và phân tích giao thơng thơng minh, giúp cho người dùng có
thể nhận biết được các biển báo giao thông và nắm được thông tin về các hạn
chế và quy định của giao thơng. Nó cũng có thể được sử dụng để cải thiện an
tồn giao thông và giảm thiểu tai nạn giao thông bằng cách cảnh báo người lái
xe về các biển báo giao thơng quan trọng hoặc các tình huống nguy hiểm trên
đường.
1.2.2 Nhận dạng biển báo giao thông

Biển báo giao thông là phương tiện để thông báo cho người tham gia giao
thông về tình trạng đường, đưa ra những chỉ dẫn, hay cảnh báo giúp người tham
gia giao thông xử lý và đưa ra những hành vi hợp lý, đảm bảo an tồn giao
thơng. Mỗi người tham gia giao thơng địi hỏi phải nắm bắt và hiểu hết toàn bộ ý
nghĩa của tất cả các loại biển báo giao thông. Việc này trở nên khá khó khăn khi
số lượng biển báo quá lớn, dày đặc và không được dán nhãn rõ chi tiết têntên
từng biển báo.
Vì những lý do trên, với mong muốn xây dựng một ứng dụng nhận dạng
biển báo giao thông hỗ trợ cho các phương tiện giao thông thông minh cho phép

người dùng có thể hiểu được tín hiệu của các loại biển báo giao thông này để
đưa ra các cảnh báo thích hợp và có áp dụng hỗ trợ phục vụ cho một số trường
hợp khác.
Nghiên cứu khoa học lần thứ 36


tài: Xây dng ng dng nhn din bin báo giao thơng trên thit b di ng

Chức năng chính cơ bản của ứng dụng là phát hiện, nhận dạng và đưa ra
những cảnh báo hợp lý về các loại biển báo giao thơng. Người dùng có bộ
camera trên xe, chụp hình hoặc qt camera qua khung cảnh có hình biển báo.
Ứng dụng sẽ tự động phát hiện (detect) các khu vực có hình dạng biển báo và
xuất hiện hình ảnh cùng thơng tin biển báo mà ứng dụng nhận ra.

Hình 1.2 - Bài tốn nhận dạng biển báo giao thơng

1.3. Mục tiêu và nhiệm vụ nghiên cứu
1.3.1. Mục tiêu nghiên cứu

Nghiên cứu nhận dạng biển báo giao thông nhằm đạt được mục tiêu tìm
cách để máy tính hoặc các hệ thống tự động có thể nhận dạng và phân loại các
biển báo giao thơng một cách chính xác và nhanh chóng giúp người dùng có thể
nâng cao hiểu biết về biển báo giao thông. Mục tiêu của nghiên cứu này là xây
dựng các thuật tốn và mơ hình máy học để phân loại biển báo giao thông dựa
trên các đặc điểm hình ảnh như hình dạng, màu sắc, kí hiệu,... và nghiên cứu
cách để cải thiện độ chính xác và tốc độ nhận dạng của các thuật tốn và mơ
Nghiên cứu khoa học lần thứ 36


tài: Xây dng ng dng nhn din bin báo giao thơng trên thit b di ng


hình máy học. Nghiên cứu cũng tập trung vào việc tìm kiếm các kỹ thuật mới để
giảm thiểu sự ảnh hưởng của các yếu tố môi trường như ánh sáng mờ, mưa,
tuyết, v.v. đến quá trình nhận dạng và phát triển các ứng dụng thực tế của công
nghệ nhận dạng biển báo giao thông, như hệ thống hỗ trợ lái xe, hệ thống giám
sát tốc độ, hệ thống phát hiện vi phạm giao thông,...
1.3.2. Nhiệm vụ nghiên cứu

Nhiệm vụ của nghiên cứu nhận dạng biển báo giao thông là xác định các
phương pháp và kỹ thuật nhận dạng biển báo giao thơng một cách chính xác và
nhanh chóng. Các nhiệm vụ cụ thể trong lĩnh vực này bao gồm tìm hiểu và đánh
giá các phương pháp phân loại biển báo giao thông dựa trên các đặc điểm hình
ảnh, màu sắc, hình dạng, kí hiệu, v.v. Đồng thời, nghiên cứu cách để cải thiện độ
chính xác và tốc độ nhận dạng của các thuật toán và mơ hình máy học. Cụ thể
như sau:
 Nghiên cứu tổng quan về xử lý ảnh số: Chức năng của nghiên cứu này là
cung cấp kiến thức về xử lý ảnh số cho các nghiên cứu về nhận dạng biển báo
giao thông. Nghiên cứu tổng quan này tập trung vào các kỹ thuật xử lý ảnh số
như lọc, biến đổi, mô hình màu, phân đoạn, v.v. để giúp hiểu rõ hơn về các
phương pháp xử lý ảnh được sử dụng trong các thuật tốn nhận dạng biển báo
giao thơng.
 Nghiên cứu phân tích và tổng hợp các phương pháp nhận dạng, xử lý
hình ảnh biển báo giao thơng tại Việt Nam: Chức năng của nghiên cứu này là
tập trung vào việc phân tích và tổng hợp các phương pháp nhận dạng, xử lý hình
ảnh biển báo giao thơng đã được sử dụng tại Việt Nam. Nghiên cứu này sẽ giúp
hiểu rõ hơn về các phương pháp nhận dạng biển báo giao thơng hiệu quả tại Việt
Nam, từ đó có thể đề xuất các cải tiến hoặc phát triển các phương pháp mới phù
hợp với điều kiện địa phương.
 Nghiên cứu cơ sở lý thuyết về mơ hình Yolov5: Chức năng của nghiên
cứu này là tập trung vào việc phân tích và nghiên cứu cơ sở lý thuyết về mơ hình

Nghiên cứu khoa học lần thứ 36


tài: Xây dng ng dng nhn din bin báo giao thơng trên thit b di ng

Yolov5 - một mơ hình mạng nơ-ron tích chập (CNN) được sử dụng để nhận
dạng đối tượng trong hình ảnh. Nghiên cứu này sẽ giúp hiểu rõ hơn về cách hoạt
động của mơ hình Yolov5, các thành phần cơ bản của mơ hình và cách sử dụng
mơ hình trong việc nhận dạng biển báo giao thông.
 Nhận dạng biển báo giao thông qua mobile app: Chức năng của nghiên
cứu này là phát triển một ứng dụng di động để nhận dạng biển báo giao thông
thông qua camera trên thiết bị di động. Ứng dụng này sẽ sử dụng các phương
pháp và kỹ thuật nhận dạng biển báo giao thông để nhận diện biển báo và hiển
thị thông tin tương ứng cho người dùng. Nghiên cứu này có thể tập trung vào
các vấn đề như cải thiện độ chính xác của thuật tốn nhận dạng, tối ưu hóa thời
gian xử lý, phát triển giao diện người dùng thân thiện và dễ sử dụng, cải thiện
khả năng phân biệt giữa các biển báo tương đồng nhau hoặc có điều kiện ánh
sáng khác nhau, v.v. Ứng dụng di động nhận dạng biển báo giao thơng có thể
giúp tăng cường an tồn giao thơng và giảm nguy cơ tai nạn đường bộ bằng cách
cung cấp thông tin quan trọng về biển báo giao thông cho người dùng trong thời
gian thực.
Bên cạnh đó, nghiên cứu cũng tập trung vào việc phát triển các ứng dụng
thực tế của công nghệ nhận dạng biển báo giao thông, như hệ thống hỗ trợ lái
xe, hệ thống giám sát tốc độ, hệ thống phát hiện vi phạm giao thơng,... để cải
thiện an tồn giao thông và giảm thiểu tai nạn giao thông. Với các nhiệm vụ
trên, nghiên cứu nhận dạng biển báo giao thông đóng vai trị rất quan trọng trong
việc cải thiện hiệu quả và an tồn của giao thơng đường bộ.
1.4. Đối tượng và phạm vi nghiên cứu
1.4.1. Đối tượng nghiên cứu


Thông qua hình ảnh và video cung cấp, ứng dụng sẽ nhận diện biển báo
giao thơng theo trình tự nhất định. Trong q trình nhận diện biển báo giao
thơng, AI thường sử dụng các kỹ thuật xử lý ảnh và trí tuệ nhân tạo để phân tích
Nghiên cứu khoa học lần thứ 36


tài: Xây dng ng dng nhn din bin báo giao thơng trên thit b di ng

và nhận dạng hình ảnh của các biển báo giao thông. Mỗi biển báo sẽ có những
đặc điểm, hình dạng và chức năng riêng do vậy, để nhận diện được biển báo,
ứng dụng phải xử lý hình ảnh của biển báo giao thơng được chuyển đổi sang
định dạng phù hợp để phục vụ cho các bước tiếp theo của quá trình nhận diện,
bao gồm việc giảm nhiễu và cân bằng sáng tối cho ảnh. Tiếp đến là phát hiện
biển báo: sử dụng mơ hình deep learning để phát hiện và tách biển báo giao
thông ra khỏi hình ảnh nền. Sau khi phát hiện được biển báo, ta sử dụng các kỹ
thuật machine learning hoặc deep learning (cụ thể ở đây là mơ hình YoloV5) để
phân loại biển báo vào các loại khác nhau. Cuối cùng, Ứng dụng sẽ đọc nội
dung biển báo: Nếu biển báo có chứa thơng tin văn bản, AI sẽ sử dụng các kỹ
thuật nhận dạng ký tự OCR (optical character recognition) để đọc và trích xuất
nội dung từ các ký tự trên biển báo.
Khi tất cả các bước trên được thực hiện thành công, ứng dụng sẽ cung cấp
cho người dùng thông tin về loại biển báo, nội dung trên biển báo và các hướng
dẫn liên quan đến biển báo đó.
1.4.2. Phạm vi nghiên cứu

Nghiên cứu về nhận dạng biển báo giao thông bằng mobile app là một
chủ đề rất hữu ích trong việc nâng cao nhận thức, hiểu biết của người dùng về
biển báo giao thông. Phạm vi nghiên cứu bao gồm hai khía cạnh chính: lý
thuyết và thực nghiệm. Trong khía cạnh lý thuyết, nghiên cứu sẽ tập trung
vào các phương pháp phát hiện hình ảnh, kỹ thuật nhận dạng và xử lý biển

báo giao thông. Để hiểu được những kỹ thuật này, các nhà nghiên cứu cần
phải tìm hiểu kỹ thuật lập trình với Flutter để xây dựng mobile app trên
Android, hiểu về mơ hình Object Detection YoloV5 và cách xử lý dữ liệu
ảnh.
Về thực nghiệm, phạm vi nghiên cứu còn bao gồm việc áp dụng phương
pháp nhận dạng biển báo giao thông để đưa ra các cảnh báo thích hợp cho
người tham gia giao thơng và có áp dụng hỗ trợ phục vụ cho một số lĩnh vực
Nghiên cứu khoa học lần thứ 36


tài: Xây dng ng dng nhn din bin báo giao thông trên thit b di ng

khác. Các ứng dụng thực tiễn có thể là việc phát hiện vi phạm giao thông, hỗ
trợ tài xế điều khiển phương tiện, tăng cường an tồn giao thơng trong khu đơ
thị và đơi khi cịn được áp dụng trong các lĩnh vực như nơng nghiệp và công
nghiệp. Các nghiên cứu liên quan đến nhận dạng biển báo giao thơng bằng AI
sẽ đóng góp quan trọng vào việc giảm thiểu tai nạn giao thông và tạo ra một
mơi trường giao thơng an tồn hơn cho tất cả mọi người.
Ngoài ra, phương pháp nhận dạng biển báo giao thơng cịn có thể áp
dụng trong nhiều lĩnh vực khác như bảo vệ môi trường, giám sát an ninh…
Ví dụ, mobile app có thể phát hiện biển báo cấm đổ rác và đưa ra cảnh báo để
người dùng biết và hạn chế hành vi đổ rác trái phép, giúp cho việc bảo vệ mơi
trường. Bên cạnh đó, trong lĩnh vực giám sát an ninh, phương pháp nhận
dạng biển báo giao thơng có thể được áp dụng để giám sát và phát hiện các
hành vi vi phạm luật giao thơng, giúp cho việc xử lý nhanh chóng và hiệu quả
hơn.
Vì vậy, phạm vi nghiên cứu của nhận dạng biển báo giao thơng bằng
mobile app là rất rộng, có thể ứng dụng trong nhiều lĩnh vực khác nhau để
đem lại giá trị thực tiễn cho xã hội. Tuy nhiên, để đạt được những kết quả tốt
nhất, việc nghiên cứu phải được thực hiện với đầy đủ các khía cạnh từ lý

thuyết đến thực nghiệm, đồng thời sử dụng các công nghệ và phương pháp
tiên tiến nhất.
1.5. Phương pháp để nghiên cứu bài toán
Để nghiên cứu bài toán nhận dạng biển báo giao thơng bằng mobile app,
chúng ta cần tìm hiểu về cả lý thuyết và lập trình. Để bắt đầu, một trong những
bước đầu tiên là tìm hiểu kỹ thuật lập trình với Flutter. Flutter là một framework
phát triển ứng dụng di động được phát triển bởi Google, cho phép lập trình viên
phát triển các ứng dụng cho cả iOS và Android với một mã nguồn chung. Tìm
hiểu về Flutter cũng giúp chúng ta hiểu được cách hoạt động của mobile app và
cách xây dựng giao diện người dùng trên nền tảng di động.
Nghiên cứu khoa học lần thứ 36


tài: Xây dng ng dng nhn din bin báo giao thơng trên thit b di ng

Ngồi ra, để hiểu được cách xử lý dữ liệu ảnh, chúng ta cần tìm hiểu về
machine learning, deep learning và mơ hình Object Detection YoloV5. YoloV5
là một mơ hình nhận dạng vật thể được phát triển bởi Ultralytics, và là một trong
những mơ hình nhận dạng đối tượng (Object Detection) hiệu quả nhất hiện nay,
cho phép phát hiện và nhận dạng đối tượng trong ảnh hoặc video với độ chính
xác cao. Việc nghiên cứu về YoloV5 sẽ giúp chúng ta hiểu được cách hoạt động
của mơ hình nhận dạng vật thể, cũng như cách để áp dụng mơ hình này vào việc
nhận dạng biển báo giao thông.
Sau khi đã hiểu về cách hoạt động của mơ hình YoloV5, chúng ta cần tìm
hiểu cách xử lý dữ liệu ảnh. Điều này đặc biệt quan trọng đối với bài tốn nhận
dạng biển báo giao thơng bởi vì chúng ta cần xử lý ảnh để tìm ra các biển báo
trong hình ảnh và phân loại chúng. Tìm hiểu cách xử lý dữ liệu ảnh bao gồm các
kỹ thuật tiền xử lý, chuẩn hóa và đưa dữ liệu vào mơ hình nhận dạng.
Về mặt lập trình, chúng ta sử dụng ngôn ngữ Dart để xây dựng mobile app
trên hệ điều hành Android. Dart là ngơn ngữ lập trình được sử dụng trong

framework Flutter. Nó cho phép lập trình viên viết mã nguồn dễ đọc và dễ hiểu,
và cung cấp nhiều tính năng tiện ích như tính năng tự động đóng gói mã nguồn,
khả năng kiểm tra lỗi và cập nhật nhanh chóng. Việc sử dụng Dart sẽ giúp chúng
ta có thể dễ dàng tương tác với các thư viện và các phần mềm hỗ trợ khác trong
quá trình phát triển ứng dụng. Để train model, chúng ta sử dụng ngôn ngữ
Python, một trong những ngôn ngữ phổ biến nhất hiện nay để xử lý dữ liệu khoa
học.
Ngoài ra, để tăng độ chính xác của ứng dụng, ta có thể sử dụng các kỹ thuật
xử lý ảnh như làm sạch ảnh, xoá nhiễu, cân bằng sáng tối và phân ngưỡng. Các
kỹ thuật này giúp loại bỏ các yếu tố nhiễu trong ảnh, từ đó tăng độ chính xác
cho việc nhận dạng biển báo.
Việc tích hợp ứng dụng với GPS cũng là một giải pháp hữu ích để giúp
người dùng nhận biết được các biển báo giao thông cụ thể trong khu vực mình
Nghiên cứu khoa học lần thứ 36


tài: Xây dng ng dng nhn din bin báo giao thông trên thit b di ng

đang di chuyển. Khi ứng dụng phát hiện ra biển báo, nó có thể gửi thông tin tọa
độ và loại biển báo đến server để lưu trữ hoặc phân tích cho những nhu cầu
khác.
Để phát triển và cải tiến ứng dụng, ta có thể sử dụng các kỹ thuật học máy
để cải thiện độ chính xác của việc nhận dạng biển báo. Ví dụ, ta có thể sử dụng
các mơ hình học máy như Convolutional Neural Networks (CNN) để train
model với các bộ dữ liệu biển báo giao thơng. Ngồi ra, ta cũng có thể sử dụng
các thuật toán như Support Vector Machines (SVM), Decision Trees, Random
Forests, và Neural Networks để giải quyết bài toán nhận dạng biển báo.
Sau khi đã xây dựng và huấn luyện mơ hình, sẽ cần tích hợp mơ hình này
vào ứng dụng nhận dạng biển báo giao thông trên mobile app. Khi người dùng
chụp một bức ảnh chứa biển báo giao thông, ứng dụng sẽ tiến hành xử lý ảnh và

nhận diện biển báo giao thơng bằng mơ hình đã được huấn luyện trước đó. Kết
quả nhận dạng được sẽ được hiển thị trên màn hình và ứng dụng cũng có thể
cung cấp thơng tin chi tiết về biển báo đó, giúp người dùng có thể hiểu rõ hơn về
biển báo đó và tn thủ quy định giao thơng.
Tuy nhiên, để đạt được độ chính xác cao, việc cung cấp cho mơ hình học
máy một lượng lớn dữ liệu chất lượng là cần thiết. Do đó, việc xây dựng và sử
dụng các bộ dữ liệu chứa các hình ảnh biển báo giao thông đa dạng là một phần
rất quan trọng trong q trình phát triển ứng dụng.
Tóm lại, để nghiên cứu bài tốn nhận dạng biển báo giao thơng bằng
mobile app, chúng ta cần tìm hiểu về kỹ thuật lập trình với Flutter, mơ hình
Object Detection YoloV5, cũng như các ngơn ngữ lập trình Dart và Python.
Việc nghiên cứu này sẽ giúp chúng ta có thể phát triển được một ứng dụng di
động hiệu quả và tiện lợi để giúp người dùng nhận dạng biển báo giao thông một
cách nhanh chóng và chính xác.

Nghiên cứu khoa học lần thứ 36


tài: Xây dng ng dng nhn din bin báo giao thông trên thit b di ng

CHƯƠNG 2: CÁC KIẾN THỨC NỀN TẢNG
2.1 Artificial Intelligence, Machine leaning, deep leaning.
Trí tuệ nhân tạo bắt đầu vào năm 1950 với sự xuất hiện của các nghiên cứu về lý
thuyết trí tuệ máy và học máy. Ở thời điểm đó, các nhà khoa học đã tìm cách xây dựng
máy tính có thể suy luận và tự học như con người. Trong những năm 1960, các nhà
khoa học đã phát triển ra mơ hình học máy đầu tiên và thực hiện các nghiên cứu về trí
tuệ máy. Đến năm 1970, các nhà khoa học đã phát triển ra thuật toán học máy và thuật
toán học cục bộ.
Vào những năm 1980 và 1990, AI đã tiến hành nhiều bước tiến trong việc phát
triển các thuật toán học máy nâng cao, như thuật toán học sự kiện và thuật tốn học

máy deep learning. Đồng thời cơng nghệ máy tính và internet cũng phát triển rất mạnh
mẽ, giúp cho việc phát triển AI trở nên dễ dàng hơn.
Trí tuệ nhân tạo (Artificial Intelligence - AI) là lĩnh vực nghiên cứu và phát triển
các máy tính hoặc hệ thống máy tính có khả năng thực hiện các nhiệm vụ mà trước
đây chỉ có con người mới có thể thực hiện. Mục tiêu của trí tuệ nhân tạo là tạo ra các
hệ thống thơng minh, có khả năng học hỏi, lý luận, giải quyết vấn đề, nhận biết và
tương tác với mơi trường xung quanh.
Có hai loại chính của trí tuệ nhân tạo:
 Trí tuệ nhân tạo yếu (Weak AI): Đây là hệ thống AI được thiết kế để thực
hiện một tác vụ cụ thể và hạn chế trong phạm vi của tác vụ đó. Ví dụ điển
hình của trí tuệ nhân tạo yếu là trợ lý ảo, hệ thống tự động lái xe, hoặc hệ
thống phân loại email rác.
 Trí tuệ nhân tạo mạnh (Strong AI): Đây là mục tiêu cuối cùng của trí tuệ
nhân tạo, là khả năng tạo ra một hệ thống thông minh như con người, có thể
tự động học và giải quyết các vấn đề phức tạp, nhưng không chỉ giới hạn
trong một tác vụ cụ thể. Tuy nhiên, trí tuệ nhân tạo mạnh vẫn đang trong
giai đoạn nghiên cứu và phát triển và chưa được đạt đến mức độ này.

Nghiên cứu khoa học lần thứ 36


tài: Xây dng ng dng nhn din bin báo giao thông trên thit b di ng
Machine learning là một lĩnh vực của trí tuệ nhân tạo (AI) tập trung vào việc phát
triển các mơ hình và thuật tốn để giúp máy tính có thể học hỏi và cải thiện kết quả dự
đoán hoặc hành động dựa trên dữ liệu đầu vào.

Hình 2.3. Machine learning
Các mơ hình máy học có thể được huấn luyện trên các tập dữ liệu để học các mối
quan hệ và đặc trưng giữa các thuộc tính của dữ liệu. Sau đó, chúng có thể sử dụng các
mơ hình đó để dự đốn các giá trị mới hoặc phân loại các dữ liệu mới.

Các ứng dụng của máy học rất đa dạng và phổ biến trong nhiều lĩnh vực, từ nhận
dạng giọng nói, nhận dạng hình ảnh, phân tích dữ liệu y tế, phân tích tài chính đến dự
báo thời tiết. Các công ty và tổ chức đang tìm cách sử dụng machine learning để cải
thiện các sản phẩm và dịch vụ của mình, tăng hiệu suất và đưa ra quyết định thông
minh hơn.
Deep learning là một phương pháp học máy sử dụng các mạng nơ-ron sâu với
nhiều lớp để xử lý và phân tích dữ liệu phức tạp. Nó tập trung vào việc học các biểu
diễn đại diện của dữ liệu trong một kiến trúc mạng nơ-ron sâu để giải quyết các vấn đề
như phân loại, nhận dạng hình ảnh, xử lý ngơn ngữ tự nhiên, và nhiều ứng dụng khác.

Nghiên cứu khoa học lần thứ 36


tài: Xây dng ng dng nhn din bin báo giao thông trên thit b di ng
Các mạng nơ-ron sâu được xây dựng từ các lớp kết nối liên kết các nơ-ron, mỗi
lớp đại diện cho một tầng khác nhau của trừu tượng hóa dữ liệu. Dữ liệu được đưa qua
mạng qua các lớp và được xử lý dần dần để cho ra các kết quả tốt hơn.
Deep learning được coi là một trong những công nghệ tiên tiến nhất trong học
máy hiện nay và đã giúp đạt được nhiều kết quả đáng chú ý trong nhiều lĩnh vực. Ví
dụ, các ứng dụng nhận dạng hình ảnh sử dụng deep learning đã đạt độ chính xác cao
hơn so với các phương pháp truyền thống trước đây. Ngoài ra, deep learning cũng
được áp dụng trong các lĩnh vực như xử lý ngôn ngữ tự nhiên, robot học, và các ứng
dụng trong y học.

Phát hiện đối tượng trong thị giác máy tính có thể hiểu là cách xác định đối
tượng trong một hình ảnh và sau đó ước tính chính xác vị trí của nó. Ngày nay,
ứng dụng về phát hiện đối tượng được sử dụng ở khắp mọi nơi. Các trường hợp
sử dụng có thể là theo dõi đối tượng, giám sát video, phát hiện bất thường, ô tô
tự lái hoặc nhận diện khn mặt, v.v. Dưới đây sẽ trình bày 2 về ba thuật tốn
phát hiện đối tượng chính hiện đang được sử dụng trong ngành:

(1) Region-based Convolutional Neural Networks (R-CNN): R-CNN
đầu tiên xác định một số vùng quan tâm, và sau đó sử dụng CNN để phân loại
các vùng đó nhằm phát hiện các đối tượng trong đó. Bản gốc của R-CNN ban
đầu là chậm nên có một số biến thể nhanh hơn đã được phát triển như: Fast RCNN, Faster R-CNN và Mask R-CNN. Trong R-CNN, hình ảnh đầu tiên được
chia thành khoảng 2000 vùng đề xuất và sau đó CNN (ConvNet) được áp dụng
cho từng vùng tương ứng. Vấn đề lớn nhất của phương pháp này là thời gian. Vì
mỗi khu vực trong hình được áp dụng CNN riêng biệt, thời gian đào tạo là
khoảng 84 giờ và thời gian dự đoán là khoảng 47 giây.
(2) Single Shot MultiBox Detector (SSD): SSD là một thuật toán phổ biến
trong việc phát hiện đối tượng. Nó thường nhanh hơn Faster R-CNN. SSD tùy
biến không gian đầu ra của các hộp giới hạn thành một tập hợp các hộp mặc
định theo các tỷ lệ khung hình và tỷ lệ khác nhau cho mỗi vị trí bản đồ đối
Nghiên cứu khoa học lần thứ 36


tài: Xây dng ng dng nhn din bin báo giao thông trên thit b di ng

tượng. Tại thời điểm dự đoán, mạng tạo ra điểm số cho sự hiện diện của từng
loại đối tượng trong mỗi hộp mặc định và tạo ra các điều chỉnh đối với hộp để
phù hợp hơn với hình dạng đối tượng. Ngồi ra, mạng kết hợp các dự đoán từ
nhiều bản đồ đối tượng với các độ phân giải khác nhau để xử lý các đối tượng có
kích thước khác nhau một cách tự nhiên [5].
(3) You Only Look Once (YOLO): YOLO hoặc You Only Look Once là
một thuật toán phát hiện đối tượng khác nhiều so với các thuật toán dựa trên khu
vực đã thấy ở trên. Như tên cho thấy, thuật toán chỉ yêu cầu một lần truyền
chuyển tiếp duy nhất qua mạng nơ-ron để phát hiện các đối tượng. Trong
YOLO, một mạng tích chập đơn dự đốn các hộp giới hạn và xác suất lớp cho
các hộp này. Chiến lược được YOLO sử dụng hoàn toàn khác với các hệ thống
phát hiện trước đó. Một mạng nơ-ron duy nhất được áp dụng cho tồn bộ hình
ảnh. Mạng này chia hình ảnh thành các khu vực và tính tốn các hộp giới hạn

cho từng khu vực và xác suất. Các hộp giới hạn đó được tính theo xác suất dự
đốn.
Trong nghiên cứu này, YOLO được lựa chọn sử dụng vì một số lí do như:
YOLO đề xuất việc sử dụng mạng nơ-ron end-to-end đưa ra dự đoán các hộp
giới hạn và xác suất lớp cùng một lúc. Trong khi các thuật toán như Faster
RCNN hoạt động bằng cách phát hiện các khu vực quan tâm bằng cách sử dụng
Mạng đề xuất khu vực và sau đó thực hiện nhận dạng riêng trên các khu vực đó,
YOLO thực hiện tất cả các dự đốn của mình với một lớp full-connected. Do đó,
các phương pháp sử dụng Mạng đề xuất khu vực sẽ thực hiện nhiều lần lặp lại
cho cùng một hình ảnh, trong khi YOLO chỉ sử dụng một lần lặp duy nhất. Một
ưu điểm tiếp theo của YOLO đó là nó hoạt động nhanh hơn 1000 lần so với RCNN và nhanh hơn 100 lần so với Fast R-CNN

Nghiên cứu khoa học lần thứ 36


tài: Xây dng ng dng nhn din bin báo giao thơng trên thit b di ng

2.2 Thuật tốn YOLO
2.2.1 Giới thiệu
Một trong những lĩnh vực quan trọng của Trí tuệ nhân tạo (Artificial
Intelligence) là thị giác máy (Computer Vision). Computer Vision là một lĩnh
vực bao gồm các phương pháp thu nhận, xử lý ảnh kỹ thuật số, phân tích và
nhận dạng các hình ảnh, phát hiện các đối tượng, tạo ảnh, siêu phân giải hình
ảnh và nhiều hơn vậy. Object Detection có lẽ là khía cạnh sâu sắc nhất của thị
giác máy do số lần sử dụng trong thực tế.

Hình 2.4 Ảnh detection các class
Object Detection đề cập đến khả năng của hệ thống máy tính và phần
mềm để định vị các đối tượng trong một hình ảnh và xác định từng đối tượng.
Object Detection đã được sử dụng rộng rãi để phát hiện khuôn mặt, phát hiện xe,

đếm số người đi bộ, hệ thống bảo mật và xe không người lái. Có nhiều cách để
nhận diện đối tượng có thể được sử dụng cũng như trong nhiều lĩnh vực thực
hành. Giống như mọi công nghệ khác, một loạt các ứng dụng sáng tạo và tuyệt
vời của Object Detection sẽ đến từ các lập trình viên và các nhà phát triển phần
mềm.
Nghiên cứu khoa học lần thứ 36


tài: Xây dng ng dng nhn din bin báo giao thông trên thit b di ng

Bắt đầu sử dụng các phương pháp nhận diện đối tượng hiện đại trong các
ứng dụng và hệ thống, cũng như xây dựng các ứng dụng mới dựa trên các
phương pháp này.Việc triển nhận diện đối tượng sớm liên quan đến việc sử
dụng các thuật toán cổ điển, giống như các thuật toán được hỗ trợ trong
OpenCV, thư viện computer vision phổ biến. Tuy nhiên, các thuật tốn cổ điển
này khơng thể đạt được hiệu suất đủ để làm việc trong các điều kiện khác nhau.
Việc áp dụng đột phát và nhanh cóng của deep learning vào năm 2012 đã
đưa vào sự tồn tại các thuật toán và phương pháp phát hiện đối tượng hiện đại và
chính xác cao như R-CNN, Fast-RCNN, Faster-RCNN, RetinaNet và nhanh hơn
nhưng rất chính xác như SSD và YOLO. Sử dụng các phương pháp và thuật
toán này, dựa trên deep learning và cũng dựa trên việc học máy đòi hỏi rất nhiều
kiến thức về toán học và việc học sâu. Có hàng triệu chun gia lập trình và các
nhà phát triển phần mềm muốn tích hợp và tạo ra các sản phẩm mới sử dụng
object detection. Nhưng công nghệ này xa tầm tay của họ và phức tạp để hiểu và
sử dụng thực tế của nó.
ImageAI, một thư viện python cho phép các lập trình viên và các nhà phát
triển phần mềm dễ dàng tích hợp các cơng nghệ thị giác máy hiện đại vào các
ứng dụng hiện có và mới của họ, và chỉ cần sử dụng một vài dịng mã. ImageAI
hỗ trợ một danh sách các thuật tốn học máy hiện đại nhất cho việc dự đốn
hình ảnh,, nhận diện vật thể, phát diện video,...

*Thuật toán Object Detection được chia thành 2 nhóm chính:
 Họ các mơ hình RCNN ( Region-Based Convolutional Neural Networks)
để giải quyết các bài toán về định vị và nhận diện vật thể.
 Họ các mơ hình về YOLO (You Only Look Once) dùng để nhận dạng đối
tượng được thiết kế để nhận diện các vật thể real-time
YOLO (You Only Look Once) là một thuật toán phát hiện đối tượng
(object detection) trong lĩnh vực thị giác máy tính và trí tuệ nhân tạo. Được giới
Nghiên cứu khoa học lần thứ 36


tài: Xây dng ng dng nhn din bin báo giao thông trên thit b di ng

thiệu lần đầu vào năm 2016 bởi Joseph Redmon et al., YOLO đã nhanh chóng
trở thành một trong những công cụ phổ biến nhất trong cộng đồng nghiên cứu và
ứng dụng thực tiễn, với khả năng phát hiện đối tượng trong thời gian thực với độ
chính xác cao.
YOLO khác biệt so với các phương pháp phát hiện đối tượng truyền thống
bởi cách tiếp cận "one-shot", tức là việc phát hiện và phân loại đối tượng được
thực hiện trong một bước duy nhất, thay vì phải áp dụng nhiều lần các mơ hình
phân loại riêng biệt. Điều này giúp YOLO đạt được tốc độ phát hiện rất nhanh,
thường với tốc độ lên đến vài chục khung hình mỗi giây, phù hợp cho các ứng
dụng thời gian thực như xe tự hành, giám sát an ninh, nhận dạng hình ảnh trên
video, v.v.
Một đặc điểm nổi bật của YOLO là khả năng phát hiện đa lớp đối tượng
trong cùng một bức ảnh. YOLO có thể phát hiện và định vị các đối tượng thuộc
nhiều lớp khác nhau, ví dụ như người, ơ tơ, chó, mèo, v.v., trong cùng một bức
ảnh, giúp tăng tính đa dụng và khả năng ứng dụng cho nhiều tác vụ khác nhau.
YOLO sử dụng mạng neural tích chập (convolutional neural network CNN) để học cách phát hiện đối tượng. Kiến trúc mạng của YOLO gồm nhiều
lớp tích chập và lớp liên kết (fully connected layers), cho phép học cách trích
xuất đặc trưng từ hình ảnh và dự đoán định vị và phân loại của các đối tượng.

Mỗi một đầu ra của mạng YOLO đại diện cho một ơ lưới trong hình ảnh, và
chứa thơng tin về các hộp giới hạn (bounding boxes) và xác suất phân loại của
các đối tượng được phát hiện.
2.2.2 Các phiên bản của YOLO
Có nhiều phiên bản của YOLO đã được phát triển và cải tiến trong những
năm gần đây, bao gồm YOLO v1, YOLO v2, YOLO v3, YOLO v4, YOLO v5,
YOLO v6, YOLO v7 và phiên bản mới nhất là YOLO v8. Mỗi phiên bản đều
cải tiến và nâng cao độ chính xác và tốc độ phát hiện của thuật toán.
Nghiên cứu khoa học lần thứ 36


tài: Xây dng ng dng nhn din bin báo giao thông trên thit b di ng

Một trong những điểm mạnh của YOLO là khả năng hoạt động trên các đối
tượng nhỏ và đa dạng trong hình ảnh. YOLO có thể phát hiện các đối tượng nhỏ
kích thước chỉ vài pixel, ví dụ như các đối tượng nhỏ trong ảnh xám hoặc ảnh
đen trắng, đồng thời vẫn đạt được độ chính xác cao. Điều này làm cho YOLO
trở thành lựa chọn hàng đầu cho các ứng dụng yêu cầu phát hiện đối tượng chi
tiết và nhỏ gọn.
Ngoài ra, YOLO cũng hỗ trợ phát hiện đối tượng trong môi trường thực tế
và khắc phục được các vấn đề gặp phải như đối tượng bị che khuất, đối tượng di
chuyển nhanh, và thay đổi ánh sáng, giúp đảm bảo tính ổn định và đáng tin cậy
của thuật toán trong các ứng dụng thực tế.
Tuy nhiên, YOLO cũng cịn một số hạn chế. Vì việc phát hiện đối tượng
được thực hiện trong một bước duy nhất, YOLO có thể gặp khó khăn trong việc
phát hiện các đối tượng có kích thước nhỏ hoặc bị che khuất. Đồng thời, YOLO
cũng có thể gây ra nhầm lẫn trong việc phân loại đối tượng, đặc biệt là đối với
các đối tượng có đặc trưng tương tự hoặc gần nhau.
Tuy nhiên, với những ưu điểm vượt trội về tốc độ, tính đa dụng, và khả
năng hoạt động trên các đối tượng nhỏ và đa dạng, YOLO vẫn là một trong

những thuật toán phát hiện đối tượng hàng đầu được sử dụng rộng rãi trong các
ứng dụng thực tiễn, từ xe tự hành, giám sát an ninh, nhận dạng hình ảnh trên
video, đến cơng nghiệp, y tế, giao thơng, và nhiều lĩnh vực ứng dụng khác.
Ở nghiên cứu này chúng mình đã chọn Yolo v5 được giới thiệu vào năm
2020 bởi đội ngũ phát triển của Ultralytics dểddaof tạo mơ hình. YOLO v5 đã
được cải tiến đáng kể so với các phiên bản trước đó, với mục tiêu tăng cường độ
chính xác và tốc độ phát hiện trong ứng dụng thời gian thực.
Một trong những cải tiến chính của YOLO v5 là kiến trúc mạng neural.
YOLO v5 sử dụng một mạng neural dựa trên ResNet, có kiến trúc đơn giản hơn
so với các phiên bản trước đó, giúp giảm bớt khối lượng tính tốn và nâng cao
tốc độ phát hiện. Đồng thời, YOLO v5 cũng tích hợp các kỹ thuật như PANet
Nghiên cứu khoa học lần thứ 36


×