Tải bản đầy đủ (.docx) (131 trang)

Luận văn nghiên cứu ứng dụng kỹ thuật máy học để phân tích hình ảnh và nhận dạng phương tiện về hành vi vi phạm luật giao thông đường bộ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (4.21 MB, 131 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ' ĐẠI HỌC BÀ RỊA - VŨNG TÀU

BARIA VUNGTAU
UNIVERSITY
CAP SAINT IACQUES

ĐỖ HỮU HIỀN
NGHIÊN CỨU ỨNG DỤNG KỸ THUẬT MÁY HỌC ĐỂ PHÂN
TÍCH HÌNH ẢNH VÀ NHẬN DẠNG PHƯƠNG TIỆN VỀ HÀNH
VI VI PHẠM LUẬT GIAO THƠNG ĐƯỜNG BỘ
•••

LUẬN VĂN THẠC SỸ CƠNG NGHỆ THƠNG TIN
•••

Bà Rịa - Vũng Tàu, tháng 4 năm 2021
BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC BÀ RỊA - VŨNG TÀU


BARIA VUNGTAƯ
UHIVEIHITN
C S
J
AP

AINT


ACQUES

NGHIÊN CỨU ỨNG DỤNG KỸ THUẬT MÁY HỌC ĐỂ PHÂN
TÍCH HÌNH ẢNH VÀ NHẬN DẠNG PHƯƠNG TIỆN VỀ HÀNH
VI VI PHẠM LUẬT GIAO THÔNG ĐƯỜNG BỘ

LUẬN VĂN THẠC SỸ
Chuyên ngành: Công nghệ thông tin
Mã số ngành: 8480201
CÁN BỘ HƯỚNG DẪN KHOA HỌC
TS. PHAN NGỌC HOÀNG

Bà Rịa - Vũng Tàu, tháng 4 năm 2021

LỜI CAM ĐOAN
Tôi xin cam đoan đây là cơng trình nghiên cứu của riêng tơi dưới sự hướng dẫn

2


của TS. Phan Ngọc Hoàng. Các số liệu, kết quả nêu và trình bày trong Luận văn là trung
thực và chưa từng được ai công bố trong bất kỳ công trình nào khác.
Qua đây, tơi cũng xin cam đoan rằng trong thời gian hồn thành Luận văn tơi đã
được một vài đồng nghiệp hỗ trợ, giúp đỡ để hoàn thành đến thời điểm này và cũng đã
được tôi chân thành cảm ơn. Các thơng tin trích dẫn trong Luận văn đã được chỉ rõ nguồn
gốc.
Học viên thực hiện Luận văn
Đỗ Hữu Hiền

3



LỜI CẢM ƠN
Trước tiên, tôi xin chân thành gửi lời tri ân sâu sắc đến Ban giám hiệu Trường Đại
học Bà Rịa - Vũng Tàu, Ban lãnh đạo Viện Đào tạo Quốc tế và Sau đại học, cùng quý
thầy, quý cô thuộc khoa Công nghệ Thông tin - Trường Đại học Bà Rịa - Vũng Tàu đã
tận tình quan tâm hỗ trợ, khuyến khích, truyền đạt cho tơi nhiều kiến thức quý báu và đã
tạo mọi điều kiện thuận lợi trong suốt quá trình học tập và nghiên cứu tại Trường.
Tơi xin tỏ lịng biết ơn sâu sắc đến thầy TS. Phan Ngọc Hoàng, người đã quan
tâm, trách nhiệm, tận tình giúp đỡ và truyền đạt nhiều kinh nghiệm để tơi sớm có thể
thực hiện và hồn thành được đề tài.
Xin chân thành ghi ơn người thân trong gia đình, đồng nghiệp trong cơ quan, đơn
vị và các bạn đã thơng cảm, tận tình, giúp đỡ, hỗ trợ và động viên tơi rất nhiều trong q
trình thực hiện đề tài.
Một lần nữa, tôi thành thật xin chân thành cảm ơn!
Học viên thực hiện Luận văn

Đỗ Hữu Hiền


MỤC LỤC
1.1............................................................................................................................
2. Kỹ thuật áp dụng cho phát hiện, nhận dạng đối tượng [16-17, 21-23, 2627] ....49
2.1.

Kỹ thuật phát hiện đối tượng kết hợp nhận dạng khuôn mặt (Viola Jones Haar)

.........................................................................................................................................49
2.2.


Kỹ thuật biến đổi đặc trưng bất biến theo tỷ lệ (Scale-invariant feature
transform -


DANH MỤC CÁC TỪ VIẾT TẮT
STT

Từ viết tắt

Từ đầy đủ

1

AI

Artificial Intelligence

2
3

AR

Augmented Reality

ANN

Artificial Neural Network

4


BBF

Best Bin First

5

CNN

Convolutional Neural Network

6
7

CV

Cross Validation

ICT

Information and Communication Technology

8
9

ITS

Intelligent Transport Systems

KNN


K-Nearest Neighbors

10

MAE

Mean Absolute Error

11

MAP

Maximum A Posteriori

12
13

ML

Machine Learning

DL

Deep Learning

14

MLE

Maximum Likelihood Estimation


15

MSE

Mean Square Error

16
17

RF

Random Forest

RPN

Region Proposal Network

18
19

SMAC

Social, Mobile, Analytics & Cloud

SVM

Support Vector Machine

20


VR

Virtual Reality

21

YOLO

You Only Look Once

22
23

CNTT

Công nghệ thông tin

SXTN

Sản xuất thử nghiệm

DANH MỤC CÁC HÌNH

Hình 57: Kết quả nhận dạng đối tượng tham gia giao thông được gán nhãn (tracking)
......................................................................................115Error! Bookmark not defined.


DANH MỤC BẢNG




1. GIỚI THIỆU
1.1.

Đặt vấn đề

Ngày nay, công nghệ thông tin là một trong những lĩnh vực quan trọng góp phần
thúc đẩy sự phát triển kinh tế của đất nước. Ứng dụng của công nghệ thông tin (CNTT)
xuất hiện ở rất nhiều lĩnh vực, là nền tảng của các nghiên cứu về công nghệ cao như khoa
học vũ trụ, công nghệ điện tử và tự động hóa, các hệ thống thơng minh,... Khi Internet ra
đời vào những năm 90, nó đã kết nối thơng tin trên tồn thế giới lại với nhau. Chúng ta
chỉ cần ngồi bất cứ nơi đâu với máy tính được kết nối mạng là có thể truy nhập thơng tin
về bất cứ lĩnh vực gì trên thế giới.
Tại Việt Nam, từ những năm 70 của thế kỷ 20 đã bắt đầu có các nghiên cứu về
máy tính cũng như những ứng dụng về CNTT. Hiện nay CNTT luôn được xác định là
lĩnh vực then chốt được đầu tư khơng những hiện đại hóa cơ sở hạ tầng mà còn là việc
ứng dụng sâu rộng vào các lĩnh vực khác của đời sống xã hội [1].
Nghị quyết số 36-NQ/TW ngày 01/7/2014 của Bộ Chính trị về đẩy mạnh ứng
dụng, phát triển CNTT đáp ứng yêu cầu phát triển bền vững và hội nhập quốc tế tiếp tục
khẳng định sự quan tâm chỉ đạo sát sao của Đảng đối với công tác ứng dụng, phát triển
CNTT, khẳng định vị trí, vai trị của CNTT trong sự nghiệp xây dựng và bảo vệ Tổ quốc
thời kỳ mới. Và là một văn bản rất quan trọng, là định hướng xuyên suốt cho chiến lược
ứng dụng và phát triển CNTT và truyền thông từ nay đến năm 2030, là tiền đề quan trọng
để CNTT Việt Nam phát triển mạnh mẽ, sâu rộng hơn, đề ra những định hướng lớn cho
sự phát triển ngành CNTT nước nhà trong khoảng 10 - 20 năm tới. Đến năm 2030, đưa
năng lực nghiên cứu, ứng dụng, phát triển, sản xuất và cung ứng sản phẩm, dịch vụ
CNTT đạt trình độ tiên tiến thế giới; Việt Nam trở thành quốc gia mạnh về CNTT trong
khu vực.
Ngày 27/09/2019 Bộ Chính trị ban hành Nghị quyết số 52-NQ/TW về một số chủ

trương, chính sách chủ động tham gia cuộc Cách mạng công nghiệp lần thứ tư (CMCN
4.0) với quan điểm chủ động, tích cực tham gia cuộc Cách mạng công nghiệp lần thứ tư
là yêu cầu tất yếu khách quan; là nhiệm vụ có ý nghĩa chiến lược đặc biệt quan trọng, vừa
cấp bách vừa lâu dài của cả hệ thống chính trị và tồn xã hội, gắn chặt với quá trình hội
nhập quốc tế sâu rộng; đồng thời nhận thức đầy đủ, đúng đắn về nội hàm, bản chất của
cuộc Cách mạng công nghiệp lần thứ tư để quyết tâm đổi mới tư duy và hành động, coi
đó là giải pháp đột phá với bước đi và lộ trình phù hợp là cơ hội để Việt Nam bứt phá


trong phát triển kinh tế - xã hội. Xác định mục tiêu đến năm 2030, Việt Nam chúng ta
duy trì xếp hạng về chỉ số Đổi mới sáng tạo toàn cầu (GII) thuộc nhóm 40 nước dẫn đầu
thế giới. Mạng di động 5G phủ sóng tồn quốc; mọi người dân được truy cập Internet
băng thơng rộng với chi phí thấp. Kinh tế số chiếm trên 30% GDP; năng suất lao động
tăng bình qn khoảng 7,5%/năm. Hồn thành xây dựng Chính phủ số. Hình thành một
số chuỗi đơ thị thơng minh tại các khu vực kinh tế trọng điểm phía Bắc, phía Nam và
miền Trung; từng bước kết nối với mạng lưới đô thị thông minh trong khu vực và thế giới
và tầm nhìn đến năm 2045, Việt Nam trở thành một trong những trung tâm sản xuất và
dịch vụ thông minh, trung tâm khởi nghiệp, đổi mới sáng tạo thuộc nhóm dẫn đầu khu
vực Châu Á; có năng suất lao động cao, có đủ năng lực làm chủ và áp dụng công nghệ
hiện đại trong tất cả các lĩnh vực kinh tế - xã hội, mơi trường, quốc phịng, an ninh [2-3].
Bản chất của cuộc cách mạng công nghiệp lần thứ tư (CMCN 4.0) là cuộc cách
mạng thể chế. Với sự phát triển mạnh mẽ của công nghệ số tạo ra mơ hình mới, lực lượng
lao động mới, nhanh chóng, bùng nổ... khiến khuôn khổ thể chế truyền thống không cịn
phù hợp, mà nếu duy trì sẽ kìm hãm sự phát triển của đất nước và ngày 04/7/2017, Thủ
tướng chính phủ Ban hành Chỉ thị số 16/CT-TTg về tăng cường năng lực tiếp cận cuộc
cách mạng công nghiệp lần thứ 4. Trên cở sở đó, ngày 03/12/2018 Bộ Khoa học và Công
nghệ ban hành Quyết định số 3685/QĐ-BKHCN về danh mục các cơng nghệ chủ chốt
của cơng nghiệp 4.0 (Trí tuệ nhân tạo - Artificial Intelligence, Chuỗi khối- Blockchain,
Dữ liệu lớn - Big Data, Khai phá dữ liệu và Phân tích dữ liệu - Data Mining and Data
Analytics, Internet vạn vật- Internet of Things, Điện toán đám mây- Cloud computing,

Robot tự hành - Autonomous Robots, Robot cộng tác Collaborative robotics, In 3D và
chế tạo cộng - 3D printing and Additive manufacturing, Thực tại ảo - Virtual Reality,
Công nghệ chế tạo vật liệu nano - Nano materials, Công nghệ vật liệu mới - New
material technnology, Sinh học tổng hợp - Synthetic biology, Mạng di động thế hệ 5 - 5th
Generation Mobile Network, ...).
Đặc biệt, cuộc cách mạng công nghiệp lần thư 4 có nhiều tác động đến đời sống
kinh tế - xã hội trên nhiều lĩnh vực. Nền kinh tế toàn cầu đang đứng trước một giai đoạn
chuyển đổi không thể đảo ngược. Cuộc cách mạng này thông qua các công nghệ như trí
tuệ nhân tạo (AI), Internet vạn vật (IoT), thực tế ảo (VR), tương tác thực tại ảo (AR),
mạng xã hội, điện tốn đám mây, di động, phân tích dữ liệu lớn (SMAC)... để chuyển hóa
tồn bộ thế giới thực thành thế giới số.
Các công nghệ thông minh sẽ được tích hợp vào mọi khía cạnh của xã hội, xóa bỏ


các ranh giới cơng nghệ thơng thường, thay đổi hình dạng mạng lưới công nghệ và sản
xuất, thúc đẩy sự phát triển của thời đại. Những phát triển này hứa hẹn sẽ mở ra cơ hội
cho Chính phủ, vùng miền các quốc gia thúc đẩy nền kinh tế mở, linh hoạt, nâng cao hiệu
quả của nền kinh tế - xã hội và mang lại lợi thế “đi đầu” cho những quốc gia, vùng miền
tận dụng tốt các công nghệ mới nhất. Cách mạng công nghiệp lần thứ 4 dựa trên nền tảng
cơng nghệ số và tích hợp tất cả các cơng nghệ thơng minh để tối ưu hóa quy trình,
phương thức sản xuất; với những công nghệ đang và sẽ có tác động lớn như (Trí tuệ nhân
tạo - Artificial Intelligence, Chuỗi khối- Blockchain, Dữ liệu lớn - Big Data, Khai phá dữ
liệu và Phân tích dữ liệu - Data Mining and Data Analytics, Internet vạn vật- Internet of
Things, Điện toán đám mây- Cloud computing, Robot tự hành - Autonomous Robots,...
Trong lĩnh vực sản xuất công nghiệp, viễn cảnh các nhà máy thơng minh trong đó các
máy móc được kết nối Internet và liên kết với nhau qua một hệ thống có thể tự hình dung
tồn bộ quy trình sản xuất rồi đưa ra quyết định sẽ khơng cịn xa. Có thể thấy, Cách mạng
cơng nghiệp lần thứ 4 tác động đến tất cả các lĩnh vực kinh tế - xã hội như: cơng nghiệp,
nơng nghiệp, tài chính ngân hàng, lao động, việc làm, giao thông vận tải, dệt may, du
lịch, y tế, giáo dục và đào tạo. Điều đó có nghĩa nó sẽ ảnh hưởng trực tiếp đến các tổ

chức, cá nhân và các địa phương trong cả nước [4-5].
Theo các nhà nghiên cứu, ứng dụng trí tuệ nhân tạo được huấn luyện tốt có thể
thực hiện một số công việc với kỹ năng tương đương như con người. Tuy nhiên, trí tuệ
nhân tạo có lợi thế hơn con người nhờ khả năng mở rộng bằng việc học liên tục khơng
nghỉ, thậm chí là tự học mà khơng cần sự hướng dẫn của con người. Trí tuệ nhân tạo có
thể phát hiện ra mẫu trong những dữ liệu phức tạp đến mức các chuyên gia cũng không
nhận ra. Trong đó, đối với một số ứng dụng đặc thù như xử lý hình ảnh, trí tuệ nhân tạo
đã bằng hoặc vượt khả năng của con người. Chính vì lẽ đó, khi được ứng dụng vào q
trình điều tiết giao thơng, trí tuệ nhân tạo sẽ giúp giảm bớt nhân cơng nhưng lại tăng
cường khả năng xử lý dữ liệu của hệ thống.
Vì vậy có thể nói, trí tuệ nhân tạo (Artificial Intelligence - AI) là một hướng
nghiên cứu của lĩnh vực CNTT và Khoa học máy tính nhằm phát triển các hệ thống thơng
minh để giải quyết các bài tốn trong thực tế giống như hoạt động của bộ não người. Trí
tuệ nhân tạo được bắt đầu nghiên cứu từ những năm 50 của thế kỷ 20 và trong khoảng 30
năm trở lại đây đã được cộng đồng các nhà khoa học quan tâm mạnh mẽ. Rất nhiều các
hội thảo lớn về lĩnh vực này được tổ chức hàng năm trên thế giới. Các ứng dụng tiêu biểu
của trí tuệ nhân tạo vào đời sống xã hội bào gồm: người máy, robot, xử lý ngôn ngữ tự


nhiên, nhận dạng, phát hiện dị thường, an ninh quốc phòng, tin sinh học, khoa học vũ trụ
và trái đất,...
Những năm gần đây, chúng ta đã chứng kiến được nhiều thành tựu vựợt bậc trong
lĩnh vực thị giác máy tính (Computer Vision). Các hệ thống xử lý ảnh lớn của Facebook,
Google hay Amazon đã đưa vào sản phẩm của mình những chức năng thông minh như
nhận dạng khuôn mặt người dùng, phát triển xe hơi tự lái hay drone giao hàng tự động.
Bên cạnh đó, sự phát triển của mạng nơ-ron đang dần hiện thực hoá khái niệm
chúng ta vẫn thường gọi là (Computer Vision) thị giác máy tính. Tuy nhiên, việc sử dụng
thuật tốn mạng nơ-ron vẫn cịn gặp nhiều khó khăn. Chẳng hạn như: Khi bạn muốn phát
hiện nhận dạng một đối tượng trong một bức ảnh và đánh nhãn cho đối tượng đó thì các
phương pháp lúc bấy giờ quá chậm để xử lý theo thời gian thực hoặc là đòi hỏi cần phải

đầu tư trang thiết bị rất mạnh dẫn đến chi phí rất tốn kém,....
Chính vì lẻ đó, cho đến khi giải thuật nhìn một lần (You Only Look Once YOLO) ra đời. You Only Look Once lần lượt có các phiên bản 1, 2 (YOLO Version 1,
2) và hiện nay là You Only Look Once phiên bản 3 (YOLO Version 3) có khả năng gán
nhãn cho tồn bộ đối tượng trong khung hình với chỉ duy nhất một hoạt động. Có thể nói,
You Only Look Once đã xây dựng một hướng tiếp cận đầu tiên giúp đưa nhận dạng đối
tượng theo thời gian thực (Real-Time Object Detection) thực sự khả thi áp dụng thực tế
trong cuộc sống.
Đối với mạng nơ-ron tích chập (Convolutional Neural Network - CNN) là một
trong những mơ hình học sâu (Deep Learning) tiên tiến giúp cho chúng ta xây dựng
được những hệ thống thơng minh với độ chính xác cao như hiện nay và cịn là một mơ
hình xử lý thông tin phỏng theo cách thức xử lý thông tin của các hệ nơ-ron sinh học. Nó
được tạo nên từ một số lượng lớn các phần tử (nơ-ron) kết nối với nhau thông qua các
liên kết (trọng số liên kết) làm việc như một thể thống nhất để giải quyết một vấn đề cụ
thể nào đó. Một mạng nơ-ron nhân tạo được cấu hình cho một ứng dụng cụ thể (nhận
dạng mẫu, phân loại dữ liệu,...) thông qua một quá trình học từ tập các mẫu huấn luyện.
Về bản chất học chính là q trình hiệu chỉnh trọng số liên kết giữa các nơ-ron.
Trong khuôn khổ luận văn Thạc sỹ của cá nhân, qua việc được trang bị các môn
học lý thuyết như thuật tốn, xử lý ảnh, trí tuệ nhân tạo, tìm kiếm,... tơi đã lựa chọn đề tài
“Nghiên cứu ứng dụng kỹ thuật máy học để phân tích hình ảnh và nhận dạng
phương tiện vi phạm Luật giao thông đường bộ”. Chủ đề phân lớp dữ liệu là một
nhánh quan trọng trong lĩnh vực máy học (machine learning) của trí tuệ nhân tạo.


Chúng ta có thể kể đến các ứng dụng của máy học trong thực tế như người máy, robot,
nhận dạng đối tượng, nhận dạng mặt người, nhận dạng tiếng nói và chữ viết,.Trong đó,
học sâu (Deep learning) với mơ hình mạng nơ-ron tích chập theo phương pháp nhìn một
lần (Convolutional Neural Network for You Only Look Once - CNNs for YOLO
Object Detection) là một trong những giải thuật của mô hình hệ thống máy học tiên tiến
giúp cho chúng ta xây dựng đựợc những hệ thống thông minh với độ chính xác cao như
hiện nay. Trong khn khổ luận văn cao học này, cá nhân tập trung nghiên cứu về mạng

nơ-ron (neural network) cũng như mạng tích chập (Convolution network) theo giải
thuật của mơ hình mạng nơ-ron tích chập (CNNs) nhằm phân tích lớp ảnh (Image
Classification) và áp dụng trong việc xây dựng hệ thống nhận dạng phương tiện với
phương pháp nhận dạng đối tượng (You Only Look Once) các hành vi vi phạm Luật
giao thơng đường bộ [6-9].
1.2. Tính cấp thiết của đề tài
Theo một báo cáo của Liên Hợp Quốc, hơn nửa dân số trái đất hôm nay đã là dân
đô thị, với 54,6% dân số thế giới tương đương 3,6 tỷ người đang sống ở các đô thị,
nghiên cứu cho thấy đến năm 2050, tỉ lệ dân cư thành thị sẽ chiếm hơn 70% dân số thế
giới, với 64,1% ở các nước đang phát triển và 85,9% ở các nước phát triển sẽ sống ở các
khu vực thành thị.
Sự tập trung dân số, tốc độ gia tăng của đơ thị hóa đã mang lại cho các thành phố
và quốc gia một số thách thức trong việc đáp ứng nhu cầu ngày càng tăng của người dân,
như: cơ sở hạ tầng, giao thông, các yêu cầu về nhà ở, năng lượng, an ninh, y tế, giáo dục,
môi trường và ứng phó với biến đổi khí hậu, thiên tai cũng như các vấn đề như truyền
thơng và giải trí. Do đó việc phát triển đơ thị trong tương lai có ảnh hưởng lớn tới mơi
trường, tới việc quản lý và cải thiện chất lượng đô thị, điều này chỉ có thể nắm bắt được
thơng qua việc thay đổi phương thức điều hành của chính quyền, sự tham gia của người
dân, cũng như sự tham gia của các bên liên quan chịu trách nhiệm quản lý chung. Vì vậy,
việc định hướng cho phát triển "đô thị truyền thống" hiện nay thành “đô thị thông minh”
hơn là một nhu cầu tất yếu mà trong đó bao gồm các ứng dụng về chính quyền điện tử,
giao thơng thơng minh, y tế thơng minh, giáo dục thông minh, du lịch thông minh, môi
trường thông minh,... việc triển khai, áp dụng các hệ thống tự động và kết hợp với Cuộc
cách mạng công nghiệp lần thứ 4 (CMCN 4.0) bởi các công nghệ chủ chốt của cơng
nghiệp 4.0 (Trí tuệ nhân tạo - Artificial Intelligence, Chuỗi khối- Blockchain, Dữ liệu lớn


- Big Data, Khai phá dữ liệu và Phân tích dữ liệu - Data Mining and Data Analytics,
Internet vạn vật- Internet of Things, Điện toán đám mây- Cloud computing, ...) [10].
Xét một cách tổng quan, việc triển khai giao thông thơng minh sẽ có 3 giai đoạn.

Trong đó bao gồm việc thu thập dữ liệu, xử lý dữ liệu và phân phối lại chúng cho người
tham gia giao thông. Để hoạt động của hệ thống được trơn tru, sẽ cần phải có một trung
tâm xử lý nhằm tổng hợp thơng tin và tiến hành điều tiết. Ở giai đoạn ban đầu, những
trung tâm này được điều hành chủ yếu bởi con người. Tuy vậy, với các tiến bộ của trí tuệ
nhân tạo (AI) sẽ được ứng dụng nhằm thay thế con người trong tương lai.
Hệ thống giao thông thông minh (Intelligent Transport Systems - ITS) khơng phải
là điều gì q mới mẻ. Ý tưởng về hệ thống này đã được khởi xướng từ những năm 60,
70 của thế kỷ trước tại Mỹ và các nước Châu Âu. Đến nay, mô hình này đã được áp dụng
thành cơng tại nhiều thành phố lớn trên thế giới [11].
Tại các nước châu Á, Hàn Quốc chính là quốc gia đi tiên phong trong việc ứng
dụng công nghệ nhằm phát triển Hệ thống giao thông thông minh. Seoul (Hàn Quốc)
được nhận định là thành phố có hệ thống giao thơng thơng minh tốt nhất thế giới.
Tại thành phố Seoul - Hàn Quốc, chính phủ thiết lập một hệ thống vận hành giao
thơng có tên TOPIS. Khi truy nhập vào hệ thống này, người dân sẽ được cung cấp các
thơng tin liên quan đến tình trạng giao thông. Với những người đang chờ xe buýt, thơng
tin này bao gồm cả vị trí cụ thể của chuyến xe đang tới, thời gian dự kiến sẽ tới bến và
lượng ghế còn trống trên xe là bao nhiêu.


Tại Việt Nam, cùng với các kinh nghiệm đã triển khai trên thực tế trong các năm
vừa qua của các địa phương trong cả nước như thành phố Hà Nội, thành phố Hồ Chí
Minh, Đồng Nai, Kiên Giang, Quảng Nam, Đà Nẵng, Thừa Thiên Huế, Quảng Ninh...
việc trang bị hệ thống Camera giám sát giao thông thông minh nhằm mục đích nâng cao
năng lực giám sát, kiểm sốt và xử lý các vi phạm trật tự an tồn giao thơng đường bộ đã
mang lại những hiệu quả tích cực. Bên cạnh việc giảm thiểu các tai nạn giao thơng, tình
hình an ninh trật tự được đảm bảo, ý thức tự giác chấp hành pháp luật của người tham gia
giao thông được nâng cao.
Tỉnh Bà Rịa - Vũng Tàu là một tỉnh ven biển thuộc vùng Đông Nam Bộ, nằm
trong vùng kinh tế trọng điểm phía Nam, có tổng diện tích tự nhiên là 1.980,98 km 2, dân
số khoảng trên 1,3 triệu người, cũng nằm trong xu thế xây dựng đô thị hướng đến thông

minh đang được quan tâm và thúc đẩy. Có thể nói, đơ thị thơng minh được coi là lựa
chọn tất yếu, phù hợp với xu thế phát triển chung của thế giới cũng như khả năng tiếp cận
của Việt Nam. Bà Rịa - Vũng Tàu được đánh giá là một trong những địa phương có hệ
thống giao thông đường biển, đường hàng không và đường bộ với kết cấu hạ tầng giao
thơng khá hiện đại. Trong đó, đường bộ là đầu mối giao thông quan trọng với 3 tuyến
quốc lộ chính gồm QL51, QL55, QL56. Quốc lộ 51 và là trục giao thơng chính của vùng
Kinh tế trọng điểm phía Nam, nối liền với phố TP. Hồ Chí Minh, Tp. Biên Hịa và Tp.
Vũng Tàu. Quốc lộ 55, chạy từ Tp. Bà Rịa đi Tp. Phan Thiết nối với các tỉnh dun hải
Đơng Nam Bộ, có giá trị giao thông liên vùng, nối vùng Nam Trung Bộ với miền Đông.
Quốc lộ 56 là trục đường giao thông nối Tp. Bà Rịa tỉnh Bà Rịa - Vũng Tàu và vùng kinh
tế trọng điểm phía Nam với Tây Nguyên. Từ QL56 có thể đi thẳng qua TX. Long Khánh
đi Tp. Đà Lạt (Lâm Đồng). Ngoài ra tỉnh Bà Rịa - Vũng Tàu có rất nhiều tuyến đường
tỉnh kết nối đi các huyện, thị xã và thành phố.
Theo số liệu tổng hợp, đến cuối tháng 9/2020 trên địa bàn
tỉnh đã xảy ra 285 vụ tai nạn giao thông, hậu quả làm 120
người chết và 213 người bị thương. Trong đó có 28 vụ tai
nạn giao thơng tự gây, làm 31 người chết và 04 người bị
thương. So với cùng kỳ năm 2018, số vụ tai nạn giao thông
giảm 02 vụ, số người chết giảm 06 người, số người bị thương
giảm 55 người. Tuy số vụ TNGT, số người chết và bị thương
đều giảm so với cùng kỳ nhưng con số thống kê cho thấy vẫn
ở mức cao và tiềm ẩn diễn biến phức tạp. Nguyên nhân chủ
yếu là do một bộ phận người tham gia giao thông 20


chưa ý thức trong việc chấp hành pháp luật giao thơng đường bộ, cịn đối phó, chưa tự
giác, vi phạm về trật tự - an tồn giao thơng (TT-ATGT) vẫn còn phổ biến, đặc biệt là các
hành vi vi phạm như: điều khiển phương tiện tham gia giao thông không đúng tốc độ quy
định, điều khiển phương tiện tham gia giao thông không đúng phần làn/chiều đướng theo
quy định, không chấp hành hiệu lệnh của tín hiệu giao thơng, phương tiện tham gia giao

thông quá khổ - quá tải, phương tiện tham gia giao thông chở quá số lượng người quy
định [12-13].
Bên cạnh đó, giao thơng ln là một vấn đề được quan tâm nhiều nhất đối với các
đô thị lớn ở các nước nói chung và ở Việt Nam nói riêng. Trong những năm gần đây tình
trạng tắc đường, kẹt xe, tai nạn và vi phạm Luật giao thông đường bộ vẫn luôn là vấn đề
rất nghiêm trọng và cấp bách. Đây được xem là vấn đề bức xúc của toàn xã hội, ảnh
hưởng đến sự phát triển bền vững về kinh tế, văn hóa, xã hội và hình ảnh của đất nước
Việt Nam với bạn bè Quốc tế.
Hiện nay, mặc dù đã có những nghiên cứu, nhiều giải pháp, cũng như các ý tưởng
mới của các nhà khoa học, các chuyên gia hàng đầu trong nước và thế giới về việc hỗ trợ,
giảm thiểu tình trạng tắc đường, kẹt xe, tai nạn và các hành vi vi phạm Luật giao thông
đường bộ nhưng hiệu quả vẫn chưa cao và tình trạng vẫn diễn ra thường xuyên trên các
trục đường giao thông, đặc biệt là ở các khu đô thị.
Xuất phát từ nhu cầu thực tiễn, vì vậy tơi chọn vấn đề “Nghiên cứu ứng dụng kỹ
thuật máy học để phân tích hình ảnh và nhận dạng phương tiện vi phạm Luật giao
thông đường bộ” làm đề tài nghiên cứu nhằm phát hiện, nhận dạng và xử lý các hành vi
vi phạm trật tự an tồn giao thơng, góp phần giảm thiểu ùn tắc, tai nạn cho người và
phương tiện tham gia giao thông. Đồng thời giúp công tác tuần tra kiểm soát trật tự, an
ninh và phát hiện kịp thời, có chứng cứ pháp lý về hình ảnh nhằm cung cấp cho lực lượng
chức năng khi điều tra các vụ việc xảy ra trên đường góp phần đảm bảo an ninh trật tự xã
hội là cần thiết. Kết quả thực hiện đề tài dự kiến sẽ được đưa vào áp dụng thực tế trên địa
bàn tỉnh Bà Rịa - Vũng Tàu sau khi hoàn thành nghiên cứu luận văn.
2. MỤC TIÊU, ĐỐI TƯỢNG, PHẠM VI, NỘI DUNG VÀ HƯỚNG NGHIÊN
CỨU
2.1. Mục tiêu của đề tài
- Mục tiêu tổng quát: Nghiên cứu ứng dụng kỹ thuật máy học để xây dựng mơ
hình phục vụ theo dõi, giám sát tình trạng giao thông đường bộ, tự động phát hiện, ghi
15



nhận, phân tích hình ảnh đối tượng và nhận dạng phương tiện về các hành vi vi phạm
Luật giao thông đường bộ theo thời gian thực với độ chính xác cao tại một nút giao lộ, từ
đó có thể xử phạt nhằm nâng cao ý thức về an toàn giao thơng của người dân, đảm bảo
trật tự an tồn xã hội.
- Mục tiêu cụ thể: Theo dõi, giám sát tình trạng giao thông đường bộ, tự động
phát hiện, ghi nhận, phân tích hình ảnh đối tượng và nhận dạng biển số phương tiện và
các hành vi vi phạm Luật giao thông đường bộ theo thời gian thực tại một nút giao lộ cụ
thể sau:
(1) Chở quá số người quy định khi tham gia giao thông.
(2) Không đội mũ bảo hiểm khi điều khiển xe mơ tơ, xe gắn máy.

Hình 1: Mơ hình nút giao lộ (ngã tư) triển khai xây dựng mơ hình nghiên cứu
2.2 Đối tượng
Đối tượng nghiên cứu chính là các loại phương tiện tham gia giao thơng đường bộ
theo quy định của Luật giao thông đường bộ áp dụng đối với hành vi vi phạm theo mục
tiêu đề tài nghiên cứu đề ra đó là:
- Thu thập, xây dựng bộ dữ liệu ảnh các phương tiện giao thông đường bộ cho hệ
thống giám sát.
- Một số mô hình mạng nơ-ron và nơ-ron tích chập đang được sử dụng phổ biến
trong lĩnh vực nhận dạng.
- Ứng dụng kỹ thuật máy học trong lĩnh vực trí tuệ nhân tạo để phát hiện, ghi nhận
và phân vùng đối tượng ảnh dựa trên các giải thuật học sâu để phân lớp đối tượng quan
tâm với các đối tượng ảnh còn lại.
- Phương pháp trích xuất điểm đặc trưng đối tượng, phương tiện theo mơ hình
mạng nơ-ron tích chập theo phương pháp phát hiện đối tượng nhìn chỉ một lần.

16


2.3 Phạm vi

- Xây dựng bộ mẫu dữ liệu nghiên cứu, thử nghiệm với số lượng 500 mẫu là ảnh
các đối tượng vể phương tiện tham gia giao thông. Những ảnh này dùng để phát hiện
vùng chứa biển số theo cách tiếp cận của phương pháp hình thái học để phát hiện vùng
biển số cho các biển đăng ký xe của Việt Nam.
- Tập trung nghiên cứu kỹ thuật máy học trong lĩnh vực trí tuệ nhân tạo để phát
hiện, ghi nhận và phân vùng đối tượng ảnh dựa trên các giải thuật học sâu nhằm phân lớp
đối tượng quan tâm với các đối tượng ảnh còn lại, cụ thể hơn là công việc cần phải giải
quyết vấn đề phát hiện vùng chứa biển số xe và nhận dạng ký tự trong biển số với mơ
hình mạng nơ-ron tích chập để tiến hành nhận dạng biển số xe vi phạm Luật giao thông
đường bộ.
2.4.
2.4.1.

Nội dung nghiên cứu
Về nội dung

- Nghiên cứu xây dựng hệ thống phát hiện, ghi nhận và phân vùng đối tượng ảnh
dựa trên các bộ thư viện cài đặt cho mơ hình, giải thuật học sâu (deep learning).
- Sử dụng cơng cụ, mơ hình mạng nơ-ron tích chập (CNNs) nhằm phân tích lớp
ảnh (Image Classification) áp dụng trong việc xây dựng hệ thống tự động nhận dạng
phương tiện và các hành vi vi phạm Luật giao thông đường bộ theo thời gian thực.
- Huấn luyện và xây dựng nhận dạng đối tượng về các hành vi vi phạm Luật giao
thơng đường bộ.
2.4.2.

Về mặt lý thuyết

- Tìm hiểu tổng quan về hệ thống kỹ thuật máy học (machine learning) trong lĩnh
vực trí tuệ nhân tạo (AI) để phát hiện, ghi nhận và phân vùng đối tượng ảnh dựa trên các
giải thuật học sâu (deep learning) để phân lớp đối tượng quan tâm với các đối tượng ảnh

còn lại.
- Tìm hiểu tổng quan về hệ thống mơ hình giải thuật mạng nơ-ron và mạng noron tích chập theo phương pháp phát hiện đối tượng nhìn chỉ một lần.
- Nghiên cứu tổng quan về phướng pháp, cách thức nhận dạng đối tượng, phương
tiện tham gia giao thông thông qua biển số xe trong đề tài nghiên cứu.
- Nghiên cứu áp dụng các kỹ thuật đã được tìm hiểu để tự động phát hiện, nhận
dạng phương tiện tham gia giao thông và các hành vi vi phạm Luật giao thông đường bộ.
2.4.3.

Về mặt thực nghiệm

- Tiến hành khảo sát lựa chọn địa điểm xây dựng mơ hình nghiên cứu triển khai
17


thử nghiệm.
- Thiết kế mơ hình và lựa chọn thiết bị trang thiết bị, giải pháp thi công lắp đặt
cho hệ thống.
- Xây dựng phần mềm ứng dụng điều khiển hệ thống thông minh kết hợp quản lý
và in ấn bằng chứng hình ảnh vi phạm chạy trên nền tảng website.
- Ứng dụng trí tuệ nhân tạo (AI) để tự động học và nhận diện các lỗi hành vi vi
phạm giao thông từ các dữ liệu vi phạm ban đầu và nhận dạng các lỗi vi phạm có độ
chính xác ngày càng cao hơn từ các dữ liệu vi phạm trước đó.
- Xây dựng quy trình vận hành khai thác, xây dựng các kịch bản nhằm tổ chức
triển khai thu thập bộ dữ liệu mẫu tại mơ hình thực tế.
- Xây dựng bộ cơ sở dữ liệu điện toán đám mây có khả năng lưu trữ dữ liệu lớn về
các hình ảnh bằng chứng vi phạm và thơng tin của các phương tiện tham gia giao thông
vi phạm.
- Nghiên cứu thực hiện thơng qua các hình ảnh thực nhằm xác định, đánh giá kết
quả cuối cùng và đưa ra các dự báo.
2.5.


Phương pháp luận và phương pháp nghiên cứu

Để đảm bảo thực hiện xây dựng đầy đủ mơ hình hệ thống tự động phát hiện, ghi
nhận, phân tích hình ảnh đối tượng và nhận dạng phương tiện và các hành vi vi phạm
Luật giao thông đường bộ theo thời gian thực. Đề tài nghiên cứu đề xuất thực hiện theo
hai bước cụ thể sau:
- Bước 1- Huấn luyện: Sử dụng bộ dữ liệu trên cơ sở các kịch bản, diễn tập, huấn
huyện và thu thập ảnh đối tượng động từ hệ thống camera lắp sẵn đưa vào huấn luyện,
thử nghiệm để đưa ra mơ hình nhận dạng và đánh giá kết quả.
- Bước 2 - Thử nghiệm: Sử dụng mô hình vừa huấn luyện được ở trên thơng qua
hình ảnh giao thông để thực hiện các giải thuật phân lớp đối tượng trên dữ liệu mới và
đánh giá kết quả.
3. TỔNG QUAN VỀ LĨNH VỰC NGHIÊN CỨU
3.1. Những hướng nghiên cứu đã được thực hiện
Nghiên cứu xây dựng hệ thống giám sát ngã tư thông minh tại 01 điểm giao lộ
đường Huỳnh Minh Thạnh và 27/4 thuộc thị trấn Phước Bửu, huyện Xuyên Mộc, tỉnh Bà
Rịa - Vũng Tàu đây là dự án sản xuất thử nghiệm cấp tỉnh thực hiện nhiệm vụ khoa học
và công nghệ hàng năm do UBND tỉnh Bà Rịa - Vũng Tàu đặt hàng cho Trung tâm Ứng
dụng tiến bộ khoa học và công nghệ chủ trì thực hiện. Mục tiêu dự án SXTN đã nêu trên
18


với giải pháp là thiết kế lắp đặt trên nền tảng cơng nghệ sẵn có vi xử lý AVR Atmel 8-bit,
hoặc ARM Atmel 32-bit thông qua bản mạch Arduino và thực thi chương trình được nạp
sẵn cho bộ xử lý trung tâm đặt tại giao lộ cần quan sát, bộ xử lý này tiếp nhận thông tin
từ các camera được kết hợp với các cảm biến laser và camera giám sát hình ảnh phương
tiện tham gia giao thơng. Nhận dạng hành vi vi phạm và lưu trữ thông tin trên hệ thống
dữ liệu điện tốn đám mây thơng qua sóng 3G. Thơng qua phần mềm ứng dụng có thể
xây dựng kịch bản cho hệ thống tự động điều khiển và xử lý thông tin tiếp nhận từ các

thiết bị.
Hệ thống nhận dạng biển số xe: Bộ thư viện OpenCV - đây là bộ thư viện được
Intel và Itseez phát triển trong hơn 20 năm qua với hơn 2.500 thuật toán nhận dạng khác
nhau, sử dụng máy học (machine learning).

Hình 2: Sơ đồ nhận dạng biển số xe

19


Hệ thống nhận dạng người tham gia giao thông: IOT Core và Azure đảm nhận
việc có bao nhiên người tham gia giao thơng tại thời điểm đó, từ đó biết được trên một
phương tiện xe máy có bao nhiêu người, đặc điểm của họ, phân tích các hành vi tại thời
điểm đó để kiểm tra xem họ có chấp hành đúng luật giao thông hay không.
Detection Result:
2 faces detected
ISON:
[
{
"faceRectangle": {
"left": 479,
"top": 199,
“width": 158,
"height": 158
h
"scores": {
"anger": 0.00901619889,
"contempt": 9.008121588469,
"disgust": 9.9996216889184, "fear":
6.09138592813, "happiness":

8.96891577913, "neutral":
9.992224847, "sadness":
9.89889309449252, "surprise":
e.996211
}

Hình 3: Nhận dạng khn mặt người trong ảnh
Từ đó, có thể nhận thấy cần phải thay đổi ứng dụng giải pháp công nghệ vào việc
giám sát hành vi của người tham gia giao thông nhằm phát hiện, ghi nhận và phân vùng
đối tượng ảnh dựa trên các giải thuật học sâu (deep learning) để phân lớp đối tượng quan
tâm với các đối tượng ảnh còn lại, đặc biệt với thông qua các kỹ thuật học sâu (Deep
learning) với mơ hình mạng nơ-ron tích chập theo phương pháp nhìn một lần
(Convolutional Neural Network for You Only Look Once - CNNs for YOLO Object
Detection) nhằm phân tích đối tượng áp dụng trong việc xây dựng hệ thống tự động nhận
dạng phương tiện và các hành vi vi phạm Luật giao thông đường bộ theo thời gian thực là
cấp bách và cần thiết phù hợp với xu hướng công nghệ mới, tiên tiến hơn, tốt hon,....
3.2. Những kết quả nghiên cứu đã áp dụng vào thực tế
Việc ứng dụng của công nghệ phân loại hiện nay đang phát triển rất mạnh ở rất
nhiều lĩnh vực (học thuật, kinh doanh, bảo mật, y tế...) và các đối tượng (nhà nghiên cứu
xã hội, chính phủ và các tổ chức phi lợi nhuận khác). Vì các tổ chức này sở hữu một
lượng lớn dữ liệu khơng có cấu trúc và việc xử lý dữ liệu sẽ trở nên dễ dàng hơn rất nhiều
20


nếu như các dữ liệu này được chuẩn hóa bởi các chủ đề/nhãn. Nền tảng công nghệ để
thực hiện bài tốn phân loại văn bản chính là trí tuệ nhân tạo (Artificial Intelligence - AI)
áp dụng giải thuật học sâu (Deep Learning) với mơ hình mạng nơ- ron được áp dụng như:
-

Nghiên cứu của ơng Andrews Sobral: Ơng Andrews Sobral và cộng sự đã nghiên

cứu nhận diện phương tiện qua phương pháp Haar Cascades using OpenCV.
Nghiên cứu sử dụng thư viện thị giác máy tính mã nguồn mở JavaScript và
OpenCV để nhận diện hình ảnh được truy cập vào webcam.

-

Nghiên cứu nhận diện và theo dõi xe sử dụng OpenCV và Kalman Filter: Ông
Ronit Sinha và cộng sự sử dụng OpenCV và Kalman Filter để nhận diện và theo
dõi xe từ luồng trực tuyến của Camera giao thông. Bộ lọc OpenCV và Kalman sẽ
phát hiện và theo dõi xe ô tô từ video được phát trực tiếp từ camera.

-

Nghiên cứu về nhận diện vật thể bằng thuật toán YOLO: Yolo được Redmon và
Farhadi phát triển vào năm 2015, trong thời gian học tiến sĩ. YOLO (‘You only
look once”) là một thuật tốn nhận diện phổ biến nhờ độ chính xác cao trong thời
gian thực, đạt đến 45 khung hình trên giây.

-

Nghiên cứu nhận diện phương tiện và hướng đi (Vehicle Detection for
Autonomous Driving): Ông Junsheng Fu và cộng sự đã sử dụng các công cụ, bao
gồm OpenCV3, Python3.5, tensorflow, CUDA8 OS: Ubuntu 16.04. Có 2 hướng
đi: SVM tuyến tính và mạng nơ-ron.
Ở Việt Nam, cộng đồng nghiên cứu trí tuệ nhân tạo xử lý ngôn ngữ tự nhiên để áp

dụng vào bài toán xử lý tiếng Việt đang rất phát triển. Do đặc thù của tiếng Việt và sự
khác biệt về bộ ngôn ngữ trong các thư viện, công cụ hỗ trợ, nên cộng đồng các nhà
nghiên cứu trí tuệ nhân tạo (AI) của Việt Nam đã xây dựng và phát triển một số các thuật
tốn, thư viện và cơng cụ dành riêng cho tiếng Việt. Một số doanh nghiệp và trường đại

học hoạt động trong lĩnh vực công nghệ thơng tin đã và đang nghiên cứu đưa bài tốn
phân loại văn bản vào ứng dụng thực tế như: Framgia, Đại học Lê Quý Đôn, FPT, Đại
học Khoa học Công nghệ thuộc Đại học Quốc gia Việt Nam,.... Còn trong lĩnh vực quân
sự, do là là môi trường đặc thù, vì vậy, việc thu thập thơng tin trên các trang báo điện tử,
diễn đàn, mạng xã hội,. để theo dõi tình hình, nắm bắt thơng tin là một trong những
nhiệm vụ mới, quan trọng trên không gian mạng. Do lượng thông tin thu thập được qua
mạng Internet là rất lớn, nên đã đặt ra yêu cầu phân tích và xử lý lượng dữ liệu khổng lồ
trên một cách tự động và nhanh chóng.

21


3.3. Những phương pháp nghiên cứu đã được áp dụng trên thế giới và Việt
Nam
Một là, thực trạng nghiên cứu áp dụng đối với một số nước trong khu vực và thế
giới:
Đến nay, mơ hình này đã được áp dụng thành công tại nhiều thành phố lớn trên
thế giới như Mỹ và các nước Châu Âu đi đầu trong nghiên cứu triển khai và áp dụng
thành công cho nhiều lĩnh vực trong đời sống, xã hội.
Tại các nước châu Á, Hàn Quốc chính là quốc gia đi tiên phong trong việc ứng
dụng công nghệ nhằm phát triển Hệ thống giao thông thông minh. Seoul (Hàn Quốc)
được nhận định là thành phố có hệ thống giao thơng thơng minh tốt nhất thế giới.
Hoặc như Singapore với chiến lược “Quốc gia thông minh” được khởi động từ
tháng 11 năm 2014, đề án Quốc gia thông minh của Singapore được xây dựng trên nền
tảng đặt người dân làm trung tâm, sử dụng công nghệ để giải quyết các vấn đề và thách
thức của đô thị. Sáng kiến này nêu rõ: “Singapore nỗ lực để trở thành một quốc gia thông
minh nhằm hỗ trợ người dân sống tốt hơn, cộng đồng mạnh mẽ hơn và tạo nhiều cơ hội
hơn cho tất cả mọi người”. Thơng qua đề án này, Singapore đã và đang hình thành một
nền văn hóa quốc gia xung quanh việc khuyến khích thực nghiệm, ni dưỡng tinh thần
sáng tạo và triển khai những ý tưởng mới. ICT là cốt lõi để thực hiện mục tiêu Quốc gia

thơng minh, trong đó tập trung vào 3 ưu tiên: công nghệ hỗ trợ xã hội; di động và giao
thông thông minh; môi trường dữ liệu an tồn. Chính phủ cũng cam kết hằng năm đầu
tư khoảng 1% GDP cho nghiên cứu và phát triển.
Trải qua hơn 2 năm vận hành, đến nay, Singapore đã triển khai được các giải pháp
thông minh trong lĩnh vực nhà ở, điều khiển giao thông, xe tự lái, quan trắc mơi trường,
thanh tốn khơng dùng tiền mặt, các cơng nghệ hỗ trợ tự hành/người máy, y tế từ xa,
công cụ tiếp nhận ý kiến người dân, và hệ thống cơ sở dữ liệu mở. Song song đó,
Singapore tiếp tục duy trì và mở rộng hoạt động hỗ trợ khởi nghiệp nhằm có thể đảm bảo
nguồn cung cho các ứng dụng thông minh trong tương lai.
Tại Trung Quốc áp dụng mơ hình mạng nơ-ron tích chập theo phương pháp nhìn
một lần (Convolutional Neural Network for You Only Look Once - CNNs for
YOLO Object Detection) xây dựng hệ thống theo dõi người dân của Trung Quốc, từ đó
có thể giúp chính quyền xác định được tội phạm lẫn trốn ở đó hay không, hoặc hệ thống
xe tự lái, cũng phải xác định được người đi đường ở đâu từ đó đưa ra quyết định di
chuyển tiếp theo.
22


Hai là, thực trạng nghiên cứu áp dụng hiện nay tại Việt Nam:
-

Việc triển khai nghiên cứu áp dụng trí tuệ nhân tạo (AI) trong việc xây dựng
thành phố thông minh đã và đang áp dụng nghiên cứu công nghệ và triển khai cho
một số địa phương như: thành phố Hà Nội, thành phố Hồ Chí Minh, thành phố Đà
Nẵng, Bình Dương, Đồng Nai, Kiên Giang, Quảng Nam, Thừa Thiên Huế, Quảng
Ninh, ... tập trung chủ yếu vào các vấn đề chính cụ thể như: xây dựng hạ tầng
mạng kết nối trên toàn thành phố để phục vụ nhu cầu kết nối, chia sẻ thơng tin của
chính quyền, doanh nghiệp, người dân, du khách và truyền dẫn cho các ứng dụng
thành phố thông minh hơn; Hệ thống giao thông thông minh: ứng dụng CNTT-TT
vào công tác quản lý giao thông đô thị của thành phố một cách chủ động và hiệu

quả hơn; Hệ thống cấp nước thông minh: ứng dụng CNTT-TT để nâng cao chất
lượng xử lý và phân phối nước sạch cho người dân. Riêng tỉnh Bà Rịa - Vũng Tàu
ngày 13/12/2019 Hội đồng nhân dân tỉnh đã thông qua Nghị quyết số 112/NQHĐND về Đề án phát triển đô thị thông minh tỉnh Bà Rịa - Vũng Tàu giai đoạn
2020-2022, định hướng đến 2025, tầm nhìn đến 2030 với mục tiêu phát triển thí
điểm đơ thị thơng minh bền vững tỉnh Bà Rịa - Vũng tàu giai đoạn đến 2030
hướng tới tăng trưởng xanh, phát triển bền vững; ứng dụng thành tựu khoa học
công nghệ hiện đại, tối ưu hóa cơ sở dữ liệu hạ tầng kỹ thuật và hạ tầng ICT phát
triển đô thị thông minh nhằm phát huy tiềm năng lợi thế, khai thác hiệu quả tài
nguyên, con người, nâng cao chất lượng cuộc sống nhân dân, đồng thời tạo điều
kiện để các tổ chức, cá nhân tham gia đầu tư xây dựng cơ sở vật chất kỹ thuật
phát triển đô thị thông minh; hạn chế các rủi ro và nguy cô tiềm năng; nâng cao
hiệu quả quản lý nhà nước và các dịch vụ đô thị; nâng cao sức cạnh tranh của nền
kinh tế và hội nhập, góp phần thắng lợi các mục tiêu kinh tế - xã hội, an ninh quốc
phòng tại địa phương.

-

Nghiên cứu phát hiện làn đường, ôtô và người đi bộ bằng công nghệ ảnh hỗ trợ
cho ôtô tự hành của hai tác giả Trương Quốc Bảo, Trương Quốc Định - Trường
Đại học Cần Thơ.
- Các nhà khoa học thuộc Khoa Điện - Điện tử, Trường Đại học Giao thông Vận

tải đã nghiên cứu thiết kế và chế tạo thành công hệ thống giám sát giao thông ứng dụng
công nghệ xử lý ảnh. Hệ thống bao gồm camera giám sát, camera chụp hình, mạng truyền
thơng, video server, phần mềm xử lý ảnh và cơ sở dữ liệu có thể tự động phát hiện và ghi
nhận các tình huống vi phạm Luật Giao thông nhằm tăng cường giám sát, phát hiện và xử
23


lý kịp thời các vi phạm, hạn chế tai nạn và nâng cao ý thức chấp hành của người tham gia

giao thơng[8-11].
3.4. Một số vấn đề cịn hạn chế của những nghiên cứu trước và những vấn
đề cần được tiếp tục nghiên cứu hồn thiện
3.4.1.

Một số vấn đề cịn hạn chế của những nghiên cứu trước

Đầu vào mơ hình là một bức ảnh, đối với bài toán nhận dạng, chúng ta không chỉ
phải phân loại được đối tượng (object) trên bức ảnh mà cịn phải định vị được vị trí của
đối tượng đó và mỗi lần thực hiện tốn rất nhiều thời gian. Do đó:
- Tốn rất nhiều tài nguyên để tính tốn cho mọi vùng trên một bức ảnh và do đó
khơng thể thực hiện theo thời gian thực (realtime) trên các thiết bị yếu.
- Ảnh phương tiện lưu thơng vào ban đêm hay trong bóng tối nếu thiết bị ghi hình
khơng có đèn flash thì khả năng nhận dạng thấp do thiếu sáng.
- Khơng thể nhìn thấy các đối tượng nhỏ, các đối tượng quá gần sát nhau; khơng
thể khái qt các đối tượng nếu hình ảnh có kích thước khác so với hình ảnh đào tạo,
huấn luyện.
- Tỷ lệ nhận dạng còn phụ thuộc nhiều vào điều kiện ánh sáng, phản chiếu, độ che
bóng và điều kiện môi trường.
- Với những biển số trên phương tiện giao thơng có đường viền phức tạp thì mức
độ nhận dạng khơng cao. Chỉ giới hạn ảnh chụp trong góc 40 độ để nhận dạng được tốt,
nếu góc lớn hơn thì khả năng nhận dạng sẽ giảm.
- Đặc biệt, đối với Việt Nam rất đa dạng các loại phương tiện giao thông (ô tô, xe
máy, xe lam, xe ba bánh, xe đạp, người đi bộ,...), các vật thể (mũ bảo hiểm, ô dù, điện
thoại, đèn tín hiệu), các hành vi và tình trạng giao thơng (tai nạn giao thơng, tắc đường,
đua xe, lạng lách,.).
3.4.2.

Những vấn đề cần được tiếp tục nghiên cứu hồn thiện


- Chuẩn hóa hàng loạt ở các lớp tích chập, làm giảm sự thay đổi giá trị trong các
lớp ẩn, cải thiện tính ổn định của mạng lưới.
- Việc tăng kích thước đầu vào của hình ảnh đã cải thiện (độ chính xác trung bình)
tăng lên.
- Thực hiện phân loại và dự đoán trong một khung duy nhất. Các khung tâm và
khung ranh giới; khung tâm chịu trách nhiệm dự đoán khung ranh giới và các khung tâm
được thiết kế cho một tập dữ liệu nhất định bằng cách sử dụng thuật toán phân cụm (kmeans clustering).
24


- Đối với việc phát hiện các vật nhỏ trên hình ảnh khắc phục bẳng cách chia hình
ảnh thành các ô lưới nhỏ hơn so với nghiên cứu trước đó. Điều này cho phép các nghiên
cứu sau cần phải xác định các đối tượng nhỏ hơn trong hình ảnh và cũng hiệu quả với các
đối tượng lớn hơn.
- Trong các nghiên cứu trước có một điểm yếu phát hiện các đối tượng với các
kích cỡ đầu vào khác nhau, việc đào tạo với các hình ảnh nhỏ của một đối tượng cụ thể
thì nó có vấn đề phát hiện cùng một đối tượng trên hình ảnh có kích thước lớn hơn. Điều
này tiếp tục nghiên cứu để xử lý việc được đào tạo, huấn luyện với các hình ảnh ngẫu
nhiên với các kích thước khác nhau trong khoảng ảnh nhằm cho phép mạng tìm hiểu và
dự đốn các đối tượng từ các kích thước đầu vào khác nhau với độ chính xác cao.
- Nghiên cứu theo hướng ứng dụng trong việc sử dụng kiến trúc mạng Darknet 19
với 19 lớp chập và 5 lớp max-pooling và một lớp softmax cho việc phân loại đối tượng.
- Nâng cao hiệu quả chương trình, tách ly các kí tự trong biển số trong các trường
hợp biển số bị nhiều nhiễu, mất mát thông tin do nhiễu từ điều kiện mơi trường, tìm vùng
biển số trong ảnh có độ tương phản giữa biển số và nền thấp. Đặc biệt là biển xe có nền
màu đỏ chữ trắng hoặc nền màu vàng chữ trắng.
- Phát triển chương trình thành module phần cứng. Có khả năng tương thích với
các thiết bị quan sát như camera. Kết hợp quản lý và in ấn bằng chứng hình ảnh vi phạm
chạy trên nền tảng website.
- Cần trang bị hệ thống camera có độ phân giải cao cho hình ảnh biển số xe rõ nét

trong điều kiện ánh sáng ban ngày, ban đêm hay với thời tiết mưa, bão; Có cấu hình phù
hợp cho việc chụp ảnh khi xe di chuyển với tốc độ cao kết hợp công nghệ nhận dạng một
cách chính xác.
4. CẤU TRÚC LUẬN VĂN
Luận văn thạc sỹ cá nhân biên soạn bao gồm 6 mục và 4 chương với nội dung tóm
tắt như sau:
1. GIỚI THIỆU
2. MỤC TIÊU, ĐỐI TƯỢNG, PHẠM VI, NỘI DUNG VÀ HƯỚNG NGHIÊN
CỨU
3. TỔNG QUAN VỀ LĨNH VỰC NGHIÊN CỨU
4. CẤU TRÚC LUẬN VĂN
5. NGHIÊN CỨU TỔNG QUAN VÀ PHÂN TÍCH BÀI TỐN
- Chương 1. Các khái niệm, tổng quan về trí tuệ nhân tạo, học máy, các giải thuật
25


×