Tải bản đầy đủ (.pdf) (58 trang)

Đồ án Tốt nghiệp Nhận dạng biển số xe bằng mạng nơron nhân tạo

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.02 MB, 58 trang )

ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC BÁCH KHOA
KHOA ĐIỆN

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM

Độc lập - Tự do - Hạnh phúc

NHẬN XÉT ĐỒ ÁN TỐT NGHIỆP
I. Thông tin chung:
1. Họ và tên sinh viên: ………………………………………………………………….
2. Lớp: …………………………… Số thẻ SV: ..………………………………………
3. Tên đề tài: …………………………………………………………………………....
4. Người hướng dẫn: ………………………….………… Học hàm/ học vị: ………….
II. Nhận xét đồ án tốt nghiệp:
1. Về tính cấp thiết, sáng tạo và ứng dụng của đồ án: (điểm đánh giá tối đa là 2đ)
………………………………………………………………………………………..
………………………………………………………………………………………..
2. Về kết quả giải quyết các nội dung nhiệm vụ yêu cầu của đồ án: (điểm tối đa là 4đ)
………………………………………………………………………………………..
………………………………………………………………………………………..
3. Về hình thức, cấu trúc, bố cục của đồ án tốt nghiệp: (điểm đánh giá tối đa là 2đ)
………………………………………………………………………………………..
………………………………………………………………………………………..
4. NCKH: (nếu có bài báo khoa học hoặc ĐATN là đề tài NCKH: (cộng thêm 1đ)
………………………………………………………………………………………..
………………………………………………………………………………………..
5. Các tồn tại, thiếu sót cần bổ sung, chỉnh sửa:
………………………………………………………………………………………..
………………………………………………………………………………………..
III. Tinh thần, thái độ làm việc của sinh viên: (điểm đánh giá tối đa 1đ)


………………………………………………………………………………………..
………………………………………………………………………………………..
IV.Đánh giá:
1. Điểm đánh giá:
2. Đề nghị:

/10
Được bảo vệ đồ án/ Bổ sung thêm để bảo vệ/ Không được bảo vệ
Đà Nẵng, ngày
tháng
năm 2019
Người hướng dẫn

Ghi chú: Điểm đánh giá có thể cho lẻ đến mức 0,5.


ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC BÁCH KHOA
KHOA ĐIỆN

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM

Độc lập - Tự do - Hạnh phúc

NHẬN XÉT PHẢN BIỆN ĐỒ ÁN TỐT NGHIỆP
I. Thông tin chung:
5. Họ và tên sinh viên: ……….………………………………………………………….
6. Lớp: …………………….……… Số thẻ SV: ..………………………………………
7. Tên đề tài: …………………………………………….……………………………....
8. Người phản biện: ..………………………….………… Học hàm/ học vị: ………….

II. Nhận xét, đánh giá đồ án tốt nghiệp:
Điểm Điểm
tối đa trừ

TT Các tiêu chí đánh giá
1
1a
1b
1c
1d
1e
1f
2
2a
2b
3

Sinh viên có phương pháp nghiên cứu phù hợp, giải
quyết đủ nhiệm vụ đồ án được giao
- Hiểu và vận dụng được kiến thức Toán và khoa học tự
nhiên trong vấn đề nghiên cứu
- Hiểu và vận dụng được kiến thức cơ sở và chuyên ngành
trong vấn đề nghiên cứu
- Có kỹ năng vận dụng thành thạo các phần mềm mô phỏng,
tính toán trong vấn đề nghiên cứu
- Có kỹ năng đọc, hiểu tài liệu bằng tiếng nước ngoài ứng
dụng trong vấn đề nghiên cứu
- Có kỹ năng làm việc nhóm, kỹ năng giải quyết vấn đề
- Đề tài có giá trị khoa học, công nghệ; có thể ứng dụng thực
tiễn:

Kỹ năng viết:

Điểm
còn lại

80
15
25
10
10
10
10

- Bố cục hợp lý, lập luận rõ ràng, chặt chẽ, lời văn súc tích

20
15

- Thuyết minh đồ án không có lỗi chính tả, in ấn, định dạng

5

Tổng điểm đánh giá: theo thang 100
Quy về thang 10 (lấy đến 1 số lẻ)

3. Các tồn tại, thiếu sót cần bổ sung, chỉnh sửa:
………………………………………………………………………………………..
………………………………………………………………………………………..
4. Ý kiến khác:
………………………………………………………………………………………..

5. Đề nghị:
Được bảo vệ đồ án/ Bổ sung thêm để bảo vệ/ Không được bảo vệ
Đà Nẵng, ngày
tháng
năm 2019
Người phản biện


TÓM TẮT
Tên đề tài: Tự động nhận dạng biển số xe bằng công nghệ trí tuệ nhân tạo.
Sinh viên thực hiện:
Hoàng Đức Nhật

Số thẻ SV: 105140302

Lớp: 14TDH1

Dương Đức Khải

Số thẻ SV: 105140344

Lớp: 14TDH2

Bản báo cáo gồm các phần theo thứ tự sau:
 Tóm tắt.
 Nhiệm vụ đồ án tốt nghiệp.
 Lời nói đầu.
 Cam đoan.
 Mục lục.
 Danh sách các bảng, hình vẽ.

 Danh sách các cụm từ viết tắt
 Mở đầu.
 Nội dung của đề tài


ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC BÁCH KHOA
KHOA ĐIỆN

CỘNG HÒA XÃ HÔI CHỦ NGHĨA VIỆT NAM

Độc lập - Tự do - Hạnh phúc

NHIỆM VỤ ĐỒ ÁN TỐT NGHIỆP
Họ tên sinh viên: Dương Đức Khải
Lớp: 14TDH2
Khoa: Điện
4.1 Tên đề tài đồ án:

Số thẻ sinh viên: 105140344
Ngành: Kỹ thuật điều khiển & tự động hóa

Tự động nhận dạng biển số xe bằng công nghệ trí tuệ nhân tạo
4.2 Đề tài thuộc diện: ☐ Có ký kết thỏa thuận sở hữu trí tuệ đối với kết quả thực hiện
4.3 Các số liệu và dữ liệu ban đầu:
……………………………………..……………………………………………..……...
...…………………………………………………………………………………………
…..………………………………….…..………………………..………………………
4.4 Nội dung các phần thuyết minh và tính toán:
…...………………………………………………………………………………………

…...………………………………………………………………………………………
…...………………………………………………………………………………………
…...………………………………………………………………………………………
…...………………………………………………………………………………………
4.5 Các bản vẽ, đồ thị ( ghi rõ các loại và kích thước bản vẽ ):
…...………………………………………………………………………………………
…...………………………………………………………………………………………
…...………………………………………………………………………………………
…...………………………………………………………………………………………
4.6 Họ tên người hướng dẫn: TS. Nguyễn Quốc Định
4.7 Ngày giao nhiệm vụ đồ án:
……../……./201…..
4.8 Ngày hoàn thành đồ án:
……../……./201…..
Đà Nẵng, ngày
tháng
năm 201
Trưởng Bộ môn ……………………..
Người hướng dẫn


LỜI NÓI ĐẦU
Ngày nay, việc nghiên cứu trí tuệ nhân tạo và đưa nó vào các ứng dụng thực tế đang
ngày càng nhiều, và ngày càng chứng tỏ được thế mạnh của mình trong các công việc
đòi hỏi khả năng suy nghĩ và tính toán giống như con người. Trong giao thông, trí tuệ
nhân tạo (AI) đã được sử dụng trong việc đếm xe, phân tích mật độ giao thông, dự báo
đông xe, tắc đường, phục vụ tối ưu hoá điều khiển đèn tín hiệu giao thông và ngày càng
phát triển. Và trong quá trình hoàn thành đề tài tốt nghiệp, bản thân em đã học hỏi được
rất nhiều kiến thức, kinh nghiệm quý báu trong khi thực hiện đề tài với sự giúp đỡ nhiệt
tình của các thầy cô trong bộ môn Tự Động Hóa - khoa Điện.

Tuy đã có nhiều cố gắng trong quá trình thực hiện đề tài nhưng sẽ không tránh khỏi
những sai sót, mong quý thầy cô bỏ qua và giúp đỡ để em có thể hoàn thành tốt nhiệm
vụ và củng cố kiến thức ngày càng vững vàng hơn nhằm trang bị những kiến thức cần
thiết để tạo bước đệm khi ra trường đi làm.
Em xin gửi lời cám ơn đến thầy Nguyễn Quốc Định, thầy là người đã hướng dẫn
tận tình và tạo mọi điều kiện thuận lợi cho em hoàn thành đồ án này.
Em cũng xin chân thành bày tỏ lòng biết ơn sâu sắc đến các Thầy Cô trong trường
Đại Học Bách Khoa- Đại Học Đà Nẵng đặc biệt là các Thầy Cô trong bộ môn Tự Động
Hóa đã truyền thụ những kiến thức quý báu cho em trong những năm học qua.
Em xin chân thành cảm ơn


CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng nhóm em và được sự
hướng dẫn của thầy Nguyễn Quốc Định. Các nội dung nghiên cứu, kết quả trong đề tài
này là trung thực và chưa công bố dưới bất kỳ hình thức nào trước đây. Các tài liệu tham
khảo trong đồ án đã được nêu rõ trong mục tài liệu tham khảo đảm bảo về liêm chính
học thuật.
Sinh viên thực hiện


MỤC LỤC
Chương 1: Tổng quan về đề tài

Trang

1.1. Lý do chọn đề tài..................................................................................................... 2
1.1.1. Nhu cầu thực tế .................................................................................................. 2
1.1.2. Mong muốn mở mang kiến thức đối với lĩnh vực mới ..................................... 3
1.2. Phân tích ưu nhược điểm và so sánh giữa công nghệ trí tuệ nhân tạo với công

nghệ object motion ....................................................................................................... 3
1.2.1. Công nghệ object motion ................................................................................... 3
1.2.2. Công nghệ trí tuệ nhân tạo ................................................................................. 4
1.3. Một số khái niệm .................................................................................................... 5
1.3.1. Xử lý ảnh ............................................................................................................ 5
1.3.1.1. Khái niệm .................................................................................................... 5
1.3.1.2. Các phân ngành chính ................................................................................. 5
1.3.1.3. Ứng dụng ..................................................................................................... 5
1.3.2. Định dạng file ảnh .............................................................................................. 6
1.3.2.1. Khái niệm .................................................................................................... 6
1.3.2.2. Một số kiểu định dạng thường gặp.............................................................. 6
1.3.3. Ảnh số ................................................................................................................ 8
1.3.3.1. Một số khái niệm .......................................................................................... 8
1.3.3.2. Mô tả ảnh số ................................................................................................. 8
1.3.3.3. Một số loại ảnh số ........................................................................................ 9
1.4. Giới thiệu về công nghệ trí tuệ nhân tạo ............................................................ 11
1.4.1. Khái niệm ......................................................................................................... 11
1.4.2. Các trường phái trí tuệ nhân tạo ....................................................................... 11
1.4.3. Ứng dụng của trí tuệ nhân tạo .......................................................................... 12
1.5. Giới thiệu về phần mềm matlab .......................................................................... 12
1.5.1. Khái quát .......................................................................................................... 12
1.5.2. Các phép tính toán phổ biến của matlab .......................................................... 13
1.5.3. Các tính năng của matlab ................................................................................. 13
1.5.4. Các ứng dụng của matlab ................................................................................. 13


Chương 2: Sơ lược về mạng neural và mạng neural tích chập

Trang


2.1. Sơ lược về mạng neural ........................................................................................ 14
2.1.1. Lịch sử phát triển của mạng neural .................................................................. 14
2.1.2. Mô hình mạng neural ....................................................................................... 16
2.1.2.1. Mô hình neural sinh học ............................................................................ 16
2.1.2.2. Mô hình neural nhân tạo ........................................................................... 17
2.1.3. Cấu trúc mạng neural ....................................................................................... 19
2.1.4. Các tính chất của mạng neural nhân tạo .......................................................... 21
2.1.5. Các luật học của mạng neural nhân tạo............................................................ 21
2.2. Mạng neural tích chập (CNNs) ........................................................................... 22
2.2.1. Định nghĩa mạng neural tích chập (CNNs) ...................................................... 22
2.2.2. Các thành phần của mạng neural tích chập (CNNs) ........................................ 22
Chương 3: Giải thuật và quy trình thực hiện

Trang

3.1. Giải thuật tổng quát ............................................................................................. 33
3.2. Quy trình thực hiện .............................................................................................. 34
3.2.1. Định vị và tách vùng chứa của biển số ra khỏi ảnh .......................................... 34
3.2.1.1. Mô tả ........................................................................................................... 34
3.2.1.2. Các bước thự hiện ....................................................................................... 34
3.2.1.3. Giải thuật của đoạn chương trình định vị và tách biển số .......................... 35
3.2.2 Định vị và tách từng ký tự trên biển số ............................................................. 37
3.2.2.1. Mô tả ........................................................................................................... 37
3.2.2.2. Các bước thự hiện ....................................................................................... 37
3.2.2.3. Giải thuật của đoạn chương trình định vị và tách từng ký tự trên biển số . 38
3.2.3. Xây dựng và huấn luyện mạng neural (CNNs) ................................................ 39
3.2.3.1. Xây dựng mạng neural (CNNs) .................................................................. 39
3.2.3.2. Huấn luyện mạng neural (CNNs) ............................................................... 40
Chương 4: Kết quả và hướng phát triển


Trang

4.1. Kết quả................................................................................................................... 41
4.2. Giới hạn của đề tài ................................................................................................ 43
4.2.1. Những giới hạn về các dụng cụ thiết bị ............................................................ 43
4.2.2. Những giới hạn về con người và thời gian ....................................................... 44
4.3. Hướng phát triển của đề tài ................................................................................. 44


DANH SÁCH CÁC BẢNG, HÌNH VẼ
Hình 1.1. Apple đang phát triển công nghệ nhận diện khuôn mặt ................................. 2
Hình 1.2. Hệ thống chấm điểm công dân ở Trung Quốc ................................................ 2
Hình 1.3. Giao thông thông minh .................................................................................... 3
Hình 1.4. Công nghệ object motion................................................................................. 3
Hình 1.5. Công nghệ trí tuệ nhân tạo .............................................................................. 4
Hình 1.6. Các định dạng file thông dụng......................................................................... 6
Hình 1.7. Một bức ảnh định dạng JPG ............................................................................ 6
Hình 1.8. Một bức ảnh định dạng PNG ........................................................................... 7
Hình 1.9. Một bức ảnh định dạng GIF ............................................................................ 7
Hình 1.10. Ảnh số là một ma trận các pixel .................................................................... 8
Hình 1.11. Một bức ảnh nhị phân .................................................................................... 9
Hình 1.12. Một bức ảnh xám ......................................................................................... 10
Hình 1.13. Một bức ảnh RGB ...................................................................................... 10
Hình 1.14. Công cụ toán học matlab ............................................................................ 12
Hình 2.1. Mô hình neural sinh học ............................................................................... 16
Hình 2.2. Mô hình neural nhân tạo ................................................................................ 17
Hình 2.3. Mạng neural 3 lớp.......................................................................................... 19
Hình 2.4. Sơ đồ cấu trúc một số mạng neural ............................................................... 20
Hình 2.5. Ví dụ minh họa về CNNs ............................................................................. 22
Hình 2.6. Có phải là X không? ...................................................................................... 23

Hình 2.7. Đặc điểm chung ............................................................................................. 23
Hình 2.8. Các feature khớp với phần trung tâm và phần cánh của X............................ 24
Hình 2.9. Tích chập ....................................................................................................... 24
Hình 2.10. Tính toán sự khớp ....................................................................................... 25
Hình 2.11. Gộp chung (pooling).................................................................................... 26
Hình 2.12. Tinh chỉnh các đơn vị tuyến tính (Rectified Linear Units) ......................... 27
Hình 2.13. Học sâu (Deep learning) ............................................................................. 27


Hình 2.14. CNN đào tạo nhận diện mặt người .............................................................. 28
Hình 2.15. Cuộc bầu chọn ............................................................................................. 28
Hình 2.16. Các layer được kết nối đầy đủ .................................................................... 29
Hình 2.17. Lan truyền ngược......................................................................................... 29
Hình 2.18. Phân loại dữ liệu khác ................................................................................. 31
Hình 2.19. Phân loại dữ liệu khách hàng....................................................................... 31
Hình 3.1. Giải thuật tổng quát của đề tài ....................................................................... 33
Hình 3.2. Tách biển số ................................................................................................... 34
Hình 3.3. Các biến đổi ảnh của quá trính tách biển số .................................................. 34
Hình 3.4. Giải thuật của đoạn chương trình định vị và tách biển số ............................ 36
Hình 3.5. Định vị và tách từng ký tự ............................................................................. 37
Hình 3.6. Giải thuật của đoạn chương trình định vị và tách từng ký tự của biển số ..... 38
Hình 3.7. Các thành phần của mạng neural CNNs ........................................................ 39
Hình 3.8. Huấn luyện mạng neural CNNs ..................................................................... 40
Hình 4.1. Kết quả mô phỏng biển số xe ‘51A – 212.18’............................................... 41
Hình 4.2. Kết quả mô phỏng biển số xe ‘51A – 175.56’............................................... 42
Hình 4.3. Kết quả mô phỏng biển số xe ‘43A – 339.94’............................................... 42
Hình 4.4. Kết quả mô phỏng biển số xe ‘99K – 9999’.................................................. 43

DANH SÁCH CÁC CỤM TỪ VIẾT TẮT
1. JPEG - Joint Photographic Experts Group ....................................................................

2. PNG - Portable Network Graphics ................................................................................
3. GIF - Graphics Interchange Format ..............................................................................
4. AI - Artificial Intelligence .............................................................................................
5. CNN - Convolutional Neural Network


TÀI LIỆU THAM KHẢO

[1]
[2] Computer Vision System Toolbox™ User's Guide: [Online]
/>[3] Introducing Deep Learning with MATLAB – MathWorks: [Online]
/>[4]Convolutional Neural Network:
/>[5] Computer Vision Toolbox:
/>

Tự động nhận dạng biển số xe bằng công nghệ trí tuệ nhân tạo

MỞ ĐẦU


-

Mục đích thực hiện đề tài:
Hoàn thành đồ án tốt nghiệp, kết thúc khóa học.
Nâng cao kiến thức, kỹ năng.

-

Mục tiêu thực hiện đề tài:
Xử lý nhận dạng được biển số xe bằng công nghệ trí tuệ nhân tạo.

Tăng độ chính xác, giảm sai số.

-

Phạm vi và đối tượng nghiên cứu:
Xử lý ảnh.
Công nghệ trí tuệ nhân tạo.







Phương pháp nghiên cứu:
Sử dụng phương pháp phân tích và tổng hợp lý thuyết.



Cấu trúc đồ án tốt nghiệp:
Các thông tin bổ trợ.
Nội dung chính (gồm 4 chương).

-

Sinh viên thực hiện : Hoàng Đức Nhật
Dương Đức Khải

Giáo viên hướng dẫn : TS. Nguyễn Quốc Định


1


Tự động nhận dạng biển số xe bằng công nghệ trí tuệ nhân tạo

Chương 1: TỔNG QUAN VỀ ĐỀ TÀI

1.1. Lý do chọn đề tài
1.1.1. Nhu cầu thực tế
Cùng với sự phát triển của khoa học kỹ thuật, nhu cầu quản lý & kiểm soát xe cộ,
máy móc, con người và xã hội ngày càng cao.

Hình 1.1. Apple đang phát triển công nghệ nhận diện khuôn mặt

Hình 1.2. Hệ thống chấm điểm công dân ở Trung Quốc

Với sự phức tạp vốn có và tăng không ngừng của các đối tượng, việc quản lý còn
gặp vô vàn khó khăn, trở ngại. Do đó, nhu cầu thực tế về một hệ thống quản lý & kiểm
soát tự động sử dụng công nghệ cao để giải quyết những vấn đề đó là vô cùng cần thiết
và cấp bách.
Sinh viên thực hiện : Hoàng Đức Nhật
Dương Đức Khải

Giáo viên hướng dẫn : TS. Nguyễn Quốc Định

2


Tự động nhận dạng biển số xe bằng công nghệ trí tuệ nhân tạo


1.1.2. Mong muốn mở mang kiến thức đối với lĩnh vực mới
Một trong những vấn đề khá nóng hổi của nước ta là công tác quản lý giao thông
đô thị. Với sự giới thiệu và giúp đỡ định hướng của thầy TS.Nguyễn Quốc Định về một
dự án giao thông thông minh đang được nghiên cứu, tiến hành ở TP.Hồ Chí Minh và
với nhu cầu của cá nhân mỗi thành viên, nhóm của em đã lựa chọn đề tài “Tự động
nhận dạng biển số xe bằng công nghệ trí tuệ nhân tạo” với mục tiêu hoàn thành đồ
án tốt nghiệp và mở mang kiến thức trong một lĩnh vực vô cùng mới mẻ.

Hình 1.3. Giao thông thông minh

1.2. Phân tích ưu nhược điểm và so sánh giữa công nghệ trí tuệ nhân tạo với công
nghệ object motion
1.2.1. Công nghệ object motion
 Công nghệ object motion được áp dụng khá phổ biến trong nhiều lĩnh vực
như bán lẻ, an ninh, giao thông…
Công nghệ sử dụng các thuật toán lọc các lớp hình ảnh và tìm ra đặc trưng của
object. Các đối tượng object được định nghĩa, gán thông qua object referience, có kích
thước (diện tích, chiều cao, chiều rộng), vận tốc di chuyển…
Ví dụ: Người được tham chiếu qua object referience với chiều cao từ 0,5 đến 2m,
chiều rộng khoảng 0.5m, có tốc độ di chuyển nhỏ hơn 30 km/h. Các object khi gán đối
tượng là nhóm người, ô tô, xe tải, xe máy, vật thể cũng được định nghĩa theo các đặc
tính chiều cao, diện tích, tốc độ phù hợp

Hình 1.4. Công nghệ object motion
Sinh viên thực hiện : Hoàng Đức Nhật
Dương Đức Khải

Giáo viên hướng dẫn : TS. Nguyễn Quốc Định

3



Tự động nhận dạng biển số xe bằng công nghệ trí tuệ nhân tạo




-

-

-

Ưu điểm:
Công nghệ sử dụng thuật toán đơn giản và tính toán không lớn nên có ưu
điểm sử dụng ít tài nguyên, giá thành hệ thống phấn cứng không quá đắt, có
thể phân tích được tại camera hoặc tại trung tâm quản lý.
Nhược điểm:
Do công nghệ định nghĩa các object thông qua object referience và các thuộc
tính như chiều cao, chiều rộng, kích thước, tốc độ… nên đây chính là điểm
yếu cốt tử của công nghệ này.
Các object được gán thuộc tính như vậy sẽ làm cho số lượng object có thể
phân loại được ít hơn do số lượng thuộc tính ít, khó phân loại. Đặc biệt khả
năng nâng cấp nhận biết thêm nhiều object bị giới hạn, phải chờ đợi và tốn
nhiều nguồn lực cho việc lập trình và phát triển.
Với các object có các thuộc tính tương tự như vậy nên hệ thống bị nhầm lẫn
dẫn đến kết quả phân tích bị sai. Thực tiễn đã có rất nhiều trường hợp sai dẫn
đến các cảnh báo giả gây phiền nhiễu cho khách hàng trong phân tích như:
các con vật như Chó, mèo, chuột, côn trùng, lá cây…chuyển động. Đếm xe,
phân tích khi mật độ giao thông đông, thời tiết xấu, đếm người sai khi siêu thị

đông người…

1.2.2. Công nghệ trí tuệ nhân tạo
 Công nghệ Trí tuệ nhân tạo là công nghệ mới nhất và cao cấp nhất hiện nay,
nó được ứng dụng ngày càng rộng rãi và mang lại nhiều lợi ích vô hạn.

Hình 1.5. Công nghệ trí tuệ nhân tạo


-

Một số ứng dụng:
Ứng dụng trong phân tích y tế, phát hiện gãy xương, ung thư,…
Ứng dụng để quản lý con người, giao thông, xã hội.
Ứng dụng phân tích, cảnh báo trong bảo vệ an ninh.
Ứng dụng trong giáo dục,…

Sinh viên thực hiện : Hoàng Đức Nhật
Dương Đức Khải

Giáo viên hướng dẫn : TS. Nguyễn Quốc Định

4


Tự động nhận dạng biển số xe bằng công nghệ trí tuệ nhân tạo


-


-


-

-

Ưu điểm:
Điểm nổi trội nhất của công nghệ này chính là khả năng học tập và phát triển
như một bộ não con người thực sự, điều này giúp cho hệ thống tiến hóa theo
thời gian. Với lượng dữ liệu, các tình huống trong cuộc sống, các sự kiện…
hàng ngày do các hoạt động của con người tạo ra sẽ được thu thập, học tập và
khai thác, hệ thống sẽ ngày càng giúp ích và tập trung hóa mang lại nhiều lợi
ích cho người dùng.
Các vấn đề cốt tử của công nghệ cũ như Object motion phải được định nghĩa
gán thuộc tính, hay nhận diện sai (do object có ít thuộc tính và thuộc tính phân
loại trùng nhau rất nhiều) được giải quyết đơn giản bằng cách cho hệ thống
học, việc học rất dễ dàng không cần phải lập trình hệ thống.
Khả năng tự động hóa, tiến hóa cao và nhanh giúp chi phí ngày càng giảm.
Nhược điểm:
Hệ thống dùng nhiều dữ liệu để học tập nên đôi khi không thông minh ngay
được, không sử dụng tức thời được, đây là ưu điểm nhưng cũng là nhược
điểm.
Do hệ thống học tập và phân loại chính xác nên đòi hỏi nền tảng hạ tầng phục
vụ cho năng lực tính toán cao nên chi phí đầu tư ban đầu sẽ lớn, tuy nhiên lợi
ích lâu dài sẽ rất lớn.

1.3. Một số khái niệm
1.3.1. Xử lý ảnh
1.3.1.1.


Khái niệm

Xử lý ảnh là một phân ngành trong xử lý số tín hiệu với tín hiệu xử lý là ảnh.
Đây là một phân ngành khoa học mới rất phát triển trong những năm gần đây.
1.3.1.2.

1.3.1.3.

-

Các phân ngành chính
Xử lý ảnh gồm 4 lĩnh vực chính:
Xử lý nâng cao chất lượng ảnh.
Nén ảnh.
Truy vấn ảnh.
Nhận dạng ảnh.
Ứng dụng
Ngày nay xử lý ảnh đã được áp dụng rất rộng rãi trong khoa học, xã hội và
gần gũi với đời sống, sinh hoạt con người như:
Photoshop
Nén và giải nén ảnh và video,…
Nhận dạng biển số xe, khuôn mặt, chữ viết,…
Xử lý ảnh trong thiên văn và y tế,…

Sinh viên thực hiện : Hoàng Đức Nhật
Dương Đức Khải

Giáo viên hướng dẫn : TS. Nguyễn Quốc Định


5


Tự động nhận dạng biển số xe bằng công nghệ trí tuệ nhân tạo

1.3.2. Định dạng file ảnh
1.3.2.1.

Khái niệm

Định dạng file ảnh là một cách chuẩn để thông tin được mã hóa trong việc lưu trữ
các file ảnh.
Một hình ảnh có thể có rất nhiều kiểu định dạng khác nhau và phổ biến nhất mà
chúng ta vẫn hay gặp đó là các định dạng như *.JPG, *.PNG, *.GIF, *.TIFF và *.BMP.
Những định dạng hình ảnh này có các thuộc tính khác nhau và được tạo ra để sử dụng
vào những mục đích khác nhau.

Hình 1.6. Các định dạng file thông dụng

1.3.2.2.

Một số kiểu định dạng thường gặp

 Định dạng JPG (hoặc JPEG):
JPG, hay còn được gọi là JPEG, viết tắt của Joint Photographic Experts Group, là
một trong những định dạng hình ảnh phổ biến hiện nay. Mỗi hình ảnh JPG có thể thể
hiện đến 16 triệu màu. Định dạng này được lưu với thuật toán nén Lossy, khi đó, chất
lượng hình ảnh cũng như kích thước tập tin bị giảm đáng kể. JPG hiện là chuẩn hình
ảnh được sử dụng nhiều nhất trên các máy ảnh hiện nay.


Hình 1.7. Một bức ảnh định dạng JPG
Sinh viên thực hiện : Hoàng Đức Nhật
Dương Đức Khải

Giáo viên hướng dẫn : TS. Nguyễn Quốc Định

6


Tự động nhận dạng biển số xe bằng công nghệ trí tuệ nhân tạo

 Định dạng PNG:
PNG là viết tắc của Portable Network Graphics, là một định dạng hình ảnh mà sử
dụng phương pháp nén dữ liệu mới mà không giảm chất lượng, được tạo ra nhằm thay
thế cho file GIF và đang được sử dụng nhiều trên Internet. Có 2 định dạng PNG khác
nhau là PNG-8 và PNG-24. PNG-8 tương đương với định dạng GIF, hỗ trợ 256 màu,
màu trong suốt, đồng thời còn có dung lượng rất nhỏ (thậm chí còn nhỏ hơn file GIF).
Trong khi đó, PNG-24 có thể gồm 26 triệu màu và được nén theo chuẩn Lossless, có
nghĩa là file sẽ lớn hơn JPG.

Hình 1.8. Một bức ảnh định dạng PNG



Định dạng GIF:

GIF là viết tắt của Graphics Interchange Format, một định dạng hình ảnh được tạo
ra bởi CompuServe. GIF sử dụng thuật nén theo chuẩn Lossless nên không bị mất dữ
liệu khi nén. Mỗi hình ảnh GIF có thể bao gồm tối đa 256 màu. Vì hỗ trợ ít màu nên file
GIF thường có dung lượng nhỏ hơn JPG rất nhiều.

Đặc biệt, file GIF có khả năng lưu lại màu trong suốt và hỗ trợ hình ảnh động. File
GIF thường sử dụng với những hình ảnh đơn giản, ít màu sắc, hình động hay những icon
nhỏ.

Hình 1.9. Một bức ảnh định dạng GIF
Sinh viên thực hiện : Hoàng Đức Nhật
Dương Đức Khải

Giáo viên hướng dẫn : TS. Nguyễn Quốc Định

7


Tự động nhận dạng biển số xe bằng công nghệ trí tuệ nhân tạo

1.3.3. Ảnh số
1.3.3.1.







1.3.3.2.

Một số Khái niệm
Ảnh số: là tập hợp hữu hạn các điểm ảnh với mức xám phù hợp dùng để mô
tả ảnh gần với ảnh thật. Số điểm ảnh xác định độ phân giải của ảnh. Ảnh có
độ phân giải càng cao thì càng thể hiện rõ nét các đặt điểm của tấm hình đồng

thời càng làm cho tấm ảnh trở nên thực và sắc nét hơn.
Điểm ảnh (Pixel): là một phần tử của ảnh số tại toạ độ (x, y) với độ xám
hoặc màu nhất định. Kích thước và khoảng cách giữa các điểm ảnh đó được
chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và
mức xám (hoặc màu) của ảnh số gần như ảnh thật. Mỗi phần tử trong ma trận
được gọi là một phần tử ảnh.
Mức xám: Là kết quả của sự biến đổi tương ứng 1 giá trị độ sáng của 1
điểm ảnh với 1 giá trị nguyên dương. Thông thường nó xác định trong [0,
255] tuỳ thuộc vào giá trị mà mỗi điểm ảnh được biểu diễn. Các thang giá
trị mức xám thông thường: 16, 32, 64, 128, 256 (Mức 256 là mức phổ dụng.
Lý do: từ kỹ thuật máy tính dùng 1 byte (8 bit) để biểu diễn mức xám. Mức
xám dùng 1 byte biểu diễn gồm 256 mức, tức là từ 0 đến 255).
Độ phân giải (Resolution): là mật độ điểm ảnh được ấn định trên một ảnh
số được hiển thị.
Mô tả ảnh số

Chiều rộng (Width - đơn vị là pixel)

...
...
...
...
...

...
...
...
...
...


...
...
...
...
...

A1j
A2j
A3j
...
Aij

Chiều cao (Height - đơn vị là
pixel)

A11 A12 A13
A21 A22 A23
A31 A32 A33
... ... ...
Ai1 Ai2 Ai3

Hình 1.10. Ảnh số là một ma trận các pixel

Sinh viên thực hiện : Hoàng Đức Nhật
Dương Đức Khải

Giáo viên hướng dẫn : TS. Nguyễn Quốc Định

8



Tự động nhận dạng biển số xe bằng công nghệ trí tuệ nhân tạo

-

1.3.3.3.


Ảnh số được xem là một ma trận mà trong đó mỗi pixel sẽ ứng với một phần
tử của ma trận.
Chiều dài và chiều rộng (đơn vị pixel) của ảnh cũng chính là chiều dài và
chiều rộng (đơn vị phần tử) của ma trận đó.
Trong hình trên mô tả một ma trận hai chiều, với mỗi phần tử Aij là một
pixel của ảnh hay còn gọi là điểm ảnh. Mỗi pixel chứa thông tin về tọa độ
của nó và cường độ sáng. Một ảnh chứa càng nhiều pixel thì càng trở nên
chi tiết và ấn tượng hơn. Số pixel trong một ảnh chính bằng tích của chiều
dài nhân với chiều rộng theo đơn vị pixel (ixj).
Tùy vào số chiều của ma trận và mức xám mà ta có nhiều loại ảnh số khác
nhau. Ví dụ như ảnh đen trắng, ảnh xám và ảnh RGB,…
Một số loại ảnh số
Ảnh nhị phân:

Là ma trận hai chiều có giá trị xám của tất cả các điểm ảnh chỉ nhận giá trị 1 hoặc
0. Như vậy mỗi điểm ảnh trong ảnh nhị phân được biểu diễn bởi 1 bit.

Hình 1.11. Một bức ảnh nhị phân

Sinh viên thực hiện : Hoàng Đức Nhật
Dương Đức Khải


Giáo viên hướng dẫn : TS. Nguyễn Quốc Định

9


Tự động nhận dạng biển số xe bằng công nghệ trí tuệ nhân tạo



Ảnh xám:

Là ma trận hai chiều có giá trị xám của tất cả các điểm ảnh nằm trong khoảng
[0, 255]. Như vậy mỗi điểm ảnh trong ảnh xám được biểu diễn bởi 1 byte.

Hình 1.12. Một bức ảnh xám

 Ảnh RGB (ảnh màu):
- Trong ảnh RGB kiểu 24bpp, mỗi điểm ảnh có chứa giá trị gồm 3 màu đỏ
(red) + xanh lục (green) + xanh dương (blue), mỗi màu có giá trị từ 0 đến
255 thể hiện cường độ màu của màu đó, nghĩa là mỗi điểm ảnh cần 24bits
hay 3bytes để biểu diễn và màu sắc của điểm ảnh đó chính là sự pha trộn của
3 giá trị màu của nó.
- Đơn vị bpp nghĩa là Bits per pixel.
Ví dụ: 24 Bits per pixel nghĩa là một điểm ảnh được biểu diễn bằng 24 pixel.
=> với kiểu 24bpp thì ta có tối đa 16.777.216 (256x256x256) màu

Hình 1.13. Một bức ảnh RGB

- Một số màu RGB:
(0, 0, 0) là màu đen

(255, 255, 255) là màu trắng
(255, 0, 0) là màu đỏ
(0, 255, 0) là màu xanh lục
(0, 0, 255) là màu xanh lam
(255, 255, 0) là màu vàng
(0, 255, 255) là màu xanh ngọc
(255, 0, 255) là màu hồng cánh sen
Sinh viên thực hiện : Hoàng Đức Nhật
Dương Đức Khải

Giáo viên hướng dẫn : TS. Nguyễn Quốc Định

10


Tự động nhận dạng biển số xe bằng công nghệ trí tuệ nhân tạo

1.4. Giới thiệu về công nghệ trí tuệ nhân tạo
1.4.1. Khái niệm
Trí tuệ nhân tạo hay trí thông minh nhân tạo (Artificial Intelligence hay Machine
Intelligence, thường được viết tắt là AI) là trí tuệ được biểu diễn bởi bất cứ một hệ thống
nhân tạo nào. Thuật ngữ này thường dùng để nói đến các máy tính có mục đích không
nhất định và ngành khoa học nghiên cứu về các lý thuyết và ứng dụng của trí tuệ nhân
tạo.
Tuy rằng trí thông minh nhân tạo có nghĩa rộng như là trí thông minh trong các tác
phẩm khoa học viễn tưởng, nó là một trong những ngành trọng yếu của tin học. Trí thông
minh nhân tạo liên quan đến cách cư xử, sự học hỏi và khả năng thích ứng thông minh
của máy móc. Các ví dụ ứng dụng bao gồm các tác vụ điều khiển, lập kế hoạch và lập
lịch (scheduling), khả năng trả lời các câu hỏi về chẩn đoán bệnh, trả lời khách hàng về
các sản phẩm của một công ty, nhận dạng chữ viết tay, nhận dạng tiếng nói và khuôn

mặt. Bởi vậy, trí thông minh nhân tạo đã trở thành một môn học, với mục đích chính là
cung cấp lời giải cho các vấn đề của cuộc sống thực tế. Ngày nay, các hệ thống nhân tạo
được dùng thường xuyên trong kinh tế, y dược, các ngành kỹ thuật và quân sự, cũng như
trong các phần mềm máy tính thông dụng trong gia đình và trò chơi điện tử.
1.4.2. Các trường phái trí tuệ nhân tạo
Trí tuệ nhân tạo (AI) chia thành hai trường phái tư duy: Trí tuệ nhân tạo truyền
thống và Trí tuệ tính toán.


-

-

Trí tuệ nhân tạo truyền thống hầu như bao gồm các phương pháp hiện được
phân loại là các phương pháp học máy (machine learning), đặc trưng bởi hệ
hình thức (formalism) và phân tích thống kê. Nó còn được biết với các tên
Trí tuệ nhân tạo biểu tượng, Trí tuệ nhân tạo logic, Trí tuệ nhân tạo ngăn
nắp (neat AI) và Trí tuệ nhân tạo cổ điển (Good Old Fashioned Artificial
Intelligence). Các phương pháp gồm có:
Hệ chuyên gia: áp dụng các khả năng suy luận để đạt tới một kết luận. Một
hệ chuyên gia có thể xử lý các lượng lớn thông tin đã biết và đưa ra các kết
luận dựa trên các thông tin đó.
Lập luận theo tình huống.
Mạng Bayes.



Trí tuệ tính toán nghiên cứu việc học hoặc phát triển lặp (ví dụ: tinh chỉnh
tham số trong hệ thống, chẳng hạn hệ thống connectionist). Việc học dựa
trên dữ liệu kinh nghiệm và có quan hệ với Trí tuệ nhân tạo phi ký

hiệu, Trí tuệ nhân tạo lộn xộn (scruffy AI) và tính toán mềm (soft
computing). Các phương pháp chính gồm có:

-

Mạng neural: các hệ thống mạnh về nhận dạng mẫu (pattern recognition).
Hệ mờ (Fuzzy system): các kỹ thuật suy luận không chắc chắn, đã được sử
dụng rộng rãi trong các hệ thống công nghiệp hiện đại và các hệ thống quản
lý sản phẩm tiêu dùng.
Tính toán tiến hóa (Evolutionary computation): ứng dụng các khái niệm sinh
học như quần thể, biến dị và đấu tranh sinh tồn để sinh các lời giải ngày càng

-

Sinh viên thực hiện : Hoàng Đức Nhật
Dương Đức Khải

Giáo viên hướng dẫn : TS. Nguyễn Quốc Định

11


Tự động nhận dạng biển số xe bằng công nghệ trí tuệ nhân tạo

-

tốt hơn cho bài toán. Các phương pháp này thường được chia thành các thuật
toán tiến hóa (ví dụ thuật toán gene) và trí tuệ bầy đàn (swarm intelligence)
(chẳng hạn hệ kiến).
Trí tuệ nhân tạo dựa hành vi (Behavior based AI): một phương pháp module

để xây dựng các hệ thống trí tuệ nhân tạo bằng tay.

1.4.3. Ứng dụng của trí tuệ nhân tạo


Trí tuệ nhân tạo (AI) được tạo ra nhằm trợ giúp hoặc thay thế con người ở rất
nhiều lĩnh vực vì thế nó được ứng dụng rất rộng rãi trong:
- Công nghiệp.
- Y tế: Chăm sóc sức khỏe, chuẩn đoán bệnh.
- Giao thông.
- Ngành luật.
- Quân sự.
- Các ứng dụng và trò chơi.
……..
 Trí tuệ nhân tạo đang là mục tiêu theo đuổi của nhiều ông lớn:
- Google đã và đang ứng dụng AI vào lĩnh vực xe tự hành.
- Google ứng dụng AI trong việc nhận diện giọng nói...
- Facebook sử dụng trí tuệ nhân tạo trong việc nhận diện hình ảnh.
- Microsoft đang theo đuổi dự án điều trị ung thư bằng trí trí tuệ nhân tạo.
1.5. Giới thiệu về phần mềm matlab
1.5.1. Khái quát
MATLAB là phần mềm cung cấp môi trường tính toán số và lập trình, do công
ty MathWorks thiết kế. MATLAB cho phép tính toán số với ma trận, vẽ đồ thị hàm
số hay biểu đồ thông tin, thực hiện thuật toán, tạo các giao diện người dùng và liên kết
với những chương trình máy tính viết trên nhiều ngôn ngữ lập trình khác.
Với thư viện Toolbox, MATLAB cho phép mô phỏng tính toán, thực nghiệm
nhiều mô hình trong thực tế và kỹ thuật.

Hình 1.14. Công cụ toán học matlab
Sinh viên thực hiện : Hoàng Đức Nhật

Dương Đức Khải

Giáo viên hướng dẫn : TS. Nguyễn Quốc Định

12


Tự động nhận dạng biển số xe bằng công nghệ trí tuệ nhân tạo

1.5.2. Các phép tính toán phổ biến của matlab

-

MATLAB được sử dụng rộng rãi trong mọi khía cạnh tính toán. Dưới đây là
một số phép tính toán MATLAB được sử dụng phổ biến nhất:
Giải quyết các vấn đề ma trận và mảng.
Đồ thị 2-D và 3-D.
Đại số tuyến tính.
Phương trình đại số.
Các hàm phi tuyến tính.
Số liệu thống kê.
Phân tích dữ liệu.
Giải tích và phương trình vi phân.
Tính toán số.
Tích phân.
Chuyển đổi.
Hồi quy.
Các hàm đặc biệt khác.

1.5.3. Các tính năng của matlab


-

-

Dưới đây là các tính năng cơ bản của MATLAB:
MATLAB là ngôn ngữ lập trình cao cấp, cho phép tính toán các con số, hình
dung và phát triển ứng dụng.
Cung cấp môi trường tương tác để khảo sát, thiết kế và giải quyết các vấn
đề.
Cung cấp thư viện lớn các hàm toán học cho đại số tuyến tín, thống kê, phân
tích Fourier, bộ lọc, tối ưu hóa, tích phân và giải các phương trình vi phân
bình thường.
MATLAB cung cấp các đồ thị được tích hợp sẵn để hiển thị hình ảnh dữ liệu
và các công cụ để tạo đồ thị tùy chỉnh.
Giao diện lập trình của MATLAB cung cấp các công cụ phát triển để nâng
cao khả năng bảo trì chất lượng mã và tối đa hóa hiệu suất.
Cung cấp các công cụ để xây dựng các ứng dụng với các giao diện đồ họa tùy
chỉnh.
Cung cấp các hàm để tích hợp các thuật toán dựa trên MATLAB với các ứng
dụng bên ngoài và các ngôn ngữ khác như C, Java, NET và Microsoft Excel.

1.5.4. Các ứng dụng của matlab


-

MATLAB được sử dụng rộng rãi như công cụ tính toán trong các lĩnh vực
khoa học và kỹ thuật, bao gồm các lĩnh vực vật lý, hóa học, toán học và công
nghệ. MATLAB được sử dụng trong một loạt các ứng dụng bao gồm:

Xử lý tín hiệu và truyền thông.
Xử lý hình ảnh và video.
Hệ thống điều khiển.
Kiểm tra và đo lường.
Tính toán tài chính.
Tính toán sinh học.

Sinh viên thực hiện : Hoàng Đức Nhật
Dương Đức Khải

Giáo viên hướng dẫn : TS. Nguyễn Quốc Định

13


Tự động nhận dạng biển số xe bằng công nghệ trí tuệ nhân tạo

Chương 2: Sơ lược về mạng neural và mạng neural tích chập

2.1. Sơ lược về mạng neural
2.1.1. Lịch sử phát triển của mạng neural
Các nghiên cứu về bộ não con người đã được tiến hành từ hàng nghìn năm nay.
Cùng với sự phát triển của khoa học kĩ thuật đặc biệt là những tiến bộ trong ngành điện
tử hiện đại, việc con người bắt đầu nghiên cứu các nơron nhân tạo là hoàn toàn tự nhiên.
Sự kiện đầu tiên đánh dấu sự ra đời của mạng nơron nhân tạo diễn ra vào năm 1943 khi
nhà thần kinh học Warren McCulloch và nhà toán học Walter Pitts viết bài báo mô tả
cách thức các nơron hoạt động. Họ cũng đã tiến hành xây dựng một mạng nơron đơn
giản bằng các mạch điện. Các nơron của họ được xem như là các thiết bị nhị phân với
ngưỡng cố định. Kết quả của các mô hình này là các hàm logic đơn giản chẳng hạn như
“ a OR b” hay “a AND b”.

Tiếp bước các nghiên cứu này, năm 1949 Donald Hebb cho xuất bản cuốn sách
Organization of Behavior. Cuốn sách đã chỉ ra rằng các nơron nhân tạo sẽ trở nên hiệu
quả hơn sau mỗi lần chúng được sử dụng.
Những tiến bộ của máy tính đầu những năm 1950 giúp cho việc mô hình hóa các
nguyên lý của những lý thuyết liên quan tới cách thức con người suy nghĩ đã trở thành
hiện thực. Nathanial Rochester sau nhiều năm làm việc tại các phòng thí nghiệm nghiên
cứu của IBM đã có những nỗ lực đầu tiên để mô phỏng một mạng nơron. Trong thời kì
này tính toán truyền thống đã đạt được những thành công rực rỡ trong khi đó những
nghiên cứu về nơron còn ở giai đoạn sơ khai. Mặc dù vậy những người ủng hộ triết lý
“thinking machines” (các máy biết suy nghĩ) vẫn tiếp tục bảo vệ cho lập trường của
mình.
Năm 1956, dự án Dartmouth nghiên cứu về trí tuệ nhân tạo (Artificial Intelligence)
đã mở ra thời kỳ phát triển mới cả trong lĩnh vực trí tuệ nhân tạo lẫn mạng nơron. Tác
động tích cực của nó là thúc đẩy hơn nữa sự quan tâm của các nhà khoa học về trí tuệ
nhân tạo và quá trình xử lý ở mức đơn giản của mạng nơron trong bộ não con người.
Những năm tiếp theo của dự án Dartmouth, John von Neumann đã đề xuất việc mô
phỏng các nơron đơn giản bằng cách sử dụng rơle điện áp hoặc đèn chân không. Nhà
sinh học chuyên nghiên cứu về nơron Frank Rosenblatt cũng bắt đầu nghiên cứu về
Perceptron. Sau thời gian nghiên cứu này Perceptron đã được cài đặt trong phần cứng
máy tính và được xem như là mạng nơron lâu đời nhất còn được sử dụng đến ngày nay.
Perceptron một tầng rất hữu ích trong việc phân loại một tập các đầu vào có giá trị liên
tục vào một trong hai lớp. Perceptron tính tổng có trọng số các đầu vào, rồi trừ tổng này
cho một ngưỡng và cho ra một trong hai giá trị mong muốn có thể. Tuy nhiên Perceptron
còn rất nhiều hạn chế, những hạn chế này đã được chỉ ra trong cuốn sách về Perceptron
của Marvin Minsky và Seymour Papert viết năm 1969.
Năm 1959, Bernard Widrow và Marcian Hoff thuộc trường đại học Stanford đã xây
dựng mô hình ADALINE (ADAptive LINear Elements) và MADALINE. (Multiple
ADAptive LINear Elements). Các mô hình này sử dụng quy tắc học Least-MeanSquares (LMS: Tối thiểu bình phương trung bình). MADALINE là mạng nơron đầu tiên
Sinh viên thực hiện : Hoàng Đức Nhật
Dương Đức Khải


Giáo viên hướng dẫn : TS. Nguyễn Quốc Định

14


×