Tải bản đầy đủ (.pdf) (53 trang)

Nghiên cứu nhận dạng biển số xe ứng dụng thuật toán lan truyền ngược

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.23 MB, 53 trang )

1

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC VINH
________________________________________________________________________________

ĐOÀN ANH TUẤN

NGHIÊN CỨU NHẬN DẠNG BIỂN SỐ XE
ỨNG DỤNG THUẬT TOÁN LAN TRUYỀN NGƢỢC

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

NGHỆ AN, 7/2018


2

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC VINH
________________________________________________________________________________

ĐOÀN ANH TUẤN

NGHIÊN CỨU NHẬN DẠNG BIỂN SỐ XE
ỨNG DỤNG THUẬT TOÁN LAN TRUYỀN NGƢỢC
Chuyên ngành: Công nghệ thông tin
Mã số: 8480201

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
Người hướng dẫn khoa học: TS. PHAN LÊ NA



NGHỆ AN, 7/2018


3

LỜI CAM ĐOAN
Tơi xin cam đoan đây là cơng trình nghiên cứu của riêng tôi dƣới sự hƣớng
dẫn của TS. Phan Lê Na. Các kết quả đạt đƣợc trong luận văn là sản phẩm của
riêng cá nhân, không sao chép của ngƣời khác. Nội dung của luận văn có tham khảo
và sử dụng một số thông tin, tài liệu từ các nguồn sách, tạp chí đƣợc liệt kê trong
danh mục các tài liệu tham khảo.
Tác giả

Đoàn Anh Tuấn


4

LỜI CẢM ƠN
Em xin tỏ lòng biết ơn sâu sắc đến cơ giáo TS. Phan Lê Na, ngƣời đã tận
tình giúp đỡ và truyền đạt nhiều kinh nghiệm để luận văn của bản thân tơi có thể
đƣợc thực hiện và hồn thành.
Em xin cảm ơn tồn thể thầy giáo, cơ giáo ở Viện kỹ Thuật Công nghệ
Trƣờng Đại học Vinh đã tận tình giảng dạy và hƣớng dẫn, trang bị cho em những
kiến thức cần thiết trong quá trình thực hiện luận văn thành công.
Nghệ An, tháng 6 năm 2018
Tác giả

Đoàn Anh Tuấn



5

MỤC LỤC

LỜI CAM ĐOAN ............................................................................................. 3
LỜI CẢM ƠN ................................................................................................... 4
DANH MỤC CÁC HÌNH ................................................................................. 7
MỞ ĐẦU ........................................................................................................... 9
1. Sự cần thiết của vấn đề nghiên cứu ...................................................................9
2. Mục tiêu nghiên cứu........................................................................................10

2.1. Mục tiêu tổng quát ............................................................................. 10
2.2. Mục tiêu cụ thể .................................................................................. 10
3. Đối tƣợng và phạm vi nghiên cứu ...................................................................10

3.1. Đối tƣợng nghiên cứu ........................................................................ 10
3.2. Phạm vi nghiên cứu ........................................................................... 10
4. Nội dung nghiên cứu .......................................................................................10
5. Kết cấu của luận văn .......................................................................................11

Chƣơng 1: TỔNG QUAN VỀ NHẬN DẠNG BIỂN SỐ XE......................... 12
1.1. Khái niệm về hệ thống nhận dạng biển số xe ..............................................12

1.1.1. Khái niệm ........................................................................................ 12
1.1.2. Lịch sử và phát triển ....................................................................... 12
1.1.3. Cách thức hoạt động của hệ thống nhận dạng biển số xe .............. 13
1.2. Phƣơng pháp nhận dạng biển số xe từ ảnh ..................................................13


1.2.1. Phương pháp chuyển đổi Hough .................................................... 14
1.2.2. Phương pháp CANDY..................................................................... 14
1.2.3. Phép biến đổi RADON để tìm góc nghiêm và xoay: ...................... 16
1.3. Phạm vi nghiên cứu và hƣớng giải quyết.....................................................17

1.3.1. Tiêu chuẩn về kích thước ................................................................ 18
1.3.2. Tiêu chuẩn về ký tự ......................................................................... 18
1.4. Kết luận chƣơng 1 .......................................................................................18

Chƣơng 2: CƠ SỞ LÝ THUYẾT MẠNG NƠRON NHÂN TẠO ................. 20
2.1. Khái niệm mạng nơron.................................................................................20

2.1.1. Sơ lược về nơron sinh học .............................................................. 20
2.1.2. Mạng nơron nhân tạo ...................................................................... 22
2.1.3. Cấu trúc mạng ................................................................................. 28
2.1.3.1. Mạng một lớp neuron .................................................................. 28
2.1.3.2. Mạng nhiều lớp neuron ............................................................... 29
2.2. Huấn luyện mạng nơron ...............................................................................30

2.2.1. Phương pháp học ............................................................................ 30
2.2.1.1. Học có giám sát ........................................................................... 31
2.2.1.2. Học khơng có giám sát ................................................................ 31
2.2.1.3. Học tăng cường ........................................................................... 31
2.3. Thuật toán lan truyền ngược Back Propagation ............................... 32


6

2.3.1. Mơ tả thuật tốn.............................................................................. 32
2.3.1.1. Chỉ số hiệu năng .......................................................................... 33

2.3.1.2. Luật xích ...................................................................................... 34
2.3.1.3. Lan truyền ngược độ nhạy cảm ................................................ 35
2.3.2. Sử dụng thuật toán lan truyền ngược ............................................. 38
2.3.2.1. Chọn lựa cấu trúc mạng .............................................................. 38
2.3.2.2. Sự hội tụ ....................................................................................... 40
2.3.2.3. Sự tổng quát hóa .......................................................................... 40
2.3.3. Một số biến thể của thuật toán lan truyền ngược ........................... 41
2.3.3.1. Sử dụng tham số bước đà (Momentum)....................................... 42
2.3.3.2. Sử dụng hệ số học biến đổi ......................................................... 42
2.4. Kết luận chƣơng 2 .......................................................................................43

Chƣơng 3: ỨNG DỤNG MẠNG NƠRON VÀ THUẬT TOÁN LAN
TRUYỀN NGƢỢC TRONG NHẬN DẠNG BIỂN SỐ XE .......................... 44
3.1. Tách biển số ra khỏi ảnh: .............................................................................44

3.2. Tách ký tự ra khỏi biển số ................................................................ 45
3.3. Xây dựng mơ hình mạng ..............................................................................48
3.4. Giới thiệu chƣơng trình ................................................................................49
3.5. Kết quả thực nghiệm nhận dạng biển số xe với mạng nơron ứng dụng thuật
toán lan truyền ngƣợc ..........................................................................................50
3.6. Kết luận chƣơng 3 .......................................................................................51

KẾT LUẬN ..................................................................................................... 52
TÀI LIỆU THAM KHẢO ............................................................................... 53


7

DANH MỤC CÁC HÌNH
Hình 1.1. Xác định đƣờng biên theo phƣơng pháp candy…………………………15

Hình 1.2. Phép biến đổi radon dƣới dạng hình học………………………………..16
Hình 1.3. Cách tính biến đổi Radon với góc quay θ……………………………….17
Hình 2.1. Mơ hình 2 nơron sinh học……………………………………………….21
Hình 2.2. Mơ hình nơron đơn giản……………………………………….………...22
Hình 2.3. Mạng nơron 3 lớp……………………………………………….……….22
Hình 2.4. Cấu trúc huấn luyện mạng nơron………………………….…………….23
Hình 2.5. Mơ hình nơron đơn giản…………….................................................24
Hình 2.6. Một số dạng hàm chuyển của mạng nơron……………….……………..25
Hình 2.7. Nơron với R đầu vào……………………………………….…….……...25
Hình 2.8. Ký hiệu nơron với R đầu vào……………………………….…………...26
Hình 2.9. Cấu trúc mạng nơron 1………………………………….………………27
Hình 2.10. Ký hiệu mạng R đầu vào và S nơron ………………….……………....28
Hình 2.11. Cấu trúc mạng nơron 3 lớp…………….…………….…………….…..29
Hình 2.12. Ký hiệu tắt mạng nơron 3 lớp…………………….……………….…..29
Hình 2.13. Mạng nơron truyền thẳng nhiều lớp sử dụng thuật học BP....................31
Hình 2.14 : Xấp xỉ hàm f ( x)  1  sin(

i
x) với 2  x  2 ……………………. 38
4

Hình 2.15. Ttrƣờng hợp i = 8 và số nơron lớp ẩn = 9………………………..…….39
Hình 3.1. Ảnh mức xám và ảnh nhị phân …………………………………..….….43
Hình 3.2. Lƣợc đồ Histogram & ảnh sử dụng phƣơng pháp dị biên Canny…..…. 43
Hình 3.3. Biển số sau khi đƣợc tách ra khỏi ảnh ……………………………..…...44
Hình 3.4. Kết quả của tách ký tự ra khỏi biển số:……………….………..………..46
Hình 3.5. Mơ hình mạng dùng để nhận dạng ký tự …………………………..……47
Hình 3.6: Giao diện chƣơng trình nhận dạng biển số xe …………………………..48
Hình 3.7: Kết quả chƣơng trình nhận dạng biển số xe …………………...………..49
Hình 3.8. Một số biển khơng phát hiện đƣợc biển số . ……………………..……..50



8

DANH MỤC CÁC BẢNG
Bảng 3.1. Kết quả nhận dạng biểu số …………………………………………… 51


9

MỞ ĐẦU
1. Sự cần thiết của vấn đề nghiên cứu
Khoa học công nghệ ngày càng phát triển vƣợt bậc nên các máy móc hiện
đại ngày càng nhiều, dẫn đến thơng tin thu nhận của con ngƣời ngày càng phong
phú, trong những thơng tin con ngƣời nhận đƣợc thì ảnh là một phần trong các dạng
thông tin. Hiên nay công việc xử lý ảnh là một trong những lĩnh vực ngày càng
đƣợc phổ biến, nó khơng chỉ chỉ dừng lại việc xử lý thơng thƣờng nhƣ: làm giảm
những vết nhịe, phục hồi những ảnh cũ. Với sự phát triển của kỹ thuật cơng nghệ
thì xử lý ảnh đã mang lại những nấc thang mới nhƣ nhận dạng nhận dạng đối
tƣợng.
Song song với sự đi lên của xã hội thì phƣơng tiện giao thơng ngày càng
tăng, cho nên nhu cầu kiểm sốt cũng nhƣ quản lý các phƣơng tiện giao thông ngày
càng đƣợc địi hỏi cấp thiết hơn, từ đó đặt ra vấn đề là xây dựng các hệ thống tự
động để giải quyết vấn đề này và một trong những vấn đề đó thì hệ thống “Nhận
dạng biển số xe”.
Hệ thống nhận dạng biển số xe là hệ thống thu nhận hình ảnh cũng nhƣ phân
tích các biển số xe một cách tự động. Nhận dạng biển số xe đƣợc ứng dụng rộng rãi
tại các nơi nhƣ: trạm kiểm soát cầu đƣờng bộ, bãi giữ xe tự động.
Trong các hệ thống tự động ln có u cầu về phần cứng và phần mềm, hệ
thống “Nhận dạng biển số xe” cũng phải có những u cầu nhƣ vậy. Trong hệ

thống này thì phần cứng cơ bản là một camera có nhiệm vụ thu nhận hình ảnh cịn
phần mềm sẽ có nhiệm vụ xử lý hình ảnh đó.
Với sự phát triển của cơng nghệ thì việc thu nhận ảnh của camera là khá dễ
dàng, nhƣng vấn đề đặt ra là hiệu quả xử lý ảnh trong hệ thống. Với hệ thống nàu
chúng tôi dùng phần mềm matlap để xử lý thu đƣợc.
Với vai trị đã phân tích ở trên thì luận văn này chủ yếu tập trung vào giải
quyết các vấn đề đặt ra là xử lý ảnh và cho kết quả là biển số chính xác bằng dạng
văn bản.


10

2. Mục tiêu nghiên cứu
2.1. Mục tiêu tổng quát
Nghiên cứu phƣơng pháp nhận dạng biển số xe bằng mạng nơron.
2.2. Mục tiêu cụ thể
Đề tài tập trung vào các mục tiêu sau:
- Nghiên cứu tổng quan về nhận dạng biển số xe bằng mạng nơron.
- Cài đặt thử nghiệm phƣơng pháp ứng dụng thuật toán lan truyền ngƣợc cho
nhận dạng biển số xe.
3. Đối tƣợng và phạm vi nghiên cứu
3.1. Đối tƣợng nghiên cứu
- Tập trung chính vào đối tƣợng nghiên cứu là kỷ thuật xử lý ảnh và mạng
nơron trên cơ sở nghiên cứu thuật toán nhận dạng biển số.
- Các vấn đề liên quan đến phƣơng pháp nhận dạng biển số xe.
- Thuật toán lan truyền ngƣợc.
3.2. Phạm vi nghiên cứu
- Tập trung xử lý biển số có chữ đen, nền trắng, có 2 hàng.
- Nghiên cứu chỉ xử lý trên biển số khơng bị tróc sơn hay rỉ sét, khơng bị che
khuất, khơng bị nhịe .

- Khi nghiên cứu chỉ tập trung các biển số có góc nghiêng tối đa không quá
450.
- Tập trung vào các ảnh khơng bị mờ, ký tự biển số cịn phân biệt, không bị
nhiễu bởi ánh sáng.
4. Nội dung nghiên cứu
- Nghiên cứu các kỹ thuật nhận dạng biển số xe dùng kỹ thuật xử lý ảnh và
mạng nơron. Đặt tiền đề nghiên cứu sâu hơn để đƣa ra các ứng dụng cụ thể.
- Xây dựng phƣơng pháp và thuật toán để thực hiện nhận dạng, qua đó
nghiên cứu các hạn chế và nhƣợc điểm của hệ thống để tiến hành tối ƣu.


11

5. Kết cấu của luận văn
Luận văn “Nghiên cứu nhận dạng biển số xe, ứng dụng thuật toán lan truyền
ngƣợc” đƣợc trình bày theo cấu trúc sau:
Chƣơng 1: Tổng quan về nhận dạng biển số xe.
Chƣơng 2: Cơ sở lý thuyết mạng nơron nhân tạo và thuật toán lan truyền
ngƣợc.
Chƣơng 3: Ứng dụng mạng nơron và thuật toán lan truyền ngƣợc trong nhận
dạng biển số xe.


12

Chƣơng 1: TỔNG QUAN VỀ NHẬN DẠNG BIỂN SỐ XE
1.1. Khái niệm về hệ thống nhận dạng biển số xe
1.1.1. Khái niệm
Hệ thống nhận dạng biển số xe là hệ thống có khả năng phân tích hình ảnh và
xác định vùng chứa biển số trên xe, thông qua video, thiết bị ghi hình và hình ảnh.

1.1.2. Lịch sử và phát triển
Năm 1992, công nghệ ALPR (Automatic License Plate Number) hay còn gọi
là tự động nhận dạng biển số xe, đƣợc phát triển tại Đại học Cambridge ở Vƣơng
quốc Anh để ứng phó với chủ nghĩa khủng bố.
Đến năm 1996, cơng nghệ ALPR đã đƣợc hồn thiện tại mỗi cổng phía tây
Vƣơng quốc Anh để đọc tất cả các biển đăng ký xe từ Ireland. Công nghệ ALPR
tiếp tục đƣợc nghiên cứu và phát triển tại Anh. Kể từ tháng ba năm 2006, hầu hết
các con đƣờng, các trung tâm thị trấn, cảng, trạm xăng của London đã đƣợc lắp đặt
camera chạy phần mềm ALPR.
Trên thế giới hiện nay, bài toán nhận dạng biển số xe đƣợc nghiên cứu và phát
triển một cách sâu rộng. Nhiều tác giả với các công trình nghiên cứu đƣợc cơng bố
với tỉ lệ nhận dạng ngày càng chính xác. Một số bài báo cáo nghiên cứu của các tác
giả tiêu biểu trong vài năm trở lại đây nhƣ:
Chirag N. Paunwala, 2010 [5] với nội dung: rút trích vùng số xe trong ảnh.
Ảnh đầu vào đƣợc tiền xử lý bằng cách phƣơng pháp nâng cao chất lƣợng ảnh, sau
đó tìm biên bằng Vertical Edge và xử lý một lần nữa bằng Opening và Closing. Các
vùng ứng viên sau đó đƣợc kiểm tra bằng thuật tốn scan theo dịng để tìm đƣợc
vùng chứa biển số xe chính xác. Kết quả nhận dạng 750 ảnh trong các điều kiện
khác nhau cho tỉ lệ 742/750 = 99.2.
Choo Kar Soon, 2012 [6] với nội dung: nhận dạng biển số xe tại Malaysia, sử
dụng giải thuật Adaboots để training tập dữ liệu gồm gần 100 ảnh biển số. Các ký
tự đƣợc nhận dạng bằng phƣơng pháp KNN. Kết quả nhận dạng biển số 98% và
nhận dạng ký tự 95% trên ảnh tĩnh.


13

Luận văn này nghiên cứu nhận dạng biển số xe ứng dụng mạng nơron với
thuật toán lan truyền ngƣợc. Trong bƣớc tiền xữ lý ta áp dụng phƣơng pháp canny
để tách biên biển số. Tiếp theo dùng phép biến đổi Hough và giải thuật tìm Contour

để xác định các ứng viên. Vùng các ứng viên sau đó tiếp tục đƣợc scan theo dòng để
đếm số đối tƣợng bị cắt và so sánh với ngƣỡng, nhằm tìm ra vùng ứng viên thõa
mãn.
Phần mềm nhận dạng biển số xe, đã đƣợc ứng dụng thực tế tại các trạm cân,
trạm gửi xe, các trụ đèn giao thông để phát hiện xe vi phạm.
1.1.3. Cách thức hoạt động của hệ thống nhận dạng biển số xe
Hệ thống ALPR (Automatic License Plate Recognition) gồm phần cứng và
phần mềm, trong đó phần cứng là camera thu nhận ảnh xe và phần mềm có chức
năng nhận dạng biển số xe từ ảnh chụp của camera. Camera thu nhận ảnh đƣợc đặt
tại một vị trí cố định sao cho có thể qt đƣợc hình ảnh xe một cách rõ ràng và chụp
lại hình ảnh đối tƣợng xe có chứa biển số. Ảnh này đƣợc đƣa vào phần mềm nhận
dạng để trích ra chính xác biển số xe có trong ảnh, sau đó một thuật tốn OCR
(Optical Character Recognition) đƣợc sử dụng để lấy từng ký tự và chuyển đổi
thành định dạng mà máy tính có thể phân biệt đƣợc các chữ và số nhƣ dạng
text…Cùng với sự phát triển của cơng nghệ, camera ngày nay đã có thể chụp một
cách rõ nét trong điều kiện xe chạy với tốc độ cao nhƣ ở các đƣờng cao tốc.
1.2. Phƣơng pháp nhận dạng biển số xe từ ảnh
Có nhiều phƣơng pháp để giải quyết vấn đề này nhƣng đều quy về các phƣơng pháp
chính sau đây:
*) Phƣơng pháp dùng chuyển đổi Hough: dựa vào đặc trƣng cạnh biên trích
đƣợc, áp dụng các phƣơng pháp xác định đƣờng thẳng nhƣ phép biến đổi Hough để
phát hiện các cặp đƣờng thẳng gần song song ghép thành một ảnh biển số. Vùng
bao chứa biển số xe đƣợc xác định thông qua giao điểm của những đoạn thẳng.
*) Phƣơng pháp Canny [1] sử dụng hai mức ngƣỡng cao và thấp. Ban đầu ta
dùng mức ngƣỡng cao để tìm điểm bắt đầu của biên, sau đó chúng ta xác định
hƣớng phát triển của biên dựa vào các điểm ảnh liên tiếp có giá trị lớn hơn mức


14


ngƣỡng thấp. Loại bỏ các giá trị nhỏ hơn mức ngƣỡng thấp. Các đƣờng biên yếu sẽ
đƣợc chọn nếu chúng đƣợc liên kết với các đƣờng biên khỏe.
*) Phƣơng pháp khớp mẫu: xem biển số là một đối tƣợng có khung nền riêng
và sử dụng các cửa sổ dò để trích từng đối tƣợng đƣa qua mạng nơron (nơron
network), trí tuệ nhân tạo (artificial intelligence) chẳng hạn để phân loại có phải là
vùng biển số hay khơng.
1.2.1. Phương pháp chuyển đổi Hough
Dò đặc trƣng biên ngang, dọc: làm nổi bật các viền bao của tất cả các đối
tƣợng trong ảnh trong đó có viền bao biển số. Phƣơng pháp sử dụng các bộ lọc
gradient để trích đƣợc các đặc trƣng cạnh biên này. Nghiên cứu này sử dụng bộ lọc
Sobel để tiến hành dị. Dùng chuyển đổi Hough tìm các đoạn thẳng ngang dọc trên
cở sở của ảnh nhị phân biên cạnh thu đƣợc từ bƣớc trên.
Tách các đoạn thẳng ngang, dọc có thể là cạnh của biển số.
Trích ứng viên biển số: thành lập các hình chữ nhật là ứng viên cho biển số
với tiêu chí cụ thể là các bộ 4 đoạn thẳng thu đƣợc sẽ qua đánh giá về kích thƣớc, tỉ
lệ chiều rộng trên chiều cao so với một ngƣỡng nào đó.
Ƣu điểm: độ chính xác cao, không phụ thuộc vào màu sắc của biển số xe.
Nhƣợc điểm: Độ phức tạp tính tốn khá cao. Khi ảnh có thêm nhiêu đối
tƣợng khác thì khối lƣợng tính tốn tăng lên rất nhiều do mục đích là phải xác định
đƣợc vùng con nào chứa biển số xe và phụ thuộc rất lớn vào bƣớc trích đặc trƣng
biên cạnh dẫn đến là các đoạn thẳng ứng viên thu đƣợc thƣờng ngắn hơn nhiều so
với chiều dọc cũng nhƣ chiều ngang của biển số.
1.2.2. Phương pháp CANDY
Phƣơng pháp Candy bao gồm các bƣớc sau:
Bƣớc 1. Dùng bộ lọc Gausian để làm mịn ảnh:
 x2 

 x   2 
G '( x)    2  e  2 
  


(1.1)

Bƣớc 2. Tính tốn gradient (1.2) và (1.3) của đƣờng biên của ảnh đã đƣợc
làm mịn


15

 x2  y 2 

2 2 

 j  
C x  x, y     2  e 
 

(1.2)

 x2  y 2 

2 2 

 i  
C y  x, y     2  e 
 

(1.3)

Bƣớc 3. Loại bỏ những điểm không phải cực đại.

Bƣớc 4. Loại bỏ những giá trị nhỏ hơn mức ngƣỡng.
Phƣơng pháp này hơn hẳn các phƣơng pháp khác do ít bị tác động của nhiễu
và cho khả năng phát hiện các biên yếu. Nhƣợc điểm của phƣơng pháp này là nếu
chọn ngƣỡng quá thấp sẽ tạo ra biên không đúng, ngƣợc lại nếu chọn ngƣỡng q
cao thì nhiều thơng tin quan trọng của biên sẽ bị loại bỏ. Căn cứ vào mức ngƣỡng
đã xác định trƣớc, ta sẽ quyết định những điểm thuộc biên thực hoặc không thuộc
biên. Nếu mức ngƣỡng càng thấp, số đƣờng biên đƣợc phát hiện càng nhiều (nhƣng
kèm theo là nhiễu và số các đƣờng biên giả cũng xuất hiện càng nhiều). Ngƣợc lại
nếu ta đặt mức ngƣỡng càng cao, ta có thể bị mất những đƣờng biên mờ hoặc các
đƣờng biên sẽ bị đứt đoạn.
Phƣơng pháp Canny có các ƣu điểm sau:
• Cực đại hóa tỷ số tín hiệu trên nhiễu làm cho việc phát hiện các biên thực
càng chính xác.
• Đạt đƣợc độ chính xác cao của đƣờng biên thực.
• Làm giảm đến mức tối thiểu số các điểm nằm trên đƣờng biên nhằm tạo ra
các đƣờng biên mỏng, rõ.

Hình 1.1. Xác định đường biên theo phương pháp candy


16

1.2.3. Phép biến đổi RADON để tìm góc nghiêng và xoay:
Phép biến đổi Radon, đƣợc thực hiện bởi hàm radon trong MATLAB, biểu
diễn ảnh dƣới dạng các hình chiếu của nó dọc theo các hƣớng xác định. Hình
chiếu của một hàm hai biến f(x,y) là một tập hợp các tích phân đƣờng.
Hàm radon tính các tích phân đƣờng từ nhiều điểm nguồn dọc theo các
đƣờng dẫn song song, gọi là các tia chiếu (beam), theo một hƣớng xác định nào
đó. Các tia chiếu này nằm cách nhau 1 pixel. Để biểu diễn tồn bộ ảnh, hàm radon
sẽ lấy nhiều hình chiếu song song của ảnh từ các góc quay khác nhau bằng cách

xoay các điểm nguồn quanh tâm của ảnh. Quá trình này đƣợc minh hoạ ở (hình
1.2a)

Hình 1.2. Phép biến đổi radon dưới dạng hình học
Ví dụ, tích phân đƣờng của f(x,y) theo hƣớng thẳng đứng chính là hình
chiếu của f(x,y) trên trục x, cịn tích phân đƣờng của f(x,y) theo hƣớng nằm ngang
chính là hình chiếu của f(x,y) trên trụcy (hình 1.2b)
Tổng quát, biến đổi Radon của f(x,y) ứng với góc quay θ là tích phân
đƣờng của f dọc theo trục y’:


R  x '   f  x 'cos   y 'sin  , x 'sin   y 'cos   dy '


Trong đó (x’,y’) là hệ trục toạ độ có đƣợc bằng cách xoay hệ trục (x,y) đi
một góc bằng θ:


17

x '
 y '
 

cos  sin    x 

 
  sin  cos    y 

Mơ tả cách tính biến đổi Radon với góc quay θ. Trong MATLAB, biến

đổi Radon đƣợc tính bằng hàm random với cú pháp nhƣ sau:
>> [R,Xp] = radon(I,theta)
Trong đó:
Theta: là một vector gồm các góc quay cần tính biên đổi Radon
R: là một ma trận mà mỗi cột của nó là biến đổi Radon R(x’) ứng với
một góc quay theta.
Xp: là vector chứa các toạ độ x’ tƣơng ứng (Xplà nhƣ nhau đối với mọi góc
quay theta).

Hình 1.3 Cách tính biến đổi Radon với góc quay θ.
Với phép biến đổi Radon ta cho góc θ nhận các giá trị từ 00 đến 1790. Ứng với một
giá trị của θ cho ta một giá trị R. Khi đó ta lấy giá trị lớn nhất tƣơng ứng với θmax.
Sau khi xác định đƣợc θmax, ta sẽ tìm đƣợc góc lệch bằng cách 900 - θmax. Từ góc
lệch này ta dùng hàm Rotate để xoay ảnh.
1.3. Phạm vi nghiên cứu và hƣớng giải quyết
Trong luận văn này, công việc cần phải giải quyết vấn đề phát hiện vùng
chứa biển số xe và nhận dạng ký tự trong biển số. Với bài toán phát hiện vùng chứa
biển số cách tiếp cận theo phƣơng pháp canny để phát hiện vùng biển số cho các
biển đăng ký xe của Việt Nam. Bài toán nhận dạng ký tự sẽ sử dụng mơ hình mạng
nơron lan truyền ngƣợc để tiến hành nhận dạng.


18

1.3.1. Tiêu chuẩn về kích thước
Tiêu chuẩn về kích thƣớc theo TT 15/2014/TT-BCA về đăng ký và sang tên
xe. Biển số xe ơ tơ có 2 biển, kích thƣớc nhƣ sau: Loại biển số dài có chiều cao 110
mm, chiều dài 470 mm; loại biển số ngắn có chiều cao 200 mm, chiều dài 280 mm.
Biển số xe mô tô, gồm 1 biển gắn phía sau xe, kích thƣớc: Chiều cao 140
mm, chiều dài 190 mm.

Từ đây ta có tỉ lệ Chiều cao/chiều rộng là:
+) Biển có 1 hàng: 0,18< Chiều cao/chiều rộng<0.3
+) Biển có 2 hàng: 0,6< Chiều cao/chiều rộng<0,85
1.3.2. Tiêu chuẩn về ký tự
Trong biển số xe ký tự có tỷ lệ kích thƣớc về chiều rộng, chiều cao tƣơng
ứng với chiều dài và rộng của biển số xe. Mỗi ký tự của biển số xe đƣợc xem nhƣ là
một vùng liên thơng con hay bao đóng con (contours). Từ đó ta thấy rằng số ký tự
trong biển số là số bao đóng con thỏa mãn tính chất nêu trên.
Từ những phân tích trên, có thể tóm tắt phƣơng pháp thực hiện của chƣơng
trình nhận dạng nhƣ sau:
Bƣớc 1: Ảnh đầu vào là ảnh màu BGR, tiền xử lý bằng các thuật tốn xử lý
ảnh.
Bƣớc 2: Tìm các bao đóng trên ảnh xe.
Bƣớc 3: Lọc các bao đóng theo các tiêu chí nhƣ kích thƣớc, góc, tỉ lệ, số kí
tự,…
Bƣớc 4: Xử lý kết quả đầu ra để lấy vùng biển số
Bƣớc 5: Tách ký tự trên vùng biển số tìm đƣợc
Bƣớc 6: Đƣa tập ký tự đã tách vào mạng nơron để nhận dạng
Bƣớc 7: Hiển thị kết quả lên giao diện chƣơng trình
1.4. Kết luận chƣơng 1
Trong chƣơng này tôi tập trung nghiên cứu về cách thức hoạt động của hệ
thống nhận dạng biển số xe và về các thuật toán tách biển số xe ra khỏi ảnh cũng
nhƣ thiết lập các ràng buộc để lựa chọn biển số.


19


20


Chƣơng 2: CƠ SỞ LÝ THUYẾT MẠNG NƠRON NHÂN TẠO
Mạng nơron là một cấu trúc tính tốn bao gồm nhiều bộ xử lý “Nơron”
chúng đƣợc kết nối song song và chằng chịt với nhau. Với bản chất song song
của các nơron nên chung có có thể thực hiện các tính toán với tốc độ cao hơn so
với các kỹ thuật phân lớp khác. Trong một mạng nơron có nhiều nút thì đầu ra
của một nút có thể đƣợc sử dụng cho một nút khác ở trong mạng và hàm quyết
định cuối cùng phụ thuộc vào sự tƣơng tác giữa các nút. Các kiến trúc mạng
nơron có thể đƣợc phân thành hai nhóm chính: mạng truyền thẳng và mạng lan
truyền ngƣợc.
2.1. Khái niệm mạng nơron
2.1.1. Tổng quan về nơron sinh học
Sơ lược về chức năng, tổ chức và hoạt động của bộ não con người:
Trong các hoạt động của con ngƣời thì bộ não ngƣời có chức năng hết sức
quan trọng, nó gần nhƣ kiểm sốt hầu hết mọi hành vi của con ngƣời từ các hoạt
động cơ bắp đến những hoạt động phức tạp nhƣ học tập, nhớ, suy luận, tƣ duy, sáng
tạo.
Cấu tạo bộ não ngƣời đƣợc hình thành từ các tế bào thần kinh và các mạch
máu. Với ngƣời trƣởng thành có khoảng khoảng 85 tỷ phần tử (tế bào), trong đó có
khoảng 69 tỷ phần tử là nơron, số còn lại khoảng 16 tỷ phần tử là các tế bào thần
kinh đệm và chúng có nhiệm vụ phục vụ cũng nhƣ hỗ trợ cho các nơron. Bộ não của
một ngƣời trƣởng thành có trọng lƣợng trung bình cân nặng khoảng 1,4 kg và có thể
tích là 235 cm3, hiện nay ngƣời ta vẫn chƣa thực sự biết rõ cấu tạo chi tiết của bộ
não. Nhƣng ngƣời ta có thể chia cấu tạo não bộ đƣợc phân chia ra thành nhiều vùng
khác nhau, mỗi vùng có thể kiểm soát một hay nhiều hoạt động của con ngƣời.
Trong hoạt động của hệ thần kinh nói chung và của bộ não nói riêng đã đƣợc
con ngƣời quan tâm nghiên cứu nhƣng vẫn chƣa đƣa ra đƣợc cách thức hoạt động
và chƣa hiểu rõ về bản chất của nó, đặc biệt là trong các hoạt động liên quan đến trí


21


óc nhƣ suy nghĩ, nhớ, sáng tạo,... Nhƣng vói sự phát triển của khoa học thì hiện nay
chúng ta cũng có những hiểu biết căn bản về hoạt động của não ở mức thấp.
Các phần tử của bộ não hoạt động song song và phức tạp, nhƣng hiệu quả hoạt
động rất cao nhất là các vấn đề phức tạp, về độ xử lý của não caon ngƣời cũng rất
nhanh, bởi vì mỗi nơron liên kết với khoảng 1 tỷ nơron khác, cho nên khi hoạt động
thì bộ não hoạt động một cách tổng lực và đạt hiệu quả cao.
Hoạt động của cả hệ thống thần kinh bao gồm não bộ và các giác quan đƣợc
mô tả nhƣ sau: Khi con ngƣời bị kích thích từ bên trong hoặc ngồi cơ thể thơng
qua các giác quan. Các kích thích đƣợc biến thành các xung điện bởi chính các giác
quan tiếp nhận kích thích, sau đó những tín hiệu này đƣợc chuyển về não bộ để xử
lý. Quá trình xử lý trong bộ não là một q trình liên tục, nó bao gồm xử lý, đánh
giá, so sánh với thông tin đƣợc lƣu trữ từ đó đƣa ra quyết định chính xác. Từ những
quyết định đó, bộ não đƣa ra những mệnh lệnh cần thiết đƣợc phát đi và gửi đến
những bộ phận thực thi thích hợp nhƣ miệng, tay, chân,...
Tóm lại: Trong hoạt động của con ngƣời thì bộ não ngƣời có chức năng hết
sức quan trọng đối, cấu tạo của bộ não rất phức tạp, tinh vi bởi đƣợc tạo thành từ
hàng chục tỉ tế bào và mạng nơron với mức độ liên kết giữa các nơron là rất cao.
Hơn nữa, bộ não củ con ngƣời còn đƣợc chia thành nhiều vùng với các lớp khác
nhau và hoạt động của nó dựa trên cơ chế hoạt động song song của các nghìn tế bào
tạo nên.
Mạng nơron sinh học
Cấu tạo: bộ não con ngƣời đƣợc cấu tạo nên từ phần tử cơ bản là nơron. Sơ đồ
cấu tạo của một nơron sinh học đƣợc chỉ ra nhƣ trong hình 2.1. Một nơron điển hình
có 3 phần chính:


22

Hình 2.1. Mơ hình 2 nơron sinh học

- Thân nơron: Nhân của nơron đƣợc đặt ở đây.
- Các nhánh (dendrite):L à các mạng dạng cây của các dây thần kinh để nối
các tế bào cơ thể với nhau.
- Sợi trục (Axon): đây là sự mở rộng dài của một nơron nhằm mục đích dẫn
xung điện ra khỏi tế bào của nơron. Chức năng của sợi trục đó là truyền thơng tin
đến các nơron khác.
Hoạt động của mạng nơron sinh học: Khi tín hiệu đƣa ra và đƣợc nhận bởi các
nhánh là các kích thích điện tử, việc truyền tín hiệu đã mô tả ở phần trên liên quan
đến một quá trình hóa học phức tạp mà trong đó các chất truyền đặc trƣng đƣợc giải
phóng từ phía gửi của nơi tiếp nối. Từ đó ta thấy rằng qua trình này sẽ làm tăng
hoặc giảm điện thế bên trong thân của nơron nhận. khi đó nơron nhận tín hiệu sẽ
hoạt động nếu điện thế vƣợt khỏi một ngƣỡng nào đó và một xung điện với độ
mạnh của nó và thời gian tồn tại cố định đƣợc gửi ra ngồi thơng qua sợi trục tới
phần nhánh của nó rồi tới các chỗ nối synapte với các nơron khác. Sau khi nơron
kích hoạt, nơron sẽ phải chờ trong một chu kỳ, trƣớc khi nó có thể đƣợc kích hoạt
lại. Khi synapses cho phép phép các kích thích truyền qua gây ra tình.trạng kích
hoạt đối với nơron nhận thì đƣợc gọi là synapses Hƣng phấn (excitatory). Ngƣợc
lại, nếu các kích thích truyền qua làm ngăn trở trạng thái kích hoạt (fire) của nơron
nhận thì đƣợc gọi là synapses ức chế (inhibitory)
2.1.2. Mạng Nơron nhân tạo


23

Khái niệm: Mạng nơron nhân tạo mô phỏng dựa trên mạng nơron sinh học,
gồm ba thành phần đó là, Lớp đầu vào, lớp ẩn và lớp đầu ra.
- Lớp đầu vào: Mỗi nơron có một số đầu vào và nó tƣơng ứng với một thuộc
tính của dữ liệu
- Lớp ẩn: gồm các nơ ron nhận dữ liệu vào từ lớp trƣớc đó và chuyển đổi các
dữ liệu vào này cho các lớp xử lý tiếp theo

- Lớp đầu ra: Chỉ có một đầu ra duy nhất của một nơron đƣợc nối với các
đầu vào khác nhau của nơron khác.
Một nơron trở nên tích cực nếu đầu vào của nó vƣợt qua ngƣỡng ở một mức
nhất định.
Có nhiều kiểu nơron nhân tạo khác nhau. Hình 2.2 biểu diễn một kiểu rất đơn
giản.
Các đầu vào có hàm trọng Wj và bộ tổng. Đầu ra của bộ tổng đƣợc sử dụng
để quyết định một giá trị của đầu ra thông qua hàm chuyển. Có nhiều kiểu hàm
chuyển khác nhau. Tƣơng tự nơron sinh học của con ngƣời, nơron sẽ đƣợc kích hoạt
nếu tổng giá trị vào vƣợt q ngƣỡng và khơng đƣợc kích hoạt nếu tổng giá trị vào
thấp hơn ngƣỡng. Sự làm việc nhƣ vậy của nơron gọi là sự kích hoạt nhảy bậc.

Hình 2.2. Mơ hình nơron đơn giản

Hình 2.3. Mạng nơron 3 lớp


24

Kết nối một vài nơron ta đƣợc mạng nơron. Hình 2.3 là một mạng nơron
gồm 3 lớp: lớp vào, lớp ẩn và lớp ra.
Các nơron ở lớp vào đƣợc nhận tín hiệu ở đầu vào, với mỗi nơron chỉ nhận
đƣợc một tín hiệu vào. Mỗi nơron ở lớp ẩn đƣợc kết nối với tất cả các nơron lớp vào
và lớp ra. Khi đó đàu ra của mạng là các nơron ở lớp ra có đầu vào đƣợc nối với tất
cả các nơron ở lớp ẩn. Lƣu ý rằng một mạng nơron cũng có thể có một hoặc nhiều
lớp ẩn. Các mạng nơro có cấu tạo mà trong đó mỗi nơron chỉ đƣợc liên hệ với tất cả
các nơron ở lớp kế tiếp và tất cả các mối liên kết chỉ đƣợc xây dựng từ trái sang
phải đƣợc gọi là mạng nhiều lớp truyền thẳng (perceptrons).
Khi hoạt động thì mạng nơron đƣợc điều chỉnh hoặc đƣợc huấn luyện để
hƣớng các đầu vào riêng biệt đến đích ở đầu ra. Huấn luyện mạng đƣợc mơ phỏng

nhƣ trong hình 2.4. Trong hình mơ phỏng này, hàm trọng số của mạng đƣợc thay
đổi khi so sánh đầu ra với đích mong muốn (taget) cho tới khi đầu ra mạng phù hợp
với đích. Để giám sát cho huấn luyện mạng ta tạo ra các cặp vào/đích để giám sát.

Hình 2.4. Cấu trúc huấn luyện mạng nơron
Để xây dựng đƣợc một số cặp vào/ra, mà tại đó mỗi giá trị vào đƣợc gửi đến
mạng và giá trị ra tƣơng ứng đƣợc thực hiện bằng mạng là sự xem xét và so sánh
với giá trị mong muốn. Thơng thƣờng khi đó sẽ tồn tại một sai số bởi vì giá trị
mong muốn khơng hồn tồn phù hợp với giá trị khi thực hiện. Từ đó ta phải thay
đổi hàm trọng sau một lần chạy bằng cách sử dụng sai số tìm.
Khi thay đổi hàm trọng cần phải thay đổi với đặc tính hơn và tƣơng đƣơng
với đặc tính mong muốn. Từ đó từng cặp giá trị vào/ra phải đƣợc kiểm tra và trọng
số đƣợc điều chỉnh một vài lần. Khi tổng bình phƣơng các sai số nhỏ hơn một sai


25

sai số cho trƣớc hoặc đã chạy đủ một số lần đƣợc xác định trƣớc đó thì hàm trọng
của mạng đƣợc dừng lại chứ không điều chỉnh nữa.
Một mạng nơron đã đƣợc huấn luyện thì đƣợc dùng để thực hiện những
công việc phức tạp trong nhiều lĩnh vực nhƣ trong nhận dạng, phân loại sản phẩm,
xử lý tiếng nói, chữ viết và điều khiển hệ thống.
Thông thƣờng khi huấn luyện mạng nơron, ngƣời ta hay sử dụng phƣơng
pháp huấn luyện có giám sát, nhƣng cũng có mạng thu đƣợc từ sự huấn luyện khơng
có giám sát. Một mạng nơron đƣợc huấn luyện khơng giám sát có thể đƣợc sử dựng
trong trƣờng hợp riêng.
Mạng nơron nhân tạo đang phát triển nhanh chóng và càng ngày nó càng
đem đến những ứng dụng thiết thực trong đời sống. Từ đó ta thấy rằng có sự khác
biệt giữa ứng dụng của mạng nơ ron với những hệ thống điều khiển hoặc tối ƣu hoá,
nơi mà các thuật ngữ, cơ sở toán học và thủ tục thiết kế đã đƣợc thiết lập chắc chắn

và đƣợc ứng dụng từ nhiều năm.
Mơ hình nơron
Nơron đơn giản: một nơron với một đầu vào vơ hƣớng và khơng có độ dốc đƣợc chỉ
ra trên hình 2.5 a,b.

Hình 2.5. Mơ hình nơron đơn giản
Tín hiệu vào vơ hƣớng p thơng qua trọng liên kết vô hƣớng w trở thành wp
cũng là đại lƣợng vô hƣớng. Ở đây wp là đối số duy nhất của hàm truyền f, tín hiệu
đầu ra là đại lƣợng vơ hƣớng a. Hình 2.5b là nơron có độ dốc b. Ta có thể hiểu b
nhƣ là phép cộng đơn giản vào tích wp hoặc nhƣ là một sự thăng giáng của hàm f ở
hình a đi một lƣợng b. Độ dốc đƣợc xem nhƣ một trọng lƣợng, chỉ có điều đầu vào
là một hằng số bằng 1. Tín hiệu vào hàm truyền mạng là n là tổng của trọng đầu vào


×