Tải bản đầy đủ (.pdf) (77 trang)

Hệ thống nhận dạng biển số sử dụng phương pháp khớp mẫu template matching

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.8 MB, 77 trang )

bộ giáo dục và đào tạo
trờng đại học bách khoa hà nội

------------[[\\-------------

TRầN MINH HòA

H THNG NHN DNG BIN S
S DNG PHNG PHP KHP MU
TEMPLATE MATCHING

luận văn thạc Sỹ kỹ thuật
ngành: điện tử viễn thông
NGI HNG DN:
PGS.TS NGUYN TIN DNG

Hà nội - 2012


LÝ LỊCH KHOA HỌC
I. Sơ lược lý lịch:
Họ và tên:

Trần Minh Hòa

Giới tính: Nam

Sinh ngày: 12 tháng 08 năm 1980

ảnh 4x6


Nơi sinh: Hồng Long – Nam Đàn – Nghệ An
Quê quán: Hồng Long – Nam Đàn – Nghệ An
Chức vụ: Giáo viên
Đơn vị công tác: Trường Cao Đẳng Nghề KTCN Việt Nam – Hàn Quốc

Chỗ ở riêng hoặc địa chỉ liên lạc: Khoa Điện Tử - Trường Cao Đẳng Nghề KTCN Việt
Nam – Hàn Quốc. Đường Hồ Tông Thốc – P. Nghi Phú – TP.Vinh – Tỉnh Nghệ An.
Điện thoại di động: 0986988077
II. Quá trình đào tạo:
1. Đại học:
- Hệ đào tạo: Chính quy

Thời gian đào tạo: từ 08/1999 đến 04/2004.

- Trường đào tạo: Đại Học Giao Thông Vận Tải Hà Nội
- Ngành học: Điều khiển học kỹ thuật

Bằng tốt nghiệp đạt loại: TB Khá

2. Thạc sĩ:
Thời gian đào tạo: từ 2010 đến 2012

- Hệ đào tạo: Thạc sỹ kỹ thuật
- Chuyên ngành học: Điện tử viễn thông

- Tên luận văn: Hệ thống nhận dạng biển số sử dụng phương pháp khớp mẫu Template
matching
- Người hướng dẫn Khoa học: TS. Nguyễn Tiến Dũng
3. Trình độ ngoại ngữ : B1(của khung châu Âu)
III. Quá trình công tác chuyên môn kể từ khi tốt nghiệp đại học:

Thời gian

Nơi công tác

Công việc đảm nhận

2005-2009

Tổng Cty CTGT 4

Nhân viên phòng thiết bị

2010 - 2014

Trường CĐ Việt - Hàn

Giáo viên

Tôi cam đoan những nội dung viết trên đây là đúng sự thật.
Ngày

tháng

năm

NGƯỜI KHAI KÝ TÊN


LỜI CAM ĐOAN
Tôi xin cam đoan: Bản luận văn tốt nghiệp này là công trình nghiên cứu thực

sự của cá nhân, được thực hiện trên cơ sở nghiên cứu lý thuyết, kiến thức kinh điển,
nghiên cứu khảo sát tình hình thực tiễn và dưới sự hướng dẫn khoa học của Phó GS.
Tiến sĩ: Nguyễn Tiến Dũng. Các số liệu, mô hình toán và những kết quả trong luận
văn là trung thực,
Một lần nữa, tôi xin khẳng định về sự trung thực của lời cam kết trên.
Người thực hiện

Trần Minh Hòa


MỤC LỤC
MỞ ĐẦU ....................................................................................................................................... 1
CHƯƠNG 1. TỔNG QUAN VỀ HỆ THỐNG QUẢN LÝ BIỂN SỐ................................... 4
1.1. Tổng quan về xử lí ảnh số. ......................................................................................4
1.1.1. Một số khái niệm và các vấn đề cơ bản trong xử lý ảnh số..............................................5
1.1.1.1. Một số khái niệm..........................................................................................5
1.1.1.2 Biểu diễn ảnh. ...............................................................................................6
1.1.1.3. Tăng cường ảnh - Khôi phục ảnh...............................................................7
1.1.1.4. Biến đổi ảnh. ................................................................................................7
1.1.1.5. Phân tích ảnh...............................................................................................7
1.1.1.6. Nhận dạng ảnh. ...........................................................................................7
1.2. Tổng quan về hệ thống nhận dạng biển số xe máy. ...............................................7
1.3. Giới thiệu về module quản lý cơ sở dữ liệu biển số xe máy. .................................9
1.3.1. Lý thuyết về Camera................................................................................................................9
1.3.1.1. Bộ cảm biến ảnh. .........................................................................................9
1.3.1.2. Thiết bị thu nhận ảnh .................................................................................9
1.3.1.3. Camera.........................................................................................................10
1.3.1.4. Màn hình Video. ..........................................................................................10
1.3.1.5. Máy tính. .....................................................................................................10
1.3.2. Giới thiệu về Module thu nhận ảnh, phân vùng biển số và tách ký tự.......................11

1.3.3. Các chức năng chính của phần mềm quản lý cơ sở dữ liệu biển số xe máy...............11
CHƯƠNG 2. KỸ THUẬT XỬ LÝ ẢNH CƠ BẢN ỨNG DỤNG TRONG HỆ THỐNG...... 12
2.1. Cải thiện ảnh sử dụng toán tử điểm ......................................................................12
2.1.1.Khái niệm về toán tử điểm.....................................................................................................12
2.1.2.Tăng độ tương phản (Stretching Contrast).....................................................................12
2.1.3. Biến đổi âm bản (Digital Negative). ................................................................................13
2.1.4. Mô hình hóa và biến đổi lược đồ xám. ...........................................................................14
2.2. Ảnh nhị phận...........................................................................................................14
2.2.1.Ảnh đen trắng...........................................................................................................................15
2.2.2.Ảnh màu.....................................................................................................................................15
2.3. Các phương pháp phát hiện biên. .........................................................................16
2.3.1. Giới thiệu biên và kỹ thuật phát hiện biên.........................................................................16


2.3.1.1. Một số khái niệm........................................................................................16
2.3.1.2. Phân loại các kỹ thuật phát hiện biên......................................................17
2.3.1.2.1. Phương pháp phát hiện biên trực tiếp. ..............................................17
2.3.1.2.2. Phương pháp phát hiện biên gián tiếp...............................................17
2.3.1.3 Quy trình phát hiện biên.............................................................................17
2.3.2. Phương pháp phát hiện biên cục bộ. ..................................................................................18
2.3.2.1. Phương pháp Gradient. .............................................................................18
2.3.2.1.1. Kỹ thuật Gradient................................................................................19
2.3.2.1.2. Toán tử Robert (1965). .......................................................................19
2.3.2.1.3. Toán tử (mặt nạ) Sobel. ......................................................................20
2.3.2.1.4. Toán tử 4-lân cận (4-Neighbour Operator). ....................................20
2.3.2.1.5. Toán tử la bàn. ....................................................................................22
2.3.2.1.6. Toán tử la bàn Kirsh...........................................................................22
2.3.2.2. Kỹ thuật Laplace. .......................................................................................23
2.3.2.3. Tách sườn ảnh theo phương pháp Canny. ...............................................24
2.3.2.4. Một số phương pháp khác .........................................................................25

2.3.2.4.1. Tiếp cận theo mô hình mặt.................................................................25
2.3.2.4.2. Tiếp cận tối ưu hóa. ............................................................................26
2.4. Phân vùng ảnh.........................................................................................................27
2.4.1. Phân vùng ảnh theo ngưỡng biên độ..................................................................................27
2.4.2. Phân vùng ảnh theo miền đồng nhất..................................................................................29
2.4.2.1. Phương pháp tách cây tứ phân .................................................................29
2.4.2.2. Phương pháp cục bộ .................................................................................31
2.4.2.3. Phương pháp tổng hợp .............................................................................31
2.4.3. Phân vùng ảnh theo kết cấu bề mặt....................................................................................32
2.4.3.1. Phương pháp thống kê ..............................................................................32
2.4.3.1.1. Lược đồ hiệu mức xám:......................................................................34
2.4.3.1.2. Ma trận xuất hiện liên hiệp mức xám................................................34
2.4.3.2. Phương pháp cấu trúc ..............................................................................35
2.5. Nhận dạng ảnh. .......................................................................................................36
2.5.1. Không gian biểu diễn đối tượng, không gian diễn dịch............................................36
2.5.1.1. Không gian biểu diễn đối tượng...................................................................36
2.5.1.2. Không gian diễn dịch..............................................................................36
2.5.1.3. Mô hình của quá trình nhận dạng............................................................37


2.5.1.4. Bản chất của quá trình nhận dạng. ..........................................................38
2.5.2. Nhận dạng theo cấu trúc .......................................................................................................40
2.5.2.1. Biểu diễn định tính ....................................................................................40
2.5.2.2. Phương pháp ra quyết định dựa vào cấu trúc. .................................41
2.5.2.3. Phương pháp nhận dạng theo cấu trúc. ...................................................42
2.5.2.4. Phương pháp khớp mẫu Template Matching.........................................43
CHƯƠNG 3. PHÂN TÍCH THIẾT KẾ MODULE THU NHẬN ẢNH VÀ
CÁCH LY KÝ TỰ TRONG HỆ THỐNG QUẢN LÝ BIỂN SỐ XE................................. 48
3.1. Quá trình phân vùng biển số xe......................................................................48
3.2. Quá trình tách ký tự biển số .................................................................................51

3.3. Tích hợp Module vào hệ thống thực nghiệm.......................................................53
CHƯƠNG 4. KẾT QUẢ THỰC NGHIỆM VÀ ĐÁNH GIÁ ............................................. 55
4.1. Thông số làm việc của hệ thống nhận dạng..........................................................55
4.2. Thống kê và kết quả Module thu nhận ảnh từ Camera ......................................56
4.3. Thống kê và kết quả Module phân vùng biển số và tách ký tự ..........................56
4.3.1. Với hệ thống chưa tích hợp Camera...................................................................................56
4.3.2. Với hệ thống tích hợp Camera.............................................................................................59
4.4. Thống kê và kết quả của Module nhận dạng .......................................................62
4.5. Kết luận và hướng phát triển tiếp theo của luận văn. .........................................63
TÀI LIỆU THAM KHẢO ..................................................................................................... 65


DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT

CBIR

Content-Based Image Retrieval

CCD

Charge-Coupled Device

CSDL

Cơ Sở Dữ Liệu

DBMS

Data base management system


EMM

Ediator Markov Model

KL

Karhumen Loeve

KLT

Karhunen-Loeve Transform-

NNFIR

Nơron Netwrok based Flexible Image Retrieval

OBIR

Object Based Image Retrieval

PSF

Point Spread Function

RBF

Radial Basis Function

RDBMS relational database is called a relational database management
system

RGB

red, green, blue

SVM

Support Vector Machine

UFM

Unified feature matching


DANH MỤC HÌNH VẼ
Hình 1.1. Sơ đồ tổng quát một hệ thống xử lý ảnh .................................................................. 4
Hình 1.2. Lược đồ mức xám của ảnh xám tương ứng............................................................. 6
Hình 1.3. Sơ đồ khối của hệ thống và vị trí của Module xử lý cơ sở dữ liệu - điều khiển
Barrier ........................................................................................................................................... 8
Hình 2.1. Dãn đồ tương phản ................................................................................................... 13
Hình 2.2. Biến đổi âm bản ......................................................................................................... 14
Hình 2.3. Đường bao của ảnh................................................................................................... 16
Hình 2.4. Các bước phân tích và xử lý ảnh............................................................................. 17
Hình 2.5. Tính đạo hàm theo Gradient ................................................................................... 18
Hình 2.6. Toán tử Robert.......................................................................................................... 19
Hình 2.7: Mặt nạ 4-lân cận. ..................................................................................................... 21
Hình 2.8. Mặt nạ 8 hướng theo Kirsh..................................................................................... 21
Hinh 2.9. Mô hình tính của phương pháp Canny.................................................................. 25
Hình 2.10. Lược đồ rắn lượn và cách chọn ngưỡng .............................................................. 28
Hình 2.11. Khái niệm 4 liên thông và 8 liên thông................................................................. 31
Hình 2.12. Phân tích kết cấu sợi bằng dải tương quan ......................................................... 33

Hình 2.13. Sơ đồ tổng quát một hệ thống nhận dạng........................................................... 39
Hình 2.14. Các từ vựng cơ bản trong ngôn ngữ PLD.................................................. 42
Hình 2.15. Các phép toán bằng ngôn ngữ PLD ............................................................. 42
Hình 2.16 Hình thể hiện sự tuơng quan lớn ................................................................... 44
Hình 2.17. Hình thể hiện tương quan thấp........................................................................... 44
Hình 2.18. Xác định một vùng ảnh trong một mẫu ảnh lớn............................................... 45
Hình 2.19. Các mẫu đối sánh.................................................................................................. 45
Hình 2.20. Kết quả tương quan của ảnh 1 với mẫu............................................................. 46
Hình 2.21. Kết quả tương quan của ảnh 2 với mẫu.............................................................. 46
Hình 2.22. Kết quả tương quan của ảnh 3 với mẫu.............................................................. 46
Hình 2.23. Kết quả tương quan của ảnh 4 với mẫu............................................................... 47
Hình 3.1. Sơ đồ khối của module phân vùng biển số................................................................. 48
Hình 3.2. Ảnh mức xám và ảnh nhị phân thích nghi .................................................................. 49
Hình 3.3. Lược đồ Histogram & ảnh sử dụng phương pháp dò biên Canny............................ 49
Hình 3.4. Ảnh biển số sau khi đã cắt ngang và lược đồ Histogram..................................... 50


Hình 3.5. Biển số sau khi được tách ra khỏi ảnh ................................................................. 50
Hình 3.6. Sơ đồ khối của quá trình tách ký tự ....................................................................... 51
Hình 3.7. Lược đồ Histogram theo phương ngang và dọc và vị trí .................................... 51
Hình 3.8. Chia biển số xe thành 8 phần ...................................................................................... 52
Hình 3.9. Sơ đồ chiếu ngang của 8 vùng trên biển số............................................................ 52
Hình 3.10. Giao tiếp camera ..................................................................................................... 53
Hình 3.11. Giao diện chính của chương trình ....................................................................... 54
Hình 3.12. Kết quả xử lý của chương trình ........................................................................... 54
Hình 4.1. Ảnh không thể tách được vùng biển số .................................................................. 58
Hình 4.2. Ảnh không tách được các ký tự .............................................................................. 59
Hình 4.3. Hệ thống nhận dạng biển số xe................................................................................ 60
Hình 4.4. Module tiền xử lý....................................................................................................... 61
Hình 4.5. Tách ký tự .................................................................................................................. 61

Hình 4.6. Ảnh nhận dạng ký tự................................................................................................ 62


DANH MỤC BẢNG

Bảng 4.1. Thống kê thay đổi tốc độ vật thể chuyển động phía trước Camera................... 56
Bảng 4.2. Thống kê chất lượng ảnh chụp của Camera tương ứng với mức độ sáng ........ 56
Bảng 4.3. Bảng thống kê kết quả của module phân tách biển số và ký tự.......................... 57
Bảng 4.4. Kết quả thống kê của hệ thống đã bao gồm camera ............................................ 60
Bảng 4.5. Kết quả thống kê quá trình nhận dạng theo chất lượng ký tự .......................... 62
Bảng 4.6. Kết quả thống kê quá trình nhận dạng ký tự (số - chữ cái) ............................... 63


CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lâp – Tự do – Hạnh phúc
BẢN NHẬN XÉT LUẬN VĂN THẠC SĨ
-

Đề tài: Hệ thống nhận dạng biển số sử dụng phương pháp khớp mẫu template
matching.

-

Tác giả: Trần Minh Hòa – Trường ĐH Bách Khoa Hà Nội

-

Chuyên ngành: Kỹ thuật Điện tử Viễn Thông

-


Người hướng dẫn 1: TS. Nguyễn Tiến Dũng

-

Đơn vị: Viện Điện Tử Viễn Thông – Viện Đào Tạo Sau ĐH- Trường ĐH Bách
Khoa Hà Nội.

-

Người hướng dẫn 2:

-

Đơn vị:

Nhận xét:
1. Tổng quan chung: Luận văn này trình bày hệ thống nhận dạng biển số sử

dụng phương pháp khớp mẫu Template matching. Để thực hiện được
phương pháp này chúng tôi phải nghiên cứu các nội dung như: Tổng
quan về quản lý biển số, kỹ thuật xử lý ảnh cơ bản trong hệ thống.
phân tích thiết kế module thu nhận ảnh và cách ly ký tự trong hệ
thống quản lý biển số xe và cuối cùng là phần đánh giá kết quả thực
nghiệm.
2. Ưu điểm, nhược điểm của luận văn về nội dung, hình thức; thái độ, trách nhiệm
của tác giả trong quá trình thực hiện luận văn.
3. Kết luận:
Tôi đồng ý (không đồng ý) để tác giả ………… được bảo vệ luận văn trước Hội
đồng chấm luận văn thạc sĩ.



Hà Nội, Ngày tháng năm 2012
Người nhận xét
(Ký tên và ghi rõ họ và tên người
hướng dẫn)
Xác nhận của cơ quan người nhận xét
(dùng cho người nhận xét ngoài trường ĐHBKHN)


MỞ ĐẦU
1.1. Lý do chọn đề tài.
Lĩnh vực xử lí ảnh số, bao gồm xử lí, phân tích và nhận biết tự động bằng máy
tính, đã và đang có sự phát triển mạnh mẽ trong cả lý thuyết và các ứng dụng thực
tế. Xử lí ảnh được ứng dụng trong nhiều lĩnh vực quan trọng như: viễn thông,
truyền thông, chụp ảnh y tế, sinh học, khoa học vật liệu, rô-bốt, sản xuất, các hệ
thống cảm biến thông minh, tự động diều khiển, đồ hoạ, in ấn…Sự phát triển mạnh
này có thể được thấy rõ qua số lượng các bài báo, báo cáo khoa học về xử lí ảnh
hàng năm cũng như qua số lượng các đầu sách viết về xử lí ảnh số.
.

Như chúng ta đã biết, ngày nay xe máy là phương tiện giao thông chính và số

lượng ngày càng tăng. Vì vậy vấn đề quản lý giao thông, bảo đảm an ninh, thu phí
giao thông… đòi hỏi và cần thiết có sự hỗ trợ của khoa học kỹ thuật. Một trong
những sự hỗ trợ đầy hiệu quả đó là làm sao giúp những người quản lý nhận dạng
biển số xe được dễ dàng, nhanh chóng và thuận lợi nhất.
Nhận dạng biển số xe trở thành một ứng dụng hữu ích, được đưa vào trong
những lĩnh vực như: quản lí giao thông, kiểm tra an ninh, thu phí giao thông, trạm
gác cổng, quản lý các bãi giữ xe một cách tự động…Nó không chỉ giúp những

người quản lý có khả năng bao quát được tất cả khách hàng, đối tượng theo dõi của
mình mà còn giúp tiết kiệm thời gian làm việc đáng kể. Ngoài ra với phương pháp
này sẽ giúp giảm được nhiều người trông giữ xe để phân công họ vào việc khác.
Từ những lý do trên chúng tôi quyết định lựa chọn đề tài Xây dựng hệ thống
nhận dạng biển số xe máy.
1.2.

Lịch sử nghiên cứu.
Các phương pháp xử lý ảnh bắt đầu từ các ứng dụng chính: nâng cao chất

lượng ảnh và phân tích ảnh. Ứng dụng đầu tiên được biết đến là nâng cao chất
lượng ảnh báo được truyền qua cáp từ Luân đôn đến New York từ những năm 1920.
Vấn đề nâng cao chất lượng ảnh có liên quan tới phân bố mức sáng và độ phân giải
của ảnh. Việc nâng cao chất lượng ảnh được phát triển vào khoảng những năm
1955. Điều này có thể giải thích được vì sau thế chiến thứ hai, máy tính phát triển
nhanh tạo điều kiện cho quá trình xử lý ảnh số thuận lợi. Năm 1964, máy tính đã có

1


khả năng xử lý và nâng cao chất lượng ảnh từ mặt trăng và vệ tinh Ranger 7 của
Mỹ bao gồm: làm nổi đường biên, lưu ảnh. Từ năm 1964 đến nay, các phương tiện
xử lý, nâng cao chất lượng, nhận dạng ảnh phát triển không ngừng. Các phương
pháp tri thức nhân tạo như mạng nơ ron nhân tạo, các thuật toán xử lý hiện đại và
cải tiến, các công cụ nén ảnh ngày càng được áp dụng rộng rãi và thu nhiều kết quả
khả quan.
Để dễ tưởng tượng, xét các bước cần thiết trong xử lý ảnh. Đầu tiên, ảnh tự
nhiên từ thế giới ngoài được thu nhận qua các thiết bị thu (như Camera, máy chụp
ảnh). Trước đây, ảnh thu qua Camera là các ảnh tương tự (loại Camera ống kiểu
CCIR). Gần đây, với sự phát triển của công nghệ, ảnh màu hoặc đen trắng được lấy

ra từ Camera, sau đó nó được chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý
tiếp theo. (Máy ảnh số hiện nay là một thí dụ gần gũi). Mặt khác, ảnh cũng có thể
tiếp nhận từ vệ tinh; có thể quét từ ảnh chụp bằng máy quét ảnh.
1.3.

Mục đích nghiên cứu, đối tượng và phạm vi nghiên cứu của luận văn.

1.3.1. Mục đích nghiên cứu
Hệ thống nhận dạng biển số xe là một ứng dụng dựa trên kỹ thuật xử lí ảnh số.
Mục đích của nhận dạng biển số xe là thực hiện các bước xử lí để từ một ảnh đầu
vào, máy tính có thể nhận ra chính xác biển số xe trên ảnh. Nhận dạng biển số xe
trở thành một ứng dụng hữu ích, được đưa vào trong những lĩnh vực như: quản lí
giao thông, kiểm tra an ninh, thu phí giao thông, trạm gác cổng, quản lý các bãi giữ
xe một cách tự động.
1.3.2. Đối tượng nghiên cứu
Đây là một trong những ứng dụng xử lí ảnh nhận được nhiều sự quan tâm
nghiên cứu về cả hai mặt lý thuyết và thực hiện chương trình. Luận văn của chúng
tôi bao gồm các quá trình xử lí: phân vùng biển số, tách các ký tự, nhận biết các kí
tự, phần mềm quản lý cơ sở dữ liệu biển số xe máy. Mục đích của phần mềm quản
lý cơ sở dữ liệu biển số xe máy là thu nhận chuỗi biển số sau khi đã được nhận
dạng, lưu vào cơ sở dữ liệu để người dùng dễ dàng quản lý và theo dõi thông qua
các báo cáo chi tiết các lượt xe vào - ra. Mục đích của phần mềm quản lý cơ sở dữ
liệu là theo dõi số lượt vào - ra, tính tiền lưu bãi.

2


1.3.3. Phạm vi nghiên cứu.
Chủ yếu dựa vào các tài liệu và chạy mô phỏng trên máy tính, chưa có mô hình
thực tế.

Xin chân thành cảm ơn Phó GS. Tiến sĩ: Nguyễn Tiến Dũng đã tận tình hướng dẫn
và quý thầy cô khoa Điện tử viễn thông – Trường Đại học Bách Khoa Hà Nội đã
truyền dạy những kiến thức quý báu trong chương trình cao học và giúp đỡ kinh
nghiệm cho luận văn hoàn thành được thuận lợi.

3


CHƯƠNG 1. TỔNG QUAN VỀ HỆ THỐNG QUẢN LÝ BIỂN SỐ
1.1. Tổng quan về xử lí ảnh số.
Ngày nay kỹ thuật xử lí ảnh đã được ứng dụng rộng rãi ở rất nhiều lĩnh vực,
trong sản xuất cũng như trong đời sống. Ví du các hệ thống xử lí ảnh vệ tinh để
phân tích không gian vũ trụ, hệ thống thăm dò địa chất, hệ thống phân tích tế bào
sinh học và gần gũi nhất với chúng ta là các phần mềm hiển thị và xử lí ảnh chuyên
dụng như Photoshop, ACD See…
Một hệ thống xử lý ảnh là hệ thống thực hiện các chức năng thu nhận ảnh đầu vào,
thực hiện phép xử lý để tạo ảnh hoặc kết quả phân tích, nhận dạng ở đầu ra đáp ứng
các yêu cầu và các ứng dụng cụ thể.
Trong phạm vi đồ án, tôi xin giới hạn trong việc giới thiệu một hệ thống xử lý ảnh
ứng dụng nhận dạng và ra quyết định trên thực tế.

Hình 1.1. Sơ đồ tổng quát một hệ thống xử lý ảnh
Sơ đồ khối tổng quát của hệ thống này được cho trong hình 1.1, trong đó gồm ba
khối chức năng cơ bản:
• Khối thu nhận ảnh: thực hiện chức năng thu nhận ảnh và thực hiện quá trình
số hóa (lưu giữ theo định dạng yêu cầu).
• Khối phân tích ảnh: trước hết hệ thống tiến hành bước tiền xử lý ảnh với mục
đích tăng cường, cải thiện chất lượng ảnh, làm nổi các đặc trưng cơ bản của
ảnh hay làm cho ảnh gần giống nhất với trạng thái gốc. Sau đó, là quá trình
4



phân tích ảnh và trích chọn đặc trưng của ảnh ví dụ như biên, điểm gấp khúc,
điểm kết thúc, điểm chữ thập…
• Khối nhận dạng: dựa vào các đặc trưng đã thu nhận từ quá trình phân tích
ảnh trước đó thực hiện quá trình nhận dạng, đưa ra các quyết định ứng với
các ứng dụng cụ thể.
1.1.1. Một số khái niệm và các vấn đề cơ bản trong xử lý ảnh số.
1.1.1.1. Một số khái niệm.
• Phần tử ảnh (Pixel – Picture Element)
Ảnh trong thực tế là một ảnh liên tục về không gian và giá trị độ sáng. Để có thể xử
lý ảnh bằng máy tính cần thiết phải số hóa ảnh. Trong quá trình số hóa, người ta
biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông qua quá trình lấy mẫu (rời rạc
hóa về không gian) và lượng hóa thành phần giá trị. Trong quá trình này người ta sử
dụng khái niệm Pixel để biểu diễn các phần tử của bức ảnh. Ở đây, cũng cần phân
biệt khái niệm pixel hay đề cập đến trong các hệ thống đồ họa máy tính. Để tránh
nhầm lẫn ta tạm thời gọi khái niệm pixel này là pixel thiết bị.
Khái niệm pixel thiết bị có thể xem xét như sau: khi ta quan sát màn hình (trong chế
độ đồ họa), màn hình không liên tục mà gồm nhiều điểm nhỏ, gọi là pixel. Mỗi
pixel bao gồm một cặp tọa độ x, y và màu. Cặp tọa độ x, y tạo nên độ phân giải
(resolution). Như màn hình máy tính có nhiều độ phân giải khác nhau, hiện tại phổ
biến là màn hình VGA có độ phân giải 640x480 hay XSGA độ phân giải 1024x768.
• Ảnh màu (Color Image)
Ảnh màu chứa thông tin màu cho mỗi phần tử ảnh. Thông thường giá trị màu này
dựa trên các không gian màu (color space) trong đó không gian màu thườngđược
dùng là RGB tương ứng với ba kênh màu đỏ (Red) – xanh lá cây (Green) – xanh da
trời (Blue). Tùy thuộc vào số bit, được sử dụng để lưư trữ màu ta có số lượng màu
khác nhau, ví dụ 8 bit, 16 bit, 24 bit (True Color). Nếu ta sử dụng nhỏ hơn 24 bit để
lưu trữ màu thì ta phải có 1 bảng Palette màu, nó tương tự như một bảng Lookup
Table cho phép ánh xạ giữa một vị trí trong bảng với một tổ hợp của không gian

màu RGB. Ví dụ như sử dụng 8 bit tương ứng với 256 màu thì ta phải có bảng ánh
xạ 256 màu đó tương ứng với 256 tổ hợp Red – Green – Blue.

5


• Ảnh đa mức xám
Mức xám (Gray level) là kết quả sự mã hóa tương ứng một cường độ sáng của
mỗi điểm ảnh với một giá trị số - kết quả của quá trình lượng tử hóa. Ảnh đa mức
xám là ảnh có sự chuyển dần mức xám từ trắng sang đen. Thực tế, một giá trị mức
xám chính là sự tổ hợp của ba giá trị RGB (Red- Green – Blue). Thông thường mỗi
điểm ảnh trong bức ảnh đa xám thường được mã hóa 8 bit, tương ứng với 256 mức
xám.
• Lược đồ mức xám
Lược đồ này (Hình 1.2) đơn giản cho ta biết tần suất xuất hiện của mỗi điểm ảnh
( pixel ) trong một bức ảnh ứng với mức xám tương ứng. Ví dụ, một ảnh đa mức
xám sử dụng 8 bit, có 256 mức xám từ o tới 255. Lược đồ mức xám sẽ có trục
hoành chạy từ 0 tới 255 và trục tung chính là tổng số điểm ảnh có mức xám tương
ứng. Biểu đồ này tuy đơn giản nhưng có nhiều ứng dụng trong các bài toán giãn độ
tương phản và phân ngưỡng ảnh ( biến từ ảnh mức xám sang ảnh nhị phân).

Hình 1.2. Lược đồ mức xám của ảnh xám tương ứng
• Ảnh nhị phân
Ảnh nhị phân là ảnh mà mỗi điểm ảnh ảnh chỉ nhận một trong hai giá trị nhị phân.
1.1.1.2 Biểu diễn ảnh.
Trong biểu diễn ảnh, người ta thường dùng các phần tử đặc trưng của ảnh là
pixel. Nhìn chung có thể xem một hàm hai biến chứa thông tin như biểu diễn một
ảnh. Các mô hình biểu diễn ảnh cho ta một mô tả logic hay định lượng các tính chất
của hàm này. Trong biểu diễn ảnh cần chú ý tới đặc tính trung thực của ảnh hoặc
các tiêu chuẩn “thông minh” để đo chất lượng của ảnh hoặc tính hiệu quả của các


6


kỹ thuật xử lý.
Một số mô hình thường được dùng để biểu diễn ảnh như: mô hình toán học,
mô hình thống kê,v.v.... Trong mô hình toán học, ảnh hai chiều biểu diễn nhờ các
hàm hai biến trực giao gọi là hàm cơ sở. Với mô hình thống kê, một ảnh được coi
như một phần tử của một tập hợp đặc trưng bởi các đại lượng như: kỳ vọng toán
học, hiệp biến, phương sai và mômen.
1.1.1.3. Tăng cường ảnh - Khôi phục ảnh.
Tăng cường ảnh là bước quan trọng, tạo tiền đề cho xử lý ảnh. Nó gồm một
loạt các kỹ thuật như: lọc độ tương phản, khử nhiễu, nổi màu… Khôi phục ảnh
nhằm loại bỏ các suy giảm trong ảnh.
1.1.1.4. Biến đổi ảnh.
Thuật ngữ biến đổi ảnh thường được dùng để nói tới một lớp các ma trận đơn
vị và các kỹ thuật dùng để biến đổi ảnh. Cũng như các tín hiệu một chiều được biểu
diễn bởi một chuỗi các hàm cơ sở. Có nhiều loại biến đổi được dùng như
• Biến đổi Fourier

[1]

• Biến đổi KL (Karhuman Loeve )…

[2]

1.1.1.5. Phân tích ảnh.
Phân tích ảnh liên quan đến việc xác định các độ đo định lượng của ảnh để
đưa ra một mô tả đầy đủ về ảnh. Một số kỹ thuật hay dùng là dò biên, dán nhãn
vùng liên thông, phân vùng ảnh…

1.1.1.6. Nhận dạng ảnh.
Nhận dạng là quá trình liên quan đến các mô tả đối tượng mà người ta muốn
đặc tả nó. Quá trình nhận dạng thường đi sau quá trình trích chọn các đặc tính chủ
yếu của đối tượng. Có hai kiểu mô tả đối tượng
• Mô tả tham số (Nhận dạng theo tham số)

[3]

• Mô tả theo cấu trúc (Nhận dạng theo cấu trúc)

[4]

Trên thực tế, người ta đã áp dụng kỹ thuật này để nhận dạng khá thành công nhiều
đối tượng khác nhau như: nhận dạng vân tay, nhân dạng chữ (chữ cái, chữ sỗ có
dấu…).
1.2. Tổng quan về hệ thống nhận dạng biển số xe máy.
Hệ thống nhận dạng biển số xe ứng dụng trong quản lý bãi đỗ xe là một hệ
7


thống khép kín và tự động hệ thống yêu cầu cả phần cứng lẫn phần mềm. Phần cứng
bao gồm một camera có tác dụng thu nhận ảnh, một mạch điều khiển Barrier (dùng
động cơ DC) còn phần mềm sẽ có tác dụng nhận dạng chuyển động chụp hình lấy
mẫu ảnh, phân tách, xử lý ảnh đó, đưa sang cơ sở dữ liệu để quản lý và điều khiển
Barrier.
Camera sẽ được gắn trên một độ cao thích hợp để có thể chụp được biển số xe
khi có xe đi vào, camera sẽ chụp ảnh và lưu ảnh vào một mảng. Ảnh từ mảng lưu
trữ sẽ được đưa vào mudule tách ký tự và chuẩn hoá để thực hiện các kỹ thuật biến
đổi ảnh từ các định dạng cơ bản như JPEG, Bitmap, PNG…giãn độ tương phản,
thành ảnh mức xám, rồi chuyển thành ảnh nhị phân, dò biên, tách biển số, tách ký

tự…Module nhận dạng sẽ nhận các ký tự đã được tách ở module trên và tiến hành
nhận dạng dựa trên phương pháp template matching để nhận dạng các ký tự đã được
tách ra sau phần tiền xử lý. Biển số nhận được từ module nhận dạng sẽ được chuyển
thành chuỗi ký tự biển số xe và chuyển vào giao diện quản lý cơ sở dữ liệu biển số
xe, người dùng sẽ tiến hàng in vé xe cho khách hàng gửi xe và tính phí trông xe.
Cuối cùng phần mạch điều khiển sẽ được kích hoạt để tiến hàng mở Barrier cho
khách hàng đi vào bãi gửi xe.
camera

Khoanh
vùng biển số

Chụp hình
(lấy mẫu)

Chuẩn hóa
ảnh đầu ra

Cách ly
ký tự

Trích vùng
biển số

Nhận dạng
ký tự

Xử lý kết
quả nhận


Điều khiển
hệ thống

Xử lý cơ sở
dữ liệu

Chuỗi ký tự
nhận dạng

Hình 1.3. Sơ đồ khối của hệ thống và vị trí của Module xử lý cơ sở dữ liệu - điều
khiển Barrier

8


Với đặc thù các phương tiện giao thông ở Việt Nam chủ yếu là xe máy, nội
dung đề tài này tập trung vào xây dựng hệ thống quản lý biển số đăng ký xe máy
mang tính ứng dụng thực tiễn cao, với khả năng triển khai thử nghiệm và ứng dụng
vào thực tế.
1.3. Giới thiệu về module quản lý cơ sở dữ liệu biển số xe máy.
1.3.1. Lý thuyết về Camera.
1.3.1.1. Bộ cảm biến ảnh.
Máy chụp ảnh, camera có thể ghi lại hình ảnh (phim trong máy chụp,
vidicon trong camera truyền hình). Có nhiều loại máy cảm biến (Sénor) làm việc
với ánh sáng nhìn thấy và hồng ngoại như : Micro Densittometers, Image Dissector,
Camera Divincon, linh kiện quang điện bằng bán dẫn. Các loại cảm biến bằng chụp
ảnh. Camera divicon và linh kiện bán dẫn quang điện có thể cho ảnh ghi trên băng
từ có thể số hoá.
Trong Micro Densitometer phim và ảnh chụp được gắn trên mặt phẳng hoặc cuốn
quang trống. Việc quét ảnh thông qua tia sáng ( ví dụ tia Laser) trên ảnh đồng thời

dịch chuyển mặt phim hoặc quang trống tương đối theo tia sáng. Trường hợp dùng
phim, tia sáng đi qua phim . Bây giớ chúng ta đề cập đến tất cả các khối trong hệ
thống.
1.3.1.2. Thiết bị thu nhận ảnh
Chức năng của thiết bị này là số hóa một băng tần số cơ bản của tín hiệu truyền
hình cung cấp từmột camera, hoặc từ một đầu máy VCR. Ảnh số sau đó được lưu trữ
trong bộ đệm chính. Bộ đệm này có khả năng được địa chỉ hóa (nhờ một PC) đến từng
điểm bằng phần mềm. Thông thường thiết bị này có nhiều chương trình con điều khiển để
có thể lập trình được thông qua ngôn ngữ lập trình C. Khi mua một thiết cần chú ý các điểm
sau:
- Thiết bị có khả năng số hóa ảnh ít nhất 8 bit (256 mức xám) và ảnh thu được phải có kích
thước ít nhất là 512×512 điểm hoặc hơn.
-Thiết bị phải chứa một bộ đệm ảnh để lưu trữ một hoặc nhiều ảnh có độ phân giải 512×512
điểm ảnh.
-Thiết bị phải được kèm một bộ đầy đủ thư viện các chương trình con có khả năng giao
diện với các chương trình C viết bằng Turbo C hoặc Microsoft C.

9


- Sổ tay hướng dẫn sử dụng phải được kèm theo, gồm cả dạng chứa trên đĩa và khi in.
1.3.1.3. Camera.
Tổng quát có hai kiểu camera: kiểu camera dùng đèn chân không và kiểu camera chỉ
dùng bán dẫn. Đặc biệt là trong lĩnh vực này, camera bán dẫn thường hay được dùng
hơn camera đèn chân không. Camera bán dẫn cũng được gọi là CCD camera do dùng
các thanh ghi dịch đặc biệt gọi là thiết bị gộp (Charge-Coupled Devices- CCDs). Các
CCD này chuyển các tín hiệu ảnh sang từ bộ cảm nhận ánh sáng bổ trợ ở phía trước
camera thành các tín hiệu điện mà sau đó được mã hóa thành tín hiệu TV. Loại camera chất
lượng cao cho tín hiệu ít nhiễu và có độ nhậy cao với ánh sáng. Khi chọn camera cần chú ý
đến các thấu kính từ 18 đến 108 mm. Sau đây là danh sách các nhà sản xuất:

-

Pulnix America Inc, 770 Lucerne Drive, Sunnyvale, CA 84086. Tel. 408-773-1550;

fax 408-737-2966.
- Sony Corp. of America, Component Products Co., 10833 Valley View St., Cypress, CA
90630. Fax 714-737-4285.
- Panasonic, industrial camera division: 201-329-6674.
- JVC Professional: 1-800-JVC-5825.
1.3.1.4. Màn hình Video.
Một số nhà sản xuất (như Sony) sản xuất các loại màn hình đen trắng chất lượng cao.
Nên sử dụng loại màn hình chất lượng cao, vì màn hình chất lượng thấp có thể làm bạn
nhầm lẫn kết quả. Một màn hình 9 inch là đủ cho yêu cầu làm việc. Để hiển thị ảnh màu,
nên dùng một màn hình đa hệ.
1.3.1.5. Máy tính.
Cần có một máy tính với bộ xử lý Pentium 4 hoặc cấu hình cao hơn. Để chắc chắn,
các máy này phải có sẵn các khe cắm cho phần xử lý ảnh. Các chương trình thiết kế và lọc
ảnh có thể chạy trên bất kỳ hệ thống nào. Các chương trình con hiển thị ảnh dựng vỉ mạch
VGA và có sẵn trên đĩa kèm theo. Các chương trình con hiển thị ảnh cũng hỗ trợ cho hầu
hết các vi mạch SVGA.
Kết quả nhận dạng được lưu dưới dạng chuỗi các ký tự (character string) được đưa
vào chương trình quản lý cơ sở dữ liệu biển số xe máy. Tại đây cán bộ trông xe sẽ
tiến hành các thao tác nghiệp vụ như: in vé xe, thu tiền, lưu vào cơ sở dữ liệu. Tuỳ
thuộc vào kết quả xử lý của chương trình quản lý hệ thống Barrier sẽ được tiến hành

10


đóng mở tương ứng.
1.3.2. Giới thiệu về Module thu nhận ảnh, phân vùng biển số và tách ký tự.

Yêu cầu của bài toán bài là áp dụng các thuật toán thích hợp sử dụng một camera thu
nhận hình ảnh nhận dạng chuyển động tự động chụp và ghi nhận hình. Tự động trích rút
vùng biển số trên ảnh thu nhận được và tách các ký tự trên phân vùng biển số đó; từ đó máy
tính có khả năng xử lý và nhận dạng được biển số xe.
1.3.3. Các chức năng chính của phần mềm quản lý cơ sở dữ liệu biển số xe
máy.
-

Chức năng “Hệ thống”: sao lưu dữ liệu, phục hồi dữ liệu và thoát.

-

Chức năng “Thay đổi giá vé”: cho phép người quản trị có thể thay đổi giá vé
khi có yêu cầu.

-

Chức năng “In vé”: In vé xe cho khách hàng gửi xe.

-

Chức năng “Tính tiền”: Thanh toán phí gửi xe.

-

Chức năng “Báo cáo”: Thống kê tính hình quản lý lượng xe máy ra vào cùng
các thông số khác.

11



CHƯƠNG 2. KỸ THUẬT XỬ LÝ ẢNH CƠ BẢN ỨNG DỤNG
TRONG HỆ THỐNG
2.1. Cải thiện ảnh sử dụng toán tử điểm
2.1.1. Khái niệm về toán tử điểm
Xử lý điểm ảnh thực chất là biến đổi giá trị một điểm ảnh dựa vào giá trị của
chính nó mà không hề dựa vào các điểm ảnh khác. Có hai cách tiệm cận với phương
pháp này. Cách thứ nhất dùng một hàm biến đổi thích hợp với mục đích hoặc yêu
cầu đặt ra để biến đổi giá trị mức xám của điểm ảnh sang một giá trị mức xám khác.
Cách thứ hai là dùng lược đồ mức xám (GrayHistogram). Về mặt toán học, toán tử
điểm là một ánh xạ từ giá trị cường độ ánh sáng u(m, n) tại toạ độ (m, n) sang giá tri
cường độ ánh sáng khác v(m, n) thông qua hàm f(.), tức là:
v(m,n) = f(u(m,n))

(2-1)

Nói một cách khác, toán tử điểm là toán tử không bộ nhớ, ở đó một mức xác u ∈ [0
, N ] được ánh xạ sang một mức xám v ∈ [ 0 , N ] : v = f ( u ) . Ứng dụng chính của
các toán tử điểm là biến đổi độ tương phản của ảnh. Ánh xạ f khác nhau tùy theo
các ứng dụng.
2.1.2. Tăng độ tương phản (Stretching Contrast).
Trước tiên cần làm rõ khái niệm độ tương phản. Ảnh số là tập hợp các điểm, mỗi
điểm có giá trị độ sáng khác nhau. Ở đây, độ sáng để mắt người dễ cảm nhận ảnh
song không phải là quyết định. Thực tế chỉ ra rằng hai đối tượng có cùng độ sáng
nhưng đặt trên hai nền khác nhau sẽ cho cảm nhận sáng khác nhau. Như vậy, độ
tương phản biểu diễn sự thay đổi độ sáng của đối tượng so với nền. Nói một cách
khác, độ tương phản là độ nổi của điểm ảnh hay vùng ảnh so với nền. Như vậy, nếu
ảnh có độ tương phản kém, ta có thể thay đổi tùy ý theo ý muốn. Ảnh với độ tương
phản thấp có thể do điều kiện sáng không đủ hay không đều, hoặc do tính không
tuyến tính hay biến động nhỏ của bộ cảm nhận ảnh. Để điều chỉnh lại độ tương phản

của ảnh, cần điều chỉnh lại biên độ trên toàn dải hay trên dải có giới hạn bằng cách
biến đổi tuyến tính biên độ đầu vào (dùng hàm biến đổi là hàm tuyến tính) hay phi
tuyến (hàm mũ hay hàm lôgarit).

12


αu

f(u) =

α ≤u≤a

β (u - α ) + v

a≤u≤b

γ (u - b) + v

(2-2)

β ≤u≤L

Các cấp độ α , β , γ xác định độ tương phản tương đối. L là số mức xám cực đại.
Khi dùng hàm tuyến tính các độ dốc α , β , γ phải chọn lớn hơn một trong miền cần
dãn. Các tham số a và b (các cận) có thể chọn khi xem xét lược đồ xám của ảnh.
Chú ý, nếu dãn độ tương phản bằng hàm tuyến tính ta có:
α = β = γ =1 ảnh kết quả trùng với ảnh gốc
α, β, γ > 1 dãn độ tương phản
α, β, γ < 1 co độ tương phản


v
γ
β
Vb

Va

α

a

b

L

u

Hình 2.1. Dãn đồ tương phản
Hàm mũ thường được dùng để dãn độ tương phản. Hàm có dạng:
f(u)=(X[m,n])p

(2-3)

với p là bậc thay đổi, thường chọn bằng 2.
2.1.3. Biến đổi âm bản (Digital Negative).
Âm bản nhận được bằng phép biến đổi âm. Phép biến đổi rất có nhiều hữu ích trong
các phim ảnh dùng trong các ảnh y học.
f(u) = L − u


(2-4)

13


×