Tải bản đầy đủ (.docx) (47 trang)

Nhận dạng ký tự số trong hệ thống kiểm soát vé tự động

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (683.01 KB, 47 trang )

BỘ GIÁO DỤC & ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HCM
KHOA ĐIỆN – ĐIỆN TỬ
BỘ MÔN ĐIỆN TỬ VIỄN THÔNG

ĐỒ ÁN TỐT NGHIỆP
NGÀNH: ĐIỆN TỬ VIỄN THÔNG
Đề tài:
NHẬN DẠNG KÝ SỐ TRONG HỆ THỐNG
SOÁT VÉ TỰ ĐỘNG
GVHD : TS. NGUYỄN VĂN PHÚC
SVTH : TRẦN THỊ MINH TRANG
LÊ XUÂN THỌ
TPHCM, 10/2014
LỜI CẢM ƠN
Lời đầu tiên nhóm sinh viên thực hiện xin chân thành bày tỏ lòng cảm ơn
thầy Nguyễn Văn Phúc, người đã tận tình hướng dẫn trong suốt quá trình hoàn
thành luận văn này. Thầy đã mở ra cho nhóm sinh viên thực hiện những vấn đề
khoa học hướng nhóm thực hiện đề tài vào nghiên cứu các lĩnh vực hết sức thiết
thực và vô cùng bổ ích, đồng thời tạo điều kiện thuận lợi nhóm sinh viên thực hiện
học tập và nghiên cứu. Nhóm sinh viên thực hiện đã học hỏi được rất nhiều ở Thầy
phong cách làm việc, cũng như phương pháp nghiên cứu khoa học của Thầy…
Nhóm luôn được Thầy cung cấp các tài liệu, các chỉ dẫn hết sức quý báu khi cần
thiết trong suốt thời gian thực hiện luận văn.
Nhóm sinh viên thực hiện cũng xin thể hiện sự kính trọng và lòng biết ơn
đến quý Thầy Cô trong khoa Điện – Điện Tử, những người đã trang bị cho nhóm rất
nhiều kiến thức chuyên ngành, cũng như sự chỉ bảo, giúp đỡ tận tình của quý Thầy
Cô đối với nhóm sinh viên thực hiện trong suốt quá trình học tập.
Nhân đây, nhóm sinh viên thực hiện xin gửi lời cảm ơn sâu sắc đến bố, mẹ
và những người thân trong gia đình, cảm ơn những tình cảm và những lời động viên
nhóm sinh viên thực hiện trong suốt quá trình hoàn thành luận văn này.


Nhóm sinh viên thực hiện cũng xin được cảm ơn tất cả anh chị, các bạn học,
những người đã cung cấp và chia sẻ những tài liệu, thông tin quý báu trong suốt quá
trình học tập, nghiên cứu, hoàn thành luận văn này.
Tp. Hồ Chí Minh, tháng 1 năm 2015
Nhóm sinh viên thực hiện
2
Trần Thị Minh Trang
Lê Xuân Thọ

TÓM TẮT
Ngày nay việc đầu tư cho các khu du lịch, khu vui chơi giải trí là hình thức kinh
doanh mang lại nguồn thu không nhỏ cho các nhà đầu tư. Vấn đề liên quan trực tiếp
đến lợi nhuận là việc quản lý soát vé sao cho hiệu quả. Với việc bán và soát vé dưới
hình thức thủ công bằng vé giấy thông thường dễ gây thất thu đáng kể cho người
đầu tư.
Do đó mà hệ thống soát vé tự động được thiết lập nhằm đáp ứng nhu cầu quản lý
ngày càng cao của các nhà đầu tư khu du lịch, khu vui chơi, giải trí, nhà ga sân bay,
tàu điện ngầm, Hệ thống quản lý chặt chẽ, mang lại hiệu quả cao cho nhà đầu tư.
Nhằm đáp ứng nhu cầu đó, nhóm thực hiện đề tài sẽ tìm hiểu, nghiên cứu và thực
hiện việc nhận dạng ký số trong hệ thống soát vé tự động. Để nhận dạng được
các ký số thì việc lấy ảnh và tiền xử lý là bước nền tảng vì thế trong luận văn nhóm
thực hiện sẽ quan tâm và làm rõ hơn về việc xử lý các ảnh đầu vào. Và sau đó sẽ
đưa các ký số được xử lý vào nhận dạng bằng mạng Neural. Chương trình được mô
phỏng trên phần mềm Matlab. Phương pháp nêu trên giúp chúng ta có thời gian xử
lý nhanh, chính xác và hiệu quả trong việc nhận dạng và xử lý ký số.
3
MỤC LỤC
4
LIỆT KÊ HÌNH
5

CHƯƠNG 1
GIỚI THIỆU
1.1 TÌNH HÌNH NGHIÊN CỨU
Ngày nay, việc đầu tư cho các khu du lịch, khu vui chơi giải trí là hình thức
kinh doanh mang lại nguồn thu không nhỏ cho các nhà đầu tư. Vấn đề liên quan
trực tiếp đến lợi nhuận là việc quản lý soát vé sao cho hiệu quả. Với việc bán và
soát vé dưới hình thức thủ công bằng vé giấy thông thường dễ gây thất thu đáng kể
cho người đầu tư.
Một số nguyên nhân dễ gây thất thoát như:
- Nhân viên soát vé không thu vé (tiền) của người quen.
- Vé xoay vòng để bán lại sau khi đã soát.
- Người lớn sử dụng vé trẻ em.
- Khách hàng đi từng tốp nhiều người và mua vé ít hơn số lượng người, khi
qua cổng họ cố tình chen lấn qua cổng nhanh để gây khó khăn trong việc
soát vé.
- Với những đoàn khách đông người, việc đếm người không chính xác hay
nhân viên bắt tay với trưởng đoàn để chấp nhận số lượng vé ít hơn số lượng
người.
Do đó mà hệ thống soát vé tự động được thiết lập nhằm đáp ứng nhu cầu quản lý
ngày càng cao của các nhà đầu tư khu du lịch, khu vui chơi, giải trí, nhà ga, sân bay,
tàu điện ngầm, Hệ thống quản lý chặt chẽ, mang lại hiệu quả cao cho nhà đầu tư.
Để đọc các ký số trên vé chúng ta có thể sử dụng máy laser hoặc sử dụng máy tính
để xử lý hình ảnh từ camera. Và để máy tính có thể đọc, phân tích được thông tin từ
ký số thì cần phải tạo ra những phần mềm dành riêng cho chúng. Vậy nên vấn đề
đặt ra là chúng ta sẽ sử dụng một ngôn ngữ lập trình thực hiện việc nhận dạng và
đọc ký số.
Ngày nay việc nghiên cứu và phát triển các phương pháp, thuật toán dành
riêng cho nhận dạng và đọc ký số đang được chú trọng và quan tâm. phương pháp
xử lý riêng nhằm nâng cao độ chính xác và rút ngắn thời gian xử lý. Để áp dụng vào
thực tiễn cuộc sống, trên thế giới đã có những luận án, báo cáo khoa học nghiên

cứu, giải thích và thực hiện những vấn đề nêu trên. Theo thời gian, nhiều phần mềm
6
ứng dụng được giới thiệu rộng rãi, tuy nhiên đều thừa kế những phương pháp tiêu
biểu đã được nghiên cứu nhưng sử dụng những thuật toán khác nhau.
Phương pháp dựa trên các hoạt động hình thái cơ bản: hầu hết các thuật toán
sử dụng các thao tác đơn giản trong tiền xử lý như lượng tử, chuyển ảnh về giá trị
nhị phân. Tiếp theo các thao tác nhận dạng ký số sẽ được sử dụng trên ảnh nhị phân
vừa được xử lý .
Phương pháp Liner Scanning: thực hiện việc quét và so sánh các đường
thẳng theo nhiều góc, thường chọn các góc 0, 45, 90, 135 độ. Phương pháp này đòi
hỏi chất lượng ảnh đầu vào cao, vì vậy trước khi xử lý ký số cần nâng cao chất
lượng hình ảnh. Phương pháp này được sử dụng rộng rãi và thực hiện với nhiều
thuật toán khác nhau .
Phương pháp phân khúc, phân chia hình ảnh thành nhiều khu vực để xử lý,
phương pháp này được sử dụng với bộ lọc đa đường Gabor với tám hướng và sau
đó sử dụng các biến đổi Hough để xác định ký số.
Tuy nhiên việc nhận dạng ký số luôn gặp những khó khăn nhất định như: tác
động từ ánh sáng của môi trường, chất lượng hình ảnh, chất lượng in ấn Vì vậy
việc phát triển thêm nữa những phương pháp nhằm tối ưu hóa việc nhận dạng ký số
vẫn còn là một vấn đề quan trọng.
1.2 LÝ DO CHỌN ĐỀ TÀI
Với mong muốn tổng hợp lại những kiến thức đã học tại trường trong suốt
thời gian qua và có thể ứng dụng những kiến thức đó vào trong thực tế. Nhóm thực
hiện đề tài đã nghiên cứu và phát triển chương trình mô phỏng “NHẬN DẠNG KÝ
SỐ TRONG HỆ THỐNG SOÁT VÉ TỰ ĐỘNG”.
Đề tài “NHẬN DẠNG KÝ SỐ TRONG HỆ THỐNG SOÁT VÉ TỰ
ĐỘNG” chính là mục tiêu mà nhóm thực hiện đề tài muốn hướng tới. Qua đây sẽ
giúp cho mọi người nắm bắt một phần nào đó về quá trình xử lý ảnh sử dụng phần
mềm matlab cho việc nhận dạng ký số.
1.3 GIỚI THIỆU ĐỀ TÀI

Xử lý ảnh và nhận dạng là một lĩnh vực từ lâu được nhiều người quan tâm.
Nó đã được ứng dụng vào nhiều lĩnh vực. Chúng thực hiện các công việc đòi hỏi có
tốc độ và độ chính xác cao vượt quá khả năng con người Người máy sẽ trở nên
7
tinh vi hơn và thị giác máy tính đóng vai trò quan trọng hơn. Người ta sẽ không chỉ
đòi hỏi người máy xử lý và nhận dạng các bộ phận công nghiệp mà còn phải “hiểu”
được những gì chúng “thấy ” và đưa ra hành động phù hợp. Xử lý ảnh sẽ tác động
đến thị giác của máy tính.
Như tình hình thực tế đã đề cập ở trên, việc ứng dụng xử lý và nhận dạng ký
số trong hệ thống soát vé tự động, cũng như nhiều lĩnh vực khác là điều cấp thiết
giúp con người giảm tải hơn trong quá trình quản lý, có được thông tin chính xác do
thu thập các dữ liệu tự động để ra các quyết định chính xác trong quản lí, sản xuất
và kinh doanh, tiết kiệm được các chi phí không cần thiết. Sử dụng ít nhân lực và
tốn ít thời gian trong khâu kiểm kê tính toán, có điều kiện để hội nhập thương mại
toàn cầu và quảng bá thương hiệu. Khi ký số được sử dụng rộng rãi như vậy, đặt ra
phải có công cụ để đọc để quản lý nó. Nhằm thỏa yêu cầu đó. Nhóm thực hiện đề
tài đã nghiên cứu và phát triển mô hình mô phỏng để tài “NHẬN DẠNG KÝ SỐ
TRONG HỆ THỐNG SOÁT VÉ TỰ ĐỘNG”.
1.4 MỤC TIÊU CỦA ĐỀ TÀI
Đồ án nghiên cứu việc nhận dạng và đọc ký số theo hướng:
- Nhận dạng ký số từ những hình ảnh đã được lưu sẵn trong máy tính.
- Xử lý và nhận dạng ký số từ những hình ảnh được chụp từ webcam giao tiếp với
máy tính.
1.5 Ý NGHĨA CỦA ĐỀ TÀI
Đề tài được xây dựng dựa trên nhu cầu thực tiễn của xã hội. Thuận lợi trong
việc quản lý kiểm soát vé được nhanh chóng, hiệu quả. Sử dụng rộng rãi trong quản
lý kiểm soát vé tự động tại các điểm du lịch, khu vui chơi giải trí,…
1.6 GIỚI HẠN CỦA ĐỀ TÀI
- Chưa xử lý và nhận dạng được những hình ảnh bị ảnh hưởng bởi độ nghiêng, ánh
sáng môi trường, khoảng cách xa.

- Các phương pháp cao cấp hơn như: lấy mẫu, lưỡng tử hóa ảnh, sử dụng lược đồ
xám, xử lý điểm ảnh bằng ánh xạ biến đổi Fourier, tách biên,…nằm ngoài phạm vi
của đề tài.
8
1.7 BỐ CỤC ĐỀ TÀI
Với khuôn khổ phạm vi nghiên cứu đề tài, đồ án này được chia thành sáu
chương với nội dung chủ yếu mỗi chương như sau:
Chương 1: Giới thiệu
Giới thiệu tổng quát về đề tài, lý do chọn đề tài, các hướng thực hiện nhiệm
vụ đề tài nhằm tạo cái nhìn tổng quan về nội dung nghiên cứu của đề tài.
Chương 2: Cơ sở lý thuyết về xử lý ảnh
Giới thiệu tổng quát về xử lý ảnh như các bước cần thiết và các vấn đề cơ
bản về xử lý ảnh cần thực hiện.
Chương 3: Tổng quan về hệ thống nhận dạng ký số trong hệ thống soát vé tự
động
Lưu đồ của hệ thống nhận dạng ký số trong hệ thống soát vé tự động, thuật
toán tách ký số.
Chương 4: Tổng quan về mạng Neural
Giới thiệu tổng quát về mạng neural, kiến trúc mạng, thuật toán huấn luyện
và những hạn chế.
Chương 5: Thiết kế hệ thống nhận dạng ký số và kết quả
Trình bày quy trình thiết kế, kết quả mô phỏng và nhận dạng.
Chương 6: Kết luận
Những điểm đã đạt được và chưa đạt được trong quá trình thực hiện đề tài,
những thuận lợi, khó khăn và hướng phát triển đề tài.

9
10
CHƯƠNG 2
CƠ SỞ LÝ THUYẾT VỀ XỬ LÝ ẢNH [6][7][9]

2.1 GIỚI THIỆU
Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Nó là một
ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát triển
của nó rất nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc biệt là máy
tính chuyên dụng riêng cho nó.
Xét các bước cần thiết trong xử lý ảnh. Đầu tiên, ảnh tự nhiên từ thế giới
ngoài được thu nhận qua các thiết bị thu (như Camera, máy chụp ảnh). Trước đây,
ảnh thu qua Camera là các ảnh tương tự (loại Camera ống kiểu CCIR). Gần đây, với
sự phát triển của công nghệ, ảnh màu hoặc đen trắng được lấy ra từ Camera, sau đó
nó được chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo. (Máy ảnh
số hiện nay là một thí dụ gần gũi). Mặt khác, ảnh cũng có thể tiếp nhận từ vệ tinh;
có thể quét từ ảnh chụp bằng máy quét ảnh. Hình vẽ dưới đây mô tả các bước cơ
bản trong xử lý ảnh .
Hình 2.1: Các bước cơ bản trong xử lý ảnh
11
Nhận dạng và
nội suy
Biểu diễn
và mô tả
Phân đoạn
ảnh
Tiền xử lý
ảnh
Thu nhận
ảnh
Cơ sở trí thức
Sơ đồ này bao gồm các thành phần sau:
2.1.1 Phần thu nhận ảnh (Image Acquisition)
Ảnh có thể nhận qua camera màu hoặc đen trắng. Thường ảnh nhận qua
camera là ảnh tương tự (loại camera ống chuẩn CCIR với tần số 1/25, mỗi ảnh 25

dòng), cũng có loại camera đã số hoá (như loại CCD – Change Coupled Device) là
loại photodiot tạo cường độ sáng tại mỗi điểm ảnh.
Camera thường dùng là loại quét dòng; ảnh tạo ra có dạng hai chiều. Chất
lượng một ảnh thu nhận được phụ thuộc vào thiết bị thu, vào môi trường (ánh sáng,
phong cảnh).
2.1.2 Tiền xử lý (Image Processing)
Sau bộ thu nhận, ảnh có thể nhiễu độ tương phản thấp nên cần đưa vào bộ
tiền xử lý để nâng cao chất lượng. Chức năng chính của bộ tiền xử lý là lọc nhiễu,
nâng độ tương phản để làm ảnh rõ hơn, nét hơn.
2.1.3 Phân đoạn (Segmentation) hay phân v}ng ảnh
Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểu
diễn phân tích, nhận dạng ảnh. Ví dụ: để nhận dạng chữ (hoặc kí số) trên phong bì
thư cho mục đích phân loại bưu phẩm, cần chia các câu, chữ về địa chỉ hoặc tên
người thành các từ, các chữ, các số (hoặc các vạch) riêng biệt để nhận dạng. Đây là
phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi, làm mất độ chính
xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào công đoạn này.
2.1.4 Bi~u di•n ảnh (Image Representation)
Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã phân
đoạn) cộng với mã liên kết với các vùng lận cận. Việc biến đổi các số liệu này thành
dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính. Việc chọn các tính
chất để thể hiện ảnh gọi là trích chọn đặc trưng (Feature Selection) gắn với việc tách
các đặc tính của ảnh dưới dạng các thông tin định lượng hoặc làm cơ sở để phân
biệt lớp đối tượng này với đối tượng khác trong phạm vi ảnh nhận được. Ví dụ:
trong nhận dạng ký tự trên phong bì thư, chúng ta miêu tả các đặc trưng của từng ký
tự giúp phân biệt ký tự này với ký tự khác.
12
2.1.5 Nhận dạng và nội suy ảnh (Image Recognition and Interpretation)
Nhận dạng ảnh là quá trình xác định ảnh. Quá trình này thường thu được
bằng cách so sánh với mẫu chuẩn đã được học (hoặc lưu) từ trước. Nội suy là phán
đoán theo ý nghĩa trên cơ sở nhận dạng. Ví dụ: một loạt chữ số và nét gạch ngang

trên phong bì thư có thể được nội suy thành mã điện thoại. Có nhiều cách phân loai
ảnh khác nhau về ảnh. Theo lý thuyết về nhận dạng, các mô hình toán học về ảnh
được phân theo hai loại nhận dạng ảnh cơ bản :
- Nhận dạng theo tham số.
- Nhận dạng theo cấu trúc.
Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng trong
khoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký điện tử),
nhận dạng văn bản (Text), nhận dạng vân tay, nhận dạng mã vạch, nhận dạng mặt
người…
2.1.6 Cơ sở tri thức (Knowledge Base)
Ảnh là một đối tượng khá phức tạp về đường nét, độ sáng tối, dung lượng
điểm ảnh, môi trường để thu ảnh phong phú kéo theo nhiễu. Trong nhiều khâu xử lý
và phân tích ảnh ngoài việc đơn giản hóa các phương pháp toán học đảm bảo tiện
lợi cho xử lý, người ta mong muốn bắt chước quy trình tiếp nhận và xử lý ảnh theo
cách của con người. Trong các bước xử lý đó, nhiều khâu hiện nay đã xử lý theo các
phương pháp trí tuệ con người. Vì vậy, ở đây các cơ sở tri thức được phát huy.
2.2 NHỮNG VẤN ĐỀ CƠ BẢN TRONG HỆ THỐNG XỬ LÝ ẢNH
2.2.1 Đi~m ảnh (Picture Element)
Gốc của ảnh (ảnh tự nhiên) là ảnh liên tục về không gian và độ sáng. Để xử
lý bằng máy tính (số), ảnh cần phải được số hoá. Số hoá ảnh là sự biến đổi gần đúng
một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí (không gian) và
độ sáng (mức xám). Khoảng cách giữa các điểm ảnh đó được thiết lập sao cho mắt
người không phân biệt được ranh giới giữa chúng. Mỗi một điểm như vậy gọi là
điểm ảnh (PEL: Picture Element) hay gọi tắt là Pixel. Trong khuôn khổ ảnh hai
chiều, mỗi pixel ứng với cặp tọa độ (x, y).
13
Định nghĩa: Điểm ảnh (Pixel) là một phần tử của ảnh số tại toạ độ (x, y) với
độ xám hoặc màu nhất định. Kích thước và khoảng cách giữa các điểm ảnh đó được
chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức xám
(hoặc màu) của ảnh số gần như ảnh thật. Mỗi phần tử trong ma trận được gọi là một

phần tử ảnh .
2.2.2 Ảnh
Ảnh được xem như là một tập hợp các điểm ảnh.
Bất kỳ hình ảnh từ một máy quét hoặc từ một Camera số hay trong máy tính
là một hình ảnh kỹ thuật số. Hình ảnh máy tính đã được “số hóa”, đây là quá trình
chuyển đổi từ hình ảnh màu sắc thực tế thành các dữ liệu số bao gồm các hàng và
cột của hàng triệu mẫu màu được đo từ hình ảnh ban đầu.
Một máy ảnh kỹ thuật số dùng chip CCD (Change Coupled Device) đằng sau
ống kính, CCD bao gồm một mạng lưới các điểm bắt sáng được phủ bằng lớp bọc
màu (đỏ - Red, xanh lục – Green, xanh dương – Blue), mỗi điểm ảnh chỉ bắt một
màu. Do đó khi chụp ảnh (cửa sập mở), ánh sáng qua ống kính và được lưu lại trên
bề mặt chip cảm biến dưới dạng điểm ảnh. Mỗi điểm ảnh có một mức điện áp khác
nhau sẽ được chuyển đến bộ phận đọc giá trị theo từng hàng. Giá trị mỗi điểm ảnh
sẽ được khuếch đại và được đưa vào bộ chuyển đổi tín hiệu tương tự sang tín hiệu
số, cuối cùng đổ vào bộ xử lý để tái hiện lại hình ảnh đã chụp. Chính quá trình đọc
thông tin thực hiện theo từng hàng đã làm cho tốc độ xử lý ảnh chậm, thiếu hoặc
thừa sáng. Đối với máy ảnh kỹ thuật số dùng chip CMOS tại các điểm bắt sáng có
sẵn mạch điện hỗ trợ dễ dàng tích hợp ngay quá trình xử lý điểm ảnh. Với cấu trúc
này, mỗi điểm ảnh sẽ được xử lý ngay tại chỗ và đồng loạt truyền tín hiệu số về bộ
xử lý để tái hiện hình ảnh đã chụp nên tốc độ xử lý nhanh hơn rất nhiều.
Cảm biến nhìn thấy màu sắc và độ sáng của từng khu vực nhỏ là lấy mẫu. Đó
là giá trị màu sắc của từng khu vực được đo và ghi thành giá trị số đại diện cho màu
sắc. Quá trình này được gọi là số hóa hình ảnh. Dữ liệu được tổ hợp thành các hàng
và cột để giữ lại vị trí của từng khu vực hình ảnh. Mỗi giá trị dữ liệu đó chính là
điểm ảnh. Các dữ liệu hình ảnh là bao gồm các giá trị màu RGB số trong một mạng
lưới các hang và cột. Khi tất cả các dữ liệu ảnh được kết hợp lại và sao chép liên
14
tiếp, chính xác trật tự cột trên giấy in hoặc hoặc màn hình máy tính, não bộ con
người nhận ra hình ảnh ban đầu .
2.2.3 Độ phân giải của ảnh

Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn định trên một
ảnh số được hiển thị. Theo định nghĩa, khoảng cách giữa các điểm ảnh phải được
chọn sao cho mắt người vẫn thấy được sự liên tục của ảnh. Việc lựa chọn khoảng
cách thích hợp tạo nên một mật độ phân bổ, đó chính là độ phân giải và được phân
bố theo trục x và y trong không gian hai chiều.
Ví dụ: Độ phân giải của ảnh trên màn hình CGA (Color Graphic Adaptor) là
một lưới điểm theo chiều ngang màn hình: 320 điểm chiều dọc * 200 điểm ảnh
(320*200). Rõ ràng, cùng màn hình CGA 12” ta nhận thấy mịn hơn màn hình CGA
17” độ phân giải 320*200. Lý do: cùng một mật độ (độ phân giải) nhưng diện tích
màn hình rộng hơn thì độ mịn (liên tục của các điểm) kém hơn.
2.2.4 Mức xám của ảnh [2]
Mức xám của điểm ảnh là cường độ sáng của nó được gán bằng giá trị số tại
điểm đó.
Các thang giá trị mức xám thông thường: 16, 32, 64, 128, 256 (Mức 256 là
mức phổ dụng. Lý do: từ kỹ thuật máy tính dùng 1 byte (8 bit) để biểu diễn mức
xám: Mức xám dùng 1 byte biểu diễn: 2^8=256 mức, tức là từ 0 đến 255).
2.2.5 Ảnh nhị phân
Là ảnh chỉ có 2 mức đen trắng phân biệt, tức dùng 1 bit mô tả 21 mức khác
nhau. Nói cách khác, mỗi điểm ảnh của ảnh nhị phân chỉ có thể là 0 hoặc 1.
2.2.6 Ảnh màu
Trong khuôn khổ lý thuyết ba màu (Red, Blue, Green) để tạo nên thế giới
màu, người ta thường dùng 3 byte để mô tả mức màu, khi đó các giá trị màu là 28*3
= 224 =16,7 triệu màu.
2.2.7 Khử nhi•u
Có 2 loại nhiễu cơ bản trong quá trình thu nhận ảnh:
15
- Nhiễu hệ thống: là nhiễu có quy luật có thể khử bằng các phép biến đổi
- Nhiễu ngẫu nhiên: vết bẩn không rõ nguyên nhân → khắc phục bằng các phép lọc.
2.2.8 Chỉnh mức xám
Nhằm khắc phục tính không đồng đều của hệ thống gây ra. Thông thường có

2 hướng tiếp cận:
- Giảm số mức xám: Thực hiện bằng cách nhóm các mức xám gần nhau thành một
bó. Trường hợp chỉ có 2 mức xám thì chính là chuyển về ảnh đen trắng. Ứng dụng:
In ảnh màu ra máy in đen trắng.
- Tăng số mức xám: Thực hiện nội suy ra các mức xám trung gian bằng kỹ thuật nội
suy. Kỹ thuật này nhằm tăng cường độ mịn cho ảnh.
2.2.9 Nhận dạng ảnh
Nhận dạng tự động (automatic recognition), mô tả đối tượng, phân loại và
phân nhóm các mẫu là những vấn đề quan trọng trong thị giác máy, được ứng dụng
trong nhiều ngành khoa học khác nhau. Mẫu ở đây có thể là ảnh của vân tay, ảnh
của một vật nào đó được chọn, một chữ viết, khuôn mặt người ….
Hệ thống nhận dạng tự động bao gồm ba khâu tương ứng với ba giai đoạn
chủ yếu sau đây:
1. Thu nhận dữ liệu và tiền xử lý.
2. Biểu diễn dữ liệu.
3. Nhận dạng, ra quyết định.
Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng là:
1. Đối sánh mẫu dựa trên các đặc trưng được trích chọn.
2. Phân loại thống kê.
3. Đối sánh cấu trúc.
4. Phân loại dựa trên mạng neural nhân tạo.
Trong các ứng dụng rõ ràng là không thể chỉ dùng có một cách tiếp cận đơn
lẻ để phân loại “tối ưu” do vậy cần sử dụng cùng một lúc nhiều phương pháp và
cách tiếp cận khác nhau. Do vậy, các phương thức phân loại tổ hợp hay được sử
16
dụng khi nhận dạng và nay đã có những kết quả có triển vọng dựa trên thiết kế các
hệ thống lai (hybrid system) bao gồm nhiều mô hình kết hợp.
Việc giải quyết bài toán nhận dạng trong những ứng dụng mới, nảy sinh
trong cuộc sống không chỉ tạo ra những thách thức về thuật giải, mà còn đặt ra
những yêu cầu về tốc độ tính toán. Đặc điểm chung của tất cả những ứng dụng đó là

những đặc điểm đặc trưng cần thiết thường là nhiều, không thể do chuyên gia đề
xuất, mà phải được trích chọn dựa trên các thủ tục phân tích dữ liệu.
17
CHƯƠNG 3
TỔNG QUAN VỀ HỆ THỐNG NHẬN DẠNG
KÝ SỐ TRONG HỆ THỐNG SOÁT VÉ TỰ
ĐỘNG
3.1 LƯU ĐỒ HỆ THỐNG NHẬN DẠNG KÝ SỐ
Hình 3.1 Lưu đồ hệ thống nhận dạng ký số
18
Ảnh đầu vào
Tiền xử lý
Tách ký số
Trích chọn đặc trưng
Chuẩn hóa
Huấn luyện
Đưa vào mạng neural đã
huấn luyện
Nhận dạng và xuất kết
quả
3.2 ẢNH ĐẦU VÀO
3.2.1 Ảnh tĩnh
Ảnh tĩnh là ảnh có sẵn trong máy tính, ít bị ảnh hưởng bởi ánh sáng, khoảng
cách hay góc nghiêng.
3.2.2 Ảnh chụp từ webcam
Đây là khâu quan trọng nhất của hệ thống bởi vì nếu ảnh chụp bị mờ hay
nhiễu thì khi đưa vào nhận dạng sẽ không được. Để chụp ảnh thì ta có thể sử dụng
camera hoặc Webcam. Khi lựa chọn thiết bị thì ta cần quan tâm tới các thông số
quyết định tới chất lượng ảnh như:
Độ phân giải (resolution)

Độ phân giải càng lớn thì chất lượng hình ảnh càng nét. Thường thì trong
các ứng dụng không cần thiết phải quan sát thật rõ nét thì độ phân giải 420 TV
Lines là hoàn toàn có thể chấp nhận được.
Số đi~m ảnh (CCD Total Pixels)
Thông số này nói lên chất lượng hình ảnh, số điểm ảnh càng lớn thì chất
lượng hình ảnh càng tốt, tuy nhiên, chất lượng hình ảnh càng tốt thì cũng đồng
nghĩa với dung lượng ảnh càng lớn, và sẽ tốn bộ nhớ lưu trữ cũng như ảnh hưởng
đến tốc độ đường truyền.
Điều kiện hoạt động của thiết bị:
Cường độ ánh sáng nhỏ nhất (Minimum Illumination): thường được tính
bằng Lux. Thông số này nói lên rằng, Webcam (camera) chỉ có thể hoạt động ở
cường độ ánh sáng lớn hơn cường độ ánh sáng nhỏ nhất. Trong điều kiện quá tối,
nếu không phải là Camera có chức năng hồng ngoại thì sẽ không hoạt động được.
- Ánh nắng mặt trời: 4000 Lux, có mây: 1000 lux
- Ánh sáng đèn tuýp: 500 lux, có mây: 300 lux
- Ánh sáng đèn tuýp đỏ: 500 lux, trắng (300 lux) trắng sáng 1 lux
- Đêm không trăng: 0.0001 lux
19
Chú ý: các loại camera quan sát có chức năng Auto Iris (Tự động hiệu chỉnh ánh
sáng). Đặc điểm của camera lại này là chỉ với 1 nguồn sáng nhỏ, nó có thể tự động
khuếch đại nguồn sáng đó lên để có thể quan sát được.
Nguồn cung cấp (Power Supply): Hiện nay đa số các webcam đều sử dụng
nguồn máy tính (laptop), camera quan sát đều dùng loại nguồn 12 VDC, chỉ một số
ít các camera dùng nguồn khác. Tuy nhiên, bạn không phải lo lắng đến vấn đề
nguoonf 12 VDC, vì phần lớn các công ty bán camera quan sát đều bán bộ chuyển
đổi nguồn, do đó bạn có thể sử dụng trực tiếp nguồn 220 VAC
- Operatinon Temperature: Dải nhiệt độ hoạt động.
- Phần lớn các Camera quan sát đều cho phép hoạt động trong dải nhiệt độ
-100 ~ 500 C, nếu camera của bạn được sử dụng trong những điều kiện khắc
nghiệt như trong công nghiệp, khu vực có nhiệt độ cao thì bạn nên sử dụng

các loại Camera quan sát chuyên dụng trong công nghiệp.
- Operational Humidity: Độ ẩm cho phép
- Thông thường, độ ẩm cho phép là 90 % RH (độ ẩm tương đối).
3.3 TIỀN XỬ LÝ
Trong thực tế, ảnh chứa ký số mà chúng ta nhận vào ban đầu để xử lý là
ảnh số. Vì vậy để có thể thực hiện được quá trình phân tích và nhận dạng, chúng ta
cần phải chuyển chúng thành ảnh nhị phân. Trong đó, mỗi điểm ảnh (pixel) được
biểu diễn bởi một trong 2 giá trị là 0 hoặc 255. Đầu tiên, ảnh màu nhận vào sẽ được
chuyển thành ảnh xám với các mức xám có giá trị từ 0 đến 255 dựa trên ba giá trị
RED, GREEN, BLUE của ảnh đầu vào. Từ ảnh xám này, chúng ta sẽ so sánh mức
xám của từng điểm với một ngưỡng cho trước để quyết định điểm đó sẽ là 0 hoặc
255, giá trị 0 biểu diễn cho màu đen và 255 biểu diễn cho màu trắng. Hay nói cách
khác ảnh xám được đem so sánh để chuyển về ảnh nhị phân.
20
3.4 TÁCH KÝ SỐ
3.4.1 Lưu đồ tách ký số
Hình 3.2: Lưu đồ tách ký số
3. 4.2 Thuật toán tách kí số:
3. 4.2.1 Xử lý dữ liệu (Phân tích ảnh)
Quá trình phân tích ảnh thực chất là phân tích chuỗi số ảnh (dòng ký số)
thành từng ký số ảnh. Việc phân tích này dựa trên việc nhận dạng các pixel màu của
ký số ảnh với dữ liệu đầu vào đã được xử lý và chuyển thành định dạng *.bmp chỉ
có 2 pixel điểm đen RGB (0,0,0) và điểm trắng RGB (255, 255, 255).
3. 4.2.2 Tách từng kí số
 Thuật toán :
Xét trên dòng ký số:
a. Bắt đầu xét từ giá trị giới hạn trên y của dòng (top_line) và giá trị x đầu tiên
(x=0).
b. Xác định giới hạn trên của kí số: Quét hết chiều rộng của ảnh, trên cùng giá
trị y.

21
Ảnh nhị phân
Tách từng ký số
Định giới hạn chính xác
cho từng ký số
Ánh xạ ký số ảnh vào ma
trận giá trị
 Nếu phát hiện pixel đen thì đánh dấu y là giá trị đỉnh của kí số
(top_character). Dừng quét.
 Nếu quét hết chiều rộng, mà vẫn không tìm thấy pixel đen nào thì tăng y
và reset lại x, tiếp tục thực hiện lại bước b.
c. Xác định giới hạn dưới của kí số: Bắt đầu duyệt từ giới hạn trên (đỉnh) vừa
tìm thấy của ký tự (0,top_character)
Tương tự như xác định giới hạn trên, ta duyệt hết chiều rộng của ảnh trên cùng
một giá trị y.
 Nếu duyệt hết dòng mà không tìm thấy ký tự pixel đen nào thì ghi nhận
y-1 là giới hạn dưới của ký tự (bottom_character).Dừng duyệt.
 Nếu chưa tìm thấy bottom_character, tiếp tục duyệt đến dòng tiếp theo
(tăng y, reset x=0).
d. Xác định giới hạn trái của kí số (xác định giá trị của x )
Bắt đầu từ giới hạn trên (đỉnh của kí số - top_character), giá trị x đầu tiên
(x=0).
Quét đến giới hạn dưới của dòng (bottom_character), giữ nguyên x (quét theo
chiều thẳng đứng )
 Nếu gặp pixel đen đầu tiên, ghi nhận x là giới hạn trái của kí số (left-
character). Dừng quét.
 Nếu quét đến cuối giới hạn dưới, vẫn không tìm thấy pixel đen nào, thì
reset lại y = giới hạn trên vừa tìm thấy, tăng x lên.(x++),và tiếp tục thực
hiện lại bước 4.
e. Xác định giới hạn phải của kí số (xác định giá trị x )

Bắt đầu từ giới hạn trên -đỉnh của ký tự (top_character), giới hạn trái của kí số
(left_character,top_character). Quét theo chiều thẳng đứng đến giới hạn dưới
của dòng.
 Nếu khi quét hết chiều đứng ,mà vẫn không gặp được pixel đen nào thì
ghi nhận x-1 là giới hạn phải của kí số (right_character). Dừng quét.
22
 Nếu gặp pixel đen thì tăng x (x++) và reset lại y =top_character của kí số
đang xét , để xét đường thẳng đứng tiếp theo.
f. Lặp lại bước (a) đến (e) để xác định giới hạn của kí số tiếp theo trên cùng
dòng. Với y = top_line của dòng đang xét và giá trị x đầu tiên = right_character
của kí số vừa tìm thấy.



Hình 3.3 Tách từng ký số
3. 4.2.3 Xác Định Giới Hạn Chính Xác Cho Từng Ký Số
Trong một số trường hợp, việc tách kí số chưa thực sự chính xác (giống như ví
dụ trên). Ta cần xác định lại một lần nữa giới hạn chính xác cho từng kí số.
 Thuật toán :
Xét từng kí số:
a. Xác định đỉnh kí số
Bắt đầu từ đỉnh của kí số tạm thời, và giới hạn trái của kí số vừa xác định ở trên
( left_character,top_character). Quét đến giới hạn phải của kí số, giữ nguyên y.
 Nếu tìm thấy pixel đen thì chọn lại y là giới hạn đỉnh của kí số
(top_character=y). Dừng quét.
 Nếu không, xét điểm tiếp theo.
 Nếu không tìm thấy pixel đen nào thì tăng y (y++), reset lại x.
(x= left_character). Thực hiện lại bước a.
b. Xác định giới hạn dưới của kí số
23

Bắt đầu từ giới hạn dưới hiện thời của kí số (được xác định ở trên), và giới hạn
trái của kí số (left_character, bottom_character). Quét x đến giới hạn phải của kí
số, trên cùng giá trị y .
 Nếu tìm thấy pixel đen, đánh dấu y là giới hạn dưới của kí số
( bottom_character= y). Ngừng quét.
 Nếu không tìm thấy pixel đen nào, thì reset lại x (= left character), giảm
y (y ). Thực hiện lại bước b.
3. 4.2.4 Ánh Xạ Ký Số Ảnh Vào Ma Trận Giá Trị
Sau khi tách, kí số ảnh sẽ được ánh xạ vào ma trận 2 chiều, có kích thước 15
x 10. Vì các kí số ảnh dù đã chuẩn hóa, chọn lọc nhưng sau khi tách đều có kích
thước khá lớn so với ma trận ( khoảng 58x 74), nên các kí số ảnh này đều phải qua
1 bước chuyển đổi tỉ lệ trước khi chuyển giá trị vào ma trận nhị phân 15 x10.
Lưu ý: Việc chuyển đổi tỉ lệ này là một trong những nguyên nhân gây ra sai
số dẫn đến nhận dạng ký số bị sai.
 Thuật toán:
a. Xét chiều rộng
- Ánh xạ điểm đầu và điểm cuối của ký số ảnh tương ứng với giá trị
đầu và cuối của ma trận .
- Khởi tạo với 10 phần tử tương ứng.
- Ánh xạ tọa độ điểm đầu (0,y) và điểm cuối (width,y) của ảnh kí số
tương ứng với giá trị đầu (0,y) và giá trị cuối (10,y) của ma trận.
- Chia nhỏ chiều rộng thành 10 mốc giá trị, ánh xạ vào chiều rộng của
ma trận pixel.
b. Đối với chiều cao:
Khởi tạo với 15 phần tử tương ứng.
- Ánh xạ điểm đầu (x,0) và điểm cuối (x,height) của ảnh kí số tương
ứng với giá trị đầu (x,0) và giá trị cuối (x,15) của ma trận.
- Chia nhỏ chiều cao thành 15 mốc giá trị, ánh xạ tương ứng vào chiều
cao của ma trận pixel.
24

- Lấy các giá trị pixel trong file ảnh tuyến tính hóa vào trong ma trận
pixel bằng cách kết hợp tọa độ chiều cao và chiều rộng.
Hình 3.4 Ánh xạ lưới ký tự.
c. Chuyển ma trận lưới pixel thành ma trận giá trị
-Bắt đầu từ tọa độ (0,0) của ma trận pixel. Giữ y , duyệt qua x:
Nếu pixel đen thì ghi nhận giá trị 1 vào ma trận giá trị có tọa độ tương ứng.
Nếu pixel trắng thì ghi nhận giá trị 0 vào ma trận giá trị có tọa độ tương ứng.
Nếu x= chiều rộng thì reset lại x=0, tăng y (y++).
Từ ma trận ảnh này ta ánh xạ thành mảng 1 chiều 150 hàng 1 cột, và chuyển
thành 150 neural đầu vào.
25

×