Tải bản đầy đủ (.pdf) (2 trang)

042_Nghiên cứu và xây dựng hệ thống nhập tài liệu tự động bằng nhận dạng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (181.19 KB, 2 trang )


- 42 -
NGHIÊN CỨU VÀ XÂY DỰNG HỆ THỐNG NHẬP TÀI LIỆU TỰ ĐỘNG BẰNG
NHẬN DẠNG QUANG HỌC

Nguyễn Thanh Phúc
MSV: 0220247
Email:

Cán bộ hướng dẫn : ThS Đào Kiến Quốc

1. Mở đầu
Nhập dữ liệu tự động đang là bài toán ngày
càng thu hút nhiều sự chú ý vì khả năng áp dụng
rộng rãi vào thực tế cũng như những hiệu quả mà
nó mang lại. Trong hệ thống này, khử nhiễu, khử
nghiêng và phân vùng ảnh là một phần có vai trò
đặc biệt quan trọng. Chức năng của nó là chính
xác ảnh và tách ra các vùng được nhập thông tin
để làm đầu vào cho module nhận dạng chữ. Dựa
trên đặc điểm phân bố có hướng và đồng đều của
form văn bản, chúng tôi đã sử dụng phương pháp
phép chiếu để khử nghiêng ảnh do phương pháp
này đạt được độ chính xác cao đối với những ảnh
có đặc trưng trên. Cũng dựa trên đặc điểm của
kiểu form văn bản là dữ liệu được nhập vào các ô
trên form ( nghĩa là nằm trong giới hạn giữa các
đường thẳng), giải pháp đề ra cho phân vùng là
thông qua việc xác định các đường thẳng kết hợp
với sử dụng hệ tọa độ tương đối để xác định các
vùng nhập dữ liệu. Chúng tôi đã tiến hành thực


nghiềm trên nhiều kiểu form văn bản khác nhau
và thu được những kết quả rất khả quan.
2. Tổng quan một số phương pháp khử
nghiêng và phân vùng ảnh
Một văn bản có rất nhiều các đặc trưng so
với các loại hình ảnh khác như các đặc trưng về
hướng, về cấu trúc phân bố các đối tượng ... Từ
đó cũng có một số phương pháp xác định góc
nghiêng cho ảnh của văn bản như: các phương
pháp dựa trên biến đổi Hough, các phương pháp
dựa trên Nearest Neighbour, các phương pháp
dựa trên registered object…
Điểm khác biệt trong việc phân vùng ảnh
trên form nhập dữ liệu và phân vùng ảnh trên văn
bản tổng quát là : đối với form nhập dữ liệu, ta
thực hiện phân vùng trên ảnh đã biết trước cấu
trúc và ta chỉ cần tách ra các vùng đã được định
nghĩa từ trước là sẽ được nhập dữ liệu để sau đó
tiến hành nhận dạng trên các vùng này. Việc phân
vùng có thể được thực hiện dựa trên tọa độ tuyệt
đối và tọa độ tương đối.
3. Đề xuất giải pháp khử nghiêng và phân vùng
ảnh
a) Giải pháp khử nghiêng
Qua việc nghiên cứu rất nhiều dạng Form
văn bản khác nhau bao gồm cả văn bản tiếng việt
và tiếng anh cùng với việc nghiên cứu nhiều thuật
toán, chúng tôi thấy rằng phương pháp phép chiếu
là một phương pháp thích hợp để xác định góc
nghiêng của các form văn bản trong phạm vi của

bài toán. Bởi vì :
• Phương pháp phép chiếu cho kết quả với
độ chính cao trên các form văn bản thuộc
pham vi của bài toán.
• Có thể thực hiện một số cải tiến để giảm
bớt khối lượng tính toán.
• Dễ hiểu, dễ bảo trì.
b) Giải pháp phân vùng ảnh
Dựa trên đặc điểm của kiểu form nhập dữ
liệu là dữ liệu được nhập vào các ô trên form (
nghĩa là nằm trong gi
ới hạn giữa các đường
thẳng) Chúng tôi đưa ra thuật toán xác định vùng
nhập dữ liệu thông qua việc xác định các đường
thẳng.
Trong phương pháp này, trước tiên chúng
tôi nhận dạng tất cả các đường thẳng có trong
ảnh. Sau đó các đường thẳng này sẽ được đối
chiếu với các đường thẳng có trong form mẫu để
xác định thứ tự chính xác và khử nhiễu. Cuối
cùng sau khi nhận dạng được các đường thẳng,
vùng nhập dữ liệu sẽ được tính thông qua tọa độ
gián tiếp tới các đường thẳng đó. Và bởi vì các
tọa độ gián tiếp này là các tọa độ địa phương nên
độ chính xác trong việc xác định các vùng là rất
cao.


- 43 -
4. Thực nghiệm

Với mục đích đánh giá độ chính xác và hiệu
năng thực hiện của các phương pháp, chúng tôi đã
tuyển tập rất nhiều các tài liệu dạng ảnh trên các
kiểu form khác nhau như: phiếu đăng ký, phiếu
điều tra, hóa đơn, ….Các ảnh này được tìm thấy
phần lớn là thông qua trang tìm kiếm Google để
có thể đảm bảo được sự đa dạng về kiểu form, về
chất lượng ảnh, về kích cỡ và ngôn ngữ.
a) Thực nghiệm về xác định góc nghiêng của
ảnh
Thực nghiệm về xác định góc nghiêng của
ảnh được cài đặt theo phương pháp phép chiếu
trên 60 ảnh, với 300 góc nghiêng khác nhau cho
mỗi một ảnh, tổng số ảnh thử nghiệm là 18000
ảnh.
Độ lệch trung bình so với góc thực tế

Phương pháp phép chiếu
(
0
)
Cat 1 0.0383
Cat 2 0.0351
Cat 3 0.0177
Cat 4 0.0246
Total 0.0289
Từ kết quả thực nghiệm trên ta thấy, độ
chính xác việc xác định góc nghiêng là đủ để tiến
hành phân vùng và nhận dạng ảnh.
b) Thực nghiệm về Phân vùng ảnh

Tập ảnh thực nghiệm được chia ra làm 2
loại : Loại 1 gồm các ảnh có tập các đường thẳng
với độ dày là 1 pixel và Loại 2 gồm các ảnh có
tập các đường thẳng với độ dày ≥ 2 pixel.
Độ chính xác của phương pháp xác định đường thẳng
DPI Độ chính xác –
Loại 1 (%)
Độ chính xác –
Loại 2 (%)
100 73.35 96.14
150 87.61 98.85
200 91.53 99.15
300 94.11 99.46
Kết quả thực nghiệm cho thấy việc xác định
các đường thẳng cho kết quả chính xác đối với
các trường hợp nằm trong phạm vi của bài toán


5. Kết luận
Trong quá trình nghiên cứu nhiều dạng
Form văn bản cũng như nhiều thuật toán khác
nhau, chúng tôi đã lựa chọn, cải tiến và đưa ra
được một số các giải pháp riêng cũng như cài đặt
thành công các thuật toán về lọc nhiễu, tách nền
và xác định góc nghiêng của ảnh.
Các công việc cần được nghiên cứu tiếp:
• Tích hợp với module nhận dạng chữ viết
tiếng việt.
• Xây module quản trị tài liệu dạng Form.
• Nâng cao hiệu năng và độ chính xác cho

module tiền xử lý ảnh và phân vùng.

Tài liệu tham khảo
[1] Lương Mạnh Bá, Nguyễn Thanh Thủy.
Nhập môn xử lý ảnh số. Nhà xuất bản
khoa học và kỹ thuật 5/1999
[2] D. X. Le, G. Thoma. Document Skew
Angle Detection Algorithm. 1993
[3] Junichi Kanai, Andrew D. Bagdanov.
Projection profile based skew estimation
algorithm for JBIG compressed images.
IJDAR (1998)
[4] Dipti Deodhare, NNR Ranga Suri,
R.Amit. Preprocessing and Image
Enhancement Algorithms for a Form-
based Intelligent Character Recognition
System. Vol. II, 2005

×