Tải bản đầy đủ (.pdf) (13 trang)

Nghiên cứu các kỹ thuật xử lý ảnh phục vụ việc nâng cao chất lượng nhận dạng tiếng việt

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (497.58 KB, 13 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
VIỆN CÔNG NGHỆ THÔNG TIN

NGUYỄN XUÂN CƢỜNG

NGHIÊN CỨU CÁC KỸ THUẬT XỬ LÝ ẢNH PHỤC VỤ
VIỆC NÂNG CAO CHẤT LƢỢNG NHẬN DẠNG TIẾNG VIỆT

LUẬN VĂN THẠC SĨ

Hà Nội - 2015


ĐẠI HỌC QUỐC GIA HÀ NỘI
VIỆN CÔNG NGHỆ THÔNG TIN

NGUYỄN XUÂN CƢỜNG

NGHIÊN CỨU CÁC KỸ THUẬT XỬ LÝ ẢNH PHỤC VỤ
VIỆC NÂNG CAO CHẤT LƢỢNG NHẬN DẠNG TIẾNG VIỆT
Ngành: Công nghệ Thông tin
Chuyên ngành: Quản lý Hệ thống Thông tin
Mã số: Chuyên ngành đào tạo thí điẻm

LUẬN VĂN THẠC SĨ

NGƢỜ I HƢỚNG DẪN KHOA HỌC: Ts. Vũ Duy Linh

Hà Nội – 2015



1

LỜI CAM ĐOAN
Tôi xin cam đoan rằng, đây là kết quả nghiên cứu của tôi trong đó có sự giúp
đỡ rất lớn của thầy hƣớng dẫn và các đồng nghiệp ở cơ quan. Các nội dung nghiên
cứu và kết quả trong đề tài này hoàn toàn trung thực.
Trong luận văn, tôi có tham khảo đến một số tài liệu của một số tác giả đã liệt
kê tại phần “Tài liệu tham khảo” ở cuối luận văn.

Tác giả luận văn
Nguyễn Xuân Cƣờng


2

LỜI CẢM ƠN
Em xin chân thành cảm ơn đến Viện Công Nghệ thông tin, Đại học Công Nghệ,
Đại học Quốc gia Hà Nội đã tạo điều kiện cho em học tập và thực hiện luận văn
này.
Em xin gửi lời cảm ơn chân thành đến Tiến sĩ Vũ Duy Linh, ngƣời đã tận tình
hƣớng dẫn em trong quá trình làm luận văn này.
Em xin cảm ơn quý Thầy Cô đã nhiệt tình giảng dạy cho chúng em trong
những năm học vừa qua.
Cuối cùng, em xin đƣợc gửi lời cảm ơn chân thành đến gia đình cũng nhƣ bạn
bè, đồng nghiệp đã luôn ủng hộ, động viên em để em có thể có điều kiện tốt nhất để
học tập và nghiên cứu.

Hà Nội, tháng 6/2015
Nguyễn Xuân Cƣờng – CIO 04
Viện Công nghệ thông tin – Đại học Quốc gia Hà Nội



3

MỤC LỤC
BẢNG KÝ HIỆU VÀ CÁC CHỮ VIẾT TẮT ...............................................................................................6
MỞ ĐẦU........................................................................................................................................................7
CHƢƠNG 1 – TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ THƢ VIỆN OPENCV ...............................................9
1.1 Giới thiệu về xử lý ảnh .........................................................................................................................9
1.1.1 Phần thu nhận ảnh .......................................................................................................................10
1.1.2 Tiền xử lý ....................................................................................................................................10
1.1.3 Phân đoạn ảnh (phân vùng ảnh) ..................................................... Error! Bookmark not defined.
1.1.4 Biểu diễn và mô tả .......................................................................... Error! Bookmark not defined.
1.1.5 Nhận dạng và nội suy ..................................................................... Error! Bookmark not defined.
1.1.6 Cơ sở tri thức .................................................................................. Error! Bookmark not defined.
1.2 Những vấn đề cơ bản trong hệ thống xử lý ảnh .................................... Error! Bookmark not defined.
1.2.1 Điểm ảnh ........................................................................................ Error! Bookmark not defined.
1.2.2 Độ phân giải của ảnh ...................................................................... Error! Bookmark not defined.
1.2.3 Mức xám của ảnh ........................................................................... Error! Bookmark not defined.
1.2.4 Định nghĩa ảnh số........................................................................... Error! Bookmark not defined.
1.2.5 Mối liên hệ giữa các điểm ảnh ....................................................... Error! Bookmark not defined.
1.3 Những vấn đề khác trong xử lý ảnh ...................................................... Error! Bookmark not defined.
1.3.1 Biến đổi ảnh ................................................................................... Error! Bookmark not defined.
1.3.2 Nén ảnh .......................................................................................... Error! Bookmark not defined.
1.4 Một số phƣơng pháp biểu diễn ảnh ....................................................... Error! Bookmark not defined.
1.4.1 Mã loạt dài...................................................................................... Error! Bookmark not defined.
1.4.2 Mã xích........................................................................................... Error! Bookmark not defined.
1.4.3 Mã tứ phân ..................................................................................... Error! Bookmark not defined.
1.5 Thƣ viện OpenCV ................................................................................. Error! Bookmark not defined.
1.5.1 Tổng quan....................................................................................... Error! Bookmark not defined.

1.5.2 Những điểm đặc trƣng .................................................................... Error! Bookmark not defined.
1.5.3 Các tổ chức ..................................................................................... Error! Bookmark not defined.
1.6 ImageMagick......................................................................................... Error! Bookmark not defined.
CHƢƠNG 2 – MỘT SỐ PHƢƠNG PHÁP TIỀN XỬ LÝ NÂNG CAO CHẤT LƢỢNG ẢNH .......... Error!
Bookmark not defined.
2.1 Cải thiện ảnh sử dụng các toán tử điểm ................................................ Error! Bookmark not defined.
2.1.1 Tăng độ tƣơng phản (Stretching Contrast) ..................................... Error! Bookmark not defined.


4
2.1.2 Tách nhiễu và phân ngƣỡng ........................................................... Error! Bookmark not defined.
2.1.3 Biến đổi âm bản (Digital Negative) ............................................... Error! Bookmark not defined.
2.1.4 Cắt theo mức (Intensity Level Slicing) .......................................... Error! Bookmark not defined.
2.1.5 Trích chọn bit (Bit Extraction) ....................................................... Error! Bookmark not defined.
2.1.6 Trừ ảnh ........................................................................................... Error! Bookmark not defined.
2.1.7 Nén dải độ sáng .............................................................................. Error! Bookmark not defined.
2.1.8 Mô hình hóa và biến đổi lƣợc đồ xám ............................................ Error! Bookmark not defined.
2.2 Cải thiện ảnh dùng toán tử không gian.................................................. Error! Bookmark not defined.
2.2.1 Làm trơn nhiễu bằng lọc tuyến tính: lọc trung bình và lọc dải thông thấp... Error! Bookmark not
defined.
2.2.2 Làm trơn nhiễu bằng lọc phi tuyến................................................. Error! Bookmark not defined.
2.2.3 Mặt lạ gờ sai phân và làm nhẵn ...................................................... Error! Bookmark not defined.
2.2.4 Lọc thông thấp, thông cao và lọc dải thông ................................... Error! Bookmark not defined.
2.2.5 Khuyếch đại và nội suy .................................................................. Error! Bookmark not defined.
2.2.6 Một số kỹ thuật cải thiện ảnh nhị phân .......................................... Error! Bookmark not defined.
2.3 Khôi phục ảnh ....................................................................................... Error! Bookmark not defined.
2.3.1 Các mô hình quan sát và tạo ảnh .................................................... Error! Bookmark not defined.
2.3.2 Các bộ lọc ....................................................................................... Error! Bookmark not defined.
CHƢƠNG 3 – TRIỂN KHAI CHƢƠNG TRÌNH VÀ KẾT QUẢ ................. Error! Bookmark not defined.
3.1 Cài đặt và tích hợp thƣ viện OpenCV vào Microsoft Visual Studio ..... Error! Bookmark not defined.

3.2 Triển khai chƣơng trình ......................................................................... Error! Bookmark not defined.
3.2.1 Xử lý phông nền chứng minh thƣ................................................... Error! Bookmark not defined.
3.2.2 Xử lý đƣờng kẻ ô trong văn bản ..................................................... Error! Bookmark not defined.
3.2.3 Xử lý tăng DPI cho văn bản ........................................................... Error! Bookmark not defined.
3.3 Mã chƣơng trình .................................................................................... Error! Bookmark not defined.
3.3.1 Đƣa ảnh màu về đa mức xám ......................................................... Error! Bookmark not defined.
3.3.2 Tăng độ nét ..................................................................................... Error! Bookmark not defined.
3.3.3 Tăng độ sáng .................................................................................. Error! Bookmark not defined.
3.3.4 Tăng độ tƣơng phản ....................................................................... Error! Bookmark not defined.
3.3.5 Loại bỏ phông nền .......................................................................... Error! Bookmark not defined.
3.3.6 Loại bỏ nhiễu.................................................................................. Error! Bookmark not defined.
3.3.7 Tăng DPI ........................................................................................ Error! Bookmark not defined.
3.3.8 Xóa đƣờng kẻ ô .............................................................................. Error! Bookmark not defined.


5
3.4 Hình ảnh triển khai chƣơng trình .......................................................... Error! Bookmark not defined.
CHƢƠNG 4 – KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN .............................. Error! Bookmark not defined.
4.1 Kết luận ................................................................................................. Error! Bookmark not defined.
4.2 Hƣớng phát triển ................................................................................... Error! Bookmark not defined.
TÀI LIỆU THAM KHẢO ............................................................................................................................11


6

BẢNG KÝ HIỆU VÀ CÁC CHỮ VIẾT TẮT
Ký hiệu
OCR

Ý nghĩa

Optical Character Recognition
Nhận dạng ký tự bằng quang học

BSD

Berkeley Software Distribution


7

MỞ ĐẦU
Sự cấp thiết của đề tài
Xử lý ảnh là lĩnh vực mà ngày nay đƣợc phát triển và ứng dụng rất rộng rãi
trong nhiều lĩnh vực khác nhau nhờ vào sự phát triển ngày càng mạnh mẽ của các
hệ thống máy tính, các thuật toán và công trình nghiên cứu khác nhau của nhiều
nhà khoa học trên thế giới.
Ở Việt Nam, các ứng dụng về xử lý ảnh đã bƣớc đầu đƣợc triển khai trên một
số lĩnh vực nhƣ lắp đặt hệ thống nhận dạng biển số xe, nhận dạng vân tay, … Môn
học xử lý ảnh ở các trƣờng đại học đƣợc xem là môn học bắt buộc ở một số ngành
nhƣ công nghệ thông tin, điện tử viễn thông, … Tuy nhiên nhìn một cách tổng quan
thì số lƣợng các ứng dụng đƣợc triển khai trên thực tế vẫn là quá ít, lĩnh vực này sẽ
còn phát triển mạnh mẽ trong tƣơng lai nếu đƣợc quan tâm một cách nghiêm túc.
Một trong những ứng dụng phổ biến hiện nay liên quan mật thiết với xử lý ảnh
đó là nhận dạng ký tự quang học – OCR.
Các chƣơng trình hỗ trợ OCR hiện nay có thể nhận dạng đƣợc ký với tỷ lệ trên
90% đối với ảnh có chất lƣợng nét và font chữ thông dụng. Đối với hình ảnh chất
lƣợng thấp, font chữ đặc biệt, chữ viết tay hoặc có phông nền phức tạp thì kết quả
cho ra không mấy khả quan, hầu nhƣ không nhận dạng đƣợc.
Với sự phát triển mạnh mẽ của công nghệ, ngày càng có nhiều yêu cầu cao hơn
trong các ứng dụng liên quan đến nhận dạng ký tự quang học, yêu cầu nhận dạng

chính xác hơn, nhanh hơn.
Nội dung của luận văn
Với mục đích nhƣ trên luận văn có những nội dung nhƣ sau:
- Luận văn tổng hợp lý thuyết về xử lý ảnh – giải pháp nâng cao chất lƣợng
hình ảnh phục vụ cho nhận dạng, cụ thể ở đây là nhận dạng tiếng Việt.
- Luận văn mô tả một số phƣơng pháp xử lý ảnh. Nền tảng lý thuyết này sẽ
đƣợc triển khai thử nghiệm trong luận văn này.


8

- Luận văn đã mô tả từng bƣớc triển khai xử lý ảnh, đƣa ra kết quả sau khi xử
lý.
Cấu trúc luận văn
Với mục tiêu xây dựng ứng dụng tiền xử lý ảnh phục vụ cho nhận dạng, luận
văn đƣợc chia làm bốn chƣơng:
Chương 1: Tổng quan về tiền xử lý ảnh và thư viện OpenCV
Chƣơng này giới thiệu về các khái niệm trong xử lý ảnh, giới thiệu qua về thƣ
viện xử lý ảnh OpenCV.
Chương 2: Một số phương pháp tiền xử lý nâng cao chất lượng ảnh
Từ các khái niệm xử lý ảnh đƣợc đƣa ra ở Chƣơng I, chƣơng này giới thiệu một
số phƣơng pháp tiền xử lý ảnh nhƣ: nhị phân hóa, tăng cƣờng độ sáng, tăng cƣờng
độ tƣơng phản, loại bỏ phông nền, khử nhiễu, …
Chương 3: Triển khai chương trình và kết quả
Chƣơng này giới thiệu về chƣơng trình đã đƣợc triển khai, các bƣớc thực hiện
và các kết quả của mỗi bƣớc đạt đƣợc.
Chương 4: Kết luận và hướng phát triển
Chƣơng này tôi tổng kết lại các kết quả và các đóng góp mà việc thực hiện đề
tài đem lại. Ngoài ra, tôi cũng đề xuất các phƣơng hƣớng nghiên cứu tiếp theo,
nhằm giúp cho đề tài trở lên hoàn thiện hơn.



9

CHƢƠNG 1 – TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ THƢ VIỆN OPENCV
1.1 Giới thiệu về xử lý ảnh
Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Nó là một ngành
khoa học mới mẻ so với nhiều ngành khoa học khác nhƣng tốc độ phát triển của nó
rất nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc biệt là máy tính
chuyên dụng riêng cho nó.
Xử lý ảnh đƣợc đƣa vào giảng dạy ở bậc đại học ở nƣớc ta khoảng chục năm
nay. Nó là môn học liên quan đến nhiều lĩnh vực và cần nhiều kiến thức cơ sở khác.
Đầu tiên phải kể đến Xử lý tín hiệu số - một môn học hết sức cơ bản cho xử lý tín
hiệu chung, các khái niệm về tính chập, các biến đổi Fourier, Laplace, các bộ lọc
… Thứ hai, các công cụ nhƣ Đại số tuyến tính, Xác xuất, thống kê. Một số kiến
thức cần thiết khác nhƣ Trí tuệ nhân tạo, mạng noron nhân tạo cũng đƣợc đề cập
đến trong quá trình phân tích và đặc biệt là nhận dạng – OCR.
Các phƣơng pháp xử lý ảnh bắt đầu từ các ứng dụng chính: nâng cao chất lƣợng
ảnh và phân tích ảnh. Ứng dụng đầu tiên đƣợc biết đến là nâng cao chất lƣợng ảnh
báo đƣợc truyền qua cáp từ London đến New York từ những năm 1920. Vấn đề
nâng cao chất lƣợng ảnh có liên quan tới cân bằng sáng và độ phân giải của ảnh.
Việc nâng cao chất lƣợng ảnh đƣợc phát triển vào khoảng những năm 1955. Điều
này có thể giải thích đƣợc vì sau thế chiến thứ hai, máy tính phát triển nhanh tạo
điều kiện cho quá trình xử lý ảnh số thuận lợi. Năm 1964, máy tính đã có khả năng
xử lý và nâng cao chất lƣợng ảnh từ mặt trăng và vệ tinh Ranger 7 của Mỹ bao
gồm: làm nổi đƣờng biên, lƣu ảnh. Từ năm 1964 đến nay, các phƣơng tiện xử lý,
nâng cao chất lƣợng, nhận dạng ảnh phát triển không ngừng. Các phƣơng pháp tri
thức nhân tạo nhƣ mạng noron nhân tạo, các thuật toán xử lý hiện đại và cải tiến,
các công cụ nén ảnh ngày càng đƣợc ấp dụng rộng rãi và thu nhiều kết quả khả
quan.

Về cơ bản, các bƣớc cần thiết trong xử lý ảnh bao gồm:


10

Đầu tiên ảnh tự nhiên từ thế giới ngoài đƣợc thu nhận qua các thiết bị thu (nhƣ
Camera, máy chụp ảnh, scan, …). Trƣớc đây, các tấm ảnh thu đƣợc qua máy chụp
hình với phim âm bản, không có tác dụng trong xử lý ảnh. Gần đây, với sự phát
triển của công nghệ, ảnh màu hoặc đen trắng đƣợc lấy ra từ Camera, sau đó nó
đƣợc chuyển trực triếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo – máy ảnh số,
chụp qua điện thoại … là những ví dụ gần gũi. Mặt khác, ảnh cũng có thể tiếp nhận
từ vệ tinh, có thể quét từ ảnh chụp bằng máy quét ảnh. Hình 1.1 dƣới dây mô tả các
bƣớc cơ bản trong xử lý ảnh.

Thu nhận
ảnh

Tiền xử
lý ảnh

Phân
đoạn ảnh

Biểu diễn
và mô tả

Nhận dạng
và nội suy

Cơ sở tri thức


Hình 1.1 Các bƣớc cơ bản trong xử lý ảnh
1.1.1 Phần thu nhận ảnh
Ảnh có thể nhận qua camera màu hoặc đen trắng. Camera thƣờng dùng loại là
loại quét dòng, ảnh tạo ra có dạng hai chiều. Chất lƣợng một ảnh thu nhận đƣợc
phụ thuộc vào thiết bị thu, vào môi trƣờng (ánh sáng, phong cảnh).
1.1.2 Tiền xử lý
Sau bộ thu nhận, ảnh có thể nhiễu, độ tƣơng phản thấp nên cần đƣa vào bộ tiền
xử lý để nâng cao chất lƣợng. Chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng
độ tƣơng phản để làm ảnh rõ hơn, nét hơn.


11

TÀI LIỆU THAM KHẢO
1. Nhập môn xử lý ảnh – Lƣơng Mạnh Bá, Nguyễn Thanh Thủy
2. Xử lý ảnh – PGS.TS. Nguyễn Quang Hoan
3. Xử lý ảnh – PGS.TS. Đỗ Năng Toàn
4. Xử lý ảnh – TS. Đỗ Năng Toàn, TS. Phạm Việt Bình
5. Ứng dụng xử lý ảnh trong thực tế với thƣ viện OpenCV C/C++ – Nguyễn
Văn Long
6. />7. />8. />9. />10. />


×