Tải bản đầy đủ (.pdf) (27 trang)

Tìm hiểu một số kỹ thuật phát hiện góc nghiêng văn bản và ứng dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (432.42 KB, 27 trang )

ĐẠI HỌC THÁI NGUYÊN
KHOA CÔNG NGHỆ THÔNG TIN

Hoàng Thị Vân Anh

TÌM HIỂU MỘT SỐ KỸ THUẬT
PHÁT HIỆN GÓC NGHIÊNG VĂN BẢN VÀ ỨNG DỤNG
Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

NGƯỜI HƯỚNG DẪN KHOA HỌC
PGS.TS NGÔ QUỐC TẠO

Thái Nguyên - 2010

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên




LỜI CẢM ƠN
Em xin trân trọng cảm ơn các thầy giáo, cô giáo trong Viện Công nghệ
thông tin, Khoa Công nghệ thông tin Đại học Thái Nguyên đã nhiệt tình giảng
dạy và hết lòng giúp đỡ em trong quá trình học tập và nghiên cứu đề tài.
Luận văn được hoàn thành tại Khoa Công nghệ thông tin dưới sự hướng
dẫn của PGS.TS Ngô Quốc Tạo. Em xin bày tỏ lòng kính trọng và biết ơn sâu
sắc tới thầy.
Em cũng xin chân thành cảm ơn các bạn đồng nghiệp phòng Khảo thí &
Đảm bảo chất lượng trường Đại học Hải Phòng đã tạo điều kiện giúp đỡ


trong quá trình hoàn thành luận văn này.
Sự quan tâm, giúp đỡ của gia đình và bạn bè, đặc biệt lớp Cao học K7
Khoa Công nghệ thông tin đã cổ vũ, động viên em trong suốt thời gian học
tập và thực hiện đề tài.
Mặc dù có nhiều cố gắng song luận văn không thể tránh khỏi những thiếu
sót, tác giả mong nhận được sự đóng góp ý kiến của các thầy cô và các bạn.
Xin chân thành cảm ơn!
Thái Nguyên, tháng 11 năm 2010
Tác giả

Hoàng Thị Vân Anh

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên




LỜI CAM ĐOAN
Tôi xin cam đoan luận văn “Tìm hiểu một số kỹ thuật phát hiện góc
nghiêng văn bản và ứng dụng” là do tôi tự tìm hiểu và đƣợc hoàn thành
dƣới sự hƣớng dẫn của thầy giáo PGS. TS Ngô Quốc Tạo.

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên




i

MỤC LỤC

Trang
Trang phụ bìa
Lời cam đoan
Mục lục ........................................................................................................ ..i
Danh mục các bảng ...................................................................................... iv
Danh mục các hình vẽ .................................................................................. iv
MỞ ĐẦU ................................................................................................................ 1
CHƢƠNG I ............................................................................................................. 3
TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ BÀI TOÁN PHÁT HIỆN.............................. 3
GÓC NGHIÊNG VĂN BẢN ................................................................................... 3
1.1. Xử lý ảnh và các vấn đề cơ bản trong xử lý ảnh. .......................................3
1.1.1. Xử lý ảnh là gì? ............................................................................................... 3
Hình 1.2: Các giai đoạn trong xử lý ảnh .................................................................. 3
1.1.2.

Các vấn đề cơ bản trong xử lý ảnh ............................................................... 4

1.1.2.1. Nắn chỉnh biến dạng......................................................................... 5
1.1.2.2. Khử nhiễu ........................................................................................ 5
1.1.2.3. Chỉnh mức xám ................................................................................ 5
1.1.2.4. Phân tích ảnh.................................................................................... 6
1.1.2.5. Nhận dạng ảnh ................................................................................. 6
1.1.2.6. Nén ảnh ............................................................................................ 6
1.2. Bài toán phát hiện góc nghiêng văn bản ....................................................7
1.2.1. Giới thiệu bài toán phát hiện góc nghiêng văn bản. .................................. 7
1.2.2. Biên và phƣơng pháp phát hiện biên ................................................................. 8
1.2.2.1 Biên của đối tƣợng ảnh ........................................................................... 8
1.2.2.2 Phƣơng pháp phát hiện biên trực tiếp ................................................ 9
1.2.2.3 Phƣơng pháp phát hiện biên gián tiếp .............................................. 11
1.2.2.4. Thuật toán dò biên tổng quát .......................................................... 12


Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên




ii

CHƢƠNG II .......................................................................................................... 15
MỘT SỐ KỸ THUẬT PHÁT HIỆN GÓC NGHIÊNG VĂN BẢN ....................... 15
2.1
Biến đổi Hough ....................................................................................... 15
2.1.1 Đƣờng thẳng Hough ...........................................................................................15
2.1.2 Áp dụng biến đổi Hough xác định góc nghiêng văn bản .............................19
2.1.3 Thuật toán phát hiện góc nghiêng văn bản......................................................20
2.1.4 Chỉnh sửa góc nghiêng văn bản ........................................................................22
2.2 Phƣơng pháp hình chiếu ............................................................................... 23
2.2.1 Thuật toán Postl....................................................................................................25
2.2.2 Thuật toán Baird ..................................................................................................25
2.2.3 Thuật toán Nakano ..............................................................................................26
2.3 Phép toán hình thái - Morphology ............................................................... 26
2.3.1 Phƣơng pháp.........................................................................................................26
2.3.2 Bƣớc tiền xử lý .....................................................................................................28
2.4 Phƣơng pháp phân tích láng giềng................................................................ 35
2.4.1 Phƣơng pháp.........................................................................................................35
2.4.2 Thuật toán Yue Lu và Chew Lim Tan ............................................................37
2.5 Phƣơng pháp đƣờng thẳng............................................................................ 38
2.5.1 Tƣ tƣởng thuật toán phát hiện góc nghiêng văn bản .....................................39
2.5.1.1 Chọn các miền xác định và các đối tƣợng ........................................ 39
2.5.1.2 Lựa chọn các đối tƣợng ................................................................... 40

2.5.2 Bó cụm điểm chủ đạo .........................................................................................41
2.5.2.1 Định nghĩa ...................................................................................... 41
2.5.2.2 Phân cụm các điểm chủ đạo ............................................................ 42
2.5.3 Lựa chọn đƣờng cơ sở ........................................................................................42
2.5.3.1 Phân loại điểm chủ đạo ................................................................... 42
2.5.3.2 Xác định đƣờng thẳng sử dụng phƣơng pháp bình phƣơng nhỏ nhất 44
2.5.4 Thuật toán phát hiện góc nghiêng .....................................................................45
2.5.4.1 Thuật toán định hƣớng góc nghiêng đơn giản .................................. 45
2.5.4.2 Thuật toán chính ............................................................................. 46
2.5.5. Thuật toán sửa góc nghiêng ..............................................................................47
2.5.5.1 Mô hình quét dòng văn bản ............................................................. 47

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên




iii

2.5.5.2 Thuật toán chỉnh sửa góc nghiêng ................................................... 48
2.5.5.3 Kết quả thử nghiệm ......................................................................... 49
Bảng 1: Kết quả thực nghiệm của các phƣơng pháp phát hiện góc nghiêng ........... 49
2.6 Một vài phƣơng pháp khác.................................................................................. 50
CHƢƠNG 3............................................................................................................ 51
NÂNG CAO TỐC ĐỘ VÀ CHẤT LƢỢNG ............................................................... 51
PHÁT HIỆN GÓC NGHIÊNG.................................................................................. 51
3.1 Xử lý ảnh có độ phân giải thấp ........................................................................... 51
3.2 Tự động xác định ngƣỡng phân loại....................................................................52
3.2.1. Mục đích và ý nghĩa việc dùng ngƣỡng. ........................................................52
3.2.2 Ý tƣởng xuất phát ................................................................................................53

3.2.3 Phƣơng pháp thực hiện .......................................................................................53
3.3 Một vài trƣờng hợp ngoại lệ .............................................................................. 56
CHƢƠNG 4............................................................................................................ 59
CÀI ĐẶT THỬ NGHIỆM ........................................................................................ 59
4.1 Sơ đồ chức năng của chƣơng trình ............................................................... 59
4.2. Thiết kế Menu ............................................................................................. 60
4.3. Giao diện chính của chƣơng trình ................................................................ 61
KẾT LUẬN ............................................................................................................ 62
TÀI LIỆU THAM KHẢO ........................................................................................ 64

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên




iv

DANH MỤC BẢNG BIỂU
Bảng 1: Kết quả thực nghiệm của các phƣơng pháp phát hiện góc
nghiêng…………………………………………………………………........49
DANH MỤC HÌNH VẼ
Hình 1.1 Quá trình xử lý ảnh ....................................................................... 3
Hình 1.2: Các giai đoạn trong xử lý ảnh ....................................................... 3
Hình 1.3a ..................................................................................................... 7
Hình 1.3b ..................................................................................................... 7
Hình 1.4a: Các 4- láng giềng của điểm ảnh P .............................................. 11
Hình 1.4b: Các 8- láng giềng của điểm ảnh P .............................................. 11
Hình 1.5a.Chu tuyến ngoài ........................................................................... 12
Hình 1.5b. Chu tuyến trong .......................................................................... 12
Hình 1.6: Chu tuyến trong và chu tuyến ngoài của một đối tƣợng ................ 12

Hình 1.7: Hƣớng các láng giềng của một điểm ảnh ...................................... 13
Hình 1.8a: Hƣớng xác định cặp vùng nền xuất phát .................................... 14
Hình 1.8b: Hƣớng xác định cặp vùng nền tiếp theo ..................................... 14
Hình 2.1: Biến đổi Hough cho đƣờng thẳng ................................................. 16
Hình 2.2: Tham số r – φ của đƣờng thẳng .................................................... 16
Hình 2.3: Biến đổi Hough trong không gian r-  .......................................... 17
Hình 2.4: Các hình chữ nhật ngoại tiếp......................................................... 18
Hình 2.5 : Áp dụng biến đổi Hough phát hiện góc nghiêng văn .................... 19
Hình 2.6 Quay một điểm ảnh quanh gốc tọa độ ............................................ 22
Hình 2.7 Hiện tƣợng rỗ ảnh sau khi quay ..................................................... 23
Hình 2.8 a Ảnh gốc ...................................................................................... 23
Hình 2.8b Ảnh bị nghiêng 50 ........................................................................ 23
Hình 2.8 Phƣơng pháp hình chiếu đƣợc tính từ ảnh trong hình 2.8a, 2.8b .... 24

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên




v

Hình 2.9 Một ví dụ các dòng văn bản có xu hƣớng dính lại với nhau do ảnh
hƣởng của dấu .............................................................................................. 27
Hình 2.10: Các điểm left most bottom và bottom most left .......................... 28
Hình 2.11: Những khoảng góc nghiêng khác nhau đƣợc sử dụng để ƣớc lƣợng
góc nghiêng phù hợp cho phần tử cấu trúc ................................................... 31
Hình 2.12: Một vài ví dụ của việc sử dụng phép đóng và mở với những phần
tử cấu trúc nghiêng ....................................................................................... 32
Hình 2.13: Một thành phần liên thông dài với hệ tọa độ ảnh......................... 33
Hình 2.14a. Định nghĩa điểm chủ đạo .......................................................... 41

Hình 2.14b. Định hƣớng góc nghiêng ........................................................... 41
Hình 2.15: Điểm chủ đạo trên dòng văn bản ................................................. 43
Hình 2.16: Quan hệ láng giềng giữa các điểm chủ đạo ................................. 43
Hình 2.17: Định hƣớng thuật toán phát hiện góc nghiêng ............................. 45
Hình 2.18: Mô hình quét dòng văn bản ........................................................ 47
Hình 3.1 Một ảnh văn bản nghiêng có độ phân giải thấp .............................. 51
Hình 3.2: Ví dụ về một ảnh văn bản nghiêng với nhiều đối tƣợng phức tạp và
ít ký tự .......................................................................................................... 52
Hình 3.3: Sơ đồ phân bố histogram chu vi trƣớc khi gom ............................. 55
Hình 3.4: Sơ đồ phân bố histogram chu vi sau khi gom ................................ 56
Hình 3.5 Ví dụ về một ảnh nghiêng có ít ký tự chữ cái ................................. 56
Hình 3.6 : Ví dụ về văn bản nghiêng có các đối tƣợng bao nhau .................. 57

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên




1

MỞ ĐẦU
1. Lý do chọn đề tài
Thông tin con ngƣời thu nhận từ thế giới bên ngoài, đến hơn 80% đƣợc
ghi nhận bằng mắt tức là ở dạng ảnh. Vì vậy xử lý ảnh là một ngành khoa học
đã, đang và sẽ phát triển mạnh có ứng dụng rộng rãi trong khoa học và đời
sống thực tiễn nhƣ vẽ bản đồ, trong lĩnh vực quảng cáo, siêu thị, trong quân
sự…. Các hệ thống xử lý ảnh cho phép con ngƣời thu nhận lƣu trữ, phân tích
và nhận dạng ảnh, một bộ phận quan trọng của xử lý ảnh là xử lý văn bản.
Một trong những nhiệm vụ chính cũng là đối tƣợng của xử lý ảnh văn bản là
tự động hóa công việc văn phòng.

Hiện nay phần lớn lƣợng thông tin vẫn còn đƣợc lƣu trữ, trình bày và
phân phối thông qua phƣơng tiện chủ yếu là giấy bởi con ngƣời tin tƣởng hơn
khi nhận đƣợc văn bản giấy. Tuy nhiên có xu hƣớng đang phát triển để chia sẻ
và trao đổi thông tin điện tử, vì thế sự cần thiết để chuyển đổi từ tài liệu giấy
sang tài liệu điện tử để lƣu trữ, khôi phục và bảo trì ngày càng tăng lên. Để
chuyển đổi từ tài liệu giấy sang dạng điện tử thì kỹ thuật thƣờng gồm ba
bƣớc: quét và công nghệ kỹ thuật số, phân tích bố cục và nhận dạng ký tự.
Khi văn bản đƣợc quét vào máy, văn bản bị nghiêng là không thể tránh khỏi
do các yếu tố khác nhau khi đƣa ảnh vào. Hầu hết các thuật toán nhận dạng ký
tự, phân tích bố cục là phổ biến nhƣng lại rất nhạy cảm đối với sự biến dạng
của ảnh văn bản và văn bản bị nghiêng có thể gây ra lỗi nghiêm trọng cho
việc phân tích văn bản. Do đó phát hiện và chỉnh sửa ảnh văn bản bị nghiêng
là cần thiết ở giai đoạn tiền xử lý để tránh nhiễu trong quá trình xử lý nghiêng.
Một trong những vấn đề đầu tiên trong xử lý ảnh văn bản là bài toán góc
nghiêng văn bản. Nguyên nhân dẫn đến văn bản bị nghiêng một góc xuất phát
từ quá trình quét ảnh hoặc copy ảnh, dẫn đến ảnh bị lệch đi một góc tƣơng

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên




2

ứng. Văn bản bị lệch có ảnh hƣởng rất lớn đến các quá trình xử lý ảnh tiếp
theo, vì vậy việc phát hiện và chỉnh sửa góc nghiêng văn bản là nhiệm vụ
quan trọng đầu tiên trong xử lý ảnh văn bản.
Với những lý do trên đây nên em đã chọn đề tài: “Tìm hiểu một số kỹ
thuật phát hiện góc nghiêng văn bản và ứng dụng”.
2. Mục tiêu nghiên cứu

Hiểu đƣợc các phƣơng pháp phát hiện góc nghiêng văn bản. Từ đó đƣa
ra những nhận xét, so sánh giữa các phƣơng pháp. Lựa chọn công cụ phát
triển phù hợp cài đặt ứng dụng.
3. Đối tƣợng và phạm vi nghiên cứu
Tìm hiểu một vài kỹ thuật phát hiện góc nghiêng văn bản về mặt lý
thuyết, từ đó lựa chọn phƣơng pháp cài đặt ứng dụng vào thực tế.
Áp dụng đối với ảnh văn bản đen trắng.
4. Ý nghĩa khoa học và thực tiễn của đề tài
Hệ thống hoá các kiến thức về kỹ thuật phát hiện góc nghiêng văn bản.
Việc tìm hiểu và phát triển ứng dụng thành công giúp cho việc xử lý ảnh
trở nên đơn giản và dễ dàng hơn đối với một số trƣờng hợp nhƣ: xử lý ảnh
ban đầu để cho ra ảnh mới theo mong muốn của ngƣời dùng (ví dụ nhƣ ảnh bị
nghiêng cần xử lý để thu đƣợc ảnh chính xác hơn…).
5. Phƣơng pháp nghiên cứu
5.1 Dựa trên các tài liệu
- Tìm hiểu lý thuyết liên quan đến xử lý ảnh.
- Tìm hiểu lý thuyết các kỹ thuật phát hiện góc nghiêng văn bản và
chỉnh sửa.
5.2 Phương pháp toán học
- Xử lý các số liệu thống kê

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên




data error !!! can't not
read....



data error !!! can't not
read....


data error !!! can't not
read....


data error !!! can't not
read....


data error !!! can't not
read....



data error !!! can't not
read....


data error !!! can't not
read....


data error !!! can't not
read....


data error !!! can't not

read....


data error !!! can't not
read....


data error !!! can't not
read....

data error !!! can't not
read....


data error !!! can't not
read....

data error !!! can't not
read....


data error !!! can't not
read....

data error !!! can't not
read....




×