Tải bản đầy đủ (.pdf) (25 trang)

Nghiên cứu phép toán hình thái và ứng dụng nâng cao chất lượng ảnh nhị phân

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (5.13 MB, 25 trang )

<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">

<small>HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG</small>

DO ĐĂNG HOAT

NGHIÊN CỨU PHÉP TỐN HÌNH THÁI VA UNG DUNG NANG CAO CHAT LƯỢNG ANH NHI PHAN

<small>CHUYÊN NGÀNH : HE THONG THONG TIN</small>

<small>MA SO _ : 60. 48. 01. 04</small>

<small>HA NỘI - 2015</small>

</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2">

<small>Luận văn được hoàn thành tại:</small>

Người hướng dẫn khoa học: PGS. TS NGO QUOC TẠO

<small>Phản biện 1: PGS.TS Ngô Thành Long</small>

<small>Phản biện 2: TS. Đào Đình Khả</small>

Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học

viện cơng nghệ Bưu Chính Viễn Thơng

<small>Vào lúc: 10 giờ 30’ ngày 27 tháng 02 năm 2016</small>

<small>Có thê tìm hiéu luận văn tại:</small>

- _ Thư viện của Học viện công nghệ Bưu Chính Viễn Thơng

</div><span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3">

LỜI MỞ ĐẦU

Trong thực tế hình dang thường được chú trọng hơn kích thước và con người nhận ra

các đối tượng xung quanh cũng chủ yếu thơng qua hình ảnh. Hình ảnh là một dang đữ liệu

đóng vai trị quan trọng trong việc trao đổi, xử lý, lưu giữ thơng tin... Có nhiều phương pháp, nhiều công cụ, nhiều phần mềm xử lý ảnh đã ra đời. Tăng cường chất lượng ảnh, mà

công đoạn đầu tiên là một bước tiền xử lý nhằm xác định ảnh, khắc phục những khiếm

khuyết do bước thu nhận ảnh khơng tốt là việc làm quan trọng. Có nhiều phương pháp cho việc nâng cao chất lượng ảnh nói chung và tiền xử lý nói riêng. Trong luận văn này em chỉ mô tả một vài phương pháp tiền xử lý hình ảnh (chú trọng đến ảnh nhị phân, bởi ảnh của các bản vẽ kỹ thuật và sách scan thường chi là ảnh 2 màu: den, trang) nhằm cải thiện chất lượng hình anh bằng các thao tác Hình thái học (Morphology) dé ứng dụng vào chương trình nang

cao chat lượng ảnh Scan.

Các thao tác Hình thái học nói chung, đặc biệt là Hình thái học số được sử dụng chủ

yếu vào việc cải thiện ảnh bằng cách làm rõ (tái hiện) những nét đặc trưng của các hình

dạng, do vậy mà có thể tính tốn được hay nhận biết được chúng một cách dễ dàng. Việc sử dụng các thao tác hình thái và ứng dụng của chúng, đặc biệt là ứng dụng nâng cao chất lượng hình ảnh cho bước tiền xử lý, trước khi thực hiện những bước kế tiếp cho công việc

<small>xử lý anh.</small>

<small>Chính vì vậy em đã lựa chọn luận văn “ Nghiên cứu phép tốn hình thái và ứng</small>

dụng nâng cao chất lượng ảnh nhị phân”.

Mục tiêu của luận văn là tìm hiểu nghiên cứu một sỐ kỹ thuật nâng cao chất lượng

ảnh nhị phân đặc biệt là phép tốn hình thái học vào xử lý các đối tượng trong hình ảnh và xây dựng chương trình ứng dụng thực tế.

<small>Báo cáo luận văn được chia làm 3 chương:</small>

Chương I. Tổng quan về phương pháp nâng cao chất lượng ảnh:

Chương II. Ứng dụng phép tốn hình thái trong nâng cao chất lượng ảnh nhị

<small>Chương III. Kiém nghiệm và đánh giá</small>

</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4">

CHƯƠNG 1. TONG QUAN VE PHƯƠNG PHÁP NÂNG CAO

CHAT LƯỢNG ANH

Trong ngành khoa hoc máy tính, xử ly ảnh là một dang của xử lý tín hiệu cho đầu vào là một ảnh hoặc các frame của phim ảnh. Đầu ra có thé là một hình ảnh, hoặc tập hợp các ký tự hoặc các tham số liên quan tới hình ảnh. Thường thì kỹ thuật xử lý ảnh có liên quan tới xử lý tín hiệu hai chiều va được áp dụng bằng một chuẩn riêng về kỹ thuật xử lý ảnh cho nó. Các khái niệm cơ bản dé xử lý tín hiệu như, khái niệm về tích chập, các biến đổi Fourier, biến đổi Laplace, các bộ lọc hữu hạn... Ngồi ra cịn cần tới các cơng cụ tốn học như đại số tuyến tính, xác xuất, thống kê. Và một số kiến thức cần thiết như trí tuệ nhân tao, mạng noron nhân tạo cũng được đề cập trong q trình phân tích và nhận dạng ảnh.

1.1 Giới thiệu chung về xử lý ảnh

<small>Con người thu nhận thông tin qua các giác quan, trong đó thị giác đóng vai trị quan</small>

trọng nhất. Những năm trở lại đây với sự phát triển của phần cứng máy tính, xử lý ảnh và đồ hoạ đó phát triển một cách mạnh mẽ và có nhiều ứng dụng trong cuộc sống. Xử lý ảnh và đồ

<small>hoạ đóng một vai trò quan trọng trong tương tác người máy</small>

Xử lý ảnh bao gồm các phương pháp va kỹ thuật dé biến đổi, dé truyền tải hoặc mã hóa các ảnh tự nhiên. Mục đích của xử lý ảnh gồm:

<small>Thứ nhất, biến đổi ảnh và làm đẹp ảnh.</small>

<small>Thứ hai, tự động nhận dang ảnh hay đoán nhận ảnh và đánh giá các nội dung củaảnh.</small>

Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người ta muốn đặc tả nó. Q trình nhận dạng thường đi sau q trình trích chọn các đặc tính chủ yếu của đối tượng. Có hai kiểu mơ tả đối tượng:

<small>- Mô tả tham số (nhận dang theo tham số).</small>

- Mô tả theo cau trúc(nhận dang theo cấu trúc).

Nhận biết và đánh giá các nội dung của ảnh là sự phân tích một hình ảnh thành những phần có nghĩa để phân biệt đối tượng này với đối tượng khác. Dựa vào đó ta có thể

<small>mơ tả câu trúc của hình ảnh ban đâu.</small>

</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5">

Có thé liệt kê một số phương pháp nhận dạng cơ bản như nhận dạng biên của một đối tượng trên ảnh, tách cạnh, phân đoạn hình ảnh ... Kỹ thuật này được sử dụng nhiều trong y học (xử lý tế bào, nhiễm sắc thể).

Trong thực tế người ta đã áp dụng kỹ thuật nhận dạng khá thành công với nhiều đối

tượng khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ (chữ cái, chữ số, chữ có dấu).

<small>Nhận dạng chữ In hoặc đánh máy trong văn bản phục vụ cho việc tự động hố q trình đọc</small>

tài liệu, tăng nhanh tốc độ và chất lượng thu nhận thông tin từ máy tính, nhận dạng chữ viết tay (với mức độ ràng buộc khác nhau về cách viết, kiêu chữ, ...).

<small>Các quá trình của xử lý ảnh:</small>

Các quá trình của xử lý ảnh [3] được tiến hành theo sơ đồ sau:

Thu Số hố Phân Nhận

A" nhan anh tich anh dang

<small>quyết định</small>

<small>Hình 1.1: Các giai đoạn chính trong xử lý ảnh</small>

Trước hết là q trình thu nhận ảnh. Ảnh có thé thu nhận qua camera, vệ tinh, may

Tiếp theo là quá trình số hóa (Digitalizer) để biến đổi tín hiệu tương tự sang tín hiệu

rời rac (lấy mẫu) va số hóa bằng lượng hóa, trước khi chuyên sang giai đoạn xử lý, phân tích

<small>hay lưu trữ lại.</small>

Q trình phân tích ảnh thực chất bao gồm nhiều công đoạn nhỏ. Trước hết là công việc tăng cường hình ảnh (Image Enhancement) dé nâng cao chất lượng hình anh. Do những nguyên nhân khác nhau: có thể do thiết bị thu nhận ảnh, do nguồn sáng hay do nhiễu, ảnh có thé bị suy biến. Do vậy cần phải tăng cường và khôi phục (Image Restoration) lại ảnh dé làm nỗi bật một số đặc tính chính của anh, hay làm cho ảnh gần giống với trạng thái gốc -trạng thái trước khi ảnh bị biến dạng. Giai đoạn tiếp theo là phát hiện các đặc tính như biên

</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6">

<small>(Edge Detection), phân vùng ảnh (Image Segmentation), trích chọn các đặc trưng (Feature</small>

Cuối cùng, tuỳ theo mục dich của ứng dụng, sé là giai đoạn nhận dang, phan lớp hay

các quyết định khác. Các giai đoạn chính của q trình xử lý ảnh có thé mơ tả ở hình 1.1

1.2 Một số van đề trong xử lý ảnh

<small>1.2.1 Các khái niệm cơ bản</small>

Phần tử ảnh (Pixel - Picture Element). Anh trong thuc tế là một ảnh liên tục về không gian và về giá trị độ sáng.

Đề có thể xử lý bằng máy tính cần thiết phải tiến hành số hóa ảnh. Trong q trình số

hóa người ta biến đổi từ tín hiệu liên tục sang tín hiệu rời rac thơng qua q trình lay mau (rời rạc hóa về khơng gian) và lượng hóa thành phần về giá trị mà về nguyên tắc bằng mắt thường không phân biệt được hai điểm kề nhau. Trong quá trình này người ta sử dụng khái niệm Picture element mà ta quen gọi hay viết là Pixel. Vậy 1 anh là một tập hợp các pixel.

Mức xám (Gray level) là kết quả sự mã hóa tương ứng với một cường độ sáng của mỗi điểm ảnh với một giá trị số - kết quả của q trình lượng hóa. Cách mã hóa kinh điển

thường dùng 16, 32 hay 64 mức. Mã hóa 256 mức là phơ dụng nhất do lý do kĩ thuật. Vì 2°

<small>= 256 (0,1,...255), nên với 256 mức, mỗi pixel sẽ được mã hóa bởi 8 bit.</small>

Độ phân giải (Resolation) của ảnh là mật độ điểm ảnh được ấn định trên một ảnh số được hiền thị. Ảnh số là tập hợp các điểm ảnh với mức xám phù hợp dùng dé mô tả ảnh gần

<small>với ảnh thật.</small>

Ảnh nhị phân là ảnh chi có hai mức xám 0 và 1.

Ảnh màu là ảnh số trong đó cường độ điểm ảnh là sự tổng hợp từ các màu tùy theo từng loại mà có cách biéu diễn khác nhau.

Ảnh đa mức xám là ảnh có nhiều hơn hai mức xám.

1.2.2. Biểu diễn ảnh

Trong biểu diễn ảnh, người ta thường dùng các phan tử đặc trưng của ảnh là pixel. Nhìn chung có thể một ham hai biến chứa các thông tin như biéu diễn của một ảnh. Các mơ hình biéu dién cho ta một mô tả logic hay định lượng các tính chất của hàm này. Trong biéu

diễn ảnh cần chú ý đến tính trung thực hoặc các tiêu chuẩn “thơng minh” dé đo chất lượng

</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7">

ảnh hoặc tính hiệu quả của các kĩ thuật xử lý. Một số mơ hình thường được dùng trong biểu diễn ảnh: mơ hình bài tốn, mơ hình thống kê. Trong mơ hình bài tốn, ảnh hai chiều được biểu diễn nhờ các hàm hai biến trực giao gọi là các hàm cơ sở. Cịn mơ hình thống kê, một ảnh được coi như một phần tử của một tập hợp đặc trưng bởi các đại lượng như: kỳ vọng

toán học, hiệp biến, phương sai, moment. 1.2.3 Biến doi ảnh (Image Transform)

Thuật ngữ biến đổi ảnh thường dùng dé nói tới một lớp các ma trận don vị va các kĩ thuật dùng dé biến đổi ảnh. Biến đổi ảnh nhằm làm giảm các nguyên nhân của ảnh dé việc

<small>xử lý hiệu quả hơn. Như làm rõ hơn các thông tin mà ngời dùng quan tâm nhưng người</small>

dùng phải chấp nhận mắt đi một số thơng tin cần thiết.

<small>1.2.4 Phân tích ảnh</small>

Phân tích ảnh liên quan đến việc xác định các độ đo định lượng của | anh để đưa ra

một mô tả đầy đủ về ảnh. Q trình phân tích ảnh thực chất bao gồm nhiều công đoạn nhỏ.

Trước hết là công việc tăng cường ảnh để nâng cao chất lượng ảnh, giai đoạn tiếp theo là

<small>phát hiện các đặc tính như phát hiện biên, phân vùng ảnh, trích chọn các đặc tinh..v.v..</small>

<small>1.2.4.1 Tăng cường ảnh — khôi phục anh</small>

<small>1.2.4.2 Biên</small>

<small>1.2.4.3 Phan vùng</small>

<small>1.2.5 Nhận dạng anh</small>

Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người ta muốn đặc tả nó. Q trình nhận dạng thường đi sau q trình trích chọn các đặc tính chủ yếu của đối tượng. Có hai kiểu mơ tả đối tượng: Mô tả tham số (nhận dạng theo tham số). Mô tả theo cấu trúc (nhận dạng theo cấu trúc). Trên thực tế người ta đã áp dụng kỹ thuật nhận dạng khá thành công với nhiều đối tượng khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ viết.

<small>1.2.6 Nén ảnh</small>

Dữ liệu ảnh cũng như các dữ liệu khác cần phải lưu trữ hay truyền đi trên mang mà lượng thông tin để biểu diễn cho một ảnh là rất lớn. Do đó làm giảm lượng thơng tin hay nén dit liệu là một nhu cau cần thiết. Nén dé liệu là q trình làm giảm lượng thơng tin “ du

</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8">

thừa” trong dit liệu gốc và do vậy lượng thông tin thu được sau khi nén thường nhỏ hon dữ liệu gốc rất nhiều.

1.3 Các kỹ thuật nâng cao chất lượng ảnh

<small>1.3.1. Các kỹ thuật khơng phụ thuộc khơng gian</small>

<small>1.3.1.1. Giới thiệu</small>

<small>Các phép tốn khơng phụ thuộc khơng gian là các phép tốn khơng phục thuộc vi trí</small>

của điểm ảnh.

Ví dụ: Phép tăng giảm độ sáng , phép thống kê tần suất, biến đổi tần suất v.v..

Một trong những khái niệm quan trọng trong xử lý ảnh là biểu đồ tần suất

</div><span class="text_page_counter">Trang 9</span><div class="page_container" data-page="9">

1.3.1.5. Cân bằng histogram

<small>1.3.1.6. Kỹ thuật tách ngưỡng tự động</small>

1.3.1.7. Biến đôi cấp xám tong thé

<small>1.3.2. Các kỹ thuật phụ thuộc không gian</small>

1.3.2.1. Phép cuộn và mẫu

1.3.2.2. Một số mẫu thông dụng

<small>1.3.2.3. Lọc trung vi</small>

<small>* Định nghĩa 2.1 (Trung vi): Cho dãy x1; x2...; xn đơn điệu tăng (giảm). Khi đó</small>

<small>trung vị của dãy ký hiệu là Med({xn}), được định nghĩa:</small>

®Ir—x, > min tại Med({x, })

<small>1.3.2.4. Loc trung binh</small>

<small>* Dinh nghia 2.2 (Trung binh): Cho day x1, x2..., xn khi do trung binh cua day kyhiệu AV({xn}) được định nghĩa:</small>

</div><span class="text_page_counter">Trang 10</span><div class="page_container" data-page="10">

<small>1.3.3 Các phép tốn hình thái.</small>

Ý nghĩa của “Morphology” là hình thái học và cấu trúc của đối tượng, hay nó mơ tả những phạm vi và các mối quan hệ giữa các thành phần trong một đối tượng.

Phần lớn các phép tốn hình thái học được định nghĩa từ hai phép toán cơ bản là

<small>phép toán co nhị phan (Erosion) và phép toán giãn nhị phan (Dilation) .</small>

<small>1.3.3.1 Phép giãn nhị phân (Dilation[4])</small>

Phép giãn nhị phân của tập hợp A bởi phan tử cau trúc B là tập hợp của tat cả các điểm z (z là tâm điểm của phan tử cấu trúc B trên tập hợp A) sao cho phản xa của Ö, giao với tập A tại ít nhất một điểm

Với A và B là các tập hợp trong 2’, thì phép giãn nhị phân của A theo 8 (A®B) được

<small>định nghĩa qua cơng thức sau:</small>

A98 |8) ¬aze]

<small>1.3.3.2. Phép co nhị phân (Erosion{ 4]).</small>

<small>Phép co nhị phân của tập hợp A bởi phan tử cấu trúc B được kí hiệu AOB và viết</small>

<small>dưới dạng công thức như sau:</small>

AOB = {zl(B), cA}

<small>Với 8 ={b+z,beB}1.3.3.3. Phép mở ảnh (Opening[4]).</small>

Dé thực hiện phép mở ảnh ta phải trải qua hai giai đoạn là co ảnh và giãn anh. Dau tiên sử dụng phép co và phần tử cấu trúc có kích thước tương ứng để tác động lên đối tượng trong ảnh đúng theo yêu cầu. Tương tự với phép giãn nhị phân ta sẽ thu được kết quả.

Với tập hop A là đối tượng trong hình anh và B là phan tử cấu trúc, (s ) là ký hiệu của phép mở ảnh giữa tập hop A và phần tử cấu trúc B, phép mở ảnh được xác định bởi công

Ao 8=(1O BOB,

</div><span class="text_page_counter">Trang 11</span><div class="page_container" data-page="11">

<small>1.3.3.4. Phép đóng ảnh (Closing[4])</small>

Với tập hợp A là đối tượng trong anh, B là phan tử cấu trúc. (e) là ký hiệu phép đóng ảnh. Khi đó phép đóng ảnh của tập hợp A bởi Phan tử cấu trúc B, kí hiệu là (Ae B), xác định

<small>(AeB)=(A@B)OB</small>

</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13">

1.4 Kết luận

Chương này tìm hiểu tổng quan về các phương pháp nâng cao chất lượng ảnh

bao gồm có các khái niệm ban đầu về xử lý ảnh, các kỹ thuật nâng cao chất lượng ảnh phụ

<small>thuộc và không phụ thuộc không gian...Ngoai ra nội dung chương cịn trình bay các thuật</small>

<small>tốn xử lý hình thái học cơ bản như: phép co ảnh, phép giãn ảnh, phép mở ảnh, phép đóng</small>

ảnh.... Thơng qua nội dung chương, người đọc bước đầu có được các kiến thức chung trong lĩnh vực xử lý ảnh, các kỹ thuật nâng cao chất lượng ảnh và một số phép tốn hình thái cơ

<small>bản.</small>

</div><span class="text_page_counter">Trang 14</span><div class="page_container" data-page="14">

CHƯƠNG II. UNG DỤNG PHÉP TỐN HÌNH THÁI TRONG

NÂNG CAO CHAT LƯỢNG ANH NHI PHAN

Hình ảnh trong thực tế khi nhận được qua các thiết bi như: Photocopy, Fax, .. ít nhiều đều bị nhiễu, thậm chí có thé biến dạng đến mức độ có thé khiến người nhận được hiểu sai về mặt ý nghĩa. Dé giải quyết bài toán này như: nối liền những nét đứt, nối liền chữ, làm

<small>trơn biên ảnh ... các phép tốn hình thái nhị phân đã ra đời, thơng qua các phép tốn cơ bản</small>

như phép giãn ảnh, phép co ảnh, phép đóng ảnh, mở ảnh.... để giải quyết bài toán nêu trên.

<small>2.1 Khái niệm cơ bản</small>

Phép toán cơ sở được kết hợp với một đối tượng là tiêu chuẩn của các phép toán tập

<small>hợp như phép hợp (Union), Phép giao (InterSection), và phép bù (Complement) cộng với</small>

phép tịnh tiến nào đó.

<small>Đối với ảnh nhị phân, phần tử cấu trúc là một ảnh có kích thước nhỏ gồm có hai giá trị 0 và</small>

<small>1, các giá trị bằng 0 được bỏ qua trong q trình tính tốn,</small>

2.2 Các phép toán Logic liên quan đến ảnh nhị phân

<small>Các phép toán logic được sử dụng trong xử lý anh là AND(A), OR(v ), và NOT(¬)..</small>

Các phép tốn đó cung cấp đầy đủ các chức năng, chúng có thể được kết hợp dưới bất kỳ

<small>dạng nào của phép toán logic.</small>

2.3 Một số tinh chat của phép tốn hình thái

Đề thuận tiện trong việc cài đặt ta có thê phân tích và đơn giản hóa các mẫu phức tạp,

dưới đây là một số tính chất cơ sở của phép tốn hình thái.

</div><span class="text_page_counter">Trang 15</span><div class="page_container" data-page="15">

<small>a) X®(8LB)=(X ®B)L)(X OB),</small>

<small>b) X O(BUB')=(X OB)U(X OB’),</small>

- Mệnh dé 3: Tính chat phân phối với phép giao

Giả sử, X là một đối tượng trong ảnh, B là phần tử cấu trúc, khi đó X sẽ bị chặn trên

<small>và chặn dưới bởi tập close của X theo B.</small>

2.4 Phép Biến déi trúng hoặc trượt (Hit-or-Miss)

Phép biến đổi “trúng hoặc trượt” được đưa ra bởi Serra [7] và là một công cụ cơ bản

để ứng dụng vào phát hiện hình dạng của đối tượng.

<small>2.5 Các ứng dụng cơ bản của hình thái học</small>

Ứng dụng chủ yếu của hình thái học đối với ảnh nhị phân là phân tích các thành phần

của ảnh, chính vì nó rất có hiệu quả trong biểu diễn và mơ tả hình dạng đối tượng cho nên

phần này sẽ tập trung đưa ra các thuật tốn về hình thái [1] để trích đường biên, các thành phần liên thơng, đường bao lỗi, hay tìm xương làm mảnh.

<small>2.5.1. Trích biên ( Boundary Extraction)</small>

Biên của tập hợp A phụ thuộc vào kích thước của phần tử cấu trúc. Độ dày của đường viền bao quanh đối tượng phụ thuộc vào kích thước cua phần từ cau trúc. Ví dụ, nếu

</div>

×