Tải bản đầy đủ (.pdf) (25 trang)

Nâng cao chất lượng hình ảnh bằng phép toán hình thái, kỹ thuật tìm xương và làm mảnh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (349.28 KB, 25 trang )

Trang 1


Nâng cao chất lượng hình ảnh bằng phép
toán hình thái, kỹ thuật tìm xương và
làm mảnh / Nguyễn Minh Đức ; Nghd. :
PGS.TS.Ngô Quốc Tạo
LỜI NÓI ĐẦU
Ảnh là một dạng dữ liệu đóng vai trò quan trọng trong việc trao đổi, xử
lý, lưu giữ thông tin Trong nhiều ngành nghề, trong một số các loại hình công
việc, người ta điều cần đến hình ảnh để mô tả, minh chứng hay diễn đạt những
điều mà đôi khi chữ viết hay ngôn ngữ nói không lột tả hết được. Trong hầu hết
các ngành như: Thiết kế cơ khí, Thiết kế xây dựng, Thiết kế mạch điện việc
đọc hình ảnh có thể nói là thường xuyên và cực kỳ quan trọng. Bản vẽ kỹ thuật
(một dạng của hình ảnh) chính là kết quả ngôn ngữ kỹ thuật, Mà qua nó, một
qui trình công nghệ phải được xây dựng trong quá trình sản xuất, cũng như nó
chính là cơ sở cho việc nghiệm thu cho bất kỳ sản phẩm nào Để lưu ảnh của
các tài liệu, các bản vẽ hoặc sửa đổi chúng và chuyển chúng sang các dạng đồ
hoạ khác tiện cho việc nhận dạng, đối sánh mẫu để sử dụng sau này là điều cần
thiết. Nhưng phải tổ chức việc lưu các dạng hình ảnh này như thế nào? Có cần
xử lý gì trước khi lưu chúng không? Câu trả lời là có. Do vậy tiền xử lý ảnh là
việc cần làm. Có nhiều phương pháp, nhiều công cụ, nhiều phần mềm xử lý ảnh
Trang 2


đã ra đời. Tăng cường chất lượng ảnh, mà công đoạn đầu tiên là một bước tiền
xử lý nhằm loại bỏ nhiễu, khắc phục những khiếm khuyết do bước thu nhận ảnh
không tốt là việc làm quan trọng. Có nhiều phương pháp cho việc nâng cao chất
lượng ảnh nói chung và tiền xử lý nói riêng. Trong luận văn này chỉ mô tả một
vài phương pháp tiền xử lý hình ảnh, (chú trọng đến ảnh nhị phân, bởi ảnh của
các bản vẽ kỹ thuật thường chỉ là ảnh 2 màu: đen, trắng) để cải thiện chất lượng


hình ảnh bằng các thao tác Hình thái học (Morphology); một vài kỹ thuật phát
hiện xương, làm mảnh.
Các thao tác Hình thái học nói chung, đặc biệt là Hình thái học số được
sử dụng chủ yếu vào việc cải thiện ảnh bằng cách làm rõ (tái hiện) những nét
đặc trưng của các hình dạng, do vậy mà có thể tính toán được hay nhận biết
được chúng một cách dễ dàng. Việc sử dụng các thao tác hình thái và ứng dụng
của chúng, đặc biệt là ứng dụng kỹ thuật làm mảnh ảnh để nâng cao chất lượng
hình ảnh cho bước tiền xử lý, trước khi thực hiện những bước kế tiếp cho công
việc xử lý ảnh.
Trong các kỹ thuật tìm xương truyền thống, việc sử dụng một mẩu phần
tử cấu trúc (cũng là một ảnh nhị phân) được khởi tạo ngay từ ban đầu xuyên
suốt quá trình lặp để xử lý ảnh thường chỉ xử lý được một vài đặc điểm của đối
tượng, vì thế trong luận văn này tôi cũng đề cập đến một phương pháp phân rã
phân tử cấu trúc hình dạng tuỳ ý sử dụng thuật toán di truyền để lựa chọn phân
tử cấu trúc tối ưu cho các phép toán hình thái. Luận văn gồm 4 chương:
Chương 1: Tổng quan về phương pháp nâng cao chất lượng hình ảnh.
Trang 3


Giới thiệu sơ bộ về xử lý ảnh và ứng dụng. Khái niệm ảnh nhị phân, Hình thái
học.
Chương 2: Nâng cao chất lượng ảnh bằng phép toán hình thái
Chương này giới thiệu về các thao tác với ảnh nhị phân. Cụ thể đó là các
thao tác như: Phép dãn, phép co, phép đóng, mở ảnh. Bên cạnh các thao tác có
kèm theo ý nghĩa của chúng, có thuật toán và có hình minh hoạ.
Chương 3: Nâng cao chất lượng hình ảnh bằng phương pháp tìm xương và
làm mảnh.
Trong chương này giới thiệu về ý nghĩa của hình thái học trong thực tiễn
và các ứng dụng nói chung của thao tác hình thái, trong đó chú trọng vào thao
tác làm mảnh, luận văn còn giới thiệu một phương pháp phân rã phần tử cấu

trúc sử dụng thuật toán di truyền.
Chương 4: Cài đặt chương trình thử nghiệm.
Trình bày một số thử nghiệm cho thao tác tìm xương, làm mảnh ảnh.
Kết Luận

CHƯƠNG I: TỔNG QUAN VỀ PHƯƠNG PHÁP NÂNG
CAO CHẤT LƯỢNG HÌNH ẢNH
1.1 Giới thiệu chung về xử lý ảnh:
Cũng như xử lý dữ liệu bằng đồ hoạ, xử lý ảnh số là một lĩnh vực của tin
học ứng dụng. Xử lý dữ liệu bằng đồ họa đề cập đến những ảnh nhân tạo, các
Trang 4


ảnh này được xem xét như là một cấu trúc dữ liệu và được tạo ra bởi các
chương trình. Xử lý ảnh số bao gồm các phương pháp và kỹ thuật để biến đổi,
để truyền tải hoặc mã hóa các ảnh tự nhiên. Mục đích của xử lý ảnh gồm:
Thứ nhất, biến đổi ảnh và làm đẹp ảnh.
Thứ hai, tự động phân tích nhận dạng ảnh hay đoán nhận ảnh và đánh giá
các nội dung của ảnh.
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người ta
muốn đặc tả nó. Quá trình nhận dạng thường đi sau quá trình trích chọn các đặc
tính chủ yếu của đối tượng. Có hai kiểu mô tả đối tượng:
- Mô tả tham số (nhận dạng theo tham số).
- Mô tả theo cấu trúc (nhận dạng theo cấu trúc).
Nhận biết và đánh giá các nội dung của ảnh là sự phân tích một hình ảnh
thành những phần có nghĩa để phân biệt đối tượng này với đối tượng khác. Dựa
vào đó ta có thể mô tả cấu trúc của hình ảnh ban đầu.
Có thể liệt kê một số phương pháp nhận dạng cơ bản như nhận dạng biên
của một đối tượng trên ảnh, tách cạnh, phân đoạn hình ảnh Kỹ thuật này được sử
dụng nhiều trong y học (xử lý tế bào, nhiễm sắc thể).

Các quá trình của xử lý ảnh:
Các quá trình của xử lý ảnh được tiến hành theo sơ đồ sau:






Nhận dạng
Thu nhận
ảnh
Số hoá
Phân tích
ảnh
Lưu trử
Hệ quyết
định
Lưu trử
Trang 5


Hình 1.1: Sơ đồ quá trình xử lý ảnh



Trước hết là quá trình thu nhận ảnh: Ảnh có thể thu nhận qua camera, từ
vệ tinh hay ảnh được quét qua scanner. Tiếp theo là quá trình số hóa
(Digitalizer) để biến đổi tín hiệu tương tự sang tín hiệu rời rạc trước khi chuyển
sang giai đoạn xử lý, phân tích hay lưu trữ lại.
Quá trình phân tích ảnh thực chất bao gồm nhiều công đoạn nhỏ. Trước hết

là công việc tăng cường hình ảnh (Image Enhancement) để nâng cao chất lượng
hình ảnh. Do những nguyên nhân khác nhau: có thể do thiết bị thu nhận ảnh, do
nguồn sáng hay do nhiễu, ảnh có thể bị suy biến. Do vậy cần phải tăng cường
và khôi phục (Image Restoration) lại ảnh để làm nổi bật một số đặc tính chính
của ảnh, hay làm cho ảnh gần giống với trạng thái gốc - trạng thái trước khi ảnh
bị biến dạng. Giai đoạn tiếp theo là phát hiện các đặc tính như biên (Edge
Detection), phân vùng ảnh (Image Segmentation), trích chọn các đặc tính
(Feature Extraction),v.v
Cuối cùng, tuỳ theo mục đích của ứng dụng, sẽ là giai đoạn nhận dạng,
phân lớp hay các quyết định khác. Các giai đoạn chính của quá trình xử lý ảnh
có thể mô tả ở hình 1.1.
1.2 Giới thiệu ảnh nhị phân:

1.2.1 Một số khái miệm:

• Pixel (Picture Element): Phần tử ảnh.
Trang 6


Trong quá trình số hoá, ngươì ta biến đổi tín hiêụ liên tục sang tín hiệu rời
rạc thông qua quá trình lấy mẫu (rời rạc hoá về không gian) và lượng hoá thành
phần giá trị mà về nguyên tắc, mắt thường không phân biệt được hai điểm kề
nhau. Trong quá trình này, người ta sử dụng khái niệm Picture Element mà ta
quen gọi hay viết là pixel ( phần tử ảnh). Như vậy một ảnh là một tập hợp các
pixel. Mỗi pixel gồm một cặp toạ độ x, y và màu.
• Ảnh nhị phân: Ảnh chỉ có giá trị 0 hoặc 1 thì ta nói đó là một ảnh nhị
phân hoặc ảnh đen trắng.
Trang 7



CHƯƠNG II: NÂNG CAO CHẤT LƯỢNG ẢNH BẰNG
PHÉP TOÁN HÌNH THÁI
2.1 Khái niệm về phép toán hình thái Morphology:
Hiểu một cách đầy đủ thì morphology là “ hình thái và cấu trúc của một
đối tượng”, hay, nó diễn tả những phạm vi và các mối quan hệ giữa các phần
của một đối tượng.
Những đối tượng ảnh trong Hình thái học là tập hợp của các điểm ảnh,
nhóm lại theo cấu trúc hai chiều.
Phần lớn các phép toán hình thái học được định nghĩa từ hai phép toán cơ
bản là: Dãn ảnh (Dilation) và Co ảnh (Erosion).
2.2 Thao tác trên ảnh nhị phân:

Trong luận văn này, ta coi đối tượng ảnh là những điểm đen và nền là
những điểm trắng. Trước hết, để bắt đầu ta hãy xem hình 2.1a.
Tập hợp các điểm ảnh đen tạo nên đối tượng ảnh hình vuông và trong 2.1b,
đối tượng ảnh cũng là hình vuông nhưng là hình vuông lớn hơn so với 2.1a một
điểm ảnh về mọi phía, nghĩa là thay mọi lân cận trắng của các điểm ảnh trong
2.1a thành các điểm ảnh đen. Đối tượng trong 2.1c cũng được thao tác tương
tự. Thao tác đó có thể coi như một phép dãn đơn giản, phép dãn một điểm ảnh
về mọi phía. Việc dãn đó có thể được thực hiện cho đến khi toàn bộ ảnh được
thay bằng các điểm ảnh đen. Tuy nhiên trong thực tế, đối tượng ảnh được xem
như là một tập hợp toán học của các điểm ảnh đen, mỗi điểm ảnh đen được coi
Trang 8


như là một điểm trong không gian hai chiều và nó được xác định bởi số hàng và
số cột. Do vậy, đối tượng ảnh trong 2.1a










có thể được viết lại là {(3, 3), (3, 4), (4, 3), (4, 4) }, với điểm ảnh phía trên bên
trái là (0, 0). Tuy nhiên, việc viết như vậy sẽ rất dài dòng và bất tiện nên ta gọi
đơn giản đối tượng ảnh là A, và các phần tử trong đó là các điểm ảnh.
2.2.1. Phép dãn nhị phân (Dilation):

• Phép dịch A bởi điểm x (hàng, cột)
(A)
x
= {c | c = a + x, a ∈ A} (EQ 2.1)
• Phép đối của tập A được định nghĩa như sau:
Â= {c | c = - a, a ∈ A } (EQ 2.2)
đó chính là phép quay A một góc 180° quanh gốc tọa độ.
• Phần bù của tập A là tập các điểm ảnh không thuộc đối tượng A, ở đây
chính là các điểm ảnh trắng. Theo lý thuyết tập hợp thì:
Hình 2.1:
Hiệu quả của thao tác nhị phân đơn giản trên một ảnh nhỏ.
(a) Ảnh ban đầu
(b) Ảnh dãn 1 điểm ảnh
(c) Ảnh dãn 2 điểm ảnh (so với ảnh ban đầu).
Trang 9


A
c

= {c | c ∉ A} (EQ 2.3)
• Giao của hai tập hợp A và B là tập các phần tử thuộc về cả A lẫn B. Kí hiệu:
A ∩
∩∩
∩ B = {c | ( c ∈ A) ∧ ( c ∈ B)} (EQ 2.4)
• Hợp của hai tập hợp A và B là tập các phần tử thuộc A hoặc / và B. Kí hiệu:
A ∪
∪∪
∪ B = {c | ( c ∈ A) ∨ ( c ∈ B)} (EQ 2.5)
• Hiệu của hai tập hợp A và B là tập:
A - B = { c | ( c ∈ A) ∧ ( c ∉ B)} (EQ 2.6)
hay A - B = A ∩ B
c

Phép dãn tập A bởi cấu trúc B:
A ⊕
⊕⊕
⊕ B = {c | c = a + b, a ∈ A, b ∈ B} (EQ 2.7)
Trong đó, tập C gọi là kết quả của phép dãn A sử dụng phần tử cấu trúc
B và gồm các phần tử như được mô tả ở trên, tuy nhiên một vài điểm trong số
chúng có thể trùng nhau.











Phần tử cấu trúc
Hình 2.2 Dãn A bơỉ B
a) Tập A ban đầu.
b) Tập A cộng phần tử (0, 0).
c) Tập A cộng phần tử (0, 1).
d) Hợp của (b) và (c) Kết quả của phép dãn
Trang 10


Nhìn hình 2.2 trên, ta nhận thấy rằng trong các ảnh có hình 1 dấu thập

××
×). Những phần tử được đánh dấu (×) hoặc đen, hoặc trắng được coi như gốc
(Ogirin) của mỗi ảnh. Việc xác định vị trí của gốc cấu trúc là rất quan trọng, nó
có thể quyết định hướng co, dãn của ảnh. Nếu gốc ở bên trái, thì ảnh có xu
hướng co, dãn về bên phải, gốc ở bên phải thì co, dãn về trái và nếu gốc ở giữa,
tất nhiên, ảnh sẽ dãn đều. Trong thí dụ trên do gốc của cấu trúc B ở bên trái nên
ta thấy ảnh được dãn về bên phải.
Tổng quát hơn, ta có thể coi phép dãn (dilation) là hợp của tất cả các
phép dịch bởi các phần tử của cấu trúc, kí hiệu:
(EQ 2.8)

Tuy nhiên với vai trò bình đẳng của A và B, ta coi A là cấu trúc và B là ảnh
thì khi đó:
(EQ 2.9)


Từ những điều trên, giúp ta tiếp cận đến một thao tác dãn ảnh có thể được “
máy tính hóa “. Ta hãy xem những phần tử cấu trúc như là một mẫu và dịch nó

trên ảnh. Khi gốc của phần tử cấu trúc, hay mẫu, khớp với một điểm ảnh đen trên
ảnh thì tất cả các điểm ảnh tương ứng với các điểm đen trên cấu trúc sẽ được
đánh dấu và thay thế sau. Sau khi toàn bộ ảnh đã được quét qua bởi mẫu, thao tác
dãn ảnh coi như hoàn chỉnh. Thông thường, máy tính sẽ làm như sau:




U
Bb
b
ABA

=⊕ )(
U
Aa
a
BBA

=⊕ )(
Trang 11


Hình 2.4
: Dãn ảnh sử dụng phần tử cấu trúc.
(a) Gốc cấu trúc định vị trên điểm ảnh đen đầu tiên và những điểm đen cấu
trúc được chép sang ảnh kết quả ở nhưưng vị trí tương ứng.
(b) Quá trình lặp laị tương tự đối với điểm đen tiếp theo cuả ảnh.
(c) Quá trình hoàn thành.
2.2.2. Phép co nhị phân (Erosion):


Phép co một ảnh A bởi cấu trúc B có thể được định nghĩa như là tập:
A Θ B = {c |(B)
c
⊆ A} (EQ 2.10)
Nói cách khác, đó là tập hợp các điểm ảnh c ∈ A, mà nếu cấu trúc B dịch
chuyển theo các toạ độ của c, thì B vẫn nằm trong đối tượng ảnh A, tức B là
một tập con của đối tượng ảnh cần co A.


Hình 2.5:Phép co nhị phân dùng cấu trúc đơn giản
Trang 12


Quan hệ giữa phép co và phép dãn có mối quan hệ qua biểu thức sau đây:
(A Θ B)
c
= A
c
⊕ BÂ (EQ 2.11)
Theo định nghĩa của phép co ở trên, ta có:
A Θ B = {z|(B)
z
⊆ A}
Khi đó phần bù của phép co là:
(A Θ B)
c
= {z|(B)
z
⊆ A }

c

 Một số tính chất của phép biến đổi hình thái:

♦ Tính chất bất biến
((X ⊕
⊕⊕
⊕ B)Θ B) ⊕
⊕⊕
⊕ B = X ⊕
⊕⊕
⊕ B
((X Θ B) ⊕
⊕⊕
⊕ B) Θ B = X Θ B
♦ Tính chất phân bố của phép toán hình thái đối với tập cấu trúc
X ⊕
⊕⊕
⊕ (B ∪ B’) = (X ⊕
⊕⊕
⊕ B) ∪ (X ⊕
⊕⊕
⊕ B’)
X Θ (B ∪ B’) = (X Θ B) ∩ (X Θ B’)
♦ Tính chất phân bố của co đối với phép giao hai tập hợp
(X ∩ Z) Θ B = (X Θ B) ∩ (Z Θ B)
♦ Tính chất kết hợp của phép toán co, dãn nở
(X Θ B) Θ B’ = X Θ (B ⊕ B’)
(X ⊕ B) ⊕ B’=X ⊕ (B ⊕ B’)
♦ Tính chất gia tăng

X ⊂ X’⇒ X Θ B ⊂ X’ Θ B ∀B
X ⊕ B ⊂ X’ ⊕ B ∀B
B ⊂ B’ ⇒ X Θ B ⊂ X Θ B’ ∀X
Trang 13


♦ Tính chất đối ngẫu
X ⊕
⊕⊕
⊕ B = (X Θ B)
c

2.2.3. Các phép toán đóng mở ảnh (closing and opening
)
2.2.3.1.Phép mở:

Opening(I) = D(E(I)).
2.2.3.2.Phép đóng:

Close (I) = E(D(I))

CHƯƠNG III: NÂNG CAO CHẤT LƯỢNG ẢNH BẰNG PHƯƠNG
PHÁP TÌM XƯƠNG VÀ LÀM MẢNH
Thuật toán làm mảnh thường bao gồm nhiều lần lặp, mỗi lần lặp tất cả
các điểm của đối tượng sẽ được kiểm tra, nếu chúng thoả mãn điều kiện xoá
nào đó thì nó sẽ bị xoá đi. Quá trình được lặp lại cho đến khi không còn điểm
biên nào được xoá.
3.1 Xương và làm mảnh

Một xương được xem như sử dụng để mô tả hình dạng của đối tượng theo

số ít các điểm ảnh có liên quan. Trong các ảnh đoạn, xương truyền đạt tất cả các
thông tin được thấy trong ảnh nguyên bản ban đầu. Do đó, làm mảnh ảnh có thể
được định nghĩa như là hoạt động của việc nhận dạng (identifying) các điểm ảnh
của một đối tượng mà các điểm ảnh đó là các điểm cốt yếu cho việc mô tả hình
dạng của đối tượng: Đó là các điểm xương tạo thành một tập các điểm xương.
3.2 Các phương pháp lặp hình thái học
Trang 14


Phần lớn các thuật toán làm mảnh đều dựa trên một vòng lặp lột bỏ dần
đi các lớp điểm ảnh cho đến khi không còn nhiều hơn một lớp được xoá bỏ.
Người ta đưa ra tập các quy tắc xác định điểm ảnh nào cần loại bỏ. Thường thì
các quy tắc được thiết kế sao cho dễ nhận biết được khi nào thì thuật toán dừng.
Đó là khi không còn sự thay đổi nào sau 2 lần duyệt qua ảnh.
Thuật toán đầu tiên được Stentiford đề xuất 1983 là một điển hình cho
kiểu này. Thuật toán sử dụng mẫu cấu trúc 3 x 3 để đối sánh mẫu này trong
hình ảnh nghĩa là nếu giống thì ta có thể xoá (đặt trắng) pixel trung tâm:
• Tìm một vị trí pixel (i, j) nơi mà các pixel trong hình ảnh I giống với
mẫu M1 (Hình 3.1).
• Nếu pixel trung tâm không là điểm cuối và có số kết nối bằng 1 thì
đánh dấu pixel này lại để sau này xoá đi.
• Lặp lại bước 1 và 2 với tất cả những pixel giống mẫu M1 trong ảnh.
• Lặp lại các bước 1-3 với các mẫu còn lại (M2, M3, M4).
• Nếu bất kỳ những pixel nào đã được đánh đấu để xoá thì xoá chúng
bằng cách đặt chúng thành màu trắng.
• Nếu bất kỳ những pixel nào đã được xoá ở bước 5, lặp lại toàn bộ quá
trình từ bước 1. Ngược lại, thuật toán dừng.





Hình 3.1. Các mẫu sử dụng để nhận dạng những pixel có thể được xoá
trong thuật toán làm mảnh Stentiford
Trang 15


Hình 3.2:
Một minh hoạ về số liên kết
a) Điểm trung tâm không liên kết với bất cứ vùng nào và có thể bị xoá. Số
liên kết bằng 1
b) Nếu điểm trung tâm đã bị xoá, hai phần trái và phải sẽ trở thành không liên
kết. Số liên kết bằng 2
c) Số liên kết bằng 3
d) Số liên kết bằng 4, cực đại
Ảnh phải được quét theo một thứ tự riêng biệt đối với từng mẫu. M1: tìm
các pixel có thể xoá được dọc theo biên trên của đối tượng, từ trái qua phải.
Mẫu M2 di chuyển từ dưới lên trên, từ trái qua phải của hình ảnh. M3 sẽ định
vị các pixel dọc theo biên dưới và di chuyển từ phải qua trái, từ dưới lên trên.
Cuối cùng mẫu M4 sẽ tìm những pixel ở bên phải của đối tượng, từ trên xuống
dưới, phải qua trái.
Thứ tự đặc biệt này và hướng áp dụng cho các mẫu, để bảo đảm rằng các
pixel sẽ được xoá cân đối, tránh được sự sai lệch hướng.
Có 2 khái niệm mới và cả 2 được nêu trong bước 2.
• Điểm cuối (End point): Chỉ kết nối với một pixel đen khác.
• Số liên kết : pixel đơn kết nối với 2 bộ phận rộng của một đối tượng.


(a) (b) (c) (d) (e)







Số kết nối chính là một sự đo lường xem có bao nhiêu đối tượng mà một
điểm ảnh có thể kết nối. Một cách đo lường các kết nối, được thấy như trong
hình 3.2 (đẳng thức Yokoi 1973) là:
)**(
21 ++

−=

kkk
Sk
kn
NNNNC
(EQ 3.1)
Trang 16


Trong đó N
k
là giá trị màu của một trong các 8 láng giềng của điểm ảnh
được liên kết và S = {1, 3, 5, 7}. N
1
là giá trị màu của điểm ảnh bên phải của
điểm ảnh trung tâm và chúng được số hoá theo thứ tự ngược chiều kim đồng
hồ, xung quanh điểm ảnh trung tâm. Giá trị của N
k
là 1 nếu điểm ảnh là điểm

trắng (điểm ảnh nền) và giá trị của N
k
là 0 nếu điểm ảnh là điểm đen (điểm ảnh
thuộc đối tượng). Điểm ảnh trung tâm là N
0
và N
k
= N
k
- 8 nếu k > 8. Một cách
khác giá trị liên kết có thể được tính toán bằng cách xét các điểm láng giềng
theo thứ tự: N
1,
N
2,
Ns
,
N
1.
Số các thay đổi màu (đen-trắng) được sử dụng
đếm số vùng điểm ảnh trung tâm kết nối.



Hình 3.3:
Bốn phần của mỗi phép lặp trong làm mảnh Stentiford
a) Sau khi áp dụng mẫu M1 b) Sau mẫu M2 c) Sau M3 d) Sau M4.
Để hoàn chỉnh việc làm mảnh đối tượng này đòi hỏi 13 vòng lặp (vòng lặp
sau cùng không làm điều gì ngoại trừ việc hiển thị điều mà chúng ta đã hoàn tất).
Có một vài vấn đề vẫn tồn tại trong thuật toán làm mảnh này đó là việc

hiển thị như là một chế tác trong xương ảnh. Hiện tượng đầu tiên trong kết quả
của thuật toán này được gọi là necking, nó xảy ra trong một điểm hẹp chỗ giao
nhau của hai đường thẳng đã bị kéo dài ra lại thành một đoạn thẳng (Hình
3.5a). Phần đuôi

(Tailing) có thể được tạo tại nơi lẽ ra là không tồn tại bởi do
việc làm mảnh quá mức, tại nơi hai đường thẳng gặp nhau tạo thành một góc
nhọn (Hình 3.5b). Hiện tượng cuối cùng có lẽ là chung nhất, đó là sự tạo ra
Trang 17


những đoạn thẳng phụ gắn vào đoạn xương thực, Điều này được gọi là spurious
projection (sự nhô giả), hairs (những sợi tóc), hoặc line fuzz (dòng kẻ xoắn) hình 3.5c.

Hình 3.5. Phần đuôi (Tailing) được tạo ra bởi những đoạn thẳng phụ.
Stentiford đề xuất một giai đoạn tiền xử lý để cực tiểu hoá các chế tác làm
mảnh đó: Xoá bỏ các điểm ảnh có không có quá hai điểm láng giềng đen và có
một giá trị liên kết nhỏ hơn 2.
Để xử lý với điểm thắt nút, ông đề nghị một thủ tục gọi là thủ tục phân giác
góc nhọn (acute angle amphasis), các điểm ảnh gần chỗ nối giữa hai đường được
đặt thành màu trắng nếu chúng khép lại tạo thành một góc nhọn. Điều này được
thực hiện bằng cách sử dụng các mẫu như trong hình 3.6







Hình 3.6:

Các mẫu được dùng cho bước xử lý góc nhọn quan trọng.
Trang 18


Làm trơn (smoothing) được hoàn tất đầu tiên, tiếp theo là tất cả các quá
trình duyệt qua ảnh của các góc nhọn quan trọng. Cuối cùng là các bước làm
mảnh ảnh. Hình 3.7 trình bày các xương kết quả cuối cùng của các kí tự trong
hình 3.5 khi các bước tiền xử lý được gộp vào.


Hình 3.7:
Những kí tự được làm mảnh cuối cùng, sau cả hai bước tiền xử lý
và làm mảnh.
Hầu hết các xương xuất hiện khi sử dụng phương pháp này vẫn bị rạn
nứt. Cách sử dụng 3 giai đoạn của các góc nhọn quan trọng sẽ không hiệu quả
đối với các kí tự rất dày, và các mẫu không phù hợp với tất cả các tình huống
mà có thể gây ra cổ cột và đuôi cột. Cũng như vậy, bước làm trơn sẽ không bắt
gặp các bất quy tắc mà các bất quy tắc này có thể tạo nên các đưòng xơ.
Thuật toán làm mảnh song song Zhang-Suen (Zhang 1984): Thuật toán
được ngắt thành hai vòng lặp con để thay thế, ví dụ: thay vì 4 vòng lặp con của
thuật toán Stentiford. Trong một vòng lặp con, một điểm ảnh I(i, j) được xoá
(hay được đánh dấu cho thao tác xoá bỏ) nếu 4 điều kiện sau đây được thoả
mãn:
1) Giá trị liên kết là 1.
2) Nó có ít nhất 2 điểm láng giềng đen và không nhiều hơn 6.
3) Có ít nhất một trong các điểm: I(i, j+1), I(i-1, j) và I(i, j-1) là nền
4) ít nhất một trong các điểm: I(i-1, j), I(i+1, j) và I(i, j-1) là điểm ảnh nền.
Tại cuối vòng lặp con này các điểm đã đánh dấu được xoá bỏ.
Trang 19



Vòng lặp con tiếp theo sau làm tương tự ngoại trừ bước 3 và 4.
1) Ít nhất một trong các điểm: I(i-1, j), I(i, j+1), và I(i+1, j) là nền (trắng).
2) Ít nhất một trong các điểm: I(i, j+1), I(i+1, j) và I(i, j-1) là nền.
Trở lại, bất kỳ điểm ảnh nào đã đánh dấu đều được xoá bỏ.
Nếu ở cuối vòng lặp con khác không có điểm nào được xoá thì xương hoàn
toàn được xác định và chương trình kết thúc.
Hình 3.8 trình bày các xương đã được tìm bằng thuật toán Zhang-Suen áp
dụng cho 4 ảnh :


Hình 3.8:
Các xương tạo ra bởi thuật toán làm mảnh Zhang-Suen khi áp dụng
kiểm tra ảnh hình 3.5
Một cải tiến (nâng cao) của thuật toán đã được đề xuất (bởi Holt 1987) nó
nhanh hơn và không liên quan đến các vòng lặp con.
Đầu tiên 2 vòng lặp con được viết như một biểu thức logic sử dụng 3x3
điểm láng giềng về điểm ảnh quan tâm. Vòng lặp con ở trên có thể được viết như sau:
v(C)
^
(~edge(C) v (v(E)
^
v(S)
^
(v(N) v v(W)))) (EQ 3.2)
Đó là điều kiện dưới cho điểm trung tâm C tồn tại trong vòng lặp con đầu
tiên. Hàm v cho giá trị của điểm ảnh (1 = đúng, đối với điểm ảnh thuộc đối
tượng, 0 = sai, đối với các điểm ảnh nền), và hàm cạnh (edge function) là đúng
nếu điểm trung tâm C nằm trên biên của đối tượng, sự tương xứng (đối xứng)
này có giữa 2 và 6 láng giềng và giá trị kết nối (liên kết) =1. Các kí tự E, S, N

Trang 20


và W tương xứng với các điểm ảnh theo một hướng từ điểm ảnh trung tâm C: E
nghĩa là hướng đông (tương ứng với điểm ảnh I(i, j+1)), S nghĩa là hướng nam
(tương ứng với điểm ảnh I(i+1, j)), v.v
Vòng lặp con thứ 2 được viết như sau:
v(C)
^
(~edge(C) v (v(W)
^
v(N)
^
(v(S) v v(E)))) (EQ 3.3)
Holt và nhóm của ông đã kết hợp 2 biểu thức 3.2 và 3.3 với một điều kiện
kết nối bảo toàn (cần thiết cho việc thực hiện tính toán song song) và đưa ra
các biểu thức đơn dưới đây cho các điểm ảnh còn lại:
v(C)
^
(~edge(C) v
(edge(E)
^
v(N)
^
v(S)) v
(edge(S)
^
v(W)
^
v(E)) v

(edge(E) ^ edge(SE) ^ edge(S))

Biểu thức này không phải là phức tạp như nó minh hoạ, các hàm v chỉ đơn
giản là các giá trị điểm ảnh và hàm cạnh chỉ phức tạp gần như hàm kết nối (liên
kết) sử dụng trong thuật toán Stentiford.
Đôi khi, khi quá trình làm mảnh hoàn thành vẫn có các điểm ảnh mà chúng
có thể bị xoá bỏ (những điểm ảnh có dạng hình bậc thang (staircase), một nửa
các điểm ảnh trong hình bậc thang đó có thể được xoá bỏ, mà không có sự kết
nối của đối tượng tổng thể). Về cơ bản, điểm ảnh trung tâm của một trong các
cửa sổ dưới đây có thể được xoá bỏ:
0 1 x x 1 0 0 x x x x 0
1 1 x x 1 1 x 1 1 1 1 x
x x 0 0 x x x 1 0 0 1 x
Trang 21


Để tránh tạo ra một lỗ hổng mới, đơn giản chúng ta bổ sung thêm một điều
kiện mà một trong các giá trị x = 0.
Đối với các cửa sổ có đường chéo hướng bắc (2 cửa sổ đầu tiên), biểu thức
cho sự tồn tại 1 điểm ảnh trong việc lặp lại thao tác xoá những điểm ảnh bậc
thang (staircase removal) là:
v(C)
^
~( v(N) ^
((v(E)
^
~v(NE)
^
~v(SW)
^

(~v(W) v ~v(S)) v
(v(W)
^
~v(NW)
^
~v(SE)
^
(~v(E) v ~v(S))))))

Quá trình duyệt ảnh có đường chéo hướng nam tương tự như vậy, nhưng
với chuyển đổi bắc và nam.



Hình 3.9:
Các phép biến đổi trên thuật toán làm mảnh Zhang-Suen.
a)Ảnh gốc; b) Làm mảnh theo thuật toán chuẩn; c) Làm mảnh của Holt;
d) Phép biến đổi của Holt cộng với xoá bậc thang.
Hình 3.10 trình bày kết quả việc áp dụng phương pháp này vào 4 ảnh kiểm
tra mà chúng ta đã sử dụng.

Hình 3.10: Các kết quả từ thuật toán của Holt với xoá bậc thang áp dụng
cho ảnh kiểm tra chuẩn.
Trang 22


Nếu tốc độ là vấn đề cần quan tâm đến thì việc cải tiến thuật toán Holt
của Zhang-Suen là thuật toán tốt. Mặt khác, nếu chất lượng của xương là vấn
đề quan trọng bậc nhất thì đó là một sự kết hợp của 3 phương pháp theo thứ tự:
Phương pháp tiền xử lý của Stentiford cung cấp các ảnh cho thuật toán cơ bản

Zhang-Suen, với thuật toán xoá bậc thang (staircase-removal) của Holt như là
một quá trình hậu xử lý. Các xương tốt nhất có thể thấy trong hình 3.11.



Hình 3.11:
Các xương đạt được từ việc sử dụng các bước tiền xử lý
Stentiford phối hợp với thuật toán làm mảnh Zhang-Suen và thủ tục xoá bậc
thang của Holt.
3.3 Phân rã các phần tử cấu trúc hình thái nhị phân có hình dạng tùy
ý sử dụng thuật toán di truyền.
Trên các hệ thống tuần tự, việc sử dụng phần tử cấu trúc (SE) lớn là
không có hiệu quả, việc phân rã SE thành các nhân tử như là một chuỗi có hơn
một phép dãn sẽ làm giảm đi được độ phức tạp tính toán. Và trên hệ thống tế
bào SIMD chỉ cho phép thực hịên các phép toán cơ sở dựa trên lân cận
nhỏ hơn
kích thước của phần tử cấu trúc; trên hệ thống này việc phân rã SE thành chuỗi
các phép toán đơn giản hơn thuộc tập chỉ dẫn (Struction Set SI ) thường dựa
trên việc sử dụng các phần tử cấu trúc 3x3 là điều bắt buộc.
Vấn đề đặt ra là phân rã SE như thế nào là tối ưu?.
Trang 23


Luận văn này đề cập đến vấn đề tiếp cận ngẫu nhiên dựa trên thuật toán
di truyền: Bắt đầu từ một tập quần thể (các cá thể) của các lời giải có khả năng
được xác định thông qua thuật toán vét cạn, một quá trình lặp biến đổi các cá
thể hiện tại và/hoặc tạo ra các cá thể mới phù hợp với tập các toán tử di truyền
được áp dụng một cách ngẫu nhiên. Các cá thể tối thiểu hoá hàm giá có xu
hướng thay thế các cá thể khác và sau một số bước lặp đủ lớn, thì thuật toán có
xu hướng hội tụ tới lời giải tối ưu. Mục đích chính của công việc này chính là

để phát triển công cụ có thể cho câu trả lời sơ bộ về vấn đề phân rã tối ưu của
tập các phần tử cấu trúc không lồi thành chuỗi các phép toán cơ sở.
CHƯƠNG IV: CÀI ĐẶT CHƯƠNG TRÌNH THỬ NGHIỆM
Chương trình thử nghiệm được cài đặt bằng ngôn ngữ Visual C++ 6.0
gồm các chức năng:
- Nhập các ảnh dạng .PBM
- Minh hoạ một cách chi tiết thao tác hình thái học cụ thể đó là: Các thao
tác co, dãn ảnh, closing, opening
- Tìm xương để làm mảnh bằng cách sử dụng thuật toán stentiford cùng
với nhũng cải tiến của thuật toán nhằm làm mảnh đối tượng ảnh một cách tốt
hơn.

Trang 24


KẾT LUẬN
Luận văn đã trình bày về các phép toán hình thái học, kỹ thuật tìm xương
của ảnh. Kết hợp các phép toán hình thái với làm mảnh để nâng cao chất lượng
ảnh. Các phép toán hình thái tỏ ra rất hữu hiệu trong cải thiện ảnh, tuy nhiên nó
hoàn toàn phụ thuộc vào mẫu ban đầu. Do đó luận văn cũng trình bày phương
pháp phân rã phân tử cấu trúc hình dạng tuỳ ý sử dụng thuật toán di truyền để
lựa chọn phân tử cấu trúc tối ưu cho các phép toán hình thái.
Trang 25


Tài liệu tham khảo
Tiếng Việt
1. Đỗ Năng Toàn, Ngô Quốc Tạo (1993), Kết hợp các phép toán hình thái học
và làm mảnh để nâng cao chất lượng ảnh đường nét. Tạp chí Tin học và
Điều khiển học, t.14, s.3, tr.23-29.

2. Hoàng kiếm - Lê Hoàng Thái (2001) Thuật giải di truyền: Cách giải tự
nhiên các bài toán trên máy tính;NXB Giáo Dục.
3. Lương Mạnh Bá, Nguyễn Thanh Thủy (1999), Nhập môn xử lý ảnh số; tr.
7-15; NXB Khoa Học Kỹ Thuật.
4. Ngô Quốc Tạo (2002) Tập bài giảng Xử Lý ảnh cho cao học chất lượng
cao, Khoa Công nghệ, ĐHQG.
Tiếng Anh

5. A. Broggi, “Speeding-Up Mathematic Morphology Computation With
Special-Pupose Array Processor. “Proc. 27
th
Hawaii Int'l Conf. System
Sciences, T.N. Mudge and B.D. Shriver, eds., vol.1,pp. 321-330, Maui,
Hawaii, Jan 4-7 1994. Los Alamitos, Calif.: IEEE Computer Society.
6. James R. Parker (1997), Algorithms for image processing and computer
vision, pp 69- 101, pp 177- 188.
7. J. Serra, Image Analyst and Mathematical Morphology; London: Academic
Press, 1982.
8. G.Anelli, A. Broggi and G.Destri (1998), Decomposition of Arbitrarily
Shaped Binary Morphology Structurting Elements Using Genetic
Algorithms; IEEE Transactions on Pattern Analysis and Machine
Intelligence; Vol 20, pp 217-224.

×