Phần 1 TỔNG QUAN VỀ BIÊN VÀ CÁC PHƯƠNG
PHÁP PHÁT HIỆN BIÊN
1.1. Vị trí của biên trong phân tích ảnh
Phân tích ảnh là một qua trình gồm nhiều giai đoạn. Đầu tiên là giai
đoạn tiền xử lý ảnh. Sau giai đoạn này, ảnh được tăng cường hay được
khôi phục đề làm nồi các đặc tính ( feature extraction ), tiếp theo là phân
đoạn ảnh (segmentation) thành các phần tử. Thí dụ, như phân đoạn
dựa theo biên, dựa theo vùng,… Và tuỳ theo các ứng dựng, giai đoạn
tiếp theo có thể là nhận dạng ảnh ( phân thành các lớp có miêu tả) hay
là giải thích và miêu tả ảnh. Hình 1.1 mô tả tóm lược các bước của quá
trình phân tích ảnh:
Trích chọn đặc tính
Phân đoạn
Phân loại
Giải thích
Ảnh đầu ra của
quá trình tiền XL
Hình 1.1. Các bước trong phân tích ảnh
Các đặc trưng của ảnh thường gồm: mật độ xám, phân bổ xác xuất,
phân bồ không gian, biên ảnh. Các kỹ thuật phân đoạn ảnh chủ yếu dựa
vào biên.
Do đó, biên có tầm quan trọng đặc biệt trong qua trình phân
tích ảnh.
1.2. Biên và các kỹ thuật dò biên
Trong phần này chúng ta sẽ đề cập đến một số nội dung: khái
niệm về biên, phân loại các phương pháp phát hiện biên và qui trình
phát hiện biên.
1.2.1. Khái niệm về biên
Biên là một vấn đề chủ yếu trong phân tích ảnh vì các kỹ thuật
phân đoạn ảnh chủ yếu dựa vào biên.
Một điểm ảnh có thể coi là điểm biên nếu ở đó có sự thay đổi đột
ngột về mức xám. Tập hợp các điểm biên tạo thành biên hay đường bao
ảnh của ảnh (boundary).
Thí dụ, trong một ảnh nhị phân, một điểm có thể gọi là biên nếu
đó là điểm đen và có ít nhất một điểm trắng là lân cận.
Để hình dung tầm quan trọng của biên ta xét ví dụ sau: Khi người
hoạ sĩ vẽ một cái bàn gỗ, chỉ cần vài nét phác thảo về hình dáng như cái
mặt bàn, chân bàn mà không cần thêm các chi tiết khác, người xem đã
có thể nhận ra nó là một cái bàn. nếu ứng dụng của ta là phân lớp nhận
diện đối tượng, thì coi như nhiệm vụ đã hoàn thành. Tuy nhiên nếu đòi
hỏi thêm về các chi tiết khác như vân gỗ hay màu sắc,…thì với chừng
ấy thông tin là chưa đủ.
Nhìn chung về mặt toán học người ta coi điểm biên của ảnh là
điểm có sự biến đổi đột ngột về độ xám.Như vậy phát hiện biên một
cách lý tưởng là xác định được tất cả các đường bao trong các đối
tượng. Định nghĩa toán học của biên ở trên là cơ sở cho các kỹ thuật
phát hiện biên. Điều quan trọng là sự biến thiên mức xám giữa các ảnh
trong một vùng thường là nhỏ, trong khi đó biến thiên mức xám của
điểm vùng giáp ranh (khi qua biên) lại khá lớn.
1.2.2. Phân loại các kỹ thuật phát hiện biên
Xuất phát từ định nghĩa toán học của biên người ta thường sử
dụng 2 phương pháp phát hiện biên sau:
1.2.2.1.Phương pháp phát hiện biên trực tiếp:
Phương pháp này nhằm làm nổi biên dựa vào sự biến thiên về giá trị
độ sáng của điểm ảnh. kỹ thuật chủ yếu dùng phát hiện biên ở đây là kỹ
thuật đạo hàm. Nếu lấy đạo hàm bậc nhất của ảnh ta có phương pháp
Gradient; nếu lấy đạo hàm bậc hai ta có kỹ thuật Laplace. Hai phương
pháp trên được gọi là phương pháp dò biên cục bộ. ngoài ra người ta
còn sử dụng phương pháp “đii theo đường bao”: dựa vào nguyên lý qui
hoạch hoạt động và được gọi là phương pháp dò biên tổng thể.
1.2.2.2.Phương pháp gián tiếp:
Nếu bằng cách nào đấy , ta phân được ảnh thành các vùng thì
đường phân ranh giữa các vùng đó chính là biên. việc phân vùng ảnh
thường dựa vào kết cấu (texture) bề mặt của ảnh.
Cũng cần lưu ý rằng, kỹ thuật dò biên và phân vùng ảnh là hai bài
toán đối ngẫu của nhau. Thực vậy, dò biên để thực hiện phân lớp đối
tượng và một khi đã phân lớp xong có nghĩa là đã phân vùng được ảnh.
Và ngược lại, khi phân vùng, ảnh đã phân lập được thành các đối
tượng, ta có thể phát hiện được biên. Phương pháp dò biên trực tiếp tỏ
ra khá hiệu quả vì ít chịu ảnh hưởng của nhiễu. song nếu sự biến thiên
độ sáng không đột ngột, phương pháp này lại kém hiệu quả. Phương
pháp dò biên gián tiếp tuy có khó cài đặt song lại áp dụng khá tốt khi sự
biến thiên độ sáng nhỏ.
1.2.3. Qui trình phát hiện biên trực tiếp
b1) Khử nhiễu ảnh
Vì ảnh thu nhận thường có nhiễu, nên bước đầu tiên là phải khử
nhiễu. việc khử nhiễu được thực hiện bằng các kỹ thuật khử nhiễu khác
nhau.
b2) Làm nổi biên
Tiếp theo là làm nổi biên bởi các toán tử đạo hàm
b3) Định vị điểm biên
Vì các kỹ thuật làm nổi biên có hiệu ứng phụ là tăng nhiễu , do
vậy sẽ có một số điểm biên giả cần loại bỏ.
b4) liên kết và trích chọn biên.
Như đã nói, phát hiện biên và phân vùng ảnh là một bài toán đối
ngẫu. vì thế cũng có thể phát hiện biên thông qua việc phân vùng ảnh.
1.3. Một số phương pháp phát hiện biên cục bộ
1.3.1. Phương pháp gradient
Phương pháp gradient là phương pháp dò biên cục bộ dựa vào
cực đạii của đạo hàm. Theo định nghĩa, gradient là một véctơ có các
thành phần biểu thị tốc độ thay đổi giá trị của điểm ảnh theo hai hướng x
và y . các thành phần của gradient được tính bởi:
df(x,y)
= fx
≈
f(x+dx,y) – f(x,y)
dx dx
df(x,y)
= fy
≈
f(x,y+dy) – f(x,y)
dy dy
với dx là khoảng cách giữa các điểm theo hướng x ( khoảng các tính
bằng số điểm) và tương tự với dy. Trên thực tế, người ta hay dùng với
dx = dy = 1
Trong kỹ thuật gradient, người ta chia thành 2 kỹ thuật (do dùng 2
toán tử khác nhau): kỹ thuật gradient và kỹ thuật la bàn. kỹ thuật
gradient dùng toán tử gradient lấy đạo hàm theo hai hướng; còn kỹ
thuật la bàn lấy đạo hàm theo 8 hướng chính: Bắc, Nam, Đông ,Tây và
Đông Bắc, Tây Bắc, Đông Nam, Tây Nam.
1.3.1.1.Kỹ thuật gradient
Kỹ thuật này sử dụng một cặp mặt nạ H
1
và H
2
trực giao ( theo 2
hướng vuông góc). Nếu định nghĩa g
1
,g
2
là gradient tương ứng theo 2
hướng x và y, thì biên độ của gradient, ký hiệu là g tại điểm (m,n) được
tính theo công thức:
A
0
= g(m,n) = √ g²
1
(m,n) +
g
2
2
(m,n)
(1.2)
θ
r
(m,n) = tan
-1
g
2
(m,n)/ g
1
(m,n) (1.3)
Chú ý: để giảm tính toán, công thức 1-2 được tính gần đúng bởi:
A
0
= | g
1
(m,n) | + | g
2
(m,n) |
Các toán tử đạo hàm được áp dụng là khá nhiều. ở đây ta chỉ xét
một số toán tử tiêu biểu: toán tử Robert, Sobel, Prewitt…
Trước tiên chúng ta xét toán tử Robert. Toán tử này do Robert đề
xuất vào năm 1965. Nó áp dụng trực tiếp của các công thức đạo hàm tại
điểm (x,y). với mỗi điểm ảnh I(x,y) của I, đạo hàm theo x, theo y được ký
hiệu tương ứng bởi g
x
, g
y
được tính:
g
x
= I(x +1,y) – I(x,y)
g
y
=I(x,y+1) – I(x,y)
điều này tương đương với việc chập ảnh với 2 mặt nạ H
1
và H
2
:
H
1
=
0 1
H
2
=
-1 0
-1 0 0 -1
Ta gọi H
1
,H
2
là mặt nạ Robert.
Trong trường hợp tổng quát, giá trị gradient biên độ g và gradient
hướng θ
r
được tính bởi công thức 1.2 và 1.3. Thường để giảm thời gian
tính toán, người ta còn tính gradient theo các chuẩn sau:
A
1
= | g
1
(m,n) + g
2
(m,n) |
hoặc
A
2
= max( | g
1
(m,n) | , | g
2
(m,n) |)
Cần lưu ý rằng, do lạm dụng về ngôn từ, tuy ta lấy đạo hàm của
ảnh nhưng thực ra chỉ là mô phỏng và xấp xỉ đạo hàm bằng kỹ thuật
nhân chập do ảnh số là tín hiệu rời rạc, do vậy đạo hàm không tồn tại.
Trong kỹ thuật Sobel và prewtt người ta sử dụng 2 mặt nạ:
H1 =
-1 0 1
H2 =
-1 -1 -1
-1 0 1 0 0 0
-1 0 1 1 0 1
Ngang (hướng x) Dọc(hướng y)
a) mặt nạ Sobel
H1 =
-1 0 1
H2 =
-1 -2 -1
-2 0 2 0 0 0
-1 0 1 1 2 1
Ngang (hướng x) Dọc(hướng y)
b) mặt nạ Prewitt
H
1
=
-1 0 1
H
2
=
-1 -
2
-1
-
2
0
2
0 0 0
-1 0 1
1
2
1
Ngang (hướng x) Dọc(hướng y)
c) mặt nạ đẳng hướng (Isometric)
Gradient được tính xấp xỉ công thức
Gx=Hx
⊗
I và Gy=Hy
⊗
I (Hx nhân chập với I, Hy nhân chập với I)
Thực tế cho thấy rằng các toán tử Sobel và Prewitt tốt hơn toán tử
Sobel bởi chúng ít nhậy cảm với nhiễu.
1.3.1.2.Kỹ thuật La bàn
Về phương pháp kỹ thuật này tương tự kỹ thuật Gradient. Tuy
nhiên,điểm khác, kỹ thuật Gradient chỉ lấy đạo hàm theo 2 hướng. còn
kỹ thuật la bàn lấy đạo hàm theo 8 hướng chính: Bắc, Nam, Đông ,Tây
và Đông Bắc, Tây Bắc, Đông Nam, Tây Nam. Bằng cách sử dụng 8 mặt
nạ cho 8 hướng khác nhau.
1.3.2. Phương pháp Laplace
Các phương pháp đánh giá Gradient ở trên làm việc khá tốt khi
mà độ sáng thay đổi rõ nét. Khi mức sáng thay đổi chậm, miền chuyển
tiếp trải rộng, phương pháp cho hiệu quả hơn đó là sử dụng phương
pháp đạo hàm bậc hai gọi là phương pháp Laplace. Kết quả nghiên cứu
cho thấy phương pháp Gradient rất nhậy cảm với nhiễu và thường tạo