Tải bản đầy đủ (.pdf) (85 trang)

Phương pháp phát hiện biên ảnh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.61 MB, 85 trang )



ĐẠI HỌC CÔNG NGHỆ
ĐẠI HỌC QUỐC GIA HÀ NỘI



ĐẶNG QUANG HUY




PHƯƠNG PHÁP PHÁT HIỆN BIÊN ẢNH




LUẬN VĂN THS CÔNG NGHỆ THÔNG TIN





Người hướng dẫn PGS.TS Ngô Quốc Tạo




Hà Nội 2007

1


MỤC LỤC
LỜI CẢM ƠN 3
DANH MỤC CÁC CHỮ CÁI VIẾT TẮT 4
DANH MỤC CÁC BẢNG 5
DANH MỤC CÁC HÌNH VẼ 6
MỞ ĐẦU 8 U
CHƯƠNG 1 - TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ BIÊN 10
1.1. TỔNG QUAN VỀ XỬ LÝ ẢNH 10
1.2. BIÊN VÀ ỨNG DỤNG. 11
1.2.1. Biên và các phương pháp phát hiện biên cơ bản 11
1.2.2. Một số khái niệm về biên 14
1.2.3. Ứng dụng của biên 15
CHƯƠNG 2 - NHỮNG PHƯƠNG PHÁP PHÁT HIỆN BIÊN 17
2.1. PHƯƠNG PHÁP TUYẾN TÍNH 17
2.1.1. Phương pháp đạo hàm bậc nhất Gradient 17
2.1.2. Phương pháp đạo hàm bậc hai Laplace 35
2.1.3. Phát hiện biên thích ứng 48
2.1.4. Đánh giá phương pháp tuyến tính. 51
2.2. PHƯƠNG PHÁP PHI TUYẾN 52
2.2.1. Phát hiện biên hình chóp. 52
2.2.2. Phương pháp Sobel 53
2.2.3. Toán tử la bàn Kirsch 54
2.2.4. Đánh giá nhận xét phương pháp phi tuyến 55
2.3. PHƯƠNG PHÁP NÂNG CAO 57
2.3.1. Phương pháp Canny 58
2.3.2. Phương pháp Shen - Castan 66
CHƯƠNG 3 - PHÁT HIỆN BIÊN DỰA VÀO WAVELET 71


2

3.1. PHƯƠNG PHÁP PHÁT HIỆN BIÊN 71
3.2. SỬ DỤNG WAVELET ĐỂ PHÁT HIỆN BIÊN 72
3.3. KẾT QUẢ SO SÁNH 78
KẾT LUẬN 83
TÀI LIỆU THAM KHẢO 84


4
DANH MỤC CÁC CHỮ CÁI VIẾT TẮT
Kí hiệu Giải thích
BLI Ảnh nhị phân
DOG Toán tử Gaussian khác
DWT Biến đổi Wavelet rời rạc
FDOG Toán tử đạo hàm bậc một Gaussian
ISEF Bộ lọc mũ đối xứng vô hạn
LOC Hàm định vị
LOG Laplace của Gaussian
SNR Tỉ số tín hiệu nhiễu


5
DANH MỤC CÁC BẢNG

Bảng 2-1: Bảng cung cấp các ngưỡng tối ưu 33
Bảng 2-2: Bảng đánh giá phương pháp Sobel 55
Bảng 2-3: Bảng đánh giá phương pháp la bàn 56
Bảng 3-1: Bảng giá trị trung bình của các phương pháp 80




6
DANH MỤC CÁC HÌNH VẼ
Hình 1-1: Quá trình xử lý ảnh 10
Hình 1-2: Các bước cơ bản trong một hệ thống xử lý ảnh 11
Hình 1-3: Tập ảnh để đánh giá các phương pháp 16
Hình 2-1: Mô hình biên 18
Hình 2-2: Chênh lệch Gradient của ảnh quả ớt 19
Hình 2-3: Gradient của ảnh quả ớt 20
Hình 2-4: Toán tử hướng phát hiện biên với quy ước 3x3 21
Hình 2-5: Gradient Prewitt, Sobel và Frei Chen với ảnh quả ớt 22
Hình 2-6: Mảng 3x3 thúc đẩy trả lại toán tử biên Gradient trực giao khác 23
Hình 2-7: Boxcar, Kim tự tháp, Argyle, Macleod và FDOG với ảnh quả ớt. 25
Hình 2-9: Ma trận đáp ứng mẫu Gradient 3x3 29
Hình 2-10: Hình ảnh quả ớt cho bốn toán tử Gradient mẫu 3x3. 30
Hình 2-11: Các mật độ xác suất điều kiện Gradient biên điển hình 31
Hình 2-12: Lấy ngưỡng trong phương pháp Sobel 35
Hình 2-13: Hình ảnh làm mảnh bản đồ biên của những quả ớt 36
Hình 2-14: Các đáp ứng của ảnh quả ớt ngọt 39
Hình 2-15: Vùng Laplace theo phép lấy Gaussian 40
Hình 2-16: Các mẫu Laplace đổi dấu 41
Hình 2-17: Mảng đáp ứng xung tương ứng 3x3 với Chebyshev. 46
Hình 2-18: Các đáp ứng Chebtshev cho ảnh Ớt ngọt đơn sắc 48
Hình 2-19: Trùng khớp biên theo một chiều và hai chiều. 49
Hình 2-20: Mô hình biên toán học tiếp tuyến 50
Hình 2-21: Kết quả áp dụng phương pháp Sobel và la bàn Kirsch. 57
Hình 2-22: Quá trình nonmax-suppress (lọc các điểm biên) 62
Hình 2-23: Các bước khác nhau trong quá trình xử lý bàn cờ 64
Hình 2-24: Quá trình phân ngưỡng trễ 65



7
Hinh 2-25: So sánh tương quan giữa hai phương pháp Canny và Shen-Castan.
70

Hình 3-1: Biên của ảnh cái hộp 71
Hình 3-2: Xác định biên của con chó nằm trên bậc thang 72
Hình 3-3: Biên ảnh của Filopodia 72
Hình 3-4: Dùng DWT cho biến đổi Neurite. 73
Hình 3-5: Đặc điểm thấy được ở một hộp đơn. 75
Hình 3-6: Các đặc điểm thấy được từ ảnh con chó nằm ở bậc thang. 75
Hình 3-7: Sử dụng 3 trong 5 tiêu chuẩn cho ảnh con chó nằm bậc thang. 76
Hình 3-8: Sử dụng 3 tiêu chuẩn cho ảnh của Filopodia 76
Hình 3-9: Sử dụng tự liên kết trong ảnh hộp đơn. 77
Hình 3-10: Sử dụng tự liên kết trong ảnh con chó nằm bậc thang. 77
Hình 3-11: Sử dụng tự liên kết trong của Filopodia. 77
Hình 3-12: Đường biên được tìm thấy 81
Hình 3-13: Khoảng cánh từ tâm biên 81



8
MỞ ĐẦU

Ngày nay, với sự phát triển mạnh mẽ của mọi lĩnh vực khoa học, kinh
tế, xã hội v.v… việc ứng dụng Công nghệ Thông tin vào tất cả các lĩnh vực đã
đem lại hiệu quả cao. Ở nước ta, ngành Công nghệ Thông tin tuy mới được hội
nhập nhưng tốc độ phát triển khá nhanh và ngày càng được ứng dụng rộng
trong nhiều lĩnh vực của nền kinh tế, góp phần thúc đẩy sự phát triển của xã
hội. Một trong những lĩnh vực có nhiều ứng dụng trong thực tiễn đó là Xử Lý
ảnh.

Xử lý hình ảnh là khâu quan trọng trong việc trao đổi thông tin giữa
người và máy. Theo thống kê cho thấy thì có khoảng 79% thông tin mà con
người thu nhận được bằng thị giác là qua hình ảnh. Xử lý ảnh đã góp phần
quan trọng cho việc quan sát trở nên tốt hơn.
Có nhiều ứng dụng cần tới các thông tin hình ảnh như: Xử lý ảnh trong
hệ thống thông tin văn phòng, trong quân sự, trong quảng cáo, trong thăm dò
địa chất, vẽ bản đồ, trong các cửa hàng siêu thị, trong hoạt hình
Trong xử lý ảnh, việc nhận dạng và phân lớp các đối tượng đòi hỏi rất
nhiều các quá trình và thao tác khác nhau, nhưng thông dụng hơn vẫn là quá
trình dò tìm biên ảnh. Cùng với sự phát triển của ngành Công nghệ Thông tin,
xử lý ảnh ngày càng được áp dụng rộng trong nhiều lĩnh vực thì dò tìm biên
càng trở thành một công cụ cần thiết hơn.
Phát hiện biên là quá trình định vị các điểm trong khi làm nổi biên, hay
nó làm tăng độ tương phản giữa các vùng và nền cho đến khi biên đó có thể
thấy được một cách dễ dàng. Mặc dù có nhiều phưng pháp nhưng nói chung
tất cả các phương pháp đều thiết lập giá trị của điểm ảnh vào một mức xám
nhất định (cùng màu) để có thể nhận ra chúng dễ dàng. Kết quả là từ các
phương pháp này ta thu được tập hợp đại diện cho các đối tượng. Dựa vào các
tập hợp, các thao tác của xử lý ảnh như: tính kích thước của đối tượng, nhận


9
dạng, phân lớp các đối tượng có thể được thực hiện. Trước đây, các phương
pháp tìm biên thường sử dụng những toán tử đơn giản để thực hiện việc phát
hiện biên.
Hiện nay, các phương pháp phát hiện biên hiện đại được xây dựng trên
cơ sở phân tích lý thuyết một cách chặt chẽ nhiễu được đưa vào trong mô hình
của bài toán. Cách phát hiện ra các điểm biên ảnh không còn đơn giản như
trước nữa mà sử dụng một loạt phưng pháp phức tạp như loại trừ điểm không
cực đại, phù hợp Gradient,

Luận văn được trình bày trong ba chương chính. Chương 1 nêu tổng
quan về biên và xử lý ảnh, chương 2 nêu một số phương pháp phát hiện biên
và chương 3 nêu ra việc áp dụng Wavelet cho việc phát hiện biên. Nội dung
chi tiết các chương được trình bày chi tiết ở những phần tiếp theo.

















10
CHƯƠNG 1 - TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ BIÊN
Trong chương này, chúng ta tìm hiểu những khái niệm, thuật ngữ cơ
bản được sử dụng trong xử lý ảnh cũng như dùng trong luận văn này.
1.1. TỔNG QUAN VỀ XỬ LÝ ẢNH
Xử lý ảnh (Image Processing) là đối tượng nghiên cứu của lĩnh vực thị
giác máy, là quá trình biến đổi ảnh từ một ảnh ban đầu sang một ảnh mới với
các đặc tính mà tuân theo ý muốn của việc xử lý. Xử lý ảnh có thể là quá trình
phân tích, phân lớp các đối tượng làm tăng chất lượng ảnh, phân đoạn và tìm

cạnh, gán nhãn cho vùng hay quá trình biên dịch các thông tin hình ảnh của
ảnh.
Cũng như xử lý dữ liệu bằng đồ hoạ, xử lý ảnh số là một lĩnh vực của
tin học ứng dụng. Xử lý dữ liệu bằng đồ hoạ đề cập đến những ảnh nhân tạo,
các ảnh này được xem xét như là một cấu trúc dữ liệu và được tạo bởi các
chương trình. Xử lý ảnh số bao gồm các phương pháp và kỹ thuật để biến đổi,
để truyền tải hoặc mã hoá các ảnh tự nhiên. Như vậy mục đích của xử lý ảnh
bao gồm:
+ Biến đổi ảnh, làm đẹp ảnh.
+ Tự động nhận dạng ảnh, đoán nhận ảnh và đánh giá các nội dung của ảnh.

Xử lý ảnh
Ảnh
“Tốt hơn”
Kết luận
Ảnh



Hình 1-1: Quá trình xử lý ảnh
Ảnh trong xử lý có thể xem như ảnh n chiều. Bởi vì, ảnh có thể xem là
tập hợp các điểm ảnh. Trong đó, mỗi điểm ảnh được xem như là đặc trưng


11
cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của đối tượng
trong không gian và do đó nó có thể xem như một hàm n biến P(c
1
, c
2

, , c
n
).
Sơ đồ tổng quát của một hệ thống xử lý ảnh:


Hình 1-2: Các bước cơ bản trong một hệ thống xử lý ảnh

1.1.1. Thu nhận ảnh: Ảnh có thể nhận được qua quá trình thu nhận, thường là
các thiết bị thu nhận tín hiệu tương tự (nhưng cũng có thể các thiết bị
thu nhận số), sau đó tín hiệu này sẽ được số hóa trước khi chuyển sang
giai đoạn xử lý hoặc lưu trữ lại.
1.1.2. Tiền xử lý: Dùng những kỹ thuật xử lý ảnh làm cho ảnh tốt hơn theo
mục đích của người sử dụng trước khi đưa ra xử lý, tùy thuộc vào quá
trình xử lý tiếp theo trong giai đoạn này sẽ thực hiện các công đoạn
khác nhau như: Xóa nhiễu, nổi biên, nắn chỉnh hình học, vv
1.1.3. Trích lọc đặc điểm: Các đặc điểm của đối tượng được trích chọn tùy
theo mục đích nhận dạng các đối tượng ảnh chính xác, với tốc độ tính
toán cao và dung lượng nhớ lưu trữ giảm.
1.1.4. Đối sánh, nhận dạng: Nhận dạng tự động, mô tả đối tượng, phân loại
và phân nhóm các mẫu là những vấn đề quan trọng trong thị giác máy.
Khi biết một mẫu nào đó, để nhận dạng và phân loại mẫu đó.

1.2. BIÊN VÀ ỨNG DỤNG.
1.2.1. Biên và các phương pháp phát hiện biên cơ bản.
Biên là vấn đề quan trọng trong xử lý ảnh, vì các đặc điểm được trích
chọn trong quá trình phân tích ảnh chủ yếu dựa vào biên. Muốn nhận dạng
Thu nhận
ảnh
Tiền

xử lý
Trích chọn
đặc điểm
Hậu
xử lý
Đối sánh rút
ra kết luận


12
được các đối tượng trước hết phải tìm đường biên của các đối tượng, đa số
các hệ nhận dạng đều dùng đến biên.
Một điểm được gọi là điểm biên nếu ở đó có sự thay đổi đột ngột về
mức xám. Thông thường hay sử dụng hai phương pháp phát hiện cơ bản:
“Phương pháp trực tiếp” và “Phương pháp gián tiếp”.
Phát hiện biên trực tiếp: Phương pháp này làm nổi biên dựa vào sự
biến thiên mức xám của ảnh. Kỹ thuật chủ yếu dùng để phát hiện biên ở đây
là dựa vào sự biến đổi theo hướng. Nếu lấy đạo hàm bậc nhất của ảnh ta có kỹ
thuật Gradient, nếu lấy đạo hàm bậc hai của ảnh ta có kỹ thuật Laplace.
Phát hiện biên gián tiếp: Nếu bằng cách nào đó ta phân được ảnh
thành các vùng thì ranh giới giữa các vùng đó gọi là biên. Kỹ thuật dò biên và
phân vùng ảnh là hai bài toán đối ngẫu nhau vì dò biên để thực hiện phân lớp
đối tượng mà khi đã phân lớp xong nghĩa là đã phân vùng được ảnh và ngược
lại, khi đã phân vùng ảnh đã được phân lớp thành các đối tượng, do đó có thể
phát hiện được biên.
1.2.1.1. Phương pháp phát hiện biên trực tiếp
a) Kỹ thuật phát hiện biên Gradient
Theo định nghĩa Gradient là một vectơ có các thành phần biểu thị tốc
độ thay đổi giá trị của điểm ảnh.
b) Kỹ thuật phát hiện biên Laplace

Các phương pháp đánh giá Gradient ở trên làm việc khá tốt khi mà độ
sáng thay đổi rõ nét. Khi mức xám thay đổi chậm, miền chuyển tiếp trải rộng,
phương pháp cho hiệu quả hơn đó là pương pháp sử dụng đạo hàm bậc hai
Laplace.
1.2.1.2. Phương pháp phát hiện biên gián tiếp
a) Một số khái niệm cơ bản


13
* Ảnh và điểm ảnh: Ảnh là một mảng số thực 2 chiều (I
ij
) có kích thước
(mxn), trong đó mỗi phần tử I
ij
(i=1, ,m, j=1, ,n) biểu thị mức xám của ảnh
tại (i,j) tương ứng.
* Các điểm 4 và 8 láng giềng
Giả sử (i,j) là một điểm ảnh, các điểm 4 và 8 láng giềng là:
N4={(i’,j’) : |i-i’|+|j-j’|=1}, N8={(i’,j’) : max|i-i’|,|j-j’|=1}.

b) Chu tuyến của một đối tượng ảnh.
Định nghĩa 1: [Chu tuyến]
Chu tuyến của một đối tượng ảnh là dãy các điểm của đối tượng ảnh
P
1
, , P
n
sao cho P
i
và P

i+1
là các 8 láng giềng của nhau (i=1, , n-1) và P
1
là 8
láng giềng của P
n
, ∀i ∃Q không thuộc đối tượng ảnh và Q là 4 láng giềng của
P
i
(hay nói cách khác ∀i thì P
i
là biên 4). Kí hiệu <P
1
P
2
P
n
>. Hình vẽ dưới
đây biểu diễn chu tuyến của ảnh, P là điểm khởi đầu chu tuyến.
Định nghĩa 2: [Chu tuyến đối ngẫu]
Hai chu tuyến C=<P
1
P
2
P
n
> và C
1
= <Q
1

Q
2
Q
n
> được gọi là đối ngẫu
của nhau khi và chỉ khi ∀i ∃j sao cho:
1 – P
i
và Q
j
là 4 láng giềng của nhau.
2 – Các điểm P
i
và vùng thì Q
j
là nền và ngược lại.
Định nghĩa 3: [Chu tuyến ngoài]
Chu tuyến C được gọi là chu tuyến ngoài khi và chỉ khi:
1 – Chu tuyến đối ngẫu C
1
là chu tuyến của các điểm nền.
2 - Độ dài của C nhỏ hơn độ dài C
1
.
Định nghĩa 4: [Chu tuyến trong]
Chu tuyến C được gọi là chu tuyến trong khi và chỉ khi:
1 – Chu tuyến đối ngẫu C
1
là chu tuyến của các điểm nền.
2 - Độ dài của C lớn hơn độ dài C

1
.


14

c) Thuật toán dò tìm biên tổng quát.
Về cơ bản, các thuật toán dò tìm biên trên một vùng đều bao gồm các bước
sau:
• Xác định điểm biên xuất phát.
• Dự báo và xác định điểm biên tiếp theo.
• Lặp bước 2 cho đến khi gặp điểm biên xuất phát.
* Thuật toán dò tìm biên tổng quát.
Bước 1: Xác định cặp nền – vùng xuất phát.
Bước 2: Xác định cặp nền – vùng tiếp theo.
Bước 3: Lựa chọn điểm biên.
Bước 4: Nếu gặp lại cặp xuất phát thì dừng, nếu không quay lại bước 2.

1.2.2. Một số khái niệm về biên
a) Biên lý tưởng: Biên lý tưởng được định nghĩa là sự thay đổi giá trị cấp xám
tại một vị trí xác định. Nếu sự thay đổi cấp xám giữa các vùng trong ảnh càng
lớn thì biên càng dễ dàng nhận ra. Trong trường hợp này sự thay đổi từ cấp
xám cho ta thấy một biên. Sự thay đổi này lại diễn ra tại một điểm nên biên có
độ rộng là một điểm ảnh và vị trí của biên chính là vị trí thay đổi cấp xám đó.
b) Biên dốc: Biên dốc xuất hiện khi sự thay đổi cấp xám trải rộng qua nhiều
điểm ảnh. Vị trí của biên được xem như vị trí chính giữa của đường dốc nối
giữa cấp xám thấp và cấp xám cao. Tuy nhiên đây chỉ là đường dốc trong toán
học, từ khi ảnh được kỹ thuật số hoá thì đường dốc không còn là đường thẳng
mà thành những đường lởm chởm, không trơn.
c) Biên không trơn: Trong trường hợp không nhiễu (lý tưởng), bất cứ một sự

thay đổi cấp xám nào cũng thông báo sự tồn tại của một biên. Trên thực tế,


15
những trường hợp như vậy hiếm khi xảy ra, thường là do các nguyên nhân
sau:
+ Hình dạng của đối tượng không sắc nét.
+ Nhiễu: do một loạt các yếu tố như: kiểu thiết bị nhập ảnh, cường độ
sáng, nhiệt độ, hiệu ứng áp suất, chuyển động, bụi , chưa chắc rằng hai điểm
ảnh có cùng giá trị cấp xám khi được nhập lại có cùng cấp xám đó trong ảnh.
Kết quả của nhiễu trên ảnh gây ra một sự biến thiên ngẫu nhiên giữa các điểm
ảnh. Sự biến thiên ngẫu nhiên làm đường dốc của sự thay đổi cấp xám không
còn là đường thẳng mà sẽ là đường gồ ghề, cạnh không nhẵn xuất hiện.

1.2.3. Ứng dụng của biên
Trong cuộc sống con người chủ yếu tiếp nhận thông tin qua hình
ảnh và âm thanh. Con người nhận dạng được đối tượng nhờ sự nhận thức trực
quan đối với đường bao đối tượng. Một người quan sát thông thường có thể
nhận rõ ranh giới đối tượng trong một cảnh thực, tuy nhiên đa số những người
quan sát lại khó khăn trong việc ghi lại sự quan sát của họ bằng việc đánh dấu
đối tượng. Việc nhận dạng cạnh đã mang lại kết quả hết sức hữu ích dưới
dạng những bản vẽ phác thảo trong việc miêu tả cảnh thực.
Phát hiện biên được sử dụng trong rất nhiều phần mền xử lý ảnh hiện
nay, đây chính là một phần trong việc nhận dạng ảnh. Biên rất quan trọng
trong xử lý ảnh và hệ thống nhận dạng, quá trình nhận dạng có hai giai đoạn
cần thực hiện:
+ Giai đoạn học: Các đặc điểm của đối tượng mẫu được lưu trữ (gọi là
học mẫu) và tập các phần tử mẫu được chia thành các lớp.
+ Giai đoạn nhận dạng: Khi có đối tượng cần nhận dạng, các đặc điểm
của đối tượng sẽ được trích chọn và sử dụng hàm quyết định để xác định đối

tượng cần nhận dạng thuộc lớp nào.


16
1.2.4. Tập ảnh chuẩn:
Tập ảnh này dùng để đánh giá và nhận xét giữa các phương pháp phát
hiện biên ảnh.

Không nhiễu δ=3, SNR=3 δ =9, SNR=2 δ=18, SNR=1

Hình 1-3: Tập ảnh để đánh giá các phương pháp.


17
CHƯƠNG 2 - NHỮNG PHƯƠNG PHÁP PHÁT HIỆN BIÊN
2.1. PHƯƠNG PHÁP TUYẾN TÍNH
Phương pháp tuyến tính hay còn gọi là phương pháp phát hiện biên trực
tiếp, phương pháp này nhằm phát hiện biên dựa vào sự biến thiên về cường độ
sáng của điểm ảnh.
Phương pháp dùng chủ yếu ở đây là phương pháp đạo hàm. Nếu lấy
đạo hàm bậc nhất của ảnh ta có phương pháp Gradient, nếu lấy đạo hàm bậc
hai ta có phương pháp Laplace. Các phương pháp này được mô tả chi tiết
dưới đây:
2.1.1. Phương pháp đạo hàm bậc nhất Gradient.
Phép toán Gradient là phép toán cơ bản dùng để phát hiện biên theo
phương pháp tuyến tính, đây là phép toán lấy đạo hàm bậc nhất trong không
gian hai chiều.
Có hai phương pháp cơ bản để tạo ra đạo hàm bậc nhất. Cách thứ nhất
tạo ra các Gradien theo hai hướng trực giao trong một ảnh; cách thứ hai dùng
một tập các đạo hàm theo hướng.

2.1.1.1. Tạo các Gradient trực giao.
Một biên trong một vùng biên liên tục F( x, y) có thể được tìm thấy bởi
việc thiết lập Gradient một chiều liên tục dọc theo hướng trực giao với đường
biên dốc, với một góc θ so với trục hoành. Gradient một chiều liên tục dọc
theo hướng trực giao với đường biên dốc có thể được tính dưới dạng các đạo
hàm dọc theo các trục trực giao.
θθ
sin
),(
cos
),(
),(
y
yxF
x
yxF
yxG


+


=
(2.1.1.1)


18

Hình 2-1: Mô hình biên.
Hình 2-1: Miêu tả việc tạo một Gradient biên G(x, y) trong miền rời rạc

dưới dạng một Gradient dòng G
R
(j, k) và Gradient cột G
C
(j, k). Gradient
không gian biên độ được tính bởi:
G(j, k)=[[G
R
(j, k)]
2
+ [G
C
(j, k)]
2
]
1/2
(2.1.1.2)
Để tính toán hiệu quả, Gradient biên độ thỉnh thoảng được tính xấp xỉ
bởi việc phối hợp độ lớn:
G(j, k)=|G
R
(j, k)| + |G
C
(j, k)| (2.1.1.3)
Hướng của Gradient không gian đối với trục hoành là:







=
),(
),(
arctan),(
kjG
kjG
kj
R
C
θ
(2.1.1.4)
Vấn đề còn lại cho việc tạo Gradient trực giao của một miền rời rạc là
chọn một xấp xỉ rời rạc tốt cho các sai khác liên tục ở công thức (2.1.1.1).
Phương pháp đơn giản nhất để tạo Gradient rời rạc là tạo ra dung sai
khác của các điểm ảnh chạy theo các dòng và các cột của ảnh. Gradient theo
dòng được định nghĩa như sau:
G
R
(j, k) = F(j, k) – F(j, k - 1) (2.1.1.5a)
Và Gradient theo cột là:
G
C
(j, k) = F(j, k) – F(j + 1, k) (2.1.1.5b)


19
Các định nghĩa Gradient theo dòng và cột, và các mở rộng tiếp theo
được chọn mà G
R

và G
C
là dương với một biên mà biên độ tăng từ trái qua
phải và từ dưới lên trên trong một ảnh.
Với các biên dốc, tìm biên dựa theo sự sai khác không thể khoanh vùng
biên thành một điểm ảnh đơn. Hình 2-2 đưa ra các ví dụ phân biệt các
Gradient theo chiều ngang và chiều dọc của ảnh đơn sắc các quả ớt. Trong đó
và tiếp theo các bức ảnh Gradient hiển thị, phạm vi Gradient được vẽ theo tỷ
lệ trên toàn bộ phạm vi độ tương phản của bức ảnh. Thể hiện bề ngoài từ bức
ảnh mà sử dụng kỹ thuật sai khác là rất nhạy cảm với các sự dao động nhỏ
trong độ chói của ảnh và các đường biên vật thể không được mô tả chính xác.

Hình 2-2: Chênh lệch Gradient của ảnh quả ớt.


20
Các Gradient biên chéo có thể đạt được bằng việc thiết lập các sai khác
liên tiếp của các bộ chéo của các điểm ảnh. Đây là cơ sở của toán tử
Roberts[4] mà được định nghĩa theo giá trị tuyệt đối như sau:
G(j, k) = |G
1
(j, k)| + |G
2
(j, k)| (2.1.1.6a)
Và dưới dạng căn bậc hai như sau:
G(j, k) = [[G
1
(j, k)]
2
+ [G

2
(j, k)]
2
]
1/2
(2.1.1.6b)
Với:
G
1
(j, k) = F(j, k) – F(j + 1, k + 1) (2.1.1.6c)
G
2
(j, k) = F(j, k + 1) – F(j + 1, k) (2.1.1.6d)
Hướng biên đối với trục hoành là






+=
),(
),(
arctan
4
),(
1
2
kjG
kjG

kj
π
θ
(2.1.1.7)
Hình 2-3 đưa ra các biên Gradient của ảnh các quả ớt với toán tử
Roberts. Nhìn bề ngoài các vật thể trong ảnh xuất hiện trở lên mảnh phân biệt
dễ hơn với căn bậc hai Roberts so với Gradient trị tuyệt đối.

Hình 2-3: Gradient của ảnh quả ớt.
Mặc dù góc biên được khoanh vùng phù hợp, nhưng phương pháp di
truyền hướng sai khác điểm ảnh tách biệt vẫn rất nhạy cảm với sự dao động


21
ánh sáng trong ảnh. Vấn đề này có thể được hạn chế bằng cách sử dụng các
toán tử hai chiều thực hiện đồng thời vi phân theo một hướng và lấy trung
bình không gian theo hướng trực giao.
A
0
A
1
A
2
A
7
F(j,k)

A
3
A

6
A
5
A
4
Hình 2-4: Toán tử hướng phát hiện biên với quy ước 3x3.
Prewitt[3] đã giới thiệu toán tử hướng biên 3x3 được mô tả bởi hình 2-
4. Phương pháp tìm biên căn bình phương toán tử Prewitt được định nghĩa:
G(j,k) = ([G
r
(j,k)]
2
+ [G
c
(j,k)]
2
)
1/2
. (2.1.1.8a)
Với :
G
r
(j,k) =
2
1
+k
[(A
2
+ KA
3

+ A
4
) – (A
0
+ KA
7
+ A
6
)] (2.1.1.8b)
G
c
(j,k) =
2
1
+k
[(A
0
+ KA
1
+ A
2
) – (A
6
+ KA
5
+ A
4
)] (2.1.1.8c)
Trong đó: K=1. Trong công thức này, hướng theo hàng và cột được đơn
giản hoá để đưa ra các đơn vị tăng trung bình trọng lượng âm và dương về

một vị trí biên tách biệt. Bộ phát hiện biên toán tử Sobel rất khác so với bộ dò
biên Prewitt bởi vì các giá trị điểm hướng đông, tây, nam và bắc được gấp hai
lần (ví dụ K=2). Mục đích việc gán hệ số trọng lượng này là để đưa ra tầm
quan trọng tương xứng cho mỗi điểm ảnh trong cách thức nó đóng góp cho
hướng không gian. Frei và Chen[5] đã đề nghị đánh hệ trọng số đông, tây,
nam và bắc bởi K =
2
vì thế hướng là tương tự nhau theo các biên dọc, ngang
và chéo. Hướng biên G(j,k) cho các toán tử này cùng một hàng trong mô hình
biên dọc biến đổi điểm ảnh đơn.
Trong toán tử Frei-Chen với K =
2
, Gradient biên là tương tự nhau tại
trung tâm biên với biến đổi điểm ảnh đơn trong các mô hình biên chéo và biên
dọc. Gradient Prewitt cho biên chéo bằng 0,94 lần biên dọc. Hệ số tương ứng


22
cho bộ dò biên Sobel là 1,06. Kết quả là toán tử Prewitt nhạy cảm theo biên
dọc và biên ngang hơn là biên chéo; ngược lại đối với toán tử Sobel. Các
Gradient cùng một hàng trong mô hình biên chéo biến đổi mềm khác so với
biên chéo và dọc với tất cả ba bộ dò biên 3x3. Không cái nào trong số chúng
có thể khoanh vùng biên cho điểm ảnh đơn.

Hình 2-5: Gradient Prewitt, Sobel và Frei Chen với ảnh quả ớt.
Hình 2-5 đưa ra ví dụ các Gradient Prewitt, Sobel và Frei-Chen của mô
hình ảnh quả ớt. Lý do mà các toán tử này dường như là rõ ràng tốt hơn cho


23

các biên của đối tượng phác hoạ so với toán tử Roberts là ở chỗ nó có kích
thước lớn hơn, đưa ra trung bình của các dao động ánh sáng nhỏ.
G
r
(j,k) = F(j,k) 8 H
r
(j,k) (2.1.1.9a)
G
c
(j,k) = F(j,k) 8 H
c
(j,k) (2.1.1.9b)
Trong đó H
R
(j,k) và H
C
(j,k) là các mảng 3x3 tương ứng hàng và cột,
như đã xác định ở hình 2-6.
Toán tử Gradient hàng Gradient cột
Pixen different












000
110
000











000
010
010
Roberts












000
010
100











000
010
001
Prewitt
3
1














101
101
101

3
1










−−−
111
000
111

Sobel
4
1














101
202
101

4
1










−−−
121
000
121


Frei – Chen













+
101
202
101
22
1












−−−
+
121
000
121
22
1

Hình 2-6: Mảng 3x3 thúc đẩy trả lại toán tử biên Gradient trực giao khác.
Một giới hạn bình thường cho toán tử di truyền Gradient biên được
định nghĩa trước đây là không có khả năng để dò biên chính xác trong môi


24
trường có độ nhiễu cao. Vấn đề này có thể được hạn chế bởi việc mở rộng
hợp lý kích thước các toán tử lân cận thông qua đó Gradient sai phân được
tính toán. Một ví dụ, toán tử Prewitt loại 7x7 có dạng tương ứng Gradient sau:























−−−
−−−
−−−
−−−
−−−
−−−
−−−
=
1110111
1110111
1110111
1110111
1110111
1110111
1110111
21
1
R
H

(2.1.1.10)
Một toán tử của loại này được gọi là toán tử boxcar. Hình 2-7 biểu diễn
Gradient của một ma trận boxcar 7x7.


25

Hình 2-7: Boxcar, Kim tự tháp, Argyle, Macleod và FDOG với ảnh quả ớt.
Abdou[6] đưa ra toán tử kim tự tháp mà ở đó có trọng lượng giảm
tuyến tính với các điểm ảnh từ trung tâm của biên. Ma trận đáp ứng Gradient
hàng cho toán tử kim tự tháp 7x7 được cho như sau:

×