Đề tài môn học PHÂN ĐOẠN ẢNH

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (5.85 MB, 74 trang )

Đề tài môn học

Nhóm 2: Khanh, Ánh, Thảo, Dương.

Mục lục:
Lời giới thiệu
1. Tách không liên tục
1.1. Tách điểm
1.2. Tách dòng
1.3. Tách biên
2. Liên kết biên và tách đường giới hạn
2.1. Xử lý cục bộ
2.2. Liên kết cạnh và tách biên
2.3. Xử lý toàn cục bằng phương pháp lý thuyết đồ thị
3. Ngưỡng
3.1. Sự thành lập
3.2. Vai trò của sự chiếu sáng
3.3. Ngưỡng toàn cục cơ bản
3.4. Ngưỡng động cơ sở
3.5. Ngưỡng động và ngưỡng toàn cục tối ưu
3.6. Sử dụng những đặc điểm biên để cải tiến histogram và
phân ngưỡng địa phương
3.7. Ngưỡng dựa trên 1 vài biến số
4. Phân đoạn trên cơ sở vùng
4.1. Công thức cơ bản
4.2. Tăng vùng
4.3. Chia và trộn vùng
5. Phân đoạn theo mức hình thái
5.1. Khái niệm cơ bản
5.2. Xây dựng đập
5.3. Thuật toán phân mức

5.4. Áp dụng cho những ảnh nhiễu hay những vùng phân đoạn nhỏ
6. Phân đoạn ảnh động
6.1. Kỹ thuật miền không gian
6.2. Kỹ thuật miền tần số
Tổng kết

Phân đoạn ảnh

Trang 51

Đề tài môn học

Nhóm 2: Khanh, Ánh, Thảo, Dương.

Lời giới thiệu
Phân đoạn ảnh là các thao tác chia nhỏ bức ảnh đầu vào thành các miền hoặc
các vật thể con với mức độ tùy theo nhu cầu xử lý. Có rất nhiều kiểu phân đoạn
như xác định biên của vật thể, xử lý các vùng ảnh, tách bạch rõ ràng vật thể và nền
bằng 1 ngưỡng,… nhưng tựu chung lại mục tiêu của phân đoạn ảnh là làm nổi bật
hoặc tách hẳn vật thể cần quan tâm ra từ ảnh ban đầu.
Trong các thao tác về xử lý ảnh thì phân đoạn ảnh được xem là thao tác khó
nhất và là thao tác rất quan trọng vì độ chính xác của quá trình phân đoạn ảnh có ý
nghĩa quyết định tới các xử lý tính toán sau đó. Phân đoạn có thể đóng vai trò trung
tâm trong 1 số xử lý kĩ thuật như phân tích chất lượng sản phẩm, kiểm tra quá trình
lắp ráp các chi tiết điện,… hoặc là 1 khâu trung gian cần thiết cho các quá trình xử
lý tiếp theo như các xử lý trong y học.
Vì thời gian có hạn nên đề tài chỉ giới hạn trong việc xét ảnh xám chứ hầu như
không xét tới sự phân đoạn ảnh màu. Và cấu trúc của đề tài gồm các phần sau:
Chương 1: là các vấn đề về tách 1 phần nhỏ của bức ảnh, cụ thể là tách

điểm, tách dòng, tách biên. Kĩ thuật chính của phần này là dựa vào sự rời rạc mức
xám tại các phần này.
Chương 2: dựa trên một số thuộc tính của mức xám là gradient và toán tử
Laplace để tiến hành liên kết các đường biên bị gián đoạn và dùng lý thuyết đồ thị
để tìm ra các đường biên phân chia vật thể và nền.
Chương 3: là các phương pháp chọn và xử lý trên ngưỡng; đây là kĩ thuật
trung tâm của phân đoạn ảnh. Trong đó chúng ta sẽ đi từ việc chọn ngưỡng toàn
cục đơn (dễ thực hiện nhất) tới chọn 1 ngưỡng động bằng cách chia nhỏ ảnh và
chọn ngưỡng tối ưu dựa trên các tính toán về xác suất.
Chương 4: chúng ta tiến hành chia bức ảnh thành các vùng nhỏ theo 1 số
đặc trưng nhất định rồi sau đó, tùy theo yêu cầu bài toán, ta sẽ tiến hành 1 số xử lý
như chia vùng, trộn vùng.
Chương 5: chương này nói về cách xác định các đường phân mức dựa trên 1
hình ảnh rất tự nhiên là các con đập. Chúng ta sẽ tiến hành xây dựng các đập
trên bức ảnh rồi cho ngập nước từ từ toàn bộ ảnh. Tới 1 lúc nhất định khi chỉ
còn các chỗ cao trên con đập chưa bị ngập thì ta có thể xác định được các
đường biên của đập. và các đường biên này là các đường định mức cần tìm.
Chương 6: nhiệm vụ của chúng ta trong phần này là làm sao tách các vật thể
chuyển động từ 1 bức ảnh đưa vào gồm các đối tượng động và tĩnh. Có 2 kĩ
thuật chính: kĩ thuật miền không gian dựa vào việc tạo ra 1 ảnh mẫu chỉ gồm
các vật thể tĩnh và tính toán sai biệt tích lũy để xác định vật thể động, còn kĩ
thuật miền tần số dựa vào các biến đổi Fourier.

Phân đoạn ảnh

Trang 51

Tách không liên tục

Nhóm 2: Khanh, Ánh, Thảo, Dương.

1. TÁCH KHÔNG LIÊN TỤC:
Phần này chúng ta sẽ nói về 3 kỹ thuật cơ bản để tách mức xám không liên tục
trong một ảnh số: điểm, đường và biên. Cách phổ biến nhất để tìm ra sự không liên
tục này là sử dụng mặt nạ quét qua hết bức ảnh. Ví dụ đối với mặt nạ 3x3 ở hình 1,
quá trình này bao gồm việc tính tổng các tích của trọng số với mức xám trong vùng
mặt nạ đi qua để thu được đáp ứng của mặt nạ:
9

R  w1 z1  w 2 z2  ...  w 9 z9  �w i zi

(1.1)

i 1

Trong đó,

zi

là mức xám của Pixel xác định bởi mặt nạ, w i là trọng số của

mặt nạ. Thông thường, đáp ứng mặt nạ được xác định chủ yếu dựa vào vị trí của
tâm mặt nạ.

Hình 1
1.1Tách Điểm:
Về nguyên tắc, việc tách các điểm cô lập trong 1 bức ảnh khá đơn giản. Ví dụ
khi sử dụng mặt nạ như hình 2a, ta tách điểm có vị trí mà mặt nạ tập trung nếu :
|R| ≥T

(1.2)
Ở đây T là ngưỡng dương và R được xác định bởi (1.1). Về cơ bản, công thức
này đo độ chênh lệch giữa điểm trung tâm và các lân cận của nó. Ý tưởng chủ đạo
ở đây là một điểm cô lập (điểm có mức xám khác với nền của nó, và được định vị
trong vùng đồng nhất hoặc có thể nhận thấy) thì hơi khác so với những điểm xung
quanh, vì vậy nó dễ dàng bị tách bởi loại mặt nạ này. Lưu ý là các điểm cô lập phải
đủ lớn (xác định bởi T). Tổng hệ số của mặt nạ bằng 0, điều đó chứng tỏ rằng đáp
ứng của mặt nạ sẽ bằng 0 tại những vùng có mức xám không đổi.
Hình 2b là 1 minh họa cho việc tách các điểm cô lập trong 1 ảnh. Hình 2b biểu
diễn ảnh chụp bằng tia X của bề mặt tua bin của 1 động cơ phản lực ở trạng thái bị
rỗ. Có 1 pixel màu đen đơn lẻ ở trong mỗi vùng bị rỗ. Hình 2c là kết quả sau khi áp
Phân đoạn ảnh

Trang 3

Tách không liên tục

Nhóm 2: Khanh, Ánh, Thảo, Dương.

dụng tách điểm bằng cách sử dụng mặt nạ 2a cho ảnh 2b. Hình 2d là kết quả áp
dụng công thức 1.2 với ngưỡng T bằng 90% giá trị của các pixel cao nhất trong
hình 2c. (Việc chọn ngưỡng – threshold sẽ được nói chi tiết trong phần sau).
Những pixel đơn hiện ra rõ ràng trong bức ảnh này.

Hình 2
Kiểu xử lý tách này thì khá đặc biệt bởi vì nó dựa trên cơ sở là những pixel đơn
không liên tục trên nền đồng nhất của mặt nạ tách. Khi điều kiện này không thỏa
mãn thì ta dùng phương pháp khác phù hợp hơn (sẽ được bàn đến trong chương
này) để tách mức xám không liên tục.

1.2Tách Dòng:
Phương pháp tiếp theo là tách dòng. Cho những mặt nạ như trong hình 3.
Nếu ma trận đầu tiên di chuyển qua bức ảnh, nó sẽ đáp ứng mạnh tại những
đường có hướng nằm ngang (độ dày một pixel). Với nền không đổi, kết quả trả về
lớn nhất khi đường đi qua hàng giữa của mặt nạ. Thực nghiệm cho thấy mặt nạ thứ
2 trong hình 3 sẽ đáp ứng tốt nhất những đường có hướng là +45 o, mặt nạ thứ 3 thì
đáp ứng tốt với đường thẳng đứng, mặt nạ thứ tư thì đáp ứng tốt với những đường
có hướng là -45o. Những hướng này cũng được thiết lập bằng cách làm chú ý rằng
các hướng thích hợp của mỗi mặt nạ có trọng số lớn hơn những hướng khác. Chú ý
rằng các hệ số trong 1 mặt nạ có tổng bằng 0, hệ số đáp ứng của mặt nạ sẽ bằng 0
tại những vùng có mức xám không đổi.

Phân đoạn ảnh

Trang 4

Tách không liên tục

Nhóm 2: Khanh, Ánh, Thảo, Dương.

Hình 3
Đặt R1 , R2 , R3 và R4 là đáp ứng của những mặt nạ trong hình 3 từ trái qua phải,
trong đó Ri được xác định bởi (1.1). Cho 4 mặt nạ này lần lượt quét qua toàn bộ
ảnh. Nếu tại một điểm xác định trong hình, | Ri |>| R j | với mọi j≠i, ta nói rằng điểm
đó có hướng phù hợp với hướng của mặt nạ i hơn. Ví dụ nếu tại một điểm trong
bức ảnh mà | R1 |>| R j |, với j=2,3,4, thì điểm đó có hướng phù hợp hơn với hướng
của đường nằm ngang. Lần lượt chúng ta quan tâm đến việc tách những đường có
hướng xác định. Trong trường hợp này, chúng ta sẽ sử dụng mặt nạ phù hợp với
hướng và ngưỡng đó của đầu ra, theo biểu thức (1.2). Nói cách khác, nếu như

chúng ta quan tâm đến việc tách tất cả các đường trong ảnh với hướng xác định bởi
một mặt nạ cho trước, chúng ta chạy mặt nạ này qua ảnh và tạo ngưỡng cho giá trị
tuyệt đối của kết quả. Những điểm còn lại là những điểm có đáp ứng mạnh nhất,
đối với những đường có độ dày 1 pixel, phù hợp nhất với hướng được xác định bởi
mặt nạ. Ví dụ sau sẽ minh họa cho điều này.
Ví dụ:
Giả sử rằng chúng ta quan tâm đến việc tìm tất cả các đường có độ dày 1 pixel
và có hướng -45o. Với giả thuyết này, chúng ta sử dụng mặt nạ cuối cùng trong
hình 3. Kết quả được thể hiện trong hình 4b. Chú ý rằng tất cả những phần ngang
và phần đứng trong bức ảnh thì bị loại bỏ và những phần của bức ảnh ban đầu mà
có hướng -45o thì được nổi rõ nhất trong hình 4b. Để xác định những đường nào
phù hợp nhất với mặt nạ chúng ta chọn ngưỡng cho hình này. Kết quả của việc sử
dụng ngưỡng bằng với giá trị lớn nhất của bức ảnh thể hiện trong hình 4c. Giá trị
lớn nhất này là một lựa chọn tốt cho 1 ngưỡng trong trường hợp này, bởi vì ảnh
đầu vào là ảnh nhị phân. Thực hiện xong việc này, chúng ta tìm những đáp ứng
mạnh nhất. Hình 4c biểu diễn tất cả những điểm vượt qua ngưỡng bằng màu trắng.

Phân đoạn ảnh

Trang 5

Tách không liên tục

Nhóm 2: Khanh, Ánh, Thảo, Dương.

Hình 4
Trong trường hợp này, phương pháp trên chỉ tìm ra những đoạn có độ dày 1
pixel và hướng -45o. Những điểm cô lập nhìn thấy trong hình 4c là những điểm
đáp ứng mạnh đối với mặt nạ. Trong ảnh ban đầu, những điểm này và láng giềng

của chúng được định hướng theo hướng mặt nạ đáp ứng mạnh nhất. Những điểm
cô lập này có thể được tách bằng cách sử dụng mặt nạ trong hình 2a và sau đó
được xóa đi.
1.3Tách Biên:
Mặc dù phương pháp tách điểm và tách dòng là các kỹ thuật phân đoạn quan
trọng, nhưng việc tách biên lại hoàn toàn khác xa với các kỹ thuật trên, nó được sử
dụng phổ biến nhất cho việc tách độ trung bình không liên tục của mức xám. Trong
phần này chúng ta sẽ nói về công cụ đạo hàm bậc 1 và bậc 2 và nhấn mạnh về các
thuộc tính của chúng để tách biên cho bức ảnh.


Cơ sở của việc tách biên:

Phân đoạn ảnh

Trang 6

Tách không liên tục

Nhóm 2: Khanh, Ánh, Thảo, Dương.

Một cách trực quan, một biên là tập hợp những pixel ( nằm trên đường biên
giới giữa 2 vùng) liên kết với nhau. Tuy nhiên, biên và cạnh có sự khác nhau.Về cơ
bản ta sẽ xem xét một cách ngắn gọn, một cạnh là 1 khái niệm “cục bộ”, trong khi
đường biên của một miền mang tính toàn cục hơn nhiều. Một định nghĩa hợp lý
của “biên” đòi hỏi khả năng đo được sự chuyển tiếp mức xám.
Chúng ta bắt đầu bằng việc làm mô hình cho biên và việc đo đạc sự chuyển
tiếp trung bình của mức xám chỉ mang tính hình thức. Một cách trực quan, một
biên lý tưởng có các thuộc tính của mô hình ở hình 5a. Theo mô hình này thì một

biên lý tưởng là một tập hợp các pixel (ở đây là theo hướng thẳng đứng) liên kết
với nhau, mỗi thành phần của biên có vị trí tại 1 bước chuyển tiếp trực giao mức
xám.

Hình 5
Trong thực tế, quang học, lấy mẫu,... và những cách thu nhận hình ảnh khác
không hoàn hảo dẫn đến biên bị nhòe với độ nhòe được xác định bởi những nhân
tố như là chất lượng của hệ thống thu nhận hình ảnh, tốc độ lấy mẫu và điều kiện
chiếu sáng của mỗi bức ảnh. Vì vậy kết quả là biên được mô hình gần giống với
một đoạn dốc hơn đoạn thẳng đứng, được thể hiện trong hình 5b. Độ nghiêng của
dốc tỉ lệ nghịch với độ nhòe của biên. Trong mô hình này, chúng ta không bao giờ
có một đường biên mảnh (có độ dày một pixel). Thay vào đó, một điểm biên bây
giờ là một điểm bất kì chứa trong đoạn dốc và biên là tập hợp những điểm liên
thông. Độ dày của đường biên được xác định bởi chiều dài của đoạn dốc, khi biên
biến đổi từ đầu đến cuối mức xám. Độ dài này được xác định bởi độ nhòe. Dễ dàng
nhận ra rằng: biên nhòe thì dày và biên sắc nét thì mảnh.
Phân đoạn ảnh

Trang 7

Tách không liên tục

Nhóm 2: Khanh, Ánh, Thảo, Dương.

Hình 6
Hình 6a hiển thị 1 phần trích ra từ hình 5b. Ảnh 6b thể hiện mặt nghiêng của
một mức xám theo hướng nằm ngang của biên nằm giữa hai vùng. Hình này cũng
cho thấy đạo hàm bậc một, bậc hai của mức xám. Đạo hàm bậc 1 dương tại những
điểm chuyển tiếp từ trong ra ngoài đoạn dốc theo hướng di chuyển từ trái sang

phải, và không đổi đối với những điểm nằm trên dốc, bằng 0 tại những vùng có
mức xám không đổi. Đạo hàm bậc hai dương tại những biến đổi tương ứng với
phía tối của biên, âm tại những biến đổi tương ứng với phía sáng của biên, và bằng
0 dọc theo dốc hoặc trong những vùng mức xám không đổi. Dấu của đạo hàm
trong 6b sẽ bị đảo ngược đối với những biên biến đổi từ sáng sang tối.
Từ những quan sát trên ta kết luận rằng độ lớn của đạo hàm bậc 1 có thể được
sử dụng để phát hiện ra dấu hiệu của một biên tại một điểm trong hình (nghĩa là
xác định điểm đó có nằm trên dốc không). Tương tự như vậy dấu của đạo hàm bậc
2 có thể được sử dụng để xác định một pixel cạnh nằm trên phía sáng hay phía tối
của biên. Chúng ta chú ý thêm hai thuộc tính của đạo hàm bậc hai xung quanh một
biên:
(1) Nó tạo ra hai giá trị cho mỗi cạnh (điều không mong muốn)
(2) Một đường thẳng tưởng tượng nối từ điểm dương lớn nhất và điểm âm nhỏ
nhất của đạo hàm bậc hai sẽ đi qua 0 gần với điểm giữa của biên. Thuộc tính zeroPhân đoạn ảnh

Trang 8

Tách không liên tục

Nhóm 2: Khanh, Ánh, Thảo, Dương.

crossing của đạo hàm bậc hai thì hữu dụng cho việc xác định trung tâm của biên
dày.
Ví dụ:
Biên thể hiện trong Hình 5 và 6 thì không có nhiễu. Cột đầu tiên của Hình 7 thể
hiện 4 biên (đoạn dốc) phân ra thành một vùng đen ở bên trái và một vùng trắng ở
bên phải. Lưu ý là toàn bộ biến đổi từ đen sang trắng này chỉ là biểu diễn của một
cạnh đơn. Vùng ảnh ở trên cùng bên trái là ảnh không có nhiễu. Ba ảnh còn lại
trong cột đầu tiên của Hình 7 bị sai lệch bởi nhiễu Gauss với “zero mean” và độ

lệch chuẩn mức xám lần lượt là 0.1 và 1.0 và 10. Đồ thị biểu diễn bên dưới mỗi
ảnh này là hình chiếu mức xám của đường quét theo hàng ngang qua toàn bộ ảnh.

Hình 7
Phân đoạn ảnh

Trang 9

Tách không liên tục

Nhóm 2: Khanh, Ánh, Thảo, Dương.

Các ảnh trong cột 2 của hình 7 là đạo hàm bậc 1 của những ảnh ở cột 1. Xét
ảnh ở giữa trên cùng, đạo hàm bằng 0 tại những vùng đen và trắng không đổi. Đạo
hàm của một đoạn biên không đổi là hằng số biểu thị độ nghiêng của dốc. Đạo hàm
không đổi này được biểu diễn bằng màu xám. Hình tiếp theo của cột 2 thì các đạo
hàm càng tăng so với trường hợp không có nhiễu. Và trong hình cuối cùng của cột
2, rất khó để chỉ ra biên. Yếu tố gây ra sự sai lệch này chính là nhiễu. Ảnh cuối
cùng có nhiều hạt nhỏ nhưng sự sai lệch này hầu như không thể nhận thấy.
Ví dụ trên cho thấy độ nhạy của đạo hàm đối với nhiễu, đạo hàm bậc hai nhạy
hơn đối với nhiễu. Đạo hàm bậc hai của ảnh không nhiễu ở ảnh trên cùng bên phải
của hình. Đường mảnh màu trắng và đen là thành phần dương và âm được nhắc
đến trong hình 6. Màu xám trong những ảnh này biểu diễn cho số 0 tương ứng
trong thang chia tỷ lệ. Nhiễu đạo hàm bậc hai (tương tự với trường hợp không có
nhiễu) tương ứng với nhiễu có độ lệch chuẩn ở mức xám 0.1. Hai ảnh đạo hàm bậc
hai và biên cho thấy rất khó để các tách thành phần âm và dương.
Thực tế, nhiễu khá nhỏ vẫn có thể có sự tác động đáng kể trên 2 đạo hàm then
chốt được dùng cho việc tách ảnh. Vì vậy đối với những ứng dụng rất có khả năng
xuất hiện nhiễu với các mức độ chúng ta vừa đề cập, ta nên làm trơn ảnh trước khi

xử lý.
Dựa vào ví dụ này và 3 nội dung đã trình bày, chúng ta đưa ra kết luận rằng
tiêu chuẩn để phân loại 1 điểm biên là sự chuyển tiếp mức xám tương ứng với
điểm đó phải mạnh hơn đáng kể so với nền của điểm đó. Vì chúng ta đang đề cập
đến tính toán cục bộ, do đó chúng ta kết luận 1 điểm trong ảnh là điểm biên nếu
đạo hàm bậc nhất của nó lớn hơn một ngưỡng lý thuyết. Biên là tập hợp những
điểm thỏa điều kiện đó liên kết với nhau theo một tiêu chuẩn xác định cho trước.
Sự phân đoạn giới hạn biên được sử dụng nếu biên ngắn so với các kích cỡ của
ảnh. Vấn đề then chốt trong việc phân đoạn là lắp ráp các phần biên thành những
biên dài hơn. Nếu chúng ta quyết định sử dụng đạo hàm bậc hai để dễ dàng xác
định các điểm biên trong 1 ảnh khi đạo hàm bậc hai của nó là 0 thì có 1 định nghĩa
thay thế. Trong trường hợp này, định nghĩa của biên cũng giống như trên. Điều
quan trọng cần chú ý là những định nghĩa này không đảm bảo thành công trong
việc tìm điểm biên của ảnh. Chúng chỉ đơn giản là cho chúng ta một hình thức tìm
kiếm các điểm biên đó.


Toán tử Gradient:

Đạo hàm bậc nhất của 1 ảnh số dựa trên những xấp xỉ khác nhau của độ chênh
lệch của cả hai thành phần x và y. Gradient của 1 ảnh f(x,y) tại vị trí (x,y) được xác
định là vectơ :
�
f �
�
�
x
�f  � �
 �
f � (1.3)

� � �
�
�
y �
Gx
Gy

Phân đoạn ảnh

Trang 10

Tách không liên tục

Nhóm 2: Khanh, Ánh, Thảo, Dương.

Từ sự phân tích vector, ta thấy rằng các vector Gradient cho biết hướng và tốc
độ thay đổi cực đại của f tại (x, y).
Một đại lượng quan trọng trong tách biên là độ lớn của vector này, được ký
hiệu là �f :

�f  mag  �f   �
Gx2  G y2 �
�
� (1.4)
1/ 2

Đại lượng này cho biết tốc độ cực đại của việc tăng f(x,y) trên 1 đơn vị khoảng
cách theo hướng của �f . Mặc dù không hoàn toàn đúng, nhưng thông thường ta
coi �f như Gradient, chỉ cần phân biệt vector và độ lớn của nó trong trường hợp

dễ có sự nhầm lẫn.
Hướng của vector Gradient cũng là một thông số quan trọng. Cho α(x,y) biểu
diễn hướng góc của vector ∆f tại (x, y). Từ sự phân tích vector, ta có:

�G y �
  x, y   tan 1 � �
�Gx �

(1.5)

Trong đó, góc được đo xét theo trục x. Hướng của một biên tại (x,y) trực giao
với hướng của vector Gradient tại điểm đó.
Việc tính Gradient của 1 ảnh dựa trên cơ sở tính toán đạo hàm riêng phần
�
f /�
x và �
f /�
y tại mỗi vị trí pixel. Cho vùng (3x3) trong hình 8(a) biểu diễn các
mức xám trong vùng lân cận của ảnh. Một trong những cách dễ nhất để tính đạo
hàm riêng bậc nhất tại điểm z5 là sử dụng toán tử Robert:
G x   z9  z5 

Và

(1.6)

G y   z8  z6 

(1.7)
Những đạo hàm này có thể được sử dụng cho toàn bộ ảnh bằng cách sử dụng

những mặt nạ trong hình 8(b).
Những mặt nạ kích thước 2 x 2 khó khăn cho việc thực hiện bởi vì mặt nạ đó
không có một tâm rõ ràng. Một phương pháp khác là sử dụng mặt nạ kích thước 3
x3:
Gx   z7  z8  z9    z1  z2  z3  (1.8)
Và
G y   z3  z6  z9    z1  z4  z7  (1.9)

Phân đoạn ảnh

Trang 11

Tách không liên tục

Nhóm 2: Khanh, Ánh, Thảo, Dương.

Hình 8
Trong công thức này, sự khác nhau giữa hàng 1 và hàng thứ 3 của vùng ảnh 3 x
3 xấp xỉ với đạo hàm theo x, và sự khác nhau giữa cột thứ 3 và cột thứ 1 xấp xỉ với
đạo hàm theo y. Những mặt nạ trong hình 8(d) và (e) gọi là các toán tử Prewitt, có
thể được sử dụng để thực hiện hai phương trình này.
Một sự biến đổi nhỏ giữa hai phương trình này là việc nhân hệ số trung tâm với
2:
Gx   z7  2 z8  z9    z1  2 z2  z3 
(1.10)
Và
G y   z3  2 z6  z9    z1  2 z4  z7 
(10.1-11)
Phân đoạn ảnh

Trang 12

Tách không liên tục

Nhóm 2: Khanh, Ánh, Thảo, Dương.

Hình 8(f) và (g) là toán tử Sobel được dùng để thực hiện hai phương trình này.
Toán tử Prewitt và toán tử Sobel được sử dụng nhiều nhất trong thực hành tính
toán các gradient số. Việc thực hiện mặt nạ Prewitt đơn giản hơn so với mặt nạ
Sobel, nhưng lại gây ra nhiễu suppression nhỏ, một vấn đề quan trọng khi sử dụng
đạo hàm. Chú ý rằng các hệ số trong tất cả các mặt nạ ở hình 8 đều có tổng bằng 0,
nên các đáp ứng phải bằng 0 trong vùng mức xám cố định.
Những mặt nạ vừa đề cập được sử dụng để tính các thành phần Gradient Gx và
G y . Việc tính Gradient theo phương trình (1.4) không phải bao giờ cũng được sử
dụng bởi vì những tính toán bắt buộc là bình phương và khai căn bậc hai. Một
phương pháp hay được sử dụng là xấp xỉ gradient bằng giá trị sau:
ѻf  Gx |  | G y | .
(10.1-12)
Phương trình này thuận tiện hơn cho việc tính toán, và vẫn bảo toàn được
những thay đổi tương ứng trong mức xám. Những mặt nạ Sobel và mặt nạ Prewitt
chỉ cho kết quả tốt đối với những biên theo hướng ngang và thẳng đứng, vì vậy
thậm chí nếu chúng ta sử dụng phương trình (1.4) để tính gradient thì kết quả cũng
chỉ đẳng hướng đối với những biên theo hướng ngang và thẳng đứng. Trong trường
hợp này, phương trình (1.4) và (1.12) cho kết quả giống nhau.
Chúng ta có thể điều chỉnh mặt nạ 3x3 trong hình 8 để có những kết quả trả về
tốt nhất theo hướng chéo. Các mặt nạ Prewitt và Sobel bổ sung để tách những điểm
không liên tục theo hướng chéo được thể hiện trong hình 9.

Hình 9
Hình 10 minh họa đáp ứng của hai thành phần của gradient,  Gx | và | Gy | như là
ảnh gradient được tạo thành từ tổng của hai thành phần này. Hướng của hai thành
phần rất rõ trong hình 10(b) và (c). Chú ý đặc biệt là sự nổi rõ của ngói lợp mái
nhà, những chỗ nối viên gạch nằm ngang và những phần ngang của cửa sổ trong
hình 10(b). Ngược lại, hình 10(c) lại nổi rõ những thành phần dọc, như là góc của
Phân đoạn ảnh

Trang 13

Tách không liên tục

Nhóm 2: Khanh, Ánh, Thảo, Dương.

bức tường kế bên, những thành phần dọc của cửa sổ, những chỗ nối viên gạch theo
chiều dọc, và cột đèn ở bên phải của bức tranh.

Hình 10
Ảnh ban đầu có độ phân giải cao hợp lý (1200x1600 pixel ) và ở khoảng
cách mà ảnh đưa ra, ta vẫn có thể thấy những viên gạch trên bức tường. Mức độ
chi tiết này thường là điều không mong muốn, và 1 cách để giảm bớt nó làm trơn
ảnh. Hình 11 tương tự hình 10, nhưng ảnh gốc đầu tiên của hình 11 được làm trơn
bằng cách sử dụng một bộ lọc trung bình 5x5. Đáp ứng của mỗi mặt nạ hầu như
không biểu diễn chi tiết các viên gạch, và kết quả bị chi phối hầu hết bởi các biên
chính. Chú ý rằng việc tính trung bình làm cho đáp ứng của biên bị mờ đi.
Ở hình 10 và 11 rõ ràng những mặt nạ Sobel theo chiều ngang và chiều dọc đáp
ứng tốt gần như nhau với những biên định hướng -45 0 và +450. Nếu chú ý đến việc
làm nổi biên theo hướng đường chéo, thì ta nên dùng một trong những cặp mặt nạ
ở hình 9.

Đáp ứng tốt của mặt nạ Sobel chéo được biểu diễn ở hình 12. Rõ ràng trong
hình này những đường chéo đáp ứng mạnh hơn với những mặt nạ này. Cả 2 mặt nạ
đường chéo đều này đều có đáp ứng giống nhau cho biên ngang và biên dọc,
nhưng như dự đoán, đáp ứng của chúng theo những hướng này yếu hơn đáp ứng
của mặt nạ Sobel ngang và dọc biểu diễn trong hình 10(b) và 10(c).

Phân đoạn ảnh

Trang 14

Tách không liên tục

Nhóm 2: Khanh, Ánh, Thảo, Dương.

Hình 11

Hình 12


Toán tử Laplace :

Toán tử Laplace của hàm 2 chiều f(x,y) là đạo hàm bậc 2 được định nghĩa như
sau :

�2 f �2 f
�f  2  2
�
x
�

y
2

(1.13)

Cho một vùng 3x3, một trong hai công thức thường gặp nhất trong thực tế là:

�2 f  4 z5   z2  z4  z6  z8  (1.14)

Phân đoạn ảnh

Trang 15

Tách không liên tục

Nhóm 2: Khanh, Ánh, Thảo, Dương.

Hình 13
Trong đó, z i đã được xác định trong hình 8(a). Xấp xỉ của láng giềng trên
đường chéo được đưa bởi công thức:

�2 f  8 z5   z1  z2  z3  z4  z6  z7  z8  z9 

(10.1-15)

Những mặt nạ để thực hiện hai phương trình trên được biểu diễn ở hình 13.
Toán tử Laplace thường không được sử dụng ở dạng nguyên bản để tách biên
vì một số lý do sau:
 Vì là đạo hàm bậc 2 nên toán tử Laplace rất nhạy với nhiễu (hình 7).

 Toán tử Laplace thường tạo ra biên kép (xem ở hình 6 và 7), đây là một hiệu
ứng không mong muốn bởi vì nó làm cho việc phân đoạn trở nên rắc rối.
 Lý do cuối cùng là toán tử Laplace không thể nhận dạng hoặc tách hướng
biên ảnh một cách trực tiếp.
Vì những lý do này nên vai trò của toán tử Laplace trong phân đoạn bao gồm :
(1) Sử dụng thuộc tính Zero-crossing cho vị trí biên.
(2) Sử dụng nó với mục đích bổ sung là xác định một pixel ở mặt tối hay mặt
sáng của biên.
Ở vai trò đầu tiên, toán tử Laplace được kết hợp với hàm làm trơn là tiền thân
của việc tìm biên thông qua thuộc tính Zero-crossing. Xem xét hàm sau:

h( r )  e



r2

(1.16)

2 2

Trong đó : r 2  x 2  y 2 và  là độ lệch chuẩn. Sử dụng hàm này sẽ làm cho
ảnh bị mịn hơn. Toán tử Laplace của h ( nghĩa là đạo hàm bậc 2 của h đối với r) là :
r2

�
r 2  2 � 22
2
� h( r )   � 4 �
e


�
�

(1.17)

Hàm này thường được gọi là toán tử Laplace của hàm Gauss (LoG) vì phương
trình (1-16) có dạng giống hàm Gauss.
Phân đoạn ảnh

Trang 16

Tách không liên tục

Nhóm 2: Khanh, Ánh, Thảo, Dương.

Hình 14
Hình 14 biểu diễn đồ thị 3-D, mặt cắt ngang của hàm LoG, và một mặt nạ 5 x 5
xấp xỉ � h . Xấp xỉ này không phải là duy nhất. Mục đích của nó là thu được hình
dạng cơ bản của � h , đó là hình gồm một vùng ở giữa dương, kề liền là vùng biên
mang giá trị âm bao bọc xung quanh có giá trị tăng theo khoảng cách với gốc tọa
độ và một vùng bên ngoài mang giá trị 0. Các hệ số cũng phải có tổng bằng 0 để
đáp ứng mặt nạ bằng 0 ở những vùng mức xám không đổi. Mặt nạ nhỏ chỉ hữu
dụng đối với những ảnh không có nhiễu. Dựa vào hình dạng của nó, đôi khi toán tử
của Gauss cũng được gọi là hàm mũ Mexico (Mexican hat) .
Vì đạo hàm bậc 2 là toán tử tuyến tính nên tích chập của ảnh với � h cũng
tương tự như tích chập của ảnh với hàm làm trơn Gauss ở phương trình (1.16), sau
đó tính Laplace của kết quả vừa tìm được. Vì vậy, ta thấy rằng mục đích của hàm
Gauss trong việc tính toán theo công thức LoG là để làm trơn ảnh, và mục đích của

toán tử Laplace là để cung cấp hình ảnh với Zero crossing được dùng để xác định
vị trí của biên. Việc làm trơn ảnh sẽ làm giảm đi tác động của nhiễu và chủ yếu là
nó ngăn chặn sự tăng tác động của nhiễu gây ra bởi đạo hàm bậc 2 của toán tử
Laplace.

Phân đoạn ảnh

Trang 17

Tách không liên tục

Nhóm 2: Khanh, Ánh, Thảo, Dương.

Hình 15
Hình 15(a) là hình chụp X-Quang của mạch máu. Hình 15(b) biểu diễn
Gradient Sobel của hình này. Hình 15(c) là 1 hàm Gauss trong không gian ( với
một độ lệch chuẩn 5 pixel) được dùng để thu được mặt nạ trơn trong không gian 27
x 27. Hình 15(d) là mặt nạ trong không gian được sử dụng để thực hiện phương
trình (1.5). Hình 15(e) là hình LoG thu được bằng cách làm trơn ảnh ban đầu với
mặt nạ làm trơn Gauss, sau đó áp dụng mặt nạ Laplace (hình này đã được dùng để
khử hiệu ứng đường biên tạo ra bởi mặt nạ làm trơn).
Kết quả LoG biểu diễn trong hình 15(e) là ảnh thu được từ việc tính toán Zero
crossing để tìm biên. Một phương pháp dễ hiểu cho xấp xỉ zero crossing là tạo
ngưỡng ảnh LoG bằng cách thiết lập tất cả giá trị dương cho điểm màu trắng, và tất
cả giá trị âm cho điểm màu đen. Kết quả được biểu diễn trong hình 15(f). Tính
Phân đoạn ảnh

Trang 18

Tách không liên tục

Nhóm 2: Khanh, Ánh, Thảo, Dương.

logic của phương pháp này là zero crossing xảy ra giữa những giá trị âm và dương
của toán tử Laplace. Cuối cùng, hình 15(g) biểu diễn ước lượng zero crossing thu
được bằng cách quét ngưỡng ảnh và làm nổi phần chuyển tiếp giữa vùng màu đen
và vùng màu trắng.
So sánh hình 15(b) và (g) ta phát hiện ra vài sự khác biệt quan trọng và thú vị.
Trước tiên, chúng ta chú ý thấy biên trong ảnh zero-crossing mảnh hơn biên trong
ảnh gradient. Đây là đặc trưng của zero-crossing làm cho phương pháp được thu
hút. Mặt khác, chúng ta xem trong hình 15(g), biên được xác định bởi zerocrossing hình thành các mạch kín nhiều hơn. Cái này thường được gọi là hiệu ứng
spaghetti, là một trong những mặt hạn chế lớn nhất của phương pháp này. Mặt hạn
chế lớn khác là độ phức tạp của việc tính toán zero crossing, mà việc tính toán này
lại là nền tảng của phương pháp. Mặc dù nó hợp lý trong ví dụ này, nhưng thực tế
việc tính toán zero crossing thường có rất nhiều trở ngại, và để thu được kết quả có
thể chấp nhận được đòi hỏi phải có những kỹ thuật tinh vi hơn ( Huertas và
Medione [1986] ).
Phương pháp zero-crossing được quan tâm sử dụng vì khả năng làm giảm
nhiễu và ẩn đi những biểu diễn gồ ghề. Tuy nhiên, sự hạn chế chỉ nổi rõ khi biểu
diễn một chướng ngại vật khá lớn trong các ứng dụng thực tế. Vì lý do này, các kỹ
thuật tìm biên dựa trên những cách tính gradient khác nhau vẫn thường được sử
dụng hơn phương pháp zero crossing trong việc thực hiện thuật toán phân đoạn.
2. LIÊN KẾT BIÊN VÀ TÁCH ĐƯỜNG GIỚI HẠN :
Những phương pháp đã thảo luận trước đây giúp định ra những pixel nằm trên
biên và sắp xếp các pixel đó vào các tập hợp riêng. Tuy nhiên trong thực tế thì
hiếm khi tập hợp các pixel này xác định 1 cạnh hoàn chỉnh vì có sự xuất hiện của
nhiễu, sự vỡ cạnh do chiếu sáng không đồng đều và các tác động khác tạo ra mật
độ gián đoạn sai lệch . Chính vì vậy mà các giải thuật xác định biên luôn đi kèm

với việc liên kết các thủ tục nhằm tập hợp các pixel thành các cạnh có ý nghĩa. Sau
đây là một vài phương pháp cơ bản:
2.1 Xử lý cục bộ:
Một trong những phương pháp đơn giản nhất để liên kết cạnh là phân tích tính
chất của các pixel trong 1 láng giếng nhỏ (3 �3 hay 5 �5) của những pixel mà đã
được định là 1 điểm của 1 cạnh nào đó bằng 1 trong các phương pháp đã bàn trong
phần trước. Tất cả các điểm mà thỏa một số tính chất định trước nào đó thì được
liên kết lại. Sau cùng ta sẽ có 1 cạnh thỏa các tính chất đã định trước.
Hai tính chất chính được dùng trong phương pháp phân tích này là : (1) Độ dài
của kết quả của toán tử gradient được sử dụng để tạo ra các pixel cạnh; và (2)
Hướng của véctơ gradient. Tính chất đầu tiên sử dụng giá trị của �f :
Phân đoạn ảnh

Trang 19

Liên kết biên và tách đường giới hạn

Nhóm 2: Khanh, Ánh, Thảo, Dương.

2
2
�
�f  mag  �f   �
G

G
x
y
�

� (1-4)
ѻf | Gx | Gy |
Hoặc :
(1-12)
1/ 2

Với

Gx 

�
f
�
f
và G y 
�
y
�
x

Vì vậy một pixel cạnh ( nghĩa là pixel đã được định là 1 điểm của 1 cạnh nào
đó) có tọa độ ( x0 , y0 ) trong một lân cận được xác định trước của (x,y) thì tương
đương với pixel (x,y) về độ lớn nếu:
| �f(ѣ
x, y )
f ( x0 , y0 ) | E
,trong đó E là 1 ngưỡng không âm.
Hướng (góc) của véctơ gradient được đưa ra trong phương trình (1-5), một
pixel cạnh tại ( x0 , y0 ) trong một lân cận cho trước của (x,y) có góc tương tự với
pixel (x,y) nếu:

| ( x, y )  ( x0 , y0 ) | A
, với A là ngưỡng góc không âm.
Như đã chú ý trong phương trình (1-5), hướng của một biên tại (x,y) vuông góc với
hướng của véctơ gradient tại điểm đó.
Một điểm trong lân cận cho trước của (x,y) được liên kết với pixel tại (x,y) nếu
cả tiêu chuẩn về độ lớn và hướng được đáp ứng. Quá trình này được lặp lại tại mọi
vị trí trong bức ảnh. Sẽ có một mẫu tin lưu lại những điểm liên kết với điểm trung
tâm của vùng lân cận lần lượt di chuyển từ pixel này sang pixel khác. Một thủ tục
đánh dấu đơn giản là đưa ra cho mỗi tập hợp các pixel biên liên kết một mức xám
khác nhau.
Để minh họa cho những thủ tục đã nói, hãy nhìn vào hình 16(a) - ảnh chụp phía
sau chiếc xe. Mục đích là để tìm ra hình chữ nhật có kích thước phù hợp với kích
thước của bảng số xe. Thông tin của những hình chữ nhật này có thể được lấy được
bằng cách xác định các cạnh dọc và ngang của chúng. Hình 16(b) và (c) thể hiện
những cạnh dọc và ngang nhận được bằng cách sử dụng toán tử Sobel dọc và
ngang. Hình 16(d) là kết quả nhận được sau khi liên kết tất cả những điểm có giá
trị gradient lớn hơn 25 và hướng của véctơ gradient không khác biệt quá 150 .
Các đường ngang được tạo ra bằng cách sử dụng liên tiếp các tiêu chuẩn trên
cho từng dòng của hình 16(c). Lần lượt quét từng cột của hình 16(b) thì ta có các
cạnh dọc. Hơn nữa quá trình xử lý trên còn bao hàm cả thao tác liên kết các đoạn
cạnh nhỏ bị phân chia do các vết nứt nhỏ và hủy bỏ các đoạn cạnh ngắn cô lập.

Liên kết biên và tách đường giới hạn

Nhóm 2: Khanh, Ánh, Thảo, Dương.

Hình 16
Cuối cùng, như ta thấy ở hình 16(d), hình chữ nhật tương ứng với bảng số xe là 1
trong số các hình chữ nhật được xác định trong ảnh. Và bây giờ thì thật dễ dàng để

định vị bảng số xe dựa vào các hình chữ nhật này (tỉ lệ chiều dài chia chiều cao của
bảng số xe hình chữ nhật luôn là 2:1 với các bảng số của U.S.)
2.2 Liên kết cạnh và tách biên:
Trong phần này, các điểm được liên kết với nhau đầu tiên nếu chúng nằm trên
một đường cong có hình dạng được định trước. Không giống như phương pháp
phân tích cục bộ đã được thảo luận trong phần trước, bây giờ chúng ta lại quan tâm
tới mối quan hệ toàn cục giữa các pixel.
Cho n điểm trên 1 bức ảnh. Giả sử rằng ta muốn tìm ra những tập con của các
điểm thuộc cùng một đường thẳng. Một lời giải khả dĩ là trước tiên tìm ra tất cả các
đường thẳng được xác định bởi mỗi cặp điểm, rồi sau đó tìm các tập con của những
điểm gần với các đường đặc biệt. Vấn đề nảy sinh trong cách làm này là nó bao
n(n  1) n 2
gồm việc xác định ra
đường thẳng và sau đó là khoảng

2
2
n.n(n  1) n3

phép so sánh từng điểm có thuộc ngần ấy đường đó hay không.
2
2
Cách tiếp cận này làm cho việc tính toán trở nên rất phức tạp ngay cả trong các
ứng dụng bình thường nhất.

Liên kết biên và tách đường giới hạn

Nhóm 2: Khanh, Ánh, Thảo, Dương.

Hough [1962] đã đề xuất 1 cách tiếp cận khác, đó là biến đổi Hough (Hough
transform). Xét điểm ( xi , yi ) và phương trình tổng quát của đường thẳng có dạng:
yi  axi  b . Có vô số đường thẳng cùng đi qua ( xi , yi ) , nhưng tất cả chúng đều
có dạng yi  axi  b với các giá trị khác nhau của a và b. Tuy nhiên, khi viết lại

phương trình này dưới dạng b=-ax i  yi và xét mặt phẳng ab (còn gọi là không
gian tham số) ta đưa ra được phương trình của một đường đơn cho một cặp
( xi , yi ) tương ứng. Hơn nữa, một điểm thứ hai ( x j , y j ) cũng có một đường trong
không gian tham số tương ứng với nó, và đường này giao với đường thẳng ứng với
( xi , yi ) tại (a', b'), với (a',b') là giao điểm của đường thẳng chứa cả hai điểm

( xi , yi ) và ( x j , y j ) trong mặt phẳng xy. Thực tế, tất cả mọi điểm trên đường này
đều có các đường trong không gian tham số giao nhau tại (a’,b’). Hình 17 minh
họa cho những khái niệm này.

Hình 17
Sự hấp dẫn trong tính toán của biến đổi Hough bắt nguồn từ việc chia nhỏ
không gian tham số thành những cái gọi là ô tích lũy (accumulator cells) như minh
họa trong hình 18, trong đó (amax , amin ) và (bmax , bmin ) là những khoảng mong đợi
của các giá trị độ dốc (slope) và intercept. Ô ở tọa độ (i,j) (có giá trị tích lũy A(i,j))
tương ứng với hình vuông trong không gian tham số có tọa độ ( ai , b j ) .

Liên kết biên và tách đường giới hạn

Nhóm 2: Khanh, Ánh, Thảo, Dương.

Hình 18
Quá trình xác định các giá trị tích lũy được làm như sau :
B1: Cho mọi giá trị tích lũy A(i,j) = 0.

B2: Với mỗi điểm ( xk , yk ) trong mặt phẳng ảnh.Ta đặt tham số a = giá trị chia
nhỏ trên trục x. Sau đó giải b   xk a  yk rồi làm tròn b tới giá trị gần nhất trên
trục b. Nếu một lựa chọn của ap tìm được bq, chúng ta gán A(p,q) = A(p,q)+1.
B3: Cuối cùng ta thay giá trị Q trong A(i,j) tương ứng với Q điểm trong mặt
phẳng xy nằm trên đường thẳng y  ai x  b j . Số lượng các điểm chia trong mặt
phẳng ab quyết định sự chính xác của sự cộng tuyến của các điểm này.
Chú ý rằng nếu số khoảng chia nhỏ của trục a là K thì ứng với mỗi điểm ảnh
( xk , yk ) , giá trị K của b tương ứng với các giá trị K có thể có của a. Do đó với n
điểm ảnh thì ta chỉ tốn nK phép tính. Vì vậy mà quá trình xử lý này là tuyến tính
theo n, và tích nK không đạt đến số phép tính đã được thảo luận ở đầu phần này trừ
khi K xấp xỉ hoặc lớn hơn n.
Tuy vậy có vấn đề nảy sinh khi sử dụng phương trình y = ax + b để biểu diễn 1
đường thẳng là hệ số góc sẽ tiến tới vô cùng khi đường thẳng “xấp xỉ” trục đứng.
Một cách để khắc phục khó khăn này là sử dụng biểu diễn thông thường của đường
thẳng :
x cos  y sin    (2-3)
Hình 19a minh họa sự giải thích bằng hình học của những tham số được sử
dụng trong phương trình (2-3). Việc sử dụng biểu diễn này trong việc xây dựng
một bảng của những bộ đếm thì giống với phương pháp đã thảo luận cho cách biểu
diễn Slope-intercept. Tuy nhiên, thay vì là những đường thẳng, quỹ tích các điểm
đó lại là các đường hình sin trong mặt phẳng  . Như trên, Q điểm cùng nằm trên

Liên kết biên và tách đường giới hạn

Nhóm 2: Khanh, Ánh, Thảo, Dương.

đường thẳng x cos  j  y sin  j   tạo ra Q đường hình sin giao nhau tại (i ,  j )
trong không gian tham số. Hình 19b biểu diễn việc chia không gian tham số. Tăng
 và giải  tương ứng sẽ thu được Q dữ liệu trong giá trị tích lũy A(i,j) tương ứng

với ô được xác định bởi (i ,  j ) . Hình 19b minh họa việc chia nhỏ cho không gian
tham số.
Khoảng giá trị của  là �
900 , tương ứng với trục x. Do đó với biểu diễn trong
hình 19a, một đường thẳng nằm ngang sẽ có  = 00 và  bằng x-intercept dương.
Tương tự với trường hợp đường thẳng dọc ta có   900 còn  bằng y-intercept
dương , hoặc   900 , với  bằng giá trị y-intercept âm.

Hình 19
Hình 20 minh họa biến đổi Hough dựa vào phương trình (2-3). Hình 20a biểu
diễn ảnh với 5 điểm được đánh số. Mỗi điểm được ánh xạ qua mặt phẳng  như
biểu diễn ở hình 20b. Khoảng giá trị của giá trị  là �
900 , và khoảng của trục 
là � 2D , với D là khoảng cách giữa hai góc trong ảnh. Không giống như biến đổi
dựa trên việc sử dụng slope-intercept, mỗi đường cong có dạng hình sin khác nhau.
Đường nằm ngang là kết quả của việc ánh xạ điểm 1, đó là trường hợp đặc biệt của
một hàm sin với biên độ 0.
Thuộc tính nhận dạng sự cộng tuyến của biến đổi Hough được minh họa trong
hình 20c. Điểm A là giao điểm của những đường cong tương ứng với các điểm 1,3
và 5 trong mặt phẳng ảnh xy. Vị trí của điểm A cho thấy 3 điểm này nằm trên một
đường thẳng đi qua gốc tọa độ (  0) và có hướng là 450 . Tương tự, giao điểm
của những đường cong tại điểm B trong không gian tham số cho thấy các điểm 2,
3, 4 nằm trên một đường thẳng có hướng 450 và khoảng cách của các điểm đó đến
gốc tọa độ bằng nửa khoảng cách đường chéo từ gốc đến góc đối diện của ảnh.

Liên kết biên và tách đường giới hạn

Nhóm 2: Khanh, Ánh, Thảo, Dương.

Hình 20
Cuối cùng, hình 20d cho thấy rằng biến đổi Hough biểu diễn mối quan hệ đối
xứng tại những biên bên trái và bên phải của không cách tham số. Thuộc tính này
được biểu diễn bởi những điểm A, B, C trong hình 20d, là kết quả của phương
pháp với  và  thay đổi dấu tại các đường bao �900 .
Mặc dù biến đổi Hough chủ yếu dành cho đường thẳng nhưng ta vẫn có thể áp
dụng nó cho bất cứ hàm nào có dạng g(v,c) = 0, trong đó v là vector tọa độ và c là
vector hệ số. Ví dụ các điểm nằm trên đường tròn

( x  c1 ) 2  ( y  c2 ) 2  c32 (2-4)
có thể được xác định bằng cách sử dụng phương pháp trên. Sự khác nhau cơ bản là
sự hiện diện của 3 tham số (c 1, c2 và c3), mà kết quả nằm trong không gian tham số
3-D với những khối lập phương và tích lũy có dạng A(i, j, k). Thủ tục này là để
tăng c1, c2, tìm c3 theo phương trình (2-4) và cập nhật giá trị tích lũy cho các ô
tương ứng với bộ ba (c1, c2 và c3). Rõ ràng, độ phức tạp của biến đổi Hough tỉ lệ
với số lượng tọa độ và những hệ số được cho trong phương trình biểu diễn. Hơn
nữa, ta có thể suy rộng biến đổi Hough nhằm nhận diện các đường cong có biểu
diễn không đơn giản, như là ứng dụng của biến đổi ảnh xám.
Bây giờ, chúng ta trở lại vấn đề liên kết cạnh. Một phương pháp dựa trên biến
đổi Hough được trình bày như sau:

Đề tài môn học PHÂN ĐOẠN ẢNH

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về