Tải bản đầy đủ (.docx) (38 trang)

tiểu luận môn xử lý ảnh nâng cao ngưỡng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.49 MB, 38 trang )

TIỂU LUẬN MÔN XỬ LÝ ẢNH NÂNG CAO : NGƯỠNG
Vì tính trực quan và đơn giản thực hiện, ngưỡng hình ảnh một vị trí trung tâm trong
các ứng dụng của phân vùng ảnh. Đơn giản ngưỡng lần đầu tiên được giới thiệu trong
phần 3.1, và chúng ta đã sử dụng nó trong các cuộc thảo luận khác nhau trong các
chương trước. Trong phần này, chúng tôi giới thiệu ngưỡng một cách chính thức hơn
và mở rộng nó để kỹ thuật mà là đáng kể tổng quát hơn những gì đã được trình bày
cho đến nay.
10.3.1 Nền tảng
Giả sử rằng biểu đồ màu xám cấp hình. 10.26 (a) tương ứng với một hình ảnh, f (x,
y), bao gồm các đối tượng ánh sáng trên một nền tối, trong một cách mà đối tượng và
nền pixel có mức xám nhóm lại thành hai chế độ chi phối. Một cách rõ ràng để trích
xuất các đối tượng từ nền là để chọn một ngưỡng T phân cách các chế độ này. Sau đó
bất kỳ điểm (x, y) mà f (x, y) > T được gọi là một điểm đối tượng: nếu không, các
điểm được gọi là một điểm nền. Đây là loại ngưỡng giới thiệu trong phần 3.1.
Hình 10.26 (a) biểu đồ màu xám cấp có thể được phân chia bởi (a) một ngưỡng duy
nhất, và (b) nhiều ngưỡng.
Hình 10.26 (b) cho thấy một trường hợp hơi tổng quát hơn của phương pháp này, nơi
ba chế độ thống trị đặc trưng cho biểu đồ hình ảnh (ví dụ, hai loại đối tượng ánh sáng
trên nền tối). Đây, ngưỡng đa phân loại một điểm (x, y) là thuộc về một lớp đối tượng
nếu T1 <(x, y) <T2, cho lớp đối tượng khác nếu f (x, y)> T2, và nền nếu f (x, y) <T3.
Nói chung, vấn đề phân chia nhỏ đòi hỏi nhiều ngưỡng được giải quyết tốt nhất sử
dụng phương pháp phát triển khu vực, chẳng hạn như những thảo luận trong phần
10.4.
Dựa trên các cuộc thảo luận trước đó, ngưỡng có thể được xem như là một hoạt động
có liên quan đến việc kiểm tra đối với một chức năng T của mẫu
T = T [x, y, p (x, y), f (x, y)] ( 10.3-1)
trong đó f (x, y) là mức xám của điểm (x, y) và p (x, y) biểu thị một số bất động sản
địa phương của điểm-cho ví dụ này, mức độ màu xám trung bình của một khu phố tập
trung vào (x, y) . Một hình ảnh ngưỡng g (x, y) được định nghĩa là
( 10.3-2)
Do đó, các điểm ảnh được dán nhãn 1 (hoặc bất kỳ cấp độ màu xám tiện lợi khác)


tương ứng với các đối tượng trong khi pixel nhãn 0 (hoặc bất kỳ cấp độ xám khác
không giao cho đối tượng tương ứng với nền.
Khi T chỉ phụ thuộc vào f (x, y) (có nghĩa là, chỉ có trên các giá trị màu xám cấp)
ngưỡng được gọi là toàn cầu Nếu T phụ thuộc vào cả hai f (x, y) và p (x, y), ngưỡng
được gọi là cục bộ .Ngoài ra, T phụ thuộc vào các tọa độ không gian x và y ngưỡng
được gọi là động hay thích nghi.
10.3.2 Vai trò của độ sáng
Tại mục 2.3.4 chúng tôi giới thiệu một mô hình đơn giản trong đó hình ảnh của f (x,
y) được hình thành như là sản phẩm của một phản xạ thành phần r (x, y) và lan độ
sáng thành phần i (x, y). Mục đích của việc này phần là sử dụng mô hình này để thảo
luận về một thời gian ngắn ảnh hưởng của ánh sáng trên ngưỡng, đặc biệt là trên
ngưỡng toàn cầu.
Xem xét các máy tính chức năng phản xạ tạo ra hình. 10.27 (a) Các biểu đồ của chức
năng này, thể hiện trong hình. 10,27 (b), rõ ràng là hai mốt và có thể được phân chia
dễ dàng bằng cách đặt một ngưỡng toàn cầu duy nhất, T, trong thung lũng biểu đồ.
Nhân chức năng phản xạ trong hình. 10.27 (a) bởi chức năng chiếu sáng trong hình,
10,27 (c) sản lượng hình ảnh hiển thị trong hình. 10,27 (d). Hình 10.27 (e) cho thấy
biểu đồ của hình ảnh này. Lưu ý rằng các thung lũng ban đầu đã được hầu như bị loại,
làm cho phân chia bởi một ngưỡng duy nhất một nhiệm vụ không thể. Mặc dù chúng
ta hiếm khi có chức năng phản xạ của chính nó để làm việc với, minh hoạ đơn giản
này cho thấy tính chất phản chiếu của các đối tượng và hình nền có thể được như vậy
mà họ có thể dễ dàng tách rời. Tuy nhiên, các kết quả hình ảnh từ nghèo (trong trường
hợp này không đồng dạng) chiếu sáng có thể được khá khó khăn để phân đoạn.

Lý do tại sao các biểu đồ trong hình. 10.27 (e) như vậy là bị biến dạng có thể được
giải thích với trợ giúp của việc thảo luận trong Phần 4.5. Từ biểu thức. (4.5-1)
f(x,y)=i(x,y) r (x,y) (10.3-3)
Lấy logarit tự nhiên của phương trình là tổng :
z(x, y) = ln (x, y)
= ln i(x, y) + ln r(x, y) (10.3-4)

= i '(x, y) + r’(x, y).
Từ lý thuyết xác suất Papoulis [1991] ) , nếu i '( x, y) và r' ( x, y) là các biến ngẫu
nhiên độc lập , các biểu đồ của z ( x, y) được cho bởi chập của các biểu đồ của i '( x,
y) và r' ( x, y) . Nếu i (x , y) không đổi, i'( x, y) sẽ là liên tục cũng có, và biểu đồ của
nó sẽ là đơn giản ( như một xung ) . Phép chập của hàm này với biểu đồ mức xám của
r ' ( x, y) sẽ để lại hình dạng cơ bản của biểu đồ này không thay đổi ( thu hồi từ các
cuộc thảo luận tại mục 4.2.4 mà chập của một chức năng với một xung tương tự các
chức năng tại địa điểm của xung ) . Nhưng nếu i '( x, y) đã có một biểu đồ rộng hơn
(do sự không đồng dạng chiếu sáng ) , quá trình chập sẽ làm bẩn các biểu đồ mức
xám của r' ( x, y) , cho ra một biểu đồ cho z { x, y } có hình dạng khá khác so với biểu
đồ mức xám của r'( x, y) . Mức độ biến dạng phụ thuộc vào bề ngang của biểu đồ của
i '( x, y) , do đó phụ thuộc vào sự không giống nhau của các hàm về độ sáng .
Chúng ta đã xử lý với logarit của f (x, y), thay vì đối phó với các chức năng chụp
ảnh trực tiếp, nhưng bản chất của vấn đề được giải thích rõ ràng bằng cách sử dụng
logarit để tách các thành phần chiếu sáng và phản xạ. Cách tiếp cận này cho phép hình
thành biểu đồ được xem như là một quá trình tích chập, điều này giải thích lý do tại
sao một khe khác biệt trong biểu đồ của các hàm phản xạ có thể bị mờ bởi ánh sáng
không phù hợp.
Khi truy cập vào các nguồn chiếu sáng có sẵn, một giải pháp thường được sử dụng
trong thực tế để bù cho những phần không giống là dự án mô hình chiếu sáng trên một
bề mặt phản chiếu màu trắng liên tục. Điều này mang lại một hình ảnh g (x, y) = ki (x,
y), với k là một hằng số mà phụ thuộc vào bề mặt và i (x, y) là pattern.Then chiếu
sáng, cho bất kỳ hình ảnh của f (x, y ) = i (x, y) r (x, y) thu được với chức năng chiếu
sáng như nhau, chỉ đơn giản là chia f (x, y) bởi g (x, y) mang lại một chức năng bình
thường hóa h (x, y) = f (x , y) / g (x, y) = r (x, y) / k. Vì vậy, nếu r (x, y) có thể được
phân đoạn bằng cách sử dụng một T ngưỡng duy nhất, sau đó h (x> y) có thể được
phân đoạn bằng cách sử dụng một ngưỡng giá trị duy nhất của T / k.
10.3.3 Ngưỡng toàn cầu cơ bản
Với tham chiếu đến các cuộc thảo luận trong mục 10.3.1, đơn giản nhất trong tất cả
các kỹ thuật ngưỡng là phân vùng biểu đồ hình ảnh bằng cách sử dụng một ngưỡng

toàn cầu duy nhất, T, như minh họa trong hình. 10.26 (a). Phân khúc sau đó được thực
hiện bằng cách quét các điểm ảnh hình ảnh của điểm ảnh và ghi nhãn mỗi điểm ảnh
như đối tượng hoặc nền, tùy thuộc vào mức độ màu xám của điểm ảnh đó là lớn hơn
hoặc thấp hơn giá trị của T. Như nêu ở trên, sự thành công của phương pháp này phụ
thuộc toàn bộ trên như thế nào biểu đồ có thể được phân chia.
Hình 10.28 (a) cho thấy một hình ảnh đơn giản, và hình. 10,28 (b) cho thấy biểu đồ
hình của nó 10,28 (c) cho thấy kết quả của việc phân chia hình. 10,28 (a) bằng cách sử
dụng một ngưỡng T nằm giữa các cấp độ màu xám tối đa và tối thiểu. Ngưỡng này đạt
được một "clean" phân khúc bằng cách loại bỏ bóng tối và chỉ để lại các đối tượng tự.
Các đối tượng quan tâm trong trường hợp này là tối hơn nền, do đó bất kỳ điểm ảnh
với một mức độ màu xám ≤ T đã được dán nhãn màu đen (0)., Và bất kỳ điểm ảnh với
một mức độ màu xám> T đã được dán nhãn trong khi (255). mục tiêu chính là chỉ ly
để tạo ra một hình ảnh nhị phân, vì vậy mối quan hệ đen-trắng có thể bị đảo ngược.
Loại ngưỡng toàn cầu vừa mô tả có thể được dự kiến sẽ được thành công trong môi
trường kiểm soát cao. Một trong những lĩnh vực mà điều này thường có thể là trong
các ứng dụng kiểm tra công nghiệp, nơi kiểm soát của ánh sáng thường có tính khả
thi.
Ngưỡng trong ví dụ trên đã được xác định bằng cách sử dụng một phương pháp tiếp
cận heuristic, dựa trên quan sát bằng mắt của thuật toán sau đây histogram.Có thể
được sử dụng để có được T tự động:
1. Chọn một ước tính ban đầu cho T.
2. Phân khúc hình ảnh sử dụng T.This sẽ sản xuất hai nhóm điểm ảnh: G1con ¬ sisting
của tất cả các điểm ảnh với giá trị mức xám> T và G2 bao gồm các điểm ảnh với giá
trị ≤ T.
3. Tính toán các giá trị mức xám trung bình μ1 và μ2 cho các điểm ảnh trong vùng G1
và G2
4. Tính toán một giá trị ngưỡng mới:
T =
)21(
2

1
µµ
+

5. Lặp lại các bước 2 thông qua 4 cho đến khi sự khác biệt trong T trong lần lặp kế
tiếp nhỏ hơn một tham số được xác định trước T0.
Khi có lý do để tin rằng nền và đối tượng chiếm khu vực so sánh trong các hình ảnh,
giá trị ban đầu tốt cho T là mức xám trung bình của hình ảnh. Khi đối tượng là nhỏ so
với các khu vực bị chiếm đóng bởi nền (hoặc ngược lại), sau đó một nhóm các điểm
ảnh sẽ chiếm ưu thế trong biểu đồ và mức độ màu xám trung bình không phải là một
sự lựa chọn tốt ban đầu. Một giá trị ban đầu thích hợp hơn cho T trong trường hợp
như thế này là một giá trị giữa chừng giữa các cấp độ màu xám tối đa và tối thiểu. T
0

các tham số được sử dụng để ngăn chặn các thuật toán sau khi thay đổi trở nên nhỏ về
thông số này. Này được sử dụng khi tốc độ lặp đi lặp lại là một vấn đề quan trọng.
EXAMPLE 10.11: Image segmentation using an estimated global threshold.
Hình 10.29 cho thấy một ví dụ về phân đoạn dựa trên một ngưỡng ước tính bằng cách
sử dụng thuật toán trước đó. Hình 10.29 (a) là hình ảnh ban đầu, và hình. 10.29 (b) là
biểu đồ hình ảnh. Lưu ý các khe rõ ràng của biểu đồ. Áp dụng các thuật toán lặp đi lặp
lại dẫn đến một giá trị 125,4 sau khi ba lần lặp lại bắt đầu với mức độ trung bình và
màu xám
T
0
= 0. Kết quả thu được sử dụng T = 125 phân đoạn hình ảnh ban đầu được thể hiện
trong hình. 10.29 (c). Như đã phân định rõ ràng các chế độ trong biểu đồ, các phân
hóa giữa các đối tượng và hình nền là rất hiệu quả.
10.3.4 Thresholding thích ứng cơ bản
Như minh họa trong Fig.10.27 yếu tố hình ảnh như chiếu sáng không đồng đều có thể
chuyển đổi một biểu đồ hoàn hảo segmentable vào một biểu đồ mà không thể được

phân chia một cách hiệu quả bởi một ngưỡng toàn cầu duy nhất. Một cách tiếp cận để
xử lý một tình huống như vậy là để phân chia hình ảnh ban đầu vào subimages và sau
đó sử dụng một ngưỡng khác nhau để phân đoạn mỗi subimage . Các vấn đề quan
trọng trong cách tiếp cận này là làm thế nào để chia nhỏ các hình ảnh và làm thế nào
để ước tính ngưỡng cho mỗi subimage kết quả. Kể từ khi ngưỡng sử dụng cho mỗi
điểm ảnh phụ thuộc vào vị trí của các điểm ảnh trong các điều khoản của subimages,
loại hình này là ngưỡng thích nghi Chúng tôi minh họa ngưỡng thích nghi với một ví
dụ đơn giản. Một ví dụ toàn diện hơn được đưa ra trong phần tiếp theo.
Hình 10.30 (a) cho thấy hình ảnh từ hình. 10,27 (d), mà chúng tôi kết luận không thể
ngưỡng hiệu quả với một ngưỡng toàn cầu duy nhất. Trong hình. 10.30 (b) cho thấy
kết quả của ngưỡng hình ảnh với một ngưỡng toàn cầu tự đặt trong khe của biểu đồ
của nó [xem hình. 10,27 (e)]. Một cách tiếp cận để giảm hiệu ứng của sự không đồng
dạng chiếu sáng là để chia nhỏ các hình ảnh vào subimages nhỏ hơn, như vậy mà sự
chiếu sáng của mỗi subimage khoảng thống nhất. Hình 10.30 (c) cho thấy một phân
vùng như vậy, thu được bằng cách phân chia hình ảnh thành bốn phần bằng nhau, và
sau đó phân chia từng phần bằng bốn lần nữa.
Tất cả các subimages không chứa một ranh giới giữa đối tượng và nền đã có chênh
lệch dưới 75. Tất cả subimages chứa ranh giới có chênh lệch vượt quá 100. Mỗi
subimage với phương sai lớn hơn 100 là phân đoạn với một ngưỡng tính toán cho rằng
subimage sử dụng thuật toán thảo luận trong các giá trị của phần trước.The trước cho
Tín từng trường hợp được chọn làm điểm giữa chừng giữa các cấp độ màu xám tối
thiểu và tối đa trong subimage. Tất cả subimages với phương sai nhỏ hơn 100 được
coi là một hình ảnh tổng hợp, đó là phân đoạn sử dụng một ngưỡng đơn ước tính bằng
cách sử dụng cùng một thuật toán.
Kết quả của phân khúc sử dụng thủ tục này được thể hiện trong hình. 10.30 (d).
Ngoại trừ hai subimages, sự cải thiện trên hình. 10.30 (b) là điều hiển nhiên. Ranh
giới giữa đối tượng và nền trong mỗi subimages không đúng phân đoạn nhỏ và tối, và
biểu đồ kết quả là gần như unimodal. Hình 10.31 (a) cho thấy đầu không đúng cách
phân đoạn subimage từ hình. 10.30 (c) và subimage trực tiếp trên nó. đó là phân đoạn
đúng. Các biểu đồ của subimage đó là đúng phân đoạn rõ ràng là hai đỉnh, đỉnh điểm

rõ ràng và thung lũng. Các biểu đồ khác là gần như unimodal, không có phân biệt rõ
ràng giữa các đối tượng và nền
Hình 10.31 (d) cho thấy subimage không được chia nhỏ thành subimages nhỏ
hơn nhiều, và hình. 10.31 (e) cho thấy biểu đồ của hàng đầu, trái nhỏ subimage.This
subimage có sự chuyển tiếp giữa đối tượng và nền. Subimage này nhỏ hơn có một
biểu đồ rõ ràng hai mốt và phải được dễ dàng segmentable. Điều này, trên thực tế, là
trường hợp, như thể hiện trong hình. 10.31 (f). Con số này cũng cho thấy các phân
đoạn của tất cả các subimages nhỏ khác. Tất cả những subimages có một biểu đồ gần
unimodal, và mức độ màu xám trung bình của họ là gần hơn với đối tượng hơn nền, vì
vậy tất cả chúng được xếp vào nhóm đối tượng. Nó là trái như một dự án để cho người
đọc thấy rằng phân khúc đáng kể chính xác hơn có thể đạt được bằng cách phân chia
toàn bộ hình ảnh trong hình. 10.30 (a) vào subimages của kích thước hình. 10.31 (d)
Ngưỡng tối ưu và thích ứng toàn cầu
Trong phần này, chúng tôi thảo luận về phương pháp ước lượng ngưỡng đầu ra tối
thiểu lỗi phân vùng trung bình . Như một minh hoạ, phương pháp này được áp dụng
cho một vấn đề đòi hỏi phải có giải pháp của một số vấn đề quan trọng tìm thấy
thường xuyên trong các ứng dụng thực tế của ngưỡng
Hình 10.31 (a) subimages phân đoạn đúng và không đúng từ hình, 10.30. (b) - (c)
biểu đồ tương ứng, (d) chia nhỏ hơn nữa của subimage phân đoạn không đúng , (e)
Histogram của subimage nhỏ ở đầu , trái, (f) Kết quả phân chia thích nghi (d)
Giả sử rằng một hình ảnh chỉ chứa hai vùng màu xám cấp chính. Cho z biểu thị giá
trị màu xám cấp. Chúng ta có thể xem các giá trị như số lượng ngẫu nhiên, và biểu đồ
của họ có thể được coi là một ước tính hàm mật độ xác suất (PDF), p (z). Hàm mật độ
tổng thể này là tổng hợp hoặc hỗn hợp của hai mật độ. một cho ánh sáng và một cho
các vùng tối trong hình ảnh. Hơn nữa, các thông số hỗn hợp là tỷ lệ thuận với khu vực
tương đối của các vùng tối và sáng. Nếu hình thức của mật độ được biết đến hoặc đã
thừa nhận, nó có thể xác định một ngưỡng tối ưu (về lỗi tối thiểu) để phân chia hình
ảnh thành hai khu vực riêng biệt.
Hình 10.32 cho thấy hai hàm mật độ xác suất. Cho rằng lớn hơn mô tả các mức độ
màu xám của các đối tượng trong hình ảnh. Hàm mật độ xác suất hỗn hợp mô tả các

biến thể màu xám cấp tổng thể trong hình ảnh là
p(z) = P
1
p
1
(z) + P
2
p
2
(z) (10.3-5)
Đây, P1 và P2 là xác suất của sự xuất hiện của hai lớp của điểm ảnh, đó là, P1 là
xác suất (một số) mà một điểm ảnh ngẫu nhiên với giá trị z là một điểm ảnh đối tượng.
Tương tự như vậy, P2 là xác suất mà các điểm ảnh là một điểm ảnh nền. Chúng tôi giả
định rằng bất kỳ điểm ảnh được thuộc về một trong hai đến một đối tượng hoặc nền,
do đó
P1 + P2 = 1
Một hình ảnh là phân đoạn bằng cách phân loại như nền tất cả các pixel có mức
xám lớn hơn một ngưỡng T (xem hình. 10,32). Tất cả các điểm ảnh khác được gọi là
điểm ảnh đối tượng. Mục tiêu chính của chúng tôi là chọn giá trị của T là giảm thiểu
các lỗi trung bình trong việc đưa ra các quyết định mà một điểm ảnh được thuộc về
một đối tượng hoặc nền.
Nhớ lại rằng xác suất của một biến ngẫu nhiên có giá trị trong khoảng [a, b] là bộ
của hàm mật độ xác suất của nó từ a đến b, đó là khu vực của đường cong PDF giữa
hai giới hạn này. Như vậy, xác suất lỗi phân loại một điểm nền là một điểm đối tượng

E
1
(T) = (10.3-7)
Đây là khu vực dưới đường cong của p
2

(z) bên trái của ngưỡng. Tương tự như
vậy, xác suất lỗi phân loại một điểm đối tượng như nền
E
2
(T) = (10.3-8)
which is the area under the curve of p
1
(z) to the right of T. Then the overall
probability of error is
E(T) = P
2
E
1
(T) + P
1
E
2
(T) (10.3-9)
Lưu ý rằng số lượng E
1
và E
2
quan trọng (tầm quan trọng nhất định) bởi xác suất
xuất hiện của các đối tượng hoặc ảnh nền. Cũng lưu ý rằng các kí hiệu trái ngược
nhau. Đây đơn giản để giải thích. Xem xét, ví dụ, trường hợp cực đoan, trong đó điểm
nền được biết đến không bao giờ xảy ra. Trong trường hợp này P
2
= 0. Đóng góp cho
sự lỗi tổng thể (E) phân loại một điểm nền là một điểm đối tượng (E
1

) nên bị lỗi ngoài
vì điểm nền được biết đến không bao giờ xảy ra. Này được thực hiện bằng cách nhân
E
1
bởi P
2
= 0. Nếu nền và đối tượng điểm đều có khả năng xảy ra, thì trọng lượng là P
1
= P
2
= 0,5.
Để tìm giá trị ngưỡng mà lỗi này là tối thiểu yêu cầu phân biệt E (T) đối với T (sử
dụng quy tắc Leibniz) và tương đương với kết quả là 0. Kết quả là
P
1
p
1
(T) = P
2
p
2
(T) (10.3-10)
Phương trình này được giải quyết cho T để tìm ra ngưỡng tối ưu. Lưu ý rằng nếu
P1 = P2, sau đó ngưỡng tối ưu là nơi mà các đường cong cho p1 (z) và p2 (z) giao
nhau (xem hình, 10.32).
Có được một biểu hiện phân tích cho T đòi hỏi chúng ta biết các phương trình cho
hai file PDF. Ước tính các mật độ trong thực tế không phải lúc nào cũng khả thi, và
một cách tiếp cận được sử dụng thường là sử dụng mật độ có các tham số hợp lý đơn
giản để có được. Một trong những mật độ chính được sử dụng theo cách này là mật độ
Gauss, được đặc trưng hoàn toàn bởi hai thông số: giá trị trung bình và phương sai.

Trong trường hợp này:
p(z) = + (10.3-11)
nơi and là giá trị trung bình và phương sai của mật độ Gauss của một lớp học của các
điểm ảnh (nói, các đối tượng) và and là giá trị trung bình và phương sai của các lớp
khác. Sử dụng phương trình này trong các giải pháp chung của phương trình. (10.3-
10) kết quả trong các giải pháp sau đây đối với ngưỡng T
A + BT + C = 0 (10.3-12)
Khi đó
A =
B = (10.3-13)
C = +
Từ một phương trình bậc hai có hai giải pháp có thể, hai giá trị ngưỡng có thể
được yêu cầu để có được những giải pháp tối ưu.
Nếu phương sai bằng nhau ngưỡng duy nhất là đủ:
T = (10.3-14)
Thay vì giả định một hình thức chức năng cho p (z), một cách tiếp cận có nghĩa là
vuông lỗi tối thiểu có thể được sử dụng để ước tính một hỗn hợp màu xám PDF cấp
một hình ảnh từ các hình ảnh từ biểu đồ. Ví dụ, lỗi vuông trung bình giữa (liên tục)
hỗn hợp mật độ p (z) và (rời rạc) hình ảnh biểu đồ
h (z
i
) là
e
ms =
(10.3-15)
nơi một biểu đồ n-điểm được giả định. Lý do chính cho việc đánh giá mật độ hoàn
thành là để xác định có hay không có chế độ chiếm ưu thế trong các file PDF. Ví dụ,
hai chế độ chi phối cho thấy sự hiện diện của các cạnh trong hình ảnh (hoặc khu vực)
trong đó các file PDF được tính
Nói chung, phân tích xác định các thông số để giảm thiểu lỗi này hình vuông có

nghĩa không phải là một vấn đề đơn giản. Ngay cả đối với các trường hợp Gaussian,
tính toán đơn giản của tương đương các đạo hàm riêng đến 0 dẫn đến một tập hợp các
phương trình siêu việt đồng thời thường chỉ có thể được giải quyết bằng thủ tục số,
chẳng hạn như một gradient liên hợp hoặc phương pháp của Newton cho phương trình
phi tuyến đồng thời.
Sau đây là một trong những ví dụ đầu tiên về phân chia bởi ngưỡng tối ưu trong
xử lý hình ảnh. Ví dụ này là đặc biệt thú vị tại điểm này bởi vì nó cho thấy kết quả
phân đoạn có thể được cải thiện bằng cách sử dụng các kỹ thuật tiền xử lý dựa trên
các phương pháp phát triển trong cuộc thảo luận của chúng ta về nâng cao hình ảnh.
Ngoài ra, ví dụ này cũng minh họa việc sử dụng các biểu đồ dự toán địa phương và
ngưỡng thích nghi. Các vấn đề chung là để phác thảo tự động ranh giới của tâm thất
trái tim trong cardioangiograms (hình ảnh X-quang của một trái tim đã được tiêm một
chất cản quang). Phương pháp thảo luận ở đây được phát triển bởi Chow và Kaneko
[1972] cho phác thảo ranh giới của tâm thất trái của tim.
Trước khi phân khúc, tất cả các hình ảnh được tiền xử lý như sau: (1) Mỗi điểm
ảnh được ánh xạ với một chức năng đăng nhập (xem Phần 3.2.2) để chống lại hiệu
ứng theo cấp số nhân gây ra bởi sự hấp thụ phóng xạ. (2) Một hình ảnh thu được trước
khi áp dụng các chất cản quang đã trừ đi từ mỗi hình ảnh được chụp sau khi vừa được
tiêm để loại bỏ hiện tại cột sống trong cả hai hình ảnh (xem Phần 3.4.1). (3) Một số tia
X quang được tổng kết để lại giúp giảm nhiễu ngẫu nhiên (xem Phần 3.4.2). Hình
10,33 cho thấy một cardioangiogram trước và sau khi tiền xử lý (một lời giải thích của
các khu vực được đánh dấu A và B được đưa ra trong đoạn sau).
Để tính toán ngưỡng tối ưu, mỗi hình ảnh xử lý trước được chia thành 49 khu vực
bằng cách đặt một
7 x 7 lưới với 50% chồng lên nhau trên mỗi hình ảnh (tất cả các hình ảnh ban đầu thể
hiện trong ví dụ này có kích thước 256 x 256 pixel). Mỗi phòng trong số kết quả các
khu vực chồng chéo 49 chứa 64 x 64 pixel. Hình ¬ ures 10.34 (a) và 10.34 (b) là
những biểu đồ của các khu vực được đánh dấu A và B trong hình. 10,33 (b). Lưu ý
rằng các biểu đồ cho khu vực một cách rõ ràng là hai mốt, cá Cating sự hiện diện của
một ranh giới. Biểu đồ cho khu vực B, tuy nhiên, là đơn phương thức, cho thấy sự

vắng mặt của hai khu vực riêng biệt rõ rệt.
Sau khi tất cả 49 biểu đồ được tính toán, một bài kiểm tra bimodality được thực
hiện để loại bỏ các biểu đồ còn lại histograms.The unimodal sau đó được trang bị bởi
hai đỉnh đường cong mật độ Gaussian [xem phương trình. (10,3-11)] sử dụng một
gradient liên hợp đồi leo phương pháp để giảm thiểu hàm lỗi được đưa ra trong
phương trình. (10,3-15). X và O trong hình. 10.34 (a) là hai phù hợp với biểu đồ thể
hiện trong các chấm đen. Các ngưỡng tối ưu đã được sau đó thu được bằng cách sử
dụng EQS. (10,3-12) và (10,3-13).
Ở giai đoạn này của quá trình chỉ các khu vực với biểu đồ hai mốt được phân
ngưỡng. Các ngưỡng cho các khu vực còn lại đã thu được bằng cách nội suy các
ngưỡng này. Sau đó, một suy thứ hai được thực hiện từng điểm bằng cách sử dụng các
giá trị ngưỡng lân cận do đó, vào cuối các thủ tục, tất cả các điểm trong hình ảnh đã
được chỉ định một ngưỡng. Cuối cùng, một quyết định nhị phân được thực hiện cho
mỗi điểm ảnh bằng cách sử dụng quy tắc.
Sử dụng các đặc tính biên cho cải thiện biểu đồ và Thresholding cục bộ
Dựa trên các cuộc thảo luận trong các năm phần trước, nó là trực giác rõ ràng
rằng cơ hội để lựa chọn một ngưỡng "tốt" được tăng cường đáng kể nếu các đỉnh biểu
đồ là cao, hẹp, đối xứng, và cách nhau bởi các thung lũng sâu. Một cách tiếp cận để
cải thiện hình dạng của biểu đồ là để xem xét chỉ những điểm ảnh nằm trên hoặc gần
các cạnh giữa các đối tượng và hình nền. một cải tiến ngay lập tức và rõ ràng là biểu
đồ sẽ ít phụ thuộc vào kích thước tương đối của các đối tượng và nền. Ví dụ, biểu đồ
của một hình ảnh bao gồm một đối tượng nhỏ trên một diện tích nền lớn (hoặc ngược
lại) sẽ được thống trị bởi một đỉnh lớn do nồng độ cao của một loại các điểm ảnh. hình
10.30 và 10.31 là một minh họa tốt về cách thức thực hiện phân chia nhỏ bị ảnh hưởng
bởi điều này điều kiện.
Nếu chỉ có các điểm ảnh trên hoặc gần mép giữa các đối tượng và hình nền được sử
dụng, biểu đồ kết quả sẽ có đỉnh xấp xỉ cùng một chiều cao. Ngoài ra, khả năng mà
bất kỳ của những điểm ảnh được nằm trên một đối tượng sẽ được xấp xỉ bằng xác suất
mà nó nằm trên nền, do đó cải thiện tính đối xứng của các đỉnh biểu đồ. Cuối cùng.
như đã nêu trong các đoạn sau đây, sử dụng điểm ảnh đáp ứng một số biện pháp đơn

giản dựa trên gradient và Laplacian các nhà khai thác có xu hướng làm sâu sắc thêm
các thung lũng giữa đỉnh biểu đồ.
Vấn đề chính với cách tiếp cận chỉ thảo luận là các giả định ngầm rằng các cạnh
giữa các đối tượng và nền được biết đến. Thông tin này rõ ràng là không có sẵn trong
phân khúc, như việc tìm kiếm một phân chia giữa các đối tượng và nền là chính xác
những gì phân khúc là tất cả về. Tuy nhiên, từ các cuộc thảo luận trong mục 10.1.3,
chỉ số cho biết một điểm ảnh trên một cạnh có thể thu được bằng cách tính toán độ
dốc của nó. Ngoài ra, sử dụng là Laplacian có thể mang lại thông tin về việc liệu có
một điểm ảnh được nằm trên mặt tối hoặc ánh sáng của một cạnh. Giá trị trung bình
của Laplacian là 0 ở sự chuyển đổi của một cạnh (xem hình. 10.6). trong thực tế các
thung lũng của biểu đồ hình thành từ các điểm ảnh được chọn bởi một gradient /
Laplacian tiêu chí có thể được dự kiến sẽ được dân cư thưa thớt. Thuộc tính này là
kết quả của các rảnh sâu đã thảo luân trước đó.
Gradient ∇f tại điểm bất kỳ (x, y) trong một hình ảnh được cho bởi phương trình
(10,1-4) hoặc (10,1-12). Tương tự như vậy, các Laplacian f được cho bởi phương
trình. (10,1-14) hoặc (10,1-15). Hai với số lượng có thể được sử dụng để tạo thành
một hình ảnh ba cấp, như sau:
nơi mà các ký hiệu 0, + và - đại diện cho bất kỳ ba cấp độ màu xám khác nhau, T là
một ngưỡng, và gradient và Laplacian được tính ở mọi điểm (x, y). Cho một đối tượng
tối trên một nền ánh sáng, và có sự tham khảo hình. 10.6, việc sử dụng các phương
trình. (10,3-36) tạo ra hình ảnh của (x, y), trong đó (1) tất cả các điểm mà không phải
là trên một cạnh (được xác định bởi ∇ f là ít hơn so với T) được dán nhãn 0, (2) tất cả
các điểm ảnh trên bóng tối bên cạnh được dán nhãn +, và (3) tất cả các điểm ảnh trên
bên ánh sáng của một cạnh được dán nhãn -, các ký hiệu + và - trong phương trình.
(10.3-16) được đảo ngược cho một đối tượng ánh sáng trên nền tối. Con số 10.36 cho
thấy ghi nhãn sản xuất bởi phương trình. (10.3-16) cho một hình ảnh của nền tối, nhấn
mạnh việc mất khi viết trên nền sáng.
Các thông tin thu được với điều này có thể được sử dụng để tạo ra một phân đoạn,
hình ảnh nhị phân trong đó 1 's tương ứng với đối tượng quan tâm và 0 của tương ứng
với nền. Quá trình chuyển đổi (dọc theo một đường quét ngang hay dọc) từ một nền

ánh sáng cho một đối tượng tối phải được đặc trưng bởi sự xuất hiện của một - theo
sau là một + trong s (x, y). Bên trong các đối tượng bao gồm các điểm ảnh được dán
nhãn hoặc là 0 hoặc +. Cuối cùng, quá trình chuyển đổi từ đối tượng quay trở lại nền
được đặc trưng bởi sự xuất hiện của một + theo sau là một - Như vậy, một dòng quét
ngang hoặc thẳng đứng chứa một phần của một đối tượng có cấu trúc sau
( ) (-, +) (0 hoặc +) (+, -) ( )
( ) đại diện cho bất kỳ sự kết hợp của +, -, và 0. Các dấu ngoặc chứa đối tượng, điểm
và được dán nhãn 1. Tất cả các điểm khác dọc theo đường quét tương tự được dán
nhãn 0, ngoại trừ bất kỳ chuỗi khác (0 hoặc +) giới hạn bởi (-, +) và (+, -).
Hình 10.37 (a) cho thấy một hình của một ảnh kiểm tra ngân hàng bình thường .
Hình 10.38 cho thấy biểu đồ như một chức năng của các giá trị độ dốc cho các điểm
ảnh với độ dốc lớn hơn 5. Lưu ý rằng biểu đồ này có hai chế độ chi phối là đối xứng.
gần của cùng một chiều cao, và được ngăn cách bởi một thung lũng riêng biệt. Cuối
cùng. Vả. 10,37 (b) cho thấy hình ảnh phân đoạn thu được bằng cách sử dụng phương
trình. (10,3-16) với tôi tại hoặc gần trung điểm của thung lũng. Kết quả đã được thực
hiện nhị phân bằng cách sử dụng các phân tích trình tự chỉ thảo luận. Lưu ý rằng ví dụ
này là một minh chứng của ngưỡng cục bộ , như được định nghĩa trong phương trình.
(10,3-1), bởi vì giá trị của T được xác định từ một biểu đồ của gradient và Laplacian,
là thuộc tính cục bộ
.
Ngưỡng cơ bản dựa trên một số biến
Vì vậy, đến nay chúng tôi đã quan tâm đến ngưỡng mức màu xám. Trong một số
trường hợp, một bộ cảm biến có thể làm cho có sẵn nhiều hơn một biến để mô tả mỗi
điểm ảnh trong một hình ảnh, và do đó cho phép theresholding đa phổ. Như thảo luận
chi tiết trong phần 6.7, màu sắc hình ảnh là một ví dụ điển hình, trong đó mỗi điểm
ảnh được đặc trưng bởi ba giá trị RGB, trong trường hợp này, việc xây dựng một 3-D
"biểu đồ" trở thành có thể. Các thủ tục cơ bản là tương tự như phương pháp sử dụng
cho một biến. Ví dụ, đối với một hình ảnh với ba biến (các thành phần RGB), từng có
16 cấp độ có thể, một x 16 lưới 16 x16 (khối lập phương) được hình thành. chèn trong
mỗi tế bào của khối lập phương là số lượng điểm ảnh có các thành phần RGB có giá

trị tương ứng với các tọa độ xác định vị trí của mà tế bào đặc biệt. Mỗi mục được chia
cho tổng số lượng điểm ảnh trong hình ảnh để tạo thành một biểu đồ bình thường.
Các khái niệm về ngưỡng bây giờ trở thành một trong việc tìm kiếm các cụm điểm
trong không gian 3 chiều. Giả sử, ví dụ, cụm đáng kể K điểm được tìm thấy trong biểu
đồ. Hình ảnh có thể được phân đoạn bằng cách chỉ định một giá trị tùy ý (ví dụ: trong
khi) các điểm ảnh RGB có thành phần gần gũi hơn với một cụm và giá trị khác (ví
dụ : đen) để các điểm ảnh trong hình ảnh. Khái niệm này có thể dễ dàng mở rộng để
các thành phần khác và chắc chắn các cụm hơn. Khó khăn chủ yếu là tư lợi cụm trở
thành một nhiệm vụ ngày càng phức tạp như số lượng các biến tăng. Cụm tìm kiếm
các phương pháp có thể được tìm thấy, ví dụ, trong các cuốn sách của Duda, Hart, và
Stork [2001], và Tou và Gonzalez [1974]
Những hình ảnh thể hiện trong hình. 10.39 (a) là một hình ảnh đơn sắc của một bức
ảnh màu. Những hình ảnh màu sắc ban đầu bao gồm ba hình ảnh RGB 16 độ. Chiếc
khăn là một màu đỏ rực rỡ, và mái tóc và màu sắc trên khuôn mặt được ánh sáng và
khác nhau về đặc điểm quang phổ từ cửa sổ và các tính năng cơ bản khác.
Ví dụ 10.15
Hình 10.39 (b) thu được bằng cách ngưỡng về một trong những cụm biểu đồ
tương ứng với tông màu trên khuôn mặt. Lưu ý rằng cửa sổ, trong hình ảnh đơn sắc
gần về giá trị màu xám cấp cho tóc, không xuất hiện trong hình ảnh phân đoạn do việc
sử dụng các đặc điểm đa phổ để phân cách giữa hai khu vực này. Hình 10.39 (c) thu
được bằng cách ngưỡng về một nhóm gần với trục màu đỏ. Trong trường hợp này chỉ
có chiếc khăn và một phần của một bông hoa (có màu đỏ cũng) xuất hiện trong kết
quả phân đoạn. Ngưỡng được sử dụng để có được cả hai kết quả là một khoảng cách
của một tế bào. Do đó bất kỳ điểm ảnh có thành phần là bên ngoài tế bào bao quanh
trung tâm của cụm trong câu hỏi đã được phân loại là nền (màu đen). Pixel mà thành
phần đặt chúng bên trong tế bào được mã hóa màu trắng.
Như đã thảo luận trong phần 6.7, phân khúc màu sắc có thể được dựa trên bất kỳ
của các mô hình màu giới thiệu trong chương 6. Ví dụ, màu sắc và độ bão hòa là tài
sản quan trọng trong nhiều ứng dụng xử lý việc sử dụng hình ảnh để kiểm tra tự động.
Các tính chất này đặc biệt quan trọng trong nỗ lực cạnh tranh với các chức năng tương

đương được thực hiện bởi con người, chẳng hạn như trong việc kiểm tra các loại trái
cây cho chín hoặc trong việc kiểm tra hàng hóa sản xuất. Như đã đề cập trong Chương
6,the Hue, Saturation, Cường độ (HSI) mô hình lý tưởng cho các loại ứng dụng bởi vì
nó liên quan chặt chẽ đến cách thức mà con người mô tả nhận thức về màu sắc. Một
cách tiếp cận phân khúc bằng cách sử dụng màu sắc và độ bão hòa các thành phần của
một tín hiệu màu sắc cũng đặc biệt hấp dẫn, vì nó liên quan đến 2-D cụm dữ liệu được
dễ dàng hơn để phân tích hơn, nói rằng, các cụm 3-D cần thiết cho RGB phân khúc.
10.4 Phân đoạn vùng cơ bản
Mục tiêu của phân khúc là phân chia một hình ảnh thành các vùng. Trong Mục
10.1 và 10.2, chúng tôi tiếp cận vấn đề này bằng cách tìm ranh giới giữa các khu vực
dựa trên không liên tục trong mức độ màu xám, trong khi đó tại mục 10.3 phân chia
được thực hiện thông qua các ngưỡng dựa trên việc phân phối các tính điểm ảnh,
chẳng hạn như giá trị màu xám cấp hoặc màu sắc. Trong phần này, chúng tôi thảo
luận về kỹ thuật phân chia nhỏ dựa trên việc tìm kiếm các khu vực trực tiếp.
10.4.1 Công thức cơ bản
Cho R đại diện cho toàn bộ khu vực hình ảnh. Chúng tôi có thể xem như một quá trình
phân chia phân vùng R vào n tiểu vùng R
1
, R
2
, ,R
n
sao cho
(a) = R
(b) Ri is a connected region i = 1,2, …,n
(c) Ri = Ø for all i and j , i ≠ j
(d) P (Ri) = TRUE for i = 1,2, …,n
(e) P (Ri ) =FALSE for i ≠ j
Dưới đây, P (Ri) là một vị từ logic xác định qua các điểm trong thiết Ri và Ø tập vô
giá trị.

Điều kiện (a) chỉ ra rằng các phân khúc phải đầy đủ, có nghĩa là mỗi điểm ảnh phải ở
trong một khu vực. Điều kiện (b) yêu cầu điểm trong một khu vực phải được kết nối
trong một số ý nghĩa được xác định trước (xem mục 2.5.2 về kết nối)
Điều kiện (c) chỉ ra rằng các khu vực phải được tách rời. Điều kiện (d) được giả quyết
với các thuộc tính đó phải được đáp ứng bởi các điểm ảnh trong một khu vực được
phân đoạn cho ví dụ P (Ri) = TRUE nếu tất cả các điểm trong R, có các cùng các cấp
độ màu xám . Cuối cùng, điều kiện (e) chỉ ra rằng khu vực Ri và Rj khác nhau về ý
nghĩa của vị P
Khu vực đang phát triển
Như tên gọi của nó, phát triển khu vực là một thủ tục mà các nhóm pixel hoặc tiểu
vùng trong khu vực lớn hơn dựa trên các tiêu chí được xác định trước. Phương pháp
tiếp cận cơ bản là bắt đầu với một tập hợp các "hạt " điểm và từ các khu vực trồng cây
bằng cách phụ thêm cho mỗi hạt những điểm ảnh lân cận có đặc tính tương tự như hạt
(chẳng hạn như phạm vi cụ thể của các cấp độ màu xám hoặc màu).
Lựa chọn một tập hợp của một hoặc nhiều điểm bắt đầu thường xuyên có thể dựa
vào bản chất của vấn đề, được hiển thị trong Ví dụ 10,16. Khi một thông tin tiên là
không có sẵn, thủ tục để tính toán tại mỗi điểm ảnh cùng một thuộc tính mà cuối cùng
sẽ được sử dụng để phân điểm ảnh để khu vực trong quá trình phát triển. Nếu kết quả
của những tính toán cho cụm các giá trị, các điểm ảnh có tính chất đặt chúng gần
trọng tâm của các cụm có thể được sử dụng như hạt giống.
Việc lựa chọn các tiêu chí tương tự không chỉ phụ thuộc vào vấn đề đang được xem
xét, nhưng cũng vào loại dữ liệu hình ảnh có sẵn. Ví dụ, việc phân tích các hình ảnh
vệ tinh sử dụng đất phụ thuộc nhiều vào việc sử dụng màu sắc. Vấn đề này sẽ là khó
khăn hơn, hoặc thậm chí không thể, để xử lý mà không có thông tin vốn có sẵn trong
hình ảnh màu sắc. Khi những hình ảnh đơn sắc, phân tích khu vực phải được thực hiện
với một bộ mô tả dựa trên mức độ màu xám và thuộc tính không gian (chẳng hạn như
những khoảnh khắc hoặc kết cấu). Chúng tôi thảo luận về mô tả đặc tính hữu ích cho
khu vực trong chương 11.
Mô tả chỉ có thể mang lại kết quả sai lệch nếu kết nối hoặc kề thông tin không được
sử dụng trong quá trình phát triển vùng. Ví dụ, hình dung một sự sắp xếp ngẫu nhiên

của các điểm ảnh chỉ có ba giá trị màu xám cấp riêng biệt. Nhóm pixel với mức cùng
một màu xám để tạo thành một "khu vực" mà không chú ý đến kết nối sẽ mang lại
một kết quả phân đoạn đó là vô nghĩa trong cuộc thảo luận này.
Một vấn đề khác phát triển trong khu vực là xây dựng một quy luật dừng lại. Về cơ
bản, phát triển một khu vực nên dừng lại khi không có nhiều điểm ảnh đủ tiêu chuẩn
để đưa vào khu vực đó. Các tiêu chí như mức độ màu xám, kết cấu và màu sắc, là địa
phương trong tự nhiên và không có tính "lịch sử" của tăng trưởng khu vực. Tiêu chí
bổ sung làm tăng sức mạnh của một thuật toán region-growing sử dụng các khái niệm
về kích thước, giống như giữa một điểm ảnh ứng cử viên và các điểm ảnh phát triển
cho đến nay (như so sánh về mức độ màu xám của một ứng cử viên và các cấp độ màu
xám trung bình của khu vực phát triển), và hình dạng của khu vực đang được trồng.
Việc sử dụng các loại mô tả là dựa trên giả định rằng một mô hình của kết quả mong
đợi ít nhất là một phần có sẵn.
Hình 10.40 (a) cho thấy một hình ảnh X-quang của một mối hàn (khu vực tối
ngang) có chứa một số vết nứt và porosities (sáng, vệt trắng chạy ngang qua giữa của
hình ảnh). Chúng tôi muốn sử dụng khu vực đang phát triển để phân đoạn các khu vực
của thất bại hàn. Các tính năng phân đoạn có thể được sử dụng để kiểm tra, để đưa
vào một cơ sở dữ liệu của nghiên cứu lịch sử, để điều khiển một hệ thống hàn tự động,
và cho nhiều ứng dụng khác.
10.4 Vùng tách và sát nhập
Thủ tục chỉ thảo luận phát triển khu vực từ một tập hợp các điểm hạt giống. Một
cách khác là chia nhỏ một hình ảnh ban đầu vào một tập hợp các tùy ý, khu vực rời
rạc và sau đó hợp nhất và phân chia các khu vực trong một nỗ lực để đáp ứng các điều
kiện quy định tại mục 10.4.1. Một sự chia rẽ và hợp nhất các thuật toán mà lặp đi lặp
lại quá trình tiến tới đáp ứng những khó khăn này được phát triển tiếp theo.
Cho R đại diện cho toàn bộ khu vực hình ảnh và chọn một vị P. Một cách tiếp cận
đối với phân khúc R là chia nhỏ tiếp thành các vùng hạ sườn nhỏ hơn và nhỏ hơn do
đó, đối với bất kỳ Ri khu vực, P (Ri) = TRUE. Chúng tôi bắt đầu với toàn bộ khu vực.
Nếu P (R) = FALSE, chúng tôi chia hình ảnh vào góc phần tư. Nếu P là FALSE cho
bất kỳ góc phần tư, chúng tôi chia nhỏ góc phần tư đó vào subquadrants, và như vậy.

Kỹ thuật tách biệt này có một đại diện thuận tiện trong các hình thức của một cây
phàn tư cái gọi là (có nghĩa là, một cây mà các nút có chính xác bốn cháu), như minh
họa trong hình. 10.42. Lưu ý rằng thư mục gốc của cây tương ứng với toàn bộ hình
ảnh và mỗi nút tương ứng với một phân khu. Trong trường hợp này, chỉ R
4
được chia
thêm
Nếu chỉ tách được sử dụng, phân vùng cuối cùng có khả năng có các khu
vực liền kề với tính chất giống nhau. Trở ngại này có thể được khắc phục bằng
cách cho phép sát nhập, cũng như chia tách. Đáp ứng các hạn chế của Mục
10.4.1 yêu cầu sát nhập chỉ có các vùng lân cận có pixel kết hợp đáp ứng các vị
P. Đó là, hai khu vực liền kề R
i
và R
k
được sáp nhập chỉ khi P (R U RK) =
TRUE.
Các cuộc thảo luận trên có thể được tóm tắt bởi các thủ tục sau đây, trong đó, tại
bất cứ bước nào chúng ta có
(1)Chia thành bốn phần phân chia bất kỳ R
i
khu vực, trong đó P (R
i
) = FALSE.
(2)Hợp nhất bất kỳ khu vực lân cận R
i
và R
k
cho P (R U R
k

) = TRUE.
(3) Dừng lại khi không tiếp tục sáp nhập hoặc chia tách được
Một số dạng biến thể cơ bản của đề tài trước đó là có thể. Ví dụ, một khả năng là
để phân chia các hình ảnh ban đầu vào một tập hợp các khối. Tách xa hơn được thực
hiện như mô tả trước đây, nhưng kết hợp ban đầu giới hạn ở nhóm bốn khối là lớp sau
trong các đại diện cây phần tư và đáp ứng các vị P . Khi không tiếp tục hợp nhất của
loại này là có thể, thủ tục được kết thúc bằng một kết hợp cuối cùng của khu vực đáp
ứng bước 2. Tại thời điểm này, các khu vực sáp nhập có thể có kích thước khác nhau.
Ưu điểm chính của phương pháp này là nó sử dụng cây phần tư tương tự cho tách và
sáp nhập, cho đến khi bước hợp thức
10.5 Phân đoạn theo hình thái lưu vực
Như vậy đến nay, chúng ta đã thảo luận phân chia dựa trên ba khái niệm chính:
(a) phát hiện các bất liên tục, (b) ngưỡng, và (c) xử lý khu vực. Mỗi phương pháp đã
được tìm thấy để có lợi thế (ví dụ, tốc độ trong trường hợp ngưỡng toàn bộ) và bất lợi
(ví dụ, sự cần thiết phải xử lý sau, chẳng hạn như cạnh liên kết, trong các phương
pháp dựa trên phát hiện các bất liên tục trong mức độ màu xám). Trong phần này
chúng ta thảo luận một cách tiếp cận dựa trên các khái niệm về cái gọi là lưu vực hình
thái. Như sẽ trở nên rõ ràng trong các cuộc thảo luận sau đây, phân khúc của hình thái
đầu là hiện thân của nhiều khái niệm của ba cách tiếp cận khác, và như vậy, thường
cho ra kết quả phân chia ổn định hơn, trong đó có ranh giới phân chia liên tục. Cách
tiếp cận này cũng cung cấp một khuôn khổ đơn giản để kết hợp các ràng buộc dựa trên
hiểu biết cơ bản (xem hình. 1.23) trong quá trình phân chia.
10.5.1 Khái niệm cơ bản
Các khái niệm về lưu vực dựa trên hình dung một hình ảnh trong ba kích thước: hai
tọa độ không gian so với mức màu xám. Trong một giải thích như vậy "địa hình",
chúng ta xem xét ba loại điểm: (a) điểm thuộc về một tối thiểu vùng (b) điểm mà tại
đó một giọt nước, nếu đặt ở vị trí của bất kỳ của những điểm, sẽ rơi với chắc chắn đến
mức tối thiểu duy nhất, và (c) điểm mà tại đó nước sẽ được bình đẳng có thể sẽ giảm
nhiều hơn một mức tối thiểu như vậy. Tối thiểu đặc biệt trong khu vực, tập hợp các
điểm thỏa mãn điều kiện (b) được gọi là lưu vực lưu vực đầu nguồn hoặc tối thiểu đó.

Các điểm thỏa mãn điều kiện (c) Hình thức dòng đỉnh trên bề mặt địa hình và được
gọi là đường phân chia hoặc dòng đầu nguồn.
Mục tiêu chính của thuật toán phân chia dựa trên những khái niệm này là để tìm
thấy những dòng đầu nguồn . Ý tưởng cơ bản là đơn giản: Giả sử một lỗ được đưa vào
mỗi tối thiểu vùng và toàn bộ địa hình tràn ngập từ bên dưới bằng cách cho phép tăng
nước thông qua các lỗ ở một tỷ lệ thống nhất. Khi nước tăng trong lưu vực lưu vực
riêng biệt là về hợp nhất, một con đập được xây dựng để ngăn chặn việc sáp nhập. Lũ
lụt cuối cùng sẽ đạt tới giai đoạn khi chỉ có các đỉnh của các đập có thể nhìn thấy trên
dòng nước. Những ranh giới đập tương ứng với các đường phân chia của các lưu vực
sông. Do đó, họ là những ranh giới (liên tục) chiết xuất bởi một thuật toán phân chia
lưu vực sông.
Những ý tưởng này có thể được giải thích thêm với sự trợ giúp của Fig.10.44. Hình
10.44 (a) cho thấy một hình ảnh màu xám quy mô đơn giản và hình. 10,44 (b) là một
điểm địa hình, trong đó chiều cao của "núi'' là tỷ lệ thuận với giá trị màu xám cấp
trong hình ảnh đầu vào. Để dễ giải thích, mông của cấu trúc được tô. Đây không phải
là để bị nhầm lẫn với các giá trị màu xám cấp, chỉ có địa hình chung của các đại diện
ba chiều được quan tâm. Để ngăn chặn các nước tăng từ tràn ra thông qua các cạnh
của cấu trúc, chúng ta tưởng tượng chu vi của toàn bộ địa hình (hình ảnh) được bao
bọc bởi các con đập có chiều cao lớn hơn ngọn núi cao nhất có thể, có giá trị được xác
định bởi màu xám cao nhất có thể cấp giá trị trong các hình ảnh đầu vào.
Giả sử rằng một lỗ được đấm vào mỗi tối thiểu vùng [ hiển thị như các vùng tối trong
Fig.10.44 (b)] và rằng toàn bộ địa hình tràn ngập từ bên dưới bằng cách cho phép tăng
nước thông qua các lỗ ở một tỷ lệ thống nhất . Figure10.44 ( c ) cho thấy giai đoạn đầu
tiên của lũ lụt, nơi mà các " nước", thể hiện trong ánh sáng màu xám , đã bao phủ khu
vực chỉ tương ứng với các nền rất tối trong hình ảnh. Trong Hình. 10.44 ( d ) và (e)
chúng ta thấy rằng các nước hiện đã tăng lên vào các lưu vực lưu vực đầu tiên và thứ
hai , tương ứng . Khi nước tiếp tục tăng, nó cuối cùng sẽ tràn từ một lưu vực lưu vực
thành khác. các dấu hiệu đầu tiên điều này được thể hiện trong 10,44 (f ) . đây , nước
từ lưu vực trái thực sự tràn vào lưu vực trên bên phải và một " đập " ngắn ( bao gồm
các điểm ảnh đơn) được xây dựng để ngăn nước từ sáp nhập ở mức đó của lũ lụt ( các

chi tiết của việc xây dựng đập sẽ được thảo luận trong phần sau ) . Hiệu quả là rõ rệt
hơn như nước tiếp tục tăng, như thể hiện trong hình . 10,44 ( g ) . Con số này cho thấy
một đập dài giữa hai lưu vực lưu vực và một con đập ở phần trên của lưu vực bên phải
.Đập thứ hai được xây dựng để ngăn chặn việc sáp nhập của nước từ lưu vực nước từ
các khu vực tương ứng với nền. Quá trình này được tiếp tục cho đến mức tối đa của lũ
lụt (tương ứng với giá trị màu xám-mức cao nhất trong hình ảnh) là đạt. Các đập thức
tương ứng với các dòng đầu nguồn, đó là kết quả phân khúc mong muốn. Kết quả ví
dụ này được thể hiện trong hình. 10,44 (h) như bóng tối, con đường một điểm ảnh dày
chồng lên hình ảnh ban đầu. Lưu ý các tài sản quan trọng là các dòng đầu nguồn tạo
thành một con đường kết nối, do đó đưa ra ranh giới liên tục giữa các vùng.
Một trong những ứng dụng chính của phân đoạn đầu nguồn là trong việc khai thác
gần như thống nhất (bloblike) các đối tượng từ phía sau. Các khu vực đặc trưng bởi sự
thay đổi nhỏ trong mức độ màu xám có giá trị độ dốc nhỏ. Vì vậy, trong thực tế,
chúng ta thường thấy phân khúc đầu nguồn áp dụng cho gradient của một hình ảnh,
chứ không phải là hình ảnh của chính nó. Trong công thức này, các tiểu khu vực lưu
vực tương quan độc đáo với giá trị nhỏ của gradient tương ứng với các đối tượng quan
tâm.
10.5.2 Xây dựng vách ngăn (chắn)
Trước khi tiếp tục, chúng ta xem xét làm thế nào để xây dựng các vách ngăn hoặc
đường biên theo yêu cầu của thuật toán phân vùng biên . Xây dựng đập được dựa trên
hình ảnh nhị phân, là thành viên của 2-D số nguyên không gian Z
2
(xem Phần 2.4.2).
Cách đơn giản nhất để xây dựng đập tách bộ điểm nhị phân là sử dụng sự giãn nở hình
thái (xem Phần 9.2,1).
Điều cơ bản là làm thế nào để xây dựng đập sử dụng sự giãn nở được minh họa
trong hình. 10.45. Hình 10.45 (a) cho thấy các phần của hai lưu vực lưu vực trong khi
tràn bước n - 1 và hình. 10.45 (b) cho thấy kết quả ở bước tiếp theo của việc tràn , n.
Các nước đã đổ từ một lưu vực khác và, do đó, một con đập phải được xây dựng để
giữ cho điều này xảy ra. Để phù hợp với ký hiệu được giới thiệu trong thời gian ngắn,

cho M
1
và M
2
biểu thị các bộ tọa độ của điểm trong hai khu vực cực tiểu. Sau đó để
tập hợp các tọa độ của điểm trong lưu vực kết hợp với hai cực tiểu này ở giai đoạn n -
1 việc tràn được ký hiệu là C
n-1
{M1} và C
n-1
{M2} , tương ứng. Đây là hai vùng đen
hình. 10.45 (a).
Hãy để cho sự liên kết của hai bộ được ký hiệu là C [n - 1]. Có hai thành phần
được kết nối trong hình. 10.45 (a) (xem Phần 2.5.2 liên quan đến các thành phần được
kết nối) và chỉ có một thành phần kết nối trong hình. 10.45 (b). Thành phần kết nối
này bao gồm hai thành phần trước đó, thể hiện bằng nét gach. Thực tế là hai thành
phần kết nối đã trở thành một thành phần duy nhất và chỉ ra rằng nước giữa hai lưu
vực lưu vực đã sáp nhập trong khi tràn ở bước n. Cho thành phần này kết nối được ký
hiệu là q. Lưu ý rằng hai thành phần từ bước n-1 có thể được chiết xuất từ q bằng cách
thực hiện đơn giản AND hoạt động q [n - 1 ]. Chúng tôi cũng lưu ý rằng tất cả các
điểm thuộc một lưu vực lưu vực cá nhân tạo thành một thành phần kết nối duy nhất.
Giả sử rằng mỗi thành phần kết nối trong hình. 10.45 (a) được giãn ra bởi các yếu
tố cấu hình. 10.45 (c), tùy thuộc vào hai điều kiện. (1) Sự giãn nở phải được hạn chế
đến q (điều này có nghĩa là trung tâm của các yếu tố cấu trúc có thể được đặt chỉ tại
các điểm trong q trong quá trình giãn nở), và sự giãn nở không thể được thực hiện trên
điểm có thể gây ra các bộ được giãn ra để hợp nhất (trở thành một thành phần kết nối
duy nhất). Hình 10.45 (d) cho thấy qua sự giãn nở đầu tiên (trong ánh sáng màu xám)
mở rộng ranh giới của từng thành phần kết nối ban đầu. Lưu ý rằng điều kiện (1) được
thỏa mãn bằng tất cả các điểm trong thời gian giãn nở, và điều kiện (2) không áp dụng
cho bất kỳ điểm nào trong quá trình giãn nở, do đó ranh giới của từng khu vực đã

được mở rộng thống nhất
Trong sự giãn nở thứ hai ( thể hiện trong môi trường màu xám) , một số điểm bij
lỗi điều kiện ( 1 ) trong khi điều kiện cuộc họp (2) , kết quả là hình dạng bị gãy đươc
chỉ ở hình . Nó cũng là điều hiển nhiên rằng các điểm chỉ trong q đáp ứng hai điều
kiện được xem xét mô tả con đường một điểm ảnh dày kết nối thể hiện vượt nở trong
hình . 10.45 ( d ) . Con đường nàycấu tạo để tách rời ở hoạt động n của việc tràn. Xây
dựng đập ở mức độ lũ lụt được hoàn thành bằng cách thiết lập tất cả các điểm trong
đường dẫn chỉ xác định một giá trị lớn hơn giá trị màu xám - mức tối đa của hình ảnh .
Chiều cao của tất cả các vách ngăn thường được đặt ở 1 cộng với giá trị tối đa cho
phép trong hình ảnh. Điều này sẽ ngăn chặn nước từ băng qua một phần của vách
ngăn được hoàn thành như mức độ tràn ngập tăng lên. Điều quan trọng cần lưu ý rằng
các vách ngăn được xây dựng theo cách này , đó là ranh giới phân chia nhỏ mong
muốn , được kết nối với các thành phần . Nói cách khác, phương pháp này giúp loại
bỏ vấn đề khi đường phân chia nhỏ bị hỏng .
Dù các thủ tục được mô tả dựa trên một ví dụ đơn giản, phương pháp được sử dụng
cho các tình huống phức tạp hơn là giống hệt nhau, bao gồm cả việc sử dụng các yếu
tố cấu trúc 3x 3 được chỉ ở hình 10.45 (c).
10.5.3 Thuật toán phân vùng biên
Cho M
1
M
2 ……
M
R
là bộ biểu thị tọa độ của các điểm trong tiểu khu vực của một hình
ảnh g (x, y). Như đã trình bày ở phần cuối của mục 10.5.1, điều này thường sẽ là một
hình ảnh gradient. Cho C (M
i
) là một tập hợp biểu thị tọa độ của các điểm trong lưu
vực lưu vực kết hợp với tối thiểu vùng M

i
(nhớ lại rằng các điểm trong bất kỳ hình
thức lưu vực lưu vực một thành phần kết nối). Các ký hiệu min và max sẽ được sử
dụng để biểu thị giá trị tối thiểu và tối đa của g (x, y). Cuối cùng, chúng ta hãy T [n]
đại diện cho tập hợp các tọa độ (s, t) mà g (s, t) < n. Đó là,
T[n] ={ (s,t) │ g(s,t) < n } (10.5-1)
Theo hình học , T [n] là tập hợp tọa độ của điểm trong g (x, y) nằm bên dưới mặt
phẳng g (x, y) = n.
Sự tính toán sẽ gia tăng số nguyên, từ n = min + 1 đến n = max + 1. Tại bất kỳ
bước n của quá trình làm phẳng, các thuật toán cần phải biết số lượng các điểm dưới
độ sâu . Khái niệm, giả sử rằng các tọa độ trong T [n] mà bên dưới mặt phẳng g (x, y)
= n được "đánh dấu" đen, và tất cả các tọa độ khác được đánh dấu màu trắng . Sau đó,
khi nhìn "xuống" trên tọa độ tại bất kỳ tăng n của độ phẳng, chúng ta sẽ thấy một hình
ảnh nhị phân trong đó điểm đen tương ứng với điểm trong các chức năng mà là dưới
tọa độ g (x, y) = n. Giải thích này là khá hữu ích trong việc giúp hiểu được thảo luận
dưới đây

×