Tải bản đầy đủ (.docx) (46 trang)

tiểu luận xử lý ảnh nâng cao trình diễn và mô tả hình ảnh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.39 MB, 46 trang )

TIỂU LUẬN : Trình diễn và mô tả hình ảnh
Tổng quan
Sau khi phân mảnh bức ảnh thành vùng bởi các phương pháp như đã học trong chương
10, kết quả của việc phân mảnh pixel thường được dùng để trình diễn và mô tả trong
dạnh thích hợp trong những chương trình xử lý máy tính khác. Một cách cơ bản, trình
diễn một phân vùng lien quan đến hai lựa chọn: chúng ta có thể trình diễn nó theo cách
đặc tính bên ngoài hoặc có thể dựa vào các đặc tính bên trong của nó. Lựa chọn phương
pháp trình diễn chỉ là một phần trong nhiệm vụ khởi tạo dữ liệu hữu ích cho máy tính.
Bước tiếp theo là mô tả phân vùng dựa trên phương pháp trình diễn đã lựa chọn.
11.1 Trình diễn
Kỹ thuật phân mảnh đã được học trong chương 10 đã thu được dữ liệu thô ở dưới dạng
các pixel ở đường biên hoặc các pixel nằm trong phân vùng. Mặc dù những dữ liệu này
đôi khi được sử dụng trực tiếp để thu được các mô tả. trong chương này ta sẽ thảo luận
một số phương pháp trình diễn khác nhau
11.1.1 Mã dây chuyền
Mã dây chuyền được sử dụng để trình diễn đường bao bằng cách liên kết 1 chuỗi những
phân mảnh thẳng hàng theo chiều dài và hướng cụ thể nào đó. Cách trình diễn nãy dựa
trên sự kết nối giữa 4 hoặc 8 phân mảnh. Hướng của mỗi phân mảnh được mã hóa bằng
cách sử dụng bảng đánh số như trong hình 11.1.
Ảnh số thường được thu giữ và xử lý trong dạng lưới với chiều dài theo hướng x và
hướng y là bằng nhau, vì vậy mã dây chuyền có thể được tạo ra bằng cách đi theo đường
bao, theo chiều kim đồng hồ và gán những giá trị theo bảng trên cho các điểm ảnh.
Phương pháp này nhìn chung không được chấp nhận vì 2 lý do sau đây: thứ nhất, kết quả
của mã dây chuyền quá dài, và thứ hai, tất cả những sự ảnh hưởng dọc theo đường bao
gây ra nhiễu hoặc những phân mảnh không hoàn hảo có thể gây ra sự thay đổi trong mã
dây chuyền, từ đó dẫn đến sự sai khác về hình dạng của đường bao.

Hình 11.1: Mã dây chuyền 4 hướng và mã dây chuyền 8 hướng
Một phương pháp thường được sử dụng để tránh những vấn đề trên là lấy mẫu lại đường
bao bằng cách chọn khoảng cách lưới lớn hơn, như trong hình 11.2. Những giá trị đường
bao sẽ được gán cho các note trong lưới. Và sau đó sử dụng bảng đánh số như trên và tiếp


tục hoàn thiện mã dây chuyền.

Hình 11.2: Phương pháp sử dụng khoảng cách lưới kích thước lớn
Mã dây chuyền của đường biên phụ thuộc vào điểm khởi đầu. Tuy nhiên, các mã có thể
được xác định đối với điểm khởi đầu bằng cách đơn giản sau: Ta chỉ đơn giản là xử lý
các mã chuỗi như là một chuỗi vòng số hướng và xác định lại điểm khởi đầu nên chuỗi
kết quả là một số nguyên có độ lớn tối thiểu. Chúng ta có thể xác định bằng phương pháp
xoay vòng, sử dụng sự khác biệt đầu tiên của mã chuỗi thay vì mã chính nó. Sự khác biệt
này là thu được bằng cách đếm số thay đổi hướng ( theo chiều kim đồng hồ ). Đối với
trường hợp này, sự khác biệt đầu tiên của mã chuỗi 4 hướng 10103322 là 3133030. Nếu
chúng ta chọn để xử lý các mã như một chuỗi vòng tròn, sau đó các yếu tố đầu tiên của
sự khác biệt được tính toán bằng cách sử dụng sự chuyển tiếp giữa các phần tử cuối cùng
và đầu tiên của chuỗi . Ở đây , kết quả là 33133030.
11.1.2 Xấp xỉ đa giác
Một đường bao số có thể được xấp xỉ với độ chính xác tùy ý bởi một đa giác. Cho một
đường cong khép kín, đường xấp xỉ là chính xác khi số lượng các phân đoạn trong đa
giác bằng với số điểm trong đường bao, để mỗi cặp điểm tiếp giáp xác định một phân
khúc trong đa giác. Trong thực tế, mục tiêu xấp xỉ đa giác là để nắm bắt được"bản
chất" của hình dạng đường bao với các phân đoạn ít nhất có thể. Vấn đề này nói
chung là không dễ dàng và có thể nhanh chóng biến thành một quá trình lặp đi lặp lại tốn
nhiều thời gian. Tuy nhiên, một vài kỹ thuật xấp xỉ đa giác phức tạp rất thích hợp cho các
ứng dụng xử lý hình ảnh.
Tối thiểu chu vi đa giác

Hình 11.3a,b: Phương pháp tối thiểu hóa chu vi đa giác
Ta bắt đầu nghiên cứu về xấp xỉ đa giác với phương pháp để tìm ra đa giác có chu vi nhỏ
nhất . Phương pháp này được giải thích bởi ví dụ sau. Giả sử chúng ta có một đường bao
được tạo thành từ một tập hợp các tế bào nối với nhau, như thể hiện trong hình 11.3a. Nó
có thể được xem như như hai bức tường tương ứng với ranh giới bên ngoài và bên trong
của các dải tế bào, và đối tượng như một dãy cao su chứa bên trong các bức tường. Nếu

dãy cao su co lại, nó có hình dạng như hình 11.3b, tạo ra một đa giác có chu vi tối thiểu
phù hợp với hình dạng được thành lập bởi dãy tế bào. Lỗi này có thể được giảm một nửa
bằng cách buộc mỗi tế bào tập trung vào điểm ảnh tương ứng của nó .
11.2 Mô tả đường bao
Trong phần này chúng ta quan tâm đến một số phương pháp để mô tả đường bao của một
phân vùng, và trong phần 11.3 chúng ta tập trung vào mô tả phân vùng. Một số phần của
11.4 và 11.5 được ứng dụng trong đường bao và phân vùng.
11.2.1 Một vài mô tả đơn giản
Chiều dài của đường bao là một trong những mô tả đơn giản của nó. Số lượng pixels dọc
theo đường bao đưa ra một xấp xỉ gần đúng của chiều dài của nó. Cho một chuỗi dây
chuyền của 1 đường cong được mã hóa với các đơn vị khoảng cách trong cả hai hướng,
số lượng của các thành phần dọc và ngang cộng với lần số lượng các thành phần đường
chéo cho chiều dài chính xác của nó.
Đường kính của đường bao B được xác định như sau:
Với D là khoảng cach đo được, và pi, pj là các điểm trên đường bao. Đường nãy được gọi
là trục chính cua đường bao, được sử dụng để mô tả đường bao.
Trục phụ của một đường bao được định nghĩa là đường thẳng vuông góc với trục chính
và có chiều dài tương tự mà một hộp đi qua bên ngoài bốn điểm giao nhau của các ranh
giới với hai trục hoàn toàn bao quanh ranh giới, và được gọi là hình chữ nhật cơ bản, tỷ lệ
trục lớn với trục nhỏ được gọi là độ lệch tâm của ranh giới. Đây cũng là một mô tả hữu
ích.
Độ cong được định nghĩa là tốc độ thay đổi của độ dốc . Nói chung, có được biện pháp
tin cậy để có đường cong tại một điểm trong một đường bao số là khó khăn bởi vì những
đường bao có xu hướng được tách rời. Tuy nhiên, bằng cách sử dụng sự khác biệt giữa
các sườn của các phân đoạn liền kề ( đã được biểu diễn như là đường thẳng ) như một mô
tả của độ cong tại điểm giao nhau của các phân mảnh, đôi khi hữu ích hơn. Ví dụ , các
đỉnh của ranh giới được thể hiện trong hình 11.3b và 11.4d cho ta một đường cong được
mô tả tốt. Vì đường bao hướng theo chiều kim đồng hồ , một điểm đỉnh p được cho là
một phần của khúc lồi nếu sự thay đổi độ dốc tại p là không âm, nếu không, p được cho
là thuộc về một phân khúc lõm.

11.2.2 Hình dạng số
Như đã giải thích trong phần 11.1.1, sự khác nhau thứ nhất của mã dây chuyền phụ thuộc
vào vị trí đầu tiên. Hình dạng số của 1 đường bao dựa trên mã dây chuyền 4 hướng như ở
hình 1.11, được định nghĩa là sự khác nhau thứ nhất của giá trị độ lớn tối thiểu. Bậc n của
hình dạng số được xác định bằng số các ký tự có trong biểu diễn của nó. Ngoài ra, n là số
chẵng nếu đường bao là khép kín. Hình 11.11 biểu diễn tất cả các hình dạng của bậc 4,6
và 8 cùng với mã dây chuyền, sai khác thứ nhất và hình dạng số tương ứng.
Trong thực tế, đối với một bậc hình dạng mong muốn, chúng ta thấy bậc của hình chữ
nhật có độ lệch tâm (được định nghĩa trong phần trước) xấp xỉ tốt nhất của hình chữ nhật
cơ bản và sử dụng hình chữ nhật mới này để thiết lập kích thước lưới. Ví dụ n = 12, tất
cả các hình chữ nhật có bậc 12 (có nghĩa là, những hình chữ nhật có chiều dài chu vi là
12) là 2 x 4, 3 x 3, và 1 x 5. Nếu độ lệch tâm của hình chữ nhật 2x4 phù hợp nhất với độ
lệch tâm của hình chữ nhật cơ bản cho một đường bao nhất định thì sẽ thiết lập một lưới
2 x 4 tập trung vào hình chữ nhật cơ bản và sử dụng các phương pháp phác thảo khác.
Hình 11.4: Hình dạng của bậc 4,6 và 8.
Mục 11.1.1 ta đã có được mã dây chuyền. Hình dạng số được xác định từ sự khác nhau
thứ nhất của mã dây chuyền. Mặc dù bậc của hình dạng số thường bằng n vì khoảng cách
lưới đã được lựa chọn, đường bao khi so sánh với khoảng cách này đôi khi mang lại bậc
của hình dạng số lớn hơn n. Trong trường hợp này, ta chỉ định một hình chữ nhật của bậc
thấp hơn n và lặp lại quán trình cho đến khi bậc của hình dạng số là n.
Giả sử n = 18 được quy định cho các đường bao hình. 11.5a.
Bước đầu tiên là để tìm hình chữ nhật cơ bản, như thể hiện trong hình. 11.5b.
Hình chữ nhật gần nhất với bậc 18 là hình chữ nhật 3x6 được biểu diễn trong hình 11.5c.

Hình 11.5: Các bước trong việc tạo hình dạng số
11.2.3 Mô tả Fourier
Hình 11.6 biểu diễn một đường bao số K điểm trong hệ tọa độ XY. Bắt đầu từ một điểm
(x0,y0) bất kỳ, các cặp tọa độ (x1,y1), (x2,y2),… (xk-1,yk-1), khi đi dọc theo đường bao,
theo chiều ngược chiều kim đồng hồ. Các tọa độ trên có thể được thể hiện dưới dạng
x(k)=xk và y(k)=yk. Với kiểu ký hiệu này thì đường bao có thể được xem như là chuỗi

các tọa s(k) = [ x(k),y(k)], với k=0,1,2,3,…,K-1.
Ngoài ra, mỗi cặp tọa độ có thể xem như là 1 số phức:
S(k) = x(k) + jy(k) với k=0,1,2,…,K-1
Với trục X được xem như là trục thực, và trục Y được xem như là trục ảo của chuỗi các
số phức.
Mặc dù việc giải thích các trình tự đã kết thúc, bản chất của đường bao là không thay đổi.
Tất nhiên, sự biểu diễn này có một lợi thế rất lớn: nó chuyển 1 vấn đề từ 2-D sang 1-D.
Như ta đã biết, biểu thức tính Fourier rời rạc của s(k) là:

Với u = 0,1,2,…,K-1. Hệ số phức a(u) được gọi là hệ số Fourier của đường bao. Biến đổi
Fourier ngược của các hệ số trên ta thu lại được s(k).


Hình 11.6: Ví dụ của việc khôi phục lại hình dạng từ các hệ số mô tả Fourier. P là số hệ
số mô tả Fourier được sử dụng.
Như đã đề cập trong ví dụ trên, một vài hệ số mô tả Fourier có thể được sử dụng để nắm
được bản chất của một đường bao. Đây là những thong tin có giá trị, bởi vì các hệ số này
mang thông tin hình dạng . Do đó chúng có thể được sử dụng làm cơ sở để phân biệt giữa
các hình dạng khác nhau, ta sẽ thảo luận trong một số chi tiết thuộc Chương 12.
Ta đã đề cập nhiều lần rằng mô tả Fourier nên càng nhạy cảm càng tốt để thay đổi sự dịch
chuyển, xoay vòng, và tỷ lệ. Trong trường hợp kết quả phụ thuộc vào bậc của điểm đang
được xử lý, thêm một ràng buộc là mô tả không nên nhạy cảm với điểm bắt đầu. Mô tả
Fourier không nhạy cảm với những thay đổi hình học, nhưng những thay đổi trong các
thông số này có thể liên quan đến biến đổi đơn giản về các mô tả.
Bảng 11.1: Một số tính chất cơ bản của mô tả Fourier
Bảng 11.1 tổng hợp những mô tả Fourier cho 1 chuỗi đường bao s(k) cái mà đã qua dịch
chuyển, tỷ lệ, xoay và thay đổi điểm bắt đầu.

Nói cách khác, sự dịch chuyển bao gồm thêm sự chuyển đổi cho tất cả các tọa độ trong
đường bao. Lưu ý dịch mà không ảnh hưởng đến các mô tả, ngoại trừ u = 0.


11.2.4 Giá trị thống kê
Hình dạng của các phân mảnh đường bao có thể được mô tả 1 cách định lượng bằng cách
sử dụng phương pháp giá trị thống kê đơn giản, như là giá trị trung bình, phương sai và
những giá trị bậc cao. Để biết được bằng cách nào có thể thực hiện được, xem xét hình
11.7a, biểu diễn phân mảnh của đường bao, và hình 11.7b biểu diễn phân mảnh như là
hàm 1 chiều g(r) với biến giá trị r tùy ý. Hàm này thu được bằng cách liên kết 2 điểm
cuối cùng của phân mảnh và xoay đường trục cho đến khi nó nằm ngang. Tọa độ của các
điểm cũng được xoay với góc tương tự.
Hình 11.7a: Phân mảnh đường bao
11.7b: Biểu diễn thành 1 hàm 1 chiều
Về cơ bản, những gì ta đã đạt được là làm giảm công việc mô tả thành việc mô tả hàm 1
chiều. Mặc dù giá trị thống kê cho đến nay là phương pháp phổ biến nhất, nhưng nó
không phải là phương pháp mô tả duy nhất có thể được sử dụng cho mục đích này. Ví dụ,
phương pháp khác liên quan đến tính toán 1-D rời rạc biến đổi Fourier, có được phổ của
nó, và sử dụng các thành phần q đầu tiên của phổ để mô tả g (r). Lợi thế của giá trị thống
kê so với các kỹ thuật khác là thực hiện rất đơn giản và nó cũng mang theo "giải thích vật
lý của hình dạng đường bao”.
11.3 Mô tả khu vực
Trong phần này chúng ta sẽ xem xét đến một số phương pháp để mô tả phân vùng ảnh.
Luôn luôn nhớ răng trong thực tế, người ta luôn sử dụng tổng hợp cả 2 phương pháp mô
tả đường bao và phân vùng.
11.3.1 Một số mô tả đơn giản
Diện tích của một phân vùng được định nghĩa là số lượng điểm ảnh trong phân vùng. Chu
vi của một phân vùng là chiều dài của ranh giới của nó. Mặc dù diện tích và chu vi đôi
khi được sử dụng như một cách mô tả, nhưng chúng được áp dụng chủ yếu đối với các
trường hợp trong đó kích thước của phân vùng quan tâm là bất biến. Một thông số được
sử dụng thường xuyên hơn của hai mô tả này là độ nhỏ gọn của một phân vùng, được
định nghĩa như sau : (chu vi)*(chu vi)/(area). Độ nhỏ gọn là một giá trị không thứ nguyên
(và do đó là không nhạy cảm với những thay đổi quy mô thống nhất) và là tối thiểu cho

một khu vực hình đĩa. Ngoại trừ các lỗi được giới thiệu bởi vòng quay của một phân
vùng số, độ nhỏ gọn cũng nhạy cảm với định hướng.
Các phương pháp đo đơn giản khác được sử dụng như mô tả phân vùng bao gồm trung
bình và trung bình của các mức độ màu xám , các giá trị màu xám - mức tối thiểu và tối
đa , và số lượng điểm ảnh với các giá trị ở trên và dưới mức trung bình.
Thậm chí một mô tả phân vùng đơn giản như các phân vùng bình thường có thể khá hữu
ích trong việc chiết xuất thông tin từ các hình ảnh . Ví dụ, theo hình 11.8 cho thấy một
hình ảnh hồng ngoại từ vệ tinh của Mỹ . Như đã thảo luận chi tiết trong phần 1.3.4 , hình
ảnh như thế này cung cấp một dữ liệu toàn cầu của các khu định cư của con người. Các
cảm biến được sử dụng để thu thập những hình ảnh này có khả năng phát hiện ánh sáng
nhìn thấy và hồng ngoại, chẳng hạn như đèn , hỏa hoạn. Những bảng cùng với các hình
ảnh hiển thị ( theo vùng từ trên xuống dưới ) tỷ lệ của khu vực chiếm đóng trắng ( ánh
sáng ) với tổng diện tích ánh sáng trong tất cả bốn phân vùng. Một phương pháp đo đơn
giản như thế này có thể cung cấp, ví dụ , một ước tính tương đối của khu vực năng lượng
điện tiêu thụ. Dữ liệu có thể được tinh chế bằng cách bình thường đối với đất trên mỗi
phân vùng, liên quan đến số lượng dân số , và tương tự như vậy.

Hình 11.8: Hình ảnh hồng ngoại từ vệ tinh Hoa Kỳ vào ban đêm
11.3.2 Mô tả hình học tô-pô
Tính chất topo có hữu ích cho mô tả chung của các phân vùng trong mặt phẳng ảnh. Hay
đơn giản hơn, cấu trúc liên kết là nghiên cứu về tính chất của một con số mà không bị
ảnh hưởng bởi bất kỳ biến dạng nào, miễn là không bị rách,xé hoặc ảnh hưởng của các
con số (đôi khi chúng được gọi là biến dạng cao su ). Ví dụ, hình 11.9 cho ta thấy một
khu vực với hai vùng trống. Nếu một mô tả topo được xác định bởi số lượng các lỗ hổng
trong khu vực, mô tả này rõ ràng sẽ không bị ảnh hưởng bởi biến đổi kéo căng và xoay
vòng. Nhìn chung, số lượng các lỗ sẽ thay đổi nếu khu vực bị rách hoặc gấp lại. Lưu ý
rằng, vì kéo dài ảnh hưởng đến khoảng cách, tính chất topo không phụ thuộc vào quan
niệm về khoảng cách hay bất kỳ đại lượng ngầm nào dựa trên khái niệm của khoảng
cách.


Hình 11.9: Phân vùng với 2 lỗ trống
Một tính chất topo hữu ích khác để mô tả phân vùng là số lượng các thành phần kết nối.
Một thành phần kết nối của một phân vùng được quy định tại mục 2.5.2. Hình 11.10 cho
thấy một phân vùng với ba thành phần kết nối.

Hình 11.10: Phân vùng với 3 thành phần kết nối
Số lượng lỗ H và kết nối các thành phần C trong một con số có thể được sử dụng để xác
định hệ số Euler E.
Số Euler cũng là một đặc tính topo. Các phân vùng như trong hình 11.11, ví dụ, có số
Euler bằng 0 và 1, bởi vì:
"A" có một thành phần kết nối với một lỗ trống.
“ B” có một thành phần kết nối nhưng với 2 lỗ trống.
Phân vùng đặc trưng bởi các đoạn đường thẳng (gọi tắt là mạng lưới đa giác) có một sự
liên quan cụ thể đơn giản nhất là trong định luật của số Euler. Hình 11.12 cho thấy một
mạng lưới đa giác. Phân loại các phân vùng bên trong của một mạng vào mặt và lỗ
thường là quan trọng. Thể hiện số lượng đỉnh của V, số cạnh bằng Q, và số lượng các mặt
bằng F đưa ra mối quan hệ sau đây, được gọi là công thức Euler:
V - Q + F = C - H (11.3-2)
trong đó, theo quan điểm của phương trình. (11,3-1), bằng với số Euler:
V - Q + F = C – H = E

Hình 11.12: Phân vùng với số Euler tương ứng bằng 0 và -1
Mạng như trong hình 11.20 có 7 đỉnh, 11 cạnh, 2 mặt, 1 phân vùng kết nối, và 3 lỗ trống,
do đó số Euler là - 2:
7-11 + 2 = 1-3 = -2.

Hình 11.13: Phân vùng với hệ thống mạng đa giác
Hình 11.14a cho thấy một hình ảnh 512 X 512, 8-bit của thành phố Washington, thực
hiện bởi vệ tinh NASA LANDSAT. Hình ảnh cụ thể này là trong dãy gần hồng ngoại
(xem hình. 1.10 để biết chi tiết). Giả sử chúng ta muốn phân mảnh con sông chỉ sử dụng

hình ảnh này ( trái ngược với sử dụng một số hình ảnh đa phổ, trong đó sẽ đơn giản hóa
các nhiệm vụ). Vì dòng sông là một khu vực tối, thống nhất, ngưỡng là một điều hiển
nhiên phải thực hiện. Kết quả của thực hiện ngưỡng những hình ảnh với ngưỡng giá trị
cao nhất, trước khi con sông đã trở thành một phân vùng bị ngắt kết nối được hiển thị
trong hình 11.14b. Ngưỡng được chọn bằng tay để minh họa cho quan điểm rằng nó sẽ
không thể trong trường hợp này, để phân đoạn con sông bằng cách riêng của mình mà
không có các khu vực khác của hình ảnh cũng xuất hiện trong kết quả. Mục đích của ví
dụ này là để minh họa cách kết nối các thành phần có thể được sử dụng để'' kết thúc "các
phân khúc.

Hình 11.14: Hình ảnh hồng ngoại của thành phố Washington
11.3.3 Kết cấu
Một phương pháp quan trọng để mô tả phân vùng là định lượng nội dung kết cấu của nó.
Mặc dù không có định nghĩa chính thức về sự tồn tại của kết cấu, mô tả trực quan này
cung cấp các biện pháp đo các tính chất đó như: độ mượt, gấp khúc, và đều đặn (Hình
11.15 cho thấy một số ví dụ). Đó là ba phương pháp chính được sử dụng trong hình ảnh,
hạt, và tương tự như vậy. Các kỹ thuật cấu trúc xử lý sự sắp xếp của hình ảnh nguyên
thủy, chẳng hạn như mô tả của kết cấu dựa trên khoảng cách dòng song song. Kỹ thuật
quang phổ dựa trên tính chất của phổ Fourier và được sử dụng chủ yếu để phát hiện chu
kì trong một hình ảnh bằng cách xác định năng lượng cao, đỉnh hẹp trong quang phổ.
Hình 11.15: Các ô được đánh dấu màu trắng, từ trái sang phải, mịn, thô và thường xuyên
kết cấu. Đây là một hình ảnh quang học của một kính hiển vi của một chất siêu dẫn,
cholesterol của con người và một vi điều khiển.
• Phương pháp thống kê
Một trong những phương pháp đơn giản nhất để mô tả cấu trúc là sử dụng những giá trị
thống kê của biểu đồ mức độ xám histogram của một hình ảnh hoặc phân vùng.
Cho z là một biến ngẫu nhiên biểu thị mức độ màu xám và cho p (Zj) , với i = 0,1,2,…,
L – 1, tương ứng là histogram, trong đó L là số mức xám khác nhau, từ phương trình
(3,3-18), giá trị thống kê thứ n có giá trị trung bình là:


Với m là giá trị trung bình của z:

Lưu ý từ biểu thức (11,3-4) mà µ0 = 1 và µ1 = 0. Tại thời điểm thứ hai là những giá trị
đặc biệt quan trọng trong mô tả kết cấu. Đây là một biện pháp tương phản màu xám cấp
có thể được sử dụng để thiết lập mô tả của độ mượt tương đối. Ví dụ, phương pháp này
bằng 0 cho các khu vực có cường độ không đổi (phương sai bằng 0 trong các phân vùng
này ) và tiếp cận đến 1 cho các giá trị lớn nhất của phương sai. Bởi vì giá trị phương sai
có xu hướng lớn cho màu xám với các giá trị trong khoảng từ 0 đến 255, nó là một ý
tưởng tốt để chuẩn hóa phương sai trong khoảng [0,1], để sử dụng trong phương trình.
(11,3-6). Việc này được thực hiện chỉ đơn giản bằng cách chia phương sai bằng (L - l)^2
trong phương trình. (11,3-6). Độ lệch chuẩn, cũng được sử dụng thường xuyên như là
một biện pháp của kết cấu bởi vì giá trị độ lệch chuẩn có xu hướng trực quan hơn cho
nhiều người.

Thời điểm thứ 3:

là một thước đo độ lệch của biểu đồ histogram trong khi thời điểm thứ tư là một phương
pháp đo độ phẳng tương đối của nó. Những thời điểm thứ năm và cao hơn là không dễ
dàng liên quan đến hình dạng biểu đồ histogram, nhưng chúng không cung cấp sự phân
biệt trong nội dung kết cấu. Một số biện pháp kết cấu bổ sung hữu ích dựa trên biểu đồ
histogram bao gồm một biện pháp "tính đồng nhất, được cho bởi:

và một phương pháp đo dữ liệu ngẫu nhiên trung bình, mà ta có thể nhớ lại từ lý thuyết
thông tin cơ bản, và đã được đề cập đến trong Chương 8, được định nghĩa là:

Vì p có giá trị trong khoảng [0,1] và tổng của chúng bằng 1, phương pháp đo V là tối đa
cho một hình ảnh trong đó tất cả các mức độ màu xám đều bình đẳng (tối đa thống nhất),
và giảm từ đó. Entropy là một biện pháp thay đổi và bằng 0 đối với một hình ảnh cố định.
Bảng 11.2 tóm tắt các giá trị của các biện pháp trước cho ba loại kết cấu được đánh dấu
trong hình. 11.15. Có nghĩa là chỉ cho chúng ta biết mức độ xám trung bình của từng

vùng và chỉ có hữu ích như một ý tưởng thô của cường độ, không thực sự kết cấu. Độ
lệch chuẩn chứa nhiều thông tin hơn, những con số cho thấy rõ ràng rằng các kết cấu đầu
tiên có ít thay đổi hơn trong mức độ xám (còn gọi là mượt mà hơn) so với hai kết cấu
khác. Các kết cấu thô thể hiện rõ ràng trong biện pháp này. Theo dự kiến, các ý kiến cùng
giữ cho R, bởi vì các biện pháp cơ bản điều tương tự như độ lệch chuẩn. Thời điểm thứ
ba.
Hình 11.16: Phương pháp đo kết cấu của hình 11.15
Điều này đưa ra một ý tưởng sơ bộ liệu mức độ màu xám đang nghiêng về phía bóng tối
hay ánh sáng so với mức trung bình. Về kết cấu, các thông tin thu được từ thời điểm thứ
ba chỉ có ích khi biến thể giữa các phép đo là lớn. Xem xét các biện pháp đồng bộ, chúng
ta có thể kết luận rằng giá trị đầu tiên là mượt mà hơn ( đồng đều hơn so với phần còn
lại ) và các giá rị ngẫu nhiên này ( thống nhất thấp nhất ) tương ứng với kết cấu thô. Điều
này là không đáng ngạc nhiên. Cuối cùng, các giá trị dữ liệu ngẫu nhiên là theo thứ tự
ngược lại và do đó dẫn chúng ta đến kết luận tương tự như các biện pháp đồng bộ đã làm.
Các giá trị đầu tiên có sự thay đổi thấp nhất trong cấp độ màu xám và hình ảnh thô nhất.
Kết cấu thông thường là ở giữa hai thái cực đối với cả các biện pháp này.
Phương pháp đo kết cấu chỉ sử dụng biểu đồ histogram bị hạn chế do nó không mang
theo không có thông tin liên quan đến vị trí tương đối của các điểm ảnh đối với nhau.
Một cách để mang thông tin đó vào quá trình phân tích kết cấu là xem xét không chỉ sự
phân bố cường độ , và cũng là vị trí của các điểm ảnh với các giá trị cường độ bằng nhau
hoặc gần bằng nhau.
Cho P là vị trí điều khiển và cho A là [k x k] ma trận mà các phần tử con là số lần mà
điểm có cấp độ màu xám z xảy ra (ở vị trí theo quy định của P) liên quan đến điểm có
mức độ xám zj với 1 < i, j < k. Trong trường hợp này, hãy xem xét một hình ảnh với ba
cấp độ màu xám, Z1 = 0, Z2 = 1 và Z3 = 2, như sau:

Xác định vị trí điều khiển P là "một điểm ảnh ở bên phải và một điểm ảnh ở dưới”, ta thu
được ma trận 3x3 sau:

Với, ví dụ, phần tử phía trên bên trái là số lần mà một điểm với mức Z1 = 0 xuất hiện một

vị trí điểm ảnh bên dưới và bên phải của một điểm ảnh với mức độ màu xám giống nhau,
và phần tử trên cùng bên phải là số lần mà một điểm với mức Z1 = 0 xuất hiện một vị trí
điểm ảnh bên dưới và bên phải của một điểm với màu xám mức Z3 = 2 . Kích thước của
A được xác định bởi số lượng các mức độ xám khác biệt trong hình ảnh đầu vào . Vì vậy
ứng dụng các khái niệm đã được đề cập trong phần này thường đòi hỏi cường độ được
kiểm tra lại vào một vài dãy màu xám.
Cho n là tổng số các cặp điểm trong hình ảnh đáp ứng P ( trong ví dụ trên n = 16 , tổng
của tất cả các giá trị trong ma trận A ) . Nếu một ma trận C được hình thành bằng cách
chia mọi phần tử của A bằng n , trong đó các phần tử của ma trận C là ước lượng xác suất
chung cho một cặp điểm thỏa mãn P sẽ có giá trị ( Zi,Zj). Ma trận C được gọi là ma trận
xuất hiện đồng thời mức màu xám . Bởi vì C phụ thuộc vào P , sự hiện diện của mẫu kết
cấu nhất định có thể được phát hiện bằng cách chọn một vị trí điều khiển thích hợp . Ví
dụ, các vị trí điều khiển được sử dụng trong ví dụ trên là nhạy cảm với dãy cường độ liên
tục chạy ở -45 °, ( lưu ý rằng giá trị cao nhất trong A là a11= 4, một phần là do một vệt
các điểm với cường độ 0 và chạy ở -45 ° . ) Tổng quát hơn , vấn đề là cần phải phân tích
một ma trận C nhất định để phân loại các kết cấu của phân vùng trên mà C đã được tính
toán . Một tập hợp các mô tả hữu ích cho mục đích này bao gồm:
1. Xác suất tối đa

2. Yếu tố khác biệt thời điểm để k

3. Yếu tố đảo ngược sự khác biệt thời điểm để k

4. Thống nhất

5. Entropy

Ý tưởng cơ bản là để mô tả các "nội dung" của ma trận C thông qua các mô tả. Ví dụ,
tính chất đầu tiên đưa ra một dấu hiệu của sự phản ứng mạnh mẽ đến P. Mô tả thứ hai có
giá trị tương đối thấp khi giá trị cao của C là gần đường chéo chính, bởi vì sự khác biệt

(i - j) là nhỏ hơn ở đây. Mô tả thứ ba mô tả có tác dụng ngược lại. Mô tả thứ tư là cao
nhất khi (Cij * s) đều bình đẳng. Như đã đề cập trước đây, mô tả thứ năm là một biện
pháp ngẫu nhiên, đạt giá trị cao nhất khi tất cả các yếu tố của C là tối đa ngẫu nhiên.
Một cách tiếp cận để sử dụng các mô tả là để "dạy" một hệ thống đại diện các giá trị mô
tả cho một tập hợp các kết cấu khác nhau. Các kết cấu của một phân vùng không biết
được, rồi sau đó được xác định bởi cách gần đúng mô tả của nó.
• Phương pháp cấu trúc
Như đã đề cập ở đầu bài này , một phương pháp quan trọng thứ hai mô tả kết cấu dựa
trên khái niệm về cấu trúc . Giả sử chúng ta có một quy tắc của mẫu S  aS , mà chỉ ra
rằng biểu tượng S có thể được viết lại như aS (ví dụ, ba ứng dụng của quy tắc này sẽ
mang lại chuỗi aaaS ). Nếu biểu diễn cho một vòng tròn ( hình 11.17a ) và ý nghĩa của "
vòng tròn bên phải " được gán cho một chuỗi các hình thức aaa , các quy tắc S  aS
cho phép tạo ra các mô hình kết cấu như hình 11.17b.
Giả sử tiếp theo ta thêm một số quy định mới để mô hình này : S  bA , A  cA ,
A  c, A  bS, S  a, nơi sự hiện diện của ab có nghĩa là " vòng tròn xuống " và sự
hiện diện của ac có nghĩa là " vòng tròn bên trái. Bây giờ chúng ta có thể tạo ra một chuỗi
các aaabccbaa hình thức tương ứng với một ma trận 3 x 3 của vòng tròn. Mô hình kết cấu
lớn hơn, như thể hiện trong hình 11.17c, có thể được tạo ra dễ dàng theo cùng một cách.
Lưu ý , tuy nhiên, những quy định này cũng có thể tạo ra các cấu trúc mà không phải là
hình chữ nhật.
Ý tưởng cơ bản trong các vấn đề nói trên là "đơn giản kết cấu nguyên thủy", có thể được
sử dụng để tạo mô hình kết cấu phức tạp hơn bằng phương pháp hay quy tắc hạn chế số
lượng các phiên bản có thể có của bản nguyên thủy s. Những khái niệm này nằm ở trung
tâm của các mô tả, một chủ đề mà ta sẽ xem xét một cách chi tiết hơn trong phần 11.5.

Hình 11.17: Cấu trúc 2-D được tạo thành theo quy tắc S  aS
• Phương pháp phổ
Như đã nêu trong phần 5.4 , phổ Fourier là lý tưởng để mô tả hướng của mô hình 2-D có
chu kì hoặc gần như có chu kì trong một hình ảnh. Những mô hình kết cấu chung, mặc dù
dễ dàng phân biệt như nồng độ của năng lượng cao trong quang phổ, nói chung là khá

khó khăn để phát hiện bằng phương pháp không gian vì tính chất cục bộ của những kỹ
thuật này .
Ở đây, chúng ta xem xét ba tính năng của quang phổ Fourier hữu ích cho việc mô tả kết
cấu: ( 1 ) đỉnh nổi bật trong quang phổ cho hướng chính của các mô hình kết cấu. (2) Các
vị trí của các đỉnh trong mặt phẳng tần số cho chu kì không gian cơ bản của các mô hình .
( 3 ) Loại bỏ bất kỳ thành phần định kỳ thông qua bộ lọc lá yếu tố hình ảnh nonperiodic ,
mà sau đó có thể được mô tả bằng các kỹ thuật thống kê. Nhớ rằng quang phổ là đối
xứng, vì vậy chỉ cần một nửa mặt phẳng tần số cần được xem xét . Như vậy với mục đích
phân tích , tất cả các mô hình định kỳ có liên quan đến chỉ có một đỉnh cao trong phổ,
chứ không phải hai.
Phát hiện và giải thích các tính năng phổ chỉ đề cập đến đơn giản hóa bằng cách bày tỏ
phổ trong tọa độ cực để mang lại một chức năng S { t \ 0 ), trong đó S là chức năng phổ
và r và theta là các biến trong hệ tọa độ này . Cho mỗi hướng theta , S( r , theta ) có thể
được coi là một 1- D SFT ( r ). Tương tự như vậy , đối với mỗi tần số r , s , (theta) là một
chức năng 1- D . Phân tích S(r) đối với một giá trị cố định từ theta của quang phổ ( chẳng
hạn như sự hiện diện của các đỉnh ) cùng một hướng xuyên tâm từ gốc, trong khi phân
tích Sr (theta) cho một giá trị cố định của r cùng một vòng tròn tập trung vào nguồn gốc .
Một mô tả chung hơn là thu được bằng cách tích hợp ( tổng hợp cho các biến rời rạc ) các
chức năng này :

Với R là bán kính của vòng tròn trung tâm tại gốc.
Kết quả từ các biểu thức (11.3-10) và (11.3-11) là một cặp giá trị [ S ( r ) , S (theta) ] cho
mỗi cặp tọa độ ( r , theta ) . Bằng cách thay đổi các tọa độ này , chúng ta có thể tạo ra hai
hàm 1- D , S (r) và S (theta) , tạo thành mô tả phổ năng lượng của kết cấu cho một hình
ảnh toàn bộ hoặc một phân vùng được xem xét. Hơn nữa, mô tả của các chức năng có thể
tự được tính toán để mô tả hành vi của nó về số lượng. Mô tả thường được sử dụng cho
mục đích này là vị trí có giá trị cao nhất , trung bình và phương sai của cả hai biên độ và
các biến thể trục, và khoảng cách giữa giá trị trung bình và giá trị cao nhất của hàm.
Hình 11.18 minh họa việc sử dụng các biểu thức (11.3-10) và (11.3-11) để mô tả cấu trúc
chung. Hình 11.18a cho thấy một hình ảnh với kết cấu định kỳ, và hình 11.24b cho thấy

phổ của nó. Còn hình số 11.24c và d cho thấy S(r) và S (theta). Đồ thị của S(r) là một cấu
trúc điển hình , có hàm năng lượng cao gần gốc và giá trị dần dần thấp hơn cho tần số cao
hơn. Đồ thị của S( theta ) cho thấy đỉnh trong khoảng 45 °, tương ứng rõ ràng cho các chu
kỳ trong nội dung kết cấu của hình ảnh.
Như minh hoạ của S(theta) có thể được sử dụng để phân biệt giữa hai mô hình kết cấu.
Vả hình 11.24e cho thấy một hình ảnh khác mà mô hình kết cấu chủ yếu là trong các
hướng ngang và dọc . Hình 11.24f cho thấy S(theta) cho phổ của hình ảnh này . Theo dự
kiến, S(theta) có đỉnh tại 90°. Khoảng phân biệt giữa hai mô hình kết cấu bằng cách phân
tích.
Hình 11.18: (a) Hình thể hiện cấu trúc có định kỳ (b) Phổ (c) Đồ thị của S(r)
(d) Đồ thị của S(theta) (e) Hình ảnh khác của một loại cấu trúc có định kỳ khác
11.3.4 Moments of two-dimensional Function
Cho 1 hàm liên tục 2-D, giá trị của moment bậc ( p+q ) được định nghĩa là:

Với q,p = 0,1,2,…,A
Giá trị moment trung tâm được định nghĩa:

Với: và
Nếu f(x,y) là một ảnh số, theo công thức (11.3-13) ta có:

Giá trị moment trung tâm của hàm bậc 3 là:

×