Tải bản đầy đủ (.pdf) (74 trang)

TÌM HIỂU một số PHƯƠNG PHÁP PHÂN ĐỌAN ẢNH và KHẢ NĂNG ỨNG DỤNG

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.26 MB, 74 trang )

MỤC LỤC
MỞ ĐẦU............................................................................................................... 3
Chương 1............................................................................................................... 5
SƠ LƯỢC VỀ XỬ LÝ ẢNH ................................................................................ 5
1.1.

Biểu diễn ảnh ............................................................................................6

1.2.

Tăng cường ảnh - Khôi phục ảnh..............................................................6

1.3.

Biến đổi ảnh..............................................................................................7

1.4.

Phân tích ảnh.............................................................................................7

1.5.

Nhận dạng ảnh ..........................................................................................7

1.6.

Nén ảnh.....................................................................................................8

Chương 2............................................................................................................... 9
MỘT SỐ KỸ THUẬT PHÂN ĐOẠN ẢNH ........................................................ 9
2.1.



Sơ lược về phân đoạn ảnh .........................................................................9

2.2.

Phân vùng ảnh dựa theo ngưỡng biên độ .................................................10

2.2.1.

Ngưỡng cố định ...............................................................................11

2.2.2.

Ngưỡng tự động...............................................................................11

2.3.

Phân vùng theo miền đồng nhất...............................................................12

2.3.1.

Phương pháp tách cây tứ phân..........................................................14

2.3.2.

Phương pháp cục bộ hay phân vùng bởi hợp ....................................18

2.3.2.1.

Thuật toán tô màu .....................................................................19


2.3.2.2.

Thuật toán đệ quy cục bộ ..........................................................20

2.3.3.
2.4.

Phương pháp tổng hợp .....................................................................21

Phân vùng dựa theo đường biên ..............................................................22

2.4.1.

Phát hiện biên và làm nổi biên .........................................................23

2.4.1.1.

Phương pháp Gradient ..............................................................25

2.4.1.2.

Kỹ thuật Laplace.......................................................................29

2.4.2.

Làm mảnh biên ................................................................................30

2.4.3.


Nhị phân hoá đường biên .................................................................31

2.4.4.

Miêu tả đường biên ..........................................................................32


Tìm hiểu một số phương pháp phân đoạn ảnh và khả năng ứng dụng
2.4.4.1.

Mã hoá theo toạ độ đề các.........................................................34

2.4.4.2.

Mã hoá Freeman .......................................................................35

2.4.4.3.

Xấp xỉ bởi đoạn thẳng...............................................................38

Chương 3..............................................................................................................40
CÀI ĐẶT THỬ NGHIỆM MỘT SỐ THUẬT TOÁN PHÂN ĐOẠN ẢNH......40
3.1.

Thuật toán phân đoạn ảnh dựa vào ngưỡng cố định .................................41

3.1.1.

Tư tưởng thuật toán..........................................................................41


3.1.2.

Kết quả thực nghiệm và nhận xét .....................................................42

3.2.

Thuật toán tam giác.................................................................................43

3.2.1.

Tư tưởng thuật toán..........................................................................43

3.2.2.

Kết quả thực nghiệm và nhận xét .....................................................47

3.3.

Thuật toán JSEG .....................................................................................48

3.3.1.

Giới thiệu.........................................................................................48

3.3.2.

Tiêu chuẩn phân đoạn ......................................................................50

3.3.2.1.


Thuật toán lượng tử hoá ảnh màu..............................................51

3.3.2.2.

Tiêu chuẩn J..............................................................................54

3.3.3.

J-Image ............................................................................................58

3.3.4.

Thuật toán phân hoạch không gian ...................................................62

3.3.4.1.

Phát hiện các Valley .................................................................63

3.3.4.2.

Phát triển các Valley .................................................................67

3.3.5.
3.4.

Kết quả thực nghiệm và nhận xét .....................................................69

Kết chương .............................................................................................72

KẾT LUẬN..........................................................................................................73

TÀI LIỆU THAM KHẢO...................................................................................74

-2-


Tìm hiểu một số phương pháp phân đoạn ảnh và khả năng ứng dụng

MỞ ĐẦU
Ngày nay, công nghệ thông tin đã và đang đóng vai trò quan trọng trong đời
sống kinh tế, xã hội của nhiều quốc gia trên thế giới, là một phần không thể thiếu
trong một xã hội ngày càng hiện đại. Các nhu cầu về thông tin ngày càng phức tạp.
Nó không chỉ đơn thuần là các văn bản text như trước kia. Ảnh cũng là một dạng
thông tin rất phổ biến. Người ta sử dụng ảnh để minh hoạ, để biểu diễn thông tin…
Nó đã trở thành công cụ không thể thiếu đối với các hình thức lưu trữ, biểu diễn
thông tin. Và từ đó thì nhu cầu xử lý các bức ảnh để phục vụ cho nhiều mục đích
khác nhau đã dẫn đến việc hình thành một môn khoa học, có tên là: “Xử lý ảnh”.
Nó cũng là một lĩnh vực đang được chú trọng, quan tâm.
Xử lý ảnh bao gồm nhiều kỹ thuật như: thu nhận ảnh, nén dữ liệu ảnh, xử lý
nâng cao chất lượng và khôi phục ảnh, phát hiện biên, phân vùng ảnh, nhận dạng
ảnh… Trong các kỹ thuật trên thì phân vùng ảnh là bước khó nhất trong hệ thống
xử lý ảnh. Nó là tiền đề quan trọng cho bước nhận dạng, là một kỹ thuật có rất
nhiều ứng dụng. Phân đoạn ảnh sẽ trợ giúp đắc lực cho quá trình nhận dạng tìm
kiếm các ảnh để minh hoạ cho các bài báo, tìm kiếm các ảnh chụp về một đối tượng
cho các mục đích khác nhau, giúp phát hiện ra các đối tượng chuyển động trong
một cuốn film, hay đưa ra được tỷ lệ diện tích đất liền và biển trong một khu vực
qua ảnh vệ tinh…
Người ta đã đưa ra một số phương pháp phân đoạn ảnh dựa vào ngưỡng biên
độ, dựa vào miền đồng nhất, dựa theo đường biên. Trong đề tài này, em sẽ tìm hiểu
và cài đặt một số thuật toán phân đoạn ảnh dựa vào ngưỡng biên độ và miền đồng
nhất:

1. Phân đoạn ảnh dựa vào ngưỡng cố định
2. Phân đoạn ảnh bằng thuật toán tam giác
3. Phân đoạn ảnh dựa trên giá trị J – thuật toán JSEG
Cấu trúc của báo cáo tốt nghiệp này như sau:

-3-


Tìm hiểu một số phương pháp phân đoạn ảnh và khả năng ứng dụng
 Chương 1: Sơ lược về các kỹ thuật xử lý ảnh. Chương này trình bày sơ lược
về các kỹ thuật xử lý ảnh. Bao gồm các kỹ thuật sau: thu nhận ảnh, biểu diễn
ảnh, biến đổi và phân tích ảnh, nhận dạng ảnh, nén ảnh.
 Chương 2: Một số kỹ thuật phân đoạn ảnh. Chương này trình bày chi tiết về
một số kỹ thuật phân đoạn ảnh. Kỹ thuật phân vùng ảnh dựa theo ngưỡng
biên độ gồm kỹ thuật phân ngưỡng tự động và kỹ thuật phân ngưỡng cố định.
Kỹ thuật phân vùng ảnh dựa theo miền đồng nhất gồm 3 phương pháp:
phương pháp tách cây tứ phân, phương pháp phân vùng bởi hợp và phương
pháp tổng hợp. Và kỹ thuật phân vùng dựa theo đường biên thì gồm các
bước phát hiện và làm nổi biên, làm mảnh biên, nhị phân hoá đường biên,
mô tả biên.
 Chương 3: Cài đặt thử nghiệm một số thuật toán phân đoạn ảnh. Chương
này mô tả chi tiết về ba thuật toán phân đoạn ảnh là: phân đoạn ảnh dựa theo
ngưỡng cố định, phân đoạn ảnh theo thuật toán tam giác và phân đoạn ảnh
bằng thuật toán JSEG.

-4-


Tìm hiểu một số phương pháp phân đoạn ảnh và khả năng ứng dụng


Chương 1
SƠ LƯỢC VỀ XỬ LÝ ẢNH
Xử lý ảnh là một môn khoa học còn tương đối mới mẻ so với nhiều ngành
khoa học khác. Song cũng đã bắt đầu xuất hiện những máy tính chuyên dụng cho
lĩnh vực này. Người ta đã đưa ra cấu hình một hệ thống xử lý ảnh chuyên dụng gồm
các giai đoạn sau:
Lưu trữ

CAMERA

Thu nhận
ảnh

SENSOR

Số
hoá

Lưu trữ

Phân
tích ảnh

Nhận
dạng

Hệ Q. Định

Hình 1.1. Các giai đoạn chính trong xử lý ảnh
Trước hết là quá trình thu nhận ảnh, ảnh có thể được thu nhận qua camera,

qua bộ cảm ứng (sensor), hay trên máy quét (scanner). Tiếp theo là quá trình số hoá
(digitalizer) để biến đổi tín hiệu tương tự sang tín hiệu rời rạc (lấy mẫu) và số hoá
bằng lượng hoá, trước khi chuyển sang giai đoạn xử lý cần phân tích và lưu trữ lại.
Quá trình phân tích ảnh thực chất bao gồm nhiều công đoạn nhỏ. Trước hết
là công việc tăng cường ảnh để nâng cao chất lượng. Có thể do chất lượng thiết bị
thu nhận ảnh, do nguồn sáng hay do nhiễu làm cho ảnh bị suy biến. Do vậy, cần
phải tăng cường và khôi phục lại ảnh để làm nổi bật một số đặc tính chính của ảnh,
hay làm cho ảnh gần giống nhất với trạng thái gốc - trạng thái trước khi ảnh bị biến
dạng. Giai đoạn tiếp theo là phát hiện các đặc tính như biên, phân vùng ảnh, trích
chọn các đặc trưng…
-5-


Tìm hiểu một số phương pháp phân đoạn ảnh và khả năng ứng dụng
Cuối cùng, tuy theo mục đích của ứng dụng, sẽ là giai đoạn nhận dạng, phân
lớp hay các quyết định khác.
1.1.

Biểu diễn ảnh
Trong biểu diễn ảnh, người ta thường dùng các phần tử đặc trưng của ảnh là

pixel. Nhìn chung có thể xem một hàm 2 biến chứa các thông tin như biểu diễn của
một ảnh. Các mô hình biểu diễn ảnh cho ta một mô tả logic hay định lượng các tính
chất của hàm này. Trong biểu diễn ảnh cần chú ý đến tính trung thực của ảnh hoặc
các tiêu chuẩn thông minh để đo chất lượng ảnh hoặc tính hiệu quả của các kỹ thuật
xử lý.
Việc xử lý ảnh số yêu cầu phải được mẫu hoá và lượng tử hoá. Thí dụ, một
ảnh ma trận 512 dòng gồm khoảng 512x512 pixel. Việc lượng tử hoá ảnh là chuyển
đổi tín hiệu tương tự sang tín hiệu số (Analog Digital Convert) của một ảnh đã lấy
mẫu sang một số hữu hạn mức xám

1.2.

Tăng cường ảnh - Khôi phục ảnh
Tăng cường ảnh là bước quan trọng, tạo tiền đề cho xử lý ảnh. Nó gồm một

loạt các kỹ thuật như: bộ lọc tương phản, khử nhiễu, nổi màu…

ảnh đầu
vào

f ( ,  )



g ( x, y )

h( x , y ;  ,  )

f ( ,  )

Hệ thống thu
nhận ảnh

Nhiễu

ảnh đầu
ra

g ( x, y)




Hình 1.2. Ảnh bị biến dạng do nhiễu

Khôi phục ảnh là nhằm loại bỏ các suy giảm (degradation) trong ảnh. Với
một hệ thống tuyến tính, ảnh của một đối tượng có thể biểu diễn bởi:


g ( x, y ) 

  h( x, y; ,  ) f ( ,  )dd (   ( x, y ))

  

Trong đó:
-

 ( x, y ) là hàm biểu diễn nhiễu cộng

-

f ( ,  ) là hàm biểu diễn đối tượng

-6-


Tìm hiểu một số phương pháp phân đoạn ảnh và khả năng ứng dụng
-

g ( x, y ) là ảnh thu nhận


-

h( x, y; ,  ) là hàm tán xạ điểm (Point spread Function - PSF)

Một vấn đề tiêu biểu là tìm một xấp xỉ của f ( ,  ) khi PSF của nó có thể đo
lường hay quan sát được, ảnh mờ và các tính chất xác suất của quá trình nhiễu.
1.3.

Biến đổi ảnh
Thuật ngữ biến đổi ảnh thường dùng để nói tới một lớp các ma trận đơn vị và

các kỹ thuật dùng để biến đổi ảnh. Cũng như các tín hiệu một chiều được biểu diễn
bởi một chuỗi các hàm cơ sở, ảnh cũng có thể được biểu diễn một chuỗi các ma trận
cơ sở gọi là ảnh cơ sở. Phương trình ảnh cơ sở có dạng: A *kJ  ak al*T với ak là cột
thứ k của ma trận A, A là ma trận đơn vị. Có nghĩa là AA*T  I . Các AkJ* định nghĩa
ở trên với k,l = 0, 1, …, N-1 là ảnh cơ sở. Có nhiều loại biến đổi được dùng như:
-

Biến đổi Fourier, Sin, Cosin, Hadamard,…

-

Tích Kronecker

-

Biến đổi KL (Karhumen Loeve): biến đổi này có nguồn gốc từ
khai triển của các quá trình ngẫu nhiên gọi là phương pháp
trích chọn các thành phần chình.


Do phải xử lý nhiều thông tin, các phép nhân và cộng trong khai triển là khá
lớn. Do vậy, các biến đổi trên nhằm làm việc xử lý ảnh được hiệu quả hơn.
1.4.

Phân tích ảnh
Phân tích ảnh liên quan đến việc xác định các độ đo định lượng của một ảnh

để đưa ra một mô tả đầy đủ về ảnh. Các kỹ thuật được sử dụng ở đây nhằm mục
đích xác định biên của ảnh. Có nhiều kỹ thuật khác nhau như lọc vi phân hay dò
theo quy hoạch động.
Người ta cũng dùng các kỹ thuật để phân vùng ảnh. Từ ảnh thu được, người
ta tiến hành kỹ thuật tách (split) hay hợp (fusion) dựa theo các tiêu chuẩn đánh giá
như: màu sắc, cường độ,… Các phương pháp được biết đến như Quad-Tree, mảnh
hoá biên, nhị phân hoá đường biên. Cuối cùng, phải kể đến các kỹ thuật phân lớp
dựa theo cấu trúc. Đây là công việc vô cùng quan trọng và phức tạp. Nó là tiền đề
cho rất nhiều ứng dụng về ảnh. Để hiểu rõ hơn về phân đoạn ảnh, một số kỹ thuật sẽ
được trình kỹ ở chương 2 và cài đặt thử nghiệm ở chương 3.
1.5.

Nhận dạng ảnh
-7-


Tìm hiểu một số phương pháp phân đoạn ảnh và khả năng ứng dụng
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người ta
muốn đặc tả nó. Quá trình nhận dạng thường đi sau quá trình trích chọn các đặc tính
chủ yếu của đối tượng. Có hai kiểu mô tả đối tượng:
-


Mô tả tham số (Nhận dạng theo tham số).

-

Mô tả theo cấu trúc (Nhận dạng theo cấu trúc).

Trên thực tế, người ta đã áp dụng kỹ thuật nhận dạng khá thành công với
nhiều đối tượng khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ (chữ cái,
chữ số, chữ có dấu).
Nhận dạng chữ viết tay (với mức độ ràng buộc khác nhau về cách viết, kiểu
chữ,…). phục vụ cho nhiều lĩnh vực.
Ngoài hai kỹ thuật nhận dạng trên, hiện nay một kỹ thuật nhận dạng mới dựa
vào kỹ thuật nhận dạng nơron đang được áp dụng và cho kết quả khả quan. Một số
khái niệm về mạng nơron cũng như một ứng dụng mạng nơron trong nhận dạng ký
tự đã được nghiên cứu đến.
1.6.

Nén ảnh
Dữ liệu ảnh cũng như các dữ liệu khác cần phải lưu trữ hay truyền đi trên

mạng. Như đã nói ở trên lượng thông tin phải truyền đi là rất lớn. Ví dụ, một ảnh
đen trắng cỡ 512x512 với 256 mức xám chiếm 256 K bytes. Do đó, làm giảm lượng
thông tin hay nén dữ liệu là một nhu cầu cần thiết. Nhiều phương pháp nén dữ liệu
khác được nghiên cứu và áp dụng cho loại dữ liệu đặc biệt này.

-8-


Tìm hiểu một số phương pháp phân đoạn ảnh và khả năng ứng dụng


Chương 2
MỘT SỐ KỸ THUẬT PHÂN ĐOẠN ẢNH
2.1.

Sơ lược về phân đoạn ảnh
Phân tích ảnh là bước then chốt trong xử lý ảnh. Nhiệm vụ của quá trình này

là từ các ảnh đã có, phân tích ảnh thành các thành phần có cùng tích chất nào đó hay
lấy ra “những đối tượng đáng quan tâm” hoặc những ảnh con để phục vụ cho
những bước tiếp theo của quá trình xử lý ảnh. Quá trình phân đoạn chia tách đối
tượng ra khỏi nền, lựa chọn các ảnh riêng lẻ từ một bộ sưu tập ảnh các đối tượng
hoặc phân tách các đối tượng phủ lên nhau. Quá trình phân đoạn là cơ sở cho các
quá trình tiếp theo như đánh giá các tế bào và nhân trong mẫu cắt mô, nhận dạng
chữ viết hoặc đánh giá các ảnh chụp từ không trung.
Ta có thể xem xét quá trình phân đoạn ảnh như là quá trình phân loại điểm
ảnh khi ta phân biệt giữa điểm ảnh nền và điểm ảnh đối tượng, nhằm phân tích ảnh
thành các thành phần có cùng tính chất nào đó dựa theo biên hay các vùng liên
thông. Tiêu chuẩn để xác định các vùng liên thông có thể là cùng mức xám, cùng
màu hay cùng độ nhám...
Nếu phân vùng dựa trên các miền liên thông, ta gọi là kỹ thuật phân vùng
dựa theo miền đồng nhất. Nếu ta phân vùng dựa vào đường biên gọi là kỹ thuật
phân vùng biên. Ngoài ra, còn có kỹ thuật khác như phân vùng dựa vào ngưỡng
biên độ, phân vùng theo kết cấu (texture segmentation).
Mục đích của phân tích ảnh là để có một miêu tả tổng hợp về nhiều phân tử
khác nhau cấu tạo nên ảnh thô (brut image). Vì lượng thông tin chứa trong ảnh là rất
lớn, trong khi đó đa số ứng dụng chỉ cần một số thông tin đặc trưng nào đó. Do
vậy, chúng ta cần có một quá trình để giảm lượng thông tin khổng lồ ấy. Quá trình

-9-



Tìm hiểu một số phương pháp phân đoạn ảnh và khả năng ứng dụng
này bao gồm phân vùng ảnh và trích chọn các đặc trưng chủ yếu. Các kỹ thuật này
sẽ được đề cập dưới đây.
2.2.

Phân vùng ảnh dựa theo ngưỡng biên độ
Đặc tính đơn giản nhất và có thể hữu ích nhất của ảnh đó là biên độ của các

tính chất vật lý của ảnh như: độ phản xạ, độ truyền sang, màu sắc hoặc đáp ứng đa
phổ. Thí dụ, trong ảnh X-quang, biên độ mức xám biểu diễn đặc tính bão hoà của
các phần hấp thụ của cơ thể và làm cho ta có khả năng phân biệt xương với các
phần mềm, tế bào lành với các tế bào bị nhiễm bệnh…
Như vậy, có thể dùng ngưỡng biên độ để phân vùng khi mà biên độ đủ lớn
đặc trưng cho ảnh. Thí dụ, biên độ trong bộ cảm biến ảnh hồng ngoại có thể phản
ánh vùng nhiệt độ thấp hay vùng có nhiệt độ cao hơn. Kỹ thuật phân ngưỡng theo
biên độ rất có ích đối với ảnh nhị phân như văn bản in, đồ hoạ, ảnh màu hay ảnh Xquang.
Trước hết cần đưa về ảnh nhị phân một cách đơn giản bằng một giá trị
ngưỡng. Các điểm ảnh ở trên một ngưỡng T sẽ là đối tượng còn dưới ngưỡng T sẽ
là những điểm nền. Ta có một hàm biến đổi tổng quát :
1, khi B( x, y )  T
với 0  T  255
A( x, y )  
0, khi B( x, y )  T

(2.1)

Hàm này được hiện thực hoá bằng một bảng dò tìm (LUT - Look Up Table)
trên đó một ảnh xám B( x, y) được biến đổi thành một ảnh nhị phân AT ( x, y ), hay
còn gọi là quá trình nhị phân hoá.

Phương pháp ngưỡng vừa trình bày trên đây phân loại điểm ảnh dựa trên tính
chất “giá trị xám” của các điểm đối tượng và các điểm nền. Đặc điểm của vùng lân
cận điểm ảnh không được quan tâm đến. Khi quyết định xem một điểm ảnh nào đấy
có thuộc về đối tượng hay không phương pháp này chỉ hướng theo giá trị xám của
một điểm ảnh. Một kết quả như ý đòi hỏi có một ngưỡng tối ưu được xác định,
ngưỡng này có thể dễ dàng tìm được ở nhiều ứng dụng.
Một số phương pháp được sử dụng để tìm. Đơn giản nhất là dùng ngưỡng cố
định khi ảnh có độ sáng tối rõ ràng. Nhưng để tìm ngưỡng một cách tối ưu hơn với

- 10 -


Tìm hiểu một số phương pháp phân đoạn ảnh và khả năng ứng dụng
những ảnh không có độ sáng tối rõ ràng như vậy thì có thể dùng đến các phương
pháp tìm ngưỡng tự động.
2.2.1. Ngưỡng cố định
Các ảnh với đối tượng sáng trên nền tối hoặc đối tượng tối trên nền sáng có
thể được phân đoạn tương đối tốt bằng cách lựa chọn một ngưỡng cố định. Ngưỡng
này có thể do người sử dụng lựa chọn tuy theo ảnh, hoặc cũng có thể mặc đinh là T
= 128.
Ngưỡng T được chọn sao cho các điểm có màu sáng là điểm nền (phân bố
biểu đồ cột ở bên phải T) và các điểm tối thuộc về đối tượng (phân bố biểu đồ cột
bên trái T) được phân tách ra như hình dưới đây.

Hình 2.1.a:
Ảnh gốc

Hình 2.1.b: Histogram điểm đánh
dấu tại ngưỡng T = 128


Hình2.1.c: Ảnh
nhị phân với
ngưỡng T=128

Đây là một thuật toán tương đối đơn giản. Ý tưởng chính của thuật toán chỉ
là phân ngưỡng ảnh bằng giá trị xám cố định độc lập với dữ liệu ảnh và chi tiết về
thuật toán được trình bày chi tiết ở mục 3.1 thuộc chương 3.
2.2.2. Ngưỡng tự động
Việc chọn ngưỡng trong kỹ thuật này là bước rất quan trọng. Với những ảnh
mà độ tương phản màu sắc không cao, nếu áp dụng phân ngưỡng cố định thì kết quả
phân đoạn ảnh sẽ không tốt. Khi đó, có thể áp dụng một số phương pháp phân
ngưỡng tự động. Người ta thường tiến hành theo các bước chung sau:
-

Xem xét lược đồ xám của ảnh để xác định các đỉnh và các khe. Nếu ảnh
có dạng rắn lượn (nhiều đỉnh và khe) các khe có thể sử dụng để chọn
ngưỡng.

-

Chọn ngưỡng t sao cho một phần xác định trước  của toàn bộ số mẫu là
thấp hơn t.
- 11 -


Tìm hiểu một số phương pháp phân đoạn ảnh và khả năng ứng dụng
-

Điều chỉnh ngưỡng dựa trên xem xét lược đồ xám của các điểm lân cận.


-

Chọn ngưỡng như xem xét lược đồ xám của những điểm thoả mãn tiêu
chuẩn chọn. Thí dụ, với ảnh có độ tương phản thấp, lược đồ của những
điểm có biên độ Laplace g(m,n) lớn hơn giá trị t định trước (sao cho từ
5% đến 10% số điểm ảnh với gradient lớn nhất sẽ coi như biên) sẽ cho
phép xác định các đặc tính ảnh lưỡng cực tốt hơn ảnh gốc.

-

Khi có một mô hình phân lớp xác suất, việc xác định ngưỡng dựa vào
tiêu chuẩn nhằm cực tiểu xác suất của sai số hoặc một số tính chất khác
theo luật Bayes.
Trong hầu hết các trường hợp, ngưỡng được chọn từ lược đồ độ sáng của

vùng hay ảnh cần phân đoạn. Có rất nhiều kỹ thuật chọn ngưỡng tự động xuất phát
từ lược đồ xám đã được đưa ra. Trong đó có thuật toán tam giác được trình bày chi
tiết trong mục 3.2 ở chương 3.
2.3.

Phân vùng theo miền đồng nhất
Kỹ thuật phân đoạn ảnh thành các miền đồng nhất dựa vào các tính ch ất quan

trọng nào đó của miền. Việc lựa chọn các tính chất của miền sẽ xác định các tiêu
chuẩn phân vùng. Ở đây cũng cần phải xác định rõ tính đồng nhất của một miền của
ảnh. Vì đó là điểm chủ yếu xác định tính hiệu quả của việc phân vùng. Các tiêu
chuẩn hay được dùng là sự thuần nhất về mức xám, kết cấu sợi và chuyển động.
Thí dụ, với ảnh hàng không, việc phân vùng theo màu cho phép phân biệt
thảm thực vật: cánh đồng màu xanh hay mày vàng, rừng xanh thẫm, đường màu
xám, mái nhà màu đỏ…

Đối với ảnh chuyển động, người ta tiến hành trừ 2 ảnh quan sát được tại 2
thời điểm khác nhau. Trong trường hợp này, phần ảnh không thay đổi sẽ nhận giá
trị không, những phần thay đổi sẽ nhận giá trị dương hay âm tương ứng với thay đổi
hay dịch chuyển. Như vậy, việc trừ ảnh thực ra là một xấp xỉ của đạo hàm theo thời
gian của ảnh. Thực vậy, giả sử I(t) và I (t   ) là 2 ảnh quan sát ở thời điểm t và
t   . Nếu thời gian quan sát  là nhỏ, ta sẽ nhận được xấp xỉ của đạo hàm một

cách trực tiếp:
I i (t   )  I (t )

t


(2.2)
- 12 -


Tìm hiểu một số phương pháp phân đoạn ảnh và khả năng ứng dụng
Với cách tính này ta có thể biết được vận tốc dịch chuyển của ảnh.
Cũng nhờ kỹ thuật trừ ảnh ta có thể xác định đựơc sự xuất hiện của các đối
tượng mới (tín hiệu dương) hay sự biến mất của các đối tượng trong ảnh trước (tín
hiệu âm).
Tính kết cấu là đặc tính rất quan trọng trong phân vùng ảnh. Nhờ nó, ta có
thể phân biệt thảm cỏ với một mặt nhuộm màu xanh lá cây. Tính kết cấu đặc trưng
cho kiểu dạng xuất hiện lặp trên bề mặt nào đó của đối tượng. Có 2 kiểu lặp: lặp có
tính chu kỳ và lặp ngẫu nhiên. Lặp ngẫu nhiên thường gặp trong tự nhiên như cát,
thảm cỏ; còn lặp có tính chu kỳ là lặp nhân tạo.
Người ta có thể dùng logic vị từ để làm tiêu chuẩn đánh giá phân đoạn. Giả
sử ảnh X phải phân thành n vùng khác nhau: Z1, Z2, ..., Zn và lôgic vị từ có dạng
P(Z). Việc phân vùng phải thoả mãn các tính chất sau:

n

X

Z i ; i  1,2,..., n


i 1

Z  Z   ; i  j
j
 i
 P( Z )  True; i  1,2,..., n
i

 P( Z i  Z j )  False; i  j

(2.3)

Kết quả của việc phân đoạn ảnh phụ thuộc vào dạng của vị từ P và các đặc
tính biểu diễn bởi vectơ đặc tính. Thường vị từ P có dạng P(Z, X, t), với X là vectơ
đặc tính, t là ngưỡng. Trường hợp đơn giản nhất, véc tơ đặc tính chỉ chứa giá trị
mức xám của ảnh I(k, t) và ngưỡng chỉ đơn thuần là giá trị T.
P(Z): I (k, I)
(2.4)

Với ảnh màu, véc tơ đặc tính X có thể là thành phần ba màu R, G, B và
IR(k,l), IG(k,l), IB(k, l) là các thành phần tương ứng. Lúc đó luật phân ngưỡng có
dạng:

P(Z,X,t): IR( k,l)
(2.5)

Có ba cách tiếp cận chủ yếu trong phân vùng ảnh theo miền đồng nhất và
độc lập với tiêu chuẩn lựa chọn tính đồng nhất:
- Phương pháp phân tách – cây tứ phân (split – quad trees)
- 13 -


Tìm hiểu một số phương pháp phân đoạn ảnh và khả năng ứng dụng
- Phương pháp hợp (merge).
- Phương pháp tách - hợp ( split – merge).
Mức độ hiệu quả của các phương pháp là phụ thuộc vào việc lựa chọn tiêu
chuẩn đánh giá độ thuần nhất. Trên thực tế người ta hay sử dụng trung bình số học,
và độ lệch chuẩn i cho vùng Zi có n điểm:
mi 

1
 I (k , l )
n ( k ,l )Z

i 

(2.6)

1
( I (k )  mi ) 2

n ( k ,l )Z


(2.7)

Hai vùng Zi và Zj có thể hợp nhất nếu | mi-mj | < ki.
2.3.1. Phương pháp tách cây tứ phân
Về nguyên tắc, phương pháp này kiểm tra tính hợp thức của tiêu chuẩn đồng
nhất một cách tổng thể trên miền lớn. Nếu tiêu chuẩn được thoả mãn, việc phân
đoạn coi như kết thúc. Trong trường hợp ngược lại ta chia miền đang xét thành 4
miền nhỏ hơn, ta lại áp dụng đệ quy bằng phương pháp trên cho mỗi miền nhỏ hơn
cho đến khi tất cả các miền đều thoả mãn. Phương pháp này có thể mô tả bằng thuật
toán sau (và cần lưu ý rằng tham số là miền đang xét):
Procedure PhanDoan(Mien)
Begin
If miền đang xét không thoả Then
Begin
Chia miền đang xét thành 4 miền: Z1, Z2, Z3, Z4
For i=1 to 4 Do PhanDoan(Zi)
End
Else Exit
End;

Có thể dựa vào mức xám để xét tiêu chuẩn miền đồng nhất. Giả sử Max và
Min là giá trị mức xám lớn nhất và nhỏ nhất trong miền đang xét. Khi đó,
- 14 -


Tìm hiểu một số phương pháp phân đoạn ảnh và khả năng ứng dụng
 tiêu chuẩn để miền đang xét là đồng nhất có thể là:
| max-min | < T


(2.8)

với T là một ngưỡng
 Nếu miền đang xét không thoả mãn tiêu chuẩn thì không phải là miền
đồng nhất và sẽ được chia thành 4 phần.

Thuật toán kiểm tra tiêu chuẩn theo (2.8) được viết:
Fuction Examin_Criteria(I,N1,M1,N2, M2, T)
/*

Giả sử là ảnh có tối đa 255 mức xám.
(N1,M1), (N2, M2) là toạ độ điểm đầu và điểm cuối của miền, T là

ngưỡng. */
Begin
1. Max = 0; Min = 255;
2. For i = N1 to N2 do
For j = N1 to N2 do
If I(i,j) < Min Then Min = I(i,j);
If I(i,j) >Max Then Max = I(i,j);
3.

If ABS(max - min) < T Then Examin_Criteria = 0
Else Examin_Criteria = 1;

End

Nếu hàm trả về giá trị 0, có nghĩa vùng đang xét là đồng nhất, trường hợp
ngược lại nghĩa là mức không đồng nhất. Trong giải thuật trên, khi miền là đồng
nhất cần tính lại giá trị trung bình và cập nhật lại ảnh đầu ra. Giá trị trung bình được

tính bởi:
Tổng giá trị mức xám/ tổng số điểm.
Thuật toán này tạo nên một cây mà mỗi nút cha có 4 nút con ở mọi mức, trừ
mức ngoài cùng. Vì thế, cây này có tên là cây tứ phân. Cây này cho hình ảnh rõ nét
về cấu trúc phân cấp các vùng tương ứng với tiêu chuẩn.
- 15 -


Tìm hiểu một số phương pháp phân đoạn ảnh và khả năng ứng dụng

Hình dưới đây mô tả một ví dụ về phương pháp phân vùng bởi tách:

a. Ảnh gốc

b. Phân mức 1

- 16 -


Tìm hiểu một số phương pháp phân đoạn ảnh và khả năng ứng dụng

c. Phân mức 2

d. Phân mức 3
Hình 2.2: Phân vùng bởi tách

Một vùng thoả mãn tiêu chuẩn tạo nên một nút lá, nếu không sẽ tạo nên một
nút trong và 4 nút con tương ứng của việc chia làm 4 vùng. Mỗi nút lá của cây biểu
diễn một vùng đã phân chia theo tiêu chuẩn. Cứ tiếp tục như vậy cho đến khi phân
- 17 -



Tìm hiểu một số phương pháp phân đoạn ảnh và khả năng ứng dụng
xong. Các nút lá của cây biểu diễn số vùng đã phân theo tiêu chuẩn (như trên hình
2.3).
Tiêu chuẩn phân vùng ở đây là màu sắc. Nếu mọi điểm của vùng là màu
trắng sẽ tạo nên một nút lá trắng và tương tự như vậy với nút lá đen. Nút màu ghi có
nghĩa là vùng không thuần nhất và phải tiếp tục chia.

1

5

2

4

3

6

7

8

9

10

11


17

18

19

20

21

22

12

23

13

24

15

14

25

26

27


16

28

Hình 2.3: Cây tứ phân tương ứng

2.3.2. Phương pháp cục bộ hay phân vùng bởi hợp
Ý tưởng của phương pháp này là xem xét ảnh từ các miền nhỏ nhất rồi hợp
chúng lại nếu thoả mãn tiêu chuẩn để được một miền đồng nhất lớn hơn. Ta lại tiếp
tục với miền thu được cho đến khi không thể hợp được nữa. Số miền còn lại cho ta
kết quả phân đoạn ảnh. Miền nhỏ nhất của bước xuất phát là điểm ảnh.

- 18 -


Tìm hiểu một số phương pháp phân đoạn ảnh và khả năng ứng dụng
Phương pháp này hoàn toàn ngược với phương pháp tách. Song điều quan
trọng ở đây là nguyên lý hợp 2 vùng. Việc hợp hai vùng được thực hiện theo
nguyên tắc sau:
- Hai vùng phải đáp ứng tiêu chuẩn, như cùng màu hay cùng mức xám
- Chúng phải kế cận nhau

a/ 4 liên thông

b/ 8 liên thông

Hình 2.4. Khái niệm 4 và 8 liên thông

Chúng ta nên làm rõ khái niệm kế cận. Trong xử lý ảnh người ta dùng khái

niệm liên thông để xác định kế cận. Có hai khái niệm liên thông là 4 liên thông và 8
liên thông. Với 4 liên thông một điểm ảnh I (x,y) sẽ có 4 kế cận theo hướng x, y.
Trong khi đó, với 8 liên thông, điểm ảnh I(x, y) sẽ có 4 liên thông theo hai hướng x
và y và 4 liên thông khác theo hướng chéo 450 . Hình trên cho ta khái niệm về 4 và
8 liên thông.
Dựa theo nguyên lý của phương pháp hợp, ta có 2 thuật toán:

2.3.2.1.

-

Thuật toán tô màu (Blog coloring)

-

Thuật toán đệ quy cục bộ

Thuật toán tô màu

Thuật toán này sử dụng khái niệm 4 liên thông. Người ta dùng một cửa sổ di
chuyển trên ảnh để sánh với tiêu chuẩn hợp. Thuật toán có thể tóm tắt như sau:
For mỗi điểm I(x,y) do
/*Kiểm tra màu của các lân cận*/
Begin
- 19 -


Tìm hiểu một số phương pháp phân đoạn ảnh và khả năng ứng dụng
If Criteria(x,y)=Criteria(x-1,y) Then M(x,y)=M(x-1,y)
Else

If Criteria(x,y)=Criteria(x,y-1) Then M(x,y)=M(x,y-1)
Else
M(x,y)=NewM;
End
/*Hợp lại nếu các lân cận cùng màu*/
If (Criteria(x,y)=Criteria(x-1,y)) and (Criteria(x,y)=Criteria(x,y-1))
Then
Merge 2 phân vùng bằng cách để màu giống nhau

Trong thuật toán trên, chỉ tiêu hợp là màu đồng nhất. Thực tế chứng tỏ rằng
thuật toán này tỏ ra khá hiệu quả khi dùng camera một hàng vì có thể phân đoạn
theo từng hàng.
2.3.2.2.

Thuật toán đệ quy cục bộ

Thuật toán này sử dụng phương pháp tìm kiếm trong một cây để làm tăng
kích thước vùng. Trước tiên, người ta tìm kiếm các lân cận để tăng kích thước tối đa
của vùng rồi sau đó mới quan tâm đến các vùng khác và cũng áp dụng thuật toán
trên. Thuật toán này sử dụng một thủ tục đệ quy GiaTang để thực hiện việc tăng
kích thước một vùng. Thuật toán được mô tả như sau:
a) Thủ tục chính
Procedure DQCB
Begin
For mỗi điểm I(x,y) do
If I(x,y)<>0 Then
Begin
Save(I(x,y))
GiaTang(x,y)
NSeg <= NSeg+1

End
End
b) Thủ tục GiaTang
- 20 -


Tìm hiểu một số phương pháp phân đoạn ảnh và khả năng ứng dụng
I(x,y)<=0

/*Đặt I(x,y) là 0 để không phải xét lại*/

For mọi điểm kế cận của I(x,y) do
Begin
If (I(x,y)<>0 and Criteria(pixel)=Criteria_Bd)
Then GiaTang(pixel);
End
Nhìn chung phương pháp này nhanh và dễ cài đặt.
2.3.3. Phương pháp tổng hợp
Hai phương pháp vừa xét ở trên có một số nhược điểm. Phương pháp tách
tạo nên một cấu trúc phân cấp và thiết lập mối quan hệ giữa các vùng. Tuy nhiên,
nó thực hiện việc chia quá chi tiết. Phương pháp hợp cho phép làm giảm số miền
liên thông xuống tối thiểu nhưng cấu trúc hàng ngang dàn trải, không cho ta thấy
mối liên hệ giữa các miền.
Chính vì nhược điểm này mà ta nghĩ đến cách phối hợp cả 2 phương pháp.
Trước tiên, dùng phương pháp tách để tạo nên cây tứ phân, phân đoạn theo hướng
từ gốc đến lá. Tiếp theo, tiến hành duyệt cây theo chiều ngược lại và hợp các vùng
có cùng tiêu chuẩn. Với phương pháp này ta thu được miêu tả cấu trúc của ảnh với
các miền liên thông có kích thước tối đa.
Giải thuật tách hợp gồm một số bước chính sau:
1. Kiểm tra tiêu chuẩn đồng nhất

a) Nếu không thoả và số điểm trong vùng lớn hơn một điểm, tách làm
4 vùng (trên, dưới, trái, phải) bằng cách gọi đệ quy. Nếu kết quả
tách xong và không tách được nữa chuyển sang bước 2.
b) Nếu tiêu chuẩn đồng nhất là thoả thì tiến hành hợp vùng và cập
nhật giá trị trung bình cho vùng.
2. Hợp vùng

Cần kiểm tra 4 lân cận đã nêu trên. Có thể có nhiều vùng thoả mãn khi đó ta
chọn vùng tối ưu rồi tiến hành hợp.
- 21 -


Tìm hiểu một số phương pháp phân đoạn ảnh và khả năng ứng dụng
Phương pháp này thu được kết quả số vùng là nhỏ hơn phương pháp tách.
1
4

Hiện

3

thời
2
Hình 2.5: 4 lân cận của điểm hiện thời

Với ví dụ trong hình 2.2, áp dụng phương pháp tách hợp ta thu được một cây
chỉ có 2 phân vùng hay nói cách khác là phân đoạn ảnh thành 2 miền đồng nhất. Rõ
ràng là phương pháp này đạt hiệu quả tốt hơn so với phương pháp tách.

Hình 2.6: Cây thu được theo phương pháp tách hợp


2.4.

Phân vùng dựa theo đường biên
Biên là một trong những đặc trưng quan trọng của ảnh. Cũng vì thế mà trong

nhiều ứng dụng, người ta sử dụng cách phân đoạn theo biên. Việc phân đoạn ảnh
dựa vào biên được tiến hành qua một số bước:
-

Phát hiện biên và làm nổi biên

-

Làm mảnh biên

-

Nhị phân hoá đường biên

-

Miêu tả đường biên
- 22 -


Tìm hiểu một số phương pháp phân đoạn ảnh và khả năng ứng dụng
2.4.1. Phát hiện biên và làm nổi biên
Biên là một vấn đề chủ yếu trong phân tích ảnh vì các kỹ thuật phân đoạn
ảnh chủ yếu dựa vào biên. Một điểm ảnh có thể coi là biên nếu ở đó có sự thay đổi

đột ngột về mức xám. Tập hợp các điểm biên tạo thành biên hay đường bao của ảnh
(boundary). Thí dụ, trong một ảnh nhị phân, một điểm ảnh có thể coi là biên nếu nó
là điểm đen và có ít nhất một điểm trắng lân cận.
Ta xét ví dụ sau để thấy được tầm quan trọng của biên. Khi người hoạ sĩ vẽ
một cái bàn gỗ, chỉ cần vài nét phác thảo về hình dáng như mặt bàn, chân bàn mà
không cần thêm các chi tiết khác, người xem đã có thể nhận ra đó là cái bàn. Nếu
ứng dụng của ta là phân lớp nhận diện đối tượng, thì coi như nhiệm vụ đã hoàn
thành. Tuy nhiên, nếu đòi hỏi thêm về các chi tiết như vân gỗ hay màu sắc… thì với
chừng ấy thông tin là chưa đủ.
Về toán học, người ta coi điểm biên của ảnh là điểm có sự biến đổi đột ngột
về độ xám, như trong hình 2.7 dưới đây:
Phát hiện biên một cách lý tưởng là xác định được tất cả các đường bao trong
các đối tượng. Định nghĩa toán học của biên ở trên là cơ sở cho các kỹ thuật phát
hiện biên. Điểm quan trọng là biến thiên giữa các điểm ảnh thường là nhỏ, trong khi
đó biến thiên độ sáng của điểm biên (khi qua biên) lại khá lớn.
Xuất phát từ cơ sở này, người ta thường sử dụng hai phương pháp phát hiện
biên như sau:
 Phương pháp phát hiện biên trực tiếp: Phương pháp này nhằm làm nổi
biên dựa vào sự biến thiên về giá trị độ sáng của điểm ảnh. Kỹ thuật chủ
yếu dùng phát hiện biên ở đây là kỹ thuật đạo hàm. Nếu lấy đạo hàm bậc
nhất của ảnh ta có phương pháp Gradient. Nếu lấy đạo hàm bậc hai của
ảnh ta có kỹ thuật Laplace.
 Phương pháp phát hiện biên gián tiếp: Nếu bằng cách nào đấy ta phân
được ảnh thành các vùng thì đường phân ranh giữa các vùng đó chính là
biên. Việc phân vùng ảnh thường dựa vào kết cấu texture của ảnh hoặc
dựa vào một số yếu tố khác.

- 23 -



Tìm hiểu một số phương pháp phân đoạn ảnh và khả năng ứng dụng

Mức xám

a) Đường biên lý tưởng

Mức xám

b) Đường biên bậc thang

Mức xám

c) Đường bao thực

x

Hình 2.7: Đường biên của ảnh

Cũng cần chú ý rằng kỹ thuật dò biên và phân vùng ảnh là hai bài toán đối
ngẫu của nhau. Thực vậy, dò biên để thực hiện phân lớp đối tượng và một khi đã
phân lớp xong có nghĩa là đã phân vùng được ảnh. Và ngược lại, Khi đã phân vùng,
ảnh đã phân lập được thành các đối tượng, ta có thể phát hiện được biên. Phương
pháp dò biên trực tiếp tỏ ra khá hiệu quả vì ít khi chịu ảnh hưởng của nhiễu. Song
nếu sự biến thiên độ sáng không đột ngột. Phương pháp này lại tỏ ra kém hiệu quả.
Phương pháp dò biên gián tiếp tuy khó cài đặt, song lại áp dụng khá tốt khi sự biến
thiên độ sáng nhỏ.

- 24 -



Tìm hiểu một số phương pháp phân đoạn ảnh và khả năng ứng dụng
Có một số phương pháp phát hiện biên hay được sử dụng như: phương pháp
Gradient, kỹ thuật Laplace.
2.4.1.1.

Phương pháp Gradient

Phương pháp Gradient là phương pháp dò biên cục bộ dựa vào cực đại của
đạo hàm. Gradient là một véctơ có các thành phần biểu thị tốc độ thay đổi giá trị
của điểm ảnh theo hai hướng x và y. Các thành phần của gradient được tính bởi:
f ( x, y )
f ( x  dx, y)  f ( x, y )
 fx 
x
dx
f ( x, y )
f ( x, y  dy)  f ( x, y )
 fy 
y
dy

(2.9)

với dx là khoảng cách giữa các điểm theo hướng x (khoảng cách tính bằng số
điểm), tương tự, dy là khoảng cách giữa các điểm theo hướng y. Thực tế, người ta
hay dùng với dx = dy = 1.
Với một ảnh liên tục f(x,y), các đạo hàm riêng của nó cho phép xác định vị
trí cực đại cục bộ theo hướng của biên. Thực vậy, một ảnh liên tục được biểu diễn
bởi một hàm f(x,y) dọc theo r với góc  được định nghĩa bởi:
df f dx f dy



 f x cos  f y sin 
dr x dr y dr

(2.10)

df
đối với  đạt cực đại khi(df / d )(df / dr)=0 hay  f x cos  f y sin   0
dr

Do vậy, ta có thể xác định hướng cực đại của nó:  r  tan 1  fy fx  và
df
max 
dr

fx 2  fy 2 . Ta gọi  r là hướng của biên.

Đạo hàm của ảnh là không tồn tại vì f(x,y) không liên tục. Ở đây, ta chỉ sử
dụng mô phỏng theo ý nghĩa của đạo hàm, việc tính toán là xấp xỉ đạo hàm bằng kỹ
thuật nhân chập. Trong phương pháp gradient, người ta chia nhỏ thành hai kỹ thuật
(do sử dụng hai toán tử khác nhau):
-

Kỹ thuật gradient dùng toán tử gradient, lấy đạo hàm theo một hướng

-

Kỹ thuật la bàn dùng toán tử la bàn, lấy đạo hàm theo tám hướng:
Bắc, Nam, Đông, Tây, và Đông Bắc, Tây Bắc, Đông Nam, Tây Nam.

- 25 -


×