Tải bản đầy đủ (.docx) (65 trang)

Nghiên cứu và hệ thống một số phương pháp phân đoạn ảnh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.14 MB, 65 trang )

LỜI CẢM ƠN

Lời đầu tiên em xin bày tỏ lòng biết ơn sâu sắc tới thầy PGS.TS Ngô Quốc
Tạo, Viện Công Nghệ Thông Tin – Viện Khoa Học Công Nghệ Việt Nam, người đã
tận tình hướng dẫn, chỉ bảo, giúp đỡ em hoàn thành đồ án tốt nghiệp này. Em xin
gửi lời cảm ơn chân thành đến Thầy PGS.TS Đỗ Năng Toàn, Viện Công Nghệ
Thông Tin - Viện Khoa Học & Công Nghệ Việt Nam.
Em cũng xin gửi lời cảm ơn chân thành đến các thầy cô giáo trong bộ môn
Công nghệ thông tin trường Đại học Dân Lập Hải Phòng đã nhiệt tình giảng dạy,
truyền đạt kiến thức cho em trong suốt 4 năm học qua.
Cuối cùng em xin gửi lời cảm ơn đến gia đình, bạn bè những người đã động
viên giúp đỡ em rất nhiều trong suốt quá trình học tập tại trường cũng như quá trình
làm đồ án này.

Hải Phòng , tháng 7 năm 2019

Sinh viên

1


MỤC LỤC
LỜI CẢM ƠN ............................................................................................................. 1
LỜI MỞ ĐẦU ............................................................................................................. 4
CHƯƠNG 1. TỔNG QUAN XỬ LÝ ẢNH ............................................................... 6
1.1. Giới thiệu vể xử lý ảnh ................................................................................... 6
1.2 Quá trình xử lý ảnh .......................................................................................... 7
1.3. Tổng quan về phân đoạn ảnh .......................................................................... 9
1.4 Một số khái niệm cơ bản ................................................................................ 10
1.4.1 Điểm ảnh – Pixel ..................................................................................... 10
1.4.2 Mức xám - Gray level ............................................................................. 10


1.4.3 Biên ......................................................................................................... 10
1.4.4 Láng giềng ............................................................................................... 11
1.4.5 Vùng liên thông ...................................................................................... 11
1.4.6 Biểu diễn ảnh ........................................................................................... 11
1.4.7 Tăng cường và khôi phục ảnh ................................................................. 12
1.4.8 Biến đổi ảnh ............................................................................................. 12
1.4.9. Phân tích ảnh .......................................................................................... 12
1.4.10 Nhận dạng ảnh ....................................................................................... 12
1.4.11 Nén ảnh .................................................................................................. 12
1.5 Các định dạng cơ bản trong xử lý ảnh ........................................................... 12
CHƯƠNG 2. PHÂN ĐOẠN ẢNH DỰA VÀO NGƯỠNG ..................................... 13
2.1 Giới thiệu chung ............................................................................................ 13
2.2 Chọn ngưỡng cố định .................................................................................... 14
2.3 Chọn ngưỡng dựa trên lược đồ (Histogram) ................................................. 15
2.3.1 Thuật toán đẳng liệu ............................................................................... 15
2.3.2 Thuật toán đối xứng nền ......................................................................... 15
2.3.3 Thuật toán tam giác ................................................................................. 17
2.3.4 Chọn ngưỡng đối với Bimodal Histogram ............................................. 17
2.4 Phân ngưỡng tối ưu dựa trên sự không ổn định của lớp và tính đồng nhất
của vùng ............................................................................................................... 19
2.4.1 Giới thiệu ................................................................................................ 19
2.4.2 Cơ sở lý thuyết và thuật toán .................................................................. 20
CHƯƠNG 3. PHÂN ĐOẠN THEO MIỀN ĐỒNG NHẤT ..................................... 33
3.1 Giới thiệu ....................................................................................................... 33
3.2 Phương pháp tách cây tứ phân ....................................................................... 34
3.3 Phương pháp phân vùng hợp ......................................................................... 37
3.4 Phương pháp tách hợp ( Split- Meger) .......................................................... 38
3.5 Nhận xét ......................................................................................................... 39
CHƯƠNG 4. PHÂN ĐOẠN DỰA VÀO ĐỒ THỊ .................................................. 40
4.1 Giới thiệu ....................................................................................................... 40

4.2 Phân đoạn dựa vào đồ thị .............................................................................. 41
4.3 Tính chất của so sánh cặp miền ...................................................................... 42
4.4 Thuật toán và các tính chất ........................................................................... 43
4.5 Nhận xét ......................................................................................................... 49
CHƯƠNG 5. CÀI ĐẶT THỬ NGHIỆM .................................................................. 50
5.1 Thuật toán Đẳng liệu : ................................................................................... 50
5.2 Thuật toán Tam giác : .................................................................................... 54

2


5.3 Thuật toán GraphBased :.............................................................................. 57
5.4 Kết quả đạt được........................................................................................... 60
KẾT LUẬN............................................................................................................ 62
TÀI LIỆU THAM KHẢO....................................................................................... 65

3


LỜI MỞ ĐẦU
Cùng với sự phát triển ngày càng mạnh mẽ của khoa học kĩ thuật trong một
vài thập kỷ gần đây, xử lý ảnh tuy là một ngành khoa học còn tương đối mới mẻ so
với nhiều ngành khoa học khác nhưng hiện nay nó đang là một trong những lĩnh
vực phát triển rất nhanh và thu hút sự quan tâm đặc biệt từ các nhà khoa học, thúc
đẩy các trung tâm nghiên cứu, ứng dụng về lĩnh vực hấp dẫn này. Điều này hoàn
toàn có thể lý giải được từ một định nghĩa đơn giản: Xử lý ảnh là ngành khoa học
nghiên cứu các quá trình xử lý thông tin dạng hình ảnh, mà hình ảnh là một dạng
thông tin vô cùng phong phú, đa dạng và là phương tiện giao tiếp, trao đổi chủ yếu
của con người. Thông tin hình ảnh ngày nay có thể được xử lý dễ dàng bằng máy
tính, chính vì thế, trong những năm gần đây sự kết hợp giữa ảnh và đồ hoạ đã trở

nên rất chặt chẽ trong lĩnh vực xử lý thông tin. Mục tiêu chính của xử lý ảnh thường
là:
-

Xử lý ảnh ban đầu để có được ảnh mới theo một yêu cầu xác định (ví

dụ như ảnh mờ cần xử lý để được ảnh rõ hơn)
-

Phân tích ảnh để thu được các thông tin đặc trưng giúp cho việc phân

loại, nhận biết ảnh (ví dụ phân tích ảnh vân tay để trích chọn các đặc trưng
vân tay)
-

Hiểu ảnh đầu vào để có những mô tả về ảnh ở mức cao hơn, sâu hơn

(ví dụ từ ảnh một tai nạn giao thông phác họa hiện trường tai nạn).
Qua đó, ta có thể thấy xử lý ảnh đóng vai trò quan trọng như thế nào trong các ứng
dụng thực tế về khoa học kĩ thuật cũng như trong cuộc sống thường ngày. Những
ứng dụng này dường như là vô hạn cùng với sự khám phá của con người và sự phát
triển như vũ bão của công nghệ số hóa, chẳng hạn, trong các lĩnh vực như: sản xuất
và kiểm tra chất lượng, sự di chuyển của Robot, các phương tiện đi lại tự trị, công
cụ hướng dẫn cho người mù, an ninh và giám sát, nhận dạng đối tượng, nhận dạng
mặt, các ứng dụng trong y học, sản xuất, hiệu chỉnh Video, và chinh phục vũ trụ…

4


Để xử lý được một bức ảnh thì phải trải qua nhiều khâu khác nhau tùy theo mục

đích của việc xử lý, nhưng khâu quan trọng và khó khăn nhất đó là phân đoạn ảnh.
Trong một số lượng lớn các ứng dụng về xử lý ảnh và hiển thị máy tính, phân đoạn
đóng vai trò chính yếu như là bước đầu tiên trước khi áp dụng các thao tác xử lý
ảnh mức cao hơn như: nhận dạng, giải thích ngữ nghĩa, và biểu diễn ảnh. Nếu bước
phân đoạn ảnh không tốt thì dẫn đến việc nhận diện sai lầm về các đối tượng có
trong ảnh.
Phân đoạn ảnh đã và đang là một trong những vấn đề nhận được nhiều sự
quan tâm trong lĩnh vực xử lý ảnh. Trong khoảng 30 năm trở lại đây đã có rất nhiều
các thuật toán được đề xuất để giải bài toán này. Các thuật toán hầu hết đều dựa vào
hai thuộc tính quan trọng của mỗi điểm ảnh so với các điểm lân cận của nó, đó là:
sự khác nhau(dissimilarity) và giống nhau (similarity) giữa chúng. Các phương
pháp dựa trên sự khác nhau của các điểm ảnh được gọi là các phương pháp biên
(boundary-based methods), còn các phương pháp dựa trên sự giống nhau của các
điểm ảnh được gọi là phương pháp miền (region-based methods). Tuy nhiên, cho
đến nay các thuật toán theo cả hai hướng này đều vẫn chưa cho kết quả phân đoạn
tốt, vì cả hai loại phương pháp này đều chỉ nắm bắt được các thuộc tính cục bộ của
ảnh. Do đó, trong thời gian gần đây, việc tìm ra các thuật toán nắm bắt được các
thuộc tính toàn cục của bức ảnh đã trở thành một xu hướng phổ biến.
Nhận thấy, xử lý ảnh là một lĩnh vực hay và khó. Được sự khuyến khích và hỗ trợ
của thầy giáo hướng dẫn, em đã chọn đề tài nghiên cứu và hệ thống một số phương
pháp phân đoạn ảnh để làm luận văn tốt nghiệp.

5


CHƯƠNG 1. TỔNG QUAN XỬ LÝ ẢNH
1.1. Giới thiệu vể xử lý ảnh
Trong xã hội loài người, ngôn ngữ là một phương tiện trao đổi thông tin phổ
biến trong quá trình giao tiếp. Bên cạnh ngôn ngữ, hình ảnh cũng là một cách trao
đổi thông tin mang tính chính xác, biểu cảm khá cao và đặc biệt không bị cảm giác

chủ quan của đối tượng giao tiếp chi phối. Thông tin trên hình ảnh rất phong phú,
đa dạng và có thể xử lý bằng máy tính. Chính vì vậy, trong những năm gần đây sự
kết hợp giữa ảnh và đồ hoạ đã trở nên rất chặt chẽ trong lĩnh vực xử lý thông tin.
Cũng như xử lý dữ liệu hình ảnh bằng đồ hoạ, việc xử lý ảnh số là một lĩnh
vực của tin học ứng dụng. Việc xử lý dữ liệu bằng đồ hoạ đề cập đến những ảnh
nhân tạo, các ảnh này được xem xét như là những cấu trúc dữ liệu và được tạo ra
bởi các chương trình. Xử lý ảnh số thao tác trên các ảnh tự nhiên thông qua các
phương pháp và kỹ thuật mã hoá. Ảnh sau khi được thu nhận bằng các thiết bị thu
nhận ảnh sẽ được biến đổi thành ảnh số theo các phương pháp số hoá được nhúng
trong các thiết bị kĩ thuật khác nhau và được biểu diễn trong máy tính dưới dạng
ma trận 2 chiều hoặc 3 chiều.
Mục đích của việc xử lý ảnh được chia làm 2 phần:
Biến đổi làm tăng chất lượng ảnh
Tự động nhận dạng, đoán ảnh, đánh giá nội dung của ảnh
Phương pháp biến đổi ảnh được sử dụng trong việc xử lý các ảnh chụp từ
không trung (Chương trình đo đạc từ máy bay, vệ tinh và các ảnh vũ trụ ) hoặc xử
lý các ảnh trong y học (ảnh siêu âm, ảnh chụp cắt lát, vv…). Một ứng dụng khác
của biến đổi ảnh đó là mã hóa ảnh, trong đó các ảnh được xử lý để lưu trữ hoặc
truyền đi.
Các phương pháp nhận dạng ảnh được sử dụng khi xử lý tế bào, nhiễm sắc thể,
nhận dạng chữ viết, vv… Thực chất của công việc nhận dạng chính là sự phân loại

6


đối tượng thành các lớp đối tượng đã biết hoặc thành những lớp đối tượng chưa
biết. Bài toán nhận dạng ảnh là một bài toán lớn, có rất nhiều ý nghĩa thực tiễn và ta
có thể thấy rằng để công việc nhận dạng trở nên dễ dàng thì ảnh phải được tách
thành các đối tượng riêng biệt, đây là mục đích chính của bài toán phân đoạn ảnh.
Nếu phân đoạn ảnh không tốt sẽ dẫn đến sai lầm trong quá trình nhận dạng ảnh, bởi

vậy người ta xem công đoạn phân đoạn ảnh là quá trình then chốt trong quá trình
xử lý ảnh nói chung.
1.2 Quá trình xử lý ảnh
Quá trình xử lý ảnh có thể được mô tả bằng sơ đồ sau:

Phân đoạn

Biểu diễn và
mô tả ảnh

Tiền xử lý ảnh

CƠ SỞ
Thu nhận

TRI THỨC

Nhận dạng và
giải thích

Hình 1. Quá trình xử lý ảnh

 Thu nhận ảnh: Đây là công đoạn đầu tiên mang tính quyết định đối với quá
trình xử lý ảnh. Ảnh đầu vào sẽ được thu nhận qua các thiết bị như camera,

sensor, máy quét, vv… và sau đó các tín hiệu này sẽ được số hóa. Các thông
số quan trọng ở bước này là độ phân giải, chất lượng màu, dung lượng bộ
nhớ và tốc độ thu nhận ảnh của các thiết bị.

 Tiền xử lý: Ở bước này ảnh sẽ được cải thiện về độ tương phản, khử nhiễu,

khử bóng, khử độ lệch, vv… với mục đích làm cho chất lượng ảnh trở nên
tốt hơn và thường được thực hiện bởi các bộ lọc.

7


 Phân đoạn ảnh: Phân đoạn ảnh là bước then chốt trong xử lý ảnh, giai đoạn
này nhằm phân tích ảnh thành những thành phần có cùng tính chất nào đó,

dựa theo biên hay các vùng liên thông. Tiêu chuẩn đễ xác định các vùng liên
thông có thể là cùng màu, cùng mức xám hay cùng độ nhám, vv… Mục đích
của phân đoạn ảnh là để có một miêu tả tổng hợp từ nhiều phần tử khác nhau
cấu tạo nên ảnh thô. Vì lượng thông tin chứa trong ảnh rất lớn, trong khi đó
trong đa số các ứng dụng chúng ta chỉ cần trích chọn một vài đặc trưng nào
đó, do vậy cần có một quá trình để giảm lượng thông tin khổng lồ ấy. Quá
trình này bao gồm phân vùng ảnh và trích chọn đặc tính chủ yếu.

 Biểu diễn và mô tả ảnh: Kết quả của bước phân đoạn ảnh thường được cho
dưới dạng dữ liệu điểm ảnh thô, trong đó hàm chứa biên của một vùng ảnh,

hoặc tập hợp các điểm ảnh thuộc về chính vùng ảnh đó. Trong cả hai trường
hợp sự chuyển đổi dữ liệu thô này thành một dạng thích hợp hơn cho việc xử
lý trong máy tính là rất cần thiết. Để chuyển đổi chúng, câu hỏi đầu tiên cần
phải trả lời là nên biểu diễn một vùng ảnh dưới dạng biên hay dưới dạng một
vùng hoàn chỉnh gồm tất cả những điểm ảnh thuộc về nó. Biểu diễn dạng
biên cho một vùng phù hợp với những ứng dụng chỉ quan tâm chủ yếu đến
các đặc trưng hình dạng bên ngoài của đối tượng, ví dụ như các góc cạnh và
điểm uốn trên biên. Biểu diễn dạng vùng lại thích hợp cho những ứng dụng
khai thác các tính chất bên trong của đối tượng, ví dụ như vân ảnh hay cấu
trúc xương của nó. Sự chọn lựa cách biểu diễn thích hợp cho một vùng ảnh

chỉ mới là một phần trong việc chuyển đổi dữ liệu ảnh thô sang một dạng
thích hợp hơn cho những xử lý về sau. Chúng ta còn phải đưa ra một phương
pháp mô tả dữ liệu đã được chuyển đổi đó sao cho những tính chất cần quan
tâm đến sẽ được làm nổi bật lên, thuận tiện cho việc xử lý chúng.

 Nhận dạng và giải thích: Đây là bước cuối cùng trong quá trình xử lý ảnh.
8


Nhận dạng ảnh có thể được nhìn nhận một cách đơn giản là việc gán nhãn
cho các đối tượng trong ảnh. Giải thích là công đoạn gán nghĩa cho một tập
các đối tượng đã được nhận biết.
Chúng ta có thể thấy rằng, không phải bất kỳ một ứng dụng xử lý ảnh nào cũng bắt
buộc phải tuân theo các bước xử lý đã nêu ở trên, ví dụ như các ứng dụng chỉnh sửa
ảnh nghệ thuật chỉ dừng lại ở bước tiền xử lý. Một cách tổng quát thì những chức
năng xử lý bao gồm cả nhận dạng và giải thích thường chỉ có mặt trong hệ thống
phân tích ảnh tự động hoặc bán tự động, được dùng để rút trích ra những thông tin
quan trọng từ ảnh, ví dụ như các ứng dụng nhận dạng kí tự quang học, nhận dạng
chữ viết tay vv…
1.3. Tổng quan về phân đoạn ảnh
Để phân tích các đối tượng trong ảnh, chúng ta cần phải phân biệt được các
đối tượng cần quan tâm với phần còn lại của ảnh, hay còn gọi là nền ảnh. Những
đối tượng này có thể tìm ra được nhờ kĩ thuật phân đoạn ảnh, theo nghĩa tách phần
tiền cảnh ra khỏi hậu cảnh trong ảnh. Mỗi một đối tượng trong ảnh được gọi là một
vùng hay miền, đường bao quanh đối tượng ta gọi là đường biên. Mỗi một vùng
ảnh phải có các đặc tính đồng nhất ( như màu sắc, kết cấu, mức xám vv…). Các
đặc tính này tạo nên một vector đặc trưng riêng của vùng giúp chúng ta phân biệt
được các vùng khác nhau.
Như vậy, hình dánh của một đối tượng có thể được miêu tả hoặc bởi các
tham số của đường biên hoặc các tham số của vùng mà nó chiếm giữ. Sự miêu tả

hình dáng dựa trên thông tin đường biên yêu cầu việc phát hiện biên. Sự mô tả hình
dáng dựa vào vùng đòi hỏi việc phân đoạn ảnh thành một số vùng đồng nhất. Có
thể thấy kĩ thuật phát hiện biên và phân vùng ảnh là hai bài toán đỗi ngẫu của nhau.
Thực vậy, dò biên để thực hiện phân lớp đối tượng và một khi đã phân lóp xong
cũng có nghĩa là đã phân vùng được ảnh. Ngược lại, khi đã phân vùng ảnh được
phân lập thành các đối tượng ta có thể phát hiện biên.

9


Có rất nhiều kỹ thuật phân đoạn ảnh, nhưng nhìn chung chúng ta có thể chia
thành ba lớp khác nhau:

 Các kỹ thuật cục bộ (Local techniques) dựa vào các thuộc tính
cục bộ của các điểm láng giềng của nó.

 Các kỹ thuật toàn thể (global techniques) phân ảnh dựa trên
thông tin chung của toàn bộ ảnh (ví dụ bằng cách sử dụng
lược đồ xám của ảnh – image histogram).

 Các kỹ thuật tách (split), hợp (merge) và growing sử dụng các
khái niệm đồng nhất và gần về hình học.

1.4 Một số khái niệm cơ bản
1.4.1 Điểm ảnh – Pixel
Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ sáng. Để
có thể XLA bằng máy tính cần phải tiến hành số hoá ảnh. Trong quá trình số hoá,
người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông qua quá trình lấy mẫu
(rời rạc hoá về không gian) và lượng hoá thành phần giá trị mà về nguyên tắc bằng
mắt thường không phân biệt được hai điểm kề nhau. Trong quá trình này người ta

sử dụng khái niệm Picture element mà ta quen gọi là Pixel - phần tử ảnh. Như vậy,
một ảnh là một tập hợp các Pixel.
1.4.2 Mức xám - Gray level
Mức xám là kết quả của sự mã hóa tương ứng một cường độ sáng của mỗi
điểm ảnh với một giá trị sáng, kết quả của quá trình lượng tử hóa. Cách mã hóa
kinh điển thường dùng là 16, 32 hay 64 mức. Phổ dụng nhất là mã hóa ở mức 256,
ở mức này mỗi Pixel sẽ được mã hóa bởi 8 bít.
1.4.3 Biên
Biên là một đặc tính rất quan trọng của đối tượng trong ảnh, nhờ vào biên
mà chúng ta phân biệt được đối tượng này với đối tượng kia. Một điểm ảnh có thể
gọi là điểm biên nếu ở đó có sự thay đổi đột ngột về mức xám. Tập hợp các điểm

10


biên gọi là biên hay còn gọi là đường bao ảnh.
1.4.4 Láng giềng
Trong xử lý ảnh có một khái niệm rất quan trọng, đó là khái niệm láng
giềng. Có hai loại láng giềng: 4 láng giềng và 8 láng giềng.
4 láng giềng của một điểm (x,y) là một tập hợp bao gồm láng giềng dọc và
láng giềng ngang của nó:
N4((x,y)) = {(x+1,y), (x-1,y), (x,y+1), (x,y-1)}

(1.1)

8 láng giềng của (x,y) là một tập cha của 4 láng giềng và bao gồm láng giềng
ngang, dọc và chéo:
N8((x,y)) = N4((x,y))

{(x+1,y+1), (x-1,y-1), (x+1,y-1), (x-1,y+1)}

(1.2)
1.4.5 Vùng liên thông
Một vùng R được gọi là liên thông nếu bất kỳ hai điểm (xA,yA) và (xB,yB)
thuộc vào R có thể được nối bởi một đường (x A,yB) ... (xi-1,yi-1), (xi,yi), (xi+1,yi+1) ...
(xB,yB), mà các điểm (xi,yi) thuộc vào R và bất kỳ điểm (x i,yi) nào đều kề sát với điểm
trước (xi-1,yi-1) và điểm tiếp theo (x i+1,yi+1) trên đường đó. Một điểm (x k,yk) được gọi
là kề với điểm (xl,yl) nếu (xl,yl) thuộc vào láng giềng trực tiếp của (xk,yk).

1.4.6 Biểu diễn ảnh
Trong biểu diễn ảnh, người ta dùng các phần tử đặc trưng của ảnh là pixel.
Có thể xem một hàm hai biến chứa các thông tin như biểu diễn của ảnh, việc xử lý
ảnh số yêu cầu ảnh phải được mã hóa và lượng tử hóa. Việc lượng tử hóa ảnh là
chuyển đổi tín hiệu tương tự sang tín hiệu số của một ảnh đã lấy mẫu sang một số
hữu hạn mức xám.
Một số mô hình thường được dùng trong xử lý ảnh, mô hình toán, mô hình
thống kê.

11


1.4.7 Tăng cường và khôi phục ảnh
Tăng cường ảnh là bước quan trọng tạo tiền đề cho xử lý ảnh, gồm một loạt
các kỹ thuật như: lọc độ tương phản, khử nhiễu, nổi màu…
Khôi phục ảnh là nhằm loại bỏ các suy giảm trong ảnh.
1.4.8 Biến đổi ảnh
Trong thuật ngữ biến đổi ảnh thường được dùng để nói đến một lớp các ma
trận đơn vị và các kỹ thuật dùng để biến đổi ảnh. Một số loại biến đổi được dùng
như: biến đổi Fourier, Sin, Cosin, Hadamard, tích Kronecker, biến đổi Karhumen
Loeve…
1.4.9. Phân tích ảnh

Liên quan đến việc xác định các độ đo định lượng của một ảnh để đưa ra một
mô tả đầy đủ về ảnh. Các kỹ thuật được sử dụng ở đây nhằm mục đích xác định
biên của ảnh.
1.4.10 Nhận dạng ảnh
Là quá trình liên quan đến việc mô tả các đối tượng mà người ta muốn đặc tả
nó. Quá trình nhận dạng thường đi sau quá trình trích chọn các đặc tính chủ yếu của
đối tượng.
Có hai kiểu mô tả đối tượng đó là: mô tả tham số ( nhận dạng theo tham số )
và mô tả theo cấu trúc ( nhận dạng theo cấu trúc).
1.4.11 Nén ảnh
Dữ liệu ảnh cũng như các dữ liệu khác cần phải lưu trữ hay truyền đi trên
mạng, lượng thông tin để biểu diễn cho một ảnh là rất lớn . Do đó làm giảm lượng
thông tin hay nén dữ liệu là một nhu cầu cần thiết.
1.5 Các định dạng cơ bản trong xử lý ảnh
Trong quá trình xử lý ảnh, một ảnh thu nhận vào máy tính phải được mã hóa.
Hình ảnh khi lưu trữ dưới dạng tệp tin sẽ được số hóa. Một số dạng ảnh đã được
chuẩn hóa như: ảnh GIF, BMP, PCX, IMG, TIFF…

12


• Ảnh IMG: Là ảnh đen trắng, phần đầu của ảnh có 16 byte chứa các thông
tin cần thiết, ảnh IMG được nén theo từng dòng. Mỗi dòng bao gồm các gói ( pack).
Các dòng giống nhau cũng nén thành một gói.
• Ảnh PCX: Định dạng ảnh PCX là một trong những định dạng ảnh cổ điển
nhất, nó thường được dùng để lưu trữ ảnh, nó sử dụng phương pháp mã loại dài
RLE (Run-Length-Encoded ) để nén dữ liệu ảnh, quá trình nén và giải nén được
thực hiện trên từng dòng ảnh.
• Ảnh TIFF: Là ảnh mà dữ liệu chứa trong tệp thường được tổ chức thành
các nhóm dòng ( cột) quét của dữ liệu ảnh.

• Ảnh GIF (Graphics Interchanger Format): Với định dạng ảnh GIF những
vướng mắc mà các định dạng khác gặp phải khi số trong ảnh tăng lên không còn
nữa. Dạng ảnh GIF cho chất lượng cao độ phân giải đồ họa cũng đạt cao, cho phép
hiển thị trên hầu hết các phần cứng.

CHƯƠNG 2. PHÂN ĐOẠN ẢNH DỰA VÀO NGƯỠNG
2.1 Giới thiệu chung
Biên độ của các tính chất vật lý của ảnh (như là độ phản xạ, độ truyền sáng,
màu sắc …) là một đặc tính đơn giản và rất hữu ích. Nếu biên độ đủ lớn đặc trưng
cho ảnh thì chúng ta có thể dùng ngưỡng biên độ để phân đoạn ảnh. Thí dụ, biên độ
trong bộ cảm biến hồng ngoại có thể phản ánh vùng có nhiệt độ thấp hay vùng có
nhiệt độ cao. Đặc biệt, kỹ thuật phân ngưỡng theo biên độ rất có ích đối với ảnh nhị
phân như văn bản in, đồ họa, ảnh màu hay ảnh X-quang.
Việc chọn ngưỡng trong kỹ thuật này là một bước vô cùng quan trọng, thông
thường người ta tiến hành theo các bước chung như sau:

 Xem xét lược đồ xám của ảnh để xác đỉnh và khe. Nếu ảnh có
nhiều đỉnh và khe thì các khe có thể sử dụng để chọn ngưỡng.

 Chọn ngưỡng T sao cho một phần xác định trước η của toàn

13


bộ số mẫu

 Điều chỉnh ngưỡng dựa trên xét lược đồ xám của các điểm lân
cận.

 Chọn ngưỡng bằng cách xem xét lược đồ xám của những

điểm thoả tiêu chuẩn đã chọn.
Một thuật toán đơn giản trong kỹ thuật này là: giả sử rằng chúng ta đang
quan tâm đến các đối tượng sáng (object) trên nền tối (background), một tham số T
gọi là ngưỡng độ sáng, sẽ được chọn cho một ảnh f[x,y] theo cách:
If f[x,y] ≥ T
Else

f[x,y] = object = 1
f[x,y] = Background = 0.

Ngược lại, đối với các đối tượng tối trên nền sáng chúng ta có thuật toán
sau:
If f[x,y] < T
Else

f[x,y] = object = 1
f[x,y] = Background = 0.

Vấn đề chính là chúng ta nên chọn ngưỡng T như thế nào để việc phân vùng
đạt được kết quả cao nhất ?
Có rất nhiều thuật toán chọn ngưỡng: ngưỡng cố định, dựa trên lược đồ,
sử dụng Entropy, sử dụng tập mờ, chọn ngưỡng thông qua sự không ổn định của
lớp và tính thuần nhất của vùng vv… Ở đây chúng tôi đề cập đến hai thuật toán
chọn ngưỡng đó là chọn ngưỡng cố định và chọn ngưỡng dựa trên lược đồ.
2.2 Chọn ngưỡng cố định
Đây là phương pháp chọn ngưỡng độc lập với dữ liệu ảnh. Nếu chúng ta
biết trước là chương trình ứng dụng sẽ làm việc với các ảnh có độ tương phản rất
cao, trong đó các đối tượng quan tâm rất tối còn nền gần như là đồng nhất và rất
sáng thì việc chọn ngưỡng T= 128 (xét trên thang độ sáng từ 0 đến 255) là một giá
trị chọn khá chính xác. Chính xác ở đây hiểu theo nghĩa là số các điểm ảnh bị


14


phân lớp sai là cực tiểu.
2.3 Chọn ngưỡng dựa trên lược đồ (Histogram)
Trong hầu hết các trường hợp, ngưỡng được chọn từ lược đồ độ sáng của
vùng hay ảnh cần phân đoạn. Có rất nhiều kỹ thuật chọn ngưỡng tự động xuất phát

B

từ lược đồ xám {h[b] | b = 0, 1, ..., 2 -1} đã được đưa ra. Những kỹ thuật phổ biến
sẽ được trình bày dưới đây. Những kỹ thuật này có thể tận dụng những lợi thế do sự
làm trơn dữ liệu lược đồ ban đầu mang lại nhằm loại bỏ những dao động nhỏ về độ
sáng. Tuy nhiên các thuật toán làm trơn cần phải cẩn thận, không được làm dịch
chuyển các vị trí đỉnh của lược đồ. Nhận xét này dẫn đến thuật toán làm trơn dưới
đây:
( w 1)

hsmooth [b] = 1
ww

2

( w 1)

h

raw


[b-w] w lẻ

(2.1)

2

Trong đó w thường được chọn là 3 hoặc 5
2.3.1 Thuật toán đẳng liệu
Đây là kĩ thuật chọn ngưỡng theo kiểu lặp do Ridler và Calvart đưa ra.
Thuật toán được mô tả như sau:
B-1

- B1: Chọn giá trị ngưỡng khởi động θ0=2

- B2: Tính các trung bình mẫu (m f,0) của những điểm ảnh thuộc đối
tượng và (m b,0) của những điểm ảnh nền.
- B3: Tính các ngưỡng trung gian theo công thức:

=

m

m
f ,k 1

k

b,k 1

với k= 1,2,…


2

(2.2)

=

- B4: Nếu k
k 1 Kết thúc. Dừng thuật toán.
Ngược lại thì lặp tiếp bước 2.
2.3.2 Thuật toán đối xứng nền
Kỹ thuật này dựa trên sự giả định là tồn tại hai đỉnh phân biệt trong lược đồ
nằm đối xứng nhau qua đỉnh có giá trị lớn nhất trong phần lược đồ thuộc về các

1
5


điểm ảnh nền. Kỹ thuật này có thể tận dụng ưu điểm của việc làm trơn được mô tả
trong phương trình (2.1). Đỉnh cực đại maxp tìm được nhờ tiến hành tìm giá trị cực
đại trong lược đồ. Sau đó thuật toán sẽ được áp dụng ở phía không phải là điểm ảnh
thuộc đối tượng ứng với giá trị cực đại đó nhằm tìm ra giá trị độ sáng a ứng với giá
trị phần trăm p% mà: P(a) = p%, trong đó P(a) là hàm phân phối xác suất về độ sáng
được định nghĩa như sau:
Định nghĩa (Hàm phân phối xác suất về độ sáng)
Hàm phân phối xác suất P(a) thể hiện xác suất chọn được một giá trị
độ sáng từ một vùng ảnh cho trước, sao cho giá trị này không vượt quá một
giá trị sáng cho trược a. Khi a biến thiên từ

đến + , P(a) sẽ nhận các giá trị


từ 0 đến 1. P(a) là hàm đơn điệu không giảm theo a do vậy dp/da ≥ 0.

Số điểm ảnh
Nền

Đối tượng

T maxp

a Giá trị độ sáng

Hình2. Minh họa thuật toán đối xứng nền
Ở đây ta đang giả thiết là ảnh có các đối tượng tối trên nền sáng. Giả sử
mức là 5%, thì có nghĩa là ta phải ở bên phải đỉnh maxp một giá trị a sao cho
P(a)=95%. Do tính đối xứng đã giả định ở trên, chúng ta sử dụng độ dịch chuyển về
phía trái của điểm cực đại tìm giá trị ngưỡng T:
T = maxp – (a – maxp)
Kỹ thuật này dễ dàng điều chỉnh được cho phù hợp với tình huống ảnh có
các đối tượng sáng trên một nền tối.

16


2.3.3 Thuật toán tam giác
Khi một ảnh có các điểm ảnh thuộc đối tượng tạo nên một đỉnh yếu trong
lược đồ ảnh thì thuật toán tam giác hoạt động rất hiệu quả. Thuật toán này do Zack
đề xuất và được mô tả như sau:
- B1: Xây dựng đường thẳng ∆ là đường nối hai điểm (Hmax, bmax)
và (Hmin, bmin), trong đó Hmax là điểm có Histogram lớn nhất ứng

với mức xám bmax và Hmin là điểm có Histogram ứng với độ sáng
nhỏ nhất bmin.
- B2: Tính khoảng cách d từ Hb của lược đồ (ứng với điểm sáng b)
đến ∆. Trong đó, b ∈ [bmax, bmin].
- B3: Chọn ngưỡng T = Max{Hb }
Minh hoạ thuật toán tam giác bởi hình vẽ như sau:
Số điểm ảnh

Hmax

d

H

Hb
min

bmin

b

bmax

Giá trị độ sáng

Hình 3. Minh họa thuật toán tam
giác 2.3.4 Chọn ngưỡng đối với Bimodal Histogram
Ngưỡng T được chọn ở tại vị trí cực tiểu địa phương của histogram nằm giữa
hai đỉnh của histogram. Điểm cực đại địa phương của histogram có thể dễ dàng
được phát hiện bằng cách sử dụng biến đổi chóp mũ (top hat) do Meyer đưa ra: Phụ

thuộc vào tình huống chúng ta đang phải làm việc là với nhưng đối tượng

17


sáng trên nền tối hay đối tượng tối trên nền sáng mà phép biến đổi top hat sẽ có một
trong hai dạng sau:
a/ Các đối tượng sáng:
TopHat( A, B) = A − ( A o B) = A − maxB(minA( A))

(2.3)

b/ Các đối tượng tối:
TopHat ( A, B) = A − ( A o B) = A − minB(maxA( A))
Việc tính toán giá trị cực tiểu địa phương của

(2.4)
histogram thì khó

nếu histogram nhiễu. Do đó, trong trường hợp này nên làm trơn histogram, ví dụ sử
dụng thuật toán (2.1).
Số điểm ảnh

Giá trị độ sáng

Hình 4. Bimodal Histogram
Trong một số ứng dụng nhất định, cường độ của đối tượng hay nền thay đổi
khá chậm. Trong trường hợp này, histogram ảnh có thể không chứa hai thuỳ phân
biệt rõ ràng, vì vậy có thể phải dùng ngưỡng thay đổi theo không gian. Hình ảnh
được chia thành những khối hình vuông, histogram và ngưỡng được tính cho mỗi

khối tương ứng. Nếu histogram cục bộ không phải là bimodal histogram thì ngưỡng
được tính bằng cách nội suy ngưỡng của các khối láng giềng. Khi ngưỡng cục bộ đã
có thì áp dụng thuật toán phân ngưỡng ở hình 2.1 cho khối này.

18


2.4 Phân ngưỡng tối ưu dựa trên sự không ổn định của lớp và tính đồng nhất
của vùng
2.4.1 Giới thiệu
Phần này trình bày một phương pháp được nghiên cứu gần đây bởi Punam
K.Shaha, Jayaram K.Udupa, đó là cách phân đoạn bằng cách chọn ngưỡng tối ưu
thông qua sự không ổn định của lớp và tính đồng nhất của vùng.
Đặc điểm chung của các phương pháp dùng Histogram là không tận dụng
được các thuộc tính trung gian của ảnh như cường độ sáng và không gian của ảnh.
Trong thực tế rất khó để chọn ra được ngưỡng tối ưu chỉ từ histogram mà không
xem ảnh. Trong khi đó phương pháp dựa vào không gian lại cho ta hình dạng các
đối tượng rất rõ ràng. Do đó người ta đã phát triển những phương pháp, trong đó sử
dụng đến hình thái của ảnh. Trong phần này ta trình bày một phương pháp như vậy.
Biên của đối tượng trong bất kì ảnh nào cũng rất mờ do quá trình thu nhận
ảnh gây ra những hiện tượng nhòe hay không đồng đều về những hiệu suất thu trên
các vùng của thiết bị thu nhận ảnh. Hầu hết các phương pháp phân ngưỡng đều tận
dụng một phần của tính không chắc chắn khi một điểm thuộc vào một lớp hay tiêu
chuẩn entropy để chọn ngưỡng tối ưu. Do đó có thể thấy rằng nếu tiêu chuẩn tối ưu
được đề ra, sau đó tìm ngưỡng tối ưu thì các phần tử ảnh trong vùng lân cận biên
đối tượng sẽ có giá trị của độ không ổn định cao.
Điều này rất khó thực hiện được nếu không có những hiểu biết về đối tượng
hoặc các thông tin phụ về đối tượng từ ảnh. Một số tiêu chuẩn đơn giản về sự đồng
nhất của cường độ có thể được dùng để thu thập những thông tin sơ bộ về đối
tượng. Một tập các tiêu chuẩn tối ưu trong đó sử dụng những tiêu chuẩn về độ

không ổn định và tiêu chuẩn về tính thuần nhất vùng sẽ cho ta những dấu hiệu của
ngưỡng mà tại đó các phần tử ảnh trong lân cận biên sẽ có giá trị hàm tối ưu đạt giá
trị cao tại ngưỡng tối ưu.

19


2.4.2 Cơ sở lý thuyết và thuật toán
2.4.2.1 Ký hiệu và định nghĩa
n

Chia không gian Euclidean R thành các hình hộp bởi n họ mặt phẳng trực
giao, mỗi họ chứa các mặt phẳng song song cách đều. Mặc dù phương pháp này có
thể mở rộng cho các ảnh lưới không đẳng hướng, nhưng để đơn giản ta giả sử các
ảnh được áp dụng có độ phân giải đẳng hướng. Ta gọi các siêu hộp là các Spels
( viết tắt của spatial elements) và giả sử rằng các mặt phẳng liên tiếp trong cùng một
họ mặt phẳng cách đều nhau cùng một đơn vị khoảng cách. Ta xây dựng một hệ tọa
độ sao cho tâm của mỗi Spels có tọa độ là (c 1, c2, … , cn) với các thành phần ci là
n

các số nguyên. Từ đó ta có một tương ứng 1-1 giữa các Spels với không gian Z như
n

sau: một n-bộ c trong không gian Z được sơ đồ hóa bởi một Spels sao cho c j (1 ≤ j
n

≤ n) là tọa độ thứ j của tâm Spels tương ứng với c. Từ giờ ta có thể coi Z như một
n

tập các Spels trong R và sẽ sử dụng các khái niệm Spels và tọa độ tâm của chúng

thay cho nhau.
Quy ước vói mỗi tập con mờ ( một quan hệ mờ ) của một tham chiếu X có
một hàm μA là hàm thành phần của A trong X ( tương ứng trong X X ). Giá trị hàm
n

μA nằm trong khoảng [0, 1]. Một quan hệ mờ α trong Z được gọi là một quan hệ
liền kề mờ giữa các spel nếu nó có tính phản xạ và đối xứng. Có thể thấy rằng α
n

thỏa mãn: giá trị hàm thành phần của nó μ α (c, d) ( c, d Z ) là một hàm không tăng
n

của khoảng cách || c - d || giữa c và d với || . || là chuẩn trong R . Để dơn giản trong
tính toán, ta giả thiết μα được tính như sau:
- Với mỗi spel c, μα (c, c) = 1
-

n

c, d Z , μ(c, d) = 1 nếu c, d khác nhau đúng 1, các trường hợp còn lại

μ(c, d) = 0
n

Ta gọi cặp (Z , α) là một không gian số mờ. Không gian số mờ là một khái
niệm mô tả hệ thống lưới số cơ bản độc lập của bất kỳ quan niệm nào liên quan tới
ảnh.

20



n

Một cảnh trong một không gian số mờ (Z , α) là một cặp C = ( C, f ) với
n

C = { c| -bj ≤ c ≤ bj, với b Z+ }, f là một hàm mà có miền xác định là C, gọi là miền
ảnh và có miền giá trị là tập hợp các số nguyên thuộc đoạn Г = [MIN, MAX]. Để
tránh các điều kiện không xác định, ta sẽ tìm ngưỡng tối ưu T bên
trong khoảng Г trừ hai điểm tận cùng của đoạn. Tương ứng với một ảnh từ bốn bức
xám trở lên, ta chọn: Г = [MIN + 2, MAX - 1]
Phương pháp mô tả ở đây hoàn toàn có thể được áp dụng cho ảnh vector, có
nghĩa là khi f là một hàm có giá trị vector. Nhưng để cho đơn giản ta sẽ coi f như
n

một hàm vô hướng. Một ảnh trên không gian (Z , α) sẽ được coi Г = [0, 1].
2.4.2.2. Độ không ổn định của lớp dựa vào cường độ
Nguyên lý về độ không ổn định của lớp dựa trên cường độ đã được rất nhiều
nhà nghiên cứu sử dụng trong các phương pháp chọn ngưỡng tối ưu trước đây.
Trong phương pháp mới này, người ta đã đưa ra các công thức chung.
Ý tưởng đằng sau khái niệm độ không ổn định của lớp dựa trên cường độ là
để xác định độ không ổn định của việc phân lớp một spel vào một lớp đối tượng nào
đó dựa trên các lớp khác nhau. Dù vấn đề có thể khái quát thành bài toán xác định
đa ngưỡng để phân thành nhiều lớp, song ta sẽ chỉ xem xét đến bài toán phân lớp
hai đối tượng, tức là phân một ảnh thành đối tượng và nền. Việc mở rộng cho bài
toán nhiều đối tượng sẽ được tìm hiểu tiếp theo.
Để xác định độ không ổn định của lớp, ta giả sử đã biết các xác suất tiên
nghiệm của hàm phân bố cường độ của đối tượng và nền và xác suất để một spel
thuộc vào đối tượng. Gọi F0 và Fb lần lượt là lớp đối tượng và nền, θ là xác suất để
một spel thuộc vào lớp đối tượng còn 1- θ là xác suất để một spel thuộc vào lớp nền.

Gọi p0(g) là xác suất để một spel c của đối tượng có cường đội g. Tức là ta có:

p0(g) = P( f(c)=g | c F0)

(2.5)

Gọi pb(g) là xác suất để một spel của nền có cường độ g. Tức là ta có:

21


pb(g) = P( f(c)=g | c Fb)

(2.6)

Như vậy nếu gọi p(g) là xác suất để một spel có cường độ g thì:
p(g) = θp0(g) + (1-θ)pb(g)

(2.7)

Suy ra theo quy tắc Bayes ta có xác suất để một spel có giá trị xám g thuộc
vào lớp đối tượng là:
P(c F0 | f(c) = g) =

1

p0 g
pg

(2.8)


Còn xác suất để một spel có giá trị xám g thuộc vào lớp nền là:
P(c Fb | f(c) = g) =

1pb g
pg

Theo Shannon và Weaver, sau khi biết giá trị cường độ tại spel c là g thì độ
không chắc chắn của việc phân lớp c vào đối tượng hay nền là entropy của hai xác
suất hậu nghiệm(hai công thức trên).
Ta gọi tắt độ không ổn định của lớp dựa trên cường độ là độ không ổn định
lớp. Độ không ổn định lớp H(g) tại cường độ g được cho bởi:
H(g) = -

p0 (g)
log
pg

p0 (g)
pg

- 1

pb g
log
pg

1

pb g

pg

(2.9)
Từ (2.8) và (2.9), nếu ta biết θ, p 0 và pb thì độ không chắc chắn có thể tính
n

được tại bất kỳ cường độ nào. Với mỗi ảnh C = ( C, f ) trên không gian (Z , α) vì
khoảng cách Г của f là một tập hữu hạn các số nguyên nên xác suất p 0, pb xác định
từ công thức (2.5) và (2.6) cũng là các hàm mật độ của biến ngẫu nhiên g. Trong
các nghiên cứu gần đây, các hàm này giả sử được phân bố bởi chuẩn Gauss Gm ,
và Gm , với kỳ vọng và phương sai tương ứng là m0, mb,
b

b

o

,

b

0 0

và được ước lượng

từ ảnh đã cho như một hàm của ngưỡng như sau:
Giả sử t Г là một ngưỡng cường độ bất kỳ. Đặt F0, t và Fb, t tương ứng là
tập các spel thuộc lớp đối tượng và lớp nền được cho bởi ngưỡng t. Tức là:
F0, t = { c| c C và f(c) ≥ t }


(2.10)

22


Fb, t = { c| c C và f(c) < t }

(2.11)

Đặt m0(t) và mb(t) tươngt ứng là giá trị trung bình của cường độ các spel

F
trong tập F0, t và Fb, t,

o

(t) và

0,t

(t) là độ lệch trung bình. Đặt θ(t) =

b

| X | là lực lượng của tập X. Chú ý rằng Fb, t = Φ khi t = Min,
Min+1 và

o

b


(t) = 0 khi t = Max – 1. Đó là lý do tại sao ta cần t

trong đó

C

(t) = 0 khi t =

Г. Các hàm mật

độ với chỉ số t biểu thị sự phụ thuộc của chúng vào ngưỡng được tính như sau:

1

p0,t (g) =

0

t

2

với g Г

(2.12)

với g Г

(2.13)


với g

(2.14)

t
0

2

g mb t

1
2

2

e

2

pb,t (g) =

2

g m0 t

t

e


2 b t

2

b

pt(g) = θ(t) p0,t (g) +(1 - θ(t)) pb,t (g)

Г

Từ (2.9) độ không ổn định của lớp được tính hàm của ngưỡng t đối với

g

Г như sau:
Ht(g) = -

(t) p0,t (g )

p
t

g

log

(t) p0,t (g )
pt g


-

1

(t) pb,t g

log

pt g

1

(t) pb,t g

(2.15)

pt g

Từ (2.10) và (2.15) cho ta một thuật toán để tính trên máy tính một thuật toán không
ổn định Ht(g) đối với mỗi cường độ g trong Г, tại bất kỳ ngưỡng t nào trong Г.

2.4.2.3. Tính thuần nhất vùng
Chúng ta nghĩ về khái niệm độ thuần nhất trên vùng( hay gọi tắt là thuần
nhất) như một đặc tính của mỗi spel trong ảnh đã cho C = ( C,f ) trên không gian
n

(Z , α). Có nghĩa là tính thuần nhất

là một hàm


:C

[0,1]. Nó phụ thuộc

vào quan hệ liền kề giữa các spel α và một quan hệ mờ khác trên C là
là độ đồng nhất mờ. Khi mối liên kết

được gọi

(c,d) càng lớn thì cường độ ảnh trong

vùng lân cận của c và d trong C càng giống nhau. Ta sử dụng phương pháp tính

23


toán dựa trên phạm vi đồng nhất để xác định Ψ sẽ mô tả sau. Dạng hàn của

mà ta

sử dụng trong chương trình này như sau:
c, d

d C

(c) =

c, d
c, d


d C

(2.16)

Nói cách khác độ đồng nhất tại spel c là trung bình trọng số của các lực hấp
dẫn đối với c của các spels trong C. Do tính liền kề giữa các spel ở xa nhau là bằng
0 nên các spel thực sự cần quan tâm trong công thức (2.16) là các spel trong một lân
cận gần của c.
Nguồn gốc của ý tưởng lập công thức dựa vào phạm vi đồng nhất giữa hai
spel c và d là để tận dụng khái niệm kích thước của một cấu trúc địa phương hay
phạm vi tại c và d. Phạm vi trong một ảnh C tại mỗi spel c được định nghĩa là bán
kính r(c) của hình cầu lớn nhất có tâm tại c nằm hoàn toàn trong cùng một vùng đối
tượng được xác định dựa trên tiêu chuẩn xấp xỉ độ đồng nhất cường độ. Bằng trực
giác ta thấy để phân đoạn ảnh, trước hết cần xác định phạm vi của đối tượng. Người
ta đư ra một thuật toán đơn giản nhưng rất hiệu quả, trong đó ước lượng r(c) tại mỗi
spel c C trong một ảnh bất kỳ không cần phân đoạn trực tiếp ảnh đó mà dựa trên sự
liên tục của tính đồng nhất về cường độ.
Xác định phạm vi:
Một hình cầu Bk( c) tâm tại c, bán kính k được định nghĩa như sau:
Bk( c ) = {e C \ || c-e || ≤ k }

(2.17)

Với mỗi hình cầu Bk( c) ta xác định một phân số FO k(c), biễu diển tỉ lệ giữa
tập các spel trên biên hình cầu có cường độ gần như đồng nhất với c và tập các điểm
trên biên:
W

FOk(c) =


e Bk c Bk -1 c

B

k

c

f c
B

k 1

f e
c

(2.18)

Trong đó WΨ là hàm thành phần tương ứng với mệnh đề mờ: “ x is small ”. Có
nhiều cách chọn hàm này có thể áp dụng được, nhưng trong bài này ta chọn hàm

24


phân bố chuẩn Gauss với kỳ vọng bằng 0 và độ lệch chuẩn

. Sau đây là thuật

toán ước lượng phạm vi của đối tượng:
Thuật toán OSE

Input: C, c C, WΨ, một ngưỡng cố định ts
Output: r(c)
Begin
Set k = 1;
While FOk(c) ≥ ts do
Set k to k + 1
Endwhile;
Set r(c) to k – 1;
Output r(c);
End.
Thuật toán này lặp tăng bán kính cầu k lên 1, bắt đầu từ 1, và kiểm tra FO k(c)
xem đối tượng chứa c có nằm trong biên hình cầu không. Ngay lần đầu tiên khi
phân số này nhỏ hơn ts, ta xem như hình cầu rơi ra ngoài đối tượng đang
xét và vào vùng của đối tượng khác. Ta thường dùng ts = 0.85.
Tham số

được xác định như sau: Trên toàn miền C, các hiệu cường độ

địa phương | f(c) – f(d)| được tính cho tất cả các cặp (c, d) với c ≠ d và

(c, d) > 0.

Trên 10% các giá trịn này bị loại dido phần biên chung giữa các đối tượng. Còn lại
dưới 90% các giá trị này dùng để tính kỳ vọng Mh và độ lệch trung bình h . Khi đó

ta tính

= Mh + 3

h.


Lý do căn bản của sự lựa chọn này là trong phân phối chuẩn, ba lần độ lệch
chuẩn về cả hai phía của giá trị trung bình chiếm tới 99,7% tổng số.

2
5


×