Tải bản đầy đủ (.pdf) (63 trang)

thuật toán phân vùng ảnh slic bằng các superpixels

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (6.58 MB, 63 trang )

1

ĐẠI HỌC THÁI NGUN
TRƯỜNG ĐẠI HỌC CƠNG NGHỆ THƠNG TIN VÀ TRUYỀN THƠNG



Nguyễn Xn Kỳ



THUẬT TỐN PHÂN VÙNG ẢNH SLIC
BẰNG CÁC SUPERPIXELS




LUẬN VĂN THẠC SĨ CƠNG NGHỆ THƠNG TIN







Thái Ngun - 2013

Số hóa bởi trung tâm học liệu />

ĐẠI HỌC THÁI NGUN
TRƯỜNG ĐẠI HỌC CƠNG NGHỆ THƠNG TIN VÀ TRUYỀN THƠNG





Nguyễn Xn Kỳ


THUẬT TỐN PHÂN VÙNG ẢNH SLIC
BẰNG CÁC SUPERPIXELS



LUẬN VĂN THẠC SĨ CƠNG NGHỆ THƠNG TIN
Chun ngành: Khoa học máy tính
Mã số: 60480101
NGƯỜI HƯỚNG DẪN KHOA HỌC:
TS. ĐÀO NAM ANH



Thái Ngun - 2013
Số hóa bởi trung tâm học liệu />
LỜI CẢM ƠN
Để hồn thành chương trình cao học và viết luận văn này, tơi đã nhận
được sự hướng dẫn, giúp đỡ và góp ý nhiệt tình của q thầy cơ trường Đại học
Cơng nghệ thơng tin và truyền thơng – Đại học Thái Ngun.
Trước hết, tơi xin chân thành cảm ơn đến q thầy cơ trường Đại học Cơng
nghệ thơng tin và truyền thơng – Đại học Thái Ngun, đặc biệt là những thầy
cơ đã tận tình dạy bảo cho tơi suốt thời gian học tập tại trường. Tơi xin gửi lời
biết ơn sâu sắc đến Tiến sĩ Đào Nam Anh đã dành rất nhiều thời gian và nhiệt
tình hướng dẫn nghiên cứu giúp tơi hồn thành luận văn tốt nghiệp.

Nhân đây, tơi xin chân thành cảm ơn Ban Giám hiệu trường Đại học Cơng
nghệ thơng tin và truyền thơng – Đại học Thái Ngun cùng q thầy cơ đã tạo
rất nhiều điều kiện để tơi học tập và hồn thành tốt khóa học.
Mặc dù tơi đã có nhiều cố gắng hồn thiện luận văn bằng tất cả sự nhiệt
tình và năng lực của mình, tuy nhiên khơng thể tránh khỏi những thiếu sót,
rất mong nhận được những đóng góp q báu của q thầy cơ và các bạn.
Thái Ngun, tháng 9 năm 2013
Học viên


Nguyễn Xn Kỳ




Số hóa bởi trung tâm học liệu />
LỜI CAM ĐOAN


Tơi xin cam đoan luận văn là kết quả nghiên cứu của tơi, khơng sao
chép của ai. Nội dung luận văn có tham khảo và sử dụng các tài liệu liên quan,
các thơng tin trong tài liệu được đăng tải trên các tạp chí và các trang website
theo danh mục tài liệu của luận văn.

Tác giả luận văn


Nguyễn Xn Kỳ
Số hóa bởi trung tâm học liệu />i




MỤC LỤC
Danh mục các thuật ngữ, các từ viết tắt iii
Danh mục các hình vẽ, đồ thị iv
Mở đầu 1
Chương 1. Tổng quan về phân vùng ảnh 3
1.1 Phương pháp phân vùng dựa vào ngưỡng 4
1.2 Phân vùng dựa vào phát triển vùng 7
1.2.1 Điểm ảnh lớn 7
1.3 Phương pháp phân vùng dựa vào cạnh 9
1.3.1 Thuật tốn phân vùng đập nước 11
1.4 Phân lớp dữ liệu 14
1.4.1 Phân lớp phân cấp 14
1.4.2 Thuật tốn phân chia thứ bậc 16
1.4.3 Phân cụm 17
1.5 Kết luận chương 1 23
Chương 2. Thuật tốn điểm ảnh lớn dựa trên lặp tuyến tính 25
2.1 Các phương pháp điểm ảnh lớn 26
2.1.1 Các thuật tốn điểm ảnh lớn dựa vào đồ thị 26
2.1.2 Các thuật tốn điểm ảnh lớn tăng dần độ dốc 27
2.2 Thuật tốn điểm ảnh lớn dựa trên lặp tuyến tính 28
2.2.1 Thuật tốn 30
2.2.2 Phép đo khoảng cách 32
2.2.3 Hậu xử lý 34
Số hóa bởi trung tâm học liệu />ii


2.3 Độ phức tạp giải thuật 35
2.4 Ứng dụng của thuật tốn phân vùng ảnh với điểm ảnh lớn SLIC 36

2.4.1 Xác định cơ chấn thương 36
2.4.2 Nén ảnh JPEG 39
2.5 Kết luận chương 2 40
Chương 3. Cài đặt thử nghiệm 41
3.1 Mơi trường cài đặt 41
3.2 Kết quả thực nghiệm 41
3.3 Kết luận chương 3 51
Kết luận 52
Tài liệu tham khảo 53
Error! Bookmark not defined.

Số hóa bởi trung tâm học liệu />iii


DANH MỤC CÁC THUẬT NGỮ, CÁC TỪ VIẾT TẮT
CÁC THUẬT NGỮ
Dendrogram Sơ đồ phân lớp
Edge-Based Segmentation
Method
Phân vùng dựa vào cạnh
Gradient Độ dốc
Over-segmentation Phân vùng q
Screen Resolution Độ phân giải màn hình
Sensor Cảm ứng
Similarity Giống nhau
Superpixel Điểm ảnh lớn
True Color Màu tự nhiên
Under-segmentation Phân vùng chưa hết
Normalized cuts algorithm Thuật tốn cắt trung bình
Gradient-ascent-based

algorithms
Thuật tốn tăng dần độ dốc
Simple linear iterative
clustering
Thuật tốn điểm ảnh lớn dựa trên lặp tuyến tính

CÁC TỪ VIẾT TẮT
XLA Xử lý ảnh
SLIC Simple linear iterative clustering


Số hóa bởi trung tâm học liệu />iv


DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
Hình 1:
Phân vùng ảnh theo một ngưỡng 5

Hình 2:
Phân vùng ảnh theo hai ngưỡng trong biểu đồ 6

Hình 3: Phân vùng ảnh theo vùng - phát triển vùng 7
Hình 4: Điểm ảnh lớn 8

Hình 5: Điểm ảnh lớn với kích thước nhỏ hơn 9

Hình 6: Phân vùng ảnh theo cạnh 10

Hình 7: Khái niệm về đập nước và dòng chảy 12


Hình 8: (a) ảnh đầu vào và (b) - kết quả áp dụng thuật tốn đập nước. 12

Hình 9: (a) Ảnh hiển thị đánh dấu nội bộ (vùng sáng) và các đanh dấu bên ngồi
(dòng nước chảy).(b) Kết quả phân vùng của (a). 13

Hình 10: Mơ hình 8 nhóm thành ba cụm. 15

Hình 11: Dendrogram này tương ứng với tám mẫu trong hình 12 bằng cách sử
dụng các thuật tốn liên kết đơn. 16

Hình 12: Thí dụ về thuật tốn k-means, để phân vùng ban đầu. 19

Hình 13: Kết quả phân vùng của ảnh Lena bằng cách sử dụng các thuật tốn thay
đổi trung bình. 22

Hình 14: Phân vùng “q” - oversegmentation 244

Hình 15: Phân vùng ảnh kiến trúc với SLIC 245

Hình 16: Phân vùng ảnh thiên nhiên với SLIC 29
Hình 17: a. tìm kiếm k-mean trong tồn ảnh, b. SLIC tìm kiếm trong một vùng 30
Hình 18: Kết quả phân điểm ảnh lớn của SLIC cho các loại ảnh khác nhau với
cùng số điểm ảnh lớn 31
Hình 19: SLIC với dãy ảnh liên tục trong video 364

Hình 20: Kết quả của SLIC với các ảnh kiến trúc 365

Hình 21: Ảnh siêu âm của (a) sợi cơ khỏe mạnh và (b) sợi cơ yếu. 366

Hình 22: Ảnh ban đầu của cơ khỏe mạnh và ảnh nâng cao cấp độ màu xám. 36


Hình 23: Kết quả phân vùng của hình 22. 37

Hình 24: Các vùng sợi cơ từ hình 22 38

Hình 25: Tìm các sợi lành mạnh hoặc bị hỏng từ hình 22. 38

Hình 26: (a) Một ví dụ về một người đàn ơng và (b) là kết quả phân chia hình
thang của chiếc mũ của ơng ta. 39

Số hóa bởi trung tâm học liệu />v


Hình 27: Kết quả tốt với i>=200 42

Hình 28: Kết quả tốt nhất với i=500, do ảnh có q nhiều chi tiết 43

Hình 29: Kết quả với i=200 có thể chấp nhận được, tuy nhiên với i=500 thì tốt
hơn 444

Hình 30: Kết quả i=100 đã khá tốt 455

Hình 31: với ảnh kiến trúc, các mức độ chi tiết tương ứng với số điểm ảnh 46

Hình 32: Với ảnh kiến trúc, số điểm ảnh lớn cao phân vùng tốt hơn 47

Hình 33: Với ảnh kiến trúc có khung cảnh thiên nhiên, cần số điểm ảnh lớn 48

Hình 34: Với ảnh có kiến trúc nét, chỉ cần ít số điểm ảnh lớn 49


Hình 35: Để phân biệt các chi tiết kiến trúc cần chọn số điểm ảnh phù hợp 50

Số hóa bởi trung tâm học liệu />1




MỞ ĐẦU
Thơng tin ảnh đóng vai trò quan trọng trong hầu hết mọi lĩnh vực của
cuộc sống. Ngày nay, thơng tin ảnh được xử lý bằng kỹ thuật số. Xử lý ảnh
(XLA) là một trong những chun ngành quan trọng và lâu đời của Cơng nghệ
thơng tin được áp dụng trong các ứng dụng khác nhau, từ truyền hình đến
chụp cắt lớp, từ nhiếp ảnh đển in ấn, từ robot đến cảm biến từ xa [1,2].
Để xử lý được ảnh thì phải trải qua nhiều bước, nhưng bước quan trọng
và khó khăn nhất đó là phân vùng ảnh. Nếu bước phân vùng ảnh khơng tốt
thì dẫn đến việc nhận diện sai lầm về các đối tượng có trong ảnh[3,4].
Điểm ảnh lớn đang trở nên ngày càng phổ biến để sử dụng trong các
ứng dụng thị giác máy tính. Superpixel là điểm ảnh lớn, hay một nhóm điểm
ảnh ở cạnh nhau và có đặc tính tương đồng. Điểm ảnh lớn được dùng để đánh
giá độ sâu của ảnh, phân vùng ảnh, phát hiện đối tượng trong ảnh, và thường
được áp dụng cho ảnh màu. Tuy nhiên, khơng phải thuật tốn superpixel nào
cũng tốt. Để hiểu những thuật tốn hiện có, cần thiết phân tích, đánh giá các
ưu điểm và mặt yếu của các thuật tốn. Các yếu tố cần xem xét là khả năng
phát hiện phân vùng ảnh, tốc độ tính tốn, hiệu quả sử dụng bộ nhớ.
Trong các thuật tốn trên có thuật tốn đệ qui tuyến tính có tên là
SLIC. Thuật tốn này có cách tiếp cận phân nhóm k-means để tạo ra các điểm
ảnh lớn một các hiệu quả. Mặc dù thuật tốn đơn giản, nhưng SLIC có khả
năng bám đường biên tốt. Đồng thời, thuật tốn có tốc độ nhanh và sử dụng
bộ nhớ hiệu quả, cải thiện hiệu suất phân vùng ảnh.
Mục đích chính của luận văn là nắm được các hướng tiếp cận chính

trong phân vùng ảnh trong đó có phân vùng ảnh màu dựa trên Điểm ảnh lớn.
Luận văn sẽ tập trung tìm hiểu và trình bày thuật tốn phân vùng ảnh đệ qui
tuyến tính SLIC.
Số hóa bởi trung tâm học liệu />2




Ngồi phần mở đầu và kết luận, luận văn được chia làm 3 chương, cụ
thể nội dung các chương như sau:
Chương 1: Tổng quan về phân vùng ảnh, các thuật tốn tạo
superpixel. Các mơ hình phân vùng ảnh cơ bản: theo đường biên, theo vùng.
Trong phân ảnh theo vùng, superpixel – điểm ảnh lớn là một hướng phát
triển.
Chương 2: Thuật tốn phân vùng ảnh SLIC. Trong chương này một số
thuật tốn tạo superpixel – điểm ảnh lớn sẽ được tập trung phân tích. Sau đó
trình bày chi tiết thuật tốn xây dựng các điểm ảnh lớn SLIC theo phương
pháp đệ qui tuyến tính, áp dụng cho ảnh màu.
Chương 3: Cài đặt thử nghiệm. Cài đặt thuật tốn phân vùng ảnh màu,
xây dựng điểm ảnh lớn SLIC bằng ngơn ngữ C++.
Số hóa bởi trung tâm học liệu />3


CHƯƠNG 1. TỔNG QUAN VỀ PHÂN VÙNG ẢNH
Với một số ứng dụng, như nhận diện ảnh hay nén ảnh, ta khơng thể xử
lý tồn bộ bức ảnh một cách trực tiếp bởi lý do việc đó khơng hiệu quả và phi
thực tế. Vì vậy, một vài thuật tốn về phân vùng ảnh đã được đưa ra nhằm
phân vùng ảnh trước khi nhận diện hoặc nén. Phân vùng ảnh là phân loại
hoặc nhóm ảnh thành nhiều phần (vùng) tuỳ theo đặc tính của ảnh, ví dụ, giá
trị điểm ảnh hay miền tần số. Cho tới nay, có rất nhiều thuật tốn về phân

vùng ảnh vẫn tồn tại và được ứng dụng rộng rãi trong khoa học và trong cuộc
sống thường ngày. Tuỳ theo phương pháp phân vùng ảnh, có thể phân loại
chúng thành phân vùng ảnh dựa vào vùng, nhóm dữ liệu, và phân vùng ảnh
dựa vào biên (cạnh) [13,14,15].
Phân vùng ảnh rất hữu ích trong nhiều ứng dụng. Phân vùng ảnh có thể
phát hiện những vùng cần quan tâm trong một cảnh hoặc chú giải dữ liệu. Ta
phân loại thuật tốn phân vùng hiện nay thành phân vùng ảnh dựa vào vùng,
hợp nhóm dữ liệu, và phân vùng ảnh dựa vào biên [6,7]. Phân vùng ảnh dựa
vào vùng bao gồm các thuật tốn phát triền vùng gieo hạt và vùng khơng
gieo hạt, và thuật qt nhanh. Tất cả chúng đều mở rộng từng vùng điểm ảnh
dựa vào giá trị điểm ảnh của chúng hay giá trị lượng tử hố để làm sao cho
mỗi nhóm đều có mối quan hệ. Đối với hợp nhóm dữ liệu, khái niệm nhóm
dựa trên tồn ảnh và khoảng cách giữa từng dữ liệu.
Đặc điểm của nhóm dữ liệu là mỗi điểm ảnh của một nhóm khơng liên
kết hồn tồn với nhau. Phương pháp cơ bản của nhóm dữ liệu có thể được
chia thành nhóm theo thứ bậc và nhóm bộ phận. Ngồi ra, có phiên bản mở
rộng của nhóm dữ liệu là thuật tốn dịch chuyển trung bình, mặc dầu thuật
tốn này thuộc về ước lượng mật độ nhiều hơn. Phần còn lại của phân vùng
ảnh là phân vùng ảnh dựa vào biên. Loại phân vùng ảnh này nhìn chung áp
dụng việc tìm biên hoặc khái niệm biên.
Loại điển hình này là một thuật tốn đập nước, nhưng thuật tốn này có
vấn đề phân vùng q (over-segment), vì thế nên dùng kỹ thuật đánh dấu
(marker) để cải thiện thuật tốn đập nước. Cuối cùng, ta chỉ ra một số ứng
dụng áp dụng kỹ thuật phân vùng trong q trình tiền xử lý.
Số hóa bởi trung tâm học liệu />4


Phần này giới thiệu một số thuật tốn phân vùng ảnh phổ biến, tìm hiểu
về những đặc tính của chúng, và chỉ ra các kết quả phân vùng.
1.1 Phương pháp phân vùng dựa vào ngưỡng

Phân vùng ảnh dựa trên ngưỡng nhằm mục đích phân vùng một ảnh
đầu vào thành các điểm ảnh của hai hoặc nhiều hơn hai giá trị thơng qua việc
so sánh các giá trị pixel với giá trị T ngưỡng được xác định một cách độc lập.
Khơng tìm thấy các thuật tốn phù hợp nhất để xác định giá trị T ngưỡng. Kết
quả có thể là một hoặc tất cả những điều sau đây.
• Các vùng được phân vùng có thể là nhỏ hơn hoặc lớn hơn so với thực
tế.
• Các cạnh của vùng đượcphân vùng có thể khơng được kết nối.
• Vùng trên hoặc dưới của ảnh (phát sinh của các cạnh giả hoặc thiếu
cạnh).
Kỹ thuật cắt biểu đồ, dựa vào một ngưỡng được sử dụng để phân vùng
ảnh. Việc này có thể được áp dụng trực tiếp cho một ảnh, nhưng cũng có thể
được kết hợp, thực hiện trước hoặc sau một kỹ thuật xử lý ảnh khác.
Ký hiệu f(x,y) là màu xám của ảnh gốc. với ngưỡng T, hàm g(x,y) sẽ lọc
những điểm ảnh mà f(x,y) cho giá trị lớn hơn hoặc bằng ngưỡng T.



<

=
Tyxf
Tyxf
yxg
),( if0
),( if1
),(
( 1)
Trong hình 1, bên trái là ảnh gốc với ba chiếc bút chì, bên phải là phân
vùng, xác định đối tượng trong vùng màu trắng, còn lại là nền màu đen.

Số hóa bởi trung tâm học liệu />5



Hình 1: Phân vùng ảnh theo một ngưỡng
Việc phần vùng theo ngưỡng khơng chỉ dừng lại một ngưỡng: có thể có
nhiều hơn một ngưỡng.











<≤
<≤
<≤
<
=
+1
32
21
1
),( if
),( if2
),( if1

),( if0
),(
nn
TyxfTn
TyxfT
TyxfT
Tyxf
yxg
( 2)
Việc phần vùng theo ngưỡng khơng chỉ dừng lại một ngưỡng: có thể có
nhiều hơn một ngưỡng. Trong hình 2 là một ví dụ sử dụng 2 ngưỡng để phân
vùng ảnh.
Số hóa bởi trung tâm học liệu />6





a. ảnh gốc

b. ảnh được phân vùng với ngưỡng
thấp



c. ảnh được phân vùng với ngưỡng
cao

d. ảnh được phân vùng với cả hai
ngưỡng

Hình 2: Phân vùng ảnh theo hai ngưỡng trong biểu đồ
Số hóa bởi trung tâm học liệu />7


1.2 Phân vùng dựa vào phát triển vùng
Kỹ thuật phân vùng dựa trên cạnh có thể tìm được đường biên đối
tượng và sau đó xác định vị trí các đối tượng đó bằng cách làm đầy bên trong
đường biên.
Kỹ thuật phân vùng dựa trên vùng có cách tiếp cận ngược lại, bắt đầu ở
giữa một đối tượng và sau đó "phát triển" ra ngồi cho đến khi gặp đường
biên đối tượng [11,12].

a. ảnh gốc b. kết quả của việc phát triển từ
điểm hạt giống nằm chính giữa
ảnh (a)
Hình 3: Phân vùng ảnh theo vùng - phát triển vùng
1.2.1 Điểm ảnh lớn
Các thuật tốn điểm ảnh lớn nhóm các điểm ảnh thành các vùng ảnh có
ý nghĩa. Cách tiếp cận này có thể thay thế các cấu trúc lưới điểm ảnh (Hình 4),
loại bớt thơng tin thừa, tạo nên cơ sở thuận tiện tính tốn các đặc điểm của
ảnh, và giảm độ phức tạp của các thủ tục xử lý ảnh sau đó. Điểm ảnh lớn đã trở
thành cơ sở quan trọng cho các thuật tốn quan sát máy tính, được sử dụng
trong các ứng dụng đánh giá chiều sâu khơng gian, phân vùng ảnh, đánh giá
chuyển động cơ thể, và xác định đối tượng trong ảnh.
Số hóa bởi trung tâm học liệu />8



Hình 4: Điểm ảnh lớn
Có nhiều phương pháp tạo ra điểm ảnh lớn, mỗi phương pháp đều có

ưu nhược điểm và phù hợp với từng ứng dụng cụ thể. Ví dụ, phương pháp dựa
trên đồ thị có thể là lựa chọn tốt khi xem biên ảnh là quan trọng nhất. Tuy
nhiên nếu sử dụng điểm ảnh lớn để xây dựng đồ thị, phương pháp tạo lưới
đều, có thể là lựa chọn tốt hơn. Thường là khó xác định một giải pháp lý tưởng
cho tất cả các ứng dụng, tuy nhiêu, với điểm ảnh lớn, thường có các u cầu
sau:
• Điểm ảnh lớn cần phải tạo nên biên ảnh tốt.
• Điểm ảnh lớn cần phải được tính tốn nhanh, tiết kiệm bộ nhớ, và
dễ sử dụng, giảm độ phức tạp tính tốn.
• Khi được dùng cho mục đích phân vùng ảnh, điểm ảnh lớn cần
làm tăng tốc độ và cải thiện chất lượng của kết quả.

Số hóa bởi trung tâm học liệu />9



Hình 5: Điểm ảnh lớn với kích thước nhỏ hơn
Điểm ảnh lớn đã trở thành một cơng cụ cần thiết cho xử lý ảnh, và chương sau
sẽ phân tích các kỹ thuật điểm ảnh lớn hiện đại. Các thuật tốn được phân
tích về sự tn thủ đường biên, tốc độ phân vùng, và hiệu suất khi sử dụng
như là một bước tiền xử lý trong phạm vi phân vùng ảnh.

1.3 Phương pháp phân vùng dựa vào cạnh
Trong kỹ thuật này, các cạnh được phát hiện trong ảnh được cho là đại
diện cho đường biên đối tượng, và được sử dụng để xác định các đối tượng
này.
Thuật tốn Phân vùng theo cạnh:
Bước 1: Tính ảnh tăng cường cạnh ∇f từ f, bằng một tốn tử dạng gradient
Số hóa bởi trung tâm học liệu />10



Bước 2: Áp dụng ngưỡng với ảnh∇f: (∇f)
t
, từ đó ta có ảnh nhị phân chỉ ra các
cạnh.
Bước 3: Tính Laplacian Δf từ f, sử dụng bộ lọc Laplacian liên tục hoặc rời rạc.
Bước 4: Tính ảnh g = (∇f)t · sgn(Δf). Trong đó hàm sgn trả lại dấu của giá trị.
Ảnh g sẽ chỉ có 3 giá trị: 0 tại điểm khơng phait cạnh, 1. Tại điểm cạnh, ở bên
vùng sáng, -1 tại điểm cạnh ở bên vùng tối.
Hình dưới đây minh họa thuật tốn trên.

a. ảnh gốc b. ảnh được làm nét
các cạnh
c. ảnh được lấy
ngưỡng từ (b)

d. ảnh được áp dụng
bộ lọc Laplacian
(f
ii
) với σ = 1 điểm
ảnh.
e. Làm nét cạnh cho
(d)
f. Lấy ngưỡng cho
(e)
Hình 6: Phân vùng ảnh theo cạnh

Số hóa bởi trung tâm học liệu />11



Những phương pháp này có vấn đề với ảnh đó là:
• Cạnh yếu
• Rất nhiễu
• Ranh giới rất mịn
• Ranh giới kết cấu
Các vấn đề khác của những kỹ thuật này bắt nguồn từ sự khó khăn điều
chỉnh hiệu chỉnh chức năng Gradient cho phù hợp như vậy, tạo ra kết quả
khơng mong muốn như:
• Các vùng phân vùng có thể là nhỏ hơn hoặc lớn hơn so với thực tế
• Các cạnh của vùng phân vùng có thể khơng được kết nối
• Phân vùng trên hoặc dưới của ảnh (phát sinh của các cạnh giả hoặc
thiếu cạnh)
Về sau, các phương pháp khác chỉ dựa trên cơ sở các khái niệm về cạnh
thay vì sử dụng phương pháp phát hiện cạnh, ví dụ, thuật tốn phân vùng đập
nước.

1.3.1 Thuật tốn phân vùng đập nước
Mục đích chính của thuật tốn phân vùng đập nước là để tìm thấy
những "dòng chảy" trong một ảnh để tách các vùng riêng biệt. Trong thuật
tốn này, xem ảnh như một biểu đồ địa hình 3D, trong đó x và y biểu thị tọa
độ, và z biểu thị các giá trị pixel.
Thuật tốn bắt đầu đổ nước trong biểu đồ địa hình từ lưu vực thấp nhất
tới đỉnh cao nhất. Trong q trình này, ta có thể phát hiện một số đỉnh núi
được tách rời các lưu vực, được gọi là "đập". Biểu đồ cho thấy trong hình dưới
đây.

Số hóa bởi trung tâm học liệu />12



lưu vực đập

Hình 7: Khái niệm về đập ước và dòng chảy
Trước khi mơ tả các bước của lưu vực dòng chảy, trước hết ta xác định
một số thơng số. Đặt bộ M
1
, M
2
, , M
R
biểu thị các tọa độ trong vùng cực tiểu
của một ảnh g(x, y), trong đó g(x, y) là giá trị điểm ảnh của tọa độ (x, y). Ký
hiệu C (M
i
) là tọa độ trong lưu vực liên quan với vùng tối thiểu M
i
. Cuối cùng,
đặt T[n] là tập hợp các toạ độ (s,t) sao cho g(s, t)<n và hiển thị như sau

( 3)
Sau đó, q trình của thuật tốn đập nước được thực hiện với sự tăng
dần của n để phát hiện các cạnh. Kết quả thu được sau khi thực hiện thể hiện
trong hình sau.

Hình 8: (a) ảnh đầu vào và (b) - kết quả áp dụng thuật tốn đập nước.
ĐÁNH DẤU
Thuật tốn phân vùng đập nước có nhược điểm là phân vùng q,
nghĩa là các vùng bị phân nhỏ qua mức, một đối tượng có thể nămg trong
Số hóa bởi trung tâm học liệu />13



nhiều vùng. Để giải quyết vấn đề trên cách tiếp cận dựa trên các khái niệm về
điểm đánh dấu được sử dụng. Đánh dấu là một thành phần kết nối thuộc về
một ảnh. Các dấu hiệu bao gồm các dấu nội bộ, liên quan dến các đối tượng
quan tâm, và đánh dấu bên ngồi, liên quan đến nền. Việc lựa chọn điểm
đánh dấu thơng thường bao gồm hai bước: tiền xử lý và Xác định các tiêu chí
mà các dấu hiệu phải đáp ứng.
Bước tiền xử lý là lọc ảnh với một bộ lọc làm mịn. Bước này có thể giảm
thiểu tác động chi tiết nhỏ, nói cách khác, bước này là để giảm số lượng lớn
các cực tiểu tiềm năng (các chi tiết khơng liên quan) ngun nhân phân vùng
q nêu trên.
Các định nghĩa là của đánh dấu nội bộ:
• Một vùng được bao quanh bởi các điểm của"độ cao".
• Các điểm trong vùng tạo thành các thành phần kết nối.
• Tất cả các điểm trong thành phần kết nối có giá trị cường độ như
nhau.
Sau khi ảnh được làm mịn, đánh dấu nội bộ có thể được xác định bởi
các định nghĩa như mức xám, các blob như trong hình dưới (a). Do đó, các
thuật tốn đập nước được áp dụng cho ảnh đã mịn, với ràng buộc đó các đánh
dấu nội bộ chỉ được phép cực tiểu vùng. Hình18 (a) cho thấy các dòng nước
chảy, là các đánh dấu bên ngồi. Các điểm của dòng nước chảy dọc theo các
điểm cao nhất giữa các đánh dấu lân cận.

Hình 9: (a) Ảnh hiển thị đánh dấu nội bộ (vùng sáng) và các đanh dấu bên
ngồi (dòng nước chảy).(b) Kết quả phân vùng của (a).
Số hóa bởi trung tâm học liệu />14


1.4 Phân lớp dữ liệu
Phân lớp dữ liệu là một trong những phương pháp được áp dụng rộng

rãi trong phân vùng ảnh và thống kê ảnh. Khái niệm chính của phân lớp dữ
liệu là sử dụng trọng tâm để đại diện cho mỗi cụm và trên cơ sở sự tương
đồng với tâm của cụm để phân loại. Theo đặc điểm của thuật tốn phân lớp, ta
gần như có thể phân chia thành các phân lớp"phân cấp" và "phân chia". Ngoại
trừ hai lớp này, thuật tốn thay đổi giá trị trung bình cũng là một phần của
phân nhóm dữ liệu, và khái niệm của nó được dựa trên mật độ ước tính.
1.4.1 Phân lớp phân cấp
Khái niệm của việc phân lớp phân cấp để xây dựng một dendrogram
đại diện cho các nhóm lồng nhau của mơ hình (cho ảnh, được gọi là điểm ảnh)
và mức độ tương đồng mà tại đó các nhóm thay đổi. Ta có thể áp dụng các dữ
liệu hai chiều được thiết lập để giải thích hoạt động của các thuật tốn phân
lớp phân cấp. Ví dụ, tám nhãn mẫu A, B, C, D, E, F, G, H trong ba cụm được
hiển thị trong hình 6 và Hình 7 cho thấy sơ đồ phân cấp (dendrogram) tương
ứng với tám mẫu trong hình 6.
Các phóm phân cấp có thể được chia thành hai loại thuật tốn: thuật
tốn kết tụ thứ bậc và thuật tốn phân chia thứ bậc. Tương ứng, ta mơ tả chi
tiết của hai thuật tốn như dưới đây.

Thuật tốn kết tụ thứ bậc:
Bước 1. Thiết lập từng mơ hình trong cơ sở dữ liệu như là một cụm C
i

tính tốn ma trận lân cận bao gồm cả khoảng cách giữa mỗi cặp của các mơ
hình.
Bước 2. Sử dụng ma trận lân cận để tìm ra hầu hết các cặp cụm tương
đồng và sau đó sát nhập hai cụm này thành một cụm. Sau đó, cập nhật ma
trận lân cận.
Số hóa bởi trung tâm học liệu />15



Bước 3. Lặp lại Bước 1 và 2 cho đến khi tất cả các mẫu trong một cụm
hoặc chỉ đạt được sự tương đồng mà ta u cầu, ví dụ như dòng gạch ngang
trong hình 13.

Chú ý rằng có một số cách để xác định "khoảng cách" giữa mỗi cặp của
các mơ hình. Các định nghĩa phổ biến nhất là các thuật tốn liên kết đơn và
liên kết hồn chỉnh. Nếu ta giả sử D(C
i
, C
j
) là khoảng cách giữa các cụm C
i

C
j
, và giả sử d(a, b) là khoảng cách giữa mơ hình a và b. Sau đó, định nghĩa
khoảng cách của phương pháp liên kết đơn.

Hình 10: Mơ hình 8 nhóm thành ba cụm.

Số hóa bởi trung tâm học liệu />16


Hình 11: Dendrogram này tương ứng với tám mẫu trong hình 6 bằng cách sử
dụng các thuật tốn liên kết đơn.

1.4.2 Thuật tốn phân chia thứ bậc
Trước khi giới thiệu thuật tốn về phân chia thứ bậc, để xác định
khoảng cách giữa mơ hình x (như ảnh, điểm ảnh) và cụm C là d(x, C)= trung
bình của khoảng cách giữa x và mỗi mẫu trong cụm C. các bước của thuật tốn

phân chia thứ bậc thể hiện dưới đây.

Thuật tốn phân chia thứ bậc
Bước 1. Bắt đầu với một cụm tồn bộ cơ sở dữ liệu (về ảnh, tồn bộ ảnh)
Bước 2. Tìm mơ hình x
i
trong cụm C
i
sao cho d(x, C
i
) = max (d(y,C
i
)),
∀y∈C
i
, i = 1, 2, , N và N là số cụm hiện tại trong tồn bộ cơ sở dữ liệu.
Bước 3. Chia x
i
ra thành một cụm C
i+n
mới, và sau đó tính d (y, C
i
) và d
(y, C
i+n
), với ∀ y ∈ C
i
. Nếu d (y, C
i
)> d (y, C

i+n
), thì phân chia y của C
i
và sát
nhập nó vào C
i+n
.
Bước 4. Lặp lại bước 2 cho đến khi tất cả các cụm khơng thay đổi nữa.

Những ưu điểm và nhược điểm của thuật tốn phân chia thứ bậc:
Ưu điểm
a. Q trình và các mối quan hệ của việc phân lớp theo cấp bậc chỉ có
thể được thực hiện bằng cách kiểm tra dendrogram.
b. Kết quả của việc phân lớp theo cấp bậc trình bày mối tương quan cao
với các ký tự của cơ sở dữ liệu ban đầu.
c. Ta chỉ cần phải tính tốn khoảng cách giữa mỗi mẫu, thay vì tính
tốn tâm của cụm.
Số hóa bởi trung tâm học liệu />

×