Số hóa bởi trung tâm học liệu
ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
–––––––––––––––––––––––––––
NGUYỄN THANH TÙNG
PHÂN VÙNG ẢNH NHỜ SÁT NHẬP
CÁC MIỀN ĐỘNG
Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01.01
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Ngƣời hƣớng dẫn khoa học: TS. ĐÀO NAM ANH
Thái Nguyên - 2013
Số hóa bởi trung tâm học liệu
i
LỜI CAM ĐOAN
Tôi xin cam đoan luận văn là kết quả nghiên cứu của tôi, không sao chép của
ai. Nội dung luận văn có tham khảo và sử dụng các tài liệu liên quan, các thông tin
trong tài liệu được đăng tải trên các tạp chí và các trang website theo danh mục tài
liệu của luận văn.
Tác giả luận văn
Nguyễn Thanh Tùng
Số hóa bởi trung tâm học liệu
ii
LỜI CẢM ƠN
Lời đầu tiên, Em xin chân thành cảm ơn đến các Thầy bộ môn đã trực tiếp dạy
dỗ Em như Thầy PGS.TS Ngô Quốc Tạo, PGS.TSKH Nguyễn Xuân Huy, PGS.TS
Đỗ Năng Toàn,…đã giúp Em có kiến thức và ý tưởng cho luận văn. Em xin cảm ơn
các Thầy trong hội đồng bảo vệ đề cương đã góp ý, giúp Em có những thay đổi phù
hợp hơn trong luận văn này. Em xin cảm ơn trường đại học công nghệ thông tin và
truyền thông - Đại học Thái Nguyên đã tạo rất nhiều điều kiện thuận lợi cho Em.
Đặc biệt, Em xin cảm ơn Thầy TS. Đào Nam Anh đã trực tiếp hướng dẫn, giúp đỡ
và tận tình chỉ bảo Em trong suốt thời gian từ khi có ý tưởng cho luận văn đến khi
hoàn thành luận văn này.
Tác giả luận văn
Nguyễn Thanh Tùng
Số hóa bởi trung tâm học liệu
iii
MỤC LỤC
Lời cam đoan i
Lời cảm ơn ii
Mục lục iii
Danh mục các thuật ngữ, các từ viết tắt v
Danh mục các hình vẽ, đồ thị vi
MỞ ĐẦU 1
Chƣơng 1: TỔNG QUAN VỀ PHÂN VÙNG ẢNH, CÁC THUẬT TOÁN
PHÁT TRIỂN VÙNG 4
1.1. Tổng quan về phân vùng ảnh 4
1.1.1. Phương pháp phân vùng theo ngưỡng 5
1.1.2. Phương pháp phân vùng dựa vào cạnh 5
1.1.3. Kỹ thuật phân cụm 5
1.1.4. Phương pháp dựa vào vùng 6
1.2. Các thuật toán dựa vào vùng 6
1.2.1. Phát triển vùng từ các hạt 6
1.2.2. Phát triển vùng không dùng hạt 7
1.2.3. Tách và sát nhập vùng 8
1.3. Phân vùng ảnh không giám sát đối với các vùng màu 10
1.3.1. Tiêu chí phân vùng ảnh 10
1.3.2. Thuật toán JSEG 12
1.3.4. Thuật toán quét nhanh 14
1.4. Kết luận chương 1 16
Chƣơng 2: THUẬT TOÁN PHÂN VÙNG ẢNH SÁT NHẬP CÁC MIỀN ĐỘNG 18
2.1. Phân vùng ảnh bằng cách sát nhập các miền động 18
Số hóa bởi trung tâm học liệu
iv
2.1.1. Bước chuẩn bị trước khi sát nhập miền 21
2.1.2. Kiểm tra tính tương đồng các đặc tính của superpixel 24
2.1.3. Sát nhập miền động 27
2.2. Tăng tốc thuật toán bằng đồ thị lân cận gần nhất 32
2.3. Độ phức tạp thuật toán DRM 34
2.4. Ứng dụng của thuật toán DRM 35
2.5. Kết luận chương 2 35
Chƣơng 3: CÀI ĐẶT THỬ NGHIỆM 36
3.1. Môi trường cài đặt 36
3.2. Lựa chọn các thông số 36
3.3. Kết quả thực nghiệm 37
3.4. Đánh giá chất lượng phân vùng 43
3.5. Kết luận chương 3 43
KẾT LUẬN 45
TÀI LIỆU THAM KHẢO 46
Số hóa bởi trung tâm học liệu
v
DANH MỤC CÁC THUẬT NGỮ, CÁC TỪ VIẾT TẮT
Boundary-based methods
Phương pháp biên
Clustering
Phân nhóm/cụm
Dissimilarity
Khác biệt
Dynamic region merging
DRM
Sát nhập các miền động
Edge-Based Segmentation Method
Phân vùng dựa vào cạnh
Gradient
Độ dốc
Grow region
Phát triển vùng ảnh
Over-segmentation
Phân vùng quá
Region splitting and merging
Tách vùng và sát nhập vùng
Region-based methods
Phương pháp miền
Screen resolution
Độ phân giải màn hình
Seeded region growing
SRG
Phát triển vùng từ các hạt
Sensor
Cảm ứng
Similarity
Giống nhau
Superpixel
Điểm ảnh lớn
Unseed region growing
URG
Phát triển vùng không dùng hạt
Số hóa bởi trung tâm học liệu
vi
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
Hình 1.1: Các kiểu kỹ thuật phân vùng 4
Hình 1.2: Biểu đồ xám và ngưỡng T 5
Hình 1.3: (a) Cấu trúc lược đồ hình cây, trong đó R đại diện cho toàn bộ vùng ảnh.
(b) Phân vùng ảnh tương ứng 9
Hình 1.4: Một ví dụ về các lớp bản đồ khác nhau và giá trị J tương ứng của chúng.
"+", "O", và "#" đại diện cho ba lớp của các điểm dữ liệu 11
Hình 1.5: Sơ đồ luồng các bước trong JSEG 12
Hình 1.6: Phân vùng ảnh của ảnh mức xám sử dụng JSEG 14
Hình 2.1: Một ví dụ về phân vùng và trên đồ thị liền kề miền tương ứng (RAG) 22
Hình 2.2: Một ví dụ mà P vị từ giữa R
1
và R
2
đều phù hợp 23
Hình 2.3: Quá trình sát nhập miền động như một con đường ngắn nhất trong một đồ
thị phân lớp 30
Hình 2.4: Một NNG của RAG trong hình 2.1 và một chu kỳ trong NNG 32
Hình 2.5: Một ví dụ về NNG sửa đổi. Đường đứt nét đại diện cho các cạnh RAG,
khi đường kẻ trực tiếp đại diện cho cạnh NNG 34
Hình 3.1: Phân vùng với sát nhập động với các lamda = 0.2, 0.6 37
Hình 3.2: Các miền lân cận với màu sắc thống nhất được sát nhập 38
Hình 3.3: Phân vùng “thấp” – under segment 39
Hình 3.4: Biên được nằm trên các địa điểm thích hợp 39
Hình 3.5: Có thể sát nhập các miền với biên có độ tương phản ngắn 40
Hình 3.6: DRM có thể bỏ đi một số biên dài nhưng yếu 40
Hình 3.7: Một số miền lớn có các biến thể đáng kể bên trong 41
Hình 3.8: Phân vùng với sát nhập động, Phân vùng “thấp” – under segment 41
Hình 3.9: Ví dụ lỗi của phương pháp DRM 42
Hình 3.10: So sánh với một số phương pháp 42
1
MỞ ĐẦU
Thông tin ảnh đóng vai trò quan trọng trong hầu hết mọi lĩnh vực của cuộc
sống. Ngày nay, thông tin ảnh được xử lý bằng kỹ thuật số. Xử lý ảnh (XLA) là một
trong những chuyên ngành quan trọng và lâu đời của Công nghệ thông tin được áp
dụng trong các ứng dụng khác nhau, từ truyền hình đến chụp cắt lớp, từ nhiếp ảnh
đến in ấn, từ robot đến cảm biến từ xa.
Để xử lý được một ảnh thì phải trải qua nhiều bước, nhưng bước quan trọng
và khó khăn nhất đó là phân vùng ảnh. Nếu bước phân vùng ảnh không tốt thì dẫn
đến việc nhận diện sai lầm về các đối tượng có trong ảnh.
Hiện nay đã có nhiều thuật toán được đề xuất để giải quyết bài toán phân
vùng ảnh. Các thuật toán trên hầu hết đều dựa vào hai thuộc tính quan trọng của
mỗi điểm ảnh so với các điểm lân cận của nó, đó là: sự khác biệt (dissimilarity) và
giống nhau (similarity). Các phương pháp dựa trên sự khác nhau của các điểm ảnh
được gọi là các phương pháp biên (boundary-based methods), còn các phương pháp
dựa trên sự giống nhau của các điểm ảnh được gọi là phương pháp miền (region-
based methods).
Phát triển vùng ảnh là một cách tiếp cận để phân vùng ảnh, trong đó các
điểm ảnh lân cận được kiểm tra và gán vào vùng ảnh nếu không phát hiện được
biên. Quá trình này được lặp cho mỗi điểm ảnh nằm ở biên của vùng ảnh. Nếu tìm
thấy được các vùng lân cận, thuật toán sát nhập vùng được áp dụng, trong đó đường
biên yếu được giải thể và đường biên mạnh được giữ lại.
Phát triển vùng ảnh (grow region) có một số lợi thế hơn các kỹ thuật phân
vùng thông thường. Không giống như các phương pháp gradient và Laplacian,
đường biên của các vùng ảnh tìm thấy bằng cách phát triển vùng là rất mỏng và
được kết nối. Thuật toán cũng rất ổn định đối với nhiễu ảnh.
2
Phương pháp phát triển vùng ảnh thường sử dụng các vùng đầu tiên như là
một bước tiền xử lý cho phân vùng ảnh. Vùng đầu tiên có thể chỉ là các điểm ảnh
thông thường mà cũng có thể là các điểm ảnh lớn - Superpixels. Điểm ảnh lớn là
một nhóm điểm ảnh ở cạnh nhau và có đặc tính tương đồng. Superpixels được dùng
để đánh giá độ sâu của ảnh, phân vùng ảnh, phát hiện đối tượng trong ảnh, và
thường được áp dụng cho ảnh màu. Luận văn tập trung hướng việc phân vùng ảnh
thành các đối tượng lớn bằng thuật toán sát nhập các vùng động, mà các vùng động
ban đầu là các điểm ảnh lớn.
Phương pháp phân vùng này có hai lợi thế. Trước tiên, các miền tiếp tục có
thêm thông tin mô tả bản chất của đối tượng. Thứ hai, số lượng của các vùng đầu
tiên ít hơn số điểm ảnh trong một ảnh và do đó làm tăng tốc độ sát nhập miền. Bắt
đầu từ một tập hợp của các vùng đầu tiên, phân vùng được thực hiện bằng việc tiếp
tục sát nhập các miền lân cận tương tự theo một điền kiện xác định. Đó là ý tưởng
thuật toán phân vùng ảnh bằng cách sát nhập các miền động (Dynamic Region
Merging – DRM)
Mục đích chính của luận văn là nắm được các hướng tiếp cận chính trong
phân vùng, đặc biệt là phân vùng theo cách phát triển vùng. Luận văn sẽ tập trung
tìm hiểu và trình bày thuật toán phân vùng ảnh màu bằng cách sát nhập các miền
động, có khả năng tăng tốc độ tính toán.
Ngoài phần mở đầu và kết luận, luận văn được chia làm 3 chương, cụ thể nội
dung các chương như sau:
Chương 1: Tổng quan về phân vùng ảnh, các thuật toán phát triển vùng: Các
khái niệm cơ bản trong xử lý ảnh, Ảnh và điểm ảnh, Quan hệ giữa các điểm ảnh,
Mức xám của ảnh. Các mô hình phân vùng ảnh: theo ngưỡng, theo biên và theo
vùng. Trong nhóm phân vùng theo miền, các thuật toán phát triển vùng sẽ được
phân tích kỹ hơn.
3
Chương 2: Thuật toán phân vùng ảnh sát nhập các miền động: Phương pháp
phát triển vùng ảnh thường sử dụng các vùng đầu tiên như là một bước tiền xử lý
cho phân vùng ảnh. Một thuật toán hiệu quả phát triển vùng sử dụng các điểm ảnh
lớn làm các vùng ban đầu sẽ được mô tả và phân tích. Các vùng ảnh sẽ được phát
triển lớn lên bằng cách sát nhập các vùng liền kề với nhau.
Chương 3: Kết quả thực nghiệm. Cài đặt thuật toán phân vùng ảnh màu, sát
nhập các miền động bằng ngôn ngữ C++.
4
Chƣơng 1
TỔNG QUAN VỀ PHÂN VÙNG ẢNH, CÁC THUẬT TOÁN
PHÁT TRIỂN VÙNG
1.1. Tổng quan về phân vùng ảnh
Nhiều phương pháp phân vùng ảnh đã được đề xuất trong những thập kỷ
qua, và phân loại các phương pháp phân vùng là cần thiết. Dường như không thể có
một cách phân loại tách bạch, bởi vì hai phương pháp phân vùng rất khác nhau cũng
có thể có cùng một số thuộc tính. Do đó việc phân loại được trình bày trong chương
này là ở mức độ phương pháp tiếp cận, chứ không phải là phân loại nghiêm ngặt các
cách phân vùng ảnh [1,2,3,4]. Các loại phương pháp phân vùng ảnh sau đây hay
được sử dụng:
1. Phân vùng dựa vào ngưỡng.
2. Phân vùng dựa vào cạnh.
3. Phân vùng dựa vào phát triển vùng.
4. Kỹ thuật phân nhóm.
Các mục tiếp theo giới thiệu một số kỹ thuật trên.
Hình 1.1: Các kiểu kỹ thuật phân vùng
Các kiểu kỹ thuật phân vùng
Dựa vào
ngưỡng
Dựa vào
cạnh
Dựa vào
vùng
Gradient
Laplacien
Phát triển vùng
Phân loại/
Phân cụm
Mục đích
chung
Dựa vào hiểu
biết
5
1.1.1. Phương pháp phân vùng theo ngưỡng
Trong phân vùng ảnh dựa trên ngưỡng, các điểm ảnh của ảnh đầu vào được so
sánh với một hoặc nhiều ngưỡng T, từ đó xếp các đểm ảnh vào các vùng khác nhau.
Hình 1.2: Biểu đồ xám và ngƣỡng T
Trong hình 1.2 có biểu đồ xám và ngưỡng T có thể dùng để phân vùng các
đối tượng / nền. Hạn chế cơ bản của phương pháp này là biểu đồ không cung cấp
thông tin không gian, chỉ có phân phối các mức xám [14,15,16]
1.1.2. Phương pháp phân vùng dựa vào cạnh
Phân vùng dựa vào cạnh (Edge-Based Segmentation Method) thường chỉ ra
phương pháp phân vùng dựa vào các cạnh trong một ảnh. Các phương pháp đơn
giản áp dụng một số phương pháp phát hiện cạnh trước khi phân vùng. Một số
phương pháp phát hiện cạnh được thực hiện theo độ dốc [2] và biến đổi Hilbert
[9,10].
1.1.3. Kỹ thuật phân cụm
Mặc dù phân nhóm/cụm (clustering) đôi khi được dùng như một từ đồng
nghĩa với các kỹ thuật phân vùng, song ở đây phân nhóm để chỉ kỹ thuật được sử
dụng chủ yếu trong thăm dò phân tích dữ liệu của các mẫu. Trong ngữ nghĩa này,
các phương pháp phân nhóm sắp xếp các mô hình tương tự vào từng nhóm với một
ý nghĩa nhất định. Mục tiêu này rất giống với những gì ta đang làm khi phân vùng
một ảnh, và thực sự một số kỹ thuật phân nhóm có thể dễ dàng được áp dụng cho
phân vùng ảnh [19,20,21].
^
6
1.1.4. Phương pháp dựa vào vùng
Các phân vùng dựa trên vùng là phân vùng của một ảnh vào các vùng tương
đồng / đồng nhất của các điểm ảnh được kết nối thông qua việc áp dụng các tiêu
chuẩn đồng nhất / giống nhau giữa các tập đại diện của các điểm ảnh. Mục 1.2 sẽ
phân tích chi tiết về các phương pháp này.
1.2. Các thuật toán dựa vào vùng
Các phân vùng dựa trên vùng được phân vùng của một ảnh vào các vùng
tương đồng / đồng nhất của các điểm ảnh được kết nối thông qua việc áp dụng các
tiêu chuẩn đồng nhất / giống nhau giữa các tập đại diện của các điểm ảnh. Mỗi điểm
ảnh trong một vùng tương tự như đối với một số đặc tính hoặc tính toán như cường
độ, màu và kết cấu. Phát triển vùng bắt đầu với tạo vùng bằng việc chọn một số
điểm ảnh làm hạt giống. Tiếp theo kiểm tra các điểm ảnh lân cận của "điểm hạt
giống” ban đầu và xác định liệu những điểm lân cận nên được thêm vào vùng. Quá
trình này được lặp lại, tương tự như thuật toán phân cụm dữ liệu.
Chương này có 3 thuật toán:
Phát triển vùng từ các hạt.
Phát triển vùng không dùng hạt.
Tách vùng và sát nhập vùng.
1.2.1. Phát triển vùng từ các hạt
Thuật toán phát triển vùng từ các hạt (Seeded Region Growing - SRG) là
một trong những phương pháp phân vùng dựa vào vùng đơn giản nhất. Thuật toán
thực hiện một phân vùng ảnh với việc kiểm tra những điểm ảnh lân cận của một tập
hợp điểm, được gọi là những điểm hạt, và quyết định liệu những điểm ảnh này có
được phân loại thành nhóm các điểm hạt hay không [8, 9, 10].
Quy trình thuật toán được thực hiện như sau:
7
Thuật toán phát triển vùng từ các hạt (SRG):
Bƣớc 1. Ta bắt đầu với một số điểm hạt mà được phân nhóm vào n nhóm,
gọi là C
1
, C
2
, …., C
n
. Và vị trí của các điểm hạt được lập là p
1
, p
2
, … , p
n
.
Bƣớc 2. Tính sự khác biệt của giá trị điểm ảnh ở điểm hạt đầu tiên p
1
, và các
điểm ở cạnh nó, nếu sự khác biệt nhỏ hơn ngưỡng mà ta định nghĩa, điểm ở cạnh nó
có thể được phân loại thành C
i
, với i = 1, 2, …., n.
Bƣớc 3. Tính lại biên của C
i
và lập các điểm biên này thành những điểm hạt
mới p
i
. Đồng thời, các giá trị điểm ảnh trung bình của C
i
phải được lần lượt tính lại.
Bƣớc 4. Lặp lại Bước 2 và 3 cho đến khi tất cả các điểm ảnh trong ảnh được
phân bổ vào một nhóm phù hợp.
Một điều chắc chắn là những vùng được phân vùng ảnh SRG đều có độ
tương đồng màu cao. Tuy nhiên, vẫn có 2 hạn chế, đó là ở việc chọn hạt đầu tiên và
vấn đề tốn kém thời gian.
Vấn đề điểm hạt đầu tiên tức là chọn các điểm hạt đầu tiên khác nhau dẫn đến
những kết quả phân vùng ảnh khác nhau. Vấn đề này làm giảm tính ổn định của các
kết quả phân vùng ảnh từ cùng một ảnh. Hơn nữa, việc quyết định xem có bao nhiêu
điểm hạt cũng là một vấn đề quan trọng bởi vì những ảnh khác nhau đều có số phân
vùng ảnh riêng phù hợp.
Một vấn đề nữa là tiêu tốn thời gian, vì SRG cần rất nhiều thời gian tính toán, và
đây cũng là vấn đề nghiêm trọng nhất trong SRG.
1.2.2. Phát triển vùng không dùng hạt
Thuật toán phát triển vùng không dùng hạt (Unseed Region Growing-URG)
được đề xuất bởi Lin và cộng sự. Sự khác biệt là không cần chọn hạt. Trong quá
trình phân vùng, các hạt có thể được phát sinh một cách tự động. Vì thế, phương
pháp này có thể thực hiện phân vùng ảnh tự động đầy đủ cùng với lợi ích thiết thực
khi trở thành một phân vùng ảnh dựa vào vùng.
8
Thuật toán phát triển vùng không dùng hạt URG
Bƣớc 1. Quá trình này khởi chạy với nhóm C
1
chứa một điểm ảnh đơn và
trạng thái chạy của quá trình bao gồm một bộ các nhóm được nhận dạng, C
1
,
C
2
, …, C
n
.
Bƣớc 2. Ta xác định tập tất cả các điểm ảnh không đánh dấu mà giáp ranh
với ít nhất một trong những nhóm được nhận dạng.
Bƣớc 3. Chọn một điểm z. Nếu
z,
C
< t, ta có thể đặt điểm ảnh vào C. Nếu
một trong hai điều kiện trên không thoả mãn, thì rõ ràng rằng điểm ảnh này nằm ở
các nhóm khác, vì thế một nhóm mới C
n+1
được sinh ra và khởi chạy với điểm z.
Bƣớc 4. Sau khi điểm ảnh đã được phân vào nhóm, giá trị điểm ảnh trung
bình của nhóm đó phải được cập nhật.
Bƣớc 5. Lặp lại bước 2 đến bước 4 đến khi tất cả các điểm ảnh được phân
vào một nhóm.
1.2.3. Tách và sát nhập vùng
Mục đích chính của tách vùng và sát nhập vùng (Region Splitting and
Merging) là để phân biệt sự đồng nhất của ảnh [5]. Thuật toán dựa trên lược đồ hình
cây, có nghĩa là mỗi nút của cây có bốn con và gốc của cây tương ứng với toàn bộ
ảnh. Bên cạnh đó, mỗi nút đại diện cho các nhánh của một nút vào bốn nút hậu duệ.
Trường hợp được hiển thị trong hình 1.3(a), và trong trường hợp của hình 1.3(b),
chỉ R
4
được chia nhỏ hơn. Các vấn đề cơ bản tách vùng và sát nhập vùng được trình
bày dưới đây.
R đại diện cho toàn bộ vùng ảnh và quyết định một vị từ P. Nếu P (R)
FALSE, ta chia ảnh R vào bốn phần. Nếu P là FALSE cho bất kỳ phần nào, ta chia
nhỏ phần đó vào 4 phần nhỏ hơn, và cứ thế. Cho đến khi, với bất kỳ vùng R
i
, P(R
i
)
TRUE.
Khi đó quá trình tách vùng, sát nhập vùng là quá trình kết hợp hai vùng liền
kề R
j
và R
k
nếu P(R
j
, R
k
) = True.
9
R
1
R
2
R
3
R
41
R
42
R
43
R
44
Thuật toán tách vùng và sát nhập vùng:
Bƣớc 1. Bước tách: Đối với bất kỳ vùng R
i
nào, P(R
i
) FALSE, ta chia
thành 4 phần rời nhau.
Bƣớc 2. Sát nhập: Khi không thể tách được thêm nữa, thì hợp nhất bất kỳ
vùng liền kề R
j
và R
k
mà P (R
j
, R
k
) = True.
Bƣớc 3. Chỉ dừng lại nếu không có thêm sát nhập nào là còn khả năng.
R
R
1
R
2
R
3
R
4
R
41
R
42
R
43
R
44
Hình 1.3: (a) Cấu trúc lƣợc đồ hình cây, trong đó R đại diện cho toàn bộ vùng
ảnh. (b) Phân vùng ảnh tƣơng ứng
Nhận xét thuật toán tách và sát nhập vùng:
Ƣu điểm:
Ảnh có thể được chia dần độ phân giải theo yêu cầu để tạo ra số lượng cấp
độ vùng được xác định.
Ta có thể phân chia các ảnh bằng cách sử dụng các tiêu chí mà ta quyết định,
như là trung bình. Ngoài ra, các tiêu chí sát nhập có thể là khác với các tiêu chí
phân chia.
Nhƣợc điểm:
Thuật toán có thể tạo ra các phân vùng ảnh dạng ô vuông đều. Vấn đề phân
vùng ảnh ô vuông có thể được giảm bằng cách chia tách ở cấp độ cao hơn, nhưng
thời gian tính toán sẽ phát sinh.
10
1.3. Phân vùng ảnh không giám sát đối với các vùng màu
Hạn chế của phân vùng ảnh không giám sát là không rõ ràng bởi vì các đối
tượng được phân vùng ảnh thường không phù hợp với các vùng đồng nhất về màu,
kết cấu hoặc chuyển động. Do đó, vào năm 2001, Deng và cộng sự trình bày các
phương pháp về phân vùng ảnh không giám sát đối với những vùng màu – đặc
trưng trong ảnh và video, gọi là JSEG [6]. Mục tiêu của thuật toán này là phân vùng
ảnh và video thành các vùng màu – đặc trưng đồng nhất.
Khái niệm về các thuật toán JSEG là để tách quá trình phân vùng ảnh thành
hai phần, định lượng màu và phân vùng không gian. Định lượng màu chính là định
lượng màu trong ảnh thành các lớp đại diện mà có thể phân biệt các vùng trong ảnh.
Quá trình định lượng được thực hiện trong không gian màu mà không cần xem xét
sự phân bố không gian của các màu. Các nhãn lớp màu tương ứng thay thế các giá
trị điểm ảnh ban đầu và sau đó tạo ra một bản đồ lớp của ảnh.
Không gian màu CIE LUV được sử dụng cho không gian màu trong JSEG.
Trong phần thứ hai, phân vùng không gian thực hiện trên bản đồ lớp thay vì xem
xét sự tương đồng của điểm màu tương ứng. Lợi ích của việc phân tách này đó là
việc lần lượt phân tích sự tương đồng về màu và phân bố thì dễ xử lý hơn thực hiện
cùng một lúc.
1.3.1. Tiêu chí phân vùng ảnh
Trước khi giới thiệu các thuật toán JSEG, mục này nói về các tiêu chuẩn về
phân vùng ảnh áp dụng trong JSEG. Quy trình trước đó của tiêu chí là một thuật
toán định lượng màu không được giám sát dựa trên nhận thức con người [7].
Phương pháp định lượng này định lượng các bộ điểm ảnh cùng một màu, được gọi
là lớp màu. Sau đó, các màu điểm ảnh được thay thế bằng nhãn lớp màu tương ứng
của chúng và ảnh vừa được xác lập nhãn được gọi là một bản đồ lớp. Bản đồ lớp có
thể được coi như là một loại đặc biệt của các thành phần kết cấu.
Các chi tiết của tiêu chuẩn này được mô tả dưới đây.
11
Z là tập hợp của tất cả các điểm dữ liệu N trong một bản đồ lớp và z = (x, y),
z Z và (x, y) là vị trí các điểm ảnh.
(a) lớp - bản đồ
1
(b) lớp - bản đồ
2
(c) lớp - bản đồ
3
J=
0
J=
0.855
J=
1.720
Hình 1.4: Một ví dụ về các lớp bản đồ khác nhau và giá trị J tƣơng ứng của
chúng. "+", "O", và "#" đại diện cho ba lớp của các điểm dữ liệu
Giá trị của J liên quan với mức độ phân bố các lớp màu. Sự phân bố các lớp
màu càng đồng nhất, giá trị của J càng nhỏ. Một ví dụ về bản đồ lớp như vậy được
thể hiện trong hình 1.4 (a) trong đó J bằng 0. Mặt khác, nếu một ảnh bao gồm một
số vùng màu đồng nhất và các lớp màu được tách biệt so với các lớp khác, giá trị J
tương ứng là lớn. Điều này được minh họa bằng bản đồ lớp 3 trong hình 1.4 (c) và
giá trị J tương ứng bằng 1.720. Có một ví dụ khác trong hình 1.4 (b) trong đó J bằng
0.855 thể hiện sự phân bố đồng đều hơn ở bản đồ lớp 1. Định nghĩa của J xuất phát
từ việc phân biệt các lớp tuyến tính của Fisher [8].
Sau khi thực hiện các phương pháp hoạt động của J, trong các thuật toán của
JSEG, ta cần phải áp dụng hai giá trị: J trung bình và giá trị J cục bộ. J trung bình
được sử dụng như tiêu chí để tính toán phân vùng.
12
1.3.2. Thuật toán JSEG
Hình 1.5: Sơ đồ luồng các bƣớc trong JSEG
Theo các đặc tính của giá trị J, phương pháp phát triển vùng sửa đổi có thể
được ứng dụng để phân vùng ảnh.
Thuật toán bắt đầu việc phân vùng ảnh ở mức độ lớn nhất. Sau đó lặp lại quá
trình tương tự trên các vùng được phân vùng ảnh mới ở mức độ tiếp theo nhỏ hơn.
Sau khi kết thúc việc phân vùng ảnh cuối cùng ở mức độ nhỏ nhất, việc sát nhập
vùng tuân theo việc phát triển vùng để thu được kết quả phân vùng ảnh cuối cùng.
Sơ đồ các bước JSEG được thể hiện ở hình 1.5.
Tiếp theo là mô tả 3 bước: phát hiện hạt, phát triển hạt và sát nhập vùng.
Lớp biểu đồ ban đầu
Quét ban đầu
Cho từng vùng
Tính toán giá trị J cục
bộ
Phát triển vùng
Phát hiện hạt
Phát triển hạt
Vùng được phân vùng
Quét lại
Sát nhập vùng
Kết quả cuối cùng
Quét < ngưỡng
Sai
Đúng
13
1.3.3.1. Phát hiện hạt
Trước khi tiến hành gieo hạt, ta phải phát hiện các vùng gieo hạt đầu tiên.
Những vùng này tương ứng với các mức tối thiểu của giá trị J cục bộ. Các bước
phát hiện hạt được thể hiện dưới đây.
Thuật toán phát hiện hạt
Bƣớc 1. Tính trung bình và độ lệch chuẩn của các giá trị J cục bộ trong vùng,
ký hiệu là μ
j
và T
j
, tương ứng.
Bƣớc 2. Xác định một ngưỡng T
j
T
j j j
(1)
Cho α được chọn từ một số các giá trị cho trước sẽ cho kết quả hạt giống tốt
nhất. Sau đó, ta thiết lập các điểm ảnh với giá trị J cục bộ ít hơn T
j
như điểm hạt
giống đại diện và kết nối các điểm hạt giống dại diện dựa trên các kết nối thứ tư và
có được các vùng hạt giống đại diện.
Bƣớc 3. Nếu kích thước của vùng hạt giống đại diện lớn hơn kích thước tối
thiểu được liệt kê ở bước 1 trong quy mô tương ứng, thì nó được xác định như một
hạt giống.
1.3.3.2. Phát triển hạt
Phát triển hạt không giống như phát triển vùng được mô tả trước đây. Phát
triển hạt được trình bày để đẩy nhanh thời gian tính toán. Thủ tục được hiển thị như
dưới đây.
Thuật toán Phát triển hạt
Bƣớc 1. Loại bỏ "lỗ hổng" trong các hạt giống.
Bƣớc 2. Tính trung bình các giá trị J cục bộ ở phần của vùng chưa được phân
vùng ảnh còn lại và kết nối các điểm ảnh dưới mức trung bình để tạo các vùng. Nếu một
vùng là liền kề với một và chỉ một hạt giống, ta sát nhập vùng này thành hạt giống.
Bƣớc 3. Tính toán giá trị J cục bộ của các điểm ảnh chưa được phân vùng
còn lại ở quy mô nhỏ hơn và lặp lại Bước 2 (Chuyển động này là để xác định vị trí
chính xác biên). Khi hoạt động đạt đến quy mô nhỏ nhất, tiếp tục sang Bước 4.
Bƣớc 4. Ở quy mô nhỏ nhất, các điểm ảnh còn lại được phát triển lần lượt.
Các điểm ảnh còn lại đều được sắp xếp bởi các giá trị J cục bộ. Các điểm ảnh được
gán để gieo hạt lân cận của nó để từ giá trị J cục bộ nhỏ nhất tới giá trị lớn nhất.
14
1.3.3.3. Sát nhập vùng
Các phân vùng từ phát triển hạt có vấn đề phân vùng quá mức (over-
segment). Sát nhập vùng là để giải quyết vấn đề này. Các vùng được sát nhập dựa
trên sự tương đồng về màu của chúng. Các thông tin màu của vùng được đặc trưng
bởi biểu đồ màu và nhóm giá trị theo biểu đồ màu. Sau đó, ta tính toán khoảng cách
thuật toán Oclit giữa hai biểu đồ màu i và j.
D
h
i,
j
P
i
P
j
|| (2)
Trong đó P biểu thị các vector biểu đồ màu. Đầu tiên ta xây dựng một bảng
khoảng cách có chứa khoảng cách giữa các biểu đồ màu của hai vùng lân cận. Các
cặp vùng với khoảng cách tối thiểu được sát nhập với nhau. Sau đó, vector có tính
năng màu mới của vùng mới được tính toán và khoảng cách bảng được cập nhật
cùng với các mối quan hệ lân cận. Quá trình sát nhập vùng tiếp tục cho đến khi đạt
được một ngưỡng tối đa.
JSEG cũng có thể được áp dụng trong các ảnh mức xám mà các giá trị cường
độ được định lượng giống như các màu. Hai trường hợp được hiển thị trong hình
1.6. Kết quả là lý do không tốt về ảnh màu bởi vì cường độ riêng biệt không phân
biệt bằng màu.
Hình 1.6: Phân vùng ảnh của ảnh mức xám sử dụng JSEG
1.3.4. Thuật toán quét nhanh
Không giống như phát triển hạt, thuật toán quét nhanh không cần điểm hạt.
Khái niệm của thuật toán quét nhanh [9] là để quét từ góc trên bên trái đến góc dưới
bên phải của toàn bộ ảnh và xác định xem chúng có thể sát nhập các điểm ảnh vào
một phân nhóm có sẵn hay không. Các tiêu chí sát nhập được dựa trên ngưỡng giao
của chúng. Nếu sự khác biệt giữa các giá trị điểm ảnh và giá trị điểm ảnh trung bình
của các cụm lân cận nhỏ hơn ngưỡng, thì các điểm ảnh này có thể được sát nhập
15
thành cụm. Ngưỡng thông thường chọn 45. Ta mô tả các bước của thuật toán quét
nhanh như dưới đây.
Thuật toán quét nhanh
Bƣớc 1. Đặt các điểm ảnh trên bên trái là cụm đầu tiên. Thiết lập các điểm
ảnh (1, 1) trong ảnh như là một cụm C
i
và điểm ảnh mà chúng đang quét là C
j
. Giả
định rằng ngưỡng ở đây là 45
Bƣớc 2.
Trong dòng đầu tiên, ta quét điểm ảnh tiếp theo (1, 1 +1) và xác
định nếu nó có thể được sát nhập vào cụm đầu tiên hoặc trở thành một cụm mới
theo ngưỡng. Sau đây là kết luận, trong đó mean đại diện cho các giá trị điểm ảnh
trung bình của cụm C
i
.
Nếu |
C
j
mean
C
i
|
ngưỡng thì sát nhập C
j
thành C
i
và tính toán lại mean của
C
i
.
Nếu |
C
j
mean
C
i
|
ngưỡng thì chỉnh C
j
vào 1 cụm mới C
i+1.
Bƣớc 3. Lặp lại Bước 2 cho đến khi tất cả các điểm ảnh trong dòng đầu tiên
đều được quét.
Bƣớc 4.
Để quét các điểm ảnh (x+1, 1) ở dòng tiếp theo và so sánh điểm ảnh
này vớicụm C
u
trong xu hướng tăng của nó. Và xác định nếuta có thể sát nhập các
điểm ảnh (x+1, 1) vào cụm C
u
. (trong dòng thứ 2, x bằng 1 và nó cứ tăng lên)
Nếu |
C
j
mean
C
u
|
ngưỡng thì sát nhập C
j
thành C
u
và tính toán lại
mean của C
u
.
Nếu |
C
j
mean
C
u
|
ngưỡng thì chỉnh C
j
vào cụm mới C
n
.
Trong đó n là số cụm hiện có.
Bƣớc 5.
Quét điểm ảnh tiếp theo (x+1, 1 +1) và so sánh điểm ảnh này với
cụm C
u
và C
i
, trong xu hướng tăng của nó và ở phía bên trái của nó, một cách tương
ứng. Và quyết định nếu ta có thể sát nhập các điểm ảnh (x+1, 1 +1) vào bất cứ cụm
nào trong hai cụm.
Nếu |
C
j
mean
C
u
|
ngưỡng và
|
C
j
mean
C
l
|
ngưỡng.
(1) Ta sát nhập C
j
thành C
u
hoặc C
j
thành C
l
.
(2) Sát nhập cụm C
u
và C
l
thành cụm C
n
.
16
(3) Tính toán lại mean của C
n
.
Nếu |
C
j
mean
C
u
|
ngưỡng và
|
C
j
mean
C
l
|
ngưỡng.
Ta sát nhập C
j
thành C
u
và tính toán lại mean của C
u
.
Nếu |
C
j
mean
C
u
|
ngưỡng và
|
C
j
mean
C
l
|
ngưỡng.
Sát nhập C
j
thành C
L
và tính toán lại mean của C
L
.
Các trường hợp khác, thiết lập C
j
thành 1 cụm mới C
n
.
Bƣớc 6. Lặp lại bước 4 đến 5 cho đến khi tất cả các điểm ảnh trong ảnh đều
được quét.
Bƣớc 7. Loại bỏ các cụm nhỏ. Nếu số C
m
< , ta loại bỏ cụm m và gán các
điểm ảnh trong cụm m thành các cụm liền kề. Việc chuyển nhượng theo sự khác
biệt nhỏ nhất giữa các điểm ảnh và giá trị trung bình của các cụm liền kề.
Nhận xét thuật toán quét nhanh:
Ƣu điểm:
a. Các điểm ảnh của mỗi cụm được kết nối và có giá trị điểm ảnh tương đồng, tức là
nó có kết nối hình dạng tốt.
b. Thời gian tính toán nhanh hơn so với cả hai thuật toán phát triển vùng và thuật
toán phân chia và sát nhập vùng.
c. Kết quả phân vùng chính xác phù hợp với hình dạng của các đối tượng thực tế,
tức là nó có phù hợp với hình dạng tốt.
1.4. Kết luận chƣơng 1
Trong chương này, Ta tìm hiểu một số phương pháp phân vùng ảnh dựa vào
phát triển vùng.
Đối với các ứng dụng khác nhau, có những phương pháp phân vùng phù hợp
có thể được áp dụng. Nếu yêu cầu rằng các điểm ảnh của mỗi cụm phải được liên
kết, thì trong các thuật toán phân vùng ảnh dựa trên vùng, JSEG và thuật toán quét
nhanh, hay được dùng, bởi vì các thực hiện của chúng tốt hơn. Nếu yêu cầu là để
phân loại toàn bộ điểm ảnh nhưng không xem xét các kết nối của nhóm sau khi
nhóm dữ liệu, thì lựa chọn tốt nhất là các thuật toán k-means. Kết quả phân lớp
17
thuật toán thay đổi giá trị trung bình là tốt, nhưng chi phí mất nhiều thời gian tính
toán. Phương pháp phân vùng dựa trên cạnh, đặc biệt là đập nước, có vấn đề phân
vùng, do đó thường kết hợp các công cụ đánh dấu và đường nước chảy để khắc
phục vấn đề phân vùng.
18
Chƣơng 2
THUẬT TOÁN PHÂN VÙNG ẢNH SÁT NHẬP CÁC MIỀN ĐỘNG
2.1. Phân vùng ảnh bằng cách sát nhập các miền động
Phân vùng ảnh là một vấn đề cơ bản nhưng vẫn còn đầy thách thức bằng
cách hiển thị của máy tính và xử lý ảnh. Đặc biệt, nó là một quá trình cần thiết cho
nhiều ứng dụng như nhận dạng đối tượng, theo dõi mục tiêu, truy xuất ảnh dựa trên
nội dung và xử lý ảnh y tế, vv Nói chung, mục tiêu của phân vùng ảnh để phân
vùng một ảnh vào một số lượng nhất định các phần có các thuộc tính rõ ràng (màu,
kết cấu, vv) và trong khi đó để nhóm các phần có gần ý nghĩa với nhau cho dễ dàng
nhận biết. Trong nhiều ứng dụng thực tế, một số lượng lớn các ảnh cần thiết được
xử lý, tương tác con người có liên quan trong quá trình phân vùng nên càng ít càng
tốt. Điều này làm cho kỹ thuật phân vùng ảnh động hấp dẫn hơn. Hơn nữa, sự thành
công của các kỹ thuật phân vùng cao cấp (ví dụ như phân vùng đối tượng dựa trên
lớp) cũng đòi hỏi kỹ thuật phân vùng tự động tinh vi.
Trong nhiều thập kỷ trở lại đây, có một số lượng lớn các tài liệu về phân
vùng ảnh tự động. Ví dụ, các thuật toán phát hiện cạnh dựa vào những thay đổi đột
ngột về cường độ, ảnh hoặc màu, do đó cạnh nổi bật có thể được phát hiện. Tuy
nhiên, do các cạnh kết quả thường không liên tục hoặc ngoài khả năng phát hiện,
chúng chỉ có thể cung cấp những yếu tố thay thế hoặc các đường giới hạn. Một
thuật toán cổ điển khác là phân vùng dựa trên những điểm tương đồng giữa các
điểm ảnh trong một miền, tên của miền phụ thuộc vào thuật toán đã sử dụng.
Với cụm các điểm ảnh được tập hợp trong một nhóm miền hoặc đối tượng,
tính đồng nhất của miền được sử dụng như một tiêu chí phân vùng quan trọng.
Nhiều tiêu chí được cắt đi vẫn còn được nghiên cứu với mục tiêu này. Hầu hết các
tiêu chí cắt được sử dụng gồm có cắt thường, cắt theo tỷ lệ và cắt nhỏ, vv…. Mục
đích của các thuật toán này là để tạo ra một phân vùng mong muốn bằng cách đạt
được tối ưu hóa hoàn toàn cho một số chức năng có giá trị. Tuy nhiên, các chức
năng này chỉ cung cấp một đặc tính của mỗi lần cắt chứ không phải là toàn bộ miền
[5, 6, 7].