Tải bản đầy đủ (.pdf) (27 trang)

Tóm tắt Luận án tiến sĩ Khoa học Máy tính: Tìm kiếm ảnh dựa trên đồ thị chữ ký nhị phân

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (16.16 MB, 27 trang )

ĐẠI HỌC HUẾ
TRƯỜNG ĐẠI HỌC KHOA HỌC

VĂN THẾ THÀNH

TÌM KIẾM ẢNH
DỰA TRÊN ĐỒ THỊ CHỮ KÝ NHỊ PHÂN

CHUYÊN NGÀNH: KHOA HỌC MÁY TÍNH
MÃ SỐ: 62.48.01.01

LUẬN ÁN TIẾN SĨ KHOA HỌC MÁY TÍNH

Người hướng dẫn khoa học:
PGS.TS Lê Mạnh Thạnh

HUẾ - NĂM 2017


Công trình được hoàn thành tại: Trường Đại học Khoa học, Đại học Huế
Người hướng dẫn khoa học: PGS. TS Lê Mạnh Thạnh
Phản biện 1:. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
..............................................................................
..............................................................................
..............................................................................
Phản biện 2:. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
..............................................................................
..............................................................................
..............................................................................
Phản biện 3:. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
..............................................................................


..............................................................................
..............................................................................
Luận án sẽ được bảo vệ tại Hội đồng chấm luận án cấp Đại học Huế họp tại:
..............................................................................
..............................................................................
..............................................................................
Vào hồi. . . . . . giờ. . . . . . ngày. . . . . . tháng. . . . . . năm. . . . . . . . .
Có thể tìm hiểu luận án tại thư viện:
..............................................................................
..............................................................................
..............................................................................


Tìm kiếm ảnh dựa trên đồ thị chữ ký nhị phân

MỞ ĐẦU
1. Lý do chọn đề tài
Ngày nay, dữ liệu đa phương tiện được lưu trữ và ứng dụng rộng rãi trong
nhiều hệ thống như: hệ thống thư viện số, hệ thống thông tin địa lý, hệ thống
điều tra hình sự, v.v. Dữ liệu đa phương tiện, đặc biệt là ảnh số đã trở nên
thân thuộc và được sử dụng trên nhiều thiết bị khác nhau như camera, mobile,
smartphone, v.v. Lyman và cộng sự đã ước tính dung lượng thông tin trên toàn
cầu có hơn 4 exabyte vào năm 2000. Hilbert và López ước tính dung lượng thông
tin toàn cầu vào năm 2007 khoảng 1,15 zettabyte. Bohn và Short ước tính dung
lượng thông tin toàn cầu năm 2008 khoảng 3,6 zettabyte và kích thước gia tăng
trong năm 2011 khoảng 1.800 exabyte, gấp 700 lần so với dung lượng gia tăng
năm 2002. Theo (IDC, 2016 ), dữ liệu gia tăng trên toàn cầu trong năm 2012
khoảng 2.800 exabyte, ước tính dung lượng gia tăng năm 2020 là 40 zettabyte.
Năm 2015, thế giới đã chia sẻ hơn 1,6 nghìn tỷ hình ảnh, trong đó 70% hình ảnh
được tạo ra từ thiết bị mobile (C. Chute, 2015 ).

Trong vấn đề truy vấn dữ liệu, đặc biệt là dữ liệu ảnh, tìm kiếm hình ảnh
tương tự là một bài toán quan trọng (T. Acharya, 2005 ; L. Deligiannidis, 2015 ).
Với mong muốn đóng góp một phương pháp tìm kiếm ảnh hiệu quả, luận án thực
hiện đề tài: "Tìm kiếm ảnh dựa trên đồ thị chữ ký nhị phân".
2. Mục tiêu của luận án
Mục tiêu của luận án là xây dựng phương pháp tìm kiếm ảnh hiệu quả, nghĩa
là tăng tốc độ tìm kiếm và đảm bảo độ chính xác cao.
3. Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu: (1) Phương pháp tạo chữ ký nhị phân; (2) Độ đo
tương tự giữa các chữ ký nhị phân; (3) Cấu trúc dữ liệu lưu trữ chữ ký nhị phân;
(4) Thuật toán tạo cấu trúc dữ liệu và tìm kiếm ảnh.
Phạm vi nghiên cứu: Tìm kiếm ảnh theo nội dung bằng cách sử dụng đồ
thị chữ ký nhị phân.
4. Phương pháp nghiên cứu
Phương pháp lý thuyết: Tổng hợp một số công bố liên quan và đánh giá
ưu khuyết điểm. Trên cơ sở đó, luận án phát triển phương pháp tạo chữ ký nhị
phân, xây dựng cấu trúc dữ liệu và thuật toán tìm kiếm ảnh.
Phương pháp thực nghiệm: Thực hiện việc cài đặt các thuật toán của
1


Tìm kiếm ảnh dựa trên đồ thị chữ ký nhị phân
luận án nhằm minh chứng tính hiệu quả về độ chính xác và tốc độ tìm kiếm.
Các tập dữ liệu ảnh được sử dụng cho cài đặt thực nghiệm bao gồm: COREL,
CBIRimages, WANG, ImageCLEF, MSRDI, ImgColl01, ImgColl02. Trên cơ sở
số liệu thực nghiệm (chi tiết tại />luận án thực hiện phân tích, đánh giá và so sánh với các công trình khác.
5. Ý nghĩa khoa học và thực tiễn
Ý nghĩa khoa học của luận án là xây dựng phương pháp tìm kiếm ảnh
tương tự theo nội dung, đồng thời đề xuất cấu trúc dữ liệu và thuật toán để
tăng tốc độ tìm kiếm trên tập dữ liệu ảnh lớn.

Đóng góp của luận án: (1) Đề xuất một số cải tiến cho cây S-Tree và
thiết kế cấu trúc cây Sig-Tree; (2) Xây dựng cấu trúc đồ thị chữ ký S-k Graph;
(3) Xây dựng cấu trúc mạng Sig-SOM; (4) Đề xuất các thuật toán cho phương
pháp tìm kiếm ảnh theo nội dung.
Ý nghĩa thực tiễn: kết quả nghiên cứu có thể áp dụng để xây dựng một
phương pháp tìm kiếm ảnh hiệu quả đáp ứng yêu cầu người dùng. Kết quả luận
án có thể tạo ra công cụ tìm kiếm nhằm phục vụ cộng đồng trong các hệ thống
đa phương tiện như: thư viện số, tìm kiếm ảnh y khoa, hệ thống GIS, v.v.
6. Bố cục của luận án
Ngoài phần mở đầu, phần kết luận và hướng phát triển, danh mục các công
trình khoa học của tác giả liên quan đến luận án, tài liệu tham khảo, luận án
chia thành 3 chương. Chương 1 trình bày tổng quan về tìm kiếm ảnh dựa trên
chữ ký nhị phân. Chương 2 đưa ra một số cải tiến cho tìm kiếm ảnh dựa trên
cây S-Tree. Chương 3 đề xuất phương pháp tìm kiếm ảnh trên đồ thị chữ ký.

Chương 1. TỔNG QUAN VỀ TÌM KIẾM ẢNH THEO
NỘI DUNG DỰA TRÊN CHỮ KÝ NHỊ PHÂN
1.1. Mở đầu
Luận án tiếp cận phương pháp tìm kiếm ảnh dựa trên chữ ký nhị phân gồm hai
giai đoạn: (1) Tiền xử lý nhằm lưu trữ tập các chữ ký nhị phân trên cấu trúc dữ liệu;
(2) Tìm kiếm ảnh nhằm đưa ra tập ảnh tương tự với ảnh tra cứu ban đầu.

1.2. Các công trình nghiên cứu liên quan
Tìm kiếm ảnh theo nội dung được giới thiệu vào thập niên 1980 (A. Alzu’bi, 2015 ;
Y. Liu, 2007 ). Từ năm 1986, chữ ký nhị phân đã ứng dụng cho bài toán tìm kiếm
2


Tìm kiếm ảnh dựa trên đồ thị chữ ký nhị phân
dữ liệu (W.W. Chang, 1989 ; U. Deppisch, 1986). Từ năm 1990 đến 2015, nhiều công

trình ứng dụng cây S-Tree và chữ ký nhị phân cho bài toán tìm kiếm ảnh (F. Rabitti,
1990 ; V. Chitkara, 2000 ; J. Landre, 2007; J. Cai, 2014; L. Liu, 2015;...). Từ đó cho
thấy phương pháp tìm kiếm ảnh dựa trên chữ ký nhị phân rất khả thi và hiệu quả.
Tuy nhiên, các công trình này chưa phát triển cấu trúc dữ liệu cho chữ ký nhị phân,
chưa áp dụng các kỹ thuật khai thác dữ liệu lên các chữ ký nhị phân, v.v.

1.3. Định hướng nghiên cứu
Luận án phát triển cấu trúc dữ liệu lưu trữ chữ ký nhị phân và đề xuất các thuật
toán cho bài toán tìm kiếm ảnh, bao gồm: (1) Tạo chữ ký nhị phân và tính độ tương
tự giữa hai hình ảnh; (2) Cải tiến cấu trúc cây S-Tree; (3) Xây dựng đồ thị chữ ký nhị
phân; (4) Xây dựng phương pháp tìm kiếm ảnh.

1.4. Các đối tượng cơ sở
Luận án tiếp cận các đối tượng cơ sở cho tìm kiếm ảnh dựa trên chữ ký nhị phân,
bao gồm: dải màu, lược đồ màu, điểm đặc trưng, đối tượng đặc trưng, chữ ký nhị
phân, các giá trị đánh giá hiệu suất, môi trường thực nghiệm và tập các dữ liệu ảnh.

1.5. Tổng kết chương
Chương 1 đã tiếp cận các công trình liên quan và các đối tượng cơ sở cho hệ truy
vấn ảnh theo nội dung dựa trên chữ ký nhị phân. Nhiều công trình chứng minh tính
hiệu quả của phương pháp này về tốc độ tìm kiếm, hiệu suất tìm kiếm. Từ đó cho
thấy chữ ký nhị phân là một giải pháp khả thi cho bài toán tìm kiếm ảnh tương tự.

Chương 2. CẢI TIẾN PHƯƠNG PHÁP TÌM KIẾM ẢNH
DỰA TRÊN CÂY S-Tree
2.1. Giới thiệu
Chương này thiết kế cấu trúc và các thao tác cho cây Sig-Tree để cải tiến cây
S-Tree. Phần thực nghiệm và đánh giá kết quả được trình bày ở cuối chương.

2.2. Tạo chữ ký nhị phân của hình ảnh

Mỗi ảnh I được lượng tử hóa thành n màu c1 , c2 , ..., cn ; mỗi màu cj được mô tả
bằng một dãy bit bj1 bj2 ...bjm . Danh sách màu của ảnh I được mô tả như sau:
S = b11 b12 ...b1m b21 b22 ...b2m ...bn1 bn2 ...bnm

(2.1)

trong đó, bji = 1 nếu i = hi × m , ngược lại bji = 0, với hi là thành phần thứ i của
véc-tơ chuẩn hóa lược đồ màu H = (h1 , h2 , ..., hn ) (hi ∈ [0, 1]).
3


Tìm kiếm ảnh dựa trên đồ thị chữ ký nhị phân
Đặt B j = bj1 bj2 ...bjm , chữ ký nhị phân của ảnh I là:
SIG = B 1 B 2 ...B n

(2.5)

Chữ ký nhị phân mô tả N vùng đặc trưng cục bộ oiI của ảnh I là:
Sig(I) =

N
i=1

Sig(oiI )

(2.6)

2.3. Độ đo EMD
Độ tương tự EMD giữa ảnh I và J là: (A. Alzu’bi, 2015 ; H. zouaki, 2011 )
EM D(I, J) =


n
i=1

n
j=1

dij fij

với (fij ) là ma trận phân phối luồng màu sắc từ

n
i=1
màu ciI

n
j=1

fij

đến màu

khoảng cách Euclide trong không gian màu RGB từ màu

ciI

(2.11)
cjJ ;

(dij ) là ma trận


đến màu cjJ .

2.4. Độ đo Hamming
Độ sai biệt di tại cặp phần tử thứ i của hai chữ ký nhị phân Sig(I) và Sig(J) là:
di =

1 if (Sig(I)i = Sig(J)i )
0 if (Sig(I)i = Sig(J)i )

(2.12)

Dựa trên độ đo Hamming (J. Landre, 2007 ), độ tương tự giữa ảnh I và J là:
φ=

1
n

n

di

(2.13)

i=1

2.5. Cây S-Tree
Cây S-Tree (M.A. Nascimento, 2002 ) là cây nhiều nhánh cân bằng theo chiều cao.
Mỗi nút trong cây S-Tree gồm nhiều chữ ký liên kết đến các nút con. Mỗi phần tử của
nút lá gồm chữ ký và định danh của đối tượng.


2.6. Cây Sig-Tree
2.6.1. Giới thiệu cây Sig -Tree
Mỗi nút trong cây Sig-Tree gồm hai thành phần để liên kết đến nút cha và liên kết
đến các nút con. Phần này thiết kế cấu trúc và các thao tác trên cây Sig-Tree gồm:
chèn nút, loại bỏ nút, tách nút và tìm kiếm trên cây.

2.6.2. Thiết kế cấu trúc dữ liệu cây Sig -Tree
Mỗi nút trong cây Sig-Tree có hai phần: (1) Phần liên kết đến nút cha gồm chữ
ký tổ hợp và phần liên kết về nút cha: signature, parent ; (2) Phần nội dung là tập
các chữ ký và liên kết đến nút con: {SIGi = signaturei , nexti |i = 1, ..., k}. Mỗi nút
lá cũng gồm hai phần: phần liên kết nút cha signature, parent và phần nội dung
{SIGi = signaturei , oidi |i = 1, ..., k} là tập chữ ký nhị phân và định danh.

4


Tìm kiếm ảnh dựa trên đồ thị chữ ký nhị phân

2.6.3. Phép tổ hợp các chữ ký trên cây Sig -Tree
Trong cây Sig-Tree, mỗi chữ ký của nút cha là tổ hợp các chữ ký của nút con. Nếu
các thành phần của nút con thay đổi thì phải tổ hợp lại các chữ ký của nút cha và
thực hiện cho đến nút gốc. Thuật toán tổ hợp chữ ký được đề xuất như sau:
Thuật toán 2.5. Tổ hợp chữ ký
Input: Nút v cần tổ hợp.
Output: Cây Sig-Tree sau khi tổ hợp.
Function UnionSignature(v)
Begin
if v → parent = null then
Signature = ∨(SIGi → sig), SIGi ∈ v;

v → parent → (SIGi → sig) = Signature; U nionSignature(v → parent);
end if
Return Sig-Tree;

End. =0

Mệnh đề 2.3. Độ phức tạp của Thuật toán 2.5 là O(k log n), với n là số chữ ký
trên cây, k là chiều dài chữ ký.

2.6.4. Phép tách một nút trên cây Sig -Tree
Kết quả của phép tách nút là hai cụm chữ ký rời nhau tương ứng với hai nút trong
cây Sig-Tree. Việc tách nút làm cho cây Sig-Tree tăng trưởng theo hướng gốc. Thuật
toán tách nút được đề xuất như sau:
Thuật toán 2.6. Tách nút
Input: Tập các chữ ký S của nút cần tách, chữ ký α và β.
Output: Hai nút đã được tách gồm NodeA và NodeB.
Function SplitNode(S, α, β)
Begin
NodeA = {α}; NodeB = {β;}
for si ∈ S do
Tính độ đo d(α, si ) và d(β, si );
if d(α, si ) < d(β, si ) then
else

Chèn si vào NodeA

Chèn chữ ký si vào NodeB ;

end if
end for

Return {NodeA, NodeB };
End. =0

5


Tìm kiếm ảnh dựa trên đồ thị chữ ký nhị phân
Thuật toán 2.7. Tách nút trong cây Sig -Tree
Input: Nút cần tách v.
Output: Cây Sig-Tree sau khi được tách.
Function SplitTree(v)
Begin
Tạo tập chữ ký S của nút v; Trích xuất hai chữ ký α, β của nút v;
{NodeA, NodeB } = SplitNode(S, α, β);
Tạo hai chữ ký tổ hợp SigA, SigB của NodeA, NodeB ;
Gán vparent là nút cha của nút v;
if (v → parent == null ) then

Root = {SigA, SigB}

else Bổ sung chữ ký SigA, SigB vào nút vparent ; UnionSignature(v → parent);
if (vparent đầy)

SplitTree(v → parent); end if

end if
Return Sig-Tree;

End. =0


Mệnh đề 2.4. Độ phức tạp của Thuật toán 2.6 là O(M ), với M là số chữ ký.
Mệnh đề 2.5. Độ phức tạp của Thuật toán 2.7 là O(k(log n)2 + M log n), với
M, n, k lần lượt là số chữ ký tối đa của nút, số chữ ký trên cây, chiều dài chữ ký.

2.6.5. Phép loại bỏ chữ ký trên cây Sig -Tree
Việc loại bỏ một nút trong cây dẫn đến phải loại bỏ một phần tử tương ứng của
nút cha. Nếu nút cha sau khi loại bỏ có số phần tử ít hơn số lượng tối thiểu thì phải
loại bỏ luôn nút cha và thu gom các chữ ký tại nút lá theo nút cha này và thực hiện
thao tác chèn trở lại. Một giải pháp đề xuất là thực hiện gán định danh đối tượng
oid = null nếu như một nút lá sau khi loại bỏ có số lượng phần tử nhỏ hơn số lượng
tối thiểu. Khi thực hiện thao tác chèn chữ ký tại một nút lá, nếu số lượng phần tử có
oid = null nhiều hơn số lượng tối thiểu thì thực hiện loại bỏ các phần tử có oid = null.
Thuật toán 2.8. Loại bỏ chữ ký
Input: Chữ ký Sig và nút lá v, số chữ ký tối thiểu m.
Output: Cây Sig-Tree sau khi loại bỏ chữ ký.
Function DeleteNode(Sig, v, m)
Begin
Khởi tạo SIG = v.SIG sao cho v.SIG = Sig;
if (v.count > m) then

Loại bỏ phần tử SIG; UnionSignature(v)

else v.SIG → oid = null;
end if
Return Sig-Tree;

End. =0

6



Tìm kiếm ảnh dựa trên đồ thị chữ ký nhị phân
Mệnh đề 2.6. Độ phức tạp của Thuật toán 2.8 là O(k log n), với n là số chữ ký
trên cây, k là chiều dài chữ ký.

2.6.6. Phép chèn chữ ký trên cây Sig -Tree
Mỗi lần chèn chữ ký vào nút lá thực hiện đếm số phần tử khác trống, nếu vượt
qua số lượng tối thiểu thì loại bỏ các phần tử trống này. Nếu nút lá bị đầy thì tách
nút theo Thuật toán 2.7. Thuật toán chèn chữ ký được đề xuất như sau:
Thuật toán 2.9. Chèn chữ ký
Input: Chữ ký Sig và nút v.
Output: Cây Sig-Tree sau khi chèn nút.
Function InsertNode(Sig, v)
Begin
if (v là nút lá) then
Chèn chữ ký Sig vào nút v;
if (số lượng phần tử nút v > m) then Loại bỏ các nút trống; end if
UnionSignature(v);
if (nút v đầy) then SplitTree(v); end if
else
Chọn SIG ∈ v : độ đo d(SIG.Sig, Sig) nhỏ nhất;
v = SIG → next; InsertNode(v);
end if
Return Sig-Tree;

End. =0

Mệnh đề 2.7. Độ phức tạp của Thuật toán 2.9 là O(k(log n)2 + M log n), với
M, n, k lần lượt là số chữ ký tối đa của nút, số chữ ký trên cây, chiều dài chữ ký.


2.6.7. Tìm kiếm trên cây Sig -Tree
Luận án mô tả việc tìm kiếm dựa trên cấu trúc STACK trên cây Sig-Tree như sau:
Thuật toán 2.10. Tìm kiếm ảnh trên cây Sig -Tree
Input: Chữ ký tìm kiếm Sig và cây Sig-Tree.
Output: Tập SigOid = { sigi , oidi |i = 1, . . . , p}.
Function STreeRetrieval(Sig, Sig-Tree)
Begin
Khởi tạo:
v = Root;
SigOid = ∅ ; STACK = ∅;
while (not Empty(STACK )) do

7


Tìm kiếm ảnh dựa trên đồ thị chữ ký nhị phân
v = Pop(STACK );
if (v không phải nút lá) then
Chọn SIG0 ∈ v: d(SIG0 → sig, Sig) nhỏ nhất;
Push(STACK, Sig0 → next)
else SigOid = SigOid ∪ { v → sigi , v → oidi |i = 1, . . . , |v|};
end if
end while
Return SigOid;

End. =0

Mệnh đề 2.8. Độ phức tạp của Thuật toán 2.10 là O(M log n), với M là số chữ
ký tối đa của nút trên cây, n là số chữ ký trên cây.


2.7. Thực nghiệm tìm kiếm ảnh dựa trên cây Sig -Tree
Số liệu Bảng 2.2 cho thấy thời gian tìm kiếm trung bình trên tập dữ liệu ảnh
COREL là 26,813 milli giây, trên tập ảnh dữ liệu WANG là 692,947 milli giây và trên
tập dữ liệu ảnh ImgColl01 là 2423,780 milli giây.

Hình 2.14. Hiệu suất tìm kiếm trên cây Sig-Tree của tập ảnh COREL

Hình 2.15. Hiệu suất tìm kiếm trên cây Sig-Tree của tập ảnh WANG

8


Tìm kiếm ảnh dựa trên đồ thị chữ ký nhị phân

Hình 2.16. Hiệu suất tìm kiếm trên cây Sig-Tree của tập ảnh ImgColl01
Bảng 2.2. Đánh giá hiệu suất giữa các phương pháp trên các tập dữ liệu ảnh

Bảng 2.3. So sánh hiệu suất tìm kiếm giữa các phương pháp

Kết quả thực nghiệm được so sánh với các phương pháp khác đã công bố trên tập
dữ liệu ảnh COREL. Số liệu so sánh từ Bảng 2.3 cho thấy phương pháp tìm kiếm
ảnh theo nội dung dựa trên chữ ký nhị phân và cây Sig-Tree có thời gian tìm kiếm
nhanh hơn và độ chính xác không kém hơn các phương pháp khác.

2.8. Tổng kết chương
Chương 2 đã tiếp cận phương pháp tìm kiếm ảnh dựa trên chữ ký nhị phân và
cây Sig-Tree. Kết quả thực nghiệm cho thấy phương pháp đề xuất là giải pháp hiệu
quả để tìm kiếm ảnh theo nội dung. Tuy nhiên, quá trình truy tìm cụm phụ thuộc vào
các mức trên cây và phép tách ghép có thể ảnh hưởng trên toàn bộ cây Sig-Tree. Vì
vậy, luận án thực hiện cải tiến phương pháp bằng cách phân cụm dựa trên cấu trúc

đồ thị nhằm tăng độ chính xác tìm kiếm ảnh.

9


Tìm kiếm ảnh dựa trên đồ thị chữ ký nhị phân

Chương 3. ĐỀ XUẤT PHƯƠNG PHÁP TÌM KIẾM ẢNH
DỰA TRÊN ĐỒ THỊ CHỮ KÝ
3.1. Giới thiệu
Chương này xây dựng cấu trúc đồ thị S-k Graph và mạng Sig-SOM trên cơ sở gom
cụm chữ ký nhị phân. Từ đó, luận án trình bày các thuật toán và thực nghiệm cho
phương pháp tìm kiếm ảnh dựa trên chữ ký nhị phân.

3.2. Chữ ký nhị phân của hình ảnh
Định nghĩa 3.1. Chữ ký nhị phân của đối tượng đặc trưng O trên ảnh I là một chuỗi
O
O
O
bit SigIO = bO
1 b2 ...bN , sao cho bi = 1 nếu khối thứ i của ảnh I và vùng đặc trưng O có

diện tích giao nhau lớn hơn ngưỡng θ cho trước, bO
i = 0 nếu ngược lại; với N = n × k
là số lượng các khối ảnh.
O
O
C
C C
C

Định nghĩa 3.2. Gọi SigIO = bO
1 b2 ...bN và SigI = b1 b2 ...bM lần lượt là chữ ký nhị

phân đối tượng và chữ ký nhị phân màu sắc. Khi đó, chữ ký nhị phân của hình ảnh I
được định nghĩa là:
O
O C C
C
Sig(I) = SigIO ⊕ SigIO = bO
1 b2 ...bN b1 b2 ...bM

(3.1)

Chữ ký nhị phân của hình ảnh gồm: (1) dãy N -bit mô tả chữ ký nhị phân đối
tượng; (2) dãy M -bit mô tả chữ ký nhị phân màu sắc (đã trình bày ở Chương 2).

3.3. Độ đo tương tự
Định nghĩa 3.3. Gọi Sig(I) = SigIO ⊕ SigIC và Sig(J) = SigJO ⊕ SigJC lần lượt là chữ
ký nhị phân của hai hình ảnh I và J. Độ đo tương tự của đối tượng đặc trưng và màu
sắc là µO (sigIO , sigJO ) và µC (sigIC , sigJC ) được xác định như sau:
µO (sigIO , sigJO ) =
µC (sigIC , sigJC ) =

1
N
1
M

N


(sigIO [i]XORsigJO [i])

(3.2)

(sigIC [i]XORsigJC [i])

(3.3)

i=1
M
i=1

Mệnh đề 3.1. Độ tương tự µα trong Định nghĩa 3.3 (với α ∈ {O, C}) là một
khoảng cách trong không gian metric.
Định nghĩa 3.4. Cho hai hình ảnh I và J lần lượt có chữ ký nhị phân là Sig(I) =
SigIO ⊕ SigIC và Sig(J) = SigJO ⊕ SigJC . Độ đo tương tự giữa hai hình ảnh I và J được
định nghĩa:
φ(I, J) = α×(µO (sigIO , sigJO ))+β×(µC (sigIC , sigJC ))
với α, β ∈ (0, 1) là các hệ số điều chỉnh và α + β = 1.
10

(3.4)


Tìm kiếm ảnh dựa trên đồ thị chữ ký nhị phân
Mệnh đề 3.2. Độ đo tương tự φ(I, J) trong Định nghĩa 3.4 là một khoảng cách
trong không gian metric.

3.4. Tìm kiếm ảnh dựa trên gom cụm chữ ký nhị phân
3.4.1. Gom cụm chữ ký nhị phân

Mỗi phần tử gồm chữ ký nhị phân sig và định danh oid. Phần tử sig, oid được
phân bố vào một cụm nếu khoảng cách d đến tâm cụm này là ngắn nhất và nhỏ hơn
ngưỡng θ. Nếu khoảng cách d lớn hơn θ thì phần tử sig, oid tạo một tâm cụm mới.
Thuật toán 3.1. Gom cụm chữ ký nhị phân
Input: Ngưỡng tương tự θ và tập chữ ký hình ảnh Γ.
Output: Tập các cụm Ω.
Function SignatureClustering(θ, Γ)
Begin
Khởi tạo Ω = ∅;
for sig, oid ∈ Γ do
if (Ω = ∅) then
else

Khởi tạo cụm V0 với tâm sig, oid

Tìm Vk ∈ Γ : φ(sig, sigk ) = minφ(sig, sigi ), i = 1, . . . , m;

if (φ(sig, sigk ) < θ) then
else

end if

Vk = Vk ∪ { sig, oid }; Cập nhật lại tâm cụm;

Tạo mới cụm V có tâm sig, oid ; Bổ sung tập cụm Ω = Ω ∪ V ; end if

end for
Return Ω;

End. =0


Mệnh đề 3.3. Độ phức tạp của Thuật toán 3.1 là O(N 2 ), với N là số lượng phần
tử của tập chữ ký Γ.

3.4.2. Thuật toán tìm kiếm ảnh
Quá trình tìm kiếm ảnh được thực hiện bằng cách chọn ra cụm có tâm gần nhất
với hình ảnh tra cứu. Nếu khoảng cách này nhỏ hơn ngưỡng θ thì thực hiện trích xuất
các định danh oid trong tập cụm và sắp xếp theo độ đo tương tự. Thuật toán tìm
kiếm ảnh được đề xuất như sau:
Thuật toán 3.2. Tìm kiếm ảnh
Input: Chữ ký ảnh sig, tập cụm Ω và ngưỡng tìm kiếm θ.
Output: Tập các định danh ảnh tương tự Ψ.
Function ClusterRetrieval(sig, Ω, θ)
Begin
Khởi tạo Ψ = ∅; Tìm cụm Vk : φ(sig, sigk ) = minφ(sig, sigi ), i = 1, .., m;
11


Tìm kiếm ảnh dựa trên đồ thị chữ ký nhị phân
if (φ(sig, sigk ) < θ) then Chọn cụm Vk ∈ Ω để truy hồi hình ảnh tương tự; end if
Thực hiện tra cứu ảnh tương tự;
Return Ψ;

End. =0

Mệnh đề 3.4. Độ phức tạp của Thuật toán 3.2 là O(m), với m là số lượng cụm.

3.4.3. Thực nghiệm tìm kiếm ảnh dựa trên gom cụm

Hình 3.2. Mô hình tìm kiếm ảnh dựa trên gom cụm chữ ký nhị phân


Hình 3.9. Hiệu suất tìm kiếm dựa trên gom cụm tập ảnh CBIRimages

3.5. Xây dựng đồ thị S-k Graph
3.5.1. Cấu trúc đồ thị S-k Graph
Định nghĩa 3.5. Đồ thị chữ ký là đồ thị vô hướng SG = (V, E), trong đó, tập các
đỉnh V và tập các cạnh E được định nghĩa như sau:
V = {vI = sigI , oidI |I ∈

}

E = { vI , vJ |φ(I, J) ≤ θ, ∀I, J ∈
với I, J là hai hình ảnh trong tập ảnh

(3.6)
}

(3.7)

; φ(I, J) là độ đo tương tự; θ là giá trị ngưỡng.

Phần này xây dựng đồ thị S-k Graph với mỗi đỉnh là một cụm dựa trên độ đo φ.
Định nghĩa 3.6. Một cụm V có tâm I được định nghĩa:
V = {J|φ(I, J) ≤ kθ, J ∈
với kθ là bán kính cụm V ,

}

là tập dữ liệu ảnh, k ∈ N ∗ .
12


(3.8)


Tìm kiếm ảnh dựa trên đồ thị chữ ký nhị phân

Hình 3.10. Hiệu suất tìm kiếm dựa trên gom cụm tập ảnh COREL và WANG
Bảng 3.4. Hiệu suất tìm kiếm trung bình dựa trên gom cụm các tập ảnh

Bảng 3.5. So sánh độ chính xác tìm kiếm trên tập ảnh COREL

Cho trước tập Ω = {Vi |i = 1, ..., n} là tập các cụm rời nhau, đồ thị S-k Graph được
định nghĩa như sau:
Định nghĩa 3.7. Đồ thị S-kGraph=(VSG , ESG ) là một đồ thị vô hướng, trong đó tập
đỉnh VSG = Ω và tập cạnh ESG được xác định như sau:
ESG = { Vi , Vj |i = j; Vi , Vj ∈ VSG ; φ(Ii0 , Jj0 ) < kθ}

(3.9)

Gọi I0 là ảnh cần phân bố vào tập cụm rời nhau Ω. Gọi Im là tâm của cụm Vm sao
cho: (φ(I0 , Im ) − km θ) = min{(φ(I0 , Ii ) − ki θ), i = 1, ..., n}, với Ii là tâm của cụm Vi .
Quy tắc 3.1. Quy tắc phân bố hình ảnh:
(1) Nếu φ(I0 , Im ) ≤ km θ thì ảnh I0 được phân bố vào cụm Vm .
(2) Nếu φ(I0 , Im ) > km θ thì đặt k0 = [(φ(I0 , Im ) − km θ)/θ], khi đó:
(2.1) Nếu k0 > 0 thì tạo cụm V0 tâm I0 , bán kính k0 θ và Ω = Ω ∪ {V0 };
13


Tìm kiếm ảnh dựa trên đồ thị chữ ký nhị phân
(2.2) Ngược lại (k0 = 0), ảnh I0 phân bố vào cụm Vm và gán φ(I0 , Im ) = km θ.

Để tránh xung đột dữ liệu, các hình ảnh nếu được phân bố thì phải thuộc về một
cụm duy nhất. Các định lý sau đây chứng minh về sự phân bố duy nhất này.
Định lý 3.1. Cho đồ thị S-kGraph=(VSG , ESG ). Gọi Vi , Vj ∈ ESG và Ii0 , Jj0 lần lượt
là tâm của Vi , Vj . Khi đó ta có:
φ(Ii0 , Jj0 ) > (ki0 + kj0 )θ

(3.10)

với ∀I ∈ Vi , φ(Ii0 , I) ≤ ki0 θ và ∀J ∈ Vj , φ(Jj0 , J) ≤ kj0 θ.
Định lý 3.2. Mỗi ảnh I chỉ được phân bố vào một cụm duy nhất trong tập Ω =
{Vi |i = 1, ..., n}.
Định lý 3.3. Với mỗi ảnh I, giá trị φ(I, Im ) − km θ ≤ 0 chỉ xảy ra duy nhất tại Im .
Định lý 3.4. Cho tập Ω = {Vi |i = 1, ..., n} là tập các cụm, gọi I là một hình ảnh bất
kỳ. Khi đó tồn tại cụm Vi0 ∈ Ω sao cho I ∈ Vi0 .

3.5.2. Thuật toán tạo đồ thị S-k Graph
Đồ thị S-k Graph được xây dựng từ tập ảnh

và ngưỡng θ theo Quy tắc 3.1.

Thuật toán tạo đồ thị S-k Graph được đề xuất như sau:
Thuật toán 3.3. Tạo đồ thị S-k Graph
Input: Tập dữ liệu ảnh

và giá trị ngưỡng bán kính θ.

Output: Đồ thị S-k Graph=(VSG , ESG ).
Function CreateSkGraph( ,θ)
Begin VSG = ∅; ESG = ∅; kI = 1; n = 1;
for I(I ∈ ) do

if (VSG = ∅) then
I0n = I; r = kI θ; Khởi tạo cụm Vn = { I0n , r, φ = 0 }; VSG = VSG ∪ Vn
else
Tìm tâm I0n : (φ(I, I0m ) − km θ) = min{(φ(I, I0i ) − ki θ), i = 1, . . . , n};
if ((φ(I, I0m ) ≤ km θ)) then
Vm = Vm ∪ { I, km θ, φ(I, I0m ) };
else
kI = [(φ(I, I0m ) ≤ km θ)] ;
if (kI > 0) then
I0n+1 = I; r = kI θ; Khởi tạo cụm Vn+1 = I0n+1 , r, φ = 0 ;
VSG = VSG ∪ Vn+1 ; ESG = ESG ∪ { Vn+1 , Vi |φ(I0n+1 , I0i ) ≤ kθ, i = 1, . . . , n;
n = n + 1;
14


Tìm kiếm ảnh dựa trên đồ thị chữ ký nhị phân
else
φ(I, I0m ) = km θ; Vm = Vm ∪ { I, km θ, φ(I, I0m ) };
end if
end if
end if
end for Return S-k Graph;

End. =0

Mệnh đề 3.5. Độ phức tạp của Thuật toán 3.3 là O(N ), với N là số lượng phần
tử của tập chữ ký

.


3.5.3. Thuật toán tìm kiếm ảnh trên đồ thị S-k Graph
Thuật toán 3.4. Thuật toán tìm kiếm ảnh trên đồ thị S-k Graph
Input: Ảnh cần tìm kiếm IQ , đồ thị S-k Graph = (VSG , ESG ), giá trị ngưỡng kθ.
Output: Tập ảnh tương tự IM G.
Function SkGraphRetrieval(IQ , S-k Graph,kθ)
Begin
IM G = ∅; V = ∅;
φ(IQ , I0m ) = min{φ(IQ , I0i ), i = 1, ..., n}; V = V ∪ Vm , với Vm là cụm có tâm là I0m ;
for (Vi ∈ VSG ) do if (φ(I0m , I0i ) ≤ kθ) then
for (Vj ∈ V ) do IM G = IM G ∪

{Ikj , Ikj

V = V ∪ Vi ; end if

end for

∈ Vj , k = 1, ..., |Vj |}; end for

Return IM G;
End. =0
Mệnh đề 3.6. Độ phức tạp của Thuật toán 3.4 là O(n), với n là số lượng đỉnh
trong đồ thị S-kGraph.

3.5.4. Phép phân rã cụm trong đồ thị S-k Graph
Mục đích của việc phân rã cụm nhằm phân hoạch lại các cụm có bán kính quá lớn.
Định lý 3.5. Thuật toán tách cụm V thành các cụm con khác rỗng, rời nhau C =
{V1 , ..., VM }, nghĩa là V = V1 ∪ ... ∪ VM và Vi ∩ Vj = ∅, với i = j và i, j ∈ {1, ..., M }.
Mệnh đề 3.7. Độ phức tạp của Thuật toán 3.5 là O(m × n), với m, n là số lần
phân rã và số lượng phần tử trong cụm phân rã.


3.5.5. Thực nghiệm tìm kiếm ảnh trên đồ thị S-k Graph
Thực nghiệm tìm kiếm ảnh trên đồ thị S-k Graph gồm hai giai đoạn: Tạo đồ thị
S-k Graph từ tập dữ liệu ảnh và tìm kiếm tập ảnh tương tự với ảnh tra cứu ban đầu.
15


Tìm kiếm ảnh dựa trên đồ thị chữ ký nhị phân

Hình 3.14. Mô hình tìm kiếm ảnh dựa trên đồ thị S-k Graph

Hình 3.19. Hiệu suất tìm kiếm trên đồ thị S-k Graph của tập ảnh CBIRimages

Hình 3.20. Hiệu suất tìm kiếm trên đồ thị S-k Graph của tập COREL và WANG

16


Tìm kiếm ảnh dựa trên đồ thị chữ ký nhị phân

Hình 3.22. Hiệu suất tìm kiếm trên đồ thị S-k Graph của tập ảnh MSRDI

Hình 3.24. Hiệu suất tìm kiếm trên đồ thị S-k Graph của tập ảnh ImageCLEF

Hình 3.26. Hiệu suất tìm kiếm trên đồ thị S-k Graph của tập ảnh ImgColl02
Bảng 3.14. Hiệu suất tìm kiếm trên đồ thị S-k Graph của các tập dữ liệu ảnh

17



Tìm kiếm ảnh dựa trên đồ thị chữ ký nhị phân
Bảng 3.15. So sánh độ chính xác tìm kiếm trên tập ảnh COREL

3.6. Xây dựng đồ thị S-k Graph dựa trên mạng Sig -SOM
3.6.1. Xây dựng cấu trúc mạng Sig -SOM
Nhằm cải tiến quá trình tạo đồ thị S-k Graph và phương pháp tìm kiếm ảnh, luận
án xây dựng mạng Sig-SOM. Mạng Sig-SOM có cơ chế mở rộng đồ thị S-k Graph tại
tầng đầu ra theo như Quy tắc 3.1.
Định nghĩa 3.8. Mạng Sig-SOM là mạng SOM, trong đó lớp đầu vào ứng với một
chữ ký nhị phân Sig(I) = b1 b2 ...bN , bi ∈ {0, 1} và lớp đầu ra gồm N thành phần tương
ứng với các cụm trong đồ thị chữ ký S-kGraph = (VSG , ESG ). Mỗi một cụm thứ j ở
tầng đầu ra được kết nối đầy đủ với N thành phần của tầng đầu vào. Mỗi cung kết nối
từ thành phần thứ i của lớp đầu vào đến cụm thứ j thuộc tầng đầu ra có một trọng số
kết nối là wij ∈ {0, 1}.
Định nghĩa 3.9. Gọi Sig(I) = b1 ...bN là chữ ký nhị phân của ảnh I và tập SIG =
{Sig(I10 ), ..., Sig(In0 )} là tập chữ ký nhị phân của các tâm cụm tại tầng đầu ra của
mạng Sig-SOM. Cụm chiến thắng Vm ứng với dữ liệu đầu vào Sig(I) = b1 ...bN thỏa:
0
) = max{δ(I, Ii0 )|i = 1, ..., n}
δ(I, Im

(3.12)

với δ(I, Ii0 ) = α × dO (sigIO , sigIOi ) + β × dC (sigIC , sigICi ) và α, β ∈ (0, 1), α + β = 1.
dO (sigIO , sigIOi ) =

1
N

N

i=1

N OT (SigIO [i]XORSigICi [i])

dC (sigIC , sigICi ) =

1
M

M
i=1

N OT (SigIC [i]XORSigICi [i])

Khi đó, cụm chiến thắng Vm là cụm kết nối trực tiếp với vec-tơ chiến thắng Wm .
Định lý 3.6. Nếu Vm là cụm chiến thắng ứng với dữ liệu đầu vào Sig(I) = b1 b2 ...bN
thì khoảng cách φ(I, I0m ) là ngắn nhất, nghĩa là:
φ(I, I0m ) = min{φ(I, I0i )|i = 1, ..., |VSG |}

(3.13)

với I0i là tâm của cụm Vi ∈ VSG và φ là độ đo tương tự.

3.6.2. Thuật toán huấn luyện mạng Sig -SOM
Quy tắc 3.2. Gọi Sig(I) = b1 b2 ...bN là chữ ký nhị phân của ảnh I. Gọi Wm =
(w1m , w2m , ..., wN m ) là vec-tơ trọng số kết nối tại thời điểm t. Quy tắc huấn luyện
mạng Sig-SOM tại thời điểm t + 1 ứng với dữ liệu đầu vào Sig(I) = b1 b2 ...bN như sau:
18



Tìm kiếm ảnh dựa trên đồ thị chữ ký nhị phân
(t+1)

(t)

wi,m = bi ∨ wi,m
(t+1)

wi,j

(3.14)

(t)

= ¬bi ∧ wi,j

(3.15)

với j = m và j = 1, ..., n
(t)

Định lý 3.7. Đặt Sig(I) = b1 ...bN là dữ liệu đầu vào, Wm = (w1m , ..., wN m ) là vec-tơ
trọng số kết nối tại thời điểm t. Ta có:
(t)

(t+1)

δ(Sig(I), Wm ) ≤ δ(Sig(I), Wm

)


(3.16)

Thuật toán 3.6. Thuật toán huấn luyện mạng Sig -SOM
Input: Tập huấn luyện Γ = {Sig(Ii ) = (bi1 , bi2 , ..., biN )|i = 1, ..., K}.
Output: Mạng Sig-SOM sau khi đã huấn luyện.
Function SigSOMTraining(Γ)
Begin
Bước 1. Khởi tạo mạng
Khởi tạo tập huấn luyện Γ gồm K vec-tơ các chữ ký nhị phân Sig(Ii ) = (bi1 , ..., biN )
mô tả tập các hình ảnh

={Ii |i = 1, ..., K}; Khởi tạo tầng đầu ra gồm n cụm

Ω = {Vj = Cj , kj θ }, với Cj = (cj1 , ..., cjN ), cjk ∈ {0, 1}, k = 1, ..., N, j = 1, ..., n;
Khởi tạo tập trọng số W = {Wj |Wj = (w1j , ..., wnj ), wij ∈ {0, 1}, i = 1, ..., n};
Với mỗi chữ ký nhị phân đầu vào Sig(Ii ) gán tập S =∅ và thực hiện từ Bước 2 đến
Bước 4 như sau:
Bước 2. Chọn cụm chiến thắng ứng với chữ ký Sig(Ii )
if (W = S) then go to Bước 4
else Tính δ(Ii , Wi ) với Wj ∈ W \S của các cụm tại tầng đầu ra;
Chọn cụm chiến thắng VJ : (δ(Ii , WJ ) = max{δ(Ii , Wj )|j = 1, 2, ..., n}); end if
Bước 3. Kiểm tra điều kiện cụm
Tính độ đo tương tự φ giữa vec-tơ đầu vào Sig(Ii ) và tâm Cj = (cj1 , ..., cjN );
if (φ(Sig(Ii ), Cj ) ≤ kj θ) then
Vec-tơ đầu vào Sig(Ii ) thuộc về cụm VJ ; Huấn luyện vec-tơ trọng số WJ như sau:
(t+1)

wi,J


(t)

(t+1)

= bi ∨ wi,J ; wi,j

(t)

= ¬bi ∧ wi,j , với j = J và j = 1, ..., n

else S = S ∪ {WJ }; go to Bước 2; end if
Bước 4. Tạo cụm mới
Tìm cụm gần nhất Vm với VJ ; (nghĩa là (φ(CJ , Cm ) − km θ) = min{(φ(CJ , Ci ) −
ki θ), i = 1, ..., n} )
Đặt k0 = [(φ(CJ , Cm ) − km θ)/θ] ≥ 0;
if k0 > 0 then
Tạo cụm V0 = C0 , k0 θ : C0 = Sig(Ii );
Tạo vec-tơ kết nối W0 = (w1,0 , ..., wN 0 ), với wi,0 là giá trị ngẫu nhiên trong {0, 1};
19


Tìm kiếm ảnh dựa trên đồ thị chữ ký nhị phân
end if
if k0 = 0 then
Vec-tơ đầu vào Sig(Ii ) thuộc về cụm Vm ; Huấn luyện vec-tơ Wm như sau:
(t+1)

(t)

(t+1)


wi,m = bi ∨ wi,m ; wi,j

(t)

= ¬bi ∧ wi,j , với j = m và j = 1, ..., n;

end if
Return Sig-SOM Network;
End. =0
Mệnh đề 3.8. Độ phức tạp của Thuật toán 3.6 là O(K), với K là số lượng phần
tử của tập chữ ký Γ.

3.6.3. Thuật toán tìm kiếm ảnh trên mạng Sig -SOM
Thuật toán 3.7. Thuật toán tìm kiếm ảnh
Input: Ảnh cần tìm kiếm IQ và mạng Sig-SOM sau khi huấn luyện.
Output: Tập ảnh tương tự IM G.
Function SigSOMRetrieval(IQ , Sig-SOM)
Begin
Khởi tạo tập ảnh kết quả IM G = ∅; Khởi tạo tập cụm V = ∅;
Tính δ(IQ , Wi ), với Wj ∈ W, j = 1, ..., n;
Chọn cụm chiến thắng VJ : (δ(Ii , WJ ) = max{δ(Ii , Wj )|j = 1, 2, ..., n};
V = V ∪ {VJ };
0
for(Vi ∈ VSG ) do if (φ(Im
, Ii0 ) ≤ kθ) then V = V ∪ Vi ; end if

end for

for (Vj ∈ V ) do IM G = IM G ∪ {Ijk ∈ Vj , k = 1, ..., |Vj |}; end for

Return Tập ảnh tương tự IM G;
End.
Mệnh đề 3.9. Độ phức tạp của Thuật toán 3.7 là O(n), với n là số lượng đỉnh
trong đồ thị S-kGraph tại tầng đầu ra của mạng Sig-SOM.

3.6.4. Thực nghiệm tìm kiếm ảnh trên mạng Sig -SOM
Phương pháp tìm kiếm ảnh dựa trên mạng Sig-SOM gồm hai giai đoạn: huấn luyện
mạng Sig-SOM để tạo đồ thị S-k Graph và tìm kiếm ảnh dựa trên mạng Sig-SOM.
Phương pháp dựa trên đồ thị S-k Graph đã giải quyết được những khuyết điểm về
quá trình phân cụm phân cấp của phương pháp cây Sig-Tree. Thời gian và độ chính
xác của phương pháp S-k Graph đã cải thiện đáng kể so với phương pháp Sig-Tree.
Phương pháp đồ thị S-k Graph đã giải quyết vấn đề xung đột dữ liệu giữa các cụm
và cũng là một phương pháp tìm kiếm ảnh hiệu quả.

20


Tìm kiếm ảnh dựa trên đồ thị chữ ký nhị phân

Hình 3.28. Mô hình tìm kiếm ảnh dựa trên mạng Sig-SOM

Hình 3.33. Hiệu suất tìm kiếm trên mạng Sig-SOM của tập ảnh CBIRimages

Hình 3.34. Hiệu suất tìm kiếm trên mạng Sig-SOM của tập ảnh COREL và WANG
Phương pháp tìm kiếm trên mạng Sig-SOM đã cải thiện về độ chính xác so với
phương pháp S-k Graph và vẫn đảm bảo được tốc độ tìm kiếm cũng như không làm
mất đi cấu trúc đồ thị S-k Graph.

21



Tìm kiếm ảnh dựa trên đồ thị chữ ký nhị phân

Hình 3.36. Hiệu suất tìm kiếm trên mạng Sig-SOM của tập ảnh MSRDI

Hình 3.38. Hiệu suất tìm kiếm trên mạng Sig-SOM của tập ảnh ImageCLEF

Hình 3.40. Hiệu suất tìm kiếm trên mạng Sig-SOM của tập ảnh ImgColl02

3.7. Tổng kết chương
Chương này đã đưa ra cấu trúc đồ thị S-k Graph nhằm cải tiến tốc độ gom cụm để
tìm kiếm ảnh dựa trên nội dung. Mạng Sig-SOM nhằm cải tiến phương pháp tạo đồ
22


Tìm kiếm ảnh dựa trên đồ thị chữ ký nhị phân
Bảng 3.23. Hiệu suất tìm kiếm trên mạng Sig-SOM của các tập dữ liệu ảnh

Bảng 3.24. So sánh độ chính xác tìm kiếm trên mạng Sig-SOM của tập COREL

Bảng 3.25. So sánh hiệu suất của các phương pháp đề xuất

thị S-k Graph với đầu vào là chữ ký nhị phân và đầu ra là đồ thị S-k Graph. Theo
kết quả thực nghiệm, các phương pháp đề xuất đáp ứng được mục tiêu của luận án.
Phương pháp gom cụm chữ ký nhị phân tốn kém nhiều chi phí tạo cụm ban đầu.
Tuy nhiên, hai phương pháp cải tiến gồm đồ thị S-k Graph và mạng Sig-SOM đã
giảm rất đáng kể về chi phí thời gian tạo dữ liệu ban đầu. Theo số liệu so sánh với
các phương pháp khác, các phương pháp đề xuất đều xây dựng được các chương
trình tìm kiếm ảnh hiệu quả, nghĩa là thời gian tìm kiếm nhanh và có độ chính
xác cao. Điều này đã minh chứng tính đúng đắn theo thực nghiệm của các phương

pháp đề xuất và đáp ứng được mục tiêu đề ra ban đầu của luận án. Từ đó cho thấy
phương pháp tìm kiếm ảnh theo nội dung dựa trên chữ ký nhị phân là một giải
pháp hiệu quả để xây dựng công cụ tìm kiếm ảnh đáp ứng yêu cầu người dùng.

23


×