-62-
TÌM HIỂU PHƯƠNG PHÁP TÌM KIẾM ẢNH THEO NỘI DUNG
Đỗ Khắc Sĩ
MSV: 0320258
Email:
Người hướng dẫn: PGS.TS. Ngô Quốc Tạo
1. Giới thiệu
Tìm kiếm ảnh theo nội dung là một đề tài
mới, phức tạp. Việc tìm kiếm một bức ảnh với
độ chính xác cao là rất khó. Để giải quyết vấn
đề này tôi nghiên cứu một phương pháp tìm
kiếm ảnh dựa trên các đặc trưng màu sắc, kết
cấu và hình thù. Theo cách tìm kiếm này ảnh
thu được sẽ có các đặc trưng về màu sắc, hình
thù và kết cấu tương tự với ảnh đầu vào.
2. Cơ sở lý thuyết
Tìm kiếm ảnh dựa trên các đặc trưng màu
sắc, kết cấu và hình thù là cách tiếp cận tương
đối phổ biến và đang được hầu hết các hệ thống
tìm kiếm ảnh lớn trên thế giới áp dụng. Phương
pháp này thực hiện việc tìm kiếm ảnh bằng
cách tính khoảng cách của bức ảnh đầu vào với
mỗi bức ảnh trong cơ sở dữ liệu. Kết quả trả về
là những bức ảnh có khoảng cách gần nhất so
với ảnh đầu vào. Khoảng cách mỗi bức ảnh sẽ
được tính dựa trên khoảng cách các đặc trưng
màu sắc, kết cấu, hình thù và độ ưu tiên của
mỗi đặc trưng. Các bước trong quá trình so
sánh hai ảnh: tính khoảng cách đặc trưng màu,
tính khoảng cách kết cấu, tính khoảng cách hai
ảnh.
Phương pháp này tương đối phù hợp với
việc tìm ki
ếm ảnh có nội dung tương tự ảnh đầu
vào.
3. Phương pháp tìm kiếm ảnh theo nội
dung
Giải pháp được tôi lựa chọn để giải quyết
việc tìm kiếm ảnh theo nội dung là tính khoảng
cách ảnh theo các đặc trưng màu sắc, kết cấu và
hình thù. Cơ sở dữ liệu lưu ảnh mẫu bao gồm
thông tin và nội dung ảnh nguyên gốc do người
sử dụng đưa vào. Ngòai ra cơ sở dữ liệu còn
chứa ảnh mẫu đã được chuyển đổi về định
dạng, kích thước về chuẩn chung nhằm phục vụ
cho việc tính khoảng cách nhanh hơn, chính
xác hơn.
Mỗi quá trình tìm kiếm ảnh gồm các bước:
đưa ảnh đầu vào, chuyển đổi về định dạng
chuẩn, tính khoảng cách với mỗi ảnh trong cơ
sở dữ liệu. Việc tính khoảng cách ảnh so với
ảnh cơ sở dữ liệu gồm các bước chính: tính
khoảng cách mầu, tính khoảng cách kết cấu.
Sau đó tổng hợp để tính khoảng cách ảnh.
1) Khoảng cách màu:
Với hai ảnh đã đưa về cùng định dạng kích
cỡ. Ta sử dụng khoảng cách bình phương để
tính khoảng cách mầu của hai bức ảnh.
)()(),(
IQ
T
IQ
HHAHHIQd −−=
Trong đó, Q và I là hai ảnh
Q
H
là lược đồ
màu của ảnh Q còn
I
H
là lược đồ màu của ảnh
I, còn A là ma trận NxN, N là số thùng trong
mỗi lược đồ màu còn
ij
a
mô tả sự giống nhau
màu i và màu j.
2) Khoảng cách kết cấu:
Việc tính khoảng cách kết cấu chia làm hai
phần.
a.Tính mức năng lượng:
B1. Phân tích ảnh đầu vào thành 4 ảnh
con.
B2. Tính mức năng lượng của ảnh với cỡ
tương ứng. Sử dụng công thức
∑∑
==
=
m
i
n
j
jiX
MN
E
11
|),(|
1
Trong đó, M và N là độ rộng của ảnh. X
là cường độ sáng của điểm ảnh tại hàng i và cột
j.
B3. Lặp lại bước 2 với mỗi bức ảnh.
Giá trị mức năng lượng được lưu trữ lại để
phục vụ cho việc tính khoảng cách Euclidean.
b.Tính khoảng cách Euclidean:
B1. Phân tích ảnh đầu vào
B2. Lấy mức năng lượng của kênh k trội
nhất.
B3. Với mỗi bức ảnh i trong cơ sở dữ liệu
lấy mức năng lượng ở kênh k.
B4. Tính khoảng cách Euclidean ở hai bức
ảnh với mức năng lượng được chọn.
-63-
()
∑
=
−=
k
k
kiki
yxD
1
2
,
B5. Tăng biến i và lặp lại bước 3.
3) Khoảng cách ảnh:
Khoảng cách ảnh được tính dựa vào khoảng
cách màu và khoảng cách kết cấu. Ngoài ra hệ
thống cho phép người dùng đưa vào các thông
tin về độ ưu tiên màu và kết cho việc khoảng
cách. Khi đó khoảng cách ảnh được tính theo
công thức:
D(Q,I)= D
C
* W
C
+ D
T
*W
T
Trong đó D(Q,I) là khoảng cách ảnh, D
C
và
D
T
lần lượt là khoảng cách mầu và kết cấu. W
C
và W
T
lần lượt là độ ưu tiên màu và kết cấu.
4. Thực nghiệm
Chúng tôi đã cài đặt hệ thống trên ngôn ngữ
lập trình java và hệ quản trị cơ sở dữ liệu
oracle. Hệ thống đã đạt được tốc độ chấp nhận
được. Việc tìm kiếm ảnh là khá khả quan tuy
nhiên đôi khi vẫn thu được những bức ảnh
không mong muốn.
Tuy nhiên, do thời gian hạn hẹp hệ thống
mới chỉ đáp ứng được việc tìm kiếm trên 2 đặc
trưng là màu sắc và kết cấu nên độ chính xác là
chưa cao. Số lượng ảnh trong cơ sở dữ liệu còn
ít và chưa đa dạng nên việc đánh giá độ ổn định
và tốc độ là chưa khách quan.
5. Kết luận
Trong khóa luận này, chúng tôi đã xây dựng
hệ thống tìm kiếm ảnh theo nội dung dựa trên
các đặc trưng màu và kết cấu. Hệ thống đáp
ứng được về mặt tốc độ với cơ sở dữ liệu nhỏ.
Tuy nhiên với hệ cơ sở dữ liệu lớn thì tốc độ
chưa được khả quan. Về hiệu quả tìm kiếm do
mới chỉ đáp ứng trên việc tìm kiếm ảnh theo
khoảng cách màu và kết cấu nên độ chính xác
cũng chưa cao.
Các vấn đề cần tiếp tục nghiên cứu: xây
dựng thuật toán tính khoảng cách các đặc trưng
khác như hình thù, vị trí, không gian…để cải
thiện độ chính xác của việc tìm kiếm. Xây dựng
chỉ mục cho cơ sở dữ liệu để cải thiện tốc độ
tìm kiếm.
Tài liệu tham khảo
[1] R. Jain, R. Kasturi, and B. G. Schunck,
Machine Vision
, McGraw Hill International
Editions, 1995.
[2] Sharmin Siddique, “A Wavelet Based
Technique for Analysis and Classification of
Texture Images,” Carleton University, Ottawa,
Canada, Proj. Rep. 70.593, April 2002.
[3] Shengjiu Wang, “A Robust CBIR
Approach Using Local Color Histograms,”
Department of Computer Science, University of
Alberta, Edmonton, Alberta, Canada, Tech.
Rep. TR 01-13, October 2001.