Tải bản đầy đủ (.pdf) (60 trang)

Một số kỹ thuật tìm kiếm ảnh theo nội dung trong cơ sở dữ liệu đa phương tiện

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (690.67 KB, 60 trang )


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ





DƯƠNG HOÀNG HUYÊN






MỘT SỐ KỸ THUẬT
TÌM KIẾM ẢNH THEO NỘI DUNG
TRONG CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN








LUẬN VĂN THẠC SĨ













Hà Nội - 2005

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ





DƯƠNG HOÀNG HUYÊN





MỘT SỐ KỸ THUẬT
TÌM KIẾM ẢNH THEO NỘI DUNG
TRONG CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN



Ngành : Công nghệ thông tin

Mã số : 1.01.10



LUẬN VĂN THẠC SĨ





NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS ĐẶNG VĂN ĐỨC






Hà Nội - 2005


Mục lục
Mục lục 1
Các thuật ngữ và các từ viết tắt 3
Danh sách các hình trong luậ 4
Mở ầu 5
Chương 1 7
Tổng quan về cơ sở dữ liệương tiện 7
1.1 Các khái niệm cơ bản 7
1.2 Nguyên lý thiết kế ương tiện 8

1.3 Kiến trúc hệ thống và mô hình dữ liệương tiện 11
1.3.1 Kiến trúc tổng quát 11
1.3.2 Mô hình dữ liệu 13
1.3.3 Giao diện người dùng 14
1.3.4 Trích chọặc trưng, chỉ số ộ ương tự 16
1.4 Cơ sở dữ liệu ảnh 18
1.4.1 Các cơ sở dữ liệu truyền thống 18
1.4.2 Cơ sở dữ liệu ảnh 21
1.4.3 Tìm kiếm ảnh theo nội dung 23
Chương 2 25
Một số kỹ thuật tìm kiếm theo nội dung trong cơ sở dữ liệu ảnh 25
2.1 Kí hiệu mô tả nội dung ảnh 25
2.2 Tìm kiếm ảnh dựặc trưng màu 26
2.2.1 Không gian màu 26
2.2.2 Lượng tử hóa màu 28
2.2.3 Biểồ màu 29
ộ ảng cách của biểồ màu 30
2.2.5 Kỹ thuật tìm kiếm ảnh dùng biểồ màu 32
2.2.6 Kỹ thuật tìm kiếm ảnh dùng moment màu 40
2.3 Tìm kiếm ảnh dựặc trưng texture 41
2.3.1 Một số khái niệm về texture 41
2.3.2 Ma trậồng hiện (co-occurrence matrix) 44
2.3.3 Phương pháp chuỗi texture (texture spectrum methods) 46
ặc trưng tương quan tự ộng 48
ặc trưng của Tamura 49
ộ ương tự của texture 50
2.4 Tìm kiếm ảnh dựặc trưng hình dạng 50
2.4.1 Moment bất biến 51
2.4.2 Biểu diễn hình dạng dựa vào vùng 52
2.4.3 Kí hiệu mô tả Fourier 54

2.5 Kết luận 56
Chương 3 58
ặt và thử nghiệm 58
3.1 Tìm kiếm ảnh dựặc trưng màu 58
3.1.1 Phương pháp dùng biểồ màu cục bộ 58
3.1.2 Phương pháp dùng biểồ màu toàn cục 62
3.1.3 Phương pháp dùng moment màu 62
3.2 Tìm kiếm dựặc trưng texture sử dụng ma trậồng hiện 66
3.3 Tìm kiếm dựặc trưng hình dạng sử dụng các moment bất biến 69
Kết luận 72
Tài liệu tham khảo 73
Tiếng Việt 73
Tiếng Anh 73















Các thuật ngữ và các từ viết tắt
CBIR Content-Based Image Retrieval

CH Color Histogram
Co-occurrence Matrix Ma trậồng hiện
CSDL Cơ sở dữ liệu
FD Fourier Descriptor
GB GigaByte
GCH Global Color Histogram
GI Grid Image
HSV Hue, Saturation, Value
LBP Local Binary Pattern
LCH Local Color Histogram
MMDBMS Multimedia DataBase Management System
RGB Red, Blue, Green
SQL Structure Query Language
URL Uniform Resouse Locator
XLB X-Lower Boundary
XUB X-Upper Boundary



Danh sách các hình trong luậ
Hình 1.1 Sơ ồ nguyên lý tự trị 9
Hình 1.2 Sơ ồ nguyên lý thống nhất 9
Hình 1.3 Sơ ồ nguyên lý tổ chức lai 10
Hình 1.4 Kiến trúc tổng quát của MMDBMS 12
Hình 1.5 Mô hình dữ liệu tổng quát 14
Hình 1.6 Hệ thống tìm kiếm ảnh theo nội dung tiêu biểu 24
Hình 2.1 Không gian màu RGB 27
Hình 2.2 Không gian màu HSV 28
Hình 2.3 ảnh trước và sau khi lượng tử hóa 29
Hình 2.4 Khoảng cách dạng Minkowski 31

Hình 2.5 Khoảng cách dạng toàn phương 31
Hình 2.6 Biểồ màu của 3 ảnh A, B, C 32
Hình 2.7 Khoảng cách hai ảnh A và B 34
Hình 2.8 Khoảng cách hai ảnh A và C 35
Hình 2.9 Khoảng cách hai ảnh B và C 35
Hình 2.10 ảnh D sau khi xoay 900 36
Hình 2.11 Ví dụ về ồ thị  38
Hình 2.12 Phương pháp xây dựồ thị  39
ồ thị ối có trọng số 39
Hình 2.14 Tậược có giá trị nhỏ nhất củồ thị  40
Hình 2.15 ảnh trước và sau khi chuyển thành ảnh xám 42
Hình 2.16 Một số texture tiêu biểu 43
Hình 2.17 Ví dụ ma trậồng hiện 44
Hình 2.18 Ví dụ phương pháp mẫu nhị phân cục bộ 47
Hình 2.19 Ví dụ hàm tương quan tự ộng 48
Hình 2.20 Ví dụ biểu diễn hình dạng theo vùng 53
Hình 3.1 Kết quả thực nghiệm phương pháp LCH với lưới 16?16 61
Hình 3.2 Kết quả thực nghiệm phương pháp LCH với lưới 8?8 61
Hình 3.3 Kết quả thực nghiệm phương pháp GCH 65
Hình 3.4 Kết quả thực nghiệm phương pháp moment màu 65
Hình 3.5 Kết quả thực nghiệm ma trậồng hiện với d(0,1) 68
Hình 3.6 Kết quả thực nghiệm ma trậồng hiện với d(1,1) 68
Hình 3.7 Kết quả thực nghiệm moment bất biến 71












Mở ầu
Ngay từ ầược coi là các thiết bị xử lý các biểu tượng, các kí
tự ầu vào có dạầu ra là các biểu tượng có cùng dạều
ở thành mô hình tính toán chuẩn dựa trên cơ sở máy Turing.
Tuy nhiên, trong nhữầất hiện nhu cầu vô cùng lớn về khả 
khai thác và xử lý dữ liệu với số lượng khổng lồ mà các dữ liệu này thì không dễ
dàng diễn tả bằng các kí hiệu, dướột số ví dụ về kiểu dữ liệu như 
nêu:
Dữ liệu hình ảnh (Image data): Các công ty thiết kế logo cho các cơ quan tổ chức
ọ cần phải duy trì một CSDL ảể khi tạo ra một logo mới sẽ
không bị trùng lặp với nhữ
Dữ liệu video (Video data): Trong ngữ cảnh khác, các sinh viên học từ xa muốn có
một bài giảng bằng video về một chủ ề ủa môn học. Trong trường hợp
này các trường học cần phải tạo ra một tập hợp các video có nội dung về bài
giảng của giáo viên với một chủ ề 
Dữ liệu âm thanh (Audio data): Tình huống tương tự như trên, các sinh viên học
từ xa muốạn audio bài giảng của các giáo viên. Hoặc tình huống khác
như sinh viên học ngoại ngữ muốạn audio các cuộại. Trong
trường hợần phải tập hợạn audio trên theo một chủ ề nào
ể thuận tiện trong việc sử dụng sau này.
Dữ liệu tài liệản bao gồoạản, các
từạệản ở chỗ nó không chỉ chứa các thông
tin ở dạng thô mà còn chứựng cấu trúc và hình ảười dùng
tìm kiếm ảnh nhưng không thể tìm trong CSDL ảnh. Tuy nhiên nếu có một CSDL
tài liệu thì ta có thể truy cập vào ảnh trong tài liệ
Dữ liệu viết bằng tay (Handwritten data): Nhiều người thường ghi chú lên những

mảnh giấy nhỏều này thường hay bị mất thông tin, hoặc thông tin dễ bị mờ.
Xu thế gầế giới người ta cho rằện tử ngày càng phát
triển trong tương lai. Người sử dụng sẽ dùng các thiết bị ện tử ể ghi chép và
lưu trữ các ghi chú cá nhân. Mặc dù có nhiều ghi chép có thể chuyể
ASCII bằng kỹ thuật phân tích chữ viết tay, nhưng có rất nhiều ghi chú không thể
thực hiệược bởi vì các ghi chú thường chứa cả các nét loằng ngoằng hay các
biểồ khối.
Các kiểu dữ liệu liệỉ là một phần trong rất nhiều hình thức biểu
hiện của dữ liệu phát sinh tự nhiên trong các ứng dụng khác nhau. Từ những dữ
liệu mới phát sinh trên, ta thấy rằng các CSDL truyền thống không thể quản lý
các kiểu dữ liệượần phải có có một hệ thống quản lý tất cả các
loại dữ liệương tiệược hình thành.
Trong khuôn khổ của luận vột số vấề cơ bản của
một hệ quản trị ương tiện chẳng hạn các khái niệm, kiến trúc hệ
thống và mô hình dữ liệương tiệập trung nghiên cứu và cài
ặt thử nghiệm một số phương pháp tìm kiếm theo nội dung trên dữ liệ
phương tiện, cụ thể là dữ liệu ảnh.




Chương 1
Tổng quan về cơ sở dữ liệương tiện
1.1 Các khái niệm cơ bản
Dữ liệu Media là các kiểu thông tin hoặc biểu diễn của các kiểu thông tin như các
kí tự, ảnh, audio và video. Multimedia là tập hợp các kiểược sử dụng
với nhau. Hệ quản trị cơ sở dữ liệương tiện (Multimedia DataBase
Management System - MMDBMS) là một hệ thống giúp người dùng thao tác trên
các dữ liệu media một cách thích hợp và hiệu quả. Các thao tác cơ bản của hệ
quản trị CSDL thường là chèn, cập nhật, xóa và tìm kiếm mộối tượng trong

CSDL. Các dữ liệu media có nhữặểm chính như sau:
- Dữ liệặc biệt là dữ liệu audio và video có dung lượng rất lớn. Ví dụ
một mộạn phim khoảng 10 phút với chất lượng bình thường có thể ến 1,5
GB ở dạng không nén.
- Dữ liệu audio và video có tham số thời gian. Nó phảược thể hiện ở một tốc
ộ cố ịể ạược hiệu quả mong muốn.
- Dữ liệược biểu diễn ở dạặc thù, không có cấu trúc ngữ 
ể máy tính có thể tự ộng nhận biết nội dung.
- ữ liệương tiệụ thuộc vào cách quan
sát và ý kiến chủ quan của con người. Cùng một hình ảnh nhưng có thể có các
nhận xét khác nhau bởi nhiều người.
- Dữ liệương tiện rấể biểu diễầủ nội dung cần
phải có rất nhiều tham số.
1.2 Nguyên lý thiết kế ương tiện
Trong MMDBMS, thông thường ta sử dụể tổ chức nội
dung của một MMDBMS:
1. Nguyên lý tự trị (principle of automony): ta phải lựa chọể nhóm chung
media cùng loại. Chỉ số hóa mỗi loại media này theo cách riêng và hiệu quả nhất
ể thuận tiện khi truy cậối tượng. Ta gọi là tự trị vì mỗi loại media
ược tổ chức riêng và phù hợp với từng loại. Hình 1.1 mô tả sơ ồ nguyên lý tự
trị.
ồng nhất (Principle of unformity): cố gắng tìm ra một cấu trúc trừu
tượng hơể chỉ số hóa mọi kiểu dữ liệu, khi truy cập vào các kiểu media khác
ều thông qua chỉ số này. Nói cách khác, chúng ta biểu diễn nội dung của
ối tượng media khác nhau (ảnh, tài liệu, audio, video ) trong cùng một cấu
trúc dữ liệển thuậể truy cập vào cấu trúc dữ liệ
Hình 1.2 mô tả sơ ồ nguyên lý thống nhất.
3. Nguyên lý tổ chức lai (Principle of hybird organization): là sự kết hợp hai
nguyên lý trên. Theo nguyên lý này, một số dữ liệu media sử dụng chỉ số riêng và
những dữ liệu còn lại sẽ sử dụng cùng một chỉ số. Hình 1.3 mô tả tổng quát một

sơ ồ nguyên lý tổ chức lai.
Cả ều có những ưu và nhượểm riêng. Nguyên lý tự trị 
hỏi phải tạo ra các thuật toán và cấu trúc dữ liệu cho mỗi media riêng và cần
phải có kỹ thuật kết nối giữa các dữ liệu khác nhau. Ngược lại tổ chức dữ liệu
theo nguyên lý tự trị có thể dẫn tới thời gian xử lý nhanh. Hơn nữa, trong nhiều
trường hợp cấu trúc dữ liệu và thuật toán cho kho dữ liệu cụ thể ồn tại,
nguyên lý tự trị là một lựa chọn tốt.



Hình 1.1 Sơ ồ nguyên lý tự trị

Hình 1.2 Sơ ồ nguyên lý thống nhất

Hình 1.3 Sơ ồ nguyên lý tổ chức lai
Ngược lại với nguyên lý tự trị, nguyên lý thống nhấỏi chúng ta tìm ra cấu
trúc dữ liệể có thể lưu trữ thông tin về ảnh, video, audio, tài liệu ,
ềỏi phải khảo sát nội dung mỗi loại thông tin và cố gắưa ra các
phần chung củỉ số hóa trên các phầợi thế của
nguyên lý thống nhất là dễ ặt và thuật toán thường chạy nhanh. Trong công
nghiệp, nguyên lý thống nhấược sử dụng rộết bị chú
giải (metadata). Bất lợi là chú giải thườược tạo một cách thủ công. Tiến
trình tạo ra bằng tay thường mất nhiều thời gian và kinh phí. Hơn nữa một số
thông tin có thể bị mất nếu ngôn ngữ chú giảầủ ể mô tả
mọi khía cạnh của nội dung. Ví dụ, ngôn ngữ chú thích nội dung ảnh có thể làm
mất thông tin của từểm ảnh. Tương tự, ngôn ngữ chú thích âm thanh có
thể làm mất thông tin về ộ và tần số tín hiệu tại một số ểm.
Nguyên lý tổ chức dữ lai tận dụược các lợi thế của hai kiến trúc trướ
hạn chế ược các bất lợi của nó. Giả sử ta muốn tạo ra một MMDBMS có các
kiểu M1, , Mn. Ta sẽ chia các kiểu thành 2 tập hợp: những kiểu media có sẵn và

ỉ số, ta giữ lại các chỉ số ươồn tại; những kiểu
media không có sẵn và chưược chỉ số, ta biểu diễn theo các chỉ số thống nhất.
ạo lậươể kết nối nhiều nguồn dữ liệu khác nhau nhờ
các chỉ số của chúng. Theo nguyên lý này, sẽ sử dụng tốồ
tồn tại, tiết kiệược thời gian và sức lực bởi vì tận dụược các chỉ số 
có.
1.3 Kiến trúc hệ thống và mô hình dữ liệương tiện
1.3.1 Kiến trúc tổng quát
Kiến trúc hệ thống của một MMDBMS phải mềm dẻo và có khả ở rộể
hỗ trợ các ứng dụng, các kiểu truy vấn và nội dung dữ liệể giải quyết vấề
này, MMDBMS bao gồm một số module chứứới có thể
thêm vào, các chứể loại bỏ, cập nhật.
Một tính chất quan trọng củữ liệược tổ chức phân
tán. Lý do là dữ liệu media thường có dung lượng lớược dùng chung bởi
nhiều người, nếu duy trì một CSDL riêng cho từng cá nhân sẽ rất tốn kém. Vì vậy,
trong các MMDBMS thường có thêm một module chứền thông.
Hình 1.4 mô tả kiến trúc tổng quát của mộối chức
ện người dùng, khối trích chọặc trưng, bộ phận truyền
thông, công cụ tìm kiếm và chỉ số hóa, và cuối cùng bộ phận quản lý lưu trữ. Các
khối chứược mô tả thông qua các hoạộng.
Các thao tác chính trong mộếm. Trong thao tác
chèn, người dùng chỉ ối tượng mới thông qua giao diệối tượng
ược lưu trữ thành các file hoặc là dữ liệược nhập vào từ các thiết bị
ngoại vi như ội dung hoặặc trưng của các
ối tượng này sẽ ược trích chọn tự ộng hoặc bán tự ộng thông qua các công
cụ ược cung cấp trong khối trích chọặc trưặc trưối
tượng gốc sẽ ược gởến server thông qua bộ phận truyền thông. Tại server,
ặc trưng sẽ ược tổ chức và chỉ số hóa một cách thích hợp sao cho việc tìm
kiếạt hiệu quả tốt nhấtối tượng gốc sẽ ược lưu trữ trên server
thông qua bộ phận lưu trữ.


Hình 1.4 Kiến trúc tổng quát của MMDBMS
Trong thao tác tìm kiếm, ngườưa ra truy vấn thông qua giao diện người
dùng. Truy vấn có thể là mộặc dữ liệược nhập vào thông qua
các thiết bị ngoại vi. Giao diện ngườễối
tượng trong CSDL, người dùng có thể chọn mộối tượể làm truy
vấn. Nếối tượng trong truy vấặc trưng chính của
ối tượược trích chọn và gởến server thông qua khối truyền thông.
Khối chỉ số hóa và tìm kiếối tượng tương tự nhất và gởi
ối tượến giao diện người dùng thông qua khối truyền thông, giao
diện người dùng sẽ trình diễối tượ
1.3.2 Mô hình dữ liệu
Mô hình dữ liệu trong CSDL cung cấp một ngôn ngữ mô tả tính chất của dữ liệu
ể lưu trữ và tìm kiếm. Ngôn ngữ này phải cho ngườị
chèn, xóa, sửổi và tìm kiếối tượng trong CSDL. Mô hình dữ liệ
phương tiện nắm bắt các tính chấộủa dữ liệương tiện và
cung cấp các dạng cơ bảể phát triển các công cụ sử dụng dữ liệương
tiện. Các tính chấể ối tượng tạo ra dữ liệương tiện,
các mối liên hệ giữối tượng và các tính chất củối tượng. Các tính chất
ộng của dữ liệu có thể là sự tương tác giữối tượối
tượng. Các mô hình dữ liệu phương tiện phảứng các yêu cầu cơ bản như
sau:
- Mô hình dữ liệu phải có khả ở rộối tượng mới có thể
ược bổ sung.
- Mô hình dữ liệu phải có khả ểu diễn các kiểu media cơ bản và các mối
quan hệ không gian và thời gian củối tượng.
- Mô hình dữ liệu phải cho phép lưu trữ và tìm kiếm hiệu quả.
Một mô hình dữ liệu tổng quát thể hiện trong hình 1.5. Tầối tượng chỉ rõ các
mối quan hệ về không gian, thời gian và sự tích hợp giữối tượng. Tầng
các kiểu media chứa các kiểu media chung như text, image, audio và video. Tại

mức ặc trưng và thuộc tính củối tượược chỉ rõ. Ví dụối với
ảnh có thể có các tính chất như kích thước ảnh, biểồ ối tượng
chính chứa trong ảnh. Tầng khuôn dạng media chỉ rõ khuôn dạng mà dữ liệu
ược lưu trữ. Một kiểu media thông thường có nhiều khuôn dạng ví dụ như ảnh
có thể có dạng thô hoặc dạng nén. Kiến trúc vừa nêu chỉ là một kiến trúc tổng
quát, tùy theo mỗi ứng dụng khác nhau sẽ có một mô hình dữ liệu khác nhau,
không có một tiêu chuẩn chung cho các tầng.

Hình 1.5 Mô hình dữ liệu tổng quát
1.3.3 Giao diện người dùng
Người dùng tương tác với MMDBMS thông qua một giao diện. Chứ
của giao diện là cho phép người dùng chèn, xóa, cập nhậối tượng trong
CSDL, nhập vào các truy vấn và biểu diễn các kết quả truy vấn. Một giao diện
người dùng tốt phải hỗ trợ các chứ
- Cung cấp công cụ cho ngườối tượng mới vào CSDL một cách
dễ dàng.
- Cung cấp công cụ cho người dùng nhập truy vấn một cách hiệu quả hoặc cho
hệ thống biết các thông tin cần thiết của truy vấn.
- Biểu diễn kết quả truy vấn một cách hiệu quả.
- Giao diện thân thiện với người dùng.
Vì các tính chấặc thù của dữ liệương tiện, nên giao diện và truy vấn
của MMDBMS có một số ểm cần lưu ý như sau:
- Trong CSDL truyền thống, các bản ghi có cấu trúc với số lượng các thuộc tính cố
ịnh, mỗi bảược chèn một cách thủ công vào CSDL bằng việc chỉ ra giá trị
các thuộc tính. Trong MMDBMS, mỗi mục dữ liệu có thể là một kiểu media bất kì
hoặc là sự kết hợp của các kiểu media. Những dữ liệu này không có cấu trúc và
thuộc tính cố ịện người dùng phải cho phép người dùng chỉ rõ
các kiểu dữ liệu vào, các kiểu media kết hợp các kiểu thuộể trích chọn và
chỉ số hóa.
- Các truy vấn trong MMDBMS thường có nhiều loại và có nội dung không rõ

ràng. Truy vấn nhiều loại là vì người dùng có thể ặc tả truy vấn trong nhiều
cách khác nhau. Truy vấn là không rõ ràng bởi vì người dùng có thể chỉ biết
những gì mà họ thấy nhưng không mô tả một cách chính xác hoặc các thông tin
cần thiếượị
Tìm kiếm là một thao tác rất quan trọng trong các hệ quản trị CSDL, trong
MMDBMS thông thường có hai dạng tìm kiếm: tìm kiếm bằặc tả và tìm
kiếm theo mẫu. Giao diện người dùng cần phải hỗ trợ hai phương pháp tìm
kiếm này. Tìm kiếm bằặc tả là người dùng chỉ ra các từ khóa và các
tham số mô tả ặc trưng hoặc các thuộc tính chính của thông tin cần thiết.
Có hai loại truy vấn hỗ trợ cho các thao tác tìm kiếm bằặc tả 
- Truy vấn dựa vào metadata: metadata là các dạng thuộc tính của các mục dữ
liệu trong CSDL ví dụ nó có thể là tên tác giả và ngày tạo lập của mộối tượng
tài liệu, hoặc có thể là tên file dữ liệu.
- Truy vấn dựa vào chú thích: chú thích là các chuỗản mô tả nội dung của
một mục dữ liệu. Truy vấn là các từ khóa hoặc là các chuỗản, Việc tìm
kiếm dựa vào tính chính xác giữa nội dung truy vấn và các chú thích.
ối với tìm kiếm bằng mẫu, giao diện ngườặc tả truy vấn với các kiểu
media khác nhau hoặc kết hợp của các kiểu dữ liệu media. Truy vấưa ra một
ối tượng mẫu và hệ thống sẽ ối tượng tương tự vớối
tượng mẫện người dùng phải hỗ trợ các chứập dữ liệu
ể người dùng mô tả các mẫu, chẳng hạn như microphone, camera, scanner.
Tuy nhiên, ngườể sử dụối tượồn tại trong CSDL
ể làm truy vấể ượều này, giao diện phải có chứễn
ối tượười dùng có thể chọn mộối tượ
trình diễể làm truy vấn. Một lý do nữể giao diện phải hỗ trợ chứ
trình diễười dùng nhiều khi không biết chính xác những gì họ
muốn, họ chỉ có thể nhận ra nó khi họ thấứễn sẽ
hiển thị tất cả hoặc là một số ối tượng, ngườẽ chọn ra một
ối tượng thích hợể làm truy vấn.
Một vấề quan trọng trong giao diệấề trình diễn các kết quả truy

vấn cho người dùng. Giao diện phải biểu diễược tất cả các loại media và các
mối quan hệ không gian và thời gian củối tượng tích hợp. Kết quả truy
vấn ở nhiều dạng khác nhau có thể là mộạn audio dài, một ảnh có kích
thước lớện phải trích chọn nhữạn thông tin chủ yếể
trình diễn cho người dùng lựa chọn.
1.3.4 Trích chọặc trưng, chỉ số ộ ương tự
Các dữ liệương tiệược trích chọặc trưng và trích chọn
các thuộc tính. Trong quá trình tìm kiếặc trưng và thuộược so
ối tượất lượng của trích chọặc trưng
quyếịnh hiệu quả tìm kiếm. Nếặc trưng của mộối tượược
trích chọối tượng này sẽ ược tìm thấy trong quá trình tìm
kiếm. Thao tác trích chọặc trưng phải giải quyếược các vấề sau:
- ặc trưng và thuộọn phảầủ ể có thể biểu diễn nội dung
của các mục thông tin.
- ặc trưng và thuộược trích chọn phảọng, súc tích. Nếặc
trưng quá phức tạp và lớn sẽ ảnh hưởến hiệu quả tìm kiếm.
- Tính toán khoảng cách củặc trưng phải hiệu quả.
Tổng quát, có bốn loạặc trưng cơ bảảặc
trưng nội dung ở mức thấặc trưng nội dung ở mức cao. Metadata bao
gồm các dạng hoặc các thuộc tính thực củối tượng ví dụ như tên tác giả, ngày
tạề củối tượng. Metadata không mô tả hoặc giải thích nội dung
củối tượng.
ảảể mô tả nộối tượ
bản có thể các từ khóa hoặc chuỗản tự do. Mặản có
những hạn chế như phụ thuộc người mô tả và thườầủ 
tuy nhiên nó vẫược sử dụng rộữu ích. Thông thường, người dùng
sử dụản kết hợp với một số ặc trưng khác.
ặc trưng mức thấp nắm bắt, các thông số củối tượương tiện và các
mối quan hệ không gian và thời gian của các cặối tượng. Các loại media khác
nhau sẽ có nhữặc trưng mức thấặc trưng mức

thấp bao gồm âm sắc, phân phối tầng sốặc trưng mức thấp
của ảnh bao gồm phân phối màu, kết cấu bề mặt, hình dạối tượng và các
mối quan hệ ặc trưng mức thấp của video bao gồm tham số
thời gian và một số ặc trưng giống như ảiểm thuận lợi củặc trưng
mức thấp là nó có thể ược trích chọn một cách tự ộng.
ặc trưng mức cao cố gắng nhận dạng và hiểối tượng. Ngoại trừ nhận
dạản và tiếng nói, rấể có thể nhận dạược các mẫu audio và
ối tượng trực quan khác.
ọặc trưng, các kỹ thuật chỉ số hóa giúp tổ chứặc
trưể tìm kiếm hiệu quả. Mỗối tượng có thể có nhiềặc trưể biểu
diễn và mỗặc trưng lại có nhiều tham sốần phải có cơ chế chỉ số hóa
tốể tổ chứặc trưng này.
Thao tác tìm kiếm trong dữ liệương tiện thường dựa vào tính tương tự
thay vì tìm kiếm chính xác giữa các mục trong CSDL. Tính tương tự ược tính
toán dựặc trưng và thuộọn. Tuy nhiên, sự thích hợp
của kết quả tìm kiếm là nh giá chủ quan của con ngườầu chính
củộ ương tự là giá trị tương tự ược tính phải phù hợp nhận xét của con
người.
1.4 Cơ sở dữ liệu ảnh
ảnh số có một vị trí vượt trội so với các dữ liệu media khác như video, audio,
ống như dữ liệược sử dụng rộ
trong các ngành công nghiệp giải trí và tin tức), ảnh là một phần quan trọng
trong nhiềực như nghệ thuật, lịch sử, y tếầu khí, dự báo thời
tiết v.ảnh số ất quan trọng các hoạộng của con người
như nông nghiệp, quản lý rừng, khoa họất, quy hoạị, xa hơn nữa
ể thao và giải trí. Trước khi giới thiệu về CSDL ảnh, chúng tôi giới thiệu
khái quát một số CSDL truyền thống.
1.4.1 Các cơ sở dữ liệu truyền thống
ịột cách không hình thức CSDL quan hệ là một bảng gồm các cột và
các dòng, mỗược gọi là một bộ, mỗi cột gọi là một thuộc tính, mỗi thuộc

tính phải có một kiểu dữ liệu duy nhất. Một ví dụ về CSDL quan hệ có tên là
Client lưu trữ các thông tin khách hàng của mộượồ chi
tiết như sau: Client(Comp, Fname, Lname, AcountNum, PhoneNum, StreetNum,
ộc tính Comp, Fname, Lname, StreetName,
City có kiểu dữ liệu là chuỗản mô tả tên công ty, họ và tên khách hàng, tên
ường, thành phố tương ứng. AcountNum, PhoneNum, StreetNum có kiểu là số
nguyên dương mô tả số tài khoản, số ện thoại cá nhân và số nhà tương ứng
của khách hàng. Thao tác truy vấn trong CSDL quan hệ thường dùng các công cụ
như SQL hoặại số quan hệ. Một câu truy vấn thông thường trong SQL là
ủa câu truy vấn
trên là chọn những giá trị của các thuộrong quan hệ R1, R2,
ớều kiện F cho trước. Trong ví dụ mô tả ở trên, giả sử ta muốn biết số
ện thoại của mộấn trong
SQL có thể như 
Lname=

×