ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
DƯƠNG HOÀNG HUYÊN
MỘT SỐ KỸ THUẬT
TÌM KIẾM ẢNH THEO NỘI DUNG
TRONG CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN
LUẬN VĂN THẠC SĨ
Hà Nội - 2005
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
DƯƠNG HOÀNG HUYÊN
MỘT SỐ KỸ THUẬT
TÌM KIẾM ẢNH THEO NỘI DUNG
TRONG CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN
Ngành : Công nghệ thông tin
Mã số : 1.01.10
LUẬN VĂN THẠC SĨ
NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS ĐẶNG VĂN ĐỨC
Hà Nội - 2005
Mục lục
Mục lục 1
Các thuật ngữ và các từ viết tắt 3
Danh sách các hình trong luậ 4
Mở ầu 5
Chương 1 7
Tổng quan về cơ sở dữ liệương tiện 7
1.1 Các khái niệm cơ bản 7
1.2 Nguyên lý thiết kế ương tiện 8
1.3 Kiến trúc hệ thống và mô hình dữ liệương tiện 11
1.3.1 Kiến trúc tổng quát 11
1.3.2 Mô hình dữ liệu 13
1.3.3 Giao diện người dùng 14
1.3.4 Trích chọặc trưng, chỉ số ộ ương tự 16
1.4 Cơ sở dữ liệu ảnh 18
1.4.1 Các cơ sở dữ liệu truyền thống 18
1.4.2 Cơ sở dữ liệu ảnh 21
1.4.3 Tìm kiếm ảnh theo nội dung 23
Chương 2 25
Một số kỹ thuật tìm kiếm theo nội dung trong cơ sở dữ liệu ảnh 25
2.1 Kí hiệu mô tả nội dung ảnh 25
2.2 Tìm kiếm ảnh dựặc trưng màu 26
2.2.1 Không gian màu 26
2.2.2 Lượng tử hóa màu 28
2.2.3 Biểồ màu 29
ộ ảng cách của biểồ màu 30
2.2.5 Kỹ thuật tìm kiếm ảnh dùng biểồ màu 32
2.2.6 Kỹ thuật tìm kiếm ảnh dùng moment màu 40
2.3 Tìm kiếm ảnh dựặc trưng texture 41
2.3.1 Một số khái niệm về texture 41
2.3.2 Ma trậồng hiện (co-occurrence matrix) 44
2.3.3 Phương pháp chuỗi texture (texture spectrum methods) 46
ặc trưng tương quan tự ộng 48
ặc trưng của Tamura 49
ộ ương tự của texture 50
2.4 Tìm kiếm ảnh dựặc trưng hình dạng 50
2.4.1 Moment bất biến 51
2.4.2 Biểu diễn hình dạng dựa vào vùng 52
2.4.3 Kí hiệu mô tả Fourier 54
2.5 Kết luận 56
Chương 3 58
ặt và thử nghiệm 58
3.1 Tìm kiếm ảnh dựặc trưng màu 58
3.1.1 Phương pháp dùng biểồ màu cục bộ 58
3.1.2 Phương pháp dùng biểồ màu toàn cục 62
3.1.3 Phương pháp dùng moment màu 62
3.2 Tìm kiếm dựặc trưng texture sử dụng ma trậồng hiện 66
3.3 Tìm kiếm dựặc trưng hình dạng sử dụng các moment bất biến 69
Kết luận 72
Tài liệu tham khảo 73
Tiếng Việt 73
Tiếng Anh 73
Các thuật ngữ và các từ viết tắt
CBIR Content-Based Image Retrieval
CH Color Histogram
Co-occurrence Matrix Ma trậồng hiện
CSDL Cơ sở dữ liệu
FD Fourier Descriptor
GB GigaByte
GCH Global Color Histogram
GI Grid Image
HSV Hue, Saturation, Value
LBP Local Binary Pattern
LCH Local Color Histogram
MMDBMS Multimedia DataBase Management System
RGB Red, Blue, Green
SQL Structure Query Language
URL Uniform Resouse Locator
XLB X-Lower Boundary
XUB X-Upper Boundary
Danh sách các hình trong luậ
Hình 1.1 Sơ ồ nguyên lý tự trị 9
Hình 1.2 Sơ ồ nguyên lý thống nhất 9
Hình 1.3 Sơ ồ nguyên lý tổ chức lai 10
Hình 1.4 Kiến trúc tổng quát của MMDBMS 12
Hình 1.5 Mô hình dữ liệu tổng quát 14
Hình 1.6 Hệ thống tìm kiếm ảnh theo nội dung tiêu biểu 24
Hình 2.1 Không gian màu RGB 27
Hình 2.2 Không gian màu HSV 28
Hình 2.3 ảnh trước và sau khi lượng tử hóa 29
Hình 2.4 Khoảng cách dạng Minkowski 31
Hình 2.5 Khoảng cách dạng toàn phương 31
Hình 2.6 Biểồ màu của 3 ảnh A, B, C 32
Hình 2.7 Khoảng cách hai ảnh A và B 34
Hình 2.8 Khoảng cách hai ảnh A và C 35
Hình 2.9 Khoảng cách hai ảnh B và C 35
Hình 2.10 ảnh D sau khi xoay 900 36
Hình 2.11 Ví dụ về ồ thị 38
Hình 2.12 Phương pháp xây dựồ thị 39
ồ thị ối có trọng số 39
Hình 2.14 Tậược có giá trị nhỏ nhất củồ thị 40
Hình 2.15 ảnh trước và sau khi chuyển thành ảnh xám 42
Hình 2.16 Một số texture tiêu biểu 43
Hình 2.17 Ví dụ ma trậồng hiện 44
Hình 2.18 Ví dụ phương pháp mẫu nhị phân cục bộ 47
Hình 2.19 Ví dụ hàm tương quan tự ộng 48
Hình 2.20 Ví dụ biểu diễn hình dạng theo vùng 53
Hình 3.1 Kết quả thực nghiệm phương pháp LCH với lưới 16?16 61
Hình 3.2 Kết quả thực nghiệm phương pháp LCH với lưới 8?8 61
Hình 3.3 Kết quả thực nghiệm phương pháp GCH 65
Hình 3.4 Kết quả thực nghiệm phương pháp moment màu 65
Hình 3.5 Kết quả thực nghiệm ma trậồng hiện với d(0,1) 68
Hình 3.6 Kết quả thực nghiệm ma trậồng hiện với d(1,1) 68
Hình 3.7 Kết quả thực nghiệm moment bất biến 71
Mở ầu
Ngay từ ầược coi là các thiết bị xử lý các biểu tượng, các kí
tự ầu vào có dạầu ra là các biểu tượng có cùng dạều
ở thành mô hình tính toán chuẩn dựa trên cơ sở máy Turing.
Tuy nhiên, trong nhữầất hiện nhu cầu vô cùng lớn về khả
khai thác và xử lý dữ liệu với số lượng khổng lồ mà các dữ liệu này thì không dễ
dàng diễn tả bằng các kí hiệu, dướột số ví dụ về kiểu dữ liệu như
nêu:
Dữ liệu hình ảnh (Image data): Các công ty thiết kế logo cho các cơ quan tổ chức
ọ cần phải duy trì một CSDL ảể khi tạo ra một logo mới sẽ
không bị trùng lặp với nhữ
Dữ liệu video (Video data): Trong ngữ cảnh khác, các sinh viên học từ xa muốn có
một bài giảng bằng video về một chủ ề ủa môn học. Trong trường hợp
này các trường học cần phải tạo ra một tập hợp các video có nội dung về bài
giảng của giáo viên với một chủ ề
Dữ liệu âm thanh (Audio data): Tình huống tương tự như trên, các sinh viên học
từ xa muốạn audio bài giảng của các giáo viên. Hoặc tình huống khác
như sinh viên học ngoại ngữ muốạn audio các cuộại. Trong
trường hợần phải tập hợạn audio trên theo một chủ ề nào
ể thuận tiện trong việc sử dụng sau này.
Dữ liệu tài liệản bao gồoạản, các
từạệản ở chỗ nó không chỉ chứa các thông
tin ở dạng thô mà còn chứựng cấu trúc và hình ảười dùng
tìm kiếm ảnh nhưng không thể tìm trong CSDL ảnh. Tuy nhiên nếu có một CSDL
tài liệu thì ta có thể truy cập vào ảnh trong tài liệ
Dữ liệu viết bằng tay (Handwritten data): Nhiều người thường ghi chú lên những
mảnh giấy nhỏều này thường hay bị mất thông tin, hoặc thông tin dễ bị mờ.
Xu thế gầế giới người ta cho rằện tử ngày càng phát
triển trong tương lai. Người sử dụng sẽ dùng các thiết bị ện tử ể ghi chép và
lưu trữ các ghi chú cá nhân. Mặc dù có nhiều ghi chép có thể chuyể
ASCII bằng kỹ thuật phân tích chữ viết tay, nhưng có rất nhiều ghi chú không thể
thực hiệược bởi vì các ghi chú thường chứa cả các nét loằng ngoằng hay các
biểồ khối.
Các kiểu dữ liệu liệỉ là một phần trong rất nhiều hình thức biểu
hiện của dữ liệu phát sinh tự nhiên trong các ứng dụng khác nhau. Từ những dữ
liệu mới phát sinh trên, ta thấy rằng các CSDL truyền thống không thể quản lý
các kiểu dữ liệượần phải có có một hệ thống quản lý tất cả các
loại dữ liệương tiệược hình thành.
Trong khuôn khổ của luận vột số vấề cơ bản của
một hệ quản trị ương tiện chẳng hạn các khái niệm, kiến trúc hệ
thống và mô hình dữ liệương tiệập trung nghiên cứu và cài
ặt thử nghiệm một số phương pháp tìm kiếm theo nội dung trên dữ liệ
phương tiện, cụ thể là dữ liệu ảnh.
Chương 1
Tổng quan về cơ sở dữ liệương tiện
1.1 Các khái niệm cơ bản
Dữ liệu Media là các kiểu thông tin hoặc biểu diễn của các kiểu thông tin như các
kí tự, ảnh, audio và video. Multimedia là tập hợp các kiểược sử dụng
với nhau. Hệ quản trị cơ sở dữ liệương tiện (Multimedia DataBase
Management System - MMDBMS) là một hệ thống giúp người dùng thao tác trên
các dữ liệu media một cách thích hợp và hiệu quả. Các thao tác cơ bản của hệ
quản trị CSDL thường là chèn, cập nhật, xóa và tìm kiếm mộối tượng trong
CSDL. Các dữ liệu media có nhữặểm chính như sau:
- Dữ liệặc biệt là dữ liệu audio và video có dung lượng rất lớn. Ví dụ
một mộạn phim khoảng 10 phút với chất lượng bình thường có thể ến 1,5
GB ở dạng không nén.
- Dữ liệu audio và video có tham số thời gian. Nó phảược thể hiện ở một tốc
ộ cố ịể ạược hiệu quả mong muốn.
- Dữ liệược biểu diễn ở dạặc thù, không có cấu trúc ngữ
ể máy tính có thể tự ộng nhận biết nội dung.
- ữ liệương tiệụ thuộc vào cách quan
sát và ý kiến chủ quan của con người. Cùng một hình ảnh nhưng có thể có các
nhận xét khác nhau bởi nhiều người.
- Dữ liệương tiện rấể biểu diễầủ nội dung cần
phải có rất nhiều tham số.
1.2 Nguyên lý thiết kế ương tiện
Trong MMDBMS, thông thường ta sử dụể tổ chức nội
dung của một MMDBMS:
1. Nguyên lý tự trị (principle of automony): ta phải lựa chọể nhóm chung
media cùng loại. Chỉ số hóa mỗi loại media này theo cách riêng và hiệu quả nhất
ể thuận tiện khi truy cậối tượng. Ta gọi là tự trị vì mỗi loại media
ược tổ chức riêng và phù hợp với từng loại. Hình 1.1 mô tả sơ ồ nguyên lý tự
trị.
ồng nhất (Principle of unformity): cố gắng tìm ra một cấu trúc trừu
tượng hơể chỉ số hóa mọi kiểu dữ liệu, khi truy cập vào các kiểu media khác
ều thông qua chỉ số này. Nói cách khác, chúng ta biểu diễn nội dung của
ối tượng media khác nhau (ảnh, tài liệu, audio, video ) trong cùng một cấu
trúc dữ liệển thuậể truy cập vào cấu trúc dữ liệ
Hình 1.2 mô tả sơ ồ nguyên lý thống nhất.
3. Nguyên lý tổ chức lai (Principle of hybird organization): là sự kết hợp hai
nguyên lý trên. Theo nguyên lý này, một số dữ liệu media sử dụng chỉ số riêng và
những dữ liệu còn lại sẽ sử dụng cùng một chỉ số. Hình 1.3 mô tả tổng quát một
sơ ồ nguyên lý tổ chức lai.
Cả ều có những ưu và nhượểm riêng. Nguyên lý tự trị
hỏi phải tạo ra các thuật toán và cấu trúc dữ liệu cho mỗi media riêng và cần
phải có kỹ thuật kết nối giữa các dữ liệu khác nhau. Ngược lại tổ chức dữ liệu
theo nguyên lý tự trị có thể dẫn tới thời gian xử lý nhanh. Hơn nữa, trong nhiều
trường hợp cấu trúc dữ liệu và thuật toán cho kho dữ liệu cụ thể ồn tại,
nguyên lý tự trị là một lựa chọn tốt.
Hình 1.1 Sơ ồ nguyên lý tự trị
Hình 1.2 Sơ ồ nguyên lý thống nhất
Hình 1.3 Sơ ồ nguyên lý tổ chức lai
Ngược lại với nguyên lý tự trị, nguyên lý thống nhấỏi chúng ta tìm ra cấu
trúc dữ liệể có thể lưu trữ thông tin về ảnh, video, audio, tài liệu ,
ềỏi phải khảo sát nội dung mỗi loại thông tin và cố gắưa ra các
phần chung củỉ số hóa trên các phầợi thế của
nguyên lý thống nhất là dễ ặt và thuật toán thường chạy nhanh. Trong công
nghiệp, nguyên lý thống nhấược sử dụng rộết bị chú
giải (metadata). Bất lợi là chú giải thườược tạo một cách thủ công. Tiến
trình tạo ra bằng tay thường mất nhiều thời gian và kinh phí. Hơn nữa một số
thông tin có thể bị mất nếu ngôn ngữ chú giảầủ ể mô tả
mọi khía cạnh của nội dung. Ví dụ, ngôn ngữ chú thích nội dung ảnh có thể làm
mất thông tin của từểm ảnh. Tương tự, ngôn ngữ chú thích âm thanh có
thể làm mất thông tin về ộ và tần số tín hiệu tại một số ểm.
Nguyên lý tổ chức dữ lai tận dụược các lợi thế của hai kiến trúc trướ
hạn chế ược các bất lợi của nó. Giả sử ta muốn tạo ra một MMDBMS có các
kiểu M1, , Mn. Ta sẽ chia các kiểu thành 2 tập hợp: những kiểu media có sẵn và
ỉ số, ta giữ lại các chỉ số ươồn tại; những kiểu
media không có sẵn và chưược chỉ số, ta biểu diễn theo các chỉ số thống nhất.
ạo lậươể kết nối nhiều nguồn dữ liệu khác nhau nhờ
các chỉ số của chúng. Theo nguyên lý này, sẽ sử dụng tốồ
tồn tại, tiết kiệược thời gian và sức lực bởi vì tận dụược các chỉ số
có.
1.3 Kiến trúc hệ thống và mô hình dữ liệương tiện
1.3.1 Kiến trúc tổng quát
Kiến trúc hệ thống của một MMDBMS phải mềm dẻo và có khả ở rộể
hỗ trợ các ứng dụng, các kiểu truy vấn và nội dung dữ liệể giải quyết vấề
này, MMDBMS bao gồm một số module chứứới có thể
thêm vào, các chứể loại bỏ, cập nhật.
Một tính chất quan trọng củữ liệược tổ chức phân
tán. Lý do là dữ liệu media thường có dung lượng lớược dùng chung bởi
nhiều người, nếu duy trì một CSDL riêng cho từng cá nhân sẽ rất tốn kém. Vì vậy,
trong các MMDBMS thường có thêm một module chứền thông.
Hình 1.4 mô tả kiến trúc tổng quát của mộối chức
ện người dùng, khối trích chọặc trưng, bộ phận truyền
thông, công cụ tìm kiếm và chỉ số hóa, và cuối cùng bộ phận quản lý lưu trữ. Các
khối chứược mô tả thông qua các hoạộng.
Các thao tác chính trong mộếm. Trong thao tác
chèn, người dùng chỉ ối tượng mới thông qua giao diệối tượng
ược lưu trữ thành các file hoặc là dữ liệược nhập vào từ các thiết bị
ngoại vi như ội dung hoặặc trưng của các
ối tượng này sẽ ược trích chọn tự ộng hoặc bán tự ộng thông qua các công
cụ ược cung cấp trong khối trích chọặc trưặc trưối
tượng gốc sẽ ược gởến server thông qua bộ phận truyền thông. Tại server,
ặc trưng sẽ ược tổ chức và chỉ số hóa một cách thích hợp sao cho việc tìm
kiếạt hiệu quả tốt nhấtối tượng gốc sẽ ược lưu trữ trên server
thông qua bộ phận lưu trữ.
Hình 1.4 Kiến trúc tổng quát của MMDBMS
Trong thao tác tìm kiếm, ngườưa ra truy vấn thông qua giao diện người
dùng. Truy vấn có thể là mộặc dữ liệược nhập vào thông qua
các thiết bị ngoại vi. Giao diện ngườễối
tượng trong CSDL, người dùng có thể chọn mộối tượể làm truy
vấn. Nếối tượng trong truy vấặc trưng chính của
ối tượược trích chọn và gởến server thông qua khối truyền thông.
Khối chỉ số hóa và tìm kiếối tượng tương tự nhất và gởi
ối tượến giao diện người dùng thông qua khối truyền thông, giao
diện người dùng sẽ trình diễối tượ
1.3.2 Mô hình dữ liệu
Mô hình dữ liệu trong CSDL cung cấp một ngôn ngữ mô tả tính chất của dữ liệu
ể lưu trữ và tìm kiếm. Ngôn ngữ này phải cho ngườị
chèn, xóa, sửổi và tìm kiếối tượng trong CSDL. Mô hình dữ liệ
phương tiện nắm bắt các tính chấộủa dữ liệương tiện và
cung cấp các dạng cơ bảể phát triển các công cụ sử dụng dữ liệương
tiện. Các tính chấể ối tượng tạo ra dữ liệương tiện,
các mối liên hệ giữối tượng và các tính chất củối tượng. Các tính chất
ộng của dữ liệu có thể là sự tương tác giữối tượối
tượng. Các mô hình dữ liệu phương tiện phảứng các yêu cầu cơ bản như
sau:
- Mô hình dữ liệu phải có khả ở rộối tượng mới có thể
ược bổ sung.
- Mô hình dữ liệu phải có khả ểu diễn các kiểu media cơ bản và các mối
quan hệ không gian và thời gian củối tượng.
- Mô hình dữ liệu phải cho phép lưu trữ và tìm kiếm hiệu quả.
Một mô hình dữ liệu tổng quát thể hiện trong hình 1.5. Tầối tượng chỉ rõ các
mối quan hệ về không gian, thời gian và sự tích hợp giữối tượng. Tầng
các kiểu media chứa các kiểu media chung như text, image, audio và video. Tại
mức ặc trưng và thuộc tính củối tượược chỉ rõ. Ví dụối với
ảnh có thể có các tính chất như kích thước ảnh, biểồ ối tượng
chính chứa trong ảnh. Tầng khuôn dạng media chỉ rõ khuôn dạng mà dữ liệu
ược lưu trữ. Một kiểu media thông thường có nhiều khuôn dạng ví dụ như ảnh
có thể có dạng thô hoặc dạng nén. Kiến trúc vừa nêu chỉ là một kiến trúc tổng
quát, tùy theo mỗi ứng dụng khác nhau sẽ có một mô hình dữ liệu khác nhau,
không có một tiêu chuẩn chung cho các tầng.
Hình 1.5 Mô hình dữ liệu tổng quát
1.3.3 Giao diện người dùng
Người dùng tương tác với MMDBMS thông qua một giao diện. Chứ
của giao diện là cho phép người dùng chèn, xóa, cập nhậối tượng trong
CSDL, nhập vào các truy vấn và biểu diễn các kết quả truy vấn. Một giao diện
người dùng tốt phải hỗ trợ các chứ
- Cung cấp công cụ cho ngườối tượng mới vào CSDL một cách
dễ dàng.
- Cung cấp công cụ cho người dùng nhập truy vấn một cách hiệu quả hoặc cho
hệ thống biết các thông tin cần thiết của truy vấn.
- Biểu diễn kết quả truy vấn một cách hiệu quả.
- Giao diện thân thiện với người dùng.
Vì các tính chấặc thù của dữ liệương tiện, nên giao diện và truy vấn
của MMDBMS có một số ểm cần lưu ý như sau:
- Trong CSDL truyền thống, các bản ghi có cấu trúc với số lượng các thuộc tính cố
ịnh, mỗi bảược chèn một cách thủ công vào CSDL bằng việc chỉ ra giá trị
các thuộc tính. Trong MMDBMS, mỗi mục dữ liệu có thể là một kiểu media bất kì
hoặc là sự kết hợp của các kiểu media. Những dữ liệu này không có cấu trúc và
thuộc tính cố ịện người dùng phải cho phép người dùng chỉ rõ
các kiểu dữ liệu vào, các kiểu media kết hợp các kiểu thuộể trích chọn và
chỉ số hóa.
- Các truy vấn trong MMDBMS thường có nhiều loại và có nội dung không rõ
ràng. Truy vấn nhiều loại là vì người dùng có thể ặc tả truy vấn trong nhiều
cách khác nhau. Truy vấn là không rõ ràng bởi vì người dùng có thể chỉ biết
những gì mà họ thấy nhưng không mô tả một cách chính xác hoặc các thông tin
cần thiếượị
Tìm kiếm là một thao tác rất quan trọng trong các hệ quản trị CSDL, trong
MMDBMS thông thường có hai dạng tìm kiếm: tìm kiếm bằặc tả và tìm
kiếm theo mẫu. Giao diện người dùng cần phải hỗ trợ hai phương pháp tìm
kiếm này. Tìm kiếm bằặc tả là người dùng chỉ ra các từ khóa và các
tham số mô tả ặc trưng hoặc các thuộc tính chính của thông tin cần thiết.
Có hai loại truy vấn hỗ trợ cho các thao tác tìm kiếm bằặc tả
- Truy vấn dựa vào metadata: metadata là các dạng thuộc tính của các mục dữ
liệu trong CSDL ví dụ nó có thể là tên tác giả và ngày tạo lập của mộối tượng
tài liệu, hoặc có thể là tên file dữ liệu.
- Truy vấn dựa vào chú thích: chú thích là các chuỗản mô tả nội dung của
một mục dữ liệu. Truy vấn là các từ khóa hoặc là các chuỗản, Việc tìm
kiếm dựa vào tính chính xác giữa nội dung truy vấn và các chú thích.
ối với tìm kiếm bằng mẫu, giao diện ngườặc tả truy vấn với các kiểu
media khác nhau hoặc kết hợp của các kiểu dữ liệu media. Truy vấưa ra một
ối tượng mẫu và hệ thống sẽ ối tượng tương tự vớối
tượng mẫện người dùng phải hỗ trợ các chứập dữ liệu
ể người dùng mô tả các mẫu, chẳng hạn như microphone, camera, scanner.
Tuy nhiên, ngườể sử dụối tượồn tại trong CSDL
ể làm truy vấể ượều này, giao diện phải có chứễn
ối tượười dùng có thể chọn mộối tượ
trình diễể làm truy vấn. Một lý do nữể giao diện phải hỗ trợ chứ
trình diễười dùng nhiều khi không biết chính xác những gì họ
muốn, họ chỉ có thể nhận ra nó khi họ thấứễn sẽ
hiển thị tất cả hoặc là một số ối tượng, ngườẽ chọn ra một
ối tượng thích hợể làm truy vấn.
Một vấề quan trọng trong giao diệấề trình diễn các kết quả truy
vấn cho người dùng. Giao diện phải biểu diễược tất cả các loại media và các
mối quan hệ không gian và thời gian củối tượng tích hợp. Kết quả truy
vấn ở nhiều dạng khác nhau có thể là mộạn audio dài, một ảnh có kích
thước lớện phải trích chọn nhữạn thông tin chủ yếể
trình diễn cho người dùng lựa chọn.
1.3.4 Trích chọặc trưng, chỉ số ộ ương tự
Các dữ liệương tiệược trích chọặc trưng và trích chọn
các thuộc tính. Trong quá trình tìm kiếặc trưng và thuộược so
ối tượất lượng của trích chọặc trưng
quyếịnh hiệu quả tìm kiếm. Nếặc trưng của mộối tượược
trích chọối tượng này sẽ ược tìm thấy trong quá trình tìm
kiếm. Thao tác trích chọặc trưng phải giải quyếược các vấề sau:
- ặc trưng và thuộọn phảầủ ể có thể biểu diễn nội dung
của các mục thông tin.
- ặc trưng và thuộược trích chọn phảọng, súc tích. Nếặc
trưng quá phức tạp và lớn sẽ ảnh hưởến hiệu quả tìm kiếm.
- Tính toán khoảng cách củặc trưng phải hiệu quả.
Tổng quát, có bốn loạặc trưng cơ bảảặc
trưng nội dung ở mức thấặc trưng nội dung ở mức cao. Metadata bao
gồm các dạng hoặc các thuộc tính thực củối tượng ví dụ như tên tác giả, ngày
tạề củối tượng. Metadata không mô tả hoặc giải thích nội dung
củối tượng.
ảảể mô tả nộối tượ
bản có thể các từ khóa hoặc chuỗản tự do. Mặản có
những hạn chế như phụ thuộc người mô tả và thườầủ
tuy nhiên nó vẫược sử dụng rộữu ích. Thông thường, người dùng
sử dụản kết hợp với một số ặc trưng khác.
ặc trưng mức thấp nắm bắt, các thông số củối tượương tiện và các
mối quan hệ không gian và thời gian của các cặối tượng. Các loại media khác
nhau sẽ có nhữặc trưng mức thấặc trưng mức
thấp bao gồm âm sắc, phân phối tầng sốặc trưng mức thấp
của ảnh bao gồm phân phối màu, kết cấu bề mặt, hình dạối tượng và các
mối quan hệ ặc trưng mức thấp của video bao gồm tham số
thời gian và một số ặc trưng giống như ảiểm thuận lợi củặc trưng
mức thấp là nó có thể ược trích chọn một cách tự ộng.
ặc trưng mức cao cố gắng nhận dạng và hiểối tượng. Ngoại trừ nhận
dạản và tiếng nói, rấể có thể nhận dạược các mẫu audio và
ối tượng trực quan khác.
ọặc trưng, các kỹ thuật chỉ số hóa giúp tổ chứặc
trưể tìm kiếm hiệu quả. Mỗối tượng có thể có nhiềặc trưể biểu
diễn và mỗặc trưng lại có nhiều tham sốần phải có cơ chế chỉ số hóa
tốể tổ chứặc trưng này.
Thao tác tìm kiếm trong dữ liệương tiện thường dựa vào tính tương tự
thay vì tìm kiếm chính xác giữa các mục trong CSDL. Tính tương tự ược tính
toán dựặc trưng và thuộọn. Tuy nhiên, sự thích hợp
của kết quả tìm kiếm là nh giá chủ quan của con ngườầu chính
củộ ương tự là giá trị tương tự ược tính phải phù hợp nhận xét của con
người.
1.4 Cơ sở dữ liệu ảnh
ảnh số có một vị trí vượt trội so với các dữ liệu media khác như video, audio,
ống như dữ liệược sử dụng rộ
trong các ngành công nghiệp giải trí và tin tức), ảnh là một phần quan trọng
trong nhiềực như nghệ thuật, lịch sử, y tếầu khí, dự báo thời
tiết v.ảnh số ất quan trọng các hoạộng của con người
như nông nghiệp, quản lý rừng, khoa họất, quy hoạị, xa hơn nữa
ể thao và giải trí. Trước khi giới thiệu về CSDL ảnh, chúng tôi giới thiệu
khái quát một số CSDL truyền thống.
1.4.1 Các cơ sở dữ liệu truyền thống
ịột cách không hình thức CSDL quan hệ là một bảng gồm các cột và
các dòng, mỗược gọi là một bộ, mỗi cột gọi là một thuộc tính, mỗi thuộc
tính phải có một kiểu dữ liệu duy nhất. Một ví dụ về CSDL quan hệ có tên là
Client lưu trữ các thông tin khách hàng của mộượồ chi
tiết như sau: Client(Comp, Fname, Lname, AcountNum, PhoneNum, StreetNum,
ộc tính Comp, Fname, Lname, StreetName,
City có kiểu dữ liệu là chuỗản mô tả tên công ty, họ và tên khách hàng, tên
ường, thành phố tương ứng. AcountNum, PhoneNum, StreetNum có kiểu là số
nguyên dương mô tả số tài khoản, số ện thoại cá nhân và số nhà tương ứng
của khách hàng. Thao tác truy vấn trong CSDL quan hệ thường dùng các công cụ
như SQL hoặại số quan hệ. Một câu truy vấn thông thường trong SQL là
ủa câu truy vấn
trên là chọn những giá trị của các thuộrong quan hệ R1, R2,
ớều kiện F cho trước. Trong ví dụ mô tả ở trên, giả sử ta muốn biết số
ện thoại của mộấn trong
SQL có thể như
Lname=