~ ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯ Ờ N G ĐẠI HỌ C CÔNG N G H Ệ
Hoàng Minh Hiền
N G H I Ê N C Ứ U Ứ N G D Ụ N G
C ơ S Ở D ữ L I Ệ U Q U A N H Ệ M Ở R Ộ N G V À O
X Â Y D ự N G C ơ S Ở D ữ L I Ệ U Đ A P H Ữ Ơ N G T I Ệ N
• ♦ m
Ngành: Công nghệ thông tin
LUẬN VÀN THẠC Sĩ
NGƯỜI HƯỞNG DẴN KHOA HỌC:
PGS. TS ĐẶNG VĂN ĐỨC
Hà N ộ i- 2 0 0 5
M Ụ C L Ụ C
• ■
MỞ ĐẦU
.
4
CHƯƠNG 1: GIỚI THIỆU c ơ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN 6
1.1 Nhu cầu cần có CO' sở dữ liệu đa phưorng tiện (CSDLĐPT) 6
1.2 Các nhiệm vụ thiết kế cơ sở dữ liệu đa phương tiện 8
1.2.1 Kiến trúc
.
9
1.2.2 Mô hỉnh dữ liệu
.
.
.
.
.
.
11
1.2.2.1 Yêu cầu 11
1.2.2.2 Mô hình dữ liệu đa phương tiện tổng quát 12
1.2.2.3 Mô hinh dữ liệu thí dụ 14
1.2.3 Thiết kế giao diện người sử đụng 18
1.2.3.1 Cơ sờ dữ liệu population 18
1.2.3.2 HỖ trợ truy vấn
.
19
1.2.3.3 Trình diễn kết quả 21
1.2.4 Trích chọn đặc trưng, chỉ mục và đo tương tự 21
1.2.4.1 Trích chọn đặc trưng 22
1.2.4.2 Chi số hỏa cấu trúc
.
24
1.2.4.3 Đo tính tương tự 24
1.2.5 Đảm bào chất lượng dịch vụ (QoS) trong client, server và hệ thống truyền tin
25
1.2.6 Các nhiệm vụ khác
.
26
1.2.6.1 Nén dữ liệu đa phương tiện
.
26
1.2.6.2 Chuẩn hóa biểu diễn dữ liệu 27
CHƯƠNG 2: VẤN ĐÈ LựA CHỌN MÔ HÌNH c ơ SỞ DỮ LIỆU CHO c ơ SỞ DỮ
LIỆU ĐA PHƯƠNG TIỆN
.
.
.
.
28
2.1 Mô hình cơ sở dữ liệu quan h ệ 28
2.2 Mô bình cơ sở dữ liệu hướng đối tưọrng
29
23 Mô hình CO’ sở dữ liệu đối tượng quan hệ
31
2.4 Mô hình quan hệ mờ rộng trong Oracle InterMedia
.
32
2.4.1 Quản lý nội dung đa phương tiện
.
33
2.4.3 Kiểu đối tượng ảnh ORDImage trong Oracle InterMedia
.
38
2.4.4 Kiểu đổi tuợng âm thanh ORDAudio 41
2.4.5 Kiểu đổi tuợng video ORDVideo
42
2.4.6 Lưu trữ dữ liệu đa phương tiện 43
2.4.7 Nạp dữ liệu đa phương tiện 44
2.4.8 Truy cập dữ liệu đa phương tiện 46
2.4.9 Phân phối nội dung dữ liệu đa phương tiện 52
LỜI CẢM Ơ N 3
2.4.10 Phương time truỵ vấn dữ liệu đa phương tiện theo nội dung 53
2.4.10.1 Khái niệm tổng quát và lợi ích 54
2.4.10.2 Thực hiện truy vằn dữ liệu dựa trên nội dung 55
2.4.10.3 Thực hiện ánh xạ
.
.
61
2.4.10.4 Dùng chi mục để so sánh các dấu hiệu 66
2A10.5 Lựa chọn ảnh để ánh xạ 67
2.4.11 Kiến trúc Oracle /rt/erMedia 69
2.4.12 Khả năng mở rộng cùa Oracle InterMedia 72
2.5 Mô hình đổi tượng quan hệ trong DB2 Extender 72
2.5.1 Giới thiệu DB2 extender và các cách thức mới tìm kiểm thông tin 73
2.5.2 Đặc điểm hướng đổi tượng
.
75
2.5.3 Khả nảng quản lý dữ liệu đa phương tiện 80
2 5.3.1 Lưu trữ
.
.
81
2.5.3.2 Truy vấn ;
82
2.5.3.3 Sửa đổi
.
82
2.5.4 DB2 extender hỗ trợ tìm kiếm ảnh theo nội dung 83
2.6 Nhận xét
.
86
CHƯƠNG 3: CÀI ĐẶT THỬ NGHIỆM 87
3.1 Mô tả bài toán
.
.
87
3.1.1 Mục tiêu 87
3.1.2 Yêu cầu
87
3.2 Lựa chọn công cụ và môi trường phát triển
88
3.3 Hướng dẫn cài đặt Oracle InterMedỉa và kiểm tra cài đặt
$8
3.3.1 Phận cài đặt
.
88
3.1.2 Kiểm tra kềt quả cài đặt 90
3.4 Mô tả các chức năng chính của chương trình thử nghiệm
92
3.4.1 Sơ đồ chức năng
.
92
3.4.2 Mô tả các chức năng kèm theo hình ảnh 93
3.4.2.1 Các thao tác (nạp, xuất, sửa đối và xoá) trên đữ liệu 98
3.4.2.2 Thực thi dữ liệu âm thanh 102
3A.2.3
Tìm kiếm dữ liệu ảnh
.
104
3.5 Nhận xét phần thử nghiệm 108
KÉT LUẬN 110
TÀI LIỆU THAM KHẢO 112
D a n h m u c c a c k y h i e u v i§ t t a t
AIV Extender Audio Image Video Extender
API Application Program Interface
ASCII American Standard Code for Information Interchange
BC4J Oracle Bussiness Component for Java
BFILE File Based Large Objects
BLOB Binary Large Object
CAD Computer Aid Design
CBT Computer Based Training
CLOBs Character Large Objects
DB Database
DB2 CLI DB2 Call Level Interface
DBCLOBs Double byte Character Large Objects
DBMS Database Management System
DTD Document Type Definition
HTML Hypertext Markup Language
HTTP Hypertext Tranfer Protocol
HTTPD Hypertext Tranfer Protocol Daemon
IP Internet Protocol
IR Information Retrieval
JAI Java Advanced Imaging
JDBC Java Database Connectivity
JMF Java Media Framework
JSP Java Server Pages
JVM Java Virtual Machine
LOB Large Object Binary
MMDB Multimedia Database
M IM E
M ultipurpose Internet M ail Extensions
OS
O perating System
O ID
O bject Identifier
OD B O bject D atabase
O O D B
O bject O riented D atabase
O RD B O b ject R elational D atabase
tJD F s U ser - D efined Functions
U D Ts
U ser - D efined Types
UI
U ser Interface
URLs
U niform R esource Locator
QB IC
Q uery by Im age Content
QoS
Q uality o f Service
RDB
R elational D atabase
RTSP
R eal-Tim e Stream ing Protocol
XM L E xtensib le M arkup Language
W ebDA V W ebased Distributed A uthoring and V ersioning
M Ở Đ À U
Những thay đổi của môi trường xã hội cùng với sự xuất hiện của nhiều công nghệ
mới dẫn đến việc ngày càng có nhiều phương thức trao đổi và thể hiện thông tin. Trước
đây, con người thường thể hiện thông tin qua các văn bản bằng việc sử dụng các ký tự, số
hoặc có thêm một số hình ảnh có ý nghĩa. Nhưng ngày nay, thông tin truvền tải ý nghĩa
của nó qua nhiều định dạng khảc nhau như âm thanh, số, hình ành có hiệu ứng, hay các
đoạn phim sống động v.v. Sự phong phú trong cách thể hiện các dạng truyền thông cho
thấy các dạng dữ liệu đa phương tiện là sự kết hợp của nhiều dạng dữ liệu khác nhau
ngày càng cỏ vai trò quan trọng.
Đã có nhiều đề tài nghiên cứu và phát triển các cách thức truvền thông và thể hiện
dữ liệu đa phương tiện, hoặc một sổ vấn đề về lưu trữ và truy xuất dữ liệu đa phương tiện
qua các hệ quản trị cơ sở dữ ỉiệu sao cho hiệu quả. Mặc dù trên thực tể có rất nhiều hệ
quản trị cơ sở đữ ỉiệu được sử dụng để hỗ trợ cho vấn đề quản lý dữ liệu nhưng dường
như các hệ quàn trị này chira thực sự có khả năng quản lý tốt các dạng dữ liệu đa phương
tiện. Do vậy cần có cơ sở dữ liệu chuyên biệt dùng để quản lý dữ liệu đa phương tiện là
một nhu cầu tất yếu. Xuất phát từ vấn đề trên mà để tài “Nghiên cứu ứng dụng cơ sở dữ
liệu quan hệ mở rộng vào xây dụtìg cơ sở dữ liệu đa phương tiện ” đã được lựa chọn.
Nội dung trình bày phần nghiên cứu được chia làm ba chương:
Chương 1 : Giới thiệu cơ sờ dữ liệu đa phương tiện trinh bày nhu cẩu cẩn cỏ cơ sờ
dĩr liệu đa phương tiện và các nhiệm vụ thiết kể cơ sờ dữ liệu đá phương tiện.
Chương 2: vấn đề lựa chọn mô hình cơ sờ dữ liệu cho cơ sờ dữ liệu đa phương
tiện trình bày các mô hình cơ sở đữ liệu quan hệ, hướng đổi tượng và đối tượng quan hệ
đề thấy được khả năng ứng dụng riêng của từng mô hình cho các ứng dụng dữ liệu đa
phương tiện. Cũng trong nội dung chương 2, hai mô hình cơ sờ dừ liệu đổi tượng quan hệ
nồi bật là Oracle InterMedia và DB2 Extender được trình bày đề phân tích các khả năng
quân lý dữ liệu đa phương tiện.
Chương 3: Cài đặt thừ nghiệm một cơ sờ dừ liệu đa phương tiện trên hệ quản trị
Oracle để kiểm tra khả năng hồ trợ đa phương tiện của thành phần Oracle InterMedia
được tích hợp trong Oracle.
Phần kết luận tóm tắt các kết quả đạt được và đưa ra một số phương hưởng nghiên
cứu để đánh giá được vai trò quan trọng cùa dữ liệu đa phương tiện trong nhiều lĩnh vực.
C h ư ơ n g 1
G IỚ I T H IỆ U C ơ S Ở D ữ L IỆ U
■ •
Đ A P H Ư Ơ N G T IỆ N
■
Mục đích của cbucmg này nhẩn mạnh đến tầm quan trọng của dữ liệu đa
phương tiện trong nhiều ứng dụng cùa cuộc sống dẫn đến nhu cầu lưu trữ và khai
thác chúng sao cho hiệu quả. Do vậy cần có cơ sở dữ liệu đa phương tiện (mục
l.l)[2][3]. Vậy khi xây dựng cơ sở dừ liệu đa phương tiện cần quan tâm đến những
yếu tố nào? Mục 1.2 trình bày các nhiệm vụ chinh khi thiết kế cơ sờ dữ liệu đa
phương tiện bao gồm kiến trúc, mô hình dừ liệu, thiết kế giao diện người sử dụng,
trích chọn đặc trưng, đàm bảo chất lượng dịch vụ và một sổ nhiệm vụ khác [2][3],
1.1 Nhu cầu cần có c ơ s ử d ữ liệu đa p h ư o n g tiện (CSDLĐPT)
Thông tin đa phương tiện hay còn gọi là dữ liệu đa phương tiện, thể hiện các
thông tin của nìáy tính qua các dạng truyền thông như video, sound, animation,
images, alphanumerics hoặc có sự kết hợp giữa các dạng truyền thông này.
Dựa trên các loại dữ liệu truyền thông chủng ta có thể phân ra làm 2 dạng
truyền thông là tĩnh và động. Dữ liệu tĩnh có nội dung và ý nghĩa không phụ thuộc
vào thời gian thể hiện như alphanumerics, images, graphics. Dữ liệu động có nội
dung và ý nghĩa phụ thuộc thời gian. Chẳng hạn như khi thực hiện một đoạn video
cần dịch chuyển khoảiig 25 đến 30 frames/giây để làm hình ảnh và âm thanh thay
đổi. Các dạng dữ liệu động khác như sound và animation đều có mối quan hệ với
thời gian.
Việc truyền đạt thông tin và ý nghĩa cùa thông tin trong thực tế cũng cỏ rất
nhiều phương thức khác nhau. Tuy nhiên, với dữ liệu đa phương tiện, các thông tin
truyền đạt ý nghĩa nhanh và dễ hiểu hơn. Do vậy mà ngày nay dữ liệu đa phương
tiện được sử đụng trong nhiều ứng dụng thực tế như nghệ thuật, giáo dục, giải trí,
kỹ thuật, y học, toán học, cả trong các nghiên cứu khoa học, v.v.
*6 -
Ví dụ như trong giáo dục, dữ liệu da phương tiện được dùng để tạo ra các
khỏa học dựa trên sự hồ trợ của máy tính (computer based training - CBTs) và các
loại sách học khác. Một chuơng trình CBT là một chuồi các trình diễn
(presentations) bao gồm có text đề diễn giải cụ thể cho từng chù đề và có nhiều
phẩn minh họa bằng việc sử dụng các định dạng dữ liệu khác. Do vậy, người học sẽ
thấy thoải mải và tiếp thu nhanh hơn với nhũng bài giảng có sử dụng đữ liệu đa
phương tiện. Trong lĩnh vực giải trí, dữ liệu đa phương tiện có vaí trò hết sức quan
trọng giúp tạo ra các hiệu ứng và sự sống động trong các bộ phim, các chương trình
trò chơi giài trí v.v. Bên cạnh đó, các ngành như kỹ thuật máy, tự động hóa cũng sử
dụng dữ liệu đa phương tiện như một công cụ hỗ trợ thiết kế mẫu mã sản phẩm dựa
trên các phối cảnh khác nhau v.v. Một trong những sản phẩm được biết đến đó tà
chương trình thiết kế bằng máy tính (computer aided design - CAD).
Một sổ lĩnh vực ứng đụng dữ liệu đa phưcmg tiện kể trên cho thấy dữ liệu đa
phương tiện đang ngày càng gia tăng và có vai ừò rất quan trọng trong việc truyền
đạt thông tin đẫn đến những yêu cầu cần thiết về vấn đề quản lý như:
> Khả năng lưu trữ dữ liệu do kích thước dừ liệu đa phương tiện lởn hơn so
với các dạng dữ liệu thông thường;
> Hỗ trợ truy vẩn nhanh dữ liệu đa phương tiện do thời gian truyền tải dữ
liệu khi truy vấn không thể quả chậm vì tại mồi thời điểm ý nghĩa của dữ
liệu đa phương tiện có thể thay đổi.
Hiện nay, có nhiều hệ quản trị cơ sở dữ liệu (HQTCSDL)(Database
Management Systems - DBMS) cho phép người dùng tạo và quàn trị các loại cơ sở
dữ liệu (CSDL)(Database - DB) khác nhau. Mồi một CSDL là một tập hợp dữ liệu
có quan hệ với nhau. Khi làm việc với CSDL thì dữ liệu được xem như một tập các
bản ghi.
Tuy nhiên, do dừ liệu đa phương tiện có nhiều kiểu dữ liệu khác nhau, cân
được ]ưu trữ dưới các hỉnh thức và định dạng khác nhau vì vậy cần có CSDLĐPT.
Ngoài chức năng lưu trữ dữ liệu, người sừ dụng còn có thể thực hiện các thao tác
cập nhật, sửa, xoả v.v trên CSDLĐPT như một cơ sờ dừ liệu truyền thổng và khai
thác thông tin từ CSDL đó phục vụ cho mục đích của người sử dụng.
Xuẳt phát từ những yêu cầu đặt ra, để thực hiện quản lý tốt dừ liệu đa
phương cần có một hệ quàn trị CSDLĐPT chuyên biệt được xây dựng theo một
phương pháp chung:
> Xác định mô hinh CSDL (quan hệ. đối tượng - quan hệ, hưởng đối tượng);
> Xây dựng kiến trúc cho CSDL;
> Xác định các nội dung cần lưu trừ;
> Xây dựng các kiểu dữ liệu, các đối tượng dữ liệu mà ứng dụng cần lưu trữ
trong đó bao gồm các phương thức đi kèm với các đối tượng, v.v.
Để hiểu rõ han các yêu cầu trên, mục 1.2 sẽ trình bày các nhiệm vụ thiết kế
CSDLĐPT.
1.2 C á c n h iệm vụ thiết kế CO' s ở d ữ liệu đ a p h ư ơ n g tiện
Phần này khảo sát các vấn đề bao gồm:
> Khái quát về kién trúc môđun CSDLĐPT. Các môđun chính của
CSDLĐPT bao gồm giao diện người sử dụng (User Interface - UI), trích
chọn đặc trưng, quản lý truyền tin, quản lý lưu trữ, chỉ số hỏa và công cụ
tìm kiếm.
> Mô hình dữ liệu của CSDLĐPT xác định thông tin được tổ chức và lưu trữ
như thế nào, hỗ trợ loại truy vấn nào (query). Các yêu cầu về mô hình dữ
liệu cùa CSDLĐPT và sự phân cấp mô hình dữ liệu cũng sẽ được trình bày.
> UI - giao diện người sử dụng cung cấp công cụ chèn các items của cơ sờ
dữ liệu, câu truy vấn và trình diễn kết quả truy vấn.
> Trong CSDLĐPT, các đặc trưng và thuộc tính cùa dừ liệu đa phương tiện
được trích chọn và lưu trữ với dữ liệu. Các đặc trưng được tổ chức nhờ cấu
trúc chi mục để tìm kiểm hiệu quả. Ngoài ra còn cỏ hình thứ tìm kiếm dựa
trên ca sò thước do tương tự giữa đặc trưng tpjv vấn và đặc trưng dữ liệu.
> Tim kiếm và trinh diễn đa phương tiện phái đáp ứng một số ràng buộc về
thời gian và không gian. Các ràng buộc này được xác định bàntỉ các yêu
cầu về chất lượng dịch vụ (Quality of Serv ice - QoS) cùa đối tượng và ứng
dụng đa phương tiện. Mọi phân hệ. bao gồm hệ điểu hành (Operating
System - OS), truyền tin, quàn lý lưu trữ phái làm việc cùng nhau để đạt
được QoS mong muốn.
> Các nhiệm vụ khác bao gồm nén dừ liệu, chuẩn trình diễn dữ liệu, tiến
trình truy vẩn cũng cần được quan tâm.
1.2.1 Kiến trúc
Kiến trúc CSDLĐPT cần mềm dẻo và dễ mờ rộng để hỗ trợ các ứng dụng,
truy vấn nội đung khác nhau. Để đạt yêu cầu này CSDLĐPT bao gồm nhiều môđun
chức năng quản lý. Bộ quàn lý mới có khả năng mờ rộng chức năng của CSDLĐPT
dễ dàng.
Cơ chế khác cùa CSDLĐPT là khả năng phân tán tự nhiên, nó bao gồm
nhiều server và client. Cơ chế này hình thành từ đặc điểm kích thước dữ liệu đa
phương tiện rất lớn và nhu cầu ứng dụng đồng thời của nhiều người tại một thời
điểm như hệ thống thư viện sổ và hệ thống video theo yêu cầu.
-9 -
H ình 1.1 : Kiến trú c cơ sở của C SD L Đ PT
- 10-
Hình 1.1 chi ra kiến trúc cơ sờ của CSDLĐPT. Các khối chức năng chính
bao gồm UI, bộ trích chọn đặc trưng, bộ quàn lý truyền thông, bộ phận đánh chi số
và môtơ tìm kiếm. Các chức năng chính sẽ được mô tả thông qua các kịch bàn vận
hành cùa CSDLĐPT. Hai thao tác chinh cùa CSDLĐPT là chèn mục đa phương tiện
mới và truy vấn thông tin.
Chèn mục đa phưong tiện mới:
Người sử dụng đặc tả một hay một nhóm mục dữ liệu đa phương tiện thông
qua UI. Các mục được lưu trong tệp hay nhập trực tiếp từ thiết bị ngoài như
microphone, CD player, VCR hay video camera. Người sử dụng cũng có thể tự vẽ
hình làm dữ liệu đầu vào. Nội dung của chúng được trích trọn tự động hay bán tự
động bằng các công cụ của bộ trích chọn đặc trưng. Các đặc trưng này và các mục
gốc được gửi về máy chù thông qua bộ quàn lý truyền tin. Tại máy chù, các đặc
trưng được tổ chức (chèn) theo lược đồ chì số hóa nào đó để truy vấn hiệu quả
thông qua mô tơ truy vấn và chỉ số hóa. Các thông tin chi số và các mục gốc được
lưu trừ phù hợp thông qua bộ quản lý lưu trữ.
Truy vấn thông tin:
Người sử dụng đưa ra hay đặc tà truy vấn thông qua UI. Truy vấn có thể là
tệp lưu trữ trên đĩa hay nhập từ thiết bị vào (bàn phím, chuột). Có thể duyệt các mục
trong CSDL để sử dụng nó làm mục truy vấn. Nếu mục truy vấn không phải là cái
đã có sẵn trong CSDL, các đặc trưng chính của truy vấn được trích chọn theo cách
như khi thực hiện chèn mục đữ liệu. Các đặc trưng này được gửi đến máy chủ thông
qua bộ quản lý truyền tin. Môtơ chi sổ hóa và tìm kiếm tìm trong CSDL để có các
mục dữ liệu phù hợp với các đặc trưng truy vấn. Các mục này được truy vấn nhờ bộ
quản lý lưu trừ và gửi đến UI thông qua bộ quản lý truyền tin. UI hiển thị danh sách
các mục dữ liệu tới người sử dụng.
Hình 1.1 là kiến trúc cơ sờ. Có thể bổ sung các khối chức năng hay bộ quản
lý để đáp ứng yêu cầu từng ứns dụng cụ thể. Chúng có thề là:
> Bộ quản lý từ điển đồng nghĩa: Đảm bảo đồng bộ và các quan hệ khác giữa
-II-
các mục thông tin
'r Cơ SỜ luật toán vẹn: Kiểm tra tính toàn vẹn cùa ưng dụng
> Quàn ỉý ngữ cành: Đàm bào ngữ cảnh ứng đụng
1.2.2 Mô hình dừ liệu
1.2.2.1 Yêu cầu
Vai trò cùa mô hỉnh dữ liệu trong HQTCSDL là cung cấp khung làm việc
hay ngôn ngừ đề biểu diễn thuộc tính các mục dữ liệu mà nó sẽ đuợc lưu trữ và truy
vẩn nhờ hệ thống. Khung làm việc phải cho phép người sử dụng và n^ười thiết kể
định nghĩa, chèn, hùy, sửa đồi và tìm kiếm mục dữ liệu và thuộc tính. Trong
CSDLĐPT mô hình dữ liệu được bồ sung các vai trò đặc tả và tính toán ờ mức trừu
tượng khác.
Mô hình đừ liệu đa phương tiện thu thập thuộc tính tĩnh và thuộc tính động
của các mục dừ liệu, cung cấp cơ sờ hình thức để phát triển các công cụ phù hợp,
cần thiết khi sử dụng dữ liệu đa phương tiện. Đặc tính tĩnh bao gồm các đối tượng
hinh thành nên đừ liệu đa phương tiện, quan hệ giữa các đối tượng và các thuộc tính
đối tượng. Thí dụ các đặc tinh động bao gồm các đặc tính liên quan đến tương tác
giữa các đối tượng, các thao tác trên đối tượng, tương tác với người sử dụng
Mô hình dữ liệu phong phú đóng vai trò quan trọng vào tính ứng dụng được
cùa CSDLĐPT. Các kiểu dừ liệu đa phương tiện cơ bản được hỗ trợ để cung cấp
nền tảng hình thành các đặc trưng bổ sung.
Không gian đặc trưng đa chiều là đặc tính của chì số hóa đa phương tiện. Mô
hình dừ liệu cần hỗ trợ trình diễn không gian đa chiều này, đặc biệt thước đo
khoảng cách trong nó.
Tóm lại, mô hình dữ liệu cùa CSDLĐPT cần đáp ứng các yêu cầu chính sau
đây:
>'• Mô hình dữ liệu cỏ thế mở rộng để có thể bổ sung kiểu dữ liệu mới.
> Mô hình dử liệu có khả năng trinh diễn kiểu dừ liệu cơ sờ và các đối tượng
tồ hợp với các quan hệ không gian và thời gian phức tạp.
> Mô hình dữ liệu mềm dẻo sao cho các mục dừ liệu có thể được đặc tà, truy
van và tìm kiếm trên các mức trừu tượng khác nhau.
> Mô hỉnh dữ liệu cho phép lưu trữ và tìm kiếm hiệu quà.
1.2.2.2 Mô hình dữ liệu đa phương tiện tổng quát
Mô hình dữ liệu cùa CSDLĐPT này hình thành trên nền tàng nguyên tắc
hướng đối tượng và phân cấp đa tầng (hình 1.2).
Tầng đồi
tượng
Tầng kiẻu
media
Tâng
khuôn mẫu
media
Hình 1.2: Mô hình dữ liệu đa phương tiện tổng quát
Tầng đối tượng
Đối tượng bao gồm một hay nhiều mục media với các quan hệ không gian và
thời gian xác định. Thí dụ một đổi tượng đa phương tiện là một trang slide bao gồm
có ảnh và audio kèm theo.
Nhiệm vụ mấu chốt là bằng cách nào dể chỉ ra các quan hệ không gian và
thời gian. Quan hệ không gian được đặc tả bởi kích thước và vị trí cửa sổ hiển thị
của mỗi mục. Phương pháp chuna, đặc tả thời gian là dặc tã trên cơ sờ trục thời gian
trong đó thời gian bắt đẩu và độ dài mồi mục được xác định trên cơ sờ đồng hồ
chung. Phương pháp khác là mô hình điều khiển theo sự kiện.
Tầng kiểu media
Tầng này bao gồm các dạng truyền thông chung như văn bàn, đồ họa, ành,
audio và video. Các loại này được suy diễn từ lớp media trừu tượng chung.
Tại mức này, các đặc trưng và thuộc tính được đặc tả. Thí dụ dạng truyền
thông là ảnh: kích thước, biểu đồ màu, các đối tượng chính nỏ chửa được đặc tả.
Các đặc trưng này được sử dụng trực tiếp vào tìm kiếm và tính toán khoảng cách.
Tầng khuôn mẫu media
Tầng này đặc tả khuôn mẫu dữ liệu được lưu trừ. Các dạng truyền thông
thường có nhiều khuôn mẫu khác nhau, thí dụ ảnh có dạng nén hay thô. Hơn nữa có
rất nhiều kỹ thuật và chuẩn nén khác nhau. Thông tin chứa trong tầng nảy được sử
dụng để giải mã, phân tích và trình diễn.
Các nhiệm vụ khác
Các ứng dụng khác nhau có thể cần các mô hình dữ liệu khác nhau. Tuy
nhiên nhiều ứng dụng cùng chia sè mô hình cơ sờ chung, nếu được thiết kế tốt thì có
thể bổ sung các đặc trưng và đối tượng mới để đáp ứng yêu cầu ứng đụng cụ thể.
Hiện nay không có chuẩn chung cho các tầng mô hình dữ liệu mô tả trên. Lý
do là các ứng dụng CSDLĐPT hiện nay chù yếu là đặc thù, chỉ tập trung vảo một số
đặc trưng và các dạng truyền thông chính. Có rất nhiều công việc phải làm khi mô
hình hóa dữ liệu đa phương tiện để phát triển CSDLĐPT lớn nhất quán.
1.2.2.3 Mô hình dữ liệu thí dụ
Mô hình trên hình 1.2 là mô hình dữ liệu tổng quát. Tuy nhiên, mỗi ứng dụng
có thể sử dụng mô hình đừ liệu riêng. Phẩn mô tả sau đây nêu lên một vài mô hình
dữ liệu lảm thí dụ, bao gồm: Hệ thống quản lý ìhông tin trực quan (virtual
information management svstem - VIMSYS). mô liinh video lỏng quan và câu trúc
lược đồ sừ dụng trong mô tơ tìm kiếm ảnh Virage. Các ý tưởng và đặc trưng của các
mô hình này được áp dụng vào định nghĩa chi tiết mô hình dữ liệu đa phương tiện
tồng quát.
Thí dụ 1: Mô hình d ữ liệu hệ thống quản lý thông tin trự c quan - VIMSYS
Mô hình VIMSYS được hình thành để quàn Ịý các thông tin trực quan (ảnh
và video). Nó bao gồm bốn tầng: Tầng trinh diễn, tầng đối tượng ảnh, tầng đổi
tượng lĩnh vực và tầng sự kiện-lĩnh vực (hình 1.3). Mọi đổi tượng trong mỗi tầng có
tập các thuộc tính và phương thức.
Lĩnh vực
tri thứ c
Lĩnh vực
độc lập
Hình 1.3 : M ô hình đử liệu VIMSYS
Tầng trình diễn ảnh
Tầng trình diễn ảnh chửa dừ liệu ảnh và biến đổi ảnh nào đó. Biến đổi ảnh có
thể là nén, chuyển đổi không gian màu và tăng cường ảnh. Tầng này cung cấp dữ
liệu thô đề các tầng cao hơn tách và định nghĩa các đặc trưng mức cao. Nó không
mạnh trong việc xử lý các truy vấn người sử dụng.
Tầng đổi tượng ảnh
- 15 -
'lang này bao gom hai tầng con; rằng con phân doạn và tầng con dặc trung.
Tầne con phân đoạn làm có đọng thông tin loàn bộ ảnh hay video vào cụm
đặc tính về không gian và thời gian. Các đặc trung cục bộ này có thể được tim kiếm
trực tiếp. Tầng con này phụ thuộc mạnh vào kỹ thuật phân đoạn ảnh và video.
Tầng con đặc trưng chứa các đặc trưng hiệu quả cho tính toán, được tổ chức
theo cấu trúc dữ liệu và tuân theo tính toán khoảng cách để phát sinh tỳ sổ xếp hạng
(ranking score). Các đặc trưng chung bao gồm lược đồ màu, hình đạng đối tượng và
kết cấu.
Tầng đối tượng lĩnh vực
Đối tượng lĩnh vực là thực thể do người sử dụng định nghĩa, nó biểu diễn
thực thể vật lý hay khái niệm suy diễn từ các đặc trưng của tầng thấp hơn. Các thí
dụ của đối tượng lĩnh vực là “sunset” (khái niệm) và “heart" (đối tượng vật lý). Tri
thức về lĩnh vực cần thiết để suy diễn các đối tượng lĩnh vực.
T ầng sự kiện lĩnh vực
Tầng này định nghĩa các sự kiện mà nguời sử dụng có thề truy vấn. Các sự
kiện được định nghĩa trên cơ sờ tốc độ chuyển động đối tượng, các quan hệ thời
gian/không gian giữa các đối tượng, sự xuất hiện và biến mất đối tượng Cơ chế tổ
chức và tách sự kiện là cần thiết để cài đặt tầng này.
T hí dụ 2: Mô hình video tổng quát
Mô hình video tổng quát bao gồm 4 tầng: frame, shot, scene (hay sequence)
và episode (video document) như trên hình 1.4.
> Frame là các video và ảnh độc lập.
> Shot là tập các frames được ghi hình bằng camera trong một lẩn bâm máy.
> Scene là tập các shot có cùng ngừ nghĩa.
> Episode ià tập các scenes trong trình tự cụ thể. Đó là một đơn vị sản phẩm
(thí dụ, chương trinh bản tin TV).
-16-
Hình 1.4: Mô hình video tồng quát
Các thuộc tính được gẩn vào từng mức video. Tại tầng episode, ta có thể gán
dừ liệu thực sự như tiêu đề, tác giả, ngày tháng tạo lập và các thông tin liên quan
đến kiểu viđeo như chương trình tin tức. Scene chứa ngữ nghĩa chung chia sẻ giữa
các shot của nó. Các shot dược đặc trưng bời các frames chính của nó và các dữ liệu
khác như các đối tượng chính ngày tháng và nơi quay hoặc chụp. Mồi frame chứa
ảnh và đừ liệu thống kê ảnh như biểu đồ màu.
Thí đụ 3: c ấ u trú c lưực đồ ảnh Virag«
Mô tơ tìm kiếm ảnh Virage cung cấp khung làm việc mở để hình thành các
hệ thống truy tìm ảnh trên cơ sờ nội dung, c ấu trúc lược đồ môtơ này bao gồm 3
mức: lược đồ, sơ khai (primitive) và kiểu dữ liệu.
> Trong hệ thống truy tỉm ảnh, 5 kiểu dữ liệu trừu tượng được nhận ra, bao
gồm:
• Giá trị: là tập các vécíơ biểu diễn vài đặc tính tổng quát cùa ảnh
nhu các màu trội.
• Phân bố (distribution): biểu diễn đặc tính thống kê ảnh như biểu đồ
phân bố màu.
• Giá trị chi sổ hóa: giá trị nội bộ vùng ảnh và được biểu diễn như
tập chì sổ hoặc các véctơ.
- 17-
• Phàn bô chỉ sổ hóa: lả mẫu (pattern) hay phán bổ cục bộ cùa vùng
quan tàm.
• Đồ thị (graph): bicu diễn thông tin quan hệ, thí dụ vị trí khôna. gian
của hai vùng trong ảnh.
> Kiểu dừ liệu cơ bàn là tập hợp các véctơ với các thao tác sau:
• Tạo lập tập họp: tạo lập tập hợp rồng cho các véctơ
• Tạo lập véctơ: trích chọn và tạo lập véctơ đặc trưng cụ thể từ ảnh
sừ dụng hàm trích chọn đặc trưng cụ thể.
• Trích chọn: xâm nhập một phần từ cùa tập họp
• Khoảng cách: so sánh hai véctơ và cho lại thước đo khoàng cách
giữa chúng trẽn cơ sở hàm khoảng cách cụ thể cho loại véctơ
• Tổ hạp; tạo véctơ mới bằng cách tổ hợp hai véctơ cho trước.
• Hủy véctơ: giài phóng vùng nhớ kết hợp véctơ cụ thể
• Hủy tập hợp: hủy tập hợp khỏi bộ nhớ.
Mức tiểp theo cùa thí dụ này tà các thuộc tính sơ khai (primitive). Sơ khai
được định nghĩa như tập hợp các véctơ biểu diễn một loại thông tin ảnh. Do vậy,
primitive là đặc trưng có ý nghĩa của ảnh như màu, kểt cấu và hình dạng. Nó được
đặc tả bởi định danh duy nhất, tên loại, các hàm quàn lý và truy tìm dữ liệu.
Tại mức cao nhất cùa cấu trúc lược đồ là lược đồ mà nỏ được định nghĩa bởi
bộ nhận danh lược đồ và tập thứ tự các primitive. Một ứng dụng cỏ thề định nghĩa
và sử dụng nhiều lược đồ. Các chức năng chèn và truy tìm thông tin ảnh trên cơ sờ
nội dung là ở mức này.
1.2.3 Thiết kế giao diện ngưòĩ sử d ụ n g
Người dùng sử dụng, giao tiếp và tương tác với CSDLĐPT thông qua giao
diện người sử dụng (UI - User Interface). Do vậy, UT phàn ánh khả năng sử dụng
CSDLĐPT. Các chức năng chính cùa UI là cho phép người sừ dụng chèn items vào
ĐAI HOC QUỐC GIA HÀ NỘI
ĨRUNG TÂM THÔNG TIN THƯ VIỆN
I S’ _
lò -
CSDI,. nhập câu truy vấn và trinh diễn kết quà truy vấn. UI tốt phải thỏa mãn các
yèu cầu sau:
> Cung cấp các công cụ để người đùng dễ dàng chèn các items CSDL;
> Cung cấp công cụ giúp người đùng nhập hiệu quà câu truy vẩn hay thông
báo cho hệ thổne các thông tin nó cần;
> Trình diễn hiệu quả kết quả truy vẩn;
> Thân thiện.
Có rất nhiều việc phải làm để đáp ứng các yêu cầu trên‘đối với dữ liệu và
ứng dụng đa phương tiện.
L 2.3.1 Cơ sở dữ liệu population
Trong CSDL truvền thống, mỗi bản ghi có cấu trúc cố định với tổng sổ cố
định các thuộc tính. Mỗi bản ghi được chèn vào CSDL bằng ngôn ngữ như SQL.
Trong CSDLĐPT thì các item CSDL có thể là kiểu bất kỳ hoặc là tổ hợp
nhiều kiểu dữ liệu đa phương tiện. Chúng không có cấu trúc và thuộc tính cổ định.
Do vậy, UI phải có khả năng để người sử dụng xác định kiểu đầu vào khác nhau, tổ
hợp các đổi tượng đa phương tiện và chi ra kiểu thuộc tính sẽ trích chọn và chi sổ
hóa. Yêu cầu UI phải là tổng quát để chèn tính tương tự truy vấn theo thí dụ (Query
by example).
Việc xử lý thông tin đa phương tiện và trích chọn đặc trưng đòi hỏi nhiều
tính toán, thông thường từ (vài giây)/(đổi tượng) đến (vài giờ)/(đối tượng phức tạp)
như phim. Do vậy phải có khả năng đặc tả các thao tác trên nhóm đối tượng. Việc
trích chọn đặc trưng phải được tự động hóa hoàn toàn.
L 2.3.2 Hồ trợ truy vấn
Truy vẩn đa phương tiện là đa dạng và mờ. Nó đa dạng vì người sừ dụng có
thể chỉ ra truy vấn theo nhiều cách và với nhiều kiểu dữ liệu đa phương tiện khác
nhau. Nó mờ vì người sử dụng biết họ đang tìm gi nhưng khá khó khăn khi mô tà
chính xác nó, hay các thôniỉ tin cân thiêt khônu dược dịnh nghĩa chính xác (họ chi
nhận ra item khi nhìn thay). Đề thòa màn các yêu cầu về các đặc tính này, các còng
cụ tim kiếm, duyệt và làm mịn truy vấn cần phài có sẵn trong hệ thống.
Tìm kiếm
Tim kiếm là nhiệm vụ cơ bản của mọi hệ quản trị CSDL. Trong CSDLĐPT
cỏ hai loại tìm kiểm:
> Tìm kiếm theo đặc tả: người sử dụng sử dụng một số từ khóa và tham số để
mô tà các đặc trưng và thuộc tính chính về nhu cầu thônsĩ tin của họ.
> Tìm kiếm theo thí đụ.
Khó khăn là ánh xạ như thế nào các mô tá cùa người sử dụng bàng ngôn ngữ
tự nhiên thành các mẫu (pattern) dữ liệu đa phương tiện để có thể đo được. Thí dụ,
người sử dụng đặc tả truy vấn như “xe ôtô đò”. Giả sử các ảnh trong CSDL không
tô màu đầy đủ nhưng nó chứa biểu đồ màu và hình dạng đổi tượng ảnh. Câu hòi là
giá trị pixel nào được sừ dụng để mô tà “đỏ” và hình dạne nào là “xe ô tô”. Để tìm
kiếm hiệu quả, hệ thống cần cung cấp hướng dẫn chi tiết về đặc tả truy vấn thông
qua UI.
Khó khăn của ánh xạ nói trên có thể vượt qua bằng cách tìm kiếm theo thí
đụ. Trong trường hợp này, UI cho phép người sử dụng chí ra truy vấn theo nhiều
dạng khác nhau hay tổ hợp các loại dữ liệu truyền thông khác nhau. Truy vẩn bâv
giờ là đối tượng thí dụ và sẽ hòi hệ thống để tìm ra items tương tự đối tượng thí dụ.
Trong trường hợp trên, người sử dụng phải vẽ hình dạng xe ô tô và tô màu đỏ. Hệ
thống sẽ tính toán biểu đồ màu, tham số hinh dạng của truy vấn và tìm kiếm các
items có biểu đồ màu và tham số hình dạng tương tự. Đề hỗ trợ loại truy vấn nảy,
UI cần cung cấp các công cụ đầu vào khác nhau như microphone, công cụ đồ họa,
video camera, scanner và các công cụ authoring đa phương tiện khác. Người sừ
đụng cần có khả năng sử dụng các items trong CSDL như truy vẩn.
- 20 -
Duyệt
Đôi khi người sừ đụng không biết chinh xác cái họ muốn nhung nhận ra cái
họ cần khi nhìn thấy nó. Loại thông tin này cần đưực đáp ứng bởi duyệt. Ba phương
pháp khởi đầu đuvệt:
> Bắt đầu từ truy vấn không rõ ràng sau đó người dùng dẫn đường qua các
items trên cơ sở các kết quả.
> Đòi hỏi các thông tin trong CSDL được tổ chức theo vài tiêu chí nào đó
(ngày tháng, chù điểm) để người sừ dụng cỏ thể duyệt theo các tiêu chí
nảy.
> Chọn ngẫu nhiên một sổ item(s) từ CSDL để trình diễn và người dung có
thể sử dụng chúng như điểm khải đầu cho việc duyệt. Nếu không tìm thấy
items thỏa mãn, người dùng có thề chọn ngẫu nhiên nhóm khác để trinh
diễn.
Để duyệt hiệu quả, các items thông tin cần có tồ chức tốt và hình thành các
biểu tượng con để trình diễn thay cho trình diễn toàn bộ đối tượng trong khi duyệt.
Với ảnh ta sử dụng ảnh thumbnail. Với video sẽ sừ dụng frame đại diện hay biếu
tượng phim 3D.
Làm mịn truy vấn
Phần lớn truy vấn khởi đầu là mờ và không chính xác. UI cần cung cấp công
cụ để người dùng làm mịn truy vẩn trên cơ sờ kết quả truy vấn ban đầu. Làm mịn
truy vấn được thực hiện thông thường trên cơ sở phản hồi của người dùng từ kết
quả khởi đầu. Khi người dùng nhìn thấy mục gần nhu cái họ mong muốn thì họ có
thể tích hợp các đặc trưng của items vào truy vẩn mới. Sau vài lẩn lặp, người dùng
có thể tìm thấy mục ỉiên quan. Tri thức lĩnh vực và thông tin mà người đùng sử
dụng đề làm mịn truy vấn.
Trong thực tế, định vị thông tin đa phương tiện là tổ hợp tìm kiếm, duyệt và
làm mịn truy vấn.
CSDLĐPT trình diễn kết quà truy vấn thông qua UI. Có nhiều việc phải làm
để trình diễn kết quả. bao gồm:
> UI có khà nàng trinh diễn mọi loại media và quản lý các quan hệ không
gian và thời gian của chúng (là nhiệm vụ đàm bảu QoS).
> Thông tín kết quã có thể chứa trong nhiều đoạn aucỉio dài, ảnh lớn hay
video dài. Nhiệm vụ lả phải tách, xây dựng và trình diễn các thông tin
chính để người đùng duyệt và chọn. Nói cách khác là đòi hỏi các kv thuật
xây dựng cấu trúc (quang cảnh) thông tin sao cho ngươi dùng có thể nhận
biết nhanh cái gì đang cỏ. Ảnh thumbnail (ảnh thu nhò) hav biểu tượng
phim là các công cụ đặc biệt quan trọng.
> Thời gian đáp ứng hệ thống phải ngẳn. Thời gian đáp ứng được xác định
bởi phân hệ truyền tin và tìm kiểm trong CSDL. Một kỹ thuật để có cảm
giác giảm thời gian đáp ứng là giải mã tăng dần (progressive) và hiển thị.
> Trinh diễn kết quà phải phàn hồi dễ dàng và làm mịn truy vấn.
1.2.4 Trích chọn đặc trưng, chỉ mục và đo tương tự
Các đặc trưng và thuộc tính của dữ liệu (items) trong CSDLĐPT được trích
chọn, tham số hóa và lưu trữ chung với chính các dữ liệu. Các đặc trưng và thuộc
tính của truy vấn cũng được trích chọn theo cùng cách thức nếu nó không được xác
định rõ ràng trước. Hệ thống tìm kiếm các items trong CSDL với các thuộc tính và
đặc trưng tưomg tự trên cơ sờ thước đo tính tương tự nhất định. Để tim kiếm hiệu
quả, các dặc trưng và thuộc tính phải được tổ chức thành các cấu trúc có chi số.
1.2.4. ỉ Trích chọn đặc trưng
Các mục thông tin đa phương tiện trong CSDL được tiền xử lý để trích chọn
đặc trưng và thuộc tính.
Trong tiến trình tìm kiếm, các đặc trưng và thuộc tính này được tìm kiếm và
so sánh thay cho chính các mục thông tin. Do vậy chất lượng của trích chọn đặc
1.2.3.3 Trình diên k ế t quả
Irưng xác định hiệu quá tìm kiếm. Ncu đặc trung khỏnu được tách ra tìr item nào thì
không thề tìm thấy chúng tứ CSDL theo dặc trims đó. Đó là một trong sự khác biệt
lớn nhất giữa CSDLĐPT và các HQTCSDL truyền thống khác. Trích chọn đặc
trưng phái thòa mãn các yêu cầu sau:
> Đặc trưng và thuộc tính trích chọn phái đẩy đù nhất có thể để biểu diễn nội
dung của các mục thônu, tin.
> Các đặc trưng phải được trình diễn và lưu trữ một cách chặt chẽ, mạch lạc.
Các đặc trưng phức tạp và lớn không phải là mục đích cùa trích chọn, nó
phải có khả năng tìm kiếm và so sánh nhanh các mục thông tin với nhau.
> Tính toán khoảng cách giữa các đặc trưng phải hiệu quà, nếu không thời
gian đáp ứng của hệ thống rất lớn.
Tổng thể có 4 mức đặc trưng và thuộc tính như sau:
> Siêu dữ liệu (M etadata): bao gồm các thuộc tính của các đối tượng đa
phương tiện như tên tác giả, ngày tạo lập, tiêu đề đối tượng. Không mô tả
hay diễn giải nội dung cùa đối tượng. Các thuộc tính này được quản lý
bàng kỹ thuật cùa HQTCSDL. (Trong một số tài liệu, siêu dữ liệu bao gồm
toàn bộ các mức đặc trưng và thuộc tính đang mô tả tại đây).
> Mô tả bằng văn bản: Mô tà nội dung đối tượng bẩng văn bản. Mô tả dưới
hinh thức nhiều từ khóa hay văn bản thông thường. Chỉ sổ hóa và tìm kiếm
trên cơ sở mô tả bằng văn bản được quàn lý bàng kỳ thuật truy tìm thông
tin (Information Retrive - IR). Mặc dù mô tả bầng văn bàn có giới hạn là
còn tính chủ quan và chưa đầy đủ nhưng đây vẫn. là phương pháp hay được
sừ dụng và hiệu quả. Nên sừ dụng mô tả bằng văn bản kết hợp vói các đặc
trung khác trong ứng dụng đa phương tiện. Hiện tại, mô tả văn bản được
thực hiện thủ công nên khá vất và. cần phát triển các công cụ bán tự động
để hỗ trợ tiến trình này. Tri thức lĩnh vực và từ điển liệt kê luôn có ích để
đạt được hiệu năng íruy vấn cao.
> Đặc trưng nội dung mức thấp: Thu thập các mẫu và thống kê đổi tượng
đa phương tiện và các q u a n hệ khòníi lỊÌan, thời gian giũa các phẩn đối
tượng. Mỗi kiểu dừ liệu đa phưong tiện khác nhau có các đặc tnrrm nội
duno mức thấp khác nhau.
• Với âm thanh, đặc trưng mức thấp bao gồm âm lượng trung bình,
phân bổ tẩn sổ và tý lệ câm.
• Các đặc trưng mức thấp cùa ảnh bao gồm phân bổ màu, texture
(kết cấu nền), hình dạng đối tượng và cẩu trúc không gian.
• Đặc truna. mức thấp của video là cấu trúc thời gian.
• Lợi thế chính của việc sử dụng đặc trưng mức thấp là có thể tự
động trích chọn chủng.
> Đặc trưn g nội dung mức cao: c ố gắng nhận biết và hiểu đối tượng.
Ngoài nhận dạng văn bản và tiếng nói. việc nhận dạng và hiểu đoạn âm
thanh và các đổi tượng nhin là rất khó khàn. Trong ứng dụng với giới hạn
số lượng đối tượng, việc mô tả và nhận biết các đối tượng chung là rất hiệu
quà. Thí dụ, dự báo tới 95% các video có mục tiêu chính là quav người hay
nhóm người. Nó hữu ích cho các hệ thống để nhận biết và diễn giải con
người. Hiện tại, tiến trình nhận đạng và diễn giải được thực hiện bán tự
động.
Việc truy vấn trên cơ sờ hai loại đặc trưng nội dung mức thấp và mức cao gọi
là truy vấn trên cơ sở nội dung. Một hệ thống cẩn sử dụng toàn bộ bốn mức đặc
trưng sao cho hỗ trợ được các câu truy vấn mềm dẻo của người sừ dụng. Các kỹ
thuật này hỗ trợ nhau để hinh thành mô tả đầy đù về đối'tượng. Thí dụ, mô tả văn
bản tốt cho việc thu thập các khái niệm trừu tượng như cảm giác (vui, buồn )
nhưng không có khả năng mô tả mẫu dữ liệu đầy đù về các hình dạng không đều
hay kết cấu. Mặt khác, các dặc trưng nội dung mức thấp có thể thu thập các mẫu dữ
liệu này nhưng không mô tà được các khái niệm trừu tượng.
Khi đối tượng đa phương tiện có nhiều kiểu dừ liệu đa phương tiện, các quan
hệ và tương tác giữa các loại dữ liệu này phài được sử dụng để trích chọn đặc trưng,