Tải bản đầy đủ (.pdf) (113 trang)

(Luận văn thạc sĩ) nghiên cứu ứng dụng cơ sở dữ liệu quan hệ mở rộng vào xây dựng cơ sở dữ liệu đa phương tiện

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (41.3 MB, 113 trang )

~ Đ Ạ I HỌC QUỐC GIA HÀ NỘ I
TRƯ ỜNG ĐẠI HỌC CƠNG NGHỆ

Hồng Minh Hiền

N G H IÊ N CỨ U Ứ N G D Ụ N G
C ơ SỞ D ữ L IỆ U Q U A N H Ệ M Ở R Ộ N G V À O
X Â Y D ự• N G C ơ S Ở D ữ L I Ệ♦ U Đ A P H Ữ Ơ N G T I ỆmN

Ngành: Công nghệ thông tin

LUẬN V À N THẠC Sĩ

NGƯỜI HƯỞNG DẴN KHOA HỌC:
PGS. TS ĐẶNG V Ă N ĐỨC

Hà N ộ i - 2 0 0 5


M Ụ• C L Ụ■ C

LỜI C Ả M Ơ N ............................................................................................................................ 3

MỞ ĐẦU........................................................................................................................... 4
CHƯƠNG 1: GIỚI THIỆU c ơ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN.....................6
1.1 Nhu cầu cần có CO' sở dữ liệu đa phưorng tiện (CSDLĐPT)................................ 6
1.2 Các nhiệm vụ thiết kế cơ sở dữ liệu đa phương tiện ............................................ 8
1.2.1 Kiến trúc................................................................................................ ............................. 9
1.2.2 Mô hỉnh dữ liệu....... ............................................................................. . .
................... 11
1.2.2.1 u cầu........................................................................................................................11


1.2.2.2 Mơ hình dữ liệu đa phương tiện tổng quát.................................................................12
1.2.2.3 Mô hinh dữ liệu thí dụ................................................................................................ 14
1.2.3 Thiết kế giao diện người sử đụng......................................................................................18
1.2.3.1 Cơ sờ dữ liệu population............................................................................................ 18
1.2.3.2 HỖ trợ truy vấn........................................................................................................... 19
1.2.3.3 Trình diễn kết quả....................................................................................................... 21
1.2.4 Trích chọn đặc trưng, chỉ mục và đo tương tự..................................................................21
1.2.4.1 Trích chọn đặc trưng..................................................................................................22
1.2.4.2 Chi số hỏa cấu trúc.....................................................................................................24
1.2.4.3 Đo tính tương tự.........................................................................................................24
1.2.5 Đảm bào chất lượng dịch vụ (QoS) trong client, server và hệ thống truyền tin...............25
1.2.6 Các nhiệm vụ khác........................................................................................................... 26
1.2.6.1 Nén dữ liệu đa phương tiện................... ....................................................................26
1.2.6.2 Chuẩn hóa biểu diễn dữ liệu...................................................................................... 27
CHƯƠNG 2: VẤN ĐÈ L ự A CHỌN MƠ HÌNH c ơ SỞ DỮ LIỆU CHO c ơ SỞ DỮ
LIỆU ĐA PHƯƠNG T IỆ N .......... ...... ................................................ ...........................28
2.1 Mơ hình cơ sở dữ liệu quan h ệ ................................................................................28
2.2 Mơ bình cơ sở dữ liệu hướng đối tưọrng............................................................... 29
2 3 Mơ hình CO’ sở dữ liệu đối tượng quan hệ................................................................... .. 31
2.4 Mơ hình quan hệ mờ rộng trong Oracle InterMedia....................................................32
2.4.1 Quản lý nội dung đa phương tiện..................... ................................................................ 33
2.4.3 Kiểu đối tượng ảnh ORDImage trong Oracle InterMedia................ ............................... 38
2.4.4 Kiểu đổi tuợng âm thanh ORDAudio................................................................................41
2.4.5 Kiểu đổi tuợng video ORDVideo..................................................................................... 42
2.4.6 Lưu trữ dữ liệu đa phương tiện..........................................................................................43
2.4.7 Nạp dữ liệu đa phương tiện.............................................................................................. 44
2.4.8 Truy cập dữ liệu đa phương tiện...................................................................................... 46
2.4.9 Phân phối nội dung dữ liệu đa phương tiện...................................................................... 52



2.4.10 Phương time truỵ vấn dữ liệu đa phương tiện theo nội dung..........................................53
2.4.10.1 Khái niệm tổng quát và lợi ích...............................................................................54
2.4.10.2 Thực hiện truy vằn dữ liệu dựa trên nội dung........................................................55
2.4.10.3 Thực hiện ánh xạ................................................................................................... 61
2.4.10.4 Dùng chi mục để so sánh các dấu hiệu...................................................................66
2A 10.5 Lựa chọn ảnh để ánh xạ..........................................................................................67
2.4.11 Kiến trúc Oracle /rt/erMedia...........................................................................................69
2.4.12 Khả năng mở rộng cùa Oracle InterMedia...................................................................... 72

2.5 Mơ hình đổi tượng quan hệ trong DB2 Extender..........................................................72
2.5.1 Giới thiệu DB2 extender và các cách thức mới tìm kiểm thơng tin............................... 73
2.5.2 Đặc điểm hướng đổi tượng.......................... ................................................................... 75
2.5.3 Khả nảng quản lý dữ liệu đa phương tiện.......................................................................80
2 5.3.1 Lưu trữ...... ....................................... ........................... ................................... ........ 81
2.5.3.2 Truy vấn........................................................................................................................;...... 82
2.5.3.3 Sửa đổi........................................................................................................................ 82
2.5.4 DB2 extender hỗ trợ tìm kiếm ảnh theo nội dung.............................................................83

2.6 Nhận xét........................................................... ........................................................... 86
CHƯƠNG 3: CÀI ĐẶT THỬ NGHIỆM......................................................................87
3.1 Mô tả bài to á n .......................................................................... ....... ...........................87
3.1.1 Mục tiêu............................................................................................................................. 87
3.1.2 Yêu cầu.............................................................................................................................. 87
3.2 Lựa chọn công cụ và môi trường phát triển....................................................... 88
3.3 Hướng dẫn cài đặt Oracle InterMedỉavà kiểm tra cài đ ặ t............................... $8
3.3.1 Phận cài đặt......................................................................................................... ............. 88
3.1.2 Kiểm tra kềt quả cài đặt.....................................................................................................90
3.4 Mơ tả các chức năng chính của chương trình thử nghiệm ............................... 92
3.4.1 Sơ đồ chức năng................................................ ...............................................................92
3.4.2 Mơ tả các chức năng kèm theo hình ảnh...........................................................................93

3.4.2.1 Các thao tác (nạp, xuất, sửa đối và xoá) trên đữ liệu................................................ 98
3.4.2.2 Thực thi dữ liệu âm thanh........................................................................................ 102
3A.2.3 Tìm kiếm dữ liệu ảnh....................... ........................................................................ 104
3.5 Nhận xét phần thử nghiệm......................................................................................108
KÉT LUẬN........................................................................................................................110
TÀI LIỆU THAM KHẢO............................................................................................. 112


D a n h m u c c a c k y h ie u v i§ t ta t

AIV Extender Audio Image Video Extender
API

Application Program Interface

ASCII

American Standard Code for Information Interchange

BC4J

Oracle Bussiness Component for Java

BFILE

File Based Large Objects

BLOB

Binary Large Object


CAD

Computer Aid Design

CBT

Computer Based Training

CLOBs

Character Large Objects

DB

Database

DB2 CLI

DB2 Call Level Interface

DBCLOBs

Double byte Character Large Objects

DBMS

Database Management System

DTD


Document Type Definition

HTML

Hypertext Markup Language

HTTP

Hypertext Tranfer Protocol

HTTPD

Hypertext Tranfer Protocol Daemon

IP

Internet Protocol

IR

Information Retrieval

JAI

Java Advanced Imaging

JDBC

Java Database Connectivity


JMF

Java Media Framework

JSP

Java Server Pages

JVM

Java Virtual Machine

LOB

Large Object Binary

MMDB

Multimedia Database


M IM E

M u ltip u rp o se Internet M ail E xtensions

OS

O p e ra tin g S ystem


O ID

O b je c t Iden tifier

ODB

O b je c t D atab ase

OODB

O b je c t O rien ted D atabase

ORDB

O b je c t R elatio n al D atabase

tJD F s

U se r - D e fin e d F unctions

UDTs

U se r - D efin ed Types

UI

U s e r In terface

URLs


U n ifo rm R e so u rce L o c a to r

Q B IC

Q u e ry by Im age C ontent

Q oS

Q u a lity o f S ervice

RDB

R e la tio n al D atab ase

RTSP

R e a l-T im e S tream in g P rotocol

XM L

E x te n sib le M ark u p L anguage

W eb D A V

W e b ase d D istrib u ted A u th o rin g and V e rsio n in g


MỞ ĐÀU

Những thay đổi của môi trường xã hội cùng với sự xuất hiện của nhiều công nghệ

mới dẫn đến việc ngày càng có nhiều phương thức trao đổi và thể hiện thông tin. Trước
đây, con người thường thể hiện thông tin qua các văn bản bằng việc sử dụng các ký tự, số
hoặc có thêm một số hình ảnh có ý nghĩa. Nhưng ngày nay, thơng tin truvền tải ý nghĩa
của nó qua nhiều định dạng khảc nhau như âm thanh, số, hình ành có hiệu ứng, hay các
đoạn phim sống động v.v. Sự phong phú trong cách thể hiện các dạng truyền thông cho
thấy các dạng dữ liệu đa phương tiện là sự kết hợp của nhiều dạng dữ liệu khác nhau
ngày càng cỏ vai trò quan trọng.
Đã có nhiều đề tài nghiên cứu và phát triển các cách thức truvền thông và thể hiện
dữ liệu đa phương tiện, hoặc một sổ vấn đề về lưu trữ và truy xuất dữ liệu đa phương tiện
qua các hệ quản trị cơ sở dữ ỉiệu sao cho hiệu quả. Mặc dù trên thực tể có rất nhiều hệ
quản trị cơ sở đữ ỉiệu được sử dụng để hỗ trợ cho vấn đề quản lý dữ liệu nhưng dường
như các hệ quàn trị này chira thực sự có khả năng quản lý tốt các dạng dữ liệu đa phương
tiện. Do vậy cần có cơ sở dữ liệu chuyên biệt dùng để quản lý dữ liệu đa phương tiện là
một nhu cầu tất yếu. Xuất phát từ vấn đề trên mà để tài “Nghiên cứu ứng dụng cơ sở dữ

liệu quan hệ mở rộng vào xây dụtìg cơ sở dữ liệu đa phương tiện ” đã được lựa chọn.
Nội dung trình bày phần nghiên cứu được chia làm ba chương:
Chương 1: Giới thiệu cơ sờ dữ liệu đa phương tiện trinh bày nhu cẩu cẩn cỏ cơ sờ
dĩr liệu đa phương tiện và các nhiệm vụ thiết kể cơ sờ dữ liệu đá phương tiện.
Chương 2: vấn đề lựa chọn mơ hình cơ sờ dữ liệu cho cơ sờ dữ liệu đa phương
tiện trình bày các mơ hình cơ sở đữ liệu quan hệ, hướng đổi tượng và đối tượng quan hệ
đề thấy được khả năng ứng dụng riêng của từng mô hình cho các ứng dụng dữ liệu đa
phương tiện. Cũng trong nội dung chương 2, hai mơ hình cơ sờ dừ liệu đổi tượng quan hệ


nồi bật là Oracle InterMedia và DB2 Extender được trình bày đề phân tích các khả năng
quân lý dữ liệu đa phương tiện.
Chương 3: Cài đặt thừ nghiệm một cơ sờ dừ liệu đa phương tiện trên hệ quản trị
Oracle để kiểm tra khả năng hồ trợ đa phương tiện của thành phần Oracle InterMedia
được tích hợp trong Oracle.

Phần kết luận tóm tắt các kết quả đạt được và đưa ra một số phương hưởng nghiên
cứu để đánh giá được vai trò quan trọng cùa dữ liệu đa phương tiện trong nhiều lĩnh vực.


*6 -

C h ư ơ n g

1

G I Ớ I T H I Ệ■U C ơ S Ở D ữ L I Ệ• U
Đ A P H Ư Ơ N G T I Ệ■ N

Mục đích của cbucmg này nhẩn mạnh đến tầm quan trọng của dữ liệu đa
phương tiện trong nhiều ứng dụng cùa cuộc sống dẫn đến nhu cầu lưu trữ và khai
thác chúng sao cho hiệu quả. Do vậy cần có cơ sở dữ liệu đa phương tiện (mục
l.l)[2][3]. Vậy khi xây dựng cơ sở dừ liệu đa phương tiện cần quan tâm đến những
yếu tố nào? Mục 1.2 trình bày các nhiệm vụ chinh khi thiết kế cơ sờ dữ liệu đa
phương tiện bao gồm kiến trúc, mơ hình dừ liệu, thiết kế giao diện người sử dụng,
trích chọn đặc trưng, đàm bảo chất lượng dịch vụ và một sổ nhiệm vụ khác [2][3],
1.1 Nhu c ầ u c ầ n c ó c ơ s ử d ữ liệu đ a p h ư o n g tiện (CSDLĐPT)

Thơng tin đa phương tiện hay cịn gọi là dữ liệu đa phương tiện, thể hiện các
thông tin của nìáy tính qua các dạng truyền thơng như video, sound, animation,
images, alphanumerics hoặc có sự kết hợp giữa các dạng truyền thông này.
Dựa trên các loại dữ liệu truyền thơng chủng ta có thể phân ra làm 2 dạng
truyền thơng là tĩnh và động. Dữ liệu tĩnh có nội dung và ý nghĩa không phụ thuộc
vào thời gian thể hiện như alphanumerics, images, graphics. Dữ liệu động có nội
dung và ý nghĩa phụ thuộc thời gian. Chẳng hạn như khi thực hiện một đoạn video
cần dịch chuyển khoảiig 25 đến 30 frames/giây để làm hình ảnh và âm thanh thay

đổi. Các dạng dữ liệu động khác như sound và animation đều có mối quan hệ với
thời gian.
Việc truyền đạt thông tin và ý nghĩa cùa thông tin trong thực tế cũng cỏ rất
nhiều phương thức khác nhau. Tuy nhiên, với dữ liệu đa phương tiện, các thông tin
truyền đạt ý nghĩa nhanh và dễ hiểu hơn. Do vậy mà ngày nay dữ liệu đa phương
tiện được sử đụng trong nhiều ứng dụng thực tế như nghệ thuật, giáo dục, giải trí,
kỹ thuật, y học, tốn học, cả trong các nghiên cứu khoa học, v.v.


Ví dụ như trong giáo dục, dữ liệu da phương tiện được dùng để tạo ra các
khỏa học dựa trên sự hồ trợ của máy tính (computer based training - CBTs) và các
loại sách học khác. Một chuơng trình CBT là một chuồi các trình diễn
(presentations) bao gồm có text đề diễn giải cụ thể cho từng chù đề và có nhiều
phẩn minh họa bằng việc sử dụng các định dạng dữ liệu khác. Do vậy, người học sẽ
thấy thoải mải và tiếp thu nhanh hơn với nhũng bài giảng có sử dụng đữ liệu đa
phương tiện. Trong lĩnh vực giải trí, dữ liệu đa phương tiện có v trị hết sức quan
trọng giúp tạo ra các hiệu ứng và sự sống động trong các bộ phim, các chương trình
trị chơi giài trí v.v. Bên cạnh đó, các ngành như kỹ thuật máy, tự động hóa cũng sử
dụng dữ liệu đa phương tiện như một công cụ hỗ trợ thiết kế mẫu mã sản phẩm dựa
trên các phối cảnh khác nhau v.v. Một trong những sản phẩm được biết đến đó tà
chương trình thiết kế bằng máy tính (computer aided design - CAD).
Một sổ lĩnh vực ứng đụng dữ liệu đa phưcmg tiện kể trên cho thấy dữ liệu đa
phương tiện đang ngày càng gia tăng và có vai ừị rất quan trọng trong việc truyền
đạt thông tin đẫn đến những yêu cầu cần thiết về vấn đề quản lý như:
> Khả năng lưu trữ dữ liệu do kích thước dừ liệu đa phương tiện lởn hơn so
với các dạng dữ liệu thông thường;
> Hỗ trợ truy vẩn nhanh dữ liệu đa phương tiện do thời gian truyền tải dữ
liệu khi truy vấn khơng thể quả chậm vì tại mồi thời điểm ý nghĩa của dữ
liệu đa phương tiện có thể thay đổi.
Hiện nay, có nhiều hệ quản trị cơ sở dữ liệu (HQTCSDL)(Database

Management Systems - DBMS) cho phép người dùng tạo và quàn trị các loại cơ sở
dữ liệu (CSDL)(Database - DB) khác nhau. Mồi một CSDL là một tập hợp dữ liệu
có quan hệ với nhau. Khi làm việc với CSDL thì dữ liệu được xem như một tập các
bản ghi.
Tuy nhiên, do dừ liệu đa phương tiện có nhiều kiểu dữ liệu khác nhau, cân
được ]ưu trữ dưới các hỉnh thức và định dạng khác nhau vì vậy cần có CSDLĐPT.
Ngồi chức năng lưu trữ dữ liệu, người sừ dụng cịn có thể thực hiện các thao tác


cập nhật, sửa, xoả v.v trên CSDLĐPT như một cơ sờ dừ liệu truyền thổng và khai
thác thông tin từ CSDL đó phục vụ cho mục đích của người sử dụng.

Xuẳt phát từ những yêu cầu đặt ra, để thực hiện quản lý tốt dừ liệu đa
phương cần có một hệ quàn trị CSDLĐPT chuyên biệt được xây dựng theo một
phương pháp chung:
> Xác định mô hinh CSDL (quan hệ. đối tượng - quan hệ, hưởng đối tượng);
> Xây dựng kiến trúc cho CSDL;
> Xác định các nội dung cần lưu trừ;

> Xây dựng các kiểu dữ liệu, các đối tượng dữ liệu mà ứng dụng cần lưu trữ
trong đó bao gồm các phương thức đi kèm với các đối tượng, v.v.
Để hiểu rõ han các yêu cầu trên, mục 1.2 sẽ trình bày các nhiệm vụ thiết kế
CSDLĐPT.
1 . 2 C á c n h i ệ m v ụ t h i ế t k ế CO' s ở d ữ l i ệ u đ a p h ư ơ n g t i ệ n

Phần này khảo sát các vấn đề bao gồm:
> Khái quát về kién trúc mơđun CSDLĐPT. Các mơđun chính của
CSDLĐPT bao gồm giao diện người sử dụng (User Interface - UI), trích
chọn đặc trưng, quản lý truyền tin, quản lý lưu trữ, chỉ số hỏa và cơng cụ
tìm kiếm.

> Mơ hình dữ liệu của CSDLĐPT xác định thông tin được tổ chức và lưu trữ
như thế nào, hỗ trợ loại truy vấn nào (query). Các u cầu về mơ hình dữ
liệu cùa CSDLĐPT và sự phân cấp mơ hình dữ liệu cũng sẽ được trình bày.
> UI - giao diện người sử dụng cung cấp công cụ chèn các items của cơ sờ
dữ liệu, câu truy vấn và trình diễn kết quả truy vấn.
> Trong CSDLĐPT, các

đặc

trưng và thuộc tính

cùa

dừ liệu

đa

phương tiện

được trích chọn và lưu trữ với dữ liệu. Các đặc trưng được tổ chức nhờ cấu
trúc chi mục để tìm kiểm hiệu quả. Ngồi ra cịn cỏ hình thứ tìm kiếm dựa


-9 -

trên ca sò thước do tương tự giữa đặc trưng tpjv vấn và đặc trưng dữ liệu.
> Tim kiếm và trinh diễn đa phương tiện phái đáp ứng một số ràng buộc về
thời gian và không gian. Các ràng buộc này được xác định bàntỉ các yêu
cầu về chất lượng dịch vụ (Quality of Serv ice - QoS) cùa đối tượng và ứng
dụng đa phương tiện. Mọi phân hệ. bao gồm hệ điểu hành (Operating

System - OS), truyền tin, quàn lý lưu trữ phái làm việc cùng nhau để đạt
được QoS mong muốn.
> Các nhiệm vụ khác bao gồm nén dừ liệu, chuẩn trình diễn dữ liệu, tiến
trình truy vẩn cũng cần được quan tâm.

1.2.1 Kiến trúc
Kiến trúc CSDLĐPT cần mềm dẻo và dễ mờ rộng để hỗ trợ các ứng dụng,
truy vấn nội đung khác nhau. Để đạt yêu cầu này CSDLĐPT bao gồm nhiều môđun
chức năng quản lý. Bộ quàn lý mới có khả năng mờ rộng chức năng của CSDLĐPT
dễ dàng.
Cơ chế khác cùa CSDLĐPT là khả năng phân tán tự nhiên, nó bao gồm
nhiều server và client. Cơ chế này hình thành từ đặc điểm kích thước dữ liệu đa
phương tiện rất lớn và nhu cầu ứng dụng đồng thời của nhiều người tại một thời
điểm như hệ thống thư viện sổ và hệ thống video theo yêu cầu.

H ìn h 1.1 : K iến tr ú c cơ sở củ a C S D L Đ P T


- 10-

Hình 1.1 chi ra kiến trúc cơ sờ của CSDLĐPT. Các khối chức năng chính
bao gồm UI, bộ trích chọn đặc trưng, bộ quàn lý truyền thông, bộ phận đánh chi số
và mơtơ tìm kiếm. Các chức năng chính sẽ được mô tả thông qua các kịch bàn vận
hành cùa CSDLĐPT. Hai thao tác chinh cùa CSDLĐPT là chèn mục đa phương tiện
mới và truy vấn thông tin.
Chèn mục đa phưong tiện mới:
Người sử dụng đặc tả một hay một nhóm mục dữ liệu đa phương tiện thơng
qua UI. Các mục được lưu trong tệp hay nhập trực tiếp từ thiết bị ngoài như
microphone, CD player, VCR hay video camera. Người sử dụng cũng có thể tự vẽ
hình làm dữ liệu đầu vào. Nội dung của chúng được trích trọn tự động hay bán tự

động bằng các công cụ của bộ trích chọn đặc trưng. Các đặc trưng này và các mục
gốc được gửi về máy chù thông qua bộ quàn lý truyền tin. Tại máy chù, các đặc
trưng được tổ chức (chèn) theo lược đồ chì số hóa nào đó để truy vấn hiệu quả
thơng qua mơ tơ truy vấn và chỉ số hóa. Các thơng tin chi số và các mục gốc được
lưu trừ phù hợp thông qua bộ quản lý lưu trữ.
Truy vấn thông tin:
Người sử dụng đưa ra hay đặc tà truy vấn thông qua UI. Truy vấn có thể là
tệp lưu trữ trên đĩa hay nhập từ thiết bị vào (bàn phím, chuột). Có thể duyệt các mục
trong CSDL để sử dụng nó làm mục truy vấn. Nếu mục truy vấn không phải là cái
đã có sẵn trong CSDL, các đặc trưng chính của truy vấn được trích chọn theo cách
như khi thực hiện chèn mục đữ liệu. Các đặc trưng này được gửi đến máy chủ thông
qua bộ quản lý truyền tin. Môtơ chi sổ hóa và tìm kiếm tìm trong CSDL để có các
mục dữ liệu phù hợp với các đặc trưng truy vấn. Các mục này được truy vấn nhờ bộ
quản lý lưu trừ và gửi đến UI thông qua bộ quản lý truyền tin. UI hiển thị danh sách
các mục dữ liệu tới người sử dụng.
Hình 1.1 là kiến trúc cơ sờ. Có thể bổ sung các khối chức năng hay bộ quản
lý để đáp ứng yêu cầu từng ứns dụng cụ thể. Chúng có thề là:
> Bộ quản lý từ điển đồng nghĩa: Đảm bảo đồng bộ và các quan hệ khác giữa


-II-

các mục thơng tin

'r Cơ SỜ luật tốn vẹn: Kiểm tra tính tồn vẹn cùa ưng dụng
> Qn ỉý ngữ cành: Đàm bào ngữ cảnh ứng đụng
1.2.2 Mơ hình dừ liệu

1.2.2.1 u cầu
Vai trị cùa mơ hỉnh dữ liệu trong HQTCSDL là cung cấp khung làm việc

hay ngôn ngừ đề biểu diễn thuộc tính các mục dữ liệu mà nó sẽ đuợc lưu trữ và truy
vẩn nhờ hệ thống. Khung làm việc phải cho phép người sử dụng và n^ười thiết kể
định nghĩa, chèn, hùy, sửa đồi và tìm kiếm mục dữ liệu và thuộc tính. Trong
CSDLĐPT mơ hình dữ liệu được bồ sung các vai trò đặc tả và tính tốn ờ mức trừu
tượng khác.
Mơ hình đừ liệu đa phương tiện thu thập thuộc tính tĩnh và thuộc tính động
của các mục dừ liệu, cung cấp cơ sờ hình thức để phát triển các công cụ phù hợp,
cần thiết khi sử dụng dữ liệu đa phương tiện. Đặc tính tĩnh bao gồm các đối tượng
hinh thành nên đừ liệu đa phương tiện, quan hệ giữa các đối tượng và các thuộc tính
đối tượng. Thí dụ các đặc tinh động bao gồm các đặc tính liên quan đến tương tác
giữa các đối tượng, các thao tác trên đối tượng, tương tác với người sử dụng...
Mơ hình dữ liệu phong phú đóng vai trị quan trọng vào tính ứng dụng được
cùa CSDLĐPT. Các kiểu dừ liệu đa phương tiện cơ bản được hỗ trợ để cung cấp
nền tảng hình thành các đặc trưng bổ sung.
Không gian đặc trưng đa chiều là đặc tính của chì số hóa đa phương tiện. Mơ
hình dừ liệu cần hỗ trợ trình diễn khơng gian đa chiều này, đặc biệt thước đo
khoảng cách trong nó.
Tóm lại, mơ hình dữ liệu cùa CSDLĐPT cần đáp ứng các u cầu chính sau
đây:
>'• Mơ hình dữ liệu cỏ thế mở rộng để có thể bổ sung kiểu dữ liệu mới.


> Mơ hình dử liệu có khả năng trinh diễn kiểu dừ liệu cơ sờ và các đối tượng
tồ hợp với các quan hệ không gian và thời gian phức tạp.

> Mơ hình dữ liệu mềm dẻo sao cho các mục dừ liệu có thể được đặc tà, truy
van và tìm kiếm trên các mức trừu tượng khác nhau.
> Mơ hỉnh dữ liệu cho phép lưu trữ và tìm kiếm hiệu q.

1.2.2.2 Mơ hình dữ liệu đa phương tiện tổng qt

Mơ hình dữ liệu cùa CSDLĐPT này hình thành trên nền tàng nguyên tắc
hướng đối tượng và phân cấp đa tầng (hình 1.2).
Tầng đồi
tư ợ n g

Tầng kiẻu
media

Tâng
khn m ẫu
m edia

H ình 1.2: M ơ hình d ữ liệu đ a p hư ơ ng tiện tổng q u át
T ầ n g đối tư ợ ng
Đối tượng bao gồm một hay nhiều mục media với các quan hệ không gian và
thời gian xác định. Thí dụ một đổi tượng đa phương tiện là một trang slide bao gồm
có ảnh và audio kèm theo.
Nhiệm vụ mấu chốt là bằng cách nào dể chỉ ra các quan hệ không gian và
thời gian. Quan hệ khơng gian được đặc tả bởi kích thước và vị trí cửa sổ hiển thị


của mỗi mục. Phương pháp chuna, đặc tả thời gian là dặc tã trên cơ sờ trục thời gian
trong đó thời gian bắt đẩu và độ dài mồi mục được xác định trên cơ sờ đồng hồ
chung. Phương pháp khác là mơ hình điều khiển theo sự kiện.
T ần g kiểu media
Tầng này bao gồm các dạng truyền thông chung như văn bàn, đồ họa, ành,
audio và video. Các loại này được suy diễn từ lớp media trừu tượng chung.
Tại mức này, các đặc trưng và thuộc tính được đặc tả. Thí dụ dạng truyền
thơng là ảnh: kích thước, biểu đồ màu, các đối tượng chính nỏ chửa... được đặc tả.
Các đặc trưng này được sử dụng trực tiếp vào tìm kiếm và tính tốn khoảng cách.

T ần g khn m ẫu media
Tầng này đặc tả khuôn mẫu d ữ liệu được lưu trừ. Các dạng truyền thơng
thường có nhiều khn mẫu khác nhau, thí dụ ảnh có dạng nén hay thơ. Hơn nữa có
rất nhiều kỹ thuật và chuẩn nén khác nhau. Thông tin chứa trong tầng nảy được sử
dụng để giải mã, phân tích và trình diễn.
C ác nhiệm vụ khác
Các ứng dụng khác nhau có thể cần các mơ hình dữ liệu khác nhau. Tuy
nhiên nhiều ứng dụng cùng chia sè mơ hình cơ sờ chung, nếu được thiết kế tốt thì có
thể bổ sung các đặc trưng và đối tượng mới để đáp ứng yêu cầu ứng đụng cụ thể.
Hiện nay khơng có chuẩn chung cho các tầng mơ hình dữ liệu mơ tả trên. Lý
do là các ứng dụng CSDLĐPT hiện nay chù yếu là đặc thù, chỉ tập trung vảo một số
đặc trưng và các dạng truyền thơng chính. Có rất nhiều cơng việc phải làm khi mơ
hình hóa dữ liệu đa phương tiện để phát triển CSDLĐPT lớn nhất qn.

1.2.2.3 Mơ hình dữ liệu thí dụ
Mơ hình trên hình 1.2 là mơ hình dữ liệu tổng quát. Tuy nhiên, mỗi ứng dụng
có thể sử dụng mơ hình đừ liệu riêng. Phẩn mơ tả sau đây nêu lên một vài mơ hình
dữ liệu lảm thí dụ, bao gồm: Hệ thống quản lý ìhơng tin trực quan (virtual


information management svstem - VIMSYS). mô liinh video lỏng quan và câu trúc
lược đồ sừ dụng trong mơ tơ tìm kiếm ảnh Virage. Các ý tưởng và đặc trưng của các
mơ hình này được áp dụng vào định nghĩa chi tiết mơ hình dữ liệu đa phương tiện
tồng qt.
T h í dụ 1: Mơ hình d ữ liệu hệ thống quản lý thông tin trự c qu an - V IM SYS
Mơ hình VIMSYS được hình thành để qn Ịý các thơng tin trực quan (ảnh
và video). Nó bao gồm bốn tầng: Tầng trinh diễn, tầng đối tượng ảnh, tầng đổi
tượng lĩnh vực và tầng sự kiện-lĩnh vực (hình 1.3). Mọi đổi tượng trong mỗi tầng có
tập các thuộc tính và phương thức.


Lĩnh vực
tri th ứ c

Lĩnh vực
đ ộ c lập

H ình 1.3 : M ơ hình đ ử liệu VIM SYS
T ần g trìn h diễn ảnh
Tầng trình diễn ảnh chửa dừ liệu ảnh và biến đổi ảnh nào đó. Biến đổi ảnh có
thể là nén, chuyển đổi khơng gian màu và tăng cường ảnh. Tầng này cung cấp dữ
liệu thô đề các tầng cao hơn tách và định nghĩa các đặc trưng mức cao. Nó khơng
mạnh trong việc xử lý các truy vấn người sử dụng.
T ần g đổi tư ợ n g ảnh


- 15 -

'lang này bao gom hai tầng con; rằng con phân doạn và tầng con dặc trung.
Tầne con phân đoạn làm có đọng thơng tin lồn bộ ảnh hay video vào cụm
đặc tính về khơng gian và thời gian. Các đặc trung cục bộ này có thể được tim kiếm
trực tiếp. Tầng con này phụ thuộc mạnh vào kỹ thuật phân đoạn ảnh và video.
Tầng con đặc trưng chứa các đặc trưng hiệu quả cho tính tốn, được tổ chức
theo cấu trúc dữ liệu và tn theo tính tốn khoảng cách để phát sinh tỳ sổ xếp hạng
(ranking score). Các đặc trưng chung bao gồm lược đồ màu, hình đạng đối tượng và
kết cấu.
T ần g đối tượng lĩnh vực
Đối tượng lĩnh vực là thực thể do người sử dụng định nghĩa, nó biểu diễn
thực thể vật lý hay khái niệm suy diễn từ các đặc trưng của tầng thấp hơn. Các thí
dụ của đối tượng lĩnh vực là “ sunset” (khái niệm) và “heart" (đối tượng vật lý). Tri
thức về lĩnh vực cần thiết để suy diễn các đối tượng lĩnh vực.

T ầ n g sự kiện lĩnh vực
Tầng này định nghĩa các sự kiện mà nguời sử dụng có thề truy vấn. Các sự
kiện được định nghĩa trên cơ sờ tốc độ chuyển động đối tượng, các quan hệ thời
gian/không gian giữa các đối tượng, sự xuất hiện và biến mất đối tượng... Cơ chế tổ
chức và tách sự kiện là cần thiết để cài đặt tầng này.
T h í dụ 2: Mơ hình video tổng q u á t
Mơ hình video tổng qt bao gồm 4 tầng: frame, shot, scene (hay sequence)
và episode (video document) như trên hình 1.4.
>

Frame là các video và ảnh độc lập.

>

Shot là tập các frames được ghi hình bằng camera trong một lẩn bâm máy.

>

Scene là tập các shot có cùng ngừ nghĩa.

>

Episode ià tập các scenes trong trình tự cụ thể. Đó là một đơn vị sản phẩm
(thí dụ, chương trinh bản tin TV).


-16-

Hình 1.4: M ơ hình video tồng q u á t


Các thuộc tính được gẩn vào từng mức video. Tại tầng episode, ta có thể gán
dừ liệu thực sự như tiêu đề, tác giả, ngày tháng tạo lập và các thơng tin liên quan
đến kiểu viđeo như chương trình tin tức. Scene chứa ngữ nghĩa chung chia sẻ giữa
các shot của nó. Các shot dược đặc trưng bời các frames chính của nó và các dữ liệu
khác như các đối tượng chính ngày tháng và nơi quay hoặc chụp. Mồi frame chứa
ảnh và đừ liệu thống kê ảnh như biểu đồ màu.
T h í đụ 3: c ấ u trú c lưực đồ ảnh V irag«

Mơ tơ tìm kiếm ảnh Virage cung cấp khung làm việc mở để hình thành các
hệ thống truy tìm ảnh trên cơ sờ nội dung, c ấ u trúc lược đồ m ôtơ này bao gồm 3
mức: lược đồ, sơ khai (primitive) và kiểu dữ liệu.
> Trong hệ thống truy tỉm ảnh, 5 kiểu dữ liệu trừu tượng được nhận ra, bao

gồm:


Giá trị: là tập các vécíơ biểu diễn vài đặc tính tổng quát cùa ảnh
nhu các màu trội.



Phân bố (distribution): biểu diễn đặc tính thống kê ảnh như biểu đồ
phân bố màu.



Giá trị chi sổ hóa: giá trị nội bộ vùng ảnh và được biểu diễn như
tập chì sổ hoặc các véctơ.



- 17-



Phàn bơ chỉ sổ hóa: lả mẫu (pattern) hay phán bổ cục bộ cùa vùng
quan tàm.



Đồ thị (graph): bicu diễn thơng tin quan hệ, thí dụ vị trí khơna. gian
của hai vùng trong ảnh.

> Kiểu dừ liệu cơ bàn là tập hợp các véctơ với các thao tác sau:


Tạo lập tập họp: tạo lập tập hợp rồng cho các véctơ



Tạo lập véctơ: trích chọn và tạo lập véctơ đặc trưng cụ thể từ ảnh
sừ dụng hàm trích chọn đặc trưng cụ thể.



Trích chọn: xâm nhập một phần từ cùa tập họp



Khoảng cách: so sánh hai véctơ và cho lại thước đo khoàng cách
giữa chúng trẽn cơ sở hàm khoảng cách cụ thể cho loại véctơ




Tổ hạp; tạo véctơ mới bằng cách tổ hợp hai véctơ cho trước.



Hủy véctơ: giài phóng vùng nhớ kết hợp véctơ cụ thể



Hủy tập hợp: hủy tập hợp khỏi bộ nhớ.

Mức tiểp theo cùa thí dụ này tà các thuộc tính sơ khai (primitive). Sơ khai
được định nghĩa như tập hợp các véctơ biểu diễn một loại thông tin ảnh. Do vậy,
primitive là đặc trưng có ý nghĩa của ảnh như màu, kểt cấu và hình dạng. Nó được
đặc tả bởi định danh duy nhất, tên loại, các hàm quàn lý và truy tìm dữ liệu.
Tại mức cao nhất cùa cấu trúc lược đồ là lược đồ mà nỏ được định nghĩa bởi
bộ nhận danh lược đồ và tập thứ tự các primitive. Một ứng dụng cỏ thề định nghĩa
và sử dụng nhiều lược đồ. Các chức năng chèn và truy tìm thơng tin ảnh trên cơ sờ
nội dung là ở mức này.

1.2.3 Thiết kế g iao d iệ n n g ư ò ĩ sử d ụ n g
Người dùng sử dụng, giao tiếp và tương tác với CSDLĐPT thông qua giao
diện người sử dụng (UI - User Interface). Do vậy, UT phàn ánh khả năng sử dụng
CSDLĐPT. Các chức năng chính cùa UI là cho phép người sừ dụng chèn items vào
ĐAI HOC QUỐC GIA HÀ NỘI
ĨRUNG TÂM THÔNG TIN THƯ VIỆN



IlòS’-_
CSDI,. nhập câu truy vấn và trinh diễn kết quà truy vấn. UI tốt phải thỏa mãn các
yèu cầu sau:

> Cung cấp các công cụ để người đùng dễ dàng chèn các items CSDL;
> Cung cấp công cụ giúp người đùng nhập hiệu quà câu truy vẩn hay thông
báo cho hệ thổne các thơng tin nó cần;
> Trình diễn hiệu quả kết quả truy vẩn;
> Thân thiện.
Có rất nhiều việc phải làm để đáp ứng các yêu cầu trên ‘đối với dữ liệu và
ứng dụng đa phương tiện.

L 2.3.1 Cơ sở dữ liệu population
Trong CSDL truvền thống, mỗi bản ghi có cấu trúc cố định với tổng sổ cố
định các thuộc tính. Mỗi bản ghi được chèn vào CSDL bằng ngơn ngữ như SQL.
Trong CSDLĐPT thì các item CSDL có thể là kiểu bất kỳ hoặc là tổ hợp
nhiều kiểu dữ liệu đa phương tiện. Chúng khơng có cấu trúc và thuộc tính cổ định.
Do vậy, UI phải có khả năng để người sử dụng xác định kiểu đầu vào khác nhau, tổ
hợp các đổi tượng đa phương tiện và chi ra kiểu thuộc tính sẽ trích chọn và chi sổ
hóa. Yêu cầu UI phải là tổng quát để chèn tính tương tự truy vấn theo thí dụ (Query
by example).
Việc xử lý thơng tin đa phương tiện và trích chọn đặc trưng địi hỏi nhiều
tính tốn, thơng thường từ (vài giây)/(đổi tượng) đến (vài giờ)/(đối tượng phức tạp)
như phim. Do vậy phải có khả năng đặc tả các thao tác trên nhóm đối tượng. Việc
trích chọn đặc trưng phải được tự động hóa hồn tồn.

L 2.3.2 Hồ trợ truy vấn
Truy vẩn đa phương tiện là đa dạng và mờ. Nó đa dạng vì người sừ dụng có
thể chỉ ra truy vấn theo nhiều cách và với nhiều kiểu dữ liệu đa phương tiện khác
nhau. Nó m ờ vì người sử dụng biết họ đang tìm gi nhưng khá khó khăn khi mô tà



chính xác nó, hay các thơniỉ tin cân thiêt khơnu dược dịnh nghĩa chính xác (họ chi
nhận ra item khi nhìn thay). Đề thịa màn các u cầu về các đặc tính này, các cịng
cụ tim kiếm, duyệt và làm mịn truy vấn cần phài có sẵn trong hệ thống.
Tìm kiếm
Tim kiếm là nhiệm vụ cơ bản của mọi hệ quản trị CSDL. Trong CSDLĐPT
cỏ hai loại tìm kiểm:
> Tìm kiếm theo đặc tả: người sử dụng sử dụng một số từ khóa và tham số để
mơ tà các đặc trưng và thuộc tính chính về nhu cầu thơnsĩ tin của họ.
> Tìm kiếm theo thí đụ.
Khó khăn là ánh xạ như thế nào các mô tá cùa người sử dụng bàng ngôn ngữ
tự nhiên thành các mẫu (pattern) dữ liệu đa phương tiện để có thể đo được. Thí dụ,
người sử dụng đặc tả truy vấn như “xe ôtô đị”. Giả sử các ảnh trong CSDL khơng
tơ màu đầy đủ nhưng nó chứa biểu đồ màu và hình dạng đổi tượng ảnh. Câu hòi là
giá trị pixel nào được sừ dụng để mơ tà “đỏ” và hình dạne nào là “xe ơ tơ”. Để tìm
kiếm hiệu quả, hệ thống cần cung cấp hướng dẫn chi tiết về đặc tả truy vấn thơng
qua UI.
Khó khăn của ánh xạ nói trên có thể vượt qua bằng cách tìm kiếm theo thí
đụ. Trong trường hợp này, UI cho phép người sử dụng chí ra truy vấn theo nhiều
dạng khác nhau hay tổ hợp các loại dữ liệu truyền thông khác nhau. Truy vẩn bâv
giờ là đối tượng thí dụ và sẽ hịi hệ thống để tìm ra items tương tự đối tượng thí dụ.
Trong trường hợp trên, người sử dụng phải vẽ hình dạng xe ơ tơ và tơ màu đỏ. Hệ
thống sẽ tính tốn biểu đồ màu, tham số hinh dạng của truy vấn và tìm kiếm các
items có biểu đồ màu và tham số hình dạng tương tự. Đề hỗ trợ loại truy vấn nảy,
UI cần cung cấp các công cụ đầu vào khác nhau như microphone, công cụ đồ họa,
video camera, scanner và các công cụ authoring đa phương tiện khác. Người sừ
đụng cần có khả năng sử dụng các items trong CSDL như truy vẩn.



- 20 -

D uyệt
Đôi khi người sừ đụng không biết chinh xác cái họ muốn nhung nhận ra cái
họ cần khi nhìn thấy nó. Loại thơng tin này cần đưực đáp ứng bởi duyệt. Ba phương
pháp khởi đầu đuvệt:

> Bắt đầu từ truy vấn khơng rõ ràng sau đó người dùng dẫn đường qua các
items trên cơ sở các kết quả.
> Địi hỏi các thơng tin trong CSDL được tổ chức theo vài tiêu chí nào đó
(ngày tháng, chù điểm) để người sừ dụng cỏ thể duyệt theo các tiêu chí
nảy.
> Chọn ngẫu nhiên một sổ item(s) từ CSDL để trình diễn và người dung có
thể sử dụng chúng như điểm khải đầu cho việc duyệt. Nếu khơng tìm thấy
items thỏa mãn, người dùng có thề chọn ngẫu nhiên nhóm khác để trinh
diễn.
Để duyệt hiệu quả, các items thông tin cần có tồ chức tốt và hình thành các
biểu tượng con để trình diễn thay cho trình diễn tồn bộ đối tượng trong khi duyệt.
Với ảnh ta sử dụng ảnh thumbnail. Với video sẽ sừ dụng frame đại diện hay biếu
tượng phim 3D.
L àm mịn tru y vấn
Phần lớn truy vấn khởi đầu là m ờ và khơng chính xác. UI cần cung cấp công
cụ để người dùng làm mịn truy vẩn trên cơ sờ kết quả truy vấn ban đầu. Làm mịn
truy vấn được thực hiện thông thường trên cơ sở phản hồi của người dùng từ kết
quả khởi đầu. Khi người dùng nhìn thấy mục gần nhu cái họ mong muốn thì họ có
thể tích hợp các đặc trưng của items vào truy vẩn mới. Sau vài lẩn lặp, người dùng
có thể tìm thấy mục ỉiên quan. Tri thức lĩnh vực và thông tin mà người đùng sử
dụng đề làm mịn truy vấn.
Trong thực tế, định vị thông tin đa phương tiện là tổ hợp tìm kiếm, duyệt và
làm mịn truy vấn.



1.2 .3 .3 T rìn h d iê n k ế t qu ả

CSDLĐPT trình diễn kết quà truy vấn thơng qua UI. Có nhiều việc phải làm
để trình diễn kết quả. bao gồm:
> UI có khà nàng trinh diễn mọi loại media và quản lý các quan hệ không
gian và thời gian của chúng (là nhiệm vụ đàm bảu QoS).
> Thơng tín kết q có thể chứa trong nhiều đoạn aucỉio dài, ảnh lớn hay
video dài. Nhiệm vụ lả phải tách, xây dựng và trình diễn các thơng tin
chính để người đùng duyệt và chọn. Nói cách khác là đòi hỏi các kv thuật
xây dựng cấu trúc (quang cảnh) thơng tin sao cho ngươi dùng có thể nhận
biết nhanh cái gì đang cỏ. Ảnh thumbnail (ảnh thu nhị) hav biểu tượng
phim là các công cụ đặc biệt quan trọng.
> Thời gian đáp ứng hệ thống phải ngẳn. Thời gian đáp ứng được xác định
bởi phân hệ truyền tin và tìm kiểm trong CSDL. Một kỹ thuật để có cảm
giác giảm thời gian đáp ứng là giải mã tăng dần (progressive) và hiển thị.
> Trinh diễn kết quà phải phàn hồi dễ dàng và làm mịn truy vấn.

1.2.4 Trích chọn đặc trưng, chỉ mục và đo tương tự
Các đặc trưng và thuộc tính của dữ liệu (items) trong CSDLĐPT được trích
chọn, tham số hóa và lưu trữ chung với chính các dữ liệu. Các đặc trưng và thuộc
tính của truy vấn cũng được trích chọn theo cùng cách thức nếu nó khơng được xác
định rõ ràng trước. Hệ thống tìm kiếm các items trong CSDL với các thuộc tính và
đặc trưng tưomg tự trên cơ sờ thước đo tính tương tự nhất định. Để tim kiếm hiệu
quả, các dặc trưng và thuộc tính phải được tổ chức thành các cấu trúc có chi số.

1.2.4. ỉ Trích chọn đặc trưng
Các mục thông tin đa phương tiện trong CSDL được tiền xử lý để trích chọn
đặc trưng và thuộc tính.

Trong tiến trình tìm kiếm, các đặc trưng và thuộc tính này được tìm kiếm và
so sánh thay cho chính các mục thơng tin. Do vậy chất lượng của trích chọn đặc


Irưng xác định hiệu quá tìm kiếm. Ncu đặc trung khỏnu được tách ra tìr item nào thì
khơng thề tìm thấy chúng tứ CSDL theo dặc trim s đó. Đó là một trong sự khác biệt
lớn nhất giữa CSDLĐPT và các HQTCSDL truyền thống khác. Trích chọn đặc
trưng phái thịa mãn các yêu cầu sau:
> Đặc trưng và thuộc tính trích chọn phái đẩy đù nhất có thể để biểu diễn nội
dung của các mục thônu, tin.
>

Các đặc trưng phải được trình diễn và lưu trữ một cách chặt chẽ, mạch lạc.
Các đặc trưng phức tạp và lớn không phải là mục đích cùa trích chọn, nó
phải có khả năng tìm kiếm và so sánh nhanh các mục thơng tin với nhau.

> Tính tốn khoảng cách giữa các đặc trưng phải hiệu quà, nếu không thời
gian đáp ứng của hệ thống rất lớn.
Tổng thể có 4 mức đặc trưng và thuộc tính như sau:
> Siêu d ữ liệu (M etadata): bao gồm các thuộc tính của các đối tượng đa
phương tiện như tên tác giả, ngày tạo lập, tiêu đề đối tượng. Không mô tả
hay diễn giải nội dung cùa đối tượng. Các thuộc tính này được quản lý
bàng kỹ thuật cùa HQTCSDL. (Trong một số tài liệu, siêu dữ liệu bao gồm
toàn bộ các mức đặc trưng và thuộc tính đang mơ tả tại đây).
> Mơ tả b ằn g văn bản: Mô tà nội dung đối tượng bẩng văn bản. Mơ tả dưới
hinh thức nhiều từ khóa hay văn bản thơng thường. Chỉ sổ hóa và tìm kiếm
trên cơ sở mô tả bằng văn bản được quàn lý bàng kỳ thuật truy tìm thơng
tin (Information Retrive - IR). Mặc dù mơ tả bầng văn bàn có giới hạn là
cịn tính chủ quan và chưa đầy đủ nhưng đây vẫn. là phương pháp hay được
sừ dụng và hiệu quả. Nên sừ dụng mô tả bằng văn bản kết hợp vói các đặc

trung khác trong ứng dụng đa phương tiện. Hiện tại, mô tả văn bản được
thực hiện thủ công nên khá vất và. c ầ n phát triển các cơng cụ bán tự động
để hỗ trợ tiến trình này. Tri thức lĩnh vực và từ điển liệt kê luôn có ích để
đạt được hiệu năng íruy vấn cao.
> Đ ặc trư n g nội du n g m ức th ấ p : Thu thập các mẫu và thống kê đổi tượng


đa phương tiện và các

quan

hệ khịníi lỊÌan, thời gian giũa các phẩn đối

tượng. Mỗi kiểu dừ liệu đa phưong tiện khác nhau có các đặc tnrrm nội
duno mức thấp khác nhau.


Với âm thanh, đặc trưng mức thấp bao gồm âm lượng trung bình,
phân bổ tẩn sổ và tý lệ câm.



Các đặc trưng mức thấp cùa ảnh bao gồm phân bổ màu, texture
(kết cấu nền), hình dạng đối tượng và cẩu trúc khơng gian.



Đặc truna. mức thấp của video là cấu trúc thời gian.




Lợi thế chính của việc sử dụng đặc trưng mức thấp là có thể tự
động trích chọn chủng.

> Đặc trư n g nội dung m ức cao: c ố gắng nhận biết và hiểu đối tượng.
Ngoài nhận dạng văn bản và tiếng nói. việc nhận dạng và hiểu đoạn âm
thanh và các đổi tượng nhin là rất khó khàn. Trong ứng dụng với giới hạn
số lượng đối tượng, việc mô tả và nhận biết các đối tượng chung là rất hiệu
quà. Thí dụ, dự báo tới 95% các video có mục tiêu chính là quav người hay
nhóm người. Nó hữu ích cho các hệ thống để nhận biết và diễn giải con
người. Hiện tại, tiến trình nhận đạng và diễn giải được thực hiện bán tự
động.
Việc truy vấn trên cơ sờ hai loại đặc trưng nội dung mức thấp và mức cao gọi
là truy vấn trên cơ sở nội dung. Một hệ thống cẩn sử dụng toàn bộ bốn mức đặc
trưng sao cho hỗ trợ được các câu truy vấn mềm dẻo của người sừ dụng. Các kỹ
thuật này hỗ trợ nhau để hinh thành mô tả đầy đù về đối'tượng. Thí dụ, mơ tả văn
bản tốt cho việc thu thập các khái niệm trừu tượng như cảm giác (vui, buồn...)
nhưng khơng có khả năng mơ tả mẫu dữ liệu đầy đù về các hình dạng khơng đều
hay kết cấu. M ặt khác, các dặc trưng nội dung mức thấp có thể thu thập các mẫu dữ
liệu này nhưng không mô tà được các khái niệm trừu tượng.
Khi đối tượng đa phương tiện có nhiều kiểu dừ liệu đa phương tiện, các quan
hệ và tương tác giữa các loại dữ liệu này phài được sử dụng để trích chọn đặc trưng,


×