Tải bản đầy đủ (.pdf) (33 trang)

TÌM HIỂU CSDL ĐA PHƯƠNG TIỆN pot

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (763.4 KB, 33 trang )


TRƯỜNG ĐẠI HỌC SƯ PHẠM TPHCM
KHOA CÔNG NGHỆ THÔNG TIN
LỚP TIN HỌC 4






TÌM HIỂU CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN


BÁO CÁO NGHIÊN CỨU
MÔN: CƠ SỞ DỮ LIỆU NÂNG CAO





Giáo viên hướng dẫn: ThS. Nguyễn Đặng Kim Khánh
Sinh viên thực hiện:
Đinh Văn Quyên – K35.103.061
Nguyễn Ngọc Nhất Linh – K35.103.031
Lê Thị Kim Nga – K35.103.037
– Nhóm 04 –



TP.HCM,12/2012


1

MỤC LỤC
BẢNG GIẢI THÍCH THUẬT NGỮ VÀ KÝ HIỆU VIẾT TẮT 3
MỞ ĐẦU 5
TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN 5 CHƯƠNG I.
1. Định nghĩa về cơ sở dữ liệu đa phương tiện: 5
2. Các đặc trưng của cơ sở dữ liệu đa phương tiện: 6
3. Sự cần thiết đối với cơ sở dữ liệu đa phương tiện: 6
4. Tổ chức nội dung trong cơ sở dữ liệu đa phương tiện: 7
4.1. Nguyên lý tự trị (atonomy): 7
4.2. Nguyên lý đồng nhất (uniformity): 8
4.3. Nguyên lý lai (hybrid): 10
NGÔN NGỮ TRUY VẤN DỮ LIỆU ĐA PHƯƠNG TIỆN 11 CHƯƠNG II.
1. Truy vấn SMDSs (mô tả đồng nhất): 11
2. Truy vấn dữ liệu đa phương tiện mô tả dưới kiến trúc lai tạo: 14
HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN 17 CHƯƠNG III.
1. Định nghĩa về hệ quản trị cơ sở dữ liệu đa phương tiện: 17
2. Kiến trúc hệ quản trị cơ sở dữ liệu đa phương tiện: 17
3. Các yêu cầu của hệ quản trị cơ sở dữ liệu đa phương tiện: 19
4. Các vấn đề của hệ quản trị cơ sở dữ liệu đa phương tiện: 19
4.1. Mô hình hóa dữ liệu đa phương tiện: 19
4.2. Lưu trữ đối tượng đa phương tiện: 20
4.3. Chỉ số hóa đa phương tiện: 21
4.4. Hỗ trợ truy vấn đa phương tiện, khai thác và duyệt: 22
ỨNG DỤNG CỦA CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN – CHƯƠNG IV.
ORACLE MULTIMEDIA 23
1. Giới thiệu chung: 23
2. Công nghệ quan hệ - đối tượng: 24
3. Các khả năng của Oracle Multimedia: 24

2

4. Khái niệm âm thanh: 26
4.1. Âm thanh số hóa: 26
4.2. Các thành phần trong âm thanh: 26
5. Khái niệm ORDDoc – dữ liệu media hỗn hợp: 26
5.1. Dữ liệu media hỗn hợp được số hóa: 26
5.2. Các thành phần trong dữ liệu media hỗn hợp: 27
6. Khái niệm hình ảnh: 27
6.1. Hình ảnh số hóa: 27
6.2. Các thành phần trong hình ảnh: 27
6.3. Metadata in Images 28
7. Khái niệm video: 28
7.1. Video số hóa: 28
7.2. Các thành phần của video: 28
8. Lưu trữ và truy vấn đa phương tiện: 29
8.1. Lưu trữ dữ liệu đa phương tiện 29
8.2. Truy vấn dữ liệu đa phương tiện: 30
9. Nạp dữ liệu đa phương tiện 31
TÀI LIỆU THAM KHẢO 32



3

BẢNG GIẢI THÍCH THUẬT NGỮ VÀ KÝ HIỆU VIẾT TẮT
STT
THUẬT NGỮ/VIẾT TẮT
Ý NGHĨA
1

CSDL
Cơ sở dữ liệu
2
Hyperlink
Siêu liên kết
3
MDBMS
Hệ quản trị CSDL đa phương tiện
4
DBMS
Hệ quản trị CSDL
5
QoS
Quality of Service, chất lượng của dịch vụ
6
CNTT
Công nghệ thông tin
7
Media
Phương tiện truyền thông
8
OracleDB
Oracle Database, cơ sở dữ liệu Oracle
9
BLOB
Binary Large Object, kiểu dữ liệu đối tượng nhị
phân kích thước lớn
10
MIME
Multipurpose Internet Mail Extensions, một

chuẩn Internet về định dạng cho thư điện tử
11
Bit rate
Dung lượng mà thiết bị lưu trữ cần để xử lý một
giây âm thanh (hay video)
12
Sampling rate
Số lần lấy mẫu trên một giây của âm thanh
13
VCR
Video cassette recorder, đầu thu video
14
CLOB
Character large object, kiểu dữ liệu đối tượng kí
tự kích thước lớn
15
XML
Extention Markup Language, ngôn ngữ đánh dấu
mở rộng
16
BFILEs
File-based large object, kiểu dữ liệu dùng để lưu
trữ một định vị (liên kết) tới một tập tin nhị phân
bên ngoài (lưu trữ bên ngoài cơ sở dữ liệu)
17
Scale
Thay đổi kích thước ảnh mà vẫn giữ nguyên tỉ lệ
4

18

URL
Universal resource locator, địa chỉ một trang web
trên hệ thống World Wide Web
19
HTTP
Hyper Text Transfer Protocol, giao thức truyền
tải siêu văn bản
20
Tablespace
Một đơn vị lưu trữ bên trong cơ sở dữ liệu
Oracle, tham khảo thêm tại địa chỉ:
-
gmbh.ch/ora/concepts/tablespaces.html
21
SQL
Structured Query Language, ngôn ngữ truy vấn
có cấu trúc

5

MỞ ĐẦU
Trong thời đại ngày nay, công nghệ thông tin (CNTT) đã phát triển vượt bậc đến mức
ăn sâu vào cuộc sống hàng ngày của con người. Sự phát triển của CNTT gắn với các xu
hướng như máy tính cá nhân được sử dụng ngày càng phổ biến; công nghệ phần cứng
phát triển không ngừng mang đến các thiết bị nghe nhìn có độ phân giải cao, có khả năng
hiển thị nội dung đa phương tiện tuyệt vời; bên cạnh đó hạ tầng kỹ thuật mạng được cải
thiện đáng kể cho phép nội dung đa phương tiện có thể truyền tải qua mạng nhanh nhất,
phục vụ các nhu cầu của người dùng từ giải trí đến công việc. Tuy nhiên, cho đến khi nhu
cầu của người dùng và khả năng đáp ứng về dữ liệu đa phương tiện là rất lớn thì phát sinh
một vấn đề là làm sao quản lý và khai thác dữ liệu đa phương tiện một cách tốt nhất? Các

dữ liệu đa phương tiện hoàn toàn có thể lưu trữ trên đĩa và truy cập một cách truyền
thống, nhưng để đáp ứng yêu cầu nêu trên thì ta cần phải tổ chức chúng thành một cơ sở
dữ liệu (CSDL) đa phương tiện và cần tới một hệ quản trị CSDL đa phương tiện dùng để
quản lý và hỗ trợ khai thác chúng. Vậy CSDL đa phương tiện là gì? Tại sao lại cần dùng
đến CSDL đa phương tiện? Các nền tảng lý thuyết của CSDL đa phương tiện và ứng
dụng của nó là gì? Các nội dung trên chúng ta sẽ cùng tìm hiểu trong đề tài này.

TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU CHƯƠNG I.
ĐA PHƯƠNG TIỆN
1. Định nghĩa về cơ sở dữ liệu đa phương tiện:
Cơ sở dữ liệu đa phương tiện là một tập hợp các dữ liệu đa phương tiện có liên quan
với nhau. Các kiểu dữ liệu thông hường của một CSDL đa phương tiện bao gồm:
 Văn bản: có mặt trong hầu hết các ứng dụng đa phương tiện nhằm giải thích thêm
cho những dạng dữ liệu không phải là văn bản; đây là loại dữ liệu đa dạng (được sử
dụng với nhiều loại ngôn ngữ khác nhau) và được lưu trữ nhỏ gọn nhất;
 Audio: đây gần như là loại dữ liệu phổ biến nhất với nhiều định dạng khác nhau
(mp3, wav, wma, cd, ra, qt…). File audio chưa được chuyển hóa thành dữ liệu số có
kích thước lớn (1s chiếm 10Kb) và nó có thể nén dễ dàng (hệ số nén của file mp3 -
12:1);
 Hình ảnh: bao gồm ảnh đen trắng, ảnh xám, ảnh màu. Hình ảnh có nhiều định
dạng (bmp, gif, jpeg, pcx, png…). Một trang ảnh có độ phân giải cao chiếm vài Mb,
và cũng như âm thanh, hình ảnh cũng có thể nén, ví dụ định dạng JPEG có hệ số nén
thường lớn hơn 10;
6

 Video kĩ thuật số: là một chuỗi các hình ảnh liên tục nhau. Loại dữ liệu này
thường đòi hỏi dung lượng lưu trữ lớn tuy hệ số nén của nó là khá cao. Vận tốc truyền
và thu video kĩ thuật số phải nằm trong khoảng 20-30 hình một giây. Trong các loại
video kĩ thuật số, phim hoạt hình là loại nhỏ gọn và dễ lưu trữ hơn các loại khác vì sử
dụng các hình ảnh tổng hợp có sử dụng các mẫu chuẩn;

 Ảnh vec-tơ là loại ảnh mà các hình vẽ được tạo nên bởi công thức chứ không phải
các điểm ảnh. Ảnh vectơ có 2 dạng: 2 chiều và 3 chiều. Ưu điểm của ảnh vec-tơ là có
thể thay đổi độ lớn của ảnh mà không làm thay đổi chất lượng ảnh;
 Tích hợp văn bản và hình ảnh;
 Tích hợp audio và video;
 Siêu phương tiện là một dạng biểu diễn phi tuyến tính của dữ liệu đa phương tiện
(chứa các hyperlink).
Dữ liệu đa phương tiện được chia thành hai lớp là các dữ liệu liên tục và các dữ liệu
không liên tục. Các dữ liệu liên tục bao gồm các dữ liệu âm thanh, video thay đổi theo
thời gian. Các dữ liệu không liên tục là các dữ liệu không phục thuộc vào thời gian, các
loại dữ liệu đặc trưng cho dạng này là các dữ liệu văn bản (có hoặc không có định dạng),
hình ảnh tĩnh và các đối tượng đồ họa.
2. Các đặc trưng của cơ sở dữ liệu đa phương tiện:
Do CSDL đa phương tiện là sự tổng hợp của nhiều dữ liệu đa phương tiện khác nhau
nên nó có những đặc trưng nổi bậc như sau:
 Thiếu cấu trúc (Lack of structure): CSDL đa phương tiện thường không có cấu
trúc, do đó các tác vụ chuẩn trên CSDL truyền thống như chỉ số hóa, tìm kiếm nội
dung, truy xuất dữ liệu có thể không thực hiện được;
 Tính thời gian (Temporality): Một vài kiểu dữ liệu multimedia như là Video, âm
thanh và hoạt hình đều phụ thuộc vào yếu tố thời gian liên quan mật thiết đến việc lưu
trữ, thao tác và mô tả chúng;
 Dung lượng lưu trữ lớn (Massive Volume): các dữ liệu video và âm thanh
thường đòi hỏi các thiết bị lưu trữ lớn;
 Các ứng dụng hỗ trợ (Logistics): các dữ liệu phi chuần có thể đòi hỏi các quy
trình xử lý phức tạp như việc sử dụng các thuật toán nén dữ liệu đối với các ứng
dụng CSDL đa phương tiện.
3. Sự cần thiết đối với cơ sở dữ liệu đa phương tiện:
7

Như đã trình bày ở phần trên, đối với nhu cầu ngày càng lớn về dữ liệu đa phương

tiện thì sự hiện hữu của CSDL đa phương tiện là hết sức cần thiết. Điều này xuất phát từ
một số nguyên nhân cơ bản như sau:
 Các dữ liệu đa phương tiện có kích thước lớn và sẽ ảnh hưởng đến việc lưu trữ,
truy xuất và truyền tải các nội dung đa phương tiện;
 Cấu trúc của dữ liệu đa phương tiện khác xa so với các CSDL chuẩn;
 Các kiểu dữ liệu có tính chất liên tục (như video và audio) không thể xử lý được
trong CSDL chuẩn – vốn chỉ dành để xử lý các kiểu dữ liệu không liên tục như văn
bản và số;
Ngoài ra, khi nói đến CSDL đa phương tiện thì cũng không thể không nhắc đến hệ
quản trị CSDL đa phương tiện. Nhờ có nó mà dữ liệu đa phương tiện được tổ chức và
khai thác hợp lý, giải quyết được các vấn đề ở trên.
4. Tổ chức nội dung trong cơ sở dữ liệu đa phương tiện:
Ở đây chúng ta xem xét tới 3 kiến trúc áp dụng cho việc tổ chức nội dung của một hệ
thống CSDL đa phương tiện:
 Nguyên lý tự trị;
 Nguyên lý đồng nhất;
 Nguyên tắc lai ghép.
4.1. Nguyên lý tự trị (atonomy):
Nguyên lý này đề cập tới việc chúng ta nhóm tất cả các dữ liệu ảnh, dữ liệu video và
tất cả các dữ liệu văn bản và chỉ số hóa chúng theo nguyên tắc tối đa hóa hiệu suất của tất
cả các loại truy nhập đối với các loại dữ liệu mà chúng ta dự định. Nguyên lý này đảm
bảo rằng với mỗi loại dữ liệu (ảnh, video, văn bản) chúng đều được tổ chức với một cách
thức đặc trưng phù hợp với mỗi loại dữ liệu này.
8


Hình 1: Mô tả nguyên lý tự trị
Kiến trúc dựa trên nguyên lý tự trị đòi hỏi việc tạo ra các thuật toán và cấu trúc dữ
liệu của mỗi kiểu dữ liệu, ngoài ra nó cũng đòi hỏi các kỹ thuật hỗ trợ cho việc liên kết
chéo giữa các cấu trúc dữ liệu khác nhau này. Các công việc này đòi hỏi tính phức tạp

cao và đòi hỏi một lượng thời gian lớn cho việc phát triển. Bên cạnh các nhược điểm trên,
việc xây dựng các cấu trúc chuyên biệt hóa đem đến sự tối ưu cho việc truy xuất đến từng
loại dữ liệu khác nhau, và CSDL đa phương tiện được tổ chức theo nguyên lý này thường
đạt được hiệu quả cao trong việc xử lý tìm kiếm. Đối với các ngân hàng dữ liệu đã được
xây dựng sẵn, nơi mà các thuật toán và các cấu trúc dữ liệu đã được sử dụng có hiệu quả
thì việc áp dụng nguyên lý tự trị là mô hình kiến trúc thích hợp nhất. Các kỹ thuật hướng
đối tượng chính là công cụ đắc lực nhất hỗ trợ cho việc triển khai theo nguyên lý này
bằng cách xem mỗi loại dữ liệu nguồn là một đối tượng mà các phương thức của nó có
thể truy cập được từ một CSDL đa phương tiện tổng thể.
4.2. Nguyên lý đồng nhất (uniformity):
Một nguyên lý kiến trúc khác mà chúng ta có thể lựa chọn là nguyên lý đồng nhất,
nguyên lý này giúp chúng ta tìm được một cấu trúc tóm tắt chung cho tất cả các loại dữ
liệu. Cấu trúc này có thể được dùng trong việc chỉ số hóa tất cả các loại dữ liệu qua đó
tạo ra một “chỉ số thống nhất” mà chúng ta có thể dùng để truy cập tới các đối tượng khác
nhau. Hay nói một cách khác là chúng ta có thể trình bày tất cả các đối tượng khác nhau
9

(ảnh, video, âm thanh, văn bản) trong một cấu trúc dữ liệu duy nhất và qua đó phát triển
các thuật toán để truy vấn cấu trúc dữ liệu này.

Hình 2: Mô tả nguyên lý đồng nhất
Trái ngược với nguyên lý tự trị, nguyên lý đồng nhất đòi hỏi chúng ta phải tìm ra
được một cấu trúc dữ liệu chung mà có thể dùng để lưu trữ các thông tin về nội dung của
hình ảnh, video, văn bản, âm thanh và các loại dữ liệu khác. Điều này đòi hỏi chúng ta
phải phân tích nội dung của mỗi kiểu dữ liệu và tóm tắt được phần chung của chúng, qua
đó xây dựng một bộ chỉ số dựa trên các yếu tố chung đã được xác định này.ưu điểm nổi
bật của nguyên lý đồng nhất là dễ dàng triển khai và các thuật toán thường được thực
hiện rất nhanh. Nhược điểm chính của nguyên lý này là các sự chú giải phải được tạo ra
theo một cách riêng nào đó, thường là được tạo ra một cách thủ công hoặc là tự động,
việc tạo ra các chú giải một cách thủ công thường đỏi hòi nhiều về mặt thời gian cũng

như chi phí, mặt khác trong quá trình tạo các chú giải này thường xảy ra sự mất mát
thông tin nếu ngôn ngữ dùng để chú giải không trình bày hết được các khía cạnh của nội
dung. Có thể đưa ra đây một số ví dụ như ngôn ngữ chú giải nội dung của hình ảnh có thể
làm mất các thông tin về bề mặt của một điểm ảnh (pixel) hoặc một nhóm điểm ảnh.
Tương tự như vậy ngôn ngữ chú giải nội dung của âm thanh có thể làm mất các thông tin
về biên độ, tần số của tín hiệu tại một thời điểm nào đó.
10

4.3. Nguyên lý lai (hybrid):
Ý tưởng của nguyên lý này là dựa trên sự kết hợp của 2 nguyên lý đã trình bày ở trên.
Kết quả của nguyên lý này là một kiểu dữ liệu nào đó sử dụng chỉ số (index) riêng của
chúng, trong khi đó các kiểu dữ liệu khác sẽ sử dụng một chỉ số (Index) “thống nhất”.
Loại dữ liệu nào sử dụng kiểu chỉ số nào sẽ phụ thuộc vào các đặc tính khác nhau.

Hình 3: Mô tả nguyên lý lai ghép
Nguyên lý lai tạo tập hợp được các ưu điểm của cả hai nguyên lý nêu trên, đồng thời
giảm thiểu được một số các nhược điểm của chúng. Giả sử chúng ta muốn tạo ra một
CSDL đa phương tiện bao gồm các kiểu dữ liệu M1, …….,Mn, chúng ta bắt đầu bằng
việc phân chia tập này thành 2 phần:
 Phần 1: bao gồm các loại dữ liệu kế thừa từ các nguồn dữ liệu có sẵn, tồn tại sẵn
các chỉ số và các thuật toán để thao tác với chỉ số. Với việc bố trí này chúng ta đã tận
dụng được lợi thế của các chỉ số và mã nguồn sẵn có.
 Phần 2: bao gồm các dữ liệu không được kế thừa từ bất kỳ nguồn nào và do đó
không có sẵn các chỉ số của mình (điều này đồng nghĩa với việc là cũng không có bất
kỳ thuật toán nào để có thể thao tác với tập chỉ số). Trong trường hợp này việc tiếp
cận xây dựng hệ thống theo nguyên lý đồng nhất là cách thức thích hợp nhất ngay cả
khi là cách tiếp cận này có thể nảy sinh ra việc gây mất mát các thông tin vật lý chi
tiết.
11


Sau khi đã tiến hành xong việc phân chia, chúng ta bắt đầu tiến hành việc xây dựng
các thuật toán cần thiết để kết hợp các nguồn dữ liệu khác nhau lại bằng việc sử dụng các
tập chỉ số riêng của chúng. Cách tiếp cận này giúp chúng ta thừa kế được tối đa các tài
nguyên có sẵn, đồng thời giảm thiểu được các công việc phải thực hiện thêm bởi vì các
tệp chỉ số riêng có sẵn đối với mỗi loại dữ liệu đã được tận dụng.
NGÔN NGỮ TRUY VẤN DỮ LIỆU CHƯƠNG II.
ĐA PHƯƠNG TIỆN
Ngày nay, với sự phát triển vượt bậc của công nghệ thu giữ (capture) dữ liệu nghe
nhìn và không gia lưu trữ ngày càng gia tăng đã cho phép tạo ra các bộ sưu tập khổng lồ
các dữ liệu đa phương tiện. Tuy nhiên, khi CSDL ngày càng phình to ra thì những khó
khăn trong việc tìm kiếm một bức ảnh hay video mong muốn lại cũng tăng lên. Để giải
quyết vấn đề này, người ta có hai phương pháp đã được phát triển:
 Phương pháp thứ nhất: sử dụng các thông tin được nhập thủ công hay được bao
gồm trong thiết kế của bảng, như tiêu đề, các từ khóa mô tả - thường đã được xác định
từ trước trong lược đồ phân loại (classification schemes). Phương pháp này được biết
đến với tên gọi là truy xuất dựa trên thuộc tính (attribute-based retrieval);
 Phương pháp thứ hai: sử dụng các đặc trưng được rút trích từ nội dung của đối
tượng đa phương tiện và sự nhận diện đối tượng để phân loại nội dung dữ liệu đa
phương tiện. Phương pháp này được biết đến với tên gọi là truy xuất dựa trên nội
dung (content-based retrieval). Phương pháp này đề xuất ý tưởng sử dụng vectơ đặc
trưng – một bộ giá trị số có kích thước cố định được rút trích từ nội dung để truy vấn.
Do tính chất phức tạp và độ rộng của phương pháp thứ hai nên nghiên cứu này chỉ tập
trung tìm hiểu phương pháp thứ nhất. Cụ thể, chúng ta sẽ tìm hiểu một ngôn ngữ truy vấn
đơn giản được xây dựng dựa trên SQL dùng để khai thác dữ liệu đa phương tiện. Ở phần
trên chúng ta đã tìm hiểu cách tổ chức dữ liệu theo nguyên lý đồng nhất và lai ghép. Việc
mở rộng ngôn ngữ truy vấn SQL sử dụng cho việc truy vấn dữ liệu được xây dựng bởi
kiến trúc mô tả đồng nhất sẽ là tiền đề để chúng ta tiếp tục mở rộng ngôn ngữ truy vấn
dùng cho việc khai thác các dữ liệu media được xây dựng theo kiến trúc lai ghép. Chúng
ta sẽ cùng tìm hiểu xem xét một hệ thống cơ sở dữ liệu đa phương tiện đơn giản (SMDS
– Simple multimedia database system).

1. Truy vấn SMDSs (mô tả đồng nhất):
Các hàm cơ bản của SMDSs bao gồm:
12

 FindType(Obj): hàm này dùng đối tượng Obj như là dữ liệu đầu vào và trả về
kiểu của đối tượng, ví dụ:
+ FindType(image1.gif) = gif.
+ FindType(movie1.mpg) = mpg.
 FindObjWithFeature(f): hàm này này sử dụng đặc trưng f là giá trị đầu vào và
trả về một tập tất cả các loại đối tượng media mà có chứa đặc trưng f, ví dụ:
+ FindObjWithFeature(john)= {iml.gif,im2.gif,im3.gif,videol.mpg:[1,5]}.
+ FindObjWithFeature(mary)= {videol.mpg:[1,5],videol.mpg:[15,50]}.
 FindObjWithFeatureandAttr(f,a,v): hàm này sử dụng đặc trưng f, một thuộc
tính tên a kết hợp với đặc trưng này và một giá trị v là đầu vào. Giá trị trả về sẽ là tất
cả các đối tượng obj có chứa đặc trưng và giá trị của thuộc tính a trong đối tượng obj
là v. Ví dụ:
+ FindObjWithFeatureandAttr(Big Spender,suit,blue): Truy vấn này yêu cầu tìm
tất cả các đối tượng media mà có sự xuất hiện của Big Spender trong bộ đồ
màu xanh.
 FindFeaturesinObj(Obj): câu truy vấn này đòi hỏi phải tìm tất cả các đặc trưng
có mặt trong một đối tượng media đã cho. Kết quả trả về là một tập bao gồm tất cả
các đặc trưng. Ví dụ:
+ FindFeaturesinObj (iml.gif): câu truy vấn này yêu cầu trả về tất cả các đặc
trưng có trong file ảnh im1.gif.
+ FindFeaturesinObj(videol.mpg:[1,15]): câu truy vấn này yêu cầu trả về tất cả
các đặc trưng có trong 15 frame đầu tiên của file video video1.mpg.
 FindFeaturesandAttrinObj(Obj): truy vấn này cũng có chức năng tương tự như
hàm trước ngoại trừ việc nó trả về một quan hệ có schema như sau: (Feature,
Attribute,Value) trong đó cặp 3 (f,a,v) xuất hiện trong quan hệ đầu ra nếu tính năng f
xảy ra trong câu truy vấn FindFeaturesinObj(Obj) và thuộc tính a của đặc trưng f

được xác định và có giá trị là v. Ví dụ:
+ FindFeaturesandAttrinObj(iml.gif) có thể trả về kết quả được mô tả ở bảng sau:
13


Bảng 1: Bảng mô tả kết quả của truy vấn FindFeaturesandAttrinObj(iml.gif)
SMDS-SQL của chúng ta sẽ bao gồm tất cả các câu lệnh chuẩn của SQL có bổ sung
thêm một số đặc trưng của dữ liệu đa phương tiện vào SQL (bổ sung thêm vào Select,
From, Where)
 Mệnh đề SELECT có thể chứa thực thể media. Một thực thể media được định
nghĩa như sau:
+ Nếu m là một đối tượng media liên tục, i và j là 2 số nguyên khi đó m: [i,j] là
một thực thể media thể hiện một tập tất cả các frame của đối tượng media m
nằm trong (và chỉ trong) khoảng i và j.
+ Nếu m không phải là một đối tượng media liên tục thì khi đó m là một thực thể
media.
+ Nếu m là một thực thể media và a là một thuộc tính của m thì khi đó m.a là một
thực thể media.
 Mệnh đề FROM có thể chứa các thực thể theo mẫu sau:
<media> <source> <M>, có nghĩa là chỉ có các đối tượng media kết hợp với tên của
kiểu media và tên của dữ liệu nguồn được xem xét đến khi thực hiện truy vấn và M là
một biến được xếp loại trên các đối tượng media đó.
 Mệnh đề WHERE cho phép có các biểu thức có dạng term IN func_call. Trong
đó:
+ Term có thể là một biến (trong trường hợp này được sắp xếp trên kiểu trả về
của func.call) hoặc là một đối tượng có kiểu đầu ra giống như func.call.
+ Func.call là một trong 5 hàm đã nêu ra ở trên.
Chúng ta xem xét một vài ví dụ:
14


+ Tìm tất cả các đối tượng ảnh hoặc video có chứa cả Jane Shady và Denis
Dopeman.
Select M
FROM smds source1 M
WHERE (FindType(M)= Video OR FindType(M)=Image
AND
M IN FindObjWithFeatureand(Jane Shady)
AND
M IN FindObjWithFeatureand(Denis Dopeman)
+ Tìm tất cả các ảnh và video mà đối tượng Jane Shady mặc áo vét mầu tím
SELECT M
FROM smds source1 M
WHERE FindType(M)=Video OR FindType(M)=Image
AND
M IN FindObjWithFeatureandAttr(Jane Shady,suit,purple)
+ Tìm tất cả các ảnh có Jane Shady cùng với đối tượng xuất hiện trong đoạn
Video cùng với Denis Hopeman. Khác với câu hỏi trước, câu hỏi này đòi hỏi
phải có các thao tác kết hợp giữa các loại dữ liệu khác nhau. Để thực hiện được
câu hỏi này, chúng ta phải sử dụng các biến mở rộng như là Person, biến này
được dùng để tham chiếu đến đối tượng chưa xác định được danh tính trong
đoạn băng video.
SELECT M,Person
FROM smds source1 M,M1
WHERE (FindType(M)=Image) AND
(FindType(M1)=Video) AND
M IN FindObjWithFeature(Jane Shady) AND
M1 IN FindObjWithFeature(Big Spender) AND
Person IN FindFeaturesinObj (M) AND
Person IN FindFeaturesinObj (M1) AND
Person


Jane Shady AND Person

Big Spender
2. Truy vấn dữ liệu đa phương tiện mô tả dưới kiến trúc lai tạo:
Như đã trình bày, SMDS-SQL có thể được sử dụng để truy vấn các đối tượng đa
phương tiện lưu trữ trong kiến trúc đồng nhất. Trong kiến trúc đồng nhất, tất cả các dữ
liệu nguồn được truy vấn đều là SMDSs, trong khi trong kiến trúc lai tạo các cách thức
mô tả khác (non-SMDS) cũng được sử dụng. Cách thức mô tả dữ liệu kiểu lai tạo thường
có hai phần chính:
 Một tập các đối tượng media được mô tả dưới dạng đồng nhất.
15

 Một tập các kiểu media khác nhau mà có cấu trúc để truy nhập và truy vấn riêng.
Để mở rộng ngôn ngữ truy vấn SMDS-SQL thành ngôn ngữ có thể truy vấn được các
dữ liệu được mô tả dưới dạng lai tạo (HM-SQL) các yêu cầu sau bắt buộc phải có:
 HM-SQL phải có khả năng thực hiện tất cả các câu hỏi sử dụng ngôn ngữ riêng
đối với nguồn dữ liệu không đồng nhất này.
 HM-SQL phải có cơ chế “joins” hoặc các thao tác đại số nhị phân có trách nhiệm
“joins” giữa 2 nguồn dữ liệu SMDS và non-SMDS.
Ngôn ngữ HM-SQL cũng tương tự như ngôn ngữ SQL chuẩn ngoại trừ các mệnh đề
Select, From. Where được mở rộng như sau:
 Mệnh đề SELECT và FROM được mở rộng giống như với ngôn ngữ SMDS-
SQL.
 Mệnh đề WHERE cho phép sự có mặt của biểu thức có dạng Term IN MS:
func_call trong đó:
+ Term:có thể là một biến hoặc là một đối tượng có kiểu đầu ra giống hệt với của
func_call đã được định nghĩa trong media gốc và
+ Nếu MS=SMDS hoặc họ func_call thuộc 1 trong 5 hàm đã đinh nghĩa ở trên
hoặc

+ MS không phải là một nguồn SDMS và func_call là một câu hỏi trong
QL(MS).
 Khi đó, có 2 sự khác nhau giữa SMDS-SQL và HM-SQL là:
+ func_call xuất hiện trong mệnh đề where cần được chú thích một cách tường
minh với media gốc kèm theo và
+ Các câu truy vấn được xây dựng từ các ngôn ngữ truy vấn của từng loại dữ liệu
non-SMDS có thể được nhúng vào bên trong câu lệnh truy vấn của HM- SQL.
Điều này làm cho HM_SQL trở nên hết sức mạnh mẽ và linh hoạt. Căn cứ vào
điều này chúng ta có thể thực thi các câu truy vấn đối với các nguồn dữ liệu
khác nhau.
Xem xét một vài ví dụ:
 Giả sử chúng ta có 2 nguồn dữ liệu video video1 và video2, nguồn video1 được
triển khai qua hình thức SDMS, nguồn video2 được triển khai qua hình thức non-
SDMS (gọi là videodb). Câu hỏi của chúng ta ở đây là “hãy tìm tất cả các video clip
16

có mặt Denis Hopeman từ cả 2 nguồn dữ liệu video1 và video2. Câu hỏi này có thể
được diễn đạt bằng ngôn ngữ HM-SQL như sau:
SELECT M
FROM smds video1, videodb video2
WHERE M IN smds:FindObjWithFeature(Denis Hopeman) OR
M IN videodb:FindVideoWithObject(Denis Hopeman)
Trong câu truy vấn này, chúng ta tìm kiếm tất cả các M mà chúng trả về kết quả mong
muốn từ cả 2 nguồn dữ liệu (SDMS và non-SDMS).
 Cũng với câu hỏi trên nhưng ở đây chúng ta thêm vào một nguồn dữ liệu mới là
dữ liệu hình ảnh (idb) được triền khai dưới hình thức non-SDMS và giả sử dữ liệu
hình ảnh này có riêng chức năng tìm kiếm getpic(obj) với tham số đầu vào là obj và
kết quả trả về là một cặp bao gồm một ảnh (file ảnh) và thứ tự có liên quan. Giả sử
chúng ta muốn tìm kiếm trên cả 3 loại dữ liệu này (video1, video2, idb) có mặt của
đối tượng Denis Hopeman thì câu hỏi diễn đạt bằng ngôn ngữ HM-SQL có thể như

sau:
Select M
From sdms Video1, videodb Video2
Where M IN sdms: FindObjWithFeature(Denis Hopeman)
OR
M IN videodb: FindVideoWithObj(Denis Dopeman)
UNION
(Select M.file
From imagedb idb M
Where M In imagedb:getpic(Denis Dopeman)
 Giả sử chúng ta muốn tìm tất cả các đối tượng có mặt cùng với Denis Dopeman
trong tất cả các nguồn dữ liệu (video1, video2, idb), câu hỏi sẽ như sau:
17


HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU CHƯƠNG III.
ĐA PHƯƠNG TIỆN
1. Định nghĩa về hệ quản trị cơ sở dữ liệu đa phương tiện:
Hệ quản trị CSDL đa phương tiện (Multimedia Database Management System –
MDBMS) là một hệ quản trị CSDL (DBMS) hỗ trợ tạo lập, cập nhật và khai thác CSDL
đa phương tiện. Một MDBMS phải cung cấp gần như tất cả các chức năng của một
DBMS truyền thống bên cạnh việc cung cấp thêm một số chức năng mới và tính năng
nâng cao. MDBMS kế thừa các tính chất từ DBMS truyền thống – ACID: atomicity (tính
đơn nhất), consistency (tính nhất quán), isolation (tính độc lập) và durability (tính bền
vững).
Ngoài ra, sự khác nhau của các kiểu dữ liệu trong CSDL đa phương tiện có thể đòi
hỏi các phương thức đặc biệt để tối ưu hoá việc lưu trữ, truy cập, chỉ số hoá và khai
thác. MDBMS cần phải cung cấp các yêu cầu đặc biệt này bằng cách cung cấp các cơ
chế tóm tắt bậc cao để quản lý các kiểu dữ liệu khác nhau cũng như các giao diện thích
hợp để thể hiện chúng.

2. Kiến trúc hệ quản trị cơ sở dữ liệu đa phương tiện:
Kiến trúc của MDBMS được mô tả ở hình 4 bao gồm 3 lớp: (1)Lớp quản trị CSDL
đơn phương tiện (monomedia database-management layer), (2)Lớp quản trị/thành phần
đa phương tiện (multimedia composition/management layer), (3)Lớp giao diện người
dùng (user-interface layer).
18

Lớp quản trị CSDL đơn phương tiện cung cấp các chức năng cần thiết cho việc quản
lý các phương tiện đơn lẻ hoặc cá thể (individual media). Các phương diện chính của mỗi
DBMS tại mức này bao gồm việc duy trì cơ chế đánh chỉ mục một cách hiệu quả, và cho
phép người dùng phát triển các việc mô hình hóa và gom nhóm dựa trên ngữ nghĩa của
các thông tin phức tạp với mỗi phương tiện. Mục tiêu căn bản của lớp này là để xử lý các
truy vấn dựa trên nội dung và tạo thuận lợi cho sự truy xuất của các mảnh phù hợp của dữ
liệu đơn phương tiện, như các video clip, các phần của bức ảnh hay các đoạn âm thanh.
Một chức năng quan trọng khác được tích hợp trong lớp này là sự quản trị về mặt vật lý
của các CSDL đơn lẻ (individual databases). Việc quản lý này có thể yêu cầu một vị trí
phù hợp của dữ liệu trên hệ thống đĩa đơn/song song nhằm mang lại hiệu quả cao hơn.

Hình 4: Kiến trúc MDBMS
Mục tiêu chính của lớp ở giữa là nhằm giải quyết việc tích hợp đơn phương tiện để
tạo ra các tài liệu đa phương tiện và liên kết chéo tới các thông tin được lưu trữ trong các
CSDL đơn phương tiện. Hiện tại, sự đòi hỏi về việc quản lý các tài liệu và thư viện đa
phương tiện đang ngày càng gia tăng và nhu cầu về các mô hình tích hợp hiệu quả đang
là một trong những vấn đề nghiên cứu chính trong việc phát triển một MDBMS. Việc tích
hợp các phương tiện có thể mở rộng ra nhiều chiều bao gồm không gian, thời gian và các
ngữ nghĩa. Do đó lớp này cần phải duy trì một mô hình tích hợp đơn phương tiện đa
chiều, dưới hình thức của một siêu lược đồ (meta-schema). Về cơ bản, lớp này xử lý các
truy vấn của người dùng cho việc tổng hợp các thông tin đa phương tiện và tạo ra các
19


truy vấn con (subqueries) cho các CSDL đơn phương tiện. Việc truy xuất của dữ liệu đơn
phương tiện được điều khiển bởi các mô hình tích hợp được duy trì bởi siêu lược đồ. Cần
phải lưu ý rằng nhằm mục đích nhất quán dữ liệu, siêu lược đồ này cần phải được giao
tiếp với các lược đồ có liên quan với CSDL đơn phương tiện trình diễn ở lớp thấp hơn,
bởi vì cả 2 lược đồ đều chia sẻ thông tin về dữ liệu đơn phương tiện, bao gồm các ngữ
nghĩa dựa trên nội dung của chúng. Một chức năng quan trọng khác của lớp này là cung
cấp sự phối hợp giữa các CSDL đơn phương tiện nếu chúng được phân phối. Một trong
những mục tiêu chính trong trường hợp này là để cung cấp truy cập “trong suốt về vị trí”
(location-transparent) tới các site CSDL khác nhau và duy trì sự đồng bộ giữa các dòng
phương tiện truyền thông có nguồn gốc từ các máy chủ không đồng nhất. Theo quan
điểm CSDL, thông tin về vị trí của các đối tượng tổng hợp đa phương tiện khác nhau và
sơ đồ của chúng phải được duy trì bởi lớp này.
Lớp tương tác bao gồm nhiều phương tiện giao tiếp người dùng nhằm hỗ trợ các chức
năng trình diễn đa phương tiện, như hiển thị hình ảnh, bản diễn thử của các video clip hay
các đoạn âm thanh. Các phương tiện tương tác này có thể yêu cầu vài ngôn ngữ truy vấn
chính quy mà cũng được sử dụng tại lớp dưới cùng, với một vài tính năng nâng cao để
thao tác với các thông tin đa phương tiện tổng hợp. Để thay thế, người ta có thể sử dụng
một vài giao diện truy vấn đồ họa, bao gồm các tính năng bổ sung như duyệt, biên tập dữ
liệu phương tiện…
3. Các yêu cầu của hệ quản trị cơ sở dữ liệu đa phương tiện:
Một MDBMS cung cấp một môi trường thích hợp để sử dụng và quản lý các thông
tin CSDL đa phương tiện. Để MDBMS hoạt động có hiệu quả, đáp ứng được các nhu cầu
đa dạng của người dùng thì nó phải thỏa mãn một số yêu cầu sau:
 Đầy đủ các khả năng của một DBMS truyền thống;
 Có khả năng lưu trữ lớn;
 Có khả năng khai thác dữ liệu thuận tiện;
 Có khả năng tích hợp, tổng hợp và thể hiện;
 Hỗ trợ truy vấn đa phương tiện;
 Có giao diện đa phương tiện và tương tác.
4. Các vấn đề của hệ quản trị cơ sở dữ liệu đa phương tiện:

4.1. Mô hình hóa dữ liệu đa phương tiện:
Mô hình dữ liệu là đơn vị trung tâm của một hệ thống CSDL đa phương tiện. Một mô
hình dữ liệu cần phải tách rời người dùng ra khỏi chi tiết của việc quản lý các thiết bị lưu
20

trữ và cấu trúc lưu trữ. Điều này đòi hỏi phải phát triển các mô hình dữ liệu tương ứng để
tổ chức các kiểu dữ liệu khác nhau từng gặp trong các hệ thống CSDL đa phương tiện.
Các mô hình dữ liệu đa phương tiện (cũng giống như các mô hình dữ liệu truyền thống
khác) nắm bắt các đặc tính cố định cũng như động của nội dung CSDL và vì vậy nó cung
cấp các khuôn mẫu cơ bản cho việc phát triển các công cụ cần thiết để sử dụng dữ liệu đa
phương tiện. Các thuộc tính cố định có thể bao gồm các đối tượng tạo nên dữ liệu đa
phương tiện, mối liên hệ giữa các đối tượng, thuộc tính của các đối tượng… Các đặc tính
động bao gồm sự tương tác giữa các đối tượng, sự hoạt động trên đối tượng, các tương
tác của người dùng.
Tuy nhiên, do các tính chất đặc biệt của nó, dữ liệu đa phương tiện đòi hỏi phải có các
quan tâm mới khi chọn lựa mô hình dữ liệu. Ví dụ, một vài kiểu dữ liệu đa phương tiện
(chẳng hạn video) hoặc một nhóm các kiểu (video và hình ảnh) có thể đòi hỏi các mô
hình dữ liệu đăc biệt để cải thiện hiệu quả và tính mềm dẻo. Hơn nữa, do tầm quan trọng
của việc tương tác trong các hệ thống đa phương tiện nên việc nó được hỗ trợ bỏi các mô
hình dữ liệu trở nên quan trọng.
Rất nhiều các mô hình dữ liệu khác nhau như mô hình mạng, quan hệ, ngữ nghĩa, và
hướng đối tượng đang tồn tại và một vài mô hình trong số đó đã được xem xét để thiết
lập CSDL đa phương tiện. Có hai cách tiếp cận cơ bản trong việc mô hình hoá dữ liệu đa
phương tiện là:
 Phương pháp thứ nhất: xây dựng một mô hình dữ liệu đa phương tiện trên nền
tảng của mô hình dữ liệu của một CSDL truyền thống (thường là CSDL quan hệ hoặc
CSDL hướng đối tượng) bằng cách sử dụng các giao diện tương ứng đối với dữ liệu
đa phương tiện. Các vấn đề nảy sinh với cách tiếp cận này là các cấu trúc bên dưới
(của CSDL truyền thống) không được thiết kế dành cho dữ liệu đa phương tiện, hơn
nữa sự khác biệt cơ bản các yêu cầu của một CSDL truyền thống đối với CSDL đa

phương tiện khiến cho giao diện trở thành nơi nghẽn cổ chai trong toàn bộ hệ thống.
Các vấn đề này dẫn tới cách tiếp cận thứ hai;
 Phương pháp thứ hai: phát triển các mô hình dữ liệu thực thụ dành cho dữ liệu đa
phương tiện từ đầu chứ không xây dựng trên cơ sở của các CSDL truyền thống, tuy
nhiên mọi người đều nhất trí rằng các nỗ lực như vậy đều phải dựa trên kỹ thuật
hướng đối tượng. Liên quan đến kỹ thuật này thì có 2 mô hình tiêu biểu là mô hình
đối tượng và mô hình quan hệ - đối tượng. Hiện nay, người ta vẫn đang tranh cãi mô
hình nào là tốt hơn cho CSDL đa phương tiện. Mô hình quan hệ - đối tượng có ưu thế
hơn vì nó có thể đại diện cho các kiểu dữ liệu phức tạp. Nó bao gồm cả 2 kiểu mô
hình và có thể mở rộng để nắm bắt các cấu trúc tạm thời và các tính năng đặc biệt
khác.
4.2. Lưu trữ đối tượng đa phương tiện:
21

Lưu trữ vật lý các dữ liệu đa phương tiện đòi hỏi các phương thức để chuyển đổi,
quản lý, trao đổi và phân phối một khối lượng dữ liệu khổng lồ, các hệ thống đa phương
tiện thông thường sử dụng phương thức phân cấp đối với các thiết bị lưu trữ. Các thiết bị
lưu trữ có tốc độ cao như RAM, Cache lưu trữ các dữ liệu đang được xử lý trong khi đó
các thiết bị lưu trữ có tốc độ chậm như HDD, CD dùng để lưu trữ các dữ liệu có tính chất
dài hạn, cố định. Khi đó, hiệu suất sẽ phụ thuộc vào khả năng của cơ chế chuyển đổi các
dữ liệu đa phương tiện tương ứng với mức tối ưu hoá trong hệ thống lưu trữ phân cấp.
Các cơ chế nén dữ liệu kết hợp với các cơ chế chuyển đổi dữ liệu góp phần làm giảm
các yêu cầu khổng lồ về mặt lưu trữ, phương thức cơ bản được sử dụng ở đây là chuyển
đổi dữ liệu đa phương tiện sang một số vùng chuyển đổi để loại bỏ sự dư thừa của dữ liệu
gốc, các quá trình giải nén sẽ làm nhiệm vụ chuyển đổi ngược các dữ liệu này về dạng
gốc của nó. Quá trình này sẽ dẫn đến việc mất mát dữ liệu, tuy nhiên việc mất mát này
đươc hầu hết các ứng dụng multimedia cho phép.
Phụ thuộc vào mức độ của hạt nhân mà một đối tượng đa phương tiện có thể thể hiện
toàn bộ hoặc một phần đoạn video, một frame, một hình ảnh riêng lẻ thậm chí cả từng đối
tượng cá thể trong một ảnh hoặc một đoạn video. Vấn đề chính đặt ra ở đây là khả năng

lưu trữ có hạn, băng thông hạn chế của hệ thống lưu trữ các kênh truyền thông, tỷ lệ sẵn
sàng của các loại dữ liệu đa phương tiện. Tỷ lệ sẵn sàng của dữ liệu chỉ ra số lượng dữ
liệu tối thiểu cần thiết đối với mỗi đơn vị thời gian cần đáp ứng đối với các đòi hỏi về yêu
cầu chất lượng trong quá trình thể hiện các đối tượng đa phương tiện. Đứng từ quan điểm
này, các yêu cầu về lưu trữ của dữ liệu multimedia được giải quyết bằng cách phân chia
dữ liệu thành các đối tượng đa phương tiện nhỏ hơn để có thể lưu trữ trong các đơn vị lưu
trữ nhỏ hơn.
Với việc sắp xếp lưu trữ phân cấp, các đối tượng đa phương tiện có thể được lưu trữ ở
các mức độ khác nhau. Khi tỷ lệ sử dụng các đối tượng dữ liệu đa phương tiện thay đổi,
các đối tượng này cần phải được phân phối lại, và có thể được lưu trữ trên các thiết bị
khác, tại các mức khác nhau của hệ thống lưu trữ. Vấn đề cần giải quyết lúc này chỉ là
tìm ra giải pháp tối ưu cho việc phân rã, phân phối và tái phân phối các đối tượng đa
phương tiện.
4.3. Chỉ số hóa đa phương tiện:
Cũng như trong các CSDL truyền thống, các dữ liệu multimedia có thể được khai thác
thông qua các định danh, các thuộc tính, các từ khoá và sự liên kết giữa chúng. Sử dụng
các từ khoá là phương pháp chiếm ưu thế để chỉ số hoá dữ liệu đa phương tiện. Con
người thường chọn các từ khoá từ một tập các từ vựng nhất định, điều này tạo ra một số
khó khăn khi áp dụng đối với dữ liệu đa phương tiện vì chúng thường được làm một cách
22

thủ công và rất tốn thời gian và các kết quả thường là chủ quan và rất hạn chế phụ thuộc
vào từ vựng.
Một phương pháp khác được sử dụng dựa trên việc truy cập nội dung, nó xem xét đến
nội dung thực sự của dữ liệu đa phương tiện hoặc xuất phát từ ngữ cảnh của thông tin.
Trong thời gian gần đây, việc nghiên cứu chỉ số hoá dựa trên nội dung đã được tiến hành
hết sức mạnh mẽ với mục đích là chỉ số hoá dữ liệu đa phương tiện dựa trên các đặc
trưng xác định thu được trực tiếp từ dữ liệu. Các đặc trưng khác nhau như màu sắc, hình
dạng, kết cấu bề mặt, các chuỗi đặc trưng và các đặc trưng khác đã được dùng để chỉ số
hoá các ảnh.

Để thu được các đặc trưng này đòi hỏi phải phân tích tự động dữ liệu đa phương tiện,
các phương thức chính được sử dụng đối với dữ liệu ảnh và dữ liệu video là xử lý ảnh,
đón nhận ảnh và phân tích chuỗi video. Đối với dữ liệu video, chuỗi video trước tiên
được phân tách thành các chuỗi hợp thành, sau đó các đặc trưng tóm tắt (thường là các
frame khoá) sẽ được lựa chọn để đặc trưng cho mỗi chuỗi. Việc chỉ số hoá tiếp theo đối
với dữ liệu video cũng dựa trên các frame khoá cũng giống như đối với dữ liệu ảnh
Đối với dữ liệu âm thanh, việc chỉ số hoá dựa trên nội dung có thể có sự tham gia của
việc phân tích tín hiệu, tự động nhận biết lời nói cùng với việc chỉ số hoá dựa trên từ
khoá. Mặt khác, việc chỉ số hoá có thể dựa trên các thông tin khác phụ thuộc vào kiểu của
dữ liệu âm thanh, ví dụ một vài nhà phát triển đã sử dụng các đặc trưng về nhịp điệu, hợp
âm và giai điệu cho việc chỉ số hoá dựa trên nội dung đối với dữ liệu âm thanh. Tương tự
như vậy, việc tìm kiếm và khai thác dữ liệu âm thanh dựa trên nội dung đã được đề xuất
dựa trên các đặc tính của dữ liệu âm thanh như đã được chỉ ra qua các đặc trưng về âm
học và giác quan…
Việc chỉ số hoá dựa trên nội dung cũng gợi ra một vài vấn đề cần quan tâm. Trước
hết, cũng với một dữ liệu đa phương tiện nhưng mỗi người có thể hiểu theo một cách
khác nhau. Thứ hai, người dùng thường cần các thông tin thay đổi khác nhau, vì vậy một
đặc trưng duy nhất có thể là không đủ để chỉ số hoá hoàn toàn một kiểu dữ liệu đa
phương tiện cho trước. Một vấn đề khác cần phải xem xét là vấn đề hiệu quả, việc chỉ số
hoá phải nhanh và các chỉ số này phải được lưu trữ một cách hiệu quả để phục vụ cho
việc truy cập dễ dàng khi mà số lượng các dữ liệu đa phương tiện được lưu trữ là rất lớn.
Bởi vì đặc tính vốn có của dữ liệu multimedia là rất khác nhau nên việc chỉ số hoá không
thể tiến hành một cách hoàn toàn tự động, đơn cử như máy tính có thể phân tích dễ dàng
một bức ảnh có chứa các tác phẩm nghệ thuật, nhưng nó gần như không thể tự động xác
định được ý nghĩa của tác phẩm đó, điều đó chỉ có con người làm được.
4.4. Hỗ trợ truy vấn đa phương tiện, khai thác và duyệt:
23

Các truy vấn của người dùng thường được xử lý bằng cách sử dụng các chỉ số có sẵn,
tuy nhiên khác với CSDL truyền thống, tính chính xác trong tìm kiếm đối với dữ liệu đa

phương tiện không phải là chính xác tuyệt đối. Thông thường khi so sánh hai dữ liệu đa
phương tiện thì kết quả thu được thường là gần đúng hoặc tương tự, giả sử trong trường
hợp các dữ liệu này có cùng dữ liệu đầu vào thì kết quả thu được từ một truy vấn có thể
sinh ra rất nhiều giá trị. Đã có rất nhiều các nghiên cứu đi sâu vào việc tìm ra một phương
thức thích hợp trợ giúp cho người dùng có được khả năng khai thác hiệu quả các dữ liệu
đa phương tiện, chẳng hạn thông qua việc cung cấp các giao diện thích hợp để người
dùng có thể duyệt một cách thuận lợi các kết quả có được từ quá trình tìm kiếm. Việc hỗ
trợ duyệt một cách trực tiếp cho phép người sử dụng có thể khai thác bất kỳ thông tin nào
có khả năng liên quan đến kết quả hiện thời bằng cách lựa chọn các mục dữ liệu tương
ứng cần quan tâm sâu hơn.
Truy vấn bằng ví dụ (Query-by-Example) là một phương pháp chính được sử dụng để
nhập các truy vấn đối với CSDL đa phương tiện, đặc biệt là đối với dữ liệu ảnh. Ở đây
người dùng đưa ra các yêu cầu bằng cách sử dụng một mẫu có sẵn (ví dụ như một ảnh
tương tự), vì vậy giao diện được sử dụng để nhập truy vấn vào hệ thống trở thành một
vấn đề cần phải quan tâm. Do tính chất đa dạng của các kiểu dữ liệu đa phương tiện nên
mỗi kiểu dữ liệu đa phương tiện có thể phải có các giao diện truy vấn khác nhau, vấn đề
cần được xem xét ở đây là làm thế nào để tích hợp được các giao diện khác nhau vào một
hệ thống tích hợp CSDL đa phương tiện. Một vấn đề khác cũng cần phải giải quyết là
việc bao gồm truy vấn các dữ liệu không gian hoặc truy vấn các dữ liệu thời gian đòi hỏi
phải có các thông tin không gian hoặc thời gian.

Ngoài các vấn đề nêu trên, các MDBMS còn có một số vần đề khác mà do phạm vi
của đề tài nghiên cứu cấp môn học nên đã không đề cập đến. Cụ thể đó là:
 Tích hợp đa phương tiện, thể hiện và chất lượng của dịch vụ (QoS);
 Quản trị CSDL đa phương tiện phân tán;
 Sự hỗ trợ của hệ thống.
ỨNG DỤNG CỦA CƠ SỞ DỮ LIỆU CHƯƠNG IV.
ĐA PHƯƠNG TIỆN – ORACLE MULTIMEDIA
1. Giới thiệu chung:
Oracle Multimedia (OM – trước đây là Oracle Intermedia) là một tính năng cho phép

CSDL Oracle lưu trữ, quản lý, và truy xuất hình ảnh, video, âm thanh, hoặc các dữ liệu
24

media hỗn hợp. OM mở rộng độ tin cậy, tính sẵn có, và khả năng quản lý dữ liệu của
CSDL Oracle đối với nội dung đa phương tiện kiểu truyền thống, trên Internet, trong
thương mại điện tử, và trong các ứng dụng đa phương tiện. OM không kiểm soát các thiết
bị thu giữ media (media capture) hoặc các thiết bị đầu ra, chức năng này được giao lại
cho phần mềm ứng dụng.
2. Công nghệ quan hệ - đối tượng:
OracleDB là một hệ quản trị CSDL quan hệ - đối tượng. Điều này có nghĩa là, ngoài
vai trò truyền thống của mình trong việc quản lý an toàn và hiệu quả dữ liệu quan hệ, nó
còn cung cấp sự hỗ trợ cho sự định nghĩa về các loại đối tượng, bao gồm cả các dữ liệu
liên quan với các đối tượng và các phương thức có thể được thực hiện trên chúng. Công
nghệ quan hệ - đối tượng bao gồm việc hỗ trợ tích hợp BLOBs để cung cấp cơ sở cho
việc bổ sung các đối tượng phức tạp, chẳng hạn như âm thanh, hình ảnh, và video được
số hóa vào CSDL.
Trong Oracle Multimedia, đặc trưng dữ liệu âm thanh được lưu trữ dưới một kiểu dữ
liệu quan hệ đối tượng là ORDAudio, tương tự với dữ liệu hỗn hợp là ORDDoc, hình ảnh
là ORDImage, video là ORDVideo. Cả 4 kiểu trên đều lưu trữ thông tin nguồn dữ liệu
trong một kiểu dữ liệu quan hệ đối tượng khác gọi là ORDSource.
3. Các khả năng của Oracle Multimedia:
Các khả năng đa phương tiện Oracle bao gồm lưu trữ, thu hồi, quản lý, và thao tác với
các dữ liệu đa phương tiện được quản lý bởi CSDL Oracle.
OM hỗ trợ lưu trữ các định dạng tập tin thông dụng, bao gồm các hình ảnh tạo ra trên
máy tính, và các định dạng âm thanh, video trong CSDL. OM cung cấp các phương tiện
để thêm các cột hay đối tượng chứa dữ liệu âm thanh, hình ảnh, và video, hay các dữ liệu
media hỗn hợp khác vào các bảng có sẵn, và chèn vào và lấy ra các dữ liệu đa phương
tiện. Điều này cho phép các nhà thiết kế CSDL mở rộng các CSDL hiện có với dữ liệu đa
phương tiện, hoặc để xây dựng các ứng dụng CSDL đa phương tiện mới dành cho người
dùng cuối.

OM sử dụng các loại đối tượng, tương tự như các lớp Java hay C++, để mô tả dữ liệu
đa phương tiện. Những loại đối tượng này được gọi là ORDAudio, ORDDoc,
ORDImage, và ORDVideo. Một thể hiện của các loại đối tượng này bao gồm các thuộc
tính, siêu dữ liệu, dữ liệu media, và các phương thức. Dữ liệu media chính là dữ liệu âm
thanh, hình ảnh, video, hoặc các dữ liệu media hỗn hợp khác. Siêu dữ liệu là thông tin về
dữ liệu, chẳng hạn như độ dài đối tượng, kiểu nén, hoặc định dạng. Các phương thức là
các thủ tục mà có thể được thực hiện trên các đối tượng, chẳng hạn như getContent() và
setProperties().

×