Tải bản đầy đủ (.doc) (22 trang)

TIỂU LUẬN MÔN CƠ SƠ DỮ LIỆU MULTIMEDIA DATABASE

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (380.23 KB, 22 trang )

MULTIMEDIA DATABASE
I, BÀI TOÁN
Xây dựng chương trình chia sẻ thông tin với bạn bè. Chúng ta biết rằng
thông tin chia sẻ ở đây là bao gồm những thước phim, những hình ảnh, hay
đơn giản là những câu chuyện bạn cảm thấy thú vị, Để làm được điều này ta
cần một loại cơ sở dữ liệu đáp ứng được việc lưu dữ liệu với kích thước lớn và
có đầy đủ tính năng của cơ sở liệu thông thường. Như cho phép tìm kiếm thông
qua cá dặc trưng riêng. Và đó chính là cơ sở dữ liệu đa phương tiện
(Multimedia Database).
II CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN
CHƯƠNG I : GIỚI THIỆU CHUNG VỀ CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
1.1 Dữ liệu đa phương tiện:
Dữ liệu multimedia được chia thành hai lớp là các dữ liệu liên tục và các dữ liệu
không liên tục. Các dữ liệu liên tục bao gồm các dữ liệu âm thanh, video thay
đổi theo thời gian. Các dữ liệu không liên tục là các dữ liệu không phục thuộc
vào thời gian, các loại dữ liệu đặc trưng cho dạng này là các dữ liệu văn bản
(có hoặc không có định dạng), hình ảnh tĩnh và các đối tượng đồ họa. Các kiểu
dữ liệu thông thường của một CSDL multimedia bao gồm:
• Dữ liệu văn bản (có hoặc không có định dạng).
• Đồ họa: là các bản vẽ, minh họa được mã hóa như các tệp postscript.
• Hình ảnh: là các hình ảnh được mã hóa sử dụng các dạng thức chuẩn
như là JPEG hoặc MPEG.
• Các hoạt hình.
• Âm thanh.
• Video.
1.2 Các đặc tính chung của dữ liệu multimedia
• Thiếu cấu trúc: Các dữ liệu multimedia có khuynh hướng phi cấu trúc vì
vậy các tác nghiệp quản trị dữ liệu chuẩn như chỉ số hoá, tìm kiếm nội dung,
truy vấn dữ liệu thường là không áp dụng được.
• Tính tạm thời: Một vài kiểu dữ liệu multimedia như là Video, âm thanh và


hoạt hình đều phụ thuộc vào yếu tố thời gian liên quan mật thiết đến việc lưu
trữ, thao tác và mô tả chúng.
• Có dung lượng lớn: các dữ liệu video và âm thanh thường đòi hỏi các
thiết bị lưu trữ lớn.
• Các ứng dụng hỗ trợ: các dữ liệu phi chuần có thể đòi hỏi các quy trình
xử lý phức tạp như việc sử dụng các thuật toán nén dữ liệu đối với các ứng
dụng CSDL multimedia.
1.3 Phương pháp cơ bản truy vấn dữ liệu
Dữ liệu quản lý có tính lịch sử và có rất nhiều phương pháp để được đưa
ra để quản lý và truy vấn các loại dữ liệu khác nhau ttrong hệ thống máy tính.
Phương pháp tiếp cận cơ bản đang được sử dụng cho quản lý dữ liệu có thể
được phân loại như sau loại:
• Hệ thống cơ sở dữ liệu thông thường: Đây là phương pháp được sử dụng
rộng rãi trong quản lý và tìm kiếm dữ liệu có cấu trúc. Tất cả dữ liệu trong một
hệ thống cơ sở dữ liệu phù hợp với một số cấu trúc được xác định trước và
hạn chế .Để xây dựng một truy vấn cơ sở dữ liệu người sử dụng phải xác định
đối tượng dữ liệu được lấy ra, các bảng cơ sở dữ liệu mà từ đó họ có thể được
trích xuất và thành phần truy vấn phụ thuộc vào. Một ngôn ngữ truy vấn cơ sở
dữ liệu nói chung là các loại nhân tạo, một trong những hạn chế với cú pháp và
từ vựng, chẳng hạn như SQL.
• Hệ thống truy vấn thông tin (IR- Information retrieval): IR hệ thống được sử
dụng chủ yếu để tìm kiếm các bộ sưu tập văn bản lớn, trong đó nội dung của
dữ liệu (văn bản) được mô tả bởi một chỉ mục bằng cách sử dụng từ khoá hoặc
trừu tượng thành văn bản, và từ khóa hoặc ngôn ngữ tự nhiên được sử dụng
để thể hiện nhu cầu truy vấn. Ví dụ cho một hình ảnh hoặc video, chúng tôi có
để mô tả nó trong các từ hoặc một cách để lưu trữ rất nhiều siêu dữ liệu (dạng
văn bản).
• Truy hồi dựa trên nội dung (CBR): phương pháp tiếp cận hệ thống này
được sử dụng để lấy mong muốn các đối tượng đa phương tiện từ một bộ sưu
tập lớn trên cơ sở tính năng (như kết cấu, màu sắc và hình dạng, vv) có thể

được tự động chiết xuất từ bản thân các đối tượng. Mặc dù từ khoá có thể
được coi như một "Tính năng" cho dữ liệu văn bản, thu hồi thông tin truyền
thống có nhiều hơn nữa cao hơn hiệu suất thu hồi hơn so với nội dung dựa
trên bởi vì từ khóa có khả năng đã được chứng minh đại diện ngữ nghĩa, trong
khi không có tính năng hiển thị thuyết phục ngữ nghĩa mô tả khả năng. Nhưng
nhược điểm chính của phương pháp này là nó thiếu chính xác.
• Đồ thị hoặc cây mô hình phù hợp: Cách tiếp cận này nhằm mục đích để lấy
đối tượng phụ đồ thị từ một đối tượng đồ thị theo một số mô hình ký hiệu.
1.4 Các DBMS và vai trò của chúng trong việc xử lý dữ liệu multimedia
Các DBMS ngày nay được xây dựng khá tốt và được sử dụng rộng rãi đối với
dữ liệu có cấu trúc. Các DBMS trội nhất là các hệ quản trị dữ liệu quan hệ
(RDBMS). Trong RDBMS, thông tin dược tổ chức thành bảng hoặc các quan
hệ. Các dòng của bảng tương ứng với các khoản mục thông tin hoặc các
record, trong khi đó các cột tương ứng với các thuộc tính. Ngôn ngữ truy vấn có
cấu trúc (SQL) được sử dụng để tạo ra các bảng như thế và để chèn và truy
xuất thông tin từ các bảng đó
Chúng ta dùng một ví dụ đơn giản dể minh hoạ cách sử dụng SQL để tạo lập
một bảng và chèn, truy xuất thông tin từ đó. Giả sử chúng ta muốn lập một bảng
chứa các bản ghi về sinh viên bao gồm số hiệu sinh viên, tên và địa chỉ. Ta có
lệnh sau:
Create table STUDENT(
stu# integer,
name char(20),
address char(100));
Khi chúng ta muốn chèn các bản ghi về sinh viên vào bảng, chúng ta sử dụng
lệnh chèn SQL như sau:
Insert into STUDENT values(10,"Lew, Tom","2 Main St.,
Churchill, australia");
Lệnh trên sẽ chèn một dòng vào bảng STUDENT
Thông tin trong bảng được truy xuất khi sử dụng câu lệnh SELECT của SQL.

Ví dụ, nếu muốn truy xuất tên của sinh viên với sinh viên số 32, ta sử dụng lệnh
truy vấn sau:
Select Name
From STUDENT
Where Stu#=32
Các thuộc tính trong RDBMS đã cố định kiểu và độ rộng. Trong ví dụ trên, thuộc
tính Stu# là kiểu integer với độ dài cố định là 32 bit. Như vậy, RDBMS là thích
hợp để xử lý dữ liệu số và dòng ký tự ngắn.
Để hỗ trợ cho các trường có giá trị lớn trong RDBMS, một khái niệm được gọi là
đối tượng rộng hoặc nhị phân (BLOB) sẽ được giới thiệu. Một BLOB là một xâu
bit lớn các độ dài biến. Ví dụ, nếu ta muốn lưu bức tranh của sinh viên trong
bản ghi ở bảng STUDENT trên, chúng ta có thể tạo ra một bảng khi sử dụng
lệnh sau:
Create table STUDENT(
Stu integer,
Name char(20),
address char(100),
Picture BLOB);
Các BLOB bình thường chỉ là xâu bit và hoạt động bằng việc so sánh chứ
không mang chúng ra ngoài. Đó là vì RDBMS không biết nội dung hoặc ngữ
nghĩa của một BLOB. Tất cả BLOB hiểu như một khối dữ liệu.
Một dạng khác của các DBMS là hệ thống quản trị CSDL hướng đối tượng
(OODBMS). Các OODBMS kết nối các khả năng của cơ sơ dữ liệu (như lưu trữ
và tìm kiếm) và các đặc trưng hướng đối tượng (tóm lược, sự thừa kế, tính
đồng nhất đối tượng). Một phương pháp tiếp cận chung là kết nối các đặc điểm
hướng đối tượng với cơ sở dữ liệu quan hệ. Hệ thống đã được kết nối thì được
gọi là một hệ thống cơ sở dữ liệu đối tượng quan hệ. Trong một hệ thống như
vậy, các đối tượng được xác định một cách thích hợp trong hướng đối tượng.
Trong đó mỗi đối tượng chứa các đặc tính hoặc thuộc tính và các phương pháp
hoặc các hàm được sử dụng để chế tác ra các đặc tính khác. Ví dụ, chúng ta có

thể định nghĩa một loại ảnh sau:
Create type IMAGE(
Private
Size integer,
Resolution integer,
Content float[ ],
publlic

);
Sau đó khai báo các tranh bởi kiểu IMAGE có thể được sử dụng trong một bảng
như sau:
Create table STUDENT(
Stu# integer,
Name char(20),
Address char(100)
Picture IMAGE);
Điểm khác biệt chính giữa BLOB và các đối tượng là đối tượng thì được định rõ
một cách thích đáng, bao gồm các đặc tính và cho phép chúng có tác dụng,
trong khi đó thì BLOB thì không.
Các khái niệm về các BLOB và các đối tượng là một bước gần với xử lý dữ liệu
multimedia . Nhưng các BLOB được sử dụng chỉ để lưu dữ liệu có khối lượng
lớn. Trong khi các đối tượng chứa vài thuộc tính đơn giản, nhiều chức năng hơn
nên được phát triển để xử lý việc truy xuất multimedia dựa vào nội dung. Một
vài các khả năng được yêu cầu như sau:
• Các công cụ, tự động hoá hoặc bán tự động trích rút các nội dung và các đặc
trưng trong dữ liệu multimedia ;
• Các cấu trúc chỉ số hoá đa chiều, để điều khiển các vector multimedia
• Các độ đo tương đồng, nhằm truy xuất multimedia thay vì kết nối một cách
chính xác
• Lưu trữ các hệ thống phụ, thiết kế lại nhằm đáp ứng các yêu cầu của băng tần

cao với cỡ lớn, thoả mãn những đòi hỏi theo kiểu thời gian thực
• Giao diện sử dụng, được thiết kế cho phép các câu hỏi đa dạng trong nhiều
kiểu truyền thông đa dạng và cung cấp các trình diễn multimedia
CHƯƠNG 2 CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (MULTIMEDIA
DATABASE)
Khi thiết kế một hệ thống CSDL multimedia mô tả các loại dữ liệu multimedia
khác nhau, chúng ta bắt buộc phải đối diện với một số câu hỏi quan trọng được
đặt ra về cách thức tổ chức hệ trống như:
• Việc tổ chức về mặt nội dung đối với dữ liệu của các loại dữ liệu multimedia.
• Việc lưu trữ vật lý của các dữ liệu này trên các thiết bị lưu trữ như thế nào.
Để trả lời cho các câu hỏi này, trước tiên chúng ta xem xét tới khía cạnh tổ chức
nội dung
2.1 Kiến trúc cho việc tổ chức nội dung
Ở đây chúng ta xem xét tới 3 kiến trúc áp dụng cho việc tổ chức nội dung của
một hệ thống CSDL multimedia
2.1.1 Nguyên lý tự trị
Nguyên lý này đề cập tới việc chúng ta nhóm tất cả các dữ liệu ảnh, dữ liệu
video và tất cả các dữ liệu văn bản và chỉ số hóa chúng theo nguyên tắc tối đa
hóa hiệu suất của tất cả các loại truy nhập đối với các loại dữ liệu mà chúng ta
dự định. Nguyên lý này đảm bảo rằng với mỗi loại dữ liệu (ảnh, video, văn bản)
chúng đều được tổ chức với một cách thức đặc trưng phù hợp với mỗi loại dữ
liệu này.
Hình 2.1: Mô tả nguyên lý tự trị
2.1.2 Nguyên lý đồng nhất
Một nguyên lý kiến trúc khác mà chúng ta có thể lựa chọn là nguyên lý đồng
nhất, nguyên lý này giúp chúng ta tìm được một cấu trúc tóm tắt chung cho tất
cả các loại dữ liệu. Cấu trúc này có thể được dùng trong việc chỉ số hóa tất cả
các loại dữ liệu qua đó tạo ra một “chỉ số thống nhất” mà chúng ta có thể dùng
để truy cập tới các đối tượng khác nhau. Hay nói một cách khác là chúng ta có
thể trình bầy tất cả các đối tượng khác nhau( ảnh, video, âm thanh, văn bản)

trong một cấu trúc dữ liệu duy nhất và qua đó phát triển các thuật toán để truy
vấn cấu trúc dữ liệu này.
Hình 2.2: Mô tả nguyên lý đồng nhất
2.1.3 Nguyên lý lai ghép
Ý tưởng của nguyên lý này là dựa trên sự kết hợp của 2 nguyên lý đã trình bầy
ở trên. Kết quả của nguyên lý này là một kiểu dữ liệu nào đó sử dụng chỉ số
(index) riêng của chúng, trong khi đó các kiểu dữ liệu khác sẽ sử dụng một chỉ
số (Index) “thống nhất”.
Loại dữ liệu nào sử dụng kiểu chỉ số nào sẽ phụ thuộc vào các đặc tính khác
nhau sẽ được nói đến ở phần sau.
Hình 2.3: Mô tả nguyên lý lai ghép
Cả ba loại nguyên lý trên đều có những ưu điểm và nhược điểm riêng của
mình. Kiến trúc dựa trên nguyên lý tự trị đòi hỏi việc tạo ra các thuật toán và cấu
trúc dữ liệu của mỗi kiểu dữ liệu, ngoài ra nó cũng đòi hỏi các kỹ thuật hỗ trợ
cho việc liên kết chéo giữa các cấu trúc dữ liệu khác nhau này. Các công việc
này đòi hỏi tính phức tạp cao và đòi hỏi một lượng thời gian lớn cho việc phát
triển. Bên cạnh các nhược điểm trên, việc xây dựng các cấu trúc được đặc biệt
hóa tối ưu cho việc truy xuất dến từng loại dữ liệu khác nhau, CSDL multimedia
được tổ chức theo nguyên lý này thường đem lại hiệu quả cao trong việc xử lý
tìm kiếm. Đối với các ngân hàng dữ liệu đã được xây dựng sẵn, nơi mà các
thuật toán và các cấu trúc dữ liệu đã được sử dụng có hiệu quả thì việc áp dụng
nguyên lý tự trị là mô hình kiến trúc thích hợp nhất. Các kỹ thuật hướng đối
tượng chính là công cụ đắc lực nhất hỗ trợ cho việc triển khai theo nguyên lý
này bằng cách xem mỗi loại dữ liệu nguồn là một đối tượng mà các phương
thức của nó có thể truy cập được từ một CSDL multimedia tổng thể.
Trái ngược với nguyên lý tự trị, nguyên lý đồng nhất đòi hỏi chúng ta phải tìm ra
được một cấu trúc dữ liệu chung mà có thể dùng để lưu trữ các thông tin về nội
dung của hình ảnh, video, văn bản, âm thanh và các loại dữ liệu khác. Điều này
đòi hỏi chúng ta phải phân tích nội dung của mỗi kiểu dữ liệu và tóm tắt được
phần chung của chúng, qua đó xây dựng một bộ chỉ số dựa trên các yếu tố

chung đã được xác định này. Ưu điểm nổi bật của nguyên lý đồng nhất là dễ
dàng triển khai và các thuật toán thường được thực hiện rất nhanh. Nhược
điểm chính của nguyên lý này là các sự chú giải phải được tạo ra theo một cách
riêng nào đó, thường là được tạo ra một cách thủ công hoặc là tự động, việc
tạo ra các chú giải một cách thủ công thường đỏi hòi nhiều về mặt thời gian
cũng như chi phí, mặt khác trong quá trình tạo các chú giải này thường sẩy ra
sự mất mát thông tin nếu ngôn ngữ dùng để chú giải không trình bầy hết được
các khía cạnh của nội dung. Có thể đưa ra đây một số ví dụ như ngôn ngữ chú
giải nội dung của hình ảnh có thể làm mất các thông tin về bề mặt của một điểm
ảnh (pixel) hoặc một nhóm điểm ảnh. Tương tự như vậy ngôn ngữ chú giải nội
dung của âm thanh có thể làm mất các thông tin về biên độ, tần số của tín hiệu
tại một thời điểm nào đó.
Nguyên lý lai tạo tập hợp được các ưu điểm của cả hai nguyên lý nêu trên,
đồng thời giảm thiểu được một số các nhược điểm của chúng. Giả sử chúng ta
muốn tạo ra một CSDL multimedia bao gồm các kiểu dữ liệu M1,…….,Mn,
chúng ta bắt đầu bằng việc phân chia tập này thành 2 phần:
• Phần 1: bao gồm các loại dữ liệu kế thừa từ các nguồn dữ liệu có sẵn,
tồn tại sẵn các chỉ số và các thuật toán để thao tác với chỉ số. Với việc bố
trí này chúng ta đã tận dụng được lợi thế của các chỉ số và mã nguồn sẵn
có.
• Phần 2: bao gồm các dữ liệu không được kế thừa từ bất kỳ nguồn nào
và do đó không có sẵn các chỉ số của mình (điều này đồng nghĩa với việc
là cũng không có bất kỳ thuật toán nào để có thể thao tác với tập chỉ số).
Trong trường hợp này việc tiếp cận xây dựng hệ thống theo nguyên lý
đồng nhất là cách thức thích hợp nhất ngay cả khi là cách tiếp cận này có
thể nẩy sinh ra việc gây mất mát các thông tin vật lý chi tiết.
Sau khi đã tiến hành xong việc phân chia, chúng ta bắt đầu tiến hành việc xây
dựng các thuật toán cần thiết để kết hợp các nguồn dữ liệu khác nhau lại bằng
việc sử dụng các tập chỉ sổ riêng của chúng. Cách tiếp cận này giúp chúng ta
thừa kế được tối đa các tài nguyên có sẵn, đồng thời giảm thiểu được các công

việc phải thực hiện thêm bởi vì các tệp chỉ số riêng có sẵn đối với mỗi loại dữ
liệu đã được tận dụng. Giả sử, một người dùng muốn đưa ra một câu hỏi “ Hãy
tìm tất cả các hình ảnh và các đọan video mà trong đó ông chủ của đối tượng A
có mặt và trao đổi với đối tượng B”. Câu hỏi này
bao gồm một sự kết hợp giữa các tệp chỉ số của các loại dữ liệu khác nhau,
chúng sẽtruy cập đến CSDL hình ảnh (thông qua tệp chỉ số của dữ liệu hình
ảnh), đến CSDL âm thanh (thông qua tệp chỉ số âm thanh) và đến một CSDL
quan hệ (thông qua tệp chỉ số quan hệ), câu hỏi này có thể được diễn tả như
sau:
SELECT Name, Image, Audio
From Employee E, Image I, Audio A
Where E.Name= “A” AND
I contains E.boss and
A contains E.boss AND
A CONTAINS B
2.2 Tổ chức dữ liệu multimedia dựa trên nguyên lý đồng nhất.
Xét ví dụ sau:
• Bức ảnh photo1.gif có sự xuất hiện của đối tượng A, đối tượng B và một
đối tượng chưa được xác định được chụp tại thành phố C thuộc nước D
vào ngày 10/01/1990.
• Đoạn video video1.mpg có hình ảnh của đối tượng A đưa cho đối tượng
B một chiếc vali (trong frames 50-100). Đoạn video này thu được từ sự
theo dõi nhà của đối tượng B tại thành phố E thuộc nước F vào tháng 1-
1991.
• Văn bản B.txt có chứa các thông tin chi tiết về dối tượng B được thu
thập từ dữ liệu của cơ quan an ninh.
Bản thân mỗi đối tượng trên cũng đã nói lên phần nào nội dung của từng đối
tượng cụ thể (hình ảnh, video, văn bản), tuy nhiên thông tin đưa ra ở đây chỉ nói
lên nội dung về mặt ngữ nghĩa hơn là đề cập đến các tính chất cụ thể của mỗi
loại đối tượng, các tính chất loại này được gọi là các đặc trưng bậc thấp (lower-

level). Một cách tiếp cận hiệu quả nhất đối với CSDL multimedia và đã được sử
dụng rộng rãi trong thực tế là sử dụng các đối tượng được phát biểu ở trên như
là siêu dữ liệu (metadata).
Theo trên, giả sử chúng ta có một tập các đối tượng media o1,… ,on chúng ta
kết hợp một vài metadata md(o1) với mỗi đối tượng media o1 (định dạng chính
xác của metadata này sẽ được trình bầy sau), tương tự như vậy các metadata
kết hợp với các đối tượng media 01,….0n tương ứng sẽ là md(o1),……,md(on),
Chúng ta sẽ tiến hành việc chỉ số hóa các metadata này với một cách thức
nhằm cung cấp các phương thức triển khai hiệu quả đối với các yêu cầu truy
cập từ phía người dùng.
Có thể rõ ràng thấy rằng, sự thành công của phương pháp này phụ thuộc cơ
bản vào việc chúng ta đảm bảo được rằng với mỗi đối tượng media 0i thì
metadata tương ứng của nó md(oi) là cô đọng và phản ánh đúng chỉ những gì
mà người dùng yêu cầu.
Với một số lượng tối thiểu các metadata được dùng rõ ràng là chúng ta sẽ dễ
dàng hơn trong việc chỉ số hóa cũng như là thực hiện các thao tác khai thác dữ
liệu, tuy nhiên bên cạnh đó nếu số lượng metadata sử dụng ít thì có thể người
sử dụng sẽ phải mất thời gian hơn trong việc thiết lập các câu hỏi của mình. Có
thể lấy trường hợp sau làm ví dụ:
• Người dùng: hãy tìm cho tôi tất cả các đoạn video hoặc ảnh chụp mà đối
tượng A và đối tượng B (xem phần trên) trao đổi với nhau một gói hành lý.
• Hệ thống: Không tìm được (mặc dù hệ thống đã có đoạn video ghi lại đối
tượng A và đối tượng B trao đổi với nhau một chiếc vali nhưng hệ thống
vẫn trả lời là không tìm thấy vì nó không hiểu rằng một chiếc vali cũng có
thể coi là một gói hành lý).
• Người dùng: hãy tìm cho tôi tất cả các đoạn video hoặc ảnh chụp mà đối
tượng A và đối tượng B (xem phần trên) trao đổi với nhau một vật gì đó.
• Hệ thống: tìm thấy. frames 50-100 của đoạn video video1.mpg thỏa mãn
yêu cầu của bạn.
Mặc dù có một vài nhược điểm như sử dụng metadata không biểu diễn

hết được các khía cạnh của đối tượng media trong CSDL nhưng cách tiếp
cận dựa trên nguyên lý đồng nhất có một số ưu điểm nổi trội sau:
• Metadata thường được lưu trữ dưới dạng các cấu trúc có liên quan đến
tính chất quan hệ hoặc hướng đối tượng và có thể truy vấn một cách dễ
dàng thông qua việc mở rộng các ngôn ngữ (chẳng hạn như SQL).
• Việc viết mã để thao tác với metadata thường là dễ dàng.
• Việc viết các chương trình để tạo ra metadata là đơn giản đối với các lập
trình viên có năng lực
Chúng ta đã xem xét đến nội dung của dữ liệu media dưới các dạng khác nhau,
một câu hỏi đặt ra ở đây là đâu là phần chung nhất của các loại dữ liệu này?
Mục đích của chúng ta là tìm kiếm một cấu trúc chung nhất cho tất cả các loại
dữ liệu mà qua nó ta có thể thể hiện được nội dung của các loại dữ liệu đó.
Tóm tắt media là một cấu trúc toán học cho phép diễn đạt nội dung của các
media này, sự tóm tắt media có thể được triển khai thông qua một cấu trúc dữ
liệu duy nhất.
2.3 Ngôn ngữ truy vấn khai thác dư liệu multimedia
Trong phần này, chúng ta sẽ trình bầy một ngôn ngữ truy vấn đơn giản được
xây dựng dựa trên SQL dùng để khai thác dữ liệu Multimedia. Chúng ta đã chỉ
ra được rằng một media tóm tắt có thể được dùng để mô tả các loại dữ liệu
media khác nhau sử dụng kiến trúc mô tả đồng nhất. Việc mở rộng ngôn ngữ
truy vấn SQL sử dụng cho việc truy vấn dữ liệu được xây dựng bởi kiến trúc mô
tả đồng nhất sẽ là tiền đề để chúng ta tiếp tục mở rộng ngôn ngữ truy vấn dùng
cho việc khai thác các dữ liệu media được xây dụng theo kiến trúc lai ghép
2.3.1 Truy vấn SMDSs (mô tả đồng nhất)
Các hàm cơ bản của SMDSs bao gồm:
• FindType(Obj): hàm này sử dụng đối tượng media Obj làm đầu vào và sẽ trả
về kiểu của đối tượng, ví dụ:
o FindType(image1.gif) = gif.
o FindType(movie1.mpg) = mpg.
• FindObjWithFeature(f): hàm này sử dụng đặc trưng f là giá trị đầu vào và trả

về một tập tất cả các loại đối tượng media mà có chứa đặc trưng f, ví dụ
o
o
• FindObjWithFeatureAttr(f,a,v): hàm này sử dụng đặc trưng f, một thuộc tính
tên a kết hợp với đặc trưng này và một giá trị v là đầu vào. Giá trị trả về sẽ là tất
cả các đối tượng o có chứa đặc trưng và giá trị của thuộc tính a trong đối tượng
o là v. Ví dụ:
o : Tìm tất cả
các đối tượng media mà có sự xuất hiện của Jane Shady trong chiếc áo
mầu blue.
o Tìm tất cả các
đối tượng media mà một con voi có mang một cái nơ mầu đỏ xuất hiện.
• FindFeaturesInObj(Obj): câu hỏi này đòi hỏi phải tìm tất cả các đặc trưng có
mặt trong một đối tượng media đã cho. Kết quả trả về là một tập bao gồm tất cả
các đặc trưng. Ví dụ:
o FindFeaturesInObj (im1.gif): tìm tất cả các đặc trưng có trong file ảnh
im1.gif.
o FindFeaturesInObj(video1.mpg:[1,5]): Tìm tất cả các đặc trưng có
trong 5 frame đầu tiên của file video video1.mpg.
• FindFeatureandAttrinObj(Obj): hàm này cũng có chức năng tương tự như
hàm
trước ngoại trừ việc nó trả về một quan hệ có schema như sau:
(Feature,Attribute,Value) trong đó cặp 3 (f,a,v) xuất hiện trong quan hệ đầu ra
nếu thuộc tính a của đặc trưng f được xác định và có giá trị là v. Ví dụ:
o FindFeatureandAttrinObj (im1.gif) có thể trả về kết quả được mô tả ở
bảng sau
SMDS-SQL mở rộng của chúng ta sẽ bao gồm tất cả các câu lệnh chuẩn của
SQL có bổ sung thêm một số đặc trưng của dữ liệu Multimedia vào SQL (bổ
sung thêm vào Select, From, Where)
• Tuyên bố Select có thể chứa thực thể media. Một thực thể media được định

nghĩa như sau:
o Nếu m là một đối tượng media liên tục, i và j là 2 số nguyên khi đó m
: [i,j] là một thực thể media thể hiện một tập tất cả các frame của đối
tượng media m nằm trong (và chỉ trong) khoảng i và j.
o Nếu m không phải là một đối tượng media liên tục thì khi đó m là một
thực thể media.
o Nếu m là một thực thể media và a là một thuộc tính của m thì khi dó
m.a là một thực thể media.
• Tuyên bố From có thể có các thực thể theo mẫu sau: (media) (source) (M), có
nghĩa là chỉ có các đối tượng media kết hợp với tên của kiểu media và tên của
dữ liệu nguồn được xem xét dến khi thực hiện câu hỏi và M là một biến được
xếp loại trên các đối tượng media đó.
• Tuyên bố Where cho phép có các biểu thức có dạng term In func.call. Trong
đó:
o Term có thể là một biến (trong trường hợp này được sắp xếp trên kiểu
trả về của func.call) hoặc là một đối tượng có kiểu đầu ra giống như
func.call.
o Func.call là một trong 5 hàm đã nêu ra ở trên.
Chúng ta cũng xem xét một vài ví dụ
• Tìm tất cả các đối tượng ảnh hoặc video có chứa cả Jane Shady và Denis
Dopeman.
• Tìm tất cả các ảnh và video mà đối tượng Jane Shady mặc áo vét mầu tím
• Tìm tất cả các ảnh có chứa cả Jane Shady và Denis Dopeman và Jane đứng
bên trái Denis
Ở đây có một chú ý là quan hệ left được sử dụng ở trên là một quan hệ media
tóm tắt của CSDL hình ảnh
• Tìm tất cả các ảnh có Jane Shady cùng với đối tượng xuất hiện trong đoạn
Video cùng với Denis Hopeman. Khác với câu hỏi trước, câu hỏi này đòi hỏi
phải có các thao tác kết hợp giữa các loại dữ liệu khác nhau. Để thực hiện
được

câu hỏi này, chúng ta phải sử dụng các biến mở rộng như là Person, biến này
được dùng để tham chiếu đến đối tượng chưa xác định được danh tính trong
đoạn băng video.
2.3.2 Truy vấn dữ liệu multimedia mô tả dưới kiến trúc lai tạo.
Trong phần trước, chúng ta đã trình bày ngôn ngữ SMDS-SQL như là một mô
hình để truy vấn các dối tượng Multimedia lưu trữ trong kiến trúc thổng nhất.
Trong kiến trúc đồng nhất, tất cả các dữ liệu nguồn được truy vấn đều là
SMDSs, trong khi trong kiến trúc lai tạo các cách thức mô tả khác (non-SMDS)
cũng được sử dụng. Cách thức mô tả dữ liệu kiểu lai tạo thường có hai phần
chính:
• Một tập các đối tượng media được mô tả dưới dạng đồng nhất.
• Một tập các kiểu media khác nhau mà có cấu trúc để truy nhập và truy
vấn riêng.
Để mở rộng ngôn ngữ truy vấn SMDS-SQL thành ngôn ngữ có thể truy vấn
được các dữ liệu được mô tả dưới dạng lai tạo (HM-SQL) các yêu cầu sau bắt
buộc phải có:
• HM-SQL phải có khả năng thực hiện tất cả các câu hỏi sử dụng ngôn
ngữ riêng đối với nguồn dữ liệu không đồng nhất này.
• HM-SQL phải có cơ chế “joins” hoặc các thao tác đại số nhị phân có
trách nhiệm “joins” giữa 2 nguồn dữ liệu SMDS và non-SMDS.
Ngôn ngữ HM-SQL cũng tương tự như ngôn ngữ SQL chuẩn ngoại trừ
các mệnh đề Select, From. Where được mở rộng như sau:
• Mệnh đề SELECT và WHERE được mở rộng giống như với ngôn ngữ
SMDS_SQL.
• Tuyên bố Where cho phép sự có mặt của biểu thức có dạng Term IN MS
func_call trong đó:
o Term:có thể là một biến hoặc là một đối tượng có kiểu đầu ra
giống hệt với của func_call đã được định nghĩa trong media gốc và .
o Nếu MS=SMDS hoặc họ func_call thuộc 1 trong 5 hàm đã đinh
nghĩa ở trên

o MS không phải là một nguồn SDMS và func_call là một câu hỏi
trong QL(MS).
• Khi đó có 2 sự khác nhau giữa SMDS-SQL và HM-SQL là:
o func_call xuất hiện trong mệnh đề where cần được chú thích một
cách tường minh với media gốc kèm theo và
o Các câu hỏi được xây dựng từ các ngôn ngữ hỏi đáp của từng loại
dữ liệu non-SMDS có thể được nhúng vào bên trong câu lệnh truy
vấn của HMSQL. Điều này làm cho HM_SQL trở nên hết sức mạnh
mẽ và linh hoạt. Căn cứ vào điều này chúng ta có thể thực thi các
câu hỏi đối với các nguồn dữ liệu khác nhau.
Xét một số ví dụ sau:
• Giả sử chúng ta có 2 nguồn dữ liệu video video1 và video2, nguồn
video1 được triển khai qua hình thức SDMS, nguồn video2 được triển
khai qua hình thức non-SDMS (gọi là videob). Câu hỏi của chúng ta ở đây
là “hãy tìm tất cả các video clip có mặt Denis Hopeman từ cả 2 nguồn dữ
liệu video1 và video2. Câu hỏi này có thể được diễn đạt bằng ngôn ngữ
HM-SQL như sau:
Trong câu hỏi này, chúng ta tìm kiếm tất cả các Ms mà chúng trả về kết
quả mong muốn từ cả 2 nguồn dữ liệu (SDMS và non-SDMS).
• Cũng với câu hỏi trên nhưng ở đây chúng ta thêm vào một nguồn dữ liệu
mới là dữ liệu hình ảnh (idb) được triền khai dưới hình thức non-SDMS và
giả sử dữ liệu hình ảnh này có riêng chức năng tìm kiếm getpic(obj) với
tham số đầu vào là obj và kết quả trả về là một cặp bao gồm một ảnh (file
ảnh) và thứ tự có lien quan. Giả sử chúng ta muốn tìm kiếm trên cả 3 loại
dữ liệu này (video1, video2, idb) có mặt của đối tượng Denis Hopeman thì
câu hỏi diễn đạt bằng ngôn ngữ HM-SQL có thể như sau:
Select M
From sdms Video1, vi•eob Video2
Where M IN sdms: FindObjWithFeature(Denis Hopeman) OR
M IN videodb: FindVideoWithObj(Denis Dopeman)

UNION
(Select M.file From imagedb idb M
Where M In imagedb:getpic(Denis Dopeman)
• Giả sử chúng ta muốn tìm tất cả các đối tượng có mặt cùng với Denis
Dopeman trong tất cả các nguồn dữ liệu (video1, video2, idb), câu hỏi sẽ
như sau
Table of Contents
MULTIMEDIA DATABASE 1
I, BÀI TOÁN 1
II CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN 1
CHƯƠNG I : GIỚI THIỆU CHUNG VỀ CƠ SỞ DỮ LIỆU 1
ĐA PHƯƠNG TIỆN 1
1.1 Dữ liệu đa phương tiện: 1
1.2 Các đặc tính chung của dữ liệu multimedia 2
1.3 Phương pháp cơ bản truy vấn dữ liệu 2
1.4 Các DBMS và vai trò của chúng trong việc xử lý dữ liệu multimedia 3
CHƯƠNG 2 CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (MULTIMEDIA DATABASE) 7
2.1 Kiến trúc cho việc tổ chức nội dung 7
2.1.1 Nguyên lý tự trị 7
2.1.2 Nguyên lý đồng nhất 8
2.1.3 Nguyên lý lai ghép 9
2.2 Tổ chức dữ liệu multimedia dựa trên nguyên lý đồng nhất 12
2.3 Ngôn ngữ truy vấn khai thác dư liệu multimedia 15
2.3.1 Truy vấn SMDSs (mô tả đồng nhất) 15
2.3.2 Truy vấn dữ liệu multimedia mô tả dưới kiến trúc lai tạo 19

×