Tải bản đầy đủ (.ppt) (30 trang)

TIỂU LUẬN MÔN CƠ SƠ DỮ LIỆU MULTIMEDIA DATABASE

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (399.25 KB, 30 trang )


1
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
KHOA CÔNG NGHỆ THÔNG TIN
TIỂU LUẬN MÔN CƠ SƠ DỮ LIỆU
MULTIMEDIA DATABASE
NGUYỄN THỊ HUỆ
LÊ CHÍ CHUNG
GIẢNG VIÊN: TS NGUYỄN HÀ NAM
Hà Nội - 2012

2
NỘI DUNG

BÀI TOÁN

GIỚI THIỆU DỮ LIỆU ĐA PHƯƠNG TIỆN

CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN

3
BÀI TOÁN
Xây dựng chương trình quản lý thông tin chia sẻ
- Nội dung chia sẻ: hình ảnh, âm thanh, video, tài
liệu văn bản
- Tính năng chương trình: cho phép truy cập,
update, tim kiếm thông tin theo một só tiêu chí
nhất định
2/3


4
GIỚI THIỆU
1. Thế nào là dữ liệu đa phương tiện
2. Các đặc trưng của dữ liệu đa phương
tiện
3. Phương pháp cơ bản trong truy vấn
dữ liệu
4. Vai trò của hệ quản trị trong truy vấn dữ
liệu

5
DỮ LIỆU ĐA PHƯƠNG TIỆN

Dữ liệu đa phương tiện được chia làm hai loại dữ
liệu liên tục và dữ liệu không liên tục

Dữ liệu liên tục la loại dữ liệu phụ thuộc theo thời
gian vd : video, audio

Dữ liệu không liên tục là loại dưc liệu không phụ
thuộc thời gian VD: hình ảnh, file văn bản, ảnh vẽ

Các loại dữ liệu đa phương tiện cơ bản:
Text : Các loại văn bản(Có cấu trúc – hoặc không)
Đồ họa : là các bản vẽ minh họa
Hình ảnh, Hoạt hình, video, audio

6
• Thiếu cấu trúc: Các dữ liệu multimedia có khuynh hướng phi cấu
trúc vì vậy các tác nghiệp quản trị dữ liệu chuẩn như chỉ số hoá,

tìm kiếm nội dung, truy vấn dữ liệu thường là không áp dụng được.
• Tính tạm thời: Một vài kiểu dữ liệu multimedia như là Video, âm
thanh và hoạt hình đều phụ thuộc vào yếu tố thời gian liên quan
mật thiết đến việc lưu trữ, thao tác và mô tả chúng.
• Có dung lượng lớn: các dữ liệu video và âm thanh thường đòi hỏi
các thiết bị lưu trữ lớn.
• Các ứng dụng hỗ trợ: các dữ liệu phi chuần có thể đòi hỏi các quy
trình xử lý phức tạp như việc sử dụng các thuật toán nén dữ liệu
đối với các ứng dụng CSDL multimedia.
CÁC ĐẶC TÍNH CHUNG

7
- Hệ thống cơ sở dữ liệu thông thường: Đây là phương pháp
được sử dụng rộng rãi trong quản lý và tìm kiếm dữ liệu có cấu
trúc.
- Hệ thống truy vấn thông tin (IR- Information retrieval): IR hệ
thống được sử dụng chủ yếu để tìm kiếm các bộ sưu tập văn
bản lớn – dự liệu truy vấn là các từ khóa của văn bản.
- Truy hồi dựa trên nội dung (CBR):phương pháp tiếp cận hệ
thống này được sử dụng để lấy mong muốn các đối tượng đa
phương tiện từ một bộ sưu tập lớn trên cơ sở tính năng (như
kết cấu, màu sắc và hình dạng, vv) có thể được tự động chiết
xuất từ bản thân các đối tượng​​
- Đồ thị hoặc cây mô hình phù hợp: Cách tiếp cận này nhằm
mục đích để lấy đối tượng phụ đồ thị từ một đối tượng đồ thị
theo một số mô hình ký hiệu.
PHƯƠNG PHÁP TRUY VẤN CƠ BẢN

8
• Các công cụ, tự động hoá hoặc bán tự động trích rút các

nội dung và các đặc trưng trong dữ liệu multimedia ;
• Các cấu trúc chỉ số hoá đa chiều, để điều khiển các
vector multimedia
• Các độ đo tương đồng, nhằm truy xuất multimedia thay
vì kết nối một cách chính xác
• Lưu trữ các hệ thống phụ, thiết kế lại nhằm đáp ứng các
yêu cầu của băng tần cao với cỡ lớn, thoả mãn những
đòi hỏi theo kiểu thời gian thực
• Giao diện sử dụng, được thiết kế cho phép các câu hỏi
đa dạng trong nhiều kiểu truyền thông đa dạng và cung
cấp các trình diễn multimedia
VAI TRÒ CỦA DBMS

9
VAI TRÒ CỦA DBMS
Cung cấp đối tượng lưu trữ dữ lương lớn(BLOG, CLOG )
VD:Trong DB2 trường BLOG có thể lưu trữ lên đến 4GB
Cách tạo một bảng dữ liệu chứa thông tin hình ảnh:
Create table STUDENT(
Stu integer,
Name char(20),
address char(100),
Picture BLOB);

10
CƠ SỎ DỮ LIỆU ĐA PHƯƠNG TIỆN
Kiến trúc cho việc tổ chức dữ liệu multimedia

Nguyên lý tự trị (Principle of Autonomy)


Nguyên lý đồng nhất (Principle of Uniformity)

Nguyên lý lai ghép(Principle of Hybrid Organization)

Tổ chức dữ liệu multimedia dựa trên nguyên lý đồng
nhất

Ngôn ngữ truy vấn khai thác dư liệu multimedia

Truy vấn SMDSs (mô tả đồng nhất)

Truy vấn dữ liệu multimedia mô tả dưới kiến trúc lai tạo

Chỉ số hoá SMDS với chỉ số đảo

11
Kiến trúc tổ chức dữ
liệu multimedia
Nguyên lý tự trị (Principle of Autonomy)

Mỗi loại dữ liệu đều được tổ chức theo cách dặc trưng
riêng.

Cần được tính toán cho việc
join các cấu trúc dữ liệu
khác nhau.

Liên kết nhanh trong thực hiện
xử lý truy vấn cấu trúc dặc biệt


12
Kiến trúc tổ chức dữ
liệu multimedia
Nguyên lý đồng nhất(Principle of Uniformity)

Tạo chỉ số thống nhất cho tất cả các loại dữ liệu

Trìu tượng hóa các loại dữ
liệu khác nhau thành một
dạng metadata(khó khăn)

Có cấu trúc đơn giản nên rất
dễ thao tác

Giải quyết cho mọi dạng dữ
liệu khác nhau

13
Kiến trúc tổ chức dữ
liệu multimedia
Nguyên lý lai ghép(Principle of Hybrid
Organization) Tích hợp từ hai nguyên lý trên

Mỗi loại dữ liệu có một tập index riêng và các loại dữ
liệu sử dụng chỉ index thống nhất

14
Tổ chức dữ liệu dựa trên
nguyên lý đông nhất
Xem xét theo khía cạnh trạng thái của các dữ liệu media

chúng có thể được tạo bởi con người hay được cung cấp
bởi kỷ thuật truy vấn của hinh ảnh/ âm thanh/video.
Xét ví dụ ;
• Bức ảnh photo1.gif có sự xuất hiện của đối tượng A, đối tượng B
và một đối tượng chưa được xác định được chụp tại thành phố C
thuộc nước D vào ngày 10/01/1990.
• Đoạn video video1.mpg có hình ảnh của đối tượng A đưa cho đối
tượng B một chiếc vali (trong frames 50-100). Đoạn video này thu
được từ sự theo dõi nhà của đối tượng B tại thành phố E thuộc
nước F vào tháng 1- 1991.
• Văn bản B.txt có chứa các thông tin chi tiết về dối tượng B được
thu thập từ dữ liệu của cơ quan an ninh.

15
Tổ chức dữ liệu dựa trên
nguyên lý đông nhất

Tất cả các trạng thái của dư liệu đưa vào trạng thái dư
liệu liệu meta

Với mỗi đối tượng Oi của dữ liệu media sẽ có vài
đối tượng md(Oi)của dữ liệu meta

Nếu ta chuyển O1, On đối tượng media sang
md(O1) md(On) các đối tượng dữ liệu meta
Đây được xem là mong đợi của chúng ta với việc
thao tác với dữ liệu cấu trúc đơn giản.

16
TRUY VẤN DỮ LIỆU MEDIA DỰA VÀO

TÍNH ĐỒNG NHẤT
Truy vấn dữ liệu dựa trên SQL .và có các function cơ bản sau:
• FindType(Obj): hàm này sử dụng đối tượng media Obj làm đầu vào
và sẽ trả về kiểu của đối tượng, ví dụ:

FindType(image1.gif) = gif.

FindType(movie1.mpg) = mpg.
• FindObjWithFeature(f): hàm này sử dụng đặc trưng f là giá trị đầu
vào và trả về một tập tất cả các loại đối tượng media mà có chứa
đặc trưng f, ví dụ
FindObjWithFeature(john)= {iml.gif,im2.gif,im3.gif,videol.mpg:[1,5]}
FindObjWithFeature(mary)= {videol.mpg: [1,5],videol.mpg:[15,50]}.


17
TRUY VẤN DỮ LIỆU MEDIA DỰA
VÀO TÍNH ĐỒNG NHẤT
• FindObjWithFeatureAttr(f,a,v): hàm này sử dụng đặc trưng f, một
thuộc tính tên a kết hợp với đặc trưng này và một giá trị v là đầu
vào. Giá trị trả về sẽ là tất cả các đối tượng o có chứa đặc trưng và
giá trị của thuộc tính a trong đối tượng o là v. Ví dụ:

FindObjWithFeatureandAttr(Big Spender,suit,blue): Tìm tất cả
các đối tượng media mà có sự xuất hiện của Jane Shady trong chiếc
áo mầu blue.

FindObjWithFeatureandAttr(Elephant,bow,red): Tìm tất cả các đối
tượng media mà một con voi có mang một cái nơ mầu đỏ xuất hiện
• FindFeaturesInObj(Obj): câu hỏi này đòi hỏi phải tìm tất cả các đặc

trưng có mặt trong một đối tượng media đã cho. Kết quả trả về là
một tập bao gồm tất cả các đặc trưng. Ví dụ:

FindFeaturesInObj (im1.gif): tìm tất cả các đặc trưng có trong file
ảnh im1.gif.

FindFeaturesInObj(video1.mpg:[1,5]): Tìm tất cả các đặc trưng có
trong 5 frame đầu tiên của file video video1.mpg.

18
TRUY VẤN DỮ LIỆU MEDIA DỰA
VÀO TÍNH ĐỒNG NHẤT
• FindFeatureandAttrinObj(Obj): hàm này cũng có chức năng
tương tự như hàm trước ngoại trừ việc nó trả về một quan hệ có
schema như sau: (Feature,Attribute,Value) trong đó cặp 3 (f,a,v)
xuất hiện trong quan hệ đầu ra nếu thuộc tính a của đặc trưng f
được xác định và có giá trị là v. Ví dụ:
FindFeatureandAttrinObj (im1.gif) có thể trả về kết quả được mô tả ở
bảng sau

19
TRUY VẤN SMDS BẰNG SMDS- SQL
SMDS-SQL mở rộng của chúng ta sẽ bao gồm tất cả các
câu lệnh chuẩn của SQL có bổ sung thêm một số đặc
trưng của dữ liệu Multimedia vào SQL (bổ sung thêm vào
SELECT, FROM, WHERE)

Tuyên bố Select có thể chứa thực thể media. Một thực thể
media được định nghĩa như sau:


Nếu m là một đối tượng media liên tục, i và j là 2 số nguyên khi
đó m : [i,j] là một thực thể media thể hiện một tập tất cả các
frame của đối tượng media m nằm trong (và chỉ trong) khoảng i
và j.

Nếu m không phải là một đối tượng media liên tục thì khi đó m
là một thực thể media.

Nếu m là một thực thể media và a là một thuộc tính của m thì
khi dó m.a là một thực thể media.

20
TRUY VẤN SMDS BẰNG SMDS- SQL
• Tuyên bố FROM có thể có các thực thể theo mẫu sau:
(media) (source) (M), có nghĩa là chỉ có các đối tượng media
kết hợp với tên của kiểu media và tên của dữ liệu nguồn
được xem xét dến khi thực hiện câu hỏi và M là một biến
được xếp loại trên các đối tượng media đó.
• Tuyên bố WHERE cho phép có các biểu thức có dạng term In
func.call. Trong đó:

Term có thể là một biến (trong trường hợp này được
sắp xếp trên kiểu trả về của func.call) hoặc là một
đối tượng có kiểu đầu ra giống như func.call.

Func.call là một trong 5 hàm đã nêu ra ở trên.

21
TRUY VẤN SMDS BẰNG SMDS-
SQL

VÍ dụ :
• Tìm tất cả các đối tượng ảnh hoặc video có chứa cả
Jane Shady và Denis Dopeman.
SELECT M
FROM smds source1 M
WHERE (FindType(M)=Video OR FindType(M)=Image)
AND M IN FindObjWithFeature(Big Spender)
AND M IN FindObjWithFeature(Jane Shady).

22
TRUY VẤN SMDS BẰNG SMDS- SQL
Tìm tất cả các ảnh có chứa cả Jane Shady và Denis
Dopeman và Jane đứng bên trái Denis

23
TRUY VẤN SMDS BẰNG SMDS- SQ
. Tìm tất cả các ảnh có Jane Shady cùng với đối tượng xuất hiện trong
đoạn Video cùng với Denis Hopeman. Khác với câu hỏi trước, câu hỏi
này đòi hỏi phải có các thao tác kết hợp giữa các loại dữ liệu khác
nhau. Để thực hiện được câu hỏi này, chúng ta phải sử dụng các biến
mở rộng như là Person, biến này được dùng để tham chiếu đến đối
tượng chưa xác định được danh tính trong đoạn băng video.

24
SMDS-SQL Có thể được sử dụng để truy vấn các đối tượng multimedia
đươc lưu trữ đồng nhất
“ Những thay đổi trong truy vấn của cơ sở dữ liệu lại tạo”
Để mở rộng ngôn ngữ truy vấn SMDS-SQL thành ngôn ngữ có thể truy
vấn được các dữ liệu được mô tả dưới dạng lai tạo (HM-SQL) các yêu
cầu sau bắt buộc phải có:

• HM-SQL phải có khả năng thực hiện tất cả các câu hỏi sử dụng ngôn
ngữ riêng đối với nguồn dữ liệu không đồng nhất này.
• HM-SQL phải có cơ chế “joins” hoặc các thao tác đại số nhị phân có
trách nhiệm “joins” giữa 2 nguồn dữ liệu SMDS và non-SMDS.
Ngôn ngữ HM-SQL cũng tương tự như ngôn ngữ SQL chuẩn ngoại trừ các
mệnh đề Select, From. Where được mở rộng như sau:
• Mệnh đề SELECT và WHERE được mở rộng giống như với ngôn ngữ
SMDS_SQL.
TRUY VẤN DỮ LIỆU MEDIA CÓ CẤU TRÚC
LAI TẠO

25
• Mệnh đề SELECT và WHERE được mở rộng giống như với
ngôn ngữ SMDS_SQL.
• Tuyên bố Where cho phép sự có mặt của biểu thức có dạng
Term IN MS func_call trong đó:
o Term:có thể là một biến hoặc là một đối tượng có kiểu đầu ra giống
hệt với của func_call đã được định nghĩa trong media gốc và .
o Nếu MS=SMDS hoặc họ func_call thuộc 1 trong 5 hàm đã đinh
nghĩa ở trên
o MS không phải là một nguồn SDMS và func_call là một câu hỏi
trong QL(MS).
TRUY VẤN DỮ LIỆU MEDIA CÓ CẤU TRÚC
LAI TẠO

×