LOGO
Khoa Công nghệ thông tin
Môn Cơ sở dữ liệu nâng cao
Nhóm 04 – Lớp SP Tin 4
TÌM HIỂU VỀ
CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
GVHD: ThS. Nguyễn Đặng Kim Khánh
NỘI DUNG CHÍNH
11
Click to add Title
Tổng quan về CSDL ĐPT
22
Click to add Title
Truy vấn trên CSDL ĐPT
13
Click
add Title
Hệ QTtoCSDL
ĐPT
24
Click
add Title
OracletoMultimedia
2
1/9/17
TÌM HIỂU VỀ MDB
TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
1
Khái niệm
2
Các đặc trưng của CSDL ĐPT
3
Sự cần thiết của CSDL ĐPT
4
Tổ chức nội dung trong CSDL ĐPT
3
1/9/17
TÌM HIỂU VỀ MDB
TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
CSDL đa phương tiện là một tập hợp các dữ liệu đa phương tiện có liên quan với nhau.
Văn bản
Ảnh vectơ
Audio
Tích hợp văn bản và hình ảnh
Hình ảnh
Tích hợp audio và video
Video KTS
Siêu phương tiện
Dữ liệu liên tục là dữ liệu thay đổi theo thời gian
Dữ liệu không liên tục là các dữ liệu không phụ thuộc
theo thời gian
4
1/9/17
TÌM HIỂU VỀ MDB
TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
Đặc trưng
Lack of structure
Logistics
Temporality
Massive
Volume
1/9/17
5
TÌM HIỂU VỀ MDB
TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
Các dữ liệu đa phương tiện có kích thước lớn và sẽ ảnh hưởng đến việc lưu trữ, truy xuất
và truyền tải các nội dung đa phương tiện
Sự cần thiết
của CSDL đa
phương tiện
Cấu trúc của dữ liệu đa phương tiện khác xa so với các CSDL chuẩn
Các kiểu dữ liệu có tính chất liên tục (như video và audio) không thể xử lý được trong
CSDL chuẩn
Nhờ có CSDL đa phương tiện mà dữ liệu đa phương tiện được tổ chức và khai thác hợp lý, giải
quyết được các vấn đề ở trên.
6
1/9/17
TÌM HIỂU VỀ MDB
TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
Nguyên lý tự trị
Tổ chức nội
dung trong
CSDL đa
phương tiện
Nguyên lý đồng nhất
Nguyên tắc lai ghép
7
1/9/17
TÌM HIỂU VỀ MDB
TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
Nguyên lý tự trị (atonomy)
Nguyên lý này đảm bảo rằng với
mỗi loại dữ liệu (ảnh, video, văn
bản) đều được tổ chức theo một
cách thức phù hợp với đặc trưng
của mỗi loại dữ liệu này.
Mô hình nguyên lý tự trị
8
1/9/17
TÌM HIỂU VỀ MDB
TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
Nguyên lý tự trị (atonomy)
Nhược điểm
Ưu điểm
Các kiến trúc dựa trên nguyên lý tự trị đòi hỏi:
Việc xây dựng các cấu trúc chuyên biệt
hóa đem lại sự tối ưu cho việc truy xuất
−
tạo ra các thuật toán và cấu trúc dữ liệu của mỗi kiểu dữ liệu
−
các kỹ thuật hỗ trợ cho việc liên kết chéo giữa các cấu trúc dữ liệu khác nhau
và hiệu quả cao trong việc xử lý tìm
kiếm
này
Các công việc này đòi hỏi tính phức tạp cao và đòi hỏi một lượng thời gian
lớn cho việc phát triển
Các kỹ thuật hướng đối tượng chính là công cụ đắc lực nhất hỗ trợ cho việc triển khai theo nguyên lý này bằng cách xem
mỗi loại dữ liệu nguồn là một đối tượng mà các phương thức của nó có thể truy cập được từ một CSDL đa phương tiện
tổng thể.
9
1/9/17
TÌM HIỂU VỀ MDB
TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
Nguyên lý đồng nhất (uniformily)
Trình bày tất cả các đối tượng khác nhau trong một cấu trúc dữ
liệu duy nhất và qua đó phát triển các thuật toán để truy vấn cấu
trúc dữ liệu này.
Trái ngược với nguyên lý tự trị, nguyên lý đồng nhất đòi
hỏi chúng ta phải tìm ra được một cấu trúc dữ liệu chung
mà có thể dùng để lưu trữ các thông tin về nội dung của
các kiểu dữ liệu khác nhau.
Mô hình nguyên lý đồng nhất
10
1/9/17
TÌM HIỂU VỀ MDB
TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
Nguyên lý đồng nhất (uniformily)
Nhược điểm
−
Ưu điểm
Các sự chú giải phải được tạo ra theo một cách riêng nào đó,
Dễ dàng triển khai và các thuật toán
thường là được tạo ra một cách thủ công hoặc là tự động
thường được thực hiện rất nhanh
tốn nhiều thời gian cũng như chi phí
−
thường xảy ra sự mất mát thông tin
11
1/9/17
TÌM HIỂU VỀ MDB
TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
Nguyên tắc lai ghép (hybrid)
Ý tưởng của nguyên lý này là dựa trên sự kết hợp của 2 nguyên lý
đã trình bày ở trên.
Kết quả của nguyên lý này là một kiểu dữ liệu nào đó sử dụng chỉ
số riêng của chúng.
Loại dữ liệu nào sử dụng kiểu chỉ số nào sẽ phụ thuộc vào các
đặc tính khác nhau
Mô tả nguyên lý lai ghép
12
1/9/17
TÌM HIỂU VỀ MDB
TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
Nguyên tắc lai ghép (hybrid)
Nguyên lý lai tạo tập hợp được các ưu điểm của cả hai nguyên lý nêu trên, đồng thời giảm thiểu được một số các nhược điểm
của chúng
−
Phần 1: tận dụng được lợi thế của các chỉ số và mã
nguồn sẵn có
Nguyên lý tự trị
Phần 2: tập các dữ liệu không có nguồn sẵn, các chỉ số của mình
Nguyên lý đồng nhất
Xây dựng các thuật toán cần thiết để kết hợp các nguồn dữ liệu khác nhau lại bằng việc sử dụng các tập chỉ số riêng của chúng
Thừa kế được tối đa các tài nguyên có sẵn, đồng thời giảm thiểu được các công việc phải thực hiện
thêm
13
1/9/17
TÌM HIỂU VỀ MDB
Ngôn ngữ truy vấn
dữ liệu đa phương tiện
1
Truy vấn SMDSs
Truy vấn dữ liệu ĐPT mô tả dưới
2
kiến trúc lai tạo
14
1/9/17
TÌM HIỂU VỀ MDB
Ngôn ngữ truy vấn
dữ liệu đa phương tiện
Có 2 phương pháp truy vấn:
Thứ nhất, truy xuất dựa trên thuộc tính
Sử dụng các thông tin được nhập thủ công hay bao gồm trong thiết kế của bảng, như tiêu đề,
các từ khóa mô tả
Thứ hai, truy xuất dựa trên nội dung
Sử dụng các đặc trưng được rút trích từ nội dung của đối tượng đa phương tiện và sự nhận
diện đối tượng để phân loại nội dung dữ liệu đa phương tiện
15
1/9/17
TÌM HIỂU VỀ MDB
Truy vấn SMDSs
(Mô tả đồng nhất)
Các hàm cơ bản của SMDSs:
FindType(Obj): hàm này dùng đối tượng Obj như là dữ liệu đầu vào và trả về kiểu của đối tượng, ví dụ:
o FindType(image1.gif) = gif.
o FindType(movie1.mpg) = mpg.
FindObjWithFeature(f): hàm này này sử dụng đặc trưng f là giá trị đầu vào và trả về một tập tất cả các
loại đối tượng media mà có chứa đặc trưng f, ví dụ:
o FindObjWithFeature(john)=
o FindObjWithFeature(mary)=
{im1.gif,im2.gif,im3.gif,video1.mpg:[1,5]}.
{video1.mpg:[1,5],video1.mpg:[15,50]}.
16
1/9/17
TÌM HIỂU VỀ MDB
Truy vấn SMDSs
(Mô tả đồng nhất)
FindObjWithFeatureandAttr(f,a,v): hàm này sử dụng đặc trưng f, một thuộc tính tên a kết hợp với đặc
trưng này và một giá trị v là đầu vào. Giá trị trả về sẽ là tất cả các đối tượng obj có chứa đặc trưng và
giá trị của thuộc tính a trong đối tượng obj là v. Ví dụ:
o FindObjWithFeatureandAttr(Big Spender,suit,blue)
FindFeaturesinObj(Obj): câu truy vấn này đòi hỏi phải tìm tất cả các đặc trưng có mặt trong một
đối tượng media đã cho. Kết quả trả về là một tập bao gồm tất cả các đặc trưng. Ví dụ:
o FindFeaturesinObj (im1.gif)
o FindFeaturesinObj(video1.mpg:[1,15])
17
1/9/17
TÌM HIỂU VỀ MDB
Truy vấn SMDSs
(Mô tả đồng nhất)
FindFeaturesandAttrinObj(Obj): có chức năng tương tự như hàm trước ngoại trừ việc nó trả
về một quan hệ có schema là (Feature, Attribute,Value). Ví dụ:
o FindFeaturesandAttrinObj(iml.gif)
18
1/9/17
TÌM HIỂU VỀ MDB
Truy vấn SMDSs
(Mô tả đồng nhất)
Một số đặc trưng của DL đa phương tiện bổ sung vào SQL:
•
•
Mệnh đề SELECT có thể chứa thực thể media.
Mệnh đề FROM có thể chứa các thực thể theo mẫu sau:
<media><source><M>
•
SMDS-SQL
câu lệnh
một số đặc
chuẩn
củacó dạng:
Mệnh đề WHERE cho phép có các biểu
thức
term IN func_call
trưng của DL
SQL
ĐPT
19
1/9/17
TÌM HIỂU VỀ MDB
Truy vấn SMDSs
(Mô tả đồng nhất)
Ví dụ:
Tìm tất cả các đối tượng ảnh hoặc video có chứa cả Jane Shady và
Denis Dopeman:
SELECT
M
FROM
smds source1 M
WHERE
(FindType(M)= Video OR
FindType(M)=Image)
AND
M IN FindObjWithFeature(Jane Shady)
AND
M IN FindObjWithFeature(Denis Dopeman)
20
1/9/17
TÌM HIỂU VỀ MDB
Truy vấn dữ liệu ĐPT
mô tả dưới kiến trúc lai tạo
Trong kiến trúc lai tạo, các dữ liệu nguồn được
truy vấn gồm cả SMDSs và non-SMDS.
Cách thức mô tả DL kiểu lai tạo có 2 phần chính:
• Một tập các đối tượng media được mô tả dưới dạng đồng nhất
• Một tập các kiểu media khác nhau mà có cấu trúc để truy nhập và truy vấn
riêng
21
1/9/17
TÌM HIỂU VỀ MDB
Truy vấn dữ liệu ĐPT
mô tả dưới kiến trúc lai tạo
Để mở rộng SMDS-SQL thành HM-SQL cần có các yêu cầu sau:
HM-SQL phải có khả năng
HM-SQL phải có cơ chế
thực hiện tất cả các truy
“joins” hoặc các thao tác
vấn sử dụng ngôn ngữ
đại số nhị phân có trách
riêng đối với nguồn DL
nhiệm “joins” giữa 2 nguồn
không đồng nhất
DL SMDS và non-SMDS
22
1/9/17
TÌM HIỂU VỀ MDB
Truy vấn dữ liệu ĐPT
mô tả dưới kiến trúc lai tạo
Ngôn ngữ HM-SQL: tương tự như ngôn ngữ SQL chuẩn và Select, From, Where
được mở rộng như sau:
Mệnh đề SELECT và FROM được mở rộng giống như với ngôn ngữ SMDSSQL
Mệnh đề WHERE cho phép sự có mặt của biểu thức có dạng
Term IN MS: func_call
23
1/9/17
TÌM HIỂU VỀ MDB
Truy vấn dữ liệu ĐPT
mô tả dưới kiến trúc lai tạo
Ví dụ:
Có 2 nguồn DL video: video1 và video2, nguồn video1 được triển khai qua hình thức SMDS,
nguồn video2 được triển khai qua hình thức non-SMDS (gọi là videodb).
“Tìm tất cả các video clip có mặt Denis Hopeman từ cả 2 nguồn dữ liệu video1 và video2 ?”
SELECT
M
FROM
smds video1, videodb video2
WHERE
M IN smds:FindObjWithFeature(Denis Hopeman)
OR
M IN videodb:FindVideoWithObject(Denis Hopeman)
24
1/9/17
TÌM HIỂU VỀ MDB
HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
1
2
3
4
Khái niệm
Kiến trúc của Hệ QT CSDL ĐPT
Các yêu cầu của Hệ QT CSDL ĐPT
Các vấn đề của CSDL ĐPT
25
1/9/17
TÌM HIỂU VỀ MDB