CSDL ĐA PHƯƠNG TIỆN
PGS.TS. Đặng Văn Đức
Hà Nội - 2005/14
Mô tả môn học
Cung cấp cho học viên các kiến thức liên quan đến việc
phát triển Hệ quản trị CSDL đa phương tiện (MMDBMS-
Multimedia Database System) với khả năng lưu trữ,
quản lý và tìm kiếm dữ liệu đa phương tiện trên cơ sở
nội dung.
Các vấn đề nghiên cứu chính bao gồm:
Dữ liệu đa phương tiện và hệ thống đa phương tiện
Các kỹ thuật trích chọn đặc trưng và kỹ thuật chỉ mục dữ liệu
đa phương tiện
Các nhiệm vụ phát triển hệ thống CSDL đa phương tiện.
dvduc-2005/14Bài 1: Giới thiệu CSDL đa phương tiện2/25
Chủ đề
Giới thiệu MMDBMS
Dữ liệu đa phương tiện
Các nhiệm vụ thiết kế MMDBMS
Chỉ mục và tìm kiếm văn bản
Chỉ mục và tìm kiếm âm thanh
Chỉ mục và tìm kiếm ảnh
Chỉ mục và tìm kiếm video
Kỹ thuật và cấu trúc dữ liệu nâng cao hiệu quả tìm
kiếm đa phương tiện
Hỗ trợ hệ thống MMDBMS
Các chủ đề tiểu luận
dvduc-2005/14Bài 1: Giới thiệu CSDL đa phương tiện3/25
Tài liệu
Tài liệu học
Tài liệu biên soạn (pptx)
Tài liệu tham khảo chính
Guojun Lu, Multimedia Database
Management Systems, Artech
House, Boston – London, 1999.
Subrahmanian V.S., Principles of
Multimedia Database Systems,
Morgan Kaufmann Publishers,
Inc., California, 1998.
dvduc-2005/14Bài 1: Giới thiệu CSDL đa phương tiện4/25
Yêu cầu môn học
Nhiệm vụ của học viên
Tham gia nghe giảng trên lớp học
Tự nghiên cứu
Đánh giá kết quả
Điểm đánh giá bộ phận: 30%
Điểm thi kết thúc môn học: 70%
dvduc-2005/14Bài 1: Giới thiệu CSDL đa phương tiện5/25
GIỚI THIỆU CSDL ĐA PHƯƠNG TIỆN
Bài 1
Hà Nội 2005/2014
PGS.TS. Đặng Văn Đức
dvduc-2005/14Bài 1: Giới thiệu CSDL đa phương tiện
Nội dung
Giới thiệu
Ứng dụng CSDL đa phương tiện
Một vài khái niệm cơ sở
Tìm kiếm thông tin đa phương tiện
Các lĩnh vực liên quan
Các giai đoạn phát triển MMDBMS
Kết luận
7/25
dvduc-2005/14Bài 1: Giới thiệu CSDL đa phương tiện
1. Giới thiệu
Nghiên cứu về đa phương tiện (MM-multimedia)
Giai đoạn đầu (giữa những năm 90) : Xây dựng CD-titles,
truyền tin đa phương tiện
Các nghiên cứu hiện nay: CSDL đa phương tiện, tìm kiếm dữ
liệu đa phương tiện theo nội dung
Tại sao phải nghiên cứu phát triển Hệ quản trị CSDL đa
phương tiện (MMDBMS)?
Ngày càng có nhiều dữ liệu đa phương tiện cần lưu trữ, quản lý
và chia sẻ.
CSDL truyền thống không đáp ứng yêu cầu.
Các vấn đề chính cần quan tâm khi nghiên cứu phát
triển MMDBMS.
Chỉ mục và tìm kiếm nội dung
Truyền thông đa phương tiện
8/25
dvduc-2005/14Bài 1: Giới thiệu CSDL đa phương tiện
2. Thí dụ ứng dụng MMDBMS
Kịch bản đa phương tiện
Điều tra tội phạm buôn
bán ma túy
Quản lý dữ liệu hình ảnh
Ảnh trong y học
Quản lý dữ liệu video
Dạy-học từ xa
Quản lý dữ liệu âm thanh
Âm nhạc giải trí
Quản lý tài liệu
Văn bản/sách điện tử
Trang Web
Tích hợp
Thư viện số
Audio
(Phone) data
Still image
data
Geographic
information
Relational
data
Document
data
Police
application
Surveillance
video
Một kịch bản MMDBMS
9/25
dvduc-2005/14Bài 1: Giới thiệu CSDL đa phương tiện
Ví dụ ứng dụng MMDBMS
Thư viện số
10/25
dvduc-2005/14Bài 1: Giới thiệu CSDL đa phương tiện
Ví dụ ứng dụng MMDBMS
CSDL tài nguyên sinh vật (IOIT-VAST).
11/25
dvduc-2005/14Bài 1: Giới thiệu CSDL đa phương tiện
Ví dụ ứng dụng MMDBMS
Sinh trắc học trong việc cấp, quản lý CMND (Tổng cục
Cảnh sát QLHC về TTATXH)
12/25
dvduc-2005/14Bài 1: Giới thiệu CSDL đa phương tiện
3. Một vài khái niệm cơ sở
Khái niệm Multimedia
Multi (Latin: multus-, Eng: numeous): đa, nhiều
Media (Latin: medius, Eng: means, intermediary): Phương tiện
truyền đạt thông tin, loại thông tin: văn bản, hình ảnh, âm thanh
và video.
Định nghĩa Multimedia:
Là tập hợp các kiểu dữ liệu (media) được sử dụng chung, trong đó
ít nhất có một kiểu không phải là văn bản.
Là các kỹ thuật trên cơ sở máy tính biểu diễn, xử lý, lưu trữ, truyền
tải, sản xuất và trình diễn dưới dạng số các loại dữ liệu khác nhau
như văn bản, ảnh, âm thanh, video, đồ họa, hình ảnh động…
13/25
dvduc-2005/14Bài 1: Giới thiệu CSDL đa phương tiện
Một vài khái niệm cơ sở
Tính chất cơ bản của Multimedia
Số hóa:
Tất cả các media bao gồm cả âm thanh, video được biểu diễn
dưới dạng số
Phân tán:
Thông tin được truyền đạt có thể từ xa, có thể được tạo ra trước
để lưu trữ hay tạo ra theo thời gian thực, phân tán trên mạng
Tương tác:
Người sử dụng có khả năng tương tác với các media trình diễn.
Tích hợp:
Các media được xử lý, trình diễn theo cùng cách nhất quán,
nhưng vẫn có thể thao tác độc lập.
14/25
dvduc-2005/14Bài 1: Giới thiệu CSDL đa phương tiện
Một vài khái niệm cơ sở
Hệ thống multimedia
Là hệ thống có khả năng xử lý dữ liệu multimedia và các ứng
dụng.
IR (Information Retrieval):
Hệ thống tự động tìm kiếm văn bản trên cơ sở nội dung
MIRS (MIRS-Multimedia Indexing and Retrieval System)
Hệ thống cơ sở với khả năng tìm kiến thông tin MM, sử dụng
các kỹ thuật tìm kiếm của DBMS, IR.
Media Item – Media Object
Thực thể tự trị trong hệ thống chỉ mục và tìm kiếm thông tin đa
phương tiện (MIRS).
15/25
dvduc-2005/14Bài 1: Giới thiệu CSDL đa phương tiện
Một vài khái niệm cơ sở
Nhắc lại CSDL và Hệ quản trị CSDL
CSDL: Tập hợp các bản ghi data hay media item
Hệ quản trị CSDL (DBMS): Toàn bộ hệ thống quản trị CSDL,
quản lý CSDL
Tìm kiếm thông tin dựa trên đối sánh chính xác.
Chỉ mục và tìm kiếm đa phương tiện
Là khung làm việc để quản lý các kiểu dữ liệu khác nhau,
thể hiện trong các khuôn dạng khác nhau.
Khả năng tìm kiếm thông tin theo nội dung
MIRS: sử dụng kỹ thuật áp dụng trong CSDL truyền thống
và kỹ thuật tìm kiếm theo nội dung.
Trích chọn đặc trưng
Là nhiệm vụ quan trọng nhất khi xây dựng MIRS
Có thể trích chọn tự động hoặc bán tự động.
16/25
dvduc-2005/14Bài 1: Giới thiệu CSDL đa phương tiện
Dữ liệu Multimedia
17/25
dvduc-2005/14Bài 1: Giới thiệu CSDL đa phương tiện
4. Khái quát về hệ thống MMDBMS
Queries
Query
features
Information
Items
Indexed
information items
Retrieval of similar
items
Processing and
feature extraction
Preprocessing
and indexing
Similarity
computation
Mô hình tổng quát tìm kiếm dữ liệu đa phương tiện
Offline
Online
18/25
dvduc-2005/14Bài 1: Giới thiệu CSDL đa phương tiện
Ví dụ mô hình truy vấn trong MMDBMS
Chỉ mục:
Ảnh (I) > véctơ đặc trưng f(I):(f1, f2, fk)
Truy vấn:
Véctơ truy vấn q:(q1, q2, qk)
Tính tương tự:
Đo khoảng cách: d(f,q)
Kết quả:
Ảnh (I) có giá trị d(f(I),q) nhỏ nhất.
19/25
dvduc-2005/14Bài 1: Giới thiệu CSDL đa phương tiện
Yêu cầu của một MMDBMS
Hỗ trợ các loại truy vấn khác nhau
Trên cơ sở meta-data
Trên cơ sở mô tả (annotation)
Trên cơ sở mẫu/đặc trưng (mức thấp)
Trên cơ sở nội dung mức cao
Khả năng khai thác hiệu quả các đối tượng mang tin
Hiệu năng cao
Trơn tru
Không có jitter
Đồng bộ âm thanh-hình ảnh
Khả năng tạo lập câu trả lời và trình diễn kết quả bằng
phương tiện nghe, nhìn
Đáp ứng yêu cầu cụ thể của các ứng dụng thực tế.
20/25
dvduc-2005/14Bài 1: Giới thiệu CSDL đa phương tiện
5. Các lĩnh vực liên quan đến MM
Audio
Images
Information
Retrieval
Storage
Systems
Networking
Psychology
HCI
Data
Compression
Natural
Language
Processing
Multimedia System
CPU Power
Video
21/25
dvduc-2005/14Bài 1: Giới thiệu CSDL đa phương tiện
6. Các giai đoạn phát triển MMDBMS
Giai đoạn 1:
Phụ thuộc vào OS để lưu trữ và tìm kiếm tệp
Giữa những năm 90 của thế kỷ XX có các hệ thống như:
MediaDB, Jasmin, ITASCA
Giai đoạn 2:
Có tính thương mại, hỗ trợ nhiều kiểu dữ liệu khác nhau
Trên nền tảng các DBMS quan hệ-mở rộng
Informix,
IBM DB2 Universal Database Extenders
Oracle Media
Giai đoạn 3:
Các dự án tập trung vào hệ thống giàu nội dung, ngữ nghĩa:
MARS (University of Illinois)
Trên các chuẩn MPEG-7, MPEG-21
22/25
dvduc-2005/14Bài 1: Giới thiệu CSDL đa phương tiện
7. Kết luận
Phạm vi nghiên cứu của MMDBMS
T
e
x
t
Tasks
Properties
Media
23/25
dvduc-2005/14Bài 1: Giới thiệu CSDL đa phương tiện
Kết luận
Giới thiệu một số ứng dụng MMDBMS
Đặc trưng chính của media và của ứng dụng đa phương
tiện
Các chức năng của Hệ thống tìm kiếm thông tin
Khả năng tìm kiếm thông tin đa phương tiện của MIRS
Các lĩnh vực liên quan đến MMDBMS
24/25
Câu hỏi ôn tập
Định nghĩa Multimedia và hệ thống multimedia.
Mô tả các loại media mà MMDBMS quản lý.
Các đặc trưng chính của dữ liệu và ứng dụng đa
phương tiện là gì?
Tại sao DBMS không thể quản lý hiệu quả dữ liệu đa
phương tiện?
Mô tả mô hình tìm kiếm thông tin của MMDBMS.
Mô tả các kiểu truy vấn mà MMDBMS hỗ trợ.
Anh/chị liệt kê các hệ thống MMDBMS mà anh chị quen
biết?
dvduc-2005/14Bài 1: Giới thiệu CSDL đa phương tiện25/25