Tải bản đầy đủ (.pptx) (18 trang)

Bài báo cáo tìm kiếm dữ liệu video

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (328.74 KB, 18 trang )

BÀI BÁO CÁO
TÌM KIẾM DỮ LIỆU VIDEO
Bộ môn: Cơ sở dữ liệu đa phương tiện


THÀNH VIÊN TRONG NHÓM
 Cầm Văn Hoan
 Lò Ngọc Anh
 Tếnh Lão Bua
 Lò Văn Dương
 Lương Quốc Đức


Đinh nghĩa về cơ sở dữ liệu đa phương tiện

Cơ Sở dữ liệu đa phương tiện: là một tập hợp các dữ liệu đa phương tiện có liên
quan với nhau. Các kiểu dữ liệu thông thường của một CSDL đa phương tiện
gồm có:
- Văn bản: có mặt hầu hết ở các ứng dung đa phương tiện nhằm giải thích thêm
cho các dạng dữ liệu không phải là văn bản, đây là loại dữ liệu đa dạng, và
được lưu trữ nhỏ gọn nhất.


- Audio: là loại dữ liệu phổ biết nhất cùng với nhiều định dạng khác nhau ( mp3,
mp4, wav, wma, cd, ra,…). File audio chưa chuyển hóa sang dang số có kích
thước rất lớn (1s chiếm 10kb) và có thể nén dễ dàng ( hệ số nén của file Mp3 là
12:1 ).
- Hình ảnh: bao gồm những ảnh trắng, ảnh xám, ảnh màu. Các định dạng của
ảnh (bmp, gjf, jpeg, pcx, png,..). Một ảnh có độ phân giải cao có thể chiếm vài
Mb và cũng giống như âm thanh, hình ảnh cũng có thể nén, định dạng của
JPEG có hệ số nén thường lớn hơn 10.




- Video kỹ thuật số: là một chuỗi các hình ảnh liên tục nhau. Loại dữ liệu
này thường đòi hỏi dung lượng lưu trữ lớn tuy hệ số nén của nó là rất
cao. Vận tốc truyền và thu video kỹ thuật số nằm trong khoản 20-30
khung hình một giây. Trong các loại video kỹ thuật số, phim hoạt hình là
loại nhỏ gọn và dễ lưu trữ hơn các loại khác vì sử dụng các hình ảnh tổng
hợp có sử dụng các mẫu chuẩn.
- Tích hợp audio và video.
- Siêu phương tiện: là dạng biểu diễn phi tuyến tính của dữ liệu đa phương
tiện


Truy vấn dữ liệu đa phương tiện
Cùng sự vượt bậc của công nghệ thu giữ dữ liệu nghe nhìn và không
gian lưu trữ ngày càng gia tăng đã cho phép tạo ra các bộ sưu tập khổng
đồ các dữ liệu đa phương tiện. Tuy nhiên, khi CSDL ngày càng nhiều như
vậy thật khó khăn cho việc tìm kiếm một hình ảnh hay video nào đó. Để
giải quyết được vấn đề trên ta có 2 cách truy vấn như sau:


Phương pháp 1:
Sử dụng các thông tin nhập thủ công hay bao gồm trong thiết kế của bảng,
như các tiêu đề, các từ khóa mô tả - thường được xác định từ trước trong lược đồ
phân loại ( Classification Schemes ). Phương pháp này được biết đến với tên gọi
“ Truy xuất dựa trên thuộc tính “. ( attribute-based retrieval )


Phương pháp 2:
Sử dụng các đặc trưng được rút trích từ nội dung của đối tượng đa phương

tiện và sự nhận diện đối tượng để phân loại nội dung dữ liệu đa phương tiện.
Phương pháp này được biết đến với tên gọi: “ Truy xuất dựa trên nội dung “.
( Content-based retrieval )


Khái niệm video
Video số hóa:
ORD Video tích hợp lưu trữ, truy xuất và quản lý dữ liệu video số hóa trong 1
CSDL. Video có thể được tạo ra bởi một đầu thu video, máy quay phim, video hoạt
hình số hóa, các thiết bị quay video chuyên dụng khác, hoặc bởi các thuật toán
chương trình.
Một số thiết bị ghi video tiếp nhận một tín hiệu tương tự hay liên tục, chẳng
hạn một video được thu vào một máy quay phim hoặc video được ghi lại từ các
media từ tính và chuyển đổi thành các giá trị số với các đặc trưng điển hình của
video chẳng hạn như định dạng, kiểu mã hóa, tỉ lệ khung hình, kích thước khung
hình ( chiều rộng và chiều cao ), độ phân giải khung hình, độ dài video, kiểu nén,
số lượng màu sắc và bit rate.


Các thành phần của video:
Video số hóa bao gồm các dữ liệu video (các bít đã được số hóa) và các thuộc
tính môt tả cho video. Dữ liệu video có thể có nhiều định dạng khác nhau, các
kiểu nén, tỉ lệ khung hình, kích thước khung hình, độ phân giải khung hình, thời
gian chơi, loại nén, số lượng màu sắc và loại bít phụ thuộc cách dữ liệu video kỹ
thuật số đã được ghi lại.


- Lưu trữ đa phương tiện: media có thể được luu trữ trong các loại đối tượng
OM hoặc trực tiếp trong BLOBs hoặc BFILEs.
- Truy vấn dữ liệu đa phương tiện:khi được lưu trữ trong CSDL,dữ liệu đa

phương tiện có thể truy vấn và lấy ra bằng cách sử dụng các cột chữ hoặc số
khác nhau hoặc các thuộc tính đối tượng bảng để tìm một hàng với dữ liệu
mong muốn. Ngoài ra, dữ liệu đa phương tiện có thể được truy vấn theo các
siêu dữ liệu được trích xuất, theo các cột trong bảng khác và theo nội dung,
chẳng hạn như truy xuất nội dung hình ảnh với các chỉ mục chuyên biệt tùy
chọn.


KẾT LUẬN

Tìm kiếm văn bản:
Từ khóa.
Tìm kiếm ảnh.
Tìm kiếm dựa trên nhãn (FlickR, FaceBook).
Tìm kiếm dựa trên thông tin xung quanh (Google).
Tìm kiếm dựa trên nội dung.


- Tìm kiếm Audio:
Dựa vào siêu dữ liệu (iTunes)
Dựa vào nội dung (MuscleFish, Foote

- Tìm kiếm video:
Dựa vào từ khóa (Google/UTube)
Dựa vào các dữ liệu kết hợp cùng (ví dụ slides)
Tìm theo nội dung (TrecVid)


Các bài toán tìm kiếm cơ sở dữ liệu video



Phân tích video có cấu trúc


Phân tích video không cấu trúc


Tìm kiếm video
Tìm kiếm toàn bộ video
• Dựa trên thông tin text và hình ảnh xung quanh đại diện trong mô tả.

Ví dụ: Google/YouTube
• Search for “sunset”


BÀI LÀM CÒN NHIỀU THIẾU SÓT RẤT CẦN Ý KIẾN
ĐÓNG GÓP CỦA CÔ VÀ CÁC BẠN



×