Tải bản đầy đủ (.doc) (77 trang)

Kỹ thuật tìm kiếm video theo nội dung

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.6 MB, 77 trang )

ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN
THÔNG

LÊ HƯƠNG GIANG

KỸ THUẬT
TÌM KIẾM VIDEO THEO NỘI DUNG

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Thái Nguyên - 2018


ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN
THÔNG

LÊ HƯƠNG GIANG

KỸ THUẬT
TÌM KIẾM VIDEO THEO NỘI DUNG
Chuyên ngành: Khoa học máy tính
Mã số chuyên ngành: 8480101

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Người hướng dẫn khoa học: PGS. TS ĐẶNG VĂN ĐỨC

Thái Nguyên - 2018



LỜI CAM ĐOAN
Tôi xin cam đoan luận án này là công trình nghiên cứu của chính bản
than, luận văn này hoàn toàn được hình thành và phát triển từ quan điểm của
chính cá nhân tôi, dưới sự hướng dẫn chỉ bảo của PGS.TS Đặng Văn Đức.
Các kết quả nghiên cứu trong luận văn là trung thực và chưa được công bố
trong các công trình nào khác
Học viên

Lê Hương Giang


LỜI CẢM ƠN
Để hoàn thành luận văn “Kỹ thuật tìm kiếm video theo nội” học viên
đã nhận được sự hướng dẫn và giúp đỡ nhiệt tình của nhiều tập thể và cá
nhân.
Trước tiên,tôi xin bày tỏ lòng biết ơn chân thành đến PGS.TS Đặng
Văn Đức, Viện Công nghệ thông tin - Viện Hàn lâm Khoa học và Công
nghệ Việt Nam,người đã dìu dắt và giúp đỡ em trong suốt quá trình
làm luận văn.
Em cũng xin gửi lời cảm ơn đến các thầy cô giáo, Phòng Đào tạo
trường Đại học Công nghệ thông tin và Truyền thông, đã truyền đạt những
kiến thức và giúp đỡ em trong suốt quá trình học tập của mình.
Tôi cũng xin cảm ơn cơ quan, bạn bè đồng nghiệp, gia đình và những
người thân đã cùng chia sẻ, giúp đỡ, động viên, tạo điều kiện thuận lợi để tôi
hoàn thành tốt nhiệm vụ học tập và bản luận văn này
Hà nội, ngày .. tháng.. năm 2018
Học viên

Lê Hương Giang



MỤC LỤC
MỞ ĐẦU
8
CHƯƠNG 1: TỔNG QUAN VỀ HỆ THỐNG TÌM KIẾM VIDEO
1.1
Kiến trúc tổng quan hệ thống tìm kiếm video theo nội dung
11
1.1.1 Mô hình tổng quát tìm kiếm
11
1.1.2 Hệ thống tìm kiếm video theo nội dung
12
1.2
Mô hình dữ liệu video
12
1.2.1 Khái niệm mô hình dữ liệu video
12
1.2.2 Các yêu cầu đối với một mô hình dữ liệu video
14
1.2.3 Mô hình dữ liệu video điển hình
19
1.3
Mô hình tổng quát về CSDL video
20
1.3.1 Khái quát về CSDL đa phương tiện và CSDL video
20
1.3.2 Kiến trúc tổng thể CSDL video
21
1.3.3 Các chức năng chủ yếu của CSDL video
24

CHƯƠNG 2:MỘT SỐ KỸ THUẬT SỬ DỤNG TRONG XÂY DỰNG HỆ
THỐNG TÌM KIẾM VIDEO
2.1
Kỹ thuật tách lia video
27
2M 2
.2 ột
M 72
ột 28
2. C
.2 áK 93

2. T
39
.2 áC 4
á
2. . K
47
2 2ỹG 84
iớ 48
2. C
2. . hĐ 85
32B
ối 52
.2 iể
T 45
h
2. Ư
57
. u

8
CHƯƠ
NG P3: 6
3.
1 D
h
3.
61
23. ữ
M 16
3 Đ
ô
3.
61
4 áP 56
H 67
D
A 8


DANH MỤC HÌNH ẢNH
Hì M
nh ô
Hì C
nh ấ
Hì M
nh ô
Hì M
nh ô
Hì K

nh iế
Hì K
nh iế
Hì K
nh iế
Hì S
nh ơ
Hì C
nh h
2. ê
ặp

a
nh
.
2.
Hì P
nh h
Hì N
nh h
Hì S
nh ơ
Hì G
nh ia
Hì G
nh ia
G

i
nh

a
Hì G
nh ia

1
1
1
3
1
3
1
5
2
2
2
3
2
4
3
1
3
6
4
1
4
2
5
9
6
1

6
3
6
4
6
4
6
5


DANH MỤC CÁC THUẬT NGỮ VIẾT TẮT

Từ viết tắt
CSDL

Tiếng anh

Nghĩa tiếng việt
Cơ sở dữ liệu


CBVR

Content- Based Video
Retrieval

Tìm kiếm video theo nội dung

Multimedia Database


Hệ thống quản lý cơ sở dữ liệu đa

Management System

phương tiện

RAM

Random access memory

Bộ nhớ truy cập ngẫu nhiên

HWS

Half window size

Một nửa kích thước cửa sổ

DMZ

Demilitarised Zone

Độ sâu của khung hình

MDBMS

LB,UB

PFC


Lower Bound
Upper Bound
Pre- Frame Count

Cận dưới,Cận trên

Đếm các khung hình phía trước


8

MỞ ĐẦU
1. Đặt vấn đề
1.1. Sự cần thiết lựa chọn đề tài
Với sự phát triển của xã hội, ngành công nghệ thông tin và truyền thông
cũng phát triển nhanh chóng. Các nghiên cứu về công nghệ liên quan đến
video đã đạt được những thành tựu nhất định. Trong đó một số lượng lớn các
dữ liệu video được ứng dụng nhiều trong công nghệ giải trí (phim ảnh, clip
âm nhạc..), trong đào tạo từ xa (qua những video bài giảng)... Nhiều phòng
chức năng có nhiệm vụ lưu trữ và thu thập các video (tư liệu lịch sử, tư liệu
khai quật khảo cổ học của địa phương hay quốc gia...). Chính sự phát triển
vượt bậc của công nghệ thu giữ (capture) dữ liệu nghe nhìn và không gia lưu
trữ ngày càng gia tăng đã cho phép tạo ra các bộ sưu tập khổng lồ các dữ liệu
đa phương tiện. Tuy nhiên, khi CSDL ngày càng phình to ra thì những khó
khăn trong việc tìm kiếm một video mong muốn lại cũng tăng lên. Như
trong nhiều ứng dụng, đòi hỏi không chỉ nhận biết video nào chứa thông tin
cần tìm, mà còn cần nhận biết phần nào của video chứa thông tin cần tìm.
Duyệt video để tìm kiếm một vài thông tin cụ thể là rất tốn kém thời gian, do
vậy cần thiết phải có các phương pháp tự động định vị các shot (lia) chứa
thông tin cần tìm [3]. Để giải quyết vấn đề này, đề tài luận văn nghiên cứu kỹ

thuật tìm kiếm video theo nội dung, tập trung nghiên cứu kĩ thuật tách lia
video hay phân đoạn video thành các shot, định danh các khung frame được
mỗi lia và chỉ số hóa và tìm kiếm theo đặc trưng của các khung frame
1.2. Mục tiêu nghiên cứu của đề tài
Nghiên cứu một số kỹ thuật sử dụng trong xây dựng hệ thống tìm
66kiếm video. Sau đó là xây dựng chương trình thử nghiệm.
2. Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu là dữ liệu video trong các CSDL video


9

- Tìm hiểu về khái niệm video, mô hình tổng quát hệ thống tìm kiếm
video theo nội dung
- Nghiên cứu mô hình dữ liệu video và chỉ mục trong CSDL video
- Một số kỹ thuật sử dụng trong xây dựng hệ thống tìm kiếm video giới
hạn trong. Các kỹ thuật phân đoạn cơ sở, tách biên shot thay đổi dần dần, sai
sót khi tách shot, các kỹ thuật tách shot khác và phân đoạn video nén
- Kỹ thuật tìm lia đại diện cho đoạn video và kỹ thuật phản hồi liên
quan: Video được chia thành các lia, định danh các khung frame được mỗi lia,
chỉ số hóa và tìm kiếm theo đặc trưng của các khung frame
- Cơ sở dữ liệu video thử nghiệm: Các video chuyên ngành nghiệp vụ
tại thư viện nghiệp vụ - Học viện cảnh sát nhân dân
3. Hướng nghiên cứu của đề tài
- Tìm kiếm các tài liệu, học liệu liên quan trên Internet, thư viện nhà
trường để nghiên cứu các vấn đề liên quan nhằm giải quyết đề tài.
- Liên hệ chặt chẽ với thầy hướng dẫn để đề tài đi đúng hướng.
- Nghiên cứu một số kỹ thuật sử dụng trong xây dựng hệ thống tìm
kiếm video.
- Nghiên cứu giải pháp công nghệ cài đặt chương trình thử nghiệm.

4. Cấu trúc của luận văn
Luận văn gồm: Phần mở đầu, ba chương chính, kết luận và tài liệu
tham khảo cụ thể:
Phần mở đầu:Trình bày lý do chọn đề tài và bố cục của luận văn
Chương 1: Tổng quan về hệ thống tìm kiếm Video
Chương 2. Một số kỹ thuật sử dụng trong xây dựng hệ thống tìm kiếm
video
Chương 3. Thử nghiệm


10

Kết luận và hướng phát triển của luận văn
5. Phương pháp nghiên cứu
- Phương pháp nghiên cứu lý thuyết: Thu thập, tổng hợp các tài liệu đã
công bố, so sánh để tìm ra vấn đề phù hợp để nghiên cứu học hỏi
- Liên hệ thường xuyên với giáo viên hướng dẫn và các chuyên gia để
thực hiện luận văn cho đúng hướng, đúng tiến độ.
- Phương pháp thực nghiệm để minh chứng hiệu quả của giải pháp lựa
chọn thông qua các nhận xét, phân tích đánh giá kết quả thử nghiệm.
6. Ý nghĩa khoa học của đề tài
Hiện nay, việc nghiên cứu và triển khai các cơ sở dữ liệu (CSDL) video
trên thế giới và trong nước vẫn đang là một vấn đề quan trọng. Video, khi
được lưu trữ dưới dạng các đoạn video, các băng video, là quá thô không
thuận tiện cho các yêu cầu duyệt, truy vấn và thu hồi, cần tổ chức các dữ liệu
video. Một nhiệm vụ rất khó khăn và cấp thiết là tạo ra các phương pháp và
công cụ cho phép tự động sưu tập, lưu trữ và thu hồi thông tin video, trên cơ
sở nội dung của nó. Việc xây dựng CSDL video cần các kỹ thuật xử lý dữ liệu
phức tạp hơn nhiều so với các dữ liệu đa phương tiện khác như văn bản, âm
thanh hay ảnh tĩnh. Trong đó, chỉ số hóa và phân đoạn dữ liệu video luôn

được xem là vấn đề rất quan trọng. Khi phân chia dữ liệu video thành các đơn
vị cơ sở có nghĩa nhỏ hơn, cho phép trả lời nhanh các câu hỏi tìm kiếm trên
CSDL. Các vấn đề được trình bày trong luận văn hệ thống hoá lý thuyết
CSDL video, cung cấp các thuật toán và công cụ cho việc chỉ mục và truy tìm
video, hình thành thước đo và kỹ thuật đo độ chênh lệch sao cho phù hợp để
có thể áp dụng chúng trong tự động hóa phân đoạn video và chuẩn bị dữ liệu
trong xây dựng các CSDL video số trong môi trường đa phương tiện trong
thực tế.


11

CHƯƠNG 1. TỔNG QUAN VỀ HỆ THỐNG TÌM KIẾM VIDEO
Trong chương này sẽ trình bày hệ thống tìm kiếm video theo nội dung . Nêu
khái niệm và ý nghĩa của mô hình dữ liệu video
1.1 Kiến trúc tổng quan hệ thống tìm kiếm video theo nội dung
1.1.1 Mô hình tổng quát tìm kiếm
On-line

Hình 1.1 Mô hình tìm kiếm
Bên phải hình 1.1 : Off- Line
Băng video sẽ được tiền xử lý thành các Lia . Các Lia đại diện cho Video
tách thành các Frame . Đối với Lia tĩnh ,có thể chọn luôn được Frame đại
diện. Đối với Lia động thì ta có nhiều phương pháp tìm Frame đại diện như
sử dụng phương tính trung bình biểu đồ màu của các đoạn, frame có biểu đồ
màu gần nhất là Frame đại diện.Phần tìm frame đại diện sẽ được trình bày rõ


12


ở chương 2. Sau khi có Frame đại diện cho mỗi video, sẽ có một cơ sở dữ
liệu frame đại điện
Bên trái hình 1.1 Online
Đầu vào là ảnh (có thể một hoặc nhiều ảnh),tiền xử lý chọn ra một ảnh
tương tự như frame đại diện cho Video. Khi đã có ảnh đầu vào, ta sẽ đối sánh
đặc trưng của ảnh đầu vào với frame đại diện nếu tương đồng thì ta sẽ cho ra
video cần tìm. Đánh giá mức độ phù hợp và phản hồi kết quả
1.1.2 Hệ thống tìm kiếm video theo nội dung
Video là media giàu thông tin. Một video đầy đủ bao gồm phụ đề
(subtitle) bằng text, rãnh tiếng (tiếng nói và không phải tiếng nói), các ảnh
được ghi và trình chiếu theo tốc độ cố định. Vậy video được xem như tổ hợp
text, audio và các ảnh có chiều thời gian ảnh động. Thêm nữa, video còn kết
hợp với metadata như tên video, tác giả/ nhà sản xuất. [3]
Các dữ liệu video được ứng dụng nhiều trong công nghệ giải trí (phim
ảnh, clip âm nhạc..), trong đào tạo từ xa (qua những video bài giảng)... Nhiều
phòng chức năng có nhiệm vụ lưu trữ và thu thập các video (tư liệu lịch sử, tư
liệu khai quật khảo cổ học của địa phương hay quốc gia...). Chính vì sự giàu
thông tin và ứng dụng nhiều trong các lĩnh vực như vậy mà luận văn này của
tác giả đề cập đến phương pháp tiệm cận tổng quát đến chỉ mục và truy tìm
video trên cơ sở shot (lia). Việc tìm kiếm này là chia trình tự video thành
nhóm các frame tương tự, sau đó chỉ mục và truy tìm trên cơ sở các frame đại
diện của các nhóm này (gọi là shot).
1.2 Mô hình dữ liệu video
1.2.1 Khái niệm mô hình dữ liệu video
Video giống như một tập các hình ảnh ở các thời điểm được sắp xếp,
biểu diễn theo một chuỗi thời gian nhất định. Trên thực thế chính là chuyển
động của các điểm ảnh từ trạng thái này sang trạng thái khác, hay là sự
chuyển động của mỗi đối tượng riêng lẻ được phân tích từ dữ liệu video.



13

Công cụ tìm kiếm video cho phép người dùng thuận tiện trong quá trình tìm
kiếm phục vụ nhiều mục đích khác nhau như giải trí, giáo dục và truyền
thông. Video sẽ được tổ chức trong một cấu trúc phân cấp của những cảnh,
ảnh chụp và khung như hình 1.1

Hình 1.2 Cấu trúc phân cấp của 1 video clip
Mô hình dữ liệu video tổng quát:
Episode

Hình 1.3 Mô hình dữ liệu video tổng quát
Nhìn trên mô hình tổng quát : băng video bao gồm dãy các ảnh chụp
theo tốc độ nhất định. Thông thường video được hình thành từ nhiều đơn vị
logic hay đoạn. Chúng ta gọi các đoạn này là video shot. Một shot là trình tự
các frame liên tục, ngắn có một hay nhiều các đặc trưng sau:
- Mô tả cùng một cảnh (scene)
- Báo hiệu một thao tác máy quay (bấm máy quay)


14

- Chứa sự kiện mô tả hay một hành động của một đối tượng
- Được người sử dụng lựa chọn như thực thể để chỉ mục
Trong mô hình còn th ể hiện cut detection: là quá độ từ shot này
sang shot khác
- Hard cut
- Quá độ từ từ (gradual) [1]
Một số mô hình dữ liệu video:
- Mô hình quan hệ : có thể dùng để biểu diễn những mối quan hệ của

dữ liệu
- Mô hình đối tượng: có thể dùng để biểu diễn những cấu trúc phức tạp
- Mô hình đối tượng - quan hệ được dùng để biểu diễn cơ sở dữ liệu


15

video
- Mô hình dữ liệu siêu ngữ nghĩa là thích hợp nhất vì nó có thể biểu
diễn được cả đối tượng, quan hệ và luật ràng buộc giữa chúng
1.2.2 Các yêu cầu đối với một mô hình dữ liệu video
Một mô hình dữ liệu video đáp ứng các yêu cầu nêu trên, chúng ta cần
phải có được một số các yêu cầu cụ thể cho nó như sau:
- Có khả năng lưu trữ lớn
- Đầy đủ các khả năng của một CSDL truyền thông
- Có khả năng khai thác dữ liệu thuận tiện
- Hỗ trợ truy vấn video
- Có khả năng tích hợp, tổng hợp và thể hiện
- Có giao diện video và tương tác
Để cho hệ thống hoạt động tốt chúng ta cần phải giải quyết các vấn đề
sau:
- Hệ thống CSDL video sẽ được xây dựng như thế nào để có thể bao
gồm các lĩnh vực ứng dụng khác


15

- Xây dựng phần hạt nhân cho việc phân rã, lưu trữ và quản lý thông
tin ở mức độ nào? Các công nghệ, cấu trúc nền tảng được sắp xếp và sử dụng
như thế nào?

- Xác định được hạ tầng thể hiện nào mà một hệ thống video phải có
để đạt được các yêu cầu và cách thức thể hiện khác nhau. Làm cách nào để hỗ
trợ việc đồng bộ hóa việc thể hiện các dữ liệu tạm thời cũng như các dữ liệu
bộ phận của các dữ liệu video khác nhau
- Các kiến thức về tổng hợp dữ liệu đối với CSDL video, làm thế nào
để có thể phát triển được một ngôn ngữ truy vấn đáng tin cậy và có hiệu quả
để hỗ trợ cho vô số phương thức truy nhập và các kiểu đối tượng khác nhau.
Làm thế nào để ngôn ngữ truy vấn hỗ trợ được các đặc tính và hình thái khác
nhau của dư liệu video.
- Giả sử các kiểu media khác nhau có các yêu cầu cập nhật và sửa đổi
thông tin khác nhau thì hệ thống sẽ cập nhật các thành phần này như thế nào.
1.2.2.1 Khả năng lưu trữ của hệ thống video

Hình 1.4: Mô hình khả năng lưu trữ của các hệ thống Video
Các yêu cầu về khả năng lưu trữ của các hệ thống video có thể được
đặc trưng bởi khả năng lưu trữ lớn và cách thức tổ chức theo thứ bậc (dạng


16

kim tháp) của hệ thống lưu trữ. Việc lưu trữ theo thứ bậc đặt các đối tượng dữ
liệu video trong một hệ thống phân bậc bao gồm các thiết bị khác nhau, có thể
là trực tuyến (online), hoặc không trực tuyến (offline). Một cách tổng quát,
mức cao nhất của hệ thống sẽ cho ta hiệu suất cao nhất, khả năng lưu trữ nhỏ
nhất, chi phí cao nhất và sự cố định ít nhất. Các lớp cao trong hệ thống phân
cấp này có thể sử dụng để lưu trữ các đối tượng tóm tắt nhỏ hơn của một dữ
liệu video hoàn chỉnh với mục đích cung cấp khả năng duyệt và xem trước
nhanh đối với nội dung của dữ liệu. Chi phí và hiệu suất (tính về mặt thời
gian) sẽ giảm dần nếu ta đi xuống các lớp phí dưới của hệ thống phân cấp,
cùng với điều này là sự tăng của khả năng lưu trữ và tính cố định. Thông

thường trong hầu hết các hệ thống lưu trữ video, mức cao nhất của lưu trữ
thường là RAM, tiếp đó là đĩa từ, các thiết bị này cung cấp các dịch vụ trực
tuyến (online services). Các thiết bị lưu trữ quang học cung cấp mức lưu trữ
tiếp theo, khái niệm trực tuyến ở đây có thể hiểu gần như, tiêu biểu cho các
thiết bị lưu trữ kiểu này là các jukebox (CD-DVD jukebox). Mức thấp nhất
trong hệ thống lưu trữ phân cấp có thể là các thiết bị như băng từ, đĩa quang
hoặc các thiết bị tương tự, các thiết bị này cung cấp khả năng lưu trữ offline
và có thể không cần kết nối trực tiếp với máy tính. Chúng cung cấp khả năng
lưu trữ và tính cố định cao hơn nhưng cung có hiệu suất kém nhất về thời gian
truy nhập. Vì những lý do trên, một MDBMS phải quản lý và tổ chức việc lưu
trữ đối với bất kỳ mức nào của hệ thống phân cấp, nó phải có cơ chế tự động
để chuyển các đối tượng dữ liệu video từ một mức này của hệ thống lưu trữ
phân cấp sang mức khác, việc chuyển cấp này phải dựa trên tần suất sử dụng
của dữ liệu video. Trong trường hợp dữ liệu video được lưu trữ ở các thiết bị
offline thì MDBMS cũng phải có được các thông tin trợ giúp cho việc dễ
dàng xác định các thiết bị cụ thể có chứa các thông tin cần truy xuất.


17

1.2.2.2 Truy vấn và khai thác dữ liệu
Truy vấn đối với dữ liệu video bao gồm các kiểu dữ liệu khác nhau, các
từ khoá, thuộc tính, nội dung vv… Do người dùng có thể có các cách suy nghĩ
khác nhau về dữ liệu video vì vậy kết quả thu được từ việc truy vấn dữ liệu
video có thể không hoàn toàn chính xác và có thể chỉ là các kết quả tương tự
hoặc là một phần của kết quả hơn là các kết quả chuẩn xác. Do việc có thể kết
quả là không chính xác nên chúng ta phải có khả năng phân hạng các kết quả
thu được sao cho chúng gần với yêu cầu truy vấn nhất, tương tự như vậy
chúng ta cũng phải có các phương thức để loại bỏ bớt những kết quả không
thoả mãn yêu cầu truy vấn. Việc làm này sẽ giảm thiểu các sai sót về mặt tính

toán trong quá trình tìm kiếm.
1.2.2.3 Giao diện và tương tác
Sự khác nhau về bản chất của các dữ liệu video đòi hỏi phải có các giao
diện khác nhau để tương tác với dữ liệu. Thông thường, mỗi loại dữ liệu có
các phương thức truy nhập và thể hiện riêng của mình, ví dụ như dữ liệu
video và âm thanh sẽ đòi hỏi các giao diện người dùng khác nhau để thể hiện
và truy vấn. Đối với một vài ứng dụng Video, đặc biệt là sự có mặt của các
loại dữ liệu có tính liên tục người dùng thường đòi hỏi phải có các khả năng
tương tác với dữ liệu (chẳng hạn như đối với dữ liệu VCR thì người dùng
thường mong muốn có chức năng như tua lên (fast forward) hoặc tua ngược
lại (reverse). Khi mà một hệ thống Video cung cấp các dịch vụ như vậy thì nó
phải được liên kết vào CSDL đặc biệt là việc khai thác các đối tượng, tổng
hợp và đồng bộ chúng.
1.2.2.4 Tích hợp các phương tiện, tổng hợp và thể hiện
Giả sử tính đa dạng của các kiểu dữ liệu đã được hỗ trợ, một MDBMS
cũng phải cung cấp khả năng để tích hợp các loại dữ liệu này để tạo nên các
kiểu dữ liệu video mới và thể hiện các dữ liệu này khi có yêu cầu trong một


18

khung thời gian yêu cầu. Độ phức tạp của việc tích hợp, tổng hợp và thể hiện
bị tăng thêm bởi các đặc tính cơ bản của dữ liệu video như tính liên tục (tạm
thời) của dữ liệu video đặc biệt là với các kiểu dữ liệu như video, hoạt hình
hoặc âm thanh. Hơn nữa, một vài ứng dụng cụ thể như các hệ thống thông tin
địa lý có thể đòi hỏi MDBMS cung cấp các thông tin bộ phận (về một vùng,
miền nào đó). Tất cả các yếu tố này kết hợp với nhau làm cho việc tổng hợp
và thể hiện video trở thành một quy trình phức tạp mà MDBMS phải cung cấp
để đáp ứng các yêu cầu mà người dùng đòi hỏi. Các vấn đề về tích hợp có thể
được cải thiện trong một số trường hợp, đặc biệt là khi các hệ thống CSDL

video được xây dựng nhằm phục vụ cho các cộng đồng người dùng xác định
trước. Trong các trường hợp đặc biệt này, MDBMS có thể hỗ trợ một số tính
năng mà các ứng dụng khác không cần đến [8].
1.2.2.5 Hiệu suất
Hiệu suất là một vấn đề quan trọng cần được xem xét đối với một
MDBMS. Các hệ thống CSDL video tạo ra hiệu suất dựa trên sự tối ưu hoá
việc truy nhập tới các media, lưu trữ, chỉ số hoá, khai thác và truy vấn. Sự
có tham gia của nhiều kiểu dữ liệu khác nhau trong CSDL video có thể đòi
hỏi một số phương thức đặc biệt để tối ưu hoá việc truy cập, lưu trữ, chỉ số
hoá và khai thác. Các yêu cầu này bao gồm hiệu quả, tính ổn định, đảm bảo
và đồng bộ việc trao đổi dữ liệu, chất lượng của dịch vụ (QoS).
1.2.3 Mô hình dữ liệu video điển hình
Mô hình dữ liệu là đơn vị trung tâm của một hệ thống CSDL video.
Một mô hình dữ liệu cần phải tách rời người dùng ra khỏi chi tiết của việc
quản lý các thiết bị lưu trữ và cấu trúc lưu trữ. Điều này đòi hỏi phải phát
triển các mô hình dữ liệu tương ứng để tổ chức các kiểu dữ liệu khác nhau
tường gặp trong các hệ thống CSDL video. 20 Các mô hình dữ liệu video
(cũng giống như các mô hình dữ liệu truyền thống khác) nắm bắt các đặc tính


19

cố định cũng như động của nội dung CSDL và vì vậy nó cung cấp các khuôn
mẫu cơ bản cho việc phát triển các công cụ cần thiết để sử dụng dữ liệu video.
Các thuộc tính cố định có thể bao gồm các đối tượng tạo nên dữ liệu video,
mối liên hệ giữa các đối tượng, thuộc tính của các đối tượng… Các đặc tính
động bao gồm sự tương tác giữa các đối tượng, sự hoạt động trên đối tượng,
các tương tác của người dùng. Tuy nhiên, do các tính chất đặc biệt của mình,
dữ liệu video đòi hỏi phải có các quan tâm mới khi chọn lựa mô hình dữ liệu.
Ví dụ, một vài kiểu dữ liệu video (chẳng hạn video) hoặc một nhóm các kiểu

(video và hình ảnh) có thể đòi hỏi các mô hình dữ liệu đăc biệt để cải thiện
hiệu quả và tính mềm dẻo. Hơn nữa, do tầm quan trọng của việc tương tác
trong các hệ thống video nên việc nó được hỗ trợ bỏi các mô hình dữ liệu trở
nên quan trọng. Rât nhiều các mô hình dữ liệu khác nhau như là mạng lưới,
liên hệ, ngữ nghĩa, và hướng đối tượng đang tồn tại và một vài số trong chúng
đã được xem xét để thiết lập CSDL video. Có hai cách tiếp cận cơ bản trong
việc mô hình hoá dữ liệu video là:
• Phương pháp thứ nhất: Xây dựng một mô hình dữ liệu video trên nền
tảng của mô hình dữ liệu của một CSDL truyền thống (thường là CSDL quan
hệ hoặc CSDL hướng đối tượng) bằng cách sử dụng các giao diện tương ứng
đối với dữ liệu video. Các vấn đề nẩy sinh với cách tiếp cận này là các cấu
trúc bên dưới (của CSDL truyền thống) không được thiết kế dành cho dữ liệu
video, hơn nữa sự khác biệt cơ bản các yêu cầu của một CSDL truyền thống
đối với CSDL video khiến cho giao diện trở thành nơi nghẽn cổ chai trong
toàn bộ hệ thống. Các vấn đề này dẫn tới cách tiếp cận thứ hai .
• Phương pháp thứ hai: phát triển các mô hình dữ liệu thực thụ dành
cho dữ liệu video từ đầu chứ không xây dựng trên cơ sở của các CSDL truyền
thống, tuy nhiên mọi người đều nhất trí rằng các nỗ lực như vậy đều phải dựa
trên kỹ thuật hướng đối tượng [7].


20

1.3 Mô hình tổng quát về CSDL video
1.3.1 Khái quát về CSDL đa phương tiện và CSDL video
Dữ liệu video được chia thành hai lớp là các dữ liệu liên tục và các dữ
liệu không liên tục. Các dữ liệu liên tục bao gồm các dữ liệu âm thanh, video
thay đổi theo thời gian. Các dữ liệu không liên tục là các dữ liệu không phục
thuộc vào thời gian, các loại dữ liệu đặc trưng cho dạng này là các dữ liệu văn
bản (có hoặc không có định dạng), hình ảnh tĩnh và các đối tượng đồ họa. Các

kiểu dữ liệu thông thường của một CSDL Video bao gồm:


Dữ liệu văn bản (có hoặc không có định dạng).



Đồ họa: là các bản vẽ, minh họa được mã hóa như các tệp

postscript.


Hình ảnh: là các hình ảnh được mã hóa sử dụng các dạng thức

chuẩn như là JPEG hoặc MPEG.
• Các hoạt hình.


Âm thanh.



Video.

Các đặc tính chung của dữ liệu video bao gồm:
• Thiếu cấu trúc: Các dữ liệu video có khuynh hướng phi cấu trúc vì
vậy các tác nghiệp quản trị dữ liệu chuẩn như chỉ số hoá, tìm kiếm nội dung,
truy vấn dữ liệu thường là không áp dụng được.
• Tính tạm thời: Một vài kiểu dữ liệu video như là video, âm thanh và
hoạt hình đều phụ thuộc vào yếu tố thời gian liên quan mật thiết đến việc lưu

trữ, thao tác và mô tả chúng.
• Có dung lượng lớn: Các dữ liệu video và âm thanh thường đòi hỏi


21

các thiết bị lưu trữ lớn.
• Các ứng dụng hỗ trợ: Các dữ liệu phi chuần có thể đòi hỏi các quy
trình xử lý phức tạp như việc sử dụng các thuật toán nén dữ liệu đối với các
ứng dụng CSDL Video.
Cơ sở dữ liệu đa phương tiện (MMDB) là một tập hợp các dữ liệu đa
phương tiện có liên quan.[1] Các dữ liệu đa phương tiện bao gồm một hoặc
nhiều kiểu dữ

liệu phương tiện truyền thông chính như văn bản, hình ảnh,

các đối tượng đồ họa (bao gồm bản vẽ, phác thảo và hình minh họa) các chuỗi
hình ảnh động, âm thanh và video.
Một hệ thống quản lý cơ sở dữ liệu đa phương tiện (MMDBMS) là một
khung quản lý các loại dữ liệu khác nhau có khả năng đại diện trong một sự
đa dạng rộng của các định dạng trên một mảng rộng các nguồn phương tiện
truyền thông. Nó cung cấp hỗ trợ cho các loại dữ liệu đa phương tiện, và tạo
thuận lợi cho việc tạo ra, lưu trữ, truy cập, truy vấn và kiểm soát của một cơ
sở dữ liệu đa phương tiện.
1.3.2 Kiến trúc tổng thể CSDL video
Ở đây chúng ta xem xét tới ba kiến trúc áp dụng cho việc tổ chức nội
dung của một hệ thống CSDL Video
Kiến trúc dựa trên nguyên lý tự trị
Nguyên lý này đề cập tới việc chúng ta nhóm tất cả các dữ liệu ảnh, dữ
liệu video và tất cả các dữ liệu văn bản và chỉ số hóa chúng theo nguyên tắc

tối đa hóa hiệu suất của tất cả các loại truy nhập đối với các loại dữ liệu mà
chúng ta dự định. Nguyên lý này đảm bảo rằng với mỗi loại dữ liệu (ảnh,
video, văn bản) chúng đều được tổ chức với một cách thức đặc trưng phù hợp
với mỗi loại dữ liệu này.


22


23

USER
Trả Lời
Cơ chế hiển thị

Truy vấn
Cơ chế truy vấn Mutimedia

Tệp chỉ số dữ
liệu ảnh

Tệp chỉ số dữ li
Audio

Tệp chỉ số dữ liệ
Video

Hình 1.5 Kiến trúc dựa trên nguyên lý tự trị
Nguyên lý đồng nhất
Một nguyên lý kiến trúc khác mà chúng ta có thể lựa chọn là nguyên lý

đồng nhất, nguyên lý này giúp chúng ta tìm được một cấu trúc tóm tắt chung
cho tất cả các loại dữ liệu. Cấu trúc này có thể được dùng trong việc chỉ số hóa
tất cả các loại dữ liệu qua đó tạo ra một “chỉ số thống nhất” mà chúng ta có thể
dùng để truy cập tới các đối tượng khác nhau. Hay nói một cách khác là
chúng ta có thể trình bầy

tất cả các đối tượng khác nhau( ảnh, video, âm

thanh, văn bản) trong một cấu trúc dữ liệu duy nhất và qua đó phát triển các
thuật toán để truy vấn cấu trúc dữ liệu này.


×