Tải bản đầy đủ (.pdf) (71 trang)

Kỹ thuật tìm kiếm video theo nội dung

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.12 MB, 71 trang )

ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THƠNG

LÊ HƯƠNG GIANG

KỸ THUẬT
TÌM KIẾM VIDEO THEO NỘI DUNG

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Thái Nguyên - 2018


ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THƠNG

LÊ HƯƠNG GIANG

KỸ THUẬT
TÌM KIẾM VIDEO THEO NỘI DUNG
Chuyên ngành: Khoa học máy tính
Mã số chuyên ngành: 8480101

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Người hướng dẫn khoa học: PGS. TS ĐẶNG VĂN ĐỨC

Thái Nguyên - 2018


LỜI CAM ĐOAN
Tôi xin cam đoan luận án này là cơng trình nghiên cứu của chính bản


than, luận văn này hồn tồn được hình thành và phát triển từ quan điểm của
chính cá nhân tơi, dưới sự hướng dẫn chỉ bảo của PGS.TS Đặng Văn Đức.
Các kết quả nghiên cứu trong luận văn là trung thực và chưa được công bố
trong các cơng trình nào khác
Học viên

Lê Hương Giang


LỜI CẢM ƠN
Để hồn thành luận văn “Kỹ thuật tìm kiếm video theo nội” học viên
đã nhận được sự hướng dẫn và giúp đỡ nhiệt tình của nhiều tập thể và cá
nhân.
Trước tiên,tơi xin bày tỏ lịng biết ơn chân thành đến PGS.TS Đặng
Văn Đức, Viện Công nghệ thông tin - Viện Hàn lâm Khoa học và Công
nghệ Việt Nam,người đã dìu dắt và giúp đỡ em trong suốt quá trình
làm luận văn.
Em cũng xin gửi lời cảm ơn đến các thầy cơ giáo, Phịng Đào tạo
trường Đại học Cơng nghệ thông tin và Truyền thông, đã truyền đạt những
kiến thức và giúp đỡ em trong suốt quá trình học tập của mình.
Tơi cũng xin cảm ơn cơ quan, bạn bè đồng nghiệp, gia đình và những
người thân đã cùng chia sẻ, giúp đỡ, động viên, tạo điều kiện thuận lợi để tơi
hồn thành tốt nhiệm vụ học tập và bản luận văn này
Hà nội, ngày .. tháng.. năm 2018
Học viên

Lê Hương Giang


MỤC LỤC

MỞ ĐẦU
8
CHƯƠNG 1: TỔNG QUAN VỀ HỆ THỐNG TÌM KIẾM VIDEO
1.1
Kiến trúc tổng quan hệ thống tìm kiếm video theo nội dung
11
1.1.1 Mơ hình tổng qt tìm kiếm
11
1.1.2 Hệ thống tìm kiếm video theo nội dung
12
1.2
Mơ hình dữ liệu video
12
1.2.1 Khái niệm mơ hình dữ liệu video
12
1.2.2 Các u cầu đối với một mơ hình dữ liệu video
14
1.2.3 Mơ hình dữ liệu video điển hình
19
1.3
Mơ hình tổng qt về CSDL video
20
1.3.1 Khái quát về CSDL đa phương tiện và CSDL video
20
1.3.2 Kiến trúc tổng thể CSDL video
21
1.3.3 Các chức năng chủ yếu của CSDL video
24
CHƯƠNG 2:MỘT SỐ KỸ THUẬT SỬ DỤNG TRONG XÂY DỰNG HỆ
THỐNG TÌM KIẾM VIDEO

2.1
Kỹ thuật tách lia video
27
2.1.1 Một số khái niệm
27
2.1.2 Một số hình thức chuyển cảnh
28
2.1.3 Các hướng tiếp cận trong phân đoạn video
29
2.1.4 Kỹ thuật tách lia đối với các băng video có sự biến đổi đột ngột
39
2.1.5 Tách lia biến đổi dần dần
34
2.1.6 Các kỹ thuật khác
47
2.2
Kỹ thuật tìm Frame đại diện cho lia video
48
2.2.1 Giới thiệu
48
2.2.2 Chọn Frame đại diện
48
2.3
Đối sách tìm kiếm frame đại diện
52
2.3.1 Biểu đồ (Histogram) đa mức xám
54
2.3.2 Thuật toán cơ sở
57
2.3.4 Ưu điểm và nhược điểm của biểu đồ màu

58
CHƯƠNG 3: CHƯƠNG TRÌNH THỬ NGHIỆM
3.1
Phát biểu bài tốn
61
3.2
Dữ liệu thực nghiệm
61
3.3
Mơ tả hệ thống, mơi trường và công cụ thựcnghiệm
61
3.4
Đánh giá kết quả thử nghiệm
65
67
PHẦN KẾT LUẬN
68
DANH MỤC TÀI LIỆU THAM KHẢO


DANH MỤC HÌNH ẢNH
Hình 1.1

Mơ hình tìm kiếm

11

Hình 1.2

Cấu trúc phân cấp của 1 video clip


13

Hình 1.3

Mơ hình dữ liệu video tổng qt

13

Hình 1.4

Mơ hình khả năng lưu trữ của các hệ thống Video

15

Hình 1.5

Kiến trúc dựa trên nguyên lý tự trị

22

Hình 1.6

Kiến trúc dựa trên nguyên lý đồng nhất

23

Hình 1.7

Kiến trúc dựa trên nguyên lý lai ghép


24

Hình 2.1

Sơ đồ ứng dụng kỹ thuật trừ ảnh vào phân đoạn video

31

Hình 2.2

Chênh lệch biểu đồ

36

Hình 2.4

So sánh cặp a. chênh lệch biểu đồ liên tiếp
b. chênh lệch biểu đồ tích lũy

41

Hình 2.5

Phát hiện chuyển cảnh dần dần bằng kỹ thuật so sánh cặp 42

Hình 2.6

Những ảnh khác nhau nhưng có biểu đồ màu giống nhau


59

Hình 3.1

Sơ đồ hệ thống tìm kiếm

61

Hình 3.2

Giao diện chương trình chính

63

Hình 3.3

Giao diện chọn file

64

Hình 3.4

Giao diện tách lia video dựa trên kỹ thuật phát hiện
chuyển cảnh

64

Hình 3.5

Giao diện kết quả


65


DANH MỤC CÁC THUẬT NGỮ VIẾT TẮT

Từ viết tắt

Tiếng anh

Cơ sở dữ liệu

CSDL

CBVR

Nghĩa tiếng việt

Content- Based Video
Retrieval

Tìm kiếm video theo nội dung

Multimedia Database

Hệ thống quản lý cơ sở dữ liệu đa

Management System

phương tiện


RAM

Random access memory

Bộ nhớ truy cập ngẫu nhiên

HWS

Half window size

Một nửa kích thước cửa sổ

DMZ

Demilitarised Zone

Độ sâu của khung hình

MDBMS

Lower Bound
LB,UB

Cận dưới,Cận trên

Upper Bound
PFC

Pre- Frame Count


Đếm các khung hình phía trước


8
MỞ ĐẦU
1. Đặt vấn đề
1.1. Sự cần thiết lựa chọn đề tài
Với sự phát triển của xã hội, ngành công nghệ thơng tin và truyền thơng
cũng phát triển nhanh chóng. Các nghiên cứu về công nghệ liên quan đến
video đã đạt được những thành tựu nhất định. Trong đó một số lượng lớn các
dữ liệu video được ứng dụng nhiều trong cơng nghệ giải trí (phim ảnh, clip
âm nhạc..), trong đào tạo từ xa (qua những video bài giảng)... Nhiều phịng
chức năng có nhiệm vụ lưu trữ và thu thập các video (tư liệu lịch sử, tư liệu
khai quật khảo cổ học của địa phương hay quốc gia...). Chính sự phát triển
vượt bậc của công nghệ thu giữ (capture) dữ liệu nghe nhìn và khơng gia lưu
trữ ngày càng gia tăng đã cho phép tạo ra các bộ sưu tập khổng lồ các dữ liệu
đa phương tiện. Tuy nhiên, khi CSDL ngày càng phình to ra thì những khó
khăn trong việc tìm kiếm một video mong muốn lại cũng tăng lên. Như
trong nhiều ứng dụng, địi hỏi khơng chỉ nhận biết video nào chứa thơng tin
cần tìm, mà cịn cần nhận biết phần nào của video chứa thông tin cần tìm.
Duyệt video để tìm kiếm một vài thơng tin cụ thể là rất tốn kém thời gian, do
vậy cần thiết phải có các phương pháp tự động định vị các shot (lia) chứa
thơng tin cần tìm [3]. Để giải quyết vấn đề này, đề tài luận văn nghiên cứu kỹ
thuật tìm kiếm video theo nội dung, tập trung nghiên cứu kĩ thuật tách lia
video hay phân đoạn video thành các shot, định danh các khung frame được
mỗi lia và chỉ số hóa và tìm kiếm theo đặc trưng của các khung frame
1.2. Mục tiêu nghiên cứu của đề tài
Nghiên cứu một số kỹ thuật sử dụng trong xây dựng hệ thống tìm
66kiếm video. Sau đó là xây dựng chương trình thử nghiệm.

2. Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu là dữ liệu video trong các CSDL video


9
- Tìm hiểu về khái niệm video, mơ hình tổng quát hệ thống tìm kiếm
video theo nội dung
- Nghiên cứu mơ hình dữ liệu video và chỉ mục trong CSDL video
- Một số kỹ thuật sử dụng trong xây dựng hệ thống tìm kiếm video giới
hạn trong. Các kỹ thuật phân đoạn cơ sở, tách biên shot thay đổi dần dần, sai
sót khi tách shot, các kỹ thuật tách shot khác và phân đoạn video nén
- Kỹ thuật tìm lia đại diện cho đoạn video và kỹ thuật phản hồi liên
quan: Video được chia thành các lia, định danh các khung frame được mỗi lia,
chỉ số hóa và tìm kiếm theo đặc trưng của các khung frame
- Cơ sở dữ liệu video thử nghiệm: Các video chuyên ngành nghiệp vụ
tại thư viện nghiệp vụ - Học viện cảnh sát nhân dân
3. Hướng nghiên cứu của đề tài
- Tìm kiếm các tài liệu, học liệu liên quan trên Internet, thư viện nhà
trường để nghiên cứu các vấn đề liên quan nhằm giải quyết đề tài.
- Liên hệ chặt chẽ với thầy hướng dẫn để đề tài đi đúng hướng.
- Nghiên cứu một số kỹ thuật sử dụng trong xây dựng hệ thống tìm
kiếm video.
- Nghiên cứu giải pháp cơng nghệ cài đặt chương trình thử nghiệm.
4. Cấu trúc của luận văn
Luận văn gồm: Phần mở đầu, ba chương chính, kết luận và tài liệu
tham khảo cụ thể:
Phần mở đầu:Trình bày lý do chọn đề tài và bố cục của luận văn
Chương 1: Tổng quan về hệ thống tìm kiếm Video
Chương 2. Một số kỹ thuật sử dụng trong xây dựng hệ thống tìm kiếm video
Chương 3. Thử nghiệm



10
Kết luận và hướng phát triển của luận văn
5. Phương pháp nghiên cứu
- Phương pháp nghiên cứu lý thuyết: Thu thập, tổng hợp các tài liệu đã
công bố, so sánh để tìm ra vấn đề phù hợp để nghiên cứu học hỏi
- Liên hệ thường xuyên với giáo viên hướng dẫn và các chuyên gia để
thực hiện luận văn cho đúng hướng, đúng tiến độ.
- Phương pháp thực nghiệm để minh chứng hiệu quả của giải pháp lựa
chọn thông qua các nhận xét, phân tích đánh giá kết quả thử nghiệm.
6. Ý nghĩa khoa học của đề tài
Hiện nay, việc nghiên cứu và triển khai các cơ sở dữ liệu (CSDL) video
trên thế giới và trong nước vẫn đang là một vấn đề quan trọng. Video, khi
được lưu trữ dưới dạng các đoạn video, các băng video, là quá thô không
thuận tiện cho các yêu cầu duyệt, truy vấn và thu hồi, cần tổ chức các dữ liệu
video. Một nhiệm vụ rất khó khăn và cấp thiết là tạo ra các phương pháp và
công cụ cho phép tự động sưu tập, lưu trữ và thu hồi thông tin video, trên cơ
sở nội dung của nó. Việc xây dựng CSDL video cần các kỹ thuật xử lý dữ liệu
phức tạp hơn nhiều so với các dữ liệu đa phương tiện khác như văn bản, âm
thanh hay ảnh tĩnh. Trong đó, chỉ số hóa và phân đoạn dữ liệu video ln
được xem là vấn đề rất quan trọng. Khi phân chia dữ liệu video thành các đơn
vị cơ sở có nghĩa nhỏ hơn, cho phép trả lời nhanh các câu hỏi tìm kiếm trên
CSDL. Các vấn đề được trình bày trong luận văn hệ thống hoá lý thuyết
CSDL video, cung cấp các thuật tốn và cơng cụ cho việc chỉ mục và truy tìm
video, hình thành thước đo và kỹ thuật đo độ chênh lệch sao cho phù hợp để
có thể áp dụng chúng trong tự động hóa phân đoạn video và chuẩn bị dữ liệu
trong xây dựng các CSDL video số trong môi trường đa phương tiện trong
thực tế.



11
CHƯƠNG 1. TỔNG QUAN VỀ HỆ THỐNG TÌM KIẾM VIDEO
Trong chương này sẽ trình bày hệ thống tìm kiếm video theo nội dung . Nêu
khái niệm và ý nghĩa của mơ hình dữ liệu video
1.1 Kiến trúc tổng quan hệ thống tìm kiếm video theo nội dung
1.1.1 Mơ hình tổng qt tìm kiếm

On-line

Hình 1.1 Mơ hình tìm kiếm
Bên phải hình 1.1 : Off- Line
Băng video sẽ được tiền xử lý thành các Lia . Các Lia đại diện cho Video
tách thành các Frame . Đối với Lia tĩnh ,có thể chọn ln được Frame đại
diện. Đối với Lia động thì ta có nhiều phương pháp tìm Frame đại diện như
sử dụng phương tính trung bình biểu đồ màu của các đoạn, frame có biểu đồ
màu gần nhất là Frame đại diện.Phần tìm frame đại diện sẽ được trình bày rõ


12
ở chương 2. Sau khi có Frame đại diện cho mỗi video, sẽ có một cơ sở dữ
liệu frame đại điện
Bên trái hình 1.1 Online
Đầu vào là ảnh (có thể một hoặc nhiều ảnh),tiền xử lý chọn ra một ảnh
tương tự như frame đại diện cho Video. Khi đã có ảnh đầu vào, ta sẽ đối sánh
đặc trưng của ảnh đầu vào với frame đại diện nếu tương đồng thì ta sẽ cho ra
video cần tìm. Đánh giá mức độ phù hợp và phản hồi kết quả
1.1.2 Hệ thống tìm kiếm video theo nội dung
Video là media giàu thông tin. Một video đầy đủ bao gồm phụ đề
(subtitle) bằng text, rãnh tiếng (tiếng nói và khơng phải tiếng nói), các ảnh

được ghi và trình chiếu theo tốc độ cố định. Vậy video được xem như tổ hợp
text, audio và các ảnh có chiều thời gian ảnh động. Thêm nữa, video còn kết
hợp với metadata như tên video, tác giả/ nhà sản xuất. [3]
Các dữ liệu video được ứng dụng nhiều trong cơng nghệ giải trí (phim
ảnh, clip âm nhạc..), trong đào tạo từ xa (qua những video bài giảng)... Nhiều
phòng chức năng có nhiệm vụ lưu trữ và thu thập các video (tư liệu lịch sử, tư
liệu khai quật khảo cổ học của địa phương hay quốc gia...). Chính vì sự giàu
thông tin và ứng dụng nhiều trong các lĩnh vực như vậy mà luận văn này của
tác giả đề cập đến phương pháp tiệm cận tổng quát đến chỉ mục và truy tìm
video trên cơ sở shot (lia). Việc tìm kiếm này là chia trình tự video thành
nhóm các frame tương tự, sau đó chỉ mục và truy tìm trên cơ sở các frame đại
diện của các nhóm này (gọi là shot).
1.2 Mơ hình dữ liệu video
1.2.1 Khái niệm mơ hình dữ liệu video
Video giống như một tập các hình ảnh ở các thời điểm được sắp xếp,
biểu diễn theo một chuỗi thời gian nhất định. Trên thực thế chính là chuyển
động của các điểm ảnh từ trạng thái này sang trạng thái khác, hay là sự
chuyển động của mỗi đối tượng riêng lẻ được phân tích từ dữ liệu video.


13
Cơng cụ tìm kiếm video cho phép người dùng thuận tiện trong q trình tìm
kiếm phục vụ nhiều mục đích khác nhau như giải trí, giáo dục và truyền
thơng. Video sẽ được tổ chức trong một cấu trúc phân cấp của những cảnh,
ảnh chụp và khung như hình 1.1

Hình 1.2 Cấu trúc phân cấp của 1 video clip
Mơ hình dữ liệu video tổng qt:
Episode


Hình 1.3 Mơ hình dữ liệu video tổng qt
Nhìn trên mơ hình tổng qt : băng video bao gồm dãy các ảnh chụp
theo tốc độ nhất định. Thơng thường video được hình thành từ nhiều đơn vị
logic hay đoạn. Chúng ta gọi các đoạn này là video shot. Một shot là trình tự
các frame liên tục, ngắn có một hay nhiều các đặc trưng sau:
- Mơ tả cùng một cảnh (scene)
- Báo hiệu một thao tác máy quay (bấm máy quay)


14
- Chứa sự kiện mô tả hay một hành động của một đối tượng
- Được người sử dụng lựa chọn như thực thể để chỉ mục
Trong mơ hình cịn thể hiện cut detection: là quá độ từ shot này
sang shot khác
- Hard cut
- Quá độ từ từ (gradual) [1]
Một số mơ hình dữ liệu video:
- Mơ hình quan hệ : có thể dùng để biểu diễn những mối quan hệ của
dữ liệu
- Mơ hình đối tượng: có thể dùng để biểu diễn những cấu trúc phức tạp
- Mơ hình đối tượng - quan hệ được dùng để biểu diễn cơ sở dữ liệu
video
- Mơ hình dữ liệu siêu ngữ nghĩa là thích hợp nhất vì nó có thể biểu
diễn được cả đối tượng, quan hệ và luật ràng buộc giữa chúng
1.2.2 Các u cầu đối với một mơ hình dữ liệu video
Một mơ hình dữ liệu video đáp ứng các yêu cầu nêu trên, chúng ta cần
phải có được một số các yêu cầu cụ thể cho nó như sau:
- Có khả năng lưu trữ lớn
- Đầy đủ các khả năng của một CSDL truyền thơng
- Có khả năng khai thác dữ liệu thuận tiện

- Hỗ trợ truy vấn video
- Có khả năng tích hợp, tổng hợp và thể hiện
- Có giao diện video và tương tác
Để cho hệ thống hoạt động tốt chúng ta cần phải giải quyết các vấn đề sau:
- Hệ thống CSDL video sẽ được xây dựng như thế nào để có thể bao
gồm các lĩnh vực ứng dụng khác


15
- Xây dựng phần hạt nhân cho việc phân rã, lưu trữ và quản lý thông
tin ở mức độ nào? Các công nghệ, cấu trúc nền tảng được sắp xếp và sử dụng
như thế nào?
- Xác định được hạ tầng thể hiện nào mà một hệ thống video phải có
để đạt được các yêu cầu và cách thức thể hiện khác nhau. Làm cách nào để hỗ
trợ việc đồng bộ hóa việc thể hiện các dữ liệu tạm thời cũng như các dữ liệu
bộ phận của các dữ liệu video khác nhau
- Các kiến thức về tổng hợp dữ liệu đối với CSDL video, làm thế nào
để có thể phát triển được một ngôn ngữ truy vấn đáng tin cậy và có hiệu quả
để hỗ trợ cho vơ số phương thức truy nhập và các kiểu đối tượng khác nhau.
Làm thế nào để ngôn ngữ truy vấn hỗ trợ được các đặc tính và hình thái khác
nhau của dư liệu video.
- Giả sử các kiểu media khác nhau có các yêu cầu cập nhật và sửa đổi
thông tin khác nhau thì hệ thống sẽ cập nhật các thành phần này như thế nào.
1.2.2.1 Khả năng lưu trữ của hệ thống video

Hình 1.4: Mơ hình khả năng lưu trữ của các hệ thống Video
Các yêu cầu về khả năng lưu trữ của các hệ thống video có thể được
đặc trưng bởi khả năng lưu trữ lớn và cách thức tổ chức theo thứ bậc (dạng



16
kim tháp) của hệ thống lưu trữ. Việc lưu trữ theo thứ bậc đặt các đối tượng dữ
liệu video trong một hệ thống phân bậc bao gồm các thiết bị khác nhau, có thể
là trực tuyến (online), hoặc khơng trực tuyến (offline). Một cách tổng quát,
mức cao nhất của hệ thống sẽ cho ta hiệu suất cao nhất, khả năng lưu trữ nhỏ
nhất, chi phí cao nhất và sự cố định ít nhất. Các lớp cao trong hệ thống phân
cấp này có thể sử dụng để lưu trữ các đối tượng tóm tắt nhỏ hơn của một dữ
liệu video hồn chỉnh với mục đích cung cấp khả năng duyệt và xem trước
nhanh đối với nội dung của dữ liệu. Chi phí và hiệu suất (tính về mặt thời
gian) sẽ giảm dần nếu ta đi xuống các lớp phí dưới của hệ thống phân cấp,
cùng với điều này là sự tăng của khả năng lưu trữ và tính cố định. Thơng
thường trong hầu hết các hệ thống lưu trữ video, mức cao nhất của lưu trữ
thường là RAM, tiếp đó là đĩa từ, các thiết bị này cung cấp các dịch vụ trực
tuyến (online services). Các thiết bị lưu trữ quang học cung cấp mức lưu trữ
tiếp theo, khái niệm trực tuyến ở đây có thể hiểu gần như, tiêu biểu cho các
thiết bị lưu trữ kiểu này là các jukebox (CD-DVD jukebox). Mức thấp nhất
trong hệ thống lưu trữ phân cấp có thể là các thiết bị như băng từ, đĩa quang
hoặc các thiết bị tương tự, các thiết bị này cung cấp khả năng lưu trữ offline
và có thể khơng cần kết nối trực tiếp với máy tính. Chúng cung cấp khả năng
lưu trữ và tính cố định cao hơn nhưng cung có hiệu suất kém nhất về thời gian
truy nhập. Vì những lý do trên, một MDBMS phải quản lý và tổ chức việc lưu
trữ đối với bất kỳ mức nào của hệ thống phân cấp, nó phải có cơ chế tự động
để chuyển các đối tượng dữ liệu video từ một mức này của hệ thống lưu trữ
phân cấp sang mức khác, việc chuyển cấp này phải dựa trên tần suất sử dụng
của dữ liệu video. Trong trường hợp dữ liệu video được lưu trữ ở các thiết bị
offline thì MDBMS cũng phải có được các thơng tin trợ giúp cho việc dễ
dàng xác định các thiết bị cụ thể có chứa các thơng tin cần truy xuất.


17

1.2.2.2 Truy vấn và khai thác dữ liệu
Truy vấn đối với dữ liệu video bao gồm các kiểu dữ liệu khác nhau, các
từ khố, thuộc tính, nội dung vv… Do người dùng có thể có các cách suy nghĩ
khác nhau về dữ liệu video vì vậy kết quả thu được từ việc truy vấn dữ liệu
video có thể khơng hồn tồn chính xác và có thể chỉ là các kết quả tương tự
hoặc là một phần của kết quả hơn là các kết quả chuẩn xác. Do việc có thể kết
quả là khơng chính xác nên chúng ta phải có khả năng phân hạng các kết quả
thu được sao cho chúng gần với yêu cầu truy vấn nhất, tương tự như vậy
chúng ta cũng phải có các phương thức để loại bỏ bớt những kết quả không
thoả mãn yêu cầu truy vấn. Việc làm này sẽ giảm thiểu các sai sót về mặt tính
tốn trong q trình tìm kiếm.
1.2.2.3 Giao diện và tương tác
Sự khác nhau về bản chất của các dữ liệu video địi hỏi phải có các giao
diện khác nhau để tương tác với dữ liệu. Thông thường, mỗi loại dữ liệu có
các phương thức truy nhập và thể hiện riêng của mình, ví dụ như dữ liệu
video và âm thanh sẽ đòi hỏi các giao diện người dùng khác nhau để thể hiện
và truy vấn. Đối với một vài ứng dụng Video, đặc biệt là sự có mặt của các
loại dữ liệu có tính liên tục người dùng thường địi hỏi phải có các khả năng
tương tác với dữ liệu (chẳng hạn như đối với dữ liệu VCR thì người dùng
thường mong muốn có chức năng như tua lên (fast forward) hoặc tua ngược
lại (reverse). Khi mà một hệ thống Video cung cấp các dịch vụ như vậy thì nó
phải được liên kết vào CSDL đặc biệt là việc khai thác các đối tượng, tổng
hợp và đồng bộ chúng.
1.2.2.4 Tích hợp các phương tiện, tổng hợp và thể hiện
Giả sử tính đa dạng của các kiểu dữ liệu đã được hỗ trợ, một MDBMS
cũng phải cung cấp khả năng để tích hợp các loại dữ liệu này để tạo nên các
kiểu dữ liệu video mới và thể hiện các dữ liệu này khi có yêu cầu trong một


18

khung thời gian yêu cầu. Độ phức tạp của việc tích hợp, tổng hợp và thể hiện
bị tăng thêm bởi các đặc tính cơ bản của dữ liệu video như tính liên tục (tạm
thời) của dữ liệu video đặc biệt là với các kiểu dữ liệu như video, hoạt hình
hoặc âm thanh. Hơn nữa, một vài ứng dụng cụ thể như các hệ thống thơng tin
địa lý có thể địi hỏi MDBMS cung cấp các thông tin bộ phận (về một vùng,
miền nào đó). Tất cả các yếu tố này kết hợp với nhau làm cho việc tổng hợp
và thể hiện video trở thành một quy trình phức tạp mà MDBMS phải cung cấp
để đáp ứng các yêu cầu mà người dùng địi hỏi. Các vấn đề về tích hợp có thể
được cải thiện trong một số trường hợp, đặc biệt là khi các hệ thống CSDL
video được xây dựng nhằm phục vụ cho các cộng đồng người dùng xác định
trước. Trong các trường hợp đặc biệt này, MDBMS có thể hỗ trợ một số tính
năng mà các ứng dụng khác không cần đến [8].
1.2.2.5 Hiệu suất
Hiệu suất là một vấn đề quan trọng cần được xem xét đối với một
MDBMS. Các hệ thống CSDL video tạo ra hiệu suất dựa trên sự tối ưu hoá
việc truy nhập tới các media, lưu trữ, chỉ số hoá, khai thác và truy vấn. Sự
có tham gia của nhiều kiểu dữ liệu khác nhau trong CSDL video có thể địi
hỏi một số phương thức đặc biệt để tối ưu hoá việc truy cập, lưu trữ, chỉ số
hoá và khai thác. Các yêu cầu này bao gồm hiệu quả, tính ổn định, đảm bảo
và đồng bộ việc trao đổi dữ liệu, chất lượng của dịch vụ (QoS).
1.2.3 Mơ hình dữ liệu video điển hình
Mơ hình dữ liệu là đơn vị trung tâm của một hệ thống CSDL video.
Một mơ hình dữ liệu cần phải tách rời người dùng ra khỏi chi tiết của việc
quản lý các thiết bị lưu trữ và cấu trúc lưu trữ. Điều này địi hỏi phải phát
triển các mơ hình dữ liệu tương ứng để tổ chức các kiểu dữ liệu khác nhau
tường gặp trong các hệ thống CSDL video. 20 Các mơ hình dữ liệu video
(cũng giống như các mơ hình dữ liệu truyền thống khác) nắm bắt các đặc tính


19

cố định cũng như động của nội dung CSDL và vì vậy nó cung cấp các khn
mẫu cơ bản cho việc phát triển các công cụ cần thiết để sử dụng dữ liệu video.
Các thuộc tính cố định có thể bao gồm các đối tượng tạo nên dữ liệu video,
mối liên hệ giữa các đối tượng, thuộc tính của các đối tượng… Các đặc tính
động bao gồm sự tương tác giữa các đối tượng, sự hoạt động trên đối tượng,
các tương tác của người dùng. Tuy nhiên, do các tính chất đặc biệt của mình,
dữ liệu video địi hỏi phải có các quan tâm mới khi chọn lựa mơ hình dữ liệu.
Ví dụ, một vài kiểu dữ liệu video (chẳng hạn video) hoặc một nhóm các kiểu
(video và hình ảnh) có thể địi hỏi các mơ hình dữ liệu đăc biệt để cải thiện
hiệu quả và tính mềm dẻo. Hơn nữa, do tầm quan trọng của việc tương tác
trong các hệ thống video nên việc nó được hỗ trợ bỏi các mơ hình dữ liệu trở
nên quan trọng. Rât nhiều các mơ hình dữ liệu khác nhau như là mạng lưới,
liên hệ, ngữ nghĩa, và hướng đối tượng đang tồn tại và một vài số trong chúng
đã được xem xét để thiết lập CSDL video. Có hai cách tiếp cận cơ bản trong
việc mơ hình hố dữ liệu video là:
• Phương pháp thứ nhất: Xây dựng một mơ hình dữ liệu video trên nền
tảng của mơ hình dữ liệu của một CSDL truyền thống (thường là CSDL quan
hệ hoặc CSDL hướng đối tượng) bằng cách sử dụng các giao diện tương ứng
đối với dữ liệu video. Các vấn đề nẩy sinh với cách tiếp cận này là các cấu
trúc bên dưới (của CSDL truyền thống) không được thiết kế dành cho dữ liệu
video, hơn nữa sự khác biệt cơ bản các yêu cầu của một CSDL truyền thống
đối với CSDL video khiến cho giao diện trở thành nơi nghẽn cổ chai trong
toàn bộ hệ thống. Các vấn đề này dẫn tới cách tiếp cận thứ hai .
• Phương pháp thứ hai: phát triển các mơ hình dữ liệu thực thụ dành
cho dữ liệu video từ đầu chứ không xây dựng trên cơ sở của các CSDL truyền
thống, tuy nhiên mọi người đều nhất trí rằng các nỗ lực như vậy đều phải dựa
trên kỹ thuật hướng đối tượng [7].


20

1.3 Mơ hình tổng qt về CSDL video
1.3.1 Khái qt về CSDL đa phương tiện và CSDL video
Dữ liệu video được chia thành hai lớp là các dữ liệu liên tục và các dữ
liệu không liên tục. Các dữ liệu liên tục bao gồm các dữ liệu âm thanh, video
thay đổi theo thời gian. Các dữ liệu không liên tục là các dữ liệu không phục
thuộc vào thời gian, các loại dữ liệu đặc trưng cho dạng này là các dữ liệu văn
bản (có hoặc khơng có định dạng), hình ảnh tĩnh và các đối tượng đồ họa. Các
kiểu dữ liệu thơng thường của một CSDL Video bao gồm:


Dữ liệu văn bản (có hoặc khơng có định dạng).



Đồ họa: là các bản vẽ, minh họa được mã hóa như các tệp

postscript.


Hình ảnh: là các hình ảnh được mã hóa sử dụng các dạng thức

chuẩn như là JPEG hoặc MPEG.
• Các hoạt hình.


Âm thanh.



Video.


Các đặc tính chung của dữ liệu video bao gồm:
• Thiếu cấu trúc: Các dữ liệu video có khuynh hướng phi cấu trúc vì
vậy các tác nghiệp quản trị dữ liệu chuẩn như chỉ số hố, tìm kiếm nội dung,
truy vấn dữ liệu thường là không áp dụng được.
• Tính tạm thời: Một vài kiểu dữ liệu video như là video, âm thanh và
hoạt hình đều phụ thuộc vào yếu tố thời gian liên quan mật thiết đến việc lưu
trữ, thao tác và mơ tả chúng.
• Có dung lượng lớn: Các dữ liệu video và âm thanh thường đòi hỏi


21
các thiết bị lưu trữ lớn.
• Các ứng dụng hỗ trợ: Các dữ liệu phi chuần có thể địi hỏi các quy
trình xử lý phức tạp như việc sử dụng các thuật toán nén dữ liệu đối với các
ứng dụng CSDL Video.
Cơ sở dữ liệu đa phương tiện (MMDB) là một tập hợp các dữ liệu đa
phương tiện có liên quan.[1] Các dữ liệu đa phương tiện bao gồm một hoặc
nhiều kiểu dữ

liệu phương tiện truyền thơng chính như văn bản, hình ảnh,

các đối tượng đồ họa (bao gồm bản vẽ, phác thảo và hình minh họa) các chuỗi
hình ảnh động, âm thanh và video.
Một hệ thống quản lý cơ sở dữ liệu đa phương tiện (MMDBMS) là một
khung quản lý các loại dữ liệu khác nhau có khả năng đại diện trong một sự
đa dạng rộng của các định dạng trên một mảng rộng các nguồn phương tiện
truyền thông. Nó cung cấp hỗ trợ cho các loại dữ liệu đa phương tiện, và tạo
thuận lợi cho việc tạo ra, lưu trữ, truy cập, truy vấn và kiểm soát của một cơ
sở dữ liệu đa phương tiện.

1.3.2 Kiến trúc tổng thể CSDL video
Ở đây chúng ta xem xét tới ba kiến trúc áp dụng cho việc tổ chức nội
dung của một hệ thống CSDL Video
Kiến trúc dựa trên nguyên lý tự trị
Nguyên lý này đề cập tới việc chúng ta nhóm tất cả các dữ liệu ảnh, dữ
liệu video và tất cả các dữ liệu văn bản và chỉ số hóa chúng theo nguyên tắc
tối đa hóa hiệu suất của tất cả các loại truy nhập đối với các loại dữ liệu mà
chúng ta dự định. Nguyên lý này đảm bảo rằng với mỗi loại dữ liệu (ảnh,
video, văn bản) chúng đều được tổ chức với một cách thức đặc trưng phù hợp
với mỗi loại dữ liệu này.


22
USER
Trả Lời
Truy vấn

Cơ chế hiển thị

Cơ chế truy vấn Mutimedia

Tệp chỉ số dữ
liệu ảnh

Tệp chỉ số dữ liệu
Audio

Tệp chỉ số dữ liệu
Video


Hình 1.5 Kiến trúc dựa trên nguyên lý tự trị
Nguyên lý đồng nhất
Một nguyên lý kiến trúc khác mà chúng ta có thể lựa chọn là nguyên lý
đồng nhất, nguyên lý này giúp chúng ta tìm được một cấu trúc tóm tắt chung cho
tất cả các loại dữ liệu. Cấu trúc này có thể được dùng trong việc chỉ số hóa tất cả
các loại dữ liệu qua đó tạo ra một “chỉ số thống nhất” mà chúng ta có thể dùng
để truy cập tới các đối tượng khác nhau. Hay nói một cách khác là chúng ta có
thể trình bầy tất cả các đối tượng khác nhau( ảnh, video, âm thanh, văn bản)
trong một cấu trúc dữ liệu duy nhất và qua đó phát triển các thuật tốn để truy
vấn cấu trúc dữ liệu này.


23

USER

Trả lời
Cơ chế hiển thị

Truy vấn
Cơ chế truy vấn Mutimedia

Tệp chỉ số thống nhất

Dữ liệu ảnh

Dữ liệu Audio

Dữ liệu Video


Hình 1.6 Kiến trúc dựa trên nguyên lý đồng nhất

Nguyên lý lai ghép
Ý tưởng của nguyên lý này là dựa trên sự kết hợp của 2 nguyên lý đã trình
bầy ở trên. Kết quả của nguyên lý này là một kiểu dữ liệu nào đó sử dụng chỉ số
(index) riêng của chúng, trong khi đó các kiểu dữ liệu khác sẽ sử dụng một chỉ
số (Index) “thống nhất”. Loại dữ liệu nào sử dụng kiểu chỉ số nào sẽ phụ thuộc
vào các đặc tính khác nhau sẽ được nói đến ở phần sau


24
USER

Trả lời
Cơ chế hiển thị

Truy vấn
Cơ chế truy vấn Mutimedia

Tệp chỉ số
phương tiện 1

Tệp chỉ số phương
tiện 2

Tệp chỉ số thống nhất

Dữ liệu
ảnh


Dữ liệu
Audio

Dữ liệu
Video

Hình 1.7 Kiến trúc dựa trên nguyên lý lai ghép
1.3.3 Các chức năng chủ yếu của CSDL video
Các cơ sở dữ liệu video bây giờ có thể lưu trữ phim ảnh và tiếng
nói.Lưu trữ các định nghĩa, các mối liên kết dữ liệu (gọi là siêu dữ liệu) vào
một từ điển dữ liệu. Các chương trình truy cập đến cơ sở dữ liệu làm việc
thông qua hệ quản trị cơ sở dữ liệu. Hệ quản trị cơ sở dữ liệu sử dụng dữ liệu
trong từ điển dữ liệu để tìm kiếm các cấu trúc thành phần dữ liệu và các mối
liên kết được yêu cầu. Mọi sự thay đổi trong các tệp cơ sở dữ liệu sẽ được tự
động ghi lại vào từ điển dữ liệu. Như vậy, hệ quản trị cơ sở dữ liệu giải phóng
người sử dụng khỏi việc lập trình cho các mối liên kết phức tạp trong mỗi
chương trình, việc sửa đổi các chương trình truy cập đến tệp cơ sở dữ liệu đã


25
bị sửa đổi. Nói cách khác, hệ quản trị cơ sở dữ liệu loại bỏ sự phụ thuộc giữa
dữ liệu và cấu trúc ra khỏi hệ thống.
Tạo ra các cấu trúc phức tạp theo yêu cầu để lưu trữ dữ liệu. Nó giúp
người sử dụng làm nhiệm vụ khó khăn là định nghĩa và lập trình cho các đặc
trưng vật lý của dữ liệu.Biến đổi các dữ liệu được nhập vào để phù hợp với
các cấu trúc dữ liệu ở điểm 2. Như vậy, hệ quản trị cơ sở dữ liệu giúp người
sử dụng phân biệt dạng logic và dạng vật lý của dữ liệu. Bằng việc duy trì sự
độc lập dữ liệu, hệ quản trị cơ sở dữ liệu chuyển các yêu cầu logic thành các
lệnh định vị một cách vật lý và lấy ra các dữ liệu yêu cầu. Điều đó cũng có
nghĩa là hệ quản trị cơ sở dữ liệu tạo khuôn dạng cho các dữ liệu được lấy ra

để làm cho nó phù hợp với mong muốn logic của người sử dụng.
Tạo ra một hệ thống bảo mật và áp đặt tính bảo mật và riêng tư trong cơ
sở dữ liệu.Tạo ra các cấu trúc phức tạp cho phép nhiều người sử dụng truy
cập đến dữ liệu. Cung cấp các thủ tục sao lưu và phục hồi dữ liệu để đảm bảo
sự an toàn và toàn vẹn dữ liệu.
Xúc tiến và áp đặt các quy tắc an toàn để loại bỏ vấn đề toàn vẹn dữ
liệu. Điều đó cho phép ta làm tối thiểu sự dư thừa dữ liệu và làm tối đa tính
nhất quán dữ liệu.Cung cấp việc truy cập dữ liệu thông qua một ngôn ngữ
truy vấn. Một ngôn ngữ truy vấn là một ngôn ngữ phi thủ tục cho phép người
sử dụng chỉ ra cái gì cần phải làm mà khơng cần phải chỉ ra nó được làm như
thế nào. Các hệ quản trị cơ sở dữ liệu cũng cung cấp việc truy cập dữ liệu cho
những người lập trình thơng qua các ngôn ngữ thủ tục.


×