Tải bản đầy đủ (.pdf) (58 trang)

Kỹ thuật tách LIA video và ứng dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.38 MB, 58 trang )

ĐẠI HOC THÁI NGUYÊN
ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

PHẠM TÔ HÀ
[

KỸ THUẬT TÁCH LIA VIDEO VÀ ỨNG DỤNG

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Chuyên ngành: KHOA HỌC MÁY TÍNH
Mã số: 60 48 01 01

Ngƣời hƣớng dẫn khoa học: PGS.TS ĐẶNG VĂN ĐỨC

THÁI NGUYÊN 2015

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

LỜI CAM ĐOAN

Tôi xin cam đoan luận án này là công trình nghiên cứu của chính bản thân. Các
kết quả nghiên cứu trong luận văn là trung thực và chưa được công bố trong các công
trình nào khác.

Tác giả luận văn

Phạm Tô Hà

Số hóa bởi Trung tâm Học liệu - ĐHTN



/>

LỜI CẢM ƠN

Tôi xin bày tỏ lòng biết ơn chân thành tới thầy Đặng Văn Đức người đã dìu
dắt và giúp đỡ tôi trong cả lĩnh vực nghiên cứu của luận án cũng như trong công
tác chuyên môn và cuộc sống.

………

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

DANH MỤC CÁC THUẬT NGỮ VIẾT TẮT
Từ viết tắt

Tiếng anh

Nghĩa tiếng việt
Cơ sở dữ liệu

CSDL
Multimedia Database Management

Hệ thống quản lý cơ sở dữ

System


liệu đa phương tiện

RAM

Random access memory

Bộ nhớ truy cập ngẫu nhiên

HWZ

Half window size

Một nửa kích thước cửa sổ

DMZ

Demilitarised Zone

Độ sâu của khung hình

LB

Lower threshold

Cận dưới

UB

Upper threshold


Cận trên

MDBMS

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

DANH MỤC HÌNH ẢNH
CHƢƠNG I. TỔNG QUAN VỀ CSDL VIDEO
Hình 1.1 Cấu trúc phân cấp của 1 video clip .............................................................. 14
Hình 1.2 Mô hình dữ liệu video tổng quát. .................................................................. 14
Hình 1.3: Mô hình khả năng lưu trữ của các hệ thống Video ......................................16
Hình 1.4 Biểu diễn dữ liệu với mô hình đối tượng .......................................................21
Hình 1.5 Biểu diễn dữ liệu với mô hình quan hệ ..........................................................21
Hình 1.6 Biểu diễn dữ liệu với mô hình siêu ngữ nghĩa ...............................................22
Hình 1.7 Kiến trúc dựa trên nguyên lý tự trị ...............................................................24
Hình 1.8 Kiến trúc dựa trên nguyên lý đồng nhất ........................................................25
Hình 1.9 Kiến trúc dựa trên nguyên lý lai ghép ........................................................... 26
CHƢƠNG II. MỘT SỐ KỸ THUẬT TÁCH LIA VIDEO
Hình 2.1 Sơ đồ ứng dụng kỹ thuật trừ ảnh vào phân đoạn video ................................34
Hình 2.2 Chênh lệch biểu đồ, * cắt cảnh, ---- chồng mờ ............................................. 38
Hình 2.3 So sánh biểu đồ của hai ảnh ..........................................................................38
Hình 2.4 So sánh cặp a. chênh lệch biểu đồ liên tiếp, b. chênh lệch biểu đồ tích lũy .42
Hình 2.5 Phát hiện chuyển cảnh dần dần bằng kỹ thuật so sánh cặp.......................... 43
Chƣơng 3. CHƢƠNG TRÌNH THỬ NGHIỆM
Hình 3.1 Giao diện chương trình chính .......................................................................51
Hình 3.2 Giao diện chọn file ........................................................................................52
Số hóa bởi Trung tâm Học liệu - ĐHTN


/>

Hình 3.3 Giao diện chọn thiết bị ..................................................................................52
Hình 3.4 Giao diện tách lia video dựa trên kỹ thuật phát hiện chuyển cảnh ..............53

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

MỤC LỤC
LỜI CAM ĐOAN ....................................................................................................1
LỜI CẢM ƠN .........................................................................................................3
DANH MỤC CÁC THUẬT NGỮ VIẾT TẮT ....................................................4
DANH MỤC HÌNH ẢNH ......................................................................................4
MỞ ĐẦU..................................................................................................................9
CHƢƠNG I. TỔNG QUAN VỀ CSDL VIDEO ................................................14
1.1 Mô hình dữ liệu video ......................................................................................14
1.1.1 Khái niệm mô hình dữ liệu video. ............................................................14
1.1.2 Các yêu cầu đối với một mô hình dữ liệu video. .....................................15
1.1.3 Các mô hình dữ liệu video điển hình. ......................................................19
1.2 Mô hình tổng quát về CSDL video ..................................................................23
1.2.1 Khái quát về CSDL đa phương tiện và CSDL video ...............................23
1.2.2 Kiến trúc tổng thể CSDL video ................................................................24
1.2.3 Các chức năng chủ yếu của CSDL video .................................................28
1.2.4 Tầm quan trọng của tách lia video đối với CSDL video..........................29
CHƢƠNG II. MỘT SỐ KỸ THUẬT TÁCH LIA VIDEO ..............................31
2.1 Giới thiệu ..........................................................................................................31
2.2 Kỹ thuật tách lia đối với các băng video có sự biến đổi đột ngột ....................32
2.2.1 Tách lia trên cơ sở giá trị điểm ảnh ..........................................................32
2.2.2 Tách lia trên cơ sở histogram của các khung hình ...................................34

2.3 Kỹ thuật tách lia biến đổi dần dần (khi có hiệu ứng) .......................................36
2.3.1 Phân loại biên lia thay đổi dần dần trong băng video ..............................36
2.3.2 Kỹ thuật tách lia trên cơ sở lược đồ tích lũy ............................................37
7


2.3.3 Kỹ thuật tách lia trên cơ sở cửa sổ trượt ..................................................44
2.4 Các kỹ thuật tách khác ......................................................................................49
CHƢƠNG III. CHƢƠNG TRÌNH THỬ NGHIỆM .........................................50
3.1. Dữ liệu video thử nghiệm ................................................................................50
3.2. Phân tích, lựa chọn công cụ .............................................................................50
3.3. Một số kết quả thực hiện chương trình ............................................................51
PHẦN KẾT LUẬN ...............................................................................................56
TÀI LIỆU THAM KHẢO ....................................................................................57

8


MỞ ĐẦU
1.Đặt vấn đề
Băng video bao gồm dãy các ảnh chụp theo tốc độ nhất định. Đoạn video
dài (thí dụ 60 phút), chứa nhiều frame. Nếu các khung này được xử lý riêng biệt,
chỉ mục và truy tìm sẽ không hiệu quả [1][4]. May thay, thông thường video được
hình thành từ nhiều đơn vị logíc hay đoạn. Chúng ta gọi các đoạn này là lia video
hay video shot. Một shot là trình tự các frame liên tục, ngắn có một hay nhiều các
đặc trưng sau:
- Các frame mô tả cùng cảnh (scene)
- Các frame báo hiệu một thao tác máy quay.
- Các frame chứa sự kiện mô tả hay hành động như hiện diện có ý nghĩa hay
đối tượng

- Các frame được người sử dụng lựa chọn như thực thể có thể chỉ mục được.
Thí dụ trong đoạn video bản tin thì mỗi mục tin tương ứng một shot. Trong
một phim, các ảnh được chụp trong cùng một cảnh (scene) và mô tả nét đặc biệt
(featuring) cùng nhóm người tương ứng với một shot.
Trong nhiều ứng dụng, đòi hỏi không chỉ nhận biết video nào chứa thông
tin cần tìm, mà còn cần nhận biết phần nào của video chứa thông tin cần tìm.
Duyệt tuyến tính toàn bộ các khung hình của video để tìm kiếm một vài thông tin
cụ thể là rất tốn kém thời gian, do vậy cần thiết phải có các phương pháp tự động
định vị các shot chứa thông tin cần tìm.
Việc nghiên cứu các kỹ thuật tách lia video sao cho hiệu quả đóng vai trò
hết sức quan trọng trong xây dựng các CSDL video. Các mô hình và kỹ thuật
phân đoạn dữ liệu video sẽ trình bày trong luận văn nhằm mục đích góp phần hệ
thống hoá lý thuyết CSDL video, cung cấp các thuật toán và công cụ cho việc chỉ
mục và truy tìm video, giới thiệu các thước đo và kỹ thuật đo độ chênh lệch sao
cho phù hợp để có thể áp dụng chúng trong tự động hóa phân đoạn video và chuẩn
bị dữ liệu trong xây dựng các CSDL video số trong môi trường đa phương tiện
9


trong thực tế. Từ thực tế đó, đề tài nghiên cứu mà luận văn đã chọn là: “Kỹ thuật
tách lia video và ứng dụng”.
2. Đối tƣợng nghiên cứu và phạm vi nghiên cứu
Đối tượng nghiên cứu là dữ liệu video trong các CSDL video
Nghiên cứu tổng quan về CSDL Video
Một số kỹ thuật tách video giới hạn trong:
Các kỹ thuật tách video dựa trên cơ sở giá trị điểm ảnh và histogram như:
Sử dụng thước đo tổng chênh lệch pixel-to-pixel giữa các frames lân cận; Sử dụng
đo khoảng cách biểu đồ màu (histogram) giữa hai frames láng giềng; Sử dụng kỹ
2
thuật đo khoảng cách (phép thử  ) cải tiến.


Kỹ thuật tách shot biến đổi dần dần (khi có hiệu ứng).
3. Hƣớng nghiên cứu
Nghiên cứu kỹ thuật kỹ thuật tách lia video trong CSDL video, nhằm so
sánh các kỹ thuật tách video thông qua hai tiêu chí chính: độ chính xác và tốc độ
tính toán. Cùng với những đánh giá trong mô hình hệ thống thử nghiệm thông qua
các tiêu chí: Số lần thực hiện phân đoạn trên các file video,số loại file video; Số
lia video phát hiện chính xác, phát hiện nhầm, bỏ sót; Thời gian thực hiện của các
thuật toán, để góp phần vào việc số hoá dữ liệu đa phương tiện.
Cuối cùng là kết luận, hướng nghiên cứu tiếp theo của luận văn.
4. Những nội dung nghiên cứu
Nội dung nghiên cứu của luận văn được thể hiện qua các chương mục dự
định viết trong bản luân văn như sau đây:

Mở đầu
- Lý do chọn đề tài
10


- Lia video là gì ?
- Tình hình nghiên cứu trong và ngoài nước về các kỹ thuật (thuật toán) tách
video shot phục vụ xây dựng cơ sở dữ liệu video.
- Mục tiêu, phạm vi nghiên cứu và kết quả dự kiến đạt được.
Chương 1. Tổng quan về CSDL video
1.1. Mô hình dữ liệu video
- Khái niệm mô hình dữ liệu video.
- Các yêu cầu đối với một mô hình dữ liệu video.
- Các mô hình dữ liệu video điển hình.
1.2. Mô hình tổng quát về CSDL video
- Khái quát về CSDL đa phương tiện và CSDL video

- Kiến trúc tổng thể CSDL video
- Các chức năng chủ yếu của CSDL video
- Tầm quan trọng của tách lia video đối với CSDL video.
Chương 2. Một số kỹ thuật tách lia video
2.1 Giới thiệu
2.2 Kỹ thuật tách lia đối với các băng video có sự biến đổi đột ngột
- Tách lia trên cơ sở giá trị điểm ảnh
- Tách lia trên cơ sở histogram của các khung hình
2.3 Kỹ thuật tách lia biến đổi dần dần (khi có hiệu ứng)
- Phân loại biên lia thay đổi dần dần trong băng video
- Kỹ thuật tách lia trên cơ sở lược đồ tích lũy
11


- Kỹ thuật tách lia trên cơ sổ cửa sổ trượt
Chương 3. Xây dựng chương trình thử nghiệm tách lia video
3.1 Dữ liệu video thử nghiệm
- Đầu vào
- Đầu ra
3.2 Phân tích, lựa chọn công cụ
- Lưu đồ thuật toán
- Công cụ sử dụng
3.3 Một số kết quả thực hiện chương trình
- Các chức năng chính của chương trình
- Kết quả chạy thử nghiệm
3.4 Ứng dụng
Kết luận
- Các kết quả đạt được của luận văn
- Vấn đề còn nghiên cứu tiếp theo về phân đoạn video và tách lia video.
5. Phƣơng pháp nghiên cứu

Dựa trên phương pháp mô hình hoá, sử dụng các công cụ toán học (giải
tích, thống kê) để tính toán. Sử dụng phương pháp thực nghiệm, dùng các kết quả
xử lý dữ liệu và tách video để kiểm chứng, đánh giá các thuật toán dựa trên những
tiêu chí đã đề ra.
6. Ý nghĩa khoa học của đề tài
Hiện nay, việc nghiên cứu và triển khai các cơ sở dữ liệu (CSDL) video trên thế
giới và trong nước vẫn đang là một vấn đề quan trọng. Video, khi được lưu trữ
12


dưới dạng các đoạn video, các băng video, là quá thô không thuận tiện cho các
yêu cầu duyệt, truy vấn và thu hồi, cần tổ chức các dữ liệu video.
Một nhiệm vụ rất khó khăn và cấp thiết là tạo ra các phương pháp và công
cụ cho phép tự động sưu tập, lưu trữ và thu hồi thông tin video, trên cơ sở nội
dung của nó. Việc xây dựng CSDL video cần các kỹ thuật xử lý dữ liệu phức tạp
hơn nhiều so với các dữ liệu đa phương tiện khác như văn bản, âm thanh hay ảnh
tĩnh.
Trong đó, chỉ số hóa và phân đoạn dữ liệu video luôn được xem là vấn đề
rất quan trọng. Khi phân chia dữ liệu video thành các đơn vị cơ sở có nghĩa nhỏ
hơn, cho phép trả lời nhanh các câu hỏi tìm kiếm trên CSDL.Các vấn đề được
trình bày trong luận văn hệ thống hoá lý thuyết CSDL video, cung cấp các thuật
toán và công cụ cho việc chỉ mục và truy tìm video, hình thành thước đo và kỹ
thuật đo độ chênh lệch sao cho phù hợp để có thể áp dụng chúng trong tự động
hóa phân đoạn video và chuẩn bị dữ liệu trong xây dựng các CSDL video số trong
môi trường đa phương tiện trong thực tế.

13


CHƢƠNG I. TỔNG QUAN VỀ CSDL VIDEO

1.1 Mô hình dữ liệu video
1.1.1 Khái niệm mô hình dữ liệu video.
Các ứng dụng đa phương tiện ngày càng được mở rộng và việc để quản lý
chúng một cách hiệu quả ngày càng cần thiết. Video đã trở nên rất phổ biến trong
nhiều lĩnh vực như truyền thông, giáo dục và giải trí…. Một bộ sưu tập lớn của
các video clip, các chương trình truyền hình trực tiếp và phim hình ảnh có thể
được tìm thấy trên Internet. Video sẽ được tổ chức trong một cấu trúc phân cấp
của những cảnh, ảnh chụp và khung như hình 1.1 [3].

Hình 1.1 Cấu trúc phân cấp của 1 video clip.
Qua đó một mô hình dữ liệu video tổng quát có thể được thể hiện như sau :

Hình 1.2 Mô hình dữ liệu video tổng quát.
Trong đó :
14


- Shot (lia) : trình tự các frames liên tục, ngắn và nó có một hay nhiều các đặc
trưng sau:
+ Mô tả cùng một cảnh (scene)
+ Báo hiệu bắt đầu một thao tác máy quay (bấm máy quay).
+ Chứa sự kiện mô tả hay một hành động của một đối tượng.
+ Được người sử dụng lựa chọn như thực thể để chỉ mục.
- Cut detection: là quá độ từ shot này sang shot khác
+ Hard cut
+ Quá độ từ từ (gradual)[1].
Mặt khác để đại diện cho một cơ sở dữ liệu video, một số mô hình dữ liệu video
cụ thể thích hợp là rất quan trọng. Có 4 mô hình là:
 Mô hình quan hệ: có thể dùng để biểu diễn những mối quan hệ của dữ liệu.
 Mô hình hướng đối tượng: có thể dùng để biểu diễn những cấu trúc phức

tạp.
 Mô hình đối tượng – quan hệ được dùng để biểu diễn cơ sở dữ liệu video.
 Mô hình dữ liệu siêu ngữ nghĩa là thích hợp nhất vì nó có thể biểu diễn
được cả đối tượng, quan hệ và luật ràng buộc giữa chúng.
(Sẽ được trình bày cụ thể hơn trong phần 1.3)
1.1.2 Các yêu cầu đối với một mô hình dữ liệu video.
Để có được một mô hình dữ liệu video đáp ứng được các yêu cầu đã nêu
ra ở trên, chúng ta cần phải có được một số các yêu cầu cụ thể cho nó, các yêu
cầu ở đây bao gồm:
• Đầy đủ các khả năng của một CSDL truyền thống.
• Có khả năng lưu trữ lớn.
• Có khả năng khai thác dữ liệu thuận tiện.
• Có khả năng tích hợp, tổng hợp và thể hiện.
• Hỗ trợ truy vấn video.
• Có giao diện video và tương tác.
Bên cạnh các yêu cầu vừa nêu, để cho hệ thống hoạt động có thể hoạt động
tốt chúng ta cũng cần phải giả quyết các vấn đề sau:

15


• Hệ thống CSDL video sẽ được xây dựng như thế nào để có thể bao
gồm các lĩnh vực ứng dụng khác nhau.
• Xây dựng phần hạt nhân cho việc phân rã , lưu trữ và quản lý thông tin
ở mứcđộ nào? Các công nghệ, cấu trúc nền tảng được sắp xếp và sử dụng như thế
nào?
• Các kiến thức về tổng hợp dữ liệu đối với CSDL video, làm thê nào để
có thể phát triển được một ngôn ngữ truy vấn đáng tin cậy và có hiệu quả để hỗ
trợ cho vô số phương thức truy nhập và các kiểu đối tượng khác nhau. Làm thế
nào để ngôn ngữ truy vấn hỗ trợ được các đặc tính và hình thái khác nhau của

dữ liệu video.
• Xác định được hạ tầng thể hiện nào mà một hệ thống video phải có để đạt
được các yêu cầu và cách thức thể hiện khác nhau. Làm cách nào để hỗ trợ việc
đồng bộ hoá việc thể hiện các dữ liệu tạm thời cũng như các dữ liệu bộ phận
của các dữ liệu video khác nhau.
• Giả sử các kiểu media khác nhau có các yêu cầu cập nhật và sửa đổi
thông tin khác nhau thì hệ thống sẽ cập nhật các thành phần này như thế nào.
1.1.2.1 Khả năng quản trị lƣu trữ lớn

Hình 1.3: Mô hình khả năng lưu trữ của các hệ thống Video
16


Các yêu cầu về khả năng lưu trữ của các hệ thống video có thể được
đặc trưng bởi khả năng lưu trữ lớn và cách thức tổ chức theo thứ bậc (dạng
kim tự tháp) của hệ thống lưu trữ. Việc lưu trữ theo thứ bậc đặt các
đối tượng dữ liệu video trong một hệ thống phân bậc bao gồm các thiết bị
khác nhau, có thể là trực tuyến (online), không trực tuyến (offline). Một cách
tổng quát, mức cao nhất của hệ thống sẽ cho ta hiệu suất cao nhất, khả năng lưu
trữ nhỏ nhất, chi phí cao nhất và sự cố định ít nhất. Các lớp cao trong hệ
thống phân cấp này có thể sử dụng để lưu trữ các đối tượng tóm tắt nhỏ hơn
của một dữ liệu video hoàn chỉnh với mục đích cung cấp khả năng duyệt và
xem trước nhanh đối với nội dung của dữ liệu. Chi phí và hiệu suất (tính về mặt
thời gian) sẽ giảm dần nếu ta đi xuống các lớp phía dưới của hệ thống phân
cấp, cùng với điều này là sự tăng của khả năng lưu trữ và tính cố định. Thông
thường trong hầu hết các hệ thống lưu trữ video, mức cao nhất của lưu trữ
thường là RAM, tiếp theo đó là đĩa từ, các thiết bị này cung cấp các dịch vụ
trực tuyến (online services). Các thiết bị lưu trữ quang học cung cấp mức lưu
trữ tiếp theo, khái niệm trực tuyến ở đây có thể hiểu là gần như, tiêu biểu cho
các thiết bị lưu trữ kiểu này là các jukebox (CD-DVD jukebox). Mức thấp nhất

trong hệ thống lưu trữ phân cấp có thể là các thiết bị như băng từ, đĩa quang
hoặc các thiết bị tương tự, các thiết bị này cung cấp khả năng lưu trữ offline và
có thể không cần kết nối trức tiếp với máy tính. Chúng cung cấp khả năng lưu
trữ và tính cố định cao hơn nhưng cũng có hiệu suất kém nhất về thời gian
truy nhập. Vì những lý do trên, một MDBMS phải quản lý và tổ chức việc lưu
trữ đối với bất kỳ mức nào của hệ thống phân cấp, nó phải có cơ chế tự động
để chuyển các đối tượng dữ liệu video từ một mức này của hệ thống lưu trữ
phân cấp sang mức khác, việc chuyển cấp này phải dựa trên tần suất sử dụng
của dữ liệu video. Trong trường hợp dữ liệu video được lưu trữ ở các thiết bị
offline thì MDBMS cũng phải có được các thông tin trợ giúp cho việc dễ dàng
xác định các thiết bị cụ thể có chứa các thông tin cần truy xuất.
17


1.1.2.2 Hỗ trợ truy vấn và khai thác dữ liệu.
Truy vấn đối với dữ liệu video bao gồm các kiểu dữ liệu khác nhau,
các từ khoá, thuộc tính, nội dung vv…Do người dùng có thể có các cách suy
nghĩ khác nhau về dữ liệu video vì vậy kết quả thu được từ việc truy vấn dữ
liệu video có thể không hoàn toàn chính xác và có thể chỉ là các kết quả tương tự
hoặc là một phần của kết quả hơn là các kết quả chuẩn xác. Do việc có thể
kết quả là không chính xác nên chúng ta phải có khả năng phân hạng các kết
quả thu được sao cho chúng gần với yêu cầu truy vấn nhất, tương tự như vậy
chúng ta cũng phải có các phương thức để loại bỏ bớt những kết quả không
thoả mãn yêu cầu truy vấn. Việc làm này sẽ giảm thiểu các sai sót về mặt tính
toán trong quá trình tìm kiếm.
1.1.2.3 Tích hợp các phƣơng tiện, tổng hợp và thể hiện
Giả sử tính đa dạng của các kiểu dữ liệu đã được hỗ trợ, một MDBMS
cũng phải cung cấp khả năng để tích hợp các loại dữ liệu này để tạo
nên các kiểu dữ liệu video mới và thể hiện các dữ liệu này khi có yêu cầu
trong một khung thời gian yêu cầu. Độ phức tạp của việc tích hợp, tổng hợp và

thể hiện bị tăng thêm bởi các đặc tính cơ bản của dữ liệu video như tính liên
tục (tạm thời) của dữ liệu video đặc biệt là với các kiểu dữ liệu như video,
hoạt hình hoặc âm thanh. Hơn nữa, một vài ứng dụng cụ thể như các hệ
thống thông tin địa lý có thể đòi hỏi MDBMS cung cấp các thông tin bộ phận
(về một vùng, miền nào đó). Tất cả các yếu tố này kết hợp với nhau làm cho
việc tổng hợp và thể hiện video trở thành một quy trình phức tạp mà
MDBMS phải cung cấp để đáp ứng các yêu cầu mà người dùng đòi hỏi.
Các vấn đề về tích hợp có thể được cải thiện trong một số trường hợp, đặc biệt
là khi các hệ thống CSDL video được xây dựng nhằm phục vụ cho các cộng
đồng người dùng xác định trước. Trong các trường hợp đặc biệt này, MDBMS
có thể hỗ trợ một số tính năng mà các ứng dụng khác không cần đến [14].
18


1.1.2.4 Giao diện và tƣơng tác.
Sự khác nhau về bản chất của các dữ liệu video đòi hỏi phải có các giao
diện khác nhau để tương tác với dữ liệu. Thông thường, mỗi loại dữ liệu có các
phương thức truy nhập và thể hiện riêng của mình, ví dụ như dữ liệu video và
âm thanh sẽ đòi hỏi các giao diện người dùng khác nhau để thể hiện và truy
vấn. Đối với một vài ứng dụng Video, đặc biệt là sự có mặt của các loại dữ
liệu có tính liên tục người dùng thường đòi hỏi phải có các khả năng tương
tác với dữ liệu ( chẳng hạn như đối với dữ liệu VCR thì người dùng thường
mong muốn có chức năng như tua lên (fast forward) hoặc tua ngược lại
(reverse)). Khi mà một hệ thống Video cung cấp các dịch vụ như vậy thì nó
phải được liên kết vào CSDL đặc biệt là việc khai thác các đối tượng, tổng hợp
và đồng bộ chúng.
1.1.2.5 Hiệu suất.
Hiệu suất là một vấn đề quan trọng cần được xem xét đối với
một MDBMS. Các hệ thống CSDL video tạo ra hiệu suất dựa trên sự tối ưu hoá
việc truy nhập tới các media, lưu trữ, chỉ số hoá, khai thác và truy vấn . Sự có

tham gia của nhiều kiểu dữ liệu khác nhau trong CSDL video có thể đòi hỏi một
số phương thức đặc biệt để tối ưu hoá việc truy cập, lưu trữ, chỉ số hoá và khai
thác. Các yêu cầu này bao gồm hiệu quả, tính ổn định, đảm bảo và đồng bộ việc
trao đổi dữ liệu, chất lượng của dịch vụ (QoS).
1.1.3 Các mô hình dữ liệu video điển hình.
Mô hình dữ liệu là đơn vị trung tâm của một hệ thống CSDL video. Một
mô hình dữ liệu cần phải tách rời người dùng ra khỏi chi tiết của việc quản lý
các thiết bị lưu trữ và cấu trúc lưu trữ. Điều này đòi hỏi phải phát triển các mô
hình dữ liệu tương ứng để tổ chức các kiểu dữ liệu khác nhau tường gặp
trong các hệ thống CSDL video.
19


Các mô hình dữ liệu video (cũng giống như các mô hình dữ liệu
truyền thống khác) nắm bắt các đặc tính cố định cũng như động của nội dung
CSDL và vì vậy nó cung cấp các khuôn mẫu cơ bản cho việc phát triển các công
cụ cần thiết để sử dụng dữ liệu video. Các thuộc tính cố định có thể bao gồm
các đối tượng tạo nên dữ liệu video, mối liên hệ giữa các đối tượng, thuộc
tính của các đối tượng…Các đặc tính động bao gồm sự tương tác giữa các đối
tượng, sự hoạt động trên đối tượng, các tương tác của người dùng.
Tuy nhiên, do các tính chất đặc biệt của mình, dữ liệu video đòi hỏi phải
có các quan tâm mới khi chọn lựa mô hình dữ liệu. Ví dụ, một vài
kiểu dữ liệu video (chẳng hạn video) hoặc một nhóm các kiểu (video và hình
ảnh) có thể đòi hỏi các mô hình dữ liệu đăc biệt để cải thiện hiệu quả và tính
mềm dẻo. Hơn nữa, do tầm quan trọng của việc tương tác trong các hệ thống
video nên việc nó được hỗ trợ bỏi các mô hình dữ liệu trở nên quan trọng.
Rât nhiều các mô hình dữ liệu khác nhau như là mạng lưới, liên hệ, ngữ
nghĩa, và hướng đối tượng đang tồn tại và một vài số trong chúng đã được
xem xét để thiết lập CSDL video. Có hai cách tiếp cận cơ bản trong việc mô
hình hoá dữ liệu video là:



Phương pháp thứ nhất: xây dựng một mô hình dữ liệu

video trên nền tảng của mô hình dữ liệu của một CSDL truyền thống (thường
là CSDL quan hệ hoặc CSDL hướng đối tượng) bằng cách sử dụng các giao
diện tương ứng đối với dữ liệu video. Các vấn đề nẩy sinh với cách tiếp cận
này là các cấu trúc bên dưới (của CSDL truyền thống) không được thiết kế dành
cho dữ liệu video, hơn nữa sự khác biệt cơ bản các yêu cầu của một
CSDL truyền thống đối với CSDL video khiến cho giao diện trở thành nơi
nghẽn cổ chai trong toàn bộ hệ thống. Các vấn đề này dẫn tới cách tiếp cận
thứ hai .

20




Phương pháp thứ hai: phát triển các mô hình dữ liệu thực thụ dành

cho dữ liệu video từ đầu chứ không xây dựng trên cơ sở của các CSDL
truyền thống, tuy nhiên mọi người đều nhất trí rằng các nỗ lực như vậy đều
phải dựa trên kỹ thuật hướng đối tượng [13].
1.1.3.1 Mô hình đối tƣợng
Mỗi đối tượng trong hình tương ứng với một đối tượng trong mô hình đối
tượng.
Các thuộc tính của một đối tượng: khoảng thời gian, số frame, miêu tả nội
dung có thể được biểu diễn như là một biến.

Hình 1.4 Biểu diễn dữ liệu với mô hình đối tượng

1.1.3.2 Mô hình quan hệ

Hình 1.5 Biểu diễn dữ liệu với mô hình quan hệ

21


1.1.3.3 Mô hình đối tƣợng – quan hệ
Để hỗ trợ những mối quan hệ phức tạp của csdl đa phương tiện ta có thể xây
dựng phần mở rộng cho một mô hình dữ liệu.
• Các mối quan hệ phức tạp của csdl có thể bao gồm các mối quan hệ tạm
thời giữa các đối tượng
• Cần thiết mở rộng mô hình để quản lý dữ liệu và các chức năng khác.
• Kết hợp với mô hình dữ liệu là một ngôn ngữ truy vấn. Ngôn ngữ truy
vấn cần hỗ trợ những cấu trúc để thao tác với cơ sở dữ liệu đa phương
tiện.
• Ví dụ ta có thể truy vấn để chạy từ frame 500 đến 1000 của một đoạn
video
1.1.3.4 Mô hình dữ liệu siêu ngữ nghĩa
Với mô hình dữ liệu quan hệ - đối tượng và mô hình dữ liệu đối tượng, ta
không thể biểu diễn những ràng buộc theo ngôn ngữ tự nhiên. Mặc dù có thể thực
hiện chúng như là một phần của những phương thức, nhưng sẽ tốt hơn nếu biểu
diễn chúng một cách tự nhiên như là những điều kiện.
Mô hình siêu ngữ nghĩa cho phép chúng ta biểu diễn những ràng buộc [15].

Hình 1.6 Biểu diễn dữ liệu với mô hình siêu ngữ nghĩa.
22


1.2 Mô hình tổng quát về CSDL video

1.2.1 Khái quát về CSDL đa phƣơng tiện và CSDL video
Dữ liệu video được chia thành hai lớp là các dữ liệu liên tục và các dữ liệu
không liên tục. Các dữ liệu liên tục bao gồm các dữ liệu âm thanh, video thay đổi
theo thời gian. Các dữ liệu không liên tục là các dữ liệu không phục thuộc vào thời
gian, các loại dữ liệu đặc trưng cho dạng này là các dữ liệu văn bản (có hoặc không có
định dạng), hình ảnh tĩnh và các đối tượng đồ họa. Các kiểu dữ liệu thông thường của
một CSDL Video bao gồm:
• Dữ liệu văn bản (có hoặc không có định dạng).
• Đồ họa: là các bản vẽ, minh họa được mã hóa như các tệp postscript.


Hình ảnh: là các hình ảnh được mã hóa sử dụng các dạng thức

chuẩn như là JPEG hoặc MPEG.
• Các hoạt hình.
• Âm thanh.
• Video.
Các đặc tính chung của dữ liệu video bao gồm:
• Thiếu cấu trúc: Các dữ liệu v i d e o có khuynh hướng phi cấu trúc vì vậy
các tác nghiệp quản trị dữ liệu chuẩn như chỉ số hoá, tìm kiếm nội dung,
truy vấn dữ liệu thường là không áp dụng được.
• Tính tạm thời: Một vài kiểu dữ liệu video như là video, âm thanh và hoạt
hình đều phụ thuộc vào yếu tố thời gian liên quan mật thiết đến việc lưu
trữ, thao tác và mô tả chúng.
• Có dung lượng lớn: các dữ liệu video và âm thanh thường đòi hỏi các thiết
bị lưu trữ lớn.


Các ứng dụng hỗ trợ: các dữ liệu phi chuần có thể đòi hỏi các quy trình


xử lý phức tạp như việc sử dụng các thuật toán nén dữ liệu đối với các ứng dụng
CSDL Video.
Cơ sở dữ liệu đa phương tiện (MMDB) là một tập hợp các dữ liệu đa phương
23


tiện có liên quan.[1] Các dữ liệu đa phương tiện bao gồm một hoặc nhiều kiểu dữ
liệu phương tiện truyền thông chính như văn bản, hình ảnh, các đối tượng đồ họa (bao
gồm bản vẽ, phác thảo và hình minh họa) các chuỗi hình ảnh động, âm thanh và video.
Một hệ thống quản lý cơ sở dữ liệu đa phương tiện (MMDBMS) là một khung
quản lý các loại dữ liệu khác nhau có khả năng đại diện trong một sự đa dạng rộng của
các định dạng trên một mảng rộng các nguồn phương tiện truyền thông. Nó cung cấp
hỗ trợ cho các loại dữ liệu đa phương tiện, và tạo thuận lợi cho việc tạo ra, lưu trữ,
truy cập, truy vấn và kiểm soát của một cơ sở dữ liệu đa phương tiện.
1.2.2 Kiến trúc tổng thể CSDL video
Ở đây chúng ta xem xét tới 3 kiến trúc áp dụng cho việc tổ chức nội dung của
một hệ thống CSDL Video
1.2.2.1 Kiến trúc dựa trên nguyên lý tự trị
Nguyên lý này đề cập tới việc chúng ta nhóm tất cả các dữ liệu ảnh, dữ liệu
video và tất cả các dữ liệu văn bản và chỉ số hóa chúng theo nguyên tắc tối đa hóa
hiệu suất của tất cả các loại truy nhập đối với các loại dữ liệu mà chúng ta dự định.
Nguyên lý này đảm bảo rằng với mỗi loại dữ liệu (ảnh, video, văn bản) chúng đều
được tổ chức với một cách thức đặc trưng phù hợp với mỗi loại dữ liệu này.

Hình 1.7 Kiến trúc dựa trên nguyên lý tự trị

24


1.2.2.2 Nguyên lý đồng nhất

Một nguyên lý kiến trúc khác mà chúng ta có thể lựa chọn là nguyên lý đồng
nhất, nguyên lý này giúp chúng ta tìm được một cấu trúc tóm tắt chung cho tất cả
các loại dữ liệu. Cấu trúc này có thể được dùng trong việc chỉ số hóa tất cả các loại
dữ liệu qua đó tạo ra một “chỉ số thống nhất” mà chúng ta có thể dùng để truy cập
tới các đối tượng khác nhau. Hay nói một cách khác là chúng ta có thể trình bầy
tất cả các đối tượng khác nhau( ảnh, video, âm thanh, văn bản) trong một cấu trúc
dữ liệu duy nhất và qua đó phát triển các thuật toán để truy vấn cấu trúc dữ liệu này.

Hình 1.8 Kiến trúc dựa trên nguyên lý đồng nhất
1.2.2.3 Nguyên lý lai ghép
Ý tưởng của nguyên lý này là dựa trên sự kết hợp của 2 nguyên lý đã trình
bầy ở trên. Kết quả của nguyên lý này là một kiểu dữ liệu nào đó sử dụng chỉ số
(index) riêng của chúng, trong khi đó các kiểu dữ liệu khác sẽ sử dụng một chỉ số
(Index) “thống nhất”. Loại dữ liệu nào sử dụng kiểu chỉ số nào sẽ phụ thuộc vào các
đặc tính khác nhau sẽ được nói đến ở phần sau.
25


×