- 60 -
TÌM KIẾM DỮ LIỆU ĐA PHƯƠNG TIỆN
Nguyễn Đại Thắng Giáo viên hướng dẫn: PGS.TS Đỗ Trung Tuấn
Giới thiệu
Những tiến bộ gần đây trong công
nghệ đa phương tiện, công nghệ
Internet, công nghệ truyền thông và
sự bùng nổ của World Wide Web đã
đưa đến cuộc cách mạng mới cho
con người. Con người đã thực sự
bước vào kỉ nguyên đa phương tiện,
cùng với những tiện ích là hàng trăm
vấn đề nảy sinh. Trong đó vấn đề
n
ổi cộm là việc tìm kiếm ảnh, âm
thanh và video … để có thể tận dụng
được mọi tài nguyên sẵn có trong
các tuyển tập và trên Internet. Sự đa
dạng của các loại dữ liệu cũng như
kích thước ngày càng lớn của chúng
yêu cầu phải có những công cụ và
phương pháp khác nhau. Khoá luận
này tập trung vào các nguyên lý cơ
bản cũng như các công nghệ có thể
phát triển để tìm kiếm dữ liệu đa
phươ
ng tiện. Khoá luận cũng Demo
một hệ thống lưu trữ và tìm kiếm
Video sử dụng các thuộc tính gán.
Chương 1. Các vấn đề cơ bản trong tìm kiếm
dữ liệu đa phương tiện
Chương này đưa ra toàn bộ các vấn đề liên quan
đến tìm kiếm dữ liệu đa phương tiện. Với việc
trình bày các kiến thức từ cơ bản nhất cho đến
các vấn đề k
ĩ thuật, chương này có thể giúp ta
hiểu được mọi khía cạnh liên quan đến vấn đến
tìm kiếm dữ liệu đa phương tiện. Nội dung
chính như sau:
1.1. Giới thiệu
Giới thiệu về dữ liệu đa phương tiện và nhu cầu
tìm kiếm.
1.2. Tìm kiếm thông tin
Vấn đề tìm kiếm thông tin trong các hệ thống dữ
liệu đòi hỏi phải tuân theo một số tiêu chuẩn.
Trong
đó việc sử dụng các ngôn ngữ đánh chỉ số
(indexing language) là vấn đề cơ bản nhất cần
quan tâm. Việc sử dụng ngôn ngữ này giúp cho
các truy vấn người dùng và các mô tả đối tượng
trong cơ sở dữ liệu được thống nhất, từ đó giúp
việc tìm kiếm được thuận lợi.
1.3. Chuẩn bị các đối tượng thông tin
Các đối tượng thông tin trong thực tế là một mớ
hỗn độn, chúng ta phải tổ chức chúng vào cơ sở
dữ liệu sao cho việc khai thác và sử dụng là
thuận lợi nhất. Điều này đối với văn bản là điều
dễ dàng, tuy nhiên với loại dữ liệu âm thanh,
hình ảnh thì rất phức tạp.
1.4. Tìm kiếm đa phương tiện
Với các loại dữ liệu đa phương tiện khác nhau
thì phải có các cách thức tìm kiế
m khác nhau.
Tuy tất các chúng đều có thể đưa về tìm kiếm
văn bản tuy nhiên có một số đặc điểm ngăn cản
điều này. Ví dụ như đặc tính thời gian của các
Video, việc khó khăn khi nhận dạng các âm
thanh, tính chủ quan của người dùng v.v. Phần
này giải quyết các cách thức tìm kiếm cho các
dạng khác nhau của dữ liệu như văn bản, ảnh,
video…
1.5. Đối sánh
Việc tìm kiếm luôn luôn liên quan đế
n đối sánh
các mô tả đối tượng và truy vấn. Những phương
pháp đối sánh nào được sử dụng và hợp lý cho
loại dữ liệu nào được giải quyết trong phần này.
1.6. Đo đạc chất lượng
Trong khi xây dựng các hệ thống tìm kiếm đa
phương tiện ta luôn phải quan tâm đến chất
lượng cũng như hiệu suất của hệ thống. Các
thông số chính trong việc đo đạc hệ
thống như
độ chính xác, độ tìm kiếm được phân tích.
Chương 2. Một số hệ thống tìm kiếm
Chương này đưa ra các trang tìm kiếm áp dụng
các phương pháp đã đưa ra trong chương 1 để
- 61 -
minh họa cho tính ứng dụng của chúng. Các mặt
mạnh, yếu của các trang tìm kiếm đối với các
loại phương tiện (ảnh, âm thanh, Video…) được
phân tích.
Chương 3. Lưu trữ dữ liệu Video
Hệ thống lưu trữ Video có các đặc điểm rất khác
so với các hệ thống lưu trữ khác. Sự khác nhau
này xuất phát từ đặc tính không gian và thời
gian của Video. Do đó, việc xây dựng hệ thống
cần tính đến một số vấn đề:
3.1. Xây dựng mô hình dữ liệu Video
Có nhiều phương pháp mô hình hoá dữ liệu
Video để phù hợp với việc lưu trữ, phân tích và
tìm kiếm. Phần này đưa ra một số mô hình
chính và trực quan của Video cũng như các
điểm mạnh, điểm yếu của chúng.
3.2. Việc phân tích cảnh Video
Phân tích cảnh Video rất quan trọng trong việc
xác định ngữ ngữ của Video. M
ột số thuật toán
phát hiện sự thay đổi cảnh được đưa ra đối với
các cảnh thay đổi đột ngột, thay đổi từ từ và đối
với sự thay đổi cảnh trong Video nén.
3.3. Đánh chỉ số Video
Để tiện cho việc tìm kiếm, Video cần được đánh
chỉ số phù hợp. Ngoài các phương pháp giống
với văn bản, một số phương pháp khác đặc
trưng cho đ
ánh chỉ số Video cũng được đưa ra.
Chương 4. Hệ thống lưu trữ Video
Đối với một trường đại học hoặc một tổ chức
lớn thì các dữ liệu Video là rất phổ biến. Việc
lưu trữ và tìm kiếm loại dữ liệu này thường
không cần thiết phải sử dụng các công cụ mạnh
mà thường dùng các thuộc tính gán (giống như
văn b
ản) để hỗ trợ việc khai thác Video. Tôi xây
dựng một hệ thống Video đơn giản sử dụng các
thuộc tính do người dùng gán để hỗ trợ việc tìm
kiếm. Tuy nhiên để hỗ trợ cho một khối lượng
lớn dữ liệu thì hệ thống cần phải bổ xung các
công cụ của xử lý ngôn ngữ. Một hệ thống tham
khảo (The Digital Library Project) đang được
xây dựng tại trường
đại học University of
California, Berkeley, USA.
Tài liệu tham khảo.
[1] Gupta, T. Weymouth, and R. Jain M, The
VIMSYS model, 1991.
[2] T. G.A. Smith and G. Davenport, The
stratification system : A design environment
for random access memory, 1992.
[3] E. Oomoto and K. Tanaka, Design and
implementation of Video- object database
system, 1993.
[4] B. Shahraray, Scene change detection and
content-based sampling of Video sequences,
SPIE, 1995.
[5] K. Otsuji, Y. Tonomura, and Y. Ohba,
Video browsing using bright-ness data, 1991.
[6] Swanberg, C. F. Shu, R. Jain. Knowledge
guided parsing in Video databases, 1993.
[7] S. W. Smoliar and H. J. Zhang, Contenr-
Based Video indexing and Retrieval, 1994.
[8] Elsevier, A Rule- Base Video Database
System Architecture, 2002.
[9] Jelena Tesic, Intelligent Image Database
Seaching System, UCSB, 2002.
[10] ChrisTos Faloutsos, Multimedia Indexing,
Carnegie Mellon University, Pittsburgh,
Pennsylvania, 2002.
[11] Ying Li and C-c Jay Kuo, Introduction to
Content-Based Image Retrieval-Overview
of Key Techniques, University of Southern,
Los Angeles, California, 2002.
[12] Wallapak Tavanapong and Kien A.Hua,
Design and Implementation of a Video
Browsing System for The Internet,
Department of Computer Science, Iowa
State University, Ames, USA, 2001.
[13] Marti A.Hearst, Next Generation Web
Search: Setting Our Sites, University of
California, Berkeley, 2000.
[14] Arjen P.de Vries, Content Dependence in
Multimedia Database, Journal of The
American Society for Information Science
and Technology, 2001.
[15] Dr Andrew Salway, Modelling Multimedia
Information, Lectures of Surrey UK, 2005.