Tải bản đầy đủ (.pdf) (77 trang)

Các kỹ thuật nâng cao hiệu suất truy vấn cơ sở dữ liệu đa phương tiện

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.46 MB, 77 trang )

ĐẠI HỌC THÁI NGUYÊN

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

ĐÀO DUY TÙNG

CÁC KỸ THUẬT NÂNG CAO HIỆU SUẤT
TRUY VẤN CƠ SỞ DỮ LIỆU ĐA PHƢƠNG TIỆN

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

THÁI NGUYÊN - 2015
Số hóa bởi Trung tâm Học liệu – ĐHTN




ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

ĐÀO DUY TÙNG

CÁC KỸ THUẬT NÂNG CAO HIỆU SUẤT
TRUY VẤN CƠ SỞ DỮ LIỆU ĐA PHƢƠNG TIỆN
Chuyên ngành: KHOA HỌC MÁY TÍNH
Mã số: 60480101

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Người hướng dẫn khoa học:PGS.TSKH. NGUYỄN XUÂN HUY


THÁI NGUYÊN - 2015
Số hóa bởi Trung tâm Học liệu – ĐHTN




LỜI CAM ĐOAN
Tên tôi là: Đào Duy Tùng
Sinh ngày: 13-11-1988
Học viên lớp cao học K12I - Trƣờng Đại học Công nghệ thông tin và và
Truyền thông - Thái Nguyên.
Xin cam đoan: Đề tài “Các kỹ thuật nâng cao hiệu suất truy vấn cơ sở dữ liệu
đa phƣơng tiện” do thày giáo PGST.SKH Nguyễn Xuân Huyhƣớng dẫn là công
trình nghiên cứu của riêng tôi. Tất cả tài liệu tham khảo đều có nguồn gốc, xuất xứ
rõ ràng.
Tác giả xin cam đoan tất cả những nội dung trong luận văn đúng nhƣ nội
dung trong đề cƣơng và yêu cầu của thầy giáo hƣớng dẫn. Nếu sai tôi hoàn toàn
chịu trách nhiệm trƣớc hội đồng khoa học và trƣớc pháp luật.
Thái Nguyên, tháng 11 năm 2015
TÁC GIẢ LUẬN VĂN

Đào Duy Tùng

Số hóa bởi Trung tâm Học liệu – ĐHTN




LỜI CẢM ƠN
Sau sáu tháng nghiên cứu và làm việc nghiêm túc, đƣợc sự động viên, giúp

đỡ và hƣớng dẫn tận tình của thầy giáo hƣớng dẫn PGSTSKH Nguyễn Xuân Huy,
luận văn với đề tài “Các kỹ thuật nâng cao hiệu suất truy vấn cơ sở dữ liệu đa
phƣơng tiện” đã hoàn thành.
Tôi xin bày tỏ lòng biết ơn sâu sắc đến:
Thầy giáo hƣớng dẫn PGS.TSKH Nguyễn Xuân Huy đã tận tình chỉ dẫn,
giúp đỡ tôi hoàn thành luận văn này.
Khoa sau Đại học Trƣờng Đại học công nghệ thông tin và truyền thông đã
giúp đỡ tôi trong quá trình học tập cũng nhƣ thực hiện luận văn.
Tôi xin chân thành cảm ơn bạn bè, đồng nghiệp và gia đình đã động viên,
khích lệ, tạo điều kiện giúp đỡ tôi trong suốt quá trình học tập, thực hiện và hoàn
thành luận văn này.
TÁC GIẢ LUẬN VĂN

Đào Duy Tùng

Số hóa bởi Trung tâm Học liệu – ĐHTN




MỤC LỤC
LỜI CAM ĐOAN ........................................................................................................ i
LỜI CẢM ƠN .............................................................................................................ii
MỤC LỤC ................................................................................................................. iii
DANH MỤC CÁC HÌNH ẢNH ................................................................................ vi
DANH MỤC BẢNG BIỂU ......................................................................................vii
DANH MỤC CÁC TỪ VIẾT TẮT ........................................................................ viii
MỞ ĐẦU
CHƢƠNG 1: TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU ĐA PHƢƠNG TIỆN
VÀ KIẾN TRÚC TỔ CHỨC NỘI DUNG .............................................................. 1

1.1. Tình hình nghiên cứu chuyên đề trong và ngoài nƣớc ..................................... 1
1.1.1. Các dịch vụ đa phƣơng tiện trong giáo dục ..............................................1
1.1.2. Ứng dụng trong hội nghị điện tử ...............................................................2
1.1.3. Ngành công nghiệp giải trí ........................................................................3
1.1.4. Thƣơng mại điện tử ...................................................................................3
1.2. Mục tiêu nghiên cứu và phƣơng pháp thực hiện .............................................. 4
1.2.1. Mục tiêu nghiên cứu..................................................................................4
1.2.2. Phƣơng pháp nghiên cứu...........................................................................4
1.2.3. Nội dung thực hiện ....................................................................................4
1.3. Tổng quan về hệ quản trị cơ sở dữ liệu đa phƣơng tiện ................................... 5
1.3.1. Giới thiệu chung ........................................................................................5
1.3.2. Các kiểu truyền thông và multimedia .......................................................8
1.3.3. Hệ quản trị cơ sở dữ liệu đa phƣơng tiện (MMDBMS) ..........................10
1.3.4. Truy tìm thông tin tài liệu văn bản ..........................................................11
1.3.5. Truy xuất và chỉ số hoá multimedia ........................................................12
1.4. Kiến trúc tổ chức nội dung của một hệ thống cơ sở dữ liệu Multimedia ............ 13
1.4.1. Kiến trúc hệ thống quản trị cơ sở dữ liệu đa phƣơng tiện.......................13
1.4.2. Tổ chức dữ liệu đa phƣơng tiện trên cơ sở nguyên lý thống nhất ..........15
1.4.3. Cấu trúc tóm tắt media ............................................................................17
1.4.4. Dữ liệu ảnh nhƣ là một tóm tắt media.....................................................18
Số hóa bởi Trung tâm Học liệu – ĐHTN




1.4.5. Dữ liệu video nhƣ là một tóm tắt media. ................................................19
CHƢƠNG 2: TRÍCH CHỌN ĐẶC TRƢNG ẢNH .............................................. 20
2.1. Tổng quan về trích chọn đặc trƣng ảnh .......................................................... 20
2.1.1. Đặc trƣng văn bản đi kèm ảnh và tìm kiếm ảnh theo văn bản đi
kèm ảnh .............................................................................................................20

2.1.2. Đặc trƣng nội dung ảnh và tìm kiếm theo đặc trƣng nội dung. ..............22
2.2. Các phƣơng pháp trích chọn đặc trƣng ảnh và độ đo tƣơng đồng giữa
các ảnh ................................................................................................................... 25
2.2.1. Đặc trƣng màu sắc ...................................................................................26
2.2.2. Đặc trƣng kết cấu ....................................................................................28
2.2.3. Đặc trƣng hình dạng ................................................................................29
2.2.4. Đặctrƣng cục bộ bất biến ........................................................................30
2.2.5. Lựa chọn đặc trƣng .................................................................................34
2.3. Một số phƣơng pháp tìm kiếm ảnh theo nội dung ......................................... 37
2.3.1. Phƣơng pháp PageRank cho tìm kiếm ảnh sản phẩm .............................37
2.3.2. Phƣơng pháp xếp hạng lại ảnh dựa trên luật của ngƣời dùng
(CueFlik) ...........................................................................................................39
2.3.3. Phƣơng pháp tìm kiếm ảnh dựa trên màu sắc, hình dạng, kết cấu
của ảnh ..............................................................................................................40
2.3.4. Phƣơng pháp tìm kiếm ảnh dựa vào nội dung sử dụng các phân
vùng ảnh nhƣ mẫu truy vấn ...............................................................................43
2.4. Mô hình k láng giềng gần nhất sử dụng bộ lƣợng tử hóa .............................. 44
2.4.1. Cơ sở lý thuyết ........................................................................................45
2.4.2. Thuật toán K láng giềng .........................................................................50
2.4.3. Mô hình bài toán .....................................................................................52
CHƢƠNG 3: THỰC NGHIỆM VÀ ĐÁNH GIÁ ................................................. 55
3.1. Phát biểu bài toán ........................................................................................... 55
3.2. Cấu hình hệ thống .......................................................................................... 55
3.2.1. Cấu hình phần cứng ................................................................................55
3.2.2. Công cụ phần mềm sử dụng ....................................................................56
Số hóa bởi Trung tâm Học liệu – ĐHTN





3.2.3. Thƣ viện sử dụng.....................................................................................56
3.3. Xây dựng tập dữ liệu ảnh ............................................................................... 56
3.4. Quy trình, phƣơng pháp thực nghiệm ............................................................ 57
3.5. Kết quả thực nghiệm ...................................................................................... 60
KẾT LUẬN .............................................................................................................. 64
TÀI LIỆU THAM KHẢO ...................................................................................... 65

Số hóa bởi Trung tâm Học liệu – ĐHTN




DANH MỤC CÁC HÌNH ẢNH
Hình 1-1 Kiến trúc chung của một MMDBMS ........................................................ 13
Hình 2-1. Ví dụ hiển thị một ảnh .............................................................................. 21
Hình 2-2.Truy vấn của Google “d-80”...................................................................... 22
Hình 2-3. Truy vấn của Google “Apple” .................................................................. 22
Hình 2-4.Ví dụ về một số lọai kết cấu ...................................................................... 23
Hình 2-5.Một kết quả trả về của Google Image Swirl .............................................. 24
Hình 2-6.Một kết quả trả về của Tiltomo .................................................................. 24
Hình 2-7.Một kết quả của Byo Image Search ........................................................... 25
Hình 2-8. Biểu đồ mô phỏng việc tính toán các DoG ảnh từ các ảnh kề mờ ........... 32
Hình 2-9. Mỗi điểm ảnh đƣợc so sánh với 26 láng giềng của nó ............................. 33
Hình 2-10. Quá trình lựa chọn các điểm hấp dẫn ..................................................... 33
Hình 2-11. Biểu diễn các vector đặc trƣng ............................................................... 34
Hình 2-12. Ví dụ các ảnh sản phẩm trả về từ hệ thống của Jing.............................. 38
Hình 2-13. Tổng quan về mô hình của hệ thống tìm kiếm theo màu sắc, kết
cấu và hình dạng ........................................................................................ 41
Hình 2-14.Mô hình hệ thống IVFADCj; Hệ thống bên trái: chèn một vector
vào danh sách chỉ mục ngƣợc; hệ thống bên phải: tìm kiếm k láng

giềng gần nhất. ........................................................................................... 50
Hình 2-15. Mô hình giải quyết bài toán .................................................................... 53
Hình 3-1. Truy vấn iphone 6s plus ............................................................................ 58
Hình 3-2. Ảnh truy vấn ............................................................................................. 58
Hình 3-3. Độ đo khoảng cách của 10 ảnh ................................................................. 59
Hình 3-4. Ảnh đƣợc lƣợng tử hóa và tính khoảng cách giữa các vector .................. 60
Hình 3-5. Độ chính xác mức k của một số truy vấn ................................................ 62

Số hóa bởi Trung tâm Học liệu – ĐHTN




DANH MỤC BẢNG BIỂU

Bảng 1-1 Mô tả kích thƣớc kiểu dữ liệu ..................................................................... 8
Bảng 1-2. Liên hệ giữa đặc trƣng và trạng thái cho hình ảnh ................................... 19
Bảng 1-3. Liên hệ giữa đặc trƣng và trạng thái cho video ........................................ 19
Bảng 2-1. Một số phƣơng pháp lựa chọn đặc trƣng.................................................. 36
Bảng 3-1. Cấu hình phần cứng sử dụng trong thực nghiệm ..................................... 55
Bảng 3-2. Công cụ phần mềm sử dụng trong thực nghiệm ...................................... 56
Bảng 3-3. Một số thƣ viện sử dụng trong thực nghiệm ............................................ 56
Bảng 3-4. Kết quả độ chính xác trung bình của 10 truy vấn .................................... 62

Số hóa bởi Trung tâm Học liệu – ĐHTN




DANH MỤC CÁC TỪ VIẾT TẮT


Từ viết tắt
DBMS

Tiếng Anh
Database Management System

Hệ quản trị cơ sở dữ liệu
Cơ sở dữ liệu

CSDL
IR

Tiếng Việt

Information Retrieval

Hệ thống tự động truy tìm
thông tin

MMDBMS Multimedia Database Management Hệ thống quản trị cơ sở dữ liệu

MIRS

System

đa phƣơng tiện

Multimedia Indexing & Retrieval


Hệ thống chỉ mục và truy

System

tìm thông tin đa phƣơng tiện

MRI

Magnetic Resonance Imaging

WWW

World Wide Web

Số hóa bởi Trung tâm Học liệu – ĐHTN




MỞ ĐẦU
Thế kỷ 21 hứa hẹn những bƣớc phát triển nhảy vọt hơn nữa trong lĩnh vực
công nghệ thông tin. Những ứng dụng công nghệ thông tin vào đời sống thực tiễn và
nghiên cứu khoa học đƣợc đánh giá rất triển vọng, mở ra những thành công to lớn.
Chƣa bao giờ ngƣời dùng lại có nhiều cơ hội lựa chọn và tận hƣởng những gì
mà đa phƣơng tiện đem lại nhƣ ngày nay. Trong số đó, hình ảnh, âm thanh kỹ thuật số
kết hợp với các dịch vụ có ý nghĩa thực tiễn và quan trọng trong nhiều lĩnh vực kinh tế
xã hội nhƣ thƣơng mại điện tử, dịch vụ truyền hình, đài phát thanh, hội thảo truyền
hình qua mạng, học tập trực tuyến, xem video, tìm kiếm âm nhạc theo yêu cầu, ...
Dữ liệu đa phƣơng tiện ngày càng đóng vai trò không thể thiếu trong cuộc
sống, các trang thiết bị hiện đại phục vụ cho đời sống, nghiên cứu khoa học, quân sự

... sử dụng một khối lƣợng khổng lồ các loại dữ liệu đa phƣơng tiện khác nhau. Trong
đó, việc tăng tốc độ truy cập dữ liệu bằng cách sử dụng các cấu trúc dữ liệu hợp lý,
phục vụ những yêu cầu của hệ thống cơ sở dữ liệu là vấn đề cần phải giải đáp.
Sự phát triển mạnh mẽ của công nghệ ảnh số đã làm lƣợng ảnh lƣu trữ trên
web tăng lên một cách nhanh chóng đòi hỏi phải có các công cụ hỗ trợ tìm kiếm ảnh
hiệu quả và tiện lợi. Mặc dù các công cụ tìm kiếm ảnh theo văn bản đi kèm ảnh ra
đời cho phép ngƣời dùng tìm kiếm ảnh với thời gian đáp ứng khá nhanh, tuy nhiên,
các công cụ này vẫn còn hạn chế trong việc giải quyết nhập nhằng giữa nội dung
câu truy vấn và nội dung hiển thị của ảnh trả về. Sự ra đời của các công cụ tìm kiếm
ảnh theo nội dung ảnh đã giải quyết đƣợc những nhập nhằng trên.
Mục tiêu của luận văn là nghiên cứu các phƣơng pháp biểu diễn đặc trƣng
ảnh để tối ƣu hóa chất lƣợng tìm kiếm ảnh. Đầu tiên, luận văn khảo sát phƣơng
pháp trích chọn đặc trƣng ảnh trong tìm kiếm và xếp hạng ảnh. Tiếp đó, dựa theo
phƣơng pháp lƣợng tử hóa tích của Hervé Jégou và cộng sự [3],tác giả đƣa ra một
mô hình tìm kiếm K láng giềng gần nhất kết hợp độ đo tƣơng đồng về khoảng cách
giữa các vector đặc trƣng và tiến hành thực nghiệm mô hình.

Số hóa bởi Trung tâm Học liệu – ĐHTN




CHƢƠNG 1 : TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU ĐA PHƢƠNG TIỆN VÀ
KIẾN TRÚC TỔ CHỨC NỘI DUNG
1.1. Tình hình nghiên cứu chuyên đề trong và ngoài nƣớc
Trong những năm gần đây, nhu cầu sử dụng thông tin đa phƣơng tiện ngày
càng lớn. Chúng đƣợc sử dụng trong đời sống hàng ngày của con ngƣời và đem lại
hiệu quả mạnh hơn nhiều so với các dữ liệu truyền thống khác.Hiện có rất nhiều nhà
nghiên cứu trong nƣớc và nƣớc ngoài đã và đang tập trung nghiên cứu về cơ sở dữ
liệu đa phƣơng tiện nhờ vào những ứng dụng thực tiễn của nó nhƣ :

1.1.1. Các dịch vụ đa phương tiện trong giáo dục
Ngày nay, nhiều trƣờng đại học đã cung cấp chƣơng trình giáo dục từ xa cho
những ngƣời không có điều kiện tham gia lớp học với những lý do khác nhau nhƣ
do điều kiện địa lý hay thời gian để có thể theo các khoá học. Khoá học nhƣ vậy
thông thƣờng đƣợc tiến hành với việc gửi các tài liệu học tập nhƣ sách báo, băng
ghi hình, bên cạnh đó một số nơi có thể cho phép học viên sử dụng máy tính truy
cập trực tuyến các kho tài liệu dƣới dạng các đoạn phim tƣ liệu, băng tiếng liên
quan đến việc học tập.
Trên thế giới việc nghiên cứu và triển khai hệ thống quản lý giáo dục từ xa tại
các nƣớc phát triển đã đƣợc tiến hành tốt đẹp và đã hình thành ra một thị trƣờng với
tiềm năng to lớn. Các sản phẩm hoàn thiện chính trên thế giới có thể kể đến[5]:
Sản phẩm thƣơng mại


BlackBoard ( - Mỹ)



WebCT ( - Mỹ)

 Sản phẩm mã nguồn mở


ATutor ( - Canada)



Moodle ( - Mỹ )




ILIAS ( Đức)

1


Tại Việt Nam, trong những năm gần đây, nhiều trƣờng học đã và đang nghiên cứu
và giới thiệu các sản phẩm quản lý và giảng dạy từ xa:
 ĐHQGTPHCM với hệ thống đào tạo đƣợc truy cập theo địa chỉ
www.vnuit.edu.vn.
 Đại học Cần Thơ tại dec.ctu.edu.vn cho khóa học tiếng Anh, IT.,
 Đại học Quốc gia Hà Nội với website môn học thử nghiệm
www.fotech.vnu.edu.vn/courses/
 Khoa CNTT Viện Đại học Mở Hà Nội với
www.fithou.edu.vn/vietnamese/Tructuyen.asp
 Trung tâm Vitec (Việt-Nhật) với www.vitec.org.vn,
1.1.2. Ứng dụng trong hội nghị điện tử
Tại các nƣớc phát triển trên thế giới, ứng dụng hội nghị điện tử đƣợc chính
phủ quan tâm đầu tƣ một cách nghiêm túc, và thu đƣợc những thành công nhất định.
Tại các tập đoàn, công ty đa quốc gia lớn những ứng dụng hội nghị điện tử, trực
tuyến đƣợc sử dụng trong các mục đích hội họp, trao đổi với các đơn vị thành viên
đặt tại các quốc gia khác nhau nhằm đƣa ra các quyết định, chiến lƣợc kinh doanh
mà không cần phải gặp mặt trực tiếp vẫn có thể cảm nhận đƣợc tầm vóc của một
cuộc họp, hội nghị nhờ những công nghệ tiên tiến tạo ra. Các tập đoàn tin học lớn
đã đầu tƣ công nghệ vào việc sản xuất ra những sản phẩm phục vụ nhu cầu trên và
thu đƣợc lợi nhuận lớn lao. Công nghệ Hội nghị truyền hình đã dần trở nên phổ biến
trên thị trƣờng Việt Nam. Với nhiều tiện ích nhƣ khả năng tƣơng tác tức thời, tiết
kiệm thời gian tổ chức, giảm thiểu chi phí, thời gian đi lại hội họp. Công nghệ Hội
nghị truyền hình đã trở thành sự lựa chọn hàng đầu của các doanh nghiệp trong ứng
dụng hội họp và đào tạo.

Tại Việt Nam một số sản phẩm hoàn thiện phải kể đến:
Viettel là đơn vị đi đầu trên thế giới với mạng truyền hình hội nghị XConference /> Hội nghị trực tuyến toàn quốc về cải cách thủ tục hành chính, thành phố Cần
Thơ www.cchccantho.gov.vn

2


 Cầu truyền hình VNPT phục vụ hội nghị thanh tra:
 Hội nghị truyền hình công ty cổ phần viễn thông Á Châu:
www.sieuthivienthong.com.
1.1.3. Ngành công nghiệp giải trí
Trong một tƣơng lai rất gần, nhu cầu về phim ảnh theo yêu cầu sẽ rất lớn.
Ngƣời sử dụng có thể dễ dàng chọn các bộ phim tại nhà và xem chúng qua tivi tại
nhà. Cũng nhƣ việc ứng dụng đa phƣơng tiện trong lĩnh vực giáo dục miêu tả ở trên,
trong lĩnh vực điện ảnh ngƣời sử dụng có thể lựa chọn phim mong muốn bằng cách
trộn cả truy vấn tìm kiếm và duyệt. Một hệ thống đa phƣơng tiện hỗ trợ tƣơng tác
nhƣ vậy của ngƣời sử dụng thì phải có khả năng tìm kiếm hiệu quả qua các website
những bộ phim thoả mãn nhu cầu của ngƣời sử dụng. Hơn thế nữa, ngƣời sử dụng
nên có đƣợc khả năng xem trƣớc những mẩu phim giới thiệu mà họ mong muốn.
Ngoài ra, họ nên đƣợc quyền xem xét các bài phê bình về bộ phim, với sự cân nhắc
nhƣ vậy có thể giúp ngƣời sử dụng lựa chọn đƣợc những bộ phim mà ngƣời sử dụng
thực sự muốn xem.Các sản phẩm hoàn thiện có thể kể đến:
/> /> /> /> /> />
1.1.4. Thương mại điện tử
Trong những năm gần đây, với sự bùng nổ của Internet, thƣơng mại điện tử
cũng đã phát triển mạnh mẽ trên toàn thế giới. Tại các nƣớc đang phát triển nhƣ
Mỹ, Canada, liên minh Châu Âu (EU) thƣơng mại điện tử đã đƣợc áp dụng rất rộng
rãi và mang lại nhiều lợi ích cho cả ngƣời sử dụng cũng nhƣ các nhà cung cấp.
Hệ thống bán hàng qua mạng (online)là một trong những ứng dụng quan
trọng nhất trong thƣơng mại điện tử, chính vì vậy luận văn sẽ tập trung xây dựng

demo trên mô hình này, bao gồm những mục tiêu chính sau:
3




Mục đích: Hệ thống đƣợc thiết kế và xây dựng theo mô hình B2C, B2B.
Việc xây dựng hệ thống bao gồm các công việc: xây dựng hệ thống thực
hiện việc đăng ký giới thiệu, quảng bá các hàng hoá sản phẩm của doanh
nghiệp, quản lý các loại hàng hóa sản phẩm, quản lý việc kinh doanh hàng
hoá và thực hiện mua bán hàng hoá sản phẩm.



Phạm vi: Trên mạng Internet, mô hình Client-Server. Hệ thống đƣợc
hosting trên một ISP (nhà cung cấp dịch vụ) trong nƣớc



Ứng dụng công nghệ mới: Áp dụng các kỹ thuật đa phƣơng tiện tiến tiến
nhằm mục đích nâng cao hiệu quả kinh doanh của hệ thống.

1.2. Mục tiêu nghiên cứu và phƣơng pháp thực hiện
1.2.1. Mục tiêu nghiên cứu
Mục tiêu của luận văn là nghiên cứu các phƣơng pháp biểu diễn đặc trƣng
ảnh để tối ƣu hóa chất lƣợng tìm kiếm ảnh.
1.2.2. Phương pháp nghiên cứu
- Nghiên cứu tài liệu
- Thống kê dữ liệu
- Thử nghiệm dữ liệu

- Xây dựng, phát triển phần mềm
1.2.3. Nội dung thực hiện
Nội dung chính của luận văn là kiến trúc tổ chức nội dung của một hệ thống
cơ sở dữ liệu đa phƣơng tiện, khảo sát phƣơng pháp trích chọn đặc trƣng ảnh trong
tìm kiếm và xếp hạng ảnh. Đƣa ra một mô hình tìm kiếm K láng giềng gần nhất kết
hợp độ đo tƣơng đồng về khoảng cách giữa các vector đặc trƣng và tiến hành thực
nghiệm mô hình.
Phạm vi nghiên cứu
Cấu trúc nội dung của luận văn đƣợc trình bày theo bố cục nhƣ sau:

4




Chƣơng 1: Trình bày tổng quan về tình hình nghiên cứu chuyên đề trong và
ngoài nƣớc.



Chƣơng 2:Khái quát về lựa chọn đặc trƣng cho tìm kiếm ảnh. Các đặc trƣng
về về văn bản đi kèm ảnh và đặc trƣng về nội dung ảnh. Các phƣơng pháp lựa
chọn đặc trƣng và độ đo tƣơng tự giữa ảnh. Trình bày một số đặc trƣng về nội
dung ảnh và một số độ đo tƣơng đồng tƣơng ứng với các đặc trƣng.Giới thiệu
một số công trình nghiên cứu liên quan đến tìm kiếm ảnh theo nội dung ảnh.
Đƣa ra mô hình tìm kiếm K láng giềng gần nhất. Giới thiệu mô hình tìm kiếm
K láng giềng gần nhất, phƣơng pháp lƣu trữ và đánh chỉ mục trong tìm kiếm.




Chƣơng 3: Tập trung nghiên cứu và cài đặt thử nghiệm mô hình K láng giềng
gần nhất sử dụng bộ lƣợng tử hóa trên có sở bài toán bán hàng qua mạng.



Phần kết luận trình bày tóm tắt về các nội dung thực hiện trong luận văn,
đồng thời đƣa ra các vấn đề nghiên cứu tiếp cho tƣơng lai.

1.3. Tổng quan về hệ quản trị cơ sở dữ liệu đa phƣơng tiện
1.3.1. Giới thiệu chung
Trong những năm gần đây xuất hiện nhu cầu vô cùng lớn về khả năng khai
thác và xử lý dữ liệu với số lƣợng khổng lồ mà nó là điều không dễ dàng diễn tả chỉ
với việc sử dụng các ký tự. Các kiểu dữ liệu đó là ảnh, video, tài liệu, âm thanh (dữ
liệu Media). Multimedia là tập hợp các kiểu media đƣợc sử dụng với nhau (dữ liệu
đa phƣơng tiện). Hệ quản trị CSDL đa phƣơng tiện (Multimedia DataBase
Management System-MMDBMS) là một hệ thống giúp ngƣời dùng thao tác trên các
dữ liệu media một cách thích hợp và hiệu quả. Các thao tác cơ bản của hệ quản trị
CSDL thƣờng là chèn, cập nhật, xoá và tìm kiếm một đối tƣợng trong CSDL. Nhƣ
vậy ta có thể nói rằng CSDL đa phƣơng tiện là tập hợp các đối tƣợng phƣơng tiện
với các kiểu khác nhau. Sau đây là một số kiểu dữ liệu đƣợc đề cập đến:
Dữ liệu hình ảnh (Image data): Ví dụ một học viên phẫu thuật muốn thực
hành một ca phẫu thuật trên một bệnh nhân ảo có những triệu chứng sinh lý nào đó.
Trong thực tế để tìm ra bệnh nhân với những triệu chứng mong muốn, học viên

5


phẫu thuật phải truy vấn cơ sở dữ liệu (CSDL) ảnh phân tán và kích thƣớc lớn chứa
ảnh X quang hay MRI (Magnetic Resonance Imaging) của các bệnh nhân với các
triệu chứng tƣơng tự. [2]

Dữ liệu Video (Video data): Tƣơng tự nhƣ vậy, cùng với sự phát triển bùng nổ
của các thiết bị nghe nhìn nhƣ hiện nay thì kiểu dữ liệu Video đang ngày càng tràn
ngập trên khắp mọi nơi. Bên cạnh đó khi mà công nghệ lƣu trữ hiện đại ngày nay
làm cho việc lƣu trữ các dữ liệu Video không phải là bài toán khó giải thì việc truy
xuất dữ liệu để tìm kiếm thông tin theo yêu cầu trong kho dữ liệu khổng lồ nhƣ thế
là một vấn đề rất đáng quan tâm. Giả sử học viên của một trƣờng đại học muốn tìm
kiếm những tƣ liệu băng hình về một chủ đề kỹ thuật nào đó trong thƣ viện của
trƣờng. Nhƣ vậy đòi hỏi phải truy vấn thƣ viện băng hình mà nó bao gồm tập hợp
vô số các băng hình với nội dung kỹ thuật.[2]
Dữ liệu âm thanh (Audio data): Dữ liệu âm thanh đƣợc sử dụng trong những
ứng dụng, thiết bị nhƣ nhận dạng giọng nói, xử lý âm thanh, điều khiển thiết bị bằng
giọng nói..Ví dụ, các sinh viên học từ xa muốn có các đoạn audio bài giảng của giáo
viên. Hoặc các sinh viên ngoại ngữ muốn có các đoạn audio các cuộc đàm thoại.
Trong trƣờng hợp này cần phải tập hợp các đoạn audio theo một chủ đề nào đó cho
thuận tiện. [2]
Dữ liệu tài liệu (Document data): Các đoạn văn bản, các từ, câu, đoạn văn,
chƣơng...là một CSDL văn bản truyền thống. Một CSDL tài liệu khác văn bản ở chỗ
nó không chỉ chứa các thông tin dạng văn bản thô mà còn chứa đựng cả cấu trúc và
hình ảnh nhúng. Hoặc khi ta xem sách, trong sách không chỉ chứa dữ liệu văn bản
mà còn chứa cả hình ảnh. Giả sử ngƣời đọc muốn tìm một bức ảnh nào đó nhƣng
không thể tìm trong CSDL ảnh. Tuy nhiên nếu có một thƣ viện điện tử số để truy
cập thì việc tìm thấy bức ảnh mong muốn là rất dễ dàng. Nhƣ vậy, dữ liệu tài liệu
bao gồm các phƣơng tiện quan trọng mà trong đó các thông tin có thể đƣợc lƣu trữ
dƣới dạng điện tử. [2]
Những năm trƣớc đây khi nhiều dữ liệu dạng văn bản (text) đƣợc lƣu trữ dƣới
khuôn dạng máy tính có thể xử lý và lƣu trữ. Từ đó dẫn tới phát triển các hệ thống

6



quản trị CSDL mà ngày nay đƣợc sử dụng trong hầu hết các tổ chức, cơ quan. Tuy
nhiên, các hệ quản trị CSDL này không thể quản lý dữ liệu đa phƣơng tiện một cách
hiệu quả bởi vì các tính chất dữ liệu văn bản và dữ liệu đa phƣơng tiện là khác nhau,
và CSDL đa phƣơng tiện với các dữ liệu ảnh, video, âm thanh... thƣờng là rất lớn.
Do vậy, việc nghiên cứu phát triển hệ thống quản trị CSDL có khả năng quản lý dữ
liệu đa phƣơng tiện với các kỹ thuật truy tìm và chỉ mục mới là rất cần thiết.
MMDBMS là một khung làm việc để quản lý các kiểu dữ liệu khác nhau mà chúng
đƣợc thể hiện trong rất nhiều khuôn dạng khác nhau. Để làm việc thành công thì
một MMDBMS phải có các khả năng sau:
Có khả năng truy vấn đồng bộ dữ liệu (dữ liệu media và dữ liệu văn bản) đƣợc
thể hiện trong các định dạng khác nhau. Thí dụ: một MMDBMS sẽ có khả năng truy
vấn và tích hợp dữ liệu mà nó đƣợc lƣu trong các CSDL khác nhau mà có thể sử
dụng các lƣợc đồ khác nhau, cũng nhƣ việc truy vấn tệp và dữ liệu lƣu trữ trong
DBMS hƣớng đối tƣợng hay DBMS không gian. Việc xử lý các truy vấn nhƣ vậy là
khá phức tạp vì trên thực tế việc nhận biết đƣợc nội dung của các kiểu media là vấn
đề thách thức và nó phụ thuộc rất nhiều vào kiểu dữ liệu và cách thức lƣu trữ chúng.
Cuối cùng, truy vấn có thể mở rộng đối với nhiều kiểu vật mang (media) dữ liệu và
MMDBMS phải có khả năng kết hợp các kết quả từ các nguồn dữ liệu khác nhau và
các kiểu media khác nhau.
Có khả năng truy vấn dữ liệu biểu diễn trong media khác nhau. Ví dụ: một
MMDBMS phải có khả năng truy vấn không chỉ trong CSDL hình ảnh mà còn cả
trong CSDL âm thanh và CSDL quan hệ, sau đó kết hợp các kết quả với nhau.
MMDBMS phải có khả năng khai thác các đối tƣợng mang tin (media) từ một
thiết bị lƣu trữ cục bộ một cách trơn tru, không có jitter (phải liên tục). Bởi các đối
tƣợng mang tin (video, âm thanh…) thƣờng chiếm một không gian vô cùng lớn.
MMDBMS phải có khả năng tạo ra các câu trả lời từ truy vấn và có khả năng
trình diễn các câu trả lời này bằng các phƣơng tiện nghe nhìn.
Mỗi một hệ thống có đầy đủ các đặc tính yêu cầu trên là chƣa đủ mà còn cần
phải có khả năng phân phối các trình diễn theo một cách nào đó nhằm thoả mãn các
yêu cầu khác nhau về chất lƣợng thể hiện của các thiết bị.


7


1.3.2. Các kiểu truyền th ng v mu timedia
Đa phƣơng tiện (multimedia) là một lĩnh vực của Công nghệ thông tin có
mục đích nhiên cứu và đề xuất các công cụ trợ giúp việc xử lý lƣu trữ, truyền các dữ
liệu thích hợp nhƣ: văn bản (Text), biểu đồ, đồ thị (graphic), hoạt hình (animation),
ảnh (image), video, audio, hoặc kết hợp các media với nhau (video + audio + văn
bản diễn giải)...
Ngƣời ta thƣờng phân media thành hai loại dựa trên quan hệ của chúng với
thời gian. Đó là:
Đa phƣơng tiện tĩnh(Static media): Không có chiều thời gian. Thông tin
không liên quan tới thời gian. Ví dụ cho loại này là văn bản, hình họa, ảnh chụp.
Đa phƣơng tiện động(Dynamic media): Có chiều thời gian. Thông tin có quan
hệ chặt chẽ với thời gian và thông tin phải đƣợc trình diễn với thời gian xác định. Ví
dụ các loại audio, video, animation, game online...
So với dữ liệu truyền thống nhƣ văn bản và số, dữ liệu đa phƣơng tiện có
một số đặc điểm rất khác biệt, đó là:
Kích thƣớc dữ liệu lớn: dữ liệu đa phƣơng tiện có kích thƣớc lớn hơn nhiều so
với các kiểu dữ liệu số và văn bản thông thƣờng. Một văn bản thô có 200 từ
(khoảng 1000 ký tự) chỉ có kích thƣớc là 1kByte, nhƣng nếu lƣu văn bản đó bằng
định dạng ảnh GIF thì kích thƣớc gấp khoảng 10 lần. Một giọng nói đơn sắc đƣợc
lƣu với định dạng .WAV trong thời gian 1 phút có kích thƣớc khoảng 2640 kByte
(đã nén) hoặc xấp xỉ 6-8 MB (chƣa nén). Một cảnh video rất ngắn chứa hàng trăm
bức ảnh với kích thƣớc có thể lên đến hàng chục MB..., xem bảng minh họa:
Kiểu

Mô tả


Kích thƣớc

Plain text

khoảng 200 từ (1000 ký tự)

1 kByte

tệp Winword

khoảng 200 từ (1000 ký tự)

15 kByte

Ảnh GIF

khoảng 200 từ (1000 ký tự, 210 x 100mm)

10 kByte

Âm thanh WAVE

giọng nói (1 phút, 22KHz, 16 bit, mono)

2640 kByte

Bảng1-1 Mô tả kích thước kiểu dữ liệu
8



Số lƣợng dữ liệu đồ sộ: ngƣời ta ƣớc tính, chỉ riêng trên WWW có số lƣợng
lên đến hàng tỉ ảnh, hàng trăm triệu bài hát MP3 và vài chục triệu phim video.
 Một số dữ liệu đa phương tiện phụ thuộc thời gian
Audio và video có thêm chiều thời gian. Khi trình diễn audio và video thì chất
lƣợng của chúng phụ thuộc chặt chẽ vào tốc độ trình diễn.
Ví dụ, video phải đƣợc trình diễn với tốc độ 25 đến 30 hình/giây để có thể
cảm nhận đƣợc hình ảnh chuyển động tốt.
 Tìm kiếm dựa trên cơ sở tương tự
Trong cơ sở dữ liệu quan hệ, phƣơng pháp tìm kiếm truyền thống đối với dữ
liệu dạng văn bản và số là tìm kiếm chính xác. Đối với dữ liệu đa phƣơng tiện,
ngƣời dùng thƣờng đặt ra yêu cầu tìm kiếm một đối tƣợng tƣơng tự theo nội dung
mà họ đƣa ra. Ví dụ, một nghiên cứu khoa học cho biết con ngƣời có khả năng nhận
biết một bài hát thông qua giai điệu tốt hơn thông qua tên bài hát.
 Đồng bộ
Một số ứng dụng đa phƣơng tiện sử dụng hệ thống thời gian thực. Hệ thống
thời gian thực là hệ thống mà trong đó sự đúng đắn của việc thực hiện thao tác
không chỉ phụ thuộc vào việc thu đƣợc kết quả đúng mà còn phải đƣa ra kết quả
đúng thời điểm. Ví dụ, các tệp phim, bài giảng, truyền hình trực tiếp, hội nghị, hội
thảo qua mạng (video conference), xem video theo yêu cầu (video on demand) ... thì
yêu cầu hình ảnh phải đƣợc đồng bộ với âm thanh.
 Chất lượng dịch vụ
QoS là một tập các yêu cầu về chất lƣợng đối với các hoạt động tổng thể
chung của một hoặc nhiều đối tƣợng. Các tham số QoS mô tả tốc độ và độ tin cậy
của việc truyền dữ liệu nhƣ thông lƣợng, trễ, tỷ lệ lỗi... Các ứng dụng đa phƣơng
tiện khi truyền qua mạng thƣờng đòi hỏi yêu cầu cao về QoS, nhất là các dịch vụ đa
phƣơng tiện tƣơng tác thời gian thực nhƣ điện thoại internet, hội thảo qua mạng.
Các dịch vụ này thƣờng đòi hỏi khắt khe về độ trễ (tối đa là vài trăm ms). Để xác
định QoS, ngƣời ta dựa vào các tham số sau đây:

9



-

Độ trễ: là khoảng thời gian cực đại để truyền dữ liệu.

-

Jitter: là độ biến đổi độ trễ.

-

Thông lượng: là tổng số dữ liệu cực đại đƣợc truyền đi trên một đơn
vị thời gian.

-

Tỷ số mất tin: là số dữ liệu cực đại bị mất trên một đơn vị thời gian.

1.3.3. Hệ quản trị cơ sở dữ liệu đa phương tiện (MMDBMS)
Trung tâm của một hệ thống thông tin multimedia chính là hệ quản trị CSDL
MULTIMEDIA (MDBMS). Theo truyền thống, một CSDL bao gồm một bộ các dữ
có liên quan về một thực thể cho trƣớc hoặc một hệ quản trị CSDL (DBMS) là một
bộ các dữ liệu có liên quan đến nhau với một tập hợp các chƣơng trình đƣợc dùng
để khai báo, tạo lập, lƣu trữ, truy cập và truy vấn CSDL. Tƣơng tự nhƣ vậy, chúng
ta có thể xem một CSDL MULTIMEDIA là một tập các loại dữ liệu multimedia
nhƣ văn bản, hình ảnh, video, âm thanh, các đối tƣợng đồ hoạ….Một hệ quản trị
CSDL MULTIMEDIA (MDBMS) cung cấp hỗ trợ cho các loại dữ liệu
MULTIMEDIA trong việc tạo lập, lƣu trữ, truy cập, truy vấn và kiểm soát.
Sự khác nhau của các kiểu dữ liệu trong CSDL MULTIMEDIA có thể đòi hỏi

các phƣơng thức đặc biệt để tối ƣu hoá việc lƣu trữ, truy cập, chỉ số hoá và khai
thác. MDBMS cần phải cung cấp các yêu cầu đặc biệt này bằng cách cung cấp các
cơ chế tóm tắt bậc cao để quản lý các kiểu dữ liệu khác nhau cũng nhƣ các giao diện
thích hợp để thể hiện chúng.
Các yêu của của MDBMS:
 Các phương pháp tìm kiếm dựa theo mô tả: ví dụ, ngƣời dùng có thể đƣa ra
một mô tả để tìm kiếm "tiếng chuông điện thoại"...
 Giao diện người dùng độc lập với thiết bị: ngƣời dùng không cần biết cách
thức lƣu trữ dữ liệu đa phƣơng tiện nhƣ thế nào.
 Giao diện người dùng độc lập với các định dạng: các truy vấn dữ liệu đa
phƣơng tiện có thể độc lập với định dạng dữ liệu. Nó cho phép có thể sử
dụng các kỹ thuật lƣu trữ mới mà không cần thay đổi ứng dụng cơ sở dữ liệu
hiện có.

10


 Cho phép thực hiện nhiều truy cập dữ liệu đồng thời: dữ liệu đa phƣơng tiện
có thể truy cập đồng thời qua nhiều câu truy vấn khác nhau bởi một số ứng
dụng. Cách truy cập nhất quán nhằm chia sẻ dữ liệu có thể đƣợc thực hiện,
và cần có cơ chế để thỏa mãn việc tránh tạo ra các xung đột.
 Quản lý một lượng dữ liệu lớn: hệ thống cần phải có khả năng lƣu trữ và
quản lý lƣợng dữ liệu lớn và thỏa mãn các truy vấn đối với các quan hệ của
dữ liệu.
 Vấn đề truyền dữ liệu đa phương tiện dựa trên thời gian thực: điều khiển
việc đọc/ghi dữ liệu liên tục phải đƣợc thực hiện dựa trên thời gian thực.
Do lƣợng dữ liệu có thể là rất lớn (ví dụ, truyền video) nên việc truyền dữ
liệu có thể tốn nhiều thời gian và nó còn đòi hỏi phải đƣợc thực hiện một
cách chính xác.
1.3.4. Truy tìm thông tin tài liệu văn bản

Truy tìm thông tin- Information Retrieval (IR) là kỹ thuật tìm kiếm thông tin
đƣợc lƣu trữ trên máy tính. Đối với dữ liệu đa phƣơng tiện, việc truy tìm thông tin
hiệu quả là dựa trên tìm kiếm tƣơng tự. Hệ thống lƣu trữ một tập các đối tƣợng đa
phƣơng tiện trong cơ sở dữ liệu. Ngƣời dùng đƣa ra các truy vấn, và hệ thống tìm ra
các đối tƣợng tƣơng tự truy vấn trong cơ sở dữ liệu đã lƣu trữ thỏa mãn yêu cầu của
ngƣời dùng. Truy tìm thông tin trong MMDBMS có một số đặc điểm sau đây:
 Sử dụng một khối lƣợng dữ liệu đặc tả lớn và phức tạp.
 Việc tiếp cận IR chủ yếu dựa trên các đặc trƣng.
 Các dữ liệu thƣờng có kích thƣớc lớn.
 Sự cần thiết phải có các kỹ thuật chỉ mục dữ liệu kích thƣớc lớn để xử
lý các truy vấn một cách hiệu quả và thực hiện nhanh hơn so với
phƣơng pháp tìm kiếm tuần tự.
 Sự cần thiết phải tích hợp các đặc trƣng media phức tạp một cách
thƣờng xuyên (ví dụ, dữ liệu ảnh có thể chứa các đặc trƣng nhƣ: hình
dạng, biểu đồ màu, kết cấu...).

11


Ý tƣởng của phƣơng pháp tìm kiếm tƣơng tự đƣa ra nhƣ sau:
Cho một tập các đối tƣợng đa phƣơng tiện trong MMDBMS.
Tìm ra một hoặc một số K đối tƣợng tƣơng tự (giống) nhất với đối tƣợng truy
vấn mong muốn một cách nhanh chóng.
Ví dụ: Chúng ta biết mã vùng và muốn tìm địa chỉ của nó, nhƣng mỗi ý
tƣởng liên kết các nguồn khác nhau (tài liệu, hình ảnh, con ngƣời, khái niệm,…).
Ngƣời dùng tin sẽ vẫn có câu truy vấn gồm các từ khóa tìm kiếm để nhận về kết
quả mong muốn.
1.3.5. Truy xuất và chỉ số hoá multimedia
Các DBMS truy xuất các khoản mục dựa trên số liệu có cấu trúc khi sử dụng
kết nối chính xác. IR cũng đƣợc gọi là truy xuất dựa trên văn bản. Việc truy xuất

dựa vào nội dung đề cập đến việc truy xuất dựa trên những nét đặc trƣng truyền
thống hiện nay nhƣ là màu sắc, hình thù thay cho lời giải thích văn bản về khoản
mục truyền thông đó.
Việc truy xuất dựa trên nội dung là chuẩn dựa trên sự đồng dạng thay vì một
kết nối chính xác giữa một truy vấn và một tập các khoản mục dữ liệu.
MIRS đề cập đến một hệ thống cơ sở cung cấp việc truy xuất thông tin
multimedia khi sử dụng một tổ hợp DBMS, IR và các kỹ thuật truy xuất dựa trên
nội dung. Trong một MIRS, một vài vấn đề nhƣ phiên bản và điều khiển an toàn có
thể không thực hiện đƣợc đầy đủ. Một MIRS đủ bản lĩnh ra đời đƣợc gọi là
MDBMS.
Ví dụ, một video tài liệu cần phải đƣợc sử dụng video, hình ảnh, văn từ, âm
thanh, lời nói và những thứ tƣơng tự nhƣ vậy. Vì vậy phƣơng tiện dò tìm phải kết
nối các câu hỏi với các mục cơ sở dữ liệu. Các loại truyền thông khác nhau cần các
kỹ nghệ phục hồi và cách biểu thị khác nhau.
Để việc truy tìm có hiệu quả, cần có một cấu trúc các khoản mục hợp lý. Bởi
vì các vector đặc tính đều đa dạng về kích cỡ và việc truy tìm các khoản mục trong
các MIRS dựa trên sự tƣơng đồng thay cho việc kết nối chính xác, cấu trúc mục lục
đƣợc sử dụng trong các DBMS không thích hợp với các MIRS.

12


Trong các DBMS, tiến hành chính liên quan đến hiệu quả (thời gian trả lời
câu hỏi) nó rất quan trọng bởi kích cỡ lớn của multimedia. Ngoài ra, hiệu quả truy
tìm cũng rất quan trọng . Bởi các MIRS truy tìm các mục chọn dựa trên cơ sở đo sự
tƣơng đồng, sử dụng luật tƣơng ứng thay thế cho kết nối chính xác.
1.4. Kiến trúc tổ chức nội dung của một hệ thống cơ sở dữ liệu Multimedia
1.4.1. Kiến trúc hệ thống quản trị cơ sở dữ liệu đa phương tiện
Phát triển một MMDBMS bao gồm các bƣớc sau:
 Bƣớc 1. Thu thập media: Các dữ liệu media đƣợc thu thập từ các

nguồn khác nhau nhƣ ti vi, CD, www...
 Bƣớc 2. Xử lý media: Mô tả các đoạn trích media và các đặc trƣng
của chúng, bao gồm cả lọc nhiễu và tách thô...
 Bƣớc 3. Lƣu trữ media: Dựa vào yêu cầu cụ thể của ứng dụng để lƣu
dữ liệu và các đặc trƣng của chúng vào hệ thống.
 Bƣớc 4. Tổ chức media: Tổ chức các đặc trƣng để phục vụ việc truy tìm.
Ví dụ, chỉ mục các đặc trƣng với các cấu trúc giúp khai thác hiệu quả.
 Bƣớc 5. Xử lý truy vấn media: Là quá trình làm cho thích nghi với
cấu trúc chỉ mục. Thiết kế các giải thuật tìm kiếm hiệu quả.
Kiến trúc chung cho một MMDBMS đƣợc minh họa nhƣ sau:

Trích
chọn
đặc

Xây dựng
truy vân
đặc trƣng

truy vấn

Chỉ
mục
Search

Các đối tƣợng media

MM
DB


engine

kết

Ngƣời
dùng

MS
phản hồi
Xây dựng
truy vấn
phản hồi

nén

Hình 1-1 Kiến trúc chung của một MMDBMS

13


Hệ thống cơ sở dữ liệu đa phƣơng tiện có nhiều môđun chức năng khác
nhau nhằm hỗ trợ các thao tác trên dữ liệu đa phƣơng tiện. Bao gồm các môđun
chính sau đây:
-

Giao diện ngƣời dùng

-

Bộ trích chọn đặc trƣng


-

Chỉ số hóa và môtơ tìm kiếm

-

Quản lý truyền thông

Trong đó, có hai thao tác cơ bản là:
 Bổ sung dữ liệu đa phương tiện mới
Thao tác bổ sung đƣợc thực hiện theo trình tự các bƣớc nhƣ sau:
- Bước 1. Dữ liệu đa phƣơng tiện mới đƣợc bổ sung thông qua nhiều cách
khác nhau nhƣ nhập trực tiếp từ bàn phím, từ microphone hay từ bất kỳ thiết
bị nhập kỹ thuật số khác. Dữ liệu đa phƣơng tiện cũng có thể đƣợc lấy từ các
tệp đã lƣu sẵn.
- Bước 2. Sau khi dữ liệu đa phƣơng tiện đƣợc bổ sung, nội dung của chúng
đƣợc trích chọn bằng công cụ trích chọn đặc trƣng.
- Bước 3. Các dữ liệu đa phƣơng tiện đƣợc bổ sung cùng với các đặc trƣng
của nó, thông qua bộ quản lý truyền tin sẽ đƣợc gửi về máy chủ.
- Bước 4. Tại máy chủ, các đặc trƣng sẽ đƣợc bố trí về các vị trí phù hợp dựa
vào lƣợc đồ chỉ số hóa.
- Bước 5. Các dữ liệu đa phƣơng tiện bổ sung cùng với các đặc trƣng và chỉ
số hóa phát sinh đƣợc lƣu vào bộ quản lý lƣu trữ.
 Truy vấn
Thao tác truy vấn đƣợc thực hiện theo trình tự các bƣớc nhƣ sau:
-

Bước 1. Tại giao diện ngƣời dùng, ngƣời sử dụng truy vấn thông tin thông
qua một thiết bị nhập nào đó, thông qua tệp đã đƣợc lƣu trƣớc đó hoặc có thể

lấy trực tiếp từ cơ sở dữ liệu MMDBMS.

14


×