Tải bản đầy đủ (.pdf) (120 trang)

Cấu trúc dữ liệu đa phương tiện và mô hình cơ sở dữ liệu hình ảnh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.04 MB, 120 trang )






















































ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ






Trần Thanh Lưu





CẤU TRÚC DỮ LIỆU ĐA PHƯƠNG TIỆN VÀ MÔ HÌNH
CƠ SỞ DỮ LIỆU HÌNH ẢNH






LUẬN VĂN THẠC SỸ










Hà nội, 2006



















































ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ



Trần Thanh Lưu




CẤU TRÚC DỮ LIỆU ĐA PHƯƠNG TIỆN VÀ MÔ HÌNH
CƠ SỞ DỮ LIỆU HÌNH ẢNH



Ngành: Công nghệ thông tin
Mã số: 1.01.10



LUẬN VĂN THẠC SỸ


Người hướng dẫn khoa học :
PGS.TS. Đỗ Trung Tuấn




Hà nội, 2006

1

Mục lục
MỞ ĐẦU 7
Chƣơng 1 8
TỔNG QUAN 8
1.1 Các kịch bản đa phƣơng tiện 12
1.3. Các ứng dụng khác 18
1.3.1. Các dịch vụ đa phƣơng tiện trong giáo dục 18
1.3.2 Ứng dụng trong hội nghị điện tử 19
1.3.3. Ngành công nghiệp giải trí 19
1.4. Kết luận 20
Chƣơng 2 21
CẤU TRÚC DỮ LIỆU ĐA CHIỀU 21
2.1 Mở đầu 21
2.2 Cây k-d (k-d Trees) 22
2.2.1 Cấu trúc nút 22

2.2.2 Chèn và tìm kiếm trong cây 2-d 23
2.2.3 Huỷ bỏ trong cây 2-d 27
2.2.4 Truy vấn khoảng trong cây 2-d 29
2.2.5 Cây k-d với k2 32
2.3 Cây tứ phân điểm (Point Quadtrees) 32
2.3.1 Chèn và tìm kiếm trong cây tứ phân điểm 33
2.3.2 Thao tác xoá cây tứ phân điểm 35
2.3.3 Truy vấn khoảng trong cây tứ phân điểm 37
2.4 Cây tứ phân matrix MX (MX-Quadtrees) 37
2.4.1 Chèn và tìm kiếm trong MX-Quadtree 38
2.4.2 Thao tác xoá trong MX-Quadtrees 40
2.4.3 Truy vấn khoảng trong MX-Quadtrees 41
2.4.4 PR-Quadtrees 41
2.5 Cây R (R-Trees) 41
2.5.1 Chèn và tìm kiếm trong R-Trees 43
2.5.2 Xoá cây trong R-Trees 45
2.6 Kết luận 46
Chƣơng 3 48
CƠ SỞ DỮ LIỆU ẢNH 48
3.1 Ảnh thô 48
3.2 Biểu diễn ảnh nén 52
3.2.1 Biến đổi Fourier rời rạc (DFT–Discrete Fourier Transform) 53
3.2.2 Biến đổi cosin rời rạc (DCT–Discerte Cosine Transform) 53
3.3 Xử lý ảnh: Phân đoạn 54
3.4 Truy vấn trên cơ sở tƣợng tự 60
2

3.4.1. Tiệm cận thƣớc đo 61
3.4.2 - Tiệm cận biến đổi 64
3.5 Các hình mẫu khác của CSDL ảnh. 68

3.6. Biểu diễn IDB bằng các quan hệ 68
3.6.1 Truy vấn biểu diễn quan hệ trong IDB 70
3.7 Biểu diễn CSDL ảnh với R-Trees 77
3.7.1 Biểu diễn CSDL ảnh bằng cây R tổng quát 81
3.8 Truy vấn ảnh bằng bố trí không gian 83
3.9 Cài đặt 85
3.10 Kết luận 86
Chƣơng 4 87
CƠ SỞ DỮ LIỆU ĐA PHƢƠNG TIỆN 87
4.1 Thiết kế và kiến trúc CSDL đa phƣơng tiện 87
4.1.1 Các kiến trúc tổ chức nội dung . 87
4.2 Tổ chức dữ liệu đa phƣơng tiện trên cơ sở nguyên lý thống nhất 91
4.3 Trừu tƣợng media 92
4.4 Ngôn ngữ truy vấn dữ liệu đa phƣơng tiện 97
4.4.1 Truy vấn SMDS (Biểu diễn thống nhất) 97
4.4.2 Truy vấn dữ liệu đa phƣơng tiện của biểu diễn lai 100
4.5 Những đánh giá về thực trạng ứng dụng dữ liệu đa phƣơng tiện tại
Việt Nam nói chung. 103
4.6. Đề xuất về việc xây dựng một hệ thống quản lý dữ liệu đa phƣơng
tiện thống nhất. 103
4.7 Kết luận 104
KẾT LUẬN 106
Tài liệu tham khảo 107
Phụ lục 109
3

Lời cam đoan

Tôi xin cam đoan các kết quả của luận văn là do bản thân chuẩn bị. Nội dung
của luận văn chƣa đƣợc xuất bản, báo cáo tại nơi đâu.

Tôi xin chịu hoàn toàn về trách nhiệm, nếu có sai sót gì về nội dung trình bày
trong luận văn.
4


Lời cảm ơn
Trƣớc hết xin cám ơn gia đình, cha mẹ và anh em đã hỗ trợ tinh thần và vật
chất cho quá trình học tập của tôi. Để có đƣợc thành công nhất định nhƣ ngày hôm
nay, tôi đã có đƣợc sự quan tâm, động viên, hỗ trợ to lớn cả tinh thần và vật chất
trong suốt quá trình học tập của tôi.
Tôi xin trân trọng cảm ơn các thầy giáo, cô giáo đã giảng dạy và hƣớng dẫn
tôi trong quá trình học tập trong trƣờng Đại học và chƣơng trình sau đại học. Dù
rằng , trong quá trình học tập, có nhiều lúc gặp phải những khó khăn trong việc tiếp
thu kiến thức cũng nhƣ sƣu tầm tài liệu học tập, nhƣng với sự nhiệt tình và tâm
huyết của thầy cô cộng với những nỗ lực của bản thân đã giúp tôi vƣợt qua đƣợc
những trở ngại đó.
Trong quá trình thực hiện luận văn, mặc dù gặp phải nhiều khó khăn trong
việc sắp xếp thời gian, công việc cũng nhƣ việc tìm kiếm tài liệu tham khảo nhƣng
tôi đã nhận đƣợc sự tận tình hƣớng dẫn, chỉ bảo của thầy giáo hƣớng dẫn khoa học
PSG.TS Đỗ Trung Tuấn giúp tôi hoàn thành luận văn này.
Tôi xin chân thành cảm ơn các bạn trong khóa học đã hỗ trợ tôi trong suốt quá
trình học tập, đặc biệt là trong chƣơng trình sau đại học.
Tôi cũng xin đƣợc gửi lời cảm ơn đến ban lãnh đạo, các đồng nghiệp tại Ngân
hàng TMCP Sài Gòn Công thƣơng – Chi nhánh Hà Nội, nơi tôi đang công tác đã
tạo điều kiện về thời gian và giúp đỡ tôi trong công việc giúp tôi có thể hoàn thành
khóa học và thực hiện xong luận văn.
Để có thể hoàn tất khoá học sau đại học tại Trƣờng Đại học Công nghệ, Đại
học Quốc gia Hà Nội tôi đã nhận đƣợc rất nhiều sự động viên giúp đỡ của gia đình,
thầy cô, đặc biệt là thầy giáo hƣớng dẫn khoa học PGS.TS Đỗ Trung Tuấn, đồng
nghiệp và bè bạn.

Một lần nữa tôi xin chân thành cảm ơn.
Học viên Trần Thanh Lƣu

5

Bảng các từ viết tắt

Số thứ tự
Tên viết tắt
Tên đầy đủ
1
CSDL
Cơ sở dữ liệu
2
MMDBMS
Multimedia Database Management System
3
GIS
Geographic Infomation System
4
IDB
Image Database
5
R Tree
Rectangle Tree
6
DFT
Discrete Fourier Transform
7
DCT

Discerte Cosine Transform
8
LLINK
LEFT LINK
9
RLINK
RIGHT LINK
10
XLB
X Lower Bound
11
XUB
X Upper Bound
12
NW
North West
13
SW
South West
14
NE
North East
15
SE
South East
16
MX
Matrix
17
Reg

Region
18
RGB
Red Green Blue
19
PropName
PropertyName
20
PropValue
PropertyName
21
b/w
Black/ White
22
bwalgo
Black/ White Algorithm
23
GI
Grid Image
24
Cr
Compressed Representation
25
fe
Feature Extrationn Function
6

26
TS
Transformaion Sequence

27
ObjID
Object Identification
28
Gr-Tree
GeneralizeRectangle Tree
29
ATTR
Attributes
30
Var
Variable
31
SMDS
Structured mutlimedia database system
32
subst
Substitue
33
HM-SQL
hybrid-multimedia SQL
7

MỞ ĐẦU
Thế kỷ 21 hứa hẹn những bƣớc phát triển nhảy vọt hơn nữa trong lĩnh vực
công nghệ thông tin, nhƣ đã từng có trong những thập niên 90 thế kỷ trƣớc. Những
ứng dụng công nghệ thông tin vào đời sống thực tiễn và nghiên cứu khoa học đƣợc
đánh giá sẽ rất triển vọng, hứa hẹn mở ra những thành công to lớn.
Dữ liệu đa phƣơng tiện ngày càng đóng vai trò không thể thiếu trong cuộc
sống ngày nay, các trang thiết bị hiện đại phục vụ cho đời sống, nghiên cứu khoa

học, quân sự sử dụng một khối lƣợng khổng lồ các loại dữ liệu đa phƣơng tiện
khác nhau. Việc xây dựng các hệ thống quản lý cơ sở dữ liệu đa phƣơng tiện phục
vụ cho những mục đích đó là yêu cầu thực sự quan trọng. Trong đó, việc sử dụng
các cấu trúc dữ liệu hợp lý để biểu diễn các loại dữ liệu nhƣ vậy, phục vụ những
yêu cầu của hệ thống cơ sở dữ liệu là vấn đề cần phải giải đáp.
Trong luận văn, chủ yếu tập trung vào tìm hiểu loại dữ liệu là hình ảnh (Image
Data), giới thiệu các cấu trúc dữ liệu đa phƣơng tiện để thể hiện dữ liệu hình ảnh,
mô hình hoá cơ sở dữ liệu hình ảnh, và đề cập đến việc xây dựng cơ sở dữ liệu đa
phƣơng tiện .


8

Chƣơng 1
TỔNG QUAN
Ngay từ ban đầu, máy tính đã đƣợc coi là các thiết bị xử lý biểu tƣợng
(symbolic) – các thiết bị có đầu vào là các biểu tƣợng theo luật alphabet và đầu ra là
tập các biểu tƣợng của cùng dạng trên. Điều nay đã trở thành mô hình cho các môi
trƣờng tính toán chuẩn dựa trên cơ sở máy Turing đã quen thuộc.
Tuy nhiên, trong những năm gần đây xuất hiện nhu cầu vô cùng lớn về khả
năng khai thác xử lý dữ liệu với số lƣợng khổng lồ mà nó là điều không dễ dàng
diễn tả chỉ với việc sử dụng các ký tự. Dƣới đây là một số thí dụ về các kiểu dữ liệu
nhƣ vậy:
Dữ liệu ảnh (Image data): Dữ liệu hình ảnh có thể nói là một trong những
kiểu dữ liệu đuợc sử dụng phổ biến và thông dụng nhất trên thế giới hiện nay. Rất
nhiều những ứng dụng trong các lĩnh vực khoa học khác nhau sử dụng hình ảnh làm
nguồn dữ liệu để thực thi công việc một cách hiệu quả. Ví dụ trong lĩnh vực Y học,
một ví dụ cụ thể chẳng hạn một học viên phẫu thuật ở Miami mong muốn thực hành
một ca phẫu thuật trên một bệnh nhân ảo có những triệu chứng sinh lý nào đó. Trên
thực tế để tìm ra bệnh nhân với những triệu chứng mong muốn, học viên phẫu thuật

phải truy vấn cơ sở dữ liệu (CSDL) ảnh phân tán và kích thƣớc lớn chứa ảnh X
quang hay MRI (Magnetic Resonance Imaging) của các bệnh nhân với các triệu
chứng tƣơng tự. Đôi khi các triệu chứng có thể dễ dàng mô tả bằng văn bản. Tuy
nhiên trong nhiều trƣờng hợp khác, nó có thể dễ dàng hơn cho học viên phẫu thuật
nếu có thể trình diễn hình ảnh của loại mẫu (pattern) mà anh ta đang tìm kiếm trong
các ảnh X quang của bệnh nhân. Trong cả hai trƣờng hợp này, một CSDL hình ảnh
phải đƣợc duy trì. Nó có thể đƣợc truy vấn trên cơ sở các tiêu chí rất khác nhau -
đầu vào là văn bản hay ảnh phù hợp [17].
Dữ liệu Video (Video data): Tƣơng tự nhƣ vậy, cùng với sự phát triển bùng
nổ của các thiết bị nghe nhìn nhƣ hiện nay thì kiểu dữ liệu Video đang ngày càng
tràn ngập trên khắp mọi nơi. Bên cạnh đó khi mà công nghệ lƣu trữ hiện đại ngày
9

nay làm cho việc lƣu trữ các dữ liệu Video không phải là bài toán khó giải thì việc
truy xuất dữ liệu để tìm kiếm thông tin theo yêu cầu trong kho dữ liệu khổng lồ nhƣ
thế là một vấn đề rất đáng quan tâm. Trong một ngữ cảnh tƣơng tự, giả sử học viên
của một trƣờng đại học muốn tìm kiếm những tƣ liệu băng hình về một chủ đề kỹ
thuật nào đó trong thƣ viện của trƣờng. Điều này yêu cầu họ phải truy vấn để tìm
tài liệu trong tập hợp vô số những tƣ liệu băng hình đƣợc lƣu trữ, điều này có thể
dẫn tới truy vấn của học viên đòi hỏi xâm nhập số lƣợng lớn băng hình.[17]
Dữ liệu âm thanh (Audio data): Dữ liệu âm thanh đƣợc sử dụng trong những
ứng dụng, thiết bị nhƣ nhận dạng giọng nói, xử lý âm thanh, điều khiển thiết bị bằng
giọng nói Thí dụ, nỗ lực điều tra của cảnh sát về dấu vết của kẻ đe doạ đánh bom
mong muốn có khả năng nhận dạng giọng nói tƣơng ứng với tín hiệu từ điện thoại
của kẻ đó thông qua CSDL lƣu giữ các mẫu giọng nói của các tổ chức khủng bố
khác nhau.[17]
Dữ liệu tài liệu (Document data): Một CSDL văn bản truyền thống bao gồm
các đoạn văn bản, các từ, câu, đoạn văn, chƣơng…. Một CSDL tài liệu khác văn
bản ở chỗ nó không chỉ chứa các thông tin dạng văn bản thô mà còn chứa đựng cả
cấu trúc và hình ảnh nhúng. Trong các trƣờng hợp nhƣ vậy, cấu trúc của tài liệu có

thể đƣợc khai thác dựa trên mục lục dữ liệu. Cách khác, giả sử xem xét một quyển
sách. Quyển sách không chỉ chứa dữ liệu văn bản mà còn chứa cả hình ảnh. Một số
hình ảnh có thể là những hình vẽ trong khi một số khác là những bức ảnh. Giả sử
ngƣời sử dụng muốn tìm một bức ảnh của hoàng đế Mughal tên là Akbar nhƣng
không thể tìm ảnh trong CSDL hình ảnh. Tuy nhiên, nếu anh ta có một thƣ viện
điện tử số để truy cập thì anh ta có thể tìm thấy bức ảnh mong muốn nhờ xem xét kỹ
những cuốn sách liên quan về lịch sử ấn Độ. Nhƣ vậy, dữ liệu tài liệu bao gồm
phƣơng tiện quan trọng mà trong đó các thông tin có thể đƣợc lƣu trữ dƣới dạng
điện tử.[17]
Dữ liệu viết bằng tay (Handwritten data): Nhiều ngƣời thƣờng ghi những ghi
chú trên những mẩu giấy nhỏ, điều này thƣờng gây mất thông tin khi giặt quần áo
hay vì một lý do nào đó mà những gì đƣợc ghi bị mờ đi. Một số ghi chú có thể là
10

không quan trọng, nhƣng có rất nhiều cái cần đƣợc giữ gìn. Xu thế gần đây cả trên
thƣơng trƣờng hay trong giới nghiên cứu ngƣời ta cho rằng ghi chép điện tử ngày
càng phổ biến hơn trong tƣơng lai. Ngƣời sử dụng sẽ sử dụng các thiết bị điện tử để
ghi chép và lƣu trữ. Mặc dù có rất nhiều ghi chú có thể chuyển sang đƣợc dạng mã
văn bản ASCII bằng kỹ thuật phân tích viết tay, nhƣng có rất nhiều ghi chú không
thể thực đƣợc bởi vì các ghi chú thƣờng chứa cả các nét loằng ngoằng hay các biểu
đồ khối…
Các kiểu dữ liệu kể trên đây chỉ là một phần trong rất nhiều hình thức biểu
hiện của dữ liệu phát sinh tự nhiên trong các ứng dụng khác nhau.
Một cách phi hình thức, hệ thống quản trị cơ sở dữ liệu đa phƣơng tiện
(Multimedia Database Management System – MMDBMS) là một khung làm việc để
quản lý các kiểu dữ liệu khác nhau mà chúng đƣợc thể hiện trong rất nhiều khuôn
dạng khác nhau. Để làm việc thành công thì một MMDBMS phải có các khả năng
sau:
Nó phải có khả năng truy vấn đồng bộ dữ liệu đƣợc thể hiện trong các định
dạng khác nhau. Thí dụ, một MMDBMS sẽ có khả năng truy vấn và tích hợp dữ

liệu mà nó đƣợc lƣu trong các CSDL quan hệ khác nhau mà có thể sử dụng các lƣợc
đồ khác nhau, cũng nhƣ việc truy vấn tệp phẳng và dữ liệu lƣu trữ trong DBMS
hƣớng đối tƣợng DBMS không gian. Việc xử lý các truy vấn nhƣ vậy là khá phức
tạp bởi vì trên thực tế việc nhận biết đƣợc nội dung của các kiểu dữ liệu media là
vấn đề thách thức và nó phụ thuộc rất nhiều vào kiểu dữ liệu và cách thức lƣu trữ
chúng. Cuối cùng, truy vấn có thể mở rộng đối với nhiều kiểu vật mang (media) dữ
liệu và MMDBMS phải có khả năng kết hợp các kết quả từ các nguồn dữ liệu khác
nhau và các kiểu media khác nhau.
Tƣơng tự, MMDBMS phải có khả năng truy vấn dữ liệu biểu diễn trong
media khác nhau. MMDBMS phải có khả năng khai thác các đối tƣợng mang tin từ
một thiết bị lƣu trữ cục bộ một cách trơn tru, liên tục. MMDBMS phải có khả năng
tạo ra các câu trả lời từ truy vấn (đƣợc gọi là “answer to a query”) và có khả năng
trình diễn các câu trả lời này bằng các phƣơng tiện nghe nhìn. Mặc dù vậy, hình
11

thức và nội dung của trình diễn có thể khác nhau từ ứng dụng này đến ứng dụng
khác, do đó ngƣời sử dụng phải xác định đƣợc cấu trúc của hình thức và nội dung
của các trình diễn kết quả thu đƣợc từ hệ thống.
Điều cuối cùng là mỗi một hệ thống có đầy đủ các đặc tính yêu cầu trên là
chƣa đủ mà còn cần phải có khả năng phân phối các trình diễn theo một cách nào đó
nhằm thoả mãn các yêu cầu khác nhau về chất lƣợng thể hiện của các thiết bị. Ví
dụ, nếu MMDBMS quyết định rằng một luồng dữ liệu âm thanh và luồng dữ liệu
video phải đƣợc thể hiện cùng một lúc, để làm đƣợc việc đó MMDBMS phải đảm
bảo đƣợc rằng sự thể hiện này không bị ảnh hƣởng do hiện tƣợng nhƣ ngắt quãng
hay trục trặc nào đó. Một điều quan trọng hơn là MMDBMS phải quan tâm tới việc
dữ liệu đang đƣợc phân phối cho các thiết bị ra liên quan (loa, bàn phím, màn
hình…) mà chúng có thể để tập trung tại các nút mạng phân tán. Do đó, các nhân tố
nhƣ khả năng sẵn sàng của vùng đệm và độ rộng băng thông cần đƣợc lƣu tâm khi
phân phát trình diễn tới ngƣời sử dụng. Hơn nữa, đòi hỏi về chất lƣợng dịch vụ cho
biết rằng các tính chất hiệu năng khác nhau cần đƣợc tối ƣu theo các ràng buộc nói

trên.
Do những nỗ lực trong mọi lĩnh vực của loài ngƣời mà việc tạo ra và quản lý
các kho lƣu trữ multimedia đã đƣợc thúc đẩy từ trƣớc, trong đó có các cố gắng của
cả giới nghiên cứu và lĩnh vực thƣơng mại. Ngày nay, các ngôn ngữ truy vấn, kỹ
thuật chỉ mục, các thuật toán khai thác dữ liệu, các phƣơng pháp cập nhật đã đƣợc
phát triển cho nhiều loại CSDL nhƣ quan hệ, CSDL hƣớng đối tƣợng, CSDL không
gian, thời gian và các CSDL khác. Mỗi một ngôn ngữ này là sự mở rộng, cải tiến
của các ngôn ngữ trƣớc đó và các thuật toán đƣợc áp dụng cho các kiểu dữ liệu mới
và quan trọng, hay các mô hình lý luận. Với dữ liệu đa phƣơng tiện, nó cũng tƣơng
tự theo góc độ này. Những cái mới và dữ liệu nổi trội/mô hình lý luận phải phù hợp
với các nghiên cứu mang tính lý thuyết và các thử nghiệm trong lĩnh vực thƣơng
mại, với sự hỗ trợ tối đa từ các công nghệ đang có. Ví dụ một ngôn ngữ truy vấn
CSDL hình ảnh nên quan tâm và tận dụng thành tựu của các ngôn ngữ truy vấn
12

CSDL đã đƣợc nghiên cứu trong những thập niên trƣớc, hơn là bắt đầu từ một cái
tạp nham.
Hoàn toàn tƣơng tự cho các hình thức khác của dữ liệu cũng nhƣ các chủ đề
nghiên cứu khác (chỉ mục, khai thác, cập nhật, phiên giao dịch,…)
1.1 Các kịch bản đa phương tiện
Giả sử, xem xét một cuộc điều tra với quy mô lớn của cảnh sát về tình hình
buôn ma tuý. Thông thƣờng, để thực hiện thành công một cuộc điều tra nhƣ vậy lực
lƣợng cảnh sát sử dụng một số lƣợng lớn các thiết bị điện tử để thực hiện theo dõi
các đối tƣợng nghi ngờ dính líu đến các tổ chức ma tuý. Với một cuộc điều tra nhƣ
vậy có thể sử dụng các thiết bị dƣới đây để thu thập thông tin.
Cảnh sát có thể sử dụng camera theo dõi để ghi lại các hình ảnh về hoạt động
đang diễn ra tại các địa điểm khác nhau. Ví dụ mỗi camera theo dõi có thể giám sát
các hoạt động đang diễn ra tại một địa điểm trong một khoảng thời gian tƣơng đối
dài (có thể là trong 6 tháng). Tại mỗi địa điểm họ thu đƣợc khoảng vài triệu hình
ảnh. Vì chỉ mỗi một cuộc điều tra nhƣ vậy đã đòi hỏi từ 50 đến 100 camera theo dõi

đặt tại các địa điểm khác nhau, do đó số hình ảnh video cần đƣợc quản lý là nhiều
đáng kể. Quan trọng hơn nữa là với thúc ép của pháp luật, cần thực hiện hàng trăm
cuộc điều tra nhƣ vậy tại những địa điểm trong một khoảng thời điểm tại nhiều
vùng khác nhau với rất nhiều hình thức tội phạm tƣơng tự nhƣ cuộc điều tra về ma
tuý nhƣ điều tra về các đƣờng dây lừa đảo, các tội phạm liên quan đến tài chính, các
cuộc điều tra về khủng bố, các cuộc điều tra về gián điệp… Số lƣợng dữ liệu video
thu đƣợc theo cách đó phục vụ cho các cuộc điều tra là lớn khủng khiếp.
Một tình huống khác, lực lƣợng cảnh sát đƣợc lệnh thực hiện các cuộc nghe
trộm điện thoại tại một địa điểm sau đó tập hợp lại các dữ liệu âm thanh là các cuộc
đàm thoại cho là đáng ngờ. Mặc dù số lƣợng các cú điện thoại có thể khác nhau
giữa các tội phạm, nhƣng các tổ chức tội phạm (nhƣ đƣờng dây ma tuý) rất hay sử
dụng liên lạc điện thoại. Theo chiều hƣớng đó số lƣợng các chuỗi âm thanh thu
đƣợc trong một khoảng thời gian từ các cuộc điều tra là rất lớn. Do vậy việc tổ chức
và tìm kiếm dữ liệu audio này có ý nghĩa vô cùng lớn.
13

Ngoài tất cả những gì trình bày ở trên, lực lƣợng cảnh sát có thể có một số
lƣợng lớn các bức ảnh từ các điều tra viên Hơn nữa, trong các cuộc điều tra tội
phạm quy mô lớn có thể phát hiện ra số lƣợng đáng kể các tội phạm với tội danh
nhẹ (ví dụ hình ảnh những kẻ buôn bán ma tuý lẻ bị chụp khi đang tiến hành bán ma
tuý hay một hành vi liên quan đến ma tuý có thể đƣợc phát hiện mà bản thân nó có
liên quan đến ngƣời trong bức ảnh). Tất cả những hình ảnh này phải đƣợc lƣu lại
dƣới dạng kỹ thuật số, sẵn sàng cho các công việc tìm kiếm và khai thác khi cần.
Cảnh sát cũng có thể phải xem xét một số lƣợng lớn tƣ liệu đã tìm đƣợc tại
những nơi có liên quan đến những vụ án đang điều tra hay những vụ án khác. Một
lƣợng lớn tƣ liệu có thể liên quan trực tiếp đến vụ án nhƣng vào thời điểm ban đầu
thì chúng có thể không đƣợc rõ ràng. Khi một cuộc điều tra về ma tuý đang diễn ra,
mọi cái trở nên minh bạch khi mà ngày càng có nhiều mối liên hệ với các chứng cứ
đã thu đƣợc trong cuộc điều tra đang diễn ra cùng thời điểm.
Một tình huống khác, cảnh sát có thể xâm nhập đến các dữ liệu có quan hệ

cấu trúc. Dữ liệu dạng này có thể bao gồm, thí dụ nhƣ dữ liệu trong các giao dịch
ngân hàng của một vài tội phạm. Điều này là đặc biệt quan trọng bởi vì một số trùm
ma tuý sử dụng rất nhiều hình thức rửa tiền, việc “Lần theo dấu vết đồng tiền”
thƣờng khám phá đƣợc rất nhiều điều thú vị. Các dữ liệu khác thuộc thể loại này có
thể bao gồm những thông tin nhƣ những cuốn danh bạ điện thoại để xác định, nhận
dạng ngƣời bị tình nghi.[4,17]
Cảnh sát cũng có thể sử dụng hệ thống thông tin địa lý (GIS) chứa đựng
những dữ liệu địa lý liên quan đến cuộc điều tra ma tuý đang đƣợc triển khai. Ví dụ
cảnh sát nghi ngờ rằng một tuyến đƣờng nào đấy đang đƣợc sử dụng để vận chuyển
ma tuý. Để kiểm tra giả thuyết trên, họ phong toả một trong những tuyến đƣờng đó ,
theo cách đó làm tập trung hƣớng vận chuyển ma tuý. Mẫu của luồng ma tuý sẽ
cung cấp cho cảnh sát các thông tin rất quan trọng về các vị trí đầu mối của ma tuý.
Để thực thi chiến dịch trên, cảnh sát có thể sử dụng các hệ thống GIS để quản lý dữ
liệu địa lý. Các hệ thống GIS này quản lý các thông tin bao gồm thông tin về bản đồ
đƣờng đi, cũng có thể là các thông tin thu đƣợc về địa hình của những vùng lân cận
14

của những thủ phủ trên núi . Nhận thức về địa hình cũng nhƣ các hình thức sử dụng
các phƣơng tiện để vận chuyển ma tuý có thể mang lại cho cảnh sát những đầu mối
có giá trị để xác định đƣợc các tuyến đƣờng đi qua các địa hình có khả năng là vùng
hoạt động của tội phạm.
Hình 1.1 là sơ đồ về các kiểu khác nhau của dữ liệu và các bộ phận mềm trọn
gói đƣợc sử dụng trong các mẫu về kịch bản đa phƣơng tiện, cần chú ý rằng các
nguồn về hình thức dữ liệu đề cập trên chỉ là mẫu nhỏ của nguồn dữ liệu đa dạng và
phong phú, có sẵn trong một ứng dụng. Với sự bùng nổ về khả năng ứng dụng dữ
liệu đa phƣơng tiện, mỗi một lĩnh vực ứng dụng (dù trong ngành công nghiệp du
lịch hay trong các hoạt động luật pháp) có thể có nguồn dữ liệu và kiểu media rất
lớn và đa dạng từ ứng dụng này sang ứng dụng khác.







Trở lại các kịch bản đa phƣơng tiện mẫu đã đề cập phần trên, một số câu truy
vấn hay gặp mà ngƣời sử dụng hệ thống đa phƣơng tiện cảnh sát (ở đây là lực lƣợng
cảnh sát) có thể hay sử dụng để giải quyết công việc của mình.
Query 1.1 (Image Query). Giả sử rằng một cảnh sát có bức ảnh ngay trƣớc
mắt anh ta. Thí dụ, đó là bức ảnh chụp chính diện từ các cuộc điều tra mới đây. Cơ
quan điều tra có thể ghi ngờ một ngƣời trong bức ảnh đang sử dụng một bí danh nào
đó. Do vậy họ mong muốn giải quyết đƣợc vấn đề đặt ra là “Tìm tất cả các bức ảnh
từ thư viện ảnh trong đó có sự xuất hiện của người đang bị nghi ngờ”.
Đây là một vấn đề rất thú vị bởi vì nó có thể đƣợc giải quyết bởi một trong hai
khả năng. Thứ nhất là cảnh sát có thể biết trƣớc tên của ngƣời trong bức ảnh. Trong
trƣờng hợp này truy vấn đƣợc thực hiện bằng việc sử dụng thông tin văn bản đã biết
trƣớc về các bức ảnh khác nhau trong thƣ viện ảnh để tìm ra một bức ảnh có kết hợp

15

ghi chú bằng văn bản. Hoặc với cách khác, cảnh sát có thể cần đến việc áp dụng các
kỹ thuật xử lý ảnh để tìm sự tƣơng đồng giữa khuôn mặt trong bức ảnh vừa chụp
với các khuôn mặt trong các bức ảnh có sẵn trong thƣ viện ảnh căn cƣớc. Phƣơng án
thứ 2 thƣờng đƣợc thực hiện ngay sau khi phƣơng án thứ nhất thất bại.
Query 1.2 (Audio Query). Trong một trƣờng hợp khác, khi có quan cảnh sát
đang nghe lại một băng nghi âm theo dõi những đối tƣợng tình nghi. Thí dụ, nội
dung băng là một cuộc đàm thoại giữa một nhân vật A (ngƣời đang bị theo dõi) với
một nhân vật B (ngƣời đang tiếp xúc với A). Dựa vào nội dung của cuộc đàm thoại,
cơ quan cảnh sát mong muốn tìm kiếm thông qua CSDL các mẫu giọng nói để có
thể xác định đƣợc ngƣời B. Nếu yêu cầu nhƣ trên thành công thì nó có thể cung cấp
cho cảnh sát những chứng cứ hay có thể là những định hƣớng cho quá trình điều tra

tội phạm.
Truy vấn trên đây chỉ bao hàm xử lý tiếng nói. Đặc điểm của lời nói đƣợc lƣu
trữ một cách đặc biệt trong một véctơ đặc trƣng (feature vector) phản ánh các giá trị
của các tham số khác nhau là “quan trọng” và liên quan đến quá trình ghi âm vừa
qua. Để xác định xem một mẫu lời nói (giọng nói của nhân vật B) có tƣơng đồng
với một vector trong cơ sở dữ liệu tiếng nói hay không, phải cần một số kỹ thuật
dựa vào các CSDL tiếng nói có thể đƣợc đánh giá chỉ mục để thuận tiện hơn trong
việc khai thác một cách nhanh chóng các dãy âm thanh tƣơng tự .
Query 1.3 (Text Query). Mặt khác, cơ quan cảnh sát có thể xem qua các tài
liệu nhƣ các file văn bản lƣu trữ các bài báo cũ. Đó là hồ sơ cảnh sát về những vụ án
giết ngƣời chƣa đƣợc giải quyết, về các chứng cứ… Cảnh sát mong muốn giải quyết
vấn đề đặt ra bằng cách đƣa ra câu truy vấn nhƣ “Tìm tất cả các tư liệu (từ tập các
tài liệu văn bản) liên quan đến mối quan hệ trong các giao dịch tài chính của tổ
chức thuốc phiện XYZ với ABC Corp”.
Đây thực sự là một truy vấn khá thú vị, nó hƣớng vào lĩnh vực CSDL văn
bản. Một từ khoá tìm kiếm đơn giản thông qua tập hợp các tài liệu không đảm bảo
sẽ đảm bảo cho kết quả chính xác, ngay cả khi chỉ mục cho việc tìm kiếm trong tài
liệu văn bản này đã tồn tại. Cuối cùng nó càng không có sự đảm bảo là các tài liệu
16

sẽ đề cập đến các từ “XZY”, “finance” và “ABC Corp”. Ví dụ một tƣ liệu nói về
việc chuyển tiền từ tài khoản ngân hàng của Jose Orojuelo sang tài khoản của John
Smith có thể là một tƣ liệu có giá trị. Nó có ý nghĩa vì Jose Orojuelo là một ngƣời
đứng đầu nhóm buôn bán thuốc phiện XYZ và John Smith là một quan chức cao
cấp trong ABC Corp. Văn bản phải đƣợc đánh chỉ mục không chỉ theo từ khoá mà
còn dựa trên nội dung ngữ nghĩa của từ khoá. Chỉ khi nào thực hiện đƣợc điều đó
thì mới có hy vọng thu đƣợc các kết quả một cách chính xác và cô đọng.
Query 1.4 (Video Query) Hãy xem xét một ví dụ sau, cơ quan cảnh sát đang
kiểm tra một đoạn băng video theo dõi, ghi lại một nạn nhân bị tấn công nhƣng
đáng tiếc là kẻ tấn công đã giấu mặt trong khi gây án. Trong trƣờng hợp này cơ

quan cảnh sát mong muốn giải quyết vấn đề bằng đƣa ra câu hỏi truy vấn “Tìm tất
cả các đoạn băng video mà có sự xuất hiện của nạn nhân trong vụ tấn công”. Với
việc kiểm tra các đoạn băng video. Cảnh sát hy vọng có thể thu đƣợc một số thông
tin bổ ích cho việc nhận dạng kẻ gây án. Đặc biệt là trong trƣờng hợp kẻ gây án có
quen biết với nạn nhân. một kịch bản tƣơng tự cũng có thể nảy sinh trong khi cuộc
buôn bán ma tuý đang diễn ra giữa hai tổ chức buôn bán ma tuý.
Cũng cần chú ý rằng trong trƣờng hợp trên cảnh sát không đòi hỏi cung cấp
các khung (frame) video về các hành động đã xảy ra. Thay vào đó họ yêu cầu các
đoạn (segment) video (có lẽ là liên tiếp nhau) trong đó có hành động xảy ra. Điều
này đòi hỏi MMDBMS không chỉ có khả năng tìm ra các frame video về các hành
động đã xảy ra mà nó còn phải có khả năng tổng hợp các frame này thành những
đoạn video liền mạch.
Bây giờ, một vấn đề phức tạp hơn mà cơ quan cảnh sát phải đối phó sẽ đƣợc
thảo luận . Mỗi một vấn đề đặt ra ở trên chỉ tiếp cận với một hình thức dữ liệu riêng
lẻ. Mặc dù khái niệm về dữ liệu đa phƣơng tiện đã trở nên phổ biến thông qua các
dữ liệu nghe nhìn nhƣng thực tế rằng dữ liệu đa phƣơng tiện không phải chỉ có dữ
liệu tiếng nói và dữ liệu audio mà còn rất nhiều kiểu dữ liệu khác nhau các dữ liệu
dạng các ghi chú, dữ liệu văn bản, dữ liệu quan hệ, dữ liệu về địa lý, các bản đồ địa
hình, các mô hình không gian 3 chiều Do vậy một truy vấn phức tạp hơn là việc
17

trộn và tìm ra dữ liệu tƣơng tự từ các nguồn khác nhau. Làm đƣợc điều đó sẽ cho
phép cơ quan cảnh sát đặt ra các yêu cầu tiếp cận các nguồn dữ liệu tập trung trong
các gói dữ liệu phức tạp và trên các phƣơng tiện (media) khác nhau sử dụng các kỹ
thuật lƣu trữ khác.
Query 1.5 (Simple Heterogeneous Query) Giả sử rằng cơ quan cảnh sát đƣa
ra một vấn đề “Tìm tất cả những tù nhân đã bị kết án về tội mưu sát tại Mỹ và
những người này trong thời gian gần đây đã thực hiện việc chuyển tiền điện tử ABC
Corp vào tài khoản riêng của họ”
Xét bề ngoài của yêu cầu trên có vẻ nhƣ đây không có gì khác biệt với các

truy vấn thông thƣờng. Trƣớc hết, nó chỉ bao hàm việc xử lý các câu truy vấn dựa
vào các CSDL văn bản chuẩn ban đầu. Nhƣng đáng tiếc là thực tế không phải nhƣ
vậy, bất kỳ ai trong cơ quan pháp luật đều hiểu rằng giải quyết vấn đề trên là một
công việc hết sức khó khăn. Lý do thứ nhất là để tìm đƣợc những ngƣời đã chuyển
tiền điện tử ABC Corp vào tài khoản ngân hàng của họ thì phải đủ khả năng giám
sát các hoạt động chuyển tiền điện tử của ABC Corp. Thực tế là ABC Corp có tài
khoản trong hàng trăm ngân hàng trên khắp thế giới. Nếu nhìn nhận một cách lạc
quan, chúng ta giả sử rằng cảnh sát đã có trong tay danh sách tài khoản của ABC
Corp trong các ngân hàng trên khắp thế giới, hơn nữa, họ có quyền giám sát các
giao dịch đáng ngờ dƣới các hình thức khác nhau. Việc thu thập danh sách tài khoản
nhận tiền của ABC Corp từ các báo cáo với định dạng khác nhau. Thứ hai, nhiệm
vụ còn lại là xác định những ai đã nhận tiền từ ABC Corp đã từng bị kết án với tội
mƣu sát lƣu trữ trong kho dữ liệu tội phạm Bắc Mỹ. Các dữ liệu này cũng đƣợc
quản lý theo các cách khác nhau. Trên thực tế chỉ xét riêng nƣớc Mỹ tại các bang
khác nhau cũng có sự khác nhau trong việc lƣu trữ các hồ sơ tội phạm. Một số bang
thì sử dụng các file phẳng một số một số lại sử dụng những hệ quản trị dữ liệu rất
khác nhau. Với truy vấn có mức độ phức tạp hơn đòi hỏi tiếp cận tất cả các khuôn
dạng dữ liệu văn bản nói trên, nhƣng còn phải thêm vào đó là kiểu dữ liệu hình ảnh.
Query 1.6 (Heterogeneous Multimedia Query). Giả thiết rằng cơ quan cảnh
sát đƣa ra truy vấn “Tìm tất cả những người đã chụp ảnh với Jose Orojuelo và họ
18

đã bị bắt trong vụ mưu sát tại Mỹ và gần đây họ đã nhận tiền chuyển vào tài khoản
từ ABC Corp”
Trong truy vấn này chúng ta không chỉ phải xác định những ngƣời thoả mãn
yêu cầu trong Query 1.5 mà còn phải xác định trong những ngƣời tìm đƣợc từ
Query 1.5 ai đã chụp ảnh với Jose Orojuelo. Với nhiệm vụ này có thể đòi hỏi phải
tiếp cận với:
Cơ sở dữ liệu thẻ căn cƣớc chứa tên cũng nhƣ hình ảnh của mọi ngƣời.
Cơ sở dữ liệu các hình ảnh chứa các ảnh chụp liên quan đến các vụ điều tra.

Các dữ liệu video theo dõi để thấy đƣợc cuộc gặp gỡ giữa một kẻ khả nghi và
Jose Orojuelo đã đƣợc ghi lại trƣớc đó.
Các thuật toán xử lý ảnh để xác định ai xuất hiện trong bức ảnh chụp hay
trong băng video.
Nhìn chung, các truy vấn này đòi hỏi phải tiếp cận đến các hình thức thƣờng
khác nhau của dữ liệu quan hệ, dữ liệu hình ảnh và các thuật toán xử lý ảnh.
1.3. Các ứng dụng khác
Các kịch bản mẫu về ứng dụng đa phƣơng tiện trên đây đã mô tả phần lớn các
hình thức dữ liệu multimedia và các lập luận có thể bắt gặp. Tuy nhiên ta còn thấy
nhiều thí dụ khác về đa phƣơng tiện từ các lĩnh vực khác nhau.
1.3.1. Các dịch vụ đa phương tiện trong giáo dục
Ngày nay, nhiều trƣờng đại học đã cung cấp chƣơng trình giáo dục từ xa
giành cho những ai không có điều kiện tham gia lớp học với những lý do khác nhau
nhƣ do điều kiện địa lý hay thời gian để có thể theo các khoá học. Khoá học nhƣ
vậy ngày nay thông thƣờng đƣợc tiến hành với việc gửi các tài liệu học tập nhƣ sách
báo, băng ghi hình, bên cạnh đó một số nơi có thể cho phép học viên sử dụng máy
tính truy cập trực tuyến các kho tài liệu dƣới dạng các đoạn phim tƣ liệu, băng tiếng
liên quan đến việc học tập. Thí dụ một học viên có thể truy cập đến một trong các
dịch vụ trên máy chủ của thƣ viện nhà trƣờng đƣa ra câu truy vấn có thể nhƣ “Tìm
tất cả các bài giảng với chủ đề PR- quadtrees có trong thư viện tài liệu”. Thƣ viện
có thể chứa đựng thông tin về chủ đề này trong các phƣơng tiện lƣu trữ khác nhau
19

(các băng video bài giảng, các tập tài liệu) liên quan đến chủ đề trên. Giải pháp truy
vấn đòi hỏi khả năng duyệt qua các tƣ liệu để tìm đƣợc các phần phù hợp, nó có thể
là một video clip. Ngoài các bài giảng, ngƣời sử dụng có khả năng lựa chọn đƣợc
tài liệu mà họ cho là phù hợp nhất.
1.3.2 Ứng dụng trong hội nghị điện tử
Tại các nƣớc phát triển hiện nay trên thế giới, ứng dụng hội nghị điện tử đƣợc
chính phủ quan tâm đầu tƣ một cách nghiêm túc, và thu đƣợc những thành công

nhất định. Tại các tập đoàn, công ty đa quốc gia lớn trên thế giới những ứng dụng
hội nghị điện tử, trực tuyến đƣợc sử dụng trong các mục đích hội họp, trao đổi với
các đơn vị thành viên đặt tại các quốc gia khác nhau nhằm đƣa ra các quyết định,
chiến lƣợc kinh doanh khác nhau mà không cần phải gặp mặt trực tiếp vẫn có thể
cảm nhận đƣợc tầm vóc của một cuộc họp, hội nghị nhờ những công nghệ tiên tiến
tạo ra, hay là trao đổi với đối tác về các thảo thuận làm ăn giữa hai bên. Các tập
đoàn tin học lớn đã đầu tƣ công nghệ vào việc sản xuất ra những sản phẩm phục vụ
nhu cầu trên và thu đƣợc lợi nhuận lớn lao.
1.3.3. Ngành công nghiệp giải trí
Trong một tƣơng lai rất gần, nhu cầu về phim ảnh theo yêu cầu (on demand)
sẽ rất lớn. Ngƣời sử dụng có thể dễ dàng chọn các bộ phim tại nhà và xem chúng
qua TV tại nhà. Trong thời gian hiện nay cách thức chọn phim mà ngƣời sử dụng
mong muốn là rất phong phú. Cũng nhƣ việc ứng dụng đa phƣơng tiện trong lĩnh
vực giáo dục miêu tả ở trên, trong lĩnh vực điện ảnh ngƣời sử dụng có thể lựa chọn
phim mong muốn bằng cách trộn cả truy vấn tìm kiếm và duyệt. Một hệ thống đa
phƣơng tiện hỗ trợ tƣơng tác nhƣ vậy của ngƣời sử dụng thì phải có khả năng tìm
kiếm hiệu quả những bộ phim thoả mãn nhu cầu của ngƣời sử dụng. Hơn thế nữa,
ngƣời sử dụng nên có đƣợc khả năng xem trƣớc những mẩu phim giới thiệu mà họ
mong muốn. Ngoài ra, họ nên đƣợc quyền xem xét các bài phê bình về bộ phim, với
sự cân nhắc nhƣ vậy có thể giúp ngƣời sử dụng lựa chọn đƣợc những bộ phim mà
ngƣời sử dụng thực sự muốn xem.
20

1.4. Kết luận
Nhƣ vậy, với thực tế hiện nay, bên cạnh sự phát triển nhanh chóng của khoa
học công nghệ nói chung và các ngành liên quan đến ứng dụng đa phƣơng tiện nói
riêng, các nguồn dữ liệu đa phƣơng tiện đƣợc tạo ra là vô cùng lớn và đóng vai trò
quan trọng trong nhiều lĩnh vực của đời sống. Dẫn tới nhu cầu về việc quản lý, lƣu
trữ và sử dụng chúng một cách hiệu quả. Với tính đa dạng về các kiểu dữ liệu nên
các cấu trúc dữ liệu đƣợc sử dụng để lƣu trữ hiệu quả các kiểu dữ liệu này là rất

khác nhau. Hơn thế nữa, để quản lý các kiểu dữ liệu này trên cùng một MMDBS
cũng đòi hỏi những cách thức tổ chức dữ liệu phức tạp và rất đáng quan tâm.
Trong luận văn, kiểu dữ liệu đƣợc tập trung xem xét đó là kiểu dữ liệu hình
ảnh, các cấu trúc dữ liệu sử dụng để lƣu trữ kiểu dữ liệu hình ảnh, giới thiệu mô
hình biểu diễn CSDL hình ảnh, cuối cùng đề cập tới việc thiết kế, truy vấn CSDL đa
phƣơng tiện.

21

Chƣơng 2

CẤU TRÚC DỮ LIỆU ĐA CHIỀU
Phần lớn dữ liệu đa phƣơng tiện liên quan đến không gian và thời gian. Loại
dữ liệu này còn đƣợc gọi là dữ liệu n chiều, xuất phát từ thực tế là dữ liệu có các
thuộc tính kết hợp lấy từ không gian n chiều. Thí dụ, không gian có hai hay ba
chiều, không gian – thời gian có 4 chiều (các trục x, y, z, t ). Do vậy, những kỹ thuật
biểu diễn thông tin n chiều sẽ đƣợc tìm hiểu và trình bày.
Phần lớn các kỹ thuật lƣu trữ dữ liệu n – chiều thực hiện tách phân cấp không
gian, biểu diễn bởi các cây. Gốc cây là toàn bộ vùng. Nút biểu diễn vùng, cành biểu
diễn phân hoạch vùng ra tiểu vùng.
Có nhiều cấu trúc dữ liệu khác nhau đƣợc sử dụng để biểu diễn việc tách phân
cấp vùng nhƣ nói trên đây, trong đó có cấu trúc cây k – d, cây tứ phân điểm, cây tứ
phân MX và cây R mỗi chúng có ƣu điểm và nhƣợc điểm riêng.
2.1 Mở đầu
Một trong kịch bản về ứng dụng đa phƣơng tiện là dữ liệu có nguồn gốc thông
tin địa lý. Một hình thức đơn giản nhất là GIS lƣu trữ thông tin về vùng nào đó của
trái đất nhƣ bản đồ hay ảnh chứa các đặc trƣng nổi trội. Trong trƣờng hợp này, bản
đồ là hình ảnh hai chiều, một số điểm trên bản đồ đƣợc xem nhƣ các đối tƣợng cần
quan tâm. Các điểm này có thể đƣợc lƣu trữ trong nhiều cấu trúc dữ liệu đặc biệt.
Hình 2.1a là bản đồ đơn giản có một số điểm trên bản đồ đƣợc xem nhƣ các đối

tƣợng cần quan tâm bằng tên của nó ( thí dụ nhƣ Banja Luka, Brcko). Thay vì điểm
quan tâm, ứng dụng có thể đòi hỏi vùng quan tâm. Trong trƣờng hợp này cấu trúc
dữ liệu phải có khả năng lƣu trữ thông tin về các vùng. Hình 2.1b biểu diễn cùng
bản đồ nhƣng chứa một số vùng quan tâm.



22










Chƣơng này chỉ ra cách biểu diễn dữ liệu bản đồ trên hình 2.1b bằng các loại
cấu trúc là : cây k-d, cây tứ phân và cây R.
2.2 Cây k-d (k-d Trees)
Cây k-d đƣợc sử dụng để lƣu trữ dữ liệu điểm k - chiều nhƣ chỉ ra trên hình
2.1a. Cây k-d không sử dụng để lƣu trữ dữ liệu vùng. Nhƣ vậy, cây 2-d (khi k=2)
lƣu trữ dữ liệu điểm 2-chiều, cây 3-d lƣu trữ dữ liệu điểm 3 chiều…Thí dụ này đề
cập đến dữ liệu điểm 2-d, sau đó khái quát lên k-d.
2.2.1 Cấu trúc nút
Trong cây 2-d, mỗi nút có cấu trúc bản ghi nhất định với kiểu nhƣ sau:




Hình 2.2
nodetype = record
INFO: infotype;
XVAL: real;
YVAL: real;
LLINK: nodetype;
RLINK: nodetype;
Hình 2.1
a)
b)


23

end
Trƣờng INFO có thể có kiểu bất kỳ do ngƣời sử dụng định nghĩa phụ thuộc và
ứng dụng cụ thể. Thí dụ, nó có thể là trƣờng xâu ký tự mô tả tên địa điểm, hay nó có
thể là name:string và population:integer…
Trƣờng XVAL, YVAL biểu thị toạ độ điểm kết hợp với nút.
Các trƣờng LLINK và RLINK chỉ đến hai cành.
Giả sử T trỏ đến gốc của cây 2-d. Nếu N là nút trong cây, thì mức của N đƣợc
xác định qui nạp nhƣ sau:

Level(N) =

Cây 2-d là cây nhị phân bất kỳ nếu thoả mãn điều kiện sau:
1. Nếu N là nút trong cây và level(N) là chẵn thì mỗi nút M trong cành rẽ
nhánh từ N.LLINK có tính chất M.XVAL < N.XVAL, mỗi nút P trong cành rẽ
nhánh từ N.RLINK có tính chất P.XVAL  N.XVAL.
2. Nếu N là nút trong cây và level (N) là lẻ thì mỗi nút M trong cành rẽ nhánh

từ N.LLINK có tính chất M.YVAL < N.YVAL, mỗi nút P trong cành rẽ nhánh từ
N.RLINK có tính chất P.YVAL  N.YVAL. [17]
2.2.2 Chèn và tìm kiếm trong cây 2-d
Việc chèn nút N vào cây do T trỏ tới đƣợc phát biểu phi hình thức nhƣ sau:
Kiểm tra xem N và T có thống nhất các trƣờng XVAL và YVAL hay không. Nếu
thống nhất thì chỉ việc viết đè nút T và kết thúc. Nếu không hãy rẽ trái nếu
N.XVAL < T.XVAL và rẽ phải trong trƣờng hợp ngƣợc lại. Giả sử P là nút con
đang khảo sát. Nếu N và P thống nhất trong các trƣờng XVAL và YVAL thì chỉ cần
viết đè P và kết thúc, nếu không thì rẽ trái khi N.YVAL<P.YVAL, rẽ phải trong
trƣờng hợp ngƣợc lại. Lặp thủ tục này, hãy rẽ nhánh theo XVAL khi đang ở mức
chẵn trong cây, và theo YVAL khi đang ở mức lẻ.



1)(
0
Plevel

Nếu N là gốc của cây

Nếu cha của N là P

×