Tải bản đầy đủ (.pdf) (6 trang)

MultiBooks - Tổng hợp IT - PC part 8 docx

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (236.62 KB, 6 trang )

ABC Corp đã từng bị kết án với tội mưu sát lưu trữ trong kho dữ liệu tội phạm Bắc
Mỹ. Các dữ liệu này cũng được quản lý theo các cách khác nhau. Trên thực tế chỉ
xét riêng nước Mỹ tại các bang khác nhau cũng có sự khác nhau trong việc lưu trữ
các hồ sơ tội phạm. Một số bang thì sử dụng các file phẳng một số thì sử dụng
Dbase, Oracle, một số khác thì dùng Sybase
Với truy vấn có mức độ phức tạp hơn đòi hỏi tiếp cận tất cả các khuôn dạng dữ liệu
văn bản nói trên, nhưng còn phải thêm vào đó là kiểu dữ liệu hình ảnh.
· Query 1.6 (Heterogeneous Multimedia Query). Giả thiết rằng cơ quan
cảnh sát đưa ra truy vấn ”Tìm tất cả những người đã chụp ảnh với Jose Orojuelo
và họ đã bị bắt trong vụ mưu sát tại Mỹ và gần đây họ đã nhận tiền chuyển vào tài
khoản từ ABC Corp ”.
Trong truy vấn này chúng ta không chỉ phải xác định những người thoả mãn yêu
cầu trong Query 1.5 mà còn phải xác định trong những người tìm được từ Query
1.5ai đã chụp ảnh với Jose Orojuelo. Với nhiệm vụ này có thể đòi hỏi phải tiếp cận
với:
§ Cơ sở dữ liệu thẻ căn cước chứa tên cũng như hình ảnh của
mọi người.
§ Cơ sở dữ liệu các hình ảnh chứa các ảnh chụp liên quan đến
các vụ điều tra (đã được trình bày trong phần trước)
§ Các dữ liệu video theo dõi để thấy được cuộc gặp gỡ giữa
một kẻ khả nghi và Jose Orojuelo đã được ghi lại trước đó.
§ Các thuật toán xử lý ảnh để xác định ai xuất hiện trong bức
ảnh chụp hay trong băng video.
Nhìn chung, các truy vấn này đòi hỏi phải tiếp cận đến các hình thức thường khác
nhau của dữ liệu quan hệ, dữ liệu hình ảnh và các thuật toán xử lý ảnh.
· Query 1.7 (Complex Heterogeneous Multimedia Query). Một giả thuyết
phức tạp hơn, cơ quan cảnh sát cần hỏi câu truy vấn “Tìm tất cả những ai đã liên
lạc với Jose Orojuelo và họ đã bị kết án bởi tội mưu sát tại Bắc Mỹ và những ai
gần đây nhận tiền chuyển vào tài khoản riêng từ ABC Corp”.
Trong truy vấn này khái niệm giao tiếp (contact) giữa người thoả mãn Query 1.5
và Jose Orojuelo bao hàm ý nghĩa rộng lớn của cách giao giao tiếp. Thí dụ, một


hình thức giao tiếp có thể thông qua ảnh chụp, ảnh theo dõi hay ảnh video: hai
người được xem như là giao tiếp nếu họ chụp chung ảnh. Mặt khác, hai người giao
tiếp nếu họ hội thoại với nhau. Thí dụ, nếu băng ghi âm cho thấy ai đó nói với Jose
Orojuelo trên điện thoại thì nó thoả mãn “giao tiếp” trong câu truy vấn trên đây.
Tương tự, thư điện tử là một hình thức khác của giao tiếp giữa những người liên
quan. Cuối cùng thư đánh máy và thư viết tay trao đổi giữa Jose Orojuelo và ai đó
cũng thoả mãn tiêu chí “giao tiếp” nói trên. Như vậy, để trả lời được câu truy vấn
trên đây, ta cần xâm nhập đến dải rộng dữ liệu văn bản khác nhau (để trả lời truy
vấn Query 1.5), bao gồm các DBMS quan hệ khác nhau, cũng như các loại dữ liệu
khác nhau như ảnh, video, audio, văn bản và chữ viết tay.
1.3 Các ứng dụng khác
Các kịch bản mẫu về ứng dụng đa phương tiện trên đây đã mô tả phần lớn các hình
thức dữ liệu multimedia và các lập luận có thể bắt gặp. Tuy nhiên ta còn thấy nhiều
thí dụ khác về đa phương tiện từ các lĩnh vực khác nhau.
1.3.1 Các dịch vụ đa phương tiện trong giáo dục
Ngày nay, nhiều trường đại học đã cung cấp chương trình giáo dục từ xa giành cho
những ai không có điều kiện tham gia lớp học với những lý do khác nhau như do
điều kiện địa lý hay thời gian để có thể theo các khoá học. Khoá học như vậy ngày
nay thông thường được tiến hành với việc gửi các băng ghi hình (nếu không
bị hạn chế về thời gian thì các buổi học kết hợp tham khảo các tư liệu đa phương
tiện là rất tốt). Trong một tương lai không xa, người sử dụng máy tính có thể truy
cập trực tuyến các kho tài liệu dưới dạng băng hình, băng tiếng liên quan đến việc
học tập. Thí dụ một sinh viên có thể truy cập đến một trong các dịch vụ trên máy
chủ của nhà cung cấp dịch vụ và đưa ra câu truy vấn có thể như “Tìm tất cả các bài
giảng với chủ đề PR-quadtrees có trong thư viện tài liệu”. Thư viện có thể chứa
đựng thông tin về chủ đề này trong các phương tiện lưu trữ khác nhau (các băng
video bài giảng, các tập tài liệu in) liên quan đến chủ đề trên. Giải pháp truy vấn
đòi hỏi khả năng duyệt qua các tư liệu để tìm được các phần phù hợp, nó có thể là
một video clip. Ngoài các bài giảng, người sử dụng có khả năng lựa chọn được tài
liệu mà họ cho là phù hợp nhất.

1.3.2 Ngành công nghiệp điện ảnh
Trong một tương lai rất gần, nhu cầu về phim ảnh theo yêu cầu (on demand) sẽ rất
lớn. Người sử dụng có thể dễ dàng chọn các bộ phim tại nhà và xem chúng qua TV
tại nhà. Trong thời gian hiện nay cách thức chọn phim mà người sử dụng mong
muốn là rất phong phú. Cũng như việc ứng dụng đa phương tiện trong lĩnh vực
giáo dục miêu tả ở trên, trong lĩnh vực điện ảnh người sử dụng có thể lựa chọn
phim mong muốn bằng cách trộn cả truy vấn tìm kiếm và duyệt. Thí dụ, người sử
dụng muốn xem một bộ phim Alfred Hitchcock nhưng trong đó không có sự tham
gia diễn xuất của Jimmy Stewart (có lẽ anh ta đã xem một số bộ phim kiểu này
trước đây và đã trở nên nhàm chán với sự diễn xuất của Jimmy Stewart). Một hệ
thống đa phương tiện hỗ trợ tương tác như vậy của người sử dụng thì phải có khả
năng tìm kiếm hiệu quả những bộ phim thoả mãn nhu cầu của người sử dụng. Hơn
thế nữa, người sử dụng nên có được khả năng xem trước những mẩu phim giới
thiệu mà họ mong muốn. Ngoài ra, họ nên được quyền xem xét các bài phê bình về
bộ phim, với sự cân nhắc như vậy có thể giúp người sử dụng lựa chọn được những
bộ phim mà anh ta thực sự muốn xem.
1.3.3 Lời khuyên của các chuyên gia
Rất nhiều chúng ta không muốn phải trả giá cắt cổ cho việc sửa chữa ô tô. Trong
nhiều trường hợp, việc sửa chữa có thể thực hiện dễ dàng, rẻ tiền nếu ta có chút ít
tri thức cơ bản về những việc cần làm. Sách hướng dẫn sử dụng nhiều khi vô ích vì
nó quá dày để thực hành. Một ý tưởng thú vị là tạo ra trợ giáo tự động (assistant)
hay các tác tử (agent) cho các công việc khác nhau từ sửa chữa ống nước cho đến
sửa chữa ô tô.
Thí dụ với việc sửa chữa ô tô, chúng ta muốn tương tác với chương trình để chỉ ra
trên màn hình cái chúng ta cần nhìn thấy dưới mui xe. Hướng dẫn sử dụng quá súc
tích: các câu như “miếng đệm cao su 16-inch đặt ở bên phíc cắm của cuộn dây
đánh lửa” cho ta quá nhiều ý nghĩa. Người trợ giáo tự động sửa chữa ô tô sẽ chỉ ra
ảnh (có thể lấy ra từ tài liệu hướng dẫn điện tử) của các chi tiết liên quan đến xe ô
tô. Người sử dụng dễ dàng quan sát ảnh này và xác định phần vật lý nào trong xe
tương ứng với phần đánh dấu trong ảnh. Giả sử phải thay thế toàn bộ miếng đệm,

hệ thống sẽ in ra toàn độ đặc tả kỹ thuật của nó cùng với danh sách các nhà cung
cấp trong vùng nơi họ sống.
1.3.4 Công nghiệp du lịch
Rất nhiều người lập kế hoạch nghỉ hè cho gia đình hàng năm phải đến các đại lý du
lịch hay trong sách quảng cáo du lịch để tìm ra địa điểm du lịch phù hợp tài chính
và thoả mãn nhu cầu nghỉ ngơi của họ. Nhưng ta có thể lập kế hoạch toàn bộ
chuyến du lịch tại nhà. Hệ thống đa phương tiện cài đặt đại lý du lịch thông minh
cho người sử dụng khả năng khớp nối các nhu cầu du lịch của họ, sau đó hỏi hệ
thống để tìm ra vị trí thoả mãn. Hệ thống có thể cho lại nhiều điểm đến đều thoả
mãn yêu cầu người sử dụng. Hệ thống sẽ in ra toàn bộ hành trình, chi tiết về khách
sạn, lịch bay
1.3.5 Shopping tại nhà
Tương tự như công nghiệp du lịch, ta có thể sử dụng cùng khái niệm để thương
mại sản phẩm đến khách hàng. Như trong trường hợp của công nghiệp du lịch,
khách hàng có thể gọi hay xâm nhập các nhà cung cấp dịch vụ mà họ cung cấp
thông tin trực tuyến về các sản phẩm đang có và các thông tin thương mại khác.
1.4 Kết luận
Các thí dụ liệt kê trên đây cùng chia sẻ các khía cạnh chung mà có thể là cách trừu
tượng để hình thành lõi dữ liệu sẽ trình diễn và lõi của thuật toán sẽ cài đặt. Các
khía cạnh chung này là độc lập với bất kỳ ứng dụng cụ thể nào.

>
Chương 2
CẤU TRÚC DỮ LIỆU ĐA CHIỀU
Phần lớn dữ liệu đa phương tiện liên quan đến không gian và thời gian. Dữ liệu
loại này còn được gọi là dữ liệu n chiều, xuất phát từ thực tế là dữ liệu có các thuộc
tính trong không gian n chiều. Thí dụ, không gian có hai hay ba chiều, không
gian-thời gian có 4 chiều ( các trục x, y, z, t). Ta sẽ nghiên cứu kỹ thuật biểu diễn
thông tin n chiều.
Phần lớn các kỹ thuật lưu trữ dữ liệu n-chiều đều sử dụng việc tách “phân cấp”

không gian và được biểu diễn bởi các cây. Gốc cây biểu diễn toàn bộ vùng. Nút
biểu diễn vùng, cành biểu diễn việc phân hoạch vùng ra tiểu vùng.
Có nhiều cấu trúc dữ liệu khác nhau được sử dụng để biểu diễn việc tách phân cấp
vùng. Ta sẽ nghiên cứu cây k-d, cây tứ phân điểm, cây tứ phân MX và cây R. Mỗi
chúng thực hiện tách không gian theo cách khác nhau và có ưu điểm và nhược
điểm riêng.
2.1 Mở đầu
Error!

Một trong kịch bản về ứng dụng đa phương tiện là dữ liệu có nguồn gốc thông tin
địa lý (GIS). Một hình thức đơn giản nhất là GIS lưu trữ thông tin về vùng nào đó
của trái đất như bản đồ (ảnh) chứa các đặc trưng nổi trội. Trong trường hợp này,
bản đồ là ảnh hai chiều, một số điểm trên bản đồ được xem như các đối tượng cần
quan tâm. Các điểm này có thể được lưu trữ trong nhiều cấu trúc dữ liệu đặc biệt.
Hình 2.1a) là bản đồ đơn giản có một số điểm quan tâm trên nó. Các điểm được
đánh dấu bởi địa danh (thí dụ như Banja Luka, Brcko). Thay vì điểm quan tâm,
ứng dụng có thể quan tâm đến vùng bản đồ. Trong trường hợp này cấu trúc dữ liệu
phải có khả năng lưu trữ thông tin về các vùng. Hình 2.1b) biểu diễn cùng bản đồ
nhưng chứa một số vùng quan tâm.
Chương này chỉ ra cách biểu diễn dữ liệu bản đồ trên hình 2.1 bằng các loại cây k-
d, cây tứ phân và cây R.
2.2 Cây k-d (k-d Trees)
Cây k-d được sử dụng để lưu trữ dữ liệu điểm k-chiều như chỉ ra trên hình 2.1a.
Không sử dụng nó để lưu trữ dữ liệu vùng. Như vậy, cây 2-d (khi k=2) lưu trữ dữ
liệu điểm 2-chiều, cây 3-d lưu trữ dữ liệu điểm 3-chiều Thí dụ này đề cập đến dữ
liệu điểm 2-d, sau đó khái quát lên dữ liệu điểm 3-d.
2.2.1 Cấu trúc nút

Error!



Trong cây 2-d, mỗi nút có cấu trúc bản ghi nhất định với kiểu như sau:
nodetype = record
INFO: infotype;
XVAL: real;
YVAL: real;
LLINK: nodetype;
RLINK: nodetype;
end
Trường INFO có thể có kiểu bất kỳ do người sử dụng định nghĩa và phụ thuộc vào
ứng dụng cụ thể. Thí dụ, nó có thể là trường xâu ký tự mô tả địa danh,

×