Tải bản đầy đủ (.pdf) (74 trang)

Nghiên cứu cơ sở dữ liệu đối tượng chuyển động và ứng dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.78 MB, 74 trang )

i
ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

LƢƠNG VĂN NHẤT

NGHIÊN CỨU CƠ SỞ DỮ LIỆU ĐỐI TƢỢNG CHUYỂN ĐỘNG
VÀ ỨNG DỤNG

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

NGƢỜI HƢỚNG DẪN
TS. NGUYỄN NHƢ SƠN

THÁI NGUYÊN 2015

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

ii

MỤC LỤC
LỜI CAM ĐOAN ..................................................................................................iv
LỜI CẢM ƠN ......................................................................................................... v
DANH MỤC TỪ VIẾT TẮT ................................................................................vi
MỞ ĐẦU ................................................................................................................ 1
Chƣơng 1. TỔNG QUAN VỀ CSDL ĐỐI TƢỢNG CHUYỂN ĐỘNG VÀ
CÁC CÔNG CỤ PHÁT TRIỂN ............................................................................. 3

1.1. Cơ sở dữ liệu. ......................................................................................... 3


1.1.1. Định nghĩa cơ sở dữ liệu ................................................................. 3
1.1.2. Ƣu điểm của việc sử dụng CSDL ................................................... 3
1.1.3. Tổ chức CSDL ................................................................................ 4
1.1.4. Hệ quản trị cơ sở dữ liệu. ................................................................ 5
1.2. Cơ sở dữ liệu đối tƣợng chuyển động .................................................... 6
1.2.1. Điểm chuyển động .......................................................................... 7
1.2.2. Vùng chuyển động .......................................................................... 9
1.2.3. Đặc tính của các đối tƣợng chuyển động ...................................... 10
1.2.4. Mô hình dữ liệu khái quát cho đối tƣợng chuyển động ................ 11
1.2.5. Công nghệ khai phá dữ liệu .......................................................... 11
1.3. Cơ sở dữ liệu không gian ..................................................................... 12
1.3.1. Mô phỏng khái niệm không gian .................................................. 13
1.3.2. Mở rộng mô hình dữ liệu và ngôn ngữ truy vấn ........................... 15
1.4. Cơ sở dữ liệu thời gian ......................................................................... 18
1.4.1. Quản lý thời gian trong cơ sở dữ liệu dạng chuẩn ........................ 18
1.4.2. Miền thời gian ............................................................................... 19
1.5. Dịch vụ công nghệ điện toán đám mây Google App Engine (GAE)... 19
1.5.1. Tổng quan về điện toán đám mây ................................................. 19
1.5.2. Google App Engine (GAE) ........................................................... 20
1.6. Hệ thống định vị toàn cầu GPS - Global Positioning System ............. 27
1.6.1. Phần không gian: ........................................................................... 28
1.6.2. Phần kiểm soát: ............................................................................. 29
1.6.3. Phần sử dụng: ................................................................................ 29
1.7. Kết luận ................................................................................................ 29

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

iii

Chƣơng 2. HỆ THỐNG LƢU TRỮ CSDL ĐỐI TƢỢNG CHUYỂN ĐỘNG .... 30

2.1. Tổng quan về hệ thống lƣu trữ CSDL đối tƣợng chuyển động ........... 30
2.2. Hệ thống lƣu trữ CSDL đối tƣợng chuyển động Secondo ................... 30
2.2.1. Giới thiệu....................................................................................... 30
2.2.2. Kiến trúc ........................................................................................ 31
2.2.3. Quản lý dữ liệu đối tƣợng chuyển động: ...................................... 36
2.2.4. Truy vấn dữ liệu ............................................................................ 39
2.2.5. Thuật toán tối ƣu hóa: Tìm đƣờng đi ngắn nhất của một đồ thị thứ
tự vị từ (predicate order graph - POG) .................................................... 41
2.3. Kết luận ................................................................................................ 46
Chƣơng 3. THIẾT KẾ VÀ THỬ NGHIỆM TRÊN HỆ THỐNG LƢU TRỮ DỮ
LIỆU CHUYỂN ĐỘNG ....................................................................................... 47

3.1. Giới thiệu bài toán ................................................................................ 47
3.1.1. Cấu trúc chƣơng trình ................................................................... 48
3.1.2. Phân tích hệ thống ......................................................................... 49
3.1.3. Mô hình hoạt động ........................................................................ 50
3.2. Cài đặt và cấu hình Secondo ................................................................ 50
3.2.1. Cài đặt Secondo trên Ubuntu 14.04 .............................................. 50
3.2.2. Cấu hình Secondo lần đầu trong Hệ điều hành Ubuntu 14.04 ...... 51
3.2.3. Giao diện hệ thống Secondo ......................................................... 52
3.3. Thử nghiệm .......................................................................................... 53
3.3.1. Thao tác trên Secondo ................................................................... 53
3.3.2. Thao tác trên thiết bị đƣợc thử nghiệm ......................................... 54
3.4. Đánh giá ............................................................................................... 59
3.5. Kết luận ................................................................................................ 60
KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN ............................................................ 61
TÀI LIỆU THAM KHẢO .................................................................................... 63
PHỤ LỤC: ............................................................................................................ 64


Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

iv
LỜI CAM ĐOAN
Tôi xin cam đoan toàn bộ nội dung quyển luận văn này là do tôi tự sưu
tầm, tra cứu và xây dựng đáp ứng nội dung yêu cầu của đề tài.
Nội dung bản luận văn chưa từng được công bố hay xuất bản dưới bất
kỳ hình thức nào và cũng không được sao chép từ bất kỳ một công trình
nghiên cứu nào.
Phần mã nguồn của chương trình do tôi thiết kế và xây dựng, trong đó
có sử dụng một số thư viện chuẩn và các thuật toán được các tác giả xuất
bản công khai và miễn phí trên mạng Internet.
Nếu sai tôi xin hoàn toàn chịu trách nhiệm.
Thái Nguyên, tháng 08 năm 2015
Tác giả

Lƣơng Văn Nhất

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

v
LỜI CẢM ƠN
Sau một thời gian tìm hiểu và nghiên cứu, luận văn “Nghiên cứu cơ sở
dữ liệu đối tượng chuyển động và ứng dụng” đã hoàn thành. Ngoài sự cố
gắng của bản thân, tôi đã nhận đƣợc nhiều sự khích lệ từ phía nhà trƣờng,

thầy cô, gia đình và bạn bè.
Lời đầu tiên em xin bày tỏ lòng biết ơn sâu sắc đến thầy giáo - TS.
Nguyễn Nhƣ Sơn – Viện Công nghệ thông tin thuộc Viện Hàn lâm Khoa học
và Công nghệ Việt Nam là giáo viên hƣớng dẫn tôi đã tận tình giúp đỡ trong
suốt thời gian làm luận văn.
Em xin chân thành cảm ơn các thầy, cô đã luôn nhiệt tình giúp đỡ,
truyền đạt những kiến thức và kinh nghiệm quý báu trong suốt quá trình học
tập.
Xin chân thành cảm ơn các anh, các chị và các bạn học viên học cùng
lớp Cao học K11I đã luôn động viên, giúp đỡ và chia sẻ với tôi những kinh
nghiệm học tập trong suốt khoá học.
Tôi xin chân thành cảm ơn Ban giám hiệu trƣờng THCS Ninh Nhất, các
thầy cô giáo trong trƣờng đã tạo điều kiện tốt nhất để tôi có thể hoàn thành
khoá học này.
Mặc dù đã có nhiều cố gắng, song do điều kiện nghiên cứu và trình độ,
luận văn không tránh khỏi những khiếm khuyết. Em chân thành mong nhận
đƣợc sự đóng góp ý kiến của các thầy, cô giáo và bạn bè đồng nghiệp gần xa.
Một lần nữa em xin cảm ơn!
Ngƣời thực hiện luận văn
Lƣơng Văn Nhất

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

vi

DANH MỤC TỪ VIẾT TẮT
- API


Application Programming Interface

- CSDL

Cơ sở dữ liệu

- DBMS

Database Management System

- GAE

Google App Engine

- GPS

Global Position System

- JVM

Java Virtual Machine

- KTG

Không gian-thời gian (Spatio-temporal)

- LBS

Location-based service


- MOD

Moving Objects Databases

- GUI

Graphic User Interface

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

vii

DANH MỤC HÌNH
Hình 1.1. Kiểu dữ liệu không gian (point, line, region).................................... 6
Hình 1.2: Điểm thay đổi rời rạc (trái) - Điểm thay đổi liên tục (phải). ........... 8
Hình 1.3: Trình diễn rời rạc của một điểm chuyển động. ................................ 9
Hình 1.4. Vùng thay đổi rời rạc (trái) - Vùng thay đổi liên tục (phải). ............ 9
Hình 1.5. Công nghệ khai phá dữ liệu từ MOD. ............................................. 12
Hình 1.6. Điểm, đường và vùng ...................................................................... 14
Hình 1.7. Phân vùng........................................................................................ 15
Hình 1.8. Mạng................................................................................................ 15
Hình 1.9. Kiến trúc hoạt động của GAE. ........................................................ 22
Hình 1.10: Phân bố các vệ tinh GPS .............................................................. 28
Hình 2.1. Kiến trúc hệ thống Secondo ............................................................ 31
Hình 2.2. Kiến trúc thô của nhân trong hệ thống Secondo ............................ 32
Hình 2.3 Mô hình quản lý dữ liệu chuyển động .............................................. 36
Hình 2.4. Đồ thị POG với ba vị từ p, q, r........................................................ 41
Hình 2.5. Hình xây dựng đệ quy của đồ thị POG ........................................... 43

Hình 2.6. Hai truy vấn đồ thị .......................................................................... 44
Hình 3.1. Mô hình bài toán tìm kiếm .............................................................. 47
Hình 3.2. Mô hình hoạt động của ứng dụng ................................................... 50
Hình 3.3. Một số lệnh khởi tạo hệ thống Secondo .......................................... 51
Hình 3.4. Giao diện hệ thống Secondo ........................................................... 53
Hình 3.5. Thực thi lệnh ifconfig trên Ubuntu.................................................. 54
Hình 3.6. Giao diện chính ............................................................................... 55
Hình 3.7. Giao diện theo dõi hành trình của thiết bị ...................................... 56
Hình 3.8. Giao diện truy vấn thông tin địa điểm ............................................ 57
Hình 3.9. Kết quả truy vấn .............................................................................. 58
Hình 3.10. Kết quả tìm đường đi..................................................................... 59

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

1
MỞ ĐẦU
1. Lý do chọn đề tài:

,
… Một số công việ
. Vấn đề này thuộc xu
hƣớng xây dựng các hệ thống CSDL qui mô cực lớn liên quan tới các thông
tin thời gian và không gian đang đƣợc triển khai mạnh mẽ trên thế giới. Ví dụ
cụ thể là các CSDL của đối tƣợng chuyển động (Moving Object Database MOD), một dạng của CSDL không gian-thời gian (spatio-temporal - KTG).
Đề tài: “Nghiên cứu cơ sở dữ liệu đối tượng chuyển động và ứng
dụng” tập trung tìm hiểu những khái niệm cơ bản về công nghệ CSDL đối
tƣợng chuyển động dựa theo mã nguồn mở Secondo và ứng dụng xây dựng
chƣơng trình tìm kiếm địa điểm dựa trên việc xác định vị trí và đƣờng đi của

ngƣời sử dụng điện thoại di động.
2. Đối tƣợng và phạm vi nghiên cứu của đề tài:
CSDL đối tƣợng chuyể

[6];

Công nghệ CSDL MOD dựa theo mã nguồn mở Secondo [11];
Công nghệ điện toán đám mây của Google [9];
Dữ liệu GPS của thiết bị Smartphone.
3. Hƣớng nghiên cứu của đề tài:
Nghiên cứu cơ sở khoa học, công nghệ CSDL đối tƣợng chuyển động
dựa theo mã nguồn mở Secondo

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

2

Lƣu trữ dữ liệu GPS của thiết bị Smartphone lên máy chủ CSDL
Secondo
Cài đặt ứng dụng demo “Xác định vị trí và đường đi của thiết bị
Smartphone”
4. Phƣơng pháp nghiên cứu:
Nghiên cứu cơ sở khoa học, công nghệ

ối tƣợng chuyển

động dựa theo mã nguồn mở Secondo;
, Internet, …

Phƣơng pháp thực nghiệm.

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

3
Chƣơng 1. TỔNG QUAN VỀ CSDL ĐỐI TƢỢNG CHUYỂN ĐỘNG
VÀ CÁC CÔNG CỤ PHÁT TRIỂN
1.1. Cơ sở dữ liệu.
1.1.1. Đị nh nghĩa cơ sở dữliệu
Cơ sở dữ liệu là tập hợp các dữ liệu có liên quan với nhau, đƣợc lƣu trữ
trên máy tính, có nhiều ngƣời sử dụng và đƣợc tổ chức theo một mô hình. Dữ
liệu là những sự kiện có thể ghi lại đƣợc và có ý nghĩa. Ví dụ nhƣ:
- Họ và tên: Lƣơng Văn Nhất.
- Ngày sinh: 22/8/1985.
- Địa chỉ: Xã Quỳnh Lƣu, huyện Nho Quan, tỉnh Ninh Bình.
- Điện thoại: 0946864885.
- Tên cơ quan: Trƣờng THCS Ninh Nhất.
Tất cả các CSDL đều có thể đƣợc biểu diễn bởi hệ thống các thực thể,
thuộc tính và mối quan hệ giữa các thực thể.
1.1.2. Ưu điểm của việc sửdụng CSDL
Từ khái niệm trên, ta thấy rõ ƣu điểm nổi bật của CSDL là:
Giảm sự trùng lặp thông tin xuống mức thấp nhất và do đó đảm bảo
đƣợc tính nhất quán và toàn vẹn dữ liệu.
Đảm bảo sự độc lập giữa dữ liệu và chƣơng trình ứng dụng: Cho
phép thay đổi cấu trúc, dữ liệu trong cơ sở dữ liệu mà không cần thay
đổi chƣơng trình ứng dụng.
Trừu tƣợng hoá dữ liệu (Data Abstraction): Mô hình dữ liệu đƣợc sử
dụng để làm ẩn lƣu trữ vật lý chi tiết của dữ liệu, chỉ biểu diễn cho

ngƣời sử dụng mức khái niệm của cơ sở dữ liệu.
Nhiều khung nhìn (multi-view) cho các đối tƣợng ngƣời dùng khác
nhau: Đảm bảo dữ liệu có thể đƣợc truy xuất theo nhiều cách khác

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

4
nhau. Vì yêu cầu của mỗi đối tƣợng sử dụng CSDL là khác nhau nên
tạo ra nhiều khung nhìn vào dữ liệu là cần thiết.
Đa ngƣời dùng (multi-user): Khả năng chia sẻ thông tin cho nhiều
ngƣời sử dụng và nhiều ứng dụng khác nhau [2].
1.1.3. Tổ chức CSDL
CSDL đƣợc tổ chức có cấu trúc: Thành các bản ghi (record), các trƣờng
dữ liệu (field). Các dữ liệu lƣu trữ có mối quan hệ (relational) với nhau.
CSDL đƣợc cấu trúc để dễ dàng truy cập, quản lý và cập nhật dữ liệu.
Table (Bảng): Là một thành phần cơ bản trong chƣơng trình quản trị
cơ sở dữ liệu quan hệ. Bảng đƣợc hình thành khi sắp xếp các thông
tin có liên quan với nhau theo hàng và cột. Các hàng tƣơng ứng với
các bản ghi (record) dữ liệu và các cột tƣơng ứng với trƣờng dữ liệu.
Các bạn hãy xem bảng Ngƣời quen. Các hàng là ngƣời, mỗi hàng
tƣơng ứng với một ngƣời. Các cột là trƣờng (hay lĩnh vực) của thông
tin.
Record (bản ghi): Trong chƣơng trình quản trị cơ sở dữ liệu, đây là
một đơn vị hoàn chỉnh nhỏ nhất của dữ liệu, đƣợc lƣu trữ trong
những trƣờng hợp dữ liệu đã đƣợc đặt tên. Trong một cơ sở dữ liệu
dạng bảng, bản ghi dữ liệu đồng nghĩa với hàng (row). Bản ghi chứa
tất cả các thông tin có liên quan với mẫu tin mà cơ sở dữ liệu đang
theo dõi. Ví dụ, trong cơ sở dữ liệu về Ngƣời quen, bản ghi sẽ liệt kê

tên ngƣời quen, ngày sinh, số điện thoại, địa chỉ và tên cơ quan. Hầu
hết các chƣơng trình đều hiển thị các bản ghi dữ liệu theo hai cách:
theo các mẫu nhập dữ liệu và theo các bảng dữ liệu. Các bản ghi dữ
liệu đƣợc hiển thị dƣới dạng các hàng ngang và mỗi trƣờng dữ liệu là
một cột.

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

5

Field (Trƣờng dữ liệu): Trong chƣơng trình quản trị cơ sở dữ liệu,
đây là không gian dành cho một mẫu thông tin trong bản ghi dữ liệu.
Trong chƣơng trình quản trị CSDL dạng bảng với dữ liệu đƣợc tổ
chức theo hàng và cột, thì trƣờng dữ liệu tƣơng ứng với các cột. Nhƣ
ở bảng Cơ quan, ta có các trƣờng Tên cơ quan, Địa chỉ, Thành phố,
Số điện thoại, Lĩnh vực hoạt động.
RDBM - Relation Database Management (Quản lý cơ sở dữ liệu
quan hệ): Là một cách quản lý cơ sở dữ liệu, trong đó dữ liệu đƣợc
lƣu trữ trong các bảng dữ liệu hai chiều gồm các cột và các hàng, có
thể liên quan với nhau nếu các bảng đó có một cột hoặc một trƣờng
chung nhau.
Primary key (khóa chính): Là một giá trị dùng để phân biệt bản ghi
này với bản ghi khác. Giá trị của khóa chính trong mỗi bản ghi là
duy nhất trong cả bảng. Có thể xem số chứng minh nhân dân nhƣ
một khóa chính và không ngƣời nào giống ngƣời nào.
Ngoài khóa chính ra còn có khóa ngoài (foreign key): Khóa ngoài
là giá trị dùng để liên kết giữa các bảng và thiết lập mối quan hệ giữa
các bản ghi trong các bảng khác nhau.

1.1.4. Hệ quản trị cơ sở dữliệu.
Một hệ quản trị cơ sở dữ liệu là một hệ thống phần mềm trên máy tính
cung cấp các công cụ để truy tìm, sửa chữa, xóa và chèn thêm dữ liệu. Các
chƣơng trình này cũng có thể dùng để thành lập một cơ sở dữ liệu và tạo ra
các báo cáo, thống kê [2].
Các hệ quản trị cơ sở dữ liệu liên quan khá thông dụng hiện nay tại
Việt Nam là Foxpro, Access cho ứng dụng nhỏ, DB 2, MS SQL và Oracle cho
ứng dụng vừa và lớn.

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

6
1.2. Cơ sở dữ liệu đối tƣợng chuyển động
Cơ sở dữ liệu (CSDL) các đối tƣợng chuyển động (Moving Objects
Databases-MOD) là CSDL hỗ trợ cho mô hình và truy vấn của các dữ liệu địa
lý phụ thuộc thời gian và các đối tƣợng chuyển động. Các ứng dụng dịch vụ
dựa trên vị trí (Location based services - LBS) mà MOD cung cấp rất đa dạng
và phong phú nhƣ các lĩnh vực: Quản lý và phân tích giao thông, phân tích
hành vi ngƣời (khách hàng), nghiên cứu môi trƣờng, sinh học (ví dụ theo dõi
sự di cƣ của động vật theo mùa), khoa học Trái đất, lịch sử,…Xây dựng mô
hình dữ liệu cho các đối tƣợng trong các ứng dụng đó là những yêu cầu luôn
đƣợc đặt ra, có ba kiểu trừu tƣợng hóa cơ bản (tham khảo Hình 1.1) có thể
đƣợc sử dụng: Điểm (point), đƣờng (line), và vùng (region) [6]. Các đối
tƣợng chuyển động đó cần phải đƣợc lƣu trữ trong một CSDL.

Hình 1.1. Kiểu dữ liệu không gian (point, line, region).
MOD đã đƣợc nghiên cứu trong khoảng 15 năm nay, các công trình nghiên
cứu CSDL MOD tập trung chủ yếu vào hai góc nhìn khác nhau nhƣ sau:


Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

7
- Góc nhìn quản lý vị trí xem xét đến việc lƣu trữ trong CSDL các vị trí
hiện tại của các đối tƣợng chuyển động và các truy vấn cho các vị trí ở
thời điểm hiện tại và tƣơng lai gần. Cách tiếp cận này không quan tâm
đến tính động của chuyển động vì nó không ghi lại tất cả lịch sử của đối
tƣợng chuyển động. Nó đƣợc coi nhƣ một CSDL đƣợc ghi lại ngay, duy
trì trạng thái hiện tại.
- Góc nhìn dữ liệu không gian-thời gian (KTG) xem xét việc lƣu trữ
trong một cơ sở dữ liệu không gian của dữ liệu chuyển động, với một
quan tâm đến quan sát các sự thay đổi theo thời gian để phân tích hành
vi của các đối tƣợng chuyển động từ dữ liệu lịch sử của chuyển động.
Cách tiếp cận này giới thiệu hai kiểu đối tƣợng chuyển động trừu tƣợng
cơ bản là điểm chuyển động (moving point) và vùng chuyển động
(moving region) [6]. Đây là hai kiểu đối tƣợng chuyển động quan trọng
nhất trong mô hình dữ liệu MOD và hai khái niệm này sẽ đƣợc làm rõ ở
phần dƣới đây.
1.2.1. Điểm chuyển động
Một điểm chuyển động (MPoint) là trừu tƣợng cơ bản của một đối
tƣợng vật lý chuyển động trên mặt phẳng hoặc trong không gian nhiều chiều,
nó chỉ liên quan đến thay đổi vị trí. MPoint đƣợc định nghĩa khác nhƣ là một
hàm liên tục từ thời gian vào không gian 2 chiều (2D), hoặc nhƣ một đƣờng
gấp khúc (polyline) trong không gian ba chiều (2D + thời gian) [4]. Khi phân
tích hành vi chuyển động của ngƣời và động vật trong không gian, các chuyển
động có thể dễ dàng đƣợc mô hình hóa và xử lý nhƣ một chuỗi các quan sát
điểm chuyển động, đƣợc biểu diễn nhƣ là 3 bộ thời gian t và tọa độ (x, y). Ví

dụ cho các đối tƣợng điểm chuyển động nhƣ: ô tô, máy bay, tàu chở hàng,
ngƣời sử dụng điện thoại di động, động vật,...

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

8

Các công trình nghiên cứu CSDL KTG giới thiệu sự phân loại của các
dữ liệu điểm phụ thuộc vào thời gian. Những dữ liệu này có thể đƣợc xem
một cách tự nhiên nhƣ đƣợc nhúng vào một không gian, đó là tích véc tơ của
miền không gian và thời gian và đƣợc trình diễn trong một không gian 3D
(tham khảo hình 1.2). Trong miền thời gian t, thời gian có thể đƣợc xem là rời
rạc, dày đặc, hoặc liên tục, vì những lý do thực tế các mô hình CSDL thời
gian (temporal database) thƣờng dùng các thể hiện rời rạc của thời gian.
Ngƣợc lại, các mô hình liên tục là tƣơng thích hơn để nói về với các đối tƣợng
chuyển động [6].

Hình 1.2: Điểm thay đổi rời rạc (trái) - Điểm thay đổi liên tục (phải).
Các mô hình chuyển động của các điểm đƣợc tập trung vào các khái
niệm về hành trình (trajectory), các dữ liệu chuyển động thu đƣợc bằng cách
sử dụng bộ phần mềm hỗ trợ định vị và ghi lại các vị trí chuyển động của đối
tƣợng chuyển động. Trình diễn cho sự chuyển động của một điểm chuyển
động trong một hình thức rời rạc. Tiếp cận này thể hiện của thời gian liên kết
với một đơn vị chuyển động của một điểm chuyển động trong mặt phẳng x, y
nhƣ là một hàm của thời gian (hình 1.3)

Số hóa bởi Trung tâm Học liệu - ĐHTN


/>

9

Hình 1.3: Trình diễn rời rạc của một điểm chuyển động.
1.2.2. Vùng chuyển động
Vùng chuyển động (MRegion) là trừu tƣợng cơ bản của một đối tƣợng
vật lý di chuyển xung quanh trong mặt phẳng hoặc trong một không gian
nhiều chiều. Những MRegion là những thực thể chuyển động với sự thay đổi
về độ lớn và vị trí theo thời gian trong không gian. Các ví dụ về MRegion
nhƣ: cơn bão, cháy rừng, sự cố tràn dầu, sự lây lan của thảm thực vật hoặc
của một căn bệnh, dịch bệnh, ...MRegion đƣợc trình diễn trong không gian 3
chiều (trong hình 1.4).

Hình 1.4. Vùng thay đổi rời rạc (trái) - Vùng thay đổi liên tục (phải).
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

10

1.2.3. Đặc tính của các đối tượng chuyển động
Trong phần này, tôi xin trình bày một số đặc điểm của các đối tƣợng
chuyển động, dựa trên các nghiên cứu của các nhà khoa học trong về việc lƣu
trữ, xử lý các mô hình và các truy vấn của dữ liệu chuyển động. Dữ liệu các
đối tƣợng chuyển động thƣờng đƣợc lƣu trữ trong hệ thống cơ sở dữ liệu
không gian - thời gian, cung cấp những ngôn ngữ cho việc đặt ra câu truy vấn.
Các đặc tính của đối tƣợng chuyển động, đối với "hình dạng" của nó
trong không gian 3D, có thể đƣợc tóm tắt nhƣ sau:
Điểm:

• Các sự kiện trong không gian và thời gian: ;
• Địa điểm có giá trị trong một thời gian nhất định: ;
• Thiết lập các vị trí sự kiện theo trình tự: ;
• Từng bƣớc đổi vị trí trình tự: ;
• Các đơn vị chuyển động: điểm chuyển động.
Vùng:
• Các sự kiện khu vực trong không gian và thời gian: instant>;
• Khu vực có giá trị trong một khoảng thời gian: <region, period>;
• Thiết lập các sự kiện khu vực: - chuỗi các <region, instant>;
• Các vùng theo từng bƣớc liên tục: - chuỗi các <region, period>;
• Chuyển động các thực thể với mức độ: vùng chuyển động.
Một trong những ứng dụng của đối tƣợng chuyển động là ta có thể thực
hiện các ứng dụng giám sát để mô hình hóa và truy vấn đối tƣợng chuyển
động, sử dụng các phƣơng pháp và các kỹ thuật nhƣ việc thực hiện các mô
hình dữ liệu đƣợc cho bởi các mô đun đại số, mà cung cấp một tập hợp các
xây dựng kiểu và một thiết lập của các nhà khai thác, phát triển. Các lĩnh vực
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

11
chuyển động các đối tƣợng cơ sở dữ liệu xuất hiện đặc trƣng bởi hai góc nhìn,
quản lý vị trí và cơ sở dữ liệu KTG, nhƣ đã đề cập ở trên.
1.2.4. Mô hình dữliệu khái quát cho đối tượng chuyển động
Mô hình dữ liệu hiện thời cho chuyển động vật thể tập trung vào đại
diện vị trí trong môi trƣờng đơn và không thể đại diện cho chuyển động vật
thể trong môi trƣờng khác. Khó khăn chính cần phải có cơ cấu mà áp dụng
cho tất cả trƣờng hợp trong môi trƣờng thế giới thực có tính năng khác nhau
nhƣ là chuyển động tự do và theo quy luật, 2D và 3D. Cần đƣa ra phƣơng

pháp có thể hiển thị cho vị trí chuyển động vật thể trong môi trƣờng khác bao
gồm mạng lƣới đƣờng sá, mạng xe bus, đƣờng xe điện ngầm và mạng trong
nhà.
1.2.5. Công nghệ khai phá dữliệu
Dữ liệu về các đối tƣợng chuyển động gia tăng theo cấp số nhân.
Những phản hồi của kiểu hình dịch vụ LBS này mang tính địa lý (gần/xa,
nhanh/chậm…) và đòi hỏi phải xử lý trong thời gian thực. Các công nghệ truy
vấn dựa trên MOD nhƣ:
- Truy vấn quá khứ: Trong năm trƣớc, có bao nhiêu lần đối tƣợng đến
điểm X?
- Truy vấn tƣơng lai: Những đối tƣợng nào sẽ về đến nơi trong vòng 20
phút tới?
- Truy vấn hiện tại: Vị trí của những đối tƣợng trong phạm vi 1 Km.

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

12

Hình 1.5. Công nghệ khai phá dữ liệu từ MOD.
Lĩnh vực khai phá dữ liệu MOD là một lĩnh vực đầy tiềm năng, nhƣng
hoàn toàn mới không chỉ ở Việt Nam mà cả trên thế giới. Quá trình khai phá
MOD với mục đích khám phá tri thức trong CSDL (Knowledge Discovery in
Databases-KDD). Dựa trên công nghệ khai MOD nhiều kiểu ứng dụng khác
nhau có thể xử lý hiệu quả: Quản lý giao thông, sinh học, nghiên cứu môi
trƣờng,...
1.3. Cơ sở dữ liệu không gian
Mục tiêu của nghiên cứu cơ sở dữ liệu không gian là mở rộng mô hình
dữ liệu DBMS và ngôn ngữ truy vấn để có thể hiển thị và truy vấn hình học

trong đƣờng đi tự nhiên. Triển khai DBMS cần đƣợc gia hạn tƣơng ứng cấu
trúc dữ liệu cho nhiều kiểu dáng hình học, thuật toán để thực hiện kỹ thuật
oán hình học, chỉ mục cho không gian đa chiều, và mở rộng tối ƣu hóa (quy
tắc dịch thuật, chức năng chi phí) để ánh xạ tới từ ngôn ngữ truy vấn đến mới
thành phần liên quan đến hình học.
Những động lực chính cho nghiên cứu cơ sở dữ liệu không gian là
những hệ thống thông tin địa lý (GIS - Geographic Information System). Hệ
thống GIS đầu đã chỉ sử dụng giới hạn của công nghệ DBMS, ví dụ, bằng
cách lƣu trữ dữ liệu phi không gian trong một DBMS nhƣ việc quản lý hình
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

13
học một cách riêng biệt trong các tập tin. Dù thế, công nghệ cơ sở dữ liệu
không gian đã phát triển nhƣ vậy mà bây giờ tất cả các nhà cung cấp DBMS
chính (ví dụ nhƣ Oracle, IBM DB2, Informix) đề nghị mở rộng không
gian. Vì vậy nó là dễ dàng hơn bây giờ để xây dựng GIS hoàn toàn nhƣ một
lớp trên đầu trang của một DBMS, ví dụ, lƣu trữ tất cả các dữ liệu trong các
DBMS.
Thực tế, cơ sở dữ liệu không gian có phạm vi rộng lớn hơn. Ngoài
không gian địa lý, có những không gian khác cần quan tâm có thể hiển thị
trong cơ sở dữ liệu nhƣ là:
Bố cục của thiết kế mạch tích hợp với quy mô lớn (là mảng lớn tập
hợp các hình chữ nhật)
3D mô hình cơ thể ngƣời
Cấu trúc prô - tê - in nghiên cứu trong sinh học phân tử
Một khác biệt quan trọng liên quan đến cơ sở dữ liệu không gian và
thời gian. Mặc dầu không gian địa lý có thể đƣợc đại diện bởi những hình ảnh
thu đƣợc bằng hình ảnh trên không hoặc vệ tinh, trọng tâm của DBMS không

gian là đại diện cho các thực thể trong không gian với một định nghĩa rõ ràng
vị trí và mức độ. Cơ sở dữ liệu hình ảnh quản lý hình ảnh nhƣ vậy. Tất nhiên,
có tồn tại kết nối. Ví dụ, các kỹ thuật khai thác tính năng có thể đƣợc sử dụng
để xác định trong vòng một hình ảnh thực thể không gian có thể đƣợc lƣu trữ
trong cơ sở dữ liệu không gian.
1.3.1. Mô phỏng khái niệm không gian
Những thực thể để đƣợc lƣu trữ trong cơ sở dữ liệu không gian? Nếu
xét là dấu cách địa lý, bất cứ thứ gì rõ ràng có đủ khả năng có thể xuất hiện
trong bản đồ giấy, chẳng hạn, thành phố, sông, mạng đƣờng cao tốc, điểm
mốc, ranh giới của quốc gia, bệnh viện, ga tàu điện ngầm, rừng, cánh đồng
bắp, và những thứ tƣơng tự nhƣ thế.
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

14
Để mô hình thực thể muôn hình vạn trạng, một này có thể đƣa ra khái
niệm để mô hình đối tƣợng đơn và không gian liên quan tập hợp các đối
tƣợng.
Để mô phỏng vật thể đơn, ba khái niệm trừu tƣợng cơ bản là điểm,
đƣờng, và vùng. Thể hiện điểm (khía cạnh hình học) của vật thể, dành riêng
cho mà nó vị trí trong không gian, nhƣng nó không phải mức độ, có liên quan.
Ví dụ vật thể điểm là thành phố trên quy mô lớn bản đồ, điểm mốc, bệnh viện,
hoặc ga tàu điện ngầm. Đƣờng (đƣờng trong không gian) là khái niệm trừu
tƣợng cơ bản cho di chuyển qua không gian, hoặc kết nối trong không gian.
Ví dụ vật thể đƣờng là sông, đƣờng cao tốc, hoặc cáp điện thoại. Cuối cùng,
vùng là khái niệm trừu tƣợng cho thực thể có mức độ trong không gian 2D.
Vùng có thể nói chung có lỗ và bao gồm nhiều mảnh rời rạc. Ví dụ vật thể
vùng là quốc gia, rừng, hoặc hồ. Ba khái niệm trừu tƣợng cơ bản đƣợc minh
hoạ trong hình 1.6.


Hình 1.6. Điểm, đường và vùng
Hai trƣờng hợp quan trọng nhất của không gian liên quan đến tập hợp
các đối tƣợng là phân vùng và mạng. Phân vùng (hình 1.7) có thể đƣợc xem là
tập hợp các đối tƣợng vùng đã đƣợc tách rời ra. Mối quan hệ lân cận rất đáng
chú ý, đó là, có thƣờng cặp đối tƣợng vùng với ranh giới phổ biến. Phân vùng
có thể đƣợc dùng để đại diện cho chủ thể nào đó trên bản đồ.

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

15

Hình 1.7. Phân vùng
Mạng (hình 1.8) có thể đƣợc xem là đồ thị dự kiến, bao gồm tập hợp
các đối tƣợng điểm, hình thành nút của nó, và tập hợp các đối tƣợng đƣờng
mô tả hình học của các biên. Mạng là khắp nơi trong địa lý, chẳng hạn, đƣờng
cao tốc, sông, phƣơng tiện chuyên chở công cộng, ….

Hình 1.8. Mạng
Một điều liên quan thú vị trong DBMS không gian tập hợp các đối
tƣợng là những phân vùng đƣợc xếp lồng nhau (chẳng hạn nhƣ quốc gia phân
vùng thành các tỉnh, tỉnh phân vùng thành các quận v.v.).
1.3.2. Mở rộng mô hình dữliệu và ngôn ngữtruy vấn
Hiện nay ta xem xét cách khái niệm trừu tƣợng cơ bản có thể nhúng
vào mô hình dữ liệu DBMS.
Cho đơn khái niệm trừu tƣợng đối tƣợng đơn, đƣờng, và vùng, đó là
điều tự nhiên để giới thiệu tƣơng ứng kiểu dữ liệu trừu tƣợng, hoặc kiểu dữ
liệu không gian (spatial data types - SDTs). Chẳng hạn nhƣ thử nghiệm xem

hai vùng là đang liền kề hoặc một đƣợc bao bởi vùng khác, hoặc nhƣ tạo
thành sự khác biệt của hai vùng hoặc giao lộ của đƣờng với vùng hay khoảng

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

16
cách giữa điểm và đƣờng, hoặc tập hợp các vùng vào một vùng, hoặc tìm
trong tập hợp các điểm đến điểm truy vấn.
Tập hợp các kiểu dữ liệu không gian với thao tác liên quan tạo thành
đại số không gian. Chẳng hạn nhƣ, giao lộ của hai đƣờng giá trị sinh ra nói
chung tập hợp các điểm, và sự khác biệt của hai vùng, dù là mỗi đối số là
vùng đơn giản không có lỗ, có thể mang lại một vùng gồm vài thành phần rời
rạc có lỗ. Các kiểu dữ liệu đƣợc gọi là điểm, đƣờng, và vùng có cấu trúc là
minh họa trong hình 1.8.

Hình 1.8: Các kiểu dữ liệu không gian điểm, đường và vùng
Ở đây kiểu points cung cấp tập hợp các điểm, kiểu line tập hợp các
đƣờng, và kiểu region tập hợp các hình đa giác với lỗ. Để một có thể đƣa ra
thao tác nhƣ là:
intersection: line × line

→ points

minus:

region × region

→ region


contour:

region

→ line

sum:

set(line)

→ line

length:

line

→ real

Dữ liệu từng kiểu không gian đƣợc định nghĩa, chúng có thể nhúng vào
mô hình dữ liệu DBMS trong vai trò của kiểu thuộc tính. Vậy nên ngoài kiểu
chuẩn nhƣ là int, real, string, có thể có kiểu không gian points, line, và
region. Kiểu này có thể đƣợc dùng trong bất kỳ kiểu mô hình dữ liệu DBMS;
dù nó là quan hệ, hƣớng đối tƣợng, hoặc một cái gì đó nữa chẳng quan trọng.
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

17
Ở thiết lập quan hệ, có thể có quan hệ để đại diện cho thành phố, sông, và

quốc gia, ví dụ nhƣ :
cities(name: string, population: int, location: points)
rivers(name: string, route: line)
highways(name: string, route: line)
states(name: string, area: region)
Truy vấn sẽ trình bày bằng cách sử dụng thao tác kiểu dữ liệu không
gian trên thuộc tính không gian trong ngôn ngữ truy vấn chuẩn nhƣ là SQL.
Giả sử rằng thuộc tính sẵn sàng :
inside:

points × region

→ bool

adjacent:

region × region

→ bool

Từ đó có thể trình bày truy vấn:
Tổng dân số những thành phố ở Pháp là?
SELECT SUM(c.pop)
FROM cities AS c, states AS s
WHERE c.location inside s.area AND s.name = ’France’
Kết quả một phần của sông Rhine trong nƣớc Đức."
SELECT intersection(r.route, s.area)
FROM rivers AS r, states AS s
WHERE r.name = ’Rhine’ AND s.name = ’Germany’
Lập danh sách, hiển thị mỗi quốc gia cùng số quốc gia là láng giềng

của nó.
SELECT s.name, COUNT(*)
FROM states AS s, states AS t
WHERE s.area adjacent t.area
GROUP BY s.name

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

18
1.4. Cơ sở dữ liệu thời gian
1.4.1. Quản lý thời gian trong cơ sở dữliệu dạng chuẩn
Cơ sở dữ liệu đƣợc quản lý bởi chuẩn DBMS thƣờng mô tả trạng thái
hiện hành của thế giới theo nhƣ khi nó đƣợc biết ở cơ sở dữ liệu. Thay đổi
tình trạng hiện tại của thế giới sẽ đƣợc phản ánh muộn một chút rồi mới cập
nhật đến cơ sở dữ liệu sau khi trạng thái trƣớc đây mất đi.
Tất nhiên, nhiều ứng dụng của nó là không đủ để chỉ duy trì trạng thái
hiện hành; chúng cần theo dõi lịch sử một đoạn đƣờng đi. Ở DBMS chuẩn
đây là có thể nếu ứng dụng quản lý thời gian chính nó, bằng thêm thuộc tính
thời gian rõ ràng và thực hiện đúng kiểu tính toán trong truy vấn. Chẳng hạn
nhƣ, giả sử công ty có bảng nhân viên với mẫu:
NHANVIEN(name:string, department:string, salary:int)
Nếu công ty muốn theo dõi bộ phận và lƣơng trƣớc đây của nhân viên,
bảng có thể đƣợc mở rộng :
NHANVIEN(name:string, department:string, salary:int, start:date,
end:date)
DBMS chuẩn đƣa ra hạn chế rất hỗ trợ này dƣới dạng kiểu dữ liệu nhƣ
là ngày hoặc thời gian.
Tuy nhiên, xử lý thời gian trong mẫu đơn này bằng ứng dụng là khó

khăn, dễ mắc lỗi, dẫn đến thành lập công thức truy vấn phức tạp và thƣờng thi
hành truy vấn không hiệu quả. Chẳng hạn nhƣ, trong chỗ nối của hai bảng mở
rộng thuộc tính thời gian ở trên, cần phải bảo đảm thứ tự khoảng thời gian
đƣợc nối lại tránh chồng lấp, bằng cách thêm điều kiện rõ ràng trong truy vấn.
Điều kiện này đem lại vài sự bất bình đẳng về thuộc tính thời gian. Chuẩn
DBMS thƣờng không tốt lắm khi xử lý sự bất bình đẳng trong tối ƣu hoá truy
vấn, vậy nên thi hành có thể không hiệu quả. Ngƣợc lại, nếu hỗ trợ thời gian
đúng đƣợc đƣa vào DBMS, việc này có thể đƣợc thực hiện tự động; tình trạng

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

×