Đề tài: Tính toán xấp xỉ với các truy vấn liên quan đến khoảng cách
trong cơ sở dữ liệu không gian
2008
1
LỜI CẢM ƠN
Trong thời gian thực hiện đề tài khóa luận tốt nghiệp, dưới sự hướng dẫn tận
tình của giáo viên hướng dẫn và được phía nhà trường tạo điều kiện thuận lợi, tôi
đã có một quá trình nghiên cứu, tìm hiểu và học tập nghiêm túc để hoàn thành đề
tài. Kết quả thu được không chỉ do nỗ lực của cá nhân tôi mà còn có sự giúp đỡ
của quý thầy cô, gia đình và các bạn.
Tôi xin chân thành cảm ơn
Bán giám hiệu nhà trường, Ban chủ nhiệm khoa Công Nghệ Thông Tin –
Trường Đại học Công Nghệ đã quan tâm, tạo điều kiện giúp tôi hoàn
thành hoàn thành khóa luận tốt nghiệp.
Thầy Nguyễn Hải Châu: Thầy đã hướng dẫn, hỗ trợ tôi hoàn thành tốt đề
tài về phương pháp, lý luận và nội dung trong suốt thời gian thực hiện
khóa luận tốt nghiệp.
Gia đình đã tạo điều kiện học tập tốt nhất.
Các bạn đã giúp đỡ, trao đổi thông tin về đề tài trong quá trình thực hiện
khóa luận.
Trong quá trình thực hiện và trình bày khóa luận không thể tránh khỏi những
sai sót và hạn chế, do vậy tôi rất mong nhận được sự góp ý, nhận xét phê bình
của quý thầy cô và các bạn.
Kính chúc quý thầy cô và các bạn sức khỏe!
Người thực hiện đề tài
Hoàng Thị Hồng Trang
Đề tài: Tính toán xấp xỉ với các truy vấn liên quan đến khoảng cách
trong cơ sở dữ liệu không gian
2008
2
MỤC LỤC
MỤC LỤC........................................................................................................................ 2
MỤC LỤC BẢNG BIỂU ................................................................................................ 5
A.
PHẦN MỞ ĐẦU...................................................................................................... 7
1.
Giới thiệu .............................................................................................................. 7
2.
Ý nghĩa khoa học và thực tiễn .............................................................................. 8
3.
Mục đích nghiên cứu ............................................................................................ 9
4.
Đối tượng nghiên cứu ......................................................................................... 10
5.
Phạm vi nghiên cứu ............................................................................................ 10
B.
NỘI DUNG ............................................................................................................ 11
CHƯƠNG 1: TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU KHÔNG GIAN....................... 11
1.
Khái niệm........................................................................................................... 11
1.1
Hệ thống cơ sở dữ liệu không gian............................................................... 11
1.2. Cơ sở dữ liệu không gian (Spatial Database) .............................................. 12
2.
Mô hình cơ sở dữ liệu không gian ................................................................... 16
2.1 Xây dựng mô hình CSDL không gian ............................................................ 17
2.2 Cơ sở hình học trong tổ chức các đối tượng không gian cơ bản..................25
3.
Truy vấn thực hiện trong CSDL không gian.................................................. 30
CHƯƠNG 2: BÀI TOÁN TÍNH TOÁN XẤP XỈ VỚI CÁC TRUY VẤN LIÊN
QUAN ĐẾN KHOẢNG CÁCH TRONG CƠ SỞ DỮ LIỆU KHÔNG GIAN........ 34
1.
Các truy vấn liên quan đến khoảng cách........................................................ 34
1.1 Truy vấn khu vực theo khoảng cách δ ........................................................... 37
1.2 Truy vấn K vùng lân cận gần nhất................................................................. 38
1.3 Truy vấn nối các khu vực theo khoảng cách δ (truy vấn đệm).................... 39
1.4
Phép nối khoảng cách Iceberg...................................................................... 39
1.5 Truy vấn K cặp đối tượng gần nhất .............................................................. 39
Đề tài: Tính toán xấp xỉ với các truy vấn liên quan đến khoảng cách
trong cơ sở dữ liệu không gian
2008
3
1.6
Nối K vùng lân cận gần nhất........................................................................ 40
1.7 Truy vấn K- nối khoảng cách ......................................................................... 40
2
R – Tree.............................................................................................................. 42
2.1 Khái niệm.......................................................................................................... 43
2.2 Cấu trúc của một R-tree.................................................................................. 45
2.3 Thuật toán R-Tree ........................................................................................... 47
3
Các kỹ thuật tính toán xấp xỉ khoảng cách .................................................... 56
3.1
Thu nhỏ không gian tìm kiếm ...................................................................... 56
3.2
Kỹ thuật tìm kiếm theo kinh nghiệm...........................................................59
3.2.1
Tìm kiếm khu vực.......................................................................................... 59
3.2.2
Simulated Annealing ..................................................................................... 60
3.2.3
Thuật toán phát sinh..................................................................................... 61
CHƯƠNG 3 MỘT SỐ ỨNG DỤNG CỦA BÀI TOÁN TÍNH TOÁN XẤP XỈ
KHOẢNG CÁCH TRONG THỰC TẾ....................................................................... 63
1.
Ứng dụng trong việc xây dựng một hệ thống khung (framework) xử lý hiệu
quả các truy vấn không gian cơ bản. ...................................................................... 64
2.
Tăng tốc quá trình phân tích, thực thi và hiển thị dữ liệu địa lý trong các
truy vấn liên quan đến khoảng cách (DBQs) ......................................................... 66
3.
Xây dựng thuật toán xấp xỉ như một công cụ hạn chế những khó khăn phát
sinh đối với kích thước địa lý của đối tượng .......................................................... 68
4.
Tính toán độ chính xác về vị trí trên bản đồ và chênh lệch về khoảng cách
giữa các đối tượng trong truy vấn........................................................................... 70
CHƯƠNG 4 MỘT SỐ THUẬT TOÁN TÍNH KHOẢNG CÁCH TRONG KHÔNG
GIAN ĐỊA LÝ & ĐÁNH GIÁ HIỆU NĂNG.............................................................. 74
1.
Tính toán khoảng cách giữa các đối tượng địa lý theo công thức Haversine
74
1.1
Công thức Haversine..................................................................................... 74
Đề tài: Tính toán xấp xỉ với các truy vấn liên quan đến khoảng cách
trong cơ sở dữ liệu không gian
2008
4
1.2
Công thức Haversine trong truy vấn tìm khoảng cách ngắn nhất............77
1.3 Đánh giá thuật toán Haversine ....................................................................... 81
2.
Tính toán khoảng cách trong hệ tọa độ địa lý theo khoảng cách Vincenty.82
2.1 Khái niệm.......................................................................................................... 82
2.2 Thuật toán Vincenty ........................................................................................ 85
3. Đánh giá thuật toán Haversine và Vincenty....................................................... 89
C.
KẾT LUẬN............................................................................................................ 91
1.
Những kết quả đạt được...................................................................................... 91
2.
Đánh giá.............................................................................................................. 92
3.
Hướng phát triển ................................................................................................. 92
TÀI LIỆU THAM KHẢO............................................................................................ 93
Đề tài: Tính toán xấp xỉ với các truy vấn liên quan đến khoảng cách
trong cơ sở dữ liệu không gian
2008
5
MỤC LỤC BẢNG BIỂU
Hình 1: Trang WebGis www.bando.com.vn ........................................................15
Hình 2: (a) Một region mẫu, (b) Biểu diễn dạng mảng nhị phân của region, (c)
Các khối cực đại và các khối phổ thông được chia sẻ trong region - (d) quadtree
tương ứng. .............................................................................................................20
Hình 3: Ví dụ một PR quadtree.............................................................................22
Hình 4: Biểu diễn dạng đường..............................................................................24
Hình 5: Biểu diễn dạng khu vực ...........................................................................24
Hình 6: Biểu diễn tập đối tượng trong khu vực ....................................................24
Hình 7: Biểu diễn đối tượng dạng mạng lưới .......................................................25
Hình 8: Mô hình d-simplex..................................................................................26
Hình 9: Phép toán hợp trong không gian địa lý ....................................................28
Hình 10: Phép toán trừ trong không gian địa lý....................................................28
Hình 11: Phép toán giao trong không gian địa lý .................................................28
Hình 12: Phép toán bao phủ trong không gian địa lý ...........................................29
Hình 13 Các hàm toán tử trong không gian địa lý................................................30
Hình 14: Mô hình dữ liệu quan hệ xây dựng dựa trên Benchmark database........36
Hình 15: R-Tree và MBRs trong truy vấn ............................................................42
Hình 16: R-Tree và truy vấn trong hai cấu trúc MBR khác nhau.........................42
Hình 17: Ví dụ về R-Tree .....................................................................................44
Hình 18: Cây biểu diễn R-Tree.............................................................................47
Hình 19: Biểu diễn hai chiều của một R-Tree ......................................................47
Hình 20: Cấu trúc một R-Tree ..............................................................................48
Hình 21: Các quan hệ có thể có giữa các MBR (chứa trong, chồng lấn…) .........49
Đề tài: Tính toán xấp xỉ với các truy vấn liên quan đến khoảng cách
trong cơ sở dữ liệu không gian
2008
6
Hình 22: Trường hợp phân chia node...................................................................53
Hình 23: Phân chia entry thành các nhóm node mới ............................................54
Hình 24: Minh họa cấu trúc sản phẩm ArcGIS của ESRI ....................................66
Hình 25: Kiến trúc CSDL trên nền tảng Microsoft...............................................68
Hình 26: Trang web bản đồ trực tuyến diadiem.com ...........................................72
Hình 27: Trang web bản đồ trực tuyến basao.com ...............................................73
Hình 28: Hình dạng Elip của trái đất ....................................................................76
Hình 29: Khoảng cách AB tính theo công thức Haversine trên bản đồ địa lý......79
Hình 30: Mô hình dữ liệu quan hệ ........................................................................80
Hình 31: Thông số các hệ tọa độ elip tròn xoay ...................................................84
Hình 32: Khoảng cách tính theo thuật toán Haversine và Vincenty.....................89
Đề tài: Tính toán xấp xỉ với các truy vấn liên quan đến khoảng cách
trong cơ sở dữ liệu không gian
2008
7
A. PHẦN MỞ ĐẦU
1. Giới thiệu
Trong vài năm trở lại đây, cùng với sự phát triển không ngừng của các kỹ
thuật công nghệ hiện đại, “kỷ nguyên số” đã được bắt đầu và ứng dụng trong
mọi lĩnh vực khoa học cũng như phục vụ nhu cầu sử dụng của con người. Nếu
như cách đây vài thập kỷ, câu chuyện con người có thể quan sát toàn cảnh trái
đất t
ừ trên cao xuống thông qua các thiết bị kỹ thuật như máy tính, tivi… tại
bất kỳ đâu và bất kỳ lúc nào vẫn là một viễn cảnh xa vời thì ngày nay điều này
đã trở nên quá đơn giản. Để có thể quan sát Trái đất từ mọi góc độ, một cá
nhân chỉ cần trang bị cho mình một máy tính nối mạng, và một phần mềm
hiển thị hình ảnh 3D như Google Earth hay truy cập vào các trang web bản đồ
trực tuyế
n sẵn có trên mạng Internet…
Như vậy, trong bối cảnh hiện tại, sự hiện thực hóa bản đồ số và đưa các kỹ
thuật lập bản đồ cũng như phân tích địa lý vào sử dụng rộng rãi với mục đích
dân sự cho tất cả các tổ chức, cá nhân có nhu cầu đang trở thành một ngành
kinh doanh nhiều lợi nhuận. Trong đó phải kể đến GIS – Hệ thống thông tin
địa lý – v
ới rất nhiều công cụ ứng dụng trợ giúp đắc lực cho quá trình xây
dựng hệ thống hạ tầng cơ sở dữ liệu không gian và quản lý dữ liệu địa lý.
Cùng với đó là hàng loạt các sản phẩm toàn diện và chuyên biệt sử dụng trong
ngành khoa học bản đồ và xử lý dữ liệu không gian địa lý được các hãng sản
xuất tung ra. Công nghệ GIS cùng với các sản phẩm phần mềm hỗ trợ
có rất
nhiều ứng dụng trong khoa học nghiên cứu, phục vụ trong đời sống, dịch vụ
công ích, quản lý tài nguyên…. và nhiều lĩnh vực khác. Trong cuộc cạnh tranh
ngôi vị nhà cung cấp hàng đầu các sản phẩm ứng dụng GIS và xử lý dữ liệu
địa lý thì yếu tố giá thành cũng như hiệu năng của chương trình là quan trọng
nhất.
Trong cuộc cạnh tranh về công nghệ này, nhiều nghiên cứu đã được đư
a ra
như: Tối ưu hóa khả năng quản lý dữ liệu địa lý bằng phương pháp đánh chỉ
Đề tài: Tính toán xấp xỉ với các truy vấn liên quan đến khoảng cách
trong cơ sở dữ liệu không gian
2008
8
mục động với cấu trúc dạng cây (tree-like structure) phục vụ tăng tốc quá
trình tìm kiếm dữ liệu – đây là vấn đề đặc biệt quan trọng với một khối lượng
dữ liệu khổng lồ và phức tạp như thông tin địa lý. Tăng tốc quá trình thực thi
với các truy vấn đến Cơ sở dữ liệu không gian, tối thiểu hóa thời gian thực thi
của hệ thống, đơn gi
ản hóa độ phức tạp tính toán trong giải thuật nhằm tiết
kiềm thời gian thực hiện và tăng hiệu năng tính toán. Trong vấn đề về giải
thuật, phương pháp ưu việt chính là tìm ra và áp dụng các thuật toán tính toán
khoảng cách tốt nhất, đảm bảo yêu cầu dung hòa giữa độ phức tạp tính toán,
tốc độ thực thi và độ chính xác càng cao càng tốt.
Nhận thấy sự cần thiết trong ngành khoa học nghiên cứu lý thuyết v
ề các
thuật toán tính toán khoảng cách giữa các đối tượng địa lý trong thực tế và vai
trò to lớn của các bài toán tính toán gần đúng này, đề tài khóa luận tốt nghiệp
“
Tính toán xấp xỉ với các truy vấn liên quan đến khoảng cách trong cơ sở
dữ liệu không gian” đã được xây dựng dựa trên quá trình nghiên cứu các
thành tựu khoa học trong lĩnh vực này và hệ thống lại một cách bài bản và chi
tiết.
Bố cục khóa luận
Khóa luận tốt nghiệp được trình bày với phần nội dung gồm 04 chương:
Chương 1: Tổng quan về cơ sở dữ liệu không gian.
Chương 2: Bài toán tính toán xấp xỉ với các truy vấn liên quan đến
khoảng cách trong cơ sở dữ liệu không gian.
Chương 3: Một số ứng dụng của bài toán tính toán xấp xỉ khoảng cách
trong thực tế.
Chương 4: Một số thuật toán tính toán khoảng cách trong không gian
địa lý và đánh giá hiệu năng.
2. Ý nghĩa khoa học và thực tiễn
Về khía cạnh nghiên cứu khoa học, các tập đoàn công nghệ trong lĩnh vực
GIS vẫn không ngừng nghiên cứu các phương pháp tối ưu hóa các sản phẩm
sử dụng thông tin địa lý trong các thiết bị hỗ trợ bản đồ, tìm đường và xác
Đề tài: Tính toán xấp xỉ với các truy vấn liên quan đến khoảng cách
trong cơ sở dữ liệu không gian
2008
9
định vị trí địa lý của đối tượng. Trong đó, giải pháp đặt ra không chỉ dừng ở
việc xây dựng một hệ quản trị cơ sở dữ liệu chuyên biệt quản lý dữ liệu không
gian và các thuộc tính đặc biệt của nó với dung lượng khổng lồ và phức tạp,
quan trọng hơn là giải pháp nào để tối ưu hóa hiệu năng truy xuất dữ liệu, các
giải thuậ
t đề xuất giúp hệ thống thực thi các phép toán (đặc biệt là các phép
tính khoảng cách quy mô hàng chục ngàn km) phải thật nhanh chóng nhưng
vẫn đảm bảo độ chính xác cần thiết. Trong không gian địa lý với đặc thù bề
mặt Trái đất không ổn định, việc dùng các phương pháp tính toán gần đúng là
không thể tránh khỏi, tuy nhiên sai số đặt ra cần nằm trong khoảng chấp nhận
được, sự cân bằng giữa độ chính xác và thời gian xử lý, trả lời truy v
ấn và giá
thành chính là chìa khóa thành công cho bất kỳ sản phẩm có sử dụng thuật
toán dò đường và tính khoảng cách nào.
Khóa luận trình bày cụ thể về các giải pháp sử dụng trong bài toán tính
toán xấp xỉ khoảng cách, hệ thống một cách khoa học các kỹ thuật sử dụng
trong tìm kiếm đối tượng cũng như tính khoảng cách giữa các đối tượng trong
truy vấn. Đây hầu hết là những kỹ thuật quan trọng và hiệu quả
đang được sử
dụng rộng rãi trong các ứng dụng khai thác thông tin về đường đi, địa điểm và
quảng cáo trên nền tảng bản đồ số. Do đó các vấn đề về lý thuyết trong lĩnh
vực này luôn là đề tài khoa học có tính chất thời sự trên các diễn đàn công
nghệ GIS cũng như trong đội ngũ các nhà phân tích, thiết kế sản phẩm. Từ các
thuật toán có sẵn, nhà sản xuất hoàn toàn có thể cài
đặt và “nhúng” vào trong
nhiều ứng dụng như: Bản đồ kỹ thuật số, phần mềm định vị và chỉ đường trên
các thiết bị cầm tay, các thiết bị di động đi kèm các phương tiện giao thông,
thiết bị tìm vết và đường đi ngắn nhất tích hợp GPS (Hệ thống định vị toàn
cầu), ….
3. Mục đích nghiên cứu
Đề tài được thực hiện với mục
đích
Tìm hiểu khái niệm Cơ sở dữ liệu không gian, các công nghệ GIS đương
đại.
Nghiên cứu các kỹ thuật tính toán gần đúng về khoảng cách và các thuật
Đề tài: Tính toán xấp xỉ với các truy vấn liên quan đến khoảng cách
trong cơ sở dữ liệu không gian
2008
10
toán liên quan sử dụng trong các truy vấn trên CSDL không gian.
Các ứng dụng thiết thực của bài toán tính toán xấp xỉ trong công nghệ
thông tin địa lý.
Thử nghiệm một số truy vấn sử dụng kỹ thuật tính toán xấp xỉ trong một
số truy vấn tiêu biểu.
4. Đối tượng nghiên cứu
Mô hình, cấu trúc dữ liệu và cách xây dựng dữ liệu không gian và hệ
quản trị CSDL không gian, các phép toán thực thi.
Các kỹ thuật tính toán xấp xỉ khoảng cách trong không gian tìm kiếm và
các thuật toán.
Sản phẩm ứng dụng các kỹ thuật tính toán xấp xỉ đang được sử dụng
trong thực tế.
Thuật toán tính toán khoảng cách trên bề mặt cầu ứng dụng trong truy
vấn về khoảng cách trong không gian địa lý: Haversine, Vincenty.
5. Phạm vi nghiên cứu
Do hạn chế về thời gian và giới hạn trong khuôn khổ một đề tài khóa
luận tốt nghiệp, đề tài tập trung trình bày các thuật toán và giải pháp sử
dụng trong các truy vấn liên quan đến khoảng cách trong CSDL không
gian, phục vụ trong quá trình xử lý, phân tích và hiển thị dữ liệu địa lý
của một ứng dụng GIS bất kỳ trong thực tế. Qua đó đưa ra đánh giá hiệu
năng của từng giải pháp và đề xuất các h
ướng phát triển cho thuật tính
toán gần đúng trong tương lai.
Qua đó, độc giả có được cái nhìn tổng quan về các kỹ thuật cũng như
thuật toán tính toán gần đúng đang được sử dụng trong các ứng dụng xây
dựng, quản lý và thiết kế dữ liệu thông tin địa lý, cơ sở dữ liệu không
gian và hướng phát triển của chúng trong công cuộc nghiên cứu nhằm
hoàn thiện tốc độ xử lý, tính toán, truy xuất dữ liệu của hệ thống với sự
trợ giúp của các thuật toán tích hợp hiệu quả và chính xác.
Đề tài: Tính toán xấp xỉ với các truy vấn liên quan đến khoảng cách
trong cơ sở dữ liệu không gian
2008
11
B. NỘI DUNG
CHƯƠNG 1: TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU KHÔNG GIAN
1. Khái niệm
1.1 Hệ thống cơ sở dữ liệu không gian
Hệ thống cơ sở dữ liệu không gian – Spatial Database System – là hệ thống
quản lý dữ liệu liên quan đến các đối tượng không gian (không gian địa lý), ra
đời trước yêu cầu đặt ra trong thực tế là cần một hệ thống để lưu trữ các dữ
liệu trong không gian địa lý. Như vậy việc quản lý hệ CSDL không gian phụ
thu
ộc vào hai công nghệ: Một là phương tiện lưu trữ cố định và một là CSDL
không gian.
Các không gian:
Không gian hai chiều (2D): Các không gian hình học (Các bề mặt trên mặt
đất ở tỉ lệ co giãn lớn hoặc nhỏ)
Hệ thống thông tin địa lý (GIS – Geographic Information System)
Cơ sở dữ liệu đặt tại Luxembourg (LIS - Luxembourg Income Study)
lưu trữ dữ liệu về các quốc gia.
Urban planning – quy hoạch sử dụng không gian địa lý (sử dụng đất,
quy hoạch xây dựng đô thị….)
Không gian ba chiều (3D): Nghiên cứu vũ trụ, thiên văn học, nghiên cứu
bộ não con người trong y học, nghiên cứu cấu trúc phân tử trong ngành
sinh học.
Yêu cầu đặt ra với hệ thống này là khả năng quản lý và xử lý một khối
lượng thông tin khổng lồ của tập hợp các đối tượng địa lý đặt trong mối quan
hệ chặt chẽ với nhau.
Đề tài: Tính toán xấp xỉ với các truy vấn liên quan đến khoảng cách
trong cơ sở dữ liệu không gian
2008
12
Theo G.H.Guting[]:
Hệ quản trị cơ sở dữ liệu không gian (Spatial Database Management
System): Là một hệ CSDL sử dụng kiểu dữ liệu không gian trong mô hình dữ
liệu và ngôn ngữ truy vấn, hệ thống hỗ trợ việc thực thi với kiểu dữ liệu không
gian bằng việc cung cấp cách đánh chỉ mục và các thuật toán hiệu quả trong
trường hợp liên kết các không gian với nhau.
Kiểu dữ liệu không gian (Spatial Data type): Kiểu dữ liệ
u biểu diễn các đối
tượng trong không gian
Dữ liệu không gian là những mô tả số của hình ảnh bản đồ, chúng bao gồm
toạ độ, quy luật và các ký hiệu dùng để xác định một hình ảnh bản đồ cụ thể
trên từng bản đồ. Hệ thống thông tin địa lý dùng các số liệu không gian để tạo
ra một bản đồ hay hình ảnh bản đồ trên màn hình hoặc trên giấy thông qua
thiết bị ngoại vi, … D
ữ liệu không gian thường được biểu diễn bằng điểm,
đường và vùng.
Với hệ thống thông tin địa lý (GIS) có 2 kiểu dữ liệu cơ bản đó là vectơ và
raster.
1.2. Cơ sở dữ liệu không gian (Spatial Database)
Cơ sở dữ liệu không gian là một mô hình hướng đối tượng cho phép tích
hợp thông tin địa lý và thông tin thuộc tính trong cùng một cơ sở dữ liệu theo
mô hình dữ liệu quan hệ. Như vậy đây là cơ
sở dữ liệu lưu trữ vị trí, hình dạng
của các đối tượng không gian cùng với đặc điểm thuộc tính của chúng.
Một số hãng phát triển GIS trên thế giới đã có những sản phẩm theo hướng
CSDL không gian như: ERSI, Oracle, Intergraph, MapInfo…
Cơ sở hạ tầng dữ liệu không gian (Spatial Data Infrastructure - SDI) là nền
tảng để dữ liệu không gian và lý lịch dữ liệu cùng với người sử dụng và các
công cụ có thể
kết nối trong mối quan hệ tương tác lẫn nhau với mục đích sử
dụng được các thông tin dữ liệu không gian một cách hiệu quả và linh hoạt.
Đề tài: Tính toán xấp xỉ với các truy vấn liên quan đến khoảng cách
trong cơ sở dữ liệu không gian
2008
13
1.2.1 Hạ tầng CSDL không gian
Công nghệ (technology)
Chính sách (policies)
Chuẩn (standards)
Nguồn nhân lực (human resources)
Qui trình (procedures)
Được xây dựng để đáp ứng yêu cầu thu nhận, xử lý, lưu trữ, phân phối và
nâng cao tính hữu dụng của dữ liệu địa lý, làm cơ sở cho việc sản xuất và chia
sẻ dữ liệu địa lý giữa các cơ quan, đơn vị,…
VD:
Cơ sở hạ tầng dữ liệu không gian của một thành phố là một thành phần
trong Cơ sở hạ tầng thông tin quốc gia (siêu xa lộ thông tin) nhằm cung cấp
những thông tin thiết thực cho mọi người.
Các chức năng của quản lý cơ sở dữ liệu
Cho phép giảm thiểu sự trùng lặp dữ liệu nhằm tiết kiệm chi phí, sẵn
sàng trợ giúp ra quyết định trên một vùng địa lý dựa trên dữ liệu chính
xác và hiện thời (cập nhập dữ liệu), người sử dụng dễ dàng biết được tỉ
lệ bản đồ gốc (mức độ chi tiết), ngu
ồn gốc dữ liệu, quy trình nhập dữ
liệu, kết quả kiểm tra độ chính xác dữ liệu, cấu trúc dữ liệu,… được mô
tả bởi lý lịch dữ liệu (metadata).
Với một hệ quản trị cơ sở dữ liệu thông thường kiểu dữ liệu bảng hiện
nay được sử dụng rất phổ biến. Tuy nhiên, tiến trình tham chiếu với dữ
li
ệu địa lý được thực hiện phức tạp vì chỉ một sự thay đổi nhỏ của dữ
liệu địa lý cũng làm cho các dữ liệu bảng khó tham chiếu. Cấu trúc cơ
sở dữ liệu định hướng đối tượng không thích hợp cho việc lưu trữ
những dữ liệu đặc trưng cũng như phân tích không gian phức tạp. Nhờ
tính mở cao, cơ sở dữ liệ
u quan hệ ngày càng được sử dụng phổ biến
trong các hệ thống thông tin địa lý. Mô hình hệ quản trị cơ sở dữ liệu 3
tầng (3-tier) sẽ được sử dụng phổ biến để tăng khả năng cung cấp và
Đề tài: Tính toán xấp xỉ với các truy vấn liên quan đến khoảng cách
trong cơ sở dữ liệu không gian
2008
14
tích hợp dữ liệu của nhiều ngành theo thời gian thực.
Hiện nay, hầu hết các quốc gia đều hướng đến xây dựng cơ sở hạ tầng dữ
liệu không gian theo kiến trúc hướng đến dịch vụ (Service Oriented
Architecture - SOA) sử dụng các chuẩn mở quốc tế như OpenGIS (OGC)
hoặc ISO/TC 211. Tư tưởng chính là coi việc xây dựng cơ sở hạ tầng dữ liệu
không gian tương tự như cơ
sở hạ tầng trong các lĩnh vực khác: bưu điện, điện
thọai, đường giao thông,…như vậy người dùng khi có nhu cầu sẽ tham gia kết
nối vào cơ sở hạ tầng để sử dụng và đóng góp các dữ liệu, thông tin về GIS.
Đây là một dự án lớn có nền tảng lý luận và cơ sở thực tiễn cao, được phát
triển theo cách thức: “Phát triển trước, xây dựng đặc tả
sau”. Có nghĩa là: Để
giải quyết 1 vấn đề, các tổ chức nghiên cứu hướng tới nhiều giải pháp, sau
nhiều năm thử nghiệm sẽ đúc kết thành đặc tả (hay chuẩn mở) công bố cho
cộng đồng. Đối với Việt Nam và các nước đang phát triển thì thời điểm hiện
nay là cơ hội lớn để chúng ta tiếp cận những tinh hoa từ các tổ chức này để
xây dựng những hệ thống GIS tương tự (đa mục tiêu, đa thành viên).
Trên cơ sở đó, Việt Nam cần tiến hành xây dựng cơ sở hạ tầng dữ liệu
không gian cho mình với các tầm nhìn đều hướng đến một nền tảng để đưa dữ
liệu không gian địa lý đến tay người sử dụng một cách đơn giản, dễ dàng và
minh bạch.
Khảo sát có một số tổ
chức đã ứng dụng WebGis để xây dựng bản đồ trực
tuyến
Trang web của Nhà xuất bản bản đồ - Bộ Tài nguyên và môi trường
/>
Đề tài: Tính toán xấp xỉ với các truy vấn liên quan đến khoảng cách
trong cơ sở dữ liệu không gian
2008
15
Hình 1:
Trang WebGis www.bando.com.vn
1.2.2 Các bước thiết kế CSDL không gian
Thiết kế CSDL không gian cần tiến hành qua những bước cơ bản sau
Xác định nội dung CSDL
Chọn cấu trúc CSDL
Thiết kế chi tiết CSDL
Phân phối dữ liệu đến người sử dụng
Duy trì, cập nhật dữ liệu và vận hành hàng ngày
Các thành phần của cơ sở dữ liệu không gian
Tập hợp các dữ liệu dạng vector (tập các điểm, đường và vùng)
Tập hợp các dữ liệu dạng raster (dạng mô hình DEM hoặc ảnh)
Tập hợp các dữ liệu dạng mạng lưới (đường giao thông, lưới cấp thoát
nước, lưới điện ...)
Tập hợp các dữ liệu địa hình 3 chiều và b
ề mặt khác
Dữ liệu đo đạc
Dữ liệu dạng địa chỉ
Các bảng dữ liệu: Là thành phần quan trọng của cơ sở dữ liệu không
gian, được liên kết với các thành phần đồ họa với nhiều kiểu liên kết khác
nhau.
Đề tài: Tính toán xấp xỉ với các truy vấn liên quan đến khoảng cách
trong cơ sở dữ liệu không gian
2008
16
2. Mô hình cơ sở dữ liệu không gian
Trong những năm gần đây, đã có rất nhiều nghiên cứu đang được triển
khai về vấn đề quản lý dữ liệu không gian. Cách phương pháp tiếp cận ban
đầu trong lĩnh vực GIS đã gần như làm cạn kiệt những nỗ lực của các nhà
khoa học trong việc tìm kiếm hình thức biểu diễn hình học chính xác của dữ
liệu không gian và việc b
ổ sung những phép toán mới giữa các đối tượng
không gian. Sau đó, chỉ có một cải tiến thô sơ là việc kết hợp dữ liệu không
gian với dữ liệu thông thường. Và kết quả là việc quản lý dữ liệu địa lý phải
chia thành 2 quá trình xử lý riêng biệt nhau: một là cho dữ liệu không gian và
một là để xây dựng các thuộc tính cho dữ liệu thông thường và sự kết hợp của
chúng với dữ liệu không gian. N
ỗ lực để định nghĩa một ngôn ngữ thông dụng
và khả dụng để đơn giản thao tác xử lý các truy vấn hầu như không mang lại
kết quả, và do đó quá nhiều chương trình bắt buộc phải sử dụng đến. Kết quả
là việc xử lý dữ liệu không gian thiếu đi những giải pháp hình thức cơ bản.
Theo một khía cạnh khác, năng lực xử lý của dữ
liệu thông thường chỉ có thể
được lưu trữ thông qua Hệ quản trị CSDL. Bên cạnh đó, do tính chất phức tạp
của kiểu dữ liệu không gian dẫn đến việc quản lý dữ liệu loại này không thể
sử dụng Hệ quản trị cơ sở dữ liệu truyền thống.
Vì những lí do trên mà nhiều công trình nghiên cứu liên quan đến dữ liệu
không gian đã được tiến hành bao gồm nhi
ều lĩnh vực như: Thiết kế cấu trúc
dữ liệu vật lý tối ưu và các phương pháp truy cập, nghiên cứu việc xử lý truy
vấn và tối ưu hóa các kỹ thuật, giao diện tương tác ảo… Tất cả các cách tiếp
cận này chắc chắn sẽ đưa ra một mô hình dữ liệu không gian theo cách gián
tiếp trong đó mô hình này sẽ không đóng vai trò là đối tượng chính.
Về khía cạnh công nghệ, hình thể, vị trí không gian của các
đối tượng cần
quản lý, được miêu tả bằng các dữ liệu đồ hoạ. Trong khi đó, tính chất các đối
tượng này được miêu tả bằng các dữ liệu thuộc tính.
Mô hình cơ sở dữ liệu không gian không những quy định mô hình dữ liệu
với các đối tượng đồ hoạ, đối tượng thuộc tính mà còn quy định liên kết giữa
chúng thông qua mô hình quan hệ và định nghĩa hướng đối tượng bao gồm
các tính chấ
t như thừa kế (inherit), đóng gói (encapsulation) và đa hình
Đề tài: Tính toán xấp xỉ với các truy vấn liên quan đến khoảng cách
trong cơ sở dữ liệu không gian
2008
17
(polymorphism).
Ngoài ra, cơ sở dữ liệu không gian hiện đại còn bao gồm các ràng buộc
các đối tượng đồ hoạ ngay trong cơ sở dữ liệu, được gọi là topology (tương
quan không gian) - Phương thức thể hiện các ràng buộc đối với các đối tượng
đồ hoạ ngay trong cơ sở dữ liệu.
Đặc điểm chung của một số mô hình CSDL không gian:
Hỗ trợ tập hợp các kiểu dữ liệu đã định dạng sẵn: Tập các điểm, tập các
bề mặt…
Có thể sử dụng một hoặc hai kiểu cấu trúc dữ liệu phức tạp để lưu lại
các dữ liệu không gian, với việc sử dụng hai kiểu cấu trúc cùng một lúc
tức là một để ghi nhận dữ liệu không gian và một để ghi nhận dữ liệu
thông thường.
Định nghĩa được các phép toán áp dụng với một kiểu dữ liệu không
gian riêng biệt bất kỳ.
2.1 Xây dựng mô hình CSDL không gian
Xây dựng mô hình các đối tượng riêng lẻ.
Xây dựng mô hình cho một tập hợp các đối tượng có liên quan đến nhau
trong không gian địa lý.
Việc vận dụng dữ liệu mật
độ cao hoặc dữ liệu không gian để lưu trữ và
phục hồi trong cơ sở dữ liệu đa phương tiện là một điều rất quan trọng.
Dữ liệu không gian bao gồm các điểm, đường, hình chữ nhật, đa giác, bề
mặt hay các đối tượng mật độ cao bao gồm cả thời gian. Các phương thức
đánh chỉ mục cung cấp đường dẫn đến dữ li
ệu hướng không gian được gọi là
các phương thức truy nhập không gian (Spatial Access Methods – SAM). Đến
nay đã có rất nhều SAM được giới thiệu bao gồm các grid file
[1]
, K-D-B-tree
[2]
, R-trees
[3]
, R*-trees
[4]
, Filter Trees
[5]
, TV-tree
[6]
, X-trees
[7]
và SS-tree
[8]
.
Đề tài: Tính toán xấp xỉ với các truy vấn liên quan đến khoảng cách
trong cơ sở dữ liệu không gian
2008
18
Trong các cơ sở dữ liệu không gian, các đối tượng không gian thông
thường được ánh xạ thành các véc-tơ đặc trưng trong không gian mật độ cao
và các truy vấn được xử lý trên cơ sở dữ liệu của các véc-tơ đặc trưng này.
Các véc-tơ đặc trưng thường thấy đó là biểu đồ màu, mô tả hình thức, các biểu
diễn văn bản,…mà mỗi một loại có những đặc tính khác nhau. Tuy nhiên điều
quan trọng là phả
i tìm ra được một cách biểu diễn thích hợp cho các véc-tơ
đặc trưng và nhằm xác định chính xác việc đo lường tính đồng dạng hoặc
khoảng cách giữa chúng. Bởi vậy một hệ thống đa phương tiện cần phải có
nhiều phương thức truy cập không gian để xử lý một truy vấn.
Trong quá khứ đã có một số nhà nghiên cứu đề xuất các phép toán ghép
nối không gian cho các tập dữ liệu không gian khác nhau. Tất c
ả các phương
pháp này đề đòi hỏi các cặp SAM có cùng một kiểu cấu trúc.
Các đặc tính cơ bản của phép truy nhập không gian.
Cấu trúc dữ liệu không gian
CSDL không gian bao gồm các đối tượng không gian như điểm, đường,
vùng, hình chữ nhật, bề mặt, hình khối và thậm chí là các dữ liệu mật độ cao
trong đó gồm cả thời gian. Một ví dụ của CSDL không gian là các thành
phố, những con sông, đường xá, quốc gia, bang, các dãy núi, các thành phần
trong một hệ thống CAD
[9]
(Thiết kế sử dụng sự trợ giúp của máy tính),…Ví
dụ về các thuộc tính của dữ liệu không gian có thể có là lưu vực của một con
sông, hay biên giới của một quốc gia…Thông thường các thuộc tính còn có
thể gắn thêm các các thuộc tính thông tin dạng phi không gian (non-spatial)
như độ cao, tên thành phố,…với CSDL không gian. Các cơ sở dữ liệu không
gian thuận tiện cho việc lưu trữ và đạt hiệu quả tốt cho quá trình xử lý các
thông tin dạng spatial
[10]
và non-spatial
[11]
một cách lý tưởng mà không cần
thiết phải quan tâm đến các mối liên hệ khác. Vì thế các sơ sở dữ liệu sẽ
nâng cao khả năng đáp ứng của các ứng dụng kiểm soát môi trường, khoảng
không, phát triển đô thị, quản lý nguồn lực, và trong các hệ thống GIS
[Buchmann et al. 1990; Günther and Schek 1991] [].
Phương pháp lưu trữ, quản lý và biểu diễn dữ liệu không gian
Đề tài: Tính toán xấp xỉ với các truy vấn liên quan đến khoảng cách
trong cơ sở dữ liệu không gian
2008
19
Mọi hệ thống quản trị cơ sở dữ liệu đều thực hiện việc sắp xếp dữ liệu
theo khóa riêng của mình. Trong trường hợp với CSDL không gian, việc sắp
xếp dựa trên tất cả các khóa spatial, điều đó có nghĩa rằng không giống như
trong các hệ thống quản trị cơ sở dữ liệu truyền thống, việc sắp xếp dựa trên
t
ất cả các dữ liệu đang sử dụng. Vì vậy các kỹ thuật này được biết với tên
gọi các phương pháp spatial indexing
[12]
– đánh chỉ mục không gian.
Một hướng tiếp cận trong việc biểu diễn spatial data là phân chia một
cách có cấu trúc từ những dữ liệu non-spatial đồng thời quản lý một cách
thích hợp các mối liên kết giữa chúng [Aref and Samet 1991a]. Đây được
xem như là một trong những nguyên nhân gây nên tình trạng phải mất nhiều
băng thông hơn cho việc thu thập dữ liệu không gian. Trong trường hợp như
vậy, các phép toán không gian (spatial operation) được thực hiệ
n trực tiếp
trên các cấu trúc spatial data. Điều này cung cấp tính linh hoạt hơn nữa cho
việc chọn lựa cấu trúc spatial thích hợp thay vì phụ thuộc vào các cấu trúc
non-spatial (ví dụ như với một cơ sở dữ liệu quan hệ).
Một ví dụ về kiểu truy vấn được đặt ra cho một hệ thống cơ sở dữ liệu
không gian là “Hãy tìm các tên đường đi ngang qua trường đại học của
vùng RiverSide”. Yêu c
ầu này đòi hỏi phải trích xuất các bản ghi có trường
“region name” mang giá trị là “trường đại học vùng RiverSide” và xây dựng
một bản đồ A. Kế tiếp, thực hiện phép giao giữa A với bản đồ đường đi B
tạo được bản đồ mới C có các con đường được chọn lựa. Bây giờ tạo một
mối liên kết mới chỉ gồm một thuộc tính là các tên đường hợp lệ từ các
đườ
ng trong bản đồ C. Tất nhiên là còn có các hướng tiếp cận khác trả lời
câu truy vấn trên. Hiệu quả của chúng phụ thuộc vào tính tự nhiên và các
tính chất của dữ liệu.
Khái quát các khái niệm dữ liệu cơ sở trong CSDL không gian
Trong phần dưới đây, đề tài sẽ trình bày một cách khái quát các khái niệm
dữ liệu cơ sở trong CSDL không gian như vùng, điểm, chữ nhật, và đường.
Để biết thêm các thông tin chi tiết về các thành phần này, xin tham khảo thêm
trong [Samet 1990a; Samet 1990b].
Đề tài: Tính toán xấp xỉ với các truy vấn liên quan đến khoảng cách
trong cơ sở dữ liệu không gian
2008
20
Dữ liệu vùng - Region Data
Một region có thể được biểu diễn bằng đường biên hoặc nội dung bên
trong của chính nó. Trong phần này, region được hiểu theo cách biểu diễn
nội tại của nó. Một cách biểu diễn thông dụng nhất của region là mảng hình
ảnh. Trong trường hợp này, ta có một tập các phần tử ảnh (gọi là các pixel).
Khi số lượng các phần tử trong mảng quá lớn, phải tiến hành động thái là
giả
m bớt kích thước mảng bằng cách kết hợp các pixel tương tự (đồng nhất
hay có cùng giá trị). Ở đây có hai hướng tiếp cận cơ bản. Hướng tiếp cận
đầu tiên là của [Rutovitz 1968]: phân chia mảng thành 1*m khối. Đây là
cách biểu diễn theo hàng và nó được biết với tên runlength code. Một hướng
tiếp cận khác xem region như là một tập các khối vuông cực đại (hoặc các
khối có hình dạng bất kỳ). Thông thường các kh
ối được xác định bởi tâm và
radii của chúng. Sự biểu diễn này được gọi là medial axis transformation
(MAT).
Hình 2: (a) Một region mẫu, (b) Biểu diễn dạng mảng nhị phân của region, (c)
Các khối cực đại và các khối phổ thông được chia sẻ trong region - (d)
quadtree tương ứng.
Thuật ngữ quadtree (cây tứ phân) là chỉ số không gian được dùng để
phân chia đệ quy một tập hợp dữ liệu (chẳng hạn, một ảnh) thành các ô
vuông cho đến khi mỗi ô vuông có một giá trị thuần nhất.
Cây tứ phân
thường được dùng để lưu trữ dữ liệu raster. Ở đây quadtree được sử dụng để
mô tả rất nhiều phần tử của các cấu trúc dữ liệu có thứ bậc (dựa trên nguyên
Đề tài: Tính toán xấp xỉ với các truy vấn liên quan đến khoảng cách
trong cơ sở dữ liệu không gian
2008
21
tắc đệ quy hay còn gọi là các phương pháp chia để trị).
Dữ liệu điểm - Point Data
Dữ liệu điểm đa chiều có thể được biểu diễn dưới rất nhiều hình thức
khác nhau. Sự lựa chọn sau cùng cho một tác vụ cụ thể sẽ bị ảnh hưởng bởi
kiểu operation sẽ được thực hiện trên dữ liệu. Phần này đề cập chủ
yếu đến
kiểu biểu diễn PR quadtree (P: Point và R: Region) là phương thức phân ly
chủ đạo. Đây là sự lắp ghép giữa region quadtree và point data, và PR
quadtree được tổ chức tương tự như region quadtree. Chỉ có một sự khác
biệt đó là các nút lá hoặc là rỗng (ở đây biểu diễn bằng màu TRẮNG), hoặc
chứa dữ liệu điểm (màu ĐEN) và các giá trị tương ứng của chúng.
Hình vẽ sau là một PR quadtree tương ứ
ng với một số lượng nhất định
point data:
Đề tài: Tính toán xấp xỉ với các truy vấn liên quan đến khoảng cách
trong cơ sở dữ liệu không gian
2008
22
Hình 3: Ví dụ một PR quadtree
Điểm bất lợi của PR quadtree là mức phân chia tối đa phụ thuộc vào sự phân
ly tối thiểu giữa hai point. Trong những trường hợp đặc biệt, nếu hai point là
rất gần nhau thì sự phân chia là rất nhỏ.
Dữ liệu kiểu chữ nhật - Rectangle Data
Kiểu dữ liệu rectangle nằm đâu đó giữa kiểu dữ liệu point và region.
Rectangle thường được sử dụng để làm xấp xỉ v
ới các đối tượng khác trong
một bức ảnh. Ví dụ các rectangle biên thường được sử dụng trong các ứng
dụng bản đồ để làm xấp xỉ các đối tượng như hồ nước, rừng, đồi,…
[Hinrichs and Nieverglt 1983] đã suy giảm mỗi rectangle thành một điểm
trong không gian đa chiều lớn, và họ đối xử với các vấn đề phát sinh như
một tập các điểm chứ không phải hình. Mỗi rectangle trong m
ột sản phẩm
Cartesian (Hệ toạ độ Đề-các) có hai interval (khoảng không gian) một chiều
trong đó mỗi interval được biểu diễn bởi trọng tâm và quy mô của chúng.
Mỗi một tập interval trong một chiều cụ thể được biểu diễn bởi một grid file.
Dữ liệu đường - Line Data
Line data là một hình thức biểu diễn xác định các biên của các region.
Cách biểu diễn đơn giản nhất là đa giác gồm có các véc-tơ
xác định khuôn
dạng của các liệt kê các cặp giá trị x và y tương xứng với điểm bắt đầu và
kết thúc của chúng. Các véc-tơ thường được sắp xếp theo liên kết của chúng.
Một trong những cách biểu diễn thông dụng nhất là chain code
[13]
[Freeman
1974].
Dữ liệu không gian - Spatial (High-dimentional) Data
Rất nhiều các cấu trúc SAM (Spatial Access methods) thành công dựa
trên nguồn gốc của sự phân ly không gian có thứ bậc. Ý tưởng ở đây là đánh
chỉ mục một cách liên tục các vùng không gian, như vậy việc tìm kiếm có
Đề tài: Tính toán xấp xỉ với các truy vấn liên quan đến khoảng cách
trong cơ sở dữ liệu không gian
2008
23
thể được xuất phát ở mức cao hướng về những vùng không gian thích hợp.
Một cách thức phổ biến và khả quan để tổ chức và truy cập các đối tượng đa
chiều là sử dụng R-tree hoặc các biến thể của nó bởi vì trong R-tree, không
gian dữ liệu được phân ly liên tiếp nhau thành các rectangle, còn gọi là
hyper-rectangle.
Với hệ thống thông tin địa lý - GIS
Hệ thống thông tin địa lý làm việc với hai dạng mô hình dữ liệu địa lý
khác nhau về cơ bản - mô hình vector và mô hình raster.
9 Trong mô hình vector, thông tin về điểm, đường và vùng được mã hoá và
lưu dưới dạng tập hợp các toạ độ x,y. Vị trí của đối tượng điểm, như lỗ
khoan, có thể được biểu diễn bởi một toạ độ đơn x,y. Đố
i tượng dạng đường,
như đường giao thông, sông suối, có thể được lưu dưới dạng tập hợp các toạ
độ điểm. Đối tượng dạng vùng, như khu vực buôn bán hay vùng lưu vực
sông, được lưu như một vòng khép kín của các điểm toạ độ.
9 Mô hình vector rất hữu ích đối với việc mô tả các đối tượng riêng biệt,
nhưng kém hiệu quả hơn trong miêu tả các
đối tượng có sự chuyển đổi liên
tục như kiểu đất hoặc chi phí ước tính cho các bệnh viện. Mô hình raster
được phát triển cho mô phỏng các đối tượng liên tục như vậy. Một ảnh raster
là một tập hợp các ô lưới. Cả mô hình vector và raster đều được dùng để lưu
dữ liệu địa lý với nhưng ưu điểm, nhược điểm riêng, Các hệ GIS hiện đại có
khả năng quả
n lý cả hai mô hình này.
2.1.1 Xây dựng mô hình của các đối tượng riêng lẻ
Sử dụng phương pháp trừu tượng hóa cơ bản để mô phỏng các đối tượng
riêng lẻ trong không gian, thông qua việc sử dụng các kí hiệu hình học có tính
chất tượng trưng:
Các kí hiệu hình học thường gặp trong bản đồ địa lý thông thường và
những đối tượng cần được biểu diễn trong CSDL không gian tương ứng:
Điểm: y
Kí hiệu thành phố
Mô phỏng hình học của một đối tượng trong trường hợp này chỉ xác định
Đề tài: Tính toán xấp xỉ với các truy vấn liên quan đến khoảng cách
trong cơ sở dữ liệu không gian
2008
24
vị trí của nó trên không gian bản đồ chứ không thể hiện phạm vi hay tỉ lệ kích
thước tương ứng của đối tượng.
Đường thẳng, đoạn thẳng:
Dòng sông
Đường dây
Đường giao thông
Hình 4: Biểu diễn dạng đường
Kí hiệu hình học của đối tượng kéo dài trong không gian hoặc kết nối các
không gian địa lý.
Vùng miền, lãnh thổ: Diễn tả phạm vi và khu vực của đối tượng
Rừng
Hồ ao
Thành phố
Hình 5: Biểu diễn dạng khu vực
2.1.2 Xây dựng mô hình cho một tập hợp các đối tượng có liên quan trong
không gian địa lý
Ranh giới phân chia giữa các đối tượng
Qui hoạch đất
Phân chia quận huyện
Sở hữu đất
Không gian các điểm
Hình 6: Biểu diễn tập đối tượng trong khu vực
Đề tài: Tính toán xấp xỉ với các truy vấn liên quan đến khoảng cách
trong cơ sở dữ liệu không gian
2008
25
Xây dựng mô phỏng mạng lưới các đối tượng
Hệ thống giao thông
Mạng lưới viễn thông
Hệ thống đường thủy
Đường điện, điện thoại
Hình 7: Biểu diễn đối tượng dạng mạng lưới
2.2 Cơ sở hình học trong tổ chức các đối tượng không gian cơ bản
Câu hỏi đặt ra là liệu hệ quy chiếu hình học cổ điển có thích hợp để xây
dựng mô hình CSDL không gian? Vấn đề đặt ra là không gian địa lý trong
thực tế có tính chất liên tục và liền mạch trong khi máy tính chỉ có thể xử lý
và lưu trữ những số liệu dưới dạng số học rời rạc.
Với hệ quy chiế
u 2 chiều Euclidean điểm P được biểu diễn bởi cặp tọa độ (x,
y): P = (x, y) € R
2
(real * real)
Dễ dàng nhận thấy với hình học Euclidean các đối tượng được quy về mặt
phẳng với 2 thông số tọa độ x, y. Dẫn đến khó có thể xác định một điểm bất
kỳ có thuộc một đường thẳng nối 2 điểm khác trong không gian hay không?
Mục đích xây dựng cơ sở hình học để tổ chức hợp lý các đối tượng không
gian: Tránh phải sử dụng phép tính toán thêm các giao điể
m mới trong giới
hạn các phép toán hình học.
Có 2 cách tiếp cận:
Simplicial Complexes – Tổ hợp đơn giản (từ combinatorial topology –
tổ hợp tương quan không gian)
Realms
2.2.1 Simplicial Complexes
Định nghĩa: Simplicial Complexes – Tổ hợp đơn giản là một tập hữu hạn các
đỉnh (simplices) để giao điểm các đoạn thẳng nối giữa chúng tạo thành các bề