Tải bản đầy đủ (.pdf) (70 trang)

Một số vấn đề về lưu trữ và chỉ mục trong cơ sở dữ liệu không gian : Luận văn ThS. Công nghệ thông tin : 60 48 05

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.8 MB, 70 trang )


MỤC LỤC
CÁC THUẬT NGỮ VÀ CÁC TỪ VIẾT TẮT ..................................................... 1
DANH MỤC CÁC BẢNG..................................................................................... 1
DANH MỤC CÁC HÌNH .................................................................................... 2
Chương 1. ............................................................................................................. 5
TỔNG QUAN VỀ HỆ THỐNG THÔNG TIN ĐỊA LÝ ..................................... 5
CƠ SỞ DỮ LIỆU KHÔNG GIAN ........................................................................ 5
1.1. Tổng quan về hệ thống thông tin địa lý (GIS) ........................................... 5
1.1.1. Khái niệm ............................................................................................... 5
1.1.2. Các thành phần của hệ thống thông tin địa lý ......................................... 7
1.1.2.1. Thiết bị (Hardware) ......................................................................... 7
1.1.2.2. Phần mềm ( Software) ..................................................................... 8
1.1.2.3. Con người (Person) .......................................................................... 9
1.1.2.4. Số liệu, dữ liệu địa lý (Geographic data) .......................................... 9
1.1.2.5. Chính sách và quản lý (Policy and management) ............................. 9
1.1.3. Các chức năng của hệ thống thông tin địa lý .......................................... 9
1.1.4. Ứng dụng của hệ thống thông tin địa lý ................................................ 11
1.2. Cơ sở dữ liệu không gian .......................................................................... 11
1.2.1. Tổ chức các mẩu tin trong tệp .............................................................. 12
1.2.2. Chỉ mục không gian (Spatial indexing ) ............................................... 15
1.2.3. Phương pháp quản trị CSDL phi không gian ........................................ 17
1.2.4. Phương pháp quản trị CSDL không gian .............................................. 19
1.2.4.1. Mô hình Vector .............................................................................. 20
1.2.4.2. Mô hình Raster. ............................................................................. 21
1.2.4.3. Mô hình đồ thị (Topology)............................................................. 23
1.2.4.4. Sử dụng Mô hình CSDL quan hệ .................................................. 23
để quản trị dữ liệu phi không gian ................................................... 23
1.2.5. Truy vấn không gian............................................................................. 25
1.2.6. Phân cụm trong CSDL không gian ....................................................... 26
Chương 2. ............................................................................................................ 28


MỘT SỐ KỸ THUẬT CHỈ MỤC VÀ TÌM KIẾM ........................................... 28
TRONG CƠ SỞ DỮ LIỆU KHÔNG GIAN ...................................................... 28
2.1. Mở đầu ...................................................................................................... 28
2.2. Cây k-d (k-d Trees) ................................................................................... 29
2.2.1. Cấu trúc nút .......................................................................................... 29
2.2.2. Chèn và tìm kiếm trong cây 2-d............................................................ 30
2.2.3. Huỷ bỏ trong cây 2-d ............................................................................ 33
2.2.4 Truy vấn khoảng trong cây 2-d .............................................................. 34
2.2.5. Cây k-d với k2 ................................................................................... 36
2.3. Cây tứ phân điểm (Point Quadtrees) ....................................................... 37
2.3.1. Chèn và tìm kiếm trong cây tứ phân điểm ............................................ 37
2.3.2. Thao tác xoá trên cây tứ phân điểm ...................................................... 39
2.3.3. Truy vấn khoảng trong cây tứ phân điểm ............................................ 41
- 67 -


2.4. Cây tứ phân matrix MX (MX-Quadtrees)............................................... 41
2.4.1. Chèn và tìm kiếm trong MX-Quadtree ................................................ 42
2.4.2. Thao tác xoá trong MX-Quadtrees ....................................................... 44
2.4.3. Truy vấn khoảng trong MX-Quadtrees ................................................. 45
2.5. Cây R (R-Trees) ....................................................................................... 45
2.5.1. Chèn và tìm kiếm trong R-Trees........................................................... 46
2.5.2. Xoá trong cây R-Trees ......................................................................... 48
2.6. So sánh các cấu trúc dữ liệu ..................................................................... 49
Chương 3. ............................................................................................................ 51
CÀI ĐẶT VÀ THỬ NGHIỆM ............................................................................ 51
3.1. Bài toán...................................................................................................... 51
3.1.1. Phát biểu bài toán ................................................................................. 51
3.1.2. Cách giải quyết ..................................................................................... 51
3.2. Công cụ xây dựng chương trình ............................................................... 52

3.3. Dữ liệu xây dựng trong chương trình ...................................................... 52
3.4. Thiết kế đặc tả chức năng ......................................................................... 53
3.4.1. Chuyển đổi dữ liệu từ cấu trúc tuyến tính sang cấu trúc cây ................. 53
3.4.2. Lưu trữ sang cấu trúc cây ..................................................................... 53
3.4.3. Hiển thị bản đồ ..................................................................................... 53
3.4.4. Truy vấn trên bản đồ ............................................................................ 53
3.5. Cài đặt và thử nghiệm .............................................................................. 54
3.5.1. Cài đặt chương trình ............................................................................. 54
3.5.2. Kết quả thử nghiệm .............................................................................. 54
3.6. Nhận xét kết quả đạt được ....................................................................... 59
KẾT LUẬN .......................................................................................................... 60
TÀI LIỆU THAM KHẢO ................................................................................... 61
Tiếng Việt ......................................................................................................... 61
Tiếng Anh ......................................................................................................... 61
PHỤ LỤC A ......................................................................................................... 63

- 68 -


CÁC THUẬT NGỮ VÀ CÁC TỪ VIẾT TẮT
Ký hiệu/từ
viết tắt
API
CSDL
CPU
GIS
I/O
LAN
DBMS


Viết đầy đủ

Ý nghĩa

Application Programming Interface
Cơ sở dữ liệu
Central Process ing Unit
Geographic Information System
Input/Output
Local Area Network
Database Management System

Giao diện lập trình ứng dụng
Cơ sở dữ liệu
Đơn vị xử lý trung tâm
Hệ thống thông tin địa lý
Nhập/xuất
Mạng cục bộ
Hệ quản trị cơ sở dữ liệu

DANH MỤC CÁC BẢNG
Bảng 1.1. So sánh giữa mô hình vectơ và mô hình raster ..................................... 23
Bảng 2.1 Các trường hợp của phép chèn vào cây tứ phân điểm ............................ 40
Bảng 2.2. Mô tả bốn cành của nút N trong cây tứ phân MX ................................. 42
Bảng 3.1. Các nút lệnh trên thanh công cụ của chương trình ................................. 55

-1-


DANH MỤC CÁC HÌNH

Hình 1.1. Tầng bản đồ ............................................................................................ 6
Hình 1.2 Các hoạt động chính của GIS ................................................................... 6
Hình 1.3. Các hợp phần thiết yếu cho công nghệ GIS. ............................................ 7
Hình 1.4. Các thành phần thiết bị cơ bản của GIS .................................................. 7
Hình 1.5. Các nhóm chức năng trong GIS ............................................................ 10
Hình 1.6. Minh hoạ mô hình hoá .......................................................................... 11
Hình 1.7 Ánh xạ các mẩu tin từ Country, City và River vào các trang đĩa ............ 12
Hình 1.8. Tổ chức tệp có thứ tự cho bảng City ..................................................... 13
Hình 1.9. Tổ chức hàm băm cho bảng City .......................................................... 14
Hình 1.10. Chỉ mục phụ trên bảng City ................................................................ 16
Hình 1.11. Chỉ mục chính trên bảng City ............................................................. 16
Hình 1.12. Số liệu Vector được biểu thị dưới dạng điểm (Point) .......................... 20
Hình 1.13. Số liệu vector được biểu thị dưới dạng arc. ......................................... 21
Hình 1.14. Số liệu vectơ được biểu diễn dưới dạng vùng ..................................... 21
Hình 1.15. Biểu diễn raster ................................................................................... 22
Hình 1.16. Kiến trúc tích hợp của hệ GIS ............................................................. 25
Hình 1.17. Ví dụ về truy vấn điểm và truy vấn vùng ............................................ 26
Hình 2.1. Bản đồ mẫu để biểu diễn bởi các cấu trúc cây ....................................... 28
Hình 2.2. Lưới bản đồ với kích thước 64x64 ........................................................ 30
Hình 2.3. Trình tự chèn vào cây 2-d ..................................................................... 31
Hình 2.4. Mô tả phép chèn cây k-d trên bản đồ .................................................... 32
Hình 2.5. Bản đồ mẫu để xây dựng cây tứ phân điểm ........................................... 38
Hình 2.6. Tiến trình chèn vào cây tứ phân điểm ................................................... 38
Hình 2.7. Mô hình một cây tứ phân điểm ............................................................. 39
Hình 2.8. Trình tự chèn vào cây tứ phân MX ....................................................... 43
Hình 2.9. Mô tả phép chèn điểm vào cây tứ phân MX .......................................... 44
Hình 2.10. Bản đồ mẫu mô tả cách nhóm các hình chữ nhật minh họa cây R ....... 46
Hình 2.11. Trình tự chèn vào cây R ...................................................................... 47
Hình 2.12. Bản đồ mẫu mô tả phép chèn trong cây R ........................................... 47
Hình 2.13. Bản đồ mẫu mô tả phép chèn trong cây R ........................................... 48

Hình 2.14. Bản đồ mẫu mô tả phép chèn trong cây R ........................................... 48
Hình 2.15. Mô tả phép xóa trong cây R ................................................................ 49
Hình 3.1. Mô hình Use Case ................................................................................. 52
Hình 3.2. Giao diện chính của chương trình ......................................................... 54
Hình 3.3. Bảng đồ sau khi hiển thị cả lớp đường và lớp điểm. .............................. 56
Hình 3.4. Bảng đồ hiển lớp điểm .......................................................................... 56
Hình 3.5. Truy vấn vùng trên bản đồ lớp điểm ..................................................... 57
Hình 3.6. Kết quả của truy vấn trên hình 3.4 ........................................................ 57
Hình 3.7. Truy vấn vùng trên bản đồ tổng thể ...................................................... 58
Hình 3.8.Kết quả của truy vấn vùng trên bản đồ tổng thể ..................................... 58

-2-


MỞ ĐẦU
Thời gian gần đây, tại Việt Nam, các hệ thống thông tin địa lý –
Geographic Information System(GIS) đã bắt đầu quen thuộc và đã là nhu cầu
không thể thiếu đối với hầu hết các chuyên ngành từ địa chính, đo đạc trắc địa,
viễn thông cho đến du lịch, điện lực. Vì GIS được thiết kế như một hệ thống
chung để quản lý dữ liệu không gian, nó có rất nhiều ứng dụng trong việc phát
triển đô thị và môi trường tự nhiên như là: quy hoạch đô thị, quản lý nhân lực,
nông nghiệp, điều hành hệ thống công ích, lộ trình, nhân khẩu, bản đồ, giám sát
vùng biển, cứu hoả và bệnh tật. …Trong phần lớn lĩnh vực này, GIS đóng vai
trò như là một công cụ hỗ trợ quyết định cho việc lập kế hoạch hoạt động môi
trường.
Tuy nhiên việc vận dụng, chọn lựa giải pháp GIS như thế nào cho phù
hợp đối với từng chuyên ngành với mỗi quy mô và mức độ phức tạp riêng cũng
như đáp ứng vừa đủ các yêu cầu cụ thể về GIS là điều không phải dễ dàng. Việc
chọn sai giải pháp GIS sẽ phải trả giá đắc cho những chi phí không đáng có hoặc
sự bế tắc về tính mở, tính dễ phát triển của hệ thống dữ liệu địa lý. Ngoài vấn đề

giá cả, yếu tố hàng đầu để chọn đúng giải pháp GIS là hiểu được chiến lược
quản trị cơ sở dữ liệu của các hệ GIS. Bởi vì thông qua giải pháp quản trị CSDL
của mỗi hệ GIS, chúng ta sẽ nắm rõ năng lực, yêu cầu cần thiết phải có của một
hệ GIS như quản trị thông tin, xử lý thông tin GIS, cũng như khả năng mở, dễ
phát triển, tính phổ dụng của hệ thống dữ liệu, từ đó sẽ có cách chọn lựa đúng
đắn tối ưu khi sử dụng GIS vào các dự án, công việc cụ thể.
Cấu trúc dữ liệu thể hiện bản chất rõ nhất của nó hệ thống GIS. Biết được
giải pháp quản trị CSDL của các hệ GIS là vấn đề then chốt nhất, hệ thống nhất
để có thể ứng dụng GIS một cách hiệu quả và thuận tiện phát triển mở rộng.
Hiện nay các ràng buộc yêu cầu khi quyết định sử dụng một hệ thống GIS nào
đó chủ yếu dựa vào:
- Năng lực lưu trữ, khai thác mạnh: hệ thống dữ liệu có thể quản trị dữ
liệu lớn, truy xuất nhanh, nhiều tiện ích giải thuật.
- Tính khai thác, sử dụng rộng rãi: dữ liệu có thể được hỗ trợ khai thác
hiệu quả với nhiều tính năng trên nhiều phương diện ví dụ có thể sử dụng trên
máy tính cá nhân hoặc khai thác qua mạng LAN, Internet.
- Tính mở, tính tương thích, tính phổ biến của hệ thống dữ liệu: cấu trúc
dữ liệu có tính mở có thể liên kết với các hệ thống dữ liệu khác và có thể phát

-3-


triển mở rộng được, hệ thống dữ liệu có khả năng dễ dàng tích hợp dữ liệu từ
những hệ thống khác.
- Tính dễ dàng tạo lập chuyên biệt và tích hợp-tách rời: cấu trúc dữ liệu có
thể dễ dàng tạo lập riêng phù hợp với mục đích sử dụng chuyên biệt dễ dàng tích
hợp và tách rời.
- Giá cả và khả năng triển khai dự án GIS thông suốt.
Tất các các yếu tố này đều nói lên điểm mạnh yếu về giải pháp quản trị
CSDL của mỗi hệ GIS, vì vậy việc khảo sát giải pháp quản trị CSDL của các hệ

GIS sẽ giúp ta đưa ra các quyết định đúng về việc ứng dụng sao cho phù hợp với
mỗi nhu cầu thực tế. Có thể nói cấu trúc dữ liệu là phần khung và bản chất nhất
của các hệ thống GIS, nó là cơ sở của các giải thuật GIS cũng như nói đến khả
năng lưu trữ, khai thác, phát triển hệ thống dữ liệu. Xuất phát từ thực tế Tôi
chọn đề tài “ Một số vấn đề lưu trữ và chỉ mục trong cơ sở dữ liệu không gian”.
Trong khuôn khổ một luận văn, tôi trình bày một số vấn đề cơ bản về hệ
thống thông tin địa lý (GIS), hệ quản trị CSDL không gian chẳng hạn các khái
niệm, kiến trúc hệ thống, các mô hình dữ liệu không gian. Trong đó, tập trung
nghiên cứu và cài đặt thử nghiệm một số cấu trúc lưu trữ dữ liệu không gian.
Bố cục của luận văn bao gồm phần mở đầu, phần kết luận và ba chương
nội dung được tổ chức như sau:
Chương 1: Tổng quan về hệ thống thông tin địa lý (GIS) - Cơ sở dữ liệu không gian
Chương này trình bày tổng quan về hệ thống thông tin địa lý: định nghĩa
hình thức về hệ thống thông tin địa lý, các thành phần, chức năng và các ứng
dụng của hệ thống thông tin địa lý. Cơ sở dữ liệu không gian bao gồm: chỉ mục
không gian, truy vấn không gian, phương pháp quản trị CSDL phi không gian
và không gian, trong đó gồm các mô hình Vector, Raster, Topology
Chương 2: Một số kỹ thuật chỉ mục và tìm kiếm trong CSDL không gian
Chương này mô tả cấu trúc, các phép toán chèn, xoá, duyệt, truy vấn trên
các kỹ thuật chỉ mục và tìm kiếm không gian như: cây k-d(k-d tree), cây tứ
phân(Quadtree), cây R (R tree) và so sánh giữa chúng
Chương 3: Cài đặt và thử nghiệm
Cài đặt thử nghiệm kỹ thuật chỉ mục và tìm kiếm không gian:cây tứ phân điểm.
Chương trình được cài đặt từ cơ sở dữ liệu đã có định dạng bằng
Shapefile, với ngôn ngữ lập trình C#.NET cùng với thư viện hỗ trợ SharpMap.

-4-


Chương 1.

TỔNG QUAN VỀ HỆ THỐNG THÔNG TIN ĐỊA LÝ
– CƠ SỞ DỮ LIỆU KHÔNG GIAN
1.1. Tổng quan về hệ thống thông tin địa lý (GIS)
1.1.1. Khái niệm
Hệ thống thông tin địa lý - Geographic Information System (GIS) là một
nhánh của công nghệ thông tin, đã hình thành từ những năm 60 của thế kỷ trước
và phát triển rất mạnh trong những năm gần đây.
GIS được sử dụng nhằm xử lý đồng bộ các lớp thông tin không gian (bản
đồ) gắn với các thông tin thuộc tính, phục vụ nghiên cứu, quy hoạch và quản lý
các hoạt động theo lãnh thổ.
Ngày nay, ở nhiều quốc gia trên thế giới, GIS đã trở thành công cụ trợ
giúp quyết định trong hầu hết các hoạt động kinh tế-xã hội, an ninh, quốc phòng,
đối phó với thảm hoạ thiên tai v.v... GIS có khả năng trợ giúp các cơ quan chính
phủ, các nhà quản lý, các doanh nghiệp, các cá nhân v.v... đánh giá được hiện
trạng của các quá trình, các thực thể tự nhiên, kinh tế-xã hội thông qua các chức
năng thu thập, quản lý, truy vấn, phân tích và tích hợp các thông tin được gắn
với một nền bản đồ số nhất quán trên cơ sở toạ độ của các dữ liệu bản đồ đầu
vào.
Có nhiều định nghĩa về GIS, nhưng nói chung đã thống nhất quan niệm
chung: GIS là một hệ thống kết hợp giữa con người và hệ thống máy tính cùng
các thiết bị ngoại vi để lưu trữ, xử lý, phân tích, hiển thị các thông tin địa lý
nhằm phục vụ mục đích nghiên cứu, quản lý nhất định.
Xét dưới góc độ là công cụ, GIS dùng để thu thập, lưu trữ, biến đổi, hiển
thị các thông tin không gian nhằm thực hiện các mục đích cụ thể.
Xét dưới góc độ là phần mềm, GIS làm việc với các thông tin không
gian, phi không gian, thiết lập quan hệ không gian giữa các đối tượng. Có thể
nói các chức năng phân tích không gian đã tạo ra diện mạo riêng cho GIS.
Xét dưới góc độ ứng dụng trong quản lý nhà nước, GIS có thể được hiểu
như là một công nghệ xử lý các dữ liệu có toạ độ để biến chúng thành các thông
tin trợ giúp quyết định phục vụ các nhà quản lý.

Xét dưới góc độ hệ thống, GIS là hệ thống gồm các hợp phần: Phần cứng,
Phần mềm, Cơ sở dữ liệu và Cơ sở tri thức chuyên gia.
-5-


Tầng Biên
hành chính
Tầng Khách hàng
Tầng Đ-ờng quốc lộ
Tầng Nhà ở
hố

Hỡnh 1.1. Tng bn
GIS lu tr thụng tin th gii thc thnh cỏc tng (layer) bn chuyờn
m chỳng cú kh nng liờn kt a lý vi nhau. Gi s ta cú vựng quan sỏt
nh hỡnh 1.1, mi nhúm ngi s dng s quan tõm nhiu hn n mt hay vi
loi thụng tin. Vớ d, S giao thụng cụng chớnh s quan tõm nhiu n h thng
ng ph, s Nh t quan tõm nhiu n cỏc khu dõn c v cụng s, s
Thng mi quan tõm nhiu n phõn b khỏch hng trong vựng. T tng tỏch
bn thnh tng tuy n gin nhng khỏ mm do v hiu qu, chỳng cho kh
nng gii quyt rt nhiu vn v th gii thc, t theo dừi iu hnh xe c
giao thụng, n cỏc ng dng lp k hoch v mụ hỡnh húa lu thụng. Ta cú th
s dng tin trỡnh t ng , gi l mó húa a lý (geocoding) liờn kt d liu
bờn ngoi vi d liu bn . Vớ d, s dng mó húa a lý ỏnh x thụng tin
bỏn hng bng mó bu in (ZIP) hay ch ra a ch khỏch hng trờn bn bng
cỏc im[1].
Đo đạc

Giám sát


Lập bản đồ

t1

t2
t3
Mô hình hóa
Dân cKhí hậu
Cây trồng
Thuỷ lợi
Hệ thông tin địa lý

Hỡnh 1.2 Cỏc hot ng chớnh ca GIS
-6-


1.1.2. Các thành phần của hệ thống thông tin địa lý
Công nghệ GIS gồm 5 hợp phần cơ bản là:
- Thiết bị (Hardware)
- Phần mềm (Software).
- Số liệu (Geographic data)
- Con người (Person)
- Chính sách và cách thức quản lý (Policy and Management)

CON NGƯỜI

Hình 1.3. Các hợp phần thiết yếu cho công nghệ GIS.
1.1.2.1. Thiết bị (Hardware)
Bao gồm máy vi tính (computer), máy vẽ (plotter), máy in (printer), bàn
số hóa (digitizer), thiết bị quét ảnh (scaner), các phương tiện lưu trữ số liệu

(Floppy diskettes,optical cartridges, CD ROM. . .)

Hình 1.4. Các thành phần thiết bị cơ bản của GIS
-7-


1.1.2.2. Phần mềm (Software)
Phần mềm là tập hợp các câu lệnh, chỉ thị nhằm điều khiển phần cứng
của máy tính thực hiện một nhiệm vụ xác định, phần mềm hệ thống thông tin địa
lý có thể là một hoặc tổ hợp các phần mềm máy tính. Phần mềm được sử dụng
trong kỹ thuật GIS phải bao gồm các tính năng cơ bản sau:
- Nhập và kiểm tra dữ liệu (Data input): bao gồm tất cả các khía cạnh về
biến đổi dữ liệu đã ở dạng bản đồ, trong lĩnh vực quan sát vào một dạng số
tương thích.
- Lưu trữ và quản lý cơ sở dữ liệu (Storage and management database):
lưu trữ và quản lý cơ sở dữ liệu đề cập đến phương pháp kết nối thông tin vị trí
(topology) và thông tin thuộc tính (attributes) của các đối tượng địa lý (điểm,
đường đại diện cho các đối tượng trên bề mặt trái đất). Hai thông tin này được tổ
chức và liên hệ qua các thao tác trên máy tính và sao cho chúng lĩnh hội được
người sử dụng hệ thống.
- Xuất dữ liệu (Display and reporting): dữ liệu đưa ra là các báo cáo kết
quả quá trình phân tích tới người sử dụng, có thể bao gồm các dạng: bản đồ (MAP),
bảng biểu (TABLE), biểu đồ, lưu đồ (FIGURE) được thể hiện trên máy tính,
máy in, máy vẽ.
- Biến đổi dữ liệu (Data transformation): biến đổi dữ liệu gồm hai lớp
điều hành nhằm mục đích khắc phục lỗi từ dữ liệu và cập nhật chúng.
- Tương tác với người dùng (Query input): giao tiếp với người dùng là
yếu tố quan trọng nhất của bất kỳ hệ thống thông tin nào. Các giao diện người
dùng ở một hệ thống thông tin được thiết kế phụ thuộc vào mục đích của ứng
dụng đó.

Các phần mềm tiêu chuẩn và sử dụng phổ biến hiện nay trong khu vực Châu Á là:
ARC/INFO, MAPINFOR, IL WIS, WINGIS, SPANS, IDRISIW,....Hiện nay có rất nhiều
phần mềm máy tính chuyên biệt cho GIS, bao gồm các phần mềm sau:
+ Phần mềm dùng cho lưu trữ, xử lý số liệu thông tin địa lý: ACR/INFO,
SPAN, ERDAS-Imagine, IL WIS, MGE/MICROSTATION, IDRISIW..
+ Phần mềm dùng cho lưu trữ, xử lý và quản lý các thông tin địa lý: ERMAPPER, ATLASGIS, ARCVIEW, MAPINFO...

-8-


1.1.2.3. Con người (Person)
Con người bao gồm: người sử dụng hệ thống (system user), thao tác viên
hệ thống (system operator), nhà cung cấp GIS (GIS supplier), nhà cung cấp dữ
liệu (data supplier), người phát triển ứng dụng (application developer), chuyên
viên phân tích hệ thống GIS (GIS system analysts)
1.1.2.4. Số liệu, dữ liệu địa lý (Geographic data)
Số liệu được sử dụng trong GIS không chỉ là số liệu địa lý riêng lẽ mà còn
được thiết kế trong một cơ sở dữ liệu. Những thông tin địa lý bao gồm những dữ
kiện về: vị trí địa lý, thuộc tính, mối liên hệ không gian của các thông tin và thời
gian. Có 2 dạng số liệu được sử dụng trong kỹ thuật GIS là:
- Cơ sở dữ liệu bản đồ: là những mô tả hình ảnh bản đồ được số hóa theo
một khuôn dạng nhất định mà máy tính hiểu được. Hệ thống thông tin địa lý
dùng cơ sở dữ liệu này để xuất ra các bản đồ trên màn hình hoặc ra các thiết bị
ngoại vi khác như máy in, máy vẽ.
+ Số liệu vector: được hiển thị dưới dạng điểm, đường và vùng, mỗi dạng
có liên quan đến 1 số liệu thuộc tính được lưu trữ trong cơ sở dữ liệu.
+ Số liệu raster: được thể hiện dưới dạng lưới ô vuông hay ô chữ nhật đều
nhau, giá trị được ấn định cho mỗi ô sẽ chỉ định giá trị của thuộc tính. Số liệu
của ảnh vệ tinh và số liệu của bản đồ được quét là các loại số liệu raster.
- Số liệu thuộc tính: được hiển thị dưới dạng ký hiệu hoặc số để mô tả các

thuộc tính của các thông tin thuộc về địa lý.
Trong các dạng số liệu trên thì số liệu dạng vector là dạng thường sử dụng
nhất, tuy nhiên số liệu raster rất hữu ích để mô tả các dãy số liệu có tính liên tục
như: nhiệt độ, cao độ,...và thực hiện các phân tích không gian của số liệu. Còn
số liệu thuộc tính dùng để mô tả cơ sở dữ liệu.
1.1.2.5. Chính sách và quản lý (Policy and management)
Đây là hợp phần quan trọng để đảm bảo khả năng hoạt động của hệ thống,
là yếu tố quyết định sự thành công của việc phát triển công nghệ GIS. Hệ thống
GIS cần được điều hành bởi bộ phận quản lý. Bộ phận này phải được bổ nhiệm
để tổ chức hoạt động hệ thống GIS một cách có hiệu quả để phục vụ người sử
dụng thông tin.

1.1.3. Các chức năng của hệ thống thông tin địa lý
Các chức năng của GIS được chia thành 5 loại sau:
-9-


- Thu thp d liu
- X lý s b d liu
- Lu tr v truy cp d liu
- Tỡm kim v phõn tớch khụng gian
- Hin th ha v tng tỏc
Sc mnh ca cỏc chc nng ca h thng GIS khỏc nhau l khỏc nhau.
K thut xõy dng cỏc chc nng trờn cng khỏc nhau. Hỡnh 1.5 mụ t quan h
gia cỏc nhúm chc nng v cỏch biu din thụng tin khỏc nhau ca GIS.
Chc nng thu thp d liu to ra d liu t cỏc quan sỏt hin tng th
gii thc v t cỏc ti liu, bn giy, ụi khi chỳng cú sn di dng s. Kt
qu ta cú tp d liu thụ, cú ngha l d liu ny khụng c phộp ỏp dng trc
tip cho chc nng truy nhp v phõn tớch ca h thng. Chc nng x lý s b
d liu s bin i d liu thụ thnh d liu cú cu trỳc s dng trc tip cỏc

chc nng tỡm kim v phõn tớch khụng gian. Kt qu tỡm kim v phõn tớch
c xem nh din gii d liu, ú l t hp hay bin i c bit ca d liu cú
cu trỳc. H thng GIS phi cú phn mm cụng c t chc v lu tr cỏc loi
d liu khỏc nhau t d liu thụ n d liu din gii. Phn mm cụng c ny
phi cú cỏc thao tỏc lu tr, truy nhp; ng thi cú kh nng hin th , tng tỏc
ha vi tt c loi d liu.
Hiện t-ợng
quan sát

Tài liệu và
bản đồ giấy

Thu thập
dữ liệu
Dữ liệu
thô

CSDL

L-u trữ và
khai thác

Xử lý sơ
bộ dữ liệu

Hiển thị và
t-ơng tác

Dữ liệu có
cấu trúc

Tìm kiếm và
phân tích

Diễn giải

Hỡnh 1.5. Cỏc nhúm chc nng trong GIS
- 10 -

Thiết bị
đồ họa


1.1.4. Ứng dụng của hệ thống thông tin địa lý
- Quản lý và lập kế hoạch mạng lưới đường phố: bao gồm các chức năng
tìm kiếm địa chỉ, tìm vị trí khi biết trước địa chỉ đường phố; điều khiển đường
đi, lập kế hoạch lưu thông xe cộ; phân tích vị trí, chọn địa điểm xây dựng các
công trình công cộng; lập kế hoạch phát triển đường giao thông.
- Giám sát tài nguyên, thiên nhiên, môi trường: bao gồm các chức năng
quản lý sông ngòi, các vùng lũ lụt, vùng đất nông nghiệp, có rừng, sống hoang
dã; phân tích tác động môi trường; vị trí của các công trình công cộng,…
- Quản lý đất đai: bao gồm các chức năng lập kế hoạch vùng, miền sử
dụng đất; quản lý nước tưới tiêu; kiến trúc mặt bằng sử dụng đất…
- Quản lý và lập kế hoạch các dịch vụ công cộng: bao gồm các chức năng
tìm địa điểm cho các công trình ngầm: ống dẫn, đường điện…; cân đối tải diện;
lập kế hoạch bảo dưỡng các công trình công cộng…
- Phân tích tổng điều tra dân số, lập bản đồ các dịch vụ y tế, bưu điện và
nhiều ứng dụng trong các lĩnh vực khác.

1.2. Cơ sở dữ liệu không gian
Con người phải lập mô hình của hiện thực mà mô hình này tương tự với

một số khía cạnh chọn lọc từ thế giới thực. Mô hình là mô tả đầy đủ hệ thống từ
một góc nhìn cụ thể và được hình thành nhờ tiến trình trừu tượng hóa (đơn giản
hóa thông minh)[1]. Cơ sở dữ liệu không gian hình thành từ các mô hình mô tả
trạng thái và bản chất của hiện thực (hình 1.6).

Hình 1.6. Minh hoạ mô hình hoá
* Định nghĩa CSDL không gian:
Cơ sở dữ liệu không gian là tập hợp dữ liệu tham chiếu không gian, có
vai trò như mô hình của hiện thực:

- 11 -


+ CSDL là mô hình hiện thực theo nghĩa nó biểu diễn tập lựa chọn hay
xấp xỉ các hiện tượng
+ Các hiện tượng lựa chọn này được xem là quan trọng, đủ để biểu
diễn đặc trưng dưới dạng số cho hiện tại, quá khứ và tương lai.

1.2.1. Tổ chức các mẩu tin trong tệp
Dữ liệu trên đĩa được tổ chức thành: trường (field), mẩu tin (record), tệp
(file). Trong đó, trường mô tả đặc tính hoặc thuộc tính của một quan hệ hoặc
một thực thể. Mẩu tin mô tả một hàng (row) trong một bảng quan hệ, tập hợp
của những trường cho những thuộc tính trong mô hình quan hệ của bảng. Những
tệp là tập hợp của những mẩu tin có thể được mô tả một quan hệ, những tập hợp
khác có thể là sự kết hợp của những quan hệ liên quan.

Hình 1.7 Ánh xạ các mẩu tin từ Country, City và River vào các trang đĩa
Làm thế nào để biểu diễn các mẩu tin trong một cấu trúc tệp. Một thể hiện
của một quan hệ là một tập hợp các mẩu tin. Cho một tập hợp các mẩu tin, vấn
đề đặt ra là làm thế nào để tổ chức chúng trong một tệp. Có một số cách tổ chức

sau:
• Tổ chức tệp đống (Heap File Organization): trong cách tổ chức này, một
mẩu tin bất kỳ có thể được lưu trữ ở bất kỳ nơi nào trong tệp, ở đó có không
gian cho nó, không có thứ tự nào giữa các mẩu tin. Một tệp cho một quan hệ,
những mẩu tin trong tệp Heap không theo một trật tự riêng biệt nào ( ví dụ tệp
Heap là bảng River trong hình 1.6). Đối với cấu trúc tệp không có thứ tự thì
- 12 -


không phù hợp với yêu cầu như tìm kiếm một mẩu tin với một khóa đã cho
(chẳn hạn name ) đòi hỏi phải quét các mẩu tin trong tệp, trường hợp xấu nhất
tất cả những mẩu tin phải được kiểm tra bằng việc kiểm tra tất cả những trang
đĩa chứa dữ liệu cho tệp, nhưng nó phù hợp với phép chèn, đơn giản chỉ thêm
vào một mẩu tin mới ở cuối tệp.
• Tổ chức tệp tuần tự (Sequential File Organization): trong cách tổ chức
này, các mẩu tin được lưu trữ theo thứ tự tuần tự, dựa trên giá trị của khoá tìm
kiếm của mỗi mẩu tin.
Tổ chức tệp tuần tự được thiết kế để xử lý hiệu quả các mẩu tin trong thứ
tự được sắp dựa trên một khoá tìm kiếm (search key) nào đó. Để cho phép tìm
lại nhanh chóng các mẩu tin theo thứ tự khoá tìm kiếm, ta "xích" các mẩu tin lại
bởi các con trỏ. Con trỏ trong mỗi mẩu tin trỏ tới mẩu tin kế tiếp theo thứ tự
khoá tìm kiếm. Hơn nữa, để tối ưu hoá số khối truy xuất trong xử lý tệp tuần tự,
ta lưu trữ vật lý các mẩu tin theo thứ tự khoá tìm kiếm.
Tổ chức tệp tuần tự cho phép đọc các mẩu tin theo thứ tự được sắp mà nó
có thể hữu dụng cho mục đích trình bày cũng như cho các thuật toán xử lý truy
vấn (query-processing algorithms).
Tệp có thứ tự tổ chức những mẩu tin bằng việc sắp xếp chúng dựa vào
trường khóa đã cho, ví dụ hình 1.7 hiển thị một tệp sắp xếp được tổ chức những
mẩu tin trong bảng City với trường khóa sắp xếp City name


Hình 1.8. Tổ chức tệp có thứ tự cho bảng City
• Tổ chức tệp băm (Hashed File Organization): trong cách tổ chức này, có
một hàm băm được tính toán trên thuộc tính nào đó của mẩu tin. Kết quả của
hàm băm xác định mẩu tin được bố trí trong khối nào trong tệp. Cách tổ chức
này liên hệ chặt chẽ với cấu trúc chỉ mục.

- 13 -


Tệp băm được tổ chức chia những mẩu tin thành một tập những thùng
(buckets), sử dụng một hàm gọi là hàm băm (hashed fuction ), hàm băm ánh xạ
những giá trị trên một trường khóa được chọn (ví dụ: City name), trong hình 1.8
hiển thị một hàm băm với 4 thùng (bucket), mỗi thùng được lưu trữ vào một
trang đĩa khác nhau, hàm băm trả về giá trị 1 với những tên có độ dài nhỏ hơn
hoặc bằng 6 ký tự, 2 cho những tên có độ dài 7 hoặc 8 ký tự, 3 cho những tên có
độ dài 9 hoặc 10 ký tự và 4 cho những tên có độ dài lớn hơn 11 ký tự. Tên thành
phố được ánh xạ vào những thùng (bucket) từ 1 đến 4 qua hàm băm.

Hình 1.9. Tổ chức hàm băm cho bảng City
• Tổ chức tệp cụm (Clustering File Organization): trong cách tổ chức này,
các mẩu tin của một vài quan hệ khác nhau có thể được lưu trữ trong cùng một
tệp. Các mẩu tin có mối liên hệ của các quan hệ khác nhau được lưu trữ trên
cùng một khối sao cho mỗi hoạt động I/O đem lại các mẩu tin có mối liên hệ từ
tất cả các quan hệ.
Để thấy những điểm lợi của việc lưu trữ nhiều quan hệ trong cùng một
tệp, ta xét truy vấn SQL sau:
SELECT Account_Number,Customer_Number, Customer_Street,
ustomer_City
FROM Depositor, Customer
WHERE Depositor.Customer_Name = Customer.Customer_name;


- 14 -


Truy vấn này tính một phép nối của các quan hệ Depositor và Customer.
Như vậy, đối với mỗi bộ của Depositor, hệ thống phải tìm bộ của Customer có
cùng giá trị Customer_Name. Một cách lý tưởng là việc tìm kiếm các mẩu tin
này nhờ sự trợ giúp của chỉ mục. Bỏ qua việc tìm kiếm các mẩu tin như thế nào,
ta chú ý vào việc truyền từ đĩa vào bộ nhớ. Trong trường hợp xấu nhất, mỗi mẩu
tin ở trong một khối khác nhau, điều này buộc ta phải đọc một khối cho một
mẩu tin được yêu cầu bởi truy vấn. Ta sẽ trình bày một cấu trúc tệp được thiết
kế để thực hiện hiệu quả các truy vấn liên quan đến Depositor.Customer. Các bộ
Depositor đối với mỗi Customer_Name được lưu trữ gần bộ Customer có cùng
Customer_Name. Cấu trúc này trộn các bộ của hai quan hệ với nhau, nhưng cho
phép xử lý hiệu quả phép nối. Khi một bộ của quan hệ Customer được đọc, toàn
bộ khối chứa bộ này được đọc từ đĩa vào trong bộ nhớ chính. Do các bộ tương
ứng của Depositor được lưu trữ trên đĩa gần bộ Customer, khối chứa bộ
Customer chứa các bộ của quan hệ Depositor cần cho xử lý truy vấn. Nếu một
Customer có nhiều Account đến nỗi các mẩu tin Depositor không lấp đầy trong
một khối, các mẩu tin còn lại xuất hiện trong khối kế cận. Cấu trúc tệp này, được
gọi là gom cụm (clustering), cho phép ta đọc nhiều mẩu tin được yêu cầu chỉ sử
dụng một đọc khối, như vậy ta có thể xử lý truy vấn đặc biệt này hiệu quả hơn.
Tuy nhiên, cấu trúc tệp gom cụm trên lại tỏ ra không có lợi bằng tổ chức
lưu mỗi quan hệ trong một tệp riêng, đối với một số truy vấn, chẳng hạn:
SELECT *
FROM Customer
Việc xác định khi nào thì gom cụm thường phụ thuộc vào kiểu truy vấn
mà người thiết kế CSDL nghĩ rằng nó xảy ra thường xuyên nhất. Sử dụng thận
trọng gom cụm có thể cải thiện hiệu năng đáng kể trong việc xử lý truy vấn.


1.2.2. Chỉ mục không gian (Spatial indexing )
Tệp chỉ mục là tệp bổ trợ để cải tiến việc tìm kiếm. Mỗi bản ghi trong tệp
chỉ mục chỉ có 2 trường: giá trị khóa, địa chỉ của những trang trong tệp dữ liệu,
những bản ghi trong tệp chỉ mục thường có thứ tự, có thể sử dụng thứ tự không
gian và có thể tổ chức những cấu trúc dữ liệu để sử dụng tìm kiếm riêng như: B
tree, R tree, tệp lưới,...(hình 1.9 hiển thị một tệp chỉ mục phụ của bảng City trên
tên trường khóa)

- 15 -


Hình 1.10. Chỉ mục phụ trên bảng City
Nếu các bản ghi trong tệp dữ liệu được sắp xếp bởi trường khóa thì chỉ
mục chỉ cần giữ giá trị trường khóa đầu tiên cho mỗi trang đĩa của tệp dữ liệu
(hình 1.10 là một loại chỉ mục chính (primary index))

Hình 1.11. Chỉ mục chính trên bảng City
Một cấu trúc chỉ mục không gian tổ chức những đối tượng với một tập
những thùng (bucket) thông thường những thùng này tương ứng với những trang
trong bộ nhớ phụ (second memory), mỗi thùng (bucket) có một liên kết vùng,
một phần của không gian chứa tất cả những đối tượng lưu trữ trong thùng
(bucket), những vùng thường là những hình chữ nhật đối với những cấu trúc dữ
liệu điểm, những vùng này thường rời rạc và chúng chia cắt không gian và chính
vì vậy mỗi điểm có liên quan chính xác đến một thùng (bucket), đối với một vài
cấu trúc dữ liệu hình chữ nhật những vùng có thể chồng lên nhau.
- 16 -


Có 2 lợi ích cơ bản của chỉ mục không gian:
1. Cấu trúc dữ liệu không gian ngoài được thêm vào hệ thống, cung cấp

những thuộc tính không gian cây B (B tree) cho những thuộc tính tuyến tính.
2. Những đối tượng không gian được ánh xạ vào không gian một chiều 1D, sử dụng một trật tự không gian (ví dụ: trật tự Z, trật tự Hilbert), vì vậy chúng
được lưu trữ trong một chỉ mục chuẩn 1-D như cây B (B tree)
Chỉ mục không gian giống như bất kỳ chỉ mục khác cung cấp một cơ chế
để giới hạn tìm kiếm, nhưng trong trường hợp này cơ chế dựa vào tiêu chuẩn
không gian như sự giao nhau và chứa đựng nhau. Một chỉ mục không gian cần:
- Tìm những đối tượng trong khoảng một không gian dữ liệu chỉ mục mà
nó tương tác với một điểm đã cho hoặc một vùng quan tâm (truy vấn vùng)
- Tìm những cặp đối tượng từ khoảng 2 không gian dữ liệu chỉ mục mà
chúng tương tác không gian với mỗi trong chúng (kết nối không gian).
Chỉ mục không gian được sử dụng bởi những cơ sở dữ liệu không gian để
tối ưu truy vấn không gian. Những phương pháp chỉ mục không gian phổ biến
bao gồm: lưới (Grid), cây tứ phân (Quadtree), Cây R (R tree), cây kd (k-d tree),
Octree, UB tree. Các chỉ mục này được mô tả chi tiết trong chương 2.

1.2.3. Phương pháp quản trị CSDL phi không gian
Các hệ thống quản trị cơ sở dữ liệu thông dụng như SQL_Server, Oracle,
My_SQL thực tế đã không quản trị thích hợp dữ liệu dạng hình học (dữ liệu địa
lý). Một trong những lý do là các DBMS này thường dùng mô hình dữ liệu quan
hệ và đặt nặng vào giải quyết các vấn đề của mô hình CSDL quan hệ. Trên thực
tế các DBMS này không phục vụ tốt cho việc quản trị, khai thác dữ liệu không
gian.
Định nghĩa một cách không hình thức CSDL quan hệ là một bảng gồm
các cột và các hàng, mỗi hàng được gọi là một bộ, mỗi cột được gọi là một
thuộc tính, mỗi thuộc tính phải có một kiểu dữ liệu duy nhất. Một ví dụ về
CSDL quan hệ có tên là Client lưu trữ các thông tin khách hàng của một ngân
hàng nào đó. Lược đồ chi tiết như sau: Client(Comp, Fname, Lname,
AcountNum, PhoneNum, treetNum, StreetName, City), trong đó các thuộc tính
Comp, Fname, Lname, StreetName, City) có kiểu dữ liệu là kiểu chuỗi mô tả tên
công ty, họ tên khách hàng, tên đường, thành phố tương ứng. AcountNum,

PhoneNum, StreetNum có kiểu là số nguyên dương mô tả tài khoản, số điện
thọai cá nhân và số nhà tương ứng của khách hàng. Thao tác truy vấn trong
- 17 -


CSDL quan hệ thường dùng các công cụ như SQL hoặc đại số quan hệ. Một truy
vấn thông thường trong SQL là:
SELECT A1, A2,….,An
FROM R1, R2,….,Rk
WHERE F
Ý nghĩa của truy vấn trên là chọn những giá trị của các thuộc tính A1,
A2,….,An trong quan hệ R1, R2,….,Rk với điều kiện F cho trước. Trong ví dụ mô
tả ở trên, giả sử ta muốn biết số điện thoại của một khách hàng có tên “ John
Smith”, khi đó truy vấn trong SQL có thể như sau:
SELECT PhoneNum
FROM

Client

WHERE Fname=”John” and Lname= “Smith”.
Mô hình dữ liệu quan hệ được sử dụng rộng rãi trong các ứng dụng hiện
nay. Tuy nhiên CSDL quan hệ gặp phải một số trở ngại cụ thể là:
- Dữ liệu được tổ chức dưới dạng các bộ quan hệ và các bộ với các trường
khó phản ảnh được các cấu trúc dữ liệu phức tạp.
- Cơ chế quan hệ trên là một quan hệ tĩnh, không có cách để thay đổi số
lượng các thuộc tính trong quan hệ.
- Mỗi quan hệ nội dung giữa một bảng này với một bảng khác phải được
mã hóa một cách rõ ràng thông qua cách sử dụng của cấu trúc, ví dụ các ràng
buộc nhất quán.
Để khắc phục những nhược điểm trên, ta sử dụng CSDL hướng đối tượng.

Trong CSDL này, các thuộc tính được biểu diễn như các đối tượng độc lập, tập
hợp các đối tượng có tính chất giống nhau được gọi là lớp, bên trong lớp ta có
thể định nghĩa các thuộc tính và các thao tác trên đối tượng, các thao tác này gọi
là các phương thức. Một ưu đểm rất quan trọng trong CSDL hướng đối tượng đó
là tính kế thừa. Kế thừa là một hình thức khi tạo ra một lớp đối tượng mới có
những thuộc tính và phương thức giống với một lớp đã có. Khi đó, ta không cần
phải khai báo lại toàn bộ các thuộc tính và phương thức giống nhau đó mà chỉ
cần cho lớp mới kế thừa lớp đã có, hơn nữa còn cho phép ta mở rộng các đối
tượng đã có để tạo ra một đối tượng mới, điều này khắc phục được những trở
ngại của CSDL quan hệ. Ngôn ngữ truy vấn trong CSDL hướng đối tượng tương
tự như ngôn ngữ truy vấn trong CSDL quan hệ, tuy nhiên có sự khác nhau đó là
các đối tượng có cấu trúc lồng nhau. Một trường của đối tượng có thể chứa các
- 18 -


kiểu dữ liệu phức tạp khác, ví dụ như tập hợp hoặc danh sách. Ngôn ngữ truy
vấn trong CSDL hướng đối tượng cho phép truy xuất vào các kiểu này, ví dụ
truy vấn “ tìm tất cả các địa chỉ Url của tài liệu có tên tác giả là P?” . Rõ ràng
một tài liệu có thể ở trên nhiều địa chỉ Url , do đó trường Url phải là một kiểu
danh sách để lưu trữ các địa chỉ Url của tài liệu. Cụ thể truy vấn trên như sau:
SELECT struct (field : x.Url)
FROM

Document x

WHERE x.author= P
Nếu sử dụng CSDL quan hệ để mô tả đối tượng Document ta thấy có bất
lợi là phải lưu trữ nhiều mẩu tin để mô tả đầy đủ các địa chỉ Web của một tài
liệu.
Sự kết hợp của 2mô hình CSDL trên, đó là mô hình quan hệ-đối tượng.

theo mô hình này, ta sẽ duy trì một CSDL quan hệ và các thuộc tính trong CSDL
quan hệ này có thể là một đối tượng với các thuộc tính và phương thức riêng.
Dạng tổng quát của một mô hình quan hệ- đối tượng như sau: (A1 :T1, A2 :T2,…,
An :Tn) trong đó, Ai là một thuộc tính của quan hệ và Ti là một đối tượng nào đó
với các thuộc tính và phương thức riêng. Theo mô hình này, ta có thể mở rộng
mô hình quan hệ để quản lý được các dữ liệu phức tạp hơn. Xét ví dụ đã đề cập
ở trên, trong quan hệ Client, để dễ quản lý các khách hàng ta bổ sung vào quan
hệ này một thuộc tính mới đó là Pic mô tả ảnh của khách hàng. Dựa trên mô
hình quan hệ- đối tượng, quan hệ Client sẽ có lược dồ sau:
Client (Comp:String, Fname:String,Lname:String, AcountNum:Integer,
PhoneNum:Integer, StreetNum:Integer, StreetName:String, City:String, Pic:
Image), trong đó Image là một lớp đối tượng.

1.2.4. Phương pháp quản trị CSDL không gian
Có hai vấn đề về quản trị CSDL của GIS là quản trị dữ liệu không gian
(Spatial Data) và quản trị dữ liệu phi không gian (Non-Spatial Data). Đó là hai
mảng dữ liệu căn bản và không thể tách rời của một hệ thống GIS. Do vậy hệ
thống GIS phải giải quyết các vấn đề của một DBMS thông thường cho phần dữ
liệu phi không gian và thêm nữa phải giải quyết vấn đề quản trị dữ liệu không
gian. Sở dĩ phải chia ra làm hai như vậy vì quản trị dữ liệu không gian có những
đặc thù về lưu trữ, xử lý mà một DBMS thông dụng (như các hệ DBMS dùng
mô hình CSDL quan hệ làm nền tảng) thực tế không đảm đương nỗi.

- 19 -


Việc quản trị dữ liệu phi hình học thì các hệ GIS hiện nay lại không
“chuyên” lắm và cũng thừa nhận mô hình CSDL quan hệ là tốt nhất để giải
quyết vần đề này. GIS tự giải quyết không mạnh như các hệ quản trị CSDL như
My-SQL, SQL_server...nên một vài hệ GIS cũng có giải pháp “vay mượn” các

hệ DBMS thông qua các API mà các DBMS cung cấp. Sau đây là các phương
pháp mà các hệ thống GIS vận dụng để quản trị CSDL.
1.2.4.1. Mô hình Vector
Cấu trúc dữ liệu theo hướng đối tượng, một đối tượng địa lý được mô
phỏng bởi một vector tọa độ và thường được phân chia thành ba dạng cơ bản :
Điểm (point), đường (line), vùng (area).
* Kiểu đối tượng điểm (Points):
- Dữ liệu điểm là kiểu dữ liệu đơn giản của đối tượng không gian.
- Việc lựa chọn thực thể để biểu diễn nó như dữ liệu điểm phụ thuộc vào
tỷ lệ bản đồ.
- Tọa độ của điểm được lưu trữ như hai thuộc tính
- Các thông tin về tập điểm được xem như mở rộng của bảng thuộc tính:
+ Hàng chứa mọi thông tin về một điểm
+ Mỗi cột là một thuộc tính
+ Hai trong các cột là cặp tọa độ
- Các điểm là độc lập nhau, được biểu diễn bởi một hàng trong CSDL

Hình 1.12. Số liệu Vector được biểu thị dưới dạng điểm ( Point)
* Kiểu đối tượng đường (Lines hoặc Arcs)
Đường được xác định như một tập hợp dãy của các điểm, mô tả các đối
tượng địa lý dạng tuyến, có các đặc điểm sau:
- 20 -


- Là một dãy các cặp tọa độ
- Một đường bắt đầu và kết thúc bởi nút (node)
- Các đường nối với nhau và cắt nhau tại nút

Hình 1.13. Số liệu vector được biểu thị dưới dạng arc.
* Kiểu đối tượng vùng (area):

Vùng được xác định bởi ranh giới các đường thẳng, các đối tượng địa lý
có diện tích và đóng kín bởi một đường được gọi là đối tượng vùng, có các đặc
điểm sau:
- Vùng (area) được mô tả bằng tập các đường (arc) và điểm nhãn (label points).
- Một điểm nhãn nằm trong vùng để mô tả, xác định cho mỗi một vùng.

Hình 1.14. Số liệu vectơ được biểu diễn dưới dạng vùng
1.2.4.2. Mô hình Raster.
Mô hình dữ liệu raster (hay còn gọi là lưới tế bào) hình thành nền cho một
số hệ thông tin địa lý. Các hệ thống trên cơ sở raster hiển thị, định vị và lưu trữ
dữ liệu bản đồ nhờ sử dụng các ma trận hay lưới tế bào. Độ phân giải dữ liệu
raster phụ thuộc vào kích thước của tế bào hay điểm ảnh, chúng khác nhau từ

- 21 -


vài chục đêximet đến vài kilomet. Tiến trình xây dựng lưới tế bào được mô tả
sau đây:
Giả sử phủ một lưới lên tế bào gốc, dữ liệu raster được lập bằng cách mã
hóa mỗi tế bào bằng một giá trị dựa theo các đặc trưng trên bản đồ (hình 1.14),
trong ví dụ này đặc trưng đường được mã hóa là 2, đặc trưng điểm được mã hóa
là 1, đặc trưng vùng mã hóa là 3. Kiểu dữ liệu của tế bào trong lưới phụ thuộc
vào thực thể được mã hóa; ta có thể sử dụng số nguyên, số thực, ký tự hay tổ
hợp chúng để làm giá trị. Độ chính xác của mô hình này phụ thuộc vào kích
thước hay độ phân giải của các tế bào lưới. Một điểm có thể là một tế bào kề
nhau, một vùng là tập hợp nhiều tế bào. Mỗi đặc trưng là tập tế bào đánh số như
nhau (có cùng giá trị)
§iÓm
Vïng
§-êng


B¶n ®å
gèc

L-íi

Ma trËn
l-u tr÷
Hµng

Hình 1.15. Biểu diễn raster
* So sánh mô hình Raster và mô hình Vectơ
Bảng 1.1 là một vài so sánh hai mô hình thường được sử dụng trong GIS:
mô hình raster và mô hình vectơ, mỗi mô hình đều có ưu nhược điểm riêng.
Thực tế, các hệ thống GIS thị trường được xây dựng trên cơ sở mô hình vectơ
hay raster. Tuy nhiên nhiều hệ thống GIS được xây dựng trên cơ sở cả hai loại
mô hình này . Do vậy, tùy theo ứng dụng cụ thể để lựa chọn công cụ phần mềm
GIS cho phù hợp.

- 22 -


×