Tải bản đầy đủ (.pdf) (70 trang)

(Luận văn thạc sĩ) một số vấn đề về lưu trữ và chỉ mục trong cơ sở dữ liệu không gian luận văn ths công nghệ thông tin 60 48 05

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.8 MB, 70 trang )


MỤC LỤC
CÁC THUẬT NGỮ VÀ CÁC TỪ VIẾT TẮT ..................................................... 1
DANH MỤC CÁC BẢNG..................................................................................... 1
DANH MỤC CÁC HÌNH .................................................................................... 2
Chương 1. ............................................................................................................. 5
TỔNG QUAN VỀ HỆ THỐNG THÔNG TIN ĐỊA LÝ ..................................... 5
CƠ SỞ DỮ LIỆU KHÔNG GIAN ........................................................................ 5
1.1. Tổng quan về hệ thống thông tin địa lý (GIS) ........................................... 5
1.1.1. Khái niệm ............................................................................................... 5
1.1.2. Các thành phần của hệ thống thông tin địa lý ......................................... 7
1.1.2.1. Thiết bị (Hardware) ......................................................................... 7
1.1.2.2. Phần mềm ( Software) ..................................................................... 8
1.1.2.3. Con người (Person) .......................................................................... 9
1.1.2.4. Số liệu, dữ liệu địa lý (Geographic data) .......................................... 9
1.1.2.5. Chính sách và quản lý (Policy and management) ............................. 9
1.1.3. Các chức năng của hệ thống thông tin địa lý .......................................... 9
1.1.4. Ứng dụng của hệ thống thông tin địa lý ................................................ 11
1.2. Cơ sở dữ liệu không gian .......................................................................... 11
1.2.1. Tổ chức các mẩu tin trong tệp .............................................................. 12
1.2.2. Chỉ mục không gian (Spatial indexing ) ............................................... 15
1.2.3. Phương pháp quản trị CSDL phi không gian ........................................ 17
1.2.4. Phương pháp quản trị CSDL không gian .............................................. 19
1.2.4.1. Mơ hình Vector .............................................................................. 20
1.2.4.2. Mơ hình Raster. ............................................................................. 21
1.2.4.3. Mơ hình đồ thị (Topology)............................................................. 23
1.2.4.4. Sử dụng Mơ hình CSDL quan hệ .................................................. 23
để quản trị dữ liệu phi không gian ................................................... 23
1.2.5. Truy vấn không gian............................................................................. 25
1.2.6. Phân cụm trong CSDL không gian ....................................................... 26
Chương 2. ............................................................................................................ 28


MỘT SỐ KỸ THUẬT CHỈ MỤC VÀ TÌM KIẾM ........................................... 28
TRONG CƠ SỞ DỮ LIỆU KHÔNG GIAN ...................................................... 28
2.1. Mở đầu ...................................................................................................... 28
2.2. Cây k-d (k-d Trees) ................................................................................... 29
2.2.1. Cấu trúc nút .......................................................................................... 29
2.2.2. Chèn và tìm kiếm trong cây 2-d............................................................ 30
2.2.3. Huỷ bỏ trong cây 2-d ............................................................................ 33
2.2.4 Truy vấn khoảng trong cây 2-d .............................................................. 34
2.2.5. Cây k-d với k2 ................................................................................... 36
2.3. Cây tứ phân điểm (Point Quadtrees) ....................................................... 37
2.3.1. Chèn và tìm kiếm trong cây tứ phân điểm ............................................ 37
2.3.2. Thao tác xoá trên cây tứ phân điểm ...................................................... 39
2.3.3. Truy vấn khoảng trong cây tứ phân điểm ............................................ 41
- 67 -


2.4. Cây tứ phân matrix MX (MX-Quadtrees)............................................... 41
2.4.1. Chèn và tìm kiếm trong MX-Quadtree ................................................ 42
2.4.2. Thao tác xố trong MX-Quadtrees ....................................................... 44
2.4.3. Truy vấn khoảng trong MX-Quadtrees ................................................. 45
2.5. Cây R (R-Trees) ....................................................................................... 45
2.5.1. Chèn và tìm kiếm trong R-Trees........................................................... 46
2.5.2. Xoá trong cây R-Trees ......................................................................... 48
2.6. So sánh các cấu trúc dữ liệu ..................................................................... 49
Chương 3. ............................................................................................................ 51
CÀI ĐẶT VÀ THỬ NGHIỆM ............................................................................ 51
3.1. Bài toán...................................................................................................... 51
3.1.1. Phát biểu bài toán ................................................................................. 51
3.1.2. Cách giải quyết ..................................................................................... 51
3.2. Cơng cụ xây dựng chương trình ............................................................... 52

3.3. Dữ liệu xây dựng trong chương trình ...................................................... 52
3.4. Thiết kế đặc tả chức năng ......................................................................... 53
3.4.1. Chuyển đổi dữ liệu từ cấu trúc tuyến tính sang cấu trúc cây ................. 53
3.4.2. Lưu trữ sang cấu trúc cây ..................................................................... 53
3.4.3. Hiển thị bản đồ ..................................................................................... 53
3.4.4. Truy vấn trên bản đồ ............................................................................ 53
3.5. Cài đặt và thử nghiệm .............................................................................. 54
3.5.1. Cài đặt chương trình ............................................................................. 54
3.5.2. Kết quả thử nghiệm .............................................................................. 54
3.6. Nhận xét kết quả đạt được ....................................................................... 59
KẾT LUẬN .......................................................................................................... 60
TÀI LIỆU THAM KHẢO ................................................................................... 61
Tiếng Việt ......................................................................................................... 61
Tiếng Anh ......................................................................................................... 61
PHỤ LỤC A ......................................................................................................... 63

- 68 -


CÁC THUẬT NGỮ VÀ CÁC TỪ VIẾT TẮT
Ký hiệu/từ
viết tắt
API
CSDL
CPU
GIS
I/O
LAN
DBMS


Viết đầy đủ

Ý nghĩa

Application Programming Interface
Cơ sở dữ liệu
Central Process ing Unit
Geographic Information System
Input/Output
Local Area Network
Database Management System

Giao diện lập trình ứng dụng
Cơ sở dữ liệu
Đơn vị xử lý trung tâm
Hệ thống thông tin địa lý
Nhập/xuất
Mạng cục bộ
Hệ quản trị cơ sở dữ liệu

DANH MỤC CÁC BẢNG
Bảng 1.1. So sánh giữa mơ hình vectơ và mơ hình raster ..................................... 23
Bảng 2.1 Các trường hợp của phép chèn vào cây tứ phân điểm ............................ 40
Bảng 2.2. Mô tả bốn cành của nút N trong cây tứ phân MX ................................. 42
Bảng 3.1. Các nút lệnh trên thanh cơng cụ của chương trình ................................. 55

-1-


DANH MỤC CÁC HÌNH

Hình 1.1. Tầng bản đồ ............................................................................................ 6
Hình 1.2 Các hoạt động chính của GIS ................................................................... 6
Hình 1.3. Các hợp phần thiết yếu cho công nghệ GIS. ............................................ 7
Hình 1.4. Các thành phần thiết bị cơ bản của GIS .................................................. 7
Hình 1.5. Các nhóm chức năng trong GIS ............................................................ 10
Hình 1.6. Minh hoạ mơ hình hố .......................................................................... 11
Hình 1.7 Ánh xạ các mẩu tin từ Country, City và River vào các trang đĩa ............ 12
Hình 1.8. Tổ chức tệp có thứ tự cho bảng City ..................................................... 13
Hình 1.9. Tổ chức hàm băm cho bảng City .......................................................... 14
Hình 1.10. Chỉ mục phụ trên bảng City ................................................................ 16
Hình 1.11. Chỉ mục chính trên bảng City ............................................................. 16
Hình 1.12. Số liệu Vector được biểu thị dưới dạng điểm (Point) .......................... 20
Hình 1.13. Số liệu vector được biểu thị dưới dạng arc. ......................................... 21
Hình 1.14. Số liệu vectơ được biểu diễn dưới dạng vùng ..................................... 21
Hình 1.15. Biểu diễn raster ................................................................................... 22
Hình 1.16. Kiến trúc tích hợp của hệ GIS ............................................................. 25
Hình 1.17. Ví dụ về truy vấn điểm và truy vấn vùng ............................................ 26
Hình 2.1. Bản đồ mẫu để biểu diễn bởi các cấu trúc cây ....................................... 28
Hình 2.2. Lưới bản đồ với kích thước 64x64 ........................................................ 30
Hình 2.3. Trình tự chèn vào cây 2-d ..................................................................... 31
Hình 2.4. Mơ tả phép chèn cây k-d trên bản đồ .................................................... 32
Hình 2.5. Bản đồ mẫu để xây dựng cây tứ phân điểm ........................................... 38
Hình 2.6. Tiến trình chèn vào cây tứ phân điểm ................................................... 38
Hình 2.7. Mơ hình một cây tứ phân điểm ............................................................. 39
Hình 2.8. Trình tự chèn vào cây tứ phân MX ....................................................... 43
Hình 2.9. Mơ tả phép chèn điểm vào cây tứ phân MX .......................................... 44
Hình 2.10. Bản đồ mẫu mơ tả cách nhóm các hình chữ nhật minh họa cây R ....... 46
Hình 2.11. Trình tự chèn vào cây R ...................................................................... 47
Hình 2.12. Bản đồ mẫu mơ tả phép chèn trong cây R ........................................... 47
Hình 2.13. Bản đồ mẫu mơ tả phép chèn trong cây R ........................................... 48

Hình 2.14. Bản đồ mẫu mô tả phép chèn trong cây R ........................................... 48
Hình 2.15. Mơ tả phép xóa trong cây R ................................................................ 49
Hình 3.1. Mơ hình Use Case ................................................................................. 52
Hình 3.2. Giao diện chính của chương trình ......................................................... 54
Hình 3.3. Bảng đồ sau khi hiển thị cả lớp đường và lớp điểm. .............................. 56
Hình 3.4. Bảng đồ hiển lớp điểm .......................................................................... 56
Hình 3.5. Truy vấn vùng trên bản đồ lớp điểm ..................................................... 57
Hình 3.6. Kết quả của truy vấn trên hình 3.4 ........................................................ 57
Hình 3.7. Truy vấn vùng trên bản đồ tổng thể ...................................................... 58
Hình 3.8.Kết quả của truy vấn vùng trên bản đồ tổng thể ..................................... 58

-2-


MỞ ĐẦU
Thời gian gần đây, tại Việt Nam, các hệ thống thông tin địa lý –
Geographic Information System(GIS) đã bắt đầu quen thuộc và đã là nhu cầu
không thể thiếu đối với hầu hết các chuyên ngành từ địa chính, đo đạc trắc địa,
viễn thông cho đến du lịch, điện lực. Vì GIS được thiết kế như một hệ thống
chung để quản lý dữ liệu khơng gian, nó có rất nhiều ứng dụng trong việc phát
triển đô thị và môi trường tự nhiên như là: quy hoạch đô thị, quản lý nhân lực,
nơng nghiệp, điều hành hệ thống cơng ích, lộ trình, nhân khẩu, bản đồ, giám sát
vùng biển, cứu hoả và bệnh tật. …Trong phần lớn lĩnh vực này, GIS đóng vai
trị như là một cơng cụ hỗ trợ quyết định cho việc lập kế hoạch hoạt động môi
trường.
Tuy nhiên việc vận dụng, chọn lựa giải pháp GIS như thế nào cho phù
hợp đối với từng chuyên ngành với mỗi quy mô và mức độ phức tạp riêng cũng
như đáp ứng vừa đủ các yêu cầu cụ thể về GIS là điều không phải dễ dàng. Việc
chọn sai giải pháp GIS sẽ phải trả giá đắc cho những chi phí khơng đáng có hoặc
sự bế tắc về tính mở, tính dễ phát triển của hệ thống dữ liệu địa lý. Ngoài vấn đề

giá cả, yếu tố hàng đầu để chọn đúng giải pháp GIS là hiểu được chiến lược
quản trị cơ sở dữ liệu của các hệ GIS. Bởi vì thơng qua giải pháp quản trị CSDL
của mỗi hệ GIS, chúng ta sẽ nắm rõ năng lực, yêu cầu cần thiết phải có của một
hệ GIS như quản trị thông tin, xử lý thông tin GIS, cũng như khả năng mở, dễ
phát triển, tính phổ dụng của hệ thống dữ liệu, từ đó sẽ có cách chọn lựa đúng
đắn tối ưu khi sử dụng GIS vào các dự án, công việc cụ thể.
Cấu trúc dữ liệu thể hiện bản chất rõ nhất của nó hệ thống GIS. Biết được
giải pháp quản trị CSDL của các hệ GIS là vấn đề then chốt nhất, hệ thống nhất
để có thể ứng dụng GIS một cách hiệu quả và thuận tiện phát triển mở rộng.
Hiện nay các ràng buộc yêu cầu khi quyết định sử dụng một hệ thống GIS nào
đó chủ yếu dựa vào:
- Năng lực lưu trữ, khai thác mạnh: hệ thống dữ liệu có thể quản trị dữ
liệu lớn, truy xuất nhanh, nhiều tiện ích giải thuật.
- Tính khai thác, sử dụng rộng rãi: dữ liệu có thể được hỗ trợ khai thác
hiệu quả với nhiều tính năng trên nhiều phương diện ví dụ có thể sử dụng trên
máy tính cá nhân hoặc khai thác qua mạng LAN, Internet.
- Tính mở, tính tương thích, tính phổ biến của hệ thống dữ liệu: cấu trúc
dữ liệu có tính mở có thể liên kết với các hệ thống dữ liệu khác và có thể phát

-3-


triển mở rộng được, hệ thống dữ liệu có khả năng dễ dàng tích hợp dữ liệu từ
những hệ thống khác.
- Tính dễ dàng tạo lập chuyên biệt và tích hợp-tách rời: cấu trúc dữ liệu có
thể dễ dàng tạo lập riêng phù hợp với mục đích sử dụng chuyên biệt dễ dàng tích
hợp và tách rời.
- Giá cả và khả năng triển khai dự án GIS thông suốt.
Tất các các yếu tố này đều nói lên điểm mạnh yếu về giải pháp quản trị
CSDL của mỗi hệ GIS, vì vậy việc khảo sát giải pháp quản trị CSDL của các hệ

GIS sẽ giúp ta đưa ra các quyết định đúng về việc ứng dụng sao cho phù hợp với
mỗi nhu cầu thực tế. Có thể nói cấu trúc dữ liệu là phần khung và bản chất nhất
của các hệ thống GIS, nó là cơ sở của các giải thuật GIS cũng như nói đến khả
năng lưu trữ, khai thác, phát triển hệ thống dữ liệu. Xuất phát từ thực tế Tôi
chọn đề tài “ Một số vấn đề lưu trữ và chỉ mục trong cơ sở dữ liệu không gian”.
Trong khn khổ một luận văn, tơi trình bày một số vấn đề cơ bản về hệ
thống thông tin địa lý (GIS), hệ quản trị CSDL không gian chẳng hạn các khái
niệm, kiến trúc hệ thống, các mơ hình dữ liệu khơng gian. Trong đó, tập trung
nghiên cứu và cài đặt thử nghiệm một số cấu trúc lưu trữ dữ liệu không gian.
Bố cục của luận văn bao gồm phần mở đầu, phần kết luận và ba chương
nội dung được tổ chức như sau:
Chương 1: Tổng quan về hệ thống thông tin địa lý (GIS) - Cơ sở dữ liệu khơng gian
Chương này trình bày tổng quan về hệ thống thơng tin địa lý: định nghĩa
hình thức về hệ thống thông tin địa lý, các thành phần, chức năng và các ứng
dụng của hệ thống thông tin địa lý. Cơ sở dữ liệu không gian bao gồm: chỉ mục
không gian, truy vấn không gian, phương pháp quản trị CSDL phi khơng gian
và khơng gian, trong đó gồm các mơ hình Vector, Raster, Topology
Chương 2: Một số kỹ thuật chỉ mục và tìm kiếm trong CSDL khơng gian
Chương này mơ tả cấu trúc, các phép toán chèn, xoá, duyệt, truy vấn trên
các kỹ thuật chỉ mục và tìm kiếm khơng gian như: cây k-d(k-d tree), cây tứ
phân(Quadtree), cây R (R tree) và so sánh giữa chúng
Chương 3: Cài đặt và thử nghiệm
Cài đặt thử nghiệm kỹ thuật chỉ mục và tìm kiếm khơng gian:cây tứ phân điểm.
Chương trình được cài đặt từ cơ sở dữ liệu đã có định dạng bằng
Shapefile, với ngơn ngữ lập trình C#.NET cùng với thư viện hỗ trợ SharpMap.

-4-


Chương 1.

TỔNG QUAN VỀ HỆ THỐNG THÔNG TIN ĐỊA LÝ
– CƠ SỞ DỮ LIỆU KHÔNG GIAN
1.1. Tổng quan về hệ thống thông tin địa lý (GIS)
1.1.1. Khái niệm
Hệ thống thông tin địa lý - Geographic Information System (GIS) là một
nhánh của cơng nghệ thơng tin, đã hình thành từ những năm 60 của thế kỷ trước
và phát triển rất mạnh trong những năm gần đây.
GIS được sử dụng nhằm xử lý đồng bộ các lớp thông tin không gian (bản
đồ) gắn với các thơng tin thuộc tính, phục vụ nghiên cứu, quy hoạch và quản lý
các hoạt động theo lãnh thổ.
Ngày nay, ở nhiều quốc gia trên thế giới, GIS đã trở thành công cụ trợ
giúp quyết định trong hầu hết các hoạt động kinh tế-xã hội, an ninh, quốc phịng,
đối phó với thảm hoạ thiên tai v.v... GIS có khả năng trợ giúp các cơ quan chính
phủ, các nhà quản lý, các doanh nghiệp, các cá nhân v.v... đánh giá được hiện
trạng của các quá trình, các thực thể tự nhiên, kinh tế-xã hội thông qua các chức
năng thu thập, quản lý, truy vấn, phân tích và tích hợp các thông tin được gắn
với một nền bản đồ số nhất quán trên cơ sở toạ độ của các dữ liệu bản đồ đầu
vào.
Có nhiều định nghĩa về GIS, nhưng nói chung đã thống nhất quan niệm
chung: GIS là một hệ thống kết hợp giữa con người và hệ thống máy tính cùng
các thiết bị ngoại vi để lưu trữ, xử lý, phân tích, hiển thị các thơng tin địa lý
nhằm phục vụ mục đích nghiên cứu, quản lý nhất định.
Xét dưới góc độ là cơng cụ, GIS dùng để thu thập, lưu trữ, biến đổi, hiển
thị các thông tin khơng gian nhằm thực hiện các mục đích cụ thể.
Xét dưới góc độ là phần mềm, GIS làm việc với các thông tin không
gian, phi không gian, thiết lập quan hệ khơng gian giữa các đối tượng. Có thể
nói các chức năng phân tích khơng gian đã tạo ra diện mạo riêng cho GIS.
Xét dưới góc độ ứng dụng trong quản lý nhà nước, GIS có thể được hiểu
như là một cơng nghệ xử lý các dữ liệu có toạ độ để biến chúng thành các thông
tin trợ giúp quyết định phục vụ các nhà quản lý.

Xét dưới góc độ hệ thống, GIS là hệ thống gồm các hợp phần: Phần cứng,
Phần mềm, Cơ sở dữ liệu và Cơ sở tri thức chuyên gia.
-5-


Tầng Biên
hành chính
Tầng Khách hàng
Tầng Đ-ờng quốc lộ
Tầng Nhà ở
hố

Hỡnh 1.1. Tầng bản đồ
GIS lưu trữ thông tin thế giới thực thành các tầng (layer) bản đồ chuyên
đề mà chúng có khả năng liên kết địa lý với nhau. Giả sử ta có vùng quan sát
như hình 1.1, mỗi nhóm người sử dụng sẽ quan tâm nhiều hơn đến một hay vài
loại thơng tin. Ví dụ, Sở giao thơng cơng chính sẽ quan tâm nhiều đến hệ thống
đường phố, sở Nhà đất quan tâm nhiều đến các khu dân cư và công sở, sở
Thương mại quan tâm nhiều đến phân bố khách hàng trong vùng. Tư tưởng tách
bản đồ thành tầng tuy đơn giản nhưng khá mềm dẻo và hiệu quả, chúng cho khả
năng giải quyết rất nhiều vấn đề về thế giới thực, từ theo dõi điều hành xe cộ
giao thông, đến các ứng dụng lập kế hoạch và mơ hình hóa lưu thơng. Ta có thể
sử dụng tiến trình tự động , gọi là mã hóa địa lý (geocoding) để liên kết dữ liệu
bên ngoài với dữ liệu bản đồ. Ví dụ, sử dụng mã hóa địa lý để ánh xạ thông tin
bán hàng bằng mã bưu điện (ZIP) hay chỉ ra địa chỉ khách hàng trên bản bng
cỏc im[1].
Đo đạc

Giám sát


Lập bản đồ

t1

t2
t3
Mô hình hóa
Dân cKhí hậu
Cây trồng
Thuỷ lợi
Hệ thông tin địa lý

Hỡnh 1.2 Cỏc hot động chính của GIS
-6-


1.1.2. Các thành phần của hệ thống thông tin địa lý
Công nghệ GIS gồm 5 hợp phần cơ bản là:
- Thiết bị (Hardware)
- Phần mềm (Software).
- Số liệu (Geographic data)
- Con người (Person)
- Chính sách và cách thức quản lý (Policy and Management)

CON NGƯỜI

Hình 1.3. Các hợp phần thiết yếu cho công nghệ GIS.
1.1.2.1. Thiết bị (Hardware)
Bao gồm máy vi tính (computer), máy vẽ (plotter), máy in (printer), bàn
số hóa (digitizer), thiết bị quét ảnh (scaner), các phương tiện lưu trữ số liệu

(Floppy diskettes,optical cartridges, CD ROM. . .)

Hình 1.4. Các thành phần thiết bị cơ bản của GIS
-7-


1.1.2.2. Phần mềm (Software)
Phần mềm là tập hợp các câu lệnh, chỉ thị nhằm điều khiển phần cứng
của máy tính thực hiện một nhiệm vụ xác định, phần mềm hệ thống thơng tin địa
lý có thể là một hoặc tổ hợp các phần mềm máy tính. Phần mềm được sử dụng
trong kỹ thuật GIS phải bao gồm các tính năng cơ bản sau:
- Nhập và kiểm tra dữ liệu (Data input): bao gồm tất cả các khía cạnh về
biến đổi dữ liệu đã ở dạng bản đồ, trong lĩnh vực quan sát vào một dạng số
tương thích.
- Lưu trữ và quản lý cơ sở dữ liệu (Storage and management database):
lưu trữ và quản lý cơ sở dữ liệu đề cập đến phương pháp kết nối thơng tin vị trí
(topology) và thơng tin thuộc tính (attributes) của các đối tượng địa lý (điểm,
đường đại diện cho các đối tượng trên bề mặt trái đất). Hai thông tin này được tổ
chức và liên hệ qua các thao tác trên máy tính và sao cho chúng lĩnh hội được
người sử dụng hệ thống.
- Xuất dữ liệu (Display and reporting): dữ liệu đưa ra là các báo cáo kết
quả q trình phân tích tới người sử dụng, có thể bao gồm các dạng: bản đồ (MAP),
bảng biểu (TABLE), biểu đồ, lưu đồ (FIGURE) được thể hiện trên máy tính,
máy in, máy vẽ.
- Biến đổi dữ liệu (Data transformation): biến đổi dữ liệu gồm hai lớp
điều hành nhằm mục đích khắc phục lỗi từ dữ liệu và cập nhật chúng.
- Tương tác với người dùng (Query input): giao tiếp với người dùng là
yếu tố quan trọng nhất của bất kỳ hệ thống thông tin nào. Các giao diện người
dùng ở một hệ thống thông tin được thiết kế phụ thuộc vào mục đích của ứng
dụng đó.

Các phần mềm tiêu chuẩn và sử dụng phổ biến hiện nay trong khu vực Châu Á là:
ARC/INFO, MAPINFOR, IL WIS, WINGIS, SPANS, IDRISIW,....Hiện nay có rất nhiều
phần mềm máy tính chuyên biệt cho GIS, bao gồm các phần mềm sau:
+ Phần mềm dùng cho lưu trữ, xử lý số liệu thông tin địa lý: ACR/INFO,
SPAN, ERDAS-Imagine, IL WIS, MGE/MICROSTATION, IDRISIW..
+ Phần mềm dùng cho lưu trữ, xử lý và quản lý các thông tin địa lý: ERMAPPER, ATLASGIS, ARCVIEW, MAPINFO...

-8-


1.1.2.3. Con người (Person)
Con người bao gồm: người sử dụng hệ thống (system user), thao tác viên
hệ thống (system operator), nhà cung cấp GIS (GIS supplier), nhà cung cấp dữ
liệu (data supplier), người phát triển ứng dụng (application developer), chuyên
viên phân tích hệ thống GIS (GIS system analysts)
1.1.2.4. Số liệu, dữ liệu địa lý (Geographic data)
Số liệu được sử dụng trong GIS không chỉ là số liệu địa lý riêng lẽ mà còn
được thiết kế trong một cơ sở dữ liệu. Những thông tin địa lý bao gồm những dữ
kiện về: vị trí địa lý, thuộc tính, mối liên hệ khơng gian của các thơng tin và thời
gian. Có 2 dạng số liệu được sử dụng trong kỹ thuật GIS là:
- Cơ sở dữ liệu bản đồ: là những mô tả hình ảnh bản đồ được số hóa theo
một khn dạng nhất định mà máy tính hiểu được. Hệ thống thông tin địa lý
dùng cơ sở dữ liệu này để xuất ra các bản đồ trên màn hình hoặc ra các thiết bị
ngoại vi khác như máy in, máy vẽ.
+ Số liệu vector: được hiển thị dưới dạng điểm, đường và vùng, mỗi dạng
có liên quan đến 1 số liệu thuộc tính được lưu trữ trong cơ sở dữ liệu.
+ Số liệu raster: được thể hiện dưới dạng lưới ô vuông hay ô chữ nhật đều
nhau, giá trị được ấn định cho mỗi ô sẽ chỉ định giá trị của thuộc tính. Số liệu
của ảnh vệ tinh và số liệu của bản đồ được quét là các loại số liệu raster.
- Số liệu thuộc tính: được hiển thị dưới dạng ký hiệu hoặc số để mơ tả các

thuộc tính của các thông tin thuộc về địa lý.
Trong các dạng số liệu trên thì số liệu dạng vector là dạng thường sử dụng
nhất, tuy nhiên số liệu raster rất hữu ích để mơ tả các dãy số liệu có tính liên tục
như: nhiệt độ, cao độ,...và thực hiện các phân tích khơng gian của số liệu. Cịn
số liệu thuộc tính dùng để mơ tả cơ sở dữ liệu.
1.1.2.5. Chính sách và quản lý (Policy and management)
Đây là hợp phần quan trọng để đảm bảo khả năng hoạt động của hệ thống,
là yếu tố quyết định sự thành công của việc phát triển công nghệ GIS. Hệ thống
GIS cần được điều hành bởi bộ phận quản lý. Bộ phận này phải được bổ nhiệm
để tổ chức hoạt động hệ thống GIS một cách có hiệu quả để phục vụ người sử
dụng thơng tin.

1.1.3. Các chức năng của hệ thống thông tin địa lý
Các chức năng của GIS được chia thành 5 loại sau:
-9-


- Thu thập dữ liệu
- Xử lý sơ bộ dữ liệu
- Lưu trữ và truy cập dữ liệu
- Tìm kiếm và phân tích khơng gian
- Hiển thị đồ họa và tương tác
Sức mạnh của các chức năng của hệ thống GIS khác nhau là khác nhau.
Kỹ thuật xây dựng các chức năng trên cũng khác nhau. Hình 1.5 mơ tả quan hệ
giữa các nhóm chức năng và cách biểu diễn thông tin khác nhau của GIS.
Chức năng thu thập dữ liệu tạo ra dữ liệu từ các quan sát hiện tượng thế
giới thực và từ các tài liệu, bản đồ giấy, đơi khi chúng có sẵn dưới dạng số. Kết
quả ta có tập dữ liệu thơ, có nghĩa là dữ liệu này không được phép áp dụng trực
tiếp cho chức năng truy nhập và phân tích của hệ thống. Chức năng xử lý sơ bộ
dữ liệu sẽ biến đổi dữ liệu thơ thành dữ liệu có cấu trúc để sử dụng trực tiếp các

chức năng tìm kiếm và phân tích khơng gian. Kết quả tìm kiếm và phân tích
được xem như diễn giải dữ liệu, đó là tổ hợp hay biến đổi đặc biệt của dữ liệu có
cấu trúc. Hệ thống GIS phải có phần mềm cơng cụ để tổ chức và lưu trữ các loại
dữ liệu khác nhau từ dữ liệu thô đến dữ liệu diễn giải. Phần mềm cơng cụ này
phải có các thao tác lưu trữ, truy nhập; đồng thời có khả năng hiển thị , tương tỏc
ha vi tt c loi d liu.
Hiện t-ợng
quan sát

Tài liệu và
bản đồ giấy

Thu thập
dữ liệu
Dữ liệu
thô

CSDL

L-u trữ và
khai thác

Xử lý sơ
bộ dữ liệu

Hiển thị và
t-ơng tác

Dữ liệu có
cấu trúc

Tìm kiếm và
phân tích

Diễn giải

Hỡnh 1.5. Cỏc nhúm chc nng trong GIS
- 10 -

Thiết bị
đồ họa


1.1.4. Ứng dụng của hệ thống thông tin địa lý
- Quản lý và lập kế hoạch mạng lưới đường phố: bao gồm các chức năng
tìm kiếm địa chỉ, tìm vị trí khi biết trước địa chỉ đường phố; điều khiển đường
đi, lập kế hoạch lưu thơng xe cộ; phân tích vị trí, chọn địa điểm xây dựng các
cơng trình cơng cộng; lập kế hoạch phát triển đường giao thông.
- Giám sát tài nguyên, thiên nhiên, môi trường: bao gồm các chức năng
quản lý sơng ngịi, các vùng lũ lụt, vùng đất nơng nghiệp, có rừng, sống hoang
dã; phân tích tác động mơi trường; vị trí của các cơng trình cơng cộng,…
- Quản lý đất đai: bao gồm các chức năng lập kế hoạch vùng, miền sử
dụng đất; quản lý nước tưới tiêu; kiến trúc mặt bằng sử dụng đất…
- Quản lý và lập kế hoạch các dịch vụ công cộng: bao gồm các chức năng
tìm địa điểm cho các cơng trình ngầm: ống dẫn, đường điện…; cân đối tải diện;
lập kế hoạch bảo dưỡng các cơng trình cơng cộng…
- Phân tích tổng điều tra dân số, lập bản đồ các dịch vụ y tế, bưu điện và
nhiều ứng dụng trong các lĩnh vực khác.

1.2. Cơ sở dữ liệu không gian
Con người phải lập mơ hình của hiện thực mà mơ hình này tương tự với

một số khía cạnh chọn lọc từ thế giới thực. Mơ hình là mơ tả đầy đủ hệ thống từ
một góc nhìn cụ thể và được hình thành nhờ tiến trình trừu tượng hóa (đơn giản
hóa thơng minh)[1]. Cơ sở dữ liệu khơng gian hình thành từ các mơ hình mơ tả
trạng thái và bản chất của hiện thực (hình 1.6).

Hình 1.6. Minh hoạ mơ hình hố
* Định nghĩa CSDL khơng gian:
Cơ sở dữ liệu khơng gian là tập hợp dữ liệu tham chiếu không gian, có
vai trị như mơ hình của hiện thực:

- 11 -


+ CSDL là mơ hình hiện thực theo nghĩa nó biểu diễn tập lựa chọn hay
xấp xỉ các hiện tượng
+ Các hiện tượng lựa chọn này được xem là quan trọng, đủ để biểu
diễn đặc trưng dưới dạng số cho hiện tại, quá khứ và tương lai.

1.2.1. Tổ chức các mẩu tin trong tệp
Dữ liệu trên đĩa được tổ chức thành: trường (field), mẩu tin (record), tệp
(file). Trong đó, trường mơ tả đặc tính hoặc thuộc tính của một quan hệ hoặc
một thực thể. Mẩu tin mô tả một hàng (row) trong một bảng quan hệ, tập hợp
của những trường cho những thuộc tính trong mơ hình quan hệ của bảng. Những
tệp là tập hợp của những mẩu tin có thể được mô tả một quan hệ, những tập hợp
khác có thể là sự kết hợp của những quan hệ liên quan.

Hình 1.7 Ánh xạ các mẩu tin từ Country, City và River vào các trang đĩa
Làm thế nào để biểu diễn các mẩu tin trong một cấu trúc tệp. Một thể hiện
của một quan hệ là một tập hợp các mẩu tin. Cho một tập hợp các mẩu tin, vấn
đề đặt ra là làm thế nào để tổ chức chúng trong một tệp. Có một số cách tổ chức

sau:
• Tổ chức tệp đống (Heap File Organization): trong cách tổ chức này, một
mẩu tin bất kỳ có thể được lưu trữ ở bất kỳ nơi nào trong tệp, ở đó có khơng
gian cho nó, khơng có thứ tự nào giữa các mẩu tin. Một tệp cho một quan hệ,
những mẩu tin trong tệp Heap không theo một trật tự riêng biệt nào ( ví dụ tệp
Heap là bảng River trong hình 1.6). Đối với cấu trúc tệp khơng có thứ tự thì
- 12 -


khơng phù hợp với u cầu như tìm kiếm một mẩu tin với một khóa đã cho
(chẳn hạn name ) đòi hỏi phải quét các mẩu tin trong tệp, trường hợp xấu nhất
tất cả những mẩu tin phải được kiểm tra bằng việc kiểm tra tất cả những trang
đĩa chứa dữ liệu cho tệp, nhưng nó phù hợp với phép chèn, đơn giản chỉ thêm
vào một mẩu tin mới ở cuối tệp.
• Tổ chức tệp tuần tự (Sequential File Organization): trong cách tổ chức
này, các mẩu tin được lưu trữ theo thứ tự tuần tự, dựa trên giá trị của khố tìm
kiếm của mỗi mẩu tin.
Tổ chức tệp tuần tự được thiết kế để xử lý hiệu quả các mẩu tin trong thứ
tự được sắp dựa trên một khố tìm kiếm (search key) nào đó. Để cho phép tìm
lại nhanh chóng các mẩu tin theo thứ tự khố tìm kiếm, ta "xích" các mẩu tin lại
bởi các con trỏ. Con trỏ trong mỗi mẩu tin trỏ tới mẩu tin kế tiếp theo thứ tự
khố tìm kiếm. Hơn nữa, để tối ưu hoá số khối truy xuất trong xử lý tệp tuần tự,
ta lưu trữ vật lý các mẩu tin theo thứ tự khố tìm kiếm.
Tổ chức tệp tuần tự cho phép đọc các mẩu tin theo thứ tự được sắp mà nó
có thể hữu dụng cho mục đích trình bày cũng như cho các thuật toán xử lý truy
vấn (query-processing algorithms).
Tệp có thứ tự tổ chức những mẩu tin bằng việc sắp xếp chúng dựa vào
trường khóa đã cho, ví dụ hình 1.7 hiển thị một tệp sắp xếp được tổ chức những
mẩu tin trong bảng City với trường khóa sắp xếp City name


Hình 1.8. Tổ chức tệp có thứ tự cho bảng City
• Tổ chức tệp băm (Hashed File Organization): trong cách tổ chức này, có
một hàm băm được tính tốn trên thuộc tính nào đó của mẩu tin. Kết quả của
hàm băm xác định mẩu tin được bố trí trong khối nào trong tệp. Cách tổ chức
này liên hệ chặt chẽ với cấu trúc chỉ mục.

- 13 -


Tệp băm được tổ chức chia những mẩu tin thành một tập những thùng
(buckets), sử dụng một hàm gọi là hàm băm (hashed fuction ), hàm băm ánh xạ
những giá trị trên một trường khóa được chọn (ví dụ: City name), trong hình 1.8
hiển thị một hàm băm với 4 thùng (bucket), mỗi thùng được lưu trữ vào một
trang đĩa khác nhau, hàm băm trả về giá trị 1 với những tên có độ dài nhỏ hơn
hoặc bằng 6 ký tự, 2 cho những tên có độ dài 7 hoặc 8 ký tự, 3 cho những tên có
độ dài 9 hoặc 10 ký tự và 4 cho những tên có độ dài lớn hơn 11 ký tự. Tên thành
phố được ánh xạ vào những thùng (bucket) từ 1 đến 4 qua hàm băm.

Hình 1.9. Tổ chức hàm băm cho bảng City
• Tổ chức tệp cụm (Clustering File Organization): trong cách tổ chức này,
các mẩu tin của một vài quan hệ khác nhau có thể được lưu trữ trong cùng một
tệp. Các mẩu tin có mối liên hệ của các quan hệ khác nhau được lưu trữ trên
cùng một khối sao cho mỗi hoạt động I/O đem lại các mẩu tin có mối liên hệ từ
tất cả các quan hệ.
Để thấy những điểm lợi của việc lưu trữ nhiều quan hệ trong cùng một
tệp, ta xét truy vấn SQL sau:
SELECT Account_Number,Customer_Number, Customer_Street,
ustomer_City
FROM Depositor, Customer
WHERE Depositor.Customer_Name = Customer.Customer_name;


- 14 -


Truy vấn này tính một phép nối của các quan hệ Depositor và Customer.
Như vậy, đối với mỗi bộ của Depositor, hệ thống phải tìm bộ của Customer có
cùng giá trị Customer_Name. Một cách lý tưởng là việc tìm kiếm các mẩu tin
này nhờ sự trợ giúp của chỉ mục. Bỏ qua việc tìm kiếm các mẩu tin như thế nào,
ta chú ý vào việc truyền từ đĩa vào bộ nhớ. Trong trường hợp xấu nhất, mỗi mẩu
tin ở trong một khối khác nhau, điều này buộc ta phải đọc một khối cho một
mẩu tin được yêu cầu bởi truy vấn. Ta sẽ trình bày một cấu trúc tệp được thiết
kế để thực hiện hiệu quả các truy vấn liên quan đến Depositor.Customer. Các bộ
Depositor đối với mỗi Customer_Name được lưu trữ gần bộ Customer có cùng
Customer_Name. Cấu trúc này trộn các bộ của hai quan hệ với nhau, nhưng cho
phép xử lý hiệu quả phép nối. Khi một bộ của quan hệ Customer được đọc, toàn
bộ khối chứa bộ này được đọc từ đĩa vào trong bộ nhớ chính. Do các bộ tương
ứng của Depositor được lưu trữ trên đĩa gần bộ Customer, khối chứa bộ
Customer chứa các bộ của quan hệ Depositor cần cho xử lý truy vấn. Nếu một
Customer có nhiều Account đến nỗi các mẩu tin Depositor khơng lấp đầy trong
một khối, các mẩu tin cịn lại xuất hiện trong khối kế cận. Cấu trúc tệp này, được
gọi là gom cụm (clustering), cho phép ta đọc nhiều mẩu tin được yêu cầu chỉ sử
dụng một đọc khối, như vậy ta có thể xử lý truy vấn đặc biệt này hiệu quả hơn.
Tuy nhiên, cấu trúc tệp gom cụm trên lại tỏ ra khơng có lợi bằng tổ chức
lưu mỗi quan hệ trong một tệp riêng, đối với một số truy vấn, chẳng hạn:
SELECT *
FROM Customer
Việc xác định khi nào thì gom cụm thường phụ thuộc vào kiểu truy vấn
mà người thiết kế CSDL nghĩ rằng nó xảy ra thường xuyên nhất. Sử dụng thận
trọng gom cụm có thể cải thiện hiệu năng đáng kể trong việc xử lý truy vấn.


1.2.2. Chỉ mục không gian (Spatial indexing )
Tệp chỉ mục là tệp bổ trợ để cải tiến việc tìm kiếm. Mỗi bản ghi trong tệp
chỉ mục chỉ có 2 trường: giá trị khóa, địa chỉ của những trang trong tệp dữ liệu,
những bản ghi trong tệp chỉ mục thường có thứ tự, có thể sử dụng thứ tự khơng
gian và có thể tổ chức những cấu trúc dữ liệu để sử dụng tìm kiếm riêng như: B
tree, R tree, tệp lưới,...(hình 1.9 hiển thị một tệp chỉ mục phụ của bảng City trên
tên trường khóa)

- 15 -


Hình 1.10. Chỉ mục phụ trên bảng City
Nếu các bản ghi trong tệp dữ liệu được sắp xếp bởi trường khóa thì chỉ
mục chỉ cần giữ giá trị trường khóa đầu tiên cho mỗi trang đĩa của tệp dữ liệu
(hình 1.10 là một loại chỉ mục chính (primary index))

Hình 1.11. Chỉ mục chính trên bảng City
Một cấu trúc chỉ mục không gian tổ chức những đối tượng với một tập
những thùng (bucket) thông thường những thùng này tương ứng với những trang
trong bộ nhớ phụ (second memory), mỗi thùng (bucket) có một liên kết vùng,
một phần của khơng gian chứa tất cả những đối tượng lưu trữ trong thùng
(bucket), những vùng thường là những hình chữ nhật đối với những cấu trúc dữ
liệu điểm, những vùng này thường rời rạc và chúng chia cắt khơng gian và chính
vì vậy mỗi điểm có liên quan chính xác đến một thùng (bucket), đối với một vài
cấu trúc dữ liệu hình chữ nhật những vùng có thể chồng lên nhau.
- 16 -


Có 2 lợi ích cơ bản của chỉ mục khơng gian:
1. Cấu trúc dữ liệu khơng gian ngồi được thêm vào hệ thống, cung cấp

những thuộc tính khơng gian cây B (B tree) cho những thuộc tính tuyến tính.
2. Những đối tượng không gian được ánh xạ vào không gian một chiều 1D, sử dụng một trật tự không gian (ví dụ: trật tự Z, trật tự Hilbert), vì vậy chúng
được lưu trữ trong một chỉ mục chuẩn 1-D như cây B (B tree)
Chỉ mục không gian giống như bất kỳ chỉ mục khác cung cấp một cơ chế
để giới hạn tìm kiếm, nhưng trong trường hợp này cơ chế dựa vào tiêu chuẩn
không gian như sự giao nhau và chứa đựng nhau. Một chỉ mục khơng gian cần:
- Tìm những đối tượng trong khoảng một không gian dữ liệu chỉ mục mà
nó tương tác với một điểm đã cho hoặc một vùng quan tâm (truy vấn vùng)
- Tìm những cặp đối tượng từ khoảng 2 không gian dữ liệu chỉ mục mà
chúng tương tác không gian với mỗi trong chúng (kết nối không gian).
Chỉ mục không gian được sử dụng bởi những cơ sở dữ liệu không gian để
tối ưu truy vấn không gian. Những phương pháp chỉ mục không gian phổ biến
bao gồm: lưới (Grid), cây tứ phân (Quadtree), Cây R (R tree), cây kd (k-d tree),
Octree, UB tree. Các chỉ mục này được mô tả chi tiết trong chương 2.

1.2.3. Phương pháp quản trị CSDL phi không gian
Các hệ thống quản trị cơ sở dữ liệu thông dụng như SQL_Server, Oracle,
My_SQL thực tế đã không quản trị thích hợp dữ liệu dạng hình học (dữ liệu địa
lý). Một trong những lý do là các DBMS này thường dùng mơ hình dữ liệu quan
hệ và đặt nặng vào giải quyết các vấn đề của mơ hình CSDL quan hệ. Trên thực
tế các DBMS này không phục vụ tốt cho việc quản trị, khai thác dữ liệu không
gian.
Định nghĩa một cách khơng hình thức CSDL quan hệ là một bảng gồm
các cột và các hàng, mỗi hàng được gọi là một bộ, mỗi cột được gọi là một
thuộc tính, mỗi thuộc tính phải có một kiểu dữ liệu duy nhất. Một ví dụ về
CSDL quan hệ có tên là Client lưu trữ các thông tin khách hàng của một ngân
hàng nào đó. Lược đồ chi tiết như sau: Client(Comp, Fname, Lname,
AcountNum, PhoneNum, treetNum, StreetName, City), trong đó các thuộc tính
Comp, Fname, Lname, StreetName, City) có kiểu dữ liệu là kiểu chuỗi mô tả tên
công ty, họ tên khách hàng, tên đường, thành phố tương ứng. AcountNum,

PhoneNum, StreetNum có kiểu là số nguyên dương mô tả tài khoản, số điện
thọai cá nhân và số nhà tương ứng của khách hàng. Thao tác truy vấn trong
- 17 -


CSDL quan hệ thường dùng các công cụ như SQL hoặc đại số quan hệ. Một truy
vấn thông thường trong SQL là:
SELECT A1, A2,….,An
FROM R1, R2,….,Rk
WHERE F
Ý nghĩa của truy vấn trên là chọn những giá trị của các thuộc tính A1,
A2,….,An trong quan hệ R1, R2,….,Rk với điều kiện F cho trước. Trong ví dụ mơ
tả ở trên, giả sử ta muốn biết số điện thoại của một khách hàng có tên “ John
Smith”, khi đó truy vấn trong SQL có thể như sau:
SELECT PhoneNum
FROM

Client

WHERE Fname=”John” and Lname= “Smith”.
Mơ hình dữ liệu quan hệ được sử dụng rộng rãi trong các ứng dụng hiện
nay. Tuy nhiên CSDL quan hệ gặp phải một số trở ngại cụ thể là:
- Dữ liệu được tổ chức dưới dạng các bộ quan hệ và các bộ với các trường
khó phản ảnh được các cấu trúc dữ liệu phức tạp.
- Cơ chế quan hệ trên là một quan hệ tĩnh, khơng có cách để thay đổi số
lượng các thuộc tính trong quan hệ.
- Mỗi quan hệ nội dung giữa một bảng này với một bảng khác phải được
mã hóa một cách rõ ràng thơng qua cách sử dụng của cấu trúc, ví dụ các ràng
buộc nhất quán.
Để khắc phục những nhược điểm trên, ta sử dụng CSDL hướng đối tượng.

Trong CSDL này, các thuộc tính được biểu diễn như các đối tượng độc lập, tập
hợp các đối tượng có tính chất giống nhau được gọi là lớp, bên trong lớp ta có
thể định nghĩa các thuộc tính và các thao tác trên đối tượng, các thao tác này gọi
là các phương thức. Một ưu đểm rất quan trọng trong CSDL hướng đối tượng đó
là tính kế thừa. Kế thừa là một hình thức khi tạo ra một lớp đối tượng mới có
những thuộc tính và phương thức giống với một lớp đã có. Khi đó, ta khơng cần
phải khai báo lại tồn bộ các thuộc tính và phương thức giống nhau đó mà chỉ
cần cho lớp mới kế thừa lớp đã có, hơn nữa cịn cho phép ta mở rộng các đối
tượng đã có để tạo ra một đối tượng mới, điều này khắc phục được những trở
ngại của CSDL quan hệ. Ngôn ngữ truy vấn trong CSDL hướng đối tượng tương
tự như ngôn ngữ truy vấn trong CSDL quan hệ, tuy nhiên có sự khác nhau đó là
các đối tượng có cấu trúc lồng nhau. Một trường của đối tượng có thể chứa các
- 18 -


kiểu dữ liệu phức tạp khác, ví dụ như tập hợp hoặc danh sách. Ngôn ngữ truy
vấn trong CSDL hướng đối tượng cho phép truy xuất vào các kiểu này, ví dụ
truy vấn “ tìm tất cả các địa chỉ Url của tài liệu có tên tác giả là P?” . Rõ ràng
một tài liệu có thể ở trên nhiều địa chỉ Url , do đó trường Url phải là một kiểu
danh sách để lưu trữ các địa chỉ Url của tài liệu. Cụ thể truy vấn trên như sau:
SELECT struct (field : x.Url)
FROM

Document x

WHERE x.author= P
Nếu sử dụng CSDL quan hệ để mô tả đối tượng Document ta thấy có bất
lợi là phải lưu trữ nhiều mẩu tin để mô tả đầy đủ các địa chỉ Web của một tài
liệu.
Sự kết hợp của 2mơ hình CSDL trên, đó là mơ hình quan hệ-đối tượng.

theo mơ hình này, ta sẽ duy trì một CSDL quan hệ và các thuộc tính trong CSDL
quan hệ này có thể là một đối tượng với các thuộc tính và phương thức riêng.
Dạng tổng quát của một mơ hình quan hệ- đối tượng như sau: (A1 :T1, A2 :T2,…,
An :Tn) trong đó, Ai là một thuộc tính của quan hệ và Ti là một đối tượng nào đó
với các thuộc tính và phương thức riêng. Theo mơ hình này, ta có thể mở rộng
mơ hình quan hệ để quản lý được các dữ liệu phức tạp hơn. Xét ví dụ đã đề cập
ở trên, trong quan hệ Client, để dễ quản lý các khách hàng ta bổ sung vào quan
hệ này một thuộc tính mới đó là Pic mơ tả ảnh của khách hàng. Dựa trên mơ
hình quan hệ- đối tượng, quan hệ Client sẽ có lược dồ sau:
Client (Comp:String, Fname:String,Lname:String, AcountNum:Integer,
PhoneNum:Integer, StreetNum:Integer, StreetName:String, City:String, Pic:
Image), trong đó Image là một lớp đối tượng.

1.2.4. Phương pháp quản trị CSDL khơng gian
Có hai vấn đề về quản trị CSDL của GIS là quản trị dữ liệu không gian
(Spatial Data) và quản trị dữ liệu phi không gian (Non-Spatial Data). Đó là hai
mảng dữ liệu căn bản và không thể tách rời của một hệ thống GIS. Do vậy hệ
thống GIS phải giải quyết các vấn đề của một DBMS thông thường cho phần dữ
liệu phi không gian và thêm nữa phải giải quyết vấn đề quản trị dữ liệu không
gian. Sở dĩ phải chia ra làm hai như vậy vì quản trị dữ liệu khơng gian có những
đặc thù về lưu trữ, xử lý mà một DBMS thơng dụng (như các hệ DBMS dùng
mơ hình CSDL quan hệ làm nền tảng) thực tế không đảm đương nỗi.

- 19 -


Việc quản trị dữ liệu phi hình học thì các hệ GIS hiện nay lại không
“chuyên” lắm và cũng thừa nhận mơ hình CSDL quan hệ là tốt nhất để giải
quyết vần đề này. GIS tự giải quyết không mạnh như các hệ quản trị CSDL như
My-SQL, SQL_server...nên một vài hệ GIS cũng có giải pháp “vay mượn” các

hệ DBMS thông qua các API mà các DBMS cung cấp. Sau đây là các phương
pháp mà các hệ thống GIS vận dụng để quản trị CSDL.
1.2.4.1. Mơ hình Vector
Cấu trúc dữ liệu theo hướng đối tượng, một đối tượng địa lý được mô
phỏng bởi một vector tọa độ và thường được phân chia thành ba dạng cơ bản :
Điểm (point), đường (line), vùng (area).
* Kiểu đối tượng điểm (Points):
- Dữ liệu điểm là kiểu dữ liệu đơn giản của đối tượng không gian.
- Việc lựa chọn thực thể để biểu diễn nó như dữ liệu điểm phụ thuộc vào
tỷ lệ bản đồ.
- Tọa độ của điểm được lưu trữ như hai thuộc tính
- Các thơng tin về tập điểm được xem như mở rộng của bảng thuộc tính:
+ Hàng chứa mọi thông tin về một điểm
+ Mỗi cột là một thuộc tính
+ Hai trong các cột là cặp tọa độ
- Các điểm là độc lập nhau, được biểu diễn bởi một hàng trong CSDL

Hình 1.12. Số liệu Vector được biểu thị dưới dạng điểm ( Point)
* Kiểu đối tượng đường (Lines hoặc Arcs)
Đường được xác định như một tập hợp dãy của các điểm, mô tả các đối
tượng địa lý dạng tuyến, có các đặc điểm sau:
- 20 -


- Là một dãy các cặp tọa độ
- Một đường bắt đầu và kết thúc bởi nút (node)
- Các đường nối với nhau và cắt nhau tại nút

Hình 1.13. Số liệu vector được biểu thị dưới dạng arc.
* Kiểu đối tượng vùng (area):

Vùng được xác định bởi ranh giới các đường thẳng, các đối tượng địa lý
có diện tích và đóng kín bởi một đường được gọi là đối tượng vùng, có các đặc
điểm sau:
- Vùng (area) được mơ tả bằng tập các đường (arc) và điểm nhãn (label points).
- Một điểm nhãn nằm trong vùng để mô tả, xác định cho mỗi một vùng.

Hình 1.14. Số liệu vectơ được biểu diễn dưới dạng vùng
1.2.4.2. Mơ hình Raster.
Mơ hình dữ liệu raster (hay cịn gọi là lưới tế bào) hình thành nền cho một
số hệ thông tin địa lý. Các hệ thống trên cơ sở raster hiển thị, định vị và lưu trữ
dữ liệu bản đồ nhờ sử dụng các ma trận hay lưới tế bào. Độ phân giải dữ liệu
raster phụ thuộc vào kích thước của tế bào hay điểm ảnh, chúng khác nhau từ

- 21 -


vài chục đêximet đến vài kilomet. Tiến trình xây dựng lưới tế bào được mô tả
sau đây:
Giả sử phủ một lưới lên tế bào gốc, dữ liệu raster được lập bằng cách mã
hóa mỗi tế bào bằng một giá trị dựa theo các đặc trưng trên bản đồ (hình 1.14),
trong ví dụ này đặc trưng đường được mã hóa là 2, đặc trưng điểm được mã hóa
là 1, đặc trưng vùng mã hóa là 3. Kiểu dữ liệu của tế bào trong lưới phụ thuộc
vào thực thể được mã hóa; ta có thể sử dụng số nguyên, số thực, ký tự hay tổ
hợp chúng để làm giá trị. Độ chính xác của mơ hình này phụ thuộc vào kích
thước hay độ phân giải của các tế bào lưới. Một điểm có thể là một tế bào kề
nhau, một vùng là tập hợp nhiều tế bào. Mỗi đặc trưng là tập t bo ỏnh s nh
nhau (cú cựng giỏ tr)
Điểm
Vùng
Đ-ờng


Bản đồ
gốc

L-ới

Ma trận
l-u trữ
Hàng

Hỡnh 1.15. Biu din raster
* So sỏnh mụ hỡnh Raster và mơ hình Vectơ
Bảng 1.1 là một vài so sánh hai mơ hình thường được sử dụng trong GIS:
mơ hình raster và mơ hình vectơ, mỗi mơ hình đều có ưu nhược điểm riêng.
Thực tế, các hệ thống GIS thị trường được xây dựng trên cơ sở mơ hình vectơ
hay raster. Tuy nhiên nhiều hệ thống GIS được xây dựng trên cơ sở cả hai loại
mơ hình này . Do vậy, tùy theo ứng dụng cụ thể để lựa chọn công cụ phần mềm
GIS cho phù hợp.

- 22 -


×