Tải bản đầy đủ (.pdf) (41 trang)

mô hình dữ liệu không gian áp dụng cho mạng lưới cấp nước 2

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.27 MB, 41 trang )

6

CHƢƠNG 2:
TỔNG QUAN VỀ MÔ HÌNH DỮ LIỆU KHÔNG GIAN
2.1 GIỚI THIỆU VỀ GIS (Geographic Information System)
Xuất phát từ những quan điểm, góc độ khác nhau về chức năng, ứng
dụng, hệ thống,… Hệ thống thông tin địa lý - GIS (Geographic Information
System) có những định nghĩa khác nhau nhưng nhìn chung những định nghĩa
sau đây được chấp nhận rộng rãi trong cộng đồng phát triển GIS.
Hệ thống thông tin địa lý GIS là một công cụ tập hợp những quy trình
dựa trên máy tính để lập bản đồ, lưu trữ và thao tác dữ liệu địa lý, phân tích
các sự vật, hiện tượng thực trên trái đất, dự đoán tác động và hoạch định chiến
lược.
GIS là một tập hợp có tổ chức của phần cứng, phần mềm, con người, dữ
liệu và các phương pháp phân tích để thu nhận, lưu trữ, cập nhật, phân tích và
hiển thị tất cả các dạng thông tin địa lý có quan hệ không gian nhằm giải
quyết các sự vật, hiện tượng thực trên trái đất.
GIS là một hệ thống thông tin được thiết kế để làm việc với dữ liệu có
tham chiếu tọa độ địa lý. Nói cách khác, GIS là hệ thống gồm hệ CSDL với
những dữ liệu có tham chiếu không gian và một tập những thuật toán để làm
việc trên dữ liệu đó. (Star and Estes, (1990)).
Hệ thống thông tin địa lý là một hệ thống thông tin bao gồm một số phụ
hệ (subsystems) có khả năng biến đổi các dữ liệu địa lý thành những thông
tin có ích. (Calkins và Tomlinson, (1977); Marble, (1984)).
GIS lưu giữ thông tin về thế giới thực dưới dạng tập hợp các lớp chuyên
đề có thể liên kết với nhau nhờ các đặc điểm địa lý. GIS là một công cụ đa
năng đã được chứng minh là rất có giá trị trong việc giải quyết nhiều vấn đề
thực tế, từ thiết lập tuyến đường, mạng lưới các đường ống phân phối, phân
chia các thửa đất đến lập báo cáo chi tiết cho các ứng dụng quy hoạch hay mô
phỏng các chuyến bay trên toàn cầu.


7

2.1.1 Các thành phần của GIS
Hệ thống thông tin địa lý (GIS) bao gồm các thành phần: Phần cứng
(Hardware), Phần mềm (Software), Dữ liệu (Data), Con người (People) và
Phương pháp phân tích (Analysis).

Hình 2.1: Các thành phần của hệ thống Gis
(nguồn: Michael Zeiler (1999))
 Thiết bị (hardware) gồm: hệ thống máy tính ( Server, Workstation); hệ
thống mạng máy tính (LAN, WAN, internet); các thiết bị ngoại vi
(GPSs, survey devices,
scanners, printers, plotters,…).

 Phần mềm (software): là tập hợp các câu lệnh, chỉ thị nhằm điều khiển
phần cứng của máy tính thực hiện một nhiệm vụ xác định, phần mềm hệ
thống thông tin địa lý có thể là một hoặc tổ hợp các phần mềm máy tính.
Phần mềm được sử dụng trong kỹ thuật GIS phải bao gồm các tính năng
cơ bản sau: nhập và kiểm tra dữ liệu (Data input); lưu trữ và quản lý cơ sở
dữ liệu địa lý (Geographic database); xuất dữ liệu (Display and reporting);
biến đổi dữ liệu (Data transformation); truy vấn và phân tích (Query and
Analysis).
 Dữ liệu (data): Dữ liệu GIS bao gồm dữ liệu không gian và dữ liệu phi
không gian là một thành phần quan trọng trong các hệ thống thông tin địa
lý thường được chia làm hai phần chính là cơ sở dữ liệu nền và cơ sở dữ
liệu chuyên đề.
- Cơ sở dữ liệu nền bao gồm những lớp dữ liệu cần thiết cho hầu hết
8

các hệ thống thông tin địa lý như dữ liệu về lưới tọa độ, dữ liệu về giao

thông, dữ liệu về thủy văn, dữ liệu độ cao, dữ liệu hành chánh, v.v
- Cơ sở dữ liệu chuyên đề bao gồm dữ liệu của các thực thể chuyên
ngành về tài nguyên thiên nhiên, môi trường, cơ sở hạ tầng kỹ thuật, các
chuyên ngành kinh tế xã hội.
 Phân tích (analysis): hay còn gọi là các quy trình xử lý tác nghiệp được
nhà phân tích thiết kế hệ thống xác lập khi xây dựng hệ thống. Một hệ
thống thông tin địa lý cần có tối thiểu các quy trình sau: quy trình nhập dữ
liệu, quy trình lưu trữ dữ liệu, quy trình truy vấn dữ liệu, quy trình xuất dữ
liệu và quy trình hiển thị dữ liệu.
 Con người (people): con người là yếu tố quyết định sự thành công trong
tiến trình kiến tạo hệ thống và sự hữu hiệu của hệ thống trong tiến trình
khai thác vận hành. Từ tiến trình vận hành, khai thác hệ thống, hai nhóm
người đã hình thành: người dùng trong hệ thống (internal users) và người
dùng ngoài hệ thống (external user).
- Người dùng trong hệ thống là một thành phần của hệ thống, đó là
những người làm việc trực tiếp với hệ thống thiết bị phần cứng,
phần mềm, cơ sở dữ liệu.
- Người dùng ngoài hệ thống không phải là thành phần của hệ
thống. Nhóm người này sử dụng kết quả phân tích của hệ thống để
ra quyết định.
2.1.2 Một số ứng dụng của GIS
Từ khi ra đời GIS đã được nhiều ngành, nhiều quốc gia quan tâm
nghiên cứu và ứng dụng. GIS được thiết kế như một hệ thống chung để quản
lý dữ liệu không gian, nhờ những khả năng phân tích và xử lý không gian,
kỹ thuật GIS hiện nay được ứng dụng phổ biến trong nhiều lĩnh vực khác
nhau: Các ngành khoa học tự nhiên như quản lý tài nguyên, môi trường, khai
thác khoáng sản, quy hoạch đô thị, Các ngành khoa học xã hội như quản lý
dân số, giới tính, quản lý giáo giục, y tế, Sau đây là một số ứng dụng GIS
9


trong các lĩnh vực tiêu biểu:
Tài nguyên, môi trƣờng: Có rất nhiều ứng dụng đã phát triển trong
những tổ chức quan tâm đến môi trường. Với mức đơn giản nhất thì người
dùng sử dụng GIS để đánh giá môi trường, ví dụ như vị trí và đặc điểm cây
rừng. Ứng dụng GIS với mức phức tạp hơn là dùng khả năng phân tích của
GIS để mô hình hóa các tiến trình xói mòn đất, sự lan truyền ô nhiễm trong
môi trường khí hay nước, phân tích các biến động khí hậu, thủy văn hay quản
lý đất đai, lập quy hoạch sử dụng đất. Nếu những dữ liệu thu thập gắn liền
với đối tượng vùng và ứng dụng sử dụng các chức năng phân tích phức tạp
thì mô hình dữ liệu dạng ảnh (raster) có khuynh hướng chiếm ưu thế.
Chính quyền địa phƣơng: Ứng dụng trong các tổ chức chính quyền là
một trong những lĩnh vực ứng dụng rộng lớn nhất của GIS, bởi vì đây là một
tổ chức sử dụng dữ liệu không gian nhiều nhất. Tất cả các cơ quan của chính
quyền địa phương đều có thể sử dụng các tiện ích của GIS trong việc tìm
kiếm và quản lý thửa đất, bảo dưỡng nhà cửa và đường giao thông. GIS còn
được sử dụng trong các trung tâm điều khiển và quản lý các tình huống khẩn
cấp.
Giao thông vận tải: GIS có khả năng ứng dụng mạnh mẽ trong lĩnh
vực giao thông vận tải. Việc lập kế hoạch và duy trì cở sở hạ tầng giao thông
rõ ràng là một ứng dụng thiết thực, hiện nay một lĩnh vực mới đang được
quan tâm đến là ứng dụng định vị trong vận tải hàng hải, và hải đồ điện tử.
Sự hỗ trợ của GIS rất đáng kể trong loại hình đặc trưng này.
Dịch vụ tài chính ngân hàng: GIS được sử dụng trong lĩnh vực dịch
vụ tài chính tương tự như là một ứng dụng đơn lẻ. Hiện nay việc sử dụng GIS
đang tăng lên trong lĩnh vực này, nó là một công cụ đánh giá rủi ro với độ
chính xác cao những khu vực có độ rủi ro cao nhất hay thấp nhất. Lĩnh vực
này đòi hỏi những dữ liệu cơ sở khác nhau như là địa chất học, thời tiết và
giá trị tài sản.

10




Các dịch vụ điện, nƣớc, gas: Những ứng dụng này trong lĩnh vực này
đòi hỏi những bản đồ số với độ chính xác cao. Để quản lý tốt các đặc điểm và
vị trí của dây cáp, đường ống, van, mô hình dữ liệu vector được áp dụng.
Kinh doanh bán lẻ: GIS thường được dùng để lưu trữ những dữ liệu
về kinh tế - xã hội của khách hàng trong một vùng nào đó. Một vùng thích
hợp cho việc xây dựng một siêu thị có thể được tính toán bởi thời gian đi đến
siêu thị, và phạm vi ảnh hưởng của những siêu thị cạnh tranh.
2.2 MÔ HÌNH DỮ LIỆU KHÔNG GIAN
Các thực thể trong thế giới thực được biểu diễn bằng những đối tượng
không gian dưới dạng dữ liệu số bao gồm các thuộc tính không gian và thuộc
tính phi không gian. Các thực thể tồn tại trong thế giới thực còn được gọi là
thực thể không gian.
Đối tượng không gian (spatial object) là những thực thể không gian được
biểu diễn vào trong máy tính.
Mô hình không gian là sự đơn giản hóa thế giới thực, là tập những phần
tử biểu diễn các thực thể không gian trong thế giới thực. Mô hình dữ liệu
không gian tương ứng với tập các nguyên tắc để chuyển thế giới thực thành
các đối tượng không gian được miêu tả một cách Logic.
Trong GIS, dữ liệu về các đối tượng không gian được biểu diễn dưới
dạng nhị phân theo mô hình raster hoặc vector. Mô hình raster biểu diễn các
đối tượng không gian thành những ô lưới bằng nhau gọi là điểm ảnh (pixel),
mỗi điểm ảnh chỉ có một thuộc tính. Trong mô hình vector, các đối tượng
không gian được biểu diễn như những điểm, đường, vùng.
GIS quản lý dữ liệu không gian và phi không gian một cách riêng biệt
và có khả năng liên kết với các hệ quản trị cơ sở dữ liệu bên ngoài.

11



Hình 2.2: Từ thế giới thực đến mô hình không gian và MHDL không gian.
(nguồn: Trần Vĩnh Phước(2003))

2.2.1 Đối tƣợng không gian
Đối tượng không gian là phần tử của tập mô hình không gian tượng
trưng cho các thực thể không gian trong thế giới thực. Trong hệ thống thông
tin địa lý, mỗi thực thể không gian có thể được biểu diễn thành những đối
tượng dạng điểm, đường, vùng, bề mặt hoặc khối.
Biểu diễn các đối tượng không gian trong Gis:

a) Các đối tượng dạng điểm như những địa vật
đặc trưng trong các bản đồ tỉ lệ nhỏ được biểu
diễn trong không gian 0-D


Hình 2.3:Đối tượng điểm
(nguồn: Trần Vĩnh Phước (2009))

b) Các đối tượng dạng đường như tim đường giao
thông được biểu diễn trong không gian 1-D


Hình 2.4:Đối tượng đường
(nguồn: Trần Vĩnh Phước (2009))

c) Các đối tượng có dạng vùng phẳng như sông
hồ được biểu diễn trong không gian 2-D


Hình 2.5:Đối tượng vùng
(nguồn: Trần Vĩnh Phước (2009))
Mô hình
không gian
chứa các
đối tượng
không gian
Thế giới
thực chứa
các thực
thể không
gian
Mô hình dữ
liệu không
gian chứa
dữ liệu của
các đối
tượng
không gian
12


d) Các đối tượng có dạng của một mặt cong bất
kỳ như bề mặt địa hình, được biểu diễn trong
không gian 2.5-D

Hình 2.6:Đối tượng bề mặt
(nguồn: Trần Vĩnh Phước (2009))



e)Các đối tượng dạng hình khối như đường hầm, tòa
nhà được biểu diễn trong không gian 3-D


Hình 2.7: Đối tượng hình khối
(nguồn: Trần Vĩnh Phước (2009))
Các đối tượng không gian cũng có thể được nhóm theo hai loại khác nữa
tùy theo chúng thuộc loại “tự nhiên” hay “ phi tự nhiên”. Các đối tượng
không gian tự nhiên tương ứng với các thực thể không gian rời rạc có thể
nhận diện được trong thế giới thực. Các đối tượng phi tự nhiên là các thực thể
được con người tạo ra như đường bao đất đai hay một pixel.
2.2.2 Phân loại các đối tƣợng không gian:













Hình 2.8: Phân loại đối tượng không gian
(nguồn:Trần Vĩnh Phước (2003))
Đối tƣợng không gian tự nhiên
- Đối tượng không gian giới hạn theo mẫu (Sampling-Limited Spatial
Objects) là những đối tượng biểu diễn các thực thể không gian tự nhiên mà


Đối tượng không gian
Giới hạn
mẫu
Giới hạn
định nghĩa
Không
đồng đều
Đồng đều
Tự nhiên
Phi tự nhiên
13

thông tin về nó như hình dạng và kích thước được xác định bởi những thông
tin tổng thể cho từng thực thể.
- Đối tượng không gian giới hạn theo định nghĩa (Definition-Limited
Spatial Objects) là những đối tượng biểu diễn các thực thể không gian tự
nhiên mà những thông tin về nó đã được định nghĩa.
Đối tƣợng không gian phi tự nhiên
- Đối tượng không gian phi tự nhiên không đồng đều (Irregular
Imposed Spatial Objects) là những đối tượng biểu diễn các thực thể không
gian do con người đặt ra có hình dạng và kích thước không đồng đều.Ví dụ:
vùng hành chánh.
- Đối tượng không gian phi tự nhiên đồng đều (Regular Imposed Spatial
Objects) là những đối tượng biểu diễn các thực thể không gian do con người
đặt ra có hình dạng và kích thước giống nhau như các pixel trong một ảnh
raster.
2.2.3 Mô hình dữ liệu không gian Raster, Vector
Có hai mô hình dữ liệu được áp dụng cho hệ thống GIS là mô hình dữ
liệu Raster và mô hình dữ liệu Vector. Mỗi mô hình có những ưu điểm và

khuyết điểm riêng.
Mô hình Raster rất thích hợp đối với việc chia nhỏ các biến liên tục theo
không gian thường được sử dụng cho các ảnh số; phân tích và xử lý ảnh số là
những môn học tồn tại lâu dài với nhiều ứng dụng rộng rãi trong ảnh viễn
thám, ảnh y học,
Mô hình Vector thích hợp cho việc vẽ bản đồ, biểu diễn bản đồ. Trong mô
hình Vector, đường được tạo bằng cách nối tuần tự các điểm, hoặc các đỉnh
(Vertex). Mỗi đỉnh được tạo ra từ một cặp tọa độ không gian, vì vậy nó có tên
là Vector.
2.2.3.1 Mô hình Raster
Mô hình dữ liệu dạng Raster phản ánh toàn bộ vùng nghiên cứu dưới
dạng một lưới các ô vuông hay điểm ảnh (pixcel).
14

Mỗi điểm ảnh được xem như đồng nhất cùng một thuộc tính. Mô hình
Raster có các đặc điểm:
 Các điểm được xếp liên tiếp từ trái qua phải và từ trên xuống dưới.
 Mỗi điểm ảnh (pixcel) chứa một giá trị.
 Một tập các ma trận điểm và các giá trị tương ứng tạo thành một
lớp (layer).
 Trong cơ sở dữ liệu có thể có nhiều lớp.
Mô hình dữ liệu raster là mô hình dữ liệu GIS được dùng tương đối phổ
biến trong các bài toán về môi trường, quản lý tài nguyên thiên nhiên. Mô
hình dữ liệu raster chủ yếu dùng để phản ánh các đối tượng dạng vùng là ứng
dụng cho các bài toán tiến hành trên các loại đối tượng dạng vùng: phân loại;
chồng xếp.
2.2.3.2 Mô hình vector
Mô hình vector biểu diễn các đối tượng không gian theo ba dạng: điểm,
đường, vùng. Mô hình vector áp dụng cho các đối tượng không gian tự nhiên
giới hạn theo mẫu hoặc giới hạn theo định nghĩa và những đối tượng không

gian phi tự nhiên không đồng đều. Các đối tượng đường được tuyến tính hóa
bằng những đoạn thẳng (vector) được xác định bởi tọa độ hai điểm đầu và
cuối gọi là các “đỉnh” (vertex). Khi các Vertex càng gần nhau thì đối tượng
được biểu diễn càng chính xác. Cấu trúc lưu trữ dữ liệu trong mô hình vector
phức tạp hơn mô hình raster và việc xây dựng các thuật toán chồng lớp bản đồ
trong mô hình vector cũng phức tạp hơn.
i) Mô hình “sợi bún” (spaghetti).
 Điểm được xác định bởi cặp tọa độ (x,y).
 Đường được tuyến tính hóa từng đoạn, biểu diễn bằng một chuỗi
những cặp toạ độ (x
i
,y
i
).
 Vùng được xác định bởi một đường khép kín và được biểu diễn bằng
một chuỗi cặp tọa độ (x
i
,y
i
) có tọa độ đầu và tọa độ cuối trùng nhau.
15

 Bảng tọa độ (xi,yi) được lưu trữ như là thuộc tính không gian của các
đối tượng.
ii) Mô hình Topo (Topology)
 Đường được chia thành nhiều cung (arc) có định hướng, mỗi cung
được thành lập một hoặc nhiều đoạn thẳng, giới hạn bởi các đỉnh đầu
mút của cung gọi là nút (node), mỗi cung có nút đầu và nút cuối.
 Các bảng thuộc tính topo sẽ mô tả các quan hệ không gian giữa các
cung, các nút và các vùng.

 Các thuộc tính topo của các đối tượng không gian là các thuộc tính về
sự tiếp giáp, sự chứa đựng và sự liên kết của các đối tượng.
 Các thuộc tính Topology của các đối tượng không gian không bị thay
đổi bởi các phép biến đổi như chuyển dịch, thay đổi tỉ lệ, phép quay.
iii) Mô hình TIN
 Mô hình mạng tam giác không đều (Triangulated Irregular Network -
TIN) được sử dụng chủ yếu để biểu diễn các bề mặt độ cao số (Digital
Elevation Surface). Trong mô hình TIN, các vị trí điểm tạo thành các
đỉnh của tam giác mà các cạnh càng đều nhau càng tốt.
 Thuận lợi của mạng tam giác là kích thước của tam giác có những điều
chỉnh một cách tự động theo mật độ điểm, vùng có nhiều điểm gần
nhau thì tam giác nhỏ, vùng có ít điểm và xa nhau thì tam giác lớn.
 Mô hình TIN cũng thuận tiện trong việc biểu diễn các đối tượng không
liên tục, như các vách đá, các đứt gãy địa hình, các đường bờ biển và
các đáy thung lũng.
2.2.4 Dữ liệu thuộc tính
Dữ liệu thuộc tính ghi trong một cơ sở dữ liệu có thể được chia thành 3
loại: không gian, thời gian và chuyên đề. Phần lớn các đối tượng có thể được
mô tả thông qua ba loại thuộc tính này, mặc dù trong thực tế, thuộc tính không
gian và/hoặc thời gian được bỏ qua vì chúng không thay đổi hoặc không quan
16

trọng đối với tác vụ đang xét. Đối với các ứng dụng GIS, thuộc tính thời gian
và chuyên đề được gộp chung lại với nhau (thuộc tính phi không gian).
2.2.4.1 Thuộc tính không gian
 Thuộc tính không gian là dữ liệu về vị trí, topo và hình học của các đối
tượng không gian.
 Vị trí không gian của các đối tượng được ghi lại theo hệ tọa độ kinh vĩ,
hệ tọa độ của một các phép chiếu bản đồ chuẩn hoặc theo các tọa độ
thẳng tùy ý với một gốc cục bộ.

 Con người không nghĩ về vị trí của các đối tượng không gian qua các
tọa độ của chúng mà qua các mối quan hệ không gian (thường là mối
quan hệ topology) với những đối tượng đã biết.
 Trong các hệ thống thông tin địa lý hiện tại, các thuộc tính của hình
học topo được tạo ra một cách tự động bằng cách “building topology”
được lưu lại một cách rõ ràng trong các bảng thuộc tính.
2.2.4.2 Thuộc tính phi không gian
 Thuộc tính thời gian và thuộc tính chuyên đề của các đối tượng không
gian được gọi chung là thuộc tính phi không gian.
 Thuộc tính thời gian đề cập đến tuổi của các đối tượng, hoặc thời gian
thu thập dữ liệu.
 Thuộc tính chuyên đề đề cập đến các loại thuộc tính khác của đối
tượng, các thuộc tính không liên quan đến vị trí hay thời gian.
 Thuộc tính của các đối tượng không gian được tổ chức thành các cơ sở
dữ liệu và được quản lý bởi một hệ quản trị cơ sở dữ liệu (DBMS).
 Cơ sở dữ liệu thuộc tính được xây dựng theo các mô hình: mô hình
phân cấp, mô hình mạng hay mô hình quan hệ.
 Trong đó, mô hình quan hệ được sử dụng phổ biến nhất.
2.3 CẤU TRÚC DỮ LIỆU KHÔNG GIAN
Cấu trúc dữ liệu không gian là cách sắp xếp, tổ chức dữ liệu không gian
sao cho thích hợp với máy tính số. Cấu trúc dữ liệu không gian là trung gian
17

giữa mô hình dữ liệu với định dạng tệp dữ liệu.

Hình 2.9: Từ mô hình đến định dạng tệp tin dữ liệu không gian
(nguồn: Trần Vĩnh Phước (2009))
Dữ liệu về các đối tượng không gian có thể được xây dựng theo mô hình
raster hoặc vector với các cấu trúc tương ứng. Cấu trúc raster được sử dụng
rộng rãi trong các hệ thống xử lý ảnh và GIS raster. Các cấu trúc Vector chiếm

ưu thế trong các hệ thống CAD với những tiềm năng vẽ bản đồ mạnh mẽ. Có
nhiều cấu trúc khác nhau được phát triển cho cả hai mô hình Vector và Raster.
Việc chọn lựa một cấu trúc dữ liệu tốt nhất tùy thuộc vào bản chất dữ liệu và
phương thức chúng được sử dụng. Nhiều GIS tận dụng cả hai mô hình Raster
và Vector với nhiều cấu trúc dữ liệu khác nhau cho cùng một mô hình. Mỗi
cấu trúc đều có những thuận lợi và bất lợi riêng. Việc chuyển từ một cấu trúc
này sang cấu trúc kia là rất quan trọng.
2.3.1 Cấu trúc dữ liệu Raster
2.3.1.1 Mô tả cấu trúc
Mô hình raster chia không gian thành những ô lưới hình vuông (chữ
nhật, hoặc tam giác) có kích thước bằng nhau gọi là điểm ảnh (pixel).
Mỗi pixel được xác định vị trí bằng cặp toạ độ (x,y) là số thứ tự của hàng
và cột của pixel. Pixel là phần tử cơ sở của cấu trúc dữ liệu raster để biểu diễn
một đặc trưng địa lý f(x,y) nào đó, nghĩa là dữ liệu trong mỗi điểm ảnh là
đồng nhất.
 Trong cấu trúc raster, đường được biểu diễn bằng những pixel có cùng
giá trị f(x,y) liên tiếp nhau.
Mô hình
dữ liệu
không
gian

Định
dạng tệp
tin dữ liệu
không
gian
Cấu trúc
dữ liệu
không

gian
18

 Vì trong cấu trúc raster, các pixel được xếp theo hàng, cột như một ma
trận điểm nên đường ở đây không trơn mà có dạng zic-zac.
 Vùng được xác định bằng một mảng gồm nhiều điểm ảnh có cùng giá
trị thuộc tính f(x,y) trải rộng ra theo nhiều phương.
 Cấu trúc dữ liệu raster có hai đặc điểm cần lưu ý:
- Mỗi điểm ảnh chỉ biểu diễn một thuộc tính, xác định bởi giá trị f(x,y)
- Khi thay đổi độ phân giải (kích thước điểm ảnh thay đổi), dung
lượng dữ liệu thay đổi theo. Dung lượng dữ liệu tăng theo bình phương tỉ lệ
gia tăng độ phân giải. (Tham khảo [6])
2.3.1.2 Dạng hình học và tính Topology của dữ liệu Raster
Đối tƣợng điểm (Point objects)
Mỗi đối tượng điểm là một điểm ảnh được gán ID điểm, toạ độ (i, j) và
các thuộc tính.

Hình 2.10: Điểm trong cấu trúc raster
(nguồn: Trần Vĩnh Phước (2003))
Đối tƣợng đƣờng (Line objects)
Mỗi đối tượng đường được gán ID đường, chuỗi tọa độ định dạng đường
và các thuộc tính.


Hình 2.11: Đường trong cấu trúc raster
(nguồn: Trần Vĩnh Phước (2003))
Đối tƣợng vùng (Polygon objects)
Mỗi đối tượng vùng được gán ID vùng, nhóm tọa độ định dạng vùng và
thuộc tính.
19








Hình 2.12: Vùng trong cấu trúc raster
(nguồn: Trần Vĩnh Phước (2003))
Hƣớng chảy
Một đường thẳng với các hướng có thể được biểu diễn bởi 4 hướng
(được gọi là Rook’s move) hoặc 8 hướng ( được gọi là Queen’s move).
Dòng nước, liên kết trong một mạng, đường giao thông có thể được biểu diễn
qua các hướng chảy (hay còn được gọi là mã xích Freeman: Freeman chain
code).
Hình 2.13: Hướng chảy trong raster
(nguồn: Trần Vĩnh Phước (2003))
Đƣờng bao (Boundary)
Đường bao được định nghĩa là một cửa sổ 2x2 pixel với hai lớp khác
nhau.
Hình 2.14: Đường bao trong raster
(nguồn: Trần Vĩnh Phước (2003))

Nút (Node)
Nút được định nghĩa như một cửa sổ (Window) 2x2 pixel trong đó có ít
nhất 3 lớp khác nhau.
20


Hình 2.15:Nút trong raster

(nguồn: Trần Vĩnh Phước (2003))
2.3.2 Cấu trúc dữ liệu Vector
Các đối tượng không gian khi biểu diễn ở cấu trúc vector thường tổ chức
dưới dạng điểm, đường và vùng trên một hệ thống tọa độ xác định. Mỗi điểm
được xác định bởi một cặp toạ độ (x,y); đường được xác định bởi một chuỗi
liên tiếp các điểm và vùng được xác định bởi một đường khép kín.
Hai cấu trúc dữ liệu Vector thông dụng là cấu trúc Spaghetti và cấu trúc
Topology. Trong cấu trúc vector các đối tượng trong không gian được phân
loại thành 3 dạng:
Đối tượng điểm: Điểm dùng cho tất cả các đối tượng không gian mà biểu
diễn như một cặp tọa độ (x,y).
Đối tượng đường: Đường được dùng để biểu diễn tất cả các đối tượng có
dạng tuyến, được tạo nên từ hai hoặc nhiều cặp tọa độ (x,y).
Đối tượng vùng: Vùng là một đối tượng hình học hai chiều.








Hình 2.16: Điểm, Đường, Vùng trong cấu trúc vector
(nguồn: Trần Vĩnh Phước (2003))
2.3.2.1 Cấu trúc Spaghetti
 Điểm được xác định bằng một cặp tọa độ (x,y).
Ñieåm
Ñöôøng
Ñöôøng cong
Vuøng

21

 Đường được biểu diễn bằng một chuỗi những cặp toạ độ (xi,yi).
 Vùng được xác định bởi một cung khép kín và được biểu diễn bằng một
chuỗi cặp tọa độ (xi,yi) có tọa độ đầu và tọa độ cuối trùng nhau. Cấu
trúc không ghi nhận đặc trưng kề nhau của hai vùng kề nhau, nghĩa là
tại đường chung của hai vùng kề nhau có hai đường độc lập. Cấu trúc
Spaghetti được sử dụng để lập bản đồ số rất tốt, nhưng không thích hợp
cho các bài toán phân tích GIS vì không mô tả được các quan hệ không
gian.








Hình 2.17: Cấu trúc Spaghetti
(nguồn: Trần Vĩnh Phước (2003))
2.3.2.2 Cấu trúc topology
Tính topology rất cần thiết trong quá trình phân tích không gian.
Topology thể hiện mối quan hệ hoặc sự liên kết giữa các đối tượng trong
không gian. Topology là một phương pháp toán học dùng để xác định các
quan hệ không gian. Cấu trúc topology còn được gọi là cấu trúc cung-nút
(arc-node) với phần tử cơ bản là cung.
 Mỗi cung được mô tả như là một chuỗi những đoạn thẳng nối liền
nhau, điểm đầu và cuối cung gọi là nút (node), những điểm giữa cung
gọi là đỉnh (vertex).
 Nút là điểm giao nhau của hai hay nhiều cung, đối với những cung độc

lập, nút là điểm cuối cùng của cung, không nối liền với bất kỳ cung
nào khác.
 Vùng là một chuỗi những cung nối liền nhau và khép kín, những cung
này chính là đường biên của vùng.
 Một vùng có thể được giới hạn bởi hai đường cong khép kín lồng vào
22

nhau và không cắt nhau.







Hình 2.18: Điểm, đường, vùng trong cấu trúc topology
(nguồn: Trần Vĩnh Phước (2003))
Các đối tượng địa lý trong cấu trúc topology được mô tả trong hình 2.19:

Hình 2.19: Cấu trúc topology của đối tượng địa lý
(nguồn: Trần Vĩnh Phước (2003))

- Bảng topology vùng xác định những cung làm đường biên của vùng,
phần bên ngoài bản đồ cũng được xem như một vùng không xác định cung
đường biên.
- Bảng topology nút xác định mỗi nút thuộc những cung nào.
- Bảng topology cung xác định quan hệ của nút và vùng với cung.
- Bảng thứ tư lưu trữ tọa độ của các cung bằng cách lưu trữ tọa độ của
các nút và đỉnh của cung, để từ đó vị trí của mỗi phần tử trên bản đồ được liên
hệ với thế giới thực.

23

2.3.3 Cấu trúc TIN
Các điểm phân bố không đều tham gia tạo thành một mạng tam giác
khớp với nhau. Các đỉnh của những tam giác này là những điểm gốc. Bản
thân các tam giác này là những vùng. Các cạnh của tam giác là một trường
hợp đặc biệt của chuỗi (chain) - các đoạn thẳng với các nút (node) cũng là các
đỉnh (Vertex). Mỗi tam giác hay “bề mặt (facet)” có thể được xem xét như các
mặt phẳng (planar).
Dạng hình học của các mặt phẳng được định nghĩa hoàn toàn bởi các giá
trị (x,y,z) của 3 nút. Cấu trúc topology của một TIN được lưu trữ một cách
khá rõ ràng theo nhiều cách khác nhau.
 Cách lưu trữ topology của TIN phổ biến nhất là cách sử dụng các tam
giác làm các đối tượng không gian cơ bản với các liên kết Topology tới
các tam giác lân cận và một tập các điểm.
 Cách thứ hai là cách sử dụng các nút là những phần tử không gian cơ
bản với các liên kết tới những điểm được nối tới nó.
2.3.4 Quan hệ topology giữa các đối tƣợng không gian
Trong thực tiễn ứng dụng GIS, tất cả các quan hệ không gian có thể có
trong dữ liệu không gian được sử dụng một cách logic với nhiều cấu trúc dữ
liệu phức tạp.
















Hình 2.20: Quan hệ topology giữa các đối tượng
(nguồn: Trần Vĩnh Phước (2003))
24

Quan hệ điểm-điểm
- “Trong giới hạn (is within)”: Nằm trong giới hạn một khoảng cách cụ thể.
- “Gần nhất với (is nearest to)”: Gần nhất so với một điểm cụ thể.
Quan hệ điểm-đƣờng
- “Nằm trên đường (on line)”: điểm nằm trên một đường.
- “Gần nhất với (is nearest to)”: Điểm gần nhất so với một đường.
Quan hệ điểm-vùng
- “Chứa bên trong vùng (is contained in)”: Điểm chứa bên trong vùng.
- “Nằm trên biên (on border of area)”: Một điểm nằm trên đường biên của
vùng.
Quan hệ đƣờng-đƣờng
- “Giao nhau (intersects)”: Hai đường giao nhau.
- “Băng qua (crosses)”: Hai đường băng qua mà không giao nhau.
- “Chảy vào (flow into)”: Một nhánh sông chảy vào một dòng sông.
Quan hệ đƣờng-vùng
- “Giao nhau (intersects)”: Một đường giao (cắt) với một vùng.
- “Đường biên (borders)”: Đường là một phần biên của vùng.
Quan hệ vùng-vùng
- “Chồng lớp (overlaps)”: Hai vùng chồng lên nhau.
- “Nằm bên trong (is within)”: Một vùng nằm bên trong một vùng khác.

- “Kế cận (is adjacent to)”: Hai vùng cùng có một đường biên chung.
2.4 CẤU TRÚC DỮ LIỆU KHÔNG GIAN TRONG SQL SERVER
Có hai kiểu dữ liệu không gian được định nghĩa trong SQL2008 là
Geography và Geometry. Cả hai đều được thực hiện như các loại Microsoft
NET Framework Common Language Runtime (CLR) và có thể được sử dụng
để lưu trữ các loại khác nhau của các yếu tố địa lý như điểm, đường và vùng.
Cả hai loại dữ liệu cung cấp các thuộc tính và các phương thức có thể sử dụng
để thực hiện các hoạt động không gian như tính toán khoảng cách giữa các địa
điểm và tìm ra các điểm giao nhau.
25

2.4.1 Kiểu dữ liệu Geography:
Kiểu dữ liệu Geography cung cấp một cấu trúc lưu trữ dữ liệu không
gian được xác định bằng các cặp tọa độ (vĩ độ và kinh độ). Điển hình của việc
sử dụng loại dữ liệu này là xác định các tuyến đường, các tòa nhà, hoặc các
đặc điểm địa lý như dữ liệu vector có thể được phủ lên một bản đồ raster cơ
sở có tính đến độ cong của trái đất, hoặc tính các khoảng cách vòng tròn cực
lớn như quỹ đạo đường bay trong vận tải hàng không.
2.4.2 Kiểu dữ kiệu Geometry:
Kiểu dữ liệu Geometry cung cấp một cấu trúc lưu trữ dữ liệu không
gian được xác định bởi các tọa độ trên một mặt phẳng tùy ý. Kiểu dữ liệu này
thường được sử dụng trong các hệ thống lập bản đồ khu vực, hoặc cho các
bản đồ sơ bộ - yếu tố độ cong của Trái đất không cần thể hiện trong các bản
đồ này.
Geometry là kiểu dữ liệu phù hợp với Open Geospatial Consortium
(OGC) Simple Features for SQL Specification version 1.1.0 và phù hợp với
SQL MM (ISO tiêu chuẩn). (Tham khảo [12])
Cả hai loại dữ liệu không gian trong SQL Server 2008 cung cấp một bộ
các instance và phương thức có thể sử dụng để thực hiện các truy vấn và các
hoạt động trên dữ liệu không gian.

Kiểu dữ liệu Geography và Geometry hỗ trợ 11 đối tượng dữ liệu
không gian. Tuy nhiên, chỉ có 7 trong số các loại là instantiable nghĩa là ta có
thể tạo và làm việc với những trường hợp này (hoặc khởi tạo chúng) trong
một cơ sở dữ liệu. Các trường còn lại kế thừa những thuộc tính từ các kiểu dữ
liệu cha mẹ của nó để phân biệt chúng như Curve, MultiCurve, Surface,
MultiSurface, CurvePolygons và Geometry. (Tham khảo [13])
Hình vẽ dưới đây mô tả hệ thống phân cấp Geometry dựa trên các kiểu
dữ liệu Geometry và Geography. Các kiểu Instantiable của Geometry và
Geography được chỉ định màu xanh lam.
26


Hình 2.21: Các kiểu dữ liệu không gian trong SQL Server
(nguồn: )
Hình trên cho thấy, bảy loại instantiable của kiểu dữ liệu Geometry và
Geography là Point, MultiPoint, LineString, MultiLineString, Polygon,
MultiPolygon và GeometryCollection. Các kiểu dữ liệu Geometry và
Geography có thể nhận ra một trường hợp cụ thể miễn là nó được định dạng
đúng, thậm chí nếu khi nó không được xác định một cách rõ ràng. Ví dụ, nếu
ta xác định một trường hợp điểm một cách rõ ràng bằng cách sử dụng
phương thức STPointFromText (), Geometry và Geography nhận ra thể hiện
này là Point. Nếu ta định nghĩa cùng trường hợp trên bằng cách sử dụng các
phương thức STGeomFromText (), các loại dữ liệu của cả 2 kiểu Geometry và
Geography cũng nhận biết được đây là thể hiện của một điểm. (Tham khảo
[13])
Các kiểu dữ liệu của Geometry và Geography được chia thành 2 nhóm là
Simple và Collection. Trong đó loại Simple bao gồm các kiểu: Point,
LineString, CircularString, CompoundCurve, Polygon và CurvePolygon. Loại
Collection bao gồm các kiểu: MultiPoint, MultiLineString, MultiPolygon,
GeometryCollection.

Bảng 2.1: Các kiểu dữ liệu không gian trong SQL server (2008)
Point
Point là một đối tượng đại diện cho một điểm duy nhất. Nó
luôn luôn được xác định bởi cặp tọa độ ( X,Y) và có thể có
thêm một độ cao Z và một độ đo M.

27

MultiPoint
Đối tượng MultiPoint là một tập hợp của các điểm. Nó khác
với LineString và Polygon là không có kết nối giữa các điểm
trong tập hợp điểm. Vì vậy MutiPoint là đối tượng không có
ranh giới.

LineString
LineString cũng là một bộ tập hợp của các điểm được kết nối
với nhau. Đối tượng LineString đại diện cho các phân đoạn
đường kết nối các điểm.


MultiLineString
Một MultiLineString chỉ đơn giản là một tập hợp của
LineStrings.


Polygon
Polygon là một tập hợp của các điểm đại diện cho một bề
mặt hai chiều. Một Polygon có thể bao gồm một vòng bên
ngoài và một số các vòng bên trong. Các vòng bên trong
không cắt nhau.



MultiPolygon
MultiPolygon là một tập hợp các Polygon.


GeometryCollection
GeometryCollection là một tập hợp các đối tượng Geometry
hoặc Geography.


(nguồn: )
2.4.3 Sự khác nhau giữa kiểu dữ liệu Geometry và Geography trong SQL
Server
Hai kiểu dữ liệu trên có những thuộc tính và phương thức tương tự
28

nhau nhưng cũng có một số khác biệt quan trọng trong việc lưu trữ dữ liệu và
thao tác trên chúng.
a) Cạnh kết nối
- Dữ liệu xác định cho LineString và Polygon là các đỉnh. Cạnh kết nối
giữa hai đỉnh trong Geometry là một đường thẳng. Tuy nhiên, cạnh kết nối
giữa hai đỉnh trong Geography lại là một cung.
- Cung trong Geometry được xác định trên mặt phẳng XY của hệ tọa độ
Đêcac (giá trị Z được bỏ qua). Trong Geography Cung được xác định bởi các
phân đoạn đường cong trên một quả cầu tham chiếu.
b) Đơn vị trong các phép đo lường
- Trong kiểu dữ liệu Geometry, hay trong không gian phẳng, các phép
đo khoảng cách và các khu vực được đưa ra trong cùng một đơn vị đo lường
là tọa độ. Ví dụ khi sử dụng kiểu dữ liệu Geometry, khoảng cách giữa 2 điểm

A(2, 2) và B(5, 6) là 5 đơn vị, bất kể các đơn vị được sử dụng.
- Trong hệ thống elip sử dụng kiểu dữ liệu Geography tọa độ được đưa
ra ở mức độ vĩ độ và kinh độ. Đơn vị đo lường phụ thuộc vào định danh tham
chiếu không gian (SRID) của thể hiện vị trí địa lý. Các đơn vị phổ biến nhất
của đo lường đối với các kiểu dữ liệu Geography là mét.
c) Hướng của dữ liệu không gian
Trong hệ thống phẳng (sử dụng kiểu Geometry), hướng của một
Polygon không phải là một yếu tố quan trọng. Ví dụ, một Polygon được mô tả
bởi các đỉnh ((0, 0), (10, 0), (0, 20), (0, 0)) là tương tự như một Polygon được
mô tả bởi các đỉnh ((0, 0), (0, 20), (10, 0), (0, 0)). Tiêu chuẩn Open
Geospatial Consortium (OGC) Simple Features for SQL Specification không
yêu cầu về hướng và SQL Server không thực thi hướng trong kiểu dữ liệu
Geometry.
Trong một hệ thống elip, một Polygon sẽ không có ý nghĩa hoặc rất mơ
hồ khi nó không có định hướng. Ví dụ, một vòng quanh đường xích đạo có
thể mô tả bán cầu phía bắc hoặc phía nam? Nếu chúng ta sử dụng các kiểu dữ
29

liệu địa lý để lưu trữ các trường hợp không gian, chúng ta phải xác định định
hướng của vòng và mô tả chính xác vị trí.
2.5 CƠ SỞ DỮ LIỆU KHÔNG GIAN GEODATABASE
2.5.1 Đặc điểm và các loại Geodatabase
Khái niệm Geodatabase ra đời bởi Esri cùng với sự ra đời của họ phần
mềm ArcInfo 8.x. Geodatabase là một cơ sở dữ liệu cho phép lưu trữ, truy
vấn và xử lý dữ liệu địa lý được lưu trữ bởi các cấu trúc dữ liệu khác nhau.
Hai cấu trúc dữ liệu thường được sử dụng là raster và vector. Ngoài ra
Geodatabase còn có khả năng lưu trữ và quản lý các quan hệ không gian
(Topololy, Network), ràng buộc dữ liệu (Domain, Subtype) và các giao tác dữ
liệu. Như vậy để có được một hệ thống Gis hoàn chỉnh thì ta cần phải xây
dựng Geodatabase vì những lợi ích mà nó mang lại.

Việc thiết kế cơ sở dữ liệu đóng vai trò quan trọng và mang tính quyết
định trong tiến trình xây dựng hệ thống GIS. Đây cũng là vấn đề đòi hỏi nhiều
công sức và thời gian. Với sự tiến bộ của công nghệ phần mềm hướng đối
tượng đã cung cấp một số phương pháp và công cụ thiết kế Geodatabase khá
hữu hiệu giúp cho việc thiết kế Geodatabase trở nên đơn giản hơn và ít sai sót.
Geodatabase có các đặc điểm chức năng sau:
+ Lưu trữ một tập hợp đa dạng của dữ liệu không gian ở một nơi tập
trung.
+ Áp dụng các quy tắc phức tạp và các mối quan hệ của dữ liệu.
+ Xác định các quan hệ không gian giữa các đối tượng địa lý
(topologies, networks).
+ Duy trì tính toàn vẹn của dữ liệu không gian trong cơ sở dữ liệu.
+ Cung cấp môi trường đa người dùng và cho phép truy cập, chỉnh sửa
tích hợp dữ liệu không gian với cơ sở dữ liệu khác ngoài hệ thống.
+ Dễ dàng mở rộng giải pháp lưu trữ dữ liệu.
+ Hỗ trợ việc chỉnh sửa các thuộc tính và phương thức của đối tượng.
+ Khai thác các tiềm năng của dữ liệu không gian một cách hiệu quả.
30

Geodatabase được thiết kế cho những mục đích khác nhau của người sử
dụng. Hai mô hình Geodatabase được sử dụng là Single-User Geodatabase và
Multiuser Geodatabase.
2.5.1.1 Single-User Geodatabase

Hình 2.22: Single-user Geodatabase
(nguồn: www.esri.com)
Single User Geodatabase thích hợp cho các ứng dụng Gis riêng lẻ trong
môi trường Desktop. Cơ sở dữ liệu được lưu trữ trong file có cấu trúc đặc biệt
(shapfile) hoặc trong một hệ quản trị CSDL Personal như Microsoft Access.
2.5.1.2 Multiuser Geodatabase


Hình 2.23: Multiuser Geodatabase
(nguồn: www.esri.com)
Multiuser Geodatabases sử dụng công nghệ ArcSDE của Esri thực hiện
trên nền tảng của hệ quản trị cơ sở dữ liệu quan hệ (RDBMS) để:
+ Cung cấp cho người sử dụng có một trung tâm lưu trữ dữ liệu và khả
năng mở rộng hệ thống quản lý.
+ Bổ sung các chức năng chưa có trong Single-user Geodatabase.

×