Tải bản đầy đủ (.pdf) (76 trang)

Nghiên cứu các chuẩn OGC (open geospatial consortium) trong hệ thống tin địa lý và ứng dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.76 MB, 76 trang )



ĐẠI HỌC QUỐC GIA HÀ NỘI
VIỆN CÔNG NGHỆ THÔNG TIN






ĐỖ THỊ HƢƠNG







NGHIÊN CỨU CÁC CHUẨN OGC
(OPEN GEOSPATIAL CONSORTIUM) TRONG
HỆ THỐNG TIN ĐỊA LÝ VÀ ỨNG DỤNG








LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN









Hà Nội – 2014


ĐẠI HỌC QUỐC GIA HÀ NỘI
VIỆN CÔNG NGHỆ THÔNG TIN




ĐỖ THỊ HƢƠNG





NGHIÊN CỨU CÁC CHUẨN OGC
(OPEN GEOSPATIAL CONSORTIUM) TRONG
HỆ THỐNG TIN ĐỊA LÝ VÀ ỨNG DỤNG

Ngành: Công nghệ thông tin
Chuyên ngành: Quản lý hệ thống thông tin
Mã số: Chuyên ngành đào tạo thí điểm




LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN




NGƢỜI HƢỚNG DẪN KHOA HỌC:



PGS.TS ĐẶNG VĂN ĐỨC




Hà Nội – 2014

i

LỜI CAM ĐOAN
Tôi xin cam đoan rằng nội dung và những kết quả của luận văn tốt nghiệp này
là do tôi tự nghiên cứu dƣới sự hƣớng dẫn của PGS.TS Đặng Văn Đức. Trong toàn bộ
nội dung của luận văn, những điều đƣợc trình bày là của cá nhân tôi hoặc đƣợc tổng
hợp từ nhiều nguồn tài liệu khác. Tất cả các tài liệu tham khảo đều đƣợc trích dẫn rõ
ràng ở phần cuối của luận văn.
Tôi xin hoàn toàn chịu trách nhiệm và chịu mọi hình thức kỷ luật theo quy định
cho lời cam đoan của mình.



Hà Nội, ngày 01 tháng 12 năm 2014
Học viên



Đỗ Thị Hƣơng



ii

LỜI CẢM ƠN
Tôi xin chân thành cảm ơn sâu sắc đến thầy PGS.TS.Đặng Văn Đức. Thầy đã
tận tình hƣớng dẫn, chỉ bảo và tạo điều kiện tốt cho tôi trong suốt quá trình thực hiện
luận văn.
Tôi cũng xin gửi lời cảm ơn đến các thầy giáo, cô giáo trong Viện công nghệ
thông tin – ĐH Quốc Gia Hà Nội đã truyền đạt những kiến thức cùng các phƣơng pháp
nghiên cứu khoa học bổ ích và hiện đại để tôi có đƣợc cơ sở vững chắc và hoàn thành
luận văn này.
Cảm ơn bạn học viên cao học khóa K3 đã tạo điều kiện cho tôi trao đổi, chia sẻ
kiến thức và kinh nghiệm thực tế qua các môn học, các buổi thảo luận và làm việc
cùng nhóm. Các bạn đã giúp tôi hiểu thêm nhiều vấn đề mà tôi chƣa có điều kiện tìm
hiểu, chỉ cho tôi những thứ tôi chƣa làm đƣợc.
Cuối cùng, tôi xin gửi lời cảm ơn tới gia đình tôi đã luôn ủng hộ tôi trên con
đƣờng học tập và nghiên cứu với nhiều khó khăn, vất vả. Mặc dù tôi đã cố gắng hết
sức trong quá trình làm luận văn nhƣng không thể tránh khỏi thiếu sót, rất mong nhận
đƣợc những góp ý của thầy cô và các bạn.

1


MỞ ĐẦU
1. Tính cấp thiết
Hệ thống thông tin địa lý-GIS ra đời đánh dấu một bƣớc phát triển trong ngành
công nghệ quản lý không gian lãnh thổ trên cơ sở tích hợp các thông tin bản đồ và
thông tin thuộc tính của các đối tƣợng và ngày càng đƣợc sử dụng trong nhiều ngành
nghề khác nhau nhƣ quản lý đất đai, xây dựng bản đồ sử dụng đất, quản lý hành
chính…Vì thế, những ƣu điểm của công nghệ GIS đang đƣợc quan tâm chú ý phát
triển.
Mặt khác, nhƣ chúng ta đã biết, vai trò của Internet ngày nay càng đƣợc khẳng
định và không thể thiếu trong việc quảng bá thông tin của một quốc gia hay một lãnh
thổ.Với Web, ta có thể chia sẻ thông tin với mọi ngƣời, mọi nơi, mọi lúc. Ngày nay,
cùng với sự phát triển mạnh mẽ của hệ thống mạng toàn cầu-Internet, các chuyên gia
bắt đầu quan tâm đến sự kết hợp công nghệ GIS và công nghệ Web, hay còn gọi là
WebGIS nhằm phát huy những thế mạnh của côngnghệ GIS thông qua nền tảng Web.
Nói cách khác, nhờ vào WebGIS mà ta có thể sử dụng những tính năng của một hệ
GIS thực thụ và có thể thực hiện việc chia sẻ thông tin một cách tiện lợi và dễ dàng.
Và không chỉ dừng lại ở đó, bắt nhịp cùng xu hƣớng toàn cầu hóa, xu hƣớng sử
dụng mã nguồn mở đƣợc đƣa ra trong ngành công nghệ thông tin và nhanh chóng
đƣợc sự hƣởng ứng và đóng góp của các nƣớc trên thế giới. Tổ chức OGC
(OpenGeospatial Consortium) với mục tiêu xây dựng các chuẩn thực thi chung cho
lĩnh vực dữ liệu không gian càng đƣa GIS gần đến với mọi ngƣời hơn. Và nhƣ chúng
ta đã biết, WebGIS kết hợp với các chuẩn mở OGC là con đƣờng giới thiệu những sản
phẩm về GIS và dữ liệu địa lý nhanh nhất đến cộng đồng mạng toàn thế giới. Chính vì
lý do đó em lựa chọn đề tài “NGHIÊN CỨU CÁC CHUẨN OGC (OPEN
GEOSPATIAL CONSORTIUM) TRONG HỆ THÔNG TIN ĐỊA LÝ VÀ ỨNG
DỤNG” nhằm nghiên cứu các chuẩn mở OGC và dựa trên các chuẩn đó xây dựng ứng
dụng thử nghiệm với OGC cho bài toán hiển thị Phân bổ sinh viên của một trƣờng học
trên bản đồ.
2. Mục tiêu đề tài
Đề tài nhằm mục tiêu tìm hiểu và thực hiện cách thức chia sẻ thông tin bằng

OGC.
Mục tiêu cụ thể:
- Tìm hiểu chuẩn OGC
- Tìm hiểu cách thức xây dựng một dịch vụ dữ liệu theo chuẩn OGC trên một
bộ dữ liệu sẵn có và thực hiện một ví dụ cụ thể.

2

Từ các mục tiêu đã đề ra, đề tài đƣa ra các câu hỏi nghiên cứu nhằm có đƣợc sự
định hƣớng đúng cho việc thực hiện đề tài.
- OGC là gì?
- Những chuẩn của OGC gồm những gì?
- Muốn đƣa lớp dữ liệu trên trang web theo chuẩn OGC ta phải làm sao?
3 Giới hạn đề tài
* Giới hạn về thời gian:
Đề tài đƣợc giới hạn thực hiện trong khoảng thời gian từ 1/6/2014 đến
20/11/2014.
* Giới hạn về công nghệ
Đề tài sử dụng công nghệ WebGIS mã nguồn mở với các ứng dụng:
- Web Server: Apache.
- Map Server: Geoserver.
- Thƣ viện hỗ trợ: OpenLayers, GeoExt.
- Dữ liệu: Bản đồ Hà Nội, Shapefile
* Giới hạn về nội dung:
Chỉ nghiên cứu cách thức thức xây dựng một dịch vụ dữ liệu theo chuẩn OGC
trên một bộ dữ liệu sẵn có và nghiên cứu một số chuẩn cơ bản nhƣ WMS, SLD…
4. Ý nghĩa khoa học của đề tài
Đề tài góp phần vào việc phát triển và mở rộng công nghệ Web hiện nay theo
hƣớng WebGIS mã nguồn mở, tích hợp thông tin không gian và thông tin thuộc tính
thành một hệ thống thông tin hoàn chỉnh trên nền Web.

Đề tài là nền tảng trong việc nghiên cứu và ứng dụng WebGIS mã nguồn mở
phục vụ lĩnh vực kinh tế - xã hội khác nói chung.
5. Ý nghĩa thực tiễn của đề tài
Ứng dụng mã nguồn mở Geoserver xây dựng trang WebGIS mã nguồn mở hỗ
trợ cho việc cung cấp các thông tin về sinh viên trong nhà trƣờng, từ đó giúp lãnh đạo
nhà trƣờng có thể so sánh đƣợc những thuận lợi và khó khăn trong việc tuyển sinh của
nhà trƣờng mà có các chiến lƣợc đối với từng địa điểm.


3

MỤC LỤC
LỜI CAM ĐOAN 1
MỞ ĐẦU 1
BẢNG CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT 4
DANH MỤC CÁC HÌNH VẼ 5
CHƢƠNG 1-KHÁI QUÁT VỀ HỆ THỐNG THÔNG TIN ĐỊA LÝ 7
1.1. Khái niệm hệ thống thông tin địa lý-Geographic Information System (GIS) 7
1.2. Thành phần và chức năng GIS 8
1.2.1. Các thành phần của GIS 8
1.2.2. Chức năng của hệ GIS 14
1.3. Các mô hình dữ liệu GIS 15
1.3.1. Khái niệm về dữ liệu địa lý: 15
1.3.2. Các mô hình dữ liệu GIS 16
1.4. Tích hợp GIS và Web 27
1.4.1. Tìm hiểu về WebGIS 27
1.4.2. Sơ đồ hoạt động của WebGIS. 29
1.4.3. Tổng quan kiến trúc công nghệ WebGIS 29
CHƢƠNG 2-NGHIÊN CỨU CÁC CHUẨN OPEN GEOSPATIAL CONSORTIUM
(OGC) 34

2.1. Giới thiệu Open Geospatial Consortium (OGC) 34
2.2. Các chuẩn thực thi của OGC sử dụng trong quá trình xây dựng hệ thống 39
2.2.1. Chuẩn thực thi của OGC 39
2.2.2. Đặc tả các chuẩn OGC 41
2.3. Giới thiệu mã nguồn mở ứng dụng chuẩn OGC 44
2.3.1. Mapserver 44
2.3.2. Map Window 46
2.3.3. GeoServer 46
CHƢƠNG 3: XÂY DỰNG THỬ NGHIỆM VỚI OGC CHO BÀI TOÁN PHÂN BỔ
SINH VIÊN CỦA MỘT TRƢỜNG HỌC 58
3.1. Mô tả bài toán 58
3.2. Thu thập dữ liệu 59
3.3. Phân tích thiết kế hệ thống 60
3.3.1. Thiết kế kiến trúc hệ thống 60
3.3.2. Mô hình hệ thống 64
3.4. Lập trình hệ thống GIS trên nền mã nguồn mở GeoServer 65
3.4.1. Đƣa dữ liệu trong Shapefile lên GeoServer và tạo kiểu hiển thị (style) cho
các lớp dữ liệu. 65
3.4.2. Cài đặt và thử nghiệm 69
KẾT LUẬN 71
TÀI LIỆU THAM KHẢO 72

4

BẢNG CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT

Ký hiệu
Diễn giải
Tiếng việt
GIS

Geographic Information System

Hệ thống thông tin địa lý

OGC
Open Geospatial Consortium

Một tổ chức xây dựng các chuẩn
mở trên cơ sở vị trí và không gian
địa lý

WebGIS

Website Geographic Information
System

Hệ thống thông tin địa lý trên nền
tảng Web

SOA

Service Oriented Architecture

Kiến trúc hƣớng dịch vụ

HTML

HyperText Markup Language

Ngôn ngữ đánh dấu siêu văn bản


HTTP

Hypertext Transfer Protocol

Giao thức truyền siêu văn bản

XML

eXtensible Markup Language

Ngôn ngữ đánh dấu mở rộng

GML

Geography Markup Language

Ngôn ngữ đánh dấu địa lý

WMS

Web Map Service

Tạo và hiển thị các bản đồ

WFS

Web Feature Service

Cung cấp dữ liệu thực đƣợc mã

hóa trong GML

CAT

Catalog Interface

Định nghĩa các giao diện chuẩn

SLD

Styled Layer Descriptor

Một mã hóa cho đặc tả WMS

CSDL

Database System

Cơ sở dữ liệu của hệ thống




5

DANH MỤC CÁC HÌNH VẼ
Hình 1.1 Chu trình xử lý thông tin địa lý 8
Hình 1.2: Các thành phần cứng chính của hệ thống thông tin địa lý 9
Hình 1.3: Thành phần phần mềm cơ bản của hệ thống thông tin địa lý 10
Hình 1.4: Sơ đồ nhập số liệu 10

Hình 1.5: Mô hình của modul quản lý và lƣu trữ cơ sở dữ liệu 11
Hình 1.6: Chỉnh sửa dữ liệu 12
Hình 1.7: Xuất dữ liệu 12
Hình 1.8: Mô hình dữ liệu không gian 13
Hình 1.9 Minh họa mô hình thế giới thực bằng dữ liệu GIS 15
Hình 1.10: Các chức năng đƣợc yêu cầu cho một hệ GIS 15
Hình 1.12 Minh họa mô hình thế giới thực bằng dữ liệu GIS 17
Hình 1.14: Ma trận không gian của một file ảnh raster có cấu trúc pixel 18
Hình 1.15: Các đối tƣợng không gian đƣợc mã hoá trong mô hình Raster 18
Hình 1.16: Cấu trúc dữ liệu Raster 19
Hình 1.17: Mô hình cấu trúc Raster 20
Hình 1.18. Biểu diễn bản đồ vector [1] 23
Hình 1.20. Dữ liệu topology vector 24
Hình 1.19. Chuyển đổi cấu trúc dữ liệu (Nguồn: Tor Bernhardsen, 1992) 26
Hình 1.20: Sơ đồ hoạt động của WebGIS 29
Hình 1.21: Sơ đồ kiến trúc 3 tầng của WebGIS (3-tier) 30
Hình 1.22: Kiến trúc n-tier giữa các hệ thống 31
Hình 1.23: Kiến trúc n-tier tƣơng tác giữa Client và các hệ thống 32
Hình 2.1: Khó khăn trong việc chia sẻ dữ liệu 34
Hình 2.2: Giải pháp của OGC 35
Hình 2.3: Giao diện của Web Map Service 42
Hình 2.4: Sơ đồ hoạt động của Mapserver 45
Hình 2.5: Giao diện GeoServer [10] 47
Hình 2.6: Quy trình hiển thị bản đồ trên GeoServer 57
Hình 3.1: Sơ đồ tiến trình thực hiện Error! Bookmark not defined.

6

Hình 3.5: Hộp thoại tạo Workspace 65
Hình 3.6: Hộp thoại tạo Store 66

Hình 3.7: Hộp thoại thông tin về kho dữ liệu 66
Hình 3.8: Hộp thoại tạo layer 67
Hình 3.9: Hộp thoại chọn hệ tọa độ trong GeoServer 67
Hình 3.10: Code tạo kiểu hiển thị 68
Hình 3.11: Code tạo kiểu hiển thị đƣờng phố 68
Hình 3.12: Hộp thoại chọn kiểu hiển thị (style) cho lớp bản đồ (layer) 69
Hình 3.13: Lớp bản đồ quận nội thành đƣợc chọn kiểu hiển thị 69



7

CHƢƠNG 1-KHÁI QUÁT VỀ HỆ THỐNG THÔNG TIN ĐỊA LÝ
1.1. Khái niệm hệ thống thông tin địa lý-Geographic Information System
(GIS)
Hệ thống thông tin địa lý - Geographic Information System (GIS) là một nhánh
của công nghệ thông tin, đã hình thành từ những năm 1960 và phát triển rất mạnh
trong những năm gần đây.
GIS đƣợc sử dụng nhằm xử lý đồng bộ các lớp thông tin không gian (bản đồ)
gắn với các thông tin thuộc tính, phục vụ nghiên cứu, quy hoạch và quản lý các hoạt
động theo lãnh thổ.
Ngày nay, ở nhiều quốc gia trên thế giới, GIS đã trở thành công cụ trợ giúp
quyết định trong hầu hết các hoạt động kinh tế-xã hội, an ninh, quốc phòng, đối phó
với thảm hoạ thiên tai GIS có khả năng trợ giúp các cơ quan chính phủ, các nhà quản
lý, các doanh nghiệp, các cá nhân đánh giá đƣợc hiện trạng của các quá trình, các
thực thể tự nhiên, kinh tế-xã hội thông qua các chức năng thu thập, quản lý, truy vấn,
phân tích và tích hợp các thông tin đƣợc gắn với một nền bản đồ số nhất quán trên cơ
sở toạ độ của các dữ liệu bản đồ đầu vào.
Với những khả năng của GIS nhƣ trên vì vậy mà có thể định nghĩa GIS nhƣ
sau: GIS là một hệ thống kết hợp giữa con ngƣời và hệ thống máy tính cùng các

thiết bị ngoại vi để lƣu trữ, xử lý, phân tích, hiển thị các thông tin địa lý để phục
vụ một mục đích nghiên cứu, quản lý nhất định.
GIS có thể nhìn nhận dƣới nhiều góc độ khác nhau nhƣ:
- Dƣới góc độ là công cụ, GIS dùng để thu thập, lƣu trữ, biến đổi, hiển thị các
thông tin không gian nhằm thực hiện các mục đích cụ thể.
- Dƣới góc độ là phần mềm, GIS làm việc với các thông tin không gian, phi
không gian, thiết lập quan hệ không gian giữa các đối tƣợng. Có thể nói các chức năng
phân tích không gian đã tạo ra diện mạo riêng cho GIS.
- Dƣới góc độ ứng dụng trong quản lý nhà nƣớc, GIS có thể đƣợc hiểu nhƣ là
một công nghệ xử lý các dữ liệu có toạ độ để biến chúng thành các thông tin trợ giúp
quyết định phục vụ các nhà quản lý.
- Dƣới góc độ hệ thống, GIS là hệ thống gồm các thành phần: Phần cứng, Phần
mềm, Cơ sở dữ liệu và Cơ sở tri thức chuyên gia.

8




Nhƣ vậy có thể nói: GIS là một hệ thống bao gồm phần cứng, phần mềm, dữ
liệu địa lý, và con ngƣời đƣợc thiết kế để thu nhận, quản lý, thao tác, phân tích và
hiển thị các thông tin địa lý.
1.2. Thành phần và chức năng GIS
1.2.1. Các thành phần của GIS
GIS đƣợc kết hợp bởi 5 thành phần cơ bản: Con ngƣời, phần cứng, phần mềm,
dữ liệu và phƣơng pháp phân tích

Hình 1.2: Các thành phần của GIS
1.2.1.1. Phần cứng
Hình 1.1 Chu trình xử lý thông tin địa lý


9

Phần cứng là hệ thống máy tính trên đó một hệ GIS hoạt động. Ngày nay, phần
mềm GIS có khả năng chạy trên nhiều dạng phần cứng, từ máy chủ trung tâm đến các
trạm hoạt động độc lập hoặc liên kết mạng.
Phần cứng tổng quát của Hệ thống thông tin địa lý gồm những thiết bị đƣợc thể
hiện theo sơ đồ sau (Hình 1.2):

Hình 1.3: Các thành phần cứng chính của hệ thống thông tin địa lý
Đơn vị xử lý trung tâm đƣợc kết nối với đơn vị lƣu trữ gồm ổ đĩa, băng từ để
lƣu trữ dữ liệu và chƣơng trình. Bàn số hóa hoặc các thiết bị tƣơng tự khác đƣợc xử lý
dùng cho chuyển đổi dữ liệu trong bản đồ thành dạng số và gửi vào máy tính.Máy vẽ
hoặc các thiết bị hiển thị khác dùng để hiển thị các kết quả xử lý dữ liệu. Băng từ còn
sử dụng để truyền thông với các hệ thống khác. Việc kết nối truyền thông các máy tính
đƣợc thực hiện thông qua hệ thống mạng với các đƣờng dữ liệu đặc biệt hoặc đƣờng
điện thoại qua modem. Thiết bị hình là thiết bị giao tiếp hiển thị nhƣ màn hình, thông
qua đó ngƣời sử dụng điều khiển máy tính.
1.2.1.2. Phần mềm
Phần mềm GIS cung cấp các chức năng và các công cụ cần thiết để lƣu giữ,
phân tích và hiển thị thông tin địa lý. Phần mềm GIS cho phép:
- Nhập dữ liệu
- Lƣu trữ và quản lý dữ liệu
- Phân tích dữ liệu
- Xuất dữ liệu
- Tƣơng tác với ngƣời sử dụng.
Các phần mềm GIS mang dáng dấp của phầm mềm vẽ bản đồ tự động và
phầnmềm quản lý cơ sở dữ liệu.
Các thành phần phần mềm cơ bản của Hệ thống thông tin địa lý đƣợc thể hiện
qua sơ đồ trên hình 1.4. Hệ thống phần mềm của Hệ thống thông tin địa lý lại bao gồm

năm thành phần cơ bản, thực hiện các chức năng sau:

10

- Nhập và kiểm tra dữ liệu.
- Lƣu trữ và quản lý cơ sở dữ liệu.
- Xuất dữ liệu.
- Chỉnh sửa dữ liệu.
- Tƣơng tác với ngƣời sử dụng.

Hình 1.4: Thành phần phần mềm cơ bản của hệ thống thông tin địa lý
Dƣới đây trình bày chi tiết bốn chức năng chính của hệ thống phần mềm sử
dụng trong một hệ thống thông tin địa lý. Đó là các chức năng nhập, lƣu trữ-quản lý,
chỉnh sửa và xuất dữ liệu.
1.2.1.2.1. Nhập dữ liệu

Hình 1.5: Sơ đồ nhập số liệu
Hệ thống này bao gồm tất cả các công cụ và phƣơng pháp thực hiện quy trình
biến đổi dữ liệu đã ở dạng bản đồ, dữ liệu quan trắc, các dữ liệu đo từ các bộ cảm biến
(bao gồm ảnh vũ trụ, ảnh hàng không, thiết bị ghi) thành dạng số tƣơng thích. Rất

11

nhiều công cụ máy tính sẵn có cho công việc này bao gồm các thiết bị đầu cuối tƣơng
tác, thiết bị hiển thị nhìn thấy đƣợc, thiết bị số hóa, thiết bị quét, các dữ liệu trong tệp
văn bản. Dữ liệu nhập vào sẽ đƣợc lƣu trữ trên thiết bị từ nhƣ đĩa, băng từ. Quá trình
nhập và kiểm tra dữ liệu rất cần thiết cho việc xây dựng cơ sở dữ liệu địa lý. Sơ đồ hệ
thống nhập dữ liệu trong một hệ thông tin địa lý đƣợc minh họa trên hình 1.4.
1.2.1.2.2. Lƣu trữ và quản lý cơ sở dữ liệu
Lƣu trữ và quản lý cơ sở dữ liệu đề cập đến phƣơng pháp kết nối các dữ liệu

không gian và thông tin thuộc tính của các đối tƣợng địa lý (điểm, đƣờng, vùng đại
diện cho các đối tƣợng thực trên bề mặt Trái Đất). Cả hai loại dữ liệu đó đƣợc cấu
trúc, tổ chức liên hệ với cách chúng sẽ đƣợc thao tác trong máy tính sao cho ngƣời sử
dụng hệ thống có thể hiểu đƣợc.
Mô hình của modul quản lý và lƣu trữ cơ sở dữ liệu đƣợc minh họa trên hình
I.6.

Hình 1.6: Mô hình của modul quản lý và lưu trữ cơ sở dữ liệu
1.2.1.2.3. Chỉnh sửa dữ liệu
Chỉnh sửa dữ liệu gồm hai loại thao tác nhằm mục đích xoá bỏ lỗi từ dữ liệu và
cập nhật chúng. Modul này áp dụng các phƣơng pháp phân tích dữ liệu khác nhau để
tìm ra câu trả lời cho các yêu cầu, các câu hỏi của hệ thống thông tin địa lý. Việc chỉnh
sửa dữ liệu có thể thực hiện riêng biệt đối với các dữ liệu không gian và thông tin
thuộc tính hoặc đồng thời đối với cả hai loại dữ liệu này. Chỉnh sửa dữ liệu có thể hiểu
nhƣ các hành động đƣợc kết nối với việc thay đổi tỷ lệ, phù hợp dữ liệu khi chuyển
sang lƣới chiếu mới, tính toán chu vi diện tích
Nói chung các thao tác đó phụ thuộc vào mục đích cụ thể của ứng dụng hệ
thống thông tin địa lý.

12


Hình 1.7: Chỉnh sửa dữ liệu
1.2.1.2.4. Xuất dữ liệu
Modul xuất dữ liệu (hình 1.8) đƣa các báo cáo kết quả của quá trình phân tích
dữ liệu tới ngƣời sử dụng. Dữ liệu đƣợc đƣa ra có thể dƣới dạng bản đồ, bảng, biểu đồ,
lƣu đồ đƣợc thể hiện bằng hình ảnh trên màn hình, máy in, máy vẽ hoặc đƣợc ghi trên
các thiết bị từ dƣới dạng số.

Hình 1.8: Xuất dữ liệu

1.2.1.3. Dữ liệu
Dữ liệu có thể xem là thành phần quan trọng nhất, chiếm chi phí cao nhất trong
hệ (trên 60%). Khi đề cập đến dữ liệu cần chú đến các vấn đề sau:
- Chất lƣợng dữ liệu (tính chính xác, tính cập nhật, tính đầy đủ …).
- Sự phù hợp với ứng dụng.
- Định dạng format dữ liệu.
- Kích thƣớc, độ lớn của dữ liệu.
- Khả năng truy cập của ngƣời dùng.
Dữ liệu địa lý có thể lấy từ nhiều nguồn và nhiều hình thức khác nhau:
- Các bản đồ có sẵn.

13

- Các ảnh viễn thám (ảnh máy bay và ảnh vệ tinh).
- Có số liệu đo đạc mặt đất, số liệu điều tra thực địa…
Dữ liệu đƣợc chia ra dữ liệu không gian và dữ liệu thuộc tính. Dữ liệu thuộc
tính đƣợc lƣu trữ trong hệ quản trị cơ sở dữ liệu theo mô hình quan hệ là phổ biến
nhất.
Trong khi đó, dữ liệu không gian đƣợc lƣu trữ theo hai mô hình: mô hình dữ
liệu vector và mô hình dữ liệu raster.

Hình 1.9: Mô hình dữ liệu không gian
1.2.1.4. Con ngƣời.
Con ngƣời là nhân tố thực hiện các thao tác điều hành sự hoạt động của các hệ
thống GIS, vì GIS thƣờng là hệ thống lớn và phức tạp nên cũng có nhiều đối tƣợng
con ngƣời khác nhau với các mục đích khác nhau nhƣ:
- Ngƣời dùng GIS: Là những ngƣời sử dụng các phần mềm GIS để giải quyết
các bài toán không gian theo mục đích của họ. Họ thƣờng là những ngƣời đƣợc đào
tạo tốt về lĩnh vực GIS hay là các chuyên gia.
- Ngƣời xây dựng bản đồ: sử dụng các lớp bản đồ đƣợc lấy từ nhiều nguồn khác

nhau, chỉnh sửa dữ liệu để tạo ra các bản đồ theo yêu cầu.
- Ngƣời xuất bản: Sử dụng phần mềm GIS để kết xuất ra bản đồ dƣới nhiều
định dạng khác nhau.
- Ngƣời phân tích: Giải quyết các vấn đề nhƣ tìm kiếm, xác định vị trí…

14

- Ngƣời xây dựng dữ liệu: là những ngƣời chuyên nhập dữ liệu bản đồ bằng các
cách khác nhau: vẽ, chuyển đổi từ định dạng khác, truy nhập CSDL…
Ngƣời quản trị CSDL: Quản lý CSDL GIS và đảm bảo hệ thống vận hành tốt.
- Ngƣời thiết kế CSDL: Xây dựng các mô hình dữ liệu lôgic và vật lý.
1.2.1.5. Phƣơng pháp phân tích
Dữ liệu GIS đƣợc hiển thị lên màn hình máy tính hoặc trên giấy in để cung cấp
thông tin cho ngƣời dùng. Trong GIS ngƣời ta dùng hình ảnh, hình vẽ, mô hình trực
quan, chữ viết, biểu đồ, bản đồ, bảng thống kê, ký hiệu, màu sắc, âm thanh để trình
bày vị trí và thuộc tính của các đối tƣợng và các kết quả phân tích.
1.2.2. Chức năng của hệ GIS
Hệ thống thông tin địa lý có sáu chức năng chính: Thu thập, lƣu trữ, truy vấn,
phân tích, hiển thị và xuất dữ liệu.
1.2.2.1. Thu thập (Cature)
Dữ liệu của hệ thống thông tin địa lý có thể đƣợc cung cấp từ bản đồ giấy, số
liệu ghi nhận trên giấy, ảnh vệ tinh hoặc ảnh máy bay, các thiết bị đo đạc kỹ thuật số,
các thiết bị định vị mặt đất, các thiết bị định vị vệ tinh (GPS: Global Position System),
hệ thống thu thập dữ liệu tự động (SCADA: Supervisory Control And Data
Acquisition),…
1.2.2.2. Lƣu trữ (Store)
Các đối tƣợng không gian địa lý có thể biểu diễn theo mô hình vector hoặc
raster.
1.2.2.3. Truy vấn (Query)
Ngƣời dùng có thể truy vấn thông tin đồ họa hiển thị trên bản đồ.

1.2.2.4. Phân tích (Analyze)
Phân tích dữ liệu là khả năng trả lời những câu hỏi về sự tác động lẫn nhau của
những mối quan hệ không gian và thuộc tính giữa nhiều tập dữ liệu. Hỗ trợ việc ra
quyết định của ngƣời dùng. Xác định những tình huống có thể xảy ra khi bản đồ có sự
thay đổi.
1.2.2.5. Hiển thị (Display)
Dữ liệu GIS đƣợc hiển thị lên màn hình máy tính hoặc trên giấy in để cung cấp
thông tin cho ngƣời dùng. Trong GIS ngƣời ta dùng hình ảnh, hình vẽ, mô hình trực
quan, chữ viết, biểu đồ, bản đồ, bảng thống kê, ký hiệu, màu sắc, âm thanh để trình
bày vị trí và thuộc tính của các đối tƣợng và các kết quả phân tích.

15

1.2.2.6. Xuất dữ liệu (Output)
Hỗ trợ việc kết xuất dữ liệu bản đồ dƣới nhiều định dạng: Giấy in, ảnh, file…
1.3. Các mô hình dữ liệu GIS
1.3.1. Khái niệm về dữ liệu địa lý:

Hình 1.10: Minh họa mô hình thế giới thực bằng dữ liệu GIS
Dữ liệu địa lý nhằm phản ảnh thế giới thực, có thể trả lời đƣợc các câu hỏi:
- Cái gì? (dữ liệu thuộc tính).
- Ở đâu? (dữ liệu không gian).
- Khi nào? (thời gian).
- Tƣơng tác với các đối tƣợng khác ra sao? (quan hệ).

Hình 1.11: Các chức năng được yêu cầu cho một hệ GIS
1.3.1.1. Dữ liệu thuộc tính

16


Thể hiện tính chất của đối tƣợng tìm ra cái gì tồn tại ở vị trí cụ thể (ví dụ: chiều
cao của cây rừng, dân số thành phố, bề rộng con đƣờng, ).
1.3.1.2. Dữ liệu không gian
Đƣợc thể hiện trên bản đồ và GIS dƣới dạng điểm (point), đƣờng (line) hoặc
vùng (polygon).
Tìm ra vị trí thỏa mãn một số điều kiện (vùng không có rừng diện tích 2000m
2

và xa đƣờng quốc lộ 100m và loại đất phù hợp cho xây dựng nhà),vị trí địa lý của đối
tƣợng đƣợc thể hiện bằng tọa độ (ví dụ: kinh vĩ độ, tọa độ UTM, ).
1.3.1.3. Thời gian
Tìm ra sự khác biệt theo thời gian trong vùng:
- Thông tin địa lý luôn gắn liền với một thời điểm hoặc một khoảng thời gian
nhất định.
- Biết đƣợc thời gian của thông tin thì chúng ta mới có thể sử dụng thông tin
một cách chính xác.
- Một đối tƣợng của dữ liệu địa lý đƣợc coi là điểm xác định khi có thông tin về
các lĩnh vực trên.
1.3.2. Các mô hình dữ liệu GIS
1.3.2.1. Biểu diễn dữ liệu trong GIS
Có hai dạng cấu trúc dữ liệu cơ bản trong GIS. Đó là dữ liệu không gian và dữ
liệu thuộc tính. Đặc điểm quan trọng trong tổ chức dữ liệu của GIS là: dữ liệu không
gian (bản đồ) và dữ liệu thuộc tính đƣợc lƣu trữ trong cùng một cơ sở dữ liệu (CSDL)
và có quan hệ chặt chẽ với nhau.

Hình 1.12: Minh họa cấu trúc dữ liệu không gian và dữ liệu thuộc tính
1.3.2.2. Mô hình dữ liệu không gian

17


Đây là dạng dữ liệu cơ bản của một hệ thống thông tin địa lý. Dạng dữ liệu này
bao gồm các thông tin có tính đồ họa chỉ rõ hình dạng, phạm vị không gian, vị trí địa
lý của một thực thể trong thế giới thực đƣợc khái quát hóa thành các đặc tính địa lý
nhƣ điểm, đƣờng hay vùng trên bản đồ (ảnh). Trong máy tính số, dữ liệu không gian
của các thực thể có thể đƣợc biểu diễn theo hai mô hình Raster và Vector.
Các đối tƣợng không gian trong GIS đƣợc nhóm theo ba loại đối tƣợng: điểm,
đƣờng và vùng. Trong mỗi kiểu cấu trúc dữ liệu, cách tổ chức dữ liệu cho ba đối tƣợng
không gian trên khác nhau. Tuỳ tỷ lệ hoặc mức độ chi tiết mà các đối tƣợng không
gian đƣợc thiết kế trong GIS khác nhau. Trong tỷ lệ nhỏ thì nhiều khi điểm là cả một
vùng trong tỷ lệ lớn. Ba đối tƣợng không gian dù ở mô hình cấu trúc dữ liệu GIS nào
đều có một điểm chung là vị trí của chúng đều đƣợc ghi nhận bằng giá trị toạ độ trong
một hệ toạ độ nào đó tham chiếu với hệ toạ độ dùng cho Trái đất.


Hình 1.13 Minh họa mô hình thế giới thực bằng dữ liệu GIS

Hình 1.14: Thế giới thực trên hai mô hình raster (a) và vector (b) (Theo Aronnof, 1989)
1.3.2.2.1. Mô hình dữ liệu Raster

18

Khái niệm ảnh Raster: Một file ảnh chụp về một đối tƣợng không gian qua máy
ảnh photo hoặc một ảnh số chụp từ máy chụp số (digital camera) hoặc ảnh số thu nhận
từ các đầu ghi phổ trên các vệ tinh là các ảnh có cấu trúc raster.
Raster đƣợc định nghĩa nhƣ là ma trận không gian của các đơn vị ảnh (picture
element) còn gọi là các pixel. Các pixel có kích thƣớc đồng nhất về mặt hình học,
chúng là các ô vuông nhỏ và đƣợc xếp theo các dòng và các cột giống nhƣ một lƣới ô
vuông (hình 1.15).

Hình 1.15: Ma trận không gian của một file ảnh raster có cấu trúc pixel

Cấu trúc raster là một trong những cấu trúc dữ liệu đơn giản nhất trong GIS. Nó
còn đƣợc gọi là “tổ chức theo ô vuông của dữ liệu không gian” (cellular organization
of spatial data). Pixel là phần tử cơ sở của cấu trúc dữ liệu Raster để biểu diễn một đặc
trƣng địa lý f(x,y) nào đó, giá trị của pixel chỉ tính chất của đối tƣợng không gian. Giá
trị số của pixel chính là mã đƣợc gắn cho đối tƣợng không gian (tức là mỗi đối tƣợng
không gian có một mã nhất định). Giá trị bằng không thƣờng là những pixel chỉ vùng
ngoài khu vực nghiên cứu. Ví dụ các đối tƣợng đất trồng bắp có mã bằng 1, đất trồng
cam có mã bằng 2, đất trồng điều có mã bằng 3, đất trồng mía có mã bằng 4…….
(hình 1.16).

Hình 1.16: Các đối tượng không gian được mã hoá trong mô hình Raster
Nhƣ vậy, mô hình Raster biểu diễn không gian nhƣ là một ma trận số nguyên,
mỗi một giá trị số nguyên đại diện cho một thuộc tính, vị trí của số nguyên chính là vị

19

trí của đối tƣợng. Ma trận không gian từ các ô ảnh này đƣợc mã hoá và lƣu trữ trong
máy tính theo quy luật nhất định thông qua vị trí của từng ô ảnh và đƣợc tham chiếu
tới hệ toạ độ dùng cho Trái đất gọi là hệ toạ độ Cartsian theo hai trục x và y.
Với cấu trúc dữ liệu dạng raster, giá trị của thông số nghiên cứu nhƣ độ cao địa
hình (m), loại đất, sinh khối thực vật (gr/m
2
)…phải đƣợc xác định cho từng ô lƣới
(cell). Trong cấu trúc dữ liệu dạng raster (hình 1.17), các vật thể trên bản đồ có thể
đƣợc mô tả bằng các yếu tố (map feature) sau:
- Điểm (point): có thể đƣợc biểu diễn bằng một fixel hay nhiều fixel tuỳ thuộc
vào tỷ lệ (độ phân giải của ảnh)
- Đƣờng (line): là tập hợp các ô lƣới vuông có cùng giá trị f(x,y) nối tiếp nhau
và sắp xếp theo một hƣớng nhất định.
- Vùng (area): Vùng đƣợc xác định bằng một mảng gồm nhiều pixel có cùng

giá trị thuộc tính f (x,y) trải rộng ra theo nhiều phƣơng.

Hình 1.17: Cấu trúc dữ liệu Raster
Trên thực tế mỗi pixel có một cặp toạ độ (x, y) duy nhất. Một đối tƣợng không
gian có kích thƣớc nhỏ hơn một pixel, ví dụ lớn hơn một nửa pixel, sẽ đƣợc coi nhƣ là
một pixel trọn vẹn và có giá trị về diện tích và toạ độ của chính pixel mà nó nằm trong.
Vì vậy độ phân giải của pixel đóng vai trò hết sức quan trọng về độ chính xác của dữ
liệu Raster. Kích thƣớc đƣợc chọn cho một ô lƣới (pixel) của một vùng nghiên cứu
phụ thuộc vào độ phân giải dữ liệu yêu cầu cho phân tích chi tiết. Ô phải đủ nhỏ để
nắm bắt chi tiết đƣợc yêu cầu, nhƣng đủ lớn để bộ nhớ máy tính và phép toán phân
tích có thể thực hiện hiệu quả.
Một điểm trong thế giới thực là một ngôi nhà thờ trong mô hình Raster sẽ là
một vài pixel có cùng giá trị số (mã). Nếu độ lớn của ngôi nhà theo tỷ lệ nhỏ có thể chỉ
là một pixel. Độ lớn của pixel theo chiều x, y sẽ là độ phân giải không gian của ma
trận raster (trong viễn thám gọi là độ phân giải của ảnh)
Trong cấu trúc Raster, đƣờng đƣợc biểu diễn bằng những pixel có cùng giá trị
f(x,y) liên tiếp nhau. Vì trong cấu trúc Raster, các pixel đƣợc xếp theo hàng, cột, nhƣ

20

một ma trận điểm nên đƣờng nét không trơn, có dạng zic-zac. Vùng đƣợc xác định
bằng một mảng gồm nhiều pixel có cùng giá trị thuộc tính f(x,y) trải rộng ra theo nhiều
phƣơng.

Hình 1.18: Mô hình cấu trúc Raster
Ƣu điểm của cấu trúc dữ liệu dạng raster là dễ thực hiện các chức năng xử lý và
phân tích. Tốc độ tính toán nhanh, thực hiện các phép toán bản đồ dễ dàng. Dễ dàng
liên kết với dữ liệu viễn thám. Cấu trúc raster có nhƣợc điểm là kém chính xác về vị trí
không gian của đối tƣợng. Khi độ phân giải càng thấp (kích thƣớc pixel lớn) thì sự sai
lệch này càng tăng

Mô hình dữ liệu này thích hợp trong mô tả các đối tƣợng, hiện tƣợng phân bố
liên tục trong không gian (độ cao, nhiệt độ, loại hình sử dụng đất…), dùng để lƣu giữ
thông tin dạng ảnh (ảnh mặt đất, hàng không, vũ trụ ). Một số dạng mô hình biểu diễn
bề mặt nhƣ DEM (Digital Elevation Model), DTM (Digital Terrain Model), TIN
(Triangulated Irregular Network) trong CSDL cũng thuộc dạng raster.
* Thuộc tính của ô ảnh
Thuộc tính gán cho ô sẽ định nghĩa phân lớp, nhóm, chủ đề hoặc giá trị đo đƣợc
ở tại vị trí của ô. Ô có thể có giá trị là số nguyên hoặc số thập phân. Khi một giá trị số
nguyên đƣợc sử dụng cho ô ảnh, nó có thể đƣợc dùng làm mã nhận dạng.

21


Hình 1.19: Thuộc tính của ô ảnh
* Các kiểu dữ liệu
Giá trị ô ảnh có thể biểu diễn cho một trong bốn kiểu dữ liệu sau đây:
a. Kiểu dữ liệu định danh (Nominal data): Một giá trị kiểu dữ liệu định danh
giúp nhận dạng thực thể này với thực thể khác. Đây là những giá trị định tính, không
phải là giá trị định lƣợng. Sử dụng nominal data cho phân loại đất.
b. Kiểu dữ liệu thứ tự (Ordinary data): Một giá trị kiểu dữ liệu thứ tự xác định
hạng của một thực thể so với những thực thể khác. Những phép đo này cho thấy vị trí,
nhƣ thứ tự thứ nhất, thứ hai hoặc thứ ba, nhƣng chúng không thiết lập tỷ lệ tƣơng đối
hoặc biên độ. Ta không thể suy luận ra đƣợc sự khác nhau về định lƣợng nhƣ là thực
thể này lớn hơn, cao hơn, hoặc dày đặc hơn những thực thể khác ra sao.
c. Kiểu khoảng dữ liệu: Một giá trị kiểu khoảng dữ liệu đại diện cho một phép
đo theo một thang chia độ nào đấy nhƣ thời gian trong ngày, nhiệt độ Fahrenheit và
giá trị độ PH. Có thể làm những phép so sánh tƣơng đối giữa các khoảng dữ liệu. Việc
so sánh giá trị đo với điểm 0 của thang chia độ là không có ý nghĩa.
d. Kiểu dữ liệu tỷ lệ: Một giá trị kiểu dữ liệu tỷ lệ đại diện một giá trị đo trên
một thang chia độ với điểm gốc 0 cố định và có ý nghĩa. Các toán tử có thể sử dụng

đƣợc những giá trị này để dự đoán kết quả. Những ví dụ của kiểu dữ liệu tỷ lệ là độ
tuổi, khoảng cách, trọng lƣợng và thể tích.
* Các dạng dữ liệu raster
- Ảnh vệ tinh: Thu nhận ảnh vệ tinh là một cách vẽ bản đồ ở mọi tỷ lệ với chi
phí thấp nhất. Ảnh vệ tinh có loại có màu hoặc đen trắng.
- Ảnh hàng không: Đƣợc dùng để tạo ra những bản đồ chi tiết.
- Bản đồ quét.
- Các loại hình ảnh khác.

×