Tải bản đầy đủ (.doc) (79 trang)

Lập trình arcgis engine và ứng dụng trong xây dựng công cụ hỗ trợ biên tập bản đồ số1

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.29 MB, 79 trang )

LỜI CẢM ƠN
Qua thời gian gần 5 năm học tập tại trường Đại học Công nghệ thông tin và truyền
thông Thái Nguyên, đến nay em cũng đã hoàn thành gần hết quá trình học tập tại
trường. Trong quá trình học tập tại trường, ngoài sự cố gắng của bản thân, em đã nhận
được rất nhiều sự quan tâm giúp đỡ nhiệt tình của các thầy cô, gia đình, bạn bè.
Trước tiên, em xin gửi lời cảm ơn đến gia đình: bố, mẹ, và các anh chị luôn quan
tâm chăm sóc, tạo điều kiện tốt cho việc học tập của em.
Em xin gửi lời cảm ơn đến các thầy, cô trong ban lãnh đạo trường, các thầy cô
trong bộ môn và toàn thể các thầy cô đang công tác tại trường là người đã trực tiếp dạy
em trong các môn học, đã tận tình giúp đỡ và tạo điều kiện cho em học tập và rèn luyện
trong suốt thời gian học tập tại trường.
Em cũng xin gửi lời cảm ơn đến PGS.TS Đặng Văn Đức và ThS Nguyễn Sơn –
Viện Công nghệ thông tin – Viện Khoa học và công nghệ Việt Nam đã tận tình hướng
dẫn, giúp đỡ em hoàn thành đồ án này.

Thái Nguyên, ngày tháng 06 năm 2012
Sinh viên thực hiện

Đỗ Đình Si

1


LỜI CAM ĐOAN
Tôi xin cam đoan:
1. Những nội dung trong đồ án này là do tôi thực hiện dưới sự hướng dẫn trực tiếp
của thầy Nguyễn Sơn – Viện Công nghệ thông tin – Viện khoa học và Công
nghệ Việt nam.
2. Mọi tham khảo dùng trong đồ án đều được trích dẫn rõ ràng tên tài liệu, tên tác
giả, năm phát hành.
3. Mọi sao chép không hợp lệ, vi phạm quy chế, hay gian trá, tôi xin chịu hoàn


toàn trách nhiệm.

Sinh viên

Đỗ Đình Sĩ

2


MỞ ĐẦU
1. Giới thiệu
Kỹ thuật "Thông tin Địa lý" (Geograpgic Information System) đã bắt đầu được sử
dụng rộng rãi ở các nước phát triển từ những năm 80, đây là một dạng ứng dụng công
nghệ tin học (Information Technology) nhằm mô tả thế giới thực (Real world) mà loài
người đang sống - tìm hiểu - khai thác. Với những tính năng ưu việt, kỹ thuật GIS ngày
nay đang được ứng dụng trong nhiều lĩnh vực nghiên cứu và quản lý, đặc biệt trong
quản lý và quy hoạch sử dụng - khai thác các nguồn tài nguyên một cách bền vững và
hợp lý.
Hệ thống thông tin địa lý là một kỹ thuật ứng dụng hệ thống vi tính số hoá, xuất
hiện trong những năm 60 cho đến nay công nghệ này được biết đến như là một kỹ thuật
toàn cầu. Trong sự phát triển của đất nước ta hiện nay, việc tổ chức quản lý thông tin
địa lý một cách tổng thể có thể đóng góp không nhỏ vào việc sử dụng có hiệu quả hơn
nguồn tài nguyên của đất nước.
Với sự phát triển vượt bậc và có nhiều hứa hẹn trong tương lai của hệ thống thông
tin địa lý và công nghệ thông tin như hiện nay, em chọn đề tài “Lập trình ArcGIS
Engine và ứng dụng trong xây dựng công cụ hỗ trợ biên tập bản đồ số” làm đồ án tốt
nghiệp với mục đích tìm hiểu và nghiên cứu tổng quan về GIS, bộ thư viện ArcGIS
Engine và xây dựng công cụ hỗ trợ việc xây dựng và biên tập bản đồ.
2. Phạm vi đề tài
Đề tài tập chung vào tìm hiểu tổng quan về GIS và ArcGIS Engine, xây dựng công

cụ thực hiện các phép toán xử lý trong GIS trên nền thư viện ArcObjects của ArcGIS
Engine.

3


MỤC LỤC
LỜI CẢM ƠN....................................................................................................................1
LỜI CAM ĐOAN..............................................................................................................2
1. Giới thiệu..................................................................................................................3
2. Phạm vi đề tài...........................................................................................................3
DANH MỤC HÌNH ẢNH.................................................................................................7
CHƯƠNG 1: TỔNG QUAN VỀ HỆ THỐNG THÔNG TIN ĐỊA LÝ (GEOGRAPHIC
INFORMATION SYSTEM).............................................................................................8
1.1 Khái niệm GIS.........................................................................................................8
1.1.1 Mô hình công nghệ...........................................................................................8
1.1.2 Các lĩnh vực khoa học liên quan đến GIS........................................................9
1.1.3 Một số ứng dụng của GIS...............................................................................10
1.1.4 Các hệ thống tương tác...................................................................................11
1.2 Các thành phần của GIS.......................................................................................11
1.2.1 Con người.......................................................................................................12
1.2.2 Dữ liệu............................................................................................................13
1.2.3 Phần cứng.......................................................................................................13
1.2.4 Phần mềm.......................................................................................................13
1.3 Chức năng của GIS...............................................................................................13
1.3.1 Thu thập dữ liệu..............................................................................................14
1.3.2 Lưu trữ và truy cập dữ liệu.............................................................................16
1.3.3 Tìm kiếm và phân tích dữ liệu không gian....................................................18
4



1.4 Vector và Raster trong GIS..................................................................................23
1.5 Hệ toạ độ địa lý và hệ toạ độ quy chiếu...............................................................24
1.5.1 Hệ toạ độ địa lý...............................................................................................25
1.5.2 Hệ toạ độ quy chiếu........................................................................................27
CHƯƠNG 2: ARCGIS....................................................................................................32
2.1 Giới thiệu bộ thư viện ArcGIS.............................................................................32
2.1.1 ArcGIS 9.........................................................................................................32
2.1.2 ArcGIS Engine................................................................................................34
2.1.3 Ai có thể sử dụng ArcGIS Engine?................................................................37
2.1.4 ArcGIS Engine có thể làm gì?........................................................................39
2.2 Kiến trúc của ArcGIS...........................................................................................43
2.2.1 Kiến trúc phần mềm ArcGIS [3]....................................................................43
2.2.2 Giao diện lập trình ArcGIS............................................................................45
2.2.3 Thư viện ArcGIS Engine................................................................................47
2.3 Các điều khiển trong ArcGIS...............................................................................55
CHƯƠNG 3: XÂY DỰNG CÔNG CỤ HỖ TRỢ BIÊN TẬP BẢN ĐỒ SỐ................60
3.1 Mục đích và ý nghĩa của việc xây dựng công cụ hỗ trợ biên tập bản đồ số........60
3.1.1 Mục đích.........................................................................................................60
3.1.2. Ý nghĩa...........................................................................................................61
3.2 Quy trình công nghệ xây dựng công cụ sử dụng thư viện ArcGIS Engine.........62
3.3 Tích hợp công cụ vào ArcMap và các ứng dụng khác.........................................64
3.4 Minh họa công cụ biên tập bản đồ đã xây dựng..................................................66
5


3.4.1 Giới thiệu phép toán tạo vùng đệm bản đồ [4]..............................................66
3.4.2 Các bước xây dựng công cụ và các hàm đã sử dụng.....................................67
3.4.3 Một số hình ảnh minh họa công cụ................................................................75
KẾT LUẬN......................................................................................................................77

1. Kết quả đạt được.....................................................................................................77
2. Hướng phát triển.....................................................................................................77
TÀI LIỆU THAM KHẢO...............................................................................................78

6


DANH MỤC HÌNH ẢNH

7


CHƯƠNG 1: TỔNG QUAN VỀ HỆ THỐNG THÔNG TIN ĐỊA
LÝ (GEOGRAPHIC INFORMATION SYSTEM)
1.1 Khái niệm GIS
Hệ thống thông tin địa lý – Geographic Information System (GIS) là một tổ chức
tổng thể của bốn hợp phần: phần cứng máy tính, phần mềm, tư liệu địa lý và người
điều hành được thiết kế hoạt động một cách có hiệu quả nhằm tiếp nhận, lưu trữ, điều
khiển, phân tích và hiện thị toàn bộ các dạng dữ liệu địa lý. GIS có mục tiêu đầu tiên
là xử lý hệ thống dữ liệu trong môi trường không gian địa lý.
1.1.1 Mô hình công nghệ
Một cách khái quát, có thể hiểu một hệ GIS như là một quá trình sau:

Hình 1. 1: Mô hình công nghệ GIS
-

Dữ liệu vào: dữ liệu được nhập từ các nguồn khác nhau như chuyển đổi giữa
các cách biểu diễn dữ liệu, máy quét, hình ảnh từ vệ tinh, ảnh chụp…

-


Quản lý dữ liệu: sau khi dữ liệu được thu thập và tổng hợp, GIS cần cung cấp
các thiết bị có thể lưu và bảo trì dữ liệu nhằm đảm bảo: bảo mật số liệu, tích
hợp số liệu, lọc và đánh giá số liệu, khả năng duy trì. GIS lưu thông tin thế giới
thực thành các tầng dữ liệu riêng biệt, các tầng này đặt trong cùng một hệ trục
toạ độ và chúng có khả năng liên kết với nhau.

8


-

Xử lý dữ liệu: các thao tác xử lý dữ liệu được thực hiện để tạo ra thông tin. Nó
giúp cho người sử dụng quyết định cần làm tiếp công việc gì. Kết quả của xử lý
dữ liệu là tạo ra các ảnh, báo cáo và bản đồ.

-

Phân tích và mô hình: số liệu tổng hợp và chuyển đổi chỉ là một phần của GIS.
Những yêu cầu tiếp theo là khả năng giải mã và phân tích về mặt định tính và
định lượng thông tin đã thu thập.

-

Dữ liệu ra: một trong các phương diện công nghệ GIS là sự thay đổi của các
phương pháp khác nhau trong đó thông tin có thể hiển thị khi nó được xử lý
bằng GIS. Các phương pháp truyền thống là bảng và đồ thị có thể cung cấp
bằng các bản đồ và ảnh 3 chiều.

1.1.2 Các lĩnh vực khoa học liên quan đến GIS

GIS là sự hội tụ các lĩnh vực công nghệ và các ngành truyền thống, nó hợp nhất
các số liệu mang tính liên ngành bằng tổng hợp, mô hình hoá và phân tích. Vì vậy có
thể nói, GIS được xây dựng trên các tri thức của nhiều ngành khoa học khác nhau để
tạo ra các hệ thống phục vụ mục đích cụ thể. Các ngành này bao gồm [1]:
-

Ngành địa lý: là ngành liên quan mật thiết đến việc biểu diễn thế giới và vị trí
của đối tượng trong thế giới. Nó có truyền thống lâu đời về phân tích không
gian và nó cung cấp các kỹ thuật phân tích không gian khi nghiên cứu.

-

Ngành bản đồ: nguồn dữ liệu đầu vào chính của GIS là các bản đồ. Ngành bản
đồ có truyền thống lâu đời trong việc thiết kế bản đồ, do vậy nó cũng là khuân
mẫu quan trọng nhất của đầu ra GIS.

-

Công nghệ viễn thám: các ảnh vệ tinh và ảnh máy bay là nguồn dữ liệu địa lý
quan trọng cho hệ GIS. Viễn thám bao gồm cả kỹ thuật thu thập và xử lý dữ
liệu ở mọi vị trí trên quả địa cầu. Các dữ liệu đầu ra của hệ thống ảnh vệ tinh có
thể được trộn với các lớp dữ liệu của GIS.

9


-

Ảnh máy bay: khi ta xây dựng bản đồ có tỷ lệ cao thì ảnh chụp từ máy bay là
nguồn dữ liệu chính về bền mặt trái đất được sử dụng làm đầu vào.


-

Bản đồ địa hình: cung cấp dữ liệu có chất lượng cao về vị trí của ranh giới đất
đai, nhà cửa…

-

Ngành thống kê: các kỹ thuật thống kê được sử dụng để phân tích dữ liệu GIS.
Nó là đặc biệt quan trọng trong việc xác định sự phát sinh các lỗi hoặc tính
không chắc chắn trong số liệu của GIS.

-

Khoa học tính toán: tự động thiết kế máy tính cung cấp kỹ thuật nhập, hiển thị
biểu diễn dữ liệu. Đồ hoạ máy tính cung cấp công cụ để thể hiện, quản lý các
đối tượng đồ hoạ. Quản trị cơ sở dữ liệu cho phép biểu diễn dữ liệu dưới dạng
số, các thủ tục để thiết kế hệ thống, lưu trữ, xâm nhập, cập nhật.

-

Toán học: các ngành hình học, lý thuyết đồ thị được sử dụng trong thiết kế hệ
GIS và phân tích dữ liệu không gian.

1.1.3 Một số ứng dụng của GIS
Công nghệ GIS ngày càng được sử dụng rộng rãi. GIS có khả năng sử dụng dữ liệu
không gian và thuộc tính (phi không gian) từ các nguồn khác nhau khi thực hiện phân
tích không gian để trả lời các câu hỏi của người sử dụng. Một số ứng dụng cụ thể của
GIS thường thấy trong thực tế là:
-


Quản lý hệ thống đường phố, bao gồm các chức năng: tìm kiếm địa chỉ khi xác
định được vị trí cho địa chỉ phố hoặc tìm vị trí khi biết trước địa chỉ phố.
Đường giao thông và sơ đồ; điều khiển đường đi, lập kế hoạch lưu thông xe cộ.
Phân tích vị trí, chọn khu vực xây dựng các tiện ích như bãi đỗ xe, ga tàu xe…
Lập kế hoạch phát triển giao thông.

-

Quản lý giám sát tài nguyên, thiên nhiên, môi trường bao gồm các chức năng:
quản lý gió và thuỷ hệ, các nguồn nhân tạo, bình đồ lũ, vùng ngập úng, đất
nông nghiệp, tầng ngập nước, rừng, vùng tự nhiên, phân tích tác động môi
10


trường… Xác định ví trí chất thải độc hại. Mô hình hoá nước ngầm và đường ô
nhiễm. Phân tích phân bố dân cư, quy hoạch tuyến tính.
-

Quản lý quy hoạch: phân vùng quy hoạch sử dụng đất. Các hiện trạng xu thế
môi trường. Quản lý chất lượng nước.

-

Quản lý các thiết bị: xác định đường ống ngầm, cáp ngầm. Xác định tải trọng
của lưới điện. Duy trì quy hoạch các thiết bị, sử dụng đường điện.

-

Phân tích tổng điều tra dân số, lập bản đồ các dịch vụ y tế, bưu điện và nhiều

ứng dụng khác.

1.1.4 Các hệ thống tương tác
Các hệ thống xử lý số liệu: số liệu vào từ các bản đồ, ảnh hoặc đo đạc hiện trường
cần được xử lý để đưa vào CSDL số. Sau đó là quá trình lưu trữ số liệu, cách sử dụng,
cập nhật…
Hệ phân tích dữ liệu: rút ra và phân tích, có thể đơn giản để đáp ứng yêu cầu hoặc
các phân tích thống kê tổng hợp dữ liệu. Thông tin ra hay cách hiển thị kết quả có thể
là bản đồ, bảng biểu và cũng có thể dùng để đưa vào một hệ dữ liệu số khác. Hệ sử
dụng thông tin: người dùng có thể là các nhà điều tra, quy hoạch, quản lý. Sự tương tác
cần thiết giữa các nhóm GIS và người sử dụng để lập kế hoạch cho các thủ tục phân
tích và hệ thống quản lý cấu trúc dữ liệu.
1.2 Các thành phần của GIS
GIS bao gồm 5 thành phần:
-

Con người

-

Dữ liệu

-

Phương pháp phân tích

-

Phần mềm
11



-

Phần cứng

Hình 1. 2: Các thành phần của GIS
Các thành phần này kết hợp với nhau nhằm tự động quản lý và phân phối thông tin
thông qua biểu diễn địa lý.
1.2.1 Con người
Con người là thành phần quan trọng nhất, là nhân tố thưc hiện các thao tác điều
hành sự hoạt động của hệ thống GIS. Người dùng GIS là những người sử dụng các
phần mềm GIS để giải quyết các bài toán không gian theo mục đích của họ. Họ thường
là những người được đào tạo tốt về lĩnh vực GIS hay là các chuyên gia:
- Người xây dựng bản đồ: sử dụng các lớp bản đồ được lấy từ nhiều nguồn khác
nhau, chỉnh sửa dữ liệu để tạo ra các bản đồ theo yêu cầu.
- Người xuất bản: sử dụng phần mềm GIS để kết xuất ra bản đồ dưới nhiều định
dạng xuất khác nhau.
- Người phân tích: giải quyết các vấn đề như tìm kiếm, xác định vị trí… Người
xây dựng dữ liệu: là những người chuyên nhập dữ liệu bản đồ bằng các cách
khác nhau: vẽ, chuyển đổi từ định dạng khác, truy nhập CSDL…
- Người quản trị CSDL: quản lý CSDL GIS và đảm bảo hệ thống vận hành tốt.
12


- Người thiết kế CSDL: xây dựng các mô hình dữ liệu lôgic và vật lý.
- Người phát triển: xây dựng hoặc cải tạo các phần mềm GIS để đáp ứng các nhu
cầu cụ thể.
1.2.2 Dữ liệu
Một cách tổng quát, người ta chia dữ liệu trong GIS thành 2 loại:

-

Dữ liệu không gian (spatial) cho ta biết kích thước vật lý và vị trí địa lý của các
đối tượng trên bề mặt trái đất.

-

Dữ liệu thuộc tính (non-spatial) là các dữ liệu ở dạng văn bản cho ta biết thêm
thông tin thuộc tính của đối tượng.

1.2.3 Phần cứng
Là các máy tính điện tử: PC, mini Computer, MainFrame… là các thiết bị mạng
cần thiết khi triển khai GIS trên môi trường mạng. GIS cũng đòi hỏi các thiết bị ngoại
vi đặc biệt cho việc nhập và xuất dữ liệu như: máy số hoá (digitizer), máy vẽ (plotter),
máy quét (scanner)…
1.2.4 Phần mềm
Hệ thống phần mềm GIS rất đa dạng. Mỗi công ty xây dựng GIS đều có hệ phần
mềm riêng của mình. Tuy nhiên, có một dạng phần mềm mà các công ty phải xây dựng
là hệ quản trị CSDL địa lý. Dạng phần mềm này nhằm mục đích nâng cao khả năng
cho các phần mềm CSDL thương mại trong việc: sao lưu dữ liệu, định nghĩa bảng,
quản lý các giao dịch do đó ta có thể lưu các dữ liệu đồ địa lý dưới dạng các đối tượng
hình học trực tiếp trong các cột của bảng quan hệ và nhiều công việc khác.
1.3 Chức năng của GIS
Một hệ GIS phải đảm bảo được 6 chức năng cơ bản sau:

13


-


Capture: thu thập dữ liệu. Dữ liệu có thể lấy từ rất nhiều nguồn, có thể là bản
đồ giấy, ảnh chụp, bản đồ số…

-

Store: lưu trữ. Dữ liệu có thể được lưu dưới dạng vector hay raster.

-

Query: truy vấn (tìm kiếm). Người dùng có thể truy vấn thông tin đồ hoạ hiển
thị trên bản đồ.

-

Analyze: phân tích. Đây là chức năng hộ trợ việc ra quyết định của người dùng.
Xác định những tình huống có thể xảy ra khi bản đồ có sự thay đổi.

-

Display: hiển thị. Hiển thị bản đồ.

-

Output: xuất dữ liệu. Hỗ trợ việc kết xuất dữ liệu bản đồ dưới nhiều định dạng:
giấy in, Web, ảnh, file…

Hình 1. 3: Quan hệ giữa các nhóm chức năng của GIS
1.3.1 Thu thập dữ liệu
Thu thập dữ liệu là quá trình thu nhận dữ liệu theo khuân mẫu được áp dụng cho
GIS. Mức độ đơn giản nhất của thu thập dữ liệu là chuyển đổi khuân dạng mẫu có sẵn

từ bên ngoài. Trong trường hợp này, GIS phải có các tiện ích để hiểu được các khuân
dạng mẫu dữ liệu chuẩn khác nhau để trao đổi. GIS còn phải có khả năng nhập các ảnh
14


bản đồ. Trong thực tế, nhiều kỹ thuật trắc địa được áp dụng để thu thập dữ liệu thô, bao
gồm thu thập dữ liệu về bề mặt trái đất như địa hình, địa chất học và thảm thực vật nhờ
trắc địa đo đặc hay ảnh chụp từ vệ tinh, máy bay. Các dữ liệu như kinh tế - xã hội thu
thập từ điều tra phỏng vấn hay chuyển đổi từ các bài tư liệu viết. Bản đồ vẽ bằng tay
trên giấy phải được số hoá sang dạng raster. Việc sử dụng ảnh vệ tinh hay ảnh chụp từ
máy bay được xem là nguồn dữ liệu quan trọng khi nghiên cứu tài nguyên thiên nhiên
và đo vẽ bản đồ địa hình.
Đa số nguồn gốc thông tin không gian là các bản đồ in hay bản đồ dưới khuôn mẫu
tương tự. Để các dữ liệu này được sử dụng trong GIS thì chúng cần được số hoá. Ở
mức thủ công thì chỉ có thể số hoá các đặc trưng bản đồ và nhập thuộc tính mô tả các
đặc trưng đó. Còn ở mức tự động hoá cao hơn là số hoá bản đồ bằng máy quét ảnh để
phát sinh ảnh số bản đồ đầy đủ. Đầu ra của máy quét là ma trận của các giá trị điểm
ảnh 2D, có thể được sử dụng cho công việc vector hoá để tạo ra bản đồ mã hoá dữ liệu,
kiểm chứng và sửa lỗi để có được dữ liệu phù hợp.
Nói chung, công việc thu thập dữ liệu hay “làm dữ liệu bản đồ” là nhiệm vụ khó
khăn và là quan trọng nhất khi xây dựng các ứng dụng GIS. Quá trình thu thập dữ liệu
luôn gắn liền với quá trình xử lý dữ liệu. Chúng ta có ba mô hình quan niệm của thông
tin không gian là: mô hình hướng đối tượng, mạng và bề mặt. Quá trình phân tích trên
cơ sở các cách nhìn khác nhau đòi hỏi dữ liệu phải được biểu diễn và tổ chức cho phù
hợp. Vì vậy cần cung cấp phương tiện cho người sử dụng GIS thay đổi cấu trúc dữ liệu
để thích nghi với các yêu cầu khác nhau. Điều này đòi hỏi cần phải có các chức năng
thay đổi cách biểu diễn, thay đổi phân lớp, làm đơn giản hoá hay tổng quát hoá dữ liệu,
biến đổi giữa hệ thống trục toạ độ khác nhau và biến đổi các phép chiếu bản đồ. Các
thao tác này được xem là tiền phân tích không gian. Mức độ xử lý dữ liệu thô khác
nhau phụ thuộc vào mục đích của ứng dụng GIS.

Một số công cụ phân tích của GIS phụ thuộc chặt chẽ vào các mô hình dữ liệu
raster, do đó nó đòi hỏi quá trình biến đổi mô hình dữ liệu vector sang dữ liệu raster,
15


quá trình này được gọi là raster hoá. Một số công cụ phân tích khác lại làm việc chủ
yếu với mô hình vector, nên đòi hỏi quá trình biến đổi ngược từ raster sang vector, hay
còn gọi là vector hoá. Raster hoá là quá trình phân tích đường (line) hay miền
(polygon) thành các điểm ảnh (pixel). Ngược lại, vector hoá là quá trình tập hợp các
điểm ảnh để tạo thành đường hay miền. Dữ liệu ban đầu của ta thông thường là dưới
dạng raster nên nếu dữ liệu không có cấu trúc tốt thì việc nhận dạng mẫu sẽ rất phức
tạp.
Khi so sánh dữ liệu từ các nguồn khác nhau, vấn đề thường nảy sinh là sử dụng hai
hay nhiều phân lớp để mã hoá cho cùng hiện tượng. Để nhận ra các khía cạnh khác
nhau của hiện tượng với mức độ chi tiết khác nhau, cần phải có tiến trình xấp xỉ hoá để
biển đổi về cùng một phân lớp.
Trong việc tích hợp dữ liệu bản đồ, vấn đề nảy sinh là hệ thống toạ độ của chúng
được đo, vẽ trên cơ sở nhiều phép chiếu bản đồ khác nhau. Các dữ liệu này không thể
tích hợp trên cùng bản đồ nếu không biển đổi chúng về cùng một hệ trục toạ độ.
1.3.2 Lưu trữ và truy cập dữ liệu
Lưu trữ dữ liệu liên quan đến tạo lập CSDL không gian (đồ hoạ, bản đồ). Nội dung
của CSDL này có thể bao gồm tổ hợp dữ liệu vector hoặc/và dữ liệu raster, dữ liệu
thuộc tính để nhận diện hiện tượng tham chiếu không gian. Thông thường dữ liệu
thuộc tính của GIS trên cơ sở đối tượng được lưu trong bảng, chúng chứa khoá chính là
một chỉ danh duy nhất tương ứng với đối tượng không gian, kèm theo nhiều mục dữ
liệu thuộc tính khác. Chỉ danh đối tượng không gian duy nhất được dùng để liên kết
giữa dữ liệu thuộc tính và dữ liệu không gian tương ứng. Trong bảng thuộc tính cũng
có thể bao gồm cả giá trị không gian như độ dài đường, diện tích vùng mà chúng đã
được dẫn xuất từ biểu diễn dữ liệu hình học.
Với dữ liệu raster thì các tệp thuộc tính thông thường chứa dữ liệu liên quan đến

lớp hiện tượng tự nhiên thay cho các đối tượng rời rạc. Việc lựa chọn mô hình raster
hay mô hình vector để tổ chức dữ liệu không gian được thực hiện khi thu thập dữ liệu
16


vì mỗi mô hình tương ứng với các tiếp cận khác nhau. Thông thường CSDL GIS cho
khả năng quản trị cả hai mô hình không gian nói trên, khi xây dựng CSDL không gian
thì nhất thiết phải liên kết bảng dữ liệu liên quan đến hiện tượng tương ứng.
Theo thuật ngữ của hệ quản trị CSDL thì các mô hình vector và raster được xem
như những thí dụ của mô hình quan niệm. Chúng mô tả các quan niệm liên quan đến
ứng dụng thế giới thực được biểu diễn trong CSDL. Các mô hình quan niệm được mô
tả theo nhiều cấp bậc trừu tượng, trong đó các mô hình vector và raster là ở mức trừu
tượng thấp nhất. Chúng gần với biểu diễn dữ liệu máy tính hơn các mô hình trên cơ sở
dữ liệu đối tượng, mạng và bề mặt. Khái niệm mô hình dữ liệu lôgic được sử dụng để
đề cập đến cách mà DBMS tổ chức mô hình quan niệm thành tệp, bản ghi, chỉ số. Ngày
nay, công nghệ CSDL truyền thống không còn thích hợp với việc quản lý dữ liệu địa
lý. Một số hệ GIS được sử dụng rộng rãi đã xây dựng CSDL trên cơ sở tổ hợp mô hình
quan hệ quản lý thuộc tính phi hình học và lựợc đồ chuyên dụng, phi quan hệ để lưu
trữ, xử lý dữ liệu không gian. Một vài GIS khác đã lợi dụng các phương tiện của lược
đồ lưu trữ CSDL quan hệ để quản lý cả hai loại dữ liệu hình học và phi hình học.
Phương tiện truy nhập trong CSDL GIS bao gồm cả phương tiện có sẵn của CSDL
quan hệ chuẩn và khả năng xây dựng câu hỏi truy vấn để tìm thông tin mà giá trị của
chúng bằng hoặc nằm trong khoảng xác định. Đặc tính đặc biệt theo vị trí đối với hệ
toạ độ nào đó và theo các quan hệ không gian. Do nhu cầu khai thác thông tin trên
CSDL không gian thường bao gồm phương pháp chỉ số không gian đặc biệt. Câu hỏi
không gian thường là tìm ra đối tượng nằm trong hay trên các biên của cửa sổ hình chữ
nhật. Khai thác dữ liệu trên cơ sở vị trí hay quan hệ không gian được xem như là nền
tảng của thâm nhập CSDL GIS.
Tìm kiếm và phân tích dữ liệu không gian. Đây là chức năng đóng vai trò rất quan
trọng trong GIS. Nó tạo nên sức mạnh thực sự của GIS so với các phương pháp khác.

Tìm kiếm và phân tích dữ liệu không gian giúp tìm ra những đối tượng đồ hoạ theo các
điều kiện đặt ra hay hỗ trợ việc ra quyết định của người dùng GIS.
17


1.3.3 Tìm kiếm và phân tích dữ liệu không gian
Có rất nhiều các phương pháp tìm kiếm và phân tích dữ liệu không gian, các
phương pháp khác nhau thường tạo ra các ứng dụng GIS khác nhau. Sau đây là một số
phương pháp được dùng phổ biến nhất:
a. Tìm kiếm dữ liệu trong vùng không gian (Buffer)
Tìm kiếm dữ liệu trong vùng không gian (buffer) trên cơ sở các quan hệ không
gian giữa các đối tượng. Các quan hệ này thông thường nói lên vị trí tương đối của đối
tượng này với đối tượng kia. Phương pháp buffer được chia làm nhiều loại (phép toán)
khác nhau, nhưng cách thức xử lý thì luôn tuân theo các bước cơ bản sau đây:
-

Chọn ra một hay nhiều đối tượng trên bản đồ, gọi là các đối tượng gốc.

-

Áp dụng một quan hệ không gian để tìm ra các đối tượng khác mà có quan hệ
đặc biệt với các đối tượng gốc.

-

Hiển thị tập đối tượng tìm thấy cả trên dữ liệu không gian và thuộc tính.

Hình 1. 4: Buffer bên trong một vùng có bán kính xác định
Một số phép toán buffer thông dụng Tìm các đối tượng nằm bên trong các đối
tượng khác. Phép toán này xác định quan hệ “bao kín” giữa các đối tượng không gian.

Đường thẳng bao gồm nhiều điểm, một đa giác (polygon) có thể bao gồm nhiều đường
thẳng hoặc gồm các đa giác con khác. Tìm các đối tượng cắt các đối tượng khác. Phép
toán này xác định các đối tượng có giao điểm hay nằm chồng lên các đối tượng khác.
18


Hai đa giác giao nhau nếu chúng có một miền chung. Hai đường thẳng cắt nhau nếu
chúng có một điểm chung. Một đường thẳng giao với một đa giác khi nó nằm một phần
hay toàn bộ trong đa giác. Tìm các đối tượng liền kề với các đối tượng khác. Đây là
kiểu tìm kiếm trong đó các đối tượng có chung đường bao (biên). Quan hệ này chỉ áp
dụng cho đường thẳng hoặc đa giác. Tìm các đối tượng nằm bên trong hoặc bên ngoài
một khoảng cách xác định. Kiểu tìm kiếm này được sử dụng trong việc xác định các
đối tượng xung quanh một hay nhiều các điểm mốc. Quá trình thực hiện bao gồm việc
tạo ra một vùng đệm quanh các điểm mốc này và sau đó xác định các đối tượng căn cứ
vào vị trí của chúng so với vùng đệm tạo ra.
b. Tìm kiếm theo địa chỉ (Geocoding)
Một đối tượng trên bản đồ bao giờ cũng được biểu diễn bằng một kiểu dữ liệu đồ
hoạ. Phần đồ hoạ này có thể thu được bằng cách số hoá hay quét ảnh bản đồ. Tuy
nhiên, khi ta đã có bản đồ (bản đồ số), chúng ta cũng có thể xác định được phần đồ hoạ
biểu diễn đối tượng hay là vị trí, hình dạng của đối tượng thông qua các dữ liệu mô tả
vị trí của nó ví dụ: số nhà, tên đường, tên quận… Geocoding (hay address matching) là
một tiến trình nhằm xác định các đối tượng trên cơ sở mô tả vị trí của chúng. Đây là
một kỹ thuật rất nổi tiếng, có mặt trong rất nhiều ứng dụng của GIS. Người ta gọi một
geocoding service là quá trình chuyển đổi toàn bộ mô tả thuộc tính về vị trí sang mô tả
không gian. Để tìm được vị trí thông qua địa chỉ, geocoding service phải tham chiếu
đến ít nhất một nguồn dữ liệu bao gồm cả thông tin về địa chỉ (thuộc tính) và thông tin
không gian (vị trí, hình dạng). Dữ liệu này được gọi là dữ liệu tham chiếu. Các
geocoding service có thể thao tác trên nhiều kiểu dữ liệu tham chiếu khác nhau. Sau
khi đã geocoding dữ liệu tham chiếu (tức là ánh xạ mô tả thuộc tính vào mô tả không
gian). Ta có thể nhập địa chỉ của đối tượng cần tìm. Quy trình xử lý trải qua các bước

sau:
-

Chuẩn hoá giá trị địa chỉ vừa nhập vào bằng cách tách nó thành các thành phần
địa chỉ nhỏ.
19


-

Geocoding service sau đó sẽ tìm trong nguồn dữ liệu tham chiếu để xác định
các đối tượng có các thành phần địa chỉ tương ứng với dữ liệu nhập vào. Mỗi
kiểu geocoding service sẽ quy định các định dạng của các thành phần địa chỉ
này.

-

Tập kết quả trả về sẽ được gán các trọng số (điểm) để tìm ra kết quả gần đúng
nhất.

-

Geocoding service sẽ đánh dấu đối tượng vừa được tìm thấy trên bản đồ bằng
một đối tượng đồ hoạ.

Hình 1. 5: Kết quả tìm kiếm theo địa chỉ
c. Phân tích mạng (Networks)
Networks là kỹ thuật được ứng dụng rất rộng rãi trong giao thông, phân phối hàng
hoá và dịch vụ, vận chuyển nước hay xăng dầu trong các đường ống dài, trao đổi thông
tin qua mạng viễn thông… Trong GIS, networks được mô hình dưới dạng các đồ thị

một chiều hay mạng hình học. Mạng hình học này bao gồm các đối tượng đang được
hiển thị trên bản đồ, mỗi đối tượng đóng vai trò là cạnh hoặc nút trong mạng. Trong
GIS để thiết lập nên mối quan hệ giữa nút - cạnh và cạnh - cạnh ta cần tạo các topology
cho cơ sở dữ liệu. Topology được hiểu là mối quan giữa các đối tượng trong bảng dữ
liệu. Quan hệ topology giữa các đối tượng gần giống quan hệ giữa các bảng
(relationship). Chúng ta có hai kiểu liên kết là nút - cạnh và cạnh - cạnh. Nút - cạnh là
luật liên kết được thiết lập giữa một nút của đối tượng kiểu A với một cạnh của đối
tượng kiểu B. Cạnh - cạnh là luật liên kết giữa một cạnh của đối tượng kiểu A và một
cạnh của đối tượng kiểu B qua một tập các nút. Khi đã tạo topology và xác lập luật liên

20


kết, một mạng lôgic đã được hình thành. Lúc này ta có thể áp dụng các thuật toán về
mạng để giải quyết các bài toán đặt ra.

Hình 1. 6: Kết quả tìm kiếm trên mạng giao thông
d. Chồng phủ bản đồ (Overlay)
Đây là kỹ thuật khó nhất và cũng là mạnh nhất của GIS. Overlay cho phép ta tích
hợp dữ liệu bản đồ từ hai nguồn dữ liệu khác nhau. Người ta định nghĩa: “Overlay là
quá trình chồng khít hai lớp dữ liệu bản đồ với nhau để tạo ra một lớp bản đồ mới”.
Điều này tương tự như việc nhân hai ma trận để tạo ra một ma trận mới, truy vấn hai
bảng cơ sở dữ liệu để tạo ra bảng mới, với overlay là gộp hai lớp trên bản đồ để tạo ra
bản đồ mới. Overlay thực hiện điều này bằng cách kết hợp thông tin một lớp này với
một lớp khác để lấy ra dữ liệu thuộc tính từ một trong hai lớp.
Người ta chia overlay thành ba dạng phân tích khác nhau:
-

Point-in-polygon: chồng khít hai lớp point và polygon, đầu ra là lớp point


-

Line-in-polygon: chồng khít hai lớp line và polygon, đầu ra là lớp line

-

Polygon-in-polygon: chồng khít hai lớp polygon và polygon, đầu ra là lớp
polygon

Quá trình overlay thường được tiến hành qua 2 bước:
21


-

Xác định tọa độ các giao điểm và tiến hành chồng kít hai lớp bản đồ tại giao
điểm này.

-

Kết hợp dữ liệu không gian và thuộc tính của hai lớp bản đồ.

Các phép toán overlay bao gồm:
-

Phép hợp (Union): Hoạt động như toán tử or, đầu vào là hai lớp bản đồ kiểu là
polygon Kết quả đầu ra là một lớp bản đồ mới bằng cách overlay hai miền dữ
liệu đầu vào và dữ liệu thuộc tính của chúng. (Điều kiện: miền dữ liệu phải là
polygon).


Hình 1. 7: Phép hợp
-

Phép giao (Intersect): Hoạt động như toán tử and, tạo ra một vùng bao phủ mới
bằng cách overlay hai tập dữ liệu đầu vào. Kết quả đầu ra bao gồm phần dữ
liệu thuộc vào cả hai tập dữ liệu đầu vào.

Hình 1. 8: Phép giao
-

Phép đồng nhất (Identity): Tạo ra một vùng bao phủ mới bằng cách overlay hai
tập dữ liệu đầu vào. Kết quả đầu bao gồm toàn bộ phần dữ liệu của lớp đầu tiên
và chỉ những phần nào của lớp thứ hai được chồng khít.

Hình 1. 9: Phép đồng nhất
e. Tìm kiếm trong khoảng cận kề (Proximity)
Proximity là phép tìm kiếm trên cơ sở đo khoảng cách quanh hoặc giữa các đối
tượng. Khoảng cách này được tính theo khoảng cách Euclidean. Có 3 phương pháp
phân tích proximity [1]:
22


-

Phương pháp thứ nhất: tìm kiếm nội dung trong vùng, trong đó vùng tìm kiếm
được xác định bởi xấp xỉ tới hiện tượng có sẵn, đó chính là phương pháp
buffer. Việc tìm kiếm này được thực hiện trong vùng tạo bởi mở rộng đối
tượng cho trước theo một khoảng cách cho trước. Trong GIS vùng này được
gọi là vùng đệm, nó được xây dựng xung quanh đối tượng điểm, đối tượng
đường hay đối tượng vùng. Trong các hệ thống trên cơ sở raster thì việc tạo lập

vùng đệm dược thực hiện nhờ chức năng spread.

-

Phương pháp thứ hai: tìm ra các vùng nối trực tiếp với đối tượng xác định
trước, chẳng hạn như tìm các mảnh đất liền kề với mảnh đất sẽ xây dựng nhà
máy.

-

Phương pháp thứ ba: xảy ra khi cần phải tìm kiếm những vùng gần nhất tới tập
các vị trí mẫu phân tán không đều. Các mẫu thường là các điểm. Tìm kiếm này
thực hiện bằng cách tạo lập đa giác Thiessen, nó xác định các vùng xung quanh
mỗi điểm mà gần điểm này hơn mọi điểm khác. Sơ đồ đa giác Thiessen còn
được gọi là sơ đồ Voronoi. Chúng được sử dụng để lập ra bản đồ sử dụng từ
các mẫu đất cách biệt.

1.4 Vector và Raster trong GIS
Có hai phương pháp chính để lưu trữ thông tin bản đồ: GIS lưu các đối tượng bản
đồ trong định dạng vector và trong định dạng raster:
-

Định dạng vector: các đối tượng bản đồ được biểu diễn bởi các đối tượng hình
học cơ bản point (điểm), line (đường), polygon (vùng). Point dùng xác định các
đối tựợng không có hình dạng kích thước cụ thể, hay có kích thước quá nhỏ so
với tỷ lệ bản đồ. Line để xác định các đối tượng có chiều dài xác định. Polygon
để xác định các vùng, miền trên mặt đất. Trong định dạng này, thông tin được
mô tả có tính chính xác cao đồng thời tiết kiệm không gian lưu trữ. Thông tin
lưu trong định dạng vector chủ yếu được ứng dụng trong bài toán về mạng, hệ
thống thông tin đất đai.

23


-

Định dạng raster: các đối tượng bản đồ được biểu diễn trong một chuỗi các
điểm ảnh trong một lưới hình chữ nhật. Mỗi điểm ảnh được xác định thông qua
chỉ số hàng và cột trong lưới. Trong raster, point sẽ được biểu diễn bởi một
điểm ảnh đơn, line được biểu diễn bởi một chuỗi các điểm ảnh liên tiếp nhau,
và polygon xác định bởi một nhóm các điểm ảnh kề sát nhau. Dữ liệu được lưu
trong định dạng này rất đơn giản nhưng lại đòi hỏi dung lượng bộ nhớ lớn.
Raster phù hợp với các dạng dữ liệu có đường biên không rõ ràng. Raster được
ứng dụng nhiều trong phân tích bề mặt liên tục.

Hình 1. 10: Định dạng dữ liệu Vector và Raster
1.5 Hệ toạ độ địa lý và hệ toạ độ quy chiếu
Vị trí của vật thể trong không gian đều phải gắn liền với một hệ toạ độ. Trong GIS,
để biểu diễn dữ liệu không gian người ta thường dùng 2 hệ toạ độ: hệ toạ độ địa lý và
hệ toạ độ quy chiếu.
Hệ toạ độ địa lý là hệ toạ độ lấy mặt cầu ba chiều bao quanh trái đất làm cơ sở.
Một điểm được xác định bằng kinh độ và vĩ độ của nó trên mặt cầu. Hệ toạ độ quy
chiếu là hệ toạ độ hai chiều thu được bằng cách chiếu dữ liệu bản đồ nằm trên hệ toạ
độ địa lý về một mặt phẳng.

24


1.5.1 Hệ toạ độ địa lý
Hệ tọa độ địa lý sử dụng bề mặt hình cầu để xác định vị trí của một điểm trên trái
đất. Đơn vị đo của hệ là độ.

Vì đây là hệ tọa độ gắn liền với trục trái đất nên để xác định vị trí của đối tượng
người ta chia bề mặt trái đất thành các đường kinh tuyến và vĩ tuyến. Kinh tuyến là các
đường cong cách đều nhau chạy qua hai điểm cực Bắc và Nam, vĩ tuyến là các đường
tròn song song có tâm nằm trên trục của trái đất. Giao điểm giữa kinh tuyến và vĩ tuyến
tạo thành các ô lưới.
Trong số các kinh tuyến và vĩ tuyến có hai đường quan trọng nhất được lấy làm
gốc toạ độ đó là: vĩ tuyến có bán kính lớn nhất - chính là đường xích đạo và kinh tuyến
chạy qua vùng Greenland nước Anh. Giao điểm giữa hai đường này là gốc toạ độ. Hai
đường này cũng đồng thời chia trái đất làm 4 phần bằng nhau: nửa Bắc và Nam nằm
phía trên và dưới của đường xích đạo; nửa Đông và Tây nằm ở phía bên phải và trái
của kinh tuyến gốc.
Một điểm nằm trên mặt cầu sẽ có hai giá trị toạ độ là kinh độ và vĩ độ được xác
định như trong hình vẽ trên. Giá trị này có thể được đo bằng độ theo cơ số 10 hoặc theo
độ, phút, giây.
Miền giá trị:

Vĩ độ: -900 ÷ 900
Kinh độ: -1800 ÷ 1800

25


×