Tải bản đầy đủ (.pdf) (86 trang)

Ứng dụng công nghệ web ngữ nghĩa cho hệ thống WebGIS

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.52 MB, 86 trang )

..

..

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
---------------------------------------

Nguyễn Thanh Sỹ

ỨNG DỤNG CÔNG NGHỆ WEB NGỮ NGHĨA
CHO HỆ THỐNG WEBGIS

Chuyên ngành: Công nghệ thông tin

LUẬN VĂN THẠC SĨ KỸ THUẬT
CÔNG NGHỆ THÔNG TIN

NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS. CAO TUẤN DŨNG

Hà Nội – Năm 2017


LỜI CẢM ƠN
Em xin bày tỏ lịng kính trọng và cảm ơn chân thành đến PGS.TS. Cao Tuấn
Dũng - Viện Công nghệ thông tin và Truyền thông – Trường Đại học Bách Khoa Hà
Nội, người đã định hướng, tận tình hướng dẫn, giúp đỡ em trong suốt quá trình thực
hiện luận văn.
Em xin chân thành cảm ơn các thầy, cô giáo - Viện Công nghệ Thông tin và
Truyền thông - Trường Đại học Bách Khoa Hà Nội, những người đã tận tình truyền
đạt các kiến thức cho em trong suốt thời gian em học tập và nghiên cứu tại Trường.


Em cũng xin gửi lời cảm ơn tới gia đình đã ủng hộ, động viên em trong suốt
quá trình học tập vừa qua.
Cuối cùng, em xin cảm ơn các bạn học cùng lớp 15ACNTT, các đồng nghiệp
và đơn vị công tác đã giúp đỡ em trong quá trình học tập và thực hiện luận văn.
Do trong quá trình nghiên cứu, tìm hiểu và thực nghiệm luận văn chắc chắn
không thể tránh khỏi những sai sót nhất định, em rất mong nhận được sự góp ý của
thầy, cơ giáo và các bạn để luận văn được hoàn chỉnh hơn.
Em xin trân trọng cảm ơn!
Hà Nội, tháng

năm 2017

Tác giả luận văn

Nguyễn Thanh Sỹ


LỜI CAM ĐOAN
Tôi xin cam đoan luận văn “Ứng dụng công nghệ Web ngữ nghĩa cho hệ thống
WebGIS” này là cơng trình nghiên cứu của tơi dưới sự hướng dẫn khoa học của
PGS.TS. Cao Tuấn Dũng. Tất cả những tài liệu tham khảo tôi đã liệt kê rõ ở phần
cuối của luận văn. Các nội dung công bố và kết quả trình bày trong luận văn này là
trung thực và khơng có sự sao chép của người khác.
Hà Nội, tháng

năm 2017

Tác giả luận văn

Nguyễn Thanh Sỹ



MỤC LỤC
TRANG PHỤ BÌA......................................................................................................1
LỜI CẢM ƠN .............................................................................................................2
LỜI CAM ĐOAN .......................................................................................................3
DANH MỤC CÁC KÝ HIỆU, CÁC TỪ VIẾT TẮT .................................................7
DANH MỤC CÁC HÌNH VẼ.....................................................................................9
DANH MỤC CÁC BẢNG BIỂU .............................................................................11
MỞ ĐẦU ...................................................................................................................12
CHƯƠNG 1: WEBGIS VÀ WEB NGỮ NGHĨA ....................................................16
1.1. WebGIS ..........................................................................................................16
1.1.1. Khái niệm GIS.........................................................................................16
1.1.2. Mơ hình cơng nghệ GIS ..........................................................................17
1.1.3. Những lĩnh vực khoa học liên quan đến GIS ..........................................18
1.1.4. Các thành phần của GIS ..........................................................................19
1.1.5. Một số khả năng ứng dụng của GIS ........................................................23
1.1.6. Khái niệm WebGIS .................................................................................24
1.1.7. Các tính năng của WebGIS .....................................................................24
1.1.8. Kiến trúc WebGIS và các bước xử lý .....................................................25
1.2. Web ngữ nghĩa ...............................................................................................27
1.2.1. Sự ra đời của web ngữ nghĩa ...................................................................27
1.2.2. Khái niệm web ngữ nghĩa .......................................................................28
1.2.3. Đặc điểm của web ngữ nghĩa ..................................................................28
1.2.4. Kiến trúc của web ngữ nghĩa ..................................................................30
1.2.5. Ontology ..................................................................................................31


1.2.5.1. Khái niệm .........................................................................................31
1.2.5.2. Vai trò của ontology .........................................................................32

1.2.5.3. Các bước thiết kế một ontology .......................................................32
1.2.5.4. Ngôn ngữ biểu diễn ontology...........................................................34
1.2.5.5. Một số công cụ hỗ trợ xây dựng ontology .......................................36
CHƯƠNG 2: ỨNG DỤNG CÔNG NGHỆ WEB NGỮ NGHĨA CHO GIS ............37
2.1. Tiềm năng ứng dụng của công nghệ web ngữ nghĩa vào GIS .......................37
2.1.1. Khả năng xử lý thông tin địa lý có ngữ nghĩa .........................................37
2.1.2. Khả năng tích hợp thông tin địa lý từ nhiều nguồn khác nhau [25] .......38
2.2. Khảo sát WebGIS ở Việt Nam .......................................................................41
2.3. Dự án tiêu biểu ứng dụng web ngữ nghĩa vào GIS trên thế giới ...................44
2.3.1. Basic Geo (WGS84 lat/long) Vocabulary ...............................................44
2.3.2. W3C Geospatial Ontologies ....................................................................46
2.3.3. GeoSPARQL ...........................................................................................49
CHƯƠNG 3: MỘT GIẢI PHÁP TẠO RA WEBGIS CÓ NGỮ NGHĨA ................53
3.1. Một giải pháp tạo ra WebGIS có ngữ nghĩa ..................................................53
3.1.1. Các chức năng cần có ..............................................................................53
3.1.1.1. Các chức năng của WebGIS truyền thống .......................................53
3.1.1.2. Chức năng của web ngữ nghĩa .........................................................53
3.1.2. Mơ hình hệ thống WebGIS có ngữ nghĩa đề xuất...................................54
3.1.3. Quy trình xây dựng hệ thống ..................................................................55
3.2. Đặc điểm của giải pháp ..................................................................................69
CHƯƠNG 4: THỬ NGHIỆM, KẾT QUẢ VÀ BÀN LUẬN ...................................70
4.1. Xây dựng hệ thống thử nghiệm ......................................................................70


4.1.1. Hệ thống để thử nghiệm chức năng xử lý thơng tin có ngữ nghĩa, cung cấp
thơng tin chính xác và đầy đủ hơn cho người sử dụng .....................................70
4.1.1.1. Thiết kế, xây dựng cơ sở dữ liệu GIS ..............................................70
4.1.1.2. Thiết kế, xây dựng ontology ............................................................70
4.1.1.3. Xây dựng các chức năng cơ bản của hệ thống WebGIS có ngữ nghĩa
.......................................................................................................................74

4.1.2. Hệ thống để thử nghiệm tính năng tích hợp dữ liệu ...............................74
4.2. Kết quả ...........................................................................................................77
4.2.1. Chức năng xử lý thông tin có ngữ nghĩa, cung cấp thơng tin chính xác,
đầy đủ hơn đến người sử dụng ..........................................................................77
4.2.2. Tính năng tích hợp dữ liệu từ nhiều nguồn khác nhau ...........................80
4.3. Đánh giá .........................................................................................................81
KẾT LUẬN, HƯỚNG PHÁT TRIỂN ......................................................................82
1. Kết luận .............................................................................................................82
2. Hướng phát triển ...............................................................................................82
TÀI LIỆU THAM KHẢO .........................................................................................84


DANH MỤC CÁC KÝ HIỆU, CÁC TỪ VIẾT TẮT
Ký hiệu
GIS

Tiếng Anh
Geographic Information

Tiếng Việt
Hệ thống thông tin địa lý

System
XML

Extensible Markup

Ngôn ngữ đánh dấu mở rộng

Language

WebGIS Web Geographic

RDF

Hệ thống thông tin địa lý trên môi trường

Information System

mạng

Resource Description

Khung nội dung mô tả tài nguyên

Framework
RDFS

Resource Description

Lược đồ khung nội dung mô tả tài nguyên

Framework
Scheme
WWW

World Wide Web

Ma ̣ng toàn cầu

W3C


World Wide Web

Tổ chức Ma ̣ng toàn cầu

Consortium
Triple

Subject – Predicate –

Bộ ba: Chủ ngữ - Vị ngữ – Tân ngữ

Object
GeoXG

OGC

W3C Geospatial

Nhóm nghiên cứu về vị trí và tính chất của

Incubator Group

các nguồn tài nguyên trên web thuộc W3C

Open Geospatial

Tổ chức phi lợi nhuận, tạo ra các chuẩn mở

Consortium


giúp chia sẻ dữ liệu địa lý cho cộng đồng
khơng gian địa lý tồn cầu.

GML

Geography Markup

Ngơn ngữ đánh dấu địa lý là một dạng ngôn

Language

ngữ dựa trên nền XML được định nghĩa bởi
Tổ chức OGC.

SAML

Security Assertion

Định dạng dữ liệu chuẩn mở để trao đổi dữ

Markup Language

liệu xác thực và ủy quyền giữa các bên.


DARPA Defense Advanced

Cơ quan Dự án Nghiên cứu Nâng cao Quốc


Research Projects Agency phòng của Bộ Quốc phòng Mỹ, chịu trách
nhiệm phát triển các công nghệ mới cho
quân đội sử dụng.
DAML

DARPA Agent Markup

Ngôn ngữ đánh dấu dựa trên RDF.

Language
OIL

Ontology Inference Layer Ngôn ngữ trao đổi ontology, dựa trên các
or Ontology Interchange

khái niệm được xây dựng trong mô tả Logic

Language

(Description Language: DL) và các hệ thống
khung và tương thích với RDFS.

RCC8

Region connection

Tính tốn kết nối các vùng. Là 8 mối quan

calculus. It consists of 8


hệ cơ bản giữa 2 vùng (disconnected (DC),

basic relations that are

externally connected (EC), equal (EQ),

possible between two

partially overlapping (PO), tangential proper

regions

part (TPP), tangential proper part inverse
(TPPi), non-tangential proper part (NTPP),
non-tangential proper part inverse (NTPPi).

ISBN

International Standard

Mã số tiêu chuẩn quốc tế cho sách

Book Number
ASCII

American Standard Code

Chuẩn mã trao đổi thơng tin Mỹ

for Information

Interchange
EBCDIC Extended Binary Coded

Là mã hóa ký tự tám ký tự được sử dụng chủ

Decimal Interchange

yếu trên máy tính lớn của IBM và hệ điều

Code

hành máy tính IBM tầm trung.

NXB TNMT&BĐ Việt

Nhà xuất bản Tài nguyên – Môi trường và

Nam

Bản đồ Việt Nam


DANH MỤC CÁC HÌNH VẼ
Hình 1.1: Mơ hình cơng nghệ GIS [6] ......................................................................17
Hình 1.2: Các thành phần của GIS [6] ......................................................................19
Hình 1.3: Mơ hình dữ liệu khơng gian [7] ................................................................21
Hình 1.4: Minh họa liên kết giữa dữ liệu không gian và phi khơng gian [7]............22
Hình 1.5: Kiến trúc hệ thống WebGIS ......................................................................25
Hình 1.6: Các dạng u cầu chính từ phía client trên WebGIS ................................26
Hình 1.7: Minh họa liên kết ngữ nghĩa giữa các nguồn trong Web ngữ nghĩa.........29

Hình 1.8: Kiến trúc của web ngữ nghĩa [3] ...............................................................30
Hình 2.1: Nguồn dữ liệu ontology 1 .........................................................................38
Hình 2.2: Nguồn dữ liệu ontology 2 .........................................................................38
Hình 2.3: Ontology sau khi tích hợp 2 nguồn dữ liệu 1 và 2. ...................................39
Hình 2.4: Bộ dữ liệu mới sau khi tích hợp thêm thơng tin .......................................40
Hình 2.5: Ví dụ về tìm kiếm thơng tin trên WebGIS chưa có ngữ nghĩa .................41
Hình 2.6: Tìm từ khóa trong 1 trường thuộc tính của một lớp dữ liệu GIS ..............42
Hình 2.7: Tìm từ khóa trong các trường thuộc tính của các lớp dữ liệu GIS ...........43
Hình 2.8: Kiến trúc GIS sử dụng Basic Geo (WGS84 lat/long) Vocabulary ...........45
Hình 2.9: Cấu trúc GeoRSS [24]...............................................................................46
Hình 2.10: Kiến trúc GIS sử dụng GeoRSS ..............................................................48
Hình 2.11: Các tập luật theo RCC8 [26] ...................................................................51
Hình 3.1: Mơ hình hệ thống WebGIS có ngữ nghĩa .................................................54
Hình 3.2: Những lớp chính trong ontology các đối tượng địa lý ..............................56
Hình 3.3: Lớp con của lớp Đối tượng cơ sở đo đạc ..................................................56
Hình 3.4: Lớp con của lớp Đối tượng biên giới địa giới...........................................57
Hình 3.5: Lớp con của lớp Đối tượng địa hình .........................................................57
Hình 3.6: Lớp con của lớp Đối tượng thủy hệ ..........................................................58
Hình 3.7: Lớp con của lớp Đối tượng giao thơng .....................................................58
Hình 3.8: Lớp con của lớp đường bộ ........................................................................59
Hình 3.9: Lớp con của lớp Bến bãi ...........................................................................59


Hình 3.10: Lớp con của lớp Cầu ...............................................................................59
Hình 3.11: Lớp con của lớp Đối tượng Dân cư – Cơ sở hạ tầng ..............................60
Hình 3.12: Lớp con của lớp Địa danh dân cư ...........................................................60
Hình 3.13: Lớp con của lớp Trạm quan trắc .............................................................60
Hình 3.14: Các lớp con của lớp Khu chức năng .......................................................63
Hình 3.15: Lớp con của lớp Đối tượng phủ bề mặt ..................................................64
Hình 3.16: Lớp con của lớp Khu trồng cây nơng nghiệp ..........................................64

Hình 4.1: Ontology của dữ liệu thử nghiệm .............................................................71
Hình 4.2: Lược đồ CSDL GIS ..................................................................................72
Hình 4.3: Một số di tích liên kết với các đơn vị hành chính .....................................73
Hình 4.4: Nguồn A ....................................................................................................75
Hình 4.5: Nguồn B ....................................................................................................75
Hình 4.6: Các đối tượng địa lý được tìm thấy bằng cách duyệt danh sách các lớp trên
dữ liệu ontology ........................................................................................................78
Hình 4.7: Một kết quả duyệt danh sách các lớp ........................................................79
Hình 4.8: Thông tin chi tiết về đối tượng địa lý được chọn ......................................79
Hình 4.9: Tích hợp theo URI (chùa, nhà thờ) ...........................................................80
Hình 4.10: Tích hợp bổ sung theo định nghĩa ...........................................................81


DANH MỤC CÁC BẢNG BIỂU
Bảng 3.1: Đặc điểm các giải pháp chuyển RDB sang đồ thị RDF ...........................65
Bảng 4.1: Dữ liệu di tích ...........................................................................................72
Bảng 4.2: Dữ liệu địa phận tỉnh ................................................................................72


MỞ ĐẦU
Sự kết hợp của công nghệ thông tin, khoa học trái đất và khoa học thông tin
địa lý đã tạo ra hệ thống thông tin địa lý (Geographic Information System – GIS). Kể
từ năm 1960 đến nay GIS luôn luôn được nhiều nhà nghiên cứu quan tâm và phát
triển. Ngày nay, cùng với sự phát triển mạnh mẽ của cơng nghệ thơng tin và truyền
thơng, GIS cũng đã có những bước phát triển vượt bậc. Nó đã và đang được ứng dụng
hầu hết vào các ngành, các lĩnh vực, như: Đo đạc và bản đồ, quản lý, dự báo và sử
dụng có hiệu quả tài nguyên, thiên nhiên và môi trường, quản lý quy hoạch đô thị,
giao thông, viễn thơng, thăm dị khai thác dầu khí, phân tích thị trường, vv… Với các
tính năng thu thập, quản lý, truy vấn, phân tích và tích hợp các thơng tin được gắn
với một nền bản đồ nhất quán của các dữ liệu đầu vào mà GIS có được. GIS thực sự

là cơng cụ mang tính trực quan, trợ giúp các cơ quan chính phủ, nhà quản lý, doanh
nghiệp, cá nhân, vv... đánh giá được hiện trạng của những quá trình, các thực thể tự
nhiên, kinh tế, xã hội, trợ giúp quyết định trong nhiều hoạt động kinh tế, văn hóa-xã
hội và quốc phòng an ninh của nhiều quốc gia trên thế giới.
Trước những năm 1992 khi mà cơng nghệ web cịn yếu thì GIS mới chỉ được
sử dụng đơn lẻ ở các máy tính cá nhân. Sau này nhờ sự phát triển mạnh mẽ của công
nghệ web, nhất là sự ra đời của web 2.0 và sự bùng nổ của internet đã cung cấp một
phương pháp công bố mới cho các tài ngun dữ liệu GIS. WebGIS chính là cơng cụ
mới giúp công bố dữ liệu GIS đến mọi người trên mạng internet. Nhờ có WebGIS mà
tài nguyên GIS được truy cập rộng rãi hơn, việc tiếp cận với bản đồ và thông tin địa
lý trở nên phổ biến hơn đối với người dùng.
GIS cũng như WebGIS thường được xây dựng dựa trên nhiều nguồn dữ liệu
và thông tin khác nhau như các lớp dữ liệu bản đồ nền, các đối tượng tham chiếu địa
lý và các lớp dữ liệu chuyên ngành cho từng lĩnh vực ứng dụng. Để biểu diễn nhiều
loại dữ liệu phức tạp như vậy, GIS sử dụng mơ hình dữ liệu đa chiều, dữ liệu được tổ
chức phổ biến ở dạng cơ sở dữ liệu quan hệ, có thể tập trung tại một khu vực hoặc có
thể phân tán ở nhiều nơi. Công nghệ web trước đây (web 1.0 và web 2.0) đã giúp cho
WebGIS thể hiện khá tốt về mặt bản đồ, nó mang tính trực quan cao đối với người sử

12


dụng. Tuy nhiên, WebGIS cịn có mặt hạn chế. Thứ nhất về khả năng xử lý thơng tin
có ngữ nghĩa giúp thơng tin được cung cấp chính xác và đầy đủ hơn đến người dùng
trên WebGIS là chưa có - Đa số các bộ máy tra cứu tin trên WebGIS hiện tại đều thực
hiện bằng cách cho phép người sử dụng có thể tạo các câu truy vấn gồm các từ khóa
tìm kiếm và kết hợp trên một loạt lựa chọn xác định luồng dữ liệu để nhận về kết quả
mong muốn. Tuy nhiên, phương pháp này gặp hai vấn đề chính: Một là mỗi từ khóa
có thể có một hay nhiều ý nghĩa tùy theo từng ngữ cảnh và bộ máy tìm kiếm khơng
thể hiện mối quan hệ giữa các từ khóa với nhau. Hai là có thể các thông tin cùng ý

nghĩa với thuật ngữ trong biểu thức tìm của người sử dụng sẽ khơng tồn tại trong kết
quả tìm. Điểm hạn chế thứ hai của WebGIS là: Với những WebGIS có nguồn dữ liệu
khác nhau, phân tán ở nhiều nơi thì việc tích hợp thơng tin để chia sẻ là cịn khó khăn.
Cơng nghệ web ngữ nghĩa (web 3.0) với khả năng tích hợp thơng tin để chia sẻ và xử
lý được thơng tin có ngữ nghĩa, do đó có tiềm năng giải quyết được các hạn chế trên
của WebGIS. Chính vì vậy, tơi đã chọn đề tài “Ứng dụng công nghệ Web ngữ nghĩa
cho hệ thống WebGIS” để làm đề tài nghiên cứu cho luận văn của mình. Các nội
dung cụ thể của luận văn như sau:
Mục tiêu và nhiệm vụ:
- Mục tiêu: Đưa ra một giải pháp tạo ra WebGIS có ngữ nghĩa nhằm khắc
phục hai hạn chế của WebGIS truyền thống (WebGIS chưa có ngữ nghĩa) gặp phải.
- Nhiệm vụ: Để đạt được mục tiêu như trên, thì luận văn phải thực hiện được
các nhiệm vụ sau:
+ Tìm hiểu lý thuyết về WebGIS và cơng nghệ web ngữ nghiã : Tìm hiểu về
các khái niệm, mơ hình cơng nghệ, đặc điểm, tính năng của GIS, WebGIS và Web
ngữ nghĩa.
+ Đánh giá tiềm năng, ứng dụng công nghệ web ngữ nghĩa cho WebGIS: Dựa
trên cơ sở lý thuyết về GIS, WebGIS, Web ngữ nghĩa xem xét về khả năng ứng dụng
công nghệ web ngữ nghĩa vào GIS; khảo sát xem ở Việt Nam và trên thế giới việc
ứng dụng công nghệ web ngữ nghĩa vào GIS đã có chưa? Nếu có thì chúng được kết
hợp ứng dụng ra sao?

13


+ Đề xuất một giải pháp tạo ra WebGIS có ngữ nghĩa có khả năng khắc phục
được hai hạn chế mà WebGIS truyền thống ở Việt Nam gặp phải: Dựa trên mơ hình
cơng nghệ của WebGIS và web ngữ nghĩa, cũng như những kết quả đánh giá về tiềm
năng và những khảo sát về ứng dụng công nghệ Web ngữ nghĩa vào GIS trên thế giới
và dựa trên cơ sở điều kiện triển khai WebGIS thực tế ở Việt Nam để đưa ra một giải

pháp tạo ra WebGIS có ngữ nghĩa có khả năng khắc phục được hai hạn chế mà
WebGIS truyền thống ở Việt Nam gặp phải.
+ Xây dựng hệ thống thử nghiệm, chạy hệ thống, đánh giá kết quả đạt được và
khả năng áp dụng giải pháp đề xuất vào thực tế: Xác định nguồn dữ liệu GIS để thử
nghiệm và xây dựng hệ thống thử nghiệm nhằm đánh giá về tính khả thi của mơ hình
giải pháp tạo ra WebGIS có ngữ nghĩa mà tác giả đã đề xuất.
Đối tượng và phạm vi nghiên cứu của luận văn:
- Đối tượng nghiên cứu: WebGIS có ngữ nghĩa.
- Phạm vi nghiên cứu:
+ Về lý thuyết: Lý thuyết về công nghệ WebGIS và web ngữ nghĩa.
+ Về thực nghiệm: WebGIS là hệ thống rất đa dạng về mặt nội dung. Tuy
nhiên để phục vụ cho mục đích thử nghiệm, luận văn này chỉ đưa ra một hệ thống
WebGIS nhỏ, nội dung dữ liệu bao gồm (nguồn dữ liệu GIS lấy từ NXB TNMT&BĐ
Việt Nam):
Nhóm dữ liệu nền địa lý (bản đồ nền) gồm: Các vùng hành chính cấp
tỉnh/thành phố của Việt Nam (63 tỉnh/thành phố) và một phần các vùng hành chính
cấp quốc gia của các nước lân cận Việt Nam (Lào, Campuchia, Thái Lan, Trung
Quốc), vùng biển và một số sông lớn của Việt Nam, các đường giao thông lớn của
Việt Nam (đường giao thông cấp quốc lộ, tỉnh lộ).
Nhóm dữ liệu chun ngành: Một số điểm di tích của Việt Nam.
Phương pháp nghiên cứu: Tổng hợp lý thuyết (thu thập, tìm hiểu, phân tích),
thử nghiệm và bàn luận.

14


Ý nghĩa khoa học và thực tiễn:
- Ý nghĩa khoa học: “Ứng dụng công nghệ web ngữ nghĩa cho hệ thống
WebGIS” là chủ đề mới chưa được nghiên cứu và phổ biến ở Việt Nam, nên nó là
bước đầu mở ra hướng nghiên cứu và sử dụng mới ở Việt Nam.

- Ý nghĩa thực tiễn:
+ Nghiên cứu đóng góp một giải pháp để tạo ra WebGIS có ngữ nghĩa cho
Việt Nam.
+ Nghiên cứu được áp dụng ở Việt Nam sẽ giúp tạo ra các WebGIS có ngữ
nghĩa có chất lượng tốt hơn WebGIS truyền thống trước đây (Tốt hơn ở chỗ: Nó cho
phép tích hợp được các nguồn dữ liệu khác nhau, cung cấp thơng tin chính xác và đầy
đủ hơn đến người dùng).
Cấu trúc của luận văn bao gồm các phần như sau:
MỞ ĐẦU: Nội dung phần mở đầu chỉ ra lý do chọn đề tài; mục đích, đối
tượng, phạm vi nghiên cứu của luận văn; tóm tắt những điểm cơ bản và đóng góp mới
của tác giả và phương pháp nghiên cứu.
CHƯƠNG 1: WEBGIS VÀ WEB NGỮ NGHĨA: Nội dung chương này
trình bày những tìm hiểu lý thuyết về GIS cũng như WebGIS và công nghệ web ngữ
nghĩa.
CHƯƠNG 2: ỨNG DỤNG CÔNG NGHỆ WEB NGỮ NGHĨA CHO GIS:
Nội dung chương này trình bày về khảo sát một số WebGIS tiêu biểu ở Việt Nam và
đánh giá về chúng. Tiếp đó, tác giả đánh giá tiềm năng, các ứng dụng của web ngữ
nghĩa cho GIS cũng như WebGIS, những đặc điểm nổi bật của chúng.
CHƯƠNG 3: WEBGIS CÓ NGỮ NGHĨA: Đưa ra một giải pháp để tạo ra
hệ thống WebGIS có ngữ nghĩa mà có thể khắc phục được bất cập mà WebGIS truyền
thống gặp phải.
CHƯƠNG 4: THỬ NGHIỆM, KẾT QUẢ VÀ BÀN LUẬN: Trình bày về
thử nghiệm, kết quả thử nghiệm và đánh giá về kết quả thử nghiệm.
KẾT LUẬN: Tổng kết, đánh giá về toàn bộ luận văn và đưa ra một số hướng
phát triển luận văn.

15


CHƯƠNG 1: WEBGIS VÀ WEB NGỮ NGHĨA

1.1. WebGIS
WebGIS là GIS mà sử dụng công nghệ web để công bố tài ngun GIS lên
mạng máy tính. Do đó, trước khi đề cập đến WebGIS, chúng ta sẽ cùng xem xét
những khái niệm cơ bản, các tính năng và ứng dụng của GIS.
1.1.1. Khái niệm GIS
GIS là từ viết tắt của cụm từ Tiếng Anh Geograhic Information System (Hệ
thống thông tin địa lý).
GIS ra đời từ năm 1960 do giáo sư Roger Tomlinson khởi sướng (Roger
Tomlinson là một nhà bản đồ học người Anh, cho đến nay ông được cả thế giới công
nhận là cha đẻ của GIS). Mặc dù ra đời từ năm 1960, nhưng mãi đến năm 1980, khi
mà công nghệ thơng tin phát triển thì GIS cũng mới phát triển theo. Từ năm 1980 đến
nay có rất nhiều các định nghĩa được đưa ra về GIS; tùy theo lĩnh vực, quan điểm sử
dụng GIS mà đã có những định nghĩa khác nhau về GIS, như:
- Xuất phát từ những lĩnh vực khác GIS, những nhà khoa học trong các lĩnh
vực địa chất, môi trường, tài nguyên, vv... sử dụng GIS như là những công cụ phục
vụ cho những công trình nghiên cứu của mình đã định nghĩa GIS:
+ GIS là một hộp công cụ mạnh được dùng để lưu trữ và truy vấn tùy ý, biến
đổi và hiển thị dữ liệu không gian từ thế giới thực cho những mục tiêu đặc biệt [10].
+ GIS là một hệ thống có chức năng xử lý các thơng tin địa lý nhằm phục vụ
việc qui hoạch, trợ giúp quyết định trong một lĩnh vực chuyên môn nhất định [17].
+ GIS là một hệ thống sử dụng cơ sở dữ liệu để trả lời các câu hỏi về bản chất
địa lý của các thực thể địa lý [14].
- Theo quan điểm hệ thống thông tin, một số nhà khoa học đã định nghĩa:
+ GIS là một hệ thống thông tin được thiết kế để làm việc với dữ liệu có tham
chiếu tọa độ địa lý. Nói cách khác, GIS là hệ thống gồm hệ cơ sở dữ liệu với những
dữ liệu có tham chiếu khơng gian và một tập những thuật tốn để làm việc trên dữ
liệu đó [19].

16



+ GIS là một hệ thống thông tin bao gồm một số phụ hệ (subsystems) có khả
năng biến đổi các dữ liệu địa lý thành những thơng tin có ích [11].
+ GIS là một hệ thống thông tin đặc biệt với cơ sở dữ liệu gồm những đối
tượng, những hoạt động hay những sự kiện phân bố trong không gian được biểu diễn
như những điểm, đường, vùng trong hệ thống máy tính. Hệ thống thơng tin địa lý xử
lý, truy vấn dữ liệu theo điểm, đường, vùng phục vụ cho những hỏi đáp và phân tích
đặc biệt [13].
Những định nghĩa trên cho thấy rằng hệ thống thông tin địa lý có những khả
năng của một hệ thống máy tính (phần cứng, phần mềm và các thiết bị ngoại vi) dùng
để nhập, lưu trữ, truy vấn, xử lý, phân tích và hiển thị hoặc xuất dữ liệu. Trong đó, cơ
sở dữ liệu của hệ thống là những dữ liệu về các đối tượng, các hoạt động kinh tế, xã
hội, nhân văn phân bố trong không gian tại những thời điểm nhất định.
1.1.2. Mơ hình cơng nghệ GIS
Một cách khái qt, có thể hiểu một hệ thống GIS như là một quá trình gồm
các cơng đoạn nối tiếp nhau như sơ đồ sau:

Dữ liệu
vào

Quản lý
dữ liệu

Xử lý
dữ liệu

Phân tích
và mơ hình

Dữ liệu

ra

Hình 1.1: Mơ hình cơng nghệ GIS [6]
- Dữ liệu vào: Dữ liệu được nhập từ các nguồn khác nhau như chuyển đổi giữa
các cách biểu diễn dữ liệu, máy quét, hình ảnh từ vệ tinh, ảnh chụp, …
- Quản lý dữ liệu: Sau khi dữ liệu được thu thập và tổng hợp, GIS cần cung
cấp các thiết bị có thể lưu và bảo trì dữ liệu nhằm đảm bảo: Bảo mật số liệu, tích hợp
số liệu, lọc và đánh giá số liệu, khả năng duy trì. GIS lưu thơng tin thế giới thực thành
các tầng dữ liệu riêng biệt, các tầng này đặt trong cùng một hệ trục toạ độ và chúng
có khả năng liên kết với nhau.

17


- Xử lý dữ liệu: Các thao tác xử lý dữ liệu được thực hiện để tạo ra thơng tin.
Nó giúp cho người sử dụng quyết định cần làm tiếp cơng việc gì. Kết quả của xử lý
dữ liệu là tạo ra các ảnh, báo cáo và bản đồ.
- Phân tích và mơ hình: Số liệu tổng hợp và chuyển đổi chỉ là một phần của
GIS. Những yêu cầu tiếp theo là khả năng giải mã và phân tích về mặt định tính và
định lượng thơng tin đã thu thập.
- Dữ liệu ra: Một trong các phương diện công nghệ GIS là sự thay đổi của các
phương pháp khác nhau trong đó thơng tin có thể hiển thị khi nó được xử lý bằng
GIS. Các phương pháp truyền thống là bảng và đồ thị có thể cung cấp bằng các bản
đồ và ảnh ba chiều.
1.1.3. Những lĩnh vực khoa học liên quan đến GIS
GIS là sự hội tụ các lĩnh vực cơng nghệ và các ngành truyền thống, nó hợp
nhất các số liệu mang tính liên ngành bằng tổng hợp, mơ hình hố và phân tích. Vì
vậy có thể nói, GIS được xây dựng trên các tri thức của nhiều ngành khoa học khác
nhau để tạo ra các hệ thống phục vụ mục đích cụ thể. Các ngành này bao gồm:
- Ngành địa lý: Là ngành liên quan mật thiết đến việc biểu diễn thế giới và vị

trí của đối tượng trong thế giới. Nó có truyền thống lâu đời về phân tích khơng gian
và nó cung cấp các kỹ thuật phân tích khơng gian khi nghiên cứu [7].
- Ngành bản đồ: Nguồn dữ liệu đầu vào chính của GIS là các bản đồ. Ngành
bản đồ có truyền thống lâu đời trong việc thiết kế bản đồ, do vậy nó cũng là khuôn
mẫu quan trọng nhất của đầu ra GIS [7].
- Công nghệ viễn thám: Các ảnh vệ tinh và ảnh máy bay chụp là nguồn dữ liệu
địa lý quan trọng cho hệ GIS. Viễn thám bao gồm cả kỹ thuật thu thập và xử lý dữ
liệu ở mọi vị trí trên quả địa cầu. Các dữ liệu đầu ra của hệ thống ảnh vệ tinh có thể
được trộn với các lớp dữ liệu của GIS. Ảnh máy bay: Khi ta xây dựng bản đồ có tỷ lệ
cao thì ảnh chụp từ máy bay là nguồn dữ liệu chính về bền mặt trái đất được sử dụng
làm đầu vào [7].
- Bản đồ địa hình: Cung cấp dữ liệu có chất lượng cao về vị trí của ranh giới
đất đai, nhà cửa, vv… [7].

18


- Ngành thống kê: Các kỹ thuật thống kê được sử dụng để phân tích dữ liệu
GIS. Nó là đặc biệt quan trọng trong việc xác định sự phát sinh các lỗi hoặc tính
khơng chắc chắn trong số liệu của GIS [7].
- Khoa học tính tốn: Tự động thiết kế máy tính cung cấp kỹ thuật nhập, hiển
thị biểu diễn dữ liệu. Đồ hoạ máy tính cung cấp cơng cụ để thể hiện, quản lý các đối
tượng đồ hoạ. Quản trị cơ sở dữ liệu cho phép biểu diễn dữ liệu dưới dạng số, các thủ
tục để thiết kế hệ thống, lưu trữ, xâm nhập và cập nhật [7].
- Toán học: Các ngành hình học và lý thuyết đồ thị được sử dụng trong thiết
kế hệ GIS và phân tích dữ liệu không gian [7].
1.1.4. Các thành phần của GIS
Hệ thống GIS bao gồm 5 thành phần được mô tả như hình dưới đây:

Hình 1.2: Các thành phần của GIS [6]

Các thành phần của GIS:
a. Con người: Người tham gia vào GIS có những loại sau: Thứ nhất là người
dùng GIS là những người sử dụng các phần mềm GIS để giải quyết các bài tốn khơng
gian theo mục đích của họ. Họ thường là những người được đào tạo tốt về lĩnh vực
GIS hay là các chuyên gia. Kế đến là người xây dựng bản đồ: Sử dụng các lớp bản
đồ được lấy từ nhiều nguồn khác nhau, chỉnh sửa dữ liệu để tạo ra các bản đồ theo
yêu cầu. Nhà xuất bản thì là nhân tố sử dụng phần mềm GIS để kết xuất ra bản đồ
dưới nhiều định dạng xuất khác nhau. Nhà phân tích thì giải quyết các vấn đề như tìm
19


kiếm, xác định vị trí, … Người xây dựng dữ liệu là những người chuyên nhập dữ liệu
bản đồ bằng các cách khác nhau như: Vẽ, chuyển đổi từ các định dạng khác nhau,
truy nhập CSDL, vv… Người quản trị CSDL thì quản lý CSDL GIS và đảm bảo hệ
thống vận hành tốt. Trong khi đó người thiết kế CSDL lại xây dựng các mơ hình dữ
liệu lơgic và vật lý. Cuối cùng là nhà phát triển, họ xây dựng hoặc cải tạo các phần
mềm GIS để đáp ứng các nhu cầu cụ thể.
b. Dữ liệu: Dữ liệu của hệ GIS được lưu trữ trong CSDL quan hệ và chúng
được thu thập thơng qua các mơ hình thế giới thực. Dữ liệu trong hệ GIS cịn được
gọi là thơng tin khơng gian. Đặc trưng thơng tin khơng gian là có khả năng mơ tả “vật
thể ở đâu” nhờ vị trí tham chiếu, đơn vị đo và quan hệ không gian. Chúng cịn có khả
năng mơ tả “hình dạng hiện tượng” thơng qua mơ tả chất lượng, số lượng của hình
dạng và cấu trúc. Cuối cùng, đặc trưng thông tin không gian mô tả “quan hệ và tương
tác” giữa các hiện tượng tự nhiên. Mơ hình khơng gian đặc biệt quan trọng vì cách
thức thơng tin sẽ ảnh hưởng đến khả năng thực hiện phân tích dữ liệu và khả năng
hiển thị đồ hoạ của hệ thống. Theo Barbara Parmenter (2007) cấu trúc cơ sở dữ liệu
trong GIS bao gồm 2 loại dữ liệu khơng gian (hình học) và dữ liệu phi khơng gian
(dữ liệu thuộc tính):
- Mơ hình dữ liệu không gian: Đây là dạng dữ liệu cơ bản của một hệ thống
thông tin điạ lý. Dạng dữ liệu này bao gồm các thơng tin có tính đồ họa chỉ rõ hình

dạng, phạm vi khơng gian, vị trí địa lý của một thực thể trong thế giới thực được khái
quát hóa thành các đặc tính địa lý như: điểm, đường hay vùng trên bản đồ (hoặc ảnh)
dưới dạng vector hoặc raster [7].
+ Dạng Vector: Sử dụng các điểm, đường, vùng rời rạc để thể hiện cho các đối
tượng rời rạc thơng qua thuộc tính tên hoặc mã số quy định. Mọi đối tượng không
gian đều được thể hiện thông qua các phần tử cơ bản là điểm, đường và vùng.
. Kiểu đối tượng điểm (Point): Được xác định bởi cặp giá trị tọa độ (X, Y).
Các đối tượng đơn, thông tin địa lý chỉ gồm cơ sở vị trí sẽ được phản ánh là đối tượng
điểm.

20


. Kiểu đối tượng đường (Line): Được xác định như một tập hợp dãy các điểm.
Tất cả đối tượng địa lý có dạng tuyến tính được phản ánh bằng đối tượng đường.
. Kiểu đối tượng vùng (Polygon): Là đối tượng hình học hai chiều được xác
định bởi ranh giới các đường thẳng. Các đối tượng địa lý có diện tích và đóng kín bởi
các đường, cung được gọi là đối tượng vùng.
+ Dạng Raster: Mơ hình dữ liệu dạng raster là kiểu cấu trúc dữ liệu mô tả
không gian dưới dạng các lưới ô vuông quy chuẩn (các pixel hay điểm ảnh). Mơ hình
dữ liệu raster chủ yếu dùng để phản ánh các đối tượng dạng vùng, được ứng dụng cho
các bài toán tiến hành trên các loại đối tượng dạng vùng như: Phân loại, chồng xếp.

Dữ liệu raster

Thế giới thực

Dữ liệu vector

Hình 1.3: Mơ hình dữ liệu khơng gian [7]

- Mơ hình dữ liệu phi khơng gian: Dữ liệu phi khơng gian hay cịn gọi là dữ
liệu thuộc tính là những mơ tả về đặc tính, đặc điểm và các hiện tượng xảy ra tại các
vị trí địa lý xác định.

21


Có 4 loại số liệu thuộc tính cơ bản trong hệ thống thơng tin địa lý:
+ Đặc tính của đối tượng: màu sắc, chất liệu được liên kết chặt chẽ với các
thông tin không gian.
+ Số liệu tham khảo địa lý: Bao gồm số liệu các sự kiện, hiện tượng miêu tả
thơng tin các hoạt động thc vị trí xác định.
+ Chỉ số điạ lý: Tên, địa chỉ, phương hướng, liên quan đến các đối tượng địa
lý.
+ Quan hệ giữa các đối tượng trong không gian đơn giản hay phức tạp.

Hình 1.4: Minh họa liên kết giữa dữ liệu khơng gian và phi khơng gian [7]
c. Phần cứng: Đó là các máy tính điện tử: PC, mini Computer, MainFrame,…
là các thiết bị mạng cần thiết khi triển khai GIS trên mơi trường mạng. GIS cũng địi
hỏi các thiết bị ngoại vi đặc biệt cho việc nhập và xuất dữ liệu như: Máy số hoá
(digitizer), máy vẽ (plotter), máy quét (scanner), thiết bị xác định tọa độ địa lý
(GPS),…
d. Phần mềm: Hệ thống phần mềm GIS rất đa dạng. Mỗi đơn vị xây dựng GIS
đều có hệ phần mềm riêng của mình. Tuy nhiên, có một dạng phần mềm mà các đơn
vị phải xây dựng là hệ quản trị CSDL địa lý. Dạng phần mềm này nhằm mục đích
nâng cao khả năng cho các phần mềm CSDL thương mại trong việc: Sao lưu dữ liệu,
định nghĩa bảng, quản lý các giao dịch, do đó ta có thể lưu các dữ liệu địa lý dưới
dạng các đối tượng hình học trực tiếp trong các cột của bảng quan hệ và nhiều công
việc khác.
22



Một số phần mềm GIS thông dụng: Microstation, AutoCad, MapInfo, Bentley,
ArcGIS, phần mềm GIS mã nguồn mở (QGIS, OpenMapGuide, ...).
e. Phương pháp phân tích: Các phương pháp phân tích cấu trúc và nội dung
dữ liệu.
1.1.5. Một số khả năng ứng dụng của GIS
Theo cách tiếp cận truyền thống GIS là một cơng cụ máy tính để lập bản đồ
và phân tích các sự vật và hiện tượng thực trên trái đất. Công nghệ GIS kết hợp các
thao tác cơ sở dữ liệu thông thường (cấu trúc hỏi đáp), các phép phân tích thống kê
và phân tích khơng gian. Những khả năng này phân biệt GIS với các hệ thống thông
tin khác khiến cho GIS có phạm vi ứng dụng rộng trong nhiều lĩnh vực khác nhau
như: Phân tích các sự kiện, dự đoán tác động và hoạch định chiến lược.
Một số khả năng ứng dụng cụ thể của GIS thường thấy trong thực tế là:
- Quản lý hệ thống đường phố: Tìm kiếm, phân tích vị trí, chọn khu vực xây
dựng các tiện ích như bãi đỗ xe, ga tàu, lập kế hoạch phát triển giao thông, vv...
- Quản lý giám sát tài nguyên, thiên nhiên và môi trường: Quản lý gió và thuỷ
hệ, các nguồn nhân tạo, bình đồ lũ, vùng ngập úng, đất nông nghiệp, tầng ngập nước,
rừng, vùng tự nhiên và phân tích tác động mơi trường, xcác định ví trí chất thải độc
hại, mơ hình hố nước ngầm, phân tích phân bố dân cư, vv...
- Quản lý quy hoạch: Phân vùng quy hoạch sử dụng đất, các hiện trạng xu thế
môi trường và quản lý chất lượng nước.
- Quản lý các thiết bị: Xác định đường ống ngầm và cáp ngầm. Xác định tải
trọng của lưới điện. Duy trì quy hoạch các thiết bị và sử dụng đường điện.
- Phân tích tổng điều tra dân số, lập bản đồ các dịch vụ y tế và bưu điện, vv...
- Trợ giúp quy hoạch đô thị: Nhà quy hoạch đô thị quan tâm đến sự phát triển
mở rộng đô thị ra các vùng ngoại ô và xem xét đến việc phát triển dân số cơ học tại
các vùng đó cũng như lý do tại sao cần phát triển đô thị ở vùng này chứ không phải
ở vùng khác.


23


- Hỗ trợ nghiên cứu sinh học: Nhà sinh vật học nghiên cứu tác động của tập
quán đốt rừng làm nương đến khả năng sinh tồn lâu dài của những loài động vật lưỡng
cư tại các vùng rừng núi.
- Phân tích phịng chống thiên tai: Nhà phân tích thiên tai xác định những vùng
có nguy cơ ngập lụt cao gắn liền với hiện tượng gió mùa hàng năm qua việc xem xét
các tính chất mưa và địa hình của khu vực.
- Quản lý và phân tích địa chất: Nhà địa chất xác định những khu vực tối ưu
cho việc xây dựng cơng trình tại vùng đất có chấn động thường xuyên bằng cách phân
tích các tính chất kiến tạo đá.
- Quản lý và phân tích trong bưu chính viễn thơng: Các cơng ty viễn thơng
muốn xác định vị trí tối ưu để xây dựng trạm rơle có tính đến các yếu tố chi phí như
giá đất và mức độ bằng phẳng của địa hình.
1.1.6. Khái niệm WebGIS
Khi chúng ta sử dụng công nghệ web để triển khai GIS lên mạng máy tính thì
hệ thống đó được gọi là hệ thống WebGIS [7].
WebGIS chính là cơng cụ trực quan dùng để công bố các tài nguyên dữ liệu
GIS lên mạng máy tính cho mọi người có thể tra cứu và truy vấn, giúp cho tài nguyên
GIS được truy cập rộng rãi hơn đến người dùng trên tồn thế giới.
1.1.7. Các tính năng của WebGIS
- Tính năng tra cứu dữ liệu GIS trực tuyến: Thông thường trước đây người
dùng muốn tra cứu tài ngun GIS thì cần phải có dữ liệu GIS trong máy tính, đồng
thời máy cũng phải được cài đặt phần mềm GIS tương thích. Việc này gây ra khá
nhiều khó khăn, phiền tốn. WebGIS đã gạt bỏ các cản trở đó bằng cách cho phép
người dùng chỉ việc có một thiết bị máy khách có khả năng vào mạng và dùng trình
duyệt web để xem dữ liệu GIS (đặc trưng là bản đồ) đã được tạo ra bởi nhà xuất bản.
- Tính năng phân tích đơn giản: Tìm vùng bao (buffer) hay tìm đường đi ngắn
nhất.


24


1.1.8. Kiến trúc WebGIS và các bước xử lý
Kiến trúc web của hệ thống WebGIS cũng gần giống như kiến trúc dành cho
một hệ thống web cơ bản khác, ngoại trừ ứng dụng GIS sử dụng các kỹ thuật khác.
Kiến trúc tổng quát nhất được mô tả như sau:
Client (Web
Browser)

GIS
Database

Web Server
Image, map
response spatial

Map engine

Hình 1.5: Kiến trúc hệ thống WebGIS
Quá trình làm việc với hệ thống web xử lý thơng tin khơng gian được minh
họa như trên hình vẽ 1.5, sau đây là quy trình xảy ra khi một người dùng sử dụng
trình duyệt web ở phía máy khách để truy cập hệ thống:
- Máy khách gửi yêu cầu của người sử dụng thông qua giao thức HTTP đến
máy chủ web.
- Máy chủ web nhận yêu cầu của người dùng gửi đến từ phía máy khách, xử
lý và chuyển tiếp yêu cầu đến ứng dụng trên máy chủ có liên quan đã được cài đặt
sẵn trong máy chủ web, trường hợp này là ứng dụng WebGIS.
- Ứng dụng WebGIS chạy trên máy chủ nhận các yêu cầu cụ thể đối với ứng

dụng và gọi các hàm có liên quan để tính tốn xử lý. Trong q trình xử lý, nếu có
yêu cầu dữ liệu nó sẽ gửi yêu cầu dữ liệu đến máy chủ tổng hợp dữ liệu.
- Máy chủ tổng hợp dữ liệu nhận yêu cầu dữ liệu và tìm kiếm vị trí của những
dữ liệu này sau đó gửi yêu cầu dữ liệu đến máy chủ cơ sở dữ liệu có chứa dữ liệu
tương ứng cần tìm.

25


×