Tải bản đầy đủ (.pdf) (101 trang)

Tổng hợp và phân tích dữ liệu từ các địa phương trên nền Web có sự trợ giúp của công nghệ GIS

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.81 MB, 101 trang )

i

ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

---------------------------------------

TRẦN HỮU CƢỜNG

TỔNG HỢP VÀ PHÂN TÍCH DỮ LIỆU TỪ CÁC ĐỊA
PHƢƠNG TRÊN NỀN WEB CÓ SỰ TRỢ GIÚP
CỦA CÔNG NGHỆ GIS

Chuyên ngành: Khoa học máy tính

Thái Nguyên - 2014

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

ii
LỜI CẢM ƠN
Sau một thời gian nghiên cứu, cùng với sự giúp đỡ tận tình của thầy giáo
PGS.TS. Nguyễn Văn Vỵ đến nay em đã hoàn thành luận văn về đề tài “Tổng hợp
và phân tích dữ liệu từ các địa phƣơng trên nền web có sự trợ giúp của công nghệ
GIS”
Em xin trân trọng cảm ơn thầy PGS.TS. Nguyễn Văn Vỵ ngƣời đã trực tiếp
hƣớng dẫn, giúp đỡ em trong quá trình làm luận văn.
Em xin cảm ơn quý thầy cô trong trong trƣờng Đại học Công Nghệ Thông
Tin và Truyền Thông - Đại Học Thái Nguyên đặc biệt là các quý thầy cô trong Viện


Hàn lâm Khoa học và Công nghệ Việt Nam đã chỉ dạy cho em những kiến thức hết
sức quý báu trong thời gian em học tập.
Vì lý do thời gian và vì lƣợng kiến thức thực tế còn hạn chế nên trong luận
văn chắc chắn không tránh khỏi những khiếm khuyết, mong thầy cô giáo cùng các
bạn đóng góp ý kiến để tôi có thể củng cố kiến thức và tiếp tục hoàn thiện tài liệu
tốt hơn.
Em xin chân thành cảm ơn!
Trần Hữu Cƣờng

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

ii
MỤC LỤC
LỜI CẢM ƠN ................................................................................................................... I
MỤC LỤC.........................................................................................................................II
TÓM TẮT.........................................................................................................................IV
MỘT SỐ THUẬT NGỮ VÀ TỪ VIẾT TẮT.................................................................V
MỞ ĐẦU .......................................................................................................................... 8
CHƢƠNG 1 KHÁI QUÁT VỀ CÔNG NGHỆ GIS VÀ BÀI TOÁN TỔNG HỢP PHÂN
TÍCH SỐ LIỆU.......................................................................................................................4
1.1. Công nghệ GIS ......................................................................................................... 4
1.1.1. Định nghĩa GIS ................................................................................................... 4
1.1.2. Thành phần dữ liệu GIS ...................................................................................... 4
1.1.2.1. Dữ liệu không gian .......................................................................................... 5
1.1.2.2. Dữ liệu thuộc tính ............................................................................................ 6
1.1.3. Các chức năng chính của GIS ............................................................................. 7
1.1.4. Cơ sở dữ liệu phân tán dạng GIS ........................................................................ 8
1.1.5. Hệ quản trị CSDL lựa chọn .............................................................................. 11

1.2. WebGIS ................................................................................................................... 11
1.2.1. Kiến trúc WebGIS và các bƣớc xử lý ............................................................... 11
1.2.2. Các chuẩn trao đổi WebGIS hiện nay............................................................... 18
1.2.3. Web và Webservice .......................................................................................... 20
1.24. Đặc điểm của WebGIS.................................................................................. ....21
1.2.5. Những công cụ đƣợc sử dụng cho WebGIS ......................................................23
1.3 Hoạt động nghiệp vụ theo dõi dữ liệu ................................................................... 25
1.3.1. Tổ chức thu thập và tổng hợp dữ liệu ............................................................... 25
1.3.2. Khai báo dữ liệu ................................................................................................ 26
1.3.3. Điều tra định kỳ hay đột xuất............................................................................ 26
1.3.4. Sơ đồ mô tả quá trình thu thập dữ liệu báo cáo ................................................ 27
CHƢƠNG 2: MỘT SỐ KỸ THUẬT PHÂN TÍCH DỮ LIỆU VÀ DỰ BÁO......... 28
2.1. Một số kỹ thuật phân tích dữ liệu ........................................................................ 28
2.1.1. Kỹ thuật toán định lƣợng ................................................................................. 28
2.1.2 Kỹ thuật phân tích dựa vào bản đồ và GIS ....................................................... 31
2.1.3 Kỹ thuật viễn thám phân tích chỉ số thực vật (NDVI)......................................29
2.1.4 Kỹ thuật tổng hợp..............................................................................................31
2.2. Một số phƣơng pháp dự báo ................................................................................. 36
2.2.1. Hồi quy tuyến tính đa biến ................................................................................ 36
2.2.2. Phƣơng pháp dự báo dịch dựa vào giá trị trung bình cộng 2 độ lệch chuẩn
(Mean + 2SD)...............................................................................................................37
2.2.3. Dự báo dựa trên phân bố Poisson.....................................................................38
2.3 Phân tích và dự báo ................................................................................................ 42
2.3.1. Hoạt động nghiệp vụ tại các cấp ....................................................................... 42
2.3.2. Các chức năng nghiệp vụ .................................................................................. 44
2.3.3. Mô hình vật lý của hệ thống ............................................................................. 45
2.3.4. Mô hình logic của hệ thống .............................................................................. 46
2.3.5. Thiết kế các phân hệ của hệ thống ................................................................. 48
Số hóa bởi Trung tâm Học liệu - ĐHTN


/>

iii
2.3.5.1. Sơ đồ các phân hệ...........................................................................................46
2.3.5.2. Thiết kế mô hinh phân hệ các tuyến .............................................................. 49
2.3.5.3. Thiết kế phân hệ tuyến xã...............................................................................48
2.3.5.4. Phân hệ tuyến huyện ...................................................................................... 51
2.3.5.5. Phân hệ tuyến tỉnh.......................................................................................... 51
CHƢƠNG 3 CHƢƠNG TRÌNH THỬ NGHIỆM.......................................................51
3.1. Phân tích yêu cầu và lựa chọn môi trƣờng...........................................................51
3.1.1. Phân tích dữ liệu dịch bệnh........................................................................................51
3.1.2. Thiết kế dữ liệu logic ........................................................................................ 56
3.1.3. Thiết kế dữ liệu vật lý ....................................................................................... 60
3.1.4. Ứng dụng .......................................................................................................... 66
3.1.5. Phân hệ khai thác trên nền web ........................................................................ 69
3.2.Lập trình và cài đặt hệ thống ................................................................................. 72
3.2.1. Lựa chọn môi trƣờng ........................................................................................ 72
3.2.2. Lập trình và cài đặt hệ thống ............................................................................ 73
3.2.3. Vận hành và thử nghiệm hệ thống .................................................................... 73
3.2.4. Đánh giá ............................................................................................................ 73
3.3. Một số kết quả.........................................................................................................71
3.3.1. Những kết quả của luận văn.............................................................................. 74
3.3.2. Những hạn chế và hƣớng phát triển .................................................................. 77
TÀI LIỆU THAM KHẢO ........................................................................................... 78
PHỤ LỤC: CÁC MẪU BÁO CÁO VÀ TỔNG HỢP ................................................ 79

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>


iv
TÓM TẮT
GIS ra đời và đƣợc phát triển mạnh trong những năm gần đây. Cùng với sự
bùng nổ về công nghệ của Internet, GIS cũng đã phát triển công nghệ cho phép chia
sẻ thông tin thông qua mạng toàn cầu bằng cách kết hợp GIS và Web hay còn gọi là
WebGIS. Bên cạnh đó, xu hƣớng chia sẻ dữ liêu, phát triển phần mềm trên công
nghệ mã nguồn mở cũng đang đƣợc quan tâm ở các nƣớc đang phát triển vì nhiều
lợi ích mà nó mang lại. Vì thế việc nghiên cứu ứng dụng WebGIS trên cơ sở mã
nguồn mở sẽ mang lại khả năng chia sẻ thông tin địa lý rộng rãi cho các ngành.
Nội dung chính của đề tài là tìm hiểu về hệ thống thông tin địa lý GIS và
ứng dụng của chúng. Nghiên cứu về WebGIS, khả năng xây dựng ứng dụng
WebGIS trên cơ sở mã nguồn mở, trên cơ sở đó ứng dụng xây dựng WebGIS phục
vụ công tác “Tổng hợp và phân tích dữ liệu từ các địa phương trên nền web có sự
trợ giúp của công nghệ GIS”.
Đề tài đi sâu về các kỹ thuật phân tích vì vậy sẽ không đề cập nhiều đến vấn đề
tổng hợp số liệu
Kết quả của đề tài đã trình bày các nghiên cứu lý thuyết về WebGIS: phân
loại, tìm hiểu các chiến lƣợc phát triển WebGIS, tìm hiểu phần mềm xây dựng
WebGIS trên cơ sở mã nguồn mở là MapServer và đã xây dựng ứng dụng WebGIS
giám sát tình hình và cảnh báo xu hƣớng lây truyền của bệnh sốt rét trên phạm vi cả
nƣớc.

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

v

MỘT SỐ THUẬT NGỮ VÀ TỪ VIẾT TẮT
Viết

tắt

Tên đầy đủ

GIS

Geographic Information System - Hệ thông tin địa lý

ESRI

Environmental System Research Institute- Viện nghiên cứu môi
trƣờng

DBMS

Data Base Manager System – Hệ quản trị cơ sở dữ liệu.

GUI

Graphical User Giao diện - Giao diện đồ hoạ ngƣời sử dụng.

CSDL

Cơ sở dữ liệu.

WWW

World Wide Web - mạng toàn cầu.

HTML


HyperText Markup Language - Ngôn ngữ siêu văn bản.

HTTP

HyperText Transfer Protocol - Giao thức truyền siêu văn bản.

KST

Ký sinh trùng

SR

Sốt rét

BNSR

Bệnh nhân sốt rét

SRLH

Vùng sốt rét lƣu hành

PCSR

Phòng chống sốt rét

YTDP

Y tế dự phòng


XN

Xét nghiệm

TT

Tuyên truyền

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

vi
DANH MỤC HÌNH VẼ
Hình 1.1: Mô hình dữ liệu không gian ........................................................................ 5
Hình 1.2: Dữ liệu Raster ............................................................................................. 6
Hình 1.3: Chức năng chính của GIS ........................................................................... 8
Hình 1.4 : Geodatabase trong ArcGIS ........................................................................ 9
Hình 1.5: Kiến trúc webgis........................................................................................12
Hình 1.6: Các dạng yêu cầu từ phía client.................................................................15
Hình 1.7: Cấu hình Server-side ................................................................................17
Hình 1.8: Cấu hình Client - Side ...............................................................................17
Hình 1.9: Khả năng xử lý Gis....................................................................................18
Hình 1.10: Client hỏi thông tin.................................................................................. 19
Hình 1.11: Chuỗi URL .............................................................................................. 19
Hình 1.12 : Kiến trúc Web một máy chủ .................................................................. 20
Hình 1.13: Mô hình WebService............................................................................... 21
Hình 1.14: Mô hình vận hành của giao thức SOAP .................................................. 23
Hình 1.15: Sơ đồ nghiệp vụ thu thập dữ liệu báo cáo................................................26

Hình 2.1: Mô hình hệ thống vật lý .......................................................................... 44
Hình 2.2: Mô hình lôgic của hệ thống ....................................................................... 45
Hình 2.3: Sơ đồ các thành phần của hệ thống .......................................................... 47
Hình 2.4: Mô hình tổng thể các tuyến ....................................................................... 48
Hình 2.5: Mô hình xử lý của phân hệ tuyến xã ......................................................... 49
Hình 2.6 : Mô hình xử lý ........................................................................................... 51
Hình 3.1: Mô hình khái niệm của dữ liệu ER ........................................................... 54
Hình 3.2: Sơ đồ liên kết mô hình dữ liệu của hệ quan hệ thống ............................... 57
Hình 3.3: Kiến trúc hệ thống quản lý và dự báo dịch hại trực tuyến.........................64

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

vii
DANH MỤC CÁC BẢNG
Bảng 1.1: DBMS ................................................................................................................ 9
Bảng 2.1: Quy trình báo cáo tuyến xã..............................................................................41
Bảng 2.2: Các chức năng của hệ thống theo dõi, giám sát dịch bệnh sốt rét................... 45
Bảng 2.3: Cập nhật bản đồ dịch bệnh .............................................................................. 51
Bảng 2.4: Phân hệ tổng hợp, phân tích dự báo ................................................................ 52
Bảng 3.1: Các thực thể và các thuộc tính ......................................................................... 53
Bảng 3.2: Mỗi quan hệ giữa các thực thể.........................................................................53
Bảng 3.3: Lớp dữ liệu không gian.................................................................................... 60
Bảng 3.4: thông tin tỉnh.................................................................................................... 58
Bảng 3.5: Các thôn...........................................................................................................58
Bảng 3.6: Danh sách các xã/phƣờng................................................................................58
Bảng 3.7: Danh sách các huyện (quận)........................................................................59
Bảng 3.8: Bệnh nhân SR..................................................................................................59
Bảng 3.9: Danh mục thuốc và vật tƣ................................................................................59

Bảng 3.10: Danh mục loại bệnh sốt rét ............................................................................ 60
Bảng 3.11: Kiểu xét nghiệm thực hiện.............................................................................60
Bảng 3.12: Mục đích sử dụng thuốc.................................................................................60
Bảng 3.13 Hình thức tuyên truyên....................................................................................61
Bảng 3.14: Đơn vị y tế thuộc xã......................................................................................61
Bảng 3.15: Điều trị bệnh nhân..........................................................................................61
Bảng 3.16: Cấp thuốc cho các mục tiêu sử dụng..............................................................62
Bảng 3.17: Tình trạng sử dụng vật tƣ và thuốc của đơn vị y tế........................................62
Bảng 3.18: Thống kê việc xét nghiệm .............................................................................62
Bảng 3.19 Thống kê số ngƣời chết...................................................................................63
Bảng 3.20 công tác tuyên truyền.....................................................................................63
Bảng 3.21. Đánh giá.........................................................................................................68

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

viii

MỞ ĐẦU
1. Đặt vấn đề
Việc theo dõi dịch bệnh (nhƣ dịch sốt rét, sốt xuất huyết dịch nở mồn long
móng ở gia súc dịch chân tay miệng và một số bệnh lạ mới đƣợc phát hiện...) đã phát
sinh ở các địa phƣơng toàn quốc để có thông báo kịp thời cho các địa phƣơng phòng
tránh và có giải pháp thích hợp khi tình hình có nguy cơ bùng phát là công việc rất
quan trọng và đƣợc tiến hành thƣờng xuyên ở bộ Y tế. Trong nhiều năm qua, công
việc này đã đƣợc tiến hành có kết quả nhƣng vẫn chƣa đảm bảo về mặt thời gian vì
cách làm viêc chủ yếu vẫn là thủ công: Các báo cáo và văn bản đƣợc gửi về cơ quan
quản lý cấp bộ rồi tổng hợp, ra thông báo và các quyết định cho địa phƣơng. Quá
trình này thƣờng diễn ra chập chạp, chƣa đáp ứng đƣợc yêu cầu quản lý nhƣ mong

muốn: nhiều đợt dịch nhƣ nở mồm long móng, sốt rét, chân tay miệng, sốt xuất
huyết. Các chỉ đạo không theo kịp tình hình diễn biến của dịch bênh, và có những
hậu quả, thiệt hại đáng tiếc [].
Trong tình thế nhƣ trên, với sự tiến bộ nhanh chóng của công nghệ thông tin,
luận văn cố gắng áp dụng các tiến bộ công nghện mới cho hoạt động này. Vì thế đề
tài: ”Tổng hợp và phân tích dữ liệu từ các địa phương trên nền web có sự trợ giúp
của công nghệ GIS” đƣợc đề xuất nhằm hoàn thiện một bƣớc công tác theo dõi và chỉ
đạo kịp thời các dịch bệnh hàng năm, hạn chế đến mức thấp nhất có thể tác hại của
chúng.
Các dữ liệu về dịch bệnh do các địa phƣơng thu thập, chúng thƣờng gắn với
phạm vi quản lý của địa phƣơng, với dân cƣ và các điều kiện tự nhiên trên không
gian địa bàn quản lý. Việc theo dõi các dịch bênh đòi hỏi phải tổng hợp từ dƣới lên,
và cần đƣợc phân tích, đánh giá tình hình, tiến hành các dự báo để thông báo lại cho
các địa phƣơng biết và có những giải pháp đề phòng, ngăn chặn dịch bệnh kịp thời, đúng
nơi, đúng đối tƣợng.
Công nghệ GIS đã phát triển [1], việc tổ chức thu thập dữ liệu cũng nhƣ chuyển
tải và biểu diễn thông tin trên nền web có thể sử dụng công nghệ này [6,7,8].
GIS cung cấp cho ngƣời sử dụng khả năng thay đổi, đồng thời cũng xác định
những gì có thể xảy ra khi có sự thay đổi dữ liệu đó.
Nói cách khác, GIS cung cấp cho ngƣời sử dụng những mô hình khác nhau để
dữ liệu bản đồ là thành phần chính trong cơ sở dữ liệu của GIS. Các bản đồ gắn chặt
với thế giới thực và luôn đƣợc bổ sung những thông tin mới theo sự diễn biến của
thực tế.

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

2
Nền tảng của thông tin hình học trong GIS là bản đồ đã đƣợc số hoá ở dạng nào

đó để có thể thực hiện từ những phép tính đơn giản nhất: đo đạc diện tích, chu vi,
chiều dài, vị trí ... đến những phép tính phức tạp nhất: mở rộng diện tích, xác định
giao của nhiều vùng diện tích ... là những bài toán khá phổ biến trong quản lý và
nghiên cứu khoa học.
Từ các cơ sở dữ liêu (CSDL) thông thƣờng, GIS làm trực quan hóa, thuận tiện
và cùng một lúc cung cấp cho ngƣời sử dụng nhiều thông tin khác nhau đƣợc tổng
hợp lại.
Ví dụ, Sở y tế của một tỉnh cần thông tin về mật độ ký sinh trùng của tỉnh để lựa
chọn một điạ danh làm điểm nghiên cứu tại một huyện nào đó, trên màn hình là bản
đồ của huyện với mật độ ký sinh trùng từng khu vực đƣợc thể hiện bằng các màu
khác nhau, sở y tế chỉ việc chọn một khu vực có mật độ ký sinh trùng cao và bấm
“chuột” vào điểm đó, trên màn hình sẽ hiện lên các thông số về: số dân, mật độ ký
sinh trùng, khí tượng thuỷ văn, ... của khu vực cần tìm
Các phần mềm GIS áp dụng tối đa công nghệ GIS để có thể tạo ra hệ thống tự
động lập bản đồ và phƣơng tiện xử lý dữ liệu thông minh, nhờ hệ chuyên gia,..
Trƣớc những diễn biến ngày càng phức tạp về tình hình dịch bệnh SR trên cả
nƣớc, việc có một công cụ quản lý các hoạt động trong lĩnh vực phòng chống SR trên
địa bàn để có thể đáp ứng nhu cầu thông tin nhanh chóng, chính xác, trợ giúp sự chỉ
đạo kịp thời cho các Trung tâm y tế dự phòng, Trung tâm phòng chống SR là việc
làm rất cần thiết. Việc quản lý các đối tƣợng này sẽ rất trực quan và hiệu quả nếu
đƣợc xây dựng trên nền công nghệ thông tin địa lý (GIS).
2. Mục tiêu nghiên cứu của đề tài:
− Nghiên cứu các công nghệ liên quan đến phát triển hệ thống GIS (Geographical
Information System) trên nền Web.
− Phát triển ứng dụng GIS trợ giúp việc cảnh báo dịch bệnh tại địa phƣơng từ cấp
cở đến cấp tỉnh/thành phố một cách hiệu quả.
3. Nhiệm vụ nghiên cứu
− Nghiên cứu mô hình dữ liệu không gian đƣợc tổ chức trên WebGIS
− Mô hình hệ thống GIS véctơ: Kiến trúc kết nối GIS và Web
− Khảo sát thu thập dữ liệu bản đồ, dữ liệu một loại bệnh SR từ cơ sở đến cấp

tỉnh/thành phố và đề xuất mô hình dữ liệu lƣu trữ trong hệ thống GIS .
− Xây dựng thử nghiệm chƣơng trình demo Hệ thống thông tin tích hợp Web-GIS
trên cơ sở mã nguồn mở, với khả năng cảnh báo dịch bệnh SR.
Số hóa bởi Trung tâm Học liệu - ĐHTN
/>

3
4. Phạm vi nghiên cứu
− Hoàn thiện quy trình theo dõi, tổng hợp và phân tích dịch bệnh từ địa phƣơng đến
trung ƣơng đang thực hiện làm cơ sở để triển khai hệ thống thông tin theo dõi và
chỉ đạo xử lý dịch bênh trên nền webGIS.
− Nghiên cứu Web Service là một công nghệ đƣợc sử dụng rộng rãi để hiện thực mô
hình SOA, nó cung cấp cơ chế cho phép trao đổi, tƣơng tác giữa các ứng dụng với
nhau dựa trên nền tảng XML. Web sử dụng giao thức chuẩn để giao tiếp với nhau.
Điều này làm cho dịch vụ web có thể tƣơng tác với các dịch vụ web khác dễ dàng
tạo nên sự đồng nhất giữa các môi trƣờng không đồng nhất.
− Nghiên cứu xây dựng cơ sở dữ liệu dạng GIS từ địa phƣơng đến trung ƣơng phục
vụ việc thu thập và xử lý thông tin đáp ứng yêu cầu của bài toán đặt ra
− Các phƣơng pháp phân tích, tổng hợp và dự báo theo yêu cầu.
− Xây dựng hệ thống website phục vụ việc thu thập và chuyển tải thông tin của hệ
thống cảnh báo dịch bênh SR từ trung ƣơng đến địa phƣơng.
5. Bố cục của luận văn
Ngoài phần mở đầu và kết luận, luận văn bao gồm 3 chƣơng:
Chƣơng 1. Khái quát về công nghệ GIS và bài toán tổng hợp phân tích dữ liệu
Công nghệ sử dụng GIS, WEBGIS
Một số công cụ, công nghệ sử dung cho GIS,WEBGIS
Tổ chức thu thập và tổng hợp dữ liệu
Chƣơng 2. Một số kỹ thuật phân tích dữ liệu và dự báo
Kỹ thuật phân tích dữ liệu
Một số phƣơng pháp dự báo

Phân hệ tổng hợp và dự báo
Chƣơng 3: Chƣơng trình thử nghiệm
Cài đặt thử nghiệm và đánh giá
Lựa chọn môi trƣờng lập trình và cài đặt hệ thống.
Vận hành thử nghiệm và đánh giá hệ thống.
Cuối cùng là tài liệu tham khảo và một số phụ lục.

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

4

CHƢƠNG 1: KHÁI QUÁT CÔNG NGHỆ GIS VÀ BÀI TOÁN
TỔNG HỢP PHÂN TÍCH DỮ LIỆU
1.1. Công nghệ GIS
1.1.1. Định nghĩa GIS
GIS viết tắt của cụm từ Geographic Information Systems (Hệ thống thông tin
địa lý). Có nhiều định nghĩa về GIS :
− GIS là hệ thống phần cứng, phần mềm và các thủ tục đƣợc thiết kế nhằm thu thập,
quản lý, xử lý, phân tích, mô hình hóa và hiển thị các dữ liệu quy chiếu không gian
để giải quyết các vấn đề quản lý và kế hoạch (National Center for Geography
Information and Analysis NCGIA- USA)
− GIS là công cụ trên cơ sở máy tính để lập bản đồ và phân tích những hiện tƣợng
đang tồn tại và các sự kiện xả ra trên trái đất (Enviromental System Research
Insiture ESRI-USA).
− GIS là một tập hợp nguyên lý, phƣơng pháp, công cụ và dữ liệu quy chiếu không
gian đƣợc sử dụng để nhập, lƣu trữ, chuyển đổi, phân tích, lập mô hình, mô phỏng
và lập bản đồ các hiện tƣợng, sự kiện trên trái đất, nhằm sản sinh các thông tin
thiết thực hỗ trợ cho việc ra quyết định (Thériault – Canada)…

− Tổng quát lại thì GIS thực hiện việc thu thập, quản lý, thao tác và phân tích dữ liệu
địa lý cùng với việc trình bày kết qua dƣới hình thức bản đồ và báo cáo.
1.1.2. Thành phần dữ liệu GIS
Bản đồ là phƣơng tiện tốt nhất để hiển thị các thông tin địa lý. Các dữ liệu
không gian bao gồm ba loại đặc điểm: điểm, đường và vùng; vị trí của chúng đƣợc
xác định bằng tọa độ.
Dữ liệu trong hệ thống thông tin địa lý là những dữ liệu luôn thay đổi và phức
hệ. Chúng bao gồm những mô tả số của hình ảnh bản đồ, mối quan hệ logic giữa các
hình ảnh đó, những dữ liệu thể hiện các đặc tính của hình ảnh và các hiện tƣợng xảy
ra tại các vị trí địa lý xác định.
Cơ sở dữ liệu của hệ thống thông tin địa lý bao gồm 2 phần cơ bản là dữ liệu
không gian (dữ liệu bản đồ) và dữ liệu thuộc tính (dữ liệu phi không gian). Mỗi loại
dữ liệu có đặc trƣng riêng và chúng khác nhau về yêu cầu lƣu trữ, xử lý và hiển thị.

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

5
1.1.2.1. Dữ liệu không gian
Là những mô tả số của hình ảnh bản đồ. Chúng bao gồm toạ độ, quy luật và các
ký hiệu dùng để xác định hình ảnh cụ thể của bản đồ trong một khuôn dạng hiểu
đƣợc của máy tính. Hệ thống thông tin địa lý dùng các dữ liệu không gian để tạo ra
một bản đồ hay hình ảnh bản đồ trên màn hình hoặc trên giấy thông qua thiết bị ngoại
vị. Có 6 loại thông tin bản đồ dùng để thể hiện hình ảnh bản đồ và ghi chú của nó
trong hệ thống thông tin địa lí nhƣ sau:
Điểm (Point)
Đƣờng (Line)
Vùng (Polygon)
Ô lƣới (Grid cell)

Kí hiệu (Sympol)
Điểm ảnh (Pixel)
Dữ liệu không gian có hai mô hình lƣu trữ là Vector và Raster.

Hình 1.1: Mô hình dữ liệu không gian
− Dữ liệu dạng Vertor: là các điểm tọa độ (X,Y) hoặc là các quy luật tính toán các
tọa độ và nối chúng thành các đối tƣợng trong hệ thống họa độ nhất định
Các kiểu đối tƣợng địa lý dạng Vertor :
Kiểu điểm: một tọa độ (x,y) trong 2D hoặc một tọa độ (x,y,z) trong 3D , không
chiểu.

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

6
Kiểu đường: danh sách các tọa độ x1y1, x2y2,…,xnyn hoặc là một hàm toán học,
một chiều, tính được chiều dài.
Kiểu vùng: tạp các đường khép kín, hai chiều, tính được chu vi và diện tích.
Kiểu bề mặt: Chuỗi tọa độ xyz, hàm toán học, ba chiều, tính được diện tích bề mặt,
thể tích.
− Dữ liệu Raster (ảnh đối tƣợng): là dữ liệu đƣợc tạo thành bởi các ô lƣới có độ
phân giải xác định. Loại dữ liệu này chỉ dùng cho mục đích diễn tả và minh hoạ
chi tiết bằng hình ảnh thêm cho các đối tƣợng quản lý của hệ thống.
Một diện tích địa lý đƣợc chia thành các hàng-cột, tạo nên các điểm ảnh
(pixel). Độ lớn nhỏ của các hàng/cột (hay điểm ảnh) tạo nên độ phân giải của dữ liệu.
Ví dụ: điểm ảnh có kích thƣớc 8x8. Vị trí điểm ảnh đƣợc xác định bởi số hàng/ số
cột.
Dữ liệu dạng raster có thể là dữ liệu thô (ảnh vệ tính, tệp ảnh scan của bản
đồ, tệp chụp của máy ảnh số….) hoặc là dữ liệu không gian của một số phần mềm

GIS.

Hình 1.2: Dữ liệu raster
1.1.2.2. Dữ liệu thuộc tính
Dữ liệu thuộc tính là những mô tả về đặc tính, đặc điểm và các hiện tƣợng xảy
ra tại vị trí địa lý xác định mà chúng khó hoặc không thể biểu thị đƣợc trên bản đồ.
Cũng nhƣ các hệ thống thông tin địa lý khác, hệ thống này có bốn loại dữ liệu thuộc
tính:

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

7
Ðặc tính của đối tƣợng: liên kết chặt chẽ với các thông tin đồ thị, các dữ liệu này
đƣợc xử lí theo ngôn ngữ hỏi đáp có cấu trúc (SQL) và phân tích. Chúng đƣợc liên
kết với các hình ảnh đồ thị thông qua các chỉ số xác định chung, thông thƣờng gọi là
mã địa lý và đƣợc lƣu trữ trong cả hai mảng đồ thị và phi đồ thị. Hệ thống thông tin
địa lý còn có thể xử lí các thông tin thuộc tính riêng rẽ và tạo ra các bản đồ chuyên đề
trên cơ sở các giá trị thuộc tính. Các thông tin thuộc tính này cũng có thể đƣợc hiển
thị nhƣ là các ghi chú trên bản đồ hoặc là các tham số điều khiển cho việc lựa chọn
hiển thị các thuộc tính đó nhƣ là các ký hiệu bản đồ.
Dữ liệu tham khảo địa lý: Mô tả các sự kiện hoặc hiện tƣợng xảy ra tại một vị trí
xác định. Không giống các thông tin đặc tính, chúng không mô tả về bản thân các
hình ảnh bản đồ, thay vào đó chúng mô tả các danh mục hoặc các hoạt động nhƣ cho
phép xây dựng các khu công nghiệp mới, nghiên cứu y tế, báo cáo hiểm họa môi
trƣờng. . . liên quan đến các vị trí địa lí xác định. Các thông tin tham chiếu địa lí đặc
trƣng đƣợc lƣu trữ và quản lí trong các tệp độc lập và hệ thống không thể trực tiếp
tổng hợp với các hình ảnh bản đồ trong cơ sở dữ liệu của hệ thống. Tuy nhiên các
bản ghi này chứa các yếu tố xác định vị trí của sự kiện hay hiện tƣợng.

Chỉ số địa lý: là các chỉ số về tên, địa chỉ, khối, phƣơng hƣớng định vị,... liên quan
đến các đối tƣợng địa lí, đƣợc lƣu trữ trong Hệ thông tin địa lí để chọn, liên kết và tra
cứu dữ liệu trên cơ sở vị trí địa lý mà chúng đã đƣợc mô tả bằng các chỉ số địa lý xác
định. Một chỉ số địa lý có thể bao gồm nhiều bộ xác định cho các thực thể sử dụng từ
các cơ quan khác nhau nhƣ là lập danh sách các mã địa lý mà chúng xác định mối
quan hệ không gian giữa các vị trí hoặc giữa các hình ảnh hay thực thể địa lý.
Quan hệ không gian giữa các đối tƣợng: rất quan trọng cho các chức năng xử lý
của hệ thống thông tin địa lý. Các mối quan hệ này có thể đơn giản hay phức tạp nhƣ
sự liên kết, khoảng cách tƣơng thích, mối quan hệ topo giữa các đối tƣợng.
1.1.3. Các chức năng chính của GIS
Chức năng là một mổ xẻ khác so với thành phần, các chức năng chính của GIS
đƣợc miêu tả thông qua hình sau :

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

8

Hình 1.3: Chức năng chính của GIS
1.1.4. Cơ sở dữ liệu phân tán dạng GIS
Trong những năm gần đây, Những tiến bộ công nghệ trong lĩnh vực lƣu trữ đã
tác động sâu sắc và làm thay đổi việc lƣu trữ và quản lý dữ liệu GIS. Đó là dung
lƣợng khả năng lƣu trữ dữ liệu đã tăng lên nhanh chóng và đang tiếp tục tăng lên một
cách đáng kể. Thứ hai là việc ứng dụng các cơ sở dữ liệu GIS phân tán ngày càng
hiệu quả. Cơ sở dữ liệu phân tán là nguồn dữ liệu cho những ngƣời sử dụng có thể
truy cập tới các vị trí lƣu trữ thông qua mạng. Nguyên nhân chính cho việc nghiên
cứu, ra đời cách lƣu trữ và quản lý dữ liệu mới là nhằm đem lại cho ngƣời sử dụng
một hệ thống quản lý dữ liệu hiệu quả nhất. Chính vì vậy, phần mềm ArcGIS đã thiết
kế mô hình cơ sở dữ liệu GIS Geodatabase nhằm cung cấp các công cụ dùng để triển

khai xây dựng và quản lý một hệ thông tin địa lý thông minh.
Quan điểm thiết kế các ứng dụng GIS sử dụng công nghệ ESRI ngày nay là
đƣa toàn bộ các dữ liệu không gian (bao gồm cả dữ liệu đồ họa và thuộc tính, các
quan hệ ...) vào một cơ sở dữ liệu Geodatabase. Việc thiết kế Geodatabase là thiết kế
lƣợc đồ lớp (Class Diagram). Geodatabase là một cơ sở dữ liệu chứa dữ liệu thuộc
tính, dữ liệu không gian và quan hệ tồn tại giữa chúng. Có thể nói Geodatabase còn là
một cơ sở dữ liệu địa lý hƣớng đối tƣợng và đƣợc quản lý thông qua một chuẩn Hệ
quản trị cơ sở dữ liệu. Vì vây, các thực thi trên đối tƣợng trong Geodatabase chính là
các luật chuẩn hóa, liên kết và quan hệ topology.

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

9

Hình 1.4 : Geodatabase trong Arcgis
Có hai mô hình Geodatabase: Mô hình Geodatabase một người dùng (Personal
Geodatabase) và mô hình Geodatabase nhiều người dùng (Enterprise Geodatabase).
Geodatabse là một tập lƣu trữ dữ liệu địa lý. Tất cả các thành phần trong
Geodatabase đƣợc quản lý trong các bảng DBMS chuẩn và sử dụng kiểu dữ liệu SQL
chuẩn. Nó có các thành phần cơ bản:

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

10
Lớp đối tƣợng
(Feature Class)


Là một bảng chứa một trƣờng “shape” xác định
dạng hình học điểm, đƣờng, vùng cho các đối
tƣợng địa lý. Mỗi hàng là một đối tƣợng địa lý

Bảng (Table)

Là một tập các hàng với các trƣờng giống nhau.
Các lớp đối tƣợng địa lý là các bảng đƣợc xác định
với trƣờng “shape”

Lớp quan hệ
(Relationship
class)

Là lớp liên kết đối tƣợng trọng một lớp đối tƣợng
địa lý với đối tƣợng trong một lớp đối tƣợng địa lý
khác. Thông thƣờng, các lớp quan hệ có các
trƣờng do ngƣời sử dụng định nghĩa

Topology
(Topology)

Bao gồm các luật thống nhất về hình học giữa các
đối tƣợng địa lý

Mạng hình học
(Geometric
network)


Bao gồm các luật cho phép quản lý kết nối giữa
các đối tƣợng địa lý

Tập dữ liệu đo
đạc (Survey
dataset)

Chứa các phép đo đƣợc sử dụng trong việc tính
toán tọa độ hình học đối tƣợng địa lý trong các lớp
đối tƣợng địa lý đƣợc đo đạc

Tập dữ liệu
Raster (Raster
dataset)

Là một tập dữ liệu Raster biểu diễn các hiện tƣợng
địa lý liên tục .

Tài liệu siêu dữ
liệu (Metadata
document)

Là một XML có liên kết với tất cả các tập dữ liệu,
thƣờng đƣợc sử dụng trong ArcIMS và các ứng
dụng trên máy chủ

Công cụ xử lý
thông tin địa lý
(Geoprocessing
tools)


Là một tập luồng dữ liệu và luồng công việc quản
lý, phân tích và mô hình hóa dữ liệu

Bảng 1.1: DBMS

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

11
1.1.5. Hệ quản trị CSDL lựa chọn
Thông tin dữ liệu đƣợc thiết kế và lƣu trữ trên hệ cơ sở dữ liệu quan hệ MS
SQLServer 2008. Các bảng dữ liệu đƣợc thiết kế với các liên kết và ràng buộc đảm
bảo tính toàn vẹn của dữ liệu..
Việc truy xuất dữ liệu có thể thực hiện trực tiếp trên các bảng hoặc thông qua
các View (ghép nối dữ liệu từ nhiều bảng) để tăng tính linh hoạt của hệ thống.
Cập nhật bổ sung dữ liệu đƣợc thực hiện thông qua các thủ tục bên trong hệ
quản trị cơ sở dữ liệu (Stored Procedures) thuận tiện cho việc bảo trì nâng cấp. Các
thủ tục đều sử dụng giao dịch (Transactions) để cập nhật số liệu đảm bảo sự toàn vẹn
dữ liệu. Các giao dịch bị ngắt giữa chừng dữ liệu có thể đƣợc khôi phục lại trạng thái
ban đầu.
Các bản ghi trong các bảng đƣợc lập chỉ mục (Index) để tăng khả năng truy nhập.
1.2. WebGIS
WebGIS là hệ thống thông tin địa lý phân tán trên một mạng các máy tính để
tích hợp, trao đổi các thông tin địa lý trên World Wilde Web (Edward, 2000,URL).
Trong cách thực hiện nhiệm vụ phân tích GIS, dịch vụ này gần giống nhƣ là kiến trúc
Client-Server của Web. Xử lý thông tin địa lý đƣợc chia ra thành các nhiệm vụ ở phía
server và phía client.
Một client tiêu biểu là trình duyệt web và server-side bao gồm một Web server

có cung cấp một chƣơng trình phần mềm WebGIS. Client thƣờng yêu cầu một ảnh
bản đồ hay vài xử lý thông tin địa lý qua Web đến server ở xa. Server chuyển đổi yêu
cầu thành mã nội bộ và gọi những chức năng về GIS bằng cách chuyển tiếp yêu cầu
tới phần mềm WebGIS. Phần mềm này trả về kết quả, sau đó kết quả này đƣợc định
dạng lại cho việc trình bày bởi trình duyệt hay những hàm từ các plug-in hoặc Java
applet. Server sau đó trả về kết quả cho client để hiển thị, hoặc gởi dữ liệu và các
công cụ phân tích đến client để dùng ở phía client.
1.2.1. Kiến trúc WebGIS và các bƣớc xử lý
A. Kiến trúc webGIS
− Kiến trúc xuất bản web của hệ thống tin dữ liệu không gian cũng gần giống nhƣ
kiến trúc dành cho một hệ thông tin web cơ bản khác, ngoại trừ có ứng dụng GIS
sử dụng các kỹ thuật khác. Có nhiều dạng của việc xuất bản web cho thông tin
không gian.
− Cơ sở dữ liệu không gian sẽ đƣợc dùng để quản lý và truy xuất dữ liệu không gian,
đƣợc đặt trên data server. Nhà kho hay nơi lƣu trữ (clearing house) đƣợc dùng để
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

12
lƣu trữ và duy trì những siêu dữ liệu (dữ liệu về dữ liệu - metadata) về dữ liệu
không gian tại những data server khác nhau. Dựa trên những thành phần quản lý
dữ liệu, ứng dụng server và mô hình server đƣợc dùng cho ứng dụng hệ thống để
tính toán thông tin không gian thông qua các hàm cụ thể. Tất cả kết quả tính toán
của ứng dụng server sẽ đƣợc gởi đến web server để thêm vào các gói HTML, gởi
cho phía client và hiển thị nơi trình duyệt web. Xem hình minh họa dƣới đây. Lƣu
ý là tất cả các thành phần đều đƣợc kết nối nhau thông qua mạng Internet.

Hình 1.5: Kiến trúc webgis


Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

13

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

14
B. Các bƣớc xử lý
Quá trình làm việc với hệ thống web xử lý thông tin không gian đƣợc minh họa
nhƣ hình vẽ trên.
− Client gởi yêu cầu của ngƣời sử dụng thông qua giao thức HTTP đến webserver.
− Web server nhận yêu cầu của ngƣời dùng gởi đến từ phía client, xử lý và chuyển
tiếp yêu cầu đến ứng dụng trên server có liên quan.
− Application server (chính là các ứng dụng GIS) nhận các yêu cầu cụ thể đối với
ứng dụng và gọi các hàm có liên quan để tính toán xử lý. Nếu có yêu cầu dữ liệu
nó sẽ gởi yêu cầu dữ liệu đến data exchange server (server trao đổi dữ liệu).
− Data exchange server nhận yêu cầu dữ liệu và tìm kiếm vị trí của những dữ liệu này
sau đó gởi yêu cầu dữ liệu đến server chứa dữ liệu (data server) tƣơng ứng cần tìm.
− Data server dữ liệu tiến hành truy vấn lấy ra dữ liệu cần thiết và trả dữ liệu này về
cho data exchange server.
− Data exchange server nhận dữ liệu từ nhiều nguồn data server khác nhau nằm rải
rác trên mạng. Sắp xếp dữ liệu lại theo logic của yêu cầu dữ liệu, sau đó gởi trả dữ
liệu về cho application server.
− Application server nhận dữ liệu trả về từ các data exchange server và đƣa chúng
đến các hàm cần sử dụng, xử lý chúng tại đây và kết quả đƣợc trả về cho web
server.

− Web server nhận về kết quả xử lý, thêm vào các ngữ cảnh web (HTML, PHP…) để
có thể hiển thị đƣợc trên trình duyệt và cuối cùng gởi trả kết quả về cho trình
duyệt dƣới dạng các trang web.
Các dạng yêu cầu từ phía client:

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

15

Hình 1.6: Các dạng yêu cầu từ phía client
Trong mô hình hoạt động của WebGIS đƣợc chia ra hai phần : các hoạt động ở
phía client (client side) và các hoạt động xử lý ở phía server ( server side).
Client side:
Client side đƣợc dùng để hiển thị kết quả đến cho ngƣời dùng, nhận các điều khiển
trực tiếp từ ngƣời dùng và tƣơng tác với web server thông qua trình duyệt web.
Các trình duyệt web sử dụng chủ yếu HTML để định dạng trang web. Thêm vào
đó một vài plug-in, ActiveX và các mã Applet đƣợc nhúng vào trình duyệt để tăng
tính tƣơng tác với ngƣời dùng.
Server side: Gồm có Web server, Application server, Data server và Clearinghouse.
Server side có nhiệm vụ lưu trữ dữ liệu không gian, xử lý tính toán và trả về kết quả
(dưới dạng hiển thị được) cho client side.
Web server: Web server được dùng để phục vụ cho các ứng dụng web, web server
sử dụng nghi thức HTTP để giao tiếp với trình duyệt web ở phía client. Yêu cầu từ
phía client đối với ứng dụng web đều được web server nhận và thông dịch và sau
đó gọi các chức năng của ứng dụng thông qua các giao tiếp mạng như MAPI,
Winsock, namped pipe…
Số hóa bởi Trung tâm Học liệu - ĐHTN


/>

16
Application server: Đây là phần chƣơng trình gọi các hàm xử lý GIS, gởi yêu
cầu lấy dữ liệu đến clearinghouse.
Data server: Data server là phần cơ bản của hầu hết các hệ thống thông tin với
nhiệm vụ quản lý và điều khiển truy cập dữ liệu. Ban đầu, đa số GIS sử dụng File
System để quản lý dữ liệu không gian và DBMS (Database Management System)
để quản lý dữ liệu thuộc tính. Ngày nay có nhiều sản phẩm và giải pháp phần mềm
thay thế để quản lý dữ liệu không gian và thuộc tính một cách chung nhất. Ví dụ:
SDE của ESRI (1998), SpatialWare của MapInfo (1998)…
Clearing house: Clearing house đƣợc sử dụng để chứa dữ liệu về dữ liệu không
gian đƣợc quản lý bởi các data server. Clearinghouse đóng vai trò nhƣ một cuốn
catalog, clearinghouse tìm kiếm trong catalog này để tìm dữ liệu cần.
Có hai chiến thuật lựa chọn, tƣơng ứng với hai kiểu triển khai, kiểu thứ nhất tập
trung công việc chủ yếu cho phía server, kiểu kia ngƣợc lại tập trung công việc cho
phía client.
Chiến thuật Server- side: Những chiến thuật này tập trung vào việc cung cấp dữ liệu
GIS và phân tích “theo yêu cầu” bởi một server đủ mạnh, server này sẽ truy cập dữ
liệu và phần mềm cần thiết để xử lý dữ liệu.
Trong WebGIS, đôi khi thuật ngữ “map server” đƣợc dùng để chỉ ra rằng chiến
thuật áp dụng là server-side. Mà trong đó khi ngƣời dùng gởi yêu cầu cần “map” để
hiển thị, thì sẽ đƣợc server “phục vụ”. Chiến thuật server-side dựa trên khả năng
trình duyêt web của ngƣời dùng có thể gởi các yêu cầu đến các phần mềm GIS trên
server thông qua Internet.
Các chƣơng trình đƣợc dùng để nhận và xử lý yêu cầu ngƣời dùng có thể đƣợc
viết bằng các ngôn ngữ nhƣ: Perl, Visual Basic, C++…Các chƣơng trình này cũng
có thể mua từ các nhà sản xuất để tạo khả năng kết nối tốt hơn đến các hệ xử lý
GIS đã tồn tại.
Để có thể giao tiếp với các ứng dụng WebGIS đặt trên server, web server có thể

sử dụng các chuẩn giao tiếp phổ biến nhƣ CGI (Common Gateway Giao diện),
Java, ISAPI (Internet Server Application Programming Giao diện), and NSAPI
(Netscape Server Application Programming Giao diện)…
Nhìn chung, chiến thuật này áp dụng tốt nhất cho các ứng dụng WebGIS
thƣơng mại hay cộng đồng với số lƣợng lớn ngƣời dùng mà không quan tâm đến
khả năng xử lý GIS trên các máy ngƣời dùng.
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

17

Hình 1.7: Cấu hình server-side
Chiến thuật Client-side: Thay vì để server làm quá nhiều việc, một số chức năng
xử lý GIS sẽ đƣợc đƣa về phía máy ngƣời dùng, và tại đây sẽ có một phần dữ liệu
đƣợc xử lý. Có hai dạng triển khai chiến thuật client side nhƣ sau:
GIS Applet đƣợc phân phối đến Client khi có yêu cầu: Trong cách triển khai chiến
thuật này các xử lý GIS sẽ đƣợc server cung cấp cho phía client dƣới dạng các
chƣơng trình thực thi nhỏ hoặc là các applet để có thể chạy đƣợc ở phía client.
Những applet nhƣ vậy đƣợc phân phối đến client khi client cần nó để xử lý. Các
applet có thể đƣợc viết bằng Java, JavaScript hoặc ở dạng các ActiveX. Nhƣ vậy
trình duyệt cần đƣợc tích hợp các bộ dich (compiler) để xử lý các applet này.

Hình 1.8: Cấu hình client - side
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

×