Tải bản đầy đủ (.doc) (79 trang)

Xây dựng hệ thống quản lý và cảnh báo ô nhiễm khu công nghiệp đồng văn sử dụng GIS

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.74 MB, 79 trang )

ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

ĐINH THỊ THU HIỀN

XÂY DỰNG HỆ THỐNG QUẢN LÝ VÀ CẢNH BÁO Ô
NHIỄM KHU CÔNG NGHIỆP ĐỒNG VĂN SỬ DỤNG GIS

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

THÁI NGUYÊN, 2018


ĐẠI HỌC THÁI NGUYÊN
ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

ĐINH THỊ THU HIỀN

XÂY DỰNG HỆ THỐNG QUẢN LÝ VÀ CẢNH BÁO Ô
NHIỄM KHU CÔNG NGHIỆP ĐỒNG VĂN SỬ DỤNG GIS
Chuyên ngành: Khoa học máy tính
Mã số: 8 48 01 01

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Người hướng dẫn khoa học: PGS.TS. ĐẶNG VĂN ĐỨC

THÁI NGUYÊN, 2018


i
LỜI CAM ĐOAN


Tôi xin cam đoan bản luận văn “Xây dựng hệ thống quản lý và cảnh báo
ô nhiễm khu công nghiệp Đồng Văn sử dụng Gis” là công trình nghiên cứu
của tôi, dưới sự hướng dẫn khoa học của PGS.TS Đặng Văn Đức, tham khảo các
nguồn tài liệu đã được chỉ rõ trong trích dẫn và danh mục tài liệu tham khảo. Các
nội dung công bố và kết quả trình bày trong luận văn này là trung thực và chưa
từng được ai công bố trong bất cứ công trình nào.

Thái Nguyên, tháng 5 năm 2018
Đinh Thị Thu Hiền


ii
LỜI CẢM ƠN
Em xin gửi lời cảm ơn sâu sắc tới PGS.TS. Đặng Văn Đức, Thầy đã tận
tình chỉ bảo giúp đỡ em trong suốt quá trình nghiên cứu và hoàn thành luận văn.
Xin chân thành cảm ơn quý Thầy Cô trong Phòng Đào tạo, Trường Đại
học Công nghệ thông tin và Truyền thông, Đại học Thái Nguyên đã nhiệt tình
giảng dạy, trang bị cho tôi những kiến thức quý báu trong suốt thời gian học tập
tại trường.
Xin cảm ơn các bạn cùng lớp và đồng nghiệp nơi tôi công tác đã tạo điều
kiện cho tôi hoàn thành luận văn này.
Xin gửi lời cảm ơn tới gia đình tôi đã động viên tôi trong suốt quá trình học
tập và hoàn thành luận văn.


iii
MỤC LỤC
LỜI CAM ĐOAN.................................................................................................. 1
LỜI CẢM ƠN ....................................................................................................... ii
MỤC LỤC ............................................................................................................ iii

DANH MỤC HÌNH VẼ ........................................................................................ v
PHẦN I: MỞ ĐẦU ............................................................................................... 1
CHƯƠNG I TỔNG QUAN VỀ GIS VÀ BÀI TOÁN QUẢN LÝ MÔI TRƯỜNG
............................................................................................................................... 4
1.1. Các khái niệm cơ bản về GIS:...................................................................... 4
1.1.1. Một số định nghĩa về hệ thông tin địa lý .............................................. 4
1.1.2. Các thành phần của hệ thông tin địa lý ................................................. 6
1.2. Biểu diễn dữ liệu địa lý ............................................................................... 9
1.2.1. Các thành phần của dữ liệu địa lý ......................................................... 9
1.2.2. Mô hình biểu diễn dữ liệu không gian[3] ........................................... 13
1.2.3. Phân tích và xử lý dữ liệu không gian ................................................ 18
1.3. Ứng dụng GIS trong bài toán quản lý và cảnh báo ô nhiễm...................... 24
1.3.1. Các lĩnh vực liên quan với hệ thông tin địa lý .................................... 24
1.3.2. Những bài toán của GIS ...................................................................... 25
1.3.3. Bài toán của GIS trong quản lý và cảnh báo ô nhiễm môi trường: .... 25
CHƯƠNG II PHÂN TÍCH KHÔNG GIAN HỖ TRỢ VÀ CẢNH BÁO Ô
NHIỄM MÔI TRƯỜNG
................................................................................................... 27
2.1 Kỹ thuật xây dựng vùng đệm trong GIS ..................................................... 27
2.1.1 Giới thiệu về xây dựng vùng đệm trong GIS ....................................... 27
2.1.2 Vùng đệm của điểm dữ liệu ................................................................. 27
2.1.3 Vùng đệm của xâu đoạn thẳng ............................................................ 28
2.1.4 Vùng đệm của vùng xác định bởi đa giác ............................................ 32
2.2 Kỹ thuật xếp chồng bản đồ.......................................................................... 35


iv
2.2.1 Khái quát về xếp chồng bản đồ ............................................................ 35
2.2.2 Các phương pháp xếp chồng bản đồ .................................................... 37
2.2.3 Thuật toán Bently – Ottmann............................................................... 38

2.3 Kỹ thuật nội suy không gian ....................................................................... 43
2.3.1 Nội suy trọng số không gian (IDW) .................................................... 43
2.3.2 Kỹ thuật Kriging .................................................................................. 43
2.4 Kết luận chương .......................................................................................... 46
CHUƠNG III XÂY DỰNG CHUƠNG TRÌNH THỬ NGHIỆM VÀ CẢNH
BÁO Ô NHIỄM
............................................................................................................ 47
3.1 Mô tả bài toán cảnh báo ô nhiễm tại khu công nghiệp Đồng văn bằng GIS ..
47
3.2 Mô hình hệ thống thử nghiệm ..................................................................... 47
3.3 Lựa chọn công cụ phát triển và môi trường thử nghiệm............................. 48
3.4 Đánh giá kết quả thử nghiệm ...................................................................... 49
KẾT LUẬN VÀ HUỚNG PHÁT TRIỂN .......................................................... 60
TÀI LIỆU THAM KHẢO................................................................................... 60


v
DANH MỤC HÌNH VẼ
Hình 1. 1. Thành tố của GIS ................................................................................. 6
Hình 1.2: Mối quan hệ giữa các thành phần của GIS ........................................... 7
Hình 1. 3. Ví dụ biểu diễn vị trí nước bị ô nhiễm ............................................... 10
Hình 1.4. Ví dụ biểu diễn đường......................................................................... 11
Hình 1.5. Ví dụ biểu diễn khu vực hành chính ................................................... 12
Hình 1.6. Biểu diễn thế giới bằng mô hình raster ............................................... 17
Hình 1.7: Xếp chồng đa giác ............................................................................... 21
Hình 1.8. Tiến trình xếp chồng đa giác ............................................................... 22
Hình 2.1. Vùng đệm của xâu đoạn thẳng ............................................................ 28
Hình 2.2. Tìm vùng đệm ..................................................................................... 29
Hình 2.3. Trường hợp góc tù............................................................................... 30
Hình 2.4. Trường hợp góc bẹt ............................................................................. 30

Hình 2.5. Minh họa bản đồ đệm trong GIS........................................................ 34
Hình 2.6. Nguyên lý khi xếp chồng các bản đồ ................................................ 36
Hình 2.7. Việc xếp chồng các bản đồ theo phương pháp cộng.......................... 36
Hình 2.8. Một thí dụ trong việc xếp chồng các bản đồ. ...................................... 36
Hình 2.9. Xếp chồng 2 lớp bản đồ ..................................................................... 37
Hình 2.10. Xếp chồng điểm và đa giác .............................................................. 38
Hình 2.11. Xếp chồng đoạn và đa giác .............................................................. 38
Hình 3.1: Giao diện chương trình Hmap với cửa sổ hiển thị bản đồ, các lớp bản
đồ và cửa sổ chức năng phân tích nội suy IDW.................................................. 48
Hình 3.2. Bản đồ chuyên đề nội suy chỉ tiêu Asen trong nước ngầm tại 3 điểm
quan trắc sử dụng thuật toán nội suy IDW.......................................................... 49
Hình 3.3. Bản đồ chuyên đề Tổng lượng chất rắn hòa tan trong nước ngầm ..... 51
Hình 3.4. Chỉ tiêu lượng vi khuẩn trong nước ngầm .......................................... 52
Hình 3.5. Chỉ tiêu Chì (Pb) trong nước ngầm ..................................................... 53


vi
Hình 3.6. Chỉ tiêu Asen trong nước mặt ............................................................. 54
Hình 3.7. Chỉ tiêu vi khuẩn Coliform trong nước mặt ........................................ 55
Hình 3.8. Hàm lượng Chì (Pb) trong nước mặt .................................................. 56
Hình 3.9. Chỉ tiêu vi khuẩn Coliform trong nước thải ........................................ 57
Hình 3.10. Hàm lượng CO (Các-bon ô xít) trong không khí ............................. 58
Hình 3.11. Tổng bụi lơ lửng trong không khí ..................................................... 59


1


2
PHẦN I: MỞ ĐẦU

1. Tính cấp thiết của đề tài
Cùng với sự phát triển của xã hội, con người đã sử dụng nhiều công cụ để
tìm hiểu, khai thác và giải đáp các thắc mắc về tự nhiên; Trong đó, kỹ thuật
“Thông tin địa lý” (GIS – Geographic Information System) là kỹ thuật ưu việt
được sử dụng rộng rãi từ những năm 60 trở lại đây. Kỹ thuật GIS là kỹ thuật ứng
dụng hệ thống vi tính, số hóa để thu thập, phân tích, xử lý dữ liệu không gian. Từ
đó, GIS đã trở thành công cụ hỗ trợ ra quyết định trong hầu hết các lĩnh vực
nghiên cứu và quản lý, đặc biệt trong quản lý, quy hoạch nguồn tài nguyên môi
trường.
Thông tin địa lý là thông tin về các vị trí trên bề mặt trái đất, bao gồm tri
thức về cái gì đó? Ở đâu? Hoặc tri thức về cái gì ở tại vị trí biết trước? Đặc trưng
của thông tin địa lý có thể rất chi tiết như: thông tin về từng ngôi nhà trong thành
phố hoặc có thể rất thô như: Thời tiết, mật độ dân số quốc gia…
Một vấn đề nóng bỏng, gây bức xúc trong dư luận xã hội cả nước là tình
trạng ô nhiễm môi trường sinh thái do các hoạt động sản xuất và sinh hoạt của
con người gây ra. Vấn đề này ngày càng trầm trọng, đe doạ trực tiếp sự phát
triển kinh tế - xã hội bền vững, sự tồn tại, phát triển của các thế hệ hiện tại và
tương lai. Giải quyết vấn đề ô nhiễm môi trường trong thời kỳ đẩy mạnh CNH,
HĐH hiện nay không chỉ là đòi hỏi cấp thiết đối với các cấp quản lí, các doanh
nghiệp mà đó còn là trách nhiệm của cả hệ thống chính trị và của toàn xã hội.
Việc theo dõi mức độ ô nhiễm của từng công ty trong khu công nghiệp để
có những xử lý kịp thời cho các công ty phòng tránh cũng như có những giải
pháp thích hợp khi mức độ ô nhiễm tăng cao gây nguy hại tới môi trường đất,
nước và không khí làm ảnh hưởng đến môi trường sống của những người xung
quanh. Chính thực trạng ấy đã khiến tôi mạnh dạn đưa ra ý tưởng cho đề tài
nghiên cứu:” Xây dựng hệ thống quản lý và cảnh báo ô nhiễm ở các khu công
nghiệp”. Để thực hiện được ý tưởng này cần đến sự trợ giúp của công nghệ
thông tin, thông qua công nghệ GIS. Bên cạnh đó cần phải nghiên cứu thử
nghiệm trên môi trường cụ



thể, ở đây chọn khu công nghiệp Đồng Văn - Hà Nam. Đề tài được thực hiện
thành công sẽ trợ giúp công tác quản lý và cảnh báo kịp thời các mức độ ô nhiễm
của địa phương, hạn chế đến mức thấp nhất có thể tác hại gây ô nhiễm của
chúng. Sau thử nghiệm và hoàn thiện, đề tài có thể triển khai ứng dụng cho các
vùng, khu công nghiệp khác.
Các dữ liệu về mức độ ô nhiễm môi trường do các công ty thu thập, chúng
thường gắn với phạm vi quản lý của công ty, địa phương, sở Tài nguyên môi
trường và bộ Tài nguyên môi trường với dân cư và các điều kiện tự nhiên trên
không gian địa bàn quản lý. Việc theo dõi các mức độ ô nhiễm môi trường đòi
hỏi phải tổng hợp từ dưới lên, và cần được phân tích, đánh giá tình hình, tiến
hành các dự báo để thông báo lại cho các công ty trong khu Công nghiệp Đồng
Văn biết và có những giải pháp đề phòng, ngăn chặn mức độ tiến triển gây ô
nhiễm kịp thời, đúng nơi, đúng đối tượng.
Chính vì lý do đó, trong khuôn khổ luận văn, học viên thực hiện nghiên
cứu: “Xây dựng hệ thống quản lý và cảnh báo ô nhiễm khu công nghiệp
Đồng Văn sử dụng Gis”
2. Mục tiêu của đề tài
Sử dụng công nghệ GIS để tổ chức thu thập dữ liệu cũng như chuyển tải và
biểu diễn thông tin trên nền web. Các thông tin có thể nhận được kịp thời và
được xử lý, đưa ra các quyết định đúng đắn, đáp ứng được yêu cầu quản lý và
cảnh báo mức độ ô nhiễm, hạn chế được những thiệt hại không đáng có.
3. Phạm vi và phương pháp nghiên cứu
a. Phạm vi nghiên cứu
- Hoàn thiện quy trình theo dõi, tổng hợp và phân tích ô nhiễm từ cơ sở đến
toàn khu vực trên cơ sở tổ chức và cách làm đã có nhưng sử dụng các công cụ và
công nghệ mới để triển khai hệ thống thông tin quản lý và cảnh báo xử lý ô
nhiễm trên nền web phục vụ thường xuyên cho công tác và xử lý ô nhiễm.



- Nghiên cứu xây dựng cơ sở dữ liệu dạng GIS từ cơ sở đến toàn vùng phục
vụ việc thu thập và xử lý thông tin đáp ứng yêu cầu của bài toán đặt ra
- Tổ chức website phục vụ việc thu thập và chuyển tải thông tin của hệ
thống được xây dựng.
b. Phương pháp nghiên cứu
- Các phương pháp phân tích, tổng hợp và dự báo theo yêu cầu.
- Tổ chức cơ sở dữ liệu phân tán dạng GIS, tổng hợp và phân tich dữ liệu,
tiến hành dự báo theo các phương pháp khoa học khác nhau, chuyển tải các
thông tin trên nền web dưới cả dạng văn bản và dạng bản đồ
4. Bố cục luận văn
- Phần I: Mở đầu
- Phần II: Nội dung
+ Chương I: Tổng quan về GIS và bài toán quản lý môi trường
+ Chương II: Phân tích không gian hỗ trợ quản lý và cảnh báo ô nhiễm
môi trường
+ Chương III: Xây dựng chương trình thử nghiệm cảnh báo ô nhiễm
- Phần III: Kết luận và hướng phát triển


CHƯƠNG I
TỔNG QUAN VỀ GIS VÀ BÀI TOÁN QUẢN LÝ MÔI TRƯỜNG
1.1. Các khái niệm cơ bản về GIS:
Khái niệm Địa lý (Geography) đề cập lĩnh vực nghiên cứu mô tả Trái đất
(Geo-Earth). Ngày nay, khái niệm này và khái niệm Không gian (Space) được
sử dụng thay thế nhau trong một số trường hợp. Tuy nhiên, về mặt bản chất thì
Địa lý là tập các mô tả về không gian (hai chiều), khí quyển (ba chiều), … của
Trái đất. Còn Không gian cho phép mô tả bất kỳ cấu trúc đa chiều nào, không
quan tâm đến vị trí địa lý của nó. Như vậy có thể coi Địa lý như là một phần cấu
trúc nhỏ trong tập cấu trúc Không gian.
Khi mô tả Trái đất, các nhà địa lý luôn đề cập đến quan hệ không gian

(spatial relationship) của các đối tượng trong thế giới thực. Mối quan hệ này
được thể hiện thông qua các bản đồ (map) trong đó biểu diễn đồ họa của tập các
đặc trưng trừu tượng và quan hệ không gian tương ứng trên bề mặt trái đất, ví
dụ: bản đồ dân số biểu diễn dân số tại từng vùng địa lý.
Dữ liệu bản đồ còn là loại dữ liệu có thể được số hóa. Để lưu trữ và phân
tích các số liệu thu thập được, cần có sự trợ giúp của hệ thông tin địa lý
(Geographic Information System-GIS).
1.1.1. Một số định nghĩa về hệ thông tin địa lý
Có nhiều cách diễn giải khác nhau cho từ viết tắt GIS, tuy nhiên các cách
diễn giải đó đều mô tả việc nghiên cứu các thông tin địa lý và các khía cạnh khác
liên quan.
GIS cũng giống như các hệ thống thông tin khác, có khả năng nhập, tìm
kiếm và quản lý các dữ liệu lưu trữ, để từ đó đưa ra các thông tin cần thiết cho
người sử dụng. Ngoài ra, GIS còn cho phép lập bản đồ với sự trợ giúp của máy
tính, giúp cho việc biểu diễn dữ liệu bản đồ tốt hơn so với cách truyền thống.
Dưới đây là một số định nghĩa GIS hay dùng:


• Định nghĩa của dự án The Geographer's Craft, Khoa Địa lý, Trường
Đại học Texas
GIS là cơ sở dữ liệu số chuyên dụng trong đó hệ trục tọa độ không gian là
phương tiện tham chiếu chính. GIS bao gồm các công cụ để thực hiện những
công việc sau:
- Nhập dữ liệu từ bản đồ giấy, ảnh vệ tinh, ảnh máy bay, số liệu điều tra và
các nguồn khác.
- Lưu trữ dữ liệu, khai thác, truy vấn cơ sở dữ liệu.
- Biến đổi dữ liệu, phân tích, mô hình hóa, bao gồm cả dữ liệu thống kê và
dữ liệu không gian.
- Lập báo cáo, bao gồm bản đồ chuyên đề, bảng biểu, biểu đồ và kế hoạch.
Từ định nghĩa trên, ta thấy: Thứ nhất, GIS có quan hệ với ứng dụng cơ sở

dữ
liệu. Thông tin trong GIS đều liên kết với tham chiếu không gian và GIS sử dụng
tham chiếu không gian như phương tiện chính để lưu trữ và truy nhập thông tin.
Thứ hai, GIS là công nghệ tích hợp, cung cấp các khả năng phân tích như phân
tích ảnh máy bay, ảnh vệ tinh hay tạo lập mô hình thống kê, vẽ bản đồ... Cuối
cùng, GIS có thể được xem như một hệ thống cho phép trợ giúp quyết định.
Cách thức nhập, lưu trữ, phân tích dữ liệu trong GIS phải phản ánh đúng cách
thức thông tin sẽ được sử dụng trong công việc lập quyết định hay nghiên cứu cụ
thể.
• Định nghĩa của David Cowen, NCGIA, Mỹ
GIS là hệ thống phần cứng, phần mềm và các thủ tục được thiết kế để thu
thập, quản lý, xử lý, phân tích, mô hình hóa và hiển thị các dữ liệu qui chiếu
không gian để giải quyết các vấn đề quản lý và lập kế hoạch phức tạp.
Một cách đơn giản, có thể hiểu GIS như một sự kết hợp giữa bản đồ (map)
và cơ sở dữ liệu (database).
GIS = Bản đồ + Cơ sở dữ liệu
Bản đồ trong GIS là một công cụ hữu ích cho phép chỉ ra vị trí của từng địa
điểm. Với sự kết hợp giữa bản đồ và cơ sở dữ liệu, người dùng có thể xem thông


tin chi tiết về từng đối tượng/thành phần tương ứng với địa điểm trên bản đồ
thông qua các dữ liệu đã được lưu trữ trong cơ sở dữ liệu. Ví dụ, khi xem bản đồ
về các thành phố, người dùng có thể chọn một thành phố để xem thông tin về
thành phố đó như diện tích, số dân, thu nhập bình quân, số quận/huyện của thành
phố, …
1.1.2. Các thành phần của hệ thông tin địa lý
Một hệ thông tin địa lý thường bao gồm 5 thành phần:


Hình 1. 1. Thành tố của GIS

- Con người;
- Dữ liệu;
- Phần cứng;
- Phần mềm;
- Phương pháp phân tích dữ liệu.
Các thành phần này kết hợp với nhau nhằm tự động quản lý và phân phối
thông tin thông qua biểu diễn địa lý.


Hình 1.2: Mối quan hệ giữa các thành phần của GIS
 Con người
Con người là thành phần quan trọng nhất, là nhân tố thưc hiện các thao tác
điều hành sự hoạt động của hệ thống GIS. Con người tham gia vào hệ thông tin
địa lý với một hoặc nhiều vai trò sau:
- Người xây dựng bản đồ: sử dụng các lớp bản đồ được lấy từ nhiều nguồn
khác nhau, chỉnh sửa dữ liệu để tạo ra các bản đồ theo yêu cầu.
- Người thiết kế CSDL: xây dựng các mô hình dữ liệu lôgic và vật lý.
- Người phát triển: xây dựng hoặc cải tạo các phần mềm GIS để đáp ứng
các nhu cầu cụ thể.
- Người dùng GIS là những người sử dụng các phần mềm GIS để giải quyết
các bài toán không gian theo mục đích của họ. Họ thường là những người được
đào tạo tốt về lĩnh vực GIS hay là các chuyên gia.
 Dữ liệu
Một hệ thống thông tin không thể thiếu dữ liệu, dữ liệu là nguồn đầu vào, là
nguyên liệu để hệ thống thực hiện phân tích, xử lý và cho ra kết quả phục vụ nhu
cầu khai thác thông tin của người dùng. Một cách tổng quát, người ta chia dữ
liệu trong GIS thành 2 loại:
- Dữ liệu không gian (spatial) cho ta biết kích thước vật lý, hình dạng và vị
trí địa lý của các đối tượng trên bề mặt trái đất.



- Dữ liệu thuộc tính (non-spatial) là các dữ liệu ở dạng văn bản, cung cấp
thêm thông tin mô tả về đối tượng dữ liệu không gian.
 Phần cứng
Phần cứng GIS giúp xây dựng, lưu trữ dữ liệu địa lý, kết nối các thiết bị
khai thác và sử dụng hệ thống và trình bày thông tin địa lý. Phần cứng GIS có
thể là các máy tính điện tử: PC, mini Computer, Smart Phone … là các thiết bị
mạng cần thiết khi triển khai GIS trên môi trường mạng. GIS cũng đòi hỏi các
thiết bị ngoại vi đặc biệt cho việc nhập và xuất dữ liệu như: máy số hoá
(digitizer), máy vẽ (plotter), máy quét (scanner)…
 Phần mềm
Phần mềm giúp kết nối các thành tố của một hệ thông tin địa lý với nhau,
đồng thời mang lại thông tin từ dữ liệu địa lý thông qua các chức năng phân tích
và xử lý dữ liệu.
Hệ thống phần mềm GIS rất đa dạng. Mỗi công ty xây dựng GIS đều có hệ
phần mềm riêng của mình. Tuy nhiên, có một dạng phần mềm mà các công ty
phải xây dựng là hệ quản trị CSDL địa lý. Dạng phần mềm này nhằm mục đích
nâng cao khả năng cho các phần mềm CSDL thương mại trong việc: sao lưu dữ
liệu, định nghĩa bảng, quản lý các giao dịch do đó ta có thể lưu các dữ liệu đồ địa
lý dưới dạng các đối tượng hình học trực tiếp trong các cột của bảng quan hệ và
nhiều công việc khác.
 Các phép phân tích dữ liệu
Mục đích chung của mọi hệ thông tin là khai thác, phân tích, xử lý dữ liệu
để đưa ra các thông tin phục vụ nhu cầu của con người. Các chức năng phân tích,
xử lý và trình bày dữ liệu của một hệ thông tin địa lý tối thiểu phải gồm:
- Capture: thu thập dữ liệu. Dữ liệu có thể lấy từ rất nhiều nguồn, có thể là
bản đồ giấy, ảnh chụp, bản đồ số…
- Store: lưu trữ. Dữ liệu có thể được lưu dưới dạng vector hay raster (sẽ đề
cập ở mục sau).



- Query: truy vấn (tìm kiếm). Người dùng có thể truy vấn thông tin đồ họa
hiển thị trên bản đồ.
- Analyze: phân tích. Đây là chức năng hỗ trợ việc ra quyết định của người
dùng.
- Display: hiển thị. Hiển thị dữ liệu địa lý và kết quả phân tích dưới những
cách thức hiểu được đối với người dùng.
- Output: xuất dữ liệu. Hỗ trợ việc kết xuất dữ liệu bản đồ dưới nhiều định
dạng: giấy in, Web, ảnh, file…
1.2. Biểu diễn dữ liệu địa lý
1.2.1. Các thành phần của dữ liệu địa lý
Trong GIS, dữ liệu được chia làm hai loại: thành phần không gian và thành
phần phi không gian (thuộc tính). Hai loại thành phần dữ liệu này được kết hợp
thông qua một chỉ số chung để mô tả một đối tượng thực. Sự kết hợp này thể
hiện đặc trưng không gian của đối tượng, nó cho phép:
- Mô tả “vị trí, hình dạng”: vị trí tham chiếu, đơn vị đo, dạng hình học của
thực thể địa lý.
- Mô tả “quan hệ và tương tác” giữa các thực thể địa lý: những thửa đất
nào liền kề với khu công nghiệp ?
- Mô tả “thông tin” của các đối tượng địa lý: ai là chủ sở hữu của thửa đất
này, thuộc quản lý của địa phương nào?...
 Thành phần không gian
Thành phần dữ liệu không gian hay thường được gọi là dữ liệu hình học hay
dữ liệu bản đồ trong GIS, là dữ liệu về đối tượng mà vị trí của nó được xác định
trên bề mặt trái đất. Dữ liệu không gian sử dụng trong hệ thống địa lý luôn được
xây dựng trên một hệ thống tọa độ, bao gồm tọa độ, quy luật và các ký hiệu dùng
để xác định một hình ảnh bản đồ cụ thể trên mỗi bản đồ.
Hệ thống GIS dùng thành phần dữ liệu không gian để tạo ra bản đồ hay
hình ảnh bản đồ trên màn hình hoặc trên giấy thông qua thiết bị ngoại vi. Mỗi hệ
thống



GIS có thể dùng các mô hình khác nhau để mô hình hóa thế giới thực sao cho
giảm thiểu sự phức tạp của không gian nhưng không mất đi các dữ liệu cần thiết
để mô tả chính xác các đối tượng trong không gian. Hệ thống GIS 2D dùng 3
kiểu dữ liệu cơ sở sau để mô tả hay thể hiện các đối tượng trên bản đồ vector, đó
là:
- Ðiểm (Point):
Điểm được xác định bởi cặp giá trị tọa độ (x, y). Các đối tượng đơn với
thông tin về địa lý chỉ bao gồm vị trí thường được mô tả bằng đối tượng điểm.
Các đối tượng biểu diễn bằng kiểu điểm thường mang đặc tính chỉ có tọa độ
đơn (x, y) và không cần thể hiện chiều dài và diện tích. Ví dụ, trên bản đồ, các vị
trí của bệnh viện, các cây xăng, các điểm kinh tế- xã hội khác… có thể được biểu
diễn bởi các điểm.
Hình 3 là ví dụ về vị trí nước bị ô nhiễm. Mỗi vị trí được biểu diễn bởi 1
điểm gồm cặp tọa độ (x, y) và tương ứng với mỗi vị trí đó có thuộc tính độ sâu
và tổng số nước bị nhiễm bẩn. Các vị trí này được biểu diễn trên bản đồ và lưu
trữ trong các bảng dữ liệu.

Hình 1. 3. Ví dụ biểu diễn vị trí nước bị ô nhiễm
- Ðường – Cung (Line - Arc):
Đường được xác định bởi dãy các điểm hoặc bởi 2 điểm đầu và điểm cuối.
Đường dùng để mô tả các đối tượng địa lý dạng tuyến như đường giao thông,
sông ngòi, tuyến cấp điện, cấp nước…


Các đối tượng được biểu diễn bằng kiểu đường thường mang đặc điểm là
có dãy các cặp tọa độ, các đường bắt đầu và kết thúc hoặc cắt nhau bởi điểm. Ví
dụ, bản đồ hệ thống đường bộ, sông, đường biên giới hành chính, … thường
được biểu diễn bởi đường và trên đường có các điểm (vertex) để xác định vị trí

và hình
dáng của đường đó.

Hình 1.4. Ví dụ biểu diễn đường
-

Vùng (Polygon):

Vùng được xác định bởi ranh giới của nó là đường gấp khúc, có điểm đầu
trùng với điểm cuối. Các đối tượng địa lý có diện tích và được bao quanh bởi
đường thường được biểu diễn bởi vùng.
Các đối tượng biểu diễn bởi vùng có đặc điểm là được mô tả bằng tập các
đường bao quanh vùng và điểm nhãn (label point) thuộc vùng để mô tả, xác định
cho mỗi vùng. Ví dụ, các khu vực hành chính, hình dạng các công viên, … được
mô tả bởi kiểu dữ liệu vùng. Hình 1.5 mô tả ví dụ cách lưu trữ một đối tượng
vùng.


Hình 1.5. Ví dụ biểu diễn khu vực hành chính
Một đối tượng có thể biểu diễn bởi các kiểu khác nhau tùy thuộc vào tỷ lệ
của bản đồ đó. Ví dụ, đối tượng công viên có thể được biểu diễn bởi điểm trong
bản đồ có tỷ lệ nhỏ, và bởi vùng trong bản đồ có tỷ lệ lớn.
 Thành phần phi không gian
Thành phần dữ liệu phi không gian hay còn gọi là dữ liệu thuộc tính, là
những diễn tả đặc tính, số lượng, mối quan hệ của các hình ảnh bản đồ với vị trí
địa lý của chúng thông qua một cơ chế thống nhất. Hệ thống GIS có cơ chế liên
kết dữ liệu không gian và phi không gian của cùng một đối tượng với nhau. Có
thể nói, một trong những chức năng đặc biệt của công nghệ GIS chính là khả
năng liên kết và xử lý đồng thời dữ liệu bản đồ và dữ liệu thuộc tính.
Dữ liệu thuộc tính trong hệ thống GIS bất kỳ thường phân thành 4 loại sau:

- Bộ xác định: có thể là một số duy nhất, liên tục, ngẫu nhiên hoặc chỉ báo
địa lý, số liệu xác định vị trí lưu trữ chung. Bộ xác định cho một thực thể chứa
tọa độ phân bố của nó, số hiệu mảnh bản đồ, mô tả khu vực hay con trỏ đến vị trí
lưu trữ của số liệu liên quan. Bộ xác định thường lưu trữ với các bản ghi tọa độ
hay mô tả khác của hình ảnh không gian và các bản ghi số liệu thuộc tính liên
quan.
- Số liệu hiện tượng, tham khảo địa lý: miêu tả thông tin danh mục, các
hoạt động liên quan đến các vị trí địa lý xác định (ví dụ như: cho phép xây dựng,
báo cáo tai nạn, nghiên cứu y tế,…) Thông tin này được lưu trữ và quản lý trong
các


tệp/ bảng độc lập, trong đó mỗi bản ghi chứa yếu tố xác định vị trí của sự kiện
hay hiện tượng quản lý.
- Chỉ số địa lý: bao gồm tên, địa chỉ, khối, phương hướng định vị, … liên
quan đến các đối tượng địa lý. Một chỉ số có thể bao gồm nhiều bộ xác định cho
thực thể địa lý. Ví dụ: chỉ số địa lý về đường phố và địa chỉ địa lý liên quan đến
phố đó.
- Quan hệ giữa các đối tượng tại một vị trí địa lý cụ thể trong không gian.
Đây là thông tin quan trọng cho các chức năng xử lý của hệ thống thông tin địa
lý. Các mối quan hệ không gian có thể là mối quan hệ đơn giản hay lôgic, ví dụ
đứng trước và tiếp theo số nhà 101 phải là số nhà 99 và 103.
1.2.2. Mô hình biểu diễn dữ liệu không gian[3]
Như đã đề cập ở trên, dữ liệu địa lý bao gồm thành phần dữ liệu không
gian và thành phần dữ liệu thuộc tính. Ở phần này, chúng ta sẽ xem xét cách
thức biểu diễn thành phần dữ liệu không gian trong hệ thông tin địa lý.
Hệ thông tin địa lý biểu diễn các thực thể địa lý trong tự nhiên bằng dữ liệu
của nó, hệ thống GIS chứa càng nhiều dữ liệu thì khả năng mang lại thông tin
càng lớn. Dữ liệu của GIS có được thông qua việc mô hình hóa các thực thể địa
lý. Mô hình biểu diễn dữ liệu địa lý là cách thức chúng ta biểu diễn trừu tượng

các thực thể địa lý. Mô hình biểu diễn dữ liệu địa lý đóng vai trò quan trọng vì
cách thức biểu diễn thông tin sẽ ảnh hưởng tới khả năng thực hiện phân tích dữ
liệu và khả năng hiển thị đồ họa của một hệ thống thông tin địa lý.
Các mức trừu tượng của dữ liệu được thể hiện qua 3 mức mô hình, bao
gồm:
- Mô hình quan niệm;
- Mô hình logic;
- Mô hình vật lý.
 Mô hình quan niệm
Đây là mức trừu tượng đầu tiên trong tiến trình biểu diễn các thực thể địa
lý. Là tập các thành phần và các quan hệ giữa chúng liên quan đến hiện tượng tự


nhiên nào đó. Mô hình này độc lập lập với hệ thống, độc lập với cấu trúc, tổ
chức và quản lý dữ liệu. Một số mô hình quan niệm thường được sử dụng trong
GIS là:
- Mô hình không gian trên cơ sở đối tượng:
Mô hình này tập trung vào các hiện tượng, thực thể riêng rẽ được xem xét
độc lập hay cùng với quan hệ của chúng với thực thể khác. Bất kỳ thực thể lớn
hay nhỏ đều được xem như một đối tượng và có thể độc lập với các thực thể láng
giềng. Đối tượng này lại có thể bao gồm các đối tượng khác và chúng cũng có
thể có quan hệ với các đối tượng khác. Ví dụ các đối tượng kiểu thửa đất và hồ
sơ là tách biệt với các đối tượng khác về không gian và thuộc tính.
Mô hình hướng đối tượng phù hợp với các thực thể do con người tạo ra như
nhà cửa, đường quốc lộ, các điểm tiện ích hay các vùng hành chính. Một số thực
thể tự nhiên như sông hồ, đảo…cũng thường được biểu diễn bằng mô hình đối
tượng do chúng cần được xử lý như các đối tượng rời rạc. Mô hình dữ liệu kiểu
vector (sẽ đề cập đến ở phần sau) là một ví dụ của mô hình không gian trên cơ sở
đối tượng.
- Mô hình không gian trên cơ sở mạng:

Mô hình này có một vài khía cạnh tương đồng với mô hình hướng đối
tượng, nhưng mở rộng xem xét cả mối quan hệ tương tác giữa các đối tượng
không gian. Mô hình này thường quan tâm đến tính liên thông, hay đường đi
giữa các đối tượng không gian, ví dụ mô hình mạng lưới giao thông, mạng lưới
cấp điện, cấp thoát nước…Trong mô hình này, hình dạng chính xác của đối
tượng thường không được quan tâm nhiều. Mô hình topo là một ví dụ về mô
hình không gian trên cơ sở mạng.
- Mô hình quan sát trên cơ sở nền:
Mô hình này quan tâm đến tính liên tục, trải dài về mặt không gian của
thực thể địa lý, ví dụ các thực thể như thảm thực vật, vùng mây bao phủ, vùng ô
nhiễm khí quyển, nhiệt độ bề mặt đại dương…thích hợp khi sử dụng mô hình
này. Mô


hình dữ liệu kiểu raster (được đề cập ở phần sau) là một ví dụ về mô hình quan
sát trên cơ sở nền.
 Mô hình logic
Sau khi biểu diễn các thực thể ở mức mô hình quan niệm, bước tiếp theo là
cụ thể hóa mô hình quan niệm của các thực thể địa lý thành các cách thức tổ
chức hay còn gọi là cấu trúc dữ liệu cụ thể để có thể được xử lý bởi hệ thông tin
địa lý. Ở mô hình logic, các thành phần biểu diễn thực thể và quan hệ giữa
chúng được chỉ rõ dưới dạng các cấu trúc dữ liệu. Một số cấu trúc dữ liệu được
sử dụng trong GIS là:
- Cấu trúc dữ liệu toàn đa giác:
Mỗi tầng trong cơ sở dữ liệu của cấu trúc này được chia thành tập các đa
giác. Mỗi đa giác được mã hóa thành trật tự các vị trí hình thành đường biên của
vùng khép kín theo hệ trục tọa độ nào đó. Mỗi đa giác được lưu trữ như một đặc
trưng độc lập, do vậy không thể biết được đối tượng kề của một đối tượng địa lý.
Như vậy quan hệ topo (thể hiện mối quan hệ không gian giữa các đối tượng địa
lý như quan hệ kề nhau, bao hàm nhau, giao cắt nhau…) không thể hiện được

trong cấu trúc dữ liệu này. Nhược điểm của cấu trúc dữ liệu này là một số đường
biên chung giữa hai đa giác kề nhau sẽ được lưu hai lần, và như vậy, việc cập
nhật, sửa đổi dữ liệu thường gặp nhiều khó khăn.
- Cấu trúc dữ liệu cung nút:
Cấu trúc dữ liệu cung nút mô tả các thực thể địa lý dưới dạng các điểm
(nút) và các đường (cung). Như vậy, có thể biểu diễn được quan hệ topo giữa
các đối tượng địa lý. Trong cấu trúc dữ liệu này, các phần đối tượng không gian
kề nhau sẽ được lưu trữ một lần, ngoài ra, các đối tượng lân cận của một đối
tượng địa lý cũng được chỉ rõ, điều này giúp dễ dàng thực hiện các phép phân
tích không gian, đồng thời cũng tối ưu được dung lượng lưu trữ dữ liệu.
- Cấu trúc dữ liệu dạng cây:


×