Tải bản đầy đủ (.pdf) (69 trang)

Xây dựng hệ thống quản lý và cảnh báo ô nhiễm khu công nghiệp đồng văn sử dụng GIS

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.2 MB, 69 trang )

ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

ĐINH THỊ THU HIỀN

XÂY DỰNG HỆ THỐNG QUẢN LÝ VÀ CẢNH BÁO Ô
NHIỄM KHU CÔNG NGHIỆP ĐỒNG VĂN SỬ DỤNG GIS

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

THÁI NGUYÊN, 2018


ĐẠI HỌC THÁI NGUYÊN
ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

ĐINH THỊ THU HIỀN

XÂY DỰNG HỆ THỐNG QUẢN LÝ VÀ CẢNH BÁO Ô
NHIỄM KHU CÔNG NGHIỆP ĐỒNG VĂN SỬ DỤNG GIS
Chuyên ngành: Khoa học máy tính
Mã số: 8 48 01 01

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Người hướng dẫn khoa học: PGS.TS. ĐẶNG VĂN ĐỨC

THÁI NGUYÊN, 2018


i
LỜI CAM ĐOAN


Tôi xin cam đoan bản luận văn “Xây dựng hệ thống quản lý và cảnh báo
ô nhiễm khu cơng nghiệp Đồng Văn sử dụng Gis” là cơng trình nghiên cứu của
tôi, dưới sự hướng dẫn khoa học của PGS.TS Đặng Văn Đức, tham khảo các
nguồn tài liệu đã được chỉ rõ trong trích dẫn và danh mục tài liệu tham khảo. Các
nội dung công bố và kết quả trình bày trong luận văn này là trung thực và chưa
từng được ai cơng bố trong bất cứ cơng trình nào.

Thái Nguyên, tháng 5 năm 2018
Đinh Thị Thu Hiền


ii
LỜI CẢM ƠN
Em xin gửi lời cảm ơn sâu sắc tới PGS.TS. Đặng Văn Đức, Thầy đã tận
tình chỉ bảo giúp đỡ em trong suốt quá trình nghiên cứu và hoàn thành luận văn.
Xin chân thành cảm ơn quý Thầy Cơ trong Phịng Đào tạo, Trường Đại học
Cơng nghệ thơng tin và Truyền thông, Đại học Thái Nguyên đã nhiệt tình giảng
dạy, trang bị cho tơi những kiến thức q báu trong suốt thời gian học tập tại
trường.
Xin cảm ơn các bạn cùng lớp và đồng nghiệp nơi tôi công tác đã tạo điều
kiện cho tơi hồn thành luận văn này.
Xin gửi lời cảm ơn tới gia đình tơi đã động viên tơi trong suốt q trình học
tập và hồn thành luận văn.


iii
MỤC LỤC
LỜI CAM ĐOAN.................................................................................................. 1
LỜI CẢM ƠN ....................................................................................................... ii
MỤC LỤC ............................................................................................................ iii

DANH MỤC HÌNH VẼ ........................................................................................ v
PHẦN I: MỞ ĐẦU ............................................................................................... 1
CHƯƠNG I TỔNG QUAN VỀ GIS VÀ BÀI TOÁN QUẢN LÝ MÔI TRƯỜNG
............................................................................................................................... 4
1.1. Các khái niệm cơ bản về GIS:...................................................................... 4
1.1.1. Một số định nghĩa về hệ thông tin địa lý .............................................. 4
1.1.2. Các thành phần của hệ thông tin địa lý ................................................. 6
1.2. Biểu diễn dữ liệu địa lý ............................................................................... 9
1.2.1. Các thành phần của dữ liệu địa lý ......................................................... 9
1.2.2. Mơ hình biểu diễn dữ liệu khơng gian[3] ........................................... 13
1.2.3. Phân tích và xử lý dữ liệu không gian ................................................ 18
1.3. Ứng dụng GIS trong bài tốn quản lý và cảnh báo ơ nhiễm ...................... 24
1.3.1. Các lĩnh vực liên quan với hệ thông tin địa lý .................................... 24
1.3.2. Những bài toán của GIS ...................................................................... 25
1.3.3. Bài toán của GIS trong quản lý và cảnh báo ơ nhiễm mơi trường: .... 25
CHƯƠNG II PHÂN TÍCH KHƠNG GIAN HỖ TRỢ VÀ CẢNH BÁO Ô NHIỄM
MÔI TRƯỜNG ................................................................................................... 27
2.1 Kỹ thuật xây dựng vùng đệm trong GIS ..................................................... 27
2.1.1 Giới thiệu về xây dựng vùng đệm trong GIS ....................................... 27
2.1.2 Vùng đệm của điểm dữ liệu ................................................................. 27
2.1.3 Vùng đệm của xâu đoạn thẳng ............................................................ 28
2.1.4 Vùng đệm của vùng xác định bởi đa giác ............................................ 32
2.2 Kỹ thuật xếp chồng bản đồ.......................................................................... 35


iv
2.2.1 Khái quát về xếp chồng bản đồ ............................................................ 35
2.2.2 Các phương pháp xếp chồng bản đồ .................................................... 37
2.2.3 Thuật toán Bently – Ottmann ............................................................... 38
2.3 Kỹ thuật nội suy không gian ....................................................................... 43

2.3.1 Nội suy trọng số không gian (IDW) .................................................... 43
2.3.2 Kỹ thuật Kriging .................................................................................. 43
2.4 Kết luận chương .......................................................................................... 46
CHUƠNG III XÂY DỰNG CHUƠNG TRÌNH THỬ NGHIỆM VÀ CẢNH BÁO
Ơ NHIỄM ............................................................................................................ 47
3.1 Mơ tả bài tốn cảnh báo ô nhiễm tại khu công nghiệp Đồng văn bằng GIS .. 47
3.2 Mơ hình hệ thống thử nghiệm ..................................................................... 47
3.3 Lựa chọn công cụ phát triển và môi trường thử nghiệm............................. 48
3.4 Đánh giá kết quả thử nghiệm ...................................................................... 49
KẾT LUẬN VÀ HUỚNG PHÁT TRIỂN .......................................................... 60
TÀI LIỆU THAM KHẢO ................................................................................... 60


v
DANH MỤC HÌNH VẼ
Hình 1. 1. Thành tố của GIS ................................................................................. 6
Hình 1.2: Mối quan hệ giữa các thành phần của GIS ........................................... 7
Hình 1. 3. Ví dụ biểu diễn vị trí nước bị ơ nhiễm ............................................... 10
Hình 1.4. Ví dụ biểu diễn đường ......................................................................... 11
Hình 1.5. Ví dụ biểu diễn khu vực hành chính ................................................... 12
Hình 1.6. Biểu diễn thế giới bằng mơ hình raster ............................................... 17
Hình 1.7: Xếp chồng đa giác ............................................................................... 21
Hình 1.8. Tiến trình xếp chồng đa giác ............................................................... 22
Hình 2.1. Vùng đệm của xâu đoạn thẳng ............................................................ 28
Hình 2.2. Tìm vùng đệm ..................................................................................... 29
Hình 2.3. Trường hợp góc tù ............................................................................... 30
Hình 2.4. Trường hợp góc bẹt ............................................................................. 30
Hình 2.5. Minh họa bản đồ đệm trong GIS ........................................................ 34
Hình 2.6. Nguyên lý khi xếp chồng các bản đồ ................................................ 36
Hình 2.7. Việc xếp chồng các bản đồ theo phương pháp cộng.......................... 36

Hình 2.8. Một thí dụ trong việc xếp chồng các bản đồ. ...................................... 36
Hình 2.9. Xếp chồng 2 lớp bản đồ ..................................................................... 37
Hình 2.10. Xếp chồng điểm và đa giác .............................................................. 38
Hình 2.11. Xếp chồng đoạn và đa giác .............................................................. 38
Hình 3.1: Giao diện chương trình Hmap với cửa sổ hiển thị bản đồ, các lớp bản
đồ và cửa sổ chức năng phân tích nội suy IDW. ................................................. 48
Hình 3.2. Bản đồ chuyên đề nội suy chỉ tiêu Asen trong nước ngầm tại 3 điểm
quan trắc sử dụng thuật tốn nội suy IDW .......................................................... 49
Hình 3.3. Bản đồ chuyên đề Tổng lượng chất rắn hòa tan trong nước ngầm ..... 51
Hình 3.4. Chỉ tiêu lượng vi khuẩn trong nước ngầm .......................................... 52
Hình 3.5. Chỉ tiêu Chì (Pb) trong nước ngầm ..................................................... 53


vi
Hình 3.6. Chỉ tiêu Asen trong nước mặt ............................................................. 54
Hình 3.7. Chỉ tiêu vi khuẩn Coliform trong nước mặt ........................................ 55
Hình 3.8. Hàm lượng Chì (Pb) trong nước mặt .................................................. 56
Hình 3.9. Chỉ tiêu vi khuẩn Coliform trong nước thải ........................................ 57
Hình 3.10. Hàm lượng CO (Các-bon ơ xít) trong khơng khí ............................. 58
Hình 3.11. Tổng bụi lơ lửng trong khơng khí ..................................................... 59


1
PHẦN I: MỞ ĐẦU
1. Tính cấp thiết của đề tài
Cùng với sự phát triển của xã hội, con người đã sử dụng nhiều cơng cụ để
tìm hiểu, khai thác và giải đáp các thắc mắc về tự nhiên; Trong đó, kỹ thuật
“Thông tin địa lý” (GIS – Geographic Information System) là kỹ thuật ưu việt
được sử dụng rộng rãi từ những năm 60 trở lại đây. Kỹ thuật GIS là kỹ thuật ứng
dụng hệ thống vi tính, số hóa để thu thập, phân tích, xử lý dữ liệu khơng gian. Từ

đó, GIS đã trở thành cơng cụ hỗ trợ ra quyết định trong hầu hết các lĩnh vực nghiên
cứu và quản lý, đặc biệt trong quản lý, quy hoạch nguồn tài nguyên môi trường.
Thông tin địa lý là thông tin về các vị trí trên bề mặt trái đất, bao gồm tri
thức về cái gì đó? Ở đâu? Hoặc tri thức về cái gì ở tại vị trí biết trước? Đặc trưng
của thơng tin địa lý có thể rất chi tiết như: thông tin về từng ngôi nhà trong thành
phố hoặc có thể rất thơ như: Thời tiết, mật độ dân số quốc gia…
Một vấn đề nóng bỏng, gây bức xúc trong dư luận xã hội cả nước là tình
trạng ô nhiễm môi trường sinh thái do các hoạt động sản xuất và sinh hoạt của con
người gây ra. Vấn đề này ngày càng trầm trọng, đe doạ trực tiếp sự phát triển kinh
tế - xã hội bền vững, sự tồn tại, phát triển của các thế hệ hiện tại và tương lai. Giải
quyết vấn đề ô nhiễm môi trường trong thời kỳ đẩy mạnh CNH, HĐH hiện nay
không chỉ là đòi hỏi cấp thiết đối với các cấp quản lí, các doanh nghiệp mà đó cịn
là trách nhiệm của cả hệ thống chính trị và của tồn xã hội.
Việc theo dõi mức độ ô nhiễm của từng công ty trong khu cơng nghiệp để có
những xử lý kịp thời cho các cơng ty phịng tránh cũng như có những giải pháp
thích hợp khi mức độ ơ nhiễm tăng cao gây nguy hại tới mơi trường đất, nước và
khơng khí làm ảnh hưởng đến môi trường sống của những người xung quanh.
Chính thực trạng ấy đã khiến tơi mạnh dạn đưa ra ý tưởng cho đề tài nghiên cứu:”
Xây dựng hệ thống quản lý và cảnh báo ô nhiễm ở các khu công nghiệp”. Để thực
hiện được ý tưởng này cần đến sự trợ giúp của công nghệ thông tin, thơng qua
cơng nghệ GIS. Bên cạnh đó cần phải nghiên cứu thử nghiệm trên môi trường cụ


2
thể, ở đây chọn khu công nghiệp Đồng Văn - Hà Nam. Đề tài được thực hiện
thành công sẽ trợ giúp công tác quản lý và cảnh báo kịp thời các mức độ ô nhiễm
của địa phương, hạn chế đến mức thấp nhất có thể tác hại gây ơ nhiễm của chúng.
Sau thử nghiệm và hồn thiện, đề tài có thể triển khai ứng dụng cho các vùng, khu
công nghiệp khác.
Các dữ liệu về mức độ ô nhiễm môi trường do các công ty thu thập, chúng

thường gắn với phạm vi quản lý của công ty, địa phương, sở Tài nguyên môi
trường và bộ Tài nguyên môi trường với dân cư và các điều kiện tự nhiên trên
không gian địa bàn quản lý. Việc theo dõi các mức độ ô nhiễm mơi trường địi hỏi
phải tổng hợp từ dưới lên, và cần được phân tích, đánh giá tình hình, tiến hành
các dự báo để thông báo lại cho các công ty trong khu Cơng nghiệp Đồng Văn
biết và có những giải pháp đề phòng, ngăn chặn mức độ tiến triển gây ơ nhiễm
kịp thời, đúng nơi, đúng đối tượng.
Chính vì lý do đó, trong khn khổ luận văn, học viên thực hiện nghiên cứu:
“Xây dựng hệ thống quản lý và cảnh báo ô nhiễm khu công nghiệp Đồng Văn
sử dụng Gis”
2. Mục tiêu của đề tài
Sử dụng công nghệ GIS để tổ chức thu thập dữ liệu cũng như chuyển tải và
biểu diễn thông tin trên nền web. Các thông tin có thể nhận được kịp thời và được
xử lý, đưa ra các quyết định đúng đắn, đáp ứng được yêu cầu quản lý và cảnh báo
mức độ ô nhiễm, hạn chế được những thiệt hại khơng đáng có.
3. Phạm vi và phương pháp nghiên cứu
a. Phạm vi nghiên cứu
- Hồn thiện quy trình theo dõi, tổng hợp và phân tích ơ nhiễm từ cơ sở đến
tồn khu vực trên cơ sở tổ chức và cách làm đã có nhưng sử dụng các công cụ và
công nghệ mới để triển khai hệ thống thông tin quản lý và cảnh báo xử lý ô nhiễm
trên nền web phục vụ thường xuyên cho công tác và xử lý ô nhiễm.


3
- Nghiên cứu xây dựng cơ sở dữ liệu dạng GIS từ cơ sở đến toàn vùng phục
vụ việc thu thập và xử lý thông tin đáp ứng yêu cầu của bài toán đặt ra
- Tổ chức website phục vụ việc thu thập và chuyển tải thông tin của hệ thống
được xây dựng.
b. Phương pháp nghiên cứu
- Các phương pháp phân tích, tổng hợp và dự báo theo yêu cầu.

- Tổ chức cơ sở dữ liệu phân tán dạng GIS, tổng hợp và phân tich dữ liệu,
tiến hành dự báo theo các phương pháp khoa học khác nhau, chuyển tải các thông
tin trên nền web dưới cả dạng văn bản và dạng bản đồ
4. Bố cục luận văn
- Phần I: Mở đầu
- Phần II: Nội dung
+ Chương I: Tổng quan về GIS và bài tốn quản lý mơi trường
+ Chương II: Phân tích khơng gian hỗ trợ quản lý và cảnh báo ô nhiễm môi
trường
+ Chương III: Xây dựng chương trình thử nghiệm cảnh báo ơ nhiễm
- Phần III: Kết luận và hướng phát triển


4
CHƯƠNG I
TỔNG QUAN VỀ GIS VÀ BÀI TOÁN QUẢN LÝ MÔI TRƯỜNG
1.1. Các khái niệm cơ bản về GIS:
Khái niệm Địa lý (Geography) đề cập lĩnh vực nghiên cứu mô tả Trái đất
(Geo-Earth). Ngày nay, khái niệm này và khái niệm Không gian (Space) được sử
dụng thay thế nhau trong một số trường hợp. Tuy nhiên, về mặt bản chất thì Địa
lý là tập các mơ tả về khơng gian (hai chiều), khí quyển (ba chiều), … của Trái
đất. Cịn Không gian cho phép mô tả bất kỳ cấu trúc đa chiều nào, khơng quan
tâm đến vị trí địa lý của nó. Như vậy có thể coi Địa lý như là một phần cấu trúc
nhỏ trong tập cấu trúc Không gian.
Khi mô tả Trái đất, các nhà địa lý luôn đề cập đến quan hệ không gian (spatial
relationship) của các đối tượng trong thế giới thực. Mối quan hệ này được thể
hiện thơng qua các bản đồ (map) trong đó biểu diễn đồ họa của tập các đặc trưng
trừu tượng và quan hệ không gian tương ứng trên bề mặt trái đất, ví dụ: bản đồ
dân số biểu diễn dân số tại từng vùng địa lý.
Dữ liệu bản đồ còn là loại dữ liệu có thể được số hóa. Để lưu trữ và phân tích

các số liệu thu thập được, cần có sự trợ giúp của hệ thơng tin địa lý (Geographic
Information System-GIS).
1.1.1. Một số định nghĩa về hệ thông tin địa lý
Có nhiều cách diễn giải khác nhau cho từ viết tắt GIS, tuy nhiên các cách
diễn giải đó đều mô tả việc nghiên cứu các thông tin địa lý và các khía cạnh khác
liên quan.
GIS cũng giống như các hệ thống thơng tin khác, có khả năng nhập, tìm kiếm
và quản lý các dữ liệu lưu trữ, để từ đó đưa ra các thơng tin cần thiết cho người
sử dụng. Ngồi ra, GIS cịn cho phép lập bản đồ với sự trợ giúp của máy tính,
giúp cho việc biểu diễn dữ liệu bản đồ tốt hơn so với cách truyền thống. Dưới đây
là một số định nghĩa GIS hay dùng:


5
• Định nghĩa của dự án The Geographer's Craft, Khoa Địa lý, Trường
Đại học Texas
GIS là cơ sở dữ liệu số chun dụng trong đó hệ trục tọa độ khơng gian là
phương tiện tham chiếu chính. GIS bao gồm các công cụ để thực hiện những công
việc sau:
- Nhập dữ liệu từ bản đồ giấy, ảnh vệ tinh, ảnh máy bay, số liệu điều tra và
các nguồn khác.
- Lưu trữ dữ liệu, khai thác, truy vấn cơ sở dữ liệu.
- Biến đổi dữ liệu, phân tích, mơ hình hóa, bao gồm cả dữ liệu thống kê và
dữ liệu không gian.
- Lập báo cáo, bao gồm bản đồ chuyên đề, bảng biểu, biểu đồ và kế hoạch.
Từ định nghĩa trên, ta thấy: Thứ nhất, GIS có quan hệ với ứng dụng cơ sở dữ
liệu. Thông tin trong GIS đều liên kết với tham chiếu không gian và GIS sử dụng
tham chiếu khơng gian như phương tiện chính để lưu trữ và truy nhập thơng tin.
Thứ hai, GIS là cơng nghệ tích hợp, cung cấp các khả năng phân tích như phân
tích ảnh máy bay, ảnh vệ tinh hay tạo lập mô hình thống kê, vẽ bản đồ... Cuối

cùng, GIS có thể được xem như một hệ thống cho phép trợ giúp quyết định. Cách
thức nhập, lưu trữ, phân tích dữ liệu trong GIS phải phản ánh đúng cách thức
thông tin sẽ được sử dụng trong công việc lập quyết định hay nghiên cứu cụ thể.
• Định nghĩa của David Cowen, NCGIA, Mỹ
GIS là hệ thống phần cứng, phần mềm và các thủ tục được thiết kế để thu
thập, quản lý, xử lý, phân tích, mơ hình hóa và hiển thị các dữ liệu qui chiếu không
gian để giải quyết các vấn đề quản lý và lập kế hoạch phức tạp.
Một cách đơn giản, có thể hiểu GIS như một sự kết hợp giữa bản đồ (map)
và cơ sở dữ liệu (database).
GIS = Bản đồ + Cơ sở dữ liệu
Bản đồ trong GIS là một cơng cụ hữu ích cho phép chỉ ra vị trí của từng địa
điểm. Với sự kết hợp giữa bản đồ và cơ sở dữ liệu, người dùng có thể xem thơng


6
tin chi tiết về từng đối tượng/thành phần tương ứng với địa điểm trên bản đồ thông
qua các dữ liệu đã được lưu trữ trong cơ sở dữ liệu. Ví dụ, khi xem bản đồ về các
thành phố, người dùng có thể chọn một thành phố để xem thơng tin về thành phố
đó như diện tích, số dân, thu nhập bình quân, số quận/huyện của thành phố, …
1.1.2. Các thành phần của hệ thông tin địa lý
Một hệ thông tin địa lý thường bao gồm 5 thành phần:

Hình 1. 1. Thành tố của GIS
- Con người;
- Dữ liệu;
- Phần cứng;
- Phần mềm;
- Phương pháp phân tích dữ liệu.
Các thành phần này kết hợp với nhau nhằm tự động quản lý và phân phối
thông tin thông qua biểu diễn địa lý.



7

Hình 1.2: Mối quan hệ giữa các thành phần của GIS
 Con người
Con người là thành phần quan trọng nhất, là nhân tố thưc hiện các thao tác
điều hành sự hoạt động của hệ thống GIS. Con người tham gia vào hệ thông tin
địa lý với một hoặc nhiều vai trò sau:
- Người xây dựng bản đồ: sử dụng các lớp bản đồ được lấy từ nhiều nguồn
khác nhau, chỉnh sửa dữ liệu để tạo ra các bản đồ theo yêu cầu.
- Người thiết kế CSDL: xây dựng các mô hình dữ liệu lơgic và vật lý.
- Người phát triển: xây dựng hoặc cải tạo các phần mềm GIS để đáp ứng các
nhu cầu cụ thể.
- Người dùng GIS là những người sử dụng các phần mềm GIS để giải quyết
các bài tốn khơng gian theo mục đích của họ. Họ thường là những người được
đào tạo tốt về lĩnh vực GIS hay là các chuyên gia.
 Dữ liệu
Một hệ thống thông tin không thể thiếu dữ liệu, dữ liệu là nguồn đầu vào, là
nguyên liệu để hệ thống thực hiện phân tích, xử lý và cho ra kết quả phục vụ nhu
cầu khai thác thông tin của người dùng. Một cách tổng quát, người ta chia dữ liệu
trong GIS thành 2 loại:
- Dữ liệu không gian (spatial) cho ta biết kích thước vật lý, hình dạng và vị
trí địa lý của các đối tượng trên bề mặt trái đất.


8
- Dữ liệu thuộc tính (non-spatial) là các dữ liệu ở dạng văn bản, cung cấp
thêm thông tin mô tả về đối tượng dữ liệu không gian.
 Phần cứng

Phần cứng GIS giúp xây dựng, lưu trữ dữ liệu địa lý, kết nối các thiết bị khai
thác và sử dụng hệ thống và trình bày thơng tin địa lý. Phần cứng GIS có thể là
các máy tính điện tử: PC, mini Computer, Smart Phone … là các thiết bị mạng
cần thiết khi triển khai GIS trên môi trường mạng. GIS cũng đòi hỏi các thiết bị
ngoại vi đặc biệt cho việc nhập và xuất dữ liệu như: máy số hoá (digitizer), máy
vẽ (plotter), máy quét (scanner)…
 Phần mềm
Phần mềm giúp kết nối các thành tố của một hệ thông tin địa lý với nhau,
đồng thời mang lại thông tin từ dữ liệu địa lý thơng qua các chức năng phân tích
và xử lý dữ liệu.
Hệ thống phần mềm GIS rất đa dạng. Mỗi cơng ty xây dựng GIS đều có hệ
phần mềm riêng của mình. Tuy nhiên, có một dạng phần mềm mà các công ty
phải xây dựng là hệ quản trị CSDL địa lý. Dạng phần mềm này nhằm mục đích
nâng cao khả năng cho các phần mềm CSDL thương mại trong việc: sao lưu dữ
liệu, định nghĩa bảng, quản lý các giao dịch do đó ta có thể lưu các dữ liệu đồ địa
lý dưới dạng các đối tượng hình học trực tiếp trong các cột của bảng quan hệ và
nhiều cơng việc khác.
 Các phép phân tích dữ liệu
Mục đích chung của mọi hệ thơng tin là khai thác, phân tích, xử lý dữ liệu
để đưa ra các thông tin phục vụ nhu cầu của con người. Các chức năng phân tích,
xử lý và trình bày dữ liệu của một hệ thông tin địa lý tối thiểu phải gồm:
- Capture: thu thập dữ liệu. Dữ liệu có thể lấy từ rất nhiều nguồn, có thể là
bản đồ giấy, ảnh chụp, bản đồ số…
- Store: lưu trữ. Dữ liệu có thể được lưu dưới dạng vector hay raster (sẽ đề
cập ở mục sau).


9
- Query: truy vấn (tìm kiếm). Người dùng có thể truy vấn thông tin đồ họa
hiển thị trên bản đồ.

- Analyze: phân tích. Đây là chức năng hỗ trợ việc ra quyết định của người
dùng.
- Display: hiển thị. Hiển thị dữ liệu địa lý và kết quả phân tích dưới những
cách thức hiểu được đối với người dùng.
- Output: xuất dữ liệu. Hỗ trợ việc kết xuất dữ liệu bản đồ dưới nhiều định
dạng: giấy in, Web, ảnh, file…
1.2. Biểu diễn dữ liệu địa lý
1.2.1. Các thành phần của dữ liệu địa lý
Trong GIS, dữ liệu được chia làm hai loại: thành phần không gian và thành
phần phi không gian (thuộc tính). Hai loại thành phần dữ liệu này được kết hợp
thông qua một chỉ số chung để mô tả một đối tượng thực. Sự kết hợp này thể hiện
đặc trưng khơng gian của đối tượng, nó cho phép:
- Mơ tả “vị trí, hình dạng”: vị trí tham chiếu, đơn vị đo, dạng hình học của
thực thể địa lý.
- Mơ tả “quan hệ và tương tác” giữa các thực thể địa lý: những thửa đất nào
liền kề với khu công nghiệp ?
- Mô tả “thông tin” của các đối tượng địa lý: ai là chủ sở hữu của thửa đất
này, thuộc quản lý của địa phương nào?...
 Thành phần không gian
Thành phần dữ liệu không gian hay thường được gọi là dữ liệu hình học hay
dữ liệu bản đồ trong GIS, là dữ liệu về đối tượng mà vị trí của nó được xác định
trên bề mặt trái đất. Dữ liệu không gian sử dụng trong hệ thống địa lý luôn được
xây dựng trên một hệ thống tọa độ, bao gồm tọa độ, quy luật và các ký hiệu dùng
để xác định một hình ảnh bản đồ cụ thể trên mỗi bản đồ.
Hệ thống GIS dùng thành phần dữ liệu khơng gian để tạo ra bản đồ hay hình
ảnh bản đồ trên màn hình hoặc trên giấy thơng qua thiết bị ngoại vi. Mỗi hệ thống


10
GIS có thể dùng các mơ hình khác nhau để mơ hình hóa thế giới thực sao cho

giảm thiểu sự phức tạp của không gian nhưng không mất đi các dữ liệu cần thiết
để mơ tả chính xác các đối tượng trong không gian. Hệ thống GIS 2D dùng 3 kiểu
dữ liệu cơ sở sau để mô tả hay thể hiện các đối tượng trên bản đồ vector, đó là:
- Ðiểm (Point):
Điểm được xác định bởi cặp giá trị tọa độ (x, y). Các đối tượng đơn với thông
tin về địa lý chỉ bao gồm vị trí thường được mơ tả bằng đối tượng điểm.
Các đối tượng biểu diễn bằng kiểu điểm thường mang đặc tính chỉ có tọa độ
đơn (x, y) và không cần thể hiện chiều dài và diện tích. Ví dụ, trên bản đồ, các vị
trí của bệnh viện, các cây xăng, các điểm kinh tế- xã hội khác… có thể được biểu
diễn bởi các điểm.
Hình 3 là ví dụ về vị trí nước bị ơ nhiễm. Mỗi vị trí được biểu diễn bởi 1
điểm gồm cặp tọa độ (x, y) và tương ứng với mỗi vị trí đó có thuộc tính độ sâu và
tổng số nước bị nhiễm bẩn. Các vị trí này được biểu diễn trên bản đồ và lưu trữ
trong các bảng dữ liệu.

Hình 1. 3. Ví dụ biểu diễn vị trí nước bị ô nhiễm
- Ðường – Cung (Line - Arc):
Đường được xác định bởi dãy các điểm hoặc bởi 2 điểm đầu và điểm cuối.
Đường dùng để mô tả các đối tượng địa lý dạng tuyến như đường giao thơng, sơng
ngịi, tuyến cấp điện, cấp nước…


11
Các đối tượng được biểu diễn bằng kiểu đường thường mang đặc điểm là có
dãy các cặp tọa độ, các đường bắt đầu và kết thúc hoặc cắt nhau bởi điểm. Ví dụ,
bản đồ hệ thống đường bộ, sơng, đường biên giới hành chính, … thường được
biểu diễn bởi đường và trên đường có các điểm (vertex) để xác định vị trí và hình
dáng của đường đó.

Hình 1.4. Ví dụ biểu diễn đường

-

Vùng (Polygon):

Vùng được xác định bởi ranh giới của nó là đường gấp khúc, có điểm đầu
trùng với điểm cuối. Các đối tượng địa lý có diện tích và được bao quanh bởi
đường thường được biểu diễn bởi vùng.
Các đối tượng biểu diễn bởi vùng có đặc điểm là được mô tả bằng tập các
đường bao quanh vùng và điểm nhãn (label point) thuộc vùng để mô tả, xác định
cho mỗi vùng. Ví dụ, các khu vực hành chính, hình dạng các cơng viên, … được
mơ tả bởi kiểu dữ liệu vùng. Hình 1.5 mơ tả ví dụ cách lưu trữ một đối tượng
vùng.


12

Hình 1.5. Ví dụ biểu diễn khu vực hành chính
Một đối tượng có thể biểu diễn bởi các kiểu khác nhau tùy thuộc vào tỷ lệ
của bản đồ đó. Ví dụ, đối tượng cơng viên có thể được biểu diễn bởi điểm trong
bản đồ có tỷ lệ nhỏ, và bởi vùng trong bản đồ có tỷ lệ lớn.
 Thành phần phi không gian
Thành phần dữ liệu phi không gian hay cịn gọi là dữ liệu thuộc tính, là
những diễn tả đặc tính, số lượng, mối quan hệ của các hình ảnh bản đồ với vị trí
địa lý của chúng thơng qua một cơ chế thống nhất. Hệ thống GIS có cơ chế liên
kết dữ liệu không gian và phi không gian của cùng một đối tượng với nhau. Có
thể nói, một trong những chức năng đặc biệt của công nghệ GIS chính là khả năng
liên kết và xử lý đồng thời dữ liệu bản đồ và dữ liệu thuộc tính.
Dữ liệu thuộc tính trong hệ thống GIS bất kỳ thường phân thành 4 loại sau:
- Bộ xác định: có thể là một số duy nhất, liên tục, ngẫu nhiên hoặc chỉ báo
địa lý, số liệu xác định vị trí lưu trữ chung. Bộ xác định cho một thực thể chứa tọa

độ phân bố của nó, số hiệu mảnh bản đồ, mơ tả khu vực hay con trỏ đến vị trí lưu
trữ của số liệu liên quan. Bộ xác định thường lưu trữ với các bản ghi tọa độ hay
mô tả khác của hình ảnh khơng gian và các bản ghi số liệu thuộc tính liên quan.
- Số liệu hiện tượng, tham khảo địa lý: miêu tả thông tin danh mục, các hoạt
động liên quan đến các vị trí địa lý xác định (ví dụ như: cho phép xây dựng, báo
cáo tai nạn, nghiên cứu y tế,…) Thông tin này được lưu trữ và quản lý trong các


13
tệp/ bảng độc lập, trong đó mỗi bản ghi chứa yếu tố xác định vị trí của sự kiện hay
hiện tượng quản lý.
- Chỉ số địa lý: bao gồm tên, địa chỉ, khối, phương hướng định vị, … liên
quan đến các đối tượng địa lý. Một chỉ số có thể bao gồm nhiều bộ xác định cho
thực thể địa lý. Ví dụ: chỉ số địa lý về đường phố và địa chỉ địa lý liên quan đến
phố đó.
- Quan hệ giữa các đối tượng tại một vị trí địa lý cụ thể trong không gian.
Đây là thông tin quan trọng cho các chức năng xử lý của hệ thống thông tin địa
lý. Các mối quan hệ khơng gian có thể là mối quan hệ đơn giản hay lơgic, ví dụ
đứng trước và tiếp theo số nhà 101 phải là số nhà 99 và 103.
1.2.2. Mơ hình biểu diễn dữ liệu không gian[3]
Như đã đề cập ở trên, dữ liệu địa lý bao gồm thành phần dữ liệu không gian
và thành phần dữ liệu thuộc tính. Ở phần này, chúng ta sẽ xem xét cách thức biểu
diễn thành phần dữ liệu không gian trong hệ thông tin địa lý.
Hệ thông tin địa lý biểu diễn các thực thể địa lý trong tự nhiên bằng dữ liệu
của nó, hệ thống GIS chứa càng nhiều dữ liệu thì khả năng mang lại thơng tin
càng lớn. Dữ liệu của GIS có được thơng qua việc mơ hình hóa các thực thể địa
lý. Mơ hình biểu diễn dữ liệu địa lý là cách thức chúng ta biểu diễn trừu tượng các
thực thể địa lý. Mô hình biểu diễn dữ liệu địa lý đóng vai trị quan trọng vì cách
thức biểu diễn thơng tin sẽ ảnh hưởng tới khả năng thực hiện phân tích dữ liệu và
khả năng hiển thị đồ họa của một hệ thống thông tin địa lý.

Các mức trừu tượng của dữ liệu được thể hiện qua 3 mức mơ hình, bao gồm:
- Mơ hình quan niệm;
- Mơ hình logic;
- Mơ hình vật lý.
 Mơ hình quan niệm
Đây là mức trừu tượng đầu tiên trong tiến trình biểu diễn các thực thể địa
lý. Là tập các thành phần và các quan hệ giữa chúng liên quan đến hiện tượng tự


14
nhiên nào đó. Mơ hình này độc lập lập với hệ thống, độc lập với cấu trúc, tổ chức
và quản lý dữ liệu. Một số mơ hình quan niệm thường được sử dụng trong GIS là:
- Mơ hình khơng gian trên cơ sở đối tượng:
Mơ hình này tập trung vào các hiện tượng, thực thể riêng rẽ được xem xét
độc lập hay cùng với quan hệ của chúng với thực thể khác. Bất kỳ thực thể lớn
hay nhỏ đều được xem như một đối tượng và có thể độc lập với các thực thể láng
giềng. Đối tượng này lại có thể bao gồm các đối tượng khác và chúng cũng có thể
có quan hệ với các đối tượng khác. Ví dụ các đối tượng kiểu thửa đất và hồ sơ là
tách biệt với các đối tượng khác về không gian và thuộc tính.
Mơ hình hướng đối tượng phù hợp với các thực thể do con người tạo ra như
nhà cửa, đường quốc lộ, các điểm tiện ích hay các vùng hành chính. Một số thực
thể tự nhiên như sơng hồ, đảo…cũng thường được biểu diễn bằng mơ hình đối
tượng do chúng cần được xử lý như các đối tượng rời rạc. Mơ hình dữ liệu kiểu
vector (sẽ đề cập đến ở phần sau) là một ví dụ của mơ hình khơng gian trên cơ sở
đối tượng.
- Mơ hình khơng gian trên cơ sở mạng:
Mơ hình này có một vài khía cạnh tương đồng với mơ hình hướng đối tượng,
nhưng mở rộng xem xét cả mối quan hệ tương tác giữa các đối tượng khơng gian.
Mơ hình này thường quan tâm đến tính liên thơng, hay đường đi giữa các đối
tượng khơng gian, ví dụ mơ hình mạng lưới giao thơng, mạng lưới cấp điện, cấp

thốt nước…Trong mơ hình này, hình dạng chính xác của đối tượng thường khơng
được quan tâm nhiều. Mơ hình topo là một ví dụ về mơ hình khơng gian trên cơ
sở mạng.
- Mơ hình quan sát trên cơ sở nền:
Mơ hình này quan tâm đến tính liên tục, trải dài về mặt không gian của thực
thể địa lý, ví dụ các thực thể như thảm thực vật, vùng mây bao phủ, vùng ơ nhiễm
khí quyển, nhiệt độ bề mặt đại dương…thích hợp khi sử dụng mơ hình này. Mơ


15
hình dữ liệu kiểu raster (được đề cập ở phần sau) là một ví dụ về mơ hình quan
sát trên cơ sở nền.
 Mơ hình logic
Sau khi biểu diễn các thực thể ở mức mơ hình quan niệm, bước tiếp theo là
cụ thể hóa mơ hình quan niệm của các thực thể địa lý thành các cách thức tổ chức
hay còn gọi là cấu trúc dữ liệu cụ thể để có thể được xử lý bởi hệ thơng tin địa lý.
Ở mơ hình logic, các thành phần biểu diễn thực thể và quan hệ giữa chúng được
chỉ rõ dưới dạng các cấu trúc dữ liệu. Một số cấu trúc dữ liệu được sử dụng trong
GIS là:
- Cấu trúc dữ liệu toàn đa giác:
Mỗi tầng trong cơ sở dữ liệu của cấu trúc này được chia thành tập các đa
giác. Mỗi đa giác được mã hóa thành trật tự các vị trí hình thành đường biên của
vùng khép kín theo hệ trục tọa độ nào đó. Mỗi đa giác được lưu trữ như một đặc
trưng độc lập, do vậy không thể biết được đối tượng kề của một đối tượng địa lý.
Như vậy quan hệ topo (thể hiện mối quan hệ không gian giữa các đối tượng địa
lý như quan hệ kề nhau, bao hàm nhau, giao cắt nhau…) không thể hiện được
trong cấu trúc dữ liệu này. Nhược điểm của cấu trúc dữ liệu này là một số đường
biên chung giữa hai đa giác kề nhau sẽ được lưu hai lần, và như vậy, việc cập
nhật, sửa đổi dữ liệu thường gặp nhiều khó khăn.
- Cấu trúc dữ liệu cung nút:

Cấu trúc dữ liệu cung nút mô tả các thực thể địa lý dưới dạng các điểm (nút)
và các đường (cung). Như vậy, có thể biểu diễn được quan hệ topo giữa các đối
tượng địa lý. Trong cấu trúc dữ liệu này, các phần đối tượng không gian kề nhau
sẽ được lưu trữ một lần, ngoài ra, các đối tượng lân cận của một đối tượng địa lý
cũng được chỉ rõ, điều này giúp dễ dàng thực hiện các phép phân tích khơng gian,
đồng thời cũng tối ưu được dung lượng lưu trữ dữ liệu.
- Cấu trúc dữ liệu dạng cây:


16
Trong một số mơ hình dữ liệu như mơ hình raster, dữ liệu có thể được phân
hoạch thành các đối tượng nhỏ hơn với nhiều mức khác nhau để giảm thiểu dung
lượng lưu trữ và tăng tốc độ truy vấn. Ví dụ cấu trúc cây tứ phân chia một vùng
dữ liệu làm 4 phần, trong mỗi phần này lại có thể được chia tiếp thành 4 phần con.
 Mơ hình dữ liệu vật lý
Dữ liệu địa lý cần được lưu trữ vật lý trên máy tính theo một cách thức nhất
định, tùy theo các hệ thống thông tin địa lý cụ thể mà cách thức lưu trữ, cài đặt dữ
liệu khác nhau. Mơ hình dữ liệu vật lý thường khá khác nhau đối với từng hệ
thống GIS cụ thể. Một số hệ GIS thương mại có thể kể đến như: Arc/Info, ERDAS,
Geovision, Grass, Caris, DBMS based, Ingres, Oracle, Postgres…có các cách
thức lưu trữ vật lý dữ liệu khác nhau, đồng thời cũng chia sẻ một vài khuôn dạng
dữ liệu chung để có thể dễ dàng trao đổi.
Như vậy, từ một thực thể địa lý, thơng qua 3 mức mơ hình biểu diễn mà
được cụ thể hóa thành dữ liệu trên máy tính và có thể có dạng thể hiện khác nhau
đối với từng hệ GIS cụ thể. Mỗi hệ thông tin địa lý đều sử dụng mơ hình dữ liệu
quan niệm riêng để biểu diễn mơ hình dữ liệu vật lý duy nhất. Hệ thông tin địa lý
cung cấp các phương pháp để người sử dụng làm theo các mô hình quan niệm
tương tự ba lớp mơ hình mơ tả trên.
Hai nhóm mơ hình dữ liệu khơng gian thường gặp trong các hệ GIS thương
mại là mơ hình dữ liệu vector và mơ hình dữ liệu raster.

- Mơ hình vector:
Mơ hình vector sử dụng tọa độ 2 chiều (x, y) để lưu trữ hình khối của các
thực thể khơng gian trên bản đồ 2D. Mơ hình này sử dụng các đặc tính rời rạc như
điểm, đường, vùng để mơ tả không gian, đồng thời cấu trúc topo của các đối tượng
cũng cần được mơ tả chính xác và lưu trữ trong hệ thống.
Các đối tượng không gian được lưu trữ dưới dạng vertor, đồng thời các thuộc
tính liên quan đến lĩnh vực cần quản lý (dữ liệu chuyên đề - thematic data) của
đối tượng đó cũng cần kết hợp với dữ liệu trên. Các nhân tố chỉ ra sự tác động qua


17
lại lẫn nhau giữa các đối tượng cũng được quản lý, các nhân tố đó có thể là quan
hệ topo (giao/ không giao nhau, phủ, tiếp xúc, bằng nhau, chứa, …), khoảng cách
và hướng (láng giềng về hướng nào).
- Mô hình raster:
Mơ hình raster hay cịn gọi mơ hình dạng ảnh (image) biểu diễn các đặc tính
dữ liệu bởi ma trận các ô (cell) trong không gian liên tục. Mỗi ơ có chỉ số tọa độ
(coordinate) và các thuộc tính liên quan. Mỗi vùng được chia thành các hàng và
cột, mỗi ơ có thể là hình vng hoặc hình chữ nhật và chỉ có duy nhất một giá trị.

Hình 1.6. Biểu diễn thế giới bằng mơ hình raster
Trên thực tế, chọn kiểu mơ hình nào để biểu diễn bản đồ là câu hỏi luôn đặt
ra với người sử dụng. Việc lưu trữ kiểu đối tượng nào sẽ quyết định mô hình sử
dụng. Ví dụ nếu lưu vị trí của các khách hàng, các trạm rút tiền hoặc dữ liệu cần
tổng hợp theo từng vùng như vùng theo mã bưu điện, các hồ chứa nước, … thì sử
dụng mơ hình vector. Nếu đối tượng quản lý được phân loại liên tục như loại đất,
mức nước hay độ cao của núi, … thì thường dùng mơ hình raster. Đồng thời, nếu
dữ liệu thu thập từ các nguồn khác nhau được dùng một mơ hình nào đó thì có thể
chuyển đổi từ mơ hình này sang mơ hình khác để phục vụ tốt cho việc xử lý của
người dùng.

Mỗi mơ hình có ưu điểm và nhược điểm khác nhau. Về mặt lưu trữ, việc lưu
trữ giá trị của tất cả các ô/điểm ảnh trong mơ hình raster địi hỏi khơng gian nhớ
lớn hơn so với việc chỉ lưu các giá trị khi cần trong mơ hình vector. Cấu trúc dữ


×