ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG
LÊ THỊ OANH
NGHIÊN CỨU PHÁT TRIỂN HỆ THỐNG QUẢN LÝ
TÀI NGUYÊN NƢỚC NGẦM BẰNG CÔNG NGHỆ GIS
VÀ ỨNG DỤNG TẠI TỈNH BẮC NINH
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
THÁI NGUYÊN - 2017
ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG
LÊ THỊ OANH
NGHIÊN CỨU PHÁT TRIỂN HỆ THỐNG QUẢN LÝ
TÀI NGUYÊN NƢỚC NGẦM BẰNG CÔNG NGHỆ GIS
VÀ ỨNG DỤNG TẠI TỈNH BẮC NINH
Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01.01
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Ngƣời hƣớng dẫn khoa học: 1.TS. TRƢƠNG HÀ HẢI
2.TS. HOÀNG THANH VÂN
THÁI NGUYÊN - 2017
i
LỜI CAM ĐOAN
Tên tôi là: Lê Thị Oanh
Sinh ngày: 18/02/1990.
Học viên lớp cao học CK13B - Trƣờng Đại học Công nghệ Thông tin &
Truyền thông - Đại học Thái Nguyên.
Hiện đang công tác tại: Trƣờng Đại học Y Dƣợc Thái Nguyên
Xin cam đoan: Đề tài “Nghiên cứu phát triển hệ thống quản lý tài
nguyên nƣớc ngầm bằng công nghệ GIS và ứng dụng tại tỉnh Bắc Ninh” do
TS. Trƣơng Hà Hải và TS. Hoàng Thanh Vân hƣớng dẫn là công trình nghiên
cứu của riêng tôi. Tất cả tài liệu tham khảo đều có nguồn gốc, xuất xứ rõ ràng.
Tác giả xin cam đoan tất cả những nội dung trong luận văn đúng nhƣ nội
dung trong đề cƣơng và yêu cầu của cô giáo hƣớng dẫn. Nếu sai tôi hoàn toàn chịu
trách nhiệm trƣớc hội đồng khoa học và trƣớc pháp luật.
Thái Nguyên, ngày 15 tháng 05 năm 2017
Tác giả luận văn
Lê Thị Oanh
ii
LỜI CẢM ƠN
Sau một thời gian nghiên cứu và làm việc nghiêm túc, đƣợc sự động viên,
giúp đỡ và hƣớng dẫn tận tình của Cô giáo hƣớng dẫn TS. Trƣơng Hà Hải và cô
giáo TS. Hoàng Thanh Vân, luận văn với Đề tài “Nghiên cứu phát triển hệ thống
quản lý tài nguyên nƣớc ngầm bằng công nghệ GIS và ứng dụng tại tỉnh Bắc
Ninh”.
Tôi xin bày tỏ lòng biết ơn sâu sắc đến:
Cô giáo hƣớng dẫn TS. Trƣơng Hà Hải và cô giáo TS. Hoàng Thanh Vân
đã tận tình chỉ dẫn, giúp đỡ tôi hoàn thành luận văn này.
Khoa Sau đại học Trƣờng Đại học Công nghệ Thông tin và Truyền thông đã
giúp đỡ tôi trong quá trình học tập cũng nhƣ thực hiện luận văn.
Trƣờng Đại học Y Dƣợc Thái nguyên nơi tôi công tác đã tạo điều kiện tối đa
cho tôi thực hiện khóa học này.
Trung tâm Quan trắc tài nguyên và môi trƣờng, Sở Tài nguyên và Môi
trƣờng tỉnh Bắc Ninh.
Tôi xin chân thành cảm ơn gia đình, bạn bè và các anh chị đồng nghiệp đã
động viên, khích lệ, tạo điều kiện giúp đỡ tôi trong suốt quá trình học tập, thực hiện
và hoàn thành luận văn này.
Thái Nguyên, ngày 15 tháng 05 năm 2017
Tác giả luận văn
Lê Thị Oanh
iii
MỤC LỤC
LỜI CAM ĐOAN ....................................................................................................... i
LỜI CẢM ƠN ............................................................................................................ ii
MỤC LỤC ................................................................................................................. iii
DANH MỤC HÌNH ẢNH ........................................................................................ iv
DANH MỤC BẢNG BIỂU ........................................................................................v
DANH MỤC CÁC TỪ VIẾT TẮT .......................................................................... vi
MỞ ĐẦU .....................................................................................................................1
CHƢƠNG 1: TỔNG QUAN VỀ GIS VÀ ỨNG DỤNG............................................3
1.1. Lý thuyết cơ bản về hệ thống thông tin địa lý (GIS)[2][4] ..............................3
1.1.1. Định nghĩa [2] ............................................................................................4
1.1.2. Chức năng của GIS ....................................................................................7
1.1.3. Mô hình dữ liệu không gian[2][3][4] ......................................................10
1.1.4. Tìm kiếm và phân tích dữ liệu không gian...............................................12
1.1.5. Hiển thị bản đồ[4].....................................................................................20
1.2. Khả năng ứng dụng của GIS[2][6] .................................................................25
1.3. Giới thiệu bài toán quản lý tài nguyên nƣớc ngầm.........................................28
1.4. Khả năng quản lý nƣớc ngầm bằng công nghệ GIS .......................................29
1.5. Kết luận chƣơng 1 ...........................................................................................30
CHƢƠNG II: CÁC KỸ THUẬT ỨNG DỤNG XÂY DỰNG HỆ THỐNG QUẢN
LÝ TÀI NGUYÊN NƢỚC NGẦM ..........................................................................31
2.1. Các thuật toán nội suy đánh giá chất lƣợng nƣớc[4][8][9][13] ......................31
2.1.1.Thuật toán nội suy Inverse Distance Weighting (IDW)............................31
2.1.2. Thuật toán nội suy Spline .........................................................................33
2.1.3. Thuật toán nội suy Kriging .......................................................................34
2.1.4. Nhận xét chung về 3 thuật toán ................................................................37
2.2. Đánh giá độ chính xác của thuật toán nội suy[7] ...........................................37
2.3. Các phần mềm hỗ trợ phát triển hệ thống.......................................................38
2.3.1. Phần mềm ArcGIS[4] ..............................................................................38
2.3.2. Phần mềm Matlab R2015a.......................................................................41
2.4. Kết luận chƣơng 2 ..........................................................................................41
CHƢƠNG 3. XÂY DỰNG THỬ NGHIỆM BÀI TOÁN QUẢN LÝ NƢỚC NGẦM
TẠI TỈNH BẮC NINH .............................................................................................42
3.1. Giới thiệu bài toán quản lý tài nguyên nƣớc ngầm tỉnh Bắc Ninh .................42
3.2. Nhiệm vụ quản lý tài nguyên nƣớc ngầm .......................................................43
3.3. Thu thập dữ liệu thử nghiệm...........................................................................45
3.4. Xây dựng chƣơng trình[10][11][12][13][14].......................................................53
3.4.1. Xây dựng các mô hình bản đồ ..................................................................53
3.4.2. Các chức năng chính của chƣơng trình: ...................................................55
KẾT LUẬN VÀ KIẾN NGHỊ...................................................................................62
TÀI LIỆU THAM KHẢO
iv
DANH MỤC HÌNH ẢNH
Hình 1.1. Các thành phần của GIS ............................................................................. 6
Hình 1.2. Chức năng của GIS ....................................................................................7
Hình 1.3. Xử lý dữ liệu thô ........................................................................................8
Hình 1.4. Lƣu trữ và truy vấn dữ liệu không gian .....................................................9
Hình 1.5. Định dạng dữ liệu Vector và Raster ..........................................................12
Hình 1.6. Ví dụ về Buffer .........................................................................................13
Hình 1.7. Buffer bên trong một hình có bán kính xác định ......................................14
Hình 1.8. Kết quả tìm kiếm theo địa chỉ ...................................................................16
Hình 1.9. Kết quả tìm kiếm trên mạng giao thông ....................................................17
Hình 1.10. Phép hợp ..................................................................................................18
Hình 1.11. Phép giao .................................................................................................18
Hình 1.12. Phép đồng nhất ........................................................................................19
Hình 1.13. Hiển thị lớp dữ liệu với một ký hiệu ......................................................20
Hình 1.14. Hiển thị lớp dữ liệu giao thông theo loại đƣờng .................................... 21
Hình 1.15. Hiển thị lớp dữ liệu phƣờng xã theo tên phƣờng ...................................22
Hình 1.16. Hiển thị số lƣợng dân số theo giải màu ..................................................23
Hình 1.17. Hiển thị số lƣợng dân số theo kích thƣớc ký hiệu ................................. 23
Hình 1.18. Hiển thị dân số theo mật độ ................................................................... 24
Hình 1.19. Hiển thị biểu đồ các độ tuổi dân số khác nhau theo biểu đồ hình tròn ..24
Hình 1.20. Hiển thị dữ liệu dân số và phƣờng xã ....................................................25
Hình 2.1. Phƣơng thức nội suy theo IDW ................................................................32
Hình 2.2. Phƣơng thức nội suy theo Spline .............................................................34
Hình 2.3. Phƣơng thức nội suy theo Kriging ...........................................................35
Hình 2.4. Mô tả các giá trị của Kriging ...................................................................36
Hình 2.5. Phần mềm ArcGIS ................................................................................... 39
Hình 3.1. Bản đồ hành chính tỉnh Bắc Ninh ............................................................45
Hình 3.2. Bản đồ sông ngòi tỉnh Bắc Ninh ..............................................................46
Hình 3.3. Lớp bản đồ hành chính tỉnh Bắc Ninh .....................................................53
Hình 3.4. Lớp bản đồ tên hành chính các huyện tỉnh Bắc Ninh ...............................53
Hình 3.5. Table tọa độ vị trí của các điểm quan trắc ............................................... 54
Hình 3.6. Bản đồ hiển thị các điểm quan trắc tỉnh bắc Ninh ...................................54
Hình 3.7. Cập nhật bảng chỉ số đánh giá chất lƣợng nƣớc ...................................... 55
Hình 3.8. Bản đồ chuyên đề nội suy nồng độ Fe sử dụng thuật toán nội suy IDW,
hiển thị kiểu phân lớp (Classify) ..............................................................................56
Hình 3.9. Bản đồ chuyên đề nội suy nồng độ Mn sử dụng thuật toán nội suy IDW,
hiển thị kiểu phân lớp (Classify) ..............................................................................57
Hình 3.10. Hiển thị dữ liệu thuộc tính trạm G11 .....................................................58
Hình 3.11. Hiển thị giá trị nội suy chất lƣợng Fe tại 1 điểm bất kỳ trong vùng ......58
Hình 3.12. Truy vấn tìm ra trạm quan trắc có chỉ số Fe không đạt chuẩn. ..............59
Hình 3.13. Bản đồ chồng phủ các lớp bản đồ raster về chất lƣợng nƣớc ................59
v
DANH MỤC BẢNG BIỂU
Bảng 1: Tọa độ các điểm quan trắc nƣớc ngầm .......................................................................................46
Bảng 2: Dữ liệu quan trắc mực nƣớc tại các điểm quan trắc năm 2014(G1-G10)...............................47
Bảng 3: Dữ liệu quan trắc mực nƣớc tại các điểm quan trắc năm 2014(G11-G20).............................48
Bảng 4: Kết quả-hiện trạng phân tích chất lƣợng môi trƣờng nƣớc ngầm Đợt 1-2014(G1-G5) ........48
Bảng 5: Kết quả-hiện trạng phân tích chất lƣợng môi trƣờng nƣớc ngầm Đợt 1-2014(G6-G10) ......49
Bảng 6: Kết quả-hiện trạng phân tích chất lƣợng môi trƣờng nƣớc ngầm Đợt 1-2014(G11-G15)....49
Bảng 7: Kết quả-hiện trạng phân tích chất lƣợng môi trƣờng nƣớc ngầm Đợt 1-2014(G16-G20)....50
Bảng 8: Kết quả-hiện trạng phân tích chất lƣợng môi trƣờng nƣớc ngầm Đợt 2-2014(G1-G5) ........50
Bảng 9: Kết quả-hiện trạng phân tích chất lƣợng môi trƣờng nƣớc ngầm Đợt 2-2014(G6-G10) ......51
Bảng 10: Kết quả-hiện trạng phân tích chất lƣợng môi trƣờng nƣớc ngầm Đợt 2-2014(G11-G15) .51
Bảng 11: Kết quả-hiện trạng phân tích chất lƣợng môi trƣờng nƣớc ngầm Đợt 2-2014(G15-G20) .52
Bảng 12: Giá trị giới hạn chất lƣợng nƣớc theo QCVN 09:2008/BTNMT ..........................................52
vi
DANH MỤC CÁC TỪ VIẾT TẮT
Từ hoặc
Từ tiếng Anh
cụm từ
Cơ sở dữ liệu
CSDL
ESRI
CGIS
GIS
PMIS
LIS
ILWIS
DBMS
TIN
IDW
QCVN
Từ tiếng Việt
Environmental Systems
Viện nghiên cứu hệ thống môi
Research Institute
trƣờng
Canadian Geographic
Information System
Hệ thông thông tin địa lý Canada
Geographic Information System Hệ thống thông tin địa lý
Port Management Information
System
Hệ thống thông tin quản lý Port
Land Information System
Hệ thống thông tin đất đai
Intergreted Land and Water
Hệ thống thông tin đất đai và thủy
Information System
văn tổng hợp
Database Management System
Hệ quản trị cơ sở dữ liệu
Triangulated Irregular
Mô hình tuyến tính trong không
Networks
gian 3 chiều
Inverse Distance Weighting
Nội suy khoảng cách nghịch đảo
có trọng số
Quy chuẩn Việt Nam
1
MỞ ĐẦU
Đối với một tỉnh có mật độ dân số cao và nhiều khu công nghiệp nhƣ tỉnh Bắc
Ninh thì việc quản lý tài nguyên, đặc biệt tài nguyên nƣớc là rất quan trọng. Nếu
không có sự quản lý chặt chẽ thì chất lƣợng nƣớc ngầm sẽ nhanh chóng bị suy giảm
và kéo theo đó là sự ô nhiễm của các môi trƣờng khác nhƣ môi trƣờng đất, hiện
tƣợng sụt lún đất. Trong những năm qua, việc quản lý tài nguyên nƣớc nói chung và
nƣớc ngầm nói riêng đã đƣợc tiến hành từ rất sớm. Công tác quản lý bao gồm quản
lý trữ lƣợng, chất lƣợng, dòng chảy ngầm, các hang chứa nƣớc ngầm. Với nhiều
thông số quản lý nhƣ vậy nên hàng năm các cơ quan quản lý phải xử lý một số
lƣợng lớn các hồ sơ và số liệu khác nhau cũng nhƣ gặp nhiều khó khăn trong việc
thu thập, xử lý, lƣu trữ và truy xuất thông tin đáp ứng nhu cầu của các nhà quản lý,
điều hành.
Bắc Ninh: Cần xây dựng dự án để thống kê toàn bộ công trình khai thác
sử dụng nƣớc trên toàn tỉnh để điều tra, đánh giá nhằm nắm rõ đƣợc hiện
trạng sử dụng các công trình khai thác thuận tiện cho việc quản lý nhà nƣớc
trong lĩnh vực tài nguyên nƣớc. [5]
Việc xây dựng mạng lƣới quan trắc tài nguyên nƣớc về cả nƣớc mặt và nƣớc
ngầm là hết sức cần thiết với Bắc Ninh bởi qua kiểm tra, 10/10 đơn vị đƣợc thanh
tra đều có các hành vi chƣa tuân thủ theo các quy định của pháp luật về tài nguyên
nƣớc hiện hành, thể hiện chủ yếu ở các hành vi sau: Không thực hiện việc thông
báo tới cơ quan cấp phép về việc chuyển đổi tên doanh nghiệp (chiếm 10%); Không
có giấy phép xả nƣớc thải vào nguồn nƣớc (chiếm 10%); Đặc biệt, báo cáo kết luận
thanh tra cũng cho thấy, có tới 8/10 đơn vị (chiếm 80%) không thực hiện, thực hiện
không đầy đủ việc quan trắc, giám sát mực nƣớc, lƣu lƣợng, chất lƣợng trong quá
trình khai thác, sử dụng theo quy định của nội dung giấy phép và theo quy định tại
Điều 16 của Quy định ban hành kèm theo Quyết định số 15/2008/QĐ-BTNMT
ngày 31/12/2008 ; và chƣa thực hiện việc báo cáo định kỳ tình hình khai thác, sử
dụng nƣớc dƣới đất theo quy định là 6/10 đơn vị (chiếm 60%);…
Trong những năm gần đây, hệ thống thông tin địa lý GIS (viết tắt của
Geographic Information System) ngày càng có nhiều ứng dụng khác nhau trong
2
công tác quản lý tài nguyên nói chung và tài nguyên nƣớc nói riêng. Với các ƣu
điểm của GIS nhƣ: Tổng hợp hiệu quả nhiều tập hợp dữ liệu thành một cơ sở dữ
liệu kết hợp; lƣu trữ dễ, lâu dài, sao chép nhanh; trích xuất, truy cập bản đồ dễ dàng;
dễ dàng cập nhật, chỉnh sửa thông tin, in ấn nhanh; tạo ra những giá trị mới (bản đồ
chuyên đề); có thể tích hợp với viễn thám, cơ sở dữ liệu, công cụ mô hình.
Với sự hợp tác của Trƣờng Đại học Công nghệ thông tin và Truyền thông Đại học Thái Nguyên và Trung tâm GIS.FCU của Trƣờng Đại học Phùng Giáp Đài Loan. Đƣợc sự đồng ý của TS. Trƣơng Hà Hải và TS. Hoàng Thanh Vân, em
chọn đề tài: “Nghiên cứu phát triển hệ thống quản lý tài nguyên nƣớc ngầm
bằng công nghệ GIS và ứng dụng tại tỉnh Bắc Ninh”.
Nhiệm vụ nghiên cứu của đề tài là nghiên cứu triển khai ứng dụng công nghệ
GIS trong bài toán xây dựng hệ thống quản lý, xử lý, lƣu trữ kết xuất thông tin trên
mô hình dữ liệu không gian, dữ liệu thuộc tính phục vụ công tác quản lý.
Đối tƣợng nghiên cứu của đề tài là GIS và ứng dụng GIS trong các bài toán
quản lý tài nguyên nƣớc ngầm.
Phạm vi nghiên cứu của đề tài đƣợc giới hạn trong dữ liệu không gian là các
các điểm quan trắc nƣớc ngầm, cùng với các chỉ số quan trắc đánh giá chất lƣợng
nƣớc trong năm 2014 trên địa bàn tỉnh Bắc Ninh. Với chƣơng trình thử nghiệm
đƣợc cài đặt cho phép: Tổng hợp, xử lý, trình diễn, truy vấn dữ liệu; đánh giá về tài
nguyên nƣớc ngầm tỉnh Bắc Ninh.
Mục tiêu của đề tài:
- Nghiên cứu về GIS
- Khả năng ứng dụng của GIS trong quản lý tài nguyên nƣớc ngầm.
- Ứng dụng GIS và phƣơng pháp nội suy để biểu diễn mức độ ô nhiễm nƣớc
ngầm trong khu vực tỉnh Bắc Ninh.
3
CHƢƠNG 1: TỔNG QUAN VỀ GIS VÀ ỨNG DỤNG
1.1. Lý thuyết cơ bản về hệ thống thông tin địa lý (GIS)[2]
Hệ thống thông tin địa lý còn gọi là GIS (viết tắt của Geographic Information
Systems) ra đời trên cơ sở sự phát triển của khoa học máy tính (Computer Science).
Ngày nay GIS đƣợc ứng dụng trong nhiều ngành khoa học có liên quan đến dữ liệu
không gian, từ ngành khoa học tự nhiên đến những ngành khoa học xã hội. Sự phát
triển nhanh chóng và những ứng dụng mang tính đột phá trong nhiều lĩnh vực của
GIS hiện là mối quan tâm của nhiều quốc gia, nhiều ngành và nhiều ngƣời trên toàn
thế giới. Việc áp dụng ngày càng phong phú đã tạo ra các tiền đề cơ bản và những
điều kiện thuận lợi cho sự ra đời một ngành mới: Ngành khoa học thông tin địa lý
(Geographic Information Science). Ở đây, GIS đƣợc xác lập nhƣ một ngành khoa
học liên ngành đƣợc ứng dụng trong nhiều lĩnh vực khác nhau.
Nguồn gốc của GIS là việc tạo các bản đồ chuyên đề, các nhà quy hoạch sử
dụng phƣơng pháp chồng xếp bản đồ (overlay), phƣơng pháp này đƣợc mô tả một
cách có hệ thống lần đầu tiên bởi ông Jacqueline Tyrwhitt trong quyển sổ tay quy
hoạch vào năm 1950, kỹ thuật này còn đƣợc sử dụng trong việc tìm kiếm vị trí thích
hợp cho các công trình đƣợc quy hoạch. Việc sử dụng máy tính trong vẽ bản đồ
cũng bắt đầu vào cuối thập niên 50, từ đây khái niệm về GIS ra đời nhƣng chỉ đến
những năm 80 thì GIS mới có thể phát huy hết khả năng của mình do sự phát triển
mạnh mẽ của công nghệ phần cứng. Hệ thống thông tin địa lý đầu tiên của thế giới
đƣợc xây dựng vào đầu những năm 60 (1964) tại Canada với tên gọi là CGIS
(Canadian Geographic Information System). Giai đoạn đầu những năm 60, các hệ
GIS phục vụ chủ yếu cho công tác điều tra, quản lý tài nguyên thiên nhiên thì giữa
những năm 60, các hệ GIS phục vụ cho công tác khai thác và quản lý đô thị. Sự ra
đời và phát triển các hệ GIS trong những năm 60 đã đƣợc quốc tế chấp nhận và
đánh giá cao. Vì vậy, năm 1968 Hội địa lý quốc tế đã quyết định thành lập Uỷ ban
thu nhận và xử lý dữ liệu Địa lý (Commission on Geographical Data Sensing and
Processing) nhằm mục đích phổ biến kiến thức về lĩnh vực này trong những năm
tiếp theo. Trong những năm 70, với các tiến bộ trong công nghệ chế tạo máy tính đã
4
làm tăng khả năng hoạt động của các hệ GIS và hậu thuẫn cho việc nghiên cứu,
thiết kế và thƣơng mại hoá các phần mềm GIS. Đứng đầu trong lĩnh vực thƣơng
mại là các công ty: ESRI, Synercom, Intergraph, Calma, Computervision. Cũng thời
gian này đã xuất hiện một tình trạng mà R.F.Tomlinson (1991) gọi là loạn khuôn
dạng (digital chaos), đòi hỏi trong những năm sau này phải nghiên cứu khả năng
giao diện, trao đổi khuôn dạng thông qua một số khuôn dạng chuẩn và đƣợc chấp
nhận rộng rãi nhất. Những năm 80 đƣợc đánh dấu bởi các nhu cầu ngày càng cao về
điều tra, khai thác, quản lý tài nguyên cùng việc bảo vệ môi trƣờng v.v...với các quy
mô lãnh thổ khác nhau. Ngoài việc vẫn tiếp tục nghiên cứu giải quyết một số vấn đề
còn tồn tại từ những năm trƣớc đây, một hƣớng đƣợc phát triển tƣơng đối mạnh, đó
là xây dựng các hệ GIS chuyên dụng cho một số lĩnh vực quan trọng trong sử dụng,
quản lý tài nguyên, môi trƣờng: LIS (Land Information System), LRIS (Land
Resource Information System), PMIS (Port Management Information System),
ILWIS (Intergreted Land and Water Information System). Nhìn chung đây là một
thời kỳ bùng nổ các ứng dụng của GIS.
Trong khung cảnh hiện tại, thế giới đã biết đến ít nhất vài trăm phần mềm
GIS đƣợc thƣơng mại hoá, giá giao động từ vài trăm đến vài trăm ngàn đô la Mỹ.
Với sự tích luỹ về dữ liệu thông qua các ứng dụng riêng lẻ trong từng chuyên ngành
đã vƣợt quá khả năng quản lý của các hệ GIS riêng lẻ.
Một đặc điểm khác của sự phát triển ứng dụng trong giai đoạn hiện nay là sự
gia tăng sử dụng thông tin viễn thám nhƣ một đầu vào thông tin quan trọng của các
hệ GIS. Rất nhiều nỗ lực đã đƣợc giành cho nghiên cứu các phƣơng pháp tích hợp
thông tin ảnh viễn thám với các thông tin bản đồ trên GIS. Các ứng dụng GIS trong
quản lý tài nguyên tự nhiên trên thế giới rất đa đạng và phong phú.
1.1.1. Định nghĩa [2]
Định nghĩa GIS:
GIS là một trƣờng hợp đặc biệt của hệ thống thông tin ở đó cơ sở dữ liệu bao
gồm các quan sát trên đặc trƣng phân tán không gian, các hoạt động hoặc sự kiện
mà có thể định rõ trong không gian nhƣ điểm, đƣờng hoặc vùng. Một hệ thống
5
thông tin địa lý vận dụng dữ liệu về các điểm, đƣờng, vùng này để nhận dữ liệu
bằng cách hỏi đáp và phân tích đặc biệt. Có nhiều định nghĩa về GIS, tùy theo cách
tiệm cận:
- Hệ thống thông tin địa lý (GIS) là một hệ thống thông tin có khả năng mã
hóa, lƣu trữ, chuyển đổi, phân tích và hiển thị thông tin không gian địa lý
()
- Hệ thống thông tin địa lý (GIS) là một hệ thống nhập liệu, lƣu trữ, thao tác
và trích xuất thông tin địa lý (NCGIA Core Curriculum in Geographic Information
Science)
- Hệ thống thông tin địa lý (GIS) là một hệ thống phần mềm máy tính,
phần cứng, dữ liệu, và nhân viên để giúp thao tác, phân tích và trình bày thông tin
cùng với không gian vị trí ()
Khái quát từ các định nghĩa GIS: GIS là hệ thống thông tin trên cơ sở máy
tính với 04 khả năng chủ yếu nhƣ sau đây:
- Thu thập và tiền xử lý dữ liệu tham chiếu địa lý, bao gồm dữ liệu từ bản
đồ giấy, dữ liệu vệ tinh, điều tra hay từ các nguồn khác.
- Quản lý dữ liệu, bao gồm lƣu trữ và bảo trì trong CSDL.
- Biến đổi, phân tích, mô hình hóa dữ liệu không gian và dữ liệu thuộc tính
liên quan bằng các công cụ phần mềm.
- Trình diễn dữ liệu dƣới dạng báo cáo, bản đồ chuyên đề, biểu đồ ….
Các thành phần của GIS
Xét từ góc độ hệ thống, GIS gồm các hợp phần: Phần cứng, phần mềm, cơ sở
dữ liệu và cơ sở tri thức chuyên gia.
Phần cứng là tất cả những gì mà một hệ thống có thể vận hành đƣợc.
Phần cứng bao hàm các máy tính (Server/workstation), thiết bị lƣu trữ, máy in,
máy quét, máy vẽ, các thiết bị truyền thông...
6
Phần mềm bao gồm hai loại: phần mềm hệ thống và phần mềm ứng
dụng, hiện nay trên thị trƣờng tồn tại nhiều hệ mềm khác nhau trong lĩnh vực
GIS nhƣ: ArcInfo, Mapinfo, GeoMedia, GeoConcept, CardCorp,... Mỗi phần
mềm này đều đƣợc trang bị các công cụ hữu hiệu để thực hiện các chức năng
của GIS .
Cơ sở dữ liệu là nơi tổ chức và lƣu trữ dữ liệu (cả dữ liệu không gian và
dữ liệu thuộc tính) nhằm cung cấp một cách hiệu quả các thông tin từ nó cho
các truy vấn từ phía ngƣời sử dụng. Việc tổ chức và xây dựng cơ sở dữ liệu đòi
hỏi sự thống nhất cao từ khâu thiết kế đến các ứng dụng thực tế và tuân thủ
các chuẩn trong việc tổ chức và xây dựng cơ sở dữ liệu.
Hình 1.1. Các thành phần của GIS
Cơ sở tri thức chuyên gia là tập hợp các tri thức của lãnh đạo, nhà
quản lý, các kiến thức chuyên ngành và kiến thức công nghệ thông tin. Tập
hợp các tri thức chuyên gia này sẽ quyết định mô hình ứng dụng của GIS, xác
định đƣợc các chức năng hỗ trợ quyết định của GIS, xác định đƣợc nội dung,
cấu trúc các hợp phần còn lại của hệ thống, các bƣớc và phƣơng thức cũng
nhƣ mức đầu tƣ xây dựng và vận hành hệ thống.
7
1.1.2. Chức năng của GIS
GIS có 5 nhóm chức năng cơ bản sau đây:
-
Thu thập dữ liệu
-
Xử lý sơ bộ dữ liệu
-
Lƣu trữ và truy vấn dữ liệu
-
Tìm kiếm và phân tích không gian
-
Hiển thị đồ họa và tƣơng tác
Hình 1.2. Chức năng của GIS
Thu thập và nhập (capture/input) dữ liệu:
-
Nhập dữ liệu từ bản đồ giấy, từ ảnh vệ tinh hay nhập trực tiếp các tọa
độ đối tƣợng
-
Chuyển đổi khuôn mẫu từ nguồn dữ liệu khác
-
Soạn thảo trong GIS nhằm sửa lỗi hay bổ sung đặc trƣng
-
Đặt tên cho các đặc trƣng để hệ thống có thể nhận danh
Xử lý dữ liệu thô
-
Tạo lập cấu trúc topo cho dữ liệu
8
-
Phân lớp ảnh viễn thám
-
Raster hóa nếu cần
-
Véctơ hóa nếu cần
-
Nội suy lƣới tế bào
-
Tam giác hóa
-
Tái phân lớp
-
Biến đổi chiếu bản đồ
Hình 1.3: Xử lý dữ liệu thô
Lƣu trữ và truy vấn dữ liệu không gian:
-
Liên kết dữ liệu thuộc tính với các đối tƣợng không gian
9
-
Liên kết với CSDL ngoài
-
Cập nhật các đặc trƣng trong CSDL
-
Nhập và xuất dữ liệu với GIS hay DBMS khác
-
Tổ hợp các tờ bản đồ để tạo lập CSDL lớn hơn, khớp các cạnh của các tờ bản
đồ láng giềng
Hình 1.4: Lưu trữ và truy vấn dữ liệu không gian
Truy vấn và phân tích dữ liệu
- Query
Chọn các đặc trƣng theo các thuộc tinh: “Hãy tìm các tỉnh có tỷ lệ đỗ tốt
nghiệp phổ thông > 90%”
Chọn các đặc trƣng theo quan hệ địa lý: “Hãy tìm các trƣờng học đạt
chuẩn Quốc gia trong Tỉnh A”
Truy vấn tổ hợp thuộc tính/địa lý: “Hãy tìm tất cả các xã trong vòng 10
km từ bệnh viện tỉnh mà có số trẻ con tử vong cao”
10
- Buffering: tìm mọi khu dân cƣ trong vòng 10 km từ bệnh viện
- Point-in-polygon: tìm ra các làng trong đó có thảm thực vật
- Polygon overlay: tổ hợp các bản ghi hành chính với dữ liệu y tế của huyện
Geocoding/address matching: khớp danh sách địa chỉ với bản đồ đƣờng
phố
- Network : tìm con đƣờng ngắn nhất từ làng tới bệnh viện
Mô hình hóa: nhận biết hay dự đoán tiến trình đƣợc hình thành hay sẽ hình
thành mẫu (pattern)
- Diffusion: tình hình dịch tả đang lan truyền trong tỉnh nhƣ thế nào?
- Interaction: dân di cƣ đến đâu?
- What-if scenarios: nếu xây dựng đập nƣớc ở đây thì có bao nhiêu dân phải di cƣ?
Hiển thị và xuất dữ liệu:
-
Thăm dò (Exploratory)
hiển thị mẫu và và nhận biết các dị thƣờng
So sánh thông tin trong không gian bản đồ và không gian dữ liệu
-
Xây dựng bản đồ (Cartography)
-
Xuất dữ liệu bản đồ cho các hệ thống khác
1.1.3. Mô hình dữ liệu không gian[2][3][4]
ArcGIS lƣu trữ và quản lý dữ liệu địa lý ở nhiều khuôn dạng. Ba mô hình
dữ liệu cơ bản mà ArcGIS sử dụng là vector, raster, và TIN. Ngoài ra, ngƣời dùng
có thể nhập dữ liệu bảng vào GIS.
1.1.3.1. Mô hình Vector
Một cách để biểu diễn các hiện tƣợng địa lý là dùng points, lines, và
polygons. Cách biểu diễn thế giới nhƣ thế này đƣợc gọi là mô hình dữ liệu vector.
Mô hình vector đƣợc dùng chủ yếu để mô tả và lƣu trữ những đối tƣợng rời rạc nhƣ
nhà, đƣờng ống dẫn, đƣờng bao thửa...
Points là cặp tọa độ x,y. Lines là tập hợp của các tọa độ định nghĩa một hình
dạng. Polygons là tập hợp các tọa độ khai báo cho đƣờng bao của một vùng. Tọa độ
thông thƣờng là một cặp (x,y) hay bộ ba (x,y,z) với z và giá trị biểu diễn cho độ cao.
11
ArcGIS lƣu dữ liệu vector trong các lớp đối tƣợng (feature classes) và trong tập hợp
của các lớp đối tƣợng quan hệ topo. Các thuộc tính của đối tƣợng đƣợc lƣu trong
bảng. ArcGIS sử dụng 3 mô hình vector để biểu diễn dữ liệu đặc trƣng là:
coverages, shapefiles, và geodatabases.
1.1.3.2. Mô hình Raster
Trong raster model, thế giới đƣợc biểu diễn nhƣ một bề mặt đƣợc chia thành
những ô lƣới bằng nhau. Raster model đƣợc dùng để lƣu trữ và phân tích dữ liệu
liên tục trên một vùng nào đấy. Mỗi ô ảnh chứa một giá trị có thể biểu diễn cho một
giá trị đo đƣợc. Dữ liệu raster gồm các loại ảnh (ảnh hàng không, ảnh vệ tinh, ảnh
quét dùng để số hóa, làm nền) và grid (dùng để phân tích và lập mô hình).
Grid có thể đƣợc tạo từ dữ liệu vector. Grids có thể chứa các dữ liệu liên tục, nhƣ
một lớp bề mặt. Chúng có thể lƣu giữ các thông tin thuộc chủ đề và thuộc tính của
chủ đề. Ví dụ, ảnh grid về kiểu phân bố thực vật lƣu giữ số hiệu mã hóa cho từng
loại thực vật, tên loại thực vật... Kích thƣớc ô ảnh càng nhỏ, thì bản đồ có độ chính
xác càng cao và càng chi tiết. Tuy nhiên, sẽ làm tăng kích thƣớc file ảnh.
1.1.3.3. Mô hình TIN
Trong một mô hình mạng các tam giác bất thƣờng, thế giới đƣợc biểu diễn
dƣới dạng một mạng các tam giác kết nối với nhau qua các điểm với giá trị x, y, và
z. TINs là cách lƣu trữ và phân tích bề mặt rất hiệu quả. Cũng nhƣ ảnh rasters, có
thể bổ sung các tập dữ liệu TIN vào bản đồ trong ArcMap và quản lý chúng bằng
ArcCatalog.
Dữ liệu dạng bảng
Có thể xem GIS nhƣ là một CSDL hình học. Cũng giống nhƣ các CSDL khác,
ArcGIS cho phép kết nối các bảng dữ liệu với nhau.
1.1.3.4. Phân tích các yếu tố
Có hai phƣơng pháp chính để lƣu trữ thông tin bản đồ: GIS lƣu các đối
tƣợng bản đồ trong định dạng vector và trong định dạng raster.
Trong định dạng vector, các đối tƣợng bản đồ đƣợc biểu diễn bởi các đối
tƣợng hình học cơ bản point(điểm), line(đƣờng), polygon(vùng). Point dùng xác
12
định các đối tựợng không có hình dạng kích thƣớc cụ thể, hay có kích thƣớc quá
nhỏ so với tỷ lệ bản đồ. Line để xác định các đối tƣợng có chiều dài xác định.
Polygon để xác định các vùng, miền trên mặt đất. Trong định dạng này, thông tin
đƣợc mô tả có tính chính xác cao đồng thời tiết kiệm không gian lƣu trữ. Thông
tin lƣu trong định dạng vector chủ yếu đƣợc ứng dụng trong bài toán về mạng,
hệ thống thông tin đất đai.
Trong định dạng raster, các đối tƣợng bản đồ đƣợc biểu diễn trong một
chuỗi các điểm ảnh trong một lƣới hình chữ nhật. Mỗi điểm ảnh đƣợc xác định
thông qua chỉ số hàng và cột trong lƣới. Trong raster, point sẽ đƣợc biểu diễn bởi
một điểm ảnh đơn, line đƣợc biểu diễn bởi một chuỗi các điểm ảnh liên tiếp
nhau, và polygon xác định bởi một nhóm các điểm ảnh kề sát nhau. Dữ liệu đƣợc
lƣu trong định dạng này rất đơn giản nhƣng lại đòi hỏi dung lƣợng bộ nhớ lớn.
Raster phù hợp với các dạng dữ liệu có đƣờng biên không rõ ràng. Raster đƣợc
ứng dụng nhiều trong phân tích bề mặt liên tục.
Hình 1.5: Định dạng dữ liệu Vector và Raster.
1.1.4. Tìm kiếm và phân tích dữ liệu không gian
Tìm kiếm và phân tích dữ liệu không gian. Đây là chức năng đóng vai trò rất
quan trọng trong GIS. Nó tạo nên sức mạnh thực sự của GIS so với các phƣơngpháp
13
khác. Tìm kiếm và phân tích dữ liệu không gian giúp tìm ra những đối tƣợng đồ hoạ
theo các điều kiện đặt ra hay hỗ trợ việc ra quyết định của ngƣời dùng GIS.
Có rất nhiều các phƣơng pháp tìm kiếm và phân tích dữ liệu không gian, các
phƣơng pháp khác nhau thƣờng tạo ra các ứng dụng GIS khác nhau. Sau đây là một
số phƣơng pháp đƣợc dùng phổ biến nhất:
1.1.4.1. Buffer (Tìm kiếm dữ liệu trong vùng không gian)
Buffer hay còn gọi là truy vấn không gian trên cơ sở các quan hệ không gian
giữa các đối tƣợng. Các quan hệ này thông thƣờng nói lên vị trí tƣơng đối của đối
tƣợng này với đối tƣợng kia. Phƣơng pháp buffer đƣợc chia làm nhiều loại (phép
toán) khác nhau, nhƣng cách thức xử lý thì luôn tuân theo các bƣớc cơ bản sau đây:
-
Chọn ra một hay nhiều đối tƣợng trên bản đồ, gọi là các đối tƣợng gốc.
-
Áp dụng một quan hệ không gian để tìm ra các đối tƣợng khác mà có quan
hệ đặc biệt với các đối tƣợng gốc.
-
Hiển thị tập đối tƣợng tìm thấy cả trên dữ liệu không gian và thuộc tính
-
Hình 1.6: Ví dụ về Buffer
Một số phép toán buffer thông dụng
- Tìm các đối tƣợng nằm bên trong các đối tƣợng khác. Phép toán này xác
định quan hệ “bao kín” giữa các đối tƣợng không gian. Đƣờng thẳng bao gồm nhiều
điểm, một đa giác (polygon) có thể bao gồm nhiều đƣờng thẳng hoặc gồm các đa
giác con khác.
- Tìm các đối tƣợng cắt các đối tƣợng khác. Phép toán này xác định các đối
tƣợng có giao điểm hay nằm chồng lên các đối tƣợng khác. Hai đa giác giao nhau
nếu chúng có một miền chung. Hai đƣờng thẳng cắt nhau nếu chúng có một điểm
14
chung. Một đƣờng thẳng giao với một đa giác khi nó nằm một phần hay toàn bộ
trong đa giác.
- Tìm các đối tƣợng liền kề với các đối tƣợng khác. Đây là kiểu tìm kiếm trong
đó các đối tƣợng có chung đƣờng bao (biên). Quan hệ này chỉ áp dụng cho đƣờng
thẳng hoặc đa giác.
- Tìm các đối tƣợng nằm bên trong hoặc bên ngoài một khoảng cách xác định.
Kiểu tìm kiếm này đƣợc sử dụng trong việc xác định các đối tƣợng xung quanh một
hay nhiều các điểm mốc. Quá trình thực hiện bao gồm việc tạo ra một vùng đệm
quanh các điểm mốc này và sau đó xác định các đối tƣợng căn cứ vào vị trí của
chúng so với vùng đệm tạo ra.
Một bài toán rất điển hình cho phƣơng pháp buffer này là bài toán về “Nhà máy
hoá chất và các bệnh viện”. Mục đích của bài toán là xác định các vị trí thuận tiện
nhất trên bản đồ cho việc di dời các bệnh viện trong trƣờng hợp nhà máy hoá chất
gặp sự cố. Các nhà máy hoá chất và bệnh viện đƣợc biểu diễn trên bản đồ bằng các
đối tƣợng điểm (points). Mỗi nhà máy bao gồm các thông tin chi tiết về loại hoá
chất sản xuất và mức độ phát tán chất độc ra môi trƣờng trong các điều kiện thời tiết
khác nhau. Khi có sự cố, vùng nguy hiểm cần di dời sẽ đƣợc thể hiện trên bản đồ.
Từ đó, chúng ta có thể biết đƣợc nên chuyển bệnh viện đến vùng nào là an toàn và
thuận tiện nhất.
Hình 1.7: Buffer bên trong một hình có bán kính xác định.
15
1.1.4.2. Geocoding (Tìm kiếm theo địa chỉ).
Một đối tƣợng trên bản đồ bao giờ cũng đƣợc biểu diễn bằng một kiểu dữ
liệu đồ hoạ. Phần đồ hoạ này có thể thu đƣợc bằng cách số hoá hay quét ảnh bản đồ.
Tuy nhiên, khi ta đã có bản đồ (bản đồ số), chúng ta cũng có thể xác định đƣợc
phần đồ hoạ biểu diễn đối tƣợng hay là vị trí, hình dạng của đối tƣợng thông qua
các dữ liệu mô tả vị trí của nó ví dụ: số nhà, tên đƣờng, tên quận…
Geocoding (hay address matching) là một tiến trình nhằm xác định các đối
tƣợng trên cơ sở mô tả vị trí của chúng. Đây là một kỹ thuật rất nổi tiếng, có mặt
trong rất nhiều ứng dụng của GIS.
Ngƣời ta gọi một geocoding service là quá trình chuyển đổi toàn bộ mô tả
thuộc tính về vị trí sang mô tả không gian. Để tìm đƣợc vị trí thông qua địa chỉ,
geocoding service phải tham chiếu đến ít nhất một nguồn dữ liệu bao gồm cả thông
tin về địa chỉ (thuộc tính) và thông tin không gian (vị trí, hình dạng). Dữ liệu này
đƣợc gọi là dữ liệu tham chiếu. Các gocoding service có thể thao tác trên nhiều kiểu
dữ liệu tham chiếu khác nhau.
Sau khi đã geocoding dữ liệu tham chiếu (tức là ánh xạ mô tả thuộc tính vào
mô tả không gian). Ta có thể nhập địa chỉ của đối tƣợng cần tìm. Quy trình xử lý
trải qua các bƣớc sau:
- Chuẩn hoá giá trị địa chỉ vừa nhập vào bằng cách tách nó thành các thành
phần địa chỉ nhỏ.
-
Geocoding service sau đó sẽ tìm trong nguồn dữ liệu tham chiếu để xác định
các đối tƣợng có các thành phần địa chỉ tƣơng ứng với dữ liệu nhập vào.
Mỗi kiểu geocoding service sẽ quy định các định dạng của các thành phần
địa chỉ này.
- Tập kết quả trả về sẽ đƣợc gán các trọng số (điểm) để tìm ra kết quả gần
đúng nhất.
16
- Geocoding service sẽ đánh dấu đối tƣợng vừa đƣợc tìm thấy trên bản đồ bằng
một đối tƣợng đồ hoạ.
Hình 1.8: Kết quả tìm kiếm theo địa chỉ.
1.1.4.3 Network (phân tích mạng).
Networks là kỹ thuật đƣợc ứng dụng rất rộng rãi trong giao thông, phân
phối hàng hoá và dịch vụ, vận chuyển nƣớc hay xăng dầu trong các đƣờng ống
dài, trao đổi thông tin qua mạng viễn thông… Trong GIS, networks đƣợc mô hình
dƣới dạng các đồ thị một chiều hay mạng hình học. Mạng hình học này bao gồm
các đối tƣợng đang đƣợc hiển thị trên bản đồ, mỗi đối tƣợng đóng vai trò là cạnh
hoặc nút trong mạng.
Trong GIS để thiết lập nên mối quan hệ giữa nút - cạnh và cạnh - cạnh ta cần
tạo các topology cho cơ sở dữ liệu. Topology đƣợc hiểu là mối quan giữa các đối
tƣợng trong bảng dữ liệu. Quan hệ topology giữa các đối tƣợng gần giống quan hệ
giữa các bảng (relationship).
Chúng ta có hai kiểu liên kết là nút - cạnh và cạnh - cạnh. Nút - cạnh là luật
liên kết đƣợc thiết lập giữa một nút của đối tƣợng kiểu A với một cạnh của đối
tƣợng kiểu B. Cạnh - cạnh là luật liên kết giữa một cạnh của đối tƣợng kiểu A và
một cạnh của đối tƣợng kiểu B qua một tập các nút.
Khi đã tạo topology và xác lập luật liên kết, một mạng lôgic đã đƣợc hình thành.
Lúc này ta có thể áp dụng các thuật toán về mạng để giải quyết các bài toán đặt ra.
17
Hình 1.9: Kết quả tìm kiếm trên mạng giao thông.
1.1.4.4. Overlay ( phủ trùm hay xếp chồng bản đồ ).
Đây là kỹ thuật khó nhất và cũng là mạnh nhất của GIS. Overlay cho phép ta
tích hợp dữ liệu bản đồ từ hai nguồn dữ liệu khác nhau. Ngƣời ta định nghĩa:
“Overlay là quá trình chồng khít hai lớp dữ liệu bản đồ với nhau để tạo ra một lớp
bản đồ mới”. Điều này tƣơng tự nhƣ việc nhân hai ma trận để tạo ra một ma trận mới,
truy vấn hai bảng cơ sở dữ liệu để tạo ra bảng mới, với overlay là gộp hai lớp trên bản
đồ để tạo ra bản đồ mới. Overlay thực hiện điều này bằng cách kết hợp thông tin một
lớp này với một lớp khác để lấy ra dữ liệu thuộc tính từ một trong hai lớp.
Ngƣời ta chia overlay thành ba dạng phân tích khác nhau:
-
Point-in-polygon: chồng khít hai lớp point và polygon, đầu ra là lớp point
-
Line-in-polygon: chồng khít hai lớp line và polygon, đầu ra là lớp line
-
Polygon-in-polygon: chồng khít hai lớp polygon và polygon, đầu ra là lớp
polygon.
Một bài toán rất điển hình cho kỹ thuật này là bài toán về kiểm tra tình hình
ngập lụt của các thửa đất trong một vùng có thiên tai. Ở đây chúng ta thấy có hai
lớp: một lớp cho biết tình trạng lũ lụt trong vùng, một lớp thuộc về đất đai. Thông
thƣờng hai lớp này sẽ nằm trên hai bản đồ khác nhau vì mục đích sử dụng của
chúng khác nhau. Khi cần biết tình trạng ngập lụt của từng thửa đất, ngƣời ta tiến