Tải bản đầy đủ (.pdf) (75 trang)

Xây dựng công cụ kiểm tra cơ sở dữ liệu nền địa lý

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (5.67 MB, 75 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

LÊ TRÍ VIỄN

XÂY DỰNG CÔNG CỤ KIỂM TRA CƠ SỞ DỮ LIỆU NỀN ĐỊA LÝ

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

HÀ NỘI – 2015


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

LÊ TRÍ VIỄN

XÂY DỰNG CÔNG CỤ KIỂM TRA CƠ SỞ DỮ LIỆU NỀN ĐỊA LÝ

Ngành: Công nghệ thông tin
Chuyên ngành: Kỹ thuật Phần mềm
Mã số: 60 48 01 03

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

NGƯỜI HƯỚNG DẪN KHOA HỌC: TS. BÙI QUANG HƯNG

HÀ NỘI – 2015


i


LỜI CẢM ƠN
Lời đầu tiên tôi xin chân thành cảm ơn TS. Bùi Quang Hưng, người đã tận
tình hướng dẫn, giúp đỡ, động viên tôi trong suốt quá trình thực hiện luận văn.
Tôi xin chân thành cảm ơn các thầy cô giáo, các anh chị nghiên cứu sinh,
các học viên cao học, các em sinh viên và các bạn trong Trung tâm Công nghệ
tích hợp Liên ngành Giám sát hiện trường (FIMO) – Trường Đại học Công nghệ
(ĐHQGHN) đã giúp đỡ tôi rất nhiều trong quá trình thực hiện luận văn.
Tôi xin chân thành cảm ơn các thầy cô giáo khoa Công nghệ thông tin,
trường Đại học Công nghệ, Đại học Quốc gia Hà Nội, những người đã tận tình
truyền đạt kiến thức cũng như định hướng nghiên cứu trong suốt thời gian tôi
học tập và nghiên cứu tại trường.
Tôi xin gửi lời cảm ơn đến các bạn học viên k19 đã giúp đỡ tôi trong quá
trình học tập tại trường. Nhân đây cho phép tôi gửi lời cảm ơn đến các đồng
nghiệp của tôi trong công ty cổ phần công nghệ thông tin địa lý EK đã tạo điều
kiện trong quá trình học tập cũng như cung cấp tài liệu và kinh nghiệm trong
quá trình thực hiện luận văn này.
Hà Nội, tháng 10 năm 2015
Tác giả luận văn

Lê Trí viễn


ii

LỜI CAM ĐOAN
Tôi xin cam đoan luận văn “Xây dựng Công cụ kiểm tra cơ sở dữ liệu nền
địa lý” là công trình nghiên cứu của tôi dưới sự hướng dẫn khoa học của TS.Bùi
Quang Hưng, tham khảo các nguồn tài liệu đã chỉ rõ trong trích dẫn và danh
mục tài liệu tham khảo.
Hà Nội, tháng 10 năm 2015

Tác giả luận văn

Lê trí viễn


iii

MỤC LỤC
LỜI CẢM ƠN ............................................................................................. i
LỜI CAM ĐOAN....................................................................................... ii
MỤC LỤC ................................................................................................ iii
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT ................................. vi
DANH MỤC CÁC BẢNG ....................................................................... vii
DANH MỤC CÁC HÌNH VẼ ................................................................. viii
MỞ ĐẦU ................................................................................................... 1
Chương 1. GIỚI THIỆU ........................................................................... 4
1.1

Tổng quan về CSDL nền địa lý ..... Error! Bookmark not defined.

1.1.1 Khái niệm ................................ Error! Bookmark not defined.
1.1.2 Tầm quan trọng........................................................................ 4
1.1.3 Hiện trạng CSDL nền địa lý trên thế giới ................................. 4
1.1.4 Hiện trạng CSDL nền địa lý ở Việt Nam ................................. 5
1.2

Nhu cầu xây dựng công cụ kiểm tra CSDL nền địa lý ................... 6

1.2.1 Tích hợp dữ liệu vào hệ thống quản lý CSDL nền địa lý quốc
gia

6
1.2.2 Trong quá trình xây dựng, cập nhật CSDL nền địa lý .............. 6
1.2.3 Trong quá trình nghiệm thu CSDL nền địa lý .......................... 7
1.2.4 Chưa có công cụ, phầm mềm kiểm tra CSDL nền địa lý .......... 7
1.3

Kết quả đạt được ........................................................................... 7

Chương 2. TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU NỀN ĐỊA LÝ .............. 7
2.1

Giới thiệu về CSDL nền địa lý ...................................................... 7

2.2

Chuẩn dữ liệu nền địa lý ............................................................. 10

2.3

Quy định về nội dung và cấu trúc dữ liệu nền địa lý ................... 11

2.4

Quy định về chất lượng dữ liệu nền địa lý................................... 18

2.5

Hiện trạng CSDL nền địa lý ở Việt Nam..................................... 22

2.6


Các lỗi trong CSDL nền địa lý .................................................... 23

Chương 3. PHẦN MỀM ARCGIS DESKTOP CỦA ESRI VÀ LẬP
TRÌNH ARCOBJECT ...................................................................................... 25
3.1

Giới thiệu về Esri và phần mềm ArcGis Desktop ........................ 25


iv
3.2

Lập trình ArcObject trên ArcMap (ArcGis Desktop) .................. 29

Chương 4. XÂY DỰNG CÔNG CỤ KIỂM TRA CSDL NỀN ĐỊA LÝ
ĐA TỶ LỆ
29
4.1

Quy trình xây dựng, biên tập CSDL nền địa lý ở Việt Nam ........ 29

4.1.1 Quy trình giao nộp CSDL nền địa lý ...................................... 29
4.1.2 Quy trình xây dựng biên tập................................................... 30
4.2

Phân tích yêu cầu ........................................................................ 31

4.2.1 Lựa chọn công nghệ............................................................... 31
4.2.2 Tập hợp các phép kiểm tra ..................................................... 32

4.2.3 Bảng ánh xạ quy tắc đến đối tượng ........................................ 33
4.3

Thiết kế hệ thống ........................................................................ 50

4.3.1 Các chức năng của hệ thống................................................... 50
4.3.2 Thiết kế CSDL nghiệp vụ kiểm tra ........................................ 52
4.3.2.1 Mô hình thực thể liên kết ................................................ 52
4.3.2.2 Danh mục các bảng ......................................................... 52
4.4

Một số giao diện chương trình .................................................... 57

4.4.1 Giao diện các chức năng ........................................................ 57
4.4.2 Giao diện thiết lập cấu hình ................................................... 58
4.4.3 Giao diện quản trị cấu hình .................................................... 58
4.4.4 Giao diện lấy tiêu chí kiểm tra ............................................... 59
4.4.5 Giao diện kiểm tra ................................................................. 59
4.4.6 Giao diện sửa lỗi .................................................................... 60
4.4.7 Giao diện xuất báo cáo........................................................... 60
Chương 5. CÀI ĐẶT VÀ THỬ NGHIỆM.............................................. 60
5.1

Yêu cầu hệ thống ........................................................................ 60

5.1.1 Phần cứng .............................................................................. 60
5.1.2 Phần mềm .............................................................................. 61
5.2

Mô hình triển khai ...................................................................... 61


5.3

Thử nghiệm ................................................................................ 61

5.3.1 Dữ liệu thử nghiệm ................................................................ 61
5.3.2 Kiểm tra khả năng phát hiện lỗi ............................................. 61
5.3.3 Đánh giá khả năng mở rộng của công cụ ............................... 61


v
KẾT LUẬN .............................................................................................. 62
Kết quả đạt được .................................................................................. 62
Hướng phát triển tiếp theo .................................................................... 62
TÀI LIỆU THAM KHẢO ........................................................................ 62


vi

DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT
Thuật ngữ, khái niệm
Thuật ngữ, khái niệm
Đề tài
Các từ viết tắt
CSDL
NĐL
CSDL NĐL
GIS

GSDI

NSDI
SDK

Định nghĩa
Đề tài “Xây dựng công cụ kiểm tra cơ sở
dữ liệu nền địa lý”
Cơ sở dữ liệu
Nền địa lý
Cơ sở dữ liệu nền địa lý
Geographic information system – Hệ thống
thông tin địa lý
Global spatial data infrastructure – Hạ tầng
dữ liệu không gian toàn cầu
National spatial data infrastructure – Hạ
tầng dữ liệu không gian quốc gia
Software development kit – Bộ công cụ
phát triển phần mềm

Ghi chú


vii

DANH MỤC CÁC BẢNG
Bảng 2.1 Mô tả nội dung CSDL nền tỷ lệ 1:10.000 ......................................... 13
Bảng 2.2 Thuộc tính chung của các đối tượng địa lý tỷ lệ 1: 10.000 ................ 14
Bảng 2.3 Mô tả nội dung chủ đề Cơ sở đo đạc ................................................ 18
Bảng 2.4 Tiêu chí chất lượng CSDL nền tỷ lệ 1:10.000................................... 22
Bảng 4.1 Danh sách các phép kiểm tra ............................................................ 33
Bảng 4.2 Ánh xạ phép toán đến lớp dữ liệu ..................................................... 47

Bảng 4.3 Mô tả chức năng công cụ kiểm tra ................................................... 51
Bảng 4.4 Mô tả các bảng CSDL nghiệp vụ kiểm tra ....................................... 53
Bảng 4.5 Mô tả bảng tỷ lệ dữ liệu................................................................... 53
Bảng 4.6 Mô tả bảng chủ đề dữ liệu ............................................................... 53
Bảng 4.7 Mô tả bảng lớp dữ liệu ..................................................................... 54
Bảng 4.8 Mô tả bảng thuộc tính...................................................................... 54
Bảng 4.9 Mô tả bảng miền giá trị ................................................................... 54
Bảng 4.10 Mô tả bảng nhóm phép kiểm tra .................................................... 55
Bảng 4.11 Mô tả bảng phép toán .................................................................... 55
Bảng 4.12 Mô tả bảng phép kiểm tra ............................................................... 56
Bảng 4.13 Mô tả bảng cấu hình kiểm tra ......................................................... 56
Bảng 4.14 Mô tả bảng danh mục tỉnh .............................................................. 56
Bảng 4.15 Mô tả bảng danh mục huyện ........................................................... 56
Bảng 4.16 Mô tả bảng danh mục xã ............................................................... 57


viii

DANH MỤC CÁC HÌNH VẼ
Hình 2.1 Dữ liệu không gian .............................................................................. 8
Hình 2.2 Dữ liệu thuộc tính ................................................................................ 9
Hình 2.3 Mô hình vector .................................................................................... 9
Hình 2.4 Mô hình Raster .................................................................................. 10
Hình 2.5 Mô hình TIN...................................................................................... 10
Hình 2.6 Mô hình cấu trúc CSDL nền tỷ lệ 1: 10.000 ...................................... 12
Hình 2.7 Mô hình cấu trúc chủ đề Cơ sở đo đạc ............................................... 14
Hình 2.8 Một số lỗi về cấu trúc dữ liệu............................................................ 23
Hình 2.9 Lỗi về nội dung dữ liệu – Phù hợp miền giá trị ................................. 24
Hình 2.10 Một số lỗi về quan hệ không gian ................................................... 24
Hình 3.1 Nhóm sản phẩm phần mềm của Esri ................................................. 26

Hình 3.2 Các phiên bản của bộ phần mềm ArcGis Desktop ............................ 27
Hình 4.1 Quy trình giao nộp CSDL nền địa lý.................................................. 29
Hình 4.2 Quy trình xây dựng, biên tập CSDL nền địa lý .................................. 30
Hình 4.3 Sơ đồ quy trình kỹ thuật xây dựng CSDL NĐL 1:50.000 .................. 31
Hình 4.4 Công nghệ xây dựng công cụ kiểm tra ............................................... 32
Hình 4.5 Các chức năng của công cụ kiểm tra .................................................. 50
Hình 4.6 Bảng CSDL nghiệp vụ kiểm tra ........................................................ 52
Hình 4.7 Giao diện các chức năng của công cụ kiểm tra.................................. 57
Hình 4.8 Giao diện thiết lập cấu hình .............................................................. 58
Hình 4.9 Giao diện quản trị cấu hình ............................................................... 58
Hình 4.10 Giao diện lấy tiêu chí kiểm tra ........................................................ 59
Hình 4.11 Giao diện kiểm tra .......................................................................... 59
Hình 4.12 Giao diện sửa lỗi ............................................................................. 60
Hình 4.13 Giao diện xuất báo cáo.................................................................... 60


ix


1
MỞ ĐẦU
Lý do chọn đề tài
Ngay nay, hầu hết dữ liệu hiện đang được thu thập để phục vụ nhu cầu
nghiệp vụ, quản lý đều liên quan đến vị trí không gian. Việc quản lý dữ liệu bao
gồm thuộc tính và vị trí không gian (dữ liệu địa lý) giúp người quản lý có cái
nhìn trực quan hơn về đối tượng cần quản lý, hỗ trợ tốt hơn trong quản lý đất
đai, quy hoạch đô thị…đặc biệt trong quản lý tài nguyên thiên thiên, môi trường.
Chính vì vậy việc thu thập, quản lý dữ liệu địa lý rất cần thiết.
CSDL nền địa lý đã thay thế việc quản lý các đối tượng địa lý trên bản đồ
giấy bằng bản đồ số giúp cho việc tra cứu, tìm kiếm, cập nhật các đối tượng địa

lý một cách nhanh chóng và dễ dàng. CSDL nền thông tin địa lý (trong đó có
bản đồ số) đã thể hiện bức tranh về tự nhiên, dân cư, cơ sở hạ tầng, hệ thống
giao thông đường bộ, mạng lưới đường bộ, mạng lưới sông, suối… tương đối
chi tiết.
CSDL nền địa lý là thành phần dữ liệu quan trọng của hệ thống thông tin
địa lý (GIS). GIS được phát triển trên nền tảng và thành tựu của Công nghệ
thông tin, Địa lý học, Toán học, Thống kê, Bản đồ học và các lĩnh vực khác.
GIS đang từng ngày phát triển và ứng dụng rộng rãi trong việc quản lý tài
nguyên thiên, môi trường và kinh tế xã hội.
CSDL nền địa lý phục vụ cho việc nâng cao chất lượng quy hoạch, quyết
định hợp lý về đầu tư, tăng cường cải cách hành chính, nâng cao hiệu quả bộ
máy quản lý Nhà nước, quản lý các ngành và địa phương.
CSDL nền địa được xây dựng tập trung theo phạm vị cấp tỉnh và được thực
hiện bởi nhiều đơn vị xây dựng. Tùy theo từng tỷ lệ cơ sở dữ liệu nền địa lý gồm
các chủ đề dữ liệu khác nhau, ở tỷ lệ 1:10.000 CSDL nền địa lý gồm có bẩy chủ
đề dữ liệu: Cơ sở đo đạc, Biên giới địa giới, Địa hình, Thủy hệ, Giao thông, Dân
cư cơ sở hạ tầng, Phủ bề mặt. Và mỗi chủ đề gồm nhiều lớp dữ liệu khác nhau,
ví dụ ở chủ đề Dân cư cơ sở hạ tầng gồm các lớp dữ liệu như: Nhà, Điểm dân
cư, Địa danh dân cư, Trạm điện, Đường dây tải điện, Khu chức năng, Công trình
kiến trúc đặc biệt...Vì vậy có rất nhiều lỗi trong CSDL nền địa lý.
CSDL nền địa lý sau khi xây dựng cần tích hợp vào hệ quản trị CSDL để
quản lý tập trung. Trước khi tích hợp cần kiểm tra để đảm bảo dữ liệu chuẩn và
không xảy ra các lỗi trong quá trình tích hợp.
Việc xây dựng CSDL nền địa lý ở tỷ lệ nhỏ (1:25.000, 1:50.000,…) từ
CSDL nền địa lý ở tỷ lệ lớn (1:2.000, 1:5.000, 1:10.000) bằng phương pháp biên
tập, tổng quát hóa bản đồ không tránh khỏi các lỗi và cần được kiểm tra.
Ngoài ra trong quá trình nghiệm thu sản phẩm CSDL nền địa lý cũng cần
phải kiểm tra dữ liệu. Nếu dữ liệu không đạt sẽ gửi lại đơn vị xây dựng để chỉnh
sửa.



2
Việc kiểm tra CSDL nền địa lý tốn rất nhiều thời gian và công sức, hơn nữa
với khối lượng dữ liệu lớn kiểm tra thủ công không tránh hỏi nhầm lẫn sai sót.
Vì các lý do trên, Luận văn “Xây dựng công cụ kiểm tra CSDL nền địa lý”
được thực hiện với mục đích tạo ra một công cụ kiểm tra CSDL nền địa lý tự
động giúp giảm bớt thời gian và công sức trong quá trình kiểm tra CSDL nền địa
lý với độ chính xác cao.
Mục đích nghiên cứu
Đề tài tập trung nghiên cứu CSDL nền địa lý, chuẩn dữ liệu nền địa lý, các
lỗi xảy ra trong quá trình xây dựng và biên tập CSDL nền địa lý, các phép toán
quan hệ không gian giữa các đối tượng địa lý từ đó xây dựng công cụ kiểm tra
CSDL nền địa lý tự động.
Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu: CSDL nền địa lý: công cụ xây dựng biên tập CSDL
nền địa lý, chuẩn dữ liệu nền địa lý, các lỗi trong CSDL nền địa lý, các phép
toán kiểm tra CSDL nền địa lý và xây dựng công cụ kiểm tra CSDL nền địa lý.
Phạm vi nghiên cứu:
Về CSDL nền địa lý: Chuẩn mô hình cấu trúc nội dung CSDL nền
địa lý tỷ lệ 1:10.000, quy chuẩn chất lượng dữ liệu địa lý tỷ lệ 1:10.000, Các lỗi
trong CSDL nền địa lý, Các phép toán kiểm tra nội dung, cấu trúc và quan hệ
không gian.
Về Xây dựng công cụ kiểm tra: Xây dựng công cụ kiểm tra CSDL
nền địa lý với các phép toán về cấu trúc CSDL nền địa lý, các phép toán kiểm
tra về nội dung, các phép toán kiểm tra quan hệ không gian giữa các đối tượng
trong cùng một lớp dữ liệu hoặc quan hệ không gian giữa các lớp dữ liệu cùng
chủ đề ở tỷ lệ 1: 10.000.
Ý nghĩa khoa học và thực tiễn của đề tài
Nghiên cứu về CSDL nền địa lý: loại dữ liệu trong CSDL nền địa lý, mô
hình cấu trúc dữ liệu nền địa lý, chuẩn dữ liệu nền địa lý, quy chuẩn nội dung và

cấu trúc CSDL nền địa lý tỷ lệ 1:10.000, Quy chuẩn chất lượng CSDL nền địa lý
tỷ lệ 1:10.000, các lỗi trong CSDL nền địa lý
Nghiên cứu về các phép toán kiểm tra CSDL nền địa lý: Các phép toán
kiểm tra về cấu trúc, nội dung và các phép toán về quan hệ không gian
Xây dựng công cụ kiểm tra CSDL nền địa lý tự động
Kết quả nghiên cứu của đề tài này áp dụng cho việc xây dựng, biên tập,
giao nộp, nghiệm thu CSDL nền địa lý, giảm bớt thời gian và công sức của con
người.
Nội dung của luận văn


3
Ngoài phần các ký hiệu và chữ viết tắt, danh mục các bảng, danh mục các
hình vẽ, mở đầu và kết luận, danh mục tài liệu tham khảo, nội dung luận văn
gồm năm chương:
Chương 1: Giới thiệu
Giới thiệu về khái niệm, tầm quan trọng, hiện trạng CSDL nền địa lý trên
thế giới và Việt Nam, nhu cầu xây dựng công cụ kiểm tra CSDL nền địa lý.
Chương 2: Tổng quan về CSDL nền địa lý
Nghiên cứu về CSDL nền địa lý như các loại dữ liệu địa lý, mô hình cấu
trúc dữ liệu địa lý, các chủ đề dữ liệu trong CSDL nền địa lý, các chuẩn dữ liệu
nền địa lý, quy định về cấu trúc và nội dung dữ liệu nền địa lý tỷ lệ 1:10.000,
quy định về chất lượng dữ liệu nền địa lý tỷ lệ 1: 10.000.
Chương 3: Phần mềm ArcGis Desktop của Esri và lập trình ArcObject
Giới thiệu phần mềm ArcGis Desktop sử dụng trong quá trình xây dựng,
biên tập CSDL nền địa lý và thư viện lập trình ArcObject hỗ trợ việc xây dựng
công cụ kiểm tra CSDL nền địa lý.
Chương 4: Xây dựng công cụ kiểm tra CSDL nền địa lý đa tỷ lệ
Xây dựng công cụ kiểm tra CSDL nền địa lý đa tỷ lệ. Mặc dù phạm vi của
luân văn xây dựng công cụ kiểm tra CSDL nền địa lý ở tỷ lệ 1:10.000 nhưng tác

giả xây dựng công cụ có khả năng mở rộng hỗ trợ kiểm tra CSDL dữ liệu ở các
tỷ lệ khác như: 1:2.000, 1:5.000, 1:25.000, 1:50.000…v.v.
Chương 5: Cài đặt và thử nghiệm
Chương này tác giả đưa ra yêu cầu phần cứng cũng như phần mềm để chạy
được công cụ kiểm tra CSDL nền địa lý cũng như dữ liệu để thử nghiệm,
phương pháp kiểm tra khả năng phát hiện lỗi và đưa ra đánh giá khả năng mở
rộng của công cụ nếu có thay đổi về cấu trúc và nội dung CSDL nền địa lý và
các phép toán kiểm tra.


4

Chương 1. GIỚI THIỆU
1.1 Tầm quan trọng, hiện trạng CSDL nền địa lý
1.1.1 Tầm quan trọng
CSDL nền địa lý đã thay thế việc quản lý các đối tượng địa lý trên bản đồ
giấy bằng bản đồ số giúp cho việc tra cứu, tìm kiếm, cập nhật các đối tượng địa
lý một cách nhanh chóng và dễ dàng. CSDL nền thông tin địa lý (trong đó có
bản đồ số) đã thể hiện bức tranh về tự nhiên, dân cư, cơ sở hạ tầng, hệ thống
giao thông đường bộ, mạng lưới đường bộ, mạng lưới sông, suối… tương đối
chi tiết. Đặc biệt là, thông qua bộ sản phẩm này, chúng ta có thể truy cập được
nhiều thuộc tính, trình bày hiển thị và chiết xuất theo phạm vi địa giới hành
chính đến cấp xã, trong đó người dùng có thể lựa chọn theo từng đối tượng, chủ
đề hoặc nhiều đối tượng trên phạm vi mà mình quan tâm cùng một lúc mà trên
bản đồ giấy trước đây không có.
CSDL nền địa lý phục vụ cho việc nâng cao chất lượng quy hoạch, quyết
định hợp lý về đầu tư, tăng cường cải cách hành chính, nâng cao hiệu quả bộ
máy quản lý Nhà nước, quản lý các ngành và địa phương.
CSDL nền địa lý hay dữ liệu nền địa lý là một trong những thành phần dữ
liệu quan trọng của hệ thống thông tin địa lý (GIS) và hạ tầng dữ liệu không

gian (SDI). Dữ liệu nền địa lý dùng để làm nền để thể hiện dữ liệu không gian
chuyên ngành cho các ngành khác như quy hoạch đô thị, quản lý đất đai, nông
nghiệp…v.v. Cung cấp nền không gian cho phép chồng xếp các loại thông tin về
tự nhiên, kinh tế - xã hội sẵn sàng ứng phó với biến đổi khí hậu, hạn chế thiệt
hại về người và của do thiên tai.
CSDL nền địa lý phục vụ cho các ứng dụng của các Bộ, ngành, địa phương
trong cả nước, hướng tới việc triển khai thành lập "Cơ sở hạ tầng không gian
quốc gia (NSDI)”.
1.1.2 Hiện trạng CSDL nền địa lý trên thế giới
Trên thế giới, các cơ quan quản lý từ cấp liên hợp quốc, quốc gia, các tổ
chức Quốc tế và các dự án quốc tế đều đã sử dụng rất hiệu quả nguồn dữ liệu,
đặc biệt là dữ liệu có thuộc tính hình học mà được quản lí lưu trữ dưới dạng các
cơ sở dữ liệu GIS trong trợ giúp hoạch định chính sách, lập kế hoạch và quản lý
vùng và lãnh thổ. Từ những năm 90 thế kỷ trước, cộng đồng toàn cầu đã bắt
đầu nhận ra lợi ích của việc đưa ra các chuẩn chung và khả năng tương tác về
mặt dữ liệu, xử lý và hệ thống. Khái niệm cơ sở hạ tầng thông tin dữ liệu
không gian toàn cầu (GSDI) [14] được hình thành với hướng chia sẻ thông tin
giữa các tổ chức quốc tế về công nghệ và các quốc gia. GSDI vừa tạo một
khối lượng thông tin rất lớn để cung cấp cho nhu cầu của xã hội hiện đại, vừa
là cơ sở để loài người liên kết thực hiện các chương trình chung nhằm bảo
vệ hành tinh. NSDI đóng vai trò thành phần để tạo nên GSDI cho toàn hành


5
tinh và vừa là hạ tầng thông tin để sử dụng cho nhu cầu phát triển bền vững
của từng quốc gia. Trên cơ sở đó, hiện nay các châu lục, các quốc gia đang
chung tay xây dựng và phát triển cơ sở hạ tầng dữ liệu không gian cho mình
với điển hình hệ thống INSPIRE của châu Âu, GeoData của Thụy Điển, SIDP
của bang Tây Australia, GeoSpace của Singapore v.v... [15, 16, 17, 18] với
các đặc trưng khác nhau. Hầu hết các nước trên thế giới như Mỹ, Canada, các

nước cộng đồng châu Âu, Úc, Trung Quốc, Thái Lan... đã sử dụng GIS hỗ trợ
cho quản lí trong nhiều lĩnh vực khác nhau như quản lý môi trường, thiên tai,
giao thông, đô thị, dân cư, sử dụng đất, bảo tồn, nuôi trồng thuỷ sản... Đặc biệt,
trong quản lý môi trường với hàng trăm lớp thông tin về điều kiện tự nhiên, kinh
tế xã hội và thể chế chính sách đã được xây dựng, quản lý và lưu trữ dưới dạng
các bản đồ số bằng công cụ GIS. Ở Mỹ và Canada, từ những thập kỷ 80 của thế
kỷ trước, xây dựng cơ sở dữ liệu bằng công nghệ GIS đóng vai trò cốt lõi đã
được áp dụng trong quản lí ở hầu hết cơ sở dữ liệu môi trường của các nước này.
Các nước ở Châu Âu cũng có chiến lược phát triển cộng nghệ GIS và ứng dụng
trong quản lí các vùng miền như vùng đô thị, ven đô thị, khu công nghiệp, khu
vực bảo tồn, các sản xuất nông nghiệp... rất sớm, gần như song hành với Mỹ.
Đối với nhiều nước trên thế giới và trong khu vực như Thái Lan,
MaLaysia, PhiLipin, Nhật, Hạ tầng dữ liệu không gian từ lâu đã được quan tâm
phát triển ở mức Quốc gia với một hệ thống quy chuẩn và chính sách nhằm duy
trì và phát triển bền vững. Theo đó, các dịch vụ phát triển ứng dụng phần mềm
bằng công nghệ GIS đã đem lại những lợi ích lớn về kinh tế, xã hội đặc biệt là
với chiến lược “eGoverment” tại các nước này.
Tại MaLaysia, từ năm 2004 chuẩn MS1759 đã được xây dựng, một hệ
thống mã hoá đối tượng và thuộc tính được ban hành, nhờ đó mà người làm dữ
liệu và người sử dụng thông tin địa lý luôn sử dụng trao đối dữ liệu số, hạn chế
chồng chéo trong các dịch vụ về xây dựng CSDL. Tại Thái Lan có tới hàng trăm
công ty hoạt động trên các dịch vụ về GIS, doanh thu trên 14000 tỷ bạt. Đặc biệt
là tại Nhật, công tác chuẩn hoá GIS đã được phát triển ở mức quốc tế với các
mục đích về lợi nhuận, sử dụng đa mục đích và chung cho nhiều đối tượng, với
việc phát triển các dịch vụ về dữ liệu không gian ở mức tiên tiến và tinh vi.
1.1.3 Hiện trạng CSDL nền địa lý ở Việt Nam
Tại Việt Nam, trong những năm 2004-2007 Chính phủ cũng đã có nhiều
hoạt động hướng đến chủ trương “Tin học hóa hành chính điện tử”. Tuy nhiên,
những hoạt động hầu như mới chỉ chú trọng triển khai trong phạm vi lĩnh vực
thông tin truyền thông (chủ yếu là hạ tầng máy móc thiết bị). Do vậy kết quả là

hạ tầng thiết bị có được trang bị nhưng chưa đủ điều kiện về hạ tầng dữ liệu (dữ
liệu các loại nói chung, dữ liệu không gian nói riêng).
Để làm hạn chế sự chồng chéo trong lĩnh vực xây dựng dữ liệu địa lý, từ
những năm 2007 đến nay, các hoạt động về xây dựng và chuẩn hoá dữ liệu đã
được quan tâm nhiều hơn. Thể hiện bằng việc Chính phủ đã ký Quyết định phê


6
duyệt hai dự án lớn về xây dựng CSDL nền địa lý và Quy chuẩn cơ sở dữ liệu
địa lý đó là Dự án thành lập CSDL nền thông tin địa lý ở tỷ lệ 1:10.000 gắn với
mô hình số độ cao phủ trùm cả nước và Dự án thành lập CSDL nền địa lý ở các
tỷ lệ 1:2.000, 1:5.000 các khu vực đô thị, khu vực công nghiệp, khu kinh tế
trọng điểm. Thời gian thực hiện hai Dự án trên là từ năm 2008 đến năm 2011
với tổng mức kinh phí dự toán là 552,515 tỷ đồng.
Sau khi hai dự án về xây dựng CSDL của Chính phủ kết thúc (sau năm
2012), Bộ Tài nguyên và Môi trường đã bàn giao cho các tỉnh CSDL nền địa lý
phù trùm phạm vi địa phận hành chính cấp tỉnh ở tỷ lệ 1:10.000. Dữ liệu địa lý
nền các loại tỷ lệ cơ bản dạng Vector, bao gồm 7 chủ đề Cơ sở đo đạc, Biên
giới, địa giới, Địa hình (3D), Thủy hệ, Giao thông, Dân cư, cơ sở hạ tầng, Phủ
bề mặt. Sản phẩm đóng gói theo phạm vi địa phận cấp tỉnh, định dạng
Geodatabase (có thể truy cập trực tiếp bằng ArcGIS). Từ đó đến nay CSDL nền
địa lý vẫn tiếp tục được cập nhật. Ngoài ra sản phẩm CSDL sản phẩm của hai dự
án trên là CSDL nền địa lý tỷ lệ 1:2.000, 1:5.000 và 1:10.000 là đầu vào để xây
dựng các CSDL nền địa lý ở tỷ lệ nhỏ hơn 1:25.000 và 1:50.000 bằng phương
pháp tổng quát hóa bản đồ.
1.2 Nhu cầu xây dựng công cụ kiểm tra CSDL nền địa lý
1.2.1 Tích hợp dữ liệu vào hệ thống quản lý CSDL nền địa lý quốc gia
Kiểm tra dữ liệu địa lý đã hợp chuẩn. Cũng giống như bất kỳ một hệ thống
tích hợp dữ liệu khác. Dữ liệu trước khi tích hợp vào hệ thống cần phải trải qua
các bước kiểm tra để xác định các sai sót có thể sảy ra. Dữ liệu nền địa lý được

xây dựng theo chuẩn dữ liệu nền địa lý. Vì vậy bước kiểm tra rà soát hợp chuẩn
là cần thiết trước khi tích hợp vào hệ thống bởi vì dữ liệu kiểm tra nghiệm thu
chỉ thực hiện 30% theo quy định kiểm tra sản phẩm đo đạc bản đồ hiện hành nên
khó tránh khỏi một số sai sót. Việc kiểm tra dữ liệu địa lý nền tại bước này chỉ
giới hạn ở mức kiểm tra tính hợp chuẩn của dữ liệu (tính bảo toàn về mô hình
cấu trúc dữ liệu nền địa lý theo chuẩn) nhằm mục đích dữ liệu có thể đưa vào hệ
thống mà không có vướng mắc gì. Còn về độ chính xác của dữ liệu được mặc
nhiên thừa nhận do dữ liệu đã được kiểm tra trước đó bởi Cục Đo đạc và Bản
đồ.
1.2.2 Trong quá trình xây dựng, cập nhật CSDL nền địa lý
Như đã giới thiệu ở trên, CSDL nền địa lý tỷ lệ 1:25.000 và 1:50.000 được
xây dựng từ CSDL nền địa lý tỷ lệ 1:2.000, 1: 5.000 và 1:10.000 bằng cách biên
tập và tổng quát hóa dữ liệu vì vậy không thể tránh khỏi những sai sót. Trước
khi giao nộp sản phẩm cán bộ xây dựng dữ liệu cần kiểm tra dữ liệu để đảm bảo
dữ liệu mình giao nộp đạt chuẩn theo quy định của bộ tài nguyên và môi trường.
Quá trình cập nhật CSDL nền địa lý được tiến hành như sau: Dữ liệu sau
khi được tích hợp vào hệ thống quản lý CSDL được trích xuất theo phương pháp


7
tạo bản sao phạm vi dữ liệu cần cập nhật sau đó cập nhật dữ liệu trên bản sao đó
rồi đồng bộ bản sao đó vào hệ thống quản lý CSDL, cần kiểm tra CSDL trước
khi đồng bộ.
1.2.3 Trong quá trình nghiệm thu CSDL nền địa lý
CSDL nền địa gồm nhiều tỷ lệ, mỗi tỷ lệ gồm 7 chủ đề dữ liệu và mỗi chủ
đề gồm nhiều lớp dữ liệu việc kiểm tra CSDL nền địa lý theo chuẩn quy định
bởi Bộ tài nguyên và Môi trường gặp rất nhiều khó khăn.
v Tốn nhiều thời gian và công sức
v Việc kiểm tra thủ công khó có thể tránh được những sai sót.
Cần xây dựng một công cụ kiểm tra CSDL nền địa lý theo các tỷ lệ

1.2.4 Chưa có công cụ, phầm mềm kiểm tra CSDL nền địa lý
Hiện tại chưa có công cụ, phần mềm kiểm tra CSDL nền địa lý một cách
toàn diện và có hệ thống, chỉ có một số công cụ kiểm tra lỗi một cách rời rạc.
Việc xây dựng công cụ kiểm tra CSDL nền địa lý là hết sức cần thiết và
cấp bách.
1.3 Kết quả đạt được
Sau một thời gian thực hiện đề tài “Xây dựng công cụ kiểm tra CSDL nền
địa lý” đã đạt được một số kết quả như sau:
v Định nghĩa được các phép toán kiểm tra CSDL nền địa lý theo chuẩn
mô hình cấu trúc nội dung và chuẩn chất lượng dữ liệu nền địa lý
theo quy định của Bộ tài nguyên và môi trường.
v Xây dựng được CSDL nghiệp vụ phục vụ kiểm tra CSDL nền địa lý.
v Kiểm tra CSDL nền địa lý ở một số tỷ lệ 1:2.000, 1:5.000, 1: 10.000,
1:25.000, 1:50.000. Đưa ra thông báo lỗi theo phép toán kiểm tra,
xuất các lỗi ra file excel phục vụ thống kê báo cáo. Hỗ trợ sửa một số
lỗi thuộc tính và không gian.
v Tài liệu hướng dẫn sử dụng công cụ kiểm tra CSDL nền địa lý.
v Giảm bớt công sức và thời gian kiểm tra CSDL nền địa lý.

Chương 2. TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU NỀN ĐỊA LÝ
2.1 Giới thiệu về CSDL nền địa lý
2.1.1 Khái niệm
Dữ liệu nền địa lý là thông tin về các đối tượng địa lý cơ bản được mã hóa
trong máy tính.


8
Cơ sở dữ liệu nền địa lý là một tập hợp các dữ liệu nền địa lý có chuẩn cấu
trúc được lưu trữ trên máy tính và các thiết bị lưu trữ thông tin thứ cấp có thể
thỏa mãn yêu cầu khai thác thông tin đồng thời của nhiều người sử dụng hay

nhiều chương trình ứng dụng với nhiều mục đích khác nhau.
2.1.2 Thành phần, cấu trúc CSDL nền địa lý
CSDL nền địa lý gồm các dữ liệu về vị trí và hình học của các đối tượng
đia lý và các thông tin khác có liên quan tới đối tượng địa lý đó. CSDL nền địa
lý gồm các lớp thông tin chính về bề mặt đất có liên quan tới tự nhiên và con
người. CSDL nền địa lý tỷ lệ 1:10.000 gồm 7 chủ đề dữ liệu sau:
v Cơ sở đo đạc
v Biên giới địa giới
v Địa hình
v Thủy hệ
v Giao thông
v Dân cư cơ sở hạ tầng
v Phủ bề mặt
Mỗi một chủ đề dữ liệu gồm nhiều lớp dữ liệu. Mỗi lớp dữ liệu có hai loại
dữ liệu cơ bản: Dữ liệu không gian và dữ liệu phi không gian.
v Dữ liệu không gian là những mô tả số hình ảnh của các đối tượng địa
lý của từng bản đồ ở một tỷ lệ nào đó.

Hình 2.1 Dữ liệu không gian
v Dữ liệu phi không gian (thuộc tính) là những mô tả đặc tính, số
lượng, mối quan hệ của các đối tượng địa lý.


9

Hình 2.2 Dữ liệu thuộc tính
CSDL nền địa lý là thành phần dữ liệu quan trọng của hệ thống thông tin
địa lý (GIS). Hệ thống GIS gồm có hai thành phần dữ liệu chính.
v Dữ liệu nền
v Dữ liệu chuyên ngành: Bao gồm các dữ liệu cho một lĩnh vực hay

một ứng dụng chuyên ngành,… Ví dụ: Dữ liệu về địa điểm, về quy
hoạch đô thị, hệ thống mạng, lưu vực sông…
Dữ liệu nền địa lý nói riêng hay dữ liệu không gian nói chung được tổ chức
dưới ba mô hình cấu trúc: Vector, Raster và TIN.
v Với mô hình Vector đối tượng địa lý được mô tả bằng một trong ba
đối tượng cơ bản: Điểm (Point), đường (Line hoặc Arc), vùng
(Polygon). Trong lập trình còn có thêm những cấu trúc phức tạp hơn
dựa trên các cấu trúc cơ bản đó: MultiPoint, MultiLine,
MultiPolygon. Với mô hình vector các đối tượng được tạo ra trên cơ
sở các tọa độ dạng (x,y) và (x,y,z). Dữ liệu vector có thể lưu trữ dưới
dạng file: Shapefile (shp), Dwg (Autocad), .Tab (Map info), Dgn
(Microstation), .mdb (Esri), .gdb (Esri)…v.v hoặc lưu trữ trong hệ
quản trị cơ sở dữ liệu như Postgres, Oracle, SQL server 2008 trở lên
và một số hệ quản trị cơ sở dữ liệu khác.

Hình 2.3 Mô hình vector
v Với mô hình Raster dữ liệu không gian được biểu diễn bởi lưới điểm
ảnh (pixel). Các điểm ảnh được xếp liên tiếp từ trái qua phải và từ
trên xuống dưới. Mỗi một điểm ảnh chứa một giá trị, tập các ma trận


10
điểm ảnh và giá trị tương ứng tạo thành một lớp. Nguồn dữ liệu
Raster từ quét ảnh, ảnh máy bay, ảnh viễn thám hoặc chuyển từ dữ
liệu vector sang.

Hình 2.4 Mô hình Raster
v Với mô hình TIN sử dụng lưới tam giác để mô tả bề mặt 3D.

Hình 2.5 Mô hình TIN

2.2 Chuẩn dữ liệu nền địa lý
Với vai trò và tầm quan trọng của CSDL nền địa lý Chính phủ và Bộ Tài
nguyên và Môi trường ban hành các Quyết định và Thông tư quy định chuẩn
thông tin địa lý.
Năm 2007 Bộ Tài nguyên và Môi trường ban hành Quyết định số
06/2007/QĐ-BTNMT ngày 27 tháng 2 năm 20007 về việc áp dụng chuẩn thông
tin địa lý quốc gia. Quyết định này quy định việc áp dụng Chuẩn thông tin địa lý
cơ sở quốc gia , gồm các Quy chuẩn sau đây:
1. Quy chuẩn mô hình cấu trúcdữ liệu địa lý;
2. Quy chuẩn mô hình khái niệm không gian;
3. Quy chuẩn mô hình khái niệm thời gian;


11
4. Quy chuẩn phân loại đối tượng địa lý;
5. Quy chuẩn hệ quy chiếu tọa độ;
6. Quy chuẩn siêu dữ liệu địa lý;
7. Quy chuẩn chất lượng dữ liệu địa lý;
8. Quy chuẩn trình bày dữ liệu địa lý;
9. Quy chuẩn mã hóa trong trao đổi dữ liệu địa lý.
Đến ngày 14 tháng 5 năm 2007 Bộ Tài nguyên và Môi trường ban hành
Quyết định số 08/2007/QĐ-BTNMT về việc đính chính quy định áp dụng chuẩn
thông tin địa lý cơ sở quốc gia ban hành kèm theo quyết định số 06/2007/QĐBTNMT ngày 27 tháng 02 năm 2007 của Bộ trưởng Bộ Tài nguyên và Môi
trường.
Ngày 26 tháng 08 năm 2008 Bộ Tài nguyên và Môi trường ban hành
Quyết định số 05/2008/QĐ-BTNMT về việc sửa đổi bổ sung một số điều của
quy định áp dụng chuẩn thông tin địa lý cơ sở quốc gia ban hành kèm theo quyết
định số 06/2007/QĐ-BTNMT ngày 27 tháng 02 năm 2007 và Quyết định số
08/2007/QĐ-BTNMT ngày 14 tháng 5 năm 2007 của Bộ trưởng Bộ Tài nguyên
và Môi trường.

Sau một thời gian dài nghiên cứu, thử nghiệm, ngày 19 tháng 03 năm
2012, Bộ Tài nguyên môi trường đã ban hành thông tư số: 02/2012/TT-BTNMT,
hành kèm theo Thông tư này Quy chuẩn kỹ thuật quốc gia về chuẩn thông tin
địa lý cơ sở, mã số QCVN 42: 2012/BTNMT. Thông tư này có hiệu lực thi hành
kể từ ngày 04 tháng 5 năm 2012 và thay thế các quyết định đã ban hành từ trước
như: Quyết định số 06/2007/QĐ-BTNMT, Quyết định số 08/2007/QĐ-BTNMT,
Quyết định số 05/2008/QĐ-BTNMT. Quy chuẩn này bao gồm các quy định
chung, làm cơ sở ban hành các thông tư về Quy định kỹ thuật cơ sở dữ liệu nền
địa lý các loại: tỷ lệ 1:2000 và 1:5000, tỷ lệ 1:10.000, tỷ lệ 1:50.000.
2.3 Quy định về nội dung và cấu trúc dữ liệu nền địa lý
Mỗi tỷ lệ CSDL nền địa lý đều có quy định về mô hình cấu trúc và nội
dung dữ liệu.
Đối với CSDL nền địa lý 1:10.000. Sau một thời gian xây dựng thử nghiệm
CSDL nền địa lý tỷ lệ 1:10.000 theo dự thảo Quy định kỹ thuật dữ liệu nền địa
lý. Ngày 24/4/2014 Bộ Tài nguyên và môi trường ban hành thông tư số
21/2014/TT-BTNMT Quy định kỹ thuật về mô hình cấu trúc, nội dung cơ sở dữ
liệu nền địa lý tỷ lệ 1:10.000


12

«Leaf»
1.CoSoDoDac

«Leaf»
2.BienGioiDiaGioi

«Leaf»
4.ThuyHe


«Leaf»
3.DiaHinh

«ApplicationSchema»
NenDiaLy10N

«Leaf»
5.GiaoThong

«Leaf»
7.PhuBeMat

«Leaf»
6.DanCuCoSoHaTang

Hình 2.6 Mô hình cấu trúc CSDL nền tỷ lệ 1: 10.000 [2]
Tên gói
NenDiaLy10N

Phạm vi áp dụng
Quy định kiểu đối tượng nền địa lý trừu tượng 1:10.000 được
định nghĩa với các thuộc tính chung cho tất cả các kiểu đối
tượng nền địa lý 1:10.000

CoSoDoDac

Quy định cấu trúc dữ liệu của các kiểu đối tượng địa lý thuộc
chủ đề khống chế trắc địa

BienGioiDiaGioi


Quy định cấu trúc dữ liệu của các kiểu đối tượng địa lý thuộc
chủ đề biên giới quốc gia và địa giới hành chính

DiaHinh

Quy định cấu trúc dữ liệu của các kiểu đối tượng địa lý thuộc
chủ đề địa hình

ThuyHe

Quy định cấu trúc dữ liệu của các kiểu đối tượng địa lý thuộc
chủ đề thuỷ hệ

GiaoThong

Quy định cấu trúc dữ liệu của các kiểu đối tượng địa lý thuộc
chủ đề giao thông

DanCuCoSoHaTang

Quy định cấu trúc dữ liệu của các kiểu đối tượng địa lý thuộc
chủ đề hạ tầng dân cư và hạ tầng kỹ thuật


13
Quy định cấu trúc dữ liệu của các kiểu đối tượng địa lý thuộc
chủ đề phủ bề mặt

PhuBeMat


Bảng 2.1 Mô tả nội dung CSDL nền tỷ lệ 1:10.000[2]

Kiểu đối tượng:
Tên
Mô tả

Tên các thuộc tính

NenDiaLy10N
NenDiaLy10N là lớp UML trừu tượng mô tả các đặc
tính chung của tất cả các đối tượng địa lý thuộc dữ liệu
nền địa lý 1:10.000.
maNhanDang, ngayThuNhan, ngayCapNhat

Thuộc tính đối tượng:
Tên
Mô tả

maNhanDang
Là mã nhận dạng duy nhất đối với mỗi đối tượng địa
lý thuộc dữ liệu nền địa lý 1:10.000, gồm bốn (04)
phần được đặt liên tiếp nhau trong đó: phần thứ nhất
gồm 4 ký tự là mã cơ sở dữ liệu 010N; phần thứ hai
gồm 2 ký tự là mã cấp tỉnh theo quy định của cơ quan
nhà nước có thẩm quyền; phần thứ ba gồm 4 ký tự là
mã đối tượng trong danh mục đối tượng địa lý cơ sở;
phần thứ tư gồm 6 chữ số là số thứ tự của đối tượng
cùng kiểu trong tập dữ liệu. Đối với các đối tượng trên
biển không xác định được thuộc tỉnh nào thì phần thứ

hai nhận giá trị 00.
Ví dụ: 010N04AA01000001
+ 010N là mã cơ sở dữ liệu;
+ 04 là mã tỉnh;
+ AA01 là mã đối tượng trong danh mục đối tượng cơ
sở;
+ 000001 là số thứ tự của đối tượng trong tập dữ liệu.

Kiểu dữ liệu

CharacterString

Tên

ngayThuNhan


14
Mô tả

Là ngày thu nhận thông tin đối tượng nền địa lý.

Kiểu dữ liệu

DateTime

Tên

ngayCapNhat


Mô tả

Là ngày cập nhật thông tin đối tượng nền địa lý.

Kiểu dữ liệu

DateTime

Bảng 2.2 Thuộc tính chung của các đối tượng địa lý tỷ lệ 1: 10.000[2]
Đối với mỗi gói dữ liệu (chủ đề dữ liệu) có quy định về các lớp dữ liệu, các
trường dữ liệu trong lớp, kiểu dữ liệu, miền giá trị…v.v. Dưới đây là bảng mô tả
cấu trúc của gói dữ liệu CoSoDoDac làm thí dụ.

Hình 2.7 Mô hình cấu trúc chủ đề Cơ sở đo đạc[2]
Kiểu đối tượng:
Tên
Mô tả

CoSoDoDac
Là lớp UML mô tả các đặc tính chung của các kiểu
đối tượng DiemGocQuocGia, DiemCoSoQuocGia,
DiemCoSoChuyenDung.

Kiểu cơ sở

NenDiaLy10N

Tên các thuộc tính

soHieuDiem, toaDoX, toaDoY, docaoH, geo



×