Đồ án tốt nghiệp chuyên ngành Tin học Trắc
địa
PHẦN MỞ ĐẦU
Lý do chọn đề tài
Ngày nay động lực chính thúc đẩy sự phát triển của thế giới chính là
tốc độ sáng tạo. Khoảng cách giữa lý thuyết và ứng dụng thực tế ngày càng
được rút ngắn đến mức mà mỗi công nghệ mới ra đời đều được triển khai ứng
dụng một cách nhanh chóng.
Công nghệ thông tin được triển khai ứng dụng vào mọi lĩnh vực và làm
thay đổi sâu rộng tới đời sống xã hội. Chính sự kết hợp của công nghệ thông
tin và các lĩnh vực khác đã tạo ra nhiều giải pháp và công nghệ. Những công
nghệ mới như ArcGIS Server, ArcIMS đã mang lại cho người dùng những
trải nghiệm tuyệt vời. Biến một công nghệ phức tạp trở thành một ứng dụng
thân thiết mà người dùng có thể đơn giản lướt web để tìm kiếm thông tin địa
lý mình cần.
Người dùng có thể tìm kiếm thông tin dễ dàng, nhưng với những người
lập trình lại không đơn giản như vậy. Để có được một sản phẩm thân thiện với
người sử dụng, họ phải xử lý dữ liệu, biên tập bản đồ, đưa lên trang web. Đó
là những việc đòi hỏi sự phức tạp và nhiều thời gian mà một cá nhân không
thể hoàn thành được. Do đó, chúng ta cần phải biết kết hợp, làm việc theo
nhóm. Một yêu cầu được đặt ra là: làm thế nào để kết hợp với nhau để hoàn
thành công việc. Để trả lời cho câu hỏi đó, một công nghệ mới đã ra đời, nếu
thiếu nó những công nghệ như ArcGIS Server hay ArcIMS sẽ không được
mọi người biết đến và nó chỉ được biết đến như một công cụ cho cá nhân đơn
lẻ sử dụng. Công nghệ mà tôi muốn đề cập đến chính là một công cụ mang
tính ứng dụng cao và phát triển mạnh cùng với các công nghệ như ArcGIS
Server. Đó chính là ArcSDE.
Nguyễn Mạnh
Cường
1
Tin học Trắc địa K49
Đồ án tốt nghiệp chuyên ngành Tin học Trắc
địa
Phạm vi đề tài
Đề tài “Tìm hiểu phần mềm ArcSDE và ứng dụng trong xây dựng và
quản lý dữ liệu bản đồ” chỉ giới hạn trong phạm vi tìm hiểu công nghệ
ArcSDE để cài đặt trên môi trường Desktop và mạng LAN đồng thời ứng
dụng để xây dựng và quản lý dữ liệu bản đồ khu du lịch Tràng An.
Phương pháp nghiên cứu
Trên cơ sở nghiên cứu, tìm hiểu về công nghệ GIS, chuẩn CSDL. Đồng
thời tìm hiểu và hệ quản trị cơ sở dữ liệu (RDBMS), phần mềm ArcSDE. Từ
đó tiến hành cài đặt, chạy chương trình.
Cấu trúc đồ án
PHẦN MỞ ĐẦU
Chương I. TỔNG QUAN ARCSDE
Chương II. TỔ CHỨC VÀ QUẢN LÝ CƠ SỞ DỮ LIỆU GIS
Chương III. TRIỂN KHAI CÀI ĐẶT ARCSDE VÀ PHƯƠNG PHÁP LƯU
TRỮ DỮ LIỆU BẢN ĐỒ KHU DU LỊCH TRÀNG AN
KẾT LUẬN
PHỤ LỤC
Nguyễn Mạnh
Cường
2
Tin học Trắc địa K49
Đồ án tốt nghiệp chuyên ngành Tin học Trắc
địa
MỤC LỤC
PHẦN MỞ ĐẦU...............................................................................................1
MỤC LỤC.........................................................................................................3
CHƯƠNG 1 TỔNG QUAN VỀ ARCSDE.......................................................5
1.1 Khái niệm ArcSDE..................................................................................5
1.1.1 Khái niệm......................................................................................... 5
1.1.2 Chức năng ArcSDE..........................................................................6
1.2 Tầm quan trọng của ArcSDE trong ArcGIS........................................... 6
CHƯƠNG 2 TỔ CHỨC VÀ QUẢN LÝ CƠ SỞ DỮ LIỆU GIS...................13
2.1 Tổ chức cơ sở dữ liệu trong GIS........................................................... 13
2.1.1 Khái niệm cơ bản về hệ cơ sở dữ liệu............................................ 13
2.1.2 Các loại thông tin trong hệ thống thông tin địa lý..........................15
2.1.3 Kiến trúc một hệ quản trị cơ sở dữ liệu..........................................16
2.1.4 Tính độc lập dữ liệu....................................................................... 19
2.1.5 Hệ quản trị cơ sở dữ liệu của GIS.................................................. 21
2.2 Quản lý cơ sở dữ liệu trong GIS........................................................... 24
2.2.1 SDE Geodatabase...........................................................................24
2.2.2 Quản lý cơ sở dữ liệu trong GIS.................................................... 27
2.2.3 Những kiến thức cơ sở................................................................... 28
CHƯƠNG 3 TRIỂN KHAI CÀI ĐẶT ARCSDE VÀ PHƯƠNG PHÁP LƯU
TRỮ DỮ LIỆU BẢN ĐỒ KHU DU LỊCH TRÀNG AN .............................. 37
3.1 Cấu hình và cài đặt ArcSDE................................................................. 37
3.1.1 Phần mềm cài đặt........................................................................... 37
3.1.2 Yêu cầu cấu hình............................................................................37
3.1.3 Cài đặt............................................................................................ 40
Nguyễn Mạnh
Cường
3
Tin học Trắc địa K49
Đồ án tốt nghiệp chuyên ngành Tin học Trắc
địa 3.1.4 Phương pháp lưu trữ và chuyển dữ liệu bản đồ khu du lịch Tràng
An vào SDE Geodatabase ...................................................................... 57
KẾT LUẬN.....................................................................................................63
TÀI LIỆU THAM KHẢO...............................................................................64
PHỤ LỤC........................................................................................................65
LUẬT TOPOLOGY....................................................................................65
DANH MỤC CÁC HÌNH VÀ BẢNG............................................................83
Nguyễn Mạnh
Cường
4
Tin học Trắc địa K49
CHƯƠNG 1
TỔNG QUAN VỀ ARCSDE
1.1 Khái niệm ArcSDE
1.1.1 Khái niệm
ArcSDE là một ứng dụng trên máy chủ, mà ứng dụng của nó là lưu trữ
và quản lý dữ liệu không gian raster, vector và số liệu khảo sát dựa trên những
hệ quản trị CSDL thịnh hành hiện nay (IBM DB2, Informix, SQL Server, và
Oracle), nhằm tăng khả năng khai thác dữ liệu từ các ứng dụng đơn lẻ.
ArcSDE Server sử dụng cùng với các sản phẩm ArcGIS Desktop
(ArcView, ArcEditor và ArcInfo) hay các sản phẩm phát triển của ArcGIS
(ArcGIS Engine, ArcGIS Server và ArcIMS với tính năng quản lý dữ liệu đa
người dùng).
ArcSDE là cổng nối giữa các ứng dụng GIS và hệ thống quản lý cơ sở
dữ liệu quan hệ (RDBMS). ArcSDE cho phép nhiều người dùng từ các phần
mềm GIS như ArcInfo, ArcEditor, ArcView, và ArcIMS, MapObject có thể
lưu trữ, quản lý và truy cập trực tiếp tới dữ liệu không gian được lưu trong
RDBMS. ArcSDE tương thích với nhiều RDBMS nổi tiếng như Oracle,
Informix, IBM DB2, and Microsoft SQL Server.
ArcSDE là thành phần chính trong quản lý dữ liệu chia sẻ và đa người
dùng.
ArcSDE cho phép quản lý một geodatabase quy mô lớn, có khả năng
hiển thị và cập nhật đồng thời bởi nhiều người, tốc độ truy cập và tìm kiếm
cực cao, ArcSDE thực sự là thành phần cần thiết cho các hệ thống GIS tầm
trung và lớn.
1.1.2 Chức năng ArcSDE
Như một cổng giao tiếp để quản lý CSDL
Là một hệ quản trị CSDL mở
Là hệ thống quản lý đa người dùng
Thực hiện các chức năng của GIS trong CSDL lớn
Là mô hình thông tin địa lý phức tạp Cấu hình một cách mềm dẻo
1.2 Tầm quan trọng của ArcSDE trong ArcGIS
Tầm quan trọng của ArcSDE trong ArcGIS
Một ưu thế của ArcGIS là khả năng tiếp cận và sử dụng dữ liệu ở nhiều
định dạng, từ nhiều hệ thống quản trị dữ liệu, đồng thời quản lý dữ liệu cơ sở.
ArcSDE là cổng kết nối ArcGIS với phần quản trị thông tin trong hệ thống
quản trị dữ liệu quan hệ (RDBMS).
ArcSDE server cung cấp cổng liên lạc cho phép lưu trữ, quản lý và truy
cập các thông tin không gian từ bất kỳ hệ thống quản trị cơ sở dữ liệu quan hệ
(RDBMSs) trong bất kỳ ứng dụng nào của ArcGIS. Đây là một thành phần
quan trọng quản lý cơ sở dữ liệu chia sẻ và đa người sử dụng trong RDBMS.
ArcSDE làm tăng thêm những khả năng cần thiết cho ArcGIS khi người sử
dụng cần một cơ sở dữ liệu geodatabase quy mô lớn có thể chỉnh sửa và hiển
thị tức thì trong môi trường có nhiều người sử dụng.
Những tiện ích của ArcSDE
ArcSDE cung cấp một số tiện ích quan trọng cho người sử dụng
geodatabase
-Hiệu suất cao
-Dung lượng dữ liệu cực lớn
-Toàn bộ thông tin không gian được đảm bảo chính xác
-Mô hình thông tin tích hợp cho nhiều đối tượng sử dụng GIS.
-Quản lý các thông tin không gian toàn diện trên nhiều dạng dữ liệu
(vectors, rasters, số liệu điều tra…)
-Giao diện dữ liệu chung cho tất cả các hệ thống quản trị dữ liệu quan
hệ (RDBMSs).
-Hỗ trợ geodatabase và các mô hình dữ liệu của ESRI
-Giảm chi phí
ArcSDE là server ứng dụng địa lý bậc cao cho những cơ sở dữ liệu
quan hệ, người sử dụng quản lý các thông tin địa lý với bất kỳ RDBMSs và
giúp cho dữ liệu của người sử dụng được mở trong tất cả các ứng dụng của
ArcGIS.
-Truy cập đồng thời tới nhiều cơ sở dữ liệu GIS
Nhiều dữ liệu GIS biên dịch, phân tích, bản đồ hoá và quản lý công
việc đòi hỏi dữ liệu được tích hợp từ nhiều file và nhiều nguồn hệ quản trị dữ
liệu quan hệ. ArcSDE cung cấp cổng chung cho tất cả các loại dữ liệu mà
không cần quan tâm đến định dạng và nguồn lưu trữ, đồng thời nó còn dễ
dàng linh động giữa các hệ quản trị dữ liệu quan hệ khác nhau.
Vì sao phải sử dụng ArcSDE
ArcSDE cho phép quản lý dữ liệu không gian với hiệu suất cao trên
nhiều loại cấu hình cơ sở dữ liệu (IBM DB2 Universal Database, IBM
Informix Dynamic Server, Microsoft SQL Server, and Oracle) giống như khả
năng của tất cả các hệ quản trị cơ sở dữ liệu quan hệ.
Mặc dù tất cả cơ sở dữ liệu quan hệ đơn lẻ thông qua SQL nhưng vẫn
có sự khác nhau đáng kể trong những cơ sở dữ liệu đơn lẻ khi xét chi tiết
trong nguồn dữ liệu. Điều đó liên quan đến tốc độ và chỉ số, những dạng dữ
liệu cung cấp, các công cụ quản lý đồng bộ và việc tiến hành các truy vấn
phức tạp.
Tính năng vượt trội của ArcSDE
ArcSDE được thiết kế để xử lý với sự đa dạng, phức tạp trên cơ sở nền
tảng hệ thống quản trị cơ sở dữ liệu quan hệ. Cấu trúc ArcSDE là linh hoạt
nhất và nhiều lựa chọn cho người sử dụng. Cấu trúc của nó cho phép lựa chọn
mở những dữ liệu đơn lẻ và những biểu đồ tự nhiên cũng như truy cập dữ liệu
nhanh và toàn bộ không gian trên từng công cụ dữ liệu quan hệ. ArcSDE cho
phép thúc đẩy khả năng của từng RDBMS đơn lẻ.
Là cầu nối giữa ArcGIS geodatabase và những tính năng của RDBMS.
Quản lý thông tin địa lý, cũng giống như nhiều ứng dụng khác như kế hoạch
kinh doanh và quản lý quan hệ khách hàng, đòi hỏi sự tập trung ứng dụng chặt
chẽ hơn trên RDBMS (ví dụ: ArcGIS Desktop hoặc ArcIMS/ArcGIS Server)
Song hành GIS với xu thế phát triển IT (Công nghệ thông tin)
Nhiều người sử dụng đòi hỏi GIS của họ phải tương thích với cộng
nghệ IT mà họ sử dụng. Hiểu đơn giản là các ứng dụng GIS mà họ sử dụng
gắn liền với những tiêu chuẩn công nghệ thông tin; thông tin GIS được quản
lý như một phần không thể thiếu trong cơ sở dữ liệu của người sử dụng, dữ
liệu phải được bảo vệ và việc truy cập dữ liệu phải hạn chế ở các mức độ khác
nhau tuỳ theo người sử dụng. Đấy là những tiện ích chuẩn của RDBMS mà
người sử dụng GIS cần.
Từ khi ArcSDE cung ứng phương tiện cho lưu trữ và sử dụng dữ liệu
GIS trong RDBMS với các ứng dụng đa dạng trong và ngoài GIS,
ArcSDE
luôn hoạt động với vai trò quan trọng trong việc song hành giữa GIS và chiến
lược IT.
Tính năng vượt trội của ArcSDE
ArcSDE được thiết kế để xử lý với sự đa dạng, phức tạp trên cơ sở nền
tảng hệ thống quản trị cơ sở dữ liệu quan hệ. Cấu trúc ArcSDE là linh hoạt
nhất và nhiều lựa chọn cho người sử dụng. Cấu trúc của nó cho phép lựa chọn
mở những dữ liệu đơn lẻ và những biểu đồ tự nhiên cũng như truy cập dữ liệu
nhanh và toàn bộ không gian trên từng công cụ dữ liệu quan hệ. ArcSDE cho
phép thúc đẩy khả năng của từng RDBMS đơn lẻ.
Là cầu nối giữa ArcGIS geodatabase và những tính năng của RDBMS.
Quản lý thông tin địa lý, cũng giống như nhiều ứng dụng khác như kế hoạch
kinh doanh và quản lý quan hệ khách hàng, đòi hỏi sự tập trung ứng dụng chặt
chẽ hơn trên RDBMS (ví dụ: ArcGIS Desktop hoặc ArcIMS/ArcGIS Server)
Giảm chi phí
Với ArcSDE, dữ liệu không gian được lưu trữ tập trung, chi phí sở hữu
thấp. Dữ liệu có thể được triển khai trên nhiều nền server (Windows, Linux,
UNIX) và trên nhiều nền cơ sở dữ liệu. Hơn nữa, ArcSDE đảm bảo về dữ liệu
luôn được hỗ trợ bởi tốc độ cao, bảo toàn dữ liệu và không làm ảnh hưởng
đến tính linh động trong RDBMS.
Ai sử dụng ArcSDE
ArcSDE đã được ứng dụng rộng rãi trên thế giới, có hàng ngàn các tổ
chức cá nhân lưu trữ, quản lý dữ liệu không gian lưu trữ trên RDBMS và phổ
biến một cách dễ dàng. ArcSDE còn được ứng dụng ở hầu hết các cấp quản lý
nhà nước, trong quốc phòng, thông tin, tài nguyên thiên nhiên, giao thông,
bảo hiểm, tài chính và nhiều ngành công nghiệp.
Bất kỳ người sử dụng ArcGIS trong quản lý các thông tin địa lý trong
RDBMS đều nhận thấy tiềm năng sử dụng của ArcSDE.
Server GIS Functionality
Multiuser data management in DBMS
Multiuser, configurable GIS data server
GIS Web publishing—Maps
GIS Web publishing—Data
GIS Web publishing-Metadata (XML-based
services)
HTML mapping application
Java mapping application
ASP and ISP connector for developers
Metadata catalog management and search
Support for Web interoperability
Web application development framework for
.NET, ASP, and Java ISP
Data access update and API
Server-based GIS editing
Distributed
data
managementDownload/Upload
Distributed data management-Extract/Insert
Distributed data management-Replication
GIS analysis in a central server
Comprehensive ArcObjects library for
enterprise and Web developers
SOAP-based GIS Web services
Raster analysis tools
Terrain/3D tools
ArcSDE ArcIMS ArcGIS
Server
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
Bảng 1.1 Bảng so sánh sản phẩm
Tính năng mới trong ArcSDE 9
Với việc hỗ trợ thêm tốt hơn về hiệu suất và khả năng linh hoạt theo
các mức độ áp dụng khác nhau, ArcSDE 9 cung cấp cho người sử dụng các
công cụ sau:
Nguyễn Mạnh
Cường
10
Tin học Trắc địa K49
-Hỗ trợ tích hợp những version(phiên bản) của cơ sở dữ liệu trong khi
người sử dụng vẫn kết nối với cơ sở dữ liệu
-Khả năng cập nhập dữ liệu nhanh với những file raster lớn
-Thay đổi cấu trúc một bảng trong cơ sở dữ liệu mà không cần phải
khởi động lại
-Thêm hai lựa chọn cho tạo bảng bằng tay qua cơ sở dữ liệu và bảng
tạm thời
-Quản lý bảo vệ sao chép phần mềm không cần khoá cứng trong máy
chủ Windows
-Hoàn thiện dịch vụ báo lỗi (thêm nhiều lựa chọn )
-Windows group hỗ trợ trong SQL Server
-DB2 Group hỗ trợ trong DB2, bao gồm Windows Groups trên
Windows servers
-Thêm nền tảng hỗ trợ bao gồm cho Sun Solaris, HP-UX, and Red Hat
Linux Advanced Server with IBM DB2
-Chức năng kết nối trực tiếp với DB2 và Informix
-Chức năng hiển thị đa version với DB2 và Informix
-Một mô hình dữ liệu không gian mới cho SQL Server
-Hỗ trợ nén đinh dạng JPEG 2000 cho dữ liệu raster
-Hỗ trợ chuẩn OGC (Open Geospatial Consortium)
-Các hàm API cho Java được phát triển tốt hơn (hỗ trợ các chức năng
quản lý raster)
Ưu thế chính trong ArcSDE
Nguyễn Mạnh
Cường
11
Tin học Trắc địa K49
ArcSDE có vai trò quan trọng trong môi trường đa người sử dụng GIS
vì những tính năng cơ bản sau:
-Cổng kết nối tốc độ cao
ArcSDE là cổng kết nối tới nhiều RDBMSs, đây không phải là một cơ
sở dữ liệu quan hệ hay mô hình lưu trữ mà là một giao diện bậc cao, quản lý
dữ liệu GIS tốc độ cao trên nền một số RDBMS
-Hỗ trợ RDBMS mở
ArcSDE cho phép người sử dụng quản lý thông tin địa lý tương thích
với một số RDBMSs: IBM DB2, Informix, Microsoft SQL Server, and Oracle
-Đa người sử dụng
ArcSDE cho phép nhiều người cùng truy cập tới geodatabases
-Khả năng co giãn trong cơ sở dữ liệu
ArcSDE có thể cung ứng geodatabases quy mô lớn với bất lỳ số lượng
người sử dung, trong khi đó RDBMS có sự hạn chế này
-Tính liên tục và đa thời gian
Việc quản lý dữ liệu liên tục trên GIS, chẳng hạn khi nhiều ngýời sửa
chữa, kiểm tra, ArcSDE hỗ trợ công cụ này qua RDBMSs
-Mô hình hoá thông tin địa lý toàn diện
ArcSDE đảm bảo lưu trữ toàn bộ dữ liệu với đầy đủ khuôn dạng hình
học, các thông số như hệ toạ độ x,y,z, cung đường, không gian lập thể, bản
đồ, các lớp, metadata, topology….
-Tính nguyên vẹn dữ liệu không gian
ArcSDE đảm bảo lưu trữ nguyên vẹn dữ liệu không gian trong bất kỳ
RDBMS, cũng như đảm bảo nguyên vẹn về hình học của tất cả các dữ liệu
Nguyễn Mạnh
Cường
12
Tin học Trắc địa K49
không gian. Khi kết hợp với các ứng dụng logic geodatabase, nó cho phép dữ
liệu quy mô lớn có thể được tiếp cận và duy trì với bất kỳ lượng người sử
dụng nào
-Cấu hình linh hoạt
Cổng ArcSDE cho phép lựa chọn đa cấu hình cho hệ máy chủ, nó
tương thích với nhiều hệ điều hành Windows, UNIX, và Linux
-Lưu trữ hình học không gian
ArcSDE cho phép quản lý và sử dụng dữ liệu RDBMS cơ sở với các
ứng dụng GIS, truy cập dữ liệu được lưu trong RDBMS và làm nổi bật các
mặt mạnh về khả năng khái quát của RDBMS và các dạng dữ liệu SQL Việc
thúc đẩy khả năng khái quát nhằm trợ giúp nhu cầu của người sử dụng GIS
-ArcSDE for Coverages
Trong khi ArcSDE được biết đến như là một công cụ cho truy cập dữ
liệu trong RDBMSs, nó còn cung cấp file dữ liệu không gian cơ sở. Server
này được gọi là ArcSDE for Coverages, cung cấp một số file vector cơ sở
trong toàn bộ dữ liệu
Nguyễn Mạnh
Cường
13
Tin học Trắc địa K49
CHƯƠNG 2
TỔ CHỨC VÀ QUẢN LÝ CƠ SỞ DỮ LIỆU GIS
2.1 Tổ chức cơ sở dữ liệu trong GIS
2.1.1 Khái niệm cơ bản về hệ cơ sở dữ liệu
“Chức năng của hệ thống thông tin địa lý là để cải thiện khả năng người
sử dụng để đánh giá đưa đến sự quyết định trong nghiên cứu, qui hoạch và
quản lý. Để sắp xếp cho một số hệ thống thông tin, người sử dụng cần phải
được cung cấp dữ liệu một cách đầy đủ và hữu hiệu, điều này đạt được bởi
phương pháp của hệ thống quản lý dữ liệu (DBMS). Một DBMS có thể được
định nghĩa như sau: Một sự liên kết các dữ liệu đã lưu trữ cùng với nhau mà
không gây một trở ngại hoặc việc làm dư thừa không cần thiết nhằm giúp ích
cho chương trình được gia tăng khả năng sử dụng lên gấp bội; dữ liệu được
lưu trữ để chúng là chương trình độc lập mà dữ liệu được sử dụng một cách
phổ biến, và việc điều khiển trong việc thêm dữ liệu mới, hoặc sửa đổi và
khôi phục dữ kiện hiện có bên trong hệ thống dữ liệu. Dữ liệu được kết cấu
như thế để cung cấp một nền tảng cho việc phát triển sau này"(Martin, 1977)
Để dễ dàng cho việc giải thích các khái niệm trước hết chúng ta sẽ tìm
hiểu bản đồ khu du lịch Tràng An. Dữ liệu khu du lịch được lưu trữ trong máy
tính bao gồm thông tin về khách du lịch, hệ thống khách sạn, đường.....
Mọi thông tin về mối quan hệ này được biểu diễn trong máy thông qua việc
đăng ký của khách du lịch. Vậy làm thế nào để biểu diễn được dữ liệu đó và
để đảm bảo cho hành khách đi đúng chuyến
• Dữ liệu nêu trên được lưu trong máy theo một qui định nào đó và
được gọi là cơ sở dữ liệu (CSDL, tiếng Anh là Database).
• Phần chương trình để có thể xử lý, thay đổi dữ liệu này là hệ quản trị
cơ sở dữ liệu (HQTCSDL, Database Management System).
Nguyễn Mạnh
Cường
14
Tin học Trắc địa K49
Theo nghĩa này HQTCSDL có nhiệm vụ rất quan trọng như là một bộ
diễn dịch (Interpreter) với ngôn ngữ bậc cao nhằm giúp người sử dụng có thể
dùng được hệ thống mà ít nhiều không cần quan tâm đến thuật toán chi tiết
hoặc biểu diễn dữ liệu trong máy.
Các loại thông tin trong hệ thống thông tin địa lý
Như trên đã giới thiệu dữ liệu trong hệ thống thông tin địa lý bao gồm
dữ liệu địa lý và dữ liệu thuộc tính:
Dữ liệu địa lý: bao gồm các thể loại
- Ảnh hàng không vũ trụ
- Bản đồ trực ảnh (orthophotomap)
- Bản đồ nền địa hình lập từ ảnh hàng không - vũ trụ
- Bản đồ địa hình lập từ số liệu đo đạc mặt đất
- Bản đồ địa chính
- Bản đồ địa lý tổng hợp từ các loại bản đồ địa hình.
Các loại ảnh và bản đồ nói trên đều ở dạng số và lưu lại dưới dạng
vector hoặc raster hỗn hợp raster-vector. Các dữ liệu địa lý dưới dạng vector
được phân lớp thông tin yêu cầu của việc tổ chức các thông tin. Thông thường
người ta hay phân lớp theo tính chất thông tin: lớp địa hình, lớp thuỷ văn, lớp
đường giao thông, lớp dân cư, lớp thức phụ, lớp giới hành chính v.v.. Trong
nhiều trường hợp để quản lý sâu hơn, người ta sẽ phân lớp chuyên biệt hơn
như trong lớp thuỷ văn được phân thành các lớp con: các lớp sông lớn, sông
nhỏ, lớp biển, lớp ao hồ,v.v…
Các thông tin ở dạng raster là các thông tin nguồn và các thông tin hỗ
trợ, không gian quản lý như một đối tượng địa lý. Các thông tin ở dạng vector
tham gia trực tiếp quản lý và được định nghĩa như những đối tượng địa lý.
Nguyễn Mạnh
Cường
15
Tin học Trắc địa K49
Các đối tượng này thể hiện ở 3 dạng: điểm, đường và vùng hoặc miền. Mỗi
đối tượng đều có thuộc tính hình học riêng như kích thước, miền vị trí. Vấn
đề được đặt ra là tổ chức lưu trữ và hiển thị các thông tin vector như thế nào
để thoả mãn các yêu cầu sau:
- Thể hiện đầy đủ các thông tin cần thiết
- Độ dư và độ thừa nhỏ nhất
- Truy cập thông tin nhanh
- Cập nhật thông tin dễ dàng và không sai sót (xoá bỏ thông tin không
cần thiết, bổ sung thông tin mới , chỉnh lý các thông tin đã lạc hậu)
- Thuận lợi cho việc hiển thị thông tin
Dữ liệu thuộc tính (Attribute)
Là các thông tin giải thích cho các hiện tượng địa lý gắn liền với hiện
tượng địa lý. Các thông tin này được lưu trữ dữ liệu thông thường. Vấn đề đặt
ra là là phải tìm mối quan hệ giữa thông tin địa lý và thông tin thuộc tính. Từ
thông tin ta có thể tìm ra được các thông tin kia trong cơ sở dữ liệu.
2.1.2 Kiến trúc một hệ quản trị cơ sở dữ liệu
Một CSDL được phân thành các mức khác nhau. Ở đây có thể xem như
chỉ có một CSDL đơn giản và có một hệ phần mềm QTCSDL.
Hình 2.1 Cấu trúc hệ Cơ sở dữ liệu
Nguyễn Mạnh
Cường
16
Tin học Trắc địa K49
Sự trừu tượng hoá dữ liệu
- CSDL vật lý (mức vật lý) là các tệp dữ liệu theo một cấu trúc nào đó
được lưu trên các thiết bị nhớ thứ cấp (như đĩa từ, băng từ, ... )
- CSDL mức khái niệm là một sự biểu diễn trừu tượng của CSDL vật lý
(còn có thể nói tương đương: CSDL mức vật lý là sự cài đặt cụ thể của
CSDL mức khái niệm.
- Các khung nhìn (view) là cách nhìn, là quan niệm của từng người sử
dụng đối với CSDL mức khái niệm. Sự khác nhau giữa khung nhìn và mức
khái niệm thực chất là không lớn
Hình 2.2 Sơ đồ tổng quát hệ cơ sở dữ liệu
Thể hiện và lược đồ của CSDL
- Thể hiện của CSDL (INSTANCE)
Khi CSDL đã được thiết kế, thường người ta quan tâm tới “bộ khung“
hay còn gọi là “mẫu” của CSDL. Dữ liệu có trong CSDL gọi là thể hiện của
CSDL, mặc dù khi dữ liệu thay đổi trong một chu kỳ thời gian nào đó thì ”bộ
khung“ của CSDL vẫn không thay đổi.
CSDL luôn thay đổi mỗi khi thông tin được thêm vào hay bị xoá đi.
Tập hợp các thông tin lưu trữ trong CSDL tại một thời điểm nào đó được gọi
là một thể hiện của CSDL.
- Lược đồ của CSDL (Scheme)
Nguyễn Mạnh
Cường
17
Tin học Trắc địa K49
Thiết kế tổng quan của CSDL được gọi là lược đồ (hay sơ đồ) của
CSDL. Lược đồ của CSDL ít khi bị thay đổi. Trong một ngôn ngữ lập trình,
nó tương ứng với các tập định nghĩa của các kiểu dữ liệu (kiểu mẫu tin, kiểu
bảng, …)
Thường “ bộ khung” nêu trên bao gồm một số danh mục hoặc chỉ tiêu
hoặc một số kiểu của các thực thể trong CSDL. Giữa các thực thể có thể có
mối quan hệ nào đó với nhau. Ở đây sử dụng thuật ngữ “ lược đồ” để thay thế
cho khái niệm “ bộ khung”.
Lược đồ khái niệm là bộ khung của CSDL mức vật lý, khung nhìn
được gọi là lược đồ con (Subscheme).
- Lược đồ khái niệm và mô hình dữ liệu
Lược đồ khái niệm là sự biểu diễn thế giới thực bằng một loại ngôn ngữ
phù hợp, hệ QTCSDL cung cấp ngôn ngữ định nghĩa dữ liệu cho lược đồ con
(subscheme data definition language) để xác định lược đồ khái niệm. Đây là
ngôn ngữ bậc cao có khả năng mô tả lược đồ khái niệm bằng cách biểu diễn
của mô hình dữ liệu. Ví dụ mô hình dữ liệu phù hợp là một đồ thị có hướng
(mô hình mạng - Network model), trong đó các đỉnh biểu diễn mối quan hệ
giữa các thực thể (như hành khách, chuyến bay), các cạnh của đồ thị biểu diễn
mối quan hệ giữa các thực thể (như xác định đội bay cho mỗi chuyến bay).
Các mô hình của CSDL
- Mô hình phân cấp (HIERACHICAL)
Mô hình dữ liệu là một cây, trong đó các nút biểu diễn các tập thực thể,
giữa các nút con và nút cha được liên hệ theo một mối quan hệ xác định.
Điểm nổi bật trong các thủ tục truy xuất đến một đối tượng trong mô hình
phân cấp là đường dẫn đi từ gốc đến phần tử cần xét trong cây phân cấp.
Nguyễn Mạnh
Cường
18
Tin học Trắc địa K49
Mô hình phân cấp khá phù hợp với những hình thức tổ chức phân cấp
trong xã hội. Thường gặp trong các hệ thống máy tính là mô hình quản lý thư
mục
- Mô hình lưới (Network Model)
Mô hình dữ liệu kiểu lưới là mô hình cho phép dùng một mô hình đồ
thị trực tiếp và đơn giản cho dữ liệu.
Mô hình lưới và mô hình phân cấp nói chung là khá bất tiện cho lưu trữ
và khai thác xử lý bởi vì toạ độ các điểm, một số cạnh phải lưu trữ nhiều lần
gây nên sự dư thừa dữ liệu. Ngoài ra, hệ thống còn phải cần lưu trữ một số
lớn các con trỏ móc nối gây nên phức tạp trong quá trình cập nhật, biến đổi dữ
liệu, đặc biệt khi thêm bớt một cạnh hoặc một một đỉnh nào đó.
- Mô hình quan hệ (Relational Model)
Mô hình này dựa trên cơ sở khái niệm lý thuyết tập hợp của các quan
hệ, tức là tập các K - bộ với K cố định.
Thuận lợi của mô hình quan hệ là được hình thức hoá toán học chặt chẽ
do đó các xử lý, thao tác với dữ liệu là dễ dàng, có tính độc lập dữ liệu cao.
Cấu trúc dữ liệu đơn giản mềm dẻo trong xử lý và dễ dàng cho người sử
dụng. Đặc biệt các phép tính cập nhật dữ liệu cho mô hình quan hệ nói chung
là ít phức tạp hơn nhiều so với các mô hình khác.
Trên cơ sở mô hình dữ liệu quan hệ, đến nay đã phát triển thêm một số
loại mô hình khác nhằm mô tả và thể hiện thế giới thực một cách chính xác và
phù hợp hơn như mô hình quan hệ thực thể (Entily Relationship model), mô
hình dữ liệu hướng đối tượng (Object Oriented Model)
2.1.3 Tính độc lập dữ liệu
Nguyễn Mạnh
Cường
Sự phụ thuộc dữ liệu của các ứng dụng hiện nay
19
Tin học Trắc địa K49
Một hệ ứng dụng được gọi là phụ thuộc dữ liệu khi không thể thay đổi
được cấu trúc lưu trữ hoặc chiến lược truy xuất mà không ảnh hưởng đến
chương trình ứng dụng.
Lúc đó, các khó khăn gây nên bởi cấu trúc mặt ghép nối của các
chương trình xử lý tập tin, chứ không liên quan gì đến vấn đề mà hệ ứng dụng
viết ra để giải quyết.
Yêu cầu của các hệ ứng dụng
- Các hệ ứng dụng khác nhau cần có những cái nhìn khác nhau đối với
những dữ liệu khác nhau.
- Người quản trị cơ sở dữ liệu phải có khả năng thay đổi cấu trúc lưu
trữ hoặc chiến lược truy xuất để đáp ứng các yêu cầu thay đổi mà không cần
phải sửa đổi các chương trình ứng dụng hiện có.
Định nghĩa tính độc lập dữ liệu
Tính độc lập dữ liệu là tính bất biến của các hệ ứng dụng đối với các
thay đổi trong cấu trúc lưu trữ và chiến lược truy xuất.
Phân loại tính độc lập dữ liệu
- Độc lập dữ liệu ở mức vật lý:
Theo hình trên, từ khung nhìn, tới CSDL khái niệm và CSDL vật lý cho
thấy có hai mức “độc lập tư liệu”. Thứ nhất: Lược đồ có thể thay đổi do người
quản trị CSDL mà không cần thay đổi lược đồ con. Việc tổ chức lại CSDL vật
lý (thay đổi các tổ chức, cấu trúc dữ liệu trên các thiết bị nhớ thứ cấp) có thể
làm thay đổi hiệu quả tính toán của các chương trình ứng dụng nhưng không
đòi hỏi phải viết lại các chương trình đó. Tính độc lập này gọi là Độc lập dữ
liệu mức vật lý.
- Độc lập dữ liệu ở mức logic:
Nguyễn Mạnh
Cường
20
Tin học Trắc địa K49
Mối quan hệ giữa các khung hình và lược đồ khái niệm cho thêm một
loại độc lập, gọi là độc lập dữ liệu logic. Khi sử dụng một CSDL, có thể cần
thiết để thay đổi lược đồ khái niệm như thêm thông tin về các loại khác nhau
của các thực thể hoặc bớt xoá các thông tin về các thực thể đang tồn tại trong
CSDL. Việc thay đổi lược đồ khái niệm không làm ảnh hưởng tới các lược đồ
con đang tồn tại, do đó không cần thiết phải thay đổi các chương trình ứng
dụng.
2.1.4 Hệ quản trị cơ sở dữ liệu của GIS
Hệ quản trị cơ sở dữ liệu là hệ thống quản lý, lưu trữ, bảo trì toàn bộ cơ
sở dữ liệu. Hệ quản trị cơ sở dữ liệu cũng cung cấp các công cụ cho phép
người dùng hỏi đáp, tra cứu và tác động vào cơ sở dữ liệu. Cơ sở dữ liệu cho
một hệ thống GIS bao gồm 2 cơ sở dữ liệu thành phần chính là :
- Cơ sở dữ liệu địa lý (không gian)
- Cơ sở dữ liệu thuộc tính (phi không gian)
Trong hệ thống GIS, hệ quản trị cơ sở dữ liệu GIS được xây dựng bao
gồm 2 hệ quản trị cơ sở dữ liệu riêng cho từng phần hoặc xây dựng một hệ
quản trị cơ sở dữ liệu chung cho cả hai cơ sở dữ liệu con kể trên. Thông
thường hệ quản trị cơ sở dữ liệu GIS được xây dựng bao gồm 3 hệ quản trị cơ
sở dữ liệu con:
- Hệ quản trị cơ sở dữ liệu cho cơ sở dữ liệu địa lý.
- Hệ quản trị cơ sở dữ liệu quan hệ ở mức tra cứu, hỏi đáp. Hệ này
được tích hợp cùng với hệ quản trị cơ sở dữ liệu địa lý cho phép người ta
dùng truy nhập dữ liệu địa lý và dữ liệu thuộc tính đồng thời. Tuy nhiên, hệ
quản trị cơ sở dữ liệu này cho thao tác trên cơ sở dữ liệu thuộc tính bị hạn
chế.
Nguyễn Mạnh
Cường
21
Tin học Trắc địa K49
- Hệ quản trị cơ sở dữ liệu thuộc tính. Thông thường các hệ thống GIS
đều lấy một hệ quản trị cơ sở dữ liệu quan hệ hiện có để quản trị và thực hiện
các bài toán trên dữ liệu thuộc tính mà không liên quan đến dữ liệu không
gian. Ví dụ: FOX, MS SQL, ORACLE.
Về hệ quản trị cơ sở dữ liệu quản lý cơ sở dữ liệu thuộc tính, chúng ta
đã xem xét chi tiết trong phần “Hệ thống cơ sở dữ liệu“. Vì vậy, ở đây chúng
ta chỉ đi sâu vào hệ quản trị cơ sở dữ liệu cho dữ liệu không gian.
Hệ quản trị cơ sở dữ liệu cho dữ liệu không gian bao gồm các hệ thống
con sau:
- Hệ thống nhập bản đồ
- Hệ thống hiển thị bản đồ
- Hệ thống tra cứu, hỏi đáp cơ sở dữ liệu
- Hệ thống phân tích địa lý
- Hệ thống phân tích thống kê
- Hệ thống đầu ra
Hệ quản trị cơ sở dữ liệu GIS
- Hệ thống nhập bản đồ
Hệ thống cung cấp các công cụ để số hoá các đối tượng trên bản đồ.
Hiện nay tồn tại hai phương pháp để chuyển bản đồ giấy thành bản đồ số:
+ Số hoá bản đồ: dùng bàn vẽ (digitizer) ghi lại các đối tượng bản đồ
trên giấy. Chức năng có thể có trong bản thân hệ thống hoặc dùng 1 phần
mềm khác số hoá, sau đó nhập vào kết quả số hoá bởi phần mềm đó.
+ Vector hoá bản đồ: Bản đồ được quét vào thành dạng file ảnh
(scanning) sau đó chuyển sang dạng vector (vectorizing). Quá trình
Nguyễn Mạnh
Cường
22
Tin học Trắc địa K49
vectorizing có thể thực hiện thủ công qua số hoá trên màn hình (head up
digitizing) hoặc dùng phần mềm chuyển tự động/bán tự động từ ảnh sang
vector.
Một trong những nguồn dữ liệu quan trọng là dữ liệu được nhập từ các
hệ thống khác. Vì vậy hệ thống nhập bản đồ phải có chức năng nhập (import)
các dạng (format) dữ liệu khác nhau.
- Hệ thống hiển thị bản đồ
Hệ thống cung cấp các khả năng hiển thị bản đồ trên màn hình cho
người sử dụng xem. Hiện nay chức năng hiển thị bản đồ đều có khả năng
cung cấp cách nhìn 3 chiều (3D). Bản đồ sẽ được thể hiện sinh động, trực
quan hơn.
- Tra cứu, hỏi đáp cơ sở dữ liệu
Hệ thống cung cấp các công cụ cho người sử dụng tra cứu, hỏi đáp, lấy
các thông tin cần thiết trong cơ sở dữ liệu ra. Hệ thống này ảnh hưởng trực
tiếp đến tính hiệu quả của hệ thống. Bởi vì phần lớn, người dùng chỉ có yêu
cầu tra cứu thông tin. Hệ thống tra cứu phải mềm dẻo, dễ sử dụng, thời gian
truy cập dữ liệu nhanh. Hệ thống cho phép tra cứu trên cả hai dữ liệu: dữ liệu
không gian và dữ liệu thuộc tính
- Hệ thống xử lý, phân tích địa lý
Đây là hệ thống thể hiện rõ nhất sức mạnh của GIS. Hệ thống cung cấp
các công cụ cho phép người dùng xử lý, phân tích dạng dữ liệu không gian.
Từ đó, chúng ta có thể sản sinh ra các thông tin mới (thông tin dẫn suất)
Hệ thống phân tích thống kê
Hệ thống cung cấp các công cụ thống kê trên dữ liệu không gian cũng
như dữ liệu thuộc tính. Tuy nhiên các phép phân tích thống kê trên dữ liệu
Nguyễn Mạnh
Cường
23
Tin học Trắc địa K49
không gian khác biệt so với một số phép phân tích thống kê thông thường trên
dữ liệu phi không gian.
- Hệ thống in ấn bản đồ
Hệ thống có nhiệm vụ in các bản đồ kết quả ra các thiết bị ra thông
dụng như máy in (printer), máy vẽ (Plotter). Yêu cầu đối với hệ thống này là
tương thích với nhiều loại thiết bị ngoại vì hiện có trên thị trường.
2.2 Quản lý cơ sở dữ liệu trong GIS
2.2.1 SDE Geodatabase
Là dữ liệu địa lý được lưu bởi ArcSDE trong các hệ quản trị cở sở dữ
liệu RDBMS với dữ liệu không gian thuộc tính mối quan hệ của chúng
Dữ liệu lưu trong ArcSDE sẽ có các trường mã Object ID
Dữ liệu lưu có chứa mối quan hệ đối tượng
Dữ liệu lưu trong ArcSDE sẽ có các mối quan hệ và các luật về không
gian và dữ liệu thuộc tính
Geodatabase hỗ trợ nhiều định dạng lưu trữ dữ liệu như XML, DBMS,
File-database…
Trong Geodatabase có một hay nhiều Feature Dataset. Feature Dataset
là một nhóm các đối tượng có cùng hệ quy chiếu và hệ tọa độ. Một Feature
Dataset có thể chứa một hay nhiều Feature Class. Feature Class chính là đơn
vị chứa các đối tượngkhông gian của bản đồ và tương đương với một
lớp(layer) trong ArcMap. Mỗi một Feature Class chỉ chứa một dạng đối
tượng. Mỗi một Feature Class sẽ được gắn chặt với một bảng thuộc tính
(Attribute Table). Khi bạn tạo Feature Class thì bảng thuộc tính cũng được tự
động tạo theo.
Nguyễn Mạnh
Cường
24
Tin học Trắc địa K49
Các thành phần chính trong Geodatabase:
- Feature Classes
- Raster Datasets
- Tables
+ Dữ liệu dạng Raster
Hình 2.3 Dữ liệu dạng raster
Raster được hiểu là ô hình vuông có kích thước nhất định gọi là cell
hoặc pixell (picture element), cấu trúc raster là cấu trúc hình ảnh. Mỗi ô
vuông có chứa thông tin về một đối tượng hay một sự hợp phần của đối
tượng. Vị trí của đối tượng được xác định bởi vị trí của các ô vuông theo trật
tự hàng và cột. Nếu vị trí của mỗi một ô ảnh pixel được tham chiếu với vị trí
địa lý thật của nó trong một hệ tọa độ Cartesian trên Trái đất .Cấu trúc dữ liệu
Raster đơn giản nhất là cấu trúc dạng bảng, ở đó có chứa các thông tin về toạ
độ và thuộc tính phi không gian. Thông tin về vị trí được thể hiện ở toạ độ
theo hàng và cột, tính theo trật tự sắp xếp của dữ liệu. Trường hợp có nhiều
tính chất thì có thể gọi là thông tin nhiều chiều. Bảng thuộc tính hai chiều của
Nguyễn Mạnh
Cường
25
Tin học Trắc địa K49