ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
NGUYỄN GIA TUẤN ANH
PHÁT TRIỂN MỘT SỐ MÔ HÌNH DỮ LIỆU
KHÔNG -THỜI GIAN TRONG GIS
Chuyên ngành: ĐẢM BẢO TOÁN HỌC CHO MÁY TÍNH VÀ HỆ THỐNG TÍNH TOÁN
Mã số chuyên ngành: 1.01.10
Phản biện 1: PGS.TS Nguyễn Kim Lợi
Phản biện 2: TS. Võ Thị Ngọc Châu
Phản biện 3: TS. Lý Quốc Ngọc
Phản biện độc lập 1: TS. Nguyễn Đình Thuân
Phản biện độc lập 2: PGS.TS Nguyễn Kỳ Phùng
NGƯỜI HƯỚNG DẪN KHOA HỌC
PGS.TS TRẦN VĨNH PHƯỚC
Tp. HỒ CHÍ MINH – 2012
MỤC LỤC
Chương 1. GIỚI THIỆU
1.1 Giới thiệu 1
1.2 Mục tiêu luận án 2
1.3 Phương pháp tiếp cận 3
1.4 Phạm vi nghiên cứu của luận án 3
1.5 Các đóng góp chính của luận án 3
1.6 Ý nghĩa khoa học và thực tiễn 4
1.7 Bố cục luận án 5
Chương 2.
CÁC MÔ HÌNH DỮ LIỆU GIS 3 CHIỀU
2.1 Các khái niệm không gian 7
2.1.1 Các dạng thức tồn tại của một đối tượng 7
2.1.2 Không gian 8
2.1.3 Chiều 9
2.1.4 Vị trí 10
2.1.5 Hình học 10
2.1.6 Quan hệ thứ tự 12
2.1.7 Quan hệ độ đo 12
2.1.8 Quan hệ topology 12
2.1.9 Truy vấn không gian 15
2.1.10 Hướng 16
2.1.11 Cấu trúc không gian 17
2.2 Các mô hình dữ liệu GIS 3D 18
2.2.1 Các khái niệm 18
2.2.1.1 Mô hình, mô hình dữ liệu, mô hình dữ liệu không gian 19
2.2.1.2 Mô hình dữ liệu GIS 3D 21
2.2.2 Biểu diễn các đối tượng 3D bởi các đường biên 22
2.2.2.1 Mô hình 3D-FDS (Format Data Structure) 22
2.2.2.2 Mô hình TEN (Tetrahedral Network) 23
2.2.2.3 Mô hình OO (Object Oriented) 24
2.2.2.4 Mô hình SSM (Simplified Spatial Model) 25
2.2.2.5 Mô hình SOMAS (Solid Object Management System) 26
2.2.2.6 Mô hình UDM (Urban Data Model) 27
2.2.2.7 Mô hình OO3D (Object Oriented 3D) 27
2.2.2.8 Mô hình CITYGML 28
2.2.3 Biểu diễn các đối tượng 3D bởi các phần tử voxel 29
2.2.3.1 Mô hình 3D Array 29
2.2.3.2 Mô hình Octree 30
2.2.4 Biểu diễn một đối tượng theo CSG 31
2.2.5 Các mô hình tổ hợp 31
2.2.5.1 Mô hình tổ hợp V3D 31
2.2.5.2 Mô hình tổ hợp giữa B_REP và CSG 32
2.3 So sánh các mô hình 33
2.3.1 So sánh các mô hình trên các tiêu chí: biểu diễn mặt, biểu diễn bên trong giữa các mô
hình. 34
2.3.2 So sánh các mô hình trên các tiêu chí: các phần tử chính, các đối tượng phụ, cơ sở và
ứng dụng 34
2.3.4 So sánh các mô hình trên các tiêu chí: cấu trúc không gian, hướng, độ đo và topology
35
2.3.5 So sánh các mô hình theo các chuẩn về truy vấn: thuộc tính, vị trí và topology 37
2.4 Kết luận chương 2 38
Chương 3.
MÔ HÌNH SUDM, TUDM, LUDM
3.1 Mô hình UDM (Urban Data Model) 40
3.2 Các quan hệ trong mô hình UDM 40
3.3 Mô hình SUDM (Specialized Urban Data Model) 43
3.3.1 Cải tiến đối tượng Bề mặt (Surface) 43
3.3.2 Cải tiến các khối dạng hình trụ 45
3.3.3 Cải tiến khối 3D dạng hình lăng trụ 46
3.3.4 Các cải tiến khác 48
3.3.5 UDM sau các đề xuất 1, 2, 3, 4 51
3.3.6 Tiểu kết phần 3.3 55
3.4 Mô hình TUDM (Temporal Urban Data Model) 55
3.4.1 Các khái niệm liên quan đến thời gian 55
3.4.1.1 Sự cần thiết của thời gian và mô hình dữ liệu không gian-thời gian (2D+1) 55
3.4.1.2 Đặc điểm của thời gian 58
3.4.1.3 Các ngữ nghĩa liên quan đến thời gian 59
3.4.1.4 Các loại dữ liệu thời gian 59
3.4.1.5 Các yếu tố liên quan đến lớp thời gian 61
3.4.2 Truy vấn theo thời gian 63
3.4.3 Các lớp được tích hợp trong mô hình TUDM 64
3.4.4 Mô hình TUDM 67
3.4.5 Các truy vấn theo thời gian 69
3.4.6 Tiểu kết phần 3.4 72
3.5 Mô hình LUDM (Levels of detail Urban Data Model) 72
3.5.1 Khái niệm LOD (Levels of Detail) 72
3.5.2 OGC-Mô hình CityGML 73
3.5.3 Mô hình Mingyuan Min 75
3.5.4 So sánh LOD của 2 nhóm tác giả 76
3.5.5 Đề xuất tích hợp lớp LOD và các mối liên kết vào mô hình LUDM 77
3.5.6 Mô hình dữ liệu LUDM 78
3.5.7 Các truy vấn mẫu 84
3.5.8 Tiểu kết phần 3.5 84
Chương 4. THỰC NGHIỆM
4.1. Mô hình SUDM 86
4.1.1 Mục đích thực nghiệm 86
4.1.2 Mô tả các quan hệ và tính khối lượng dữ liệu cho UDM 87
4.1.3 Mô tả các quan hệ và tính khối lượng dữ liệu cho SUDM 88
4.1.4 Tính thời gian hiển thị 400 khối B1, 150 khối B2 cho UDM và SUDM 89
4.1.5 Phân tích kết quả 90
4.2 Mô hình TUDM 91
4.2.1 Mô tả dữ liệu mẫu 91
4.2.2 Các truy vấn 95
4.2.3 Đánh giá kết quả 104
4.3 Mô hình LUDM 106
4.3.1 Mô tả dữ liệu mẫu 107
4.3.2 Khối lượng dữ liệu và LOD 111
4.3.3 Đánh giá kết quả 111
4.4. Kết luận chương 4 113
Chương 5. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
5.1 Kết luận 114
5.2 Hướng phát triển 116
Danh mục công trình của tác giả
Tài liệu tham khảo
1
Chương 1. GIỚI THIỆU
1.1 Giới thiệu
Tùy theo cách tiếp cận sẽ có nhiều định nghĩa khác nhau về “Hệ thống thông tin địa lý
– GIS” [1].
GIS là hệ thống thông tin địa lý bao gồm bốn khả năng xử lý dữ liệu địa lí: nhập dữ
liệu; lưu trữ, truy xuất dữ liệu; gia công, phân tích dữ liệu; xuất dữ liệu.
GIS là một hệ thống sử dụng CSDL để trả lời các câu hỏ
i về bản chất địa lý của các
thực thể.
GIS là một hệ thống quản trị CSDL bằng máy tính để thu thập, lưu trữ, phân tích và
hiển thị dữ liệu không gian.
. . .
GIS 3D là một hệ thống có thể mô hình hóa, biểu diễn, quản lý, thao tác, phân tích và
hỗ trợ quyết định dựa trên thông tin liên quan đến các hiện tượng 3D [46]. Ứng dụng
của GIS 3D là rộng lớn và đa dạng. Các ứng dụng này đem lại nhiều ích lợi khi được
biểu diễn trong GIS 3D vì phản ánh trung thực về thế giới thực. Ngoài ra GIS 3D còn
hỗ trợ thông tin và giúp con người khai phá thông tin từ dữ liệu được lưu trữ hơn GIS
2D, đặc biệt trong quản lí hạ tầng [29] [71]. Tuy vậy để biểu diễn, quản lý, phân tích
các đối tượng 3D cần có các giải pháp phức tạp và khối lượng công việc cũng gia tăng
đáng kể. Các lĩnh vự
c chính của GIS 3D gồm [3][62]:
Nghiên cứu hệ sinh thái.
Bản đồ 3 chiều.
Giám sát môi trường.
Xây dựng cảnh quan quy hoạch.
Phân tích địa chất.
Xây dựng dân dụng.
Khai thác thăm dò khoáng sản.
2
Các thử thách trên GIS 3D cần giải quyết bao gồm [46]:
Mô hình dữ liệu 3D: vì mô hình dữ liệu sẽ qui định mối quan hệ giữa các đối
tượng, cách thức lưu trữ, cách phân tích dữ liệu và truy xuất dữ liệu. Hiện tại
có một số mô hình dữ liệu quan niệm đã được đề nghị, tuy vậy không có mô
hình nào là hoàn hảo. Hơn nữa các mô hình thiếu chiều thời gian, nhằm biểu
diễn và lưu trữ
lịch sử thay đổi trong vòng đời của các đối tượng.
Nhập dữ liệu: việc tăng chiều của GIS từ 2D tới 3D làm kích thước dữ liệu
gia tăng đáng kể. Sự gia tăng này không những khó khăn về thể tích lưu trữ
mà còn trong việc thu nhập dữ liệu.
Phân tích không gian: các phân tích này tập trung vào các phép phân tích về
topology (giao, kề, bằng . . .) và độ đo (khoảng cách, chiều dài, diện tích, thể
tích). Trong đó topology c
ủa GIS 3D có độ phức tạp cao hơn hẳn GIS 2D.
Hiển thị: mặc dù đã có những tiến bộ vượt bậc của phần cứng máy tính trong
vấn đề cải thiện bộ nhớ và tốc độ xử lý của CPU, việc hiển thị GIS 3D vẫn
còn là một khó khăn vì yêu cầu của người dùng cần làm hẹp sự khác biệt của
tính thực tế trên máy tính và trong thế giới thực. Các mô hình hiện tại nhìn
chung chỉ hiển thị các đối tượng ở một mức.
GIS 3D và WEB: từ khi WEB trở thành một công nghệ phổ biến đối với
người dùng thì nhu cầu xây dựng các ứng dụng GIS 3D trên nền công nghệ
này càng gia tăng.
1.2 Mục tiêu luận án
Luận án tập trung phát triển các mô hình dữ liệu không-thời gian trên nền tảng mô hình
UDM do Coors đã đề xuất năm 2003.
Nội dung chính của luận án bao gồm 3 bài toán. Nghiên cứu nh
ững ưu điểm của các
mô hình dữ liệu GIS 3D sẵn có, đặc biệt là mô hình UDM, tiến hành xây dựng 3 mô
hình:
3
SUDM: được phát triển mô hình dữ liệu GIS 3D đã có-mô hình UDM. Đặc
điểm của mô hình mới là giảm chi phí về thời gian hiển thị và kích thước lưu
trữ.
TUDM: tích hợp thời gian vào mô hình dữ liệu 3D đã có-mô hình UDM để biểu
diễn và lưu trữ những thay đổi của đối tượng không gian theo thời gian.
LUDM: biểu diễn các thuộc tính không gian trên nhiều mức chi tiết khác nhau
để đáp ứng các yêu cầu đa d
ạng từ các ứng dụng và người dùng khác nhau.
1.3 Phương pháp tiếp cận
Phân tích đánh giá: các mô hình dữ liệu GIS 3D của các tác giả.
Tổng hợp: các mô hình dữ liệu GIS 3D theo nhiều tiêu chí khác nhau.
Phân tích, thiết kế: được dùng trong luận văn để biểu diễn các mô hình 3D và
4D.
Mô hình hóa dữ liệu: hệ quản trị CSDL Oracle được dùng trong luận án để biểu
diễn dữ liệu mức vật lý.
Thự
c nghiệm: lập trình được áp dụng để viết chương trình thực nghiệm các mô
hình đề xuất.
1.4 Phạm vi nghiên cứu của luận án
Luận văn tập trung nghiên cứu các vấn đề sau
Phân tích, so sánh tổng quan các mô hình dữ liệu 3D.
Phát triển mô hình dữ liệu GIS 3D mới ở 3 mức quan niệm, logic, vật lý theo
các tiêu chí về dung lượng, độ chi tiết trong hiển thị và tích hợp chiều thời gian.
Các vấn đề
thu thập dữ liệu không liên quan đến luận án.
1.5 Các đóng góp chính của luận án
4
o Phân tích các mô hình dữ liệu 3D: Luận án đã trình bày tổng quan các mô hình
dữ liệu GIS 3D của nhiều tác giả và lập các bảng so sánh những mô hình dữ liệu
3D theo nhiều tiêu chí khác nhau như: + cách biểu diễn các mặt; + biểu diễn bên
trong các khối; + các phẩn tử hình học chính-phụ; + nền tảng của mỗi mô hình;
+ các ứng dụng phù hợp; + các hỗ trợ cho truy vấn ngữ nghĩa, thời gian, không
gian; +các cấu trúc không gian, hướng và topology [CT4]. Trong phạm vi luận
án, tác giả
đã tập trung phát triển một số bổ sung vào mô hình dữ liệu UDM
theo những yêu cầu mới hơn.
o Phát triển mô hình dữ liệu SUDM: SUDM xây dựng trên nền mô hình dữ liệu
UDM do Coor đề xuất 2003 và những ứng dụng thực tế tại các dự án. Tác giả đã
đề xuất mô hình SUDM để biểu diễn các đối tượng 2D, 3D khi các đối tượng
này có các hình dạng đặc biệt. SUDM rút gọn dung lượng lưu trữ dữ li
ệu, giảm
thời gian hiển thị [CT1], [CT9].
o Phát triển mô hình dữ liệu LUDM: LUDM xây dựng trên nền mô hình dữ liệu
UDM và yêu cầu về sự phong phú trong hiển thị mức độ chi tiết của các đối
tượng trong các dự án GIS. Tác giả đã tích hợp lớp mới-LOD và các mối liên
kết phức giữa các đối tượng để hiển thị các đối tượng 3D tại nhiều mức theo nhu
cầu của người dùng và các
ứng dụng khác nhau [CT3], [CT5], [CT6], [CT7].
o Phát triển mô hình dữ liệu TUDM: TUDM xây dựng trên nền mô hình dữ liệu
UDM. Tác giả tích hợp thêm một số lớp mới và các mối liên kết phức để ghi lại
lịch sử tiến hóa của các đối tượng GIS trong cả vòng đời của các đối tượng này.
Lịch sử tiến hóa này cho các nhà quản lí biết xu thế thay đổi của các đối tượng
GIS trong tương lai để hỗ trợ
ra quyết định đúng đắn [CT2], [CT3], [CT5],
[CT8].
1.6 Ý nghĩa khoa học và thực tiễn
5
Ý nghĩa khoa học
Luận án đã nghiên cứu phân tích, so sánh các mô hình dữ liệu GIS 3D. Trên nền tảng
đó, luận án phát triển 3 mô hình dữ liệu mới. Các mô hình mới đáp ứng các mục tiêu
khoa học sau: giảm chi phí lưu trữ và thời gian hiển thị; tích hợp chiều thời gian vào
mô hình để biểu diễn và lưu trữ các biến động không gian theo thời gian; biểu diễn các
thuộc tính không gian ở nhiều mức chi tiết khác nhau để đáp ứng các nhu cầ
u đa dạng
của ứng dụng và người dùng.
Ý nghĩa thực tiễn
Các mô hình dữ liệu GIS 3D là chìa khóa trong công đoạn phân tích, thiết kế dữ liệu
của các ứng dụng GIS 3D. Các ứng dụng GIS 3D bao gồm nhiều lĩnh vực: quản lí đô
thị, phân tích địa chất, giám sát môi trường, khai thác thăm dò khoáng sản . . .Như thế,
các mô hình đề xuất trong luận án có thể dùng để tích hợp vào các ứng dụng trên trong
thực tiễn.
1.7 Bố cục luận án
Luận án được cấu trúc thành 5 chương, theo bố cục sau
Chương 1: GIỚI THIỆU
Luận án giới thiệu mục tiêu, phương pháp, phạm vi nghiên cứu và những
đóng góp chính của luận án.
Chương 2: CÁC MÔ HÌNH DỮ LIỆU GIS 3 CHIỀU
Luận án đã trình bày tổng quan, phân tích các mô hình dữ liệu 3D, lập
bảng tổng hợp, phân loại và so sánh các mô hình theo các tiêu chí cần có
của các mô hình dữ liệu 3D.
Chương 3: MÔ HÌNH DỮ LIỆ
U SUDM, TUDM, LUDM
6
Luận án mô tả chi tiết mô hình UDM, phân tích các ưu điểm và giới hạn
của UDM. Phát triển mô hình SUDM để giảm dung lượng lưu trữ và tăng
tốc độ truy xuất, hiển thị trong một số trường hợp. Mở rộng mô hình UDM
thành TUDM để biểu diễn và lưu trữ các biến đổi thuộc tính không gian
của đối tượng theo thời gian. Phát triển mô hình LUDM bằng cách tích hợp
lớp LOD mới, các mối liên kết phức vào UDM
để biểu diễn các đối tượng
3D tại các mức chi tiết khác nhau, từ đơn giản đến phức tạp và độc lập với
ngữ nghĩa.
Chương 4: THỰC NGHIỆM
Luận án trình bày kết quả hiện thực các mô hình SUDM, TUDM và
LUDM bằng chương trình viết bởi ngôn ngữ C# và hệ quản trị CSDL
Oracle. Thực nghiệm các mô hình SUDM để kiểm tra dung lượng lưu trữ
và tốc độ truy xuất hiển th
ị các đối tượng không gian. Thực nghiệm 09 câu
truy vấn không gian thời gian, bao gồm cả thời điểm, thời đoạn, thời gian
ghi vào CSDL và thời gian xảy ra trong thế giới thực. Hiển thị kết quả của
các câu truy vấn theo LOD để đánh giá lại mô hình mới với các mức chi
tiết khác nhau do người dùng định nghĩa.
Chương 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
Luận án tóm tắt các kết quả đ
ã đạt được và đề xuất hướng phát triển.
7
Chương 2. CÁC MÔ HÌNH DỮ LIỆU GIS 3 CHIỀU
Tóm tắt
Khi thêm chiều không gian thứ 3 vào trong các ứng dụng GIS 2D để trở thành GIS 3D
thì kích thước và độ phức tạp của các ứng dụng gia tăng đáng kể. Cơ sở dữ liệu của
các ứng dụng GIS 3D được xây dựng trên nền tảng mô hình dữ liệu. Mục tiêu của
chương này là trình bày các khái niệm xoay quanh mô hình dữ liệu GIS 3D, trình bày
một số mô hình GIS 3D. Phân tích các ưu điểm và hạn chế của các mô hình dữ liệu 3D
trên nhiều tiêu chí khác nhau. Bao gồm các tiêu chí: cấ
u trúc không gian, hướng, độ đo
topology, cách biểu diễn mặt, biểu diễn bên trong, các phần tử chính, các đối tượng
phụ, cơ sở ứng dụng, các truy vấn trên thuộc tính, vị trí và topology.
2.1 Các khái niệm không gian
2.1.1 Các dạng thức tồn tại của một đối tượng
Một đối tượng trong thế giới thực có thể tồn tại dưới các dạng thức sau (hình 2.1):
Đối tượng có ngữ nghĩa nhưng không quan tâm thuộ
c tính không gian và thời gian.
Đối tượng có thuộc tính không gian nhưng không quan tâm không có thuộc tính
ngữ nghĩa và thời gian, ví dụ: một khối 3D chụp từ vệ tinh.
Đối tượng có thuộc tính thời gian nhưng không quan tâm hay không có thuộc tính
ngữ nghĩa và không gian, ví dụ: thứ, năm.
Đối tượng có thuộc tính ngữ nghĩa, có thuộc tính không gian nhưng không quan
tâm hay không có thuộc tính thời gian, ví dụ: con sông.
Đối tượng có thuộc tính thời gian, có thuộc tính không gian nhưng không quan tâm
hay không có thuộc tính ngữ
nghĩa, ví dụ: một khối 3D chụp từ vệ tinh và thời gian
chụp.
Đối tượng có thuộc tính thời gian, có thuộc tính ngữ nghĩa nhưng không quan tâm
hay không có thuộc tính không gian.
8
Đối tượng có thuộc tính thời gian, có thuộc tính không gian và có cả thuộc tính ngữ
nghĩa, ví dụ: tòa nhà.
Hình 2.1 Các dạng thức của một đối tượng
Thông thường một đối tượng trong GIS có cả 3 thuộc tính: ngữ nghĩa, không gian và
thời gian (hình 2.2). Trong 10 năm gần đây, đã có một sự đánh giá trên dữ liệu thu thập
được và kết luận 80% CSDL có tối thiểu một thành phần không gian [9].
Hình 2.2 Các thành phần của một đối tượng GIS
2.1.2 Không gian
Không gian là một chủ đề mà các nhà khoa học đã cố gắng định nghĩa ở quá khứ.
Không gian và thời gian là các khái niệm được sử dụng để con người hiểu biết và hình
thành ý niệm về môi trường xung quanh [7]. Có hai phương pháp tiếp cận cho định
nghĩa này. Cách thứ nhất xem không gian là tuyệt đối, cách còn lại cho rằng không
gian là tương đối [7]. Hai cách tiếp cận này dẫn tới hai cấu trúc khác nhau khi biể
u
diễn thành phần không gian của một đối tượng trong GIS là: vector và raster.
9
Các nhà khoa học định nghĩa, không gian là tập các đối tượng và mối quan hệ giữa các
đối tượng. Các đối tượng này được trừu tượng hóa qua các khái niệm: Điểm, Đường,
Đa giác trong 2D [1][2] và Điểm, Đường, Bề mặt, Khối trong 3D [50].
Các thuộc tính và các quan hệ dùng để mô tả thành phần không gian (hình 2.3) của một
đối tượng trong GIS. Các thuộc tính gồm: chiều, vị trí và hình học. Các quan hệ gồm:
thứ tự, độ đo và topology [7].
Hình 2.3 Các thành phần không gian của đối tượng GIS
2.1.3 Chiều
Chiều là một yếu tố để phân loại trong GIS, nó mô tả số lượng chiều không gian được
hỗ trợ bởi hệ thống [7]. Hệ thống GIS n chiều sẽ hỗ trợ tất cả các đối tượng không gian
có số chiều nhỏ hơn hay bằng n. GIS 2D sẽ hỗ trợ các đối tượng có số chiều nhỏ hơn
hay bằng 2, nghĩa là các
đối tượng: 0D, 1D và 2D. Trong khi đó GIS 3D bao gồm các
đối tượng: 0D, 1D, 2D và 3D được biểu diễn trong 3 chiều [11] (hình 2.4). Hai đối
tượng 1D trong GIS 2D và GIS 3D là khác nhau. Đối tượng 1D trong GIS 2D chỉ có thể
nằm trên cùng mặt phẳng, ngược lại đối tượng 1D trong GIS 3D có thể nằm trên nhiều
mặt phẳng khác nhau. Tương tự như thế đối tượng 2D trong GIS 2D khác GIS 3D.
Trong không gian Euclide, các chiều được biểu diễn thông qua các trục toa độ, GIS 2D
hỗ trợ bởi (x,y). GIS 2.5D dùng hệ tọa độ Descartes nhưng cộng thêm thu
ộc tính chiều
cao để tạo ra chiều 0.5 [73].
10
Hình 2.4 Chiều trong GIS 1D, 2D, 3D
Thời gian trong GIS có thể xem như là một chiều mới. Khi đó GIS 2D và thời gian còn
gọi là 3D (2D không gian + 1D thời gian); GIS 3D và thời gian còn gọi là 4D (3D
không gian + 1D thời gian).
2.1.4 Vị trí
Vị trí của các đối tượng trong không gian là một yêu cầu cơ bản của bất kì hệ thống
thông tin GIS nào. Vị trí được gắn kết với một hệ qui chiếu. Các hệ qui chiếu hay sử
dụng trong GIS là hệ qui chiếu Descartes, hệ qui chiếu cực và hệ kinh tuyế
n, vĩ tuyến
[34] [74]. Hệ qui chiếu là nền tảng của GIS.
2.1.5 Hình học
Hình học là một thuộc tính không gian mô tả hình dáng của các đối tượng [7]. Các đối
tượng không gian có thể do tự nhiên hay con người tạo ra. Các lớp: Điểm (Point),
Đường (Line), Đa giác (Polygon) dùng để mô tả các đối tượng này trong 2D (hình 2.5)
và dùng các lớp Điểm (Point), Đường (Line), Bề mặt (Surface), Khối (Volume) trong
3D. Ví dụ, các đối tượng nhân tạo có thể là: tòa nhà, cây cầu, các con đường, các trụ
điện, các
ống thoát nước . . . Các đối tượng tự nhiên có thể là: biển, sông, núi, bão.
Hình 2.5 Minh họa cho Điểm, Đường, Đa giác trong 2D
Nốt (Node): là thành phần hình học trung gian để biểu diễn các thành phần hình học
chính, gồm: Điểm, Đường, Bề mặt, Khối. Một Nốt kí hiệu N được biểu diễn với 3 tọa
độ (x, y, z) trong không gian 3 chiều. Các tính chất của Nốt:
Hai Nốt khác nhau là rời nhau.
11
Phần trong (interior) của một Nốt là rỗng.
Đường biên (boundary) của một Nốt là chính nó.
Mặt (Face): là thành phần hình học trung gian để biểu diễn cho các thành phần hình học
chính, gồm: Bề mặt, Khối. Một Mặt kí hiệu bởi F, gồm tập các Nốt có thứ tự đã nối, F
phải là phẳng. Gọi x là số các Nốt, ta có x≥3. Nếu x=3 Mặt gọi là tam giác.
Điểm: là đối tượng 0D, dùng mô tả vị
trí của một thực thể mà hình dạng không được
xem xét hay diện tích là quá nhỏ so với không gian mà Điểm nhúng vào [1][38]. Ví dụ:
cột điện, trạm biến áp, cây xanh trong một bản đồ có tỉ lệ lớn.
Đường: là đối tượng 1D, thường dùng biểu diễn các đường trong những hệ thống mạng
[1][38]. Ví dụ mạng cấp thoát nước. Một Đường kí hiệu L, là một tập các chỉ mục của
n Nốt. Trong đó n
≥2.
Bề mặt: là đối tượng 2D, thường dùng biểu diễn các thực thể có diện tích lớn. Ví dụ:
sân vận động, công viên quốc gia, sân bay. Một Bề mặt kí hiệu S, là một tập các chỉ
mục gồm n Mặt, n≥1 [1][38].
Khối: là đối tượng 3D, thường dùng biểu diễn các thực thể có thể tích đáng quan tâm.
Ví dụ: các khu liên hợp thể thao, các khối chung cư. Một khối kí hiệu B, là một tập chỉ
mục của n Mặt, n≥4 [38]. Nếu n=4 thì khối gọi là tứ diện.
Hình 2.6 Minh họa cho Điểm, Đường, Bề mặt, Khối trong 3D
Hình 2.6 minh họa cho Điểm, Đường, Bề mặt, Khối trong 3D. Việc chọn Điểm,
Đường, Bề mặt, Khối để biểu diễn một đối tượng trong thế giới thực là phụ thuộc vào
mỗi mục tiêu của các ứng dụng. Tính chất của mỗi đối tượng: Điểm, Đường, Bề mặt,
Kh
ối có thể khác nhau do mỗi mô hình có định nghĩa khác nhau. Trong bản đồ thành
phố, ngôi chùa có thể chỉ là một Điểm nhưng trong ứng dụng quản lý các khối 3D trên
12
một phường lại là Khối. Đối với các đường cong, mặt cong chúng ta có thể biểu diễn
bằng phương pháp xấp xỉ. Việc xấp xỉ càng mịn thì biểu diễn càng chính xác tuy nhiên
sẽ làm kích thước dữ liệu tăng lên đáng kể.
2.1.6 Quan hệ thứ tự
Quan hệ thứ tự trình bày quan điểm so sánh giữa 2 hay nhiều đối tượng không gian. Có
2 loại quan hệ thứ tự trong GIS: thứ tự toàn phần (
) và thứ tự bộ phận ( ). Một tập
hợp được gọi là có thứ tự nếu quan hệ thứ tự được định nghĩa trên các phần tử của tập
hợp [7]. Quan hệ thứ tự thường tạo ra một mô hình cây phân cấp. Quan hệ chứa trong
là quan hệ thứ tự trong GIS. Ví dụ, một tòa nhà A được xây dựng trên khu đất B, ta nói
A
B. Hình 2.7 minh họa rõ hơn về quan hệ thứ tự: Miền Bắc Việt Nam,
Miền Nam
Việt Nam, Long An Miền Nam. . .
Hình 2.7 Một ví dụ về quan hệ thứ tự
2.1.7 Quan hệ độ đo
Quan hệ độ đo là phương thức thuần tính toán dựa trên nền tảng so sánh của những giá
trị số có liên quan đến vị trí của các đối tượng trong không gian, kích cỡ các đối tượng
và những tính toán khác [7]. Độ đo có thể là khoảng cách, diện tích, thể tích, vị trí [60].
Ví dụ, tìm khoảng cách giữa 2 cột điện; tìm chiều dài của một con
đường; tìm diện tích
của một mảnh đất hay tính thể tích (trữ lượng) của một mỏ dầu xác định.
2.1.8 Quan hệ topology
Topology mô tả mối quan hệ giữa đối tượng và những đối tượng lân cận [7]. Topology
có thể được xét trong không gian liên tục R
2
trong 2D và R
3
trong 3D hoặc trong không
gian rời rạc Z
2
trong 2D và Z
3
trong 3D.
13
Định nghĩa : Cho là một tập hợp khác rỗng. Một họ các tập con của được gọi là
topology trên
nếu thỏa mãn 3 tiên đề sau đây :
1.
2. Nếu
là một họ các phần tử của thì
3. Nếu
thì
Xét
, giả sử ta trang bị trên không gian một metric hay một khoảng
cách
với . Gọi là họ tất cả các tập mở trên lúc đó là một
không gian topology. Từ đây ta có định nghĩa hình cầu mở tâm
bán kính , ký
hiệu
, gọi là một - lân cận của .
B là tập mở trong không gian topology
khi và chỉ khi
là tập đóng trong không gian topology khi và chỉ khi là tập mở. Nếu là một
đối tượng không gian của không gian topology
, được mô tả trong lý thuyết bởi 3
thành tố: bao đóng (closure), phần trong (interior) và đường biên (boundary) [38] (hình
2.8). Cho A là một đối tượng của không gian topology
, bao đóng, phần trong, đường
biên được định nghĩa như sau:
Bao đóng (ζ): là tập đóng bé nhất chứa tập
tức là phần giao của tất cả tập đóng mà
chứa
. Điểm nằm trong bao đóng của A nếu với mọi lân cận của giao với A khác
rỗng tức là
.
Phần trong (Aº): hội của các tập mở mà chứa trong
hay là hội của tất cả các điểm
trong của
. Điểm nằm trong phần trong của ( gọi là điểm trong của ) nếu
chứa ít nhất 1 lân cận của
tức là
∀
.
Đường biên (∂A): giao của ζA và ζ(A
-1
). Điểm nằm trên đường biên của A nếu nó
nằm trên phần giao bao đóng của A và bao đóng phần bù A. A
-1
là phần bù của A.
Hình 2.8 Ba thành tố topology của một đối tượng. a. Đường biên, b. Bao đóng, c. Phần trong
14
Gọi R(A, B) là quan hệ topology giữa 2 đối tượng không gian A và B trong không gian
3 chiều, số các trường hợp xảy ra giữa A và B là 9. Ma trận 3x3 sau biểu diễn 9 trường
hợp này.
Mỗi phần tử của ma trận có 2 giá trị. Trong đó 1: biểu diễn A, B có giao nhau và 0: biểu
diễn A, B không giao nhau. Vậy mỗi quan hệ R(A, B) có 2
9
= 512 trường hợp [11] [39]
(nếu chỉ quan tâm đến sự giao nhau giữa phần trong và đường biên của A, B sẽ có 16
trường hợp [39]).
Kí hiệu: A
o
, B
o
: phần trong A, B; A
-
, B
-
: bao đóng A, B; ∂A, ∂B: đường biên A, B.
Các bảng 2.1, 2.2, 2.3, 2.4 mô tả số trường hợp các quan hệ topology giữa các đối
tượng. Trong 512 trường hợp có một số trường hợp không bao giờ xảy ra trong thực tế.
Giữa Khối và Khối là 8 trường hợp [25] (bảng 2.5).
Bảng 2.1 Topology giữa Điểm và các đối tượng khác
Điểm Đường Bề mặt Khối
Điểm 2 3 3 3
Bảng 2.2 Topology giữa Đường và các đối tượng khác
Điểm Đường
trong R
Đường
trong R
2
Đường
trong R
3
Bề mặt
trong R
2
Bề mặt
trong R
3
Khối
Đường 3 8 33 33 19 31 19
A
o
∩ B
o
A
o
∩ ∂B A
o
∩ B
-
R(A, B) = A
-
∩ B
o
A
-
∩ ∂B
A
-
∩ B
-
∂A ∩ B
o
∂A ∩ ∂B ∂A ∩ B
-
15
Bảng 2.3 Topology giữa Bề mặt và các đối tượng khác
Điểm Đường Bề mặt trong R
2
Bề mặt trong R
3
Khối
Bề mặt 3 31 8 38 19
Bảng 2.4 Topology giữa Khối với các đối tượng khác
Điểm Đường Bề mặt Khối
Khối 3 19 19 8
Bảng 2.5 Topology giữa Khối với Khối
A bằng
B
A gặp
B
A bao phủ
B
A bị B
bao phủ
A chứa B A trong
B
A rời
B
A cắt
B
Theo thời gian, các thuộc tính ngữ nghĩa, topology và hình học của một đối tượng có
thể bị thay đổi. Có 8 trường hợp thay đổi này (bảng 2.6).
2.1.9 Truy vấn không gian
Xây dựng một CSDL không gian là tạo ra tập dữ liệu có liên quan với nhau trong không
gian nhằm giải quyết các câu hỏi như: ngôi nhà A cách bệnh viện gần nhất là bao
nhiêu? Có bao nhiêu con đường giao với con đường B? Tính chiều dài của con sông C?.
Các truy vấn không gian bao gồm các dạng: truy vấn vị trí, truy vấn về mối quan hệ,
truy vấn các thuộc tính không gian khác. Để truy vấn không gian trong CSDL quan hệ,
hiện tại có 2 nhóm ngôn ngữ truy vấn chính: ngôn ngữ truy vấn không gian SQL mở
rộng và ngôn ngữ truy vấn không gian SQL hiển thị [63].
Ngôn ngữ truy vấn không gian SQL mở rộng có các ngôn ngữ: SQL/OGIS, PSQL,
QL/G, Spatial SQL, GeoSQL, CSQL, GEOQL, SQL/SDA. . . Ngôn ngữ truy vấn không
gian SQL hiển thị có các ngôn ngữ: Cigales, Query-by-Visual-Example, Spatial-Query-
by-Sketch. Trong đó, ngôn ngữ truy vấn không gian SQL mở rộng thường được sử dụng
16
hơn và 4 ngôn ngữ phổ biến là: SQL/OGIS, QL/G, SQL/SDA, PSQL. Chúng tôi lập
bảng 2.7, so sánh 4 ngôn ngữ truy vấn phổ biến. Trong đó, 1: bị thay đổi; 0: không đổi.
Bảng 2.6 Các trường hợp thay đổi của một đối tượng trong GIS
STT Hình học Topology Ngữ nghĩa Minh họa
1 1 1 1
2 1 1 0
3 1 0 1
4 0 1 1
5 1 0 0
6 0 0 1
7 0 1 0
8 0 0 0
Bảng 2.7 So sánh 4 ngôn ngữ phổ biến
SQL/OGIS QL/G SQL/SDA PSQL
Lớp dữ liệu
không gian
Point, Curve,
Surface
Point, Line,
Polygon
Point, Line,
Polygon
Point, Linesegment,
Region
Đặc điểm
chính
Các dữ liệu
không gian lưu
trên bảng riêng.
Cấu trúc cơ bản
là các hàm
Chấp nhận SQL
với các kiểu dữ
liệu không gian
Các kiểu dữ liệu là
trừu tượng
Cú pháp của
mệnh đề
select
Select attributes
from relations
where
<conditions>
Select tuple
(newname: e1,
….) from x1 in
relations, . .
Where
<conditions>
Select attributes
from
<sub-select>
Where
<conditions>
Select attributes
from relations
On <pictures>
Where
<conditions>.
On clause: optional
2.1.10 Hướng
17
Hướng được định nghĩa như vector đơn vị (hình 2.9). Trong không gian 3D, ba hướng
được đánh nhãn như sau: sau-trước, trái-phải, trên-dưới. Hướng theo cách này lấy một
đối tượng làm hệ qui chiếu [44]. Trong khi đó, hướng theo hệ thống toàn cầu được đánh
nhãn: đông, tây, nam, bắc. Ngoài ra còn có hướng theo người nhìn.
Hình 2.9 . Định nghĩa hướng
2.1.11 Cấu trúc không gian
Theo truyền thống, cấu trúc không gian trong GIS được tạo ra bằng 2 phương pháp tiếp
cận: Raster và Vector [38].
Raster: Một
đối tượng có cấu trúc là raster nếu chúng được tạo thành bởi các ô (pixel),
mỗi ô được tham chiếu bởi vị trí dòng và cột [6] (hình 2.10 [80]). Trong 2D, ô là một
phần tử trong một ô lưới giống như mảng hai chiều. Trong 3D, khối (voxel) là một phần
tử trong một mảng ba chiều. Không gian của đối tượng được chia thành các ô hay các
khối. Có hai cách để chia các ô này, chia đều và không đều [5]. Cách chia đều sẽ tạo ra
các ô, khối có hình dạng và kích thước giống nhau. Các ô, khối thường là các hình chữ
nh
ật hay khối chữ nhật. Trong cách chia không đều, các ô, khối có hình dạng và kích
thước khác nhau. Kích cỡ các ô, khối cho biết độ phân giải. Độ phân giải càng cao thì
biểu diễn thế giới thực càng chính xác, nhưng kích thước dữ liệu lưu trữ lớn và tốc độ
hiển thị lại chậm. Một ví dụ thường thấy của dữ liệu raster là ảnh vệ tinh [41].
Trên
Trước
Phải
Dưới
Sau
Trái
18
Hình 2.10 Minh họa cấu trúc Raster
Vector: biểu diễn 1 đối tượng như là một đơn vị dữ liệu và lưu trữ một cách tường minh
[80]. Điểm, Đường, Bề mặt, Khối dùng để biểu diễn một đối tượng có cấu trúc là vector
[6]. Phương pháp vector biểu diễn các đối tượng thông qua các tọa độ của các điểm
(hình 2.11 [82]). Các điểm này nằm trên đường biên và được tham chiếu bởi hệ tọ
a độ
Descartes. Bảng 2.8 so sánh những đặc trưng giữa hai cấu trúc vector và raster [6][34].
Hình 2.11 Minh họa cấu trúc Vector và Raster
Bảng 2.8 So sánh giữa cấu trúc Vector và Raster
Vector Raster
Kích thước dữ liệu lưu trữ Nhỏ Lớn
Mô tả đối tượng Bởi các đường biên Trực tiếp
Biểu diễn không gian Chính xác nhờ tập tọa độ các đỉnh Xấp xỉ qua các ô, khối
Quan hệ topology giữa các
đối tượng
Dễ biểu diễn Khó biểu diễn
Được sử dụng cho các ứng
dụng liên quan đến
Bản đồ, quản lý đô thị . . . Hình ảnh số, địa chất . . .
Chuyển đổi tọa độ Dễ Khó
2.2 Các mô hình dữ liệu GIS 3D
2.2.1 Các khái niệm
19
2.2.1.1 Mô hình, mô hình dữ liệu, mô hình dữ liệu không gian
Mô hình là thuật ngữ để biểu diễn các hiện tượng trong một phương thức dễ đọc [46].
Mô hình cũng có thể là sự trừu tượng hóa, đơn giản hóa về một thế giới thực, là cầu nối
giữa lí thuyết và thực tiễn [46]. Mô hình có thể được chia thành hai loại: số hóa và
không số hóa. Mô hình không số hóa thì dễ hiểu nhưng khó quản trị bởi máy tính [46].
Mô hình dữ liệ
u là phương thức biểu diễn thế giới thực một cách dễ hiểu đối với máy
tính [46]. Các mô hình dữ liệu quen thuộc gồm: mô hình quan hệ, mô hình thực thể kết
hợp, mô hình hướng đối tượng .
Mô hình dữ liệu không gian là một mô hình dữ liệu định nghĩa các thuộc tính và các
thao tác trên các đối tượng không gian. Những đối tượng này được mô tả bằng các loại
dữ liệu không gian như: Điểm, Đường, Bề
mặt, Khối. Các thuộc tính không gian mô tả
một đối tượng với 3 yếu tố: vị trí, hình dạng, kích thước. Các yếu tố này phù hợp cho
cách biểu diễn đồ họa hơn là biểu diễn bởi các giá trị số, chuỗi.
Sự nghiên cứu và phát triển các mô hình dữ liệu không gian 2D bắt đầu vào những năm
1990. Sự phát triển của GIS 3D kế tục trên nền GIS 2D và 2.5D. Trong nhiều trường
hợp, GIS 2.5D dùng trong các mô hình số hóa địa hình, biểu diễn bề
mặt quả đất [9].
Mô hình 2.5D không phải là mô hình GIS 3D thực, vì độ cao không phải là một phần
trong cấu trúc của đối tượng [79].
Các đối tượng 3D, nếu biểu diễn như là hình chiếu của 2D có thể tạo ra các mất mát liên
quan đến các thuộc tính, các mối quan hệ với các đối tượng khác và sẽ tạo ra các khó
khăn trong những hiểu biết và phân tích không gian trên các đối tượng 3D [47]. Sự
phức tạp của cấu trúc GIS 3D đòi hỏi có sự phân tích c
ẩn thận khi xuất hiện thêm chiều
thứ ba vào mô hình dữ liệu GIS 2D trước đó. GIS 3D hiển thị thế giới thực thì tốt hơn
GIS 2D vì thế giới quanh ta là thế giới ba chiều, nhưng xử lí chậm, dữ liệu lớn và chi
phí bộ nhớ cao [73].
20
Liên quan đến GIS 3D, hiện đã có một số hệ quản trị CSDL hỗ trợ kiểu dữ liệu không
gian như: Informix 2006, Ingres 2006, Oracle 11g [75][76]. Các kiểu đối tượng hỗ trợ
gồm: Điểm, Đường, Đa giác [57].
Hiện nay có một số hệ thống cung cấp giải pháp biểu diễn và phân tích 3D như:
ArcView 3D, Imagine virtual GIS, Geomedia Terrain, DAMAS GIS topograph, k-3D,
Wing3D, Blender, Blently [29] [42] [51][72]. Đặc biệt là ESRI và Google Earth
ESRI đã xây dựng nhiều mô hình dữ liệu cho các ứng dụng công nghiệp. Mục đ
ích
việc xây dựng này là làm đơn giản hóa quá trình triển khai các dự án, để thúc đẩy, hỗ
trợ các tiêu chuẩn tồn tại trong cộng đồng người dùng. Người dùng sẽ có lợi thế tại
điểm bắt đầu một dự án và tìm thấy nhiều vấn để hữu ích khác trên mô hình khi phát
triển hệ thống của chính mình. Lãnh đạo các nhà khoa học, công nghiệp đã hợp tác với
ESRI để thiết kế các mẫu mô hình dữ liệu
được sử dụng trên nền tảng GIS. Kết quả của
sự hợp tác này là nhiều mô hình dữ liệu được thiết kế cho mỗi ngành công nghiệp và
khoa học mà ESRI đang phục vụ. Các mô hình dữ liệu ESRI đã xây dựng gồm nhiều
ứng dụng trên các lãnh vực: lâm nghiệp, địa chất, nước ngầm, hệ thống cấp thoát nước,
viễn thông, giao thông vận tải, tòa nhà. . . Đây là những mô hình kết hợp giữa thuộc
tính không gian và ngữ nghĩa [86].
COLLADA (COLLAborative Design Activity) được khởi xướng do Sony Computer
Entertainment, để tạo ra một tiêu chuẩn trao đổi tài sản ở dạng kỹ thuật số.
COLLADA là một lược đồ XML bao gồm một hồ sơ chung, trong đó xác định một
danh sách các tính năng mà tất cả các đối tác COLLADA đã đồng ý hỗ trợ. COLLADA
định nghĩa một lược đồ cơ sở dữ liệu XML cho phép các ứng dụng 3D tự do trao đổi
các tài sản dạng kỹ thuật số mà không làm mất mát thông tin. COLLADA hỗ trợ tất cả
các tính năng 3D hiện đại trong các ứng dụng tương tác cần thiết, các hiệu ứng lập
trình đổ bóng và mô phỏng vật lý. COLLADA được tập trung vào việc cung cấp các
giải pháp cho các ứng dụng tương tác, bao gồm các ngành công nghiệp trò chơi, công
21
nghiệp phim, trong hệ thống hình ảnh thời gian thực và các ứng dụng tương tác khác
như Google Earth. COLLADA hỗ trợ nhiều tính năng: lưới hình học, các phép biến
đổi, hiệu ứng, vật liệu, kết cấu, ánh sáng, hình ảnh động [85].
KML (Keyhole Markup Language) là một định dạng dựa trên chuẩn XML được sử
dụng bởi Google Earth. KML có thể được sử dụng để hiển thị các điểm hoặc các đối
tượng vector từ một bản vẽ được định dạng cũng như cho hình ảnh. KML là một
phương thức nhanh chóng và thuận tiện để công bố dữ liệu GIS sử dụng với Google
Earth [85].
2.2.1.2 Mô hình dữ liệu GIS 3D
Mô hình dữ liệu GIS 3D là chìa khóa của GIS 3D [6] và là một trong các chủ đề lớn bên
cạnh bốn chủ đề lớn khác của GIS 3D: WebGIS, hiển thị dữ liệu, thu gom dữ liệu, phân
tích không gian. Một mô hình dữ liệu GIS 3D cũng giống như các mô hình dữ liệu khác,
cần ba mức để biểu diễn: quan niệm, logic và vật lý [62]. Sự phát triển của mô hình dữ
liệu GIS 3D phụ thuộc vào hai yếu tố: CSDL không gian và kĩ thuậ
t viễn thám [31]. Mô
hình GIS 2D là tập con của mô hình dữ liệu GIS 3D, tuy nhiên mô hình 3D phức tạp
hơn nhiều [29]. Có nhiều mô hình của các tác giả đã được đề xuất [4][5][14] [47] [48]
[50] [65][66]. Mục đích của phần này là cung cấp một cái nhìn toàn diện các mô hình
dữ liệu 3D đã được đề xuất. So sánh những mô hình trên các tiêu chí. Việc cố gắng
phân loại các mô hình đã có sẽ là nền tảng cho các nghiên cứu liên quan đến chủ đề GIS
3D và GIS 4D (là GIS 3D tích hợp thêm chiều thời gian).
Trước đ
ây đã có vài tác giả đã thực hiện vấn đề này, tuy vậy các công việc của họ vẫn
thiếu một số mô hình xuất hiện sau thời điểm mà tác giả nghiên cứu và sự so sánh còn
mang tính rời rạc [4][41] [46] [56][65]. Việc chọn lựa mô hình dữ liệu 3D để biểu diễn
các đối tượng GIS 3D cho một ứng dụng cụ thể sẽ quyết định đến các phương thức lưu
trữ, cách truy xu
ất, cách quản lí, cách xử lí khi hiển thị và các ràng buộc dữ liệu cũng
khác nhau. Một mô hình có thể tổ hợp mọi lãnh vực là không thực tiễn [49].