Tải bản đầy đủ (.pdf) (76 trang)

nghiên cứu một số thuật toán trong gis ứng dụng logic mờ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.3 MB, 76 trang )

ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CNTT VÀ TRUYỀN THÔNG


NGUYỄN NHƯ QUỲNH


NGHIÊN CỨU MỘT SỐ THUẬT TOÁN TRONG GIS
ỨNG DỤNG LOGIC MỜ


LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH





Thái Nguyên, 2012
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CNTT VÀ TRUYỀN THÔNG


NGUYỄN NHƯ QUỲNH

NGHIÊN CỨU MỘT SỐ THUẬT TOÁN TRONG GIS
ỨNG DỤNG LOGIC MỜ
Chuyên ngành: Khoa học máy tính
Mã số: 60 48 01




LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Người hướng dẫn khoa học: PGS. TS. Đặng Văn Đức







Thái Nguyên, 2012
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

i
LỜI CAM ĐOAN

Tôi xin cam đoan bản luận văn “Nghiên cứu một số thuật toán trong
GIS ứng dụng logic mờ” là công trình nghiên cứu của tôi, dưới sự hướng dẫn
khoa học của PGS.TS Đặng Văn Đức, tham khảo các nguồn tài liệu đã được
chỉ rõ trong trích dẫn và danh mục tài liệu tham khảo. Các nội dung công bố
và kết quả trình bày trong luận văn này là trung thực và chưa từng được ai
công bố trong bất cứ công trình nào.

Thái Nguyên, tháng 8 năm 2012
Nguyễn Nhƣ Quỳnh
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên




ii
LỜI CẢM ƠN

Tôi xin gửi lời cảm ơn sâu sắc tới PGS.TS. Đặng Văn Đức, Thầy đã tận
tình chỉ bảo giúp đỡ tôi trong suốt quá trình nghiên cứu và hoàn thành luận văn.
Xin chân thành cảm ơn quý Thầy Cô trong khoa Sau đại học Trường
Đại học Công nghệ Thông tin và Truyền thông Thái Nguyên đã nhiệt tình
giảng dạy, trang bị cho tôi những kiến thức quý báu trong suốt thời gian học
tập tại trường.
Xin cảm ơn các bạn cùng lớp và đồng nghiệp nơi tôi công tác đã tạo
điều kiện cho tôi hoàn thành luận văn này.
Xin gửi lời cảm ơn tới gia đình tôi đã động viên tôi trong suốt quá trình
học tập và hoàn thành luận văn.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên



iii
MỤC LỤC
MỞ ĐẦU 1
Chƣơng 1 TỔNG QUAN VỀ HỆ THỐNG THÔNG TIN ĐỊA LÝ VÀ
LOGIC MỜ 3
1.1. Tổng quan về hệ thông tin địa lý 3
1.1.1. Định nghĩa về hệ thông tin địa lý 3
1.1.2. Biểu diễn dữ liệu địa lý 6
1.1.2.1. Các thành phần của dữ liệu địa lý 6
1.1.2.2. Mô hình biểu diễn dữ liệu không gian 11
1.1.3. Phân tích và xử lý dữ liệu không gian 13
1.1.3.1. Tìm kiếm theo vùng 14
1.1.3.2. Tìm kiếm lân cận 14

1.1.3.3. Phân tích đường đi và dẫn đường 14
1.1.3.4. Tìm kiếm hiện tượng và bài toán chồng phủ 15
1.1.3.5. Nắn chỉnh dữ liệu không gian 19
1.1.3.6. Tổng quát hóa dữ liệu không gian 19
1.1.4. Ứng dụng của hệ thông tin địa lý 20
1.2. Tổng quan về logic mờ 21
1.2.1. Giới thiệu 21
1.2.2. Tập mờ và các hàm thuộc 23
1.2.2.1. Khái niệm tập mờ 23
1.2.2.2. Các dạng hàm liên thuộc của tập mờ 26
1.2.3. Các phép toán logic 27
1.2.3.1. Phép hợp hai tập mờ 27
1.2.3.2. Phép giao hai tập mờ 28
1.2.3.3. Phép bù của một tập mờ 29
1.2.4. Hệ suy diễn mờ 29
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên



iv
Chƣơng 2 ỨNG DỤNG LOGIC MỜ TRONG HỆ THỐNG THÔNG
TIN ĐỊA LÝ 33
2.1. Giới thiệu 33
2.2. Nghiên cứu một số thuật toán trong GIS có ứng dụng logic mờ 38
2.2.1. Một số thuật toán tìm đường đi tối ưu ứng dụng trong GIS 38
2.2.1.1. Phát biểu bài toán 38
2.2.1.2. Thuật toán Dijkstra 39
2.2.1.3. Thuật toán Bellman-Ford 43
2.2.1.4. Thuật toán A* 45
2.2.1.5. Hàm heuristic 50

2.2.2 Ứng dụng logic mờ trong bài toán tìm đường 51
2.2.2.1 Thuật toán FSA 52
2.2.2.2 Thuật toán tìm đường đi ngắn nhất trên cơ sở số mờ 54
Chƣơng 3 PHÁT TRIỂN CHƢƠNG TRÌNH THỬ NGHIỆM 60
3.1. Môi trường phát triển chương trình 60
3.2. Các chức năng của chương trình 60
3.3. Một số giao diện của chương trình 61
3.4. Một số kết quả thử nghiệm 62
KẾT LUẬN 66
TÀI LIỆU THAM KHẢO 68

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên



v
DANH MỤC CÁC HÌNH VẼ
Hình 1.1 Hệ thống thông tin địa lý 5
Hình 1.2 Tầng (layer) bản đồ 6
Hình 1.3 Ví dụ biểu diễn vị trí nước bị ô nhiễm 8
Hình 1.4 Ví dụ biểu diễn đường 8
Hình 1.5 Ví dụ biểu diễn khu vực hành chính 9
Hình 1.6 Biểu diễn vector của đối tượng địa lý 11
Hình 1.7 Biểu diễn thế giới bằng mô hình raster 12
Hình 1.8 Chồng phủ đa giác 16
Hình 1.9 Tiến trình phủ đa giác 18
Hình 1.10 Hàm phụ thuộc 
A
(x) của tập kinh điển A 24
Hình 1.11 Hàm liên thuộc 

B
(x) của tập “mờ” B 24
Hình 1.12 Độ cao, miền xác định, miền tin cậy của tập mờ 25
Hình 1.13 Hàm mờ tuyến tính 26
Hình 1.14 Hàm mờ hình sin 27
Hình 1.15 Hợp của hai tập mờ có cùng cơ sở 27
theo quy tắc Max (a); theo Lukasiewwiez (b) 27
Hình 1.16 Giao của hai tập mờ có cùng cơ sở 29
theo quy tắc Min (a) và theo tích đại số (b) 29
Hình 1.17 Bù của tập mờ 29
Hình 1.18 Mô hình tổng quát hệ suy diễn mờ 30
Hình 1.19 Quy trình xây dựng hệ suy diễn mờ 31
Hình 2.1 Tính chất không rõ ràng phát sinh khi xác định ranh giới 36
Hình 2.2 Đồ thị minh hoạ thuật toán Dijkstra 42
Hình 2.3 Đồ thị minh họa thuật toán Bellman-Ford 43
Hình 2.4 Đồ thị mờ G minh họa thuật toán FSA 53
Hình 2.5 Các đường đi mờ ngắn nhất của đồ thị mờ G 53
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên



vi
Hình 2.6 Số mờ tam giác 55
Hình 2.7 Ví dụ mạng lưới 56
Hình 3.1 Giao diện chính của chương trình thử nghiệm 61
Hình 3.2 Giao diện chức năng nhập dữ liệu 61
Hình 3.3 Giao diện chức năng tính toán 62
Hình 3.4 Ví dụ mạng lưới 62
Hình 3.5 Nhập dữ liệu cho cung (1,2) 63
Hình 3.6 Kết quả thử nghiệm 64

Hình 3.7 Kết quả thử nghiệm với trường hợp không tồn tại đường đi 64
Hình 3.8 Kết quả thử nghiệm với đồ thị đầy đủ 65

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên



1
MỞ ĐẦU

Hệ thống thông tin địa lý (Geographic Information System – GIS) ra
đời trên cơ sở phát triển của khoa học máy tính và được ứng dụng rộng rãi
trong nhiều ngành khoa học có liên quan đến xử lý dữ liệu không gian. GIS
được hình thành từ những năm 70 của thế kỷ trước và phát triển mạnh mẽ
trong một hai chục năm trở lại đây. GIS đã trở thành công cụ hỗ trợ ra quyết
định hầu hết trong các hoạt động kinh tế – xã hội, an ninh – quốc phòng,
trong quản lý, quy hoạch, thăm dò, khai thác…
Đối với GIS, các dữ liệu thu thập thường không đầy đủ, không rõ ràng,
không chắc chắn và mập mờ, điều đó dẫn đến dữ liệu và thông tin trong GIS
là dữ liệu “không rõ ràng” hay dữ liệu “mờ”.
Phân tích dữ liệu không gian bằng cách kết hợp nhiều nguồn dữ liệu
được khai thác từ các hệ thống thông tin địa lý là mục tiêu cao nhất của hầu
hết các dự án GIS để diễn tả, phân tích các ảnh hưởng lẫn nhau, đưa ra các mô
hình dự báo và hỗ trợ ra quyết định. Khái niện “không rõ ràng – mờ” là đặc
trưng vốn có của dữ liệu địa lý và có thể sinh ra do: Thông tin tương ứng với
chúng không đầy đủ; sự xuất hiện không ổn định khi thu thập; tập hợp các dữ
liệu thuộc tính; việc sử dụng các diễn tả định tính đối với các giá trị thuộc tính
và các mối quan hệ dữ chúng. Các hệ GIS thường không sẵn sàng cho việc xử
lý với các dữ liệu mờ. Vì thế cần phải có sự mở rộng cả về mô hình dữ liệu,
các phép toán và lập luận để giải quyết với dữ liệu mờ trong GIS làm cho hệ

thống trở nên mềm dẻo hơn trong việc giải các bài toán không gian mà dữ liệu
của chúng là các dữ liệu dạng mờ.
Theo phương pháp truyền thống khi xử lý, phân tích dữ liệu trong GIS
các thao tác dữ liệu thực hiện một cách cứng nhắc đối với các thủ tục lập luận
và phân tích. Quyết định tổng thể được thực hiện theo từng bước cụ thể và
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên



2
quy về kết quả ngay lập tức. Những ứng viên nào thoả điều kiện được dữ lại
và các ứng viên không thoả điều kiện sẽ bị loại bỏ phụ thuộc vào giá trị
ngưỡng. Thêm vào đó các quyết định đưa ra là bắt buộc để biểu diễn các ràng
buộc của chúng dưới dạng các điều kiện số học và các ký hiệu toán học trong
các quan hệ rõ, chúng không cho phép sử dụng các điều kiện cú pháp dưới
dạng ngôn ngữ tự nhiên. Mặt khác kết quả lựa chọn dựa trên các điều kiện
được xác định là ngang nhau, không có giá trị trọng số của các đối tượng.
Một trong các phương pháp toán học nghiên cứu tính chất “không rõ
ràng” của không gian là lý thuyết tập mờ Zadeh (1965). Nó sử dụng độ thuộc
để diễn tả một cá thể tham gia trong một tập hợp. Sự kết hợp lý thuyết tập mờ
và GIS là các đối tượng không gian “mờ” đều có đặc trưng chung là chúng có
ranh giới “không rõ ràng” so với đối tượng không gian “rõ”.
Lý thuyết tập mờ là giải pháp thích hợp nhất cho việc mô hình hoá dữ
liệu “không rõ ràng” và đưa ra cơ sở lý thuyết để hỗ trợ các lập luận trên dữ
liệu này. Vì vậy, học viên đã thực hiện luận văn: “Nghiên cứu một số thuật
toán trong GIS ứng dụng Logic mờ”
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên




3
Chƣơng 1
TỔNG QUAN VỀ
HỆ THỐNG THÔNG TIN ĐỊA LÝ VÀ LOGIC MỜ
1.1. Tổng quan về hệ thông tin địa lý
Khái niệm Địa lý (Geography) đề cập lĩnh vực nghiên cứu mô tả Trái
đất (Geo-Earth). Ngày nay, khái niệm này và khái niệm “không gian (Space)”
được sử dụng thay thế nhau trong một số trường hợp. Tuy nhiên, về mặt bản
chất thì Địa lý là tập các mô tả về không gian (hai chiều), khí quyển (ba
chiều), … của Trái đất. Còn “không gian” là cho phép mô tả bất kỳ cấu trúc
đa chiều nào, không quan tâm đến vị trí địa lý của nó. Như vậy có thể xem
Địa lý như là một phần cấu trúc nhỏ trong tập cấu trúc “không gian”.
Khi mô tả Trái đất, các nhà địa lý luôn đề cập đến quan hệ không gian
(spatial relationship) của các đối tượng trong thế giới thực. Mối quan hệ này
được thể hiện thông qua các bản đồ (map) trong đó biểu diễn đồ họa của tập
các đặc trưng trừu tượng và quan hệ không gian tương ứng trên bề mặt trái
đất, ví dụ: bản đồ dân số biểu diễn dân số tại từng vùng địa lý.
Dữ liệu bản đồ còn là loại dữ liệu có thể được số hóa. Để lưu trữ và
phân tích các số liệu thu thập được, cần có sự trợ giúp của hệ thông tin địa lý
(Geographic Information System-GIS).
1.1.1. Định nghĩa về hệ thông tin địa lý
Có nhiều cách diễn giải khác nhau cho từ viết tắt GIS, tuy nhiên các
cách diễn giải đó đều mô tả việc nghiên cứu các thông tin địa lý và các khía
cạnh khác liên quan.
GIS cũng giống như các hệ thống thông tin khác là có khả năng nhập,
tìm kiếm và quản lý các dữ liệu lưu trữ, để từ đó đưa ra các thông tin cần thiết
cho người sử dụng. Ngoài ra, GIS còn cho phép lập bản đồ với sự trợ giúp của
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên




4
máy tính, giúp cho việc biểu diễn dữ liệu bản đồ tốt hơn so với cách truyền
thống. Theo Khoa Địa lý, Trường Đại học Texas thì GIS là cơ sở dữ liệu số
chuyên dụng trong đó hệ trục tọa độ không gian là phương tiện tham chiếu
chính. GIS bao gồm các công cụ để thực hiện những công việc sau:
 Nhập dữ liệu từ bản đồ giấy, ảnh vệ tinh, ảnh máy bay, số liệu
điều tra và các nguồn khác.
 Lưu trữ dữ liệu, khai thác, truy vấn cơ sở dữ liệu.
 Biến đổi dữ liệu, phân tích, mô hình hóa, bao gồm cả dữ liệu
thống kê và dữ liệu không gian.
 Lập báo cáo, bao gồm bản đồ chuyên đề, bảng biểu, biểu đồ và kế hoạch.
Từ định nghĩa trên, ta thấy: Thứ nhất, GIS có quan hệ với ứng dụng cơ
sở dữ liệu. Thông tin trong GIS đều liên kết với tham chiếu không gian và
GIS sử dụng tham chiếu không gian như phương tiện chính để lưu trữ và truy
nhập thông tin. Thứ hai, GIS là công nghệ tích hợp, cung cấp các khả năng
phân tích như phân tích ảnh máy bay, ảnh vệ tinh hay tạo lập mô hình thống
kê, vẽ bản đồ Cuối cùng, GIS có thể được xem như một hệ thống cho phép
trợ giúp quyết định. Cách thức nhập, lưu trữ, phân tích dữ liệu trong GIS phải
phản ánh đúng cách thức thông tin sẽ được sử dụng trong công việc lập quyết
định hay nghiên cứu cụ thể.
Theo David Cowen, NCGIA, Mỹ thì GIS là hệ thống phần cứng, phần
mềm và các thủ tục được thiết kế để thu thập, quản lý, xử lý, phân tích, mô
hình hóa và hiển thị các dữ liệu qui chiếu không gian để giải quyết các vấn đề
quản lý và lập kế hoạch phức tạp.
Một cách đơn giản, có thể hiểu GIS như một sự kết hợp giữa bản đồ
(map) và cơ sở dữ liệu (database).
GIS = Bản đồ + Cơ sở dữ liệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên




5
Bản đồ trong GIS là một công cụ hữu ích cho phép chỉ ra vị trí của từng
địa điểm. Với sự kết hợp giữa bản đồ và cơ sở dữ liệu, người dùng có thể xem
thông tin chi tiết về từng đối tượng/thành phần tương ứng với địa điểm trên
bản đồ thông qua các dữ liệu đã được lưu trữ trong cơ sở dữ liệu. Ví dụ, khi
xem bản đồ về các thành phố, người dùng có thể chọn một thành phố để xem
thông tin về thành phố đó như diện tích, số dân, thu nhập bình quân, số
quận/huyện của thành phố, …
Độ phức tạp của thế giới thực là không gian hữu hạn. Càng quan sát thế
giới gần hơn càng thấy được chi tiết hơn. Con người mong mỏi lưu trữ, quản
lý đầy đủ các dữ liệu về thế giới thực. Nhưng sẽ dẫn đến phải có cơ sở dữ liệu
lớn vô hạn để lưu trữ mọi thông tin chính xác về chúng. Do vậy, để lưu trữ
được dữ liệu không gian của thế giới thực vào máy tính thì phải giảm số
lượng dữ liệu đến mức có thể quản lý được bằng tiến trình đơn giản hoá hay
trừu tượng hoá (Hình 1.1). Trừu tượng là đơn giản hoá một cách thông minh.
Trừu tượng cho ta tổng quát hoá và “ý tưởng” hoá vấn đề đang xem xét.
Chúng loại bỏ đi các chi tiết dư thừa mà chỉ tập trung vào các điểm chính, cơ
bản. Các đặc trưng địa lý phải được biểu diễn bởi các thành phần rời rạc hay
các đối tượng để lưu vào CSDL máy tính.

Hình 1.1 Hệ thống thông tin địa lý

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên



6
GIS lưu trữ thông tin thế giới thực thành các tầng (layer) bản đồ chuyên

đề mà chúng có khả năng liên kết địa lý với nhau. Giả sử ta có vùng quan sát
như trên Hình 1.2.

Hình 1.2 Tầng (layer) bản đồ

Mỗi nhóm người sử dụng sẽ quan tâm đến một hay là vài loại thông tin.
Thí dụ, Sở giao thông công chính sẽ quan tâm nhiều đến hệ thống đường phố.
Sở nhà đất quan tâm nhiều đến các khu dân cư và công sở. Sở thương mại
quan tâm nhiều đến phân bổ khách hàng trong vùng. Tư tưởng tách bản đồ
thành tầng tuy đơn giản nhưng khá mềm dẻo và hiệu quả, chúng có khả năng
giải quyết rất nhiều vấn đề về thế giới thực, từ theo dõi điều hành xe cộ giao
thông, đến các ứng dụng lập kế hoạch và mô hình hoá lưu thông. Ta có thể sử
dụng tiến trình tự động, gọi là mã hoá địa lý (geocoding) để liên kết dữ liệu
bên ngoài với dữ liệu bản đồ. Thí dụ sử dụng mã hoá địa lý để ánh xạ thông
tin bán hàng bằng mã bưu điện (ZIP) hay chỉ ra địa chỉ khách hàng trên bản
đồ bằng các điểm.
1.1.2. Biểu diễn dữ liệu địa lý
1.1.2.1. Các thành phần của dữ liệu địa lý
Trong GIS, dữ liệu được chia làm hai loại: thành phần không gian và
thành phần phi không gian (thuộc tính). Hai loại thành phần dữ liệu này được
kết hợp thông qua một chỉ số chung để mô tả một đối tượng thực. Sự kết hợp
này thể hiện đặc trưng không gian của đối tượng, nó cho phép:
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên



7
 Mô tả “vị trí, hình dạng”: vị trí tham chiếu, đơn vị đo, dạng hình
học của thực thể địa lý.
 Mô tả “quan hệ và tương tác” giữa các thực thể địa lý: những

thửa đất nào liền kề với khu công nghiệp ?
 Mô tả “thông tin” của các đối tượng địa lý: ai là chủ sở hữu của
thửa đất này?
a. Thành phần không gian
Thành phần dữ liệu không gian hay còn gọi là dữ liệu bản đồ, là dữ liệu
về đối tượng mà vị trí của nó được xác định trên bề mặt trái đất. Dữ liệu
không gian sử dụng trong hệ thống địa lý luôn được xây dựng trên một hệ
thống tọa độ, bao gồm tọa độ, quy luật và các ký hiệu dùng để xác định một
hình ảnh bản đồ cụ thể trên mỗi bản đồ.
Hệ thống GIS dùng thành phần dữ liệu không gian để tạo ra bản đồ hay
hình ảnh bản đồ trên màn hình hoặc trên giấy thông qua thiết bị ngoại vi. Mỗi
hệ thống GIS có thể dùng các mô hình khác nhau để mô hình hóa thế giới
thực sao cho giảm thiểu sự phức tạp của không gian nhưng không mất đi các
dữ liệu cần thiết để mô tả chính xác các đối tượng trong không gian. Hệ thống
GIS hai chiều 2D dùng ba kiểu dữ liệu cơ sở sau để mô tả hay thể hiện các đối
tượng trên bản đồ vector, đó là:
Ðiểm (Point)
Điểm được xác định bởi cặp giá trị tọa độ (x, y). Các đối tượng đơn với
thông tin về địa lý chỉ bao gồm vị trí thường được mô tả bằng đối tượng điểm.
Các đối tượng biểu diễn bằng kiểu điểm thường mang đặc tính chỉ có
tọa độ đơn (x, y) và không cần thể hiện chiều dài và diện tích. Ví dụ, trên bản
đồ, các vị trí của bệnh viện, các trạm rút tiền tự động ATM, các cây xăng,…
có thể được biểu diễn bởi các điểm.
Hình 1.3 là ví dụ về vị trí nước bị ô nhiễm. Mỗi vị trí được biểu diễn
bởi 1 điểm gồm cặp tọa độ (x, y) và tương ứng với mỗi vị trí đó có thuộc tính
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên



8

độ sâu và tổng số nước bị nhiễm bẩn. Các vị trí này được biểu diễn trên bản
đồ và lưu trữ trong các bảng dữ liệu.


Hình 1.3 Ví dụ biểu diễn vị trí nước bị ô nhiễm

Ðƣờng – Cung (Line - Arc)
Đường được xác định bởi dãy các điểm hoặc bởi 2 điểm đầu và điểm
cuối (Hình 1.4). Đường dùng để mô tả các đối tượng địa lý dạng tuyến như
đường giao thông, sông ngòi, tuyến cấp điện, cấp nước…

Hình 1.4 Ví dụ biểu diễn đường
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên



9
Các đối tượng được biểu diễn bằng kiểu đường thường mang đặc điểm
là có dãy các cặp tọa độ, các đường bắt đầu và kết thúc hoặc cắt nhau bởi
điểm, độ dài đường bằng chính khoảng cách của các điểm. Ví dụ, bản đồ hệ
thống đường bộ, sông, đường biên giới hành chính, … thường được biểu diễn
bởi đường và trên đường có các điểm (vertex) để xác định vị trí và hình dáng
của đường đó.
Vùng (Polygon)
Vùng được xác định bởi ranh giới các đường, có điểm đầu trùng với
điểm cuối. Các đối tượng địa lý có diện tích và được bao quanh bởi đường
thường được biểu diễn bởi vùng.
Các đối tượng biểu diễn bởi vùng có đặc điểm là được mô tả bằng tập
các đường bao quanh vùng và điểm nhãn (label point) thuộc vùng để mô tả,
xác định cho mỗi vùng. Ví dụ, các khu vực hành chính, hình dạng các công

viên, … được mô tả bởi kiểu dữ liệu vùng. Hình 1.5 mô tả ví dụ cách lưu trữ
một đối tượng vùng.

Hình 1.5 Ví dụ biểu diễn khu vực hành chính

Một đối tượng có thể biểu diễn bởi các kiểu khác nhau tùy thuộc vào tỷ
lệ của bản đồ đó. Ví dụ, đối tượng công viên có thể được biểu diễn bởi điểm
trong bản đồ có tỷ lệ nhỏ, và bởi vùng trong bản đồ có tỷ lệ lớn.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên



10
b. Thành phần phi không gian
Thành phần dữ liệu phi không gian hay còn gọi là dữ liệu thuộc tính, là
những diễn tả đặc tính, số lượng, mối quan hệ của các hình ảnh bản đồ với vị
trí địa lý của chúng thông qua một cơ chế thống nhất. Hệ thống GIS có cơ chế
liên kết dữ liệu không gian và phi không gian của cùng một đối tượng với nhau.
Có thể nói, một trong những chức năng đặc biệt của công nghệ GIS chính là khả
năng liên kết và xử lý đồng thời dữ liệu bản đồ và dữ liệu thuộc tính.
Dữ liệu thuộc tính trong hệ thống GIS bất kỳ thường phân thành 4 loại sau:
 Bộ xác định: có thể là một số duy nhất, liên tục, ngẫu nhiên hoặc chỉ
báo địa lý, số liệu xác định vị trí lưu trữ chung. Bộ xác định cho một thực thể
chứa tọa độ phân bố của nó, số hiệu mảnh bản đồ, mô tả khu vực hay con trỏ
đến vị trí lưu trữ của số liệu liên quan. Bộ xác định thường lưu trữ với các bản
ghi tọa độ hay mô tả khác của hình ảnh không gian và các bản ghi số liệu
thuộc tính liên quan.
 Số liệu hiện tượng, tham khảo địa lý: miêu tả thông tin danh mục, các
hoạt động liên quan đến các vị trí địa lý xác định (ví dụ như: cho phép xây
dựng, báo cáo tai nạn, nghiên cứu y tế,…) Thông tin này được lưu trữ và quản

lý trong các tệp/ bảng độc lập, trong đó mỗi bản ghi chứa yếu tố xác định vị
trí của sự kiện hay hiện tượng quản lý.
 Chỉ số địa lý: bao gồm tên, địa chỉ, khối, phương hướng định vị, …
liên quan đến các đối tượng địa lý. Một chỉ số có thể bao gồm nhiều bộ xác
định cho thực thể địa lý. Ví dụ: chỉ số địa lý về đường phố và địa chỉ địa lý
liên quan đến phố đó.
 Quan hệ giữa các đối tượng tại một vị trí địa lý cụ thể trong không
gian. Đây là thông tin quan trọng cho các chức năng xử lý của hệ thống thông
tin địa lý. Các mối quan hệ không gian có thể là mối quan hệ đơn giản hay
lôgic, ví dụ tiếp theo số nhà 101 phải là số nhà 103.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên



11
1.1.2.2. Mô hình biểu diễn dữ liệu không gian
Như đã đề cập ở trên, dữ liệu địa lý bao gồm thành phần dữ liệu không
gian và thành phần dữ liệu thuộc tính. Ở phần này, chúng ta sẽ xem xét cách
thức biểu diễn thành phần dữ liệu không gian trong hệ thông tin địa lý.
Hệ thông tin địa lý biểu diễn các thực thể địa lý trong tự nhiên bằng dữ
liệu của nó, hệ thống GIS chứa càng nhiều dữ liệu thì khả năng mang lại
thông tin càng lớn. Dữ liệu của GIS có được thông qua việc mô hình hóa các
thực thể địa lý. Mô hình biểu diễn dữ liệu địa lý là cách thức chúng ta biểu
diễn trừu tượng các thực thể địa lý. Mô hình biểu diễn dữ liệu địa lý đóng vai
trò quan trọng vì cách thức biểu diễn thông tin sẽ ảnh hưởng tới khả năng
thực hiện phân tích dữ liệu và khả năng hiển thị đồ họa của một hệ thống
thông tin địa lý.
Hai nhóm mô hình dữ liệu không gian thường gặp trong các hệ GIS
thương mại là mô hình dữ liệu vector và mô hình dữ liệu raster.
Mô hình vector

Mô hình vector sử dụng tọa độ 2 chiều (x, y) để lưu trữ hình khối của
các thực thể không gian trên bản đồ 2D. Mô hình này sử dụng các đặc tính rời
rạc như điểm, đường, vùng để mô tả không gian, đồng thời cấu trúc topo của
các đối tượng cũng cần được mô tả chính xác và lưu trữ trong hệ thống.

Hình 1.6 Biểu diễn vector của đối tượng địa lý
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên



12
Theo Hình 1.6, các đối tượng không gian được lưu trữ dưới dạng
vertor, đồng thời các thuộc tính liên quan đến lĩnh vực cần quản lý (dữ liệu
chuyên đề - thematic data) của đối tượng đó cũng cần kết hợp với dữ liệu
trên. Các nhân tố chỉ ra sự tác động qua lại lẫn nhau giữa các đối tượng cũng
được quản lý, các nhân tố đó có thể là quan hệ topo (giao/ không giao nhau,
phủ, tiếp xúc, bằng nhau, chứa, …), khoảng cách và hướng (láng giềng về
hướng nào).
Mô hình raster
Mô hình raster hay còn gọi mô hình dạng ảnh (image) biểu diễn các đặc
tính dữ liệu bởi ma trận các ô (cell) trong không gian liên tục (Hình 1.7). Mỗi
ô có chỉ số tọa độ (coordinate) và các thuộc tính liên quan. Mỗi vùng được
chia thành các hàng và cột, mỗi ô có thể là hình vuông hoặc hình chữ nhật và
chỉ có duy nhất một giá trị.

Hình 1.7 Biểu diễn thế giới bằng mô hình raster
Trên thực tế, chọn kiểu mô hình nào để biểu diễn bản đồ là câu hỏi luôn
đặt ra với người sử dụng. Việc lưu trữ kiểu đối tượng nào sẽ quyết định mô
hình sử dụng. Ví dụ nếu lưu vị trí của các khách hàng, các trạm rút tiền hoặc
dữ liệu cần tổng hợp theo từng vùng như vùng theo mã bưu điện, các hồ chứa

nước,… thì sử dụng mô hình vector. Nếu đối tượng quản lý được phân loại
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên



13
liên tục như loại đất, mức nước hay độ cao của núi,… thì thường dùng mô
hình raster. Đồng thời, nếu dữ liệu thu thập từ các nguồn khác nhau được
dùng một mô hình nào đó thì có thể chuyển đổi từ mô hình này sang mô hình
khác để phục vụ tốt cho việc xử lý của người dùng.
Mỗi mô hình có ưu điểm và nhược điểm khác nhau. Về mặt lưu trữ,
việc lưu trữ giá trị của tất cả các ô/điểm ảnh trong mô hình raster đòi hỏi
không gian nhớ lớn hơn so với việc chỉ lưu các giá trị khi cần trong mô hình
vector. Cấu trúc dữ liệu lưu trữ của raster đơn giản, trong khi vector dùng các
cấu trúc phức tạp hơn. Dung lượng lưu trữ trong mô hình raster có thể lớn hơn
gấp 10 đến 100 lần so với mô hình vector. Đối với thao tác chồng phủ, mô
hình raster cho phép thực hiện một cách dễ dàng, trong khi mô hình vector lại
phức tạp và khó khăn hơn. Về mặt hiển thị, mô hình vector có thể hiển thị đồ
họa vector giống như bản đồ truyền thống, còn mô hình raster chỉ hiển thị ảnh
nên có thể xuất hiện hình răng cưa tại đường biên của các đối tượng tùy theo
độ phân giải của tệp raster. Với dữ liệu vector, người dùng có thể bổ sung, co
dãn hoặc chiếu bản đồ, thậm chí có thể kết hợp với các tầng bản đồ khác
thuộc các nguồn khác nhau. Hiện nay, mô hình vector được sử dụng nhiều
trong các hệ thống GIS bởi các lý do trên, ngoài ra mô hình này cho phép cập
nhật và duy trì đơn giản, dễ truy vấn dữ liệu.
1.1.3. Phân tích và xử lý dữ liệu không gian
Các phép phân tích và xử lý dữ liệu không gian là một trong năm yếu tố
cấu thành nên một hệ thông tin địa lý. Mục này đề cập đến một số phép phân
tích xử lý dữ liệu cơ bản nhất của một hệ GIS. Các thao tác trên dữ liệu không
gian thường chia làm hai lớp bài toán cơ bản là các bài toán về tìm kiếm và

phân tích không gian và các bài toán về xử lý dữ liệu không gian.
Lớp bài toán tìm kiếm và phân tích không gian: bao gồm các bài toán
liên quan đến việc khai thác thông tin và tri thức từ dữ liệu không gian. Ví dụ
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên



14
như bài toán tìm kiếm đối tượng trên bản đồ theo thuộc tính, bài toán phân
tích đường đi, tìm đường…
Lớp bài toán xử lý dữ liệu không gian: bao gồm các bài toán thao tác
trực tiếp tới khuôn dạng, giá trị của dữ liệu không gian, làm thay đổi dữ liệu
không gian. Ví dụ như các thao tác nắn chỉnh dữ liệu, tổng quát hóa dữ liệu,
chuyển đổi hệ tọa độ, chuyển đổi khuôn dạng dữ liệu…Dưới đây đề cập khái
quát một số phép phân tích và xử lý dữ liệu không gian chính.
1.1.3.1. Tìm kiếm theo vùng
Là phép phân tích không gian đơn giản nhất, phép phân tích này thực
hiện tìm kiếm đối tượng bản đồ trong một vùng không gian cho trước. Vùng
này có thể là một cửa sổ hình chữ nhật. Đây là phép truy vấn không gian cơ
bản trong GIS, tuy nhiên mức độ phức tạp của nó cao hơn truy vấn query
trong cơ sở dữ liệu cổ điển bởi khả năng cắt xén đối tượng nếu đối tượng đó
chỉ nằm một phần trong cửa sổ truy vấn.
1.1.3.2. Tìm kiếm lân cận
Phép phân tích này thực hiện tìm kiếm các đối tượng địa lý trong vùng
cận kề với một hoặc một tập đối tượng địa lý biết trước. Có một vài kiểu tìm
kiếm cận kề như:
 Tìm kiếm trong vùng mở rộng (vùng đệm) của một đối tượng: Ví
dụ: Tìm các trạm thu phát sóng điện thoại di động BTS nằm trong vùng phủ
sóng của một trạm BTS nào đó.
 Tìm kiếm liền kề: Ví dụ như tìm các thửa đất liền kề với thửa đất X

nào đó.
1.1.3.3. Phân tích đường đi và dẫn đường
Phân tích đường đi là tiến trình tìm đường đi ngắn nhất, giá rẻ nhất
giữa hai vị trí trên bản đồ. Giải pháp cho bài toán này dựa trên việc sử dụng
mô hình dữ liệu mạng hay mô hình dữ liệu raster trên cơ sở lưới vùng. Mô
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên



15
hình dữ liệu mạng lưu trữ đối tượng đường đi dưới dạng cung và giao của
chúng dưới dạng nút, việc tìm đường bao gồm việc duyệt qua các đường đi từ
điểm đầu tới điểm cuối qua các cung nút và chỉ ra cung đường nào ngắn nhất.
Trong mô hình raster, việc tìm đường thực hiện bởi sự dịch chuyển từ một tế
bào sang tế bào lân cận của nó.
1.1.3.4. Tìm kiếm hiện tượng và bài toán chồng phủ
Việc tìm kiếm hiện tượng trong GIS bao gồm tìm kiếm hiện tượng độc
lập hoặc tìm kiếm tổ hợp các hiện tượng.
Tìm kiếm hiện tượng độc lập là bài toán đơn giản, chỉ bao hàm tìm
kiếm một hiện tượng, thực thể mà không quan tâm đến một hiện tượng, thực
thể khác. Việc tìm kiếm đơn giản chỉ là truy nhập dữ liệu không gian dựa trên
thuộc tính đã xác định trước. Ví dụ như tìm các tỉnh, thành phố có dân số lớn
hơn 2 triệu người…
Tìm kiếm tổ hợp thực thể là bài toán phức tạp hơn, nhưng lại là bài
toán hấp dẫn và là thế mạnh của GIS, việc tìm kiếm liên quan đến nhiều thực
thể hay lớp thực thể, chẳng hạn, tính diện tích đất nông nghiệp của quận
Thanh Trì, Hà Nội. Bài toán này đòi hỏi phải tổ hợp 2 lớp thực thể địa lý là
lớp đất nông nghiệp của thành phố Hà Nội và lớp ranh giới hành chính thành
phố Hà Nội. Kiểu bài toán này trong GIS gọi là bài toán chồng phủ bản đồ.
Bài toán chồng phủ bản đồ

Như trên đã đề cập, nhiều vấn đề trong GIS đòi hỏi sử dụng lớp
chồng
xếp
của các lớp dữ liệu
chuyên đề khác nhau. Chẳng hạn như chúng ta
muốn biết vị trí của các căn hộ giá rẻ nằm trong khu vực gần trường học; hay
khu vực nào là các bãi thức ăn của cá voi trùng với khu vực có tiềm năng dầu
khí lớn có thể khai thác; hoặc là vị trí các vùng đất nông nghiệp trên các khu
vực đất đai bị xói mòn,… Trong ví dụ liên quan đến đất xói mòn trên, một lớp
dữ liệu đất đai có thể được sử dụng để nhận biết các khu vực đất đai bị xói
mòn, đồng thời lớp dữ liệu về hiện trạng sử dụng đất cũng được sử dụng để
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên



16
nhận biết vị trí các vùng đất sử dụng cho mục đích nông nghiệp. Thông thường
thì các đường ranh giới của vùng đất bị xói mòn sẽ không trùng với các đường
ranh giới của các vùng đất nông nghiệp, do đó, dữ liệu về loại đất và sử dụng
đất sẽ phải được kết hợp lại với nhau theo một cách nào đó. Chồng phủ bản đồ
chính là phương tiện hàng đầu hỗ trợ việc thực hiện phép kết hợp dữ liệu đó.
Theo mô hình vector, các đối tượng địa lý được biểu diễn dưới dạng
các
điểm, đường và vùng. Vị trí của chúng được xác định bởi các cặp tọa độ
và thuộc tính của chúng được ghi trong các bảng thuộc tính.
Với từng kiểu bản đồ, người ta phân biệt ba loại chồng phủ bản đồ
vector sau:
Chồng phủ đa giác trên đa giác
Chồng phủ đa giác là một thao tác không gian trong đó một lớp bản đồ
chuyên đề dạng vùng chứa các đa giác được chồng xếp lên một lớp khác để hình

thành một lớp chuyên đề mới với các đa giác mới. Mỗi đa giác mới là một đối
tượng mới được biểu diễn bằng một dòng trong bảng thuộc tính. Mỗi đối tượng
có một thuộc tính mới được biểu diễn bằng một cột trong bảng thuộc tính.

Hình 1.8 Chồng phủ đa giác
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên



17
Việc chồng phủ và so sánh hai bộ dữ liệu hình học có nguồn gốc và độ
chính xác khác nhau thường sinh ra một số các đa giác nhỏ. Các đa giác này có
thể được loại bỏ theo diện tích, hình dạng và các tiêu chuẩn khác. Tuy nhiên,
trong thực tế, khó đặt ra các giới hạn để giảm được số đa giác nhỏ không mong
muốn đồng thời giữ lại các đa giác khác có thể nhỏ hơn nhưng hữu ích.
Chồng phủ điểm trên đa giác
Các đối tượng điểm cũng có thể được chồng xếp trên các đa giác. Các
điểm sẽ được gán các thuộc tính của đa giác mà trên đó chúng được chồng
lên. Các bảng thuộc tính sẽ được cập nhật sau khi tất cả các điểm được kết
hợp với đa giác.
Chồng phủ đường trên đa giác
Các đối tượng đường cũng có thể được chồng xếp trên các đa giác để tạo
ra một bộ các đường mới chứa các thuộc tính của các đường ban đầu và của
các đa giác. Cũng như trong chồng xếp đa giác, các điểm cắt được tính toán,
các nút và các liên kết được hình thành, topo được thiết lập và cuối cùng là
các bảng thuộc tính được cập nhật.
Minh họa cụ thể cho vấn đề chồng xếp bản đồ chúng ta sẽ xét tới tiến
trình phủ đa giác. Tiến trình này được minh họa bởi hình 1.9.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

×