Tải bản đầy đủ (.docx) (14 trang)

ĐỀ CƯƠNG hệ THỐNG THÔNG TIN địa lý

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (174.37 KB, 14 trang )

ĐỀ CƯƠNG HỆ THỐNG THÔNG TIN ĐỊA LÝ
Câu 1: Trình bày khái niệm và thành phần của GIS
1. Khái niệm
GIS là một hệ thống thông tin có khả năng xây dựng, cập nhật, lưu trữ, truy vấn,
xử lý, phân tích và xuất ra các dữ liệu có liên quan tới vị trí địa lý, nhằm hỗ trợ ra quyết
định trong các công tác quy hoạch và quản lý tài nguyên thiên nhiên và môi trường.
2. Các thành phần cơ bản của GIS
Công nghệ GIS bao gồm 5 hợp phần cơ bản là:
 Phần cứng (hardware)
 Phần mềm (software)
 Dữ liệu địa lý (Geographic data)
 Con người (Expertise)

Chính sách và cách thức quản lý (Policy and management)
a. Phần cứng
Thiết bị bao gồm máy vi tính (computer), máy vẽ (plotters), máy in (printer),
bàn số hoá (digitizer), thiết bị quét ảnh (scanners), các phương tiện lưu trữ số
liệu (Floppy diskettes, optical cartridges, C.D ROM v.v...)
b. Phần mềm
Là tập hợp các câu lệnh, chỉ thị nhằm điều khiển phần cứng của máy tính thực
hiện một nhiệm vụ xác định, phần mềm hệ thống thông tin địa lý có thể là một hoặc tổ
hợp các phần mềm máy tính. Phần mềm được sử dụng trong kỹ thuật GIS phải bao
gồm các tính năng cơ bản sau:
- Nhập và kiểm tra dữ liệu (Data input)
- Lưu trữ và quản lý cơ sở dữ liệu (Geographic database)
- Xuất dữ liệu (Display and reporting)
- Biến đổi dữ liệu (Data transformation)
- Tương tác với người dùng (Query input)
c. Chuyên viên
Đây là một trong những hợp phần quan trọng của công nghệ GIS, đòi hỏi những
chuyên viên hướng dẫn sử dụng hệ thống để thực hiện các chức năng phân tích và xử


1


lý các số liệu. Đòi hỏi phải thông thạo về việc lựa chọn các công cụ GIS để sử
dụng, có kiến thức về các số liệu đang được sử dụng và thông hiểu các tiến trình đang và
sẽ thực hiện trên hệ thồng GIS.
d. Số liệu, dữ liệu địa lý (Geographic data)
Số liệu được sử dụng trong GIS không chỉ là số liệu địa lý (georeferenced data) riêng lẻ mà còn phải được thiết kế trong một cơ sở dữ liệu (database).
Những thông tin địa lý có nghĩa là sẽ bao gồm các dữ kiện về: vị trí địa lý, thuộc tính
(attributes) của thông tin, mối liên hệ không gian (spatial relationships) của các
thông tin và thời gian. Có 2 dạng số liệu được sử dụng trong kỹ thuật GIS là: Cơ sở dữ
liệu không gian và cơ sở dữ liệu thuộc tính.
e. Chính sách và quản lý (Policy and management)
Ðây là hợp phần rất quan trọng để đảm bảo khả năng hoạt động của hệ thống, là
yếu tố quyết định sự thành công của việc phát triển công nghệ GIS. Hệ thống GIS cần
được điều hành bởi một bộ phận quản lý, bộ phận này phải được bổ nhiệm để tổ chức
hoạt động hệ thống GIS một cách có hiệu quả để phục vụ người sử dụng thông tin.
Câu 2: Trình bày cách phân loại đối tượng địa lý tự nhiên.
1. Phân loại theo đặc điểm hình học
Theo đặc điểm hình học, các đối tượng địa lý được chia thành đối tượng dạng
điểm, đường và vùng
- Đối tượng dạng điểm là tập hợp các đối tượng có kích thước nhỏ, khó mô tả
thành các đối tượng đường hay vùng. Mỗi điểm được lưu bởi một cặp toạ độ x,y để xác
định vị trí của đối tượng.
- Đối tượng dạng đường là những đối tượng có kích thước hẹp và dạng tuyến khó
thể hiện khó thể hiện ở dạng vùng để tính diện tích. Mỗi đối tượng dạng đường được lưu
tối thiểu hai cặp toạ độ x,y hay chuỗi các cặp toạ độ x,y. Các đoạn đường thường được
mô tả rõ ràng thông qua các thuộc tính của chúng. Các đoạn đường có đặc điểm hình học
khác nhau như đoạn thẳng hay cung
- Đối tượng dạng vùng gồm các đối tượng gồm tập hợp các đối tượng địa lý đặc

trưng cho một vùng nhất định như thửa đất, kiểu sử dụng đất, đơn vị nô tả tính chất lý
hoá, sinh học đất, đơn vị hành chính. Cụ thể mỗi vùng được định nghĩa bởi một đường
biên khép kín gồm tạp các toạ độ x,y theo một tuần tự nhất định, điểm đầu và điểm cuối
trùng nhau
2


2. Phân loại theo quan điểm toán học
Theo quan điểm toán học các đối tượng địa lý được chia thành đối tượng rời rạc và
liên tục
- Đối tượng rời rạc là đối tượng địa lý được coi như một tập hợp gồm các phần tử
riêng rẽ và ta có thể phân biệt được từng phần rõ ràng. Nhiều đối tượng tự nhiên được
phân vào nhóm này như nhà ở, thửa đất, đơn vị hành chính, đường, sông ngòi, kiểu sử
dụng đất, loại đá
- Đối tượng liên tục là những đối tượng và hiện tượng địa lý có sự biến động theo
không gian và các phần tử của tập hợp đó phân biệt rõ ràng. Nhiệt độ, không khí và các
tính chất vật lý và hoá học của đất, địa hình là một số đối tượng tiêu biểu thuộc nhóm đối
tượng liên tục
Câu 3: Nêu khái niệm và đặc điểm, ưu nhược điểm của cấu trúc dữ liệu vector.
1. Ưu điểm:
- Lưu giữ vị trí chính xác của các điểm và đối tượng trên bề mặt Trái đất theo một
hệ quy chiếu nhất định
- Dữ liệu lưu tốn ít bộ nhớ hơn dữ liệu Raster
- Dữ liệu có thể tạo ra từ độ phân giải gốc, không có sự khái quát hoá dữ liệu
- Độ chính xác của dữ liệu gốc được duy trì
- Cho phép tạo Topo các đối tượng, thực hiện phân tích mạng rất tiện ích
- Chuyển đổi hệ toạ độ được thực hiện dễ dàng
2. Nhược điểm:
- Mô hình dữ liệu vector tỏ ra hạn chế trong phân tích dữ liệu không gian
- Cấu trúc dữ liệu phức tạp

- Thực hiện các phép toán chồng ghép là rất khó khăn
- Vị trí mỗi điểm phải lưu trữ một cách chính xác
- Cho phân tích không gian, dữ liệu vector phải được chuyển sang mô hình
Topology. Quá trình sửa lỗi để tạo Topology khá tốn kém thời gian. Hơn nữa, dữ liệu
Topology phải thường xuyên tạo lại vì các dữ liệu điểm, đường và đa giác thường xuyên
thay đổi.
- Các thuật toán áp dụng cho phân tích không gian rất phức tạp
- Các dữ liệu liên tục như dữ liệu độ cao, độ dốc không được hiển thị hiệu quả đối
với mô hình dữ liệu Vector
3


- Phân tích không gian và làm trơn dữ liệu không thể thực hiện được trong ranh
giới của vùng (polygon).
Câu 4: Nêu khái niệm và đặc điểm của mô hình số độ cao.
1.

Khái niệm
Mô hình số độ cao (Digital Elevation Model - DEM) là sự biểu diễn bằng số của

bề mặt địa hình hoặc khoảng chênh cao của mặt đất so với một bề mặt mốc trắc địa nào
đó (bề mặt Geoid) trong không gian ba chiều.
Mô hình số độ cao có thể hiển thị theo mô hình dữ liệu dạng Vector gọi là TIN
(Triangulated Irregular Network) hay theo mô hình dữ liệu Raster có tên gọi là DEM
(Digital Elevation Model).
2. Đặc điểm
Về bản chất, DEM là mô hình số, khái quát và mô tả bề mặt địa hình trong không
gian 3 chiều theo các giá trị tọa độ x, y và độ cao h, theo đó tại một vị trí bất kỳ trong mô
hình đó, độ cao tại vị trí đó có thế nội suy được.
Mô hình số độ cao dạng Vector: TIN - Triangulated Irregular Network

+ TIN là một mô hình dữ liệu Vector dạng Topology được xây dựng dựa trên tập
tam giác, tập các điểm nút (nodes) và cạnh (edges). Các nodes kết nối với nhau để tạo
thành các cạnh và mạng lưới các tam giác xếp liền nhau.
+ Là tập các đỉnh được nối với nhau thành các tam giác. Các tam giác này hình
thành bề mặt 3 chiều (x,y,z)
+ Mỗi một tam giác được giới hạn bởi 3 điểm đồng nhất về giá trị X,Y và Z (độ
cao)
+ TIN biểu diễn bề mặt liên tục từ những tập hợp điểm phân bố rời rạc bất kỳ.
Mô hình số độ cao dạng Raster: DEM - Digital Elevation Model
+ Mô hình Raster DEM (GRID) là một ma trận các ô vuông và chia thành các
hàng và cột.
+ Mỗi một ô (pixel) chứa giá trị độ cao của điểm trung tâm của ô
Câu 5: Nêu khái niệm và đặc điểm, ưu nhược điểm của cấu trúc dữ liệu raster.
1. Khái niệm
Cấu trúc dữ liệu Raster là ma trận ô vuông. Mỗi ô vuông gọi là một pixel và đại
diện cho một điểm trên thực địa. Nếu một vùng lãnh thổ nào đó được chia thành ma trận
4


ô vuông, mỗi ô vuông có tọa độ riêng, tập các ô vuông trong vùng lãnh thổ chính là thực
thể dữ liệu. Nếu các điểm coi như nằm ở tâm của mỗi ô vuông, ta thành lập được một
bảng dữ liệu gồm tọa độ địa lý của các điểm trong vùng nhất định. Một ma trận ô vuông
cho một vùng lãnh thổ gọi là mô hình dữ liệu Raster.
2. Đặc điểm:
- Không gian được chia thành các ô, là ma trận số gồm hàng và cột
- Vị trí của các đối tượng xác định bằng vị trí hàng và cột
- Ô hay pixel là đơn vị cơ sở trong mô hình dữ liệu raster
- Pixel đồng nhất ở bên trong được sắp xếp thành một lưới biểu diễn một đối tượng
xác định trên Trái đất.
- Mỗi pixel chứa một số nguyên (hoặc số thực) biểu diễn kiểu hay giá trị thuộc tính

xuất hiện trên bản đồ
- Độ phân giải không gian được quyết định bởi kích thước ô
3. Ưu, điểm
a. Nhược điểm
So với mô hình dữ liệu Vector, mô hình Raster có một số ưu điểm. Một trong
những ưu điểm nổi trội là cấu trúc dữ liệu phù hợp cho thực hiện các phép tính đại số bản
đồ và nhiều thuật toán phức tạp khác. Một số ưu điểm chính của dữ liệu Raster đã được
khái quát hóa bao gồm:
- Cấu trúc dữ liệu đơn giản, thành phần cơ bản của bản đồ chỉ gồm Pixel.
- Vị trí của mỗi điểm được lưu đơn giản bằng tọa độ hàng và cột của ma trận số.
- Phân tích không gian được thực hiện dễ dàng và thuận tiện.
- Dữ liệu Raster thích hợp cho mô hình hóa và tính toán định lượng.
- Các dữ liệu rời rạc (discrete data) và dữ liệu như độ cao có thể kết hợp dễ dàng
- Dữ liệu raster thích hợp váo các thiết bị đầu ra như máy in (electrostatic plotters)
và hiển thị dữ liệu đồ hoạ (graphic terminals)
- Nhiều dữ liệu số như ảnh vệ tinh, ảnh máy bay sẵn có và đa dạng, có khả năng
cập nhật nhanh dữ liệu số này
b. Nhược điểm
Cũng giống như dữ liệu vector, dữ liệu raster cũng tồn tại những mặt hạn chế. Một
số mặt hạn chế đã được ghi nhận bao gồm:
- Độ phân giải của pixel hạn chế khả năng mô tả chi tiết đối tượng.
5


- Rất khó hiển thị các đối tượng hình tuyến chính xác như đường giao thông, thuỷ
văn
- Xử lý dữ liệu thuộc tính là khó khăn trong trường hợp cơ sở dữ liệu lớn. Mỗi bản
đồ raster chỉ tương ứng với một thuộc tính nhất định.
- Hầu hết các bản đồ chỉ tồn tại ở dạng vector, để sử dụng dữ liệu raster cần thực
hiện chuyển đổi dữ liệu sang dạng raster

- Các bản đồ raster thường có màu sắc kém hấp dẫn và kém đẹp hơn dữ liệu vector
- Chuyển đổi hệ toạ độ thực hiện khó khăn hơn dữ liệu vector
Câu 6: Phân biệt đối tượng địa lý với hiện tượng địa lý. Nêu các thông tin của đối
tượng địa lý, hiện tượng địa lý có thể thể hiện trong GIS? Cho ví dụ.
1. Phân biệt đối tượng địa lý với hiện tượng địa lý
Đối tượng địa lý là những thực thể tự nhiên như sông ngòi, thửa đất hay thực thể
nhân tạo như các công trình hạ tầng kinh tế xã hội trên bề mặt trái đất. Còn hiện tượng
địa lý là những khái niệm trừu tượng và phân biệt với đối tượng địa lý vì chúng thường
không tồn tại ở một hình thái hay hình dạng nhất định và thường biến đổi theo thời gian.
2. Các thông tin của đối tượng, hiện tượng địa lý
a. Thông tin của đối tượng địa lý
Khi một đối tượng địa lý không được hiển thị ở mọi vị trí trong khu vực nghiên
cứu, chúng được hiển thị một cách rải rác, thưa thớt, và được coi như là một tập hợp các
đối tượng địa lý. Các đối tượng như vậy cần được xác định các thông tin:
- Vị trí
- Hình dạng
- Kích thước
- Hướng
b. Thông tin của hiện tượng địa lý
Định nghĩa một hiện tượng địa lý trong hệ GIS cần phải quan tâm đến những
thông tin sau:
- Hiện tượng đó được đặt tên hoặc mô tả như thế nào.
- Hiện tượng được tham chiếu địa lý.
- Xác định thời gian hiện tượng tồn tại
Câu 7: Khái niệm cơ sở dữ liệu. Khái niệm cơ sở dữ liệu không gian. Khái niệm cơ
sở dữ liệu phi không gian.
6


1. Khái niệm cơ sở dữ liệu (Database)

Là tập hợp các thông tin được thu thập theo mục đích sử dụng nào đó, được lưu
trữ trong máy tính theo những quy tắc nhất định. Đó là tập hợp dữ liệu mà có the điều
khiến và lưu trữ một số lượng lớn dữ liệu và dữ liệu có thế chia sẻ giữa các ứng dụng
khác nhau.
2. Khái niệm cơ sở dữ liệu không gian
Cơ sở dữ liệu không gian là cơ sở dữ liệu chứa đựng các thông tin về vị trí, kích
thước, hình dạng, sự phân bố và mối quan hệ của các đối tượng.
3. Cơ sở dữ liệu phi không gian (thuộc tính)
Cơ sở dữ liệu phi không gian (thuộc tính) là các file dữ liệu mô tả các đối tượng
địa lý
Câu 8: Trình bày đặc điểm của các cấu trúc Spaghetty, Topology.
1. Đặc điểm của cấu trúc dữ liệu Spaghetti
Mô hình dữ liệu Spaghetti có cấu trúc đơn giản, mỗi đối tượng địa lý được lưu trữ
độc lập, vì vậy, một cặp toạ độ có thể xuất hiện hai hay nhiều lần để lưu hai hay nhiều
đối tượng liền kề nhau.
Không thể hiện mối quan hệ giữa các đối tượng.
Phần tử cơ bản của cấu trúc dữ liệu spaghetti là điểm, đường, vùng.
Mỗi nhóm đối tượng điểm, đường, vùng và đa giác được lưu thành các tệp riêng
biệt.
2. Đặc điểm của cấu trúc dữ liệu Topology
Mô hình dữ liệu Topology được gọi là cấu trúc cung – nút. Cấu trúc này được xây
dựng trên mô hình cung – nút trong đó cung là phần tử cơ bản.
Thể hiện mối quan hệ không gian của các đối tượng.
Trong cấu trúc dữ liệu Topology một điểm chỉ được lưu trữ 1 lần.
Các phần từ không gian trong cấu trúc Topology được xác định dựa trên các đặc
điểm sau:
+ Mỗi cung được xác định bởi 2 nút
+ Các phần tử ở giữa 2 nút là các điểm điều khiển (vertex), các điểm này xác định
hình dạng của cung.
+ Các cung giao nhau tại các nút, điểm bắt đầu và điểm kết thúc của một cung

7


phải là nút.
+ Vùng là tập hợp các cung khép kín, trong trường hợp vùng trong vùng thì phải
có sự phân biệt giữa cung bên trong và cung bên ngoài
Câu 9: Khái niệm mô hình số độ cao? Trình bày các ứng dụng của mô hình số độ
cao.
1. Khái niệm mô hình số độ cao
Mô hình số độ cao (Digital Elevation Model - DEM) là sự biểu diễn bằng số của
bề mặt địa hình hoặc khoảng chênh cao của mặt đất so với một bề mặt mốc trắc địa nào
đó (bề mặt Geoid) trong không gian ba chiều.
Mô hình số độ cao có thể hiển thị theo mô hình dữ liệu dạng Vector gọi là TIN
(Triangulated Irregular Network) hay theo mô hình dữ liệu Raster có tên gọi là DEM
(Digital Elevation Model).
2. Ứng dụng của mô hình số độ cao
DEM có thể được sử dụng trong nhiều lĩnh vực khác nhau, như:
- Lưu trữ dữ liệu độ cao trong cơ sở dữ liệu không gian quốc gia
- Nắn ảnh trực giao trong công nghệ xử lý ảnh số
- Nội suy các đường bình độ, hay các đường đẳng trị
- Tạo các bản đồ chuyên đề từ DEM, như: bieu đồ khối, mặt cắt địa hình, bản đồ
độ dốc, độ lồi, độ lõm và hướng địa hình, bản đồ địa hình nổi, mạng lưới thủy văn. Các
bản đồ này trợ giúp tốt cho nghiên cứu địa mạo, tính toán độ sói lở, xâm thực, ... Do đó,
hỗ trợ nghiên cứu dự báo trượt lở đất, dự báo xói mòn, lũ lụt.
- Mô phỏng địa hình, phục vụ cho các mục đích quân sự (hệ thống dẫn đường, tính
toán tầm nhìn, tầm bắn, vùng quét của radar, địa hình ảo tập lái máy bay, tập lái xe
tăng, .), các mục đích dân sự (quy hoạch và thiết kế cảnh quan, hệ thống thoát nước cho
đô thị, .)
- DEM được sử dụng như một phương tiện, phục vụ cho các công tác khảo sát,
thiết kế, tính toán khối lượng đào đắp trong thiết kế các công trình, thiết kế đường xá,

quy hoạch thủy lợi, quy hoạch các khu công nghiệp
- Sử dụng DEM đế mô hình hóa các đối tượng không gian trong các ngành khoa
học về trái đất, như: trong địa chất, địa chất thủy văn, trong khai thác mỏ, trong nghiên
cứu đại dương
- DEM có thế được ứng dụng rộng rãi trong các ngành du lịch, quy hoạch, kiến
8


trúc, thủy điện, thủy lợi, nông nghiệp, công nghệ giải trí, ...
Câu 10: Trình bày khái niệm phân tích dữ liệu. Trình bày phân loại các phép phân
tích dữ liệu trong GIS theo số lớp sử dụng trong phân tích dữ liệu.
1. Phân tích dữ liệu
Phân tích dữ liệu trong GIS là việc sử dụng các phương pháp để phân tích dữ liệu
địa lý nhằm nghiên cứu và tìm ra những quy luật phân bố không gian, cung cấp thông tin
hữu ích đáp ứng nhu cầu thông tin của người sử dụng.
2. Phân loại các phép phân tích dữ liệu trong GIS theo số lớp sử dụng trong phân tích
dữ liệu
- Nhóm các phép phân tích dữ liệu dựa trên một lớp dữ liệu:
Là các phép phân tích nhằm phân tích mối liên quan giữa các đối tượng trong một
lớp dữ liệu bản đồ. Các dạng phân tích với một lớp dữ liệu bao gồm đo lường , phân loại,
truy vấn ; phân tích lân cận; phân tích mạng.
- Nhóm các phép phân tích dữ liệu dựa trên hai lớp dữ liệu: được thực hiện thông
qua chồng xếp (map overlay) hai lớp dữ liệu bản đồ. Hai lớp dữ liệu được chồng xếp trên
cơ sở các phép tính số học và đại số để tạo ra lớp dữ liệu mới. Phân tích chồng xếp được
thực hiện phổ biến với dữ liệu Raster. Tuy nhiên, dữ liệu Vector cũng có thể thực hiện
chức năng chồng ghép. Nguyên lý chung của chồng ghép là kết hợp các đối tượng ở cùng
một vị trí.
- Nhóm các phép phân tích dữ liệu dựa trên nhiều lớp dữ liệu: là dạng phân tích
nâng cao và phức tạp nhất. Các phân tích nâng cao này thường dựa trên các mô hình tính
toán phức tạp; các công thức tính toán khác nhau để kết hợp dữ liệu đầu vào và tạo ra lớp

thông tin mới. Các phép toán đại số bản đồ (map algabra), công thức tính toán (spatial
models), phép tính logic và các loại thuật toán khác có thể sử dụng để thực hiện sự kết
hợp.
- Các phương pháp xử lý dữ liệu chung: bao gồm chuyển đổi hệ quy chiếu và
chuyển đổi dữ liệu như chuyển dữ liệu từ dạng cấu trúc Vector sang cấu trúc Raster
Câu 11: Trình bày phân tích dữ liệu thuộc tính: Truy vấn dữ liệu trên bảng dữ liệu.
Tính toán trên trường dữ liệu thuộc tính, tạo bản đồ từ các trường thuộc tính.
1. Truy vấn dữ liệu trên bảng dữ liệu
Truy vấn đơn giản nhất là tìm một số bản ghi (hàng) và hiển thị từ bảng dữ liệu
thuộc tính hay chọn một số bản ghi từ bảng dữ liệu. Trên cơ sở dữ liệu được xây dựng,
9


những câu hỏi liên quan đến dữ liệu thường được thực hiện thông qua quá trình truy vấn
cơ sở dữ liệu. Quá trình truy vấn hay tìm kiếm này cho ra kết quả dưới dạng các bảng hay
biểu đồ. Để thực hiện việc truy vấn (database query), ta cần thành lập các biểu thức logic
biểu thị các điều kiện theo cấu trúc các câu lệnh chuẩn của ngôn ngữ truy vấn có cấu trúc
SQL (Structured Query Language). Cơ sở dữ liệu trong các phần mềm GIS đều hoạt
động dựa trên các nguyên lý chung của mô hình dữ liệu quan hệ và ngôn ngữ truy vấn có
cấu trúc SQL. Một số biểu thức logic truy vấn có thể đơn giản với chỉ một điều kiện
nhưng nhiều biểu thức rất phức tạp, thường thì bao gồm rất nhiều điều kiện.
2. Tính toán trên trường dữ liệu
Nhiều dạng tính toán có thể thực hiện với dữ liệu trên trường của bảng thuộc tính.
Một số phép tính phổ biến là tính diện tích, chiều dài và chu vi của đối tượng. Hơn nữa,
các tính toán phức tạp sử dụng các hàm toán số sơ cấp hay công thức tính toán cũng có
thể thực hiện. Ví dụ, ta có bảng dữ liệu thuộc tính về các thửa đất, trong đó có trường
diện tính và hạng đất. Giả sử mức thuế được tính dựa vào diện tích và hạng đất, ta có thể
tính được mức thuế cho mỗi thửa đất.
3. Tạo bản đồ từ các trường thuộc tính
Mỗi thuộc tính của đối tượng có thể được hiển thị như bản đồ chuyên đề. Ví dụ,

bản đồ đất chứa nhiều thông tin thuộc tính như pH, độ dày tầng đất, lượng chất hữu cơ
trong đất. Các thuộc tính này lưu trong bảng dữ liệu thuộc tính được kết nối với tệp bản
đồ chỉ ra ranh giới từng loại đất. Các thuộc tính này có thể được gán gia trị và tạo bản đồ
thuộc tính riêng.
Câu 12: Nêu khái niệm và những lợi ích của chuẩn dữ liệu địa lý
1. Khái niệm
Sự chuẩn hóa dữ liệu địa lý có thể hiểu là sự áp dụng bộ tiêu chuẩn và thỏa thuận
chung của các cá nhân, tổ chức, hiệp hội hay thậm chí cả các quốc gia trong quá trình thu
thập và xây dựng dữ liệu, phân tích dữ liệu và chia sẻ dữ liệu.
2. Lợi ích
- Chuẩn hóa dữ liệu địa lý mang lại hiệu quả kinh tế rõ rệt như giảm chi phí thu
thập và xử lý dữ liệu. Sự chuẩn hóa dữ liệu địa lý thúc đẩy sự trao đổi thông tin giữa các
nhóm sử dụng thông tin được thuận lợi và hiệu quả. Ở khía cạnh kinh tế, nó góp phần
giảm chi phí cho xây dựng cơ dữ liệu và biên tập cơ sở dữ liệu. Đặc biệt, sự chuẩn hóa dữ
10


liệu giúp cho các nhà phát triển phần mềm hệ thống GIS hình thành tiêu chuẩn chung.
- Chuẩn hóa giảm thiểu được sự sai số và mất mát dữ liệu. Nếu dữ liệu xây dựng
theo các định dạng và cấu trúc khác nhau. Dữ liệu chuyển đổi từ dạng này sang dạng
khác sẽ gây ra hiện tượng mất dữ liệu và sai số dữ liệu so với dữ liệu gốc.
- Chuẩn hóa tạo điều kiện cho chia sẻ dữ liệu cho các nhóm người sử dụng các
phần mềm GIS khác nhau.
- Chuẩn hóa tạo thuận lợi cho công tác đào tạo và sử dụng các hệ GIS. Ví dụ, sự
phát triển các phần mềm chuẩn sẽ cho phép nhiều người có thể sử dụng cùng một phần
mềm cho nhiều mục đích khác nhau, giảm cho phí phát triển phần mềm không cần thiết.
- Nâng cao chất lượng quản lý dữ liệu và giảm sai số dữ liệu.
Câu 13: Phép đo đạc là gì?
Truy vấn lựa chọn là gì?
Chồng xếp dữ liệu là gì?

Phân tích lân cận là gì?
1. Phép đo đạc
Phép đo đạc là chức năng đơn giản nhất trong phân tích dữ liệu địa lý với cả dữ
liệu Raster và Vector. Nội dung đo đạc chủ yếu là xác định vị trí, chiều dài, diện tích. Các
phép đo này được thực hiện khác nhau giữa hai loại dữ liệu Vector và Raster.
Đo đạc với dữ liệu Vector: Đơn vị cơ bản của dữ liệu là điểm, đường và vùng. Vì
vậy, các phép đo đạc sẽ là xác định vị trí, chiều dài, khoảng cách và diện tích của các đối
tượng địa lý. Vị trí của một đối tượng địa lý được lưu dưới dạng một tọa độ x,y với đối
tượng điểm, một dãy cặp tọa độ với dạng dữ liệu đường và vùng.
Đo đạc với dữ liệu Raster: Các phép đo đạc trên dữ liệu Raster được thực hiện
đơn giản hơn vì cấu trúc dữ liệu Raster đơn giản hơn Vector. Xác định vị trí một điểm là
vị trí của pixel trong lớp dữ liệu Raster. Vị trí của pixel được xác định bằng tọa độ hàng
và cột của lớp dữ liệu. Diện tích được tính bằng tổng các pixel nhân với diện tích một
pixel. Diện tích của pixel được tính dựa trên độ phân giải.
2. Truy vấn lựa chọn
Phép truy vấn lựa chọn là phép phân tích nhận biết các thực thể thỏa mãn một
hay nhiều điều kiện hay tiêu chí nào đó. Các thuộc tính hay đặc điểm hình học của các
thực thể được kiểm tra dựa vào các tiêu chí và chỉ những gì thỏa mãn các tiêu chí mới
11


được lựa chọn. Các thực thể được lựa chọn đó có thể được ghi lại lên trên một lớp dữ liệu
mới hoặc dữ liệu hình học hay thuộc tính của chúng được lưu lại theo một vài cách khác
nhau.
Để thực hiện việc truy vấn (database query), ta cần thành lập các biểu thức
biểu thị các điều kiện theo cấu trúc các câu lệnh chuẩn của ngôn ngữ truy vấn có cấu trúc
SQL (Structured Query Language). Một số biểu thức truy vấn có thể đơn giản với chỉ
một điều kiện nhưng nhiều biểu thức rất phức tạp, thường thì bao gồm rất nhiều điều
kiện.
Biểu thức truy vấn sử dụng các toán tử đại số tập hợp : nhỏ hơn (<), nhỏ hơn

hoặc bằng (<=), lớn hơn (>), lớn hơn hoặc bằng (>=), bằng (=) và không bằng (<>) và các
toán tử logic: OR, AND, NOT và NOR(XOR)
3. Chồng xếp dữ liệu
Chồng xếp dữ liệu được thực hiện thông qua chồng xếp (map overlay) hai lớp bản
đồ. Là sự gộp chung dữ liệu không gian và thuộc tính của hai hay nhiều lớp dữ liệu.
Hai lớp dữ liệu được chồng xếp trên cơ sở các phép tính số học và đại số để tạo ra
lớp dữ liệu mới. Phân tích chồng xếp được thực hiện phổ biến với dữ liệu Raster. Tuy
nhiên, dữ liệu Vector cũng có thể thực hiện chức năng chồng ghép. Nguyên lý chung của
chồng ghép là kết hợp các đối tượng ở cùng một vị trí theo chiều thẳng đứng. Các phép
toán đại số bản đồ, công thức tính toán, phép tính logic và các loại thuật toán khác có thể
sử dụng để thực hiện sự kết hợp.
4. Phân tích lân cận
Phép phân tích lân cận là một trong số các phép phân tích dữ liệu được sử dụng
phổ biến. Phép phân tích lân cận là phép phân tích tạo vùng đệm, là một vùng có kích
thước nhỏ hơn hoặc bằng một khoảng cách được xác định trước từ một hay nhiều đối
tượng. Vùng đệm có thể được xác định cho đối tượng điểm, đường hay vùng và cho dữ
liệu vector hay raster. Vùng đệm thường là các vùng bên ngoài đối tượng với một khoảng
cách giới hạn cho trước.
Câu 14: Trình bày các loại sai số dữ liệu địa lý do thu thập dữ liệu.
Sai số do thu thập dữ liệu
Sai số dữ liệu có thể xuất hiện ở các giai đoạn khác nhau từ khâu thu thập dữ liệu,
phân tích dữ liệu, lưu trữ và hiển thị dữ liệu. Sai số về dữ liệu liên quan đến nhiều
12


nguyên nhân như phương pháp khảo sát và quan trắc, chất lượng các thiết bị quan trắc,
sự lựa chọn hệ quy chiếu bản đồ, sự thiên lệch của người quan trắc.
Sai số do dung lượng mẫu quan trắc: Đã có rất nhiều nghiên cứu chỉ ra rằng phân
bố các điểm mẫu quan trắc ảnh hưởng đến sai số dữ liệu. Tuy vậy, các cơ sở cung cấp dữ
liệu bản đồ thường từ chối cung cấp các thông tin liên quan đến quá trình lấy mẫu và thu

thập thông tin để xây dựng các bản đồ. Khi có đầy đủ các thông tin về địa điểm, thời gian
lấy mẫu và các thông tin liên quan thì người sử dụng bản đồ có thể sử dụng những công
cụ thống kê như lý thuyết thông kê lấy mẫu, kỹ thuật xử lý thống kê địa vật lý, v.v. để
xem xét và đánh giá với mức độ tin cậy hợp lý cho các kết quả phân tích dữ liệu GIS.
Sai số do thiết bị quan trắc: Nhìn chung c ác thiết bị quan trắc đều có sai số ở một
mức độ nhất định. Đặc biệt, dữ liệu thu thập có thể có sai số lớn nếu thiết bị quan trắc cũ
hay bị hư hỏng được sử dụng.
Sai số do phân tích trong phòng thí nghiệm: Sai số dữ liệu có thể xuất hiện trong
quá trình phân tích mẫu trong phòng thí nghiệm. Tuy nhiên, nhìn chung chất lượng dữ
liệu thu thập thông qua phân tích trong phòng thí nghiệm bao giờ cũng sai số ít hơn so
với thu thập dữ liệu bằng các phương pháp khác.
Sai số do số hóa bản đồ: Nguồn gốc sai số trong quá trình số hóa chủ yếu từ sai
số của bản đồ gốc. Với đối tượng điểm, sai số thường là sai lệch vị trí. Với đối tượng
đường, sai số chủ yếu là do kích thước đường biên quanh đối tượng vùng lớn. Nguyên
tắc chung là lấy đường ở giữa đường biên làm đường biên khi số hóa. Ngoài ra, kỹ năng
số hóa của kỹ thuật viên cũng ảnh hưởng đến sai số dữ liệu.
Sai lệch vị trí do đối tượng địa lý liên tục: Dữ liệu ranh giới của các thửa đất có
thể hiển thị đạt độ chính xác cao. Tuy nhiên, các đường biên của các đơn vị đất và kiểu
phân bố thực vật thì rất khó đạt được độ chính xác cao. Hơn nữa, ranh giới về sự biến đổi
chế độ thủy văn và độ dốc cũng không có ranh giới rõ ràng. Những khó khăn trong hiển
thị ranh giới của đối tượng địa lý là nguyên nhân dẫn đến sự sai lệch vị trí.
Sai lệch dữ liệu thuộc tính: Độ chính xác của dữ liệu thuộc tính phụ thuộc vào
mức độ tin cậy của dữ liệu khi chúng được gán vào các thực thể điểm, đường và vùng
của bản đồ. Người ta phân biệt độ chính xác về định tính và độ chính xác định lượng. Độ
chính xác định tính liên quan đến bản chất của dữ liệu thuộc tính. Độ chính xác định
lượng liên quan đến ước tính giá trị thuộc tính

13



*****
-------THE END-------

14



×