Bài 4
C U TRÚC C S D LI U Ấ Ơ Ở Ữ Ệ
TRONG GIS
BM Đo ảnh và viễn thám
Khái niệm
•
Cấu trúc dữ liệu đề cập đến cách thức tổ
chức dữ liệu thành các file dữ liệu. Chúng
ta đã biết cơ sở dữ liệu trong GIS gồm có
hai thành phần cơ bản là cơ sở dữ liệu
không gian và cơ sở dữ liệu thuộc tính
Cơ sở dữ liệu không gian
•
Định nghĩa: Cơ sở dữ liệu không gian chứa
đựng những thông tin định vị của các đối tượng
•
Chúng cho ta biết được vị trí, kích thước, hình
dạng, sự phân bố… của các đối tượng
•
Có 3 loại đối tượng không gian cơ bản: đối
tượng dạng điểm, đối tượng dạng đường và
đối tượng dạng vùng
•
Trong cơ sở dữ liệu không gian, người ta sử
dụng hai dạng mô hình dữ liệu là: dữ liệu raster
và dữ liệu vector.
Mô hình dữ liệu
Lựa chọn mô hình dữ liệu cho dự án hay ứng dụng phụ thuộc vào:
•
Hai mô hình dữ liệu chính: Raster và véctơ.
A A A A C C C C
A A A A C C C C
A A A B B C C C
A A B B B B B B
B B B B B B B B
Raster
C
A
B
Véctơ
Cấu trúc dữ liệu dạng Raster
Cột thứ i
Dòng
thứ j
(i,j) = (6,1), (3,2), (5,4)
dạng điểm
Dòng
thứ j
Cột thứ i
(i,j) = (1,3), (2,2), (3,2), (4,3),
(5,4), (6,5), (7,6), (8,4)
dạng đường
Dạng vùng
Mô hình dữ liệu raster
•
Mô hình raster chia toàn bộ vùng khảo sát thành các lưới pixel đều
theo thứ tự nhất định được gọi là pixel
–
Thứ tự qui ước là theo từng hàng từ góc trên bên trái.
–
Mỗi pixel chứa một giá trị
–
Mỗi vị trí trong vùng khảo sát tương ứng với 1 pixel trong raster
–
Một tập pixel kết hợp với giá trị là lớp (layer) bản đồ
•
có thể có nhiều lớp bản đồ trong 1 CSDL, thí dụ: loại đất,
loại cây trồng...
•
Mô hình raster cho biết cái gì xảy ra mọi nơi, tại mỗi điểm của
vùng. Đây là mô hình đơn giản nhất của mô hình dữ liệu GIS
Tạo lập Raster
•
Hãy đặt lưới trên bản đồ (thí dụ
bản SDD)
–
tạo lập raster: mã hóa từng
pixel bởi giá trị biểu diễn loại
đất đá mà nó chiếm đa số
phần diện tích của pixel kết
thúc: mỗi pixel có giá trị mã.
•
Thông thường giá trị mã được
lưu trên tệp theo khuôn dạng
ASCII, sau đó nhập vào GIS.
•
Có nhiều phương pháp tạo lập
CSDL raster.
Sông
Hồ
Ao
Hệ thống thủy lợi
0 0 0 0 0 0 1 1 1 1 1 0
0 0 0 0 0 0 1 1 1 1 1 1
0 1 1 1 0 0 2 1 1 1 0 0
0 1 1 1 2 2 0 0 0 0 0 0
0 0 0 0 0 2 0 0 0 0 0 0
0 0 0 0 0 2 0 0 0 0 0 0
0=Đất 1=Nước 2=Sông
Tạo lập Raster
•
Nhập dữ liệu vào GIS
–
nhập trực tiếp từng pixel của layer
•
thực hiện bằng chính phần mềm GIS
•
còn có thể thực hiện bằng công cụ bất kỳ để có tệp
ASCII, sau đó chuyển đổi vào GIS.
–
công việc này căng thẳng và tốn kém thời gian
•
layer có thể chứa hàng triệu tế bào: trung bình thì 1
ảnh Landsat có khoảng 7.4x10
6
tế bào
–
sử dụng nén RLE (Run Length Encoding) để tối ưu
vùng lưu trữ
•
chỉ một vài GIS có khả năng sử dụng tệp nén theo
RLE
•
Dữ liệu có sẵn dưới dạng số: ảnh vệ tinh số…
Giá trị của pixel
•
Các kiểu giá trị
–
kiểu giá trị chứa trong pixel raster
phụ thuộc vào thực tại và phần
mềm GIS nào được sử dụng.
–
các hệ thống khác nhau cho phép
các lớp giá trị khác nhau
•
số nguyên; số thực; giá trị phi
số
2.1 2.3 2.4 2.7 2.9 3.2 3.4
1.9 2.1 2.4 2.6 3.0 3.3 3.4
1.8 2.0 2.3 2.5 2.8 3.1 3.2
1.8 1.9 1.9 2.3 2.5 2.8 3.0
1.8 1.8 1.8 1.9 2.1 2.3 2.7
0 0 1 1 1 2 3
0 1 1 1 2 2 3
0 0 1 1 1 2 2
0 0 0 1 1 1 2
0 0 0 0 0 0 1
a a b b c c a
a b b b c c a
a b b b b c c
a a b b b c c
a a a b c c c
Giá trị nguyên (lớp đất trồng
hay tổng số trang trại)
Giá trị thực (độ cao)
Giá trị phi số (lớp thực vật)
Các giá trị tế bào
•
Nhiều hệ thống chỉ chấp nhận giá trị nguyên, nhưng có hệ thống
chấp nhận nhiều kiểu dữ liệu khác nhau cho cùng tế bào
•
Giá trị nguyên thường đóng vai trò “con trỏ” đến tên trong bảng kết
hợp hay chú giải (legend)
–
thí dụ trên đây có thể là
•
0=không rõ, 1=đất sét mịn, 2=cát thô, 3=sỏi đá
•
Thông thường, mỗi pixel chỉ có một giá trị
–
có thể dẫn tới thiếu chính xác: khi biên của 2 lớp đất đi qua
giữa các tế bào
–
giá trị pixel được xác định bởi phần nhiều hơn mà loại đó có
trong pixel hoặc là giá trị tại điểm giữa pixel
•
Một vài hệ thống cho phép pixel đa trị
–
hệ thống NARIS (University of Illinois) cho phép pixel đa trị kết
hợp với phần trăm: 30%a, 40%b, 30%c