Tải bản đầy đủ (.pdf) (123 trang)

HỆ THỐNG THÔNG TIN ĐỊA LÝ GEOGRAPHICAL INFORMATION SYSTEM

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.89 MB, 123 trang )

HỆ THỐNG THÔNG TIN ĐỊA LÝ
GEOGRAPHICAL INFORMATION SYS
TEM
Các kỹ thuật phân tích không gian (spatial analytical technicques) có nhiệm
vụ phân tích theo trật tự và tổ hợp không gian của các hiện tượng hoặc các yếu tố
(tự nhiên - kinh tế - xã hội). Mối liên quan đó được cụ thể bằng trật tự không gian
địa lý, nghĩa là mọi hiện tượng và tính chất của các yếu tố cần phải được bản đồ
hóa.
Bản đồ là cách trình bày cụ thể nhất trong không gian hai chiều các tính chất,
vị trí, mối liên hệ và trật tự trong không gian của các đối tượng hoặc hiện tượng
cần nghiên cứu. Tuy nhiên do có nhiều cách trình bày bản đồ khác nhau nên dẫn
đến sự khó khăn trong việc xử lý mối quan hệ không gian giữa các lớp thông tin.
Trong hơn một thập kỷ qua, hệ thống thông tin địa lý đã được phát triển
mạnh mẽ và ngày càng thêm hoàn thiện. Với những ưu thế của mình, hệ thông tin
địa lý- geographical information system ( HTTĐL) là một môi trường có khả năng
quản lý hệ thống cơ sở dữ liệu và xử lý chính xác các lớp thông tin trong mối quan
hệ không gian giữa chúng. HTTĐL có khả năng bổ sung, đo đạc và tự động tính
toán chính xác về mặt định lượng các thông tin trên bản đồ, cùng các thuộc tính
của chúng, đồng thời có thể đưa ra các tính toán dự báo.
I.CÁC KHÁI NIỆM CƠ BẢN VỀ HTTĐL
I.1.Định nghĩa
Hệ thông tin địa lý (HTTĐL)- Geographical information system ( GIS) là
một tổ chức tổng thể của bốn hợp phần: phần cứng máy tính, phần mềm, tư liệu
địa lý và người điều hành được thiết kế hoạt động một cách có hiệu quả nhằm tiếp
nhận, lưu trữ, điều khiển, phân tích và hiển thị toàn bộ các dạng dữ liệu địa lý.
HTTĐL có mục tiêu đầu tiên là xử lý hệ thống dữ liệu trong môi trường không
gian địa lý. (Viện nghiên cứu môi trường Mỹ - 1994).
Một định nghĩa khác có tính chất giải thích, hỗ trợ là: HTTĐL là một hệ
thống máy tính có chức nănng lưu trữ và liên kết các dữ liệu địa lý với các đặc tính
của bản đồ dạng đồ họa, từ đó cho môt khả năng rộng lớn về việc xử lý thông tin,
hiển thị thông tin và cho ra các sản phẩm bản đồ, các kết quả xử lý cùng các mô


hình (antenucci 1991)
Một con đường hoặc con sông, con suối thường được biểu diễn bằng các yếu
tố đường, mặc dù trong thực tế có thể đo được cả độ rộng và chiều dài của chúng
trên bản đồ. Các đối tượng tự nhiên thường được thể hiện bằng các đường, cung,
vùng, điểm, tuỳ theo các đặc trưng cụ thể mà chúng được thể hiện theo các hình
mẫu cụ thể.

Hình 1. Mô tả một số khái niệm vector nguồn
Một số khái niệm chính được cụ thể trong định nghĩa này như sau:
• Đường (line): là các đối tượng có một kích thước.
• Đoạn thẳng (line segment): là đường nối trực tiếp giữa hai điểm.
• Đường gấp khúc: là các đọan thẳng nối liên tục, có thể khác hướng song
không có điểm nối hoặc có thể điểm nối ở một phía (phải hoặc trái). Đường gấp
khúc có thể cắt qua chính nó hoặc cắt các đường khác.
• Cung (area) là một đoạn tập hợp các điểm tạo nên một dạng đường cong
mà đường cong đó được xác định bằng một hàm toán.
• Đoạn nối (link) là đối tượng có một kích thước nối giữa hai nút. Đoạn nối
cũng được hiểu là đường gờ (edges) hay đường viền.
• Đoạn nối trực tiếp : là đoạn nối giữa hai nút với một hướng nhất định.
• Dây xích (chain): là sự nối liên tục của các đoạn thẳng không cắt nhau
hoặc giữa các cung với các nút ở cuối mỗi cung. Các nút có thể nằm ở bên phải
hay bên trái là không bắt buộc
• Vùng: là đặc điểm thể hiện hai kích thước cả vị trí và diện tích, là đối
tượng xác định về mặt ranh giới, liên tục và có hai kích thước. Nó có thể bao gồm
cả phần bên hoặc không
I.2.Cấu trúc của HTTĐL
HTTĐL bao gồm các hợp phần cơ bản như sau: tài liệu không gian, người
điều hành, phần cứng, phần mềm (hình 2).

Hình 2. Mô hình tổ chức của HTTĐL

Dữ liệu không gian: Dữ liệu không gian cỏ thể đến từ nhiều nguồn, có các
nguồn tư liệu sau: số liệu tính toán thống kê, báo cáo, các quan trắc thực địa, ảnh
vệ tinh, ảnh máy bay, bản đồ giấy (dạng analog). Kỹ thuật hiện đại về viễn thám
và HTTĐL có khả năng cung cấp thông tin không gian bao gồm các thuộc tính địa
lý, khuôn dạng dữ liệu, tỷ lệ bản đồ và các số liệu đo đạc. Việc tích hợp các tư liệu
địa lý từ nhiều nguồn khác nhau là đặc điểm cơ bản của một phần mềm HTTĐL.
Thông thường, tư liệu không gian được trình bày dưới dạng các bản đồ giấy
với các thông tin chi tiết được tổ chức ở một file riêng. Các tư liệu đó không đáp
ứng được các nhu cầu hiện nay về tư liệu không gian là vì những lý do sau:
- Đòi hỏi không gian lưu trữ rất lớn, tra cứu khó khăn. Để nhập và khai
thác dữ liệu, nhất thiết phải liên kết được với các thông tin địa lý trên bản đồ và
các dữ liệu thuộc tính khác được lưu trữ riêng biệt và điều này trở nên rất khó
khăn với hình thức lưu trữ dạng kho hoặc thư viện.
- Các khuôn dạng lưu trữ truyền thống thường không tương thích với các
tiêu chuẩn dữ liệu hiện nay. Thay thế cho các dữ liệu dạng truyền thống, hiện nay
tư liệu dạng số với một khối lượng rất lớn có thể được lưu trữ trong các đĩa CD,
tương ứng với những khối lượng rất lớn của tư liệu analoge. Tư liệu số còn cho
khả năng xử lý tự động trên máy tính.
Như vậy, HTTĐL là sự phát triển đặc biệt để sử dụng công nghệ và nghệ
thuật máy tính trong việc xử lý tư liệu không gian dạng số.
Người điều hành
Vì HTTĐL là một hệ thống tổng hợp của nhiều công việc kỹ thuật, do đó đòi
hỏi người điều hành phải được đào tạo và có kinh nghiệm trong nhiều lĩnh vực.
Người điều hành là một phần không thể thiếu được của HTTĐL. Hơn nữa sự phát
triển không ngừng của các kỹ thuật phần cứng và phần mềm đòi hỏi người điều
hành phải luôn được đào tạo. Những yêu cầu cơ bản về người điều hành bao gồm
các vấn đề sau:
Có kiến thức cơ bản về địa lý, bản đồ, máy tính và công nghệ thông tin:
- Việc đào tạo cơ bản về địa lý cung cấp khả năng khai thác các đặc điểm
không gian (spatical process) và các quá trình không gian, đồng thời phát hiện

được mối quan hệ không gian giữa các hợp phần.
- Bản đồ học cung cấp các hiểu biết về thiết kế bản đồ, lập bản đồ (ví dụ:
Lưới chiếu bản đồ, hệ thống tọa độ, các mẫu ký tự trên bản đồ và các kỹ thuật in
ấn).
- Khoa học về máy tính và thông tin cung cấp các kiến thức cơ bản về phần
cứng máy tính và vận hành thông thạo các chương trình liên kết phần cứng.
- Có kinh nghiệm trong việc sử dụng các phần mềm HTTĐL: việc đào tạo
các phần mềm chủ yếu thường tập trung vào việc xử lý HTTĐL, lập trình cơ bản,
quản lý cơ sở dữ liệu và một số công việc khác có liên quan đến tích hợp thông
tin.
- Có hiểu biết nhuần nhuyễn về dữ liệu: hiểu về nguồn dữ liệu, nội dung và
độ chính xác của dữ liệu, tỷ lệ bản đồ nguyên thủy và các số liệu đo đạc của tập dữ
liệu, cấu trúc của dữ liệu.
- Có khả năng phân tích không gian. Yêu cầu được đào tạo về các phương
pháp xử lý thống kê và xử lý định tính trong địa lý, việc đào tạo cho người xử lý
có thể lựa chọn phương pháp tốt nhất để phân tích và áp dụng nhằm đưa ra kết quả
tốt nhất.
Các yêu cầu trên là cần thiết đối với người điều hành HTTĐL. Các huấn
luyện chi tiết sẽ tùy thuộc nội dung và mục tiêu cũng như khả năng của máy tính và
phần mềm để lực chọn những chương trình đào tạo thích hợp.
Phần cứng (máy tính và thiết bị ngoại vi)
• Phần cứng của một HTTĐL bao gồm các hợp phần sau: Bộ xử lý trung
tâm (CPU), thiết bị nhập dữ liệu, lưu dữ liệu và thiết bị xuất dữ liệu.
• Bộ xử lý trung tâm (central processing unit - CPU): hệ thống điều khiển,
bộ nhớ, tốc độ xử lý là những yếu tố quan trọng nhất của CPU. Hiện nay xử lý
HTTĐL trên nền unix là hệ thống có đủ các chức năng nhất, trong khi với máy CP
thì HTTĐL có những chức năng hạn chế hơn. Các hệ xử lý GIS trước đây, phần
lớn đều chạy trong trạm Unix. Trạm Unix cho phép lưu trữ cơ sở dữ liệu lớn và
nhiều chức năng xử lý khác nhau. Tất nhiên với sự trợ giúp của window NT thì PC
cũng có thể so sánh được với hệ unix. Ví dụ điểm hình về một hệ thống có hiệu

quả là một hệ Unix nhỏ có cài đặt phần mềm ARC/INFO để quản lý và vận hành
HTTĐL. Hiện nay, các hệ thống xử lý liên tục được nâng cấp và khoảng cách giữa
trạm Unix và PC càng hẹp dần.
• Nhập, lưu dữ và xuất dữ liệu: các thiết bị ngoại vi phục vụ cho việc nhập
dữ liệu là: Bàn số hoá, máy quét để chuyển đổi dữ liệu analoge thành dạng số.
Hoặc đọc băng và đĩa CD - ROM có nhiệm vụ lấy thông tin hiện có trong băng và
đĩa. Các phương tiện thông dụng là ổ đĩa cứng, ổ đọc băng, ổ đĩa quang có thể ghi
và xoá dữ liệu. Thiết bị xuất dữ liệu bao gồm máy in đen trắng và màu, báo cáo,
kết quả phân tích, máy in kim (plotter). Hiện nay, với sự phát triển của công nghệ
tin học và điện tử, đặc biệt là khi có thiết bị mạng cho phép san sẻ các chức năng
và trao đổi giữa những người sử dụng và càng tạo điều kiện cho HTTĐL phát
triển.
Phần mềm
Một hệ thống phần mềm xử lý HTTĐL yêu cầu phải có hai chức năng sau: tự
động hoá bản đồ và quản lý cơ sở dữ liệu. Sự phát triển kỹ thuật HTTĐL hiện đại
liên quan đến sự phát triển của hai hợp phần này.
• Tự động hoá bản đồ: bản đồ học là môn khoa học, nghệ thuật và kỹ thuật
thành lập bản đồ. Do đó, tự động hoá bản đồ là thành lập bản đồ với sự trợ giúp
của máy tính. Một bản đồ là sự thể hiện bằng đồ họa của mối quan hệ không gian
và các hình dạng (Pobinson và NNK, 1984) và mỗi một bản đồ là sự mô hình hoá
thực tế theo những tỷ lệ nhất định. Mô hình đó yêu cầu biến đổi các số liệu ghi bản
đồ thành bản đồ và gồm các công đoạn sau: Lựa chọn, phân loại, làm đơn giản hóa
và tạo mẫu ký tự (Den - 1990).
Máy tính trợ giúp cho bản đồ học ở nhiều phương diện như sau:
Trước hết, bản đồ trong máy tính là dạng số nên dễ dàng chỉnh sửa và việc
chỉnh lý đó tốn ít công sức hơn so với việc không có sự trợ giúp của máy tính.
Mặc dù việc số hóa có thể dẫn đến nhiều lỗi và làm giảm độ chính xác, song các
lỗi đó có thể sửa dễ dàng nếu phát hiện được. Khi đó, bản đồ sẽ được hoàn thiện
và lượng thông tin sẽ được nâng lên. Đặc biệt, việc bổ sung thông tin cho bản đồ
cũng dễ dàng thực hiện được.

Thứ hai, quá trình tạo chú giải và các chỉ dẫn lên bản đồ được thao tác với
tốc độ nhanh nên giá thành thấp. Việc lựa chọn, phân loại và làm đơn giản hóa các
đặc điểm bản đồ cũng được thực hiện một cách khoa học. Quá trình thiết kế và
khái quát hóa bản đồ cũng được lập trình và tạo nên các chức năng cụ thể của phần
mềm. Kết quả như mong muốn có thể đạt được bởi nhiều cán bộ bản đồ hoặc do
chính một cán bộ bản đồ làm trong nhiều thời gian khác nhau.
Thứ ba, thiết kế bản đồ có thể được hoàn thiện hơn qua việc thử và chỉnh sửa
lỗi. Kích thước, hình dạng hoặc vị trí của chữ hoặc ký hiệu trên bản đồ có thể dễ
dàng được thay đổi và đưa về vị trí chính xác như mong muốn.
• Quản lý dữ liệu: chức năng thứ hai của phần mềm HTTĐL là hệ thống
quản lý dữ liệu (data base management system DBMS). Hệ thống TTĐL phải có
khả năng điều khiển các dạng khác nhau của dữ liệu địa lý đồng thời có thể quản
lý hiệu quả một khối lượng lớn dữ liệu với một trật tự rõ ràng. Một yếu tố rất quan
trọng của phần mềm HTTĐL là cho khả năng liên kết hệ thống giữa việc tự động
hóa bản đồ và quản lý cơ sở dữ liệu. Các tài liệu mô tả cho một vị trí bất kỳ, có thể
liên hệ một cách hệ thống với vị trí không gian của chúng. Sự liên kết đó là một ưu
thế nổi bật của việc vận hành HTTĐL:
Thứ nhất: các tài liệu liệu thuộc tính nhất thiết phải được thể hiện trên những
chi tiết của bản đồ. Ví dụ số liệu về dân số của một thành phố cũng được gọi ra
một cách tự động mà không cần phải có một sự tra cứu nào khác. Đối với bản đồ
học thì công việc tra cứu thường phải làm độc lập, không thực hiện tự động được.
Ngoài ra việc bổ sung số liệu cũng đòi hỏi phải được cập nhật thường xuyên nên
chỉ HTTĐL mới có thể đáp ứng được đầy đủ.
Thứ hai: sự thay đổi về những chi tiết bản đồ nhất thiết phải phù hợp với sự
thay đổi về tự nhiên thuộc tính. Ví dụ, sự thay đổi về diện tích đô thị về số liệu
phải tương xứng với sự thay đổi về đường ranh giới thành phố. Khi thay đổi ranh
giới thì số liệu tính toán về diện tích cũng tự động được thay đổi.
II.CÁC CHỨC NĂNG CỦA PHẦN MỀM HTTĐL
Một phần mềm HTTĐL các các chức năng cơ bản như sau: nhập dữ liệu, lưu
trữ dữ liệu, điều khiển dữ liệu, hiển thị dữ liệu theo cơ sở địa lý và đưa ra những

quyết định (decision making) (Calkins và Tomlinson 1997). Có thể khái quát về
các chức năng đó như sau:
• Nhập và bổ sung dữ liệu (entry and updating): Một trong những chức
năng quan trọng của HTTĐL là nhập và bổ sung dữ liệu mà công việc đó không
tiến hành riêng rẽ. Bất kỳ một hệ thống nào cũng phải cho phép nhập và bổ sung
dữ liệu, nếu không có chức năng đó thì không được xem là một HTTĐL vì chức
năng đó là một yêu cầu bắt buộc phải có.
• Việc nhập và bổ sung dữ liệu phải cho phép sử dụng nguồn tự liệu dưới
dạng số hoặc dạng analog. Dạng tư liệu không gian như bản đồ giây hoặc ảnh vệ
tinh, ảnh máy bay phải được chuyển thành dạng số và các nguồn tư liệu số khác
cũng phải chuyển đổi được để tương thích với cơ sở dữ liệu trong hệ thống đang
sử dụng.
• Chuyển đổi dữ liệu: chuyển đổi dữ liệu là một chức năng rất gần với việc
nhập và bổ sung dữ liệu. Nhiều phần mềm thương mại cố gắng giữ độc quyền
bằng cách hạn chế đưa các khuôn dạng dữ liệu theo loại phổ cập. Tuy nhiên người
sử dụng phải lựa chọn để hạn chế việc phải số hóa thêm những tài liệu hiện đang
có ở dạng số. Trong thực tế, cùng một tư liệu nhưng có thể tồn tại ở nhiều khuôn
dạng khác nhau. Vì vậy, đối với tư liệu quốc gia, không thể chỉ lưu giữ ở một dạng
thuộc tính riêng biệt mà cần thiết phải lưu giữ ở nhiều khuôn dạng có tích chất phổ
biến để sử dụng được trong nhiều ứng dụng khác nhau. Như vậy, một phần mềm
HTTĐL cần phải có chức năng nhập và chuyển đổi nhiều khuôn dạng dữ liệu khác
nhau.
• Lưu giữ tư liệu: Một chức năng quan trọng của HTTĐL là lưu giữ và tổ
chức cơ sở dữ liệu do sự đa dạng và với một khối lượng lớn của dữ liệu không
gian: đa dạng về thuộc tính, về khuôn dạng, về đơn vị đo, về tỷ lệ bản đồ. Hai yêu
cầu cơ bản trong việc lưu trữ dữ liệu là: thứ nhất là phải tổ chức nguồn dữ liệu sao
cho đảm bảo độ chính xác và không mất thông tin, thứ hai là các tài liệu cho cùng
một khu vực song các dữ liệu lại khác nhau về tỷ lệ, về đơn vị đo thì phải được
định vị chính xác và chuyển đổi một cách hệ thống để có thể xử lý hiệu quả.
• Điều khiển dữ liệu (data manipulation): Do nhiều HTTĐL hoạt động đòi

hỏi tư liệu không gian phải được lựa chọn với một chỉ tiêu nhất định được phân
loại theo một phương thức riêng, tổng hợp thành những đặc điểm riêng của hệ
thống, do đó HTTĐL phải đảm nhiệm được chức năng điều khiển thông tin không
gian. Khả năng điều khỉển cho phép phân tích, phân loại và tạo lập các đặc điểm
bản đồ thông qua các dữ liệu thuộc tính và thuộc tính địa lý được nhập vào hệ
thống. Các thuộc tính khác nhau có thể được tổng hợp, nắm bắt một cách riêng
biệt và những sự khác biệt có thể được xác định, được tính toán và được can thiệp,
biến đổi.
• Trình bày và hiển thị: Đây cũng là một chức năng bắt buộc phải có của
một HTTĐL. Không gian dưới dạng tài liệu nguyên thủy hay tài liệu được xử lý
cần được hiển thị dưới các khuôn dạng như: chữ và số (text), dạng bảng biểu
(tabular) hoặc dạng bản đồ. Các tính toán chung và kết quả phân tích được lưu giữ
ở dạng chữ và số để dễ dàng in ra hoặc trao đổi giữa các lỗ phần mềm khác nhau.
Các dữ liệu thuộc tính có thể được lưu ở dạng bảng biểu hoặc các dạng cố định
khác. Bản đồ được thiết kế để hiển thị trên màn hình hoặc lưu dưới dạng điểm
(plot file) để in. Như vậy, hiển thị và in ra là những chức năng rất cần thiết của
một HTTĐL.
• Phân tích không gian: Trước đây, chỉ có 5 chức năng mô tả ở trên là được
tập trung, phát triển bởi những người xây dựng HTTĐL. Chức năng thứ sáu là
phân tích không gian được phát triển một cách thần kỳ dựa vào sự tiến bộ của
công nghệ và nó trở nên thực sự hữu ích cho người ứng dụng. Những định nghĩa
về HTTĐL trước đây đã trở thành thực tiễn trên cơ sở ứng dụng trực tiếp chức
năng phân tích không gian. Theo quan điểm hiện nay thì chức năng đó cần thiết
phải có đối với một hệ thống được gọi là HTTĐL. Tất nhiên các chức năng có thể
khác nhau đối với từng hệ thống song đối với một một hệ thống TTĐL sử dụng tư
liệu bản đồ thì chức năng đó là băt buộc. Với một hệ thống như vậy thì các mô tả
bằng lời có thể tổ chức thành các tham số riêng, các mô hình giải thích, dự báo đều
có thẻ thực hiện trong chức năng xử lý không gian.
II.1.Sử dụng HTTĐL cho phân tích không gian
Phân tích không gian HTTĐL Bao gồm ba hoạt động chính: Giải quyết các

câu hỏi về thuộc tính, các câu hỏi về phân tích không gian và tạo nên tập dữ liệu
mới từ cơ sở dữ liệu ban đầu. Mục tiêu của việc phân tích không gian là từ việc
giải quyết các câu hỏi đơn giản về các hiện tượng, các vấn đề trong không gian, đi
đến tập hợp thành các thuộc tính của một hay nhiều lớp và phân tích được sự liên
quan giữa các dữ liệu ban đầu.
Trong ứng dụng của HTTĐL, các đặc điểm và thuộc tính về không gian là rất
phổ biến. Câu hỏi về thuộc tính (attribute query) có chứa đựng cả tích chất thông
tin về không gian. Ví dụ: Trong cơ sở dữ liệu của một hành phố, ở đó mỗi mảng
bản đồ đều có Code thuộc tính về sử dụng đất, một bảng thuộc tính đơn giản có
thể yêu cầu liệt kê toàn bộ các mảng của các loại hình sử dụng đất có trong bản đồ.
Bảng thuộc tính đó có thể tạo được mà không hề có sự tham khảo về các mảng
trên bản đồ. Vì không có thông tin không gian đòi hỏi trả lời cho câu hỏi này nên
bảng đó được xem như là bảng thuộc tính (attribute query). Trong ví dụ này, toàn
bộ bảng thuộc tính có các Code của sử dụng đất đã được xác định. Các thông tin
khác có thể được tạo nên ví dụ như số mảng đơn vị (parcel) của loại hình sử dụng
đất này, hoặc tổng diện tích của loại hình sử dụng đất này ở trong thành phố Tất
nhiên những bài toán xử lý thông tin cho một lớp là cần thiết, song trong ứng
dụng, việc xử lý thông tin của nhiều lớp cũng là công việc rất quan trọng và đòi
hỏi nhiều công sức trong lập trình. Ví dụ gảii bài toán về 2 lớp không gian về tính
toán diện tích của các loại hình sử dụng đất theo các cấp độ dốc khác
nhau Những bài toán đó đặt ra đối với nhiều nội dung ứng dụng khác nhau mà
những phần mềm chuyên tự động hóa bản đồ hay quản lý dữ liệu không đáp ứng
được. Tất nhiên do mục đích của HTTĐL là tập trung vào xử lý không gian, nên
một số chức năng của việc tự động hóa bản đồ hoặc tính toán thống kê chuyên đề
thì có thể HTTĐL không đáp ứng được.
II.2.Một số vấn đề cơ bản trong xử lý không gian
• Xử lý thông tin trong một lớp: giải quyết các vấn đề về thuộc tính các đơn
vị trong một lớp, đo đạc các giá trị, phân tích sự liên quan giữa các đơn vị trong
một lớp bản đồ. Ví dụ xác định tên, tính diện tích, chu vi của từng khoanh vi bản
đồ, xác định khoảng cách, tạo các vùng ảnh hưởng (buffer zone).

• Xử lý thông tin nhiều lớp: chồng xếp hai hoặc nhiều lớp thông tin cho
phép tạo ra nhiều đơn vị bản đồ mới trên cơ sở làm chi tiết hoá thông tin của từng
phần trong một đơn vị bản đồ. Ví dụ hai lớp thực vật và đất khi chồng xếp sẽ cho
bản đồ thực vật phân bố trên các loại đất khác nhau.
• Xử lý không gian: có thể có rất nhiều lớp thông tin mà xử lý không gian
cần phải tính toán được mối quan hệ giữa chúng.
• Phân tích các mẫu điểm: một số đối tượng tự nhiên hoặc hiện tượng tự
nhiên có sự phân bố bằng các điểm tập trung theo các quy luật nhất định. Ví dụ:
phân bố của các đồng cỏ, hệ thống các điểm bố sụt cactor, phân bố của các loài
động vật, thực vật quý hiếm Trong xử lý không gian, sự phân bố về những điểm
đó cần được nhận diện và phân loại.
• Phân tích mạng: thiết lập một mạng hữu ích giữa các diện có sự phân bố
khác nhau là một trong những chức năng xử lý không gian: ví dụ tạo tuyến xe bus
gần nhất nối các điểm đón khách trong thành phố, mở một hệ thống đường nối
giữa các khu dân cư, thiết kế một tuyến đường ống dẫn dầu Tất nhiên khi thiết
kế cụ thể lại phải bổ sung bằng một số thông tin khác nhau, ví dụ: địa hình, sử
dụng đất…
• Phân tích, xử lý theo ô lưới (grid analysis). Bài toán xử lý ô lưới rất
phong phú, nó có thể ứng dụng cho nhiều ngành: ví dụ tính toán lan truyền ô
nhiễm, lập các đường đẳng trị, dự báo cháy rừng…
• Phân tích xử lý nhiều lớp thông tin theo điều kiện. Đây là chức năng phức
tạp và đa dạng nhất của xử lý không gian. Nhiều bài toán được áp dụng để biến
đổi lớp thông tin ban đầu thành một hay nhiều lớp thông tin mới: ví dụ tính độ
dốc, hướng dốc, tính mật độ, bài toán boolean, bài toán logic, các phép phân chia,
tính căn bản đồ, những lớp thông tin mới.
• Vùng bên trong là phần không bao gồm đường biên. Polygon là diện tích
có vùng bên trong, một đường viền bên ngoài, không có điểm giao cắt ở bên trong
và không có khoanh vi nào khác ở phía trong. Polygon phức tạp: là polygon có
một hoặc nhiều khoanh vi khác ở bên trong.
• Có hai khái niệm được sử dụng bổ sung cho định nghĩa trên đó là pixels

và ô lưới đơn vị (grid cells) Pixel là đơn vị hình ảnh có hai kích thước, nó là đơn
vị nhỏ nhất của hình ảnh không thể chia nhỏ được. Ô lưới đơn vị là đối tượng có
hai kích thước, thể hiện một yếu tố của một bề mặt có cấu trúc đều đặn bởi chúng.
Những khái niệm nêu ở trên là do bản đồ số của Mỹ đưa ra (National comitee
for digital colorgaphic data standars - NCDCDS). Các khái niệm đó có thể được
gọi khác đi,tùy theo sự thiết kế về tên gọi trong từng hệ thống phần mềm HTTĐL.
II.3.Các yếu tố cơ bản của thông tin không gian
Việc phân tích trật tự và tổ hợp không gian yêu cầu phải có ba thuộc tính cơ
bản sau: vị trí (location), dữ liệu thuộc tính (attribute data) và tính chất hình học
(topology).
• Vị trí: là tính chất quan trọng mà mỗi đối tượng không gian phải có. Vị trí
được xác định bởi tọa độ X và Y trên mặt phẳng ngang (caitesian).
• Dữ liệu thuộc tính: Cung cấp nhiều thông tin quan trọng về tính chát của
đối tượng được nghiên cứu. Ví dụ bản đồ có các đặc điểm thì bảng thuộc tính phải
nêu được tích chất các đặc điểm đó, ví dụ: giống cột điện hay hố nước với các
thông tin cụ thể cho từng loại.
• Dữ liệu hình học: được định nghĩa là mối quan hệ không gian giữa các
yếu tố bản đồ. Trong trường hợp các polygon, có những polygon lại nằm trong
ranh giới của một polygon khác. Với các yếu tố đường có, những đường tạo nên
bởi hai đoạn thẳng (segment) nối với nhau trực tiếp hoặc nối gián tiếp qua một
đoạn thẳng thứ ba, hoặc hai đoạn thẳng hoàn toàn không nối với nhau. Với các
điểm, các điểm có thể ở cách nhau những khoảng cách khác nhau.
• Nhìn chung, vị trí và dữ liệu thuộc tính là tương đối dễ hiểu, song đặc
điểm hình học thì hơi khó hình dung hơn. Có một số khái niệm và thuộc tính như
sau:
• Tiếp giáp (adjacency): hai polygon ở liền nhau thì được gọi là tiếp giáp
với nhau. Khái niệm tiếp giáp được sử dụng khi phân tích sự liên quan của những
yếu tố ở liền kề nhau. Ví dụ: giá của một miếng đất sẽ cao hơn giá trung bình của
vùng nếu như vùng đất đó nằm liền kề với công viên hoặc khu thương mại
• Chứa đựng (containment): biểu thị một yếu tố nào đó nằm trong rang giới

của một polygon. Mối quan hệ này cũng quan trọng khi phân tích mối liên quan
giữa hai kiểu đối tượng. Ví dụ: một mảnh đất nằm trong vùng ngập lụt có thể phải
mua bảo hiểm với giá cao hơn.
• Tiếp nối (connectivity): thể hiện cho hai đoạn thẳng được nối với nhau.
Khái niệm tiếp nối được xem xét cho việc phân tích giao thông, tuyến đi để có thể
tìm ra phương án mở tuyến tốt nhất.
• Giao nhau (intersection): được xem là một dạng phức tạp trong mối quan
hệ không gian của các yếu tố polygon. Giao cắt đối với polygon nghĩa là hai
polygon có cùng chung một vùng, vùng này có tính chất thuộc về cả hai polygon.
Khi xử lý chồng xếp bản đồ thì vùng giao nhau không cần xem xét đến các tính
chất hình học. Tuy nhiên thông dụng nhất là các vùng được bố trí tách biệt nhau
trong cơ sở dữ liệu.
Tóm lại, 3 yếu tố: vị trí, dữ liệu thuộc tính và đặc điểm của dữ liệu là rất
quan trọng trong xử lý không gian. Tự động hóa bản đồ sẽ giúp ích cho việc trình
bày và tổ chức dữ liệu không gian. Trong xử lý không gian, tổng hợp các đặc điểm
về mối liên hệ không gian giữa các yếu tố bản đồ được xử lý bởi HTTĐL và nó
cung cấp khả năng xử lý đồng thời cả ba yếu tố. Các đối tượng không gian được
trình bày dưới dạng đặc điểm về đường, điểm, hoặc polygon. Mỗi một đặc điểm
lại được thể hiện tập trung vào một số yêu cầu về mặt cơ sở dữ liệu.
II.4.Tổ chức dữ liệu không gian của HTTĐL
Trong một HTTĐL điển hình, các đối tượng không gian được liên kết để
nghiên cứu các hiện tượng thì nhất thiết phải được trình bày dưới dạng bản đồ với
mục đích thiết lập được mối liên quan không gian giữa chúng. Cả vị trí và thuộc
tính được xử lý thông qua một loạt các chương trình trong HTTĐL. Yêu cầu đầu
tiên để việc tạo lập dữ liệu một cách có hiệu quả là các đối tượng được thể hiện ở
ba yếu tố cơ bản là: điểm (point), đường (line) và vùng (area hay polygon). Theo
quan điểm của tổ chức quốc gia Mỹ về dữ liệu bản đồ số thì các yếu tố đó được
giải thích như sau.
Điểm: là đối tượng có kích thước bằng 0 về mặt hình học. Do đó các đối
tượng điểm chỉ dùng để xác định vị trí. Điểm không có ý nghĩa trong việc

đo về kích thước. Mặc dù trên bản đồ, các điểm được biểu thị bằng kích
thước khác nhau nhưng diện tích của các điểm là không có ý nghĩa thực
tế. Một số khái niệm về "điểm" như sau:
- Điểm thực tế (entity point): dùng để xác định vị trí của các đối tượng
dạng điểm như: các toà nhà, các cột. Trường hợp đó, xác định chính xác vị trí của
các điểm là điều rất quan trọng.
- Điểm chỉ tên (label point) được sử dụng để hiển thị một tập hợp chữ viết
cho các đối tượng bản đồ. Đối với những điểm nào thì độ chính xác của vị trí phụ
thuộc vào quan niệm bản đồ học. Nghĩa là vị trí các điểm chỉ tên cho các đối
tượng trên bản đồ được xác định sao cho không có sự lẫn lộn với nhau.
- Điểm có diện tích (area point) dùng để xã định một vị trí có thông tin về
diện tích. Ví dụ có thể dùng điểm để thể hiện vị trí một quốc gia và độ lớn của
điểm chứa đựng thông tin về đất nước đó.
- Điểm giao nhau (node) thể hiện vị trí một diện với các dấu hiệu về hình
học, ví dụ: nơi giao nhau hoặc điểm cuối của các yếu tố đường.
Các thông tin về điểm các một kích thước trong phân tích không gian mặc dù
chúng thể hiện cho các đối tượng có hai kích thước ở trên bản đồ. Ví dụ: một điểm
biểu thị cho 1 giếng, một điểm biểu thị cho một cột. Mặc dù diện tích mà giếng
chiếm khác với diện tích của cột chiếm. Trong một bản đồ thì không thể nêu được
diện tích mà giếng hoặc cột chiếm trên thực tế - do tỷ lệ bản đó không đáp ứng.
Trong phân tích không gian, diện tích giữa các điểm là không tính (trừ trường hợp
các điểm có diện tích, lúc đó điểm đã trở thành vùng)
• Tính chất của điểm: đây là dạng đơn giản nhất của các đối tượng không
gian.
Khi nói về dữ liệu điểm, phải nói đến số lượng điểm tối thiểu cho một cơ sở
dữ liệu điểm. Nhìn chung, các yếu tố tối thiểu cho một cơ sở dữ liệu điểm là
những thuộc tính về toạ độ,ngoài ra, các tính chất khác của điểm được mô tả trong
hàm sau:
P
i

: ( X, Y, Z
1
Z
2
Z
3
…Z
.m
)
Ở đây:
i là Code xác định của mõi điểm ( identification Code -ID)
X, Y toạ độ của đIểm, được xác định theo toạ độ phẳng (x, y trong mặt
phẳng cartesian)
Z
1,
Z
2
… Z
m
các đặc trưng khác của điểm.
Vì điểm có kích thước bằng không (= 0) nên nó không có khoảng trống ở
giữa, song nó phải có thuộc tính về mặt hình học, đó là toạ độ. Thông tin về mối
liên quan giữa các điểmcó thể xác định bằng công thức toán học. Trong trường
hợp có nhiều điểm thì khoảng cach giữa các đIểm được xác định bởi vị trí của các
điểm đó với nhau.
Đường: đường là các yếu tố có một kích thước và thể hiện cả vị trí và
hướng. Độ dài là dấu hiệu đo đạc về kích thước của đối tượng đường.
Mặc dù các yếu tố đường thường có không gian hai kích thước trên bản
đồ nhưng độ rộng của đường là không được xem xét đến trong tính toán
hướng của bản đồ.

Tính chất của đường: Đường được hiểu là tập hợp của rất nhiều điểm. Mỗi
đường đều có thể chia thành nhiều đoạn thẳng và mmỗi đoạn được xác dịnh bởi
hai điểm ở hai đầu. Để cấu tạo nên yếu tố hình học của đưòng thì yếu tố cơ bản là
hướng của đường. Ngoài ra, còn một yếu tố khác, đó là sự tiếp nối giữa các đường.
Để hiểu sự tiếp nối đó, ta có thể hình dung tới một đoạn thẳng nối giữa một điểm
này với một điểm khác.
Như vậy, các yếu tố cơ bản của mỗi đường gồm có:
L
j
: (P1, P2, …Pn, Z1, Z2…Zm, H
1
…Hq)
ở đây: j Code của đường ( ID)
P1 điểm thứ 1
Pn điểm thứ n
Z1 thuộc tính của đoạn thứ 1
Zn thuộc tính của đoạn thứ n
Hq - Code ID của đoạn thứ q được nối trong thứ tự của đường
(1… n) là hướng của đường từ 1 đến n của đường.
Vùng: (area) hoặc (polygone)
Vùng là khái niệm phức tạp nhất trong 3 loại yếu tố không gian của cấu trúc
vector. Vùng được hiểu là một diện tích giới hạn bởi một đường khép kín và
phần bên trong đó có những tính chất cụ thể.
Cáctính chất của polygon:Polygone dược xác định bởi một loạt các đường
vạch định ranh giới. Thêm vào đó, polygone là yếu tố có 2 kích thước . Mỗi
polygone được xác định bởi một diện tích nhất định. Vì polygone không có hình
dạng và kích thước nhất định, nên mối quan hệ không gian sẽ khó xác định nếu
không có những thuộc tính được làm rõ. Hai polygone có thể nằm tách biệt với
nhau, hoặc kề nhau, hoặc cái nọ nằm trong cái kia.
Trong trường hợp nằm tách biệt hẳn so với nhau thì lại có khả năng chúng

được nối với nhau bằng polygone thứ ba.
Yêu cầu về thuộctính của polygone bao gồm:
G. K (L
1
…L
n,
Z
1
… Z
m
ú
1
…ú
r
,


1
…ử
s
,ệ
1



t
)
ở đây: K là Code của polygone G, tần số kết nối của đường từ L
1
đến L

n
và nó
xác định ranh giới của polygone G.
Z
n
xác định giá trị của thuộc tính thứ n
ú
1
…ú
r
thể hiện một hoặc nhiều polygone kết nối với nhau tạo nên
polygone K

1
…ử
s
xác định có 1 hay nhiều polygone chứa trong polygone K

1



t
xác định có một hay nhiều polygone nằm trong polygone K
Các thông tin hình học bổ sung khác còn có thể là càn thiết đối với các
polygone phức tạp.nhiều thông tin hình học có thể được bổ sung ngay trong những
thông tin về đường hoặc được làm đơn giản hoá đi. Ví dụ: hai polygone nằm liền
kề thì phải có thêm thông tin về một đoạn thẳng chung ở giữa làm biên giới giữ
hai polygone.
II.5.CÁC MÔ HÌNH CẤU TRÚC CƠ SỞ DỮ LIỆU

II.5.1.Khái quát chung
Tư liệu (data) được hiểu như những sự hiện diện đã được kiểm tra về thế
giới thực (Graeme F Borinam Carter). Thông tin là tư liệu được tổ chức theo
những mẫu thể hiện nhằm dễ dàng tìm kiếm và khai thác.
Tư liệu không gian phải được trình bày và lưu trữ một cách riêng biệt trong
nưhngx không gian của HTTĐL. Ví dụ: đường, điểm, vùng, bề mặt … phải được
lưu trữ độc lập cùng các thuộc tính của chúng tạo thành những file dữ liệu không
gian hoặc phi không gian.
Cơ sở dữ liệu ( CSDL) là toàn bộ những thông tin cần thiết về đối tượng
được lưu giữ dưới dạng số. CSDL có thể là không gian hoặc phi không gian. Hệ
thống quản lý CSDL (Database management System - DBMS) là tập hợp một số
chức năng của phần mềm để lưu giữ, bổ sung và thể hiện dữ liệu . Các hệ thống
quản lý cơ sở dữ liệu phi không gian hoặc không gian thường tách biệt nhau. Cũng
có một số phần mềm tổ chức kết hợp để quản lý cả hai dạng dữ liệu hoặc cung cấp
khả năng liên kết với các phần mềm CSDL khác. Chương trình này sẽ tập trung
giới thiệu các cấu trúc dữ liệu chính là cấu trúc phân nhánh, chia nhỏ và cấu trúc
mạng. Ngoài ra, các dữ liệu thuộc tính phi không gian trong mối liên hệ với các
thuộc tính không gian cũng được đề cập đến. Cấu trúc dữ liệu không gian là sự tổ
chức tư liệu không gian dưới một khuôn dạng phù hợp với máy tính. Cấu trúc của
dữ liệu phải được tổ chức để có sự liên hệ giữa các mô hình dữ liệu và các khuôn
dạng (format) dữ liệu. Thực tế, giữa khái niệm mô hình và cấu trúc dữ liệu ít có sự
phân biệt. Tuy nhiên khái niệm mô hình được sử dụng ở phạm vi nguyên lý từ
khái quát đến cụ thể, còn cấu trúc là khái niệm mang tính chất kỹ thuật và minh
hoạ một cách hệ thống về bản chất và sự liên hệ giữa các thành phần của CSDL.
Cấu trúc của dữ liệu Raster được sử dụng rộng rãi trong hệ xử lý ảnh và xử
lý TTDL - raster, còn cấu trúc của dữ liệu vertor được sử dụng nhiều trong các hệ
CAD (Computer Aided Decizion - Máy tính thiết kế trợ giúp), hoặc trong HTTĐL
vertor với những khả năng mạnh về bản đồ. Trong thực tế áp dụng nhiều HTTD có
cả hai hệ thống cấu trúc dạng Raster và Vertor để có thể sử dụng một cách linh
hoạt và giao diện với nhau để đáp ứng cho những nhiệm vụ cần giải quyết. Những

sự giao diện đó được thể hiện cụ thể với việc xử lý một hệ thống dữ liệu mẫu điểm
là: có bảng thuộc tính về tính chất và toạ độ các điểm, có khả năng nội suy thuộc
tính mẫu thành các file Raster; có khả năng tạo file vertor và contour của các
trường thuộc tính đã được nội suy; có khả năng tạo các mặt phẳng hình học và các
mô hình không gian với dữ liệu Raster hoặc Vertor. Tuy nhiên do không phải là
những HTTĐL chuyên đề mà các HTTĐL tổng hợp thường có một số ưu thế và
những hạn chế nhất định.
II.5.2.Cấu trúc dữ liệu Raster
Raster được hiểu là ô hình vuông có kích thước nhất định gọi là cell hoặc
pixell (picture element), cấu trúc Raster là cấu trúc hình ảnh. Mỗi ô vuông có chứa
thông tin về một đối tượng hay một sự hợp phần của đối tượng. Vị trí của đối
tượng được xác định bởi vị trí của các ô vuong theo trật tự hàng và cột. Cấu trúc
dữ liệu Raster đơn giản nhất là cấu trúc dạng bảng, ở đó có chứa các thông tin về
toạ độ và thuộc tính phi không gian. Thông tin về vị trí được thể hiện ở toạ độ theo
hàng và cột, tính theo trật tự sắp xếp của dữ liệu. Trường hợp có nhiều tính chất
thì có thể gọi là thông tin nhiều chiều. Bảng thuộc tính hai chiều của đối tượng
được gọi là bảng một chiều hay còn gọi là bảng thuộc tính Raster mở rộng
(expanded Raster table). Cấu trúc Raster đầy đủ là cấu trúc có đầy đủ số lượng các
pixell sắp xếp theo những vị trí xác định. Cấu trúc Raster rất tiện lợicho việc áp
dụng các chức nằng xử lý không gian dựa trên nguyên tắc chồng xếp thông tin
nhiều lớp. Các đặc điểm không gian là có thông tin về địa lý, nghĩa là chúng có
thể được trình bày trên bất cứ một bản đồ nào của một hệ toạ độ đã biết. Cấu trúc
Raster yêu cầu mỗi một đặc điểm phải được trình bày thành dạng đơn vị hình ảnh
(picture elemarts pixel). Trong trường hợp này một bản đồ được phân chia thành
nhiều pixels, mỗi pixel có vị trí theo hàng và cột. Một điểm nhỏ nhất được trình
bày bởi một pixel đơn lẻ và nó chiếm một diện tích bằng kích thước của một pixel.

0
1
2

3
45
6
6
5
4
3
2
1
6
5
4
3
2
1
0
1
2
3
45
6
A
B

Hình 3. Một đường có thể tổ chức trong cấu trúc Vector (A) và Raster (B)
Một đường trong cấu trúc Raster là một loạt cácpixel nối với nhau và một
polygon là một đám (cluster) của các pixel có cùng một giá trị.
Sau đây là những ưu điểm cơ bản của cấu trúc Raster:
• Đơn giản và dễ tham khảo
• Việc chồng xếp các lớp bản đồ được thực hiện một cách thuận tiện đưa

đến kết quả.
• Đối với mô hình không gian, các đơn vị địa lý được xác định trong cấu
trúc Raster, bao gồm hình dạng và kích thước. Như vậy trong kết quả mối quan hệ
giữa các pixel là ổn định và dễ dàng vẽ ra được.
• Dễ thiết lập một bề mặt liên tục bằng phương pháp nội suy.
• Đa số các tư liệu không gian thường được ghi ở dạng Raster như ảnh vệ
tinh, ảnh máy bay chụp quét. Thông thường các tư liệu Raster đó dẽ dàng nhập
trực tiếp mà không cần một sự thay đổi nào.
Những nhược điểm của cấu trúc dữ liệu Raster:
• Tài liệu thường bị tình trạng quá tải, làm tốn nhiều phần của bộ nhớ trong
máy tính. Trong rất nhiều trường hợp, các yếu tố bản đồ không nhất thiết phải
được gắn thuộc tính (code hoá) thành các ô lưới đặc trưng. Trong cấu trúc dữ liệu
Raster, những vùng rất rộng lớn có đặc điểm giống nhau được tồn tại một cách
ngẫu nhiên với một giá trị nào đó và là tập hợp của rất nhiều ô lưới. Trong khi đó
khi thể hiện về độ dốc thì ở vùng có độ dốc tương đối giống nhau, cấu trúc raster
vẫn thể hiện sự khác nhau do kích thước của các pixel tạo nên đường gồ ghề.
• Mối quan hệ về hình học giữa các yếu tố không gian thì khó vẽvà khó
thiết lập được, ví dụ với hai bản đồ được xác định bằng hàng, cột thì mối liên hệ
hình học giữa các đặc điểm của hai bản đồ đó là rất khó xác định.
• Các bản đồ Raster thường thô và kém vẻ đẹp hơn so với bản đồ vẽ bằng
đường nét thanh của cấu trúc Vector. Trong bản đồ Raster, các yếu tố đường,
sông, … ranh giới thường được biểu hiện bằng các pixel nên có dạng răng cưa.
• Việc chuyển đổi các thuộc tính không gian của cấu trúc Raster thì dễ bị
nhiễu. Ví dụ một con đường khi quay đi một góc nào đó rồi quay lại đúng góc đó
nhưng nó có thể bị biến đổi so với hình dạng ban đầu.
• Đối với phân tích không gian, hạn chế nhất của cấu trúc Raster là độ
chính xác thường thấp so với mong muốn (ví dụ khi tính độ day của một đoạn
thẳng sai số thường lớn hơn so với đo trực tiếp). Đây là điều khó tránh khỏi vì kích
thước tính được liên quan đến kích thước của các pixel và vị trí của một đoạn
thẳng hay của một điểm cũng được xác định tuỳ thuộc kích thước của pixel.Đây

cũng là một điểm cần lưu ý trong khi thể hiện bản đồ dạng Raster ( hình 4 )

Hình 4. Mô phỏng cách thể hiện các khoanh vi theo cấu trúc Raster
II.5.3.Cấu trúc dữ liệu dạng Vector
Như phàn trên đã giới thiệu,trong cấu trúc dữ liệu dạng Vector, các đối tượng
không gianđược trình bày bằng một loạt các Vector. Trong khái niệm toán học,
một Vector được thể hiện bằng một điểm xuất phát (starting point) với toạ độ X và
Y đã cho, một hướng (direction) nghĩa là có một góc nào đó theo hướng đông, tây,
nam, bắc và một độ dài (length). Một điểm được thể hiện bởi một Vector bị thoái
hoá (degenerate) với cả hướng và độ dài của nó đều bằng 0. Trong trường hợp này
điểm cũng không có cả diện tích.
Một đường được thể hiện bởi sự lặp lại của các Vector, mà các Vector này là
các đoạn thẳng vì chiều rộng của các Vector cũng không được xác định nên về ý
nghĩa không gian, đường chỉ có một kích thước, đó là độ dài.
Một polygon được thể hiện bở một loạt các Vector tạo nên một vùng khép
kín và diện tích của vùng đó có thể đo được.

Hiình 5. cấu trúc dữ liệu vecter
Những ưu điểm của cấu trúc Vector:
• Ít trường hợp tư liệu bị đầy chặt bộ nhớ trong máy tính vì tổ chức dữ liệu
Vector thường ở dạng nén, vì có thể chứa được một lượng dữ liệu Vector rất lớn
trong tư liệu không gian.
• Các đối tượng riêng biệt được thể hiện một cách rõ ràng và liên tục bằng
những đường nét rõ ràng.
• Các yếu tố không gian về mặt hình học thì dễ dàng được xác định.
• Có độ chính xác cao trong việc tính toán và xử lý các yếu tố không gian.
Nhược điểm:
• Nhược điểm lớn nhất của cấu trúc dữ liệu Vector là xử lý chồng xếp các
lớp bản đồ rất khó thực hiện được, ngay cả những việc chồng xếp rất đơn giản của
dữ liệu Raster.

Ví dụ: Để xác định một điểm nằm trong một polygon không thì ở cấu trúc
Raster rất đơn giản khi biết vị trí của điểm theo hàng hay cột. Trong khi đó ở cấu
trúc Vector thì phải có một sự tính toán rất phức tạp.
- Hình bên trái dễ dàng xác định vị trí pixel B ở hàng 7 và cột số 8
hình bên phải các polygon A, B, C, D được xác định bởi một loạt các toạ độ
XY
AAA
A
A
AA
AA
AAAA
AAAAA
AAA
A
A
AA
A
A
B
B
B
BBB
B
BBBBB
B
BB
BBB
B
B

B
B
B
B
B
BBBB
B
C
CC
C
CC
C
C
C
C
C
C
C
CCC
CC
C
CC
CC
C
C
D
D
D
D
D

D
D
D
D
D
DD
D
B
B
B
D
B
A
B
C
D
Raster
Vector

Hình 6. So sánh giữa cấu trúc Raster và Vector
- Rất phức tạp. Để xác định một điểm có toạ độ 8,4 (theo toạ độ phẳng)
(tương ứng với điểm B ở hình bên trái có toạ độ hàng 7 cột 8) thì việc tính toán là rất
phức tạp mới xác định được điểm đó nằm ở polygon nào.
II.4.Mô hình cấu trúc dữ liệu cung và điểm nút (area-node)
Một mô hình dữ liệu là một cấu trúc cớ bản của dữ liệu được thiết kế để sao
cho việc khai thác và xử lý là thuận tiện nhất.
Mô hình cung và điểm nút (are-node) là môhình do cục thống kê của Mỹ
thiết kế theo các file dữ liệu địa lý từ năm 1980. Trên cơ sở mô hình này, các
đường phố và yếu tố dạng tuyến khác của nước Mỹ cũng được tổ chức theo hệ
thống file dữ dạng có hai thuộc tính độc lập về cung và điểm nối (dual

independence map encoding - DIME) (are-node Model- mô hình cung điểm nối).
Theo mô hình này, các cung tạo nên phần lớn các đơn vị cơ bản trên bản đồ. Khái
niệm về cung (area) ở đây khác với khái niệm về cung ở trong hội bản đồ của Mỹ
quy định. ở đây mỗi một cung bao gồm hai điểm nút: điểm đầu và điểm cuối. Giữa
các điểm nối và cung có thể không có hoặc có các giao điểm của các cung khác.
Hình dạng và độ dài của cung được xác định bởi vị trí của các điểm nối và các
giao điểm (vertice hoặc vertex). Một điểm nối khác với giao điểm về tính chất
hình học. Cụ thể: một điểm nối thì có toạ độ x và y và thuộc tính hình học, còn
giao điểm (vertex) thì chỉ có toạ độ x và y mà không có thuộc tính (hình 7)
102
103
104
101
102
Code cña polygon
§iÓm nèi
35
Code cña cung
35
38
34
39
37
36
Ghi chó

Hình 7. Cấu trúc một polygon đơn giản trong mô hình cung và điểm nối
Trên hình 3 có 4 polygon 101, 102, 103 và 104, các polygon được xác định
bởi 7 cung (are) từ 33-39. Mỗi cung có một điểm nối là điểm đầu và điểm cuối.
Những cung thẳng là không có giao điểm còn những cung gấp khúc là có một

hoặc nhiều giao điểm (vertex). Một điểm quan trọng cần lưu ý về mô hình cung -
điểm nối là một cung luôn được xác định bởi một điểm nối.
Hướng của một cung được hiểu một cách đặc biệt trong thứ tự của các điểm
nối, đó là điểm đầu và điểm cuối. Với một hướngđã biết thì hai phía (phải và trái)
của cung cũng được xác định. Những thông tin về một cung bao gồm:
Thuộc tính (ID) của cung
Thuộc tính (ID) của điểm nối đầu
Thuộc tính (ID) của điểm nối cuối
Thuộc tính (ID) của polygon bên trái của cung
Toạ độ x, y của điểm nối đầu
Toạ độ x, y của điểm nối cuối
Toạ độ của tất cả giao điểm
Ngoài ra trường (field) bao gồm độ dài của một cung cũng được xác định.
Điểm nối có ý nghĩa về mặt hình học là nó thể hiện sự tiếp nối giữa hai yếu
tố mô hình cung - điểm nối (area-node), một điểm được thể hiện bằng một yếu tố
đường bị thiếu hụt (degenerate) với điểm nối đầu trùng lên điểm nối cuối và không
có điểm giao cắt ở giữa.
Như vậy, một điểm được thể hiện bằng một điểm nối (node) vì điểm nối đầu
và điểm nối cuối là giống nhau. Đối với polygon như đã nêu ở trên thì mỗi
polygon là bao gồm tập hợp các cung và điểm nối. Để xác định mối quan hệ
không gian của polygon thì mọi điểm giao cắt phải được xácđịnh bằng một điểm
nối.
Ưu thế cơ bản của mô hình cung cầu - điểm nối là luôn có thuộc tính không
gian và như vậy mức độ chính xác sẽ rất cao, đồng thời dễ xác định được mối
quan hệ không gian của các yếu tố. Ví dụ sự tiếp giáp của hai polygon hay
pplygon này nằm trong polygon kia và cách đơn giản là xem ở bảng thống kê các
cung mà chúng ta tạo nên 2 polygon đó. Trong bảng thống kê nếu có một cung nào
đó là một phần của cả hai polygon thì 2 polygon đó là nằm liền kề nhau.
Phần mềm ERIS ARC/INFO là phần mềm điển hình có tổ chức vector theo
mô hình cung- điểm nối và nó tự động tính và thống kê các thuộc tính của cung,

điểm nối, từ đó dễ dàng cho việc tính toán và xử lý các mô hình không gian.
Trong ARC/INFO, có hai dạng bảng thống kêlà bảng thống kê thuộc tính của
các polygon (polygon attribute table - PAT) và bảng thống kê thuộc tính của các
cung are attribute table – AAT.
Bảng 1. bảng thuộc tính của polygon PAT
# - ID N
0

Thuộc tính
Poly – ID Thuộc
tính polygon
Perimeter
Chu vi
Area
Diện tích
1 0 8418 4,506
2 104 8596 2,078
3 102 4296 1,144
4 101 2233 0,301
5 103 4325 0,983
Bảng 2. Bảng thống kê thuộc tính của cung AAT
# - ID
Thứ tự
Area- ID
Thuộc
tính cung
F-node
điểm
đầu
T- node

điểm
cuối
I- Poly. P
bên trái
P-Poly. P
bên phải
Length
độ dài
1 38 3 1 2 1,1 51
2 33 4 3 5 1,0 40
3 35 4 1 3 2,1 50
4 37 2 2 4 2,2 33
5 36 1 5 2 4,1 20
6 39 5 3 2 1,0 93
7 34 4 5 1 2,1 93
Trên bảng PAT, mọi tính chất chi tiết của polygon đều được tính và thống
kê, các chi tiết đó gọi là coverage.
Polygon thứ nhất (#-ID: 1)được gọi là polygone tổng hợp (universe
polygone), nó thể hiện một vùng tổng hợp tất cả các polygon có bên trong và có
diện tích được quy định là âm và có giá ttrị tuyệt đối bằng tổng diện tích của các
polygon bên trong. Các polygon tiếp theo được gắn các thuộc tính và các giá trị:
chu vi, diện tích mà được tính tự động khi các tính chất chi tiết được thiết lập.
Bảng AAT mỗi cung được xác định bởi cả số thứ tự và thuộc tính của cung,
thuộc tính của điểm đầu, điểm cuối và thuộc tính của các polygone ở bên phải, bên
trái của cung. Và các polygon này cũng chính là các polygone ở trong bảng PAT.
Ví dụ: polygone số 3 trong bảng AAT có số thứ tự là 3 và thuộc tính là 102 t0
bảng PAT.
Cả 3 yếu tố quan trọng của vector về tính chất hình học (topology) là tính
chất nối tiếp (adracency), tính chất chứa đựng (containment) và tính chất nối
(conectivity) là những yếu tố rất quan trọng và là vấn đề cốt lõi của mô hình cung

- điểm nối (are - node). Các yếu tố này sẽ giúp người phân tích xác định rõ được
tính chất của các yếu tố trong bản đồ.
Ví dụ: để xác định hai polygon có tiếp giáp nhau hay không, người phân tích
chỉ cần xem các cung xác định nên hai polygon đó, nếu có một cung nào cùng tính
chất thì nó chính là vị trí tiếp giáp của hai polygon. Trong bảng TAB, hai polygon
có số 102 và 103 được tiếp giáp nhau bởi cung số 33 trong bảng AAT.
Để xác định tính chất chứa đựng, cách xác định cũng như vậy. Muốn xác
định polygon A được chứa bởi polygon B hay không thì trước hết phải xác định
các cung tạo nên polygon A và thuộc tính của cả hai bên các cung, nếu như xác
định thấy A luôn ở mọi phía của cung thì A nhất thiết phải được chứa trong B. Ví
dụ cung số 37 trong hình 3 xác định nên polygon số 101, một phía của cung luôn
là polygon số 104 thì nhất thiết polygon số 101 phải được chứa trong polygon số
104. Trong trường hợp một polygon lớn chứa nhiều polygon nhỏ bên trong cũng
xác định một cách tương tự.
Tính chất tiếp nối của một cung được xác định từ thuộc tính của điểm đầu (F)
và điểm cuối (T) trong bảng AAT. Hai cung được xem là nối trực tiếp một khi có
chung điểm nối. Ví dụ trong bảng, cung 33, 38 và 39 là có chung một điểm nối số
3.F. Trong khi đó cung số 37 là không được nối với một điểm nào cả vì nó chỉ có
một điểm nối riêng của nó (số 2) tạo nên polygon thứ 4 có thuộc tính là 101.
Ví dụ trên là ví dụ cho một sự ưu điểm của mô hình cung - điểm nối, nó xác
định mối liên hệ hình học của các yếu tố và điều rất quan trọng trong xử lý không
gian. Mặt khác, vị trí (toạ độ x, y) của mỗi một điểm nối, điểm giao cắt cũng được
xác định. các thuộc tính đó cũng được thống kê rõ ràng trong bảng PAT và AAT
giúp cho người phân tích dễ dàng xử lý các thông tin. Trong thực tế, các tư liệu
không gian là rất phức tạp, mô hình are-node là công cụ hữu hiệu cho việc xử lý.
Hiện nay các phần mềm ERSI-ARC/INF và INTERGRAPH được xây dựng theo
mô hình này, Trong khi đó, phần mềm MAP/ INFO không được xây dựng theo mô
hình cung-điểm nên giao diện giữa chúng không tương thích.
Tóm lại: nội dung phần này nhằm giới thiệu tập trung vào tư liệu không gian,
đó là cơ sở cho việc xử lý HTTĐL. Công việc thống kê thuần tuý thì không cần

phải có các dữ liệu không gian, sự phân tích không gian thì lại rất cấn các thông số
đó, đặc biệt là các thông số về địa lý và bản đồ.
Các đối tượng không gian có thể được trình bày dưới các dạng khac nhau là
đường, điểm và polygon. Các yếu tố cơ bản của chúng cần được xác định đó là vị
trí, thuộc tính và tính chất hình học.
Việc tổ chức các yếu tố này ở hai dạng cấu trúc Raster và polygon là khác
nhau. Nhìn chung vị trí và thuộc tính thì được tổ chức tương đối giống nhau
trongcả hai dạng cấu trúc dữ liệu, song tính chất không gian thì hết sức khác nhau.
Trong xử lý không gian, các thông tin quan trọng nhất về hình học và tính
chất tiếp giáp, chứa đựng và nối tiếp, cấu trúc Raster có hạn chế cơ bản là không
thể hiện được mối quan hệ không gian. Thay vào đó, cấu trúc Vector và đặc biệt là
cấu trúc cung- điểm nối có ưu điểm là cung cấp đầy đủ các thông tin thuộc tính
của điểm, đường và vùng nên nó giúp cho việc xử lý không gian được rõ ràng và
hiệu quả.
II.5.Mô hình mạng (network model)
Trong mô hình mạng , các cung trở thành mạng được thể hiện trong mạng
giao thông (đường sắt, đường bộ, đường không), mạng lưới điện , mạng thông tin
, mạng ống gas, ống nước. Các điểm nối trở thành các điểm nối, điểm dừng hoặc
điểm giữa của mạng giống như hệ thống chạc 3 hoặc hệ thống van một cổng dẫn.
Các điểm đó là nơi để dừng hoặc tiêp nhận các đối tượng hoặc đưa ra các đối
tượng cần lưu thông , tương tự các điểm dừng xe, bến đổ, nơi chuyển tải Trung
tâm của mạng là nơi chuyển tải nguồn cung cấp hoặc là nơi có những hoạt động có
tính chất cung ứng cho mạng như: siêu thị, bệnh viện, sân bay, trường học… ở qui
mô lớn hơn trung tâm có thể là cả một thành phố cung cấp , chuyển tải cho cả một
vùng rộng lớn. Như vậy điểm liên hệ trong mạng là những đầu mối và các đường
dẫn và mối liên hệ đó có hướng nhất định theo các điểm quay - đổi chiều. Tóm lại
những tính chất như đường nối , điểm nối , các điểm dừng , các trung tâm và các
điểm quay là những thông tin thuộc tính của mô hình mạng cơ sở dữ liệu vector.
Còn một tính chất khác của mạng là sự cản trở (tương tự điện trở của mạch điện).
Sự cản trở bởi khối lượng thông tin được truyền và thời gian truyền tải. Sự cản trở

có liên quan đến nhiều yếu tố của mạng, đồng thời có liên quan đến cả năng lượng
truyền. Trong mạng của HTTDL với dữ liệu vector , những yếu tố quan trọng ảnh
hưởng đến sự liên kết trong mạng đó là yếu tố hình học và sự nối tiép. Ngoài ra
các thuộc tính khác của đối tượng cũng phải được bố trí hợp lý cho từng mạng.
II.7.Chuyển đổi khuôn dạng dữ liệu
Trong xử lý HTTĐL, ngoài việc chuyển đổi khuôn dạng dữ liệu (format) với
các phần mềm khác thì một trong những chức năng quan trọng cần thiết là chuyển
đổi từ vector sang Raster và ngược lại. Chức năng này cho phép sử dụng một cách
linh hoạt những lớp thông tin có sẵn trong CSDL hoặc các lớp thông tin mới tạo
nên để đưa vào xử lý nhanh chóng trong hệ thống.
Chuyển đổi dữ liệu thanhf Raster (Raster hoá) (Rasterisation hay
Rasterising) là quá trình chuyển đổi dữ liệu từ cơ sở pixel sang dạng vector. Công
việc này rất cần thiết cho nhiều mục đích, Khi mà các đường contour của vector
cần thiết được xử lý phối hợp với tài liệu Raster.
Để Raster hoá cần thiết phải tạo lưới với độ phân giải (kích thước pixel)
thích hợp lên toàn bộ bản đồ và tính gia trị pixel bằng việc lựa chọn các vùng mẫu
tại nơi giao nhau của các đường vector hoặc nơi tiếp giáp của các polygon, từ đó
gắn giá trị các pixel tại nơi tiếp giáp, sao cho nó phân biệt hẳn với các pixel ở
xung quanh. Nếu vector hoá với độ phân giải thấp thì sẽ làm giảm độ chính xác
của bản đồ đôi khi làm rối các đường contour.

×