Tải bản đầy đủ (.pdf) (84 trang)

(Luận văn thạc sĩ) nghiên cứu một số thuật toán song song ứng dụng trong GIS

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.92 MB, 84 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

BÙI ANH TÚ

NGHIÊN CỨU MỘT SỐ THUẬT TOÁN SONG SONG
ỨNG DỤNG TRONG GIS

LUẬN VĂN THẠC SĨ

Hà Nội - 2011


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

BÙI ANH TÚ

NGHIÊN CỨU MỘT SỐ THUẬT TOÁN SONG SONG
ỨNG DỤNG TRONG GIS

Ngành: Công nghệ thông tin
Chuyên ngành: Công nghệ phần mềm
Mã số: 1.01.10

LUẬN VĂN THẠC SĨ

NGƯỜI HƯỚNG DẪN KHOA HỌC:

PGS. TS. Đăng Văn Đức
Hà Nội - 2011




LỜI MỞ ĐẦU ................................................................... 1
CHƯƠNG 1: KHÁI QUÁT VỀ GIS VÀ XỬ LÝ SONG
SONG ................................................................................ 3
1.1 Hệ thống thông tin địa lý GIS .......................................................................3
1.1.1. Lịch sử ra đời .......................................................................................3
1.1.2. Định nghĩa GIS .....................................................................................5
1.1.3. Các thành phần GIS ..............................................................................5
1.1.4. Tổng quan các chức năng của hệ thống thông tin địa lý ........................9
1.1.5 Các ứng dụng phổ biến của GIS........................................................... 16
1.2. Tổng quan về xử lý song song ................................................................... 20
1.2.1. Tại sao phải xử lý song song ............................................................... 20
1.2.2. Phân biệt xử lý song song ................................................................... 20
1.2.3. Mục đích của xử lý song song ............................................................. 21
1.2.4. Kiến trúc máy tính .............................................................................. 21
1.2.4.1. Kiến trúc máy tính kiểu Voneument ................................................ 21
1.2.4.2. Phân loại máy tính song song ........................................................... 22
1.2.4.3. Song song hố trong máy tính tuần tự .............................................. 25
1.2.4.4. Một số vấn đề cần quan tâm trong kiến trúc MTSS .......................... 27

CHƯƠNG 2: MỘT SỐ THUẬT TOÁN XỬ LÝ SONG
SONG ỨNG DỤNG TRONG GIS................................. 29
2.1. Tại sao lại áp dụng xử lý song song trong GIS .......................................... 29
2.1.1. Ý nghĩa thực tiễn của xử lý song song ................................................ 29
2.1.2. Đặc điểm riêng của GIS ...................................................................... 29
78


2.2. Xây dựng thuật toán xử lý song song ứng dụng trong GIS ........................ 30

2.2.1. Nguyên lý thiết kế thuật toán song song(TTSS) .................................. 30
2.2.2. Các cách tiếp cận thiết giải thuật song song và đánh giá giải thuật song
song.............................................................................................................. 32
2.3. Xây dựng một số thuật toán song song áp dụng trong GIS ........................ 33
2.3.1. Thuật toán sắp xếp song song bitonic.................................................. 33
2.3.3. Tìm kiếm đường đi ngắn nhất ứng dụng trong GIS ............................. 53
2.3.4. Xây dựng thuật tốn tìm kiếm dữ liệu song song ................................ 58
2.3.5. Thuật toán sắp xếp Quicksort song song ............................................. 62

CHƯƠNG 3: PHÁT TRIỂN CHƯƠNG TRÌNH THỬ
NGHIỆM THUẬT TỐN SONG SONG TRONG GIS65
3.1. Thực nghiệm áp dụng xử lý song song trong GIS và Bản đồ số ................. 65
3.1.1. Thực nghiệm áp dụng thuật toán Bitonic trong việc sắp xếp dữ liệu đầu
vào ............................................................................................................... 65
3.1.2. Thực nghiệm với tìm kiếm dữ liệu thơ ................................................ 66
3.1.3. Thực nghiệm sắp xếp lại dữ liệu song song ......................................... 68
3.1.3. Thực nghiệm tìm kiếm dữ liệu sau khi đã tổ chức lại dữ liệu .............. 69
3.1.4. Thực nghiệm tìm đường đi ngắn nhất từ 1 đỉnh đến tất cả các đỉnh ..... 70
3.2. Xây dựng Bản đồ số áp dụng..................................................................... 72
3.3. Một số hình ảnh chương trình ................................................................... 74

KẾT LUẬN ..................................................................... 76
TÀI LIỆU THAM KHẢO.............................................. 77

79


LỜI MỞ ĐẦU
Một trong những nghành phát triển rất mạnh mẽ hiện nay phải kể đến đó là
ngành Cơng nghệ Thông tin, một trong những ngành mũi nhọn của nhiều quốc gia

trên thế giới. Sự phát triển không ngừng của công nghệ thông tin mang lại hiệu quả
cao cho con người, đồng thời cũng giúp chính bản thân nghành cơng nghệ thông tin
phát triển, sự phát triển cả về phần cứng cũng như các phần mềm tiện ích kèm theo.
Sự phát triển đó đã kéo theo rất nhiều các ngành khác phát triền theo, trong đó có
lĩnh vực nghiên cứu khoa học. Tuy công nghệ ngày càng phát triển, tốc độ xử lý của
các thiết bị cũng không ngừng tăng cao, nhưng nhu cầu tính tốn của con người vẫn
cịn rất lớn. Cho đến hiện nay vẫn còn rất nhiều vấn đề mà các nhà khoa học cùng
với khả năng tính tốn của các máy tính hiện nay vẫn chưa giải quyết được hay giải
quyết được nhưng với thời gian rất lớn.
Các vấn đề đó có thể là :
- Mơ hình hóa và giả lập.
- Xử lý thao tác trên các dữ liệu rất lớn.
- Các vấn đề “grand challenge” (các vấn đề không thể giải quyết trong thời
gian hợp lý).
Lời giải cho những vấn đề này đã dẫn đến sự ra đời của các thế hệ siêu máy tính.
Tuy nhiên việc đầu tư phát triển cho các thiết bị này gần như là điều quá khó khăn
đối với nhiều người, tổ chức, trường học….
Chính vì lẽ đó mà ngày nay người ta đang tập trung nghiên cứu cách cách sử
dụng các tài nguyên phân bố một cách hợp lý để tận dụng được khả năng tính tốn
của các máy tính đơn. Những giải pháp này được biết đến với nhiều tên gọi khác
nhau như parallel computing, meta-computing, salable-computing, globalcomputing, Internet computing và gần nhất hiện nay là peer to peer computing hay
Grid computing. Đây là phương pháp nhằm tận dụng khả năng của các máy tính
trên tồn mạng thành một máy tính “ảo” duy nhất, nhằm hợp nhất tài ngun tính
tốn ở nhiều nơi trên thế giới để tạo ra một khả năng tính tốn khổng lồ, góp phần
1


giải quyết các vấn đề khó khăn trong khoa học và cơng nghệ. Ngày nay nó đang
càng được sự hỗ trợ mạnh hơn của các thiết bị phần cứng, băng thông…
Xử lý song song được quan tâm đầu tư rất lớn hiện nay kể cả phần cứng cũng

như phần mềm. Chính vì vậy việc áp dụng xử lý song song trong các nghành, các
lĩnh vực cũng phát triển rộng rãi, đem lại hiệu quả cao.
Hệ thống thông tin địa lý GIS được hình thành vào những năm 1960 và phát
triển rất rộng rãi trong 10 năm lại đây. GIS ngày nay là công cụ trợ giúp quyết định
trong nhiều hoạt động kinh tế - xã hội, quốc phòng của nhiều quốc gia trên thế giới.
GIS có khả năng trợ giúp các cơ quan chính phủ, các nhà quản lý, các doanh nghiệp,
các cá nhân... đánh giá được hiện trạng của các quá trình, các thực thể tự nhiên, kinh
tế -xã hội thông qua các chức năng thu thập, quản lý, truy vấn, phân tích và tích hợp
các thơng tin được gắn với một nền hình học (bản đồ) nhất quán trên cơ sở toạ độ
của các dữ liệu đầu vào. Với ý nghĩa sâu rộng của GIS thì việc làm thế nào áp dụng
cho tốt, ứng dụng sao đem lại hiệu quả cao là một vấn đề cần lưu tâm.
Mục tiêu của luận văn là tìm hiểu về xử lý song song, và qua đó vận dụng các
kiến thức có được để đưa ra giải pháp, ứng dụng tính tốn song song vào việc xử lý
thông tin trong GIS, nhằm giải quyết các vấn đề về thời gian, hiệu quả xử lý hệ
thống GIS khi dữ liệu đầu vào là tương đối lớn.
Luận văn bao gồm 3 chương:
Chương 1: Khái quát về GIS và xử lý song song.
Chương 2: Một số thuật toán song song ứng dụng trong GIS.
Chương 3: Phát triển chương trình thử nghiệm thuật tốn song song trong GIS.

2


CHƢƠNG 1:
KHÁI QUÁT VỀ GIS VÀ XỬ LÝ SONG SONG
1.1 Hệ thống thông tin địa lý GIS
Hệ thống thông tin Địa lý (GIS: Geograpgic Information System) đã được sử
dụng rộng rãi ở các nước phát triển, đây là một dạng ứng dụng công nghệ tin nhằm
mô tả thế giới thực mà chúng ta đang sống, khám phá và khai thác. Với những tính
năng ưu việt của nó mà các hệ thống thơng tin khác khơng có được như cơng nghệ

GIS kết hợp các thao tác cơ sở dữ liệu thông thường và các phép phân tích thống kê,
phân tích dữ liệu khơng gian và thuộc tính. Những khả năng này phân biệt GIS với
các hệ thống thông tin khác và khiến cho GIS ngày nay đang được ứng dụng rộng
rãi trong nhiều lĩnh vực khác nhau trong nghiên cứu và quản lý (phân tích các sự
kiện, dự đốn tác động và hoạch định chiến lược), đặc biệt trong lĩnh vực phát triển
nông thôn nhằm quản lý và quy hoạch sử dụng và khai thác các nguồn tài nguyên
thiên nhiên một cách có hiệu quả, bền vững và hợp lý.
Hệ thống thơng tin địa lý GIS có rất nhiều ứng dụng, nếu con người biết sử
dụng và khai thác tiềm năng rộng lớn của nó thì GIS sẽ như lắp thêm đơi mắt, đơi
tay, đơi cánh giúp con người nhìn thế giới trực quan hơn, chính xác hơn và nhanh
chóng chinh phục được thế giới trong tiềm năng vốn có của mình.

1.1.1. Lịch sử ra đời
Từ xa xưa con người đã biết cách biểu diễn các thông tin địa lý bằng cách thu
nhỏ các sự vật theo một kích thước nào đó, rồi vẽ lên mặt phẳng. Để đánh dấu các
đặc tính của sự vật, người ta dùng các loại ký hiệu khác nhau như độ cao được biểu
diễn bằng những đường bình độ, một số đối tượng được biểu thị bởi các loại màu
sắc tương ứng hoặc bằng chú thích cùng các số hiệu đi kèm. Sự biểu thị kết quả thể
hiện các ý tưởng đó được gọi là bản đồ.
Trên cơ sở của hệ thông tin bản đồ, những năm đầu của thập kỷ 60(1963-1964)
các nhà khoa học Canada đã cho ra đời hệ thống thông tin địa lý hay còn gọi là GIS
3


(Geographical Information Systems - GIS). GIS kế thừa mọi thành tựu trong ngành
bản đồ cả về ý tưởng lẫn thành tựu của kỹ thuật bản đồ. GIS bắt đầu hoạt động cũng
bằng việc thu thập dữ liệu theo định hướng tuỳ thuộc vào muc tiêu đặt ra. Hệ thông
tin đia lý (GIS) có thể hiểu một cách đơn giản là tập hợp các thơng tin có liên quan
đến các yếu tố địa lý một cách đồng bộ và logic.
Trong những năm 70 ở Bắc Mỹ đã có sự quan tâm nhiều hơn đến việc bảo vệ

môi trường và phát triển GIS. Thời kỳ này hàng loạt thay đổi một cách thuận lợi cho
sự phát triển của GIS, đặc biệt là sự gia tăng ứng dụng của máy tính với kích thước
bộ nhớ và tốc độ tăng. Chính những thuận lợi này mà GIS dần dần được thương mại
hoá. Năm 1977 đã có nhiều hệ thơng tin địa lý khác nhau trên thế giới. Bên cạnh
GIS thời kỳ này còn phát triển mạnh mẽ các kỹ thuật xử lý ảnh viễn thám. Một
hướng nghiên cứu kết hợp giữa GIS và viễn thám được đặt ra.
Thập kỷ 80 được đánh dấu bởi các nhu cầu sử dụng GIS ngày càng tăng với
các quy mô khác nhau. Người ta tiếp tục giải quyết những tồn tại của những năm
trước mà nổi lên là vấn đề số hoá dữ liệu. Thập kỷ này đánh dấu bởi sự nảy sinh các
nhu cầu mới trong ứng dụng GIS như: theo dõi sử dụng tối ưu các nguồn tài nguyên,
đánh giá khả thi các phương án quy hoạch, các bài tốn giao thơng… GIS trở thành
một cơng cụ hữu hiệu trong công tác quản lý và trợ giúp quyết định.
Những năm đầu của thập kỷ 90 được đánh dấu bằng việc nghiên cứu hoà
nhập giữa viễn thám và GIS. Các nước Bắc Mỹ và châu Âu thu được nhiều thành
công trong lĩnh vực này. Khu vực châu Á Thái Bình Dương cũng đã thành lập nhiều
trung tâm nghiên cứu viễn thám và GIS. Ở các nước như Trung Quốc, Nhật Bản,
Thái Lan… đã chú ý nghiên cứu đến GIS chủ yếu vào lĩnh vực quản lý, đánh giá tài
nguyên thiên nhiên và môi trường.
Ở Việt Nam việc nghiên cứu và ứng dụng hệ thông tin địa lý cũng mới chỉ
bắt đầu, và chỉ được triển khai ở những cơ quan lớn như tổng cục địa chính, trường
Đại học mỏ Địa chất, Viện Điều tra quy hoạch rừng, Viện địa chất…Đồng thời mức
độ ứng dụng còn hạn chế, và mới chỉ có ý nghĩa nghiên cứu hoặc ứng dụng để giải
quyết một số các nhiệm vụ trước mắt.
4


Như vậy hầu hết các nước trên thế giới trong đó có Việt nam đều quan tâm
nghiên cứu hệ thơng tin địa lý và ứng dụng nó vào nhiều ngành, trong đó có ngành
Lâm nghiệp. Ngày nay, phần mềm GIS đang hướng tới đưa công nghệ GIS trở thành
hệ tự động thành lập bản đồ và xử lý dữ liệu ngày càng đạt hiệu quả cao về tốc độ và

độ chính xác.

1.1.2. Định nghĩa GIS
Hiện nay có rất nhiều định nghĩa về GIS, nhưng chúng đều có điểm giống nhau
như: bao hàm khái niệm dữ liệu không gian, phân biệt giữa hệ thông tin quản lý
(Management Information System - MIS) và GIS. Về khía cạnh của bản đồ học thì
GIS là kết hợp của lập bản đồ trợ giúp máy tính và cơng nghệ cơ sở dữ liệu (CSDL).
So với bản đồ thì GIS có lợi thế là lưu trữ dữ liệu và biểu diễn chúng là hai công
việc tách biệt nhau. Do vậy GIS cho khả năng quan sát từ các góc độ khác nhau trên
cùng tập dữ liệu.
GIS là một bộ công cụ đầy sức mạnh để tuyển chọn, lưu trữ, phục hồi, chuyển
đổi và hiển thị số liệu không gian từ thế giới thực đáp ứng cho một số mục đích cụ
thể
Nhận xét GIS:
 GIS liên quan đến cơ sở dữ liệu: Tất cả các thông tin trong một GIS được liên
kết với nhau.
 Kỹ thuật hợp nhất GIS: Phân tích khơng ảnh, ảnh Vệ tinh, tạo ra mơ hình hoặc
là làm ra các bản đồ chun đề.
 GIS như là một bộ sử lý cơ sở dữ liệu.

1.1.3. Các thành phần GIS
Hệ thống GIS có năm thành tố chính bao gồm: con người, phương pháp, phần
cứng tin học, phần mềm tin học và dữ liệu. Tầm quan trọng của mỗi thành tố và các
quan hệ giữa chúng được trình bày chi tiết trong các phần tiếp theo đây.

5


Hình 1.1 Các thành phần hệ thống GIS


1.1.3.1. Con ngƣời
Con người là chuyên viên tin học, các chuyên gia về các lĩnh vực khác nhau,
chuyên gia GIS, thao tác viên GIS, phát triển ứng dụng GIS.
Người sử dụng hệ thống (system user) là những người sử dụng GIS để giải quyết các
vấn đề không gian. Họ thường là những người được đào tạo tốt về lĩnh vực GIS hay
GIS chuyên dụng. Nhiệm vụ chủ yếu của họ là số hóa bản đồ, kiểm tra lỗi, soạn
thảo, phân tích các dữ liệu thô và đưa ra các giải pháp cuối cùng để truy vấn dữ liệu
địa lý.
Thao tác viên hệ thống (system operator) có trách nhiệm vận hành hệ thống
hàng ngày để người sử dụng hệ thống làm việc hiệu quả. Cơng việc của họ là sửa
chữa khi chương trình bị tắc ngẽn hay là công việc trợ giúp nhân viên thực hiện các
phân tích có độ phức tạp cao.
Nhà cung cấp GIS (GIS supplier) có trách nhiệm cung cấp phần mềm, cập
nhật phần mềm, phương pháp nâng cấp cho hệ thống. Đôi khi tham gia huấn luyện
người dùng GIS thông qua các hợp đồng với quản trị hệ thống.
Nhà cung cấp dữ liệu (data supplier) có thể là tổ chức Nhà nước hay tư nhân.
Thông thường các công ty tư nhân cung cấp dữ liệu sửa đổi từ dữ liệu các cơ quan
Nhà nước để cho phù hợp với ứng dụng cụ thể. Thông thường các cơ quan Nhà
6


nước cung cấp dữ liệu được xây dựng cho chính nhu cầu của họ, nhưng dữ liệu này
có thể được sử dụng trong các cơ quan, tổ chức khác. Một số dữ liệu này được bán
với giá rẻ hay cho không tới các dự án GIS phi lợi nhuận.
Người phát triển ứng dụng (application developer) là những lập trình viên
được đào tạo. Họ xây dựng các giao diện người dùng, làm giảm khó khăn khi thực
hiện

các


thao

tác

cụ

thể

trên

các

hệ

thống

GIS

chun

nghiệp.

Hình 1.2 Quản lý dự án GIS

Chuyên viên phân tích hệ thống GIS (GIS systems analysts) là nhóm người
chuyên nghiên cứu thiết kế hệ thống. Phần lớn họ là đội ngũ chuyên nghiệp, có trách
nhiệm xác định mục tiêu của hệ GIS trong cơ quan, hiệu chỉnh hệ thống, đề xuất kỹ
thuật phân tích đúng đắn, đảm bảo tích hợp thắng lợi hệ thống trong cơ quan.

1.1.3.2. Dữ liệu

Với bất kỳ hệ thông tin nào cũng phải hiểu rõ các loại dữ liệu khác nhau lưu
trữ trong chúng. Dữ liệu (các biến) thống kê gắn theo các hiện tượng tự nhiên với
mức độ chính xác khác nhau. Hệ thống thước đo của chúng bao gồm các biến tên, số
thứ tự, khoảng và tỷ lệ.
Mỗi hệ GIS cần phải hiểu được dữ liệu trong các khuôn mẫu khác nhau,
không chỉ hiểu khuôn mẫu dữ liệu riêng của hệ thống. Thí dụ, đường biên bản đồ có
thể trong khuôn mẫu tệp DXF của AutoCAD hay BNA của AtlasGIS. Thông
thường, GIS hiểu ngay khuôn mẫu DXF mà không cần sửa đổi nào. Tương tự, GIS
7


phải hiểu ngay khn mẫu DBF của các thuộc tính được lưu trữ kèm theo. Lý tưởng
thì phần mềm GIS phải có khả năng đọc các khn mẫu dữ liệu raster (DEN, GIFF,
TIFF, JPEG, EPS) và khuôn mẫu vectơ (TIGER, HPGL, DXF, Postscript, DLG).
Với dữ liệu ba chiều, phần lớn phần mềm GIS trợ giúp lưới tam giác không đều
(TIN). Một số khác trợ giúp cấu trúc raster trên cơ sở lưới bao gồm cây tứ phân và
khả năng chuyển đổi toàn bộ hay một phần dữ liệu vào cấu trúc này. Một vài phần
mềm GIS chỉ trợ giúp khuôn mẫu riêng, chúng phụ thuộc vào nhà sản xuất phần
mềm.

1.1.3.3. Công cụ phần mềm
Một hệ thống GIS bao gồm nhiều môđun phần mềm. Khả năng lưu trữ, quản lý
dữ liệu không gian bằng hệ quản trị CSDL địa lý là khía cạnh quan trọng nhất của
GIS. Các mơđun khác là cơng cụ phân tích dữ liệu, làm báo cáo và truyền tin.

Hình 1.3 Phần mềm của GIS

1.1.3.4. Giao diện ngƣời dùng
Giao diện đồ họa cho phép người dùng dễ dàng thực hiện các thao tác địa lý và
các thao tác khác như truy nhập CSDL, làm báo cáo.


1.1.3.5. Phần cứng
Ngày nay, có thể tìm thấy GIS trên mọi loại hình máy tính, từ máy tính cá nhân
đến các trạm làm việc và máy tính đa người dùng. GIS địi hỏi các thiết bị ngoại vi
8


đặc biệt như bàn số hóa, máy vẽ, máy quét ảnh để vào/ra dữ liệu. Các thiết bị này có
thể được nối với nhau thông qua thiết bị truyền tin hay mạng cục bộ.

Hình 1.4 Phần cứng GIS

1.1.4. Tổng quan các chức năng của hệ thống thông tin địa lý
Phần này mơ tả các khả năng của bộ chương trình GIS thương mại. Các chức năng
của chúng được phân chia thành năm loại sau đây:
- Thu thập dữ liệu.
- Xử lý sơ bộ dữ liệu.
- Lưu trữ và truy nhập dữ liệu.
- Tìm kiếm và phân tích khơng gian.
- Hiển thị đồ họa và tương tác.
Sức mạnh của các chức năng của hệ thống GIS khác nhau là khác nhau. Kỹ
thuật xây dựng các chức năng trên cũng rất khác nhau. Hình 1.5 mơ tả quan hệ giữa
các nhóm chức năng và cách biểu diễn thông tin khác nhau của GIS.
Chức năng thu thập dữ liệu tạo ra dữ liệu từ các quan sát hiện tượng thế giới thực
và từ các tài liệu, bản đồ giấy, đơi khi chúng có sẵn dưới dạng số. Kết quả ta có tập
"dữ liệu thơ", có nghĩa là dữ liệu này khơng được phép áp dụng trực tiếp cho chức
năng truy nhập và phân tích của hệ thống. Chức năng xử lý sơ bộ dữ liệu sẽ biến đổi
dữ liệu thô thành dữ liệu có cấu trúc để sử dụng trực tiếp các chức năng tìm kiếm và
9



phân tích khơng gian. Kết quả tìm kiếm và phân tích được xem như diễn giải dữ
liệu, đó là tổ hợp hay biến đổi đặc biệt của dữ liệu có cấu trúc. Hệ thống GIS phải có
phần mềm cơng cụ để tổ chức và lưu trữ các loại dữ liệu khác nhau, từ dữ liệu thô
đến dữ liệu diễn giải. Phần mềm cơng cụ này phải có các thao tác lưu trữ, truy nhập;
đồng thời có khả năng hiển thị, tương tác đồ họa với tất cả loại dữ
liệu.

Hình 1.5 Các nhóm chức năng trong GIS

1.1.4.1. Thu thập dữ liệu
Thu thập dữ liệu là tiến trình thu nhận dữ liệu theo khuôn mẫu áp dụng được
cho GIS. Mức độ đơn giản nhất của thu thập dữ liệu là chuyển đổi khn mẫu dữ
liệu có sẵn từ các nguồn bên ngồi. Trong trường hợp này, GIS phải có mơđun
chương trình hiểu được các khuôn mẫu dữ liệu chuẩn khác nhau để trao đổi như
DLG, DXF hay các dữ liệu là đầu ra của các hệ thống GIS khác như MapInfo,
10


Arc/Info... GIS cịn phải có khả năng nhập các ảnh bản đồ trong các khuôn mẫu như
TIFF, GIF... Thực tế, nhiều kỹ thuật trắc đạc được áp dụng để thu thập dữ liệu thô.
Chúng bao gồm thu thập dữ liệu về bề mặt Trái đất như địa hình, địa chất học và
thảm thực vật nhờ trắc đạc bằng vệ tinh và máy bay. Các dữ liệu kinh tế - xã hội thu
thập từ điều tra, phỏng vấn hay chuyển đổi từ các tài liệu viết. Những bản đồ vẽ
bằng tay trên giấy phải được số hóa. Việc sử dụng dữ liệu ảnh từ vệ tinh hay ảnh
chụp từ máy bay được xem là nguồn dữ liệu quan trọng nhất khi nghiên cứu tài
nguyên thiên nhiên và đo vẽ bản đồ địa hình. Phần lớn các ảnh vệ tinh sử dụng trong
GIS có độ phân giải mặt đất từ 10-80m. Chúng đặc biệt hiệu quả khi nghiên cứu các
biến môi trường như thảm cỏ hay hệ thống thủy lợi, nhưng chúng chỉ được ứng dụng
cho bản đồ địa hình với tỷ lệ 1:50000 hay nhỏ hơn. Còn ảnh máy bay sẽ cho số liệu

chính xác hơn và được áp dụng để lập bản đồ tỷ lệ lớn hơn, thí dụ tỷ lệ 1:500 hay
1:1000.
Phần lớn nguồn gốc thông tin không gian là các bản đồ in hay bản đồ dưới
khuôn mẫu tương tự. Để các dữ liệu này được sử dụng trong GIS thì phải số hóa
chúng. Các cơng việc này có thể là số hóa thủ cơng các hình dạng đặc trưng bản đồ
và nhập thuộc tính mơ tả các đặc trưng đó. Cách tiếp cận với mức tự động hóa cao
hơn là số hóa bản đồ bằng máy quét để phát sinh ra ảnh số bản đồ đầy đủ. Đầu ra
của máy quét là ma trận của các giá trị điểm ảnh 2D, nó có thể được sử dụng cho
cơng việc vectơ hóa để tạo ra bản đồ vectơ với các đặc trưng điểm, đường, vùng hay
xâu ký tự. Trình tự số hóa bao gồm mã hóa dữ liệu, kiểm chứng và sửa lỗi để có
được dữ liệu phù hợp với GIS. Nói chung, cơng đoạn thu thập dữ liệu khơng gian là
nhiệm vụ khó khăn, nặng nề nhất trong quá trình xây dựng ứng dụng GIS.

1.1.4.2. Xử lý dữ liệu thơ
Hai khía cạnh chính của xử lý dữ liệu thơ bao gồm:
- Phát sinh dữ liệu có cấu trúc tơpơ.
- Trường hợp dữ liệu ảnh vệ tinh thì phải phân lớp các đặc trưng trong ảnh
thành các hiện tượng quan tâm.

11


Mơ hình quan niệm của thơng tin khơng gian bao gồm mơ hình hướng đối
tượng, mạng và bề mặt. Q trình phân tích trên cơ sở cách nhìn khác nhau đòi hỏi
dữ liệu phải được biểu diễn và tổ chức cho phù hợp. Vì vậy, cần thiết cung cấp
phương tiện cho người sử dụng GIS thay đổi cấu trúc dữ liệu để thích nghi với các
yêu cầu khác nhau. Điều này địi hỏi khơng chỉ chức năng tạo lập mơ hình dữ liệu
vectơ có cấu trúc tơpơ và mơ hình dữ liệu raster, mà cịn có khả năng thay đổi cách
biểu diễn, thay đổi phân lớp và sơ đồ mẫu, làm đơn giản hóa hay tổng quát hóa dữ
liệu, biến đổi giữa hệ thống trục tọa độ khác nhau và biến đổi các phép chiếu bản đồ

(hình 1.6). Các thao tác kể trên được xem như tiền thao tác cho phân tích khơng
gian. Mức độ xử lý dữ liệu thơ là khác nhau, phụ thuộc vào mục đích của ứng dụng
GIS.

12


Hình 1.6 Xử lý dữ liệu thơ

Một số cơng cụ phân tích của GIS phụ thuộc chặt chẽ vào mơ hình dữ liệu
raster, do vậy nó địi hỏi q trình biến đổi mơ hình dữ liệu vectơ sang dữ liệu raster,
hay cịn gọi là raster hóa (hình 1.6c). Biến đổi từ raster sang mơ hình vectơ, hay cịn
gọi là vectơ hóa, đặc biệt cần thiết khi tự động quét ảnh (hình 1.6d). Raster hóa là
tiến trình chia đường hay vùng thành các tế bào. Ngược lại, vectơ hóa là tập hợp các
tế bào (pixel) để tạo thành đường hay vùng. Nếu dữ liệu raster khơng có cấu trúc tốt,
thí dụ ảnh vệ tinh, thì việc nhận dạng mẫu sẽ rất phức tạp.
Thủ tục biến đổi các đối tượng rời rạc trong khuôn mẫu vectơ sang các tế bào
vuông của mô hình raster là rõ ràng, nhưng thủ tục biến đổi điểm dữ liệu có vị trí tùy
ý thành lưới đều sẽ ít chính xác (hình 1.6e). Lấy mẫu lại các điểm phân tán khơng
đều có thể thực hiện bằng các kỹ thuật nội suy. Có nghĩa là mơ hình hóa dữ liệu
13


thống kê tại các vị trí khơng lấy mẫu thành hàm số của các điểm mẫu. Cách khác là
xây dựng lưới tam giác khơng đều (TIN) (hình 1.6f).
Khi so sánh dữ liệu từ các nguồn khác nhau, vấn đề chung nảy sinh là sử dụng
hai hay nhiều phân lớp hay sơ đồ mã hóa cho cùng hiện tượng. Để nhận ra các khía
cạnh khác nhau của hiện tượng với dữ liệu có mức độ chi tiết khác nhau, cần phải có
tiến trình xấp xỉ hóa hay đơn giản hóa để biến đổi về cùng một sơ đồ. Cách mã hóa
lại khá đơn giản, nó là tái phân lớp để tổ hợp một vài lớp thành lớp ít chi tiết hơn

hay tổng qt hơn (hình 1.6g). Thí dụ, trên bản đồ biên loại đất hay bản đồ địa chất,
một vài vùng con bên trong được loại bỏ để tạo ra các đa giác lớn hơn. Kết quả là
chúng có thể được nhận biết nhờ thao tác phân lớp ở mức cao hơn.
Vấn đề lớn nảy sinh khi tích hợp dữ liệu bản đồ (thí dụ, bản đồ của các nước
khác nhau) là hệ thống tọa độ của chúng được đo vẽ trên cơ sở nhiều phép chiếu bản
đồ khác nhau. Các dữ liệu này khơng thể tích hợp trên cùng bản đồ nếu không biến
đổi chúng về cùng hệ trục tọa độ. Bước thứ nhất của biến đổi tọa độ là từ dữ liệu gốc
hay dữ liệu vừa số hóa sang đơn vị đo thế giới thực của phép chiếu bản đồ. Đây là
phần việc rất quan trọng của tiến trình thu thập dữ liệu bằng cách số hóa bản đồ giấy
có sẵn.

1.1.4.3. Lƣu trữ và truy cập dữ liệu
Chức năng lưu trữ dữ liệu trong GIS liên quan đến tạo lập CSDL khơng gian.
Nội dung của CSDL này có thể bao gồm tổ hợp dữ liệu vectơ hoặc/và dữ liệu raster,
dữ liệu thuộc tính để nhận danh hiện tượng tham chiếu khơng gian. Thơng thường
dữ liệu thuộc tính của GIS trên cơ cở đối tượng được lưu trong bảng (tệp), chúng
chứa chỉ danh duy nhất tương ứng với đối tượng khơng gian, kèm theo rất nhiều
mục dữ liệu thuộc tính khác nhau. Chỉ danh đối tượng không gian duy nhất được
dùng để liên kết giữa dữ liệu thuộc tính và dữ liệu không gian tương ứng. Đôi khi
mục dữ liệu trong bảng thuộc tính bao gồm cả giá trị khơng gian như độ dài đường,
diện tích vùng mà chúng đã dược dẫn xuất từ biểu diễn dữ liệu hình học (hình 1.7).
Trong mơ hình dữ liệu raster thì các tệp thuộc tính thơng thường chứa dữ liệu liên
quan đến lớp hiện tượng tự nhiên như loại đất, thảm thực vật thay cho đối tượng rời
14


rạc. Việc lựa chọn mơ hình raster hay vectơ để tổ chức dữ liệu không gian được thực
hiện khi thu thập dữ liệu vì mỗi mơ hình tương ứng với cách tiệm cận khác nhau đến
việc lấy mẫu và mô tả thông tin. Tuy nhiên rất nhiều CSDL của GIS cho khả năng
quản trị cả hai mơ hình khơng gian nói trên. Khi xây dựng CSDL khơng gian thì cần

phải liên kết bảng dữ liệu liên quan đến hiện tượng tự nhiên tương ứng.
Một số hệ thống GIS được sử dụng rộng rãi, thí dụ Arc/Info, xây dựng CSDL
trên cơ sở tổ hợp các mơ hình sau:
- Mơ hình quan hệ quản lý thuộc tính phi hình học.
- Lược đồ chuyên dụng, phi quan hệ để lưu trữ, xử lý dữ liệu khơng gian.

Hình 1.7 Liên kết dữ liệu thuộc hình học

Một vài GIS khác đã lợi dụng các phương tiện của lược đồ lưu trữ CSDL quan
hệ để quản lý cả hai loại dữ liệu: hình học và phi hình học.
Phương tiện truy nhập trong CSDL GIS cần bao gồm cả phương tiện có sẵn của
CSDL quan hệ chuẩn, thí dụ, trích chọn dữ liệu đã lưu trữ trên cơ sở một thuộc tính
nào đó như tên hay lớp hiện tượng (thành phố, vùng hành chính, loại đường quốc
lộ...). Chúng cịn có khả năng xây dựng câu hỏi truy vấn (query) để tìm thơng tin mà
giá trị của nó bằng hay nằm trong khoảng xác định (dân số trên 50000, số người trên
15


60 tuổi...). Đặc tính đặc biệt của câu hỏi được sử dụng trong CSDL GIS là khả năng
xác định dữ liệu theo vị trí trong hệ tọa độ nào đó và theo các quan hệ khơng gian.
Vì nhu cầu khai thác thơng tin trên cơ sở vị trí cho nên CSDL không gian thường
bao gồm phương pháp chỉ số không gian đặc biệt. Câu hỏi khơng gian thơng thường
là tìm ra các đối tượng nằm trong hay nằm phía trên các biên của cửa sổ chữ nhật.
Khai thác dữ liệu trên cơ sở vị trí hay quan hệ khơng gian được xem như nền tảng
quá trình xâm nhập cơ sở dữ liệu của hệ GIS.

1.1.4.4. Tìm kiếm và phân tích không gian
Việc thu thập, lưu trữ dữ liệu trong GIS là để nhằm sử dụng vào giải quyết các
vấn đề hay lập quyết định liên quan tới ứng dụng cụ thể. Rất nhiều hệ GIS bao hàm
hay có liên quan đến việc mơ hình hóa dữ liệu và các chức năng thống kê chuyên

dụng cho loại ứng dụng nào đó. Tuy nhiên, cốt lõi chung nhất của GIS phải đáp ứng
đòi hỏi của mọi ứng dụng

1.1.5 Các ứng dụng phổ biến của GIS
Vì GIS được thiết kế như một hệ thống chung để quản lý dữ liệu khơng gian,
nó có rất nhiều ứng dụng trong việc phát triển đô thị và môi trường tự nhiên như là:
quy hoạch đô thị, quản lý nhân lực, nông nghiệp, điều hành hệ thống cơng ích, lộ
trình, nhân khẩu, bản đồ, giám sát vùng biển, cứu hoả và bệnh tật. Trong phần lớn
lĩnh vực này, GIS đóng vai trị như là một cơng cụ hỗ trợ quyết định cho việc lập kế
hoạch hoạt động.
Môi trƣờng

16


Theo những chun gia GIS kinh nghiệm nhất thì có rất nhiều ứng dụng đã
phát triển trong những tổ chức quan tâm đến môi trường. Với mức đơn giản nhất thì
người dùng sử dụng GIS để đánh giá mơi trường, ví dụ như vị trí và thuộc tính của
cây rừng. Ứng dụng GIS với mức phức tạp hơn là dùng khả năng phân tích của GIS
để mơ hình hóa các tiến trình xói mịn đất sư lan truyền ơ nhiễm trong mơi trường
khí hay nước, hoặc sự phản ứng của một lưu vực sông dưới sự ảnh hưởng của một
trận mưa lớn. Nếu những dữ liệu thu thập gắn liền với đối tượng vùng và ứng dụng
sử dụng các chức năng phân tích phức tạp thì mơ hình dữ liệu dạng ảnh (raster) có
khuynh hướng chiếm ưu thế.
Khí tƣợng thuỷ văn
Trong lĩnh vực này GIS được dùng như là một hệ thống đáp ứng nhanh, phục
vụ chống thiên tai như lũ quét ở vùng hạ lưu, xác định tâm bão, dự đoán các luồng
chảy, xác định mức độ ngập lụt, từ đó đưa ra các biện pháp phịng chống kịp thời...
vì những ứng dụng này mang tính phân tích phức tạp nên mơ hình dữ liệu khơng
gian dạng ảnh (raster) chiếm ưu thế.


Nông nghiệp
Những ứng dụng đặc trưng: Giám sát thu hoạch, quản lý sử dụng đất, dự báo
về hàng hoá, nghiên cứu về đất trồng, kế hoạch tưới tiêu, kiểm tra nguồn nước.
Dịch vụ tài chính
GIS được sử dụng trong lĩnh vực dịch vụ tài chính tương tự như là một ứng
dụng đơn lẻ. Nó đã từng được áp dụng cho việc xác định vị trí những chi nhánh mới
17


của Ngân hàng. Hiện nay việc sử dụng GIS đang tăng lên trong lĩnh vực này, nó là
một cơng cụ đánh giá rủi ro và mục đích bảo hiểm, xác định với độ chính xác cao
hơn những khu vực có độ rủi ro lớn nhất hay thấp nhất. Lĩnh vực này đòi hỏi những
dữ liệu cơ sở khác nhau như là hình thức vi phạm luật pháp, địa chất học, thời tiết và
giá trị tài sản.
Y tế
Ngoại trừ những ứng dụng đánh gía, quản lý mà GIS hay được dùng, GIS cịn
có thể áp dụng trong lĩnh vực y tế. Ví dụ như, nó chỉ ra được lộ trình nhanh nhất
giữa vị trí hiện tại của xe cấp cứu và bệnh nhân cần cấp cứu, dựa trên cơ sở dữ liệu
giao thơng. GIS cũng có thể được sử dụng như là một cơng cụ nghiên cứu dịch bệnh
để phân tích nguyên nhân bộc phát và lây lan bệnh tật trong cộng đồng.
Chính quyền địa phƣơng
Chính quyền địa phương là một trong những lĩnh vực ứng dụng rộng lớn nhất
của GIS, bởi vì đây là một tổ chức sử dụng dữ liệu không gian nhiều nhất. Tất cả các
cơ quan của chính quyền địa phương có thể có lợi từ GIS. GIS có thể được sử dụng
trong việc tìm kiếm và quản lý thửa đất, thay thế cho việc hồ sơ giấy tờ hiện hành.
Nhà cầm quyền địa phương cũng có thể sử dụng GIS trong việc bảo dưỡng nhà cửa
và đường giao thơng. GIS cịn được sử dụng trong các trung tâm điều khiển và quản
lý các tình huống khẩn cấp.
Bán lẻ

Phần lớn siêu thị vùng ngoại ô được xác định vị trí với sự trợ giúp của GIS.
GIS thường lưu trữ những dữ liệu về kinh tế-xã hội của khách hàng trong một vùng
nào đó. Một vùng thích hợp cho việc xây dựng mơt siêu thị có thể được tính tốn bởi
thời gian đi đến siêu thị, và mơ hình hố ảnh hưởng của những siêu thị cạnh tranh.
GIS cũng được dùng cho việc quản lý tài sản và tìm đường phân phối hàng ngắn
nhất.
Giao thơng
18


GIS có khả năng ứng dụng đáng kể trong lĩnh vực vận tải. Việc lập kế hoạch
và duy trì cở sở hạ tầng giao thông rõ ràng là một ứng dụng thiết thực, nhưng giờ
đây có sự quan tâm đến một lĩnh vực mới là ứng dụng định vị trong vận tải hàng hải,
và hải đồ điện tử. Loại hình đặc trưng này đòi hỏi sự hỗ trợ của GIS.
Các dịch vụ điện, nƣớc, gas, điện thoại...
Những công ty trong lĩnh vực này là những người dùng GIS linh hoạt nhất,
GIS được dùng để xây dựng những cơ sở dữ liệu là cái thường là nhân tố của chiến
lược công nghệ thông tin của các công ty trong lĩnh vự này. Dữ liệu vecto thường
được dùng trong các lĩnh vực này. những ứng dụng lớn nhất trong lĩnh vực này là
Automated Mapping và Facility Management (AM-FM). AM-FM được dùng để
quản lý các đặc điểm và vị trí của các cáp, valve... Những ứng dụng này đòi hỏi
những bản đồ số với độ chính xác cao.
Một tổ chức dù có nhiệm vụ là lập kế hoạch và bảo dưỡng mạng lưới vận
chuyền hay là cung cấp các dịch vụ về nhân lực, hỗ trợ cho các chương trình an tồn
cơng cộng và hỗ trợ trong các trường hợp khẩn cấp, hoặc bảo vệ mơi trường, thì
cơng nghệ GIS ln đóng vai trò cốt yếu bằng cách giúp cho việc quản lý và sử
dụng thông tin địa lý một cách hiệu quả nhằm đáp ứng các yêu cầu hoạt động và
mục đích chương trình của tổ chức đó.

19



1.2. Tổng quan về xử lý song song
1.2.1. Tại sao phải xử lý song song
Yêu cầu thực tế cần thực hiện khối lượng tính tốn lớn: bài tốn xử lý ảnh 3D, thăm
dị dầu khí, dự báo thời tiết, ... (máy tính xử lý tuần tự kiểu von Neumann là khơng
đáp ứng u cầu)

Hình 1.7 Xử lý tuần tự

Tốc độ xử lý của các bộ xử lý(BXL) theo kiểu von Neumann đã dần tiến tới
giới hạn, không thể cải tiến thêm được do vậy dẫn tới đòi hỏi phải thực hiện xử lý
song song.
Hiện nay giá thành của phần cứng (CPU) giảm mạnh, tạo điều kiện để xây
dựng những hệ thống có nhiều BXL với giá thành hợp lý.
Sự phát triển của cơng nghệ mạch tích hợp (VLSI) cho phép tạo ra những hệ thống
có hàng triệu transistor trên một chip.
Xử lý song song là quá trình xử lý gồm nhiều tiến trình được kích hoạt đồng
thời và cùng tham gia giải quyết một bài tồn, nói chung xử lý song song được thực
hiện trên những hệ thống đa bộ xử lý.

1.2.2. Phân biệt xử lý song song
Trong tính tốn tuần tự với một BXL thì tại mỗi thời điểm chỉ thực hiện được
một phép toán.

20


Trong tính tốn song song thì nhiều BXL cùng kết hợp với nhau để giải quyết
cùng một bài toán cho nên giảm được thời gian xử lý vì mỗi thời điểm có thể thực

hiện đồng thời nhiều phép tốn.

1.2.3. Mục đích của xử lý song song
Là thực hiện tính tốn nhanh trên cơ sở sở dụng nhiều BXL đồng thời. Cùng
với tốc độ xử lý nhanh hơn, việc xử lý song song cũng sẽ giải được những bài toán
phức tạp u cầu khối lượng tính tốn lớn.

Hình 1.8 Xử lý song song

1.2.4. Kiến trúc máy tính
1.2.4.1. Kiến trúc máy tính kiểu Voneument
Von Neumann computer có các đặc điểm sau:
-

Bộ nhớ được dùng để lưu trữ chương trình và dữ liệu.

-

Chương trình được mã hố (code) để máy tính có thể hiểu được.

-

Dữ liệu là những thông tin đơn giản được sử dụng bởi chương trình.

-

CPU nạp (fetch) những lệnh và dữ liệu từ bộ nhớ, giải mã (decode) và thực
hiện tuần tự chúng

Máy tính kiểu V.Neumann được xây dựng từ các khối cơ sở:

-

Bộ nhớ: để lưu trữ dữ liệu

-

Các đơn vị logic và số học ALU: thực hiện các phép toán

-

Các phần tử xử lý:điều khiển CU và truyền dữ liệu I/O

-

Đường truyền dữ liệu: BUS
21


×