Tải bản đầy đủ (.pdf) (21 trang)

Mô hình và trực quan hóa dữ liệu trạng thái giao thông trên nền web

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (477.6 KB, 21 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ

PHẠM ĐỨC DƢƠNG

MÔ HÌNH VÀ TRỰC QUAN HOÁ DỮ LIỆU
TRẠNG THÁI GIAO THÔNG TRÊN NỀN WEB

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

HÀ NỘI - 2015


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ

PHẠM ĐỨC DƢƠNG

MÔ HÌNH VÀ TRỰC QUAN HOÁ DỮ LIỆU
TRẠNG THÁI GIAO THÔNG TRÊN NỀN WEB
Ngành:
Chuyên ngành:
Mã số:

Công nghệ thông tin
Hệ thống thông tin
60480104

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

Ngƣời hƣớng dẫn khoa học: TS. NGUYỄN NGỌC HÓA



HÀ NỘI - 2015


LỜI CẢM ƠN
Trước tiên tôi xin gửi lời cảm ơn chân thành và sự biết ơn sâu sắc tới TS.
Nguyễn Ngọc Hóa, người thầy đã chỉ bảo và hướng dẫn tận tình cho tôi trong
suốt quá trình nghiên cứu khoa học và thực hiện luận văn này.
Tôi xin chân thành cảm ơn các thày cô giáo đã giảng dạy trong suốt
những năm tôi học tại trường Đại học Công nghệ đã trang bị cho tôi những kiến
thức quý báu và động lực nghiên cứu.
Cuối cùng, tôi xin gửi lời cảm ơn tới gia đình, người thân, bạn bè, đồng
nghiệp đã luôn giúp đỡ, động viên, khuyến khích tôi trong cuộc sống và trong
công việc.
Tôi xin chân thành cảm ơn!
Tác giả
Phạm Đức Dương


LỜI CAM ĐOAN
Tôi xin cam đoan luận văn thạc sĩ “Mô hình và trực quan hoá dữ liệu trạng
thái giao thông trên nền Web” là do tôi viết dưới sự hướng dẫn của thầy giáo TS.
Nguyễn Ngọc Hóa thuộc Trường Đại học Công nghệ - Đại học Quốc gia Hà
Nội. Luận văn được hoàn thành trên cơ sở nghiên cứu, tổng hợp và phát triển
các nghiên cứu về mô hình, kỹ thuật trực quan hóa dữ liệu trong nước và trên
thế giới do tôi thực hiện.
Tôi xin cam đoan các đề xuất trong luận văn do chính tôi thực hiện qua
quá trình nghiên cứu đưa ra, các nội dung liên quan trong luận văn có nguồn gốc
từ nghiên cứu của người khác đều được ghi rõ nguồn gốc trong phần tài liệu
tham khảo, nếu có gì sai sót tôi xin hoàn toàn chịu trách nhiệm.



MỤC LỤC
MỞ ĐẦU ............................................................................................................... 1
Chương 1. Các vấn đề lý thuyết liên quan ............................................................ 3
1.1. Hệ thống thông tin địa lý (GIS) ................................................................. 3
1.1.1. Khái niệm về GIS ................................................................................ 3
1.1.2. Các thành phần của GIS ...................................................................... 4
1.1.2.1. Phần cứng ..................................................................................... 4
1.1.2.2. Phần mềm ..................................................................................... 4
1.1.2.3. Dữ liệu.......................................................................................... 4
1.1.2.4. Con người..................................................................................... 5
1.1.2.5. Phương pháp quản lý ................................................................... 5
1.1.3. Cấu trúc dữ liệu trong GIS. ................................................................. 5
1.1.3.1. Dữ liệu bản đồ .............................................................................. 5
1.1.3.2. Dữ liệu thuộc tính ........................................................................ 7
1.1.3.3. Mối quan hệ giữa dữ liệu bản đồ và dữ liệu thuộc tính. .............. 7
1.1.4. Các chức năng của GIS ....................................................................... 7
1.1.5. Các đặc điểm của GIS ......................................................................... 8
1.1.6. Ứng dụng của GIS............................................................................... 8
1.1.7. WebGIS ............................................................................................... 9
1.2. Trực quan hóa dữ liệu ................................................................................ 9
1.2.1. Tổng quan............................................................................................ 9
1.2.1.1. Trực quan hóa .............................................................................. 9
1.2.1.2. Trực quan hóa thông tin (Information visualization) ......... Error!
Bookmark not defined.
1.2.1.3. Trực quan hóa dữ liệu (Data visualization)Error!
Bookmark
not defined.
1.2.2. Kiến trúc và mô hình trực quan hóa dữ liệuError! Bookmark not

defined.
1.2.2.1. Mô hình khái niệm ..................... Error! Bookmark not defined.
1.2.2.2. Mô hình tham khảo trực quan hóa thông tinError! Bookmark
not defined.
1.2.3. Thiết kế trực quan hóa dữ liệu .......... Error! Bookmark not defined.
1.2.3.1. Bộ ba Designer-Reader-Data ..... Error! Bookmark not defined.
1.2.3.2. Quá trình trực quan hóa dữ liệu . Error! Bookmark not defined.
1.2.3.3. Các trạng thái của dữ liệu trong quá trình trực quan hóa dữ liệu
..................................................................... Error! Bookmark not defined.


1.3. Trực quan hóa dữ liệu theo địa lý (Geovisualization)Error! Bookmark
not defined.
1.3.1. Giới thiệu........................................... Error! Bookmark not defined.
1.3.2. Ứng dụng thực tế của trực quan hóa dữ liệu theo địa lý ............ Error!
Bookmark not defined.
1.3.3. Một số loại bản đồ trực quan hóa dữ liệu theo địa lý ................ Error!
Bookmark not defined.
1.4. Ứng dụng trực quan hóa dữ liệu biểu diễn trạng thái giao thông ..... Error!
Bookmark not defined.
1.4.1. Khả năng ứng dụng trực quan hóa dữ liệu biểu diễn trạng thái giao
thông ............................................................ Error! Bookmark not defined.
1.4.2. Tham khảo trực quan hóa dữ liệu biểu diễn trạng thái giao thông
..................................................................... Error! Bookmark not defined.
Chương 2. Nghiên cứu xây dựng giải pháp trực quan hoá dữ liệu trạng thái giao
thông trên nền bản đồ số ............................. Error! Bookmark not defined.
2.1. Thu thập và xử lý dữ liệu ......................... Error! Bookmark not defined.
2.2. Mô hình và kỹ thuật trực quan hoá dữ liệu trạng thái giao thông ..... Error!
Bookmark not defined.
2.2.1. Kỹ thuật vẽ đồ họa thực hiện trực quan hóa dữ liệu .................. Error!

Bookmark not defined.
2.2.1.1. Lý thuyết cơ bản về vẽ đồ họa ... Error! Bookmark not defined.
2.2.1.2. Thuật toán trình bày đồ họa ....... Error! Bookmark not defined.
2.2.2. Mô hình trực quan hóa dữ liệu trạng thái giao thông ................ Error!
Bookmark not defined.
2.2.3. Mô hình kiến trúc hệ thống giải pháp trực quan hoá dữ liệu trạng thái
giao thông .................................................... Error! Bookmark not defined.
2.2.4. Kỹ thuật xây dựng hệ thống trực quan hóa dữ liệu trạng thái giao
thông ............................................................ Error! Bookmark not defined.
2.2.4.1. Kỹ thuật xây dựng trực quan hóa tình trạng trên các tuyến đường
giao thông .................................................... Error! Bookmark not defined.
2.2.4.2. Kỹ thuật xây dựng trực quan hóa tổng hợp tình trạng giao thông
bằng biểu đồ ................................................ Error! Bookmark not defined.
2.3. Công cụ xây dựng hệ thống trực quan hoá dữ liệu trạng thái giao thông
..................................................................... Error! Bookmark not defined.
2.3.1. PostgreSQL/PostGIS ......................... Error! Bookmark not defined.
2.3.2. Apache............................................... Error! Bookmark not defined.
2.3.3. Map Server ........................................ Error! Bookmark not defined.


2.3.4. Công cụ lập trình ............................... Error! Bookmark not defined.
2.3.4.1. JavaScript ................................... Error! Bookmark not defined.
2.3.4.2. Leaflet ........................................ Error! Bookmark not defined.
2.3.4.3. D3 ............................................... Error! Bookmark not defined.
2.3.4.4. Heatmap ..................................... Error! Bookmark not defined.
Chương 3. Xây dựng và thử nghiệm ứng dụng trực quan hóa dữ liệu trạng thái
giao thông Hà Nội ....................................... Error! Bookmark not defined.
3.1. Yêu cầu đặt ra........................................... Error! Bookmark not defined.
3.2. Phân tích, thiết kế hệ thống ...................... Error! Bookmark not defined.
3.2.1. Mô hình kiến trúc hệ thống ............... Error! Bookmark not defined.

3.2.2. Chức năng hệ thống .......................... Error! Bookmark not defined.
3.2.3. Lược đồ cơ sở dữ liệu ....................... Error! Bookmark not defined.
3.3. Xây dựng ứng dụng và thử nghiệm.......... Error! Bookmark not defined.
3.3.1. Môi trường ứng dụng ........................ Error! Bookmark not defined.
3.3.2. Dữ liệu thử nghiệm ........................... Error! Bookmark not defined.
3.3.3. Các vấn đề và giải pháp trong quá trình triển khaiError! Bookmark
not defined.
3.3.3.1. Sử dụng heatmap thể hiện trạng thái giao thông trên tuyến đường
..................................................................... Error! Bookmark not defined.
3.3.3.2. Kết hợp Leaflet và Heatmap ...... Error! Bookmark not defined.
3.3.3.3. Thao tác với dữ liệu dạng GeoJSONError! Bookmark not
defined.
3.3.3.4. Kết nối cơ sở dữ liệu .................. Error! Bookmark not defined.
3.3.3.5. Xây dựng biểu đồ tổng hợp dữ liệu trạng thái giao thông .. Error!
Bookmark not defined.
3.3.3.6. Cập nhật dữ liệu thời gian thực .. Error! Bookmark not defined.
3.4. Kết quả thử nghiệm .................................. Error! Bookmark not defined.
3.5. Đánh giá ................................................... Error! Bookmark not defined.
KẾT LUẬN CHUNG .......................................... Error! Bookmark not defined.


DANH MỤC HÌNH VẼ
Hình 1.1 Mô hình hệ thống thông tin địa lý .......................................................... 3
Hình 1.2 Các thành phần của GIS ........................................................................ 4
Hình 1.3 Sự thể hiện quang cảnh sự vật dưới các lớp bản đồ khác nhau ............. 6
Hình 1.4 Trực quan hóa khoa học mô phỏng sự bất ổn định Raleigh-Taylor bởi
sự hòa trộn giữa 2 chất lưu .................................................................................. 10
Hình 1.5 Mô hình phân tích và trình diễn dữ liệuError! Bookmark not defined.
Hình 1.6 Mô hình khái niệm của trực quan hóa.. Error! Bookmark not defined.
Hình 1.7 Vai trò của mô hình dữ liệu trong phần mềm trực quan hóa ........ Error!

Bookmark not defined.
Hình 1.8 Sơ đồ mô tả mô hình tham khảo trực quan hóa thông tin ............. Error!
Bookmark not defined.
Hình 1.9 Bản chất của trực quan hóa dựa vào đánh giá mối quan hệ giữa 3 thành
phần ..................................................................... Error! Bookmark not defined.
Hình 1.10 Bản đồ Choropleth ............................. Error! Bookmark not defined.
Hình 1.11 Bản đồ Cartogram .............................. Error! Bookmark not defined.
Hình 1.12 Bản đồ Proportional Symbol .............. Error! Bookmark not defined.
Hình 1.13 Bản đồ kết hợp proportional symbol với cartograms.................. Error!
Bookmark not defined.
Hình 1.14 Bản đồ Pinpoint .................................. Error! Bookmark not defined.
Hình 1.15 Bản đồ nổi tiếng về chiến dịch nước Nga của Napoleon ............ Error!
Bookmark not defined.
Hình 1.16 Bản đồ Subway .................................. Error! Bookmark not defined.
Hình 1.17 Bản đồ Isopleth................................... Error! Bookmark not defined.
Hình 1.18 Bản đồ Stream plots ........................... Error! Bookmark not defined.
Hình 1.19 Bản đồ Prism ...................................... Error! Bookmark not defined.
Hình 1.20 Đồ thị mô tả thời gian chờ đợi theo số lượng xe tải Error! Bookmark
not defined.
Hình 1.21 Ví dụ sử dụng Score Cards và Dash boards ...... Error! Bookmark not
defined.
Hình 1.22 Kết quả cuộc thi MIT Big Data Challenge ....... Error! Bookmark not
defined.
Hình 2.1 Sự tương tác giữa các trạng thái dữ liệu ............. Error! Bookmark not
defined.
Hình 2.2 Luật vẽ trực giao .................................. Error! Bookmark not defined.


Hình 2.3 Mô hình trực quan hóa trạng thái giao thông ...... Error! Bookmark not
defined.

Hình 2.4 Mô hình kiến trúc hệ thống WebGIS ... Error! Bookmark not defined.
Hình 2.5 Kết quả hiển thị các điểm trên bản đồ .. Error! Bookmark not defined.
Hình 2.6 Kết quả vẽ theo phương pháp “đóng hộp” .......... Error! Bookmark not
defined.
Hình 2.7 Kết quả vẽ theo phương pháp mật độ nhân......... Error! Bookmark not
defined.
Hình 3.1 Mô hình kiến trúc ................................. Error! Bookmark not defined.
Hình 3.2 Sơ đồ áp dụng mô hình trực quan hóa . Error! Bookmark not defined.
Hình 3.3: Lược đồ cơ sở dữ liệu ......................... Error! Bookmark not defined.
Hình 3.4 Tập các điểm biểu diễn trên tuyến đường ........... Error! Bookmark not
defined.
Hình 3.5 Màn hình chương trình thử nghiệm ..... Error! Bookmark not defined.
Hình 3.6 Biểu đồ tổng hợp trạng thái giao thông theo thời điểm ............... Error!
Bookmark not defined.
Hình 3.7 Biểu đồ tổng hợp trạng thái giao thông theo ngày .... Error! Bookmark
not defined.
Hình 3.8 Biểu đồ tổng hợp trạng thái giao thông theo tuần ..... Error! Bookmark
not defined.
Hình 3.9 Biểu đồ tổng hợp trạng thái giao thông theo tháng ... Error! Bookmark
not defined.
Hình 3.10 Biểu trực quan trạng thái giao thông trên bản đồ theo thời điểm chọn
............................................................................. Error! Bookmark not defined.


MỞ ĐẦU
Hà Nội là thủ đô của Việt Nam và cũng là một trong những thành phố có
số dân và mật độ dân cư cao của cả nước nên giao thông Hà Nội có tầm quan
trọng nhất định trong việc đáp ứng nhu cầu đi lại và vận chuyển hàng hóa ngày
một tăng. Tuy nhiên, hiện nay Hà Nội cũng như các thành phố lớn khác đang
hàng ngày phải đối mặt với vấn nạn ùn tắc giao thông.

Để giải quyết tình trạng ùn tắc giao thông trên địa bàn Hà Nội, dựa trên
những phân tích về nguyên nhân ùn tắc giao thông, Hà Nội đã đệ trình Chính
phủ 4 nhóm giải pháp nhằm nâng cấp cơ sở hạ tầng giao thông, phục vụ sự tăng
trưởng kinh tế - xã hội của thủ đô gồm: Nhóm các giải pháp kỹ thuật, Nhóm các
giải pháp hành chính, Nhóm các giải pháp kinh tế, Nhóm các giải pháp tuyên
truyền.
Một phần trong các giải pháp này là đẩy mạnh việc ứng dụng CNTT một
cách tổng thể trong ngành giao thông. Đó là các giải pháp thu thập thông tin
giao thông; quy hoạch, điều tiết đường sá; điều khiển giao thông; xác định lưu
lượng và cung cấp thông tin giao thông tới người tham gia giao thông, cảnh báo
sớm cho người tham gia giao thông về tình trạng ùn tắc tại các tuyến phố, để
người dân chủ động thay đổi phương tiện, hướng đi trên đường …
Với thực trạng đó, luận văn này chú trọng đến việc tìm hiểu, nghiên cứu
xây dựng mô hình và trực quan hoá dữ liệu trạng thái giao thông trên nền bản đồ
số một số tuyến phố của thủ đô Hà nội. Đây cũng là một trong những nhiệm vụ
nghiên cứu trong đề tài nghiên cứu mã số 01C-04/08-2014-2 của Sở Khoa học
và Công nghệ Hà Nội thực hiện từ năm 2014. Mục đích chính của đề tài nhằm
cung cấp thông tin một cách trực quan cho người xem về tình trạng ùn tắc tại
các tuyến phố để có ứng xử thích hợp khi tham gia giao thông. Trong khuôn khổ
luận văn này, toàn bộ phần giải pháp thu thập dữ liệu trạng thái giao thông được
tách rời và được định hướng ngoài phạm vi luận văn.
Từ mục tiêu đó, những kết quả thu được trong luận văn được trình bày
trong 3 chương chính, ngoài phần mở đầu và kết luận, bao gồm:
Chương 1: Các vấn đề lý thuyết liên quan giới thiệu các lý thuyết phục vụ
mục đích của đề tài là xây dựng Mô hình và trực quan hoá dữ liệu trạng thái giao
thông trên nền bản đồ số. Các lý thuyết đó bao gồm: Hệ thống thông tin địa lý,
lý thuyết về trực quan hóa dữ liệu, trực quan hóa dữ liệu theo địa lý, khả năng
ứng dụng trực quan hóa dữ liệu để biểu diễn trạng thái giao thông.
Chương 2: Nghiên cứu xây dựng giải pháp trực quan hoá dữ liệu trạng
thái giao thông trên nền bản đồ số đưa ra các kỹ thuật trực quan hóa trong hệ

thống giao thông và đề xuất mô hình trực quan hóa tình trạng giao thông Hà
1


Nội. Chương này cũng giới thiệu mô hình hệ thống và các công cụ mã nguồn
mở để triển khai mô hình trực quan hóa.
Chương 3: Thử nghiệm xây dựng ứng dụng trực quan hóa với dữ liệu
trạng thái giao thông Hà Nội bằng cách sử dụng các công cụ, mô hình đã giới
thiệu trong chương 2 để xây dựng thử nghiệm hệ thống trực quan hoá dữ liệu
trạng thái giao thông trên nền bản đồ số từ thông tin trạng thái giao thông của
một số tuyến phố chính Hà Nội.
Phần kết luận tổng kết, đánh giá những kết quả đạt được của luận văn và
đưa ra hướng phát triển các nội dung nghiên cứu của luận văn.

2


Chƣơng 1. Các vấn đề lý thuyết liên quan
1.1. Hệ thống thông tin địa lý (GIS)
Hệ Thông tin địa lý (GIS) là một công cụ máy tính để lập bản đồ và phân
tích các sự vật, hiện tượng thực trên trái đất. Công nghệ GIS kết hợp các thao tác
cơ sở dữ liệu thông thường (như cấu trúc hỏi đáp) và các phép phân tích thống
kê, phân tích địa lý, trong đó phép phân tích địa lý và hình ảnh được cung cấp
duy nhất từ các bản đồ. Những khả năng này phân biệt GIS với các hệ thống
thông tin khác và khiến cho GIS có phạm vi ứng dụng rộng trong nhiều lĩnh vực
khác nhau (phân tích các sự kiện, dự đoán tác động và hoạch định chiến
lược)[1].
1.1.1. Khái niệm về GIS
Có nhiều cách tiếp cận khác nhau liên quan đến định nghĩa Hệ thống
thông tin địa lý [1]:

Định nghĩa theo chức năng: GIS là một hệ thống bao gồm 4 hệ con: Dữ
liệu vào, quản trị dữ liệu, phân tích dữ liệu và dữ liệu ra.
Định nghĩa theo khối công cụ: GIS là tập hợp phức tạp của các thuật toán.
Định nghĩa theo mô hình dữ liệu: GIS gồm các cấu trúc dữ liệu được sử
dụng trong các hệ thống khác nhau (cấu trúc dạng Raster và Vecter).
Định nghĩa về mặt công nghệ: GIS là công nghệ thông tin để lưu trữ, phân
tích và trình bày các thông tin không gian và thông tin phi không gian, công
nghệ GIS có thể nói là tập hợp hoàn chỉnh các phương pháp và các phương tiện
nhằm sử dụng và lưu trữ các đối tượng.
Định nghĩa theo sự trợ giúp và ra quyết định: GIS có thể coi là một hệ
thống trợ giúp việc ra quyết định, tích hợp các số liệu không gian trong một cơ
chế thống nhất.
Nói tóm lại theo BURROUGHT: “GIS như là một tập hợp các công cụ
cho việc thu nhập, lưu trữ, thể hiện và chuyển đổi các dữ liệu mang tính chất
không gian từ thế giới thực để giải quyết các bài toán ứng dụng phục vụ các mục
đích cụ thể”.
Mô hình chung một hệ thống thông tin địa lý được thể hiện tại hình 1.1.

Hình 1.1 Mô hình hệ thống thông tin địa lý
3


1.1.2. Các thành phần của GIS
GIS được kết hợp bởi năm thành phần chính được biểu diễn tại hình 1.2
bao gồm: phần cứng, phần mềm, dữ liệu, con người và phương pháp quản
lý[1,6,14].

Hình 1.2 Các thành phần của GIS
1.1.2.1. Phần cứng
Phần cứng là hệ thống máy tính trên đó một hệ GIS hoạt động. Ngày nay,

phần mềm GIS có khả năng chạy trên rất nhiều dạng phần cứng, từ máy chủ
trung tâm đến các máy trạm hoạt động độc lập hoặc liên kết mạng.
1.1.2.2. Phần mềm
Phần mềm GIS cung cấp các chức năng và các công cụ cần thiết để lưu
giữ, phân tích và hiển thị thông tin địa lý. Các thành phần chính trong phần mềm
GIS là:
+ Công cụ nhập và thao tác trên các thông tin địa lý
+ Hệ quản trị cơ sở dữ liệu (DBMS)
+ Công cụ hỗ trợ hỏi đáp, phân tích và hiển thị địa lý
+ Giao diện đồ hoạ người-máy (GUI) để truy cập dễ dàng.
1.1.2.3. Dữ liệu
Có thể coi thành phần quan trọng nhất trong một hệ GIS là dữ liệu. Các
dữ liệu địa lý và dữ liệu thuộc tính liên quan có thể được người sử dụng tự tập
hợp hoặc được mua từ nhà cung cấp dữ liệu thương mại. Hệ GIS sẽ kết hợp dữ
liệu không gian với các nguồn dữ liệu khác, thậm chí có thể sử dụng DBMS để
tổ chức lưu giữ và quản lý dữ liệu.

4


1.1.2.4. Con người
Công nghệ GIS sẽ bị hạn chế nếu không có con người tham gia quản lý hệ
thống và phát triển những ứng dụng GIS trong thực tế. Người sử dụng GIS có
thể là những chuyên gia kỹ thuật, người thiết kế và duy trì hệ thống, hoặc những
người dùng GIS để giải quyết các vấn đề trong công việc.
1.1.2.5. Phương pháp quản lý
Ðây là hợp phần rất quan trọng để đảm bảo khả năng hoạt động của hệ
thống, là yếu tố quyết định sự thành công của việc phát triển công nghệ GIS. Hệ
thống GIS cần được điều hành bởi một bộ phận quản lý, bộ phận này phải được
bổ nhiệm để tổ chức hoạt động hệ thống GIS một cách có hiệu quả để phục vụ

người sử dụng thông tin..
1.1.3. Cấu trúc dữ liệu trong GIS[1].
Chúng ta đều biết rằng bản đồ là phương tiện tốt nhất để hiển thị các
thông tin địa lý. Các dữ liệu không gian bao gồm ba loại chính gồm: điểm,
đường và vùng; vị trí của chúng được xác định bởi các tọa độ. Theo truyền
thống, bản đồ là tờ giấy phẳng, nó có tọa độ hai chiều. Bản đồ có các ký hiệu,
bao gồm các đường và màu sắc khác nhau biểu thị các đặc điểm khác nhau.
Cơ sở dữ liệu của hệ thống thông tin địa lý gồm hai phần cơ bản là dữ liệu
bản đồ (hay gọi là dữ liệu đồ thị) và dữ liệu thuộc tính (hay gọi là dữ liệu phi đồ
họa). Mỗi một loại dữ liệu có đặc trưng riêng và chúng yêu cầu lưu trữ, xử lý và
hiển thị khác nhau.
1.1.3.1. Dữ liệu bản đồ
Bản đồ là tài liệu miêu tả những đối tượng và những đặc trưng tự nhiên
trong thực tế của thế giới thực. Kỹ thuật làm bản đồ đã được phát triển để miêu
tả được sự phân loại của các đặc trưng, để nhận dạng được các nhãn, hình dạng
bề mặt của trái đất và luồng di chuyển của tài nguyên hoặc hàng hóa.
Hệ thống GIS dùng các dữ liệu đồ thị để tạo ra một bản đồ hay hình ảnh
bản đồ trên màn hình hoặc trên giấy thông qua thiết bị ngoại vi. Có 6 loại thông
tin dùng để thể hiện hình ảnh bản đồ và ghi chú của nó trong hệ thống thông tin
địa lý như sau:
- Ðiểm (Point)
- Ðường (Line)
- Vùng (Polygon)
- Ô lưới (Grid cell)
- Ký hiệu (Sympol)
- Ðiểm ảnh (Pixel)
5


Dữ liệu bản đồ có thể lưu trữ ở dạng Vector hoặc dạng Raster. Dữ liệu

dạng Vector là các điểm tọa độ (X, Y) hoặc là các quy luật tính toán toạ độ và
nối chúng thành các đối tượng trong một hệ thống tọa độ nhất định. Dữ liệu
Raster (ảnh đối tượng) là dữ liệu được tạo thành bởi các ô lưới có độ phân giải
xác định. Loại dữ liệu này chỉ dùng cho mục đích diễn tả và minh hoạ chi tiết
bằng hình ảnh thêm cho các đối tượng quản lý của hệ thống.
Để phản ánh toàn bộ các thông tin cần thiết của bản đồ dưới dạng đối
tượng số, các đối tượng địa lý còn được phản ánh theo cấu trúc phân mảnh và
phân lớp thông tin.
a) Cấu trúc phân mảnh
Một đối tượng địa lý về mặt không gian có thể liên tục trên một phạm vi
rộng. Tuy nhiên trong cơ sở dữ liệu GIS, do hạn chế về các lý do kỹ thuật như
khả năng lưu trữ, xử lý, quản lý dữ liệu mà các đối tượng địa lý lưu trữ dưới
dạng cách mảnh (mapsheet, tile). Tuy nhiên khái niệm chia mảnh trong cơ sở dữ
liệu GIS không hoàn toàn đồng nhất với khái niệm chia mảnh bản đồ thông
thường. Một mảnh (tile) trong cơ sở dữ liệu GIS có thể có hình dạng bất kỳ miễn
sau cho phù hợp với khả năng quản lý và xử lý của hệ thống. Theo xu hướng
hiện nay, các hệ thống GIS đã cung cấp những công cụ cho phép người sử dụng
tự động quản lý các mảnh trong cơ sở dữ liệu.
b) Cấu trúc phân lớp thông tin
Một trong những bước quan trọng xây dựng cơ sở dữ liệu GIS là phân loại
các lớp thông tin (layer, class). Hệ thống GIS lưu trữ các đối tượng địa lý theo
các lớp thông tin như hình 1.3. Mỗi lớp thông tin lưu trữ một loạt các đối tượng
có chung một tính chất, đặc điểm giống nhau. Thiết kế các lớp thông tin rất quan
trọng đối với bất kỳ một hệ thống GIS nào. Cách phân lớp thông tin sẽ ảnh
hưởng rất lớn đến tính hiệu quả, khả năng xử lý và sử dụng lâu dài của cơ sở dữ
liệu không gian.

Hình 1.3 Sự thể hiện quang cảnh sự vật dưới các lớp bản đồ khác nhau

6



Dữ liệu bản đồ giúp chúng ta xác định được vị trí địa lý, hình dạng trong
không gian của đối tượng. Thêm vào đó, dữ liệu thuộc tính giúp chúng ta mô tả
về đặc tính, đặc điểm và các thông tin liên quan tại đối tượng địa lý xác định mà
chúng khó hoặc không thể biểu thị toàn bộ trên bản đồ.
1.1.3.2. Dữ liệu thuộc tính
Là những thông tin mô tả về đặc tính, đặc điểm và các thông tin liên quan
khác gắn liền với đối tượng địa lý xác định. Các thông tin của dữ liệu thuộc tính
bao gồm:
- Ðặc tính của đối tượng: liên kết chặt chẽ với các thông tin đồ họa, các dữ
liệu này được xử lý và phân tích theo ngôn ngữ truy vấn cấu trúc (SQL). Chúng
được liên kết với các hình ảnh đồ họa thông qua các chỉ số xác định chung,
thông thường gọi là mã địa lí.
- Dữ liệu tham khảo địa lý: Mô tả các sự kiện hoặc hiện tượng xảy ra tại
một vị trí xác định. Không giống các thông tin đặc tính, chúng không mô tả về
bản thân các hình ảnh bản đồ, thay vào đó chúng mô tả các danh mục hoặc các
hoạt động như cho phép xây dựng các khu công nghiệp mới, nghiên cứu y tế,
báo cáo hiểm họa môi trường. . . liên quan đến các vị trí địa lí xác định.
- Chỉ số địa lý: là các chỉ số về tên, địa chỉ, khối, phương hướng định vị,...
liên quan đến các đối tượng địa lí, được lưu trữ trong Hệ thống thông tin địa lí
để lựa chọn, liên kết và tra cứu dữ liệu. Một chỉ số địa lý có thể bao gồm nhiều
bộ xác định cho các thực thể sử dụng từ các cơ quan khác nhau như là lập danh
sách các mã địa lý mà chúng xác định mối quan hệ không gian giữa các vị trí
hoặc giữa các hình ảnh hay thực thể địa lý.
1.1.3.3. Mối quan hệ giữa dữ liệu bản đồ và dữ liệu thuộc tính.
Hệ thống GIS sử dụng phương pháp chung để liên kết hai loại dữ liệu đó
thông qua bộ xác định, lưu trữ đồng thời trong các thành phần đồ thị và phi đồ
thị. Các bộ xác định có thể đơn giản là một số duy nhất liên tục, ngẫu nhiên hoặc
là các chỉ báo địa lí hay dữ liệu vị trí lưu trữ. Bộ xác định cho một thực thể có

thể chứa tọa độ phân bố của nó, số hiệu mảnh bản đồ, mô tả khu vực hoặc là một
con trỏ đến vị trí lưu trữ của dữ liệu liên quan.
1.1.4. Các chức năng của GIS
Trong các cơ sở dữ liệu thông thường, phần phân tích dữ liệu thường
được ghép chung vào phần hỏi đáp, tra cứu. Trong hệ GIS, phần phân tích dữ
liệu có một chức năng riêng và thường là rất mạnh, rất đặc trưng. Cơ sở toán học
cho chức năng này là đại số bản đồ. Chính ở điều này làm cho các hệ GIS khác

7


với các hệ thống khác và đây cũng là một tiêu chuẩn đặc trưng để đánh giá về
khả năng của một hệ GIS.
Các phép xử lý, phân tích của chức năng này dành riêng cho dữ liệu
không gian. Ngoài ra, GIS còn có khả năng phân tích không chỉ với dữ liệu
không gian mà còn phân tích cả hai loại dữ liệu không gian và phi không gian
trong mối liên hệ thống nhất với nhau. Các chức năng cơ bản của GIS là[1,6,14]:
Chuyển đổi hệ toạ độ, phép chiếu, nắn chỉnh bản đồ.
Thực hiện các phép toán số học, logic, hình học, đại số.
Chồng xếp, làm sạch, làm trơn, tách hoặc hợp các lớp thông tin không gian
và phi không gian.
Phân loại các lớp thông tin trên bản đồ.
Nội suy bề mặt cho điểm, đường, tạo bề mặt địa hình từ các đường đồng
mức, tạo ảnh phối cảnh ba chiều, tính toán độ dốc.
Tính toán thống kê khoảng cách, mô hình hoá và kết hợp với các hệ chuyên
gia.
Xác định chọn lọc vùng theo một tiêu chuẩn bất kỳ.
1.1.5. Các đặc điểm của GIS[1]
Hệ thống thông tin địa lý trước hết là một hệ thống thông tin cũng như các
hệ thống thông tin khác, ví dụ như thương mại, pháp luật, ngân hàng,... Các hệ

thống thông tin nói chung đều bao gồm các phần:
Hệ thống thiết bị phần cứng bao gồm máy tính hoặc hệ mạng máy tính, các
thiết bị đầu vào, các thiết bị đầu ra.
Hệ thống phần mềm bao gồm phần mềm hệ thống, phần mềm quản trị,
phần mềm ứng dụng.
Hệ thống thông tin đầu vào và hệ thống cập nhật thông tin.
Hệ thống CSDL bao gồm các loại dữ kiện cần thiết.
Hệ thống hiển thị thông tin và giao diện với người sử dụng
Sự khác nhau giữa hệ thống thông tin địa lý với các hệ thống thông tin
khác chỉ ở hai điểm sau:
CSDL bao gồm các dữ liệu địa lý và các dữ liệu thuộc tính (các dữ liệu
chữ, số, dữ liệu multimedial,... ) và mối quan hệ giữa hai loại dữ liệu này.
Hệ thống thông tin đầu vào và hệ thống hiển thị thông tin đòi hỏi những
đặc thù riêng về độ chính xác.
1.1.6. Ứng dụng của GIS[1]
Ngày nay, trên thế giới hệ thông tin địa lý đã trở nên không thể thiếu được
trong các ứng dụng kinh doanh, quản trị, nghiên cứu… Nhiều cơ quan chính
8


phủ, các công ty đã đầu tư rất nhiều tiền, công sức để xây dựng hệ thông tin địa
lý cho riêng mình và thực tế cho thấy kết quả thu được hoàn toàn tương xứng
chi phí bỏ ra.
Ở nước ta trong những năm gần đây đã và đang có nhiều tổ chức, cơ quan
và nhiều người đã bắt đầu quan tâm nghiên cứu các ứng dụng của hệ thông tin
địa lý, đặc biệt là nhiều cơ quan Nhà nước đã bắt đầu xây dựng hệ thông tin địa
lý trong công tác quản lý như quản lý đất đai, quản lý đô thị, quản lý giao thông,
quản lý hệ thống thoát nước, quy hoạch đường nông thôn, quản lý và sử dụng
hợp lý tài nguyên thiên nhiên...
Nhìn chung, hệ thống thông tin địa lý được xây dựng để phục vụ cho

nhiều mục tiêu khác nhau, đặc biệt là trợ giúp cho lao động trí óc của con người.
Cùng một cơ sở dữ liệu nhưng nhiều đối tượng khác nhau khai thác, mỗi đối
tượng sẽ khai thác theo khía cạnh riêng của mình.
1.1.7. WebGIS[6,14]
WebGIS hay công nghệ GIS trên nền Web là hệ thống thông tin địa lý
phân tán trên một mạng các máy tính để tích hợp, trao đổi các thông tin địa lý
trên mạng Internet.
Trong cách thực hiện việc phân tích GIS, dịch vụ này giống như kiến trúc
Client-Server của Web. Xử lý thông tin địa lý được chia thành các nhiệm vụ ở
phía Server và phía Client. Điều này cho phép người dùng có thể truy xuất, thao
tác và nhận kết quả từ việc khai thác dữ liệu GIS từ trình duyệt web của họ một
cách đơn giản không cần sự hỗ trợ của phần mềm GIS tại máy người sử dụng.

1.2. Trực quan hóa dữ liệu
1.2.1. Tổng quan
1.2.1.1. Trực quan hóa[19,21]
Trực quan hóa (Visualization hoặc visualisation) là kỹ thuật tạo ra
những hình ảnh, biểu đồ để diễn tả thông điệp. Trực quan hóa nghiên cứu trình
bày một cách trực quan, tương tác khối dữ liệu trừu tượng để tăng cường nhận
thức của con người.
Trực quan hóa thông qua những hình tượng trực quan đã diễn tả những ý
tưởng trừu tượng và cụ thể từ thủa sơ khai của loài người. Những ví dụ trong
lịch sử như những hình vẽ trong hang động, chữ tượng hình Ai Cập, hình học Hi
Lạp và những phương pháp mang tính cách mạng của những bản vẽ kỹ thuật
dành cho mục tiêu khoa học và công nghệ của Leonardo da Vinci.
Ngày nay, trực quan hóa đã mở rộng ứng dụng trong các ngành khoa học,
đào tạo, công nghệ, môi trường tương tác, dược, .... điển hình của ứng dụng trực
9



quan hóa là sử dụng đồ họa máy tính. Việc phát minh ra đồ họa máy tính có thể
là sự phát triển quan trọng nhất của trực quan hóa kể từ khi phát minh ra cách
phối cảnh trung tâm từ thời kỳ Phục Hưng. Và sự phát triển của animation cũng
giúp gia tăng khả năng của trực quan hóa.
Việc sử dụng trực quan hóa để biểu diễn dữ liệu không phải là hiện tượng
mới. Nó đã được sử dụng trong bản đồ, bản vẽ khoa học, những sơ đồ dữ liệu từ
hàng ngàn năm trước. Đồ họa máy tính ngay từ khi ra đời đã được sử dụng để
nghiên cứu các vấn đề khoa học. Tuy nhiên, trong những ngày đầu sự thiếu năng
lực đồ họa đã hạn chế lợi ích của chúng có thể mang lại.
Tầm quan trọng của trực quan hóa như hiện nay bắt đầu từ năm 1987 khi
xuất bản cuốn “Visualization in Scientific Computing, a special issue of
Computer Graphics”. Từ đó đã có vài hội nghị, hội thảo đã được bảo trợ bởi IEE
Computer Society và ACM SIGGRAPH dành cho những chủ đề thông thường
và những lĩnh vực đặc biết như trực quan hóa khối lượng.
Trực quan hóa khoa học thường được thực hiện bởi những phần mềm
chuyên biệt. Một số phần mềm chuyên biệt đó được phát hành dưới dạng mã mở
và thường là bắt nguồn từ các trường đại học, trong môi trường học thuật thì
việc chia sẻ công cụ phần mềm và cho phép sử dụng mã nguồn mở là bình
thường. Bên cạnh đó, có nhiều phần mềm bản quyền trực quan hóa khoa học
được phát triển và cung cấp. Một ví dụ của trực quan hóa khoa học tại hình 1.4.

Hình 1.4 Trực quan hóa khoa học mô phỏng sự bất ổn định Raleigh-Taylor bởi
sự hòa trộn giữa 2 chất lưu
Trực quan hóa được phân thành nhiều nhánh phát triển, một số loại tiêu
biểu được giới thiệu dưới đây:
+ Trực quan hóa khoa học (Scientific visualization)
+ Trực quan hóa thông tin (Information visualization)
+ Trực quan hóa giáo dục (Educational visualization)
+ Trực quan hóa tri thức (Knowledge visualization)
10



Tài liệu tham khảo
Tiếng Việt
[1]. TS. Trần Vân Anh, ThS. Nguyễn Thị Yên Giang (2011), Bài giảng Hệ
thống thông tin địa lý, Trường Đại học Mỏ Địa chất Hà Nội.
Tiếng Anh
[2]. Tom Barker (2013), Pro Data Visualization using R and JavaScript,
Apress.
[3]. Ben Fry (2008), Visualizing Data, O’Reilly.
[4]. Banafsheh

HajinasabRazlighi

(2011),

Visualization

of

data

from

transportation simulation systems, Master Thesis.
[5]. Noah Iliinsky, Julie Steele (2011), Designing Data Visualizations,
O’Reilly.
[6]. John T.Sample, Elias Ioup (2010), Tile-Based Geospatial Information
Systems, Springes.
[7]. M. Kaufmann, D. Wagner (2001), Drawing Graphs: Methods and Models,

volume 2025 of Lecture Notes in Computer Science, Springer.
[8]. Andy Kirk (2012), Data Visualization: a successful design process, Packt
Publishing.
[9]. Scott Murray (2010), Interactive Data Visualization for the Web, O’Reilly.
[10]. C. Ware (2004), Information Visualization: Perception for Design, Morgen
Kaufman, USA.
[11]. Nick Qi Zhu (2013), Data Visualization with D3.js Cookbook, Packt
Publishing Ltd.
Internet
[12].
[13].


[14].
[15]. />[16]. />[17]. />[18]. />[19]. />[20]. />[21]. />[22]. />[23]. />[24]. />[25]. />[26]. />


×