Tải bản đầy đủ (.pdf) (77 trang)

Trực quan hóa trạng thái giao thông hà nội trên nền bản đồ số

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.41 MB, 77 trang )

ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

Nguyễn Văn Thịnh

TRỰC QUAN HOÁ TRẠNG THÁI
GIAO THÔNG HÀ NỘI TRÊN NỀN BẢN ĐỒ SỐ

LUẬN VĂN THẠC SỸ
CHUYÊN NGÀNH KHOA HỌC MÁY TÍNH

THÁI NGUYÊN - 2015


ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

Nguyễn Văn Thịnh

TRỰC QUAN HOÁ TRẠNG THÁI
GIAO THÔNG HÀ NỘI TRÊN NỀN BẢN ĐỒ SỐ
Chuyên ngành: Khoa học máy tính
Mã số: 60 48 0101

LUẬN VĂN THẠC SỸ
CHUYÊN NGÀNH KHOA HỌC MÁY TÍNH
Giáo viên hướng dẫn: TS. Nguyễn Ngọc Hóa

THÁI NGUYÊN - 2015



LỜI CẢM ƠN

Trong quá trình học tập và hoàn thành luận văn tốt nghiệp, tôi đã nhận được rất
nhiều sự giúp đỡ, động viên nhiệt tình từ thầy cô, gia đình và bạn bè. Và đó đã trở
thành một nguồn động lực lớn giúp tôi có thể thực hiện được luận văn nghiên cứu
được giao. Với tất cả sự cảm kích và trân trọng, tôi xin được gửi lời cảm ơn sâu sắc
đến tất cả mọi người.
Tôi xin bày tỏ sự cám ơn đặc biệt tới thầy TS Nguyễn Ngọc Hóa, người đã định
hướng cho tôi trong lựa chọn đề tài luận văn, đưa ra những nhận xét quý giá và trực
tiếp hướng dẫn tôi trong suốt quá trình nghiên cứu và hoàn thành luận văn tốt nghiệp.
Tôi xin cảm ơn các thầy cô trong Trường Đại học Công Nghệ Thông Tin và
truyền thông – Đại học Thái Nguyên đã dạy bảo tận tình cho tôi trong suốt khoảng
thời gian học tập tại trường.
Xin được gửi lời cảm ơn sâu sắc nhất tới gia đình của mình, nguồn động viên
và cổ vũ lớn lao và là động lực giúp tôi thành công trong công việc và trong cuộc
sống.
Cuối cùng, xin cảm ơn tập thể lớp cao học CNTT K12E và đặc biệt những
người bạn tốt đã ở bên tôi, khuyến khích, động viên tôi và cho tôi những lời khuyên
chân thành trong cuộc sống và học tập.
Xin trân trọng cảm ơn!
Thái Nguyên, ngày 25 tháng 08 năm 2015
Học viên

Nguyễn Văn Thịnh

i


LỜI CAM ĐOAN


Tôi xin cam đoan kết quả đạt được trong luận văn là sản phẩm của riêng cá nhân
tôi. Những điều được trình bày trong toàn bộ nội dung của luận văn, hoặc là của cá
nhân hoặc là được tổng hợp từ nhiều nguồn tài liệu. Tất cả các tài liệu tham khảo đều
có xuất xứ rõ ràng và được trích dẫn hợp pháp.
Tôi xin hoàn toàn chịu trách nhiệm theo quy định cho lời cam đoan của mình.

Thái Nguyên, ngày 25 tháng 08 năm 2015
Học viên

Nguyễn Văn Thịnh

ii


MỤC LỤC
LỜI CẢM ƠN..................................................................................................... i
LỜI CAM ĐOAN .............................................................................................. ii
MỤC LỤC ......................................................................................................... ii
DANH MỤC CÁC HÌNH VẼ ............................................................................v
DANH MỤC BẢNG BIỂU .............................................................................. vi
LỜI MỞ ĐẦU ....................................................................................................1
CHƯƠNG 1: KHÁI QUÁT VỀ TRỰC QUAN HOÁ VÀ BÀI TOÁN TRỰC
QUAN HÓA TRẠNG THÁI GIAO THÔNG HÀ NỘI ....................................2
1.1. Khái quát trực quan hóa...........................................................................2
1.1.1. Trực quan hóa ...................................................................................2
1.1.2. Trực quan hóa dữ liệu.......................................................................6
1.1.3. Trực quan hóa dữ liệu biểu diễn trạng thái giao thông ..................18
1.2. Bài toán trực quan Hóa trạng thái giao thông Hà Nội ...........................29
1.2.1. Bối cảnh hệ thống giao thông hiện nay của nước ta ..........................29
1.2.2. Bài toán trực quan hóa trạng thái hóa giao thông Hà Nội trên nền bản

đồ số
........................................................................................................30
1.2.3. Mô hình trực quan hóa trạng thái giao thông .....................................31
1.2.4. Mô hình kiến trúc hệ thống giải pháp trực quan hoá trạng thái giao
thông
........................................................................................................33
CHƯƠNG 2: MỘT SỐ HỖ TRỢ TRỰC QUAN HÓA TRẠNG THÁI GIAO
THÔNG HÀ NỘI TRÊN NỀN BẢN ĐỒ SỐ .................................................34
2.1.Kỹ thuật và thuật toán ứng dụng trực quan hóa trạng thái giao thông ...34
2.1.1. Heatmap trực quan hóa tình trạng trên tuyến đường giao thông .34
2.1.2. Xây dựng biểu đồ thống kê dữ liệu trạng thái giao thông ...........40
2.1.3. D3JS .............................................................................................41

iii


2.1.4. Vẽ đồ họa thực hiện trực quan hóa .................................................43
2.2. Giải pháp trong quá trình triển khai ......................................................46
2.2.1. Kết hợp Leaflet và Heatmap ...........................................................46
2.2.2. Thao tác với dữ liệu dạng GeoJSON ..............................................46
2.2.3. Kết nối cơ sở dữ liệu.......................................................................47
2.2.4. Cập nhật dữ liệu thời gian thực ......................................................47
2.3. Công cụ hỗ trợ trực quan hoá trạng thái giao thông ..............................47
2.3.1. Google Maps...................................................................................47
2.3.2. Google Maps API ...........................................................................47
2.3.3. PostgreSQL/PostGIS ......................................................................48
2.3.4. Apache ............................................................................................50
2.3.5. Leaflet .............................................................................................51
CHƯƠNG 3: THỰC NGHIỆM VÀ ĐÁNH GIÁ HỆ THỐNG TRỰC QUAN
HÓA TRẠNG THÁI GIAO THÔNG HÀ NỘI ................................................52

3.1. Phân tích thiết kế hệ thống ....................................................................52
3.1.1. Kiến trúc hệ thống ..........................................................................52
3.1.2. Chức năng hệ thống ........................................................................53
3.1.3. Lược đồ cơ sở dữ liệu .....................................................................55
3.2. Xây dựng ứng dụng và thử nghiệm .......................................................60
3.2.1. Môi trường ứng dụng ......................................................................60
3.2.2. Dữ liệu thử nghiệm .........................................................................60
3.3. Kết quả thử nghiệm ...............................................................................61
3.4. Đánh giá .................................................................................................65
KẾT LUẬN ......................................................................................................66
TÀI LIỆU THAM KHẢO ................................................................................68

iv


DANH MỤC CÁC HÌNH VẼ
Hình 1.1: Trực quan hóa khoa học mô phỏng sự bất ổn định Raleigh-Taylor bởi
sự hòa trộn giữa 2 chất lưu. .........................................................................................3
Hình 1.2 : Trực quan hóa dữ liệu là một trong các bước trong phân tích và trình
diễn dữ liệu. .................................................................................................................7
Hình 1.3: Mô hình khái niệm của trực quan hóa .............................................10
Hình 1.4: Vai trò của mô hình dữ liệu trong phần mềm trực quan hóa ..........10
Hình 1.5: Sơ đồ mô tả mô hình tham khảo trực quan hóa thông tin ...............11
Hình 1.6: Một trực quan hóa dữ liệu mạng xã hội ...........................................13
Hình 1.7: Bản chất của trực quan hóa dựa vào đánh giá mối quan hệ giữa 3
thành phần. ................................................................................................................15
Hình 2.1: Mô hình trực quan hóa trạng thái giao thông ...................................31
Hình 2.2: Mô hình kiến trúc hệ thống WebGIS ...............................................33
Hình 2.3 : kết quả hiển thị các điểm trên bản đồ ..............................................36
Hình 2.4 : Kết quả vẽ theo phương pháp “đóng hộp” ......................................36

Hình 2.5 : Kết quả vẽ theo phương pháp mật độ nhân .....................................38
Hình 2.6 : Tập các điểm biểu diễn trên tuyến đường .......................................39
Hình 2.7 : Luật vẽ trực giao .............................................................................44
Hình 3.1: Mô hình kiến trúc .............................................................................52
Hình 3.2 : Sơ đồ áp dụng mô hình trực quan hóa.............................................54
Hình 3.3: Lược đồ cơ sở dữ liệu .......................................................................56
Hình 3.4: Màn hình chương trình thử nghiệm .................................................62
Hình 3.5: Biểu đồ tổng hợp trạng thái giao thông theo thời điểm....................63
Hình 3.6: Biểu đồ tổng hợp trạng thái giao thông theo ngày ...........................63
Hình 3.7: Biểu đồ tổng hợp trạng thái giao thông theo tuần ............................64
Hình 3.8: Biểu đồ tổng hợp trạng thái giao thông theo tháng ..........................64
Hình 3.9: Trực quan trạng thái giao thông trên bản đồ theo thời điểm chọn ...65

v


DANH MỤC BẢNG BIỂU
Bảng 3.1: Trường dữ liệu thông tin trạng thái giao thông...............................57
Bảng 3.2: Trường dữ liệu thông tin tuyến đường giao thông..........................58
Bảng 3.3: Trường dữ liệu thống kê trạng thái giao thông theo ngày ...............58
Bảng 3.4: Trường dữ liệu thống kê trạng thái giao thông theo tuần ................59
Bảng 3.5: Trường dữ liệu thống kê trạng thái giao thông theo tháng ..............59
Bảng 3.6: Trường dữ liệu thống kê trạng thái giao thông theo năm ................60

vi


LỜI MỞ ĐẦU
Giao thông là một vấn đề quan trọng, trong đó ùn tắc giao thông vẫn là vấn đề
“nóng” của các đô thị lớn, để giải quyết tình trạng ùn tắc giao thông trên địa bàn Hà

Nội, ngành giao thông cần đẩy mạnh việc ứng dụng CNTT một cách tổng thể. Đó là
các giải pháp thu thập thông tin giao thông; quy hoạch, điều tiết đường sá; điều khiển
giao thông; xác định lưu lượng và cung cấp thông tin giao thông tới người tham gia
giao thông, cảnh báo sớm cho người tham gia giao thông về tình trạng ùn tắc tại các
tuyến phố, để người dân chủ động thay đổi phương tiện, hướng đi trên đường …
Thực trạng đó chính là động lực chính để em chọn đề tài luận văn là “Trực quan
hoá trạng thái giao thông Hà Nội trên nền bản đồ số” để thực hiện luận văn Cao học.
Trong luận văn nghiên cứu mã số 01C-04/08-2014-2 của Sở KH-CN Hà Nội về
“Hệ thống thông tin trạng thái giao thông thành phố Hà Nội: Thực trạng và giải pháp”,
xây dựng thu thập và cung cấp thông tin trạng thái giao thông của một số tuyến phố
chính Hà Nội. Dựa vào những kết quả thu thập được dữ liệu trạng thái giao thông Hà
Nội từ các nguồn khác nhau (từ VOV giao thông, từ cộng đồng, từ các hệ thống
camera giám sát giao thông, …).
Với mục tiêu của cụ thể cần làm là ta hiển thị bản đồ các tuyến đường giao thông
Hà Nội dựa trên nền bản đồ số, trên bản đồ này trực quan hình ảnh giao thông thời
gian thực và hiển thị biểu đồ thống kê các mức độ tắc nghẽn giao thông tại các thời
điểm. Từ đó cho phép người tham gia giao thông, cán bộ quản lý giao thông đô thị,…
có thể quan sát, nắm bắt phân tích được một cách đầy đủ và dễ hình dung, dễ đánh
giá, so sánh trạng thái các điểm nóng giao thông trong thành phố.
Nội dung luận văn được trình bày trong các chương chính sau:
Chương 1 – Khái quát về Trực quan hóa và bài toán trực quan hóa trạng thái
giao thông Hà Nội
Chương 2 - Một số hỗ trợ trực quan hóa trạng thái giao thông Hà Nội trên nền
bản đồ số
Chương 3 - Thực nghiệm và đánh giá hệ thống Trực quan hóa trạng thái giao
thông Hà Nội

1



CHƯƠNG 1: KHÁI QUÁT VỀ TRỰC QUAN HOÁ VÀ BÀI TOÁN
TRỰC QUAN HÓA TRẠNG THÁI GIAO THÔNG HÀ NỘI
1.1. Khái quát trực quan hóa
1.1.1. Trực quan hóa
Trực quan hóa (visualization) là kỹ thuật tạo ra những hình ảnh, biểu đồ để
diễn tả thông điệp. Trực quan hóa nghiên cứu trình bày một cách trực quan, tương tác
khối dữ liệu trừu tượng để tăng cường nhận thức của con người. Trực quan hóa thông
qua những hình tượng trực quan đã diễn tả những ý tưởng trừu tượng và cụ thể từ
thủa sơ khai của loài người. Những ví dụ trong lịch sử như những hình vẽ trong hang
động, chữ tượng hình Ai Cập, hình học Hi Lạp và những phương pháp mang tính
cách mạng của những bản vẽ kỹ thuật dành cho mục tiêu khoa học và công nghệ của
Leonardo da Vinci [4].
Ngày nay, trực quan hóa đã mở rộng ứng dụng trong các ngành khoa học, đào
tạo, công nghệ, môi trường tương tác, dược, .... điển hình của ứng dụng trực quan hóa
là sử dụng đồ họa máy tính. Việc phát minh ra đồ họa máy tính có thể là sự phát triển
quan trọng nhất của trực quan hóa kể từ khi phát minh ra cách phối cảnh trung tâm
từ thời kỳ Phục Hưng. Và sự phát triển của animation cũng giúp gia tăng trực quan
hóa.
Việc sử dụng trực quan hóa để biểu diễn dữ liệu không phải là hiện tượng mới.
Nó đã được sử dụng trong bản đồ, bản vẽ khoa học, những sơ đồ dữ liệu từ hàng ngàn
năm trước. Đồ họa máy tính ngay từ khi ra đời đã được sử dụng để nghiên cứu các
vấn đề khoa học. Tuy nhiên, trong những ngày đầu sự thiếu năng lực đồ họa đã hạn
chế lợi ích của chúng. Tầm quan trọng của trực quan hóa như hiện nay bắt đầu từ năm
1987 khi xuất bản cuốn “Visualization in Scientific Computing, a special issue of
Computer Graphics”. Từ đó đã có vài hội nghị, hội thảo đã được bảo trợ bởi IEE
Computer Society và ACM SIGGRAPH dành cho những chủ đề thông thường và
những lĩnh vực đặc biết như trực quan hóa khối lượng.

2



Hầu hết mọi người thấy gần gũi với những hoạt họa số được sinh ra để biểu diễn
dữ liệu khí tượng trong những bản tin thời tiết trên tivi, qua đó có thể phân biệt giữa
những mô hình thực tế với những ảnh vệ tinh được thể hiện trong chương trình. Trên
TV cũng thường có những trực quan hóa khoa học như thể hiện hoạt động của máy
tính, hay những sự tái hiện hoạt động của phố xá hoặc những tai nạn máy bay, hay là
những hoạt động của tàu vũ trụ. Một dạng động khác của trực quan hóa là những hoạt
họa giáo dục hoặc những biểu diễn theo thời gian có khả năng làm nổi bật sự hiểu
biết về hệ thống biến đổi theo thời gian.
Trực quan hóa khoa học thường được thực hiện bởi những phần mềm chuyên
biệt. Một số phần mềm chuyên biệt đó được phát hành dưới dạng mã mở và thường
là bắt nguồn từ các trường đại học, trong môi trường học thuật thì việc chia sẻ công
cụ phần mềm và cho phép sử dụng mã nguồn là bình thường. Bên cạnh đó, cũng có
nhiều phần mềm bản quyền trực quan hóa khoa học.

Hình 1.1: Trực quan hóa khoa học mô phỏng sự bất ổn định Raleigh-Taylor bởi
sự hòa trộn giữa 2 chất lưu.
 Trực quan hóa khoa học (Scientific visualization)
Trực quan hóa khoa học là sự biến đổi, lựa chọn và biểu diễn dữ liệu từ
thử nghiệm hoặc mô phỏng với cấu trúc hình học tuyệt đối hoặc rõ ràng để cho
phép khảo sát, phân tích và hiểu dữ liệu. Trực quan hóa khoa học quan tâm và
nhấn mạnh sự biểu diễn dữ liệu và sử dụng chủ yếu là kỹ thuật đồ họa và hoạt

3


họa. Phần quan trọng nhất của trực quan hóa khoa học là biểu diễn trực quan
các thí nghiệm và hiện tượng như nó đã xảy ra. Những khu vực truyền thống
của trực quan hóa khoa học là: trực quan hóa dòng chảy, y khoa, thiên văn,
hóa học

 Trực quan hóa thông tin (Information visualization)
Trực quan hóa thông tin tập trung những công cụ máy tính hỗ trợ để
khảo sát lượng lớn dữ liệu trừu tượng. Cụm từ “information visualization” bao
hàm lựa chọn, định dạng và biểu diễn dữ liệu theo dạng dễ hiểu và tham khảo
cho người sử dụng. Điều quan trọng trong trực quan hóa thông tin là cường độ
trực quan và tính tương tác. Những công nghệ mạnh mẽ cho phép người sử
dụng thay đổi trực quan trong thời gian thực tạo ra khả năng tuyệt vời cảm
nhận về nguyên mẫu và mối quan hệ cấu trúc với dữ liệu trừu tượng ban đầu.
 Trực quan hóa giáo dục (Educational visualization)
Trực quan hóa giáo dục ít khi sử dụng bộ giả lập mà thường tạo trước
ở máy tính các hình ảnh về cái gì đó để phục vụ cho giáo dục. Nó rất hữu ích
khi dạy những chủ đề khó như cấu trúc nguyên tử bởi vì nguyên tử quá nhỏ để
nghiên cứu dễ dàng mà không tốn kém và rất khó có điều kiện để sử dụng
những trang bị kỹ thuật cao cấp khi nghiên cứu


Trực quan hóa tri thức (Knowledge visualization)
Là sử dụng biểu diễn trực quan hóa để chuyển đổi tri thức giữa ít nhất

2 người để cải thiện cách thức truyền tri thức bằng cách sử dụng các phương
thức trực quan hóa sử dụng máy tính và không sử dụng máy tính bổ sung nhau.
Một số định dạng trực quan như: trực quan hóa bằng bảng phác thảo, biểu đồ,
hình ảnh, đối tượng, tương tác, các ứng dụng trực quan hóa thông tin và trực
quan hóa ảo.
 Trực quan hóa sản phẩm (Product visualization)
Trực quan hóa sản phẩm bao gồm các công nghệ phần mềm trực quan
để quan sát và vận hành mô hình 3D, bản vẽ kỹ thuật và những tài liệu liên
quan khác của các thành phần sản xuất và khối lượng lớn các sản phẩm. Đó là

4



một phần chủ chốt trong quản lý vòng đời sản phẩm. Phần mềm trực quan hóa
sản phẩm điển hình cung cấp hình ảnh thực cấp độ cao của sản phẩm đó trước
khi sản xuất. Mục đích của chức năng này xuyên suốt từ thiết kế và tạo kiểu
dáng đến bán hàng và tiếp thị. Trực quan hóa sản phẩm là một hướng quan
trọng của quá trình phát triển sản phẩm.
 Truyền thông trực quan (Visual communication)
Truyền thông trực quan là phương pháp truyền những ý tưởng thông
qua hiển thị trực quan thông tin. Căn bản nó liên quan đến ảnh 2 chiều, nó bao
gồm: chữ và số, nghệ thuật, ký hiệu và các tài nguyên điện tử. Nghiên cứu hiện
nay hướng đến thiết kế web và tiện ích hướng đồ họa.
 Phân tích trực quan (Visual analytics)
Phân tích trực quan tập trung vào sự tương tác giữa con người với hệ
thống trực quan hóa như một phần của quá trình phân tích dữ liệu. Phân tích
trực quan được định nghĩa như là “môn khoa học phân tích được hỗ trợ bởi
giao diện tương tác trực quan”.
Trọng tâm của nó là sự trình bày thông tin trong không gian thông tin
lớn và thay đổi liên tục. Nghiên cứu phân tích trực quan tinh lọc những sự vận
hành thực tế và tri giác khiến cho người dùng xác định được những kết quả
định trước và khám phá những kết quả không định trước không không gian
thông tin phức tạp.
Để trình bày dữ liệu một cách hiệu quả, việc trực quan hóa dữ liệu nên:
-

Hiển thị dữ liệu

-

Tạo cho người xem có những suy nghĩ về chất hơn là về các phương pháp

luận, thiết kế đồ họa, công nghệ sản xuất đồ họa hay những thứ khác

-

Tránh bóp méo dữ liệu

-

Trình bày nhiều số trong một không gian nhỏ

-

Làm dữ liệu lớn trở nên mạch lạc

-

Kích thích mắt để so sánh các phần khác nhau của dữ liệu

-

Trình bày dữ liệu chi tiết ở nhiều cấp độ, từ tổng quan đến chi tiết

5


-

Được tích hợp chặt chẽ với các mô tả thống kê và lời nói của một tập dữ
liệu


1.1.2. Trực quan hóa dữ liệu
Trực quan hóa dữ liệu (data visualization hay data visualization) là một phân
nhánh của trực quan hóa với những thống kê được trình bày bằng đồ họa và các thông
tin địa lý hoặc dữ liệu không gian (như những bản đồ chuyên đề) được phân tán trong
các dạng biểu đồ.
Trực quan hóa dữ liệu được quan niệm bởi nhiều ngành lý thuyết tương đương
như một mô hình hiện đại của truyền thông trực quan. Nó không thuộc riêng một lĩnh
vực nào mà là sự giao thoa của nhiều ngành. Một số người quan niệm nó như một
nhánh hiện đại của thống kê mô tả, một số khác coi nó là công cụ phát triển lý thuyết
nền. Nó bao gồm sự sáng tạo và nghiên cứu phương thức trình diễn trực quan dữ liệu.
Mục tiêu chính của trực quan hóa dữ liệu là truyền thông tin rõ ràng và hiệu quả
cho người sử dụng thông qua đồ họa được lựa chọn như bảng biểu hoặc biểu đồ. Một
trực quan hóa hiệu quả giúp cho người dùng đưa ra các phân tích và luận điểm về dữ
liệu và luận cứ. Nó khiến dữ liệu phức tạp trở thành dễ hiểu và dễ sử dụng hơn. Người
sử dụng có thể có những động tác phân tích đặc biệt như tạo phép so sánh, nhân quả
và áp dụng thiết kế đồ họa (để hiển thị so sánh, nhân quả…). Bảng biểu thường được
dùng khi xem xét phép đo lường của một biến và các loại biểu đồ sẽ hiển thị kết quả
hoặc liên hệ với dữ liệu của một hay nhiều biến.
Trực quan hóa dữ liệu có cả tính khoa học và nghệ thuật. Tốc độ dữ liệu sinh ra
ngày càng lớn cùng với sự gia tăng của nền kinh tế phụ thuộc vào thông tin. Dữ liệu
được tạo bởi hoạt động internet và sự tăng khối lượng cảm biến môi trường như dữ
liệu vệ tinh và camera giao thông dẫn đến “Big Data”. Gia công, phân tích và liên kết
dữ liệu hiện có ở nhiều định dạng khác nhau là thách thức lớn cho trực quan hóa dữ
liệu.

6


a) Tổng quan.


Hình 1.2 : Trực quan hóa dữ liệu là một trong các bước trong phân tích và trình
diễn dữ liệu.
Trực quan hóa dữ liệu hướng đến những công nghệ sử dụng để truyền dữ liệu
hoặc thông tin bằng cách chuyển đổi chúng thành các đối tượng trực quan được trình
bày bằng đồ họa. Mục đích chính là làm cho thông tin rõ ràng và hiệu quả khi sử
dụng. Nó là một trong các bước trong phân tích dữ liệu hoặc khoa học dữ liệu. Theo
Friedman (2008) thì “Mục tiêu chính của trực quan hóa dữ liệu để làm thông tin rõ
ràng và hiệu quả thông qua phương tiện đồ họa. Nó không có nghĩa trực quan hóa dữ
liệu cần phải trông thật tẻ nhạt vì mục đích hiệu quả hay là trông thật phức tạp vì mục
đích làm đẹp. Để truyền tải tính hiệu quả thì thẩm mỹ và chức năng phải đi cùng nhau,
cung cấp cái nhìn vào bên trong khối dữ liệu phức tạp và rải rác bằng cách liên kết
các khía cạnh chính của nó bằng cách trực quan hơn. Do đó, người thiết kế thường
thất bại khi cố gắng đạt sự cân bằng giữa hình thức và chức năng, tạo nên sản phẩm
đẹp tuyệt vời nhưng lại không chứa đựng được mục tiêu chính của nó là truyền tải
thông tin”
Bởi vậy, Fernanda Viegas và Martin M. Wattenberg đã đề xuất một ý tưởng trực
quan hóa không chỉ là truyền tải thông tin rõ ràng mà còn khiến cho người xem chú
ý và chờ đợi.

7


Trực quan hóa dữ liệu liên hệ gần với trình bày dữ liệu bằng đồ họa, trực quan
hóa thông tin, trực quan hóa khoa học, phân tích khảo sát dữ liệu và thống kê đồ họa.
Trong thiên niên kỷ mới, trực quan hóa dữ liệu đa trở thành lĩnh vực năng động trong
nghiên cứu, giảng dạy và phát triển. Trực quan hóa dữ liệu đã liên kết trực quan hóa
khoa học và trực quan hóa thông tin.
b) Những đặc điểm hiển thị hiệu quả bằng đồ họa

Sơ đồ Charles Joseph Minard của Napoleon vào tháng Ba năm 1862 - một ví dụ đầu tiên

của một đồ họa thông tin

Người sử dụng của hiển thị dữ liệu thực thi những công tác phân tích cụ thể như
tạo sự so sánh hay xác định nguyên nhân sự việc. Nguyên tắc thiết kế của hiện thị dữ
liệu bằng đồ họa là cân phải hỗ trợ các công tác phân tích đó. Nó tuân theo nguyên
tắc sau: Một thống kê trình bày bằng đồ họa xuất sắc bao gồm rất nhiều ý tưởng phức
tạp để truyền tải một cách đúng đắn, chính xác và hiệu quả. Hiển thị bằng đồ họa cần
phải:
- Hiển thị được dữ liệu
- Hiển thị thực chất dữ liệu hơn là phương pháp, thiết kế đồ hoạc hay công nghệ
xây dựng đồ họa.
- Tránh bóp méo ý nghĩa của dữ liệu
- Hiển thị nhiều chữ số trong không gian nhỏ
- Tạo sự liên kết trong khối dữ liệu lớn
- Khuyến khích thị giác so sánh giữa các phần dữ liệu

8


- Bộc lộ dữ liệu ở một vài cấp chi tiết, từ tổng quan tới cấu trúc tinh
- Phục vụ một mục đích rõ ràng vừa phải: Diễn tả, khảo sát, sắp xếp dữ liệu hoặc
biểu diễn, trang trí.
- Kết hợp chặt chẽ giữa thống kê với diễn tả bằng lời về khối dữ liệu.
1.1.2.1. Kiến trúc và mô hình trực quan hóa dữ liệu
a) Mô hình khái niệm [6,7]
Mặc dụ trực quan hóa đã thay đổi nhanh chóng trong những thế kỷ gần đây,
những công cụ và hệ thống hỗ trợ cho nó được phát triển đặc trưng hơn là được thiết
kế chính thức. Thêm vào đó, có 2 phương hướng trực quan hóa song hành nhau. Thứ
1 là do sự tăng trưởng dữ liệu kèm theo sự giảm giá của thiết bị phần cứng hỗ trợ;
Khi đó trực quan hóa thể hiện ở dạng quan trọng hơn trước kia đặc biệt là trong các

lĩnh vực ứng dụng. Tuy nhiên, công nghệ hỗ trợ thường không áp dụng được cho
nhiều ứng dụng. Xu hướng thứ 2 xuất phát từ sự dư thừa trong dữ liệu. Một cách tiếp
cận không định trước tiêu biểu không định trước được độ lớn và phức tạp của vấn đề.
Thay vì yêu cầu tính toán, sự truy cập dự liệu là trở ngại thông thường. Bước đầu tiên
để phân tích trực quan hóa thành các tập chuyển đổi có thể làm nổi bật những giới
hạn được xác định bằng mô hình khái niệm và phép phân loại phát triển.
- Mô hình dữ liệu: Biểu diễn sự hiển thị dữ liệu
- Mô hình người dùng: biểu diễn yêu cầu mà người dùng cần đáp ứng.
- Mô hình tương tác: Biểu diễn sự tương tác giữa người dùng và hệ thống trực
quan hóa.
- Mô hình tính toán: Biểu diễn công thức tính toán
- Mô hình truyền thông: Biểu diễn sự tương tác giữa các thành phần trong hệ
thống.
- Mô hình hiển thị: Biểu diễn kết quả thực thi các thuật toán biểu diễn dữ liệu.
Mặc dù ý tưởng này đã được đề xuất từ trước đây nhưng cũng có những giới
hạn khi chúng được xem như một tập các lớp. Hình bên trái thể hiện sự tương tác
giữa các lớp của một trực quan hóa điển hình được hiển thị bao gồm các mũi tên có
màu sắc khác nhau. Hình bên phải thể hiện rõ hơn vai trò của mô hình dữ liệu.

9


Hình 1.3: Mô hình khái niệm của trực quan hóa
 Các mô hình dữ liệu
Mô hình dữ liệu là sự biểu diễn của dữ liệu, nó mô tả dữ liệu và cách sử
dụng dữ liệu. Như tại hình 1.4 thể hiện mô hình dữ liệu là lớp biểu diễn
logic và nằm ở giữa lớp biểu diễn vật lý và biểu diễn trực quan

Hình 1.4: Vai trò của mô hình dữ liệu trong phần mềm trực quan hóa
Trong trường hợp đặc biệt, lớp này cung cấp công cụ thông thường cho tất cả

ứng dụng cho định dạng dữ liệu, cung cấp siêu dữ liệu. tạo công thức, thực thi. Lớp
này cung cấp khả năng tính toán, phân tích và công cụ trực quan hóa, cung cấp hạ
tầng để truy cập và biểu diễn dữ liệu. Giống như một hệ thống quản lý dựa trên dữ
liệu, nó sẽ ở bên trên hệ điều hành và cho phép xây dựng các ứng dụng. Từ đó, mô

10


hình dữ liệu sẽ ẩn đằng sau hệ thống tính toán ở bên dưới để mô phỏng, phân tích và
trực quan hóa để người dùng tập trung vào nhận thức dữ liệu thông qua các cơ chế
thông thường để truy cập, sử dụng và trao đổi.
b) Mô hình tham khảo trực quan hóa thông tin
Mô hình tham khảo trực quan hóa thông tin là một kiến trúc phần mềm mẫu phá
vỡ quy trình trực quan hóa thành chuỗi các bước riêng rẽ, từ thu nhận dữ liệu và mô
hình hóa đến mã hóa trực quan dữ liệu thành sự biểu diễn các hiển thị tương tác. Quá
trình này được minh họa ở hình sau.

Hình 1.5: Sơ đồ mô tả mô hình tham khảo trực quan hóa thông tin
Dữ liệu nguồn được ánh xạ đến các bảng dữ liệu phía sau trực quan hóa. Những
bảng dữ liệu phía sau này sau đó được sử dụng để xây dựng trừu tượng trực quan của
dữ liệu, mô hình hóa các tính chất trực quan như vị trí, màu sắc, hình dáng,…Trừu
tượng trực quan này sau đó được dùng để tạo cái nhìn tương tác với dữ liệu, với người
sử dụng sự tương tác có khả năng thay đổi hiệu quả tại tất cả các mức của hệ thống.
- Bước đầu tiên là tập hợp dữ liệu nguồn để tiến hành trực quan. Chúng có thể
là bảng các hình, các đồ họa mạng xã hội, cấu trúc file hoặc bất kỳ tập dữ liệu nào
đó.
- Dữ liệu nguồn này sau đó được dùng để xây dựng các bảng dữ liệu, đó là
những đặc trưng bên trong của dữ liệu khi nó được trực quan. Tiến trình chuyển đổi

11



từ dữ liệu nguồn sang bảng dữ liệu có thể chỉ tập trung vào đọc dữ liệu ở file hoặc cơ
sở dữ liệu nhưng cũng có thể bao gồm cả chuyển đổi dữ liệu.
- Những bảng kết quả (cỏ thể biểu diễn cấu trúc dữ liệu theo hệ thống như biểu
đồ hoặc cây) sau đó được ánh xạ trực quan để tạo ra trừu tượng trực quan là một mô
hình dữ liệu bao gồm các đặc trưng trực quan như các lớp không gian, màu sắc, kích
thước, hình thể. Những trừu tượng trực quan này có nhiệm vụ chứa đầy đủ thong tin
cần thiết để biểu diễn trực quan dữ liệu.
- Hành động biểu diễn dữ liệu trong trừu tượng trực quan được thực hiện thông
qua tiến trình chuyển đổi quang cảnh, trong đó các thành phần biểu diễn sẽ vẽ ra nội
dung của trừu tượng trực quan thành các quang cảnh tương tác. Những quang cảnh
này có thể cung cấp những cách nhìn khác nhau của dữ liệu, ví dụ như cung cấp cách
di chuyển và zoom đến khu vực đặc biệt bằng cách sử dụng chuỗi các hiển thị nhỏ và
phức tạp để hiển thị các hình ảnh nhanh của dữ liệu thay đổi liên tục.
- Người sử dụng tương tác với trực quan hóa (thường thông qua đầu vào là chuột
và bàn phím) có thể phản hồi vào tiến trình này, gây ra sự thay đổi hoặc cập nhật bất
cứ trạng thái nào của trực quan hóa. Ví dụ như kéo một đối tượng, phóng đến một
quang cảnh hoặc mở một file dữ liệu khác.
Mô hình tham khảo trình bày ở trên khá giống với mẫu mô hình hiển thị điều
khiển (model-view-controller) thiết kế để thực thi giao diện người sử dụng.Mẫu này
phân chia thành phần giao diện người sử dụng thành:
- Một mô hình chứa những dữ liệu trả về
- Một hoặc nhiều hướng nhìn thể hiện nội dung của mô hình
- Bộ phận điều khiển cho phép người sử dụng bổ sung, cập nhập mô hình và
hướng nhìn theo đáp ứng.
Mô hình trực quan hóa tham chiếu này mở rộng mẫu thông thường bằng cách thêm
vào các mức. Những bảng dữ liệu chứa những mô hình dữ liệu cơ bản cho rất nhiều
loại trực quan hóa mà mỗi sự trừu tượng trực quan chưa một mô hình trực quan riêng
với hướng nhìn và điều khiển của chính nó.


12


c) Kiến trúc trình bày dữ liệu.

Hình 1.6: Một trực quan hóa dữ liệu mạng xã hội
Kiến trúc trình bày dữ liệu (Data presentation architecture - DPA) là tập các kỹ
năng hướng tới việc xác định, định vị, điều khiển, định dạng và biểu diễn dữ liệu theo
cách tối ưu hóa việc truyền tải ý nghĩa và kiến thức.
DPA được trình bày bởi Kelly Lautt như sau:” DPA là tập kỹ năng then chốt
cho thành công và giá trị của Kinh doanh thông minh (Business Intelligence). DPA
là sự kết hợp của số học, dữ liệu và thống kê để khám phá ra thông tin có giá trị từ dữ
liệu và khiến nó có thể sử dụng được, liên kết và tương tác với các hoạt động trực
quan hóa dữ liệu, truyền thông, tổ chức tâm lý và quản lý thay đổi nhằm cung cấp
giải pháp kinh doanh thông minh với xu hướng dữ liệu, tính toán thời gian phân phối,
định dạng và trực quan hóa sẽ trở thành sự hỗ trợ hiệu quả nhất và là phương thức,
chiến thuật và chiến lược hành xử cho mục tiêu doanh nghiệp hay tổ chức. DPA
không phải là IT hay tập kỹ năng kinh doanh mà nó tồn tại như một lĩnh vực chuyên
môn riêng.
Đối tượng
DPA có 2 đối tượng chính:

13


- Sử dụng dữ liệu để cung cấp kiến thức theo cách hiệu suất nhất có thể: ít nhiễu,
hoàn thiện và dữ liệu không cần thiết hoặc chi tiết được đưa vào nhóm theo sự cần
thiết và vai trò)
- Sử dụng dữ liệu để cung cấp kiến thức theo cách hiệu lực nhất có thể: Cung

cấp dữ liệu phù hợp, kịp thời và hoàn thiện nhất cho người dùng theo cách rõ ràng,
dễ hiểu nhất để truyền đạt những ý nghĩa quan trọng. Nó có thể hoạt động và giúp
cho hiểu biết, hành động và ra quyết định hiệu quả.
Phạm vi
Với những đối tượng ở trên, hoạt động thực tế của PDA bao gồm:
- Tạo cơ chế phân phát hiệu quả cho mỗi nhóm thành viên dựa trên vai trò,
nhiệm vụ, vị trí và truy cập công nghệ.
- Xác định ý nghĩa quan trọng của từng nhóm thành viên cần dựa trên ngữ cảnh.
- Xác định chu kỳ cần thiết để cập nhật dữ liệu
- Xác định chính xác thời gian trình bày dữ liệu
- Tìm được dữ liệu chính xác dữ liệu cần thiết
- Tận dụng phù hợp các phân tích, nhóm, trực quan hóa và các dạng trình diễn
khác.
1.1.2.2. Thiết kế trực quan hóa dữ liệu
Trực quan hóa dữ liệu dẫn đến việc trình bày một cách trực quan dữ liệu được
lựa chọn sẽ bao gồm:
- Thuật toán vẽ (có thể cho phép người dùng điểu chỉnh nhưng thường là được
sinh ra bởi các phương thức của máy tính).
- Dễ dàng sinh ra với dữ liệu khác nhau (cùng định dạng thì có thể sử dụng lại
để biểu diễn những tập dữ liệu khác nhau với tính chất cà số chiều tương tự)
- Thiếu tính thẩm mỹ
- Dữ liệu được làm giàu tương đối
Trực quan hóa dữ liệu ban đầu được thiết kế bởi con người nhưng sau đó được
vẽ theo thuật toán với các phần mềm vẽ đồ họa, đồ thị, sơ đồ. Điểm lợi của phương
pháp này là mối quan hệ để dễ dạng cập nhật hoặc sinh ra trực quan với dữ liệu mới.

14


 Bộ 3 Designer-Reader-Data

Có thể hiểu trực quan hóa dữ liệu được hỗ trợ bởi bộ 3 giống như chiếc
ghế 3 chân gồm người thiết kế, người xem và dữ liệu. Mỗi bộ phận tác động
dựa trên vai trò của mình để tạo nên một trực quan hóa ổn định, hiệu quả.
Mỗi chân của chiếc ghế có mối liên hệ với 2 chiếc còn lại. Khi tính toán,
đánh giá được mức độ quan trọng của các mối quan hệ sẽ dẫn đến xác định
được dạng trực quan hóa cần sử dụng như thể hiện ở Hình dưới

Hình 1.7: Bản chất của trực quan hóa dựa vào đánh giá mối quan hệ giữa 3
thành phần.
Người thiết kế
Người thiết kế biết được mục tiêu cần đạt được của trực quan hóa và tạo ra trực
quan hóa vì những lý do đó. Có ý thức về động cơ, mục đích và sự ưu tiên sẽ giúp
người thiết kế tạo ra trực quan hóa thành công hơn là tạo một sự biểu diễn trực quan
dữ liệu đơn thuần.
Người đọc
Điểm ảnh hưởng thứ 2 là người đọc. Sự mong đợi tiếp thu của người đọc đóng
vai trò đặc biệt trong bộ 3 này, nó có thể là trợ thủ lớn nhất hay trở ngại lớn nhất hoặc
cả 2 trong quá trình thực hiện mục tiêu truyền thông rõ ràng.

15


Dữ liệu
Điểm ảnh hưởng thứ 3 tác động đến thiết kế trực quan hóa là dữ liệu. Trực quan
hóa tốt nhất là thể hiện được đặc điểm thú vị của tập dữ liệu ta làm việc. Dữ liệu khác
nhau yêu cầu những phương thức, cách giải mã, kỹ thuật hiển thị khác nhau để thể
hiện đặc điểm của nó. Trong khi những dạng thức trực quan hóa mặc định chiếm vị
trí đặc biệt và có thể xảy ra với thiết kế đúng được chọn trước, đôi khi dữ liệu lại cung
cấp tri thức mới khi phương thức hoặc dạng thức trực quan hóa khác được sử dụng.
Cách ta chọn dạng thức trực quan hóa thể hiện khía cạnh tốt nhất của dữ liệu là

phải có hiểu biết về dữ liệu, tôn trọng dữ liệu. Thay vì cố gắng chuyển về định dạng
phù hợp thì hãy cân nhắc đến giá trị vốn có, quan hệ và cấu trúc của dữ liệu. Những
câu hỏi điển hình bao gồm:
- Hệ thống là gì? (time-series, hierarchy, …)
- Có bao nhiêu chiều cần thể hiện? Những chiều nào là quan trọng nhất?
- Kiểu liên kết là gì?
- Các biến hoạt động thế nào?
- Giá trị có thể phân đoạn? Liên tục hay không liên tục? Có tuyến tính hay
không? Giới hạn như thế nào?
- Có bao nhiêu phân đoạn cần thể hiện?
Sự hiểu biết về hình dạng của dữ liệu sẽ dẫn đến quyết định thiết kế chính
xác. Mỗi quan hệ liên quan và tính chất của dữ liệu cần được giải mã với một
tính chất trực quan phù hợp; Đặc điểm của mỗi chiều dữ liệu dẫn đến một cách
giải mã tính chất trực quan phù hợp
 Các trạng thái của quá trình
Cần phải làm những trường phù hợp như một phần của tiến trình đơn
lẻ. Người thiết kế đồ họa có thể học kỹ thuật máy tính cần thiết để trực quan
hóa và người thực hiện thống kê có thể liên kết đến dữ liệu hiệu quả hơn do
hiểu được những điểm trực quan chính của dữ liệu bên cạnh dữ liệu được trình
bày.

16


Tiến trình hiểu dữ liệu bắt đầu với tập số liệu và câu hỏi. Các bước sau đây là
thủ tục dẫn đến câu trả lời:
Thu thập
Thu thập dữ liệu từ file ở ổ đĩa hoặc từ nguồn dữ liệu trên mạng.
Phân tích cú pháp
Cung cấp một số cấu trúc để hiểu ý nghĩa dữ liệu và xếp loại.

Lọc
Bỏ những dữ liệu không cần thiết.
Khai phá
Sử dụng các phương thức trong thống kê và khai phá dữ liệu như một cách để
nhận thức mẫu hoặc đặt dữ liệu theo ngữ cảnh chính xác.
Biểu diễn
Chọn một mô hình trực quan cơ sở như đồ thị, danh sách hoặc cây để biểu diễn
dữ liệu.
Cải tiến
Cải tiến sự biểu diễn cơ sở để làm nó rõ ràng và trực quan hơn.
Tương tác
Bổ sung các phương thức để điều chỉnh dữ liệu hoặc điều khiển những đặc điểm,
nội dung cho phép hiển thị.
Tất nhiên những bước trên không bắt buộc phải theo một cách cứng nhắc. Trong
quá trình thực hiện có thể bỏ qua một số bước tùy theo tính chất, độ phức tạp của dữ
liệu hoặc yêu cầu trực quan hóa.
Một phần của vấn đề với phương thức đơn lẻ để xử lý dữ liệu là các trường riêng
rẽ dẫn đến cần những người khác nhau để xử lý. Khi nó xảy ra, sẽ có phần nào đó bị
mất trong quá trình chuyển đổi.
1.1.2.3. Trực quan hóa dữ liệu theo địa lý
Trực quan hóa theo địa lý (Geovisualization) hướng đến một tập hợp các công
cụ và kỹ thuật hỗ trợ phân tích dữ liệu theo địa lý thông qua sử dụng trực quan hóa
tương tác. Như là sự liên kết giữa trực quan hóa khoa học và trực quan hóa thông tin,

17


×