Tải bản đầy đủ (.pdf) (34 trang)

MÔ HÌNH BIỂU DIỄN TRỰC QUAN DỮ LIỆU KHÔNG GIAN – THỜI GIAN ĐA BIẾN. TÓM TẮT LUẬN ÁN TIẾN SĨ KHOA HỌC MÁY TÍNH

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.92 MB, 34 trang )

ĐẠI HỌC QUỐC GIA TP. HCM
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THƠNG TIN

NGUYỄN THỊ HỒNG
MƠ HÌNH BIỂU DIỄN TRỰC QUAN
DỮ LIỆU KHÔNG GIAN – THỜI GIAN ĐA BIẾN
Chuyên ngành: Khoa Học Máy Tính
Mã số: 62.48.01.01

TĨM TẮT LUẬN ÁN TIẾN SĨ KHOA HỌC MÁY TÍNH

NĂM 2020


Cơng trình được hồn thành tại: Trường Đại học Cơng nghệ Thơng
tin – Đại học Quốc gia TP. Hồ Chí Minh

Người hướng dẫn khoa học: PGS. TS. Trần Vĩnh Phước
Phản biện 1: PGS. TS. Trần Công Hùng
Phản biện 2: PGS. TS. Lê Hoàng Thái
Phản biện độc lập 1:
Phản biện độc lập 2:

Luận án sẽ được bảo vệ trước Hội đồng chấm luận án cấp
Trường tại: Phòng A16, Trường Đại học Công nghệ Thông

tin

ĐHQG-TPHCM, vào lúc … giờ ngày …tháng … năm

2020.



Có thể tìm hiểu luận án tại:
-

Thư viện Quốc gia Việt Nam.

-

Thư viện Trường Đại học Công nghệ Thông tin – ĐHQG –
HCM.

-


Chương 1: GIỚI THIỆU
1.1 TRỰC QUAN HĨA
1.1.1 Trình bày trực quan
Con người có khả năng cảm nhận thơng tin từ hình ảnh tốt hơn nhiều
đối với khả năng cảm nhận thơng tin từ tiếng nói hoặc chữ viết. Thật vậy,
con người chỉ có thể so sánh 2 bảng dữ liệu để rút ra một kết luận bằng
một phương pháp toán học; trong khi đó con người có thể so sánh 2 đồ
thị để rút ra một kết luận bằng cách nhìn – hiểu. Đồ họa có ý nghĩa đặc
biệt nhờ có chức năng lưu trữ nên được sử dụng như một cơng cụ nghiên
cứu.
Đồ họa trình bày hay đồ họa mô tả cũng được nhiều nhà khoa học
khảo sát như là trực quan hóa trình bày, hay trực quan hóa mơ tả, là cách
trình bày, mơ tả bằng kỹ thuật đồ họa. Đồ họa trình bày hay đồ họa mơ tả
sử dụng ngơn ngữ hình vẽ để thể hiện hình dạng, tính chất, ý nghĩa của
nguồn vào. Đồ họa trình bày chú trọng nhiều đến cách hiển thị thân thiện
người dùng, tính mỹ thuật của hình vẽ, và tính chất thu hút sự chú ý của

người dùng vào những nội dung đặc biệt. Đồ họa trình bày được sử dụng
trong lĩnh vực khoa học để mơ tả các thí nghiệm, các hiện tượng tự nhiên,
v.v... còn gọi là trực quan hóa khoa học.
Trực quan hóa sử dụng trong lĩnh vực khoa học được gọi là trực quan
hóa khoa học (scientific visualization). Trực quan hóa khoa học sử dụng
kỹ thuật đồ họa để mô tả các hiện tượng khoa học. Trong nghiên cứu khoa
học, các hình vẽ được dùng để minh họa, giải thích, suy diễn các hiện
tượng khoa học, và để hướng dẫn nghiên cứu (Hình 1.1). Trực quan hóa
khoa học là một phần của quá trình nghiên cứu, những nhà khoa học sử
dụng hình vẽ để mơ tả cụ thể bản chất của những hiện tượng trừu tượng
đang nghiên cứu.

Hình 1.1: Minh họa về trực quan hóa khoa học.

1


1.1.2 Trực quan hóa dữ liệu
Những năm gần đây, do sự bùng nổ nguồn dữ liệu và nhu cầu khai
phá tri thức từ dữ liệu, trực quan hóa dữ liệu đang phát triển theo một tốc
độ rất nhanh như hàm mũ. Những đồ thị trực quan hướng đến hỗ trợ người
dùng phân tích dữ liệu bằng phương pháp nhìn – hiểu. Trực quan hóa dữ
liệu là một tiến trình tạo ra hình ảnh biểu diễn tập dữ liệu, định tính
và/hoặc định lượng, mà người xem có thể trích xuất thơng tin, khai phá
tri thức, hoặc truyền thơng. Do đó, đồ thị trực quan phải dễ đọc đối với
người nhìn và đóng góp tích cực vào việc trích xuất thơng tin, khai phá
tri thức, và truyền thông.
1.1.3 Hệ thống trực quan hóa dữ liệu
Nhằm mục đích hỗ trợ khai phá tri thức từ những tập dữ liệu tĩnh
nhiều biến, luận án này tiếp cận hệ thống trực quan hóa là một hệ thống

kết nối dữ liệu với thông tin và/hoặc tri thức. Hệ thống gồm 2 hợp phần
chính, kỹ thuật trực quan xây dựng trên máy tính và cảm nhận trực quan
của con người (Hình 1.2).
Thơng tin /
Tri thức

Hệ thống trực quan hóa

Kỹ thuật trực quan

Cảm nhận trực quan

13
Người

Máy tính

Hình 1.2: Hệ thống trực quan hóa kết nối dữ liệu với thông tin / tri thức

1.1.4 Thách thức khoa học
Khoa học trực quan hóa kết hợp tri thức sẵn có của con người cùng
với khả năng hỗ trợ của máy tính và kỹ thuật đồ họa là một giải pháp cho
nhu cầu trích xuất thơng tin, khai phá tri thức từ dữ liệu.
1.2 MỤC TIÊU NGHIÊN CỨU
Mục tiêu của luận án là xây dựng khung trực quan hóa và các mơ
hình khối nhiều chiều để biểu diễn trực quan dữ liệu phi không gian nhiều
biến, dữ liệu không gian – thời gian nhiều biến, dữ liệu di chuyển nhiều
biến, và dữ liệu bay nhiều biến đáp ứng tính chất cảm nhận bằng thị giác
của con người.


2


1.3 CÂU HỎI NGHIÊN CỨU
Luận án tiếp cận những đặc điểm của dữ liệu kết hợp với những
nguyên lý cảm nhận bằng thị giác của con người để xây dựng khung trực
quan hóa và các mơ hình khối nhiều chiều biểu diễn dữ liệu nhiều biến để
giải ba câu hỏi nghiên cứu sau:
1. Câu hỏi nghiên cứu 1: Làm thế nào biểu diễn nhiều biến dữ liệu
trên môi trường hiển thị 2D?
2. Câu hỏi nghiên cứu 2: Làm thế nào hiển thị một đồ thị nhiều chiều
có những tính chất trực quan như người dùng mong muốn?
3. Câu hỏi nghiên cứu 3: Làm thế nào khắc phục hạn chế về kích
thước và độ phân giải của mơi trường hiển thị 2D?
1.4 PHƯƠNG PHÁP LUẬN
1.4.1 Phương pháp tổng thể
Luận án áp dụng nguyên lý Gestalt: ‘tổng thể thì nhiều hơn tổng cộng
các thành phần’ để đề xuất phương pháp biểu diễn trực quan dữ liệu nhiều
biến bởi một khối nhiều chiều.
1.4.2 Phương pháp chia-để-trị (divide-and-conquer)
1.4.3 Phương pháp kết hợp
1.4.4 Phương pháp khái quát hóa
1.4.5 Phương pháp hợp tác người-máy
1.4.6 Phương pháp cấu trúc
1.4.7 Phương pháp đồ họa máy tính
1.4.8 Phương pháp hình học
1.4.9 Phương pháp đại số
1.5 BỐ CỤC CỦA LUẬN ÁN
Luận án được cấu trúc thành 5 chương như sau:
- Chương một: giới thiệu tổng quát về luận án.

- Chương hai: trực quan hóa dữ liệu: tiếp cận có tính hệ thống.
- Chương ba: khối nhiều chiều biểu diễn trực quan dữ liệu.
- Chương bốn: khung trực quan hóa.
- Chương năm: tóm tắt những đóng góp khoa học.
3


Chương 2: TRỰC QUAN HÓA DỮ LIỆU: TIẾP CẬN CÓ TÍNH
HỆ THỐNG
(Data Visualization: Systematic Approach)
2.1 TRỰC QUAN HĨA DỮ LIỆU
2.1.1 Khái niệm
Trực quan hóa dữ liệu khơng chỉ hỗ trợ người dùng trích xuất thơng
tin, ý nghĩa dữ liệu, mà cịn hỗ trợ phân tích dữ liệu, khuếch đại tri thức.
Trực quan hóa dữ liệu cịn phối hợp với phương pháp mơ hình trong
phân tích dữ liệu để xây dựng mơ hình tốn hoặc để phát hiện những tri
thức, qui luật mới (Hình 2.1).
Mơ hình tốn
Tri thức
Dữ liệu

Trực quan hóa

Hình 2.1: Trực quan hóa phối hợp với mơ hình tốn

2.1.2 Trực quan hóa dữ liệu khuếch đại tri thức
Tri thức mới

Dữ liệu


Ánh xạ
trực quan

Đồ thị
trực quan

Nhìn-hiểu

Hình 2.2: Trực quan hóa dữ liệu khuếch đại tri thức con người thông qua khả
năng và cách nhìn – hiểu đồ thị trực quan của người dùng

Khai phá tri thức bằng trực quan hóa gồm 2 giai đoạn, kỹ thuật trực
quan ánh xạ dữ liệu thành đồ thị trực quan và cảm nhận trực quan bằng
cách nhìn – hiểu (Hình 2.2).
2.1.3 Trực quan hóa hỗ trợ tri thức của con người
Tiếp cận trực quan hóa hỗ trợ sự hiểu biết của con người về thế
giới thực (Hình 2.3). Nhận thức thế giới thực là một tiến trình trừu tượng
hóa dần từ thế giới thực cụ thể đến tri thức trừu tượng.

4


Thơng
tin

Phân tích
trực quan

Biểu đồ


Trực quan
hóa
Dữ liệu
cấu trúc
Dữ liệu

Kỹ thuật

Sự trừu tượng tăng dần trong tiến trình nhận thức thế giới thực

Tri thức

Con người

Tiến trình nhận thức
thế giới thực với sự
đóng góp của trực
quan hóa

Xử lý dữ liệu
Dữ liệu
thơ

Trực quan hóa làm gia tăng tính trửu tượng trong tiến trình nhận thức thế giới thực

Tiến trình nhận thức
thế giới thực một cách
tự nhiên

Thế giới thực


Hình 2.3: Trực quan hóa hỗ trợ sự hiểu biết của con người về thế giới thực

2.1.4 Nâng cấp nhận thức con người tương ứng với nâng cấp giá trị
dữ liệu
Nâng cấp giá trị của
dữ liệu

Nâng cấp sự hiểu biết
của con người

Qui luật

Khái quát

Khái quát

Tri thức

Hiểu

Phân tích

Nhận biết

Thơng tin
Xử lý

Dữ liệu


Khơng biết

Thu thập

Thế giới thực

Hình 2.4: Tiến trình nâng cấp sự hiểu biết của con người tương ứng với tiến
trình nâng cấp giá trị của dữ liệu

2.1.5 Đặc điểm của trực quan hóa trong khuếch đại tri thức
Trực quan hóa giúp con người hợp tác với máy tính trên cơ sở
những tri thức sẵn có của mỗi người để nhận biết và hiểu biết nhiều hơn,
nhanh hơn về thế giới thực bằng cách biến đổi dữ liệu thành thông tin
mới, tri thức mới.
2.2 NGUYÊN LÝ CẢM THỤ THÔNG TIN BẰNG THỊ GIÁC
2.2.1 Hệ thống cảm thụ trực quan
Con người cảm thụ một thực thể nào đó bằng cách tiếp nhận ánh
5


sáng do chính vật ấy phát ra hoặc ánh sáng do phản chiếu từ nguồn sáng
khác. Những tia sáng này vào mắt được tiếp nhận bởi các tế bào hình
que và tế bào hình nón (Hình 2.5).

Hình 2.5: Hệ cảm thụ trực quan

2.2.2 Nguyên lý Gestalt
Nguyên lý Gestalt được đề xướng trong thập niên 1920 bởi ba nhà
tâm lý học người Đức là Wertheimer, Koffka, và Kohler đã đúc kết
những cơng trình nghiên cứu về những đặc tính cảm nhận bằng thị giác

của con người. Nguyên lý Gestalt còn được gọi là luật thị giác Gestalt
và được phát biểu như sau “Tổng thể thì nhiều hơn tổng cộng của các
hợp phần”.
2.2.3 Nhìn – hiểu
Lý thuyết Gestalt cho rằng con người không thể hiểu biết tổng thể
từ các tri thức từng phần mà chỉ có thể hiểu biết từng phần từ những tri
thức tổng thể, nghĩa là tri thức tổng thể thì nhiều hơn tổng cộng các tri
thức thành phần.
2.3 ÁNH XẠ TRỰC QUAN
Ánh xạ trực quan là tiến trình biến đổi dữ liệu thành những đồ thị
tương thích với tính chất của dữ liệu, biến dữ liệu và quan hệ giữa các
biến dữ liệu.
2.4 TÍNH CHẤT CỦA ĐỒ THỊ TRỰC QUAN
Các nghiên cứu đã xác định những biến trực quan cơ bản gồm một
biến phẳng và sáu biến thị giác mà một người thiết kế khung trực quan
hóa dữ liệu có thể áp dụng cách đánh giá đồ thị trực quan dựa trên những
tính chất phối hợp, chọn lọc, thứ tự, định lượng, tầm giá trị.
2.5 PHÂN TÍCH TRỰC QUAN
Phân tích trực quan là một tiến trình khai thác dữ liệu, trích xuất
thơng tin, phát hiện tri thức bằng cách tương tác với những hình ảnh, đồ
thị biểu diễn trực quan dữ liệu trên máy tính.
Phân tích dữ liệu là một qui trình lặp gồm 5 bước sau:
6


-

Bước 1: hình thành câu hỏi;
Bước 2: lựa chọn phương pháp phân tích;
Bước 3: chuẩn bị dữ liệu để áp dụng phương pháp;

Bước 4: áp dụng phương pháp cho dữ liệu;
Bước 5: giải thích và đánh giá kết quả đạt được.
What

Where

When

Hình 2.6: Tam giác 3W gồm 3 đỉnh What-When-Where

Căn cứ vào mức độ liên quan của câu hỏi với các biến và các giá trị
của biến, Bertin đã chia các câu hỏi phân tích thành 3 mức, mức sơ cấp
(elementary level), mức trung gian (intermediate level), và mức toàn thể
(overall or global level). Trong đó, câu hỏi mức sơ cấp liên quan đến một
giá trị của một biến nào đó, câu hỏi mức trung gian liên quan đến một
nhóm giá trị của một biến nào đó, câu hỏi mức tồn thể liên quan đến tất
cả giá trị của một biến nào đó. Trong khi đó, Andrienko phân loại câu hỏi
phân tích thành 2 mức, câu hỏi sơ cấp (elementary questions) giống định
nghĩa của Bertin và câu hỏi khác (synoptic questions).
Luận án đã tiếp cận cách sử dụng dữ liệu và biến dữ liệu để trả lời
những câu hỏi cho mục tiêu trích xuất thơng tin hoặc tìm kiếm tri thức để
đề xuất cách phân loại câu hỏi phân tích thành 3 nhóm, câu hỏi sơ cấp
(elementary questions), câu hỏi biến thiên (variation questions), và câu
hỏi tương quan (correlation questions).
Câu hỏi sơ cấp được xử lý trên từng giá trị của biến dữ liệu. Với
nguyên lý cho rằng tại mỗi thời điểm, một đối tượng tồn tại tại một vị trí
và chỉ một vị trí, Peuquet đã đề xuất tam giác What-When-Where (Hình
2.6). Tam giác What-When-Where là một tiếp cận quan trọng để đặt ra
và trả lời những câu hỏi sơ cấp.
2.6 TRƯỜNG VÀ ĐỐI TƯỢNG

2.6.1 Khái niệm
Trường địa lý: Trường địa lý, gọi đơn giản là trường, là một ánh xạ
từ tập vị trí khơng gian đến tập giá trị được định nghĩa. Mỗi trường biểu
diễn một biến dữ liệu có một và chỉ một giá trị tại mỗi vị trí khơng gian.
7


Đối tượng địa lý: Đối tượng địa lý, gọi đơn giản là đối tượng, là khái
niệm trừu tượng chỉ một thực thể chiếm một phần không gian trong một
khoảng thời gian và vẫn tồn tại dù vị trí hoặc thuộc tính có thay đổi.
2.6.2 Dữ liệu mơ tả trường và đối tượng
Khoa học máy tính số hóa các trường hiện tượng và các đối tượng
để lưu trữ trong các mô hình dữ liệu khơng gian (Hình 2.7). Trong đó, dữ
liệu của trường hiện tượng hoặc đối tượng được rời rạc hóa theo khơng
gian và thời gian.
Thế giới thực
chứa các
hiện tượng và
thực thể
khơng gian

Mơ hình hóa

Mơ hình
khơng gian
chứa các
trường
khơng gian và
đối tượng
khơng gian


Số hóa

Mơ hình
dữ liệu
khơng gian
theo trường
khơng gian
hoặc đối tượng
khơng gian

Hình 2.7: Khoa học thơng tin địa lý và khoa học máy tính mơ hình hóa và số
hóa thế giới thực như những mơ hình dữ liệu khơng gian

2.7 BIẾN DỮ LIỆU
2.7.1 Dữ liệu
Dữ liệu được sử dụng trong việc làm quyết định sau khi được phân
tích tìm ra những ý nghĩa, những qui luật ẩn chứa bên trong dữ liệu. Đến
nay, có nhiều phương pháp khác nhau để phân tích dữ liệu, trong đó trực
quan hóa là một tiếp cận đang được nhiều nhà khoa học tập trung nghiên
cứu phát triển. Mức độ trừu tượng về ý nghĩa tăng dần từ dữ liệu, đến
thơng tin, rồi tri thức (Hình 2.8).
Tri thức
Phân tích
Thơng tin
Xử lý
Dữ liệu
Thu thập
Thế giới thực


Hình 2.8: Quan hệ Dữ liệu-Thông tin-Tri thức với mức độ trừu tượng tăng dần

2.7.2 Thuộc tính
Dữ liệu thơ được phân chia thành những tập con theo từng tính chất
riêng của đối tượng hoặc trường hiện tượng tự nhiên, gọi là biến dữ liệu,
có định danh là thuộc tính của đối tượng hoặc trường.
8


Bảng 2.1: Bảng phân loại dữ liệu dựa vào thuộc tính
Phép tốn Dữ liệu định
Dữ liệu thứ Dữ liệu khoảng Dữ liệu tỉ lệ
cơ bản danh (Nominal) tự (Ordinal) cách (Inteval)
(Ratio)

2.7.3 Thời gian
2.7.3.1 Khái niệm
Thời gian thay đổi liên tục và tự nhiên, các đơn vị đo thời gian được
các hệ thống lịch tính theo sự chuyển động của mặt trời, hoặc mặt trăng,
hoặc cả mặt trời và mặt trăng.
2.7.3.2 Tính chất
Thời gian có hai đặc tính cơ bản là phân cấp và hạt. Tính chất phân
cấp của thời gian được biểu diễn bởi cây thời gian phân cấp: năm, tháng,
ngày, giờ, phút, giây, …Tính chất hạt của thời gian được hiểu như là sự
chứa đựng của đơn vị đo thời gian mức trên đối với mức dưới: năm chứa
tháng, tháng chứa ngày, ngày chứa giờ, … (Hình 2.9).

Hình 2.9: Tính chất phân cấp và hạt của thời gian

Thời gian cũng có tính chất vừa tuyến tính vừa tuần hồn (Hình 2.10,

Hình 2.11)

Hình 2.11: Tính chất tuyến tính và
tuần hồn của thời gian

Hình 2.10: Tính chất tuyến tính của
năm và tuần hoàn của tháng
9


2.7.3.3 Biến thời gian
Biến thời gian là tập của những thời điểm hoặc tập của những thời
đoạn. Trong đó, một thời điểm là một trừu tượng tốn học vì đó là một
điểm trên trục thời gian, khơng hình dạng, khơng kích thước.
2.7.3.4 Tốn tử thời gian
Quan hệ theo vị trí tương đối giữa các đơn vị thời gian của các tập
khác nhau trên trục thời gian gọi là quan hệ topology. Topology của hai
đơn vị thời gian gồm 7 trường hợp như (Hình 2.12).

Hình 2.12: Topology của hai đơn vị thời gian X và Y

2.7.4 Không gian
Không gian được đề cập ở đây là một không gian vật lý liên tục gồm
vơ số các vị trí trên mặt đất. Trong nhiều khảo sát, một tập không gian
gồm một số hữu hạn các phần tử rời rạc, được ghi nhận và xử lý như
những vị trí rời rạc có khoảng cách. Khơng gian khảo sát là một tập các
vị trí khảo sát được xác định bởi những đa giác (polygones) trên mặt đất,
mỗi đa giác là một phần tử của tập, cịn gọi là đơn vị khơng gian…
2.8 BIẾN TRỰC QUAN
Trong trực quan hóa dữ liệu, biến trực quan là đầu ra của các ánh xạ

biến đổi biến dữ liệu. Các biến trực quan không những chỉ thị các giá trị
của các biến dữ liệu mà còn phải chỉ thị quan hệ giữa các biến dữ liệu.
Biến trực quan chỉ thị các biến dữ liệu gồm biến phẳng và biến thị giác.
2.8.1 Biến phẳng
Biến phẳng là những biến trực quan trình bày giá trị của các biến dữ
liệu trên mặt phẳng để hiển thị dữ liệu như những đồ thị với những dạng
hình học khác nhau.
2.8.2 Biến thị giác
Biến thị giác là những biến trực quan tác động vào tính chất của mắt
người khi cảm nhận hình ảnh để nâng cao khả năng của con người khi
nhìn – hiểu các đồ thị.
10


Bảng 2.2: Các kiểu biến thị giác
Dấu hiệu trực quan của các biến thị giác
2

1

2

4

Text

Biến thị giác
Hình dạng S

3

1

2

5

12.5%
12.5%
20%
12.5%

5%
12.5% 10%
12.5%

Độ lớn Z
Độ sáng B
Ký hiệu L
Màu C
Hướng D

Bảng 2.3: Tính chất của biến trực quan cơ bản
Biến trực quan
cơ bản Vb
Biến vị trí P
Biến hình dạng S

Tính
chọn lọc
?


Tính
phối hợp

Tính
thứ tự

Tính
định lượng

-

-

?

Biến độ lớn Z

?

Biến độ sáng B

-

Biến ký hiệu L
Biến màu C
Biến hướng D

?


?

-

Độ dài
Lý thuyết: vô hạn
Lý thuyết: vô hạn;
Thực tế: hữu hạn.
Lý thuyết: vô hạn;
Thực tế: hữu hạn.
Lý thuyết: vô hạn;
Thực tế: hữu hạn.
Vô hạn
Lý thuyết: vô hạn;
Thực tế: hữu hạn.
Lý thuyết: vô hạn;
Thực tế: hữu hạn.

Bảng 2.4: Tính chất của biến trực quan cơ bản bổ sung
Biến trực quan
cơ bản bổ sung
Biến chuyển động
hướng Md
Biến chuyển động
vận tốc Mv
Biến nhấp nháy
tần số Wf
Biến nhấp nháy
pha Wp


Tính
chọn lọc

Tính
phối hợp
-

Tính
thứ tự
?

Tính định
lượng
-

-

?

-

?

-

-

-

Độ dài

Lý thuyết: hữu
hạn; Thực tế: nhỏ
Lý thuyết: vô hạn;
Thực tế: hữu hạn.
Lý thuyết: vô hạn;
Thực tế: hữu hạn.
Lý thuyết: có hạn;
Thực tế: rất nhỏ.

Chú thích: ( ) phù hợp; ( ?) phù hợp có điều kiện; (-) không phù hợp
11


Chương 3: KHỐI NHIỀU CHIỀU BIỂU DIỄN TRỰC QUAN DỮ
LIỆU
(Multidimensional Cube for Representing Data)
3.1 GIỚI THIỆU
Biểu diễn trực quan dữ liệu bằng những hình ảnh đồ thị để người
dùng nhìn-hiểu những ý nghĩa của dữ liệu. Cách biểu diễn dữ liệu cùng
với tri thức và trải nghiệm của người nhìn-hiểu sẽ trích xuất ra thơng tin
hoặc khai phá những tri thức mới ở những mức giá trị khác nhau.
3.2 NHỮNG THÀNH TỰU KHOA HỌC TRONG BIỂU DIỄN
TRỰC QUAN DỮ LIỆU
3.2.1 Những kiểu biểu diễn trực quan dùng hệ tọa độ phi trực giao
A11

A22

A33


A44

A55

A66

A77

A3

A88
A44

A55

A22

t 11

t33

t 22

A11

A66

A88
A77


Hình 3.2: Biểu đồ sao biểu diễn giá
trị và quan hệ của những biến dữ
liệu tại các thời điểm t1 , t 2 , t3 .

Hình 3.1: Tọa độ song song biểu
diễn những biến dữ liệu.

A22
A33

A11
T

A66

A44
A55

ct
rụ

Hình 3.4: Bánh xe thời gian biểu
diễn những biến dữ liệu.

Tr


Trục
q


uay

Hình 3.3: Biểu đồ sao 3D biểu diễn
8 biến dữ liệu.

Góc quay
Trụ
cg
ốc

Hình 3.5: Tọa độ trụ biểu diễn biến dữ liệu thuộc tính tham chiếu thời gian
12


Trục thời gian

3.2.2 Những kiểu biểu diễn trực quan dùng hệ tọa độ trực giao


Tọa đ

Hình 3.6: Biểu đồ thanh

Vị trí
khơng gian thời gian

ất
mặt đ

Vị trí

khơng gian

Hình 3.7: Khối khơng gian – thời
gian biểu diễn vị trí khơng gian –
thời gian

Hình 3.8: Khối khơng gian – thời gian và khối thời gian nhiều biến được sử
dụng đồng thời để biểu diễn dữ liệu không gian – thời gian nhiều biến

3.3 QUAN HỆ CỦA CÁC BIẾN DỮ LIỆU
3.3.1 Tam giác Đối tượng – Vị trí – Thời gian
Đối tượng

What

Đối tượng thời gian

Where

Thời gian

When

Đối tượng không gian

Đối tượng
không gian - thời gian

Không gian


Hình 3.10: Tam giác OTL Đối
tượng (Objects)– Thời gian
(Times) – Vị trí (Locations)

Hình 3.9: Tam giác quan hệ 3W:
What – Where - When

Từ tam giác 3W của Peuquet (Hình 3.9), Andrienko đã cải biên thành
tam giác OTL Đối tượng –Thời gian–Vị trí để thiết lập các quan hệ giữa
các tập Đối tượng (O) - Thời gian (T) - Vị trí (L) (Hình 3.10).

13


3.3.2 Tứ giác Đối tượng – Thuộc tính – Thời gian – Vị trí
có những

Thuộc tính

Đối tượng

của

Thuộc tính
tham chiếu thời gian

Thuộc tính
tham chiếu khơng gian
Đối tượng thời gian


Đối tượng khơng gian

Đối tượng
khơng gian - thời gian

Vị trí

Thời gian

Hình 3.11: Tứ giác mơ tả quan hệ Đối tượng-Thuộc tính-Thời gian-Vị trí

Tứ giác (Hình 3.11) mơ tả các quan hệ (QH) như sau:
- QH1: Đối tượng – Thuộc tính.
- QH2: Đối tượng – Vị trí.
- QH3: Đối tượng – Thời gian.
- QH4: Thuộc tính – Thời gian.
- QH5: Thuộc tính – Vị trí.
- QH6: Vị trí – Thời gian.
- QH7: Đối tượng– Thời gian – Vị trí.
- QH8: Đối tượng – Thuộc tính – Vị trí.
- QH9: Đối tượng – Thuộc tính – Thời gian.
3.3.3 Ngũ giác Đối tượng – Thuộc tính – Thời gian – Vị trí 2D – Vị
trí 3D
Đối tượng

1

2

Thuộc tính


Thời gian

6

10

7

9

5

Vị trí 2D

8

4

3

Vị trí 3D

Hình 3.12: Ngũ giác Đối tượng–Thuộc tính – Thời gian – Vị trí 2D – Vị trí 3D

Luận án đề xuất chia tách tập vị trí khơng gian thành tập vị trí khơng
gian mặt đất, gọi là tập vị trí 2D, và tập vị trí khơng gian có độ cao, gọi là
14



tập vị trí 3D. Quan hệ này được biểu diễn bởi Ngũ giác OATL23, còn gọi
là Sao OATL23. Và bổ sung thêm các quan hệ như sau:
- QH10: Đối tượng – Thuộc tính – Vị trí 3D.
- QH11: Đối tượng – Thuộc tính – Thời gian – Vị trí 3D.
3.4 KHỐI NHIỀU CHIỀU (Multidimensional Cube)
Khối nhiều chiều được thiết kế để biểu diễn dữ liệu nhiều biến. Luận
án phân ra thành 3 loại khối nhiều chiều sau:
- Khối nhiều chiều phi không gian: Biểu diễn quan hệ của các biến
Đối tượng, Thuộc tính, Thời gian tương ứng các quan hệ QH1,
QH3, QH4, QH9 trong hình 3.12.
- Khối nhiều chiều khơng gian 2D: Biểu diễn quan hệ của các biến
Đối tượng, Thuộc tính, Thời gian, Vị trí 2D tương ứng với các
quan hệ QH2, QH5, QH6, QH7, QH8 trong hình 3.12.
- Khối nhiều chiều không gian 3D: Biểu diễn quan hệ của các biến
Đối tượng, Thuộc tính, Thời gian, Vị trí 3D tương ứng với các
quan hệ QH10, QH11 trong hình 3.12.
3.4.1 Khối nhiều chiều phi không gian (Non-spatial Multidimensional
Cube)
Cấu trúc khối nhiều chiều phi không gian
Khối nhiều chiều phi không gian là một biến thể của hệ tọa độ song
song (Hình 3.13). Các bộ dữ liệu trên bảng được trình bày trên mặt
phẳng C j là mặt phẳng song song với các trục thuộc tính và thẳng góc
với trục biến tham chiếu chung, gọi là mặt quan hệ (Hình 3.14).
(b)

ham
nt
biế

Mặ

t th

cb

uộ

c tí
nh

Ai
am

Cj

Truc biến thuộc tính

n
iế

chiế
u

cb

g

iến
th



Tr

n
chu
ếu
chi

Trục biến thuộc tính
Trụ

Trục thuộc tính

c
Trụ

Trục song song biểu diễn
các thuộc tính

Trục thuộc tính

(a)

am
th

15

u
iế
ch


Hình 3.13: (a) Khối nhiều chiều phi
không gian là một biến thể của tọa độ
song song; (b) Khối nhiều chiều phi
không gian biểu diễn nhiều biến thuộc
tính.

Hình 3.14: Khối nhiều chiều
phi khơng gian hỗ trợ phân tích
quan hệ giữa các biến dữ liệu
trên mặt quan hệ C j .


Trường hợp áp dụng 1: Khối nhiều chiều phi không gian biểu diễn dữ
liệu dịch bệnh
Khối nhiều chiều phi không gian biểu diễn trực quan tập dữ liệu
dịch bệnh tay-chân-miệng của tỉnh Bình Dương (Hình 3.15).

Hình 3.15: Khối nhiều chiều phi khơng gian hỗ trợ phân tích dữ liệu dịch bệnh
tay-chân-miệng tỉnh Bình Dương thời gian 2012-2014

3.4.2 Khối nhiều chiều không gian 2D (2D-Space Multidimensional
Cube)
3.4.2.1 Khối nhiều chiều không gian 2D biểu diễn dữ liệu di
chuyển
Trường hợp áp dụng 2: Bản đồ không gian – thời gian xe buýt
Bản đồ không gian – thời gian xe buýt hỗ trợ người dùng tìm đường
đi bằng xe buýt với những yêu cầu về nơi đi, nơi đến, và thời gian đến.
(Hình 3.17).
Điểm không gian thời gian


T
Quỹ đạo chuyến
Quỹ đạo chuyến
Điểm không gian thời gian

Quỹ đạo tuyến
Trạm
Trạm

Quỹ đạo tuyến
Mặt phẳng mơ hình hóa mặt đất chỉ thị vị trí khơng gian của bản đồ khơng gian – thời gian

Hình 3.17: Bản đồ khơng gian – thời gian xe buýt

Bản đồ không gian – thời gian xe buýt cung cấp cho người dùng
một bản đồ không gian – thời gian của mạng lưới xe buýt và các công
cụ đồ họa để người dùng tự thiết kế lộ trình đi xe buýt cho riêng mình
bằng phương pháp trực quan.
16


Trường hợp áp dụng 3: Bản đồ không gian – thời gian chiến dịch
1812-1813 của Napoleon

Hình 3.19: Khối khơng gian – thời
gian và khối 3D biểu diễn chiến dịch
1812-1813 của Napoleon tiến quân
vào Moscow, thực hiện bởi Kraak
năm 2002.


Hình 3.18: Bản đồ biểu diễn chiến
dịch 1812-1813 của Napoleon, thực
hiện bởi Charles Joseph Minard
năm 1816.

Hình 3.20: Khối nhiều chiều khơng gian 2D biểu diễn chiến dịch của Napoleon
hành quân tiến đến Moscow năm 1812-1813

Luận án này đã sử dụng khối nhiều chiều không gian 2D để biểu
diễn chiến dịch 1812-1813 của Napoleon (Hình 3.20).
Trường hợp áp dụng 4: Hệ thống giám sát trực quan
Luận án cũng đã đề xuất phương pháp giám sát trực quan như là
một trường hợp áp dụng trực quan hóa trong các hệ thống giám sát đối
tượng di chuyển (Hình 3.21).
Mobile Device

Moving Device

SMS Receiver
Telecommunication
Network

GPS and sensors

Database
SMS sender

information


Data
Transceiver

Data
Transceiver

Visualization
Software

control

knowledge
Viewing
Comprehension

Timer

Map
Service

control

SMS Receiver

SMS Sender

Timing

Hình 3.21: Kiến trúc tổng thể hệ thống giám sát trực quan trên thiết bị di động
17



Một trường hợp sử dụng là giám sát xe vận tải hàng hóa. Dữ liệu
di chuyển của xe vận tải hàng hóa gồm các biến vị trí, thời gian, tải
trọng, nhiên liệu.

Hình 3.22: (a) Khối khơng gian
– thời gian biểu diễn tập biến
quan hệ <vị trí, thời gian>; (b,
(c), (d), (e)Các Khối không gian
2D biểu diễn tập biến quan hệ
thuộc tính theo vị trí ; (f) Đồ thị
biểu diễn dữ liệu trọng lượng
của xe khi dừng để bốc dở hàng.

Một trường hợp áp dụng thực được minh họa là hệ thống giám sát
xe vận tải hàng hóa từ Rạch Giá đến thành phố Hồ Chí Minh trực quan
hóa dữ liệu di chuyển theo thời gian thực trên thiết bị di động (Hình
3.23)
Hình 3.23: Đồ thị trực quan trên
thiết bị di động biểu diễn minh họa
hoạt động của một xe vận tải từ Rạch
Giá đến Tp. Hồ Chí Minh

3.4.2.2 Khối nhiều chiều không gian 2D (2D-Space Multidimensional
Cube) sử dụng như Bản đồ nhiều chiều (Multidimensional Map)
Cấu trúc bản đồ nhiều chiều
Bản đồ nhiều chiều là khối nhiều chiều không gian 2D được dùng
để biểu diễn các tập dữ liệu có quan hệ Đối tượng – Thuộc tính – Thời
gian – Vị trí 2D.


18


Trường hợp áp dụng 5: Bản đồ nhiều chiều biểu diễn dữ liệu thời tiết
(a)

Hình 3.24: (a) Vùng ngập nước
rộng lớn được mô tả và khảo sát
theo phân bố trường; (b) Trạm đo
dữ liệu nước ngập được xác định
tại một vị trí khơng gian

(b)

(a)

y

(b)
Vị trí trạm đo

A

C

A

C


B

B
A

B

C

D

E

O

E

D

E

x

0

D

Hình 3.26: (a) Đường đẳng thời của
một thuộc tính thời tiết tại thời điểm ti ;


Giá trị yếu tố thời tiết

ti

t

Hình 3.25: Bản đồ nhiều chiều
biểu diễn dữ liệu thời tiết

(b) Đường đẳng thời được kéo thẳng để
dễ nhận biết phân bố không gian của
thuộc tính thời tiết tại thời điểm ti

Đồ thị biểu diễn dữ liệu trên mặt thuộc tính hỗ trợ chuyên gia khí
tượng giúp chuyên gia hiểu được biến thiên theo thời gian của một thuộc
tính thời tiết tại vị trí trạm đo; từ đây có thể phát hiện tính qui luật theo
thời gian của thuộc tính (Hình 3.26).
Bản đồ nhiều chiều biểu diễn dữ liệu dạng vùng phẳng thay đổi
theo thời gian như những bản đồ chuyên đề được xếp chồng lên bản đồ
nền theo vị trí thời gian trên trục thời gian (Hình 3.27).
Y

X

T

Hình 3.27: Bản đồ nhiều chiều biểu diễn tình trạng ngập nước vùng Tứ giác
Long Xuyên năm 2000 bằng dữ liệu dạng vùng sau khi mô hình hóa từ dữ liệu
ghi được tại các trạm đo


Trường hợp áp dụng 6: Bản đồ nhiều chiều biểu diễn dữ liệu dịch
bệnh
Các khối nhiều chiều phi không gian biểu diễn tình hình dịch bệnh
19


sốt xuất huyết tại các tỉnh An Giang, Sóc Trăng, Tiền Giang được liên
kết với bản đồ khu vực đồng bằng sơng Cửu Long tại các vị trí của tỉnh
tương ứng để tạo thành đồ thị nhiều chiều (Hình 3.28).
Y

X

T

Hình 3.29: Bản đồ nhiều chiều
cho thấy tính chất topology của
thời gian bùng phát dịch bệnh
sốt xuất huyết.

Hình 3.28: Bản đồ nhiều chiều biểu
diễn trực quan dịch bệnh sốt xuất huyết.

y

đầm lầy

đầm lầy

x

Lớp dữ liệu đầm lầy

ti

Hình 3.30: Trong bản đồ nhiều chiều, người dùng có thể tích hợp thêm các lớp
dữ liệu chuyên đề khác.

Các khoảng thời gian bùng phát dịch bệnh của các tỉnh được tham
chiếu về trục thời gian chung (Hình 3.29). Bản đồ chuyên đề đầm lầy
theo thời gian được chồng lớp lên bản đồ nền để chuyên gia có thể liên
quan đến các giả thuyết về tác nhân tạo ra dịch bệnh (Hình 3.30).
3.4.3 Khối nhiều chiều không gian 3D (3D-Space Multidimensional
Cube)
Cấu trúc khối nhiều chiều không gian 3D
Khối nhiều chiều không gian 3D biểu diễn tập dữ liệu có quan hệ
Đối tượng-Thuộc tính-Thời gian-Vị trí 2D-Vị trí 3D (Hình 3.31).
20


Hình 3.31: Cấu trúc khối nhiều chiều khơng gian 3D biểu diễn dữ liệu bay.

Trường hợp áp dụng 7: Khối nhiều chiều không gian 3D
Vật bay ngày nay được sử dụng trong nhiều lĩnh vực như quan sát
tình trạng giao thơng, quan sát tình trạng lũ lụt (Hình 3.32), cứu trợ
những vùng bị thiên tai lũ lụt chia cắt, và được dùng trong quân sự.

Hình 3.32: Vật bay ghi lại hình ảnh lũ lụt

3.5 TĨM TẮT
Luận án đã cấu trúc được khối nhiều chiều phi không gian, khối

nhiều chiều không gian 2D, khối nhiều chiều khơng gian 3D. Các mơ
hình này đã được áp dụng trong 7 trường hợp như:
Khối nhiều chiều phi không gian biểu diễn dữ liệu dịch bệnh
Bản đồ không gian – thời gian xe buýt
Bản đồ không gian – thời gian chiến dịch 1812-1813 của
Napoleon
Hệ thống giám sát trực quan
Bản đồ nhiều chiều biểu diễn dữ liệu thời tiết
Bản đồ nhiều chiều biểu diễn dữ liệu dịch bệnh
Khối nhiều chiều không gian 3D biểu diễn vật bay.

21


Chương 4: KHUNG TRỰC QUAN HÓA
(Visualization Framework)
4.1 GIỚI THIỆU
Hệ thống trực quan hóa dữ liệu nhiều biến ánh xạ tập dữ liệu nhiều
biến thành thông tin và/hoặc tri thức thông qua cảm nhận bằng thị giác
với phương pháp nhìn-hiểu, nhìn đồ thị trực quan hóa dữ liệu để hiểu ý
nghĩa của tập dữ liệu (Hình 4.1).
Thơng tin /
Tri thức

Hệ thống trực quan hóa

Kỹ thuật trực quan

Cảm nhận trực quan


13
Người

Máy tính

Hình 4.1: Hệ thống trực quan hóa biến đổi dữ liệu thành thơng tin /tri thức.

Vì sự hạn chế của mơi trường hiển thị cũng như khả năng cảm nhận
bằng thị giác của con người, chúng tơi đã phân tích thành 3 câu hỏi nghiên
cứu để xây dựng khung trực quan hóa dữ liệu.
4.2 NHỮNG THÀNH TỰU KHOA HỌC LIÊN QUAN
4.2.1 Khung trực quan hóa tham chiếu
Dữ liệu

Nguồn dữ liệu

Dạng trực quan

Bảng dữ liệu

Biến đổi dữ liệu

Trừu tượng hóa
trực quan

Ánh xạ trực quan

Hiển thị

Biến đổi hiển thị


Hình 4.2: Khung trực quan hóa tham chiếu

4.2.2 Khung trực quan hóa tự động điều chỉnh theo chất lượng
Tự động điều chỉnh theo chât lượng

Dữ liệu
nguồn

Biến đổi
dữ liệu

Dữ liệu
biến đổi

Ánh xạ
trực quan

Cấu trúc
trực quan

Biến đổi
hiển thị

Hiển thị

Hình 4.3: Khung trực quan hóa tự động điều chỉnh theo chất lượng

22



4.2.3 Qui trình khai phá trực quan
Dữ liệu

Trực quan hóa

Hình

Đặc tính
kỹ thuật
Dữ liệu

Cảm nhận &
Nhận biết

Tri thức

Điều chỉnh

Trực quan hóa

Người dùng

Hình 4.4: Qui trình khai phá trực quan

4.3 KHUNG TRỰC QUAN HÓA DỮ LIỆU NHIỀU BIẾN
(Framework for Visualizing Multivariate Data)
4.3.1 Giới thiệu
Luận án áp dụng nguyên lý Gestalt “Tổng thể thì nhiều hơn tổng
cộng các hợp phần” để đề xuất khung trực quan hóa biểu diễn tồn bộ dữ

liệu trên một đồ thị trực quan.
4.3.2 Mơ hình khung trực quan hóa dữ liệu nhiều biến
Khung trực quan hóa dữ liệu nhiều biến do luận án đề xuất là hợp
phần kỹ thuật trực quan của hệ thống trực quan hóa. Khung trực quan hóa
gồm 2 tầng với 5 chức năng.
4.4 XỬ LÝ DỮ LIỆU
4.4.1 Xác định biến dữ liệu
Trong khoa học thông tin địa lý GIS, mỗi đối tượng được mô tả bởi
ba phạm trù dữ liệu: Không gian, Thời gian, Thuộc tính.
4.4.2 Xác định tập biến quan hệ
Tập dữ liệu khơng gian – thời gian nhiều biến gồm có một, hai hoặc
ba biến chỉ thị vị trí khơng gian, một biến chỉ thị thời gian, và nhiều biến
chỉ thị thuộc tính.
4.5 BIỂU DIỄN TRỰC QUAN
Chức năng Biểu diễn trực quan (Ánh xạ trực quan) ánh xạ tập dữ
liệu thành một đồ thị nhiều chiều.
4.5.1 Cấu trúc đồ thị quan hệ
Thao tác đầu tiên của chức năng biểu diễn trực quan là cấu trúc đồ
thị quan hệ để biểu diễn các tập biến quan hệ thành những đồ thị quan hệ
trên các hệ trục tọa độ 2D hoặc 3D. Đối với một tập biến quan hệ, mỗi
biến dữ liệu được biểu diễn thành một trục trong hệ tọa độ trực giao 2D
23


×