ĐẠI HỌC QUỐC GIA TP.HCM
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
ĐOÀN THANH VIỆT
NGHIÊN CỨU BIỂU DIỄN TRỰC QUAN DỮ LIỆU HOẠT
ĐỘNG KINH DOANH CỦA DOANH NGHIỆP THEO TÍNH
CHẤT TUYẾN TÍNH VÀ TUẦN HOÀN CỦA THỜI GIAN
LUẬN VĂN THẠC SĨ
NGÀNH : CÔNG NGHỆ THÔNG TIN
Mã số: 60.48.02.01
NGƯỜI HƯỚNG DẪN KHOA HỌC
PGS.TS. TRẦN VĨNH PHƯỚC
TP. HỒ CHÍ MINH – NĂM 2016
LỜI CẢM ƠN
Tôi xin chân thành cảm ơn Bộ môn Khoa Học và Kỹ Thuật Thông Tin - Trường
Đại học Công Nghệ Thông Tin – Đại Học Quốc Gia Thành Phố Hồ Chí Minh, quý
Thầy, Cô đã tận tình giảng dạy, trang bị cho tôi kiến thức và tạo mọi điều kiện thuận
lợi trong suốt quá trình học tập, nghiên cứu và thực hiện luận văn này.
Với lòng kính trọng và biết ơn sâu sắc, tôi xin được bày tỏ lòng biết ơn đến
PGS.TS Trần Vĩnh Phước. Thầy đã khuyến khích, chỉ dẫn tận tình cho tôi trong suốt
thời gian nghiên cứu và thực hiện luận văn.
Xin được gửi lời cảm ơn đến các cá nhân, doanh nghiệp đã giúp đỡ, hợp tác chia
sẻ thông tin, cung cấp cho tôi nguồn tư liệu, tài liệu hữu ích để phục cho quá trình
nghiên cứu và thực hiện luận văn.
Cuối cùng, tôi xin được gửi lời tri ân sâu sắc đến gia đình và những người bạn
thân thiết đã động viên, hỗ trợ trong suốt quá trình học tập, làm việc, nghiên cứu và
thực hiện luận văn.
TP.Hồ Chí Minh, ngày 20 tháng 12 năm 2015
Người thực hiện
Đoàn Thanh Việt
LỜI CAM ĐOAN
Tôi xin cam đoan luận văn này do chính tôi thực hiện dưới sự hướng dẫn khoa
học của PGS.TS. Trần Vĩnh Phước. Các số liệu và kết quả nghiên cứu trong luận văn
là trung thực, do tôi khảo sát, phân tích, đánh giá và thực hiện. Các thông tin trích
dẫn trong luận văn này đều đã được chỉ rõ nguồn gốc.
Tôi xin chịu trách nhiệm về lời cam đoan này.
TP.Hồ Chí Minh, ngày 20 tháng 12 năm 2015
Người thực hiện
Đoàn Thanh Việt
MỤC LỤC
MỤC LỤC
DANH MỤC CÁC BẢNG.......................................................................................... 2
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ ..................................................................... 3
CHƯƠNG 1 - MỞ ĐẦU ............................................................................................. 7
CHƯƠNG 2 - ĐẶC TRƯNG THỜI GIAN TRONG TRỰC QUAN HÓA ............... 9
2.1. Trực quan hóa ............................................................................................9
2.1.1. Giới thiệu trực quan hóa .....................................................................9
2.1.2. Một số kỹ thuật trực quan hóa ............................................................9
2.1.3. Qui trình trực quan hóa.....................................................................18
2.2. Thời gian..................................................................................................20
2.2.1. Thời gian và các đặc trưng ...............................................................20
2.2.2. Các đối tượng liên quan đến thời gian .............................................22
CHƯƠNG 3 - PHƯƠNG PHÁP BIỂU DIỄN TRỰC QUAN TRỤ THỜI GIAN ... 24
3.1. Những câu hỏi đặt ra với dữ liệu kinh doanh từ góc nhìn quản trị .........24
3.2. Phương pháp biểu diễn trực quan Trụ thời gian ......................................28
3.2.1. Trụ thời gian biểu diễn đối tượng thời gian .....................................28
3.2.2. Ứng dụng Trụ thời gian trong phân tích dữ liệu ..............................30
3.3. Biểu diễn trực quan dữ liệu kinh doanh bằng mô hình Trụ thời gian .....33
3.3.1. Phân tích và đánh giá dữ liệu kinh doanh ........................................33
3.3.2. Trụ thời gian biểu diễn dữ liệu kinh doanh ......................................34
3.4. So sánh, đánh giá mô hình Trụ thời gian và một số mô hình hiện tại .....38
CHƯƠNG 4 - TRỤ THỜI GIAN BIỂU DIỄN DỮ LIỆU DOANH NGHIỆP ........ 50
4.1. Mục tiêu ...................................................................................................50
4.2. Các chức năng .........................................................................................50
CHƯƠNG 5 - KẾT LUẬN ....................................................................................... 57
TÀI LIỆU THAM KHẢO ......................................................................................... 57
1
DANH MỤC CÁC BẢNG
DANH MỤC CÁC BẢNG
Bảng 3.1: Dữ liệu báo kết quả kinh doanh - Công ty CP FPF trong 3 năm 2010, 2011,
2012 ........................................................................................................................... 26
Bảng 3.2: Dữ liệu báo kết quả kinh doanh - Công ty CP Trà Lý trong 3 năm 2010,
2011, 2012 ................................................................................................................. 26
Bảng 3.3: Dữ liệu báo kết quả kinh doanh - Công ty TNHH AAA trong 3 năm
2010,2011, 2012 ........................................................................................................ 27
Bảng 3.4: Các chế độ hiển thị trực quan ................................................................... 31
Bảng 3.5: Dữ liệu báo kết quả kinh doanh - Công ty CP FPF trong 3 năm 2010, 2011,
2012 .......................................................................................................................... 33
Bảng 3.6: So sánh các phương pháp biểu diễn trực quan trên cơ sở các câu hỏi đặt
ra ................................................................................................................................ 39
Bảng 3.7: So sánh các phương pháp biểu diễn trực quan dưới góc nhìn tổng quan . 39
Bảng 4.1: Dữ liệu báo kết quả kinh doanh - Công ty CP FPF trong 3 năm 2010, 2011,
2012 được định dạng theo định dạng đầu vào của ứng dụng.................................... 50
2
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
Hình 2.1: Biểu đồ Bar của William Playfair về xuất/nhập khẩu của Scoland đến/từ 17
quốc gia vào năm 1781 ............................................................................................. 10
Hình 2.2: Biểu đồ Line của William Playfair về xuất/nhập khẩu đến/từ Đan Mạch và
Na Uy từ 1700 đến 1780 ........................................................................................... 11
Hình 2.3: Biểu đồ Pie của William Playfair về tỷ lệ của đế quốc Thổ Nhĩ Kỳ nằm ở
châu Á, châu Âu và châu Phi trước năm 1789 .......................................................... 12
Hình 2.4: Biểu đồ Column về tình hình kinh doanh trong quý 1 của các nhân viên
kinh doanh ................................................................................................................. 13
Hình 2.5: Biểu đồ Area của William Playfair về lãi nợ quốc gia của Anh trong thế kỷ
18 ............................................................................................................................... 14
Hình 2.6: Đồ thị biểu diễn trực quan 4 tập dữ liệu Anscombe's quartet ................... 15
Hình 2.7: Hình ảnh biểu diễn trực quan plot 3 chiều Sombrero ............................... 15
Hình 2.8: Bản đồ của Charles Minard về Chiến dịch nước Nga của Napoleon năm
1812 ........................................................................................................................... 16
Hình 2.9: Hình ảnh trực quan thông qua màu sắc của dữ liệu về sao Hỏa của Grumm
và các công sự ........................................................................................................... 16
Hình 2.10: Hình ảnh trực quan 3D của Perozzo biểu diễn các nhóm tuổi của dân số
Thụy Điển giữa thế kỷ 18 và 19 ................................................................................ 17
Hình 2.11: Hình ảnh biểu diễn trực quan dữ liệu 3D MRI đầu người từ kết quả của
nhóm nghiên cứu của GS. M.Griebel ....................................................................... 18
Hình 2.12: Qui trình trực quan hóa dữ liệu ............................................................... 19
Hình 2.13: Đặc trưng phân cấp và dạng hạt của đơn vị đo thời gian (nguồn: Báo cáo
chuyên đề của NCS Nguyễn Thị Hồng, Trường Đại học Công nghệ thông tin) ...... 20
3
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
Hình 2.14: Tháng là tuyến tính vì khoảng thời gian khảo sát từ tháng Một đến tháng
Mười Hai ít hơn chu kỳ 12 tháng (nguồn: Báo cáo chuyên đề của NCS Nguyễn Thị
Hồng, Trường Đại học Công nghệ thông tin) ........................................................... 21
Hình 3.1: Hệ tọa độ trụ .............................................................................................. 29
của đối tượng ok tại mỗi quý trong chu kỳ 4
Hình 3.2: Độ lớn của thuộc tính ܽ.
quý ti.l trên 1 tầng dữ liệu thuộc tính ....................................................................... 30
Hình 3.3: Trong thời gian tuyến tính 2011 trên trục trụ, tầng dữ liệu của những thuộc
tính khác nhau của đối tượng được biểu diễn và độ lớn của các vector cực chỉ ra độ
lớn tương ứng của thuộc tính trong thời gian tuần hoàn quí 1 .................................. 32
Hình 3.4: Độ lớn của thuộc tính a1 của những đối tượng o1, o2, o3, o4 trong thời
gian tuyến tính ti.l = 2011 tại thời gian tuần hoàn ti.c = 1 trên mặt cực của quí 1 ... 32
Hình 3.5: Đặc trưng phân cấp và dạng hạt của đơn vị đo thời gian.......................... 34
Hình 3.6: Thời gian tuyến tính ti.l được gán cho trục trụ ........................................ 35
Hình 3.7: Thời gian tuần hoàn ti.c được gán cho góc kết hợp .................................. 35
Hình 3.8: Thuộc tính am được gán cho độ lớn của vector cực ................................. 35
Hình 3.9: Tầng thuộc tính doanh thu các quí năm 2010 .......................................... 36
Hình 3.10: Tầng thuộc tính chi phí các quí năm 2010 .............................................. 37
Hình 3.11: Tầng thuộc tính lợi nhuận các quí năm 2010 .......................................... 37
Hình 3.12: Hình ảnh biểu diễn trực quan dữ liệu kinh doanh của Công ty FPF ....... 38
Hình 3.13: Biểu đồ Column so sánh doanh thu cùng kỳ giữa các năm .................... 40
Hình 3.14: Biểu đồ Line so sánh doanh thu cùng kỳ giữa các năm .......................... 40
Hình 3.15: Biểu đồ Bar so sánh doanh thu cùng kỳ giữa các năm ........................... 41
Hình 3.16: Biểu đồ “Trụ thời gian” so sánh doanh thu cùng kỳ giữa các năm......... 41
Hình 3.17: Biểu đồ Column so sánh doanh thu giữa các quý - năm 2010................ 42
Hình 3.18: Biểu đồ Line so sánh doanh thu giữa các quý - năm 2010 ..................... 42
Hình 3.19: Biểu đồ Pie so sánh doanh thu giữa các quý - năm 2010 ....................... 43
4
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
Hình 3.20: Biểu đồ Bar so sánh doanh thu giữa các quý - năm 2010 ....................... 43
Hình 3.21: Biểu đồ Area so sánh doanh thu giữa các quý - năm 2010 ..................... 44
Hình 3.22: Biểu đồ “Trụ thời gian” so sánh doanh thu giữa các quý - năm 2010 .... 44
Hình 3.23: Biểu đồ Column so sánh DT-LN-CP quý 1 - năm 2010 ......................... 45
Hình 3.24: Biểu đồ Bar so sánh DT-LN-CP quý 1 - năm 2010 ................................ 45
Hình 3.25: Biểu đồ Area so sánh DT-LN-CP quý 1 - năm 2010............................... 46
Hình 3.26: Biểu đồ “Trụ thời gian” so sánh DT-LN-CP quý 1 - năm 2010 .............. 46
Hình 3.27: Biểu đồ Column so sánh DT-LN-CP quý 1 các năm .............................. 47
Hình 3.28: Biểu đồ Bar so sánh DT-LN-CP quý 1 các năm ..................................... 47
Hình 3.29: Biểu đồ “Trụ thời gian” so sánh DT-LN-CP quý 1 các năm ................... 48
Hình 3.30: Biểu đồ Column so sánh DT quý 2,3,4 trong 1 năm và cùng kỳ các
năm ............................................................................................................................ 48
Hình 3.31: Biểu đồ Bar so sánh DT quý 2,3,4 trong 1 năm và cùng kỳ các năm ..... 49
Hình 3.32: Biểu đồ “Trụ thời gian” so sánh DT quý 2,3,4 trong 1 năm và cùng kỳ các
năm ............................................................................................................................ 49
Hình 4.1: Hình ảnh biểu diễn trực quan dữ liệu kinh doanh của Công ty FPF ......... 50
Hình 4.2: Hình ảnh biểu diễn trực quan dữ liệu kinh doanh của Công ty FPF dưới các
góc nhìn khác nhau.................................................................................................... 51
Hình 4.3: Hình ảnh biểu diễn trực quan dữ liệu kinh doanh của Công ty FPF dưới các
góc nhìn khác nhau.................................................................................................... 51
Hình 4.4: Hình ảnh biểu diễn trực quan dữ liệu kinh doanh của Công ty FPF dưới các
góc nhìn khác nhau.................................................................................................... 52
Hình 4.5: Hình ảnh biểu diễn trực quan dữ liệu kinh doanh của Công ty FPF dưới các
góc nhìn khác nhau.................................................................................................... 52
Hình 4.6: Hình ảnh biểu diễn trực quan dữ liệu kinh doanh của Công ty FPF dưới các
góc nhìn khác nhau ................................................................................................... 53
5
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
Hình 4.7: Hình ảnh biểu diễn trực quan dữ liệu kinh doanh của Công ty FPF dưới các
màu sắc khác nhau .................................................................................................... 53
Hình 4.8: Hình ảnh biểu diễn trực quan dữ liệu kinh doanh của Công ty FPF dưới các
màu sắc khác nhau .................................................................................................... 54
Hình 4.9: Hình ảnh biểu diễn trực quan dữ liệu kinh doanh của Công ty FPF với tùy
biến hiển thị bỏ đường nối các đỉnh đa giác thuộc tính ............................................ 55
Hình 4.10: Hình ảnh biểu diễn trực quan dữ liệu kinh doanh của Công ty FPF với tùy
biến hiển thị chỉ thuộc tính doanh thu và chi phí ...................................................... 55
Hình 4.11: Hình ảnh biểu diễn trực quan dữ liệu kinh doanh của Công ty FPF với tùy
biến hiển thị chỉ thuộc tính doanh thu ....................................................................... 56
6
CHƯƠNG 1 - MỞ ĐẦU
CHƯƠNG 1 - MỞ ĐẦU
Trong lĩnh vực kinh doanh, một doanh nghiệp dù lớn hay nhỏ đều cần theo dõi
tình hình kinh doanh qua doanh số, lợi nhuận, chi phí, sức mua sắm của khách hàng,
…. Những nhà quản trị doanh nghiệp không những cần biết những dữ liệu liên quan
đến kết quả kinh doanh tại một đơn vị thời gian, mà còn muốn biết đến diễn biến tình
hình hoạt động kinh doanh trong một thời gian dài để có thể đánh giá, dự báo cho
thời gian tới nhằm có những quyết định phù hợp cho công việc kinh doanh. Hầu hết
các doanh nghiệp đều sử dụng máy tính để quản lý dữ liệu kinh doanh của doanh
nghiệp mình. Trên cơ sở các dữ liệu đó, khoa học máy tính đã cung cấp nhiều phần
mềm quản lý hỗ trợ đánh giá tình trạng kinh doanh của doanh nghiệp. Các phần mềm
này tính toán, đánh giá tình hình kinh doanh, và thậm chí dự báo dữ liệu kinh doanh
dựa trên diễn biến trong thời gian qua và có thể có thêm vài yếu tố tác động bên ngoài.
Trong thực tế, mỗi nhà quản trị đều có tri thức và trải nghiệm của riêng mình
trong lĩnh vực kinh doanh đang hoạt động. Một yêu cầu rất lớn của các nhà quản trị
là họ phải tự đánh giá tình hình kinh doanh và tự dự báo tình trạng kinh doanh trong
thời gian tới để có những quyết định tốt cho doanh nghiệp. Do đó, bên cạnh những
kết quả do các phần mềm hỗ trợ quản lý tình trạng kinh doanh cung cấp, nhà quản trị
còn muốn máy tính hỗ trợ họ để có thể tự đánh giá, dự báo tình hình kinh doanh với
các trải nghiệm riêng và những thông tin có thể tác động đến hoạt động kinh doanh
như tình hình thiên tai, chiến tranh, hoặc xuất hiện những phát minh mới, v.v..
Trực quan hóa [5] dữ liệu kinh doanh là một giải pháp thích hợp hỗ trợ nhà quản
trị biết được tình trạng kinh doanh tại một đơn vị thời gian, cũng như diễn biến hoạt
động kinh doanh trong một khoảng thời gian. Trên cơ sở những dữ liệu kinh doanh
được hiển thị trực quan như những đồ thị, biểu đồ,… Kết hợp với những thông tin tác
động từ bên ngoài, cùng với kiến thức và trải nghiệm của riêng mình, nhà quản trị sẽ
tự dự báo và có quyết định thích hợp. Dữ liệu được trực quan hóa giúp cho nhà quản
trị ra quyết định, và mỗi nhà quản trị với những thông tin từ bên ngoài khác nhau, với
khả năng và trải nghiệm khác nhau có thể có nhận định tình hình kinh doanh khác
nhau trên cùng một hình vẽ trực quan hóa dữ liệu và có những chính sách khác nhau.
7
CHƯƠNG 1 - MỞ ĐẦU
Ý tưởng chính của đề tài này là đề xuất và áp dụng phương pháp “Trụ thời gian”
để biểu diễn trực quan dữ liệu kinh doanh của doanh nghiệp theo tính chất tuyến tính
và tuần hoàn của thời gian. Đầu tiên, chúng tôi xây dựng bảng câu hỏi thường được
các nhà quản trị doanh nghiệp đặt ra đối với dữ liệu hoạt động kinh doanh. Qua đó,
chúng tôi phân tích, đánh giá, và đề xuất mô hình biểu diễn dữ liệu kinh doanh theo
hướng tiệm cận với những quy luật tự nhiên - tính chất tuyến tính và tuần hoàn của
thời gian. Mô hình biểu diễn trực quan “Trụ thời gian” [19] được đề xuất với mục
tiêu hỗ trợ các nhà quản trị hiểu rõ hơn và tổng quan nhất tình hình hoạt động kinh
doanh của doanh nghiệp theo diễn biến thời gian [1][2][16][18], từ đó có thể rút ra
các quy luật vận động của hoạt động kinh doanh. Kết hợp với tri thức, kinh nghiệm
của mình, nhà quản trị phân tích, đánh giá, dự báo tình hình kinh doanh để có được
những quyết định đúng đắn, kịp thời.
Luận văn được tổ chức thành 5 chương, gồm chương mở đầu, 3 chương chính,
và chương kết luận.
- Chương 1: Mở đầu - Giới thiệu mục tiêu và bố cục luận văn.
- Chương 2: Đặc trưng Thời gian trong Trực quan hóa - Trình bày các khái niệm
liên quan trong luận văn.
- Chương 3: Phương pháp biểu diễn trực quan Trụ thời gian - Trong chương này,
chúng tôi khảo sát, xây dựng bảng câu hỏi đặt ra trong thực tế với dữ liệu kinh doanh
từ các nhà quản trị doanh nghiệp. Đề xuất và áp dụng phương pháp biểu diễn trực
quan Trụ thời gian, phân tích dữ liệu kinh doanh để đánh giá tính khá thi của việc áp
dụng mô hình biểu diễn này. So sánh, đánh giá mô hình Trụ thời gian và một số mô
hình hiện tại.
- Chương 4: Trụ thời gian biểu diễn dữ liệu doanh nghiệp - Phát triển ứng dụng
hiện thực phương pháp Trụ thời gian nhằm biểu diễn trực quan dữ liệu kinh doanh
của doanh nghiệp.
- Chương 5: Kết luận - Tổng kết các kết quả đạt được trong luận văn.
8
CHƯƠNG 2 - ĐẶC TRƯNG THỜI GIAN TRONG TRỰC QUAN HÓA
CHƯƠNG 2 - ĐẶC TRƯNG THỜI GIAN TRONG TRỰC QUAN HÓA
2.1. Trực quan hóa
2.1.1. Giới thiệu trực quan hóa
Trực quan hóa là một khái niệm được sử dụng khá rộng rãi. Vào năm 2007,
Spence [17] đã định nghĩa khái niệm này trong từ điển như sau: Trực quan là hình
ảnh mô hình tinh thần hoặc mô hình hình ảnh của đối tượng. Biểu diễn trực quan có
lịch sử lâu đời trong các sự kiện truyền thông và thông tin liên lạc. Nhưng chỉ khoảng
25 năm trở lại đây, trực quan hóa mới trở thành một lĩnh vực nghiên cứu độc lập và
khép kín. Năm 1987, khái niệm trực quan hóa trong khoa học máy tính được giới
thiệu bởi McCormick [11]. Ông đã định nghĩa khái niệm trực quan hóa như sau: Trực
quan hóa là một phương pháp trong điện toán. Nó chuyển đổi dữ liệu từ dạng ký tự
thành hình học, cho phép nhà nghiên cứu quan sát mô phỏng và tính toán của họ.
Trực quan hóa cung cấp một phương pháp để có thể nhìn thấy những thứ vô hình. Nó
làm phong phú thêm quá trình khám phá khoa học và nuôi dưỡng những hiểu biết sâu
sắc và bất ngờ.
Mục tiêu của lĩnh vực nghiên cứu này là tích hợp khả năng nổi bật của con người
trong nhận thức trực quan và sức mạnh xử lý rất lớn của máy tính để hỗ trợ chúng ta
phân tích, nhận biết và truyền thông với những mô hình, khái niệm, dữ liệu của chúng
ta. Để đạt được mục tiêu này, Theo Schumann và Muller ba tính chất ràng buộc sau
cần phải thỏa mãn [9]: Tính chính xác, tính hiệu quả, tính thích hợp.
- Tính chính xác đề cập đến đòi hỏi của việc biểu diễn chính xác thông tin chứa
đựng trong dữ liệu.
- Tính hiệu quả chủ yếu xem xét mức độ trực quan hóa với khả năng nhận biết
của hệ thống thị giác của con người.
- Tính thích hợp liên quan đến tỉ lệ chi phí truy cập, sử dụng những hỗ trợ của
quá trình trực quan dữ liệu với việc thực hiện một nhiệm vụ cụ thể.
2.1.2. Một số kỹ thuật trực quan hóa
Dưới đây là một số kỹ thuật phổ biến được sử dụng để trực quan hóa dữ liệu:
Biểu đồ ( Charts ): Gồm một số phương pháp bar, line, pie, column, area, …
9
CHƯƠNG 2 - ĐẶC TRƯNG THỜI GIAN TRONG TRỰC QUAN HÓA
- Bar: Sử dụng các thanh hình chữ nhật nằm ngang để trực quan, chiều dài của
thanh tỉ lệ thuận với giá trị dữ liệu mà nó biểu diễn. Hỗ trợ so sánh thông tin nhanh
chóng, nhận biết ngay mức độ cao thấp. Phù hợp hơn để trực quan dữ liệu với nhãn
dài, tập dữ liệu lớn.
Hình 2.2: Biểu đồ Bar của William Playfair về xuất/nhập khẩu của Scoland đến/từ 17 quốc
gia vào năm 1781
- Line: Kết nối các điểm biểu diễn dữ liệu riêng lẻ, kết quả ta có đường gấp khúc
đơn giản, rõ ràng biểu diễn tuần tự các giá trị. Mục đích chính của việc sử dụng nhằm
thể hiện xu hướng theo thời gian.
10
CHƯƠNG 2 - ĐẶC TRƯNG THỜI GIAN TRONG TRỰC QUAN HÓA
Hình 2.2: Biểu đồ Line của William Playfair về xuất/nhập khẩu đến/từ Đan Mạch và Na
Uy từ 1700 đến 1780
- Pie: Là biểu đồ hình tròn, được chia thành từng lát để biểu diễn tỉ lệ. Trong biểu
đồ này, chiều dài của mỗi cung tỉ lệ thuận với giá trị mà nó đại diện.
11
CHƯƠNG 2 - ĐẶC TRƯNG THỜI GIAN TRONG TRỰC QUAN HÓA
Hình 2.3: Biểu đồ Pie của William Playfair về tỷ lệ của đế quốc Thổ Nhĩ Kỳ nằm ở châu Á,
châu Âu và châu Phi trước năm 1789
- Column: Sử dụng các thanh hình chữ nhật theo chiều thẳng đứng để trực quan,
chiều dài của thanh tỉ lệ thuận với giá trị dữ liệu mà nó biểu diễn. Hỗ trợ so sánh
thông tin nhanh chóng, nhận biết ngay mức độ cao thấp. Phù hợp hơn để trực quan
tập dữ liệu có giá trị âm.
12
CHƯƠNG 2 - ĐẶC TRƯNG THỜI GIAN TRONG TRỰC QUAN HÓA
Hình 2.4: Biểu đồ Column về tình hình kinh doanh trong quý 1 của các nhân viên kinh
doanh
- Area: Tương tự như biểu đồ Line nhưng vùng dưới đường và các trục được làm
nổi bật bằng các màu sắc, họa tiết. Sử dụng nhằm thể hiện xu hướng theo thời gian,
so sánh nhiều Area với nhau.
13
CHƯƠNG 2 - ĐẶC TRƯNG THỜI GIAN TRONG TRỰC QUAN HÓA
Hình 2.5: Biểu đồ Area của William Playfair về lãi nợ quốc gia của Anh trong thế kỷ 18
Đồ thị ( Graphs )
14
CHƯƠNG 2 - ĐẶC TRƯNG THỜI GIAN TRONG TRỰC QUAN HÓA
Hình 2.6: Đồ thị biểu diễn trực quan 4 tập dữ liệu Anscombe's quartet
Plots: 1…n chiều
Hình 2.7: Hình ảnh biểu diễn trực quan plot 3 chiều Sombrero
15
CHƯƠNG 2 - ĐẶC TRƯNG THỜI GIAN TRONG TRỰC QUAN HÓA
Bản đồ ( Maps ): Hỗ trợ chúng ta trong việc trực quan hóa các mối quan hệ không
gian trong dữ liệu bằng cách chỉ ra dữ liệu trên bản đồ địa lý.
Hình 2.8: Bản đồ của Charles Minard về Chiến dịch nước Nga của Napoleon năm 1812
Ảnh ( Images ): Sử dụng màu sắc, sắc độ để biểu diễn
Hình 2.9: Hình ảnh trực quan thông qua màu sắc của dữ liệu về sao Hỏa của Grumm và
các công sự
16
CHƯƠNG 2 - ĐẶC TRƯNG THỜI GIAN TRONG TRỰC QUAN HÓA
Mặt 3D
Hình 2.10: Hình ảnh trực quan 3D của Perozzo biểu diễn các nhóm tuổi của dân số Thụy
Điển giữa thế kỷ 18 và 19
17
CHƯƠNG 2 - ĐẶC TRƯNG THỜI GIAN TRONG TRỰC QUAN HÓA
Mặt ISO
Hình 2.11: Hình ảnh biểu diễn trực quan dữ liệu 3D MRI đầu người từ kết quả của nhóm
nghiên cứu của GS. M.Griebel
2.1.3. Qui trình trực quan hóa
Để có thể áp dụng các kỹ thuật trực quan khác nhau trong việc trực quan hóa dữ
liệu, ta thường phải trải qua các bước theo qui trình sau [12]:
18
CHƯƠNG 2 - ĐẶC TRƯNG THỜI GIAN TRONG TRỰC QUAN HÓA
Dữ liệu
Biến đổi số
Phân tích dữ liệu
Biểu diễn đồ họa
Tương tác người dùng
Hình 2.12: Qui trình trực quan hóa dữ liệu
Biến đổi số: Trực quan hóa là một hình thức biến đổi dữ liệu số. Số là một khái
niệm trừu tượng và để biểu diễn chúng như những điểm, đường ta cần phải có sự biến
đổi. Việc biến đổi bao gồm:
- Thay đổi sự phân bố: Việc thay đổi sự phân bố của dữ liệu số để chúng trở nên
phù hợp cho việc phân tích và trực quan dữ liệu. Một vài phương pháp thường được
sử dụng là: Biến đổi tuyến tính, biến đổi lô-ga-rít, biến đổi arcsin, …
- Xác định lại ý nghĩa: Điều chỉnh dữ liệu số để chúng trở nên có ý nghĩa hơn
hoặc nhấn mạnh vào những khái niệm tiêu biểu hơn mà người phân tích quan tâm.
- Tổng hợp lại các ý nghĩa.
Phân tích dữ liệu: Là quá trình áp dụng các phương pháp khác nhau đối với dữ
liệu số để hỗ trợ trong bước biểu diễn. Một số phương pháp phổ biến: thống kê, phân
nhóm dữ liệu, mở rộng qui mô đa chiều (MDS), …
Biểu diễn đồ họa: Bao gồm một số hoạt động chính sau: Ước tính độ lớn, ước
tính tỉ lệ, ước tính xu hướng, độ dốc, phân nhóm …Một số phương pháp thường được
sử dụng: Dùng nhiều góc nhìn để hiển thị những quan hệ ẩn, sử dụng lưới, khóa và
nhãn để hỗ trợ sự nhận biết,…
Tương tác người dùng: Khi hình ảnh đồ họa là kết quả của việc biểu diễn trực
quan được hiển thị đến người dùng, họ có thể chưa thỏa mãn nhu cầu đã đặt ra. Điều
đó đòi hỏi việc biểu diễn trực quan cần hỗ trợ người dùng có thể điều chỉnh, thay đổi
19
CHƯƠNG 2 - ĐẶC TRƯNG THỜI GIAN TRONG TRỰC QUAN HÓA
các bước trước đó của quá trình biểu diễn trực quan. Một số tương tác người dùng
cần được hỗ trợ: Điều chỉnh ánh xạ động, ghi nhãn để có dữ liệu gốc, duyệt dữ liệu
để có nhiều góc nhìn khác nhau, phóng to, thu nhỏ để tập trung vào điểm chính yếu,
…
2.2. Thời gian
2.2.1. Thời gian và các đặc trưng
Thời gian là một khái niệm thuộc về trực giác [6]. Tất cả chúng ta đều có thể
nhận biết được thời gian nhưng không ai có thể nhìn thấy hoặc chạm được nó. Ở góc
độ toán học, thời gian thay đổi liên tục và tự nhiên [7]. Thời gian được nhận biết
thông qua các đơn vị đo thời gian có đặc trưng phân cấp và dạng hạt như năm, tháng,
ngày, giờ, phút và giây. Đặc trưng phân cấp [10] được biểu diễn qua các cấp độ thời
gian năm, tháng, ngày, giờ, phút và giây như hình 2.13. Đặc trưng dạng hạt [8] thể
hiện sự chứa đựng nhau của các đơn vị đo thời gian, năm chứa tháng, tháng chứa
ngày, ngày chứa giờ, giờ chứa phút, phút chứa giây,…
2010
2011
1
2
3
10
11
12
1
2
3
29
30
31
1
2
3
22
23
24
Năm
2012
Tháng
Ngày
Giờ
Hình 2.13: Đặc trưng phân cấp và dạng hạt của đơn vị đo thời gian (nguồn: Báo cáo
chuyên đề của NCS Nguyễn Thị Hồng, Trường Đại học Công nghệ thông tin)
Theo qui ước, những đơn vị đo thời gian được tổ chức thành hai hệ thống theo
những hoạt động nghiên cứu và dữ liệu sẵn có. Đầu tiên là hệ thống thời gian nửa
phân cấp và nửa hạt bao gồm giây, phút, giờ, ngày, tháng và năm. Hệ thống thời gian
thứ hai bao gồm ngày, tuần và năm. Hai hệ thống thời gian này được sử dụng đồng
thời trong nhiều qui luật như lương nhân viên được chi trả hàng tháng, thời khóa biểu
của sinh viên hay thời khóa biểu của nhân viên được lập cho mỗi tuần.
20
CHƯƠNG 2 - ĐẶC TRƯNG THỜI GIAN TRONG TRỰC QUAN HÓA
Đặc trưng tuyến tính và tuần hoàn của thời gian là một cặp phân loại đặc biệt của
thời gian [5], [3], [15]. Thời gian là một nửa tuyến tính và một nửa tuần hoàn. Năm
có tính chất tuyến tính một cách tự nhiên bởi vì nó không bao giờ bị lặp lại. Năm là
một chuỗi tuần tự vô hạn những số nguyên. Tháng, ngày, giờ, phút, giây có tính chất
tuần hoàn một cách tự nhiên. Chúng được chỉ ra bởi một tập những số nguyên có giới
hạn. Đặc trưng tuyến tính và tuần hoàn của thời gian phụ thuộc vào khoảng thời gian
của dữ liệu khảo sát. Trong hệ thống thời gian phân cấp, một cấp bậc thời gian là
tuyến tính khi thời gian khảo sát ít hơn một chu kỳ của nó. Ví dụ, một tập các tháng
được coi như tuyến tính khi khoảng thời gian khảo sát ít hơn 12 tháng. Cấp bậc thời
gian dưới cấp bậc thời gian tuyến tính là tuần hoàn.
Một tập thời gian chứa những yếu tố thời gian trong khoảng thời gian khảo sát.
Những yếu tố của tập thời gian gồm yếu tố tuyến tính và yếu tố tuần hoàn. Ví dụ thời
gian ti ≡ 31/07/2015 là sự kết hợp của thời gian tuyến tính ti.l ≡ 2015 và thời gian tuần
hoàn ti.c ≡ 31/07. Trong khoảng thời gian khảo sát từ tháng Một đến tháng Mười Hai,
thời gian ti ≡ 15/07 là sự kết hợp của thời gian tuyến tính ti.l ≡ 07 và thời gian tuần
hoàn ti.c ≡ 15. Nói cách khác, ta có thể chia một tập thời gian thành hai tập con, tập
thời gian tuyến tính và tập thời gian tuần hoàn, với các phần tử của mỗi tập này lần
lượt là các thời gian tuyến tính và thời gian tuần hoàn. Tập con thời gian tuyến tính
được biểu diễn trên dòng thời gian với khoảng cách bằng nhau giữa các phần tử thời
gian tuyến tính. Tập con thời gian tuần hoàn được biểu diễn như những vòng thời
gian với khoảng cách bằng nhau giữa các phần tử thời gian tuần hoàn. Đường tròn
của vòng thời gian là bằng nhau đối với một khoảng thời gian trên dòng thời gian.
Ngày
Tháng
1
2
10
11
12
Hình 2.14: Tháng là tuyến tính vì khoảng thời gian khảo sát từ tháng Một đến tháng Mười
Hai ít hơn chu kỳ 12 tháng (nguồn: Báo cáo chuyên đề của NCS Nguyễn Thị Hồng, Trường
Đại học Công nghệ thông tin)
Ánh xạ đến hệ thống thời gian thứ bậc, những phần tử của tập thời gian tuyến
tính nằm ở thứ bậc cao nhất trong hệ thống này, những phần tử của tập thời gian tuần
hoàn nằm ở những thứ bậc thấp hơn. Mặc dù thời gian là tuần hoàn, một thời gian
21
CHƯƠNG 2 - ĐẶC TRƯNG THỜI GIAN TRONG TRỰC QUAN HÓA
không bao giờ lặp lại trong khoảng thời gian khảo sát. Đặc trưng tuần hoàn của thời
gian là tự nhiên, thời gian cũng tuần hoàn theo những hoạt động của con người như
chu kỳ hàng tuần [7], [6]
2.2.2. Các đối tượng liên quan đến thời gian
Một đối tượng là một thực thể trừu tượng hoặc một thực thể vật lí. Một đối tượng
được nhận biết thông qua các đặc trưng như định danh, hình dạng, màu sắc, kích
thước, … Dựa trên các tính chất, quan hệ không gian, thời gian [13] của đối tượng,
một đối tượng được phân loại là đối tượng không gian hay đối tượng thời gian hay
đối tượng không gian - thời gian. Một đối tượng không gian là một thực thể tự nhiên
hoặc áp đặt. Nó chiếm giữ một vị trí xác định trong không gian tại thời điểm nó tồn
tại. Một đối tượng thời gian [21], [23] là một sự kiện, hiện tượng xảy ra trong một
khoảng thời gian cụ thể. Một đối tượng không gian - thời gian là một thực thể, sự
kiện, hiện tượng tồn tại tại một vị trí không gian tương ứng với một thời gian xác
định. Đối tượng di chuyển là đối tượng không gian - thời gian với vị trí di chuyển liên
tục trong không gian theo thời gian. Về cơ bản, một đối tượng tồn tại liên tục trong
suốt vòng đời của nó tại một số nơi [9], [20]. Theo đó, hầu hết các đối tượng là đối
tượng di chuyển trong suốt vòng đời của chúng bởi vì vị trí tồn tại thay đổi liên tục
trong không gian. Tuy nhiên, do yêu cầu khảo sát khác nhau, một đối tượng chỉ có
thể được bắt gặp ở một số nơi trong suốt vòng đời của nó, đó là đối tượng không gian
- thời gian (ví dụ: Một tên cướp giật chỉ xuất hiện ở một nơi mà anh ta cướp giật). Do
đó, một đối tượng không gian - thời gian có thể không là một đối tượng di chuyển
nhưng một đối tượng di chuyển chắc chắn là một đối tượng không gian - thời gian.
Một đối tượng chỉ có thể được tìm thấy tại một vị trí trong những thời điểm khác nhau
nhưng không thể tìm thấy tại những vị trí khác nhau trong cùng một thời điểm.
Những thuộc tính chuyên đề chỉ ra những đặc trưng riêng có của từng đối tượng.
Những thuộc tính chuyên đề của một đối tượng bao gồm thuộc tính chuyên đề tĩnh
và thuộc tính chuyên đề động. Giá trị của những thuộc tính chuyên đề tĩnh không thay
đổi trong suốt khoảng thời gian khảo sát. Ngược lại, giá trị của những thuộc tính
chuyên đề động thay đổi theo thời gian và vị trí của đối tượng. Ví dụ: Màu của ôtô
không đổi, nó là thuộc tính chuyên đề tĩnh. Màu của con tắc kè thay đổi tùy theo vị
22