Tải bản đầy đủ (.docx) (107 trang)

ĐỒ ÁN TÌM HIỂU TABLEAU DATA VISUALIZATION THỰC NGHIỆM MINH HỌA (Full đồ án)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (6.59 MB, 107 trang )

TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP THỰC PHẦM TP.HCM
KHOA CÔNG NGHỆ THƠNG TIN



BÁO CÁO ĐỒ ÁN
TÌM HIỂU TABLEAU DATA VISUALIZATION
THỰC NGHIỆM MINH HỌA

Giáo viên hướng dẫn: Nguyễn Thị Bích Ngân
Sinh viên thực hiện:
1. 2033180166- Hồ Văn Trung
2. 2033180161- Bùi Trung Hiếu

TP.HỒ CHÍ MINH, Tháng 6/2021

LỜI CẢM ƠN


Đồ án môn học

Trường ĐH CNTP TP.HCM

Để đồ án này được đạt kết quả tốt như hiện nay em đã nhận được rất nhiều sự hỗ trợ
và hướng dẫn của cơ Nguyễn Thị Bích Ngân. Xuất phát từ sự chân thành, em xin bày tỏ sự
biết hơn sâu sắc nhất đến cơ
Bên cạnh đó, em cũng xin gửi lời cảm ơn các thầy cô giáo và nhà trường đã tạo điều
kiện tốt nhất để em có được mơi trường học tập tốt nhất.
Em xin kính chúc q thầy, q cơ, q nhà trường ln ln mạnh khỏe. Kính chúc
cho chặng đường lái đị của q thầy cơ được thuận buồm xi gió!
Em xin chân thành cảm ơn!


Ngày…Tháng….Năm……
Sinh viên thực hiện

Trang 2


Đồ án môn học

Trường ĐH CNTP TP.HCM

MỤC LỤC
Chương 1

GIỚI THIỆU CÁC DẠNG DỮ LIỆU VÀ TRỰC QUAN HĨA DỮ LIỆU12

1.1

Tìm hiểu về hệ cơ sở dữ liệu (database).........................................................12

1.2

Các dạng database..........................................................................................13

1.3

Cấu trúc dữ liệu..............................................................................................13

1.3.1

Khái niệm:...............................................................................................13


1.3.2

Vai trị của cấu trúc dữ liệu......................................................................13

1.4

Tìm hiều khái niệm data visualization............................................................14

1.4.1

Khái niệm................................................................................................14

1.4.2

Ưu điểm về data visualization..................................................................14

1.4.3

Một số lĩnh vực yêu cầu về data visualization.........................................14

Chương 2

GIỚI THIỆU CÔNG CỤ DATA VISUALIZATION TABLEU...............15

2.1

Nền tảng Tableau đối với phân tích dữ liệu....................................................15

2.2


Lịch sử hình thành Tableau.............................................................................15

2.3

Lợi ích của Tableau........................................................................................15

2.4

Sản phẩm của Tableau....................................................................................16

2.5

Ứng dụng của Tableau....................................................................................17

2.6

Kiến trúc tableau............................................................................................17

2.6.1

Nguồn dữ liệu..........................................................................................18

2.6.2

Tableau Server and Desktop....................................................................18

2.6.3

Clients......................................................................................................18


2.7

Data layer.......................................................................................................19

2.8

Data Connectors.............................................................................................19

2.9

Live Connections............................................................................................19

2.10

In-memory..................................................................................................20

2.11

Install Tableau Desktop...............................................................................20

2.11.1

Yêu cầu hệ thống cho Tableau..............................................................20

2.11.2

Dowload và cài đặt Tableau Desktop....................................................21

2.11.3


Đăng ký và kích hoạt Tableau Desktop................................................21

2.12

Kết nối Tableau với cơ sở dữ liệu đa nguồn................................................21

2.12.1

Thiết lập kết nối dữ liệu........................................................................21

2.12.2

Liên kết bảng dữ liệu............................................................................25
Trang 3


Đồ án môn học

Trường ĐH CNTP TP.HCM

2.12.3

Kết nối dữ liệu ở chế độ Live hoặc Extract..........................................25

2.12.4

Chỉnh sửa dữ liệu của mơ hình.............................................................26

2.12.5


Kiểu dữ liệu..........................................................................................27

2.12.6

Workbooks and Sheets..........................................................................28

2.13

Data scource pane.......................................................................................28

2.14

The Tableau Workspace..............................................................................29

2.15

The Data Pane.............................................................................................31

2.15.1

Trực quan hóa với các measure............................................................32

2.15.2

Trực quan hóa với các dimesion...........................................................32

2.15.3

Làm việc với khung Mark....................................................................33


2.15.4

Lưu workbook......................................................................................34

2.16

Trực quan hóa với các dạng biểu đồ............................................................35

2.16.1

Các dạng biểu đồ..................................................................................35

2.16.2

Show me menu.....................................................................................41

2.17

Filter và Hierarchies....................................................................................41

2.17.1

Lọc dimesions......................................................................................42

2.17.2

Lọc theo measures................................................................................44

2.17.3


Quick filters..........................................................................................45

2.17.4

Data source filter..................................................................................46

2.17.5

Hierarchies...........................................................................................47

2.18

Các hàm tổng hợp, calculated field và parameter........................................47

2.18.1

Các hàm tổng hợp.................................................................................47

2.18.2

Calculated Field....................................................................................49

2.18.3

Trường dữ liệu ngày tháng...................................................................51

2.18.4

Các hàm tính ngày tháng......................................................................52


2.18.5

Parameter..............................................................................................53

2.19

Bảng tính tốn và mức độ chi tiết (LOD)....................................................56

2.19.1

Các loại tính tốn..................................................................................56

2.19.2

Mở bảng tính nhanh..............................................................................57

2.19.3

Mức độ thể hiện chi tiết........................................................................59

2.19.4

Mức trung bình trong một khu vực.......................................................60

2.20

Tương tác Dashboard..................................................................................61

2.20.1


Create Dashboard.................................................................................61
Trang 4


Đồ án môn học

Trường ĐH CNTP TP.HCM

2.20.2

The Dashboard Pane.............................................................................62

2.20.3

Xây dựng bản đồ trên Dashboard.........................................................63

2.20.4

Tiêu đề Dashboard................................................................................64

2.20.5

Dashboard Actions...............................................................................64

2.21

TabPy-Python kết hợp Tableau....................................................................67

2.21.1


TabPy....................................................................................................67

2.21.2

Cài đặt TabPy.......................................................................................67

2.21.3

Kết nối Tableau vào TabPy...................................................................69

2.21.4

Sử dụng TabPy.....................................................................................70

Chương 3
3.1

ỨNG DỤNG TABLEAU TRỰC QUAN HÓA DỮ LIỆU.......................74

Thực nghiệm truy vấn trên dữ liệu SQL Server..............................................74

3.1.1

Mô tả dữ liệu liên kết bảng MOVIES......................................................74

3.1.2

Một số thống kê trực quan hóa dữ liệu trên bộ dữ liêu Movies................76


3.2

Thực nghiệm trên dataset dạng big data.........................................................85

3.2.1

Mô tả dữ liệu Olympic.............................................................................85

3.2.2

Trực quan hóa dữ liệu..............................................................................86

Chương 4

Kết luận...................................................................................................95

Trang 5


Đồ án môn học

Trường ĐH CNTP TP.HCM

DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT
Viết tắt
DBMS

Tiếng anh
Database Management


Tiếng việt
Hệ quản trị cơ sở dữ liệu

DDL

System
Data

Ngôn ngữ định nghĩa dữ

DML

Definition Language
Data

liệu
Ngôn ngữ thao tác dữ liệu

SQL

Manipulation Language
Structured

Ngôn ngữ truy vấn dữ

DCL

Query Language
Data Control


liệu
Ngôn ngữ quản lý dữ liệu

BI
MS

Language
Business Intelligence
Microsoft

Kinh doanh thông minh
Hệ điều hành Microsoft

Trang 6


Đồ án mơn học

Trường ĐH CNTP TP.HCM

DANH MỤC CÁC HÌNH VẼ VÀ ĐỒ THỊ
Hình 1.1Hệ quản trị cơ sở dữ liệu................................................................................12
Hình 2.1Mối quan hệ giữa Tableau Desktop và Taleau Server....................................17
Hình 2.2 Cấu trúc Tableau (Sc.Https://Tableau.Com)..................................................19
Hình 2.3 Giao diện sau khi bật Tableau.......................................................................22
Hình 2.4 Kết nối Excel với Tabeau..............................................................................22
Hình 2.5Mở file text trong Tableau..............................................................................23
Hình 2.6 Nguồn máy chủ khi làm việc với Tableau.....................................................23
Hình 2.7Đăng nhập vào SQL Server............................................................................24
Hình 2.8 Đăng nhập vào MySQl..................................................................................24

Hình 2.9 Nối 2 bảng movie và movie_cast..................................................................25
Hình 2.10 Chế độ Live và Extract................................................................................26
Hình 2.11 Bảng chỉnh sửa nguồn dữ liệu.....................................................................26
Hình 2.12 Kiểu dữ liệu trong Tableau..........................................................................28
Hình 2.13 Data scoure pane.........................................................................................29
Hình 2.14 Tableau workspace......................................................................................30
Hình 2.15Dữ liệu Measure Sales.................................................................................32
Hình 2.16 Dữ liệu Dimesion Customer Name.............................................................33
Hình 2.17 Giao diện mark............................................................................................33
Hình 2.18 Dữ liệu sau khi làm việc với Mark..............................................................34
Hình 2.19 Biểu đồ Bar Chart về Doanh thu.................................................................36
Hình 2.20 Biểu đồ Line Chart......................................................................................37
Hình 2.21 Biểu đồ heat map về Doanh thu trong Dữ liệu SuperStore..........................40
Hình 2.22 Biểu đồ Bullet.............................................................................................41
Hình 2.23 Lọc các giá trị cần lấy trong “City Name”..................................................42
Hình 2.24 Lọc các giá trị trong City Name bắt đầu bằng chữ C..................................43
Hình 2.25 Lọc bằng field (trái) và lọc bằng câu lệnh (phải) của mục ID City..............43
Hình 2.26 Giao diện lọc giới hạn.................................................................................44
Hình 2.27Các tính tốn cho measure...........................................................................44
Hình 2.28 Lọc Measures cơ bản..................................................................................45
Hình 2.29 Giao diện lọc nhanh....................................................................................46
Hình 2.30 Giao diện add filter dữ liệu nguồn...............................................................46
Hình 2.31 Tạo hệ thống phân cấp Category và Sub-Category.....................................47
Hình 2.32 Các lựa chọn kiểu tính tốn của measure....................................................48
Hình 2.33 Tạo Calculated Field...................................................................................50
Hình 2.34 Giao diện nhập lệnh vào Calculated Field...................................................50
Hình 2.35Sử dụng Calculated Field để tính tốn.........................................................51
Hình 2.36 Tạo Parameter.............................................................................................53
Hình 2.37 Điều chỉnh Parameter..................................................................................54
Hình 2.38 Bật tắt Parameter.........................................................................................54

Hình 2.39 Kết hợp Parameter vào Calculated Field.....................................................55
Hình 2.40 Bảng điều khiển Parameter.........................................................................55
Hình 2.41 Thiết lập bảng tính nhanh............................................................................57
Trang 7


Đồ án mơn học

Trường ĐH CNTP TP.HCM

Hình 2.42 Điều chỉnh bảng tính...................................................................................58
Hình 2.43 Các lựa chọn điều chỉnh bảng tính..............................................................59
Hình 2.44 Fixed keyword............................................................................................60
Hình 2.45 Sử dụng Fixed keyword..............................................................................60
Hình 2.46 Include keyword..........................................................................................61
Hình 2.47 Sử dụng Include keyword...........................................................................61
Hình 2.48 Giao diện Dashboard...................................................................................62
Hình 2.49 Dashboard Pane..........................................................................................62
Hình 2.50 Khung Objects............................................................................................63
Hình 2.51Add các Sheet vào Dashboard......................................................................64
Hình 2.52 Đặt tiêu đề dashboard..................................................................................64
Hình 2.53 Bộ lọc của dashboard..................................................................................65
Hình 2.54 Chọn Actions trên thanh Menu....................................................................66
Hình 2.55 Giao diện Actions........................................................................................66
Hình 2.56 Thêm Giao diện Wed vào dasboard.............................................................67
Hình 2.57 Cài đặt TabPy..............................................................................................68
Hình 2.58Cài đặt thành cơng.......................................................................................68
Hình 2.59 Thơng tin máy chủ TabPy...........................................................................68
Hình 2.60 Kết nối Tableau và Tabpy............................................................................69
Hình 2.61Kết nối Tabpy vào Tableau...........................................................................69

Hình 2.62 Hồnh thành kiểm tra kết nối......................................................................69
Hình 2.63 Tham số Số cụm..........................................................................................70
Hình 2.64Tham số Thuật tốn phân cụm.....................................................................71
Hình 2.65 Calculated field clustering...........................................................................72
Hình 2.66 Định dạng bảng tính tốn mặc định.............................................................73
Hình 2.67 Phân cụm các khu nhà, phịng cho th của AirBnb tại New york..............73
Hình 3.1 Mơ hình liên kết dữ liệu movies....................................................................75

Trang 8


Đồ án môn học

Trường ĐH CNTP TP.HCM

NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN
.....................................................................................................................
.....................................................................................................................
.....................................................................................................................
.....................................................................................................................
.....................................................................................................................
.....................................................................................................................
.....................................................................................................................
.....................................................................................................................
.....................................................................................................................
.....................................................................................................................
.....................................................................................................................
.....................................................................................................................
.....................................................................................................................
.....................................................................................................................

.....................................................................................................................
.....................................................................................................................
ĐIỂM ĐÁNH GIÁ:
.....................................................................................................................
.....................................................................................................................
.....................................................................................................................
.....................................................................................................................
.....................................................................................................................
.....................................................................................................................
.....................................................................................................................
.....................................................................................................................
.....................................................................................................................
.....................................................................................................................
…………………………………………………………………………….
…………………………………………………………………………….
Ngày……Tháng……Năm 2021
( ký rõ họ tên)

MỞ ĐẦU
Trang 9


Đồ án môn học
1.

Trường ĐH CNTP TP.HCM

Giới thiệu
Trong lĩnh vực kinh doanh ln địi hỏi chúng ta phải làm việc với các con số, cái bài


báo cáo, các dữ liệu, sử lý các thơng tin và phân tích chúng, để tìm ra những thơng tin hữu
ích đối với doanh nghiệp. Mỗi ngày, chúng ta phải giải quyết tất cả các loại dữ liệu, từ báo
cáo đến bảng tính, email với biểu đồ và thậm chí cả tài liệu in phát tay. Khi dữ liệu tích lũy,
bạn cần nhanh chóng tìm thấy những gì bạn cần vào ngay lúc bạn cần trở nên khó khăn. Q
nhiều dữ liệu làm bạn khơng sử dụng thơng tin mới nhất cũng như bỏ sót nhiều dữ liệu quan
trọng.
Chính vì thế khái niệm data visualization ra đời, bằng cách chuyển đổi tất cả dữ liệu
đó thành biểu đồ và đồ thị để giúp bạn hình dung dữ liệu của mình theo những cách có ý
nghĩa. Các dữ liệu giờ đây không chỉ là những con số và bảng tính mà giờ đây đã là những
thơng tin “hấp dẫn” với nhiều màu sắc và ý nghĩa, trực qua hơn nhà vào các biểu đồ/đồ thị.
Trong bài báo cáo này chúng ta sẽ tìm hiểu về sâu hơn về data visualization, tìm hiểu một
cơng cụ để phân tích dữ liệu và truy vấn dữ liệu là Tableau. Cách tạo ra các biểu đồ,
dashboard, phân tích dữ liệu lớn dạng big data cùng với công cụ Tableau.
2.

Mục tiêu để tài
– Tìm hiểu các dạng database, cấu trúc data, các khải niệm Data Visualization.
– Tìm hiểu Tableau Architecture & Server Components.
– Tableau Data Connections to Databases and Multiple Sources.
– Types of Filters in Tableau: Condition by Formula, Extract, Context
– Tableau Create Group, Hierarchy, Sets & Sort Data
Thực nghiệm dùng Tableau để truy vấn và trực quan hóa 2 bộ dữ liệu cụ thể
3.
Bố cục báo cáo
Chương 1: Tìm hiểu về các dạng database, cấu trúc của data, các khái niệm data
visualization
Tìm hiểu chi tiết về database, gồm có các loại database nào, cấu trúc của một dữ liệu
và khái niệm data visualization.
Chương 2: Tìm hiểu cơng cụ Tableau.
Tìm hiểu chi tiết về công cụ Tableau, cách lọc, truy vấn dữ liệu, tìm hiểu các dạng

biểu đồ, các trường tính toán, tạo dashboard.
Chương 3: Thực nghiệm dùng Tableau để truy vấn và trực quan hóa bộ dữ liệu.

Trang 10


Đồ án môn học

Trường ĐH CNTP TP.HCM

Sử dụng Tableau để trực quan hóa dữ liệu dataset dạng big data và cơ sở dữ liệu
trong SQL Server.
Chương 4: Kết luận.
Tóm tắt lại vấn đề đặt ra, sau khi triển khai sử dụng Tableau vào trong kinh doanh ta
rút ra được những vấn đề cần quan tâm.

Trang 11


Đồ án môn học

Trường ĐH CNTP TP.HCM

Chương 1

GIỚI THIỆU CÁC DẠNG DỮ LIỆU

VÀ TRỰC QUAN HĨA DỮ LIỆU

1.1 Tìm hiểu về hệ cơ sở dữ liệu (database)


Database là một tập hợp các dữ liệu có liên quan luận lý với nhau chứa thơng tin về
một tổ chức nào đó (như trường học, công ty, nhà máy) được lưu trữ trên máy tính để đáp
ứng nhu cầu khai thác thơng tin của nhiều người sử dụng với nhiều mục đích khác nhau.
Một hệ cơ sở dữ liệu thường được kiểm soát bởi hệ quản lý cơ sở dữ liệu(DBMS). Hệ
quản lý cơ sở dữ liệu tạo ra, quản lý, lưu trữ và xử lý truy vấn database. Nó cùng với cơ sở
dữ liệu tạo ra hệ thống cơ sở dữ liệu hay cịn gọi là hệ cơ sở dữ liệu.

Hình 1.1Hệ quản trị cơ sở dữ liệu

Ngôn ngữ được sử dụng trong DBSM:
 Ngôn ngữ định nghĩa dữ liệu - DDL
 Ngôn ngữ thao tác dữ liệu - DML
 Ngôn ngữ truy vấn dữ liệu - SQL
Trang 12


Đồ án môn học

Trường ĐH CNTP TP.HCM

 Ngôn ngữ quản lý dữ liệu – DCL
Một số DBMS thông dụng: Oracle, MongoDB, MySQL, Db4o, Neo4j, NoSQL,
DM2, Ms SQL Server (Microsoft), …

1.2

Các dạng database

Database được phân ra theo hai hướng là theo mục đích sử dụng và theo hệ điều hành

*Theo mục đích sử dụng
- Database dạng file: *.mdb Foxpro, *.dbf, ascii,…
- Database quan hệ: Chúng là các dữ liệu khác nhau được lưu trữ trong các bảng dữ
liệu nhưng giữa chúng có mối quan hệ với nhâu.Tiêu biểu như MySQL, MS SQL,Oracle,…
- Database hướng đối tượng: Điểm giống nhau giữa database hướng đối tượng và
database quan hệ chính là chúng đều được lưu trữ trong bảng dữ liệu. Còn điểm khác biệt
các bảng của database hướng đối tượng có thêm các tính năng hướng đối tượng, ví dụ như
lưu trữ thêm một số hành vi để thể hiện rõ hơn hành vi của đối tượng. Tiêu biểu như MS
SQL server, Postgres SQL, Oracle,…
- Database bán cấu trúc: Loại database này được lưu với định dạng XML, nó có
thơng tin mơ tả dữ liệu và đối tượng được trình bày trong các thẻ tag. Ưu điểm của database
bán cấu trúc đó là lưu trữ được nhiều dữ liệu.
*Theo hệ điều hành
- Database dùng trong hệ điêu hành windows: SQL server,…
- Database dùng trong hệ điều hành Linux: Maria DB, MySQL,…

1.3 Cấu trúc dữ liệu.

Trang 13


Đồ án môn học

Trường ĐH CNTP TP.HCM

1.3.1 Khái niệm:
Đơn giản cấu trúc dữ liệu là cách lưu dữ liệu trong máy tính sao cho nó có thể sử
dụng một cách hiệu quả nhất.
1.3.2 Vai trò của cấu trúc dữ liệu.
Mọi chương trình máy tính đều cần dữ liệu để xử lý. Dữ liệu có thể là dữ liệu đưa vào

(input data), dữ liệu trung gian hoặc dữ liệu đưa ra (output data). Việc tổ chức để lưu trữ dữ
liệu phục vụ cho chương trình có ý nghĩa rất quan trọng trong tồn bộ hệ thống chương
trình.
Trong thiết kế các loại chương trình việc chọn cấu trúc dữ liệu rất quan trọng. Xây
dựng một hệ thống lớn thường gặp nhiều vấn đề về triển khai, chất lượng, hiệu quả vì vậy
phụ thuộc rất nhiều vào việc chọn cấu trúc dữ liệu.
Các cấu trúc dữ liệu được triển khai bằng cách sử dụng các kiểu dữ liệu, các tham
chiếu, và các phép tốn trên đó được viết bằng ngơn ngữ lập trình.
Các cấu trúc dữ liệu thường dùng như: Mảng, ngăn xếp, hàng đợi, hàm băm, danh
sách liên kết, cây, đồ thị.

1.4 Tìm hiều khái niệm data visualization.

1.4.1 Khái niệm.
Data Visualization là khái niệm chỉ xuất hiện trong một vài năm trở lại đây, được dịch
ra là trực quan hóa dữ liệu. Cách biểu diễn dữ liệu dưới cách hình ảnh, biểu đồ, bảng đồ trực
quan từ đó truyền tải thơng tin đến người xem một cách sinh động hơn. Giúp người xem,
người đọc có thể hiểu được nội dung truyền đạt, nắm bắt thông tin, khai thác tối đa dữ liệu.
1.4.2 Ưu điểm về data visualization


Với hình ảnh não bộ con người sẽ phản ứng tốt hơn rất nhiều so với các ký hiệu và
con số cứng nhắc.Con người có thể xử lý hình ảnh nhanh hơn 60.000 lần so với văn
bản.

Trang 14


Đồ án mơn học



Trường ĐH CNTP TP.HCM

Có thể triển khai lượng lớn dữ liệu (big data) một cách đầy đủ mà không phải làm
việc với các bản dữ liệu và truy xuất cồng kềnh.Nắm bắt được thông tin dữ đầy đủ



nhanh chóng và trực quan nhất.
Do khả năng hiểu dữ liệu ở dạng trực quan của chúng ta một cách nhanh chóng, việc



trực quan hóa dữ liệu có thể làm tăng đáng kể tốc độ của quá trình ra quyết định.
Dữ liệu được truy xuất một cách nhanh nhất tốn ít thời gian và công sức của nhân



viên.
Truyền tải thông tin nhanh hơn.

1.4.3 Một số lĩnh vực yêu cầu về data visualization.
Trực quan hóa dữ liệu được sử dụng nhiều trong các lĩnh vực như: Kinh doanh, y tế,
giáo dục, thể thao, ngân hàng, chính phủ,…

Chương 2

GIỚI THIỆU CƠNG CỤ DATA

VISUALIZATION TABLEU


2.1 Nền tảng Tableau đối với phân tích dữ liệu

Trong kinh doanh thơng minh ln địi hỏi tạo tìm kiếm thơng tin chính xác, những
thơng tin về khách hàng, sản phẩm, dịch vụ, nhu cầu đòi hỏi của khách hàng, … Chính vì
thế cần sử dụng những cơng cụ thông minh thiết kế, tổng hợp để đa luồng và phân tích dữ
liệu.
Các cơng cụ thơng minh phải đáp ứng được các yêu cầu sau:
– Cho hình ảnh trực quan phải chính xác với thực tế kết quả mong muốn.
– Cho phép làm việc với dữ liệu như cắt – thêm - bớt - chỉnh sửa – xóa - lọc truy vấn,… .
– Có thể cho truy vấn dữ liệu lớn một cách nhanh và chính xác nhất.
Một số cơng cụ trưc quan hóa dữ liệu như : Tableau, SAP, SAS, MiscroStrategy, A1
digihub. Ngồi ra cịn có các cơng cụ khác như: QlikView from QlikTech, D3.js (Data
Trang 15


Đồ án môn học

Trường ĐH CNTP TP.HCM

Driven Documents) sử dụng HTML, CSS and SVG, Chart.js, Tibco SpotFire, IBM Cognos
Visual Analytics, RoambiAnalytics, Google Charts, FusionCharts.
Trong đó cơng cụ dễ dành tiếp cận cho mọi khách hàng đó là Tableau. Một cơng cụ
hỗ trợ phân tích và trực quan hóa dữ liệu (Data Visualization). Cũng giống như Excel,
Tableau giúp tổng hợp các dữ liệu nhưng ở một cấp độ cao hơn khi chuyển những liệu này
từ các dãy số thành những hình ảnh, biểu đồ trực quan.

2.2 Lịch sử hình thành Tableau.

Tableau được viết bởi 3 nhà đồng sáng lập công ty là Christian Chabot, Pat

Hanrahan và Chris Stolte. Được thành lập năm 2003 tại Mountain View, California và hiện
nay trụ sở chính ở Seattle, Washington.
Năm 2019, cơng ty được Salesforce mua lại với giá 15,7 tỷ đơ la.

2.3 Lợi ích của Tableau







Kết nối hơn 40 nguồn dữ liệu khác nhau.
Xây dựng bản điều khiển tương tác chỉ bằng vài cú click chuột.
Giúp hiểu rõ hơn về dữ liệu và những thông tin liên quan khác.
Phân tích đơn giản như xu hướng hay dự báo…
Cung cấp được nhiều biểu đồ như hình trịn,hình cột, …

2.4 Sản phẩm của Tableau

Để nói về dịng sản phảm của Tableau ta chia ra làm 2 loại:
-

Developer tool ( Công cụ nhà phát triển):Tableau Desktop, Tableau Public.
Sharing tool (Công cụ chia sẻ):Tableau Server, Tableau Online, Tableau Reader.

Trang 16


Đồ án môn học


Trường ĐH CNTP TP.HCM

 Tableau Reader: Cho phép người dùng xem và tương tác với Tableau packet
workbook(.twbx). Nhưng không thể sửa đổi chúng và Tableau không thể kết nối
với Tableau Server.
 Tableau Public: Ứng dụng được cung cấp miễn phí trên trang chủ Tableau. Chỉ
làm việc với nguồn dữ liệu Excel, Access, hoặc text file.Mọi dữ liệu trong
Tableau Puclic đều được lưu trong Tableau Public Server và không thể download
chúng.
 Tableau Desktop: Cung cấp giao diện trực quan cùng các tính năng đa dạng để
mã hóa và phân tích dữ liệu.
 Tableau Desktop chia ra 2 loại: Tableau Desktop Personal, Tableau Desktop
Professional
 Tableau Prep: Là công cụ được dùng để chuẩn bị dữ liệu. Tableau Prep mang
đến sự thay đổi quan trọng trong việc tổ chức dữ liệu, so với phương pháp truyền
thống có nhiều cải tiến.
 Tableau Online: Không cần đến máy chủ, không giới hạn lưu trữ, cho phép liên
kết đến hơn 40 nguồn dữ liệu khác nhau. Tuy nhiên, để có thể xuất bản, vẫn cần
đến Tableau Desktop, có thể hình dung nó giống một server miễn phí cho phép
khả năng truy cập vào các báo cáo trên thiết bị di động các thiết bị như thiết bị
iOS, v.v.
 Tableau Server: là nền tảng chia sẽ phân tích dữ liệu cho doanh nghiệp. Được
bảo mật và cấp quyền truy cập, và tất nhiên là có mất phí hoạt động.

Hình 2.2Mối quan hệ giữa Tableau Desktop và Taleau Server

Ngồi ra cịn một số tableau như Catalog, Bridge, Data management, Server management,
Embedded Analytics, Developer Tool
Trang 17



Đồ án môn học

Trường ĐH CNTP TP.HCM

2.5 Ứng dụng của Tableau



Thu gom, tổng hợp dữ liệu, xây dựng metadata cung cấp cho người dùng nghiệp vụ



(business users) để chuẩn bị phân tích dữ liệu.
Dễ dàng tạo ra các phân tích dữ liệu sử dụng với hơn 40 loại biểu đồ, bao gồm các
biểu đồ mô tả các lý thuyết kinh tế như mơ hình 80/20, phân tích phân khúc khách




hàng RFM, bản đồ hành chính của Việt Nam.
Hỗ trợ tạo các truy vấn bằng thao tác đơn giản.
Vận hành trên nền tảng công nghệ in-memory nhằm đảm bảo tốc độ phân tích với



lượng dữ liệu lớn của doanh nghiệp.
Tạo ra các dashboard tương tác trên các biểu đồ, tham biến, tooltip, drill up, drill
down, liên kết dashboard, giải thích dữ liệu và hỏi dữ liệu giúp cho bạn luôn nắm bắt




được thơng tin với các góc nhìn khác nhau.
Sử dụng phần mềm Tableau trên các máy di động iOS & Android để phân tích và



truy xuất các phân tích & dashboard.
Khả năng mở rộng dễ dàng đáp ứng yêu cầu mở rộng của doanh nghiệp, độ phức tạp
của các nghiệp vụ hiện tại.

2.6 Kiến trúc tableau

Kiến trúc của Tableau dựa trên kiến trúc máy chủ-khách n-tier. Tableau server đóng
vai trị như 1 phần mềm được cài đặt trên máy tính để bàn, ứng dụng wed, ứng dụng di
động. Tableau Desktop là 1 công cụ để làm việc cho phép người dùng khám phá dữ liệu và
chia sẻ thông tin chi tiết hiển thị chúng ở chế độ xem được chia sẻ bởi Tableau Server.
Kiến trúc tableau được chia thành 3 phần chính bao gồm:
-

Nguồn dữ liệu.
Tableau Server and Desktop.
Clients.

Trang 18


Đồ án môn học


Trường ĐH CNTP TP.HCM

2.6.1 Nguồn dữ liệu
Là nơi người dùng lấy dữ liệu cho việc phân tích từ các nguồn có sẵn như Oracle,
MySQL, file Excel,… Người dùng có thể thiết lập kết nối dữ liệu theo hai cách, thiết lập
một kết nối dữ liệu trực tiếp gửi các truy vấn đến nguồn dữ liệu và nhận kết quả ngay lập
tức, hoặc lấy dữ liệu từ nguồn dữ liệu và có một bản sao local của nó làm cơ sở dữ liệu tạm
thời. Dữ liệu có thể được lấy thơng qua kết nối trực tiếp hoặc trích xuất vào cả Tableau
Desktop và Tableau Server.
2.6.2 Tableau Server and Desktop.
Máy chủ Tableau có nhiều thành phần hoạt động cùng nhau vì nó quản lý một loạt
các quy trình quan trọng. Máy chủ Tableau chủ yếu phục vụ người dùng dựa trên tương tác
của các khách hàng mobile và web đối với dữ liệu trên nền tảng Tableau.
2.6.3 Clients.
Là người sử dụng Tableau thông qua web, thiết bị di động, trên đám mây, tại cơ sở
hoặc trên giao diện cmd-line để phát triển. Những người dùng này tương tác chủ yếu với
Máy chủ Tableau để truy cập workbooks hoặc visualizations.

Hình 2.3 Cấu trúc Tableau (Sc.Https://Tableau.Com)

2.7 Data layer
Trang 19


Đồ án môn học

Trường ĐH CNTP TP.HCM

Nền tảng Tableau của Tableau là lớp dữ liệu của nó, Tableau cho phép bạn làm việc
với môi trường dữ liệu không đồng nhất. Bạn có thể làm việc với cơ sở dữ liệu, máy chủ, cơ

sở dữ liệu, kho dữ liệu, tệp excel, Ms Access,…Trong Tableau, không cần thiết phải đưa tất
cả dữ liệu của bạn vào bộ nhớ trừ khi được yêu cầu. Tableau cho phép bạn tận dụng mơi
trường hiện có của bạn bằng cách áp dụng các tính năng cơ sở dữ liệu để trả lời các câu hỏi
của bạn.

2.8 Data Connectors

Tableau cung cấp nhiều trình kết nối dữ liệu khác nhau để làm việc với các cơ sở dữ
liệu như Microsoft SQL Server, Oracle,Teradata, Vertica, Cloudera Hadoop, và nhiều hơn
nữa. Ngồi ra cịn có các đầu nối ODBC chung để kết nối với bất kỳ hệ thống nào mà khơng
cần có trình kết nối gốc. Trong Tableau, có hai chế độ để tương tác với dữ liệu: kết nối trực
tiếp, kết nối trong bộ nhớ. Người dùng Tableau có thể chuyển đổi giữa hai tính năng này
một cách dễ dàng.

2.9 Live Connections

Các trình kết nối dữ liệu của Tableau cho phép bạn tận dụng cơ sở hạ tầng dữ liệu
hiện có của mình. Điều này được thực hiện bằng cách gửi câu lệnh SQL động hoặc MDX
trực tiếp vào cơ sở dữ liệu nguồn thay vì nhập tất cả dữ liệu. Nó có nghĩa là, nếu bạn đã đầu
tư vào một cơ sở dữ liệu nhanh, được tối ưu hóa cho phân tích như Vertica, bạn có thể nhận
được những lợi ích từ những cách kết nối trực tiếp với dữ liệu của bạn. Điều này để lại dữ
liệu chi tiết trong hệ thống nguồn và gửi tổng hợp kết quả của các truy vấn tới Tableau.
Tableau cũng có thể sử dụng lượng dữ liệu không giới hạn.

2.10 In-memory
Trang 20


Đồ án mơn học


Trường ĐH CNTP TP.HCM

Tableau có một cơng cụ phân tích dữ liệu trong bộ nhớ, nhanh chóng. Tableau cho
phép bạn kết nối dữ liệu của mình bằng một cú nhấp chuột, giải nén và đưa nó vào bộ nhớ.
Công cụ dữ liệu của Tableau sử dụng đầy đủ toàn bộ hệ thống để đạt được phản hồi truy vấn
nhanh trên hàng trăm triệu hàng dữ liệu về phần cứng hàng hóa. Vì cơng cụ dữ liệu có thể
truy cập đĩa lưu trữ cũng như RAM và bộ nhớ cache, nó khơng bị giới hạn bởi số lượng bộ
nhớ trên hệ thống. Khơng có u cầu tồn bộ tập dữ liệu được tải vào bộ nhớ để đạt được
mục tiêu hiệu suất của nó.

2.11 Install Tableau Desktop.

2.11.1 Yêu cầu hệ thống cho Tableau.
Tableau Desktop đều tích hợp được với hệ điều hành Windows và MacOS.
Cấu hình tối thiểu để cài trên hệ điều hành Windows:






Microsoft Windows 7 or later (64‐bit).
Microsoft Server 2008 R2 or later
Intel Pentium 4 or AMD Opteron processor or later
2 GB RAM
Ổ cứng còn dư 1,5 GB.

 Cấu hình tối thiểu để cài trên Mac:
 iMac/MacBook 2009 or later.
 OS X 10.10 or later.

 Ổ cứng còn dư 1,5 GB.
Nếu làm việc với nguồn dữ liệu lớn thì nên cân nhắc cấu hình sau đây:
 Latest service pack or update for your operating system.
 Intel Core i3/i5/i7/i9 or AMD FX processor or later.
 At least 8 GB RAM Solid‐state drive (SSD) with at least 20 GB of free space
 Full‐HD resolution (1920 × 1080 pixels) or higher with 32‐bit color depth.

Trang 21


Đồ án môn học

Trường ĐH CNTP TP.HCM

2.11.2 Dowload và cài đặt Tableau Desktop.
Link download Tableau: Trên Windows
chọn file setup (EXE) thực thi và chấp nhận yêu cầu hệ thống với Tableau, cịn trên hệ điều
hành MacOS thì chọn file (DMG) để cài đặt trên máy.
2.11.3 Đăng ký và kích hoạt Tableau Desktop
Sau khi hoàn tất việc cài đặt, bạn có thể mở tableau lên bằng cách nhấn vào biểu
tượng ,sau đó sẽ xuất hiện bảng mẫu đăng ký Tableau để đăng ký kích hoạt Tableau của
mình.
Nhập khóa của sản phẩm Tableau, nếu chưa có khóa có thể sử dụng miễn phí tất cả
các chức năng của Tableau trong 14 ngày.

2.12 Kết nối Tableau với cơ sở dữ liệu đa nguồn

2.12.1 Thiết lập kết nối dữ liệu.
Tableau hỗ trợ hơn 50 trình kết nối dữ liệu khác nhau. Người dùng có thể phân tích
dữ liệu từ các tệp Excel, CSV, PDF và các cơ sở dữ liệu, khối dữ liệu, Hadoop cluster.

Tableau còn cho phép truy cập vào dữ liệu từ các dịch vụ đám mây như Google sheets,
Google Analytics, Amazon Redshift và Salesforce.
Để hiểu được cách thêm nguồn dữ liệu vào Tableau ta cần nắm được các bước:
– Tạo kết nối với các tệp và cơ sở dữ liệu.
– Kết hợp các bảng dữ liệu khác nhau bằng cách sử dụng phép nối và phép kết hợp.
– Thay đổi dữ liệu và kiểu dữ liệu trong mơ hình dữ liệu đang dùng.
Khi mở Tableau lên, có thể thấy được các kiểu kết nối có sẵn ở phía trái màn hình, với mục
kết nối với tệp được liệt kê ở trên và các server cơ sở dữ liệu phía dưới (hình 2.3).

Trang 22


Đồ án mơn học

Trường ĐH CNTP TP.HCM

Hình 2.4 Giao diện sau khi bật Tableau

*Kết nối với file
Để phân tích một tệp dữ liệu, chọn một trong các trình kết nối được liệt kê sẵn, có thể
nhấp vào
More -> Other files để tìm kiểu dữ liệu khác có hỗ trợ nếu như không được liệt kê
sẵn.
*Connect to Excel.

Trang 23


Đồ án mơn học


Trường ĐH CNTP TP.HCM

Hình 2.5 Kết nối Excel với Tabeau

*Connect to text file

Hình 2.6Mở file text trong Tableau

*Kết nối máy chủ cở sở dữ liệu
Để phân tích dữ liệu trên một máy chủ, chọn một trong các trình kết nối được liệt kê
trong To a server. Nếu loại máy chủ cần tìm khơng nằm trong số các loại được liệt kê sẵn,
nhấp vào More để xem đầy đủ về tất cả các trình kết nối có sẵn được hỗ trợ.

Trang 24


Đồ án mơn học

Trường ĐH CNTP TP.HCM

Hình 2.7 Nguồn máy chủ khi làm việc với Tableau

*Kết nối máy chủ MS SQL Sever

Hình 2.8Đăng nhập vào SQL Server

*Kết nối MySQl

Trang 25



×