Tải bản đầy đủ (.docx) (11 trang)

XÂY DỰNG DASHBOARD VỚI POWER BI PHẦN 1

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.07 MB, 11 trang )

CHAPTER 1: SỰ KHÁC BIỆT GIỮA REPORT VÀ DASHBOARD
Trong ngành business intelligence thì thuật ngữ report dùng để mơ tả một cơ chế
để chia sẻ thông tin với người dùng. Có 3 loại report trong BI: dashboards, static
reports, and interac- tive reports.


Dashboard chỉ hiển thị những thơng tin mà người dùng mong muốn để qua đó
họ có thể đưa ra được quyết định cuối cùng. Vì vậy xây dựng dashboard phải
liên quan chặt chẽ với việc nắm bắt mong muốn của người dùng. Các thông tin
hiển thị trên dashboard thường được gọi là Key Performance Indicators (KPI).
Dựa vào KPI chúng ta có thể đánh giá được các chỉ số chính trong kinh doanh là



thành cơng hay thất bại.
Static report: là những báo cáo thường quy của cac công ty. Trong static report
các thông tin rất chi tiết giúp người dùng đào sâu vào một chủ đề nào đó.



Thơng thường người dùng có thể tiếp cận với static report từ dashboard.
Interactive report: là một báo cáo giống như static report nhưng được trình
bày với tính trực quan và dynamic cao. Người dùng thường có thể tương tác
với dữ liệu trong interactive report. Dashboard thường trình bày nhiều chủ đề
hoặc nhiều nguồn dữ liệu thì interactive report chỉ trình bày một chủ đề nhất
định hoặc từ một nguồn dữ liệu nhất định. Static report hiện nay dần được
thay bằng interactive report.

Power BI cho phép chúng ta xây dựng dashboard và interactive reports.
Xác định thông tin nào cần đưa vào dashboard
Bước đầu tiên để xác định thông tin nào cần đưa vào dashboard là chúng ta phải


phỏng vấn, nói chuyện với người sử dụng cuối để có thể biết thơng tin nào cần
đưa vào dashboard.
Sau đó chúng ta lên kế hoạch xây dựng dashboard bằng cách đặt ra các câu hỏi:


Chỉ số nào cần?





Giá trị nào để trình bày các chỉ số đó?
Tìm nguồn dữ liệu ở đâu để trình bày thơng tin chính xác?

Sau đó dựa trên những thơng tin có được từ các cuộc gặp mặt với người sử dụng
chúng ta có thể đưa ra các metrics.
Giả sử chúng ta xác định được các metrics sau:












Sum of revenue

Sum of units
Sum of usage
Sum of subscribers
Sum of revenue target
Sum of units target
Sum of usage target
Sum of subscribers target
Revenue percentage of total
Count of potential new customers
New customer acquisition stage

ứng với mỗi metric trên chúng ta cần trình bày các chỉ số này với hai chỉ số khác là



Variance-to-target
Year-over-year growth, as a percentage

Tiếp theo chúng ta cần xác định xem cần phân tích các chỉ số này theo biến số
nào. Ví dụ chúng ta cần phân tích theo:




Region (country, region, state, city)
Product
Time (year, month, fiscal year, fiscal month, current month, past 12 months)

Thu thập và chuẩn bị dữ liệu
Trước hết chúng ta cần lên trang web của Power Bi và tải Power BI destop về máy

và cài đặt.


Chúng ta có thể thay đổi khung cửa sổ hiển thị của PBI từ 16:9 sang 4:3.
Chúng ta có thể kiểm tra một số Features mới mà PBI sắp cập nhật

Chúng ta có thể stick vào các ơ để sử dụng thử các features này. Lưu ý rằng các preview feature này
thường khơng được hỗ trợ bởi PBI và nó chỉ dùng để chạy thử do đó nó khơng thể cập nhật được.
Sau khi đã cài đặt PBI Destop chúng ta bắt đầu quá trình nhập dữ liệu vào PBI. PBI cho phép chúng ta
nhập dữ liệu từ nhiều nguồn khác nhau. Ví dụ chúng ta có dữ liệu từ Azure SQL database, chúng ta làm
như sau để nhập dữ liệu vào PBI:


Chọn Get Data chọn More

Chọn Azure SQL database Connect


Có hai chế độ connect là Import và DirectQuery
Import mode cho phép chúng ta tải dữ liệu từ database vào máy tính. Nhờ vào cơ chế VertiPaq
compression của PBI mà dữ liệu có thể tải khơng giới hạn dịng vào PBI. Tuy nhiên nếu số lượng dòng
quá lớn mà bộ nhớ máy tính của bạn có giới hạn thì máy tính của bạn cũng khơng thể đọc hết được dữ
liệu. Khi dữ liệu trong database thay đổi thì dữ liệu trong PBI khơng tự động thay đổi. Muốn nó cập nhật
thì chúng ta phải nhấn nút refesh và dự liệu sẽ tải vào máy một lần nữa.
DirectQuery mode cho phép chúng ta kết nối trực tiếp dữ liệu với database. Với cách này dữ liệu của
chúng ta luôn được cập nhật theo thời gian thực. Một lợi điểm khác của mode này là chúng ta không cần
sử dụng bộ nhớ máy tính do đó với máy tính cấu hình thấp chúng ta vẫn có thể chạy tốt PBI. Tuy nhiên
với mode kết nối này tốc độ xử lý tùy thuộc hồn tồn vào cơ sở dữ liệu do đó khi làm dashboard hay
phân tích với PBI thì kết quả có thể trả lại rất chậm. Một khuyến cáo là chúng ta nên sử dụng Import
mode thay vì DirectQuery.


Sau đó chúng ta chọn tên server name của database và click OK.

Sau đó mỗi người dùng nhập username và password được admin cấp để connect với database.


Sau khi tiếp cận database thì chúng ta có thể chọn các bảng trong database để nhập vào PBI.
Trước khi load data vào PBI chúng ta cũng có thể transform nó sử dụng Power BI Query. Power BI Query
có chức năng như quy trình ETL nghĩa là chuyển đổi và làm sạch số liệu trước khi tải vào PBI. Trong
Power BI Query chúng ta có thể thực hiện các lệnh chuyển đổi đơn giản như unpivot table, thay đổi tên,
bỏ cột, bỏ hàng v.v. Power BI Query dùng ngôn ngữ M để viết các câu script chuyển đổi dữ liệu.

Sau khi load dữ liệu chúng ta sẽ có giao diện PBI như sau


Chúng ta chỉ cần click chọn các biến bên phải là PBI tự độ tạo chart cho dữ liệu
Để có thể biểu diễn được dữ liệu, chúng ta cần phải xây dựng model cho dữ liệu
trước. PBI sử dụng phương pháp SSAS multidimensional engine để xây dựng
model. Phương pháp xây dựng model là theo phương pháp star scheme hoặc
snowflake scheme của Ralph Kimball, thường được sử dụng trong datawarehouse.

Trong star scheme chúng ta có một bảng trung tâm gọi là bảng fact table. Fact
table là bảng chứa thông tin về chỉ số chính mà chúng ta đo lường. Trong ví dụ
trên bảng Invoice chính là bảng fact table. Các bảng chứa các thuộc tính liên quan
đến bảng fact gọi là bảng dimension. Ở đây chúng ta có bảng calendar, bảng


product, geography là các bảng dimension. Ngoài bảng trên chúng ta có bảng
device khơng phải là bảng dimension của invoice nhưng lại là bảng dimension của
product. Như vậy model trong ví dụ này là snowflake scheme chứ khơng phải là

star scheme.

Tạo cột ngày tháng năm từ cột tháng năm
Giả sử chúng ta có cột calendaryearmonth có giá trị ví dụ như 201701

Chúng ta click vào tab Edit Queries để vào Power BI Query Tools


Chúng ta chọn cột calendaryearmonth và chọn Add Column chọn Custom
Column. Trong cửa sổ Custom Column chúng ta điền vào công thức

Chúng ta dùng hàm Number.ToText để chuyển cột calendaryearmonth thành dạng
date đồng thời thêm day là 01 vào calendardaymonth.

Cột Date vừa tạo ra có dạng YYYYMMDD và trong ơ định dạng của nó vẫn là Any.
Chúng ta cần phải chuyển nó sang định dạng Date.
Sau khi đã chuyển định dạng xong chúng ta cần chọn Close & Apply.


Tính ngày tài chính từ ngày dương lịch trong năm
Giả sử chúng ta có bảng Calendar dimension gồm các cột ngày và các cột fiscal
year, fiscal month và fiscal day.

Chúng ta cũng có bảng fact table có cột ngày dương lịch

Chúng ta muốn từ ngày dương lịch tính ngày fiscal date cho các ngày dương lịch
này. Trong bảng fact table chúng ta tạo cột FiscalDate với công thức sau:

Trong công thức này vì các bảng đã được tạo relationship rồi nên chúng ta có thể
dùng hàm RELATED để nối FyYear từ bảng calendar sang bảng fact table, nối

FyMonth từ bảng calendar sang bảng fact table và 1 là ngày cho fiscal date.


Kết quả là được bảng dưới đây
Tính ngày cuối cùng của bộ dữ liệu
Giả sử chúng ta có bảng fact table với cột fiscal date và chúng ta muốn biết ngày
cuối cùng của bảng fact table là ngày nào.

Chúng ta tạo mesure với công thức sau:



×