Tải bản đầy đủ (.pdf) (58 trang)

CHUYÊN ĐỀ TỐT NGHIỆP: PHÁT TRIỂN HỆ THỐNG TRỰC QUAN HÓA DỮ LIỆU HỖ TRỢ QUẢN LÝ CÔNG NỢ TẠI CÔNG TY CÔNG NGHỆ TIN HỌC SUN VIỆT TECHNOLOGIES

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (5.36 MB, 58 trang )

TRƯỜNG ĐẠI HỌC KINH TẾ QUỐC DÂN
VIỆN CÔNG NGHỆ THÔNG TIN VÀ KINH TẾ SỐ

BÁO CÁO CHUYÊN ĐỀ
Tên đề tài:

PHÁT TRIỂN HỆ THỐNG TRỰC QUAN HÓA DỮ LIỆU
HỖ TRỢ QUẢN LÝ CÔNG NỢ TẠI CÔNG TY
CÔNG NGHỆ TIN HỌC SUN VIỆT TECHNOLOGIES

Sinh viên
Mã sinh viên

: Phạm Mạnh Hùng
: 11192192

Hà Nội - 2022


TRƯỜNG ĐẠI HỌC KINH TẾ QUỐC DÂN
VIỆN CÔNG NGHỆ THÔNG TIN VÀ KINH TẾ SỐ

BÁO CÁO CHUYÊN ĐỀ
Tên đề tài:

PHÁT TRIỂN HỆ THỐNG TRỰC QUAN HÓA DỮ LIỆU
HỖ TRỢ QUẢN LÝ CÔNG NỢ TẠI CÔNG TY
CÔNG NGHỆ TIN HỌC SUN VIỆT TECHNOLOGIES

Sinh viên
Mã sinh viên


Lớp chuyên ngành
Giảng viên hướng dẫn

: Phạm Mạnh Hùng
: 11192192
: Hệ thống thông tin quản lý 61A
: TS.Trần Thị Song Minh

Hà Nội - 2022


MỤC LỤC
MỤC LỤC ..................................................................................................... i
DANH MỤC HÌNH .................................................................................... iii
LỜI MỞ ĐẦU .............................................................................................. 1
CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN VỀ CÔNG TY SUN VIỆT
TECHNOLOGIES ...................................................................................... 4
1.1 Tổng quan về công ty Sun Việt Technologies JSC ............................ 4
1.2 Các bài toán nghiệp vụ quản lý tại công ty SVTech ........................... 5
1.3 Bài tốn cơng nợ của bộ phận Quản lý dự án (Project Manager) ....... 7
1.3.1 Thực trạng ứng dụng công nghệ trong quản lý công nợ tại bộ
phận Quản lý dự án ............................................................................... 7
1.3.2 Những vấn đề tồn tại với phương pháp nêu trên. ........................ 7
1.3.3 Hướng giải quyết cho hiện trạng nêu trên ................................... 8
CHƯƠNG 2 : PHƯƠNG PHAP LUẬN PHAT TRIỂN HỆ THỐNG
TRỰC QUAN HOA DỮ LIỆU .................................................................. 9
2.1 Tổng quan về hệ thống trực quan hóa dữ liệu..................................... 9
2.1.1 Khái niệm hệ thống trực quan hóa dữ liệu .................................. 9
2.1.2 Phương pháp xây dựng hệ thống trực quan hóa dữ liệu ............. 9
2.2 Giải pháp và cơng cụ phát triển hệ thống trực quan hóa dữ liệu ...... 10

2.2.1 Giải pháp phát triển hệ thống trực quan hóa dữ liệu ................ 10
2.2.2 Công cụ để phát triển hệ thống trực quan hóa dữ liệu .............. 11
CHƯƠNG 3 : PHÁT TRIỂN HỆ THỐNG TRỰC QUAN HÓA DỮ
LIỆU HỖ TRỢ QUẢN LÝ CÔNG NỢ TẠI CÔNG TY CÔNG NGHỆ
TIN HỌC SUN VIET TECHNOLOGIES .............................................. 15
3.1 Phân tích hệ thống trực quan hóa dữ liệu quản lý cơng nợ cho phịng
ban Quản lý dự án (PM) .......................................................................... 15
3.1.1 Xác định yêu cầu hệ thống ......................................................... 16
3.1.2. Mơ hình hóa hệ thống trực quan hóa dữ liệu ........................... 17

i


3.2 Xây dựng hệ thống trực quan hóa dữ liệu hỗ trợ quản lý cơng nợ cho
phịng ban Quản lý dự án (PM) ............................................................... 19
3.2.1 Thiết kế giao diện đầu vào (Các tập dữ liệu và nơi lưu trữ) ..... 19
3.2.2 Thiết kế giao diện đầu ra (Các báo cáo đầu ra) ........................ 24
3.2.3 Thiết kế quá trình ETL ............................................................... 36
KẾT LUẬN ................................................................................................ 50
TÀI LIỆU THAM KHẢO ........................................................................ 51

ii


DANH MỤC HÌNH
Hình 3.1: Sơ đồ luồng đi dữ liệu 1 .............................................................. 18
Hình 3.2: Cấu hình máy ảo Window Server 1 ............................................ 19
Hình 3.3: Thư mục lưu trữ tệp dữ liệu 1 ..................................................... 20
Hình 3.4: Tài khoản truy cập máy ảo 1 ....................................................... 20
Hình 3.5: Tài khoản truy cập máy ảo 2 ....................................................... 21

Hình 3.6: Các tập dữ liệu trong máy ảo 1 ................................................... 21
Hình 3.7: Các trường dữ liệu thơ 1 ............................................................. 22
Hình 3.8: Bảng dữ liệu Hist trong DB 1 ..................................................... 23
Hình 3.9: Bảng dữ liệu Temp trong DB 1................................................... 23
Hình 3.10: Kết nối cơ sở dư liệu 1 .............................................................. 25
Hình 3.11: Kết nối cơ sở dư liệu 2 .............................................................. 25
Hình 3.12: Các lược đồ trong DB 1 ............................................................ 27
Hình 3.13: Các lược đồ trong DB 2 ............................................................ 27
Hình 3.14: Dashboard cơng nợ theo Ngày 1 ............................................... 29
Hình 3.15: Dashboard cơng nợ theo Ngày 2 ............................................... 29
Hình 3.16: Bảng dữ liệu gốc trong báo cáo 1 ............................................. 30
Hình 3.17: Câu lệnh phân chia bộ phận 1 ................................................... 31
Hình 3.18: Dashboard Cơng nợ theo bộ phận 1 .......................................... 31
Hình 3.19: Tính năng của dashboard 1 ....................................................... 32
Hình 3.20: Chọn Nơi lưu trữ cho báo cáo 1 ................................................ 32
Hình 3.21: Các dashboard sau khi xuất bản 1 ............................................. 33
Hình 3.22: Các dashboard sau khi xuất bản 2 ............................................. 33
Hình 3.23: Tạo kết nối cho tập dữ liệu 1 .................................................... 34
Hình 3.24: Tạo kết nối cho tập dữ liệu 2 .................................................... 35
Hình 3.25: Lên lịch làm mới cho dashboard 1 ............................................ 35
Hình 3.26: Lên lịch làm mới cho dashboard 2 ............................................ 36
Hình 3.27: Tạo kết nối với nguồn dữ liệu 1 ................................................ 37
Hình 3.28: Tạo kết nối với nguồn dữ liệu 2 ................................................ 37
iii


Hình 3.29: Tạo kết nối với nguồn dữ liệu 3 ................................................ 38
Hình 3.30: Tạo kết nối với nguồn dữ liệu 4 ................................................ 38
Hình 3.31: Tạo kết nối với nguồn dữ liệu 5 ................................................ 39
Hình 3.32: Tạo kết nối với nguồn dữ liệu 6 ................................................ 39

Hình 3.33: Tạo kết nối với đích 1 .............................................................. 40
Hình 3.34: Tạo Mapping giữa nguồn và đích 1 .......................................... 41
Hình 3.35: Tính thời gian chênh lệch 1....................................................... 42
Hình 3.36: Tính thời gian chênh lệch 2....................................................... 42
Hình 3.37: Tính thời gian chênh lệch 3....................................................... 43
Hình 3.38: Tạo Mapping giữa nguồn và đích 2 .......................................... 44
Hình 3.39: Tạo thủ tục cho quá trình 1 ....................................................... 45
Hình 3.40: Tạo thủ tục cho quá trình 2 ....................................................... 45
Hình 3.41: Tạo thủ tục cho quá trình 3 ....................................................... 46
Hình 3.42: Lập lịch cho quá trình ETL 1 .................................................... 46
Hình 3.43: Lập lịch cho quá trình ETL 2 .................................................... 47
Hình 3.45: Lập lịch cho quá trình ETL 3 .................................................... 47
Hình 3.46: Lập lịch cho quá trình ETL 4 .................................................... 48

iv


LỜI MỞ ĐẦU
1. Lý do chọn đề tài
Nếu những thập niên đầu của thế kỷ 20, người ta cho rằng dầu mỏ
đang và sẽ là nguồn tài nguyên của cả thế giới. Nhưng hiện tại, khi cuộc
cách mạng 4.0 đang ngày càng đến gần, đổi mới từng mặt của cuộc sống,
thì nhận định đó dường như đã khơng cịn đúng nữa. Dữ liệu mới là một
nguồn tài nguyên mới trong thời kỳ chuyển đổi số, khơng phải chỉ có
những cơng ty, doanh nghiệp hay chính phủ các nước mà nó sẽ là tài
nguyên của cả thế giới. Đi kèm với điều đó, trực quan hóa dữ liệu cũng là
một vấn đề cần thiết cho bất cứ ai muốn khai thác mỏ vàng này. Việc trực
quan hóa dữ liệu ngồi việc sẽ giúp làm sạch dữ liệu, đưa ra được cái nhìn
chun sâu, biến những dữ liệu khơ khan thành thơng tin có giá trị nó cịn
là tập hợp các quy trình giúp tổ chức dữ liệu một cách có cấu trúc, dễ dàng

khai thác và phát triển.
Trực quan hóa dữ liệu tự động sẽ giúp cho các nhà quản lý dễ dàng
hơn trong việc điều hành và nắm bắt thông tin vận hành. Bên cạnh đó các
mẫu báo cáo cũng là các cơng cụ hữu ích giúp cho việc ra quyết định nhanh
chóng và chính xác hơn.
Đối với người vận hành thì một hệ thống trực quan hóa dữ liệu khơng
q khó để có thể vận hành. Có thể dễ dàng đào tạo, phát triển các mẫu báo
cáo theo cái nhìn chuyên sâu, nhu cầu của từng cá nhân.
Việc tự động hóa các báo cáo cịn giúp cho mỗi người làm việc với dữ
liệu bớt đi rất nhiều thao tác và sai sót trong q trình làm việc. Thay vì
phân tích những dịng số liệu khơ khan, thì ta có các biểu đồ với đầy đủ các
thông tin cần thiết cũng như dễ thích nghi về mặt thị giác.

1


2. Mục tiêu nghiên cứu đề tài
Mục tiêu chính của đề tài là phát triển một hệ thống trực quan hóa dữ
liệu dựa trên các phần mềm của bên thứ ba với các tiêu chí sau:
• Giải quyết được bài tốn của doanh nghiệp
• Tự động hóa quy trình
• Dễ thao tác
• Khơng tốn cơng sức vận hành
• Tiết kiệm chi phí
Hệ thống sẽ được thiết kế để chạy một cách tự động và có quy luật,
nhưng phải đảm bảo các yếu tố đầu vào và báo cáo đầu ra dễ tiếp cận cũng
như dễ thao tác để kể cả những người khơng biết nhiều về cơng nghệ cũng
có thể sử dụng.
3. Phạm vi nghiên cứu
Đề tài sẽ nghiên cứu giải quyết cái bài tồn của từng phịng ban như:

Sale Service, Project Manager, BOD… trong tồn cơng ty với một kiến
trúc không đổi, thống nhất từ trước.
Nhưng do phạm vi có hạn, đề tài sẽ tập trung chủ yếu vào việc xây
dựng hệ thống trực quan hóa dữ liệu giải quyết bài tốn cơng nợ của phịng
ban Quản lý dự án (Project Manager).
4. Kế hoạch thực hiện
Giai đoạn 1: (15/08/2022 – 05/09/2022)
Trao đổi, lấy thơng tin hiện trạng của phịng ban về :
• Cách thức lưu trữ dữ liệu ở thời điểm hiện tại
• Các báo cáo ở thời điểm hiện tại
• Yêu cầu về bảo mật dữ liệu của phòng ban
2


Giai đoạn 2: (05/09/2022 - 05/10/2022)
• Đưa ra kiến trúc phù hợp với bài tốn của phịng ban
• Thiết kế các báo cáo mẫu dựa trên yêu cầu và nghiệp vụ của phịng ban.
• Xin các tài ngun phần cứng cần dùng cũng như gửi yêu cầu mua
bản quyền các phần mềm tương ứng
Giai đoạn 3: (06/10/2022 – 06/11/2022)
• Thiết kế nơi lưu trữ, cơ sở dữ liệu của hệ thống
• Xây dựng luồng xử lý dữ liệu dựa trên các tài ngun có sẵn
• Liên kết các phần mềm vào một hệ thống
• Viết các tài liệu đào tạo, tài liệu nghiệp vụ liên quan
Giai đoạn 4: (07/11/2022 – 16/11/2022)
• Tiến hành chạy thử tồn hệ thống
• Đào tạo sử dụng
• Bàn giao hệ thống và tài liệu liên quan
5. Kết cấu
Đề tài có kết cấu gồm 4 chương:

• Chương 1: Giới thiệu tổng quan về công ty Sun Việt Technologies
• Chương 2: Phương pháp luận phát triển hệ thống trực quan hóa dữ liệu
• Chương 3: Phát triển hệ thống trực quan hóa dữ liệu hỗ trợ quản lý
cơng nợ tại cơng ty SVTech
• Chương 4: Kết luận

3


CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN VỀ CÔNG TY
SUN VIỆT TECHNOLOGIES
1.1 Tổng quan về công ty Sun Việt Technologies JSC
Công ty cổ phần phát triển công nghệ tin học Sun Việt Technologies
JSC (SVTech) được biết đến là 1 trong các cơng ty tích hợp hệ thống sớm
nhất của Việt Nam. Với tầm nhìn và sứ mệnh trở thành một trong những
đơn vị tích hợp hệ thống hàng đầu tại Việt Nam và trong khu vực, SVTech
tập trung chính vào việc nâng cao giá trị, đặt lợi ích của khách hàng lên đầu
và đào tạo con người.
SVTech hoạt động chính trong các lĩnh vực chính như sau :
+ Giải pháp tích hợp
+ Giải pháp phần mềm
+ Dịch vụ quản trị
Các giải pháp bao gồm tư vấn, cung cấp và triển khai cái giải pháp
tích hợp hệ thống nhằm nâng cao hiệu quả vận hành hệ thống Công nghệ
thông tin và tiết kiệm chi phí. Tùy biến hệ thống Cơng nghệ thơng tin để
phù hợp với ứng dụng thực tế của các tổ chức, doanh nghiệp.
Giải pháp chuyển đổi kỹ thuật số bao gồm tư vấn các giải pháp phần
mềm giúp các tổ chức, doanh nghiệp hướng tới chuyển đổi số. Nâng cao
hiệu quả tác nghiệp các nghiệp vụ chuyên môn của tổ chức, doanh nghiệp,
cải thiện trải nghiệm người dùng một cách đáng kể.

Về dịch vụ, SVTech đang là một trong những đối tác thân thết của các
hãng công nghệ lớn trên thế giới như : IBM, Oracl, Juniper… Kết hợp với
sản phẩm của các hãng cùng với đội ngũ kỹ sư đưa đến cho doanh nghiệp
các giải pháp về phần cứng cũng như phần mêm phù hợp với chi phí tối ưu.

4


Các dịch vụ về cung cấp phần cứng, bảo mật cũng là một trong những
thế mạnh của SVTech, với hơn 60% lượng nhân sự là các kỹ sư nhiều năm
kinh nghiệm, sở hữu hơn 500 chứng chỉ của các hãng công nghệ thông tin
hàng đầu thế giới. Các dịch vụ về phần cứng có thể kể đến là cho thuê hệ
thống máy chủ, máy trạm…, thiết kế, tích hợp các hệ thống phần cứng theo
yêu cầu, đi cùng với các quy trình bảo mật.
Ngồi ra, SVTech đang tiến hành nghiên cứu và phát triển các hệ
thống Cloud như lưu trữ, xử lý…
Một số khách hàng lớn của SVTech có thể kể đến như : Bộ Tài Chính,
Bộ Cơng An, Ngân hàng Quân đội MBBank, Ngân hàng đầu tư và phát
triển BIDV, Tập đồn viễn thơng qn đội Viettel, Mobifone…
Năm 2020, SVTech thành lập phòng ban Data&Analyst (D&A) với
mục tiêu nghiên cứu, tích hợp các giải pháp quản trị dữ liệu cho các doanh
nghiệp tại Việt Nam đặc biệt là khối các ngân hàng lớn. Hiện nay việc quản
trị dữ liệu đang là một trong các vấn đề nóng bỏng mà bất cứ doanh nghiệp
nào cũng tìm kiếm. Việc phát triển, tích hợp các hệ thống quản trị dữ liệu
đang là mảnh đất tiềm năng và cũng đầy thách thức với toàn bộ phận. Tuy
mới thành lập, nhưng bộ phận đặt mục tiêu trong 5 năm tới có thể triển khai
tồn bộ các hệ
1.2 Các bài toán nghiệp vụ quản lý tại cơng ty SVTech
Dưới góc độ quản lý, Sun Viet Technologies JSC là một doanh nghiệp
triển khai các phần mềm, phần cứng và bán các giải pháp của các hãng

công nghệ lớn trên thế giới, đóng vai trị là người ở giữa kết nối các doanh
nghiệp nước ngoài với doanh nghiệp trong nước và ngược lại. Do đó việc
quản lý sẽ chia thành các nghiệp vụ như sau :
1. Nghiệp vụ về quản lý tài chính, cơng nợ : Mỗi hợp đồng sau khi
được hồn thành sẽ có các khoản cơng nợ phải thu, ngồi ra khách hàng có

5


thể trả theo nhiều đợt khác nhau, hoặc trả trễ hẹn. Nghiệp vụ ở đây là từ
thông tin trên hệ thống quản trị doanh nghiệp ERP sẽ lọc ra các hợp đồng
phải thu trong 7 ngày tới, từ 7 đến 30 ngày tới hoặc ngoài 30 ngày tới.
2. Bên cạnh đó, cần phải đưa ra các hợp đồng đã trễ hẹn dưới 30 ngày
kể từ thời điểm hiện tại, các công nợ đã trễ hẹn từ 30 đến dưới 90 ngày
hoặc các cơng nợ đã trễ hẹn ngồi 90 ngày.
3. Các hợp đồng cũng cần chia theo từng đội trong cơng ty theo danh
sách thành viên để từ đó có thể đánh giá thành tích của từng bộ phận cũng
như các cá nhân theo các yếu tố trên.
4. Cuối cùng cần quản lý tồn bộ tài chính của các cơng nợ nêu trên.
5. Nghiệp vụ quản lý dự án : Nghiệp vụ này được chia cho các bộ
phận theo từng vùng miền của công ty, bộ phận quản lý dự án sẽ theo sát
từng giai đoạn của dự án bằng cách phân chia các cán bộ quản lý dự án đến
từng dự án cụ thể. Và khi dự án hoàn tất, sẽ có các tiêu chí để đánh giá dự
án và sẽ xem trên tình hình thực tế và có bản đánh giá cuối cùng về toàn bộ
dự án trong năm.
6. Nghiệp vụ quản lý công cụ kỹ thuật : Do đặc thù là công ty triển
khai, công ty sẽ cấp các thiết bị kỹ thuật cho dự án cũng như triển khai các
thiết bị phần cứng, nghiệp vụ này nhằm mục đích quản trị các tài sản của
cơng ty đã được cấp phép và các sản phẩm phần cứng đã bán trong năm.
7. Nghiệp vụ quản lý nhân sự : Bộ phận nhân sự chịu trách nhiệm

quản lý nhân sự cũng như nhận các thông tin về nhân sự từ những trưởng
bộ phận khác và đưa ra các mức phúc lợi đối với cán bộ trong công ty. Từ
điều chỉnh mức lương cho đến các chương trình đào tạo, học tập khác.

6


1.3 Bài tốn cơng nợ của bộ phận Quản lý dự án (Project Manager)
1.3.1 Thực trạng ứng dụng công nghệ trong quản lý công nợ tại bộ phận
Quản lý dự án
Như đã nêu ở trên, nghiệp vụ quản lý công nợ cần tổng họp thông tin
với tần suất cao là theo tuần.

Các hợp đồng với từng khách hàng được

chi trả theo nhiều đợt khác nhau và cần được phân biệt. Các bộ phận cũng
được chia theo tổng giá tri các công nợ được thu theo hợp đồng.
Hiện nay dữ liệu nêu trên được nhập liệu và lưu trữ trên hệ thống quản
trị doanh nghiệp ERP, được xuất ra dưới dạng các thư mục Excel, trong thư
mục Excel có các sheet tương đương với các đầu tuần. Trong mỗi sheet dữ
liệu sẽ bao gồm các cột dữ liệu như : Tên khách hàng, Ngày ký hợp
đồng….
Từ những cột dữ liệu trên, cán bộ của phịng ban sẽ sử dụng các cơng
cụ trên phần mềm Excel để tổng hợp, liên kết các sheet dữ liệu lại vơi nhau.
Vẽ các báo cáo cần thiết trên 1 trang Excel duy nhất.
1.3.2 Những vấn đề tồn tại với phương pháp nêu trên.
Phương pháp này tồn tại nhiều vấn đề hạn chế như sau (Dr.B, 2022) :
+ Dữ liệu sẽ không được lưu trữ đầy đủ do khơng có các tiêu chuẩn về
mặt nhập liệu, rất nhiều cột sẽ bị nhập thiếu.
+ Dữ liệu không được chú trọng vì các báo cáo đem đi trình ký mới là

vấn đề được quan tâm chính, các báo cáo này có thể sai sót bởi khuyết
điểm trên.
+ Việc tổng hợp dữ liệu sẽ rất khó khăn nếu có cán bộ trong phịng
ban thơi việc hoặc vơ tình xóa mất.
+ Khơng có cái nhìn chun sâu, khó khai thác hết giá trị của dữ liệu
và việc tổng hợp có thể gây thiếu sót.

7


+ Tính bảo mật khơng cao khi lưu trữ dưới dạng tệp, ai cũng có thể
mở ra xem và sao chép dễ dàng.
Về mặt công cụ, bản thân Excel không phải là cơng cụ chun dụng
để trực quan hóa dữ liệu, việc tổng hợp trên không những tốn khá nhiều
công sức, phức tạp trong khi các báo cáo tạo ra là những báo cáo tĩnh,
không linh hoạt. Việc này tạo ra 1 công việc lặp đi lặp lại hàng tuần, thiếu
tính tự động hóa dẫn đến giảm năng suất của cán bộ trong phòng ban.
1.3.3 Hướng giải quyết cho hiện trạng nêu trên
Với những hạn chế từ cách thức truyền thống, đề tài đưa ra hướng giải
quyết là xây dựng một hệ thống trực quan hóa dữ liệu với mục đích chính
là lưu trữ dữ liệu một cách có quy tắc và xây dựng các báo cáo tự động thay
đổi trực tiếp.

8


CHƯƠNG 2 : PHƯƠNG PHAP LUẬN PHAT TRIỂN HỆ
THỐNG TRỰC QUAN HOA DỮ LIỆU
2.1 Tổng quan về hệ thống trực quan hóa dữ liệu
2.1.1 Khái niệm hệ thống trực quan hóa dữ liệu

Hệ thống trực quan hóa dữ liệu là hệ thống xử lý, đưa các dữ liệu thô
đầu vào ra các dữ liệu đầu ra là các báo cáo nghiêp vụ một cách tự động.
Hệ thống sử dụng các phần mềm trực quan hóa dữ liệu, cơng cụ ETL
(Extract-Transform- Load), cơ sở dữ liệu quan hệ, máy chủ window
server… (Lucidchart, 2020)
2.1.2 Phương pháp xây dựng hệ thống trực quan hóa dữ liệu
Hệ thống trực quan hóa dữ liệu hoạt động trên mơ hình OLAP (Online analytical processing) có nghĩa là dữ liệu được lưu trữ để phục vụ cho
mục đích phân tích hay cịn gọi là dữ liệu lịch sử (historycal data), trái
ngược với mơ hình OLTP (On-line transaction processing), dữ liệu sẽ được
lưu trữ theo thời gian thực để đảm bảo tính tồn vẹn. (IBM, 2021)
Xây dựng hệ thống trực quan hóa dữ liệu trên dựa trên nhu cầu về các
báo cáo của tổ chức, có thể chạy 2 luồng dữ liệu như sau :
• Batch : là hệ thống sẽ chạy dữ liệu theo thời gian T-1 hay còn gọi
là snapshot dữ liệu, hệ thống sẽ chụp lại dữ liệu mới nhất theo một thời
gian quy định, có thể là cuối mỗi ngày, cuối mỗi tháng, cuối mỗi quý hay
cuối mỗi năm. Điển hình ở đây là hình thức ETL dữ liệu và lên lịch.
(Upslover, 2020)
• Streaming : là hệ thống được thiết lập để chạy liên tục theo thời gian
thực, dữ liệu sẽ được thiết kế để đổ vào liên tục, ngay khi có sự thay đổi ở
tệp dữ liệu nguồn thì lập tức các báo cáo sẽ thay đổi. Điển hình có thể kể

9


đến là hình thức chạy Real-Time hoặc Near Real-Time với Kafka.
(Upslover, 2020)
Việc tùy chọn từng hình thức sẽ phụ thuộc vào yêu cầu của từng bài
toán nghiệp vụ, đối với các báo cáo tổng hợp thì sẽ thường được ưu tiên
chạy theo hình thức Batch, đối với các báo cáo chiến thuật thì sẽ được ưu
tiên chạy theo hình thức real-time. Đối với các bài toán nghiệp vụ lớn như

ngân hàng có thể chạy 2 luồng song song.
Về mặt bản chất, hệ thống trực quan hóa dữ liệu là sự kết hợp giữa
các phần mềm với từng mục đích riêng biệt thành một hệ thống phục vụ
nhu cầu duy nhất là biến dữ liệu thô đầu vào thành các báo cáo quản trị ở
đầu ra.
Việc chọn các phần mềm bên thứ 3 mà không xây dựng một phần
mềm chuyên biệt bởi các phần mềm trên đều là những công cụ hàng đầu,
chuyên biệt để thực hiện các nhiệm vụ đề ra. Hơn thế nữa, chi phí để duy
trì sẽ tiết kiệm hơn so với việc phát triển một phần mềm từ đầu.
2.2 Giải pháp và công cụ phát triển hệ thống trực quan hóa dữ liệu
2.2.1 Giải pháp phát triển hệ thống trực quan hóa dữ liệu
Giải pháp được đưa ra như sau :
+ Giao diện đầu vào của hệ thống : là một máy ảo Window Server
chạy trên Server nội bộ của công ty với nhiệm vụ chứa một Thư mục, trong
đó có chia thành các thư mục con tương ứng với từng phòng ban. Các
phòng ban sẽ đưa tệp Excel chứa dữ liệu của phịng ban mình vào thư mục
nêu trên. Các thư mực sẽ được phân quyền chặt chẽ và cấp tài khoản, mật
khẩu cho từng người dùng, đảm bảo tính bảo mật về dữ liệu cho từng
phòng ban.
+ Nơi lưu trữ : cơ sở dữ liệu được sử dụng để lưu trữ dữ liệu cho các
phòng ban sẽ là cơ sở dữ liệu quan hệ Oracle (Oracle Database). Tùy thuộc
10


vào dữ liệu trong tệp Excel, sẽ tiến hành thiết kế nơi lưu trữ của dữ liệu trên
cơ sở dữ liệu. Có thể giữ nguyên như trên tệp Excel để đảm bảo tính tồn
vẹn và tơn trọng dữ liệu hoặc thiết kế các kho dữ liệu (datawarehouse) tùy
vào nghiệp vụ và độ lớn của dữ liệu từng phòng ban.
Từ đầu vào hệ thống là Thư mục tại Window Server, công cụ ETL sẽ
được thiết lập để đọc tệp dữ liệu .CSV trong thư mục, chuyển đổi và đưa

toàn bộ dữ liệu vào cơ sở dữ liệu nêu trên. Các công cụ báo cáo sẽ kết nối
trực tiếp đến cơ sở dữ liệu nêu trên thông qua các giao thức kết nối.
Tùy vào tình huống và u cầu có thể đặt chế độ kết nối là ‘Trực tiếp’
(Live Connection) hay ‘Gián tiếp’ (Extract Connection) sao cho phù hợp.
Dữ liệu sau khi được lưu trữ vào cơ sở dữ liệu thì các công cụ báo
cáo sẽ tự động lấy dữ liệu cả cũ lẫn mới cập nhật lên các báo cáo đã vẽ
trước đó.
Sau khi cập nhật, các báo cáo sẽ được xuất bản lên server của cơng cụ
trực quan hóa và được chia sẻ đến từng tài khoản của từng phòng ban. Hệ
thống phân quyền sẽ được cài đặt để đảm bảo các báo cáo hiển thị đúng nội
dung cho phép với từng tài khoản.
Cuối cùng từ cơ sở dữ liệu trên, cần thiết lập 1 cổng kết nối vào cơ sở
dữ liệu để báo cáo có thể tự động làm mới hồn tồn trên server của cơng
cụ trực quan hóa dữ liệu.
2.2.2 Công cụ để phát triển hệ thống trực quan hóa dữ liệu
+ Giao diện đầu vào lưu trữ: Tệp dữ liệu CSV và Excel đặt trên máy
ảo Window Server
Lý do chọn Window Server làm công cụ lưu trữ đầu vào bởi Window
Server thực chất là hệ điều hành Window nhưng khác với bản chạy trên
máy tính từng cá nhân thì Window Server sẽ chạy trên hệ thống nội bộ của
công ty và không bao giờ tắt (trừ khi có sự cố).
11


Ngoài ra, hệ điều hành Window cũng khá thân thiện với người dùng,
đảm bảo yếu tố là những thành viên khơng q rành về cơng nghệ cũng có
thể truy cập và để tệp dữ liệu vào thư mục.
Việc tương tác, kết nối với hệ điều hành Window cũng dễ dàng hơn so
với hệ điều hành khác như Linux.
Window Server cũng sẽ đảm bảo được rằng máy sẽ được bật lên đến

90% thời gian. Hạn chế tình trạng khi các phịng ban gửi tệp dữ liệu thì
khơng thể gửi được do nơi lưu trữ đã bị tắt.

+ Cơng cụ tích hợp dữ liệu: Oracle Data Intergrator (ODI)
ODI là một công cụ tích hợp, làm giàu dữ liệu được sử dụng nhiều
nhất trên thế giới. Với kiến trúc xử lý là ELT (Extract-Load-Transform),
tức là dữ liệu sẽ được lấy từ nguồn, đẩy trực tiếp vào nơi lưu trữ và tiến
hành xử lý trên nơi lưu trữ (thường là cơ sở dữ liệu) sẽ giúp người dùng tiết
kiệm được một máy chủ xử lý so với kiến trúc ETL (Extract-TransformLoad) thông thường.

12


ODI hỗ trợ kết nối hơn 40 nguồn dữ liệu từ cơ bản như: thư mục CSV,
Microsoft Excel… cho đến các cơ sở dữ liệu lớn như Microsoft SQL
Server, Oracle Database, MySQL, IBM DB2, IBM Netizza…
ODI với bản cài cho các máy cá nhân khơng mất chi phí, người dùng
có thể tự cài đi kèm với đó là rất nhiều các bản hướng dẫn đến từ nhà phát
hành. Do là cơng cụ phổ biến trên thế giới nên cũng có rất nhiều diễn đàn
trao đổi về ODI, việc xử lý lỗi sẽ dễ dàng hơn.

+ Cơ sở dữ liệu : Oracle Database
Cơ sở dữ liệu Oracle hay Oracle Database là một trong những cơ sở
dữ liệu quan hệ phổ biến và lớn mạnh trên thế giới, ngồi việc có dung
lượng lưu trữ lớn, Oracle cịn đưa ra các gói lưu trữ giá rẻ phù hợp với các
doanh nghiệp lớn.
Việc sử dụng công cụ lưu trữ là cơ sở dữ liệu Oracle cũng giúp
tương thích với cơng cụ tích hợp là ODI, giúp tăng tỷ lệ thành công của
mỗi lần chạy.
Do kiến trúc của cơng cụ tích hợp là ELT (Extract-Load-Transform)

nên yêu cầu một cơ sở dữ liệu có tốc độ xử lý cao để thực hiện các quy
trình xử lý dữ liệu.

13


+ Cơng cụ trực quan hóa dữ liệu : PowerBI
Đi cùng với Tableau, PowerBI là một trong hai phần mềm trực quan
hóa dữ liệu phổ biến và thơng dụng nhất thế giới. PowerBI có hỗ trợ kết nối
với cơ sở dữ liệu Oracle thông qua cổng hỗ trợ ODAC (Oracle Data Access
Component).
Các báo cáo được xây dựng trên PowerBI có thể xây dựng dễ dàng.
Việc đào tạo sử dụng cơ bản cũng không tốn quá nhiều thời gian.
Sau khi xây dựng các báo cáo, PowerBI có riêng 1 hệ thống lưu trữ
với dung lượng lưu trữ là 10GB với bản quyền Pro và 1GB với bản quyền
thường. Hỗ trợ gửi thông báo qua email, phân quyền qua email người dùng,
chia sẻ quyền xem, chỉnh sửa các báo cáo, dashboard, đảm bảo dữ liệu sẽ
được bảo mật kỹ càng.
Cuối cùng, Microsoft có các gói bản quyền ưu đãi theo tháng, theo
năm với chi phí hợp lý cho các doanh nghiệp đổi lại các tính năng đều
mạnh mẽ và phù hợp so với các phần mềm trực quan hóa dữ liệu khác.

14


CHƯƠNG 3 : PHÁT TRIỂN HỆ THỐNG TRỰC QUAN
HÓA DỮ LIỆU HỖ TRỢ QUẢN LÝ CÔNG NỢ TẠI CÔNG
TY CÔNG NGHỆ TIN HỌC SUN VIET TECHNOLOGIES
Đối với mỗi hệ thống, việc phát triển hệ thống được chia thành nhiều
giai đoạn, cho nên việc phân tích hệ thống là một bước quan trọng, đặt nền

móng cho các q trình sau. Do hệ thống phục vụ một phòng ban nghiệp vụ
nên quy trình phân tích cần dùng các phương pháp giao tiếp trực tiếp, lấy
yêu cầu nghiệp vụ, lấy yêu cầu kỹ thuật … như sau :
3.1 Phân tích hệ thống trực quan hóa dữ liệu quản lý cơng nợ cho
phịng ban Quản lý dự án (PM)
Hệ thống trực quan hóa dữ liệu sẽ bao gồm đầu vào là các tệp dữ liệu,
các tệp dữ liệu tĩnh (flat file) được tuân theo một quy chuẩn nhất định, đặt
trên một thư mục tại máy chủ Window Server.
Các báo cáo sẽ được vẽ trên cơng cụ trực quan hóa dữ liệu là PowerBI
và được xuất bản trên công cụ đám mây của PowerBI (PowerBI Ser vice).
Ở trên đám mấy, các tập dữ liệu của báo cáo được đóng gói và lưu trữ cùng
tên với các báo cáo hay còn gọi là các Dataset.
PowerBI Service cho phép người dùng kết nối tập dữ liệu đó đến với
một cổng Data Gateway chạy trên máy chủ vật lý với mục đích là tự động
làm mới (refresh) theo ngày hoặc theo tuần tệp dữ liêu (dataset) nêu trên.
Với mục đích tự động làm mới tệp dữ liệu khi có dữ liệu mới được đẩy
vào. Đảm bảo tuyệt đối tính tồn vẹn của dữ liệu.
Cơng cụ để thực hiện lấy dữ liệu tuần tự hàng ngày từ tập dữ liệu tĩnh
vào trong cơ sở dữ liệu là công cụ ETL Oracle Data Integrator. Bên trong
sẽ là những quá trình để lấy dữ liệu từ tập dữ liệu trên, thông qua các câu
lệnh, các thủ tục chuyển đổi, dữ liệu sẽ được đưa vào theo đúng yêu cầu
nghiệp vụ và đúng định dạng phục vụ theo yêu cầu của đơn vị nghiệp vụ.

15


Cuối cùng, các báo cáo, quy trình sẽ được lên lịch theo yêu cầu của
đơn vị nghiệp vụ và nhu cầu cấp thiết của từng phịng ban, có thể lấy dữ
liệu theo ngày, theo tháng hoặc là theo quý…
3.1.1 Xác định yêu cầu hệ thống

Về yêu cầu của hệ thống, thông qua phương pháp phỏng vấn trực tiếp
với cán bộ quản lý cơng nợ của phịng ban Quản lý dự án về các yêu cầu
đối với một báo cáo nghiệp vụ về mảng công nợ, đề tài thu được các yêu
cầu sau :
+ Yếu tố con người
Hệ thống được phát triển để phục vụ các phịng ban nghiệp vụ trong
cơng ty, có thể là các phịng ban back-office hoặc các phịng ban khơng
chun về cơng nghệ, nên hệ thống được u cầu, tính đơn giản, dễ sử
dụng, khơng u cầu các thao tác quá phức tạp.
Hệ thống cũng cần hoạt động ổn định, ít phát sinh các chi phí.
+ Yếu tố nghiệp vụ
Hệ thống cần đáp ứng bài tốn cơng nợ như :
- Quản lý các công nợ quá hạn theo khung thời gian như dưới 30 ngày,
từ 30 ngày đến 90 ngày và ngoài 90 ngày dựa trên cột giá trị thời gian trong
tập dữ liệu so với thời gian hiện tại.
- Các cơng nợ phải thu trong vịng 7 ngày tới, từ 8 đến 30 ngày tới và
ngoài 30 ngày tới dựa trên cột giá trị thời gian trong tập dữ liệu so với thời
gian hiện tại.
- Giá trị công nợ của từng bộ phận trong một khung thời gian tham
chiếu dựa trên tên thành viên của từng bộ phận.

16


Vậy nên, hệ thống cần xử lý các trường thời gian trong tập dữ liệu sao
cho chính xác, tiện lợi nhất cho quả trình phân tích, đảm bảo các khoảng
thời gian chênh lệch giữa các mốc thời gian, số tiền trong từng công nợ.
Đối với tệp dữ liệu đầu vào của hệ thống, qua quá trình khảo sát trực
tiếp và thu thập tài liệu tại phòng ban trên, tệp dữ liệu cần được đưa vào hệ
thống để vẽ báo cáo 1 tuần 1 lần, được cung cấp bởi cán bộ quản lý cơng

nợ của phịng Quản lý dự án (Project Manager).
3.1.2. Mơ hình hóa hệ thống trực quan hóa dữ liệu
Sơ đồ luồng hoạt động của hệ thống.

17


Hình 3.1: Sơ đồ luồng đi dữ liệu 1

18


3.2 Xây dựng hệ thống trực quan hóa dữ liệu hỗ trợ quản lý cơng nợ
cho phịng ban Quản lý dự án (PM)
3.2.1 Thiết kế giao diện đầu vào (Các tập dữ liệu và nơi lưu trữ)
Đầu vào của hệ thống được đặt trên một máy chủ Window Server tại
địa chỉ 10.1.2.2 có cấu hình như sau :

Hình 3.2: Cấu hình máy ảo Window Server 1
Mục đích của việc này giúp cho các bộ phận hồn tồn có thể truy cập
độc lập vào trong nơi lưu trữ của phòng ban mình. Tránh tình trạng khi đặt
trên một máy client thơng thường, rất khó đê truy cập vào và khi tắt máy
thì các phịng ban khơng thể truy cập vào được.
Mỗi phòng ban sẽ được cung cấp một tài khoản đề truy cập thẳng vào
thư mục để đặt tệp dữ liệu của phịng ban mình.

19



×