Tải bản đầy đủ (.pdf) (27 trang)

Xây dựng kho dữ liệu quản lý thông tin dịch vụ khách hàng của Vinaphone (tt)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (876.31 KB, 27 trang )

HỌC VIỆN CÔNG NGHỆ BƢU CHÍNH VIỄN THÔNG
---------------------------------------

HOÀNG NGUYỄN PHÚC

XÂY DỰNG KHO DỮ LIỆU QUẢN LÝ THÔNG TIN
DỊCH VỤ KHÁCH HÀNG CỦA VINAPHONE

Chuyên ngành: Hệ thống thông tin
Mã số: 84.80.104

TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT
(Theo định hƣớng ứng dụng)

NGƢỜI HƢỚNG DẪN KHOA HỌC : PGS.TS LÊ HỮU LẬP

HÀ NỘI – NĂM 2018


Luận văn được hoàn thành tại:
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG

Người hướng dẫn khoa học: PGS.TS LÊ HỮU LẬP

Phản biện 1: TS. Nguyễn Đức Dũng

Phản biện 2: TS. Nguyễn Duy Phương

Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học viện Công
nghệ Bưu chính Viễn thông
Vào lúc: 9 giờ 10 ngày 06 tháng 01 năm 2018




1

MỞ ĐẦU
Trong những năm qua cùng với sự phát triển CNTT, các hệ thống thông tin đã
được phát triển mạnh cả vể số lượng lẫn chất lượng, đặc biệt trong nhiều doanh
nghiệp tồn tại nhiều hệ thống thông tin đa dạng và phong phú. Các lãnh đạo doanh
nghiệp thì luôn thiếu thông tin phục vụ điều hành, chưa kể đến có những thông tin sai
lệch thậm chí mâu thuẫn về cùng một sự việc.... trong khi doanh nghiệp đang sở hữu
một khối lượng dữ liệu khổng lồ.
Đến thời điểm hiện nay, phương pháp xây dựng kho dữ liệu (Data
Warehousing) đã phát triển cả về lý thuyết cũng như thực tế. Lý thuyết xây dựng kho
dữ liệu đã được hình thành khá rõ nét, bên cạnh đó các nhà cung cấp phần mềm cũng
đã đưa ra các công cụ để xây dựng, duy trì và phát triển kho dữ liệu. Một kho dữ liệu
sẽ giúp doanh nghiệp có khả năng quản lý dữ liệu, khai thác thông tin phục vụ việc
điều hành kinh đoanh phù hợp hơn.
Cũng như các doanh nghiệp khác, Vinaphone có một mạng lưới các ứng dụng
nghiệp vụ cục bộ tại từng đơn vị thành viên. Việc tập hợp và quản trị dữ liệu trên
phạm vi toàn ngành để cung cấp thông tin cho "quá trình phân tích, hoạch định chiến
lược, hỗ trợ ra quyết định" trong môi trường cạnh tranh và hội nhập là một thách
thức lớn mà Vinaphone đang tìm hướng giải quyết.
Xuất phát từ thực tế này, học viên chọn đề tài ― Xây dựng Kho dữ liệu quản
lý thông tin dịch vụ khách hàng của Vinaphone‖. Đề tài được thực hiện với những
tiêu chuẩn cơ bản về các dịch vụ thông tin di động và khách hàng trong mỗi doanh
nghiệp viễn thông, chẳng hạn như Vinaphone. Đề tài này nghiên cứu lý thuyết, nắm
chắc phương pháp luận và một công cụ xây dựng kho dữ liệu cụ thể, tạo nền tảng
triển khai xây dựng một kho dữ liệu thực tế-hướng giải quyết yêu cầu của đề tài nói
trên.
Ngoài phần mở đầu và kết luận, nội dung chính của luận văn được trình bày

trong 3 chương:
Chƣơng 1. Tổng quan về kho dữ liệu


2
Trình bày cơ sở lý thuyết của kho dữ liệu với các nội dung như : định nghĩa về
kho dữ liệu, các đặc tính của kho dữ liệu, lợi ích của kho dữ liệu, một số thuật ngữ
dùng trong kho dữ liệu, kiến trúc của kho dữ liệu và mô hình dữ liệu đa chiều.
Chƣơng 2. Phƣơng pháp thiết kế kho dữ liệu
Trình bày quy trình thiết kế một kho dữ liệu gồm 6 pha cơ bản đó là: xác định
yêu cầu nghiệp vụ, xác định mô hình kiến trúc, xác định các bảng chiều, bảng sự
kiện, xây dựng lược đồ, tích hợp dữ liệu từ nguồn dữ liệu vào kho dữ liệu và khai
thác, phân tích kho dữ liệu.
Chƣơng 3. Xây dựng kho dữ liệu thử nghiệm quản lý thông tin dịch vụ
khách hàng của doanh nghiệp viễn thông(Vinaphone)
Giới thiệu bài toán xây dựng kho dữ liệu quản lý thông tin dịch vụ khách hàng
của doanh nghiệp viễn thông cụ thể là Vinaphone đồng thời tiến hành xây dựng một
kho dữ liệu thử nghiệm giải quyết bài toán này.
Mặc dù đã có nhiều cố gắng nhưng do thời gian và trình độ còn hạn chế, luận
văn không tránh khỏi những thiếu sót. Kính mong các thầy cô và đồng nghiệp thông
cảm.

Tác giả


3

CHƢƠNG 1. TỔNG QUAN VỀ KHO DỮ LIỆU
Chương này giới thiệu cơ sở lý thuyết của kho dữ liệu bao gồm các nội dung
như: định nghĩa về kho dữ liệu, đặc tính của kho dữ liệu, lợi ích của kho dữ liệu, kiến

trúc kho dữ liệu, mô hình dữ liệu đa chiều và một số thuật ngữ trong kho dữ liệu.

Định nghĩa về kho dữ liệu

1.1

Có nhiều định nghĩa khác nhau về kho dữ liệu[2] nhưng định nghĩa về kho dữ
liệu của Bill Inmon[6]là phổ biến nhất : ―Kho dữ liệu là tập hợp dữ liệu hướng chủ đề,
mang tính tích hợp, ít thay đổi, và mỗi đơn vị dữ liệu đều gắn với một khoảng thời
gian cụ thể. Kho dữ liệu được thiết kế để hỗ trợ quản trị hệ hỗ trợ quyết định‖.

1.2

Đặc tính của kho dữ liệu
Theo định nghĩa của Bill Inmon[6] kho dữ liệu có 4 đặc tính cơ bản gồm:

Hướng chủ đề (Subject Oriented), Tích hợp (Integrated), Tính thời gian cụ thể
(Time Variant) và ít thay đổi (Nonvalatile). Một số định nghĩa khác về kho dữ liệu có
bổ sung thêm tính chất kho dữ liệu bao gồm cả dữ liệu chi tiết và dữ liệu tổng hợp.

1.3

Lợi ích của kho dữ liệu
Khi triển khai một kho dữ vào thực tiễn chúng ta có thể hưởng lợi từ nó bằng

nhiều cách[9]:
- Ra quyết định tốt hơn: Lượng dữ liệu khổng lồ đáng tin cậy của kho dữ liệu
giúp chúng ta đưa ra những quyết định quan trọng khách quan và chính xác
hơn.
- Truy cập dữ liệu nhanh và dễ dàng: dữ liệu mang tính đa chiều trong kho dữ

liệu giúp chúng ta lấy thông tin dễ dàng mà không cần phân tích từng chiều
một.
- Chất lượng dữ liệu và tính nhất quán: Kho dữ liệu thu thập thông tin từ các
nguồn khác nhau và chuyển đổi nó thành một định dạng duy nhất và được sử
dụng rộng rãi.


4

1.4

Một số thuật ngữ trong kho dữ liệu
Một số thuật ngữ thường gặp khi tìm hiểu về kho dữ liệu như: OLTP và

OLAP[4], tiến trình ETL, kho dữ liệu chủ đề và siêu dữ liệu.
OLTP – Hệ thống xử lý giao dịch thời gian thực (Online Transacsion
Processing) là hệ quản trị CSDL nghiệp vụ. Các nghiệp vụ hàng ngày của các doanh
nghiệp như bán hàng, mua hàng, thanh lý hàng tồn kho,.. đều được mô hình hóa trong
OLTP để xử lý hàng ngày. Trong OLTP dữ liệu chỉ đại diện cho hiện tại, nó không có
ý nghĩa lịch sử, đồng thời dữ liệu trong OLTP được chuẩn hóa rất cao vên tốc độ xử
lý truy vấn phức tạp tương đối kém.
OLAP – Hệ thống xử lý phân tích trực tuyến (Online Analytical Processing) là
hệ quản trị CSDL chuyên dùng cho tạo báo cáo và phân tích dữ liệu. Dữ liệu là vô
nghĩa nếu chúng chỉ là các bản ghi trong CSDL, chỉ khi nào chúng được sử dụng để
làm số liệu phân tích, tổng hợp thì lúc đó dữ liệu mới trở thành thông tin. OLAP là
công cụ được dùng để khai thác dữ liệu kho dữ liệu với nhiệm vụ hỗ trợ truy vấn
phức tạp , đồng thời tạo ra các báo cáo đầy đủ, chính xác nhất.
Tiến trình ETL –là tiến trình tích hợp dữ liệu từ nguồn dữ liệu vào kho dữ liệu
bao gồm 3 quá trình: Trích xuất (Extract), Biến đổi (Transform) và Nạp (Load).
Kho dữ liệu chủ đề (Datamart) là cơ sở dữ liệu có những đặc điểm giống với

kho dữ liệu nhưng với quy mô nhỏ hơn và lưu trữ dữ liệu về một lĩnh vực, một
chuyên ngành. Có hai loại datamart thường gặp là datamart độc lập và datamart phụ
thuộc.
Siêu dữ liệu (Metadata )là dữ liệu về dữ liệu[5], được sử đụng trong kho dữ liệu
để mô tả cũng như sử dụng dữ liệu đảm bảo sử dụng triệt để và nhất quán dữ liệu
nghiệp vụ. Nó được tạo ra, duy trì và truy cập trong suốt quá trình xừ lý nghiệp vụ
(được thực hiện thông qua các ứng dụng).


5

1.5

Kiến trúc kho dữ liệu

Hình 1.1. Kiến trúc ba tầng của kho dữ liệu

1.6

Mô hình dữ liệu đa chiều
Khác với dữ liệu trong các cơ sở dữ liệu nghiệp vụ thông thường được tối ưu

hóa cho các thao tác thêm mới, chỉnh sửa hoặc xóa, dữ liệu trong kho dữ liệu được tối
ưu hóa cho việc phân tích và báo cáo. Và cơ sở dữ liệu đa chiều đã phát triển và đi
vào công nghệ cơ sở dữ liệu như là một sự lựa chọn cho những ứng dụng phân tích
dữ liệu.
Theo Oracle: ― Cơ sở dữ liệu đa chiều là một dạng của cơ sở dữ liệu được tối
ưu hoá nhằm cho kho dữ liệu và những ứng dụng xử lý phân tích trực tuyến. Cơ sở
dữ liệu đa chiều thường xuyên được tạo ra bằng cách sử dụng dữ liệu đầu vào từ
những cơ sở dữ liệu quan hệ đã tồn tại ‖[8]

Mô hình dữ liệu đa chiều được đề xuất và thiết kế cho mục đích phân tích dữ
liệu, và nó là một ứng dụng của cơ sở dữ liệu đa chiều. Các thao tác với dữ liệu của
Kho dữ liệu dựa trên cơ sở là mô hình dữ liệu đa chiều.

1.6.1 Các khái niệm chính của mô hình dữ liệu đa chiều
Mô hình dữ liệu đa chiều là một mô hình quản lý dữ liệu theo đó các cơ sở dữ
liệu được phát triển theo nhu cầu của người dùng, để được sử dụng cho các loại truy
vấn cụ thể.
Mô hình này xem dữ liệu ở dạng khối dữ liệu ( data cube). Một khối dữ liệu
cho phép dữ liệu được mô hình hóa và xem xét theo nhiều chiều, đồng thời một khối
dữ liệu được xác định bởi các chiều (dimensions) và sự kiện (facts).


6
Sự kiện là những thước đo quan trọng được sử dụng để đo lường kết quả kinh
doanh[7].
Một chiều là một cấu trúc phân loại dữ liệu để cho phép người dùng trả lời các
câu hỏi kinh doanh[7]. Trong kho dữ liệu, một chiều là một tập hợp các thông tin tham
chiếu đến một sự kiện có thể đo đếm được.
Một khối dữ liệu có thể có nhiều chiều, về mặt lý thuyết thì số chiều là không
hạn chế. Nếu khối dữ liệu có nhiều hơn ba chiều thì được gọi là siêu khối
(hypercube).

1.6.2 Đặc điểm của mô hình dữ liệu đa chiều
Mô hình dữ liệu đa chiều lưu trữ dữ liệu trong các bảng chiều, bảng sự kiện
trong cơ sở dữ liệu.

a. Bảng chiều
Bảng chiều được sử dụng để mô tả các chiều, chứa tất cả các thuộc tính đặc
trưng của chiều đó.

Bảng chiều thường có kích thước nhỏ, từ vài đến vài nghìn hàng. Thỉnh thoảng
kích thước bảng chiều có thể phát triển khá lớn như ngân hàng có thể có bảng chiều
khách hàng với kích thước hàng triệ trình cụ thể thiết kế một kho dữ liệu
dựa trên nền tảng cơ sở lý thuyết về kho dữ liệu được trình bày trong chương 1.


10

CHƢƠNG 2. PHƢƠNG PHÁP THIẾT KẾ KHO DỮ LIỆU
Chương này giới thiệu quy trình thiết kế một kho dữ liệu bao gồm sáu pha cơ
bản: xác định yêu cầu nghiệp vụ, xác định mô hình kiến trúc kho dữ liệu, xác định
bảng chiều, bảng sự kiện, xây dựng lược đồ lưu trữ dữ liệu, tích hợp dữ liệu từ nguồn
dữ liệu vào kho dữ liệu và cuối cùng là khai thác và phân tích kho dữ liệu (hình 2.1).

Hình 2.1. Quy trình thiết kế một kho dữ liệu

2.1

Xác định yêu cầu nghiệp vụ
Việc thiết kế một kho dữ liệu được bắt đầu bằng việc xác định các yêu cầu

nghiệp vụ của kho dữ liệu, đồng nghĩa với việc chúng ta phải xác định được mục đích
và phạm vi xây dựng kho dữ liệu.

2.2

Xác định mô hình kiến trúc kho dữ liệu
Chúng ta lựa chọn mô hình kiến trúc ba tầng của kho dữ liệu với vùng xử lý và

vùng dữ liệu chủ đề (hình 1.1) làm mô hình thiết kế cho kho dữ liệu trong phạm vi

luận văn này.

2.3

Xác định bảng chiều, bảng sự kiện
Trong pha xác định bảng chiều, bảng sự kiện khi thiết kế kho dữ liệu, chúng ta

sẽ đi tìm hiểu các yêu cầu cụ thể khi xây dựng bảng chiều, bảng sự kiện cho kho dữ
liệu.


11

2.3.1 Xác định bảng chiều
Bảng chiều được sử dụng để mô tả các chiều, chứa tất cả các thuộc tính đặc
trưng của chiều đó. Bảng chiều chứa các dữ liệu cần thiết cho việc thực hiện thao tác
nghiệp vụ nào đó, đồng thời nó là đối tượng mà ta có thể dựa vào để phân loại dữ
liệu. Đồng thời bảng chiều cũng là nơi cung cấp thông tin, ngữ cảnh cụ thể cho dữ
liệu trong bảng sự kiện.

2.3.2 Xác định bảng sự kiện
Bảng sự kiện là các phép đo của một quá trình kinh doanh, là bảng kết nối giữa
các bảng chiều và các độ đo và là nơi chứa dữ liệu phân tích của kho dữ liệu.
Trong mô hình dữ liệu đa chiều, cụ thể hơn là trong kho dữ liệu, bảng sự kiện
chứa các sự kiện cụ thể, bảng chiều chứa ngữ cảnh của sự kiện đó. Mối quan hệ này
cung cấp cho ta một góc nhìn trực quan, đầy đủ về dữ liệu trong kho dữ liệu.

2.4

Xây dựng lƣợc đồ lƣu trữ dữ liệu

Với hai dạng lược đồ lưu trữ dữ liệu là lược đồ hình sao và lược đồ hình bông

tuyết, trong phạm vi luận văn này chúng ta chỉ sử dụng lược đồ hình sao khi đi vào
thiết kế, xây dựng kho dữ liệu thử nghiệm.

2.5

Tích hợp dữ liệu từ nguồn dữ liệu vào kho dữ liệu
Việc tích hợp dữ liệu từ nguồn dữ liệu vào kho dữ liệu được thực hiện bởi tiến

trình ETLmô tả trong hình 2.2.

Hình 2.2. Tiến trình ETL [11]

ETL đơn giản là:


12
Trích xuất dữ liệu – tức là chọn lọc dữ liệu từ nhiều nguồn khác nhau. Mỗi
doanh nghiệp sẽ có một vài phần mềm đảm nhiệm một công việc nào đó như quản trị
nhân sự (HRM), quản lý quan hệ khách hàng (CRM) và trích xuất dữ liệu là công
việc chọn lọc những dữ liệu cấn thiết từ các phần mềm này.
Biến đổi dữ liệu – tức chuyển đổi dữ liệu, là việc chuyển đổi các dữ liệu nghiệp
vụ của các phần mềm thành dữ liệu phân tích của các nhà quản trị, đồng thời phải tối
ưu hóa cho mục đích phân tích dữ liệu này.
Nạp dữ liệu – thực hiện việc ghi dữ liệu đã qua biến đổi vào vị trí thích hợp
trong kho dữ liệu.

2.6


Khai thác và phân tích kho dữ liệu
Kho dữ liệu chứa dữ liệu phân tích, mục đích của việc xây dựng kho dữ liệu là

chuyển mục đích sử dụng dữ liệu của các dữ liệu nguồn như ghi nhận các nghiệp vụ
phát sinh hàng ngày sang mục đích khai thác, vận hành, và phân tích dữ liệu, để
doanh nghiệp tìm ra cơ hội phát triển mới cho doanh nghiệp.
Chúng ta sử dụng kỹ thuật OLAP để thực hiện khai thác và phân tích dữ liêu
kho dữ liệu. OLAP cho phép chúng ta quan sát dữ liệu trên nhiều phương diện khác
nhau, ở các mức độ chi tiết khác nhau.

2.7

Kết luận chƣơng
Trong chương này học viên đã tập trung vào phân tích các công đoạn trong quy

trình thiết kế một kho dữ liệu, cụ thể bao gồm việc xác định các yêu cầu về nghiệp
vụ, về kiến trúc, các bảng chiều bảng sự kiện cũng như lựa chọn lược đồ lưu trữ dữ
liệu cho kho dữ liệu. Đồng thời giới thiệu cách thức nạp dữ liệu cho kho dữ liệu cũng
như sử dụng OLAP trong phân tích và khai thác kho dữ liệu. Trong chương 3 học
viên sẽ xây dựng một kho dữ liệu thử nghiệm cho một bài toán cụ thể sử dụng quy
trình

trên.


1

CHƢƠNG 3. XÂY DỰNG KHO DỮ LIỆU THỬ NGHIỆM QUẢN
LÝ THÔNG TIN DỊCH VỤ KHÁCH HÀNG CỦA DOANH NGHIỆP
VIỄN THÔNG(VINAPHONE)

Chương này giới thiệu bài toán xây dựng kho dữ liệu quản lý thông tin dịch vụ
khác hàng của Vinaphone, cũng như tiến hành xây dựng kho dữ liệu thử nghiệm cho
bài toán này.

3.1.1 Bài toán xây dựng kho dữ liệu của Vinaphone
Thị trường thông tin di động trong nước cạnh tranh ngày càng gay gắt,
Vinaphone có nhu cầu xây dựng và phát triển hệ thống thông tin đủ mạnh nhằm đáp
ứng yêu cầu quản trị, tổng hợp, phân tích, dự báo và hỗ trợ ra quyết định cho các cấp
lãnh đạo.
Vinaphone đã triển khai và sử dụng hệ thống CCBS (Customer Care and
Billing System)- Hệ thống tính cước và chăm sóc khách hàng, đây là một hệ thống
tổng thể với quy trình nghiệp vụ khép kín, thực hiện việc tính cước và chăm sóc
khách hàng trọn gói cho các đơn vị khai thác và cung cấp dịch vụ viễn thống.
Tuy nhiên nhìn từ phạm vi toàn công ty, hệ thống vẫn còn hạn chế trong việc
lên báo cáo thông kê cho toàn công ty vì hạn chế trong việc liên kết số liệu từ những
chi nhánh khác nhau, chưa có khả năng quản trị, phân tích, so sánh và dự báo theo
các khoảng thời gian tùy ý. Nhìn từ phạm vi cục bộ, hệ thống chỉ dừng lại ở mức
thống kê nghiệp vụ phát sinh hàng ngày tại từng đơn vị thành viên mà chưa có sự tích
hợp dữ liệu trên phạm vi toàn công ty.
Trươc những vấn đề đang gặp phải cũng như yêu cầu phát triển hệ thống thông
tin đủ mạnh phục vụ công việc điều hành sản xuất kinh doanh, ban lãnh đạo công ty
đã đề ra định hướng chiến lược đầu tư phát triển mạnh mẽ hệ thống thông tin. Tổ
chức thực hiện định hướng chiến lược này bằng các đề án cụ thể, một trong số đó là
xây dựng kho dữ liệu.
Xác định mục tiêu xây dựng kho dữ liệu cho bài toán của doanh nghiệp là chưa
đủ, ta cần xác minh cụ thể phạm vi xây dựng kho dữ liệu của doanh nghiệp. Giá trị
cốt lõi của mọi doanh nghiệp là khách hàng, và việc xây dựng kho dữ liệu cho doanh


2

nghiệp cần tập trung vào khách hàng và dịch vụ. Nghiệp vụ quản lý thông tin dịch vụ
khách hàng có vai trò rất quan trọng trong điều hành kinh doanh, nó cung cấp những
thông tin cụ thể và đáng tin cậy giúp định hướng chiến lược phát triển của doanh
nghiệp.
Bởi vì bài toán thông tin dịch vụ khách hàng của doanh nghiệp viễn thông, cụ
thể là Vinaphone liên quan đến vấn đề bảo mật của doanh nghiệp nên việc tiếp cận
với mô hình và dữ liệu thực tế của doanh nghiệp là không thể. Thông qua việc tìm
hiểu và phân tích thông tin liên quan đến mô hình và dữ liệu của nghiệp vụ dịch vụ
khách hàng trong các doanh nghiệp viễn thông, học viên đã tiến hành mô phỏng lại
mô hình dữ liệu gần sát với thực tiễn nhất, đảm bảo tính khách quan cho bài toán.
Ý nghĩa thực tiễn mà luận văn mang lại chính là việc đưa ra mô hình trực quan
về kho dữ liệu cho nghiệp vụ quản lý thông tin dịch vụ khách hàng của Vinaphone
cũng như các doanh nghiệp viễn thông khác. Kho dữ liệu được xây dựng là một mô
hình mở có thể được dùng cho nhiều nghiệp vụ khác nhau.

3.1.2 Xây dựng Kho dữ liệu thử nghiệm
Dựa vào cơ sở lý thuyết thiết kế kho dữ liệu ở chương 2, trong mục ―Xây dựng
kho dữ liệu thử nghiệm‖ chúng ta sẽ làm rõ từng bước xây dựng kho dữ liệu. Các
bước xây dựng kho dữ liệu thử nghiệm bao gồm:
- Xác định mô hình kiến trúc của kho dữ liệu
- Xác định nguồn dữ liệu cho kho dữ liệu
- Xác định các bảng chiều, bảng sự kiện của Kho dữ liệu, xây dựng lược đồ hình
sao cho Kho dữ liệu
- Cài đặt kho dữ liệu quản lý dịch vụ khách hàng trên SQL Server
- Tích hợp dữ liệu(ETL) từ nguồn dữ liệu vào Kho dữ liệu(sử dụng công cụ
SSIS)
- Phân tích dữ liệu hỗ trợ ra quyết định trong quản lý(sử dụng công cụ SSAS và
Excel).



3

3.2.1 Mô hình kiến trúc của kho dữ liệu

Hình 3.1. Kiến trúc kho dữ liệu dịch vụ khách hàng

3.2.2 Xác định nguồn dữ liệu
Việc xác định nguồn dữ liệu đầu vào là một yêu cầu quan trọng khi xây dựng
kho dữ liệu. Trong bài toán xây dựng kho dữ liệu dịch vụ khách hàng của Vinaphone,
nguồn dữ liệu chúng ta lựa chọn là một số bảng dữ liệu trong hệ thống CCBS.
Hệ thống CCBS phải xử lý nhiều luồng nghiệp vụ khác nhau vì thế số lượng
bảng dữ liệu của nó cũng rất nhiều, trong bài toán xây dựng kho dữ liệu dịch vụ
khách hàng của Vinaphone, chúng ta lựa chọn một số bảng dữ liệu với mô hình quan
hệ được mô tả trong hình 3.2.


4

Hình 3.2. Mô hình thực thể quan hệ cơ sở dữ liệu nguồn

3.2.3 Xác định các bảng chiều, bảng sự kiện, xây dựng lược đồ hình sao
Kho dữ liệu thử nghiệm mà ta xây dựng được xác định gồm bốn bảng chiều và
một bảng sự kiện:
- Bảng chiều thời gian (DimDate)
- Bảng chiều dịch vụ (DimService)
- Bảng chiều chi nhánh (DimBranch)
- Bảng chiều nhóm khách hàng (DimCusGroup)
- Bảng sự kiện dịch vụ khách hàng (FactServiceCustomer)
Tập các hình : hình 3.3, hình 3.4, hình 3.5, hình 3.6 , hình 3.7 và hình 3.8 mô tả
cấu trúc các bảng chiều và bảng sự kiện cho kho dữ liệu quản lý thông tin dịch

vụ khách hàng của Vinaphone, đồng thời xây dựng lược đồ hình sao cho kho
dữ liệu này.


5

Hình 3.3. Bảng chiều thời gian _DimDate

Hình 3.4. Bảng chiều dịch vụ_DimService

Hình 3.5. Bảng chiều Chi nhánh_DimBranch

Hình 3.6. Bảng chiều NhómKH_DimCusGroup


6

Hình 3.7. Bảng sự kiện_FactServiceCustomer

Hình 3.8. Lược đồ hình sao kho dữ liệu dịch vụ khách hàng Vinaphone

3.2.4 Cài đặt kho dữ liệu quản lý dịch vụ khách hàng trên SQL Server
Kết thúc quá trình phân tích và thiết kế các bảng chiều, bảng sự kiện và lược
đồ hình sao cho kho dữ liệu, chúng ta sẽ tiến hành cài đặt kho dữ liệu vào môi trường
SQL Server[10].

3.2.5 Tích hợp dữ liệu từ nguồn dữ liệu vào Kho dữ liệu
Chúng ta sử dụng công cụ SSIS (SQL Server Integration Services) để thực thi
quá trình tích hợp dữ liệu từ nguồn dữ liệu vào kho dữ liệu được thể hiện trong hình
3.9.



7

Hình 3.9. Tiến trình ETL—Extract, Transform, Load

SSIS hỗ trợ chúng ta cho quá trình thực hiện ETL cho từng bảng chiều, bảng
sự kiện.
Kết quả của quá trình ETL cho các bảng chiều, bảng sự kiện của bài toán xây
dựng kho dữ liệu quản lý thông tin dịch vụ khách hàng là việc nạp dữ liệu thành công
vào kho dữ liệu.

3.2.6 Phân tích dữ liệu hỗ trợ ra quyết định trong quản lý
Chúng ta sử dụng công cụ SSAS (SQL Server Analysis Services )để phân tích
dữ liệu kho dữ liệu, từ đó xây dựng một số báo cáo thống kê cho việc sử dụng kho dữ
liệu vào hỗ trợ quyết định.
SSAS là một công cụ tích hợp trong SQL Server Data Tools for Visual Studio
2012 của Microsoft có tính năng truy vấn dữ liệu đa chiều của OLAP, nên được sử
dụng khá phổ biến trong các bài toán khai thác kho dữ liệu.
Một số kết quả đạt được của quá trình phân tích dữ liệu được mô tả trong hình
3.10 và 3.11.


8

Hình 3.10. Thống kê lượng thuê bao đăng ký sử dụng các loại dịch vụ trên toán quốc năm 2017

Hình 3.11. Thống kê lượng thuê bao đăng ký sử dụng các loại dịch vụ năm 2017 của các nhóm đối
tượng khách hàng


Ngoài ra chúng ta có thể kết hợp công cụ Excel với SSAS để lên các báo cáo thống
kê và biểu đồ trực quan như thể hiện tại các hình 3.12 và 3.13.


9

Hình 1.12. Báo cáo lượng thuê bao đăng ký sử dụng các loại dịch vụ trong tháng 1 năm 2017 tại 63
tỉnh thành trên cả nước

Hình 3.13. Biểu đồ thống kê lượng thuê bao đăng ký sử dụng các loại dịch vụ trong năm 2017 của
Vinaphone Hà Nội

3.3

Kết luận chƣơng
Với việc phân tích hệ thống nguồn CCBS hiện có của Vinaphone cũng như các

nhu cầu thực tế nhằm nâng cao hiệu quả điều hành sản xuất kinh doanh, để thấy được
tầm quan trọng của việc phải xây dựng một hệ thống kho dữ liệu. Xây dựng kho dữ
liệu tập trung từ nhiều nguồn dữ liệu khác nhau, nhằm mục đích khai thác tốt hơn,
hiệu quả hơn dữ liệu hỗ trợ việc ra quyết định. Từ các nguồn dữ liệu rời rạc khác


10
nhau không thể đưa ra cái nhìn tổng thể, hoặc hiệu quả của một vấn đế, nên các quyết
định sẽ không đạt độ chính xác cao. Sau khi nghiên cứu, ứng dụng với công cụ SQL
Server 2012 của Microsoft… áp dụng thử nghiệm cho kho dữ liệu. Dữ liệu đã được
tích hợp với độ chính xác khá cao. Nhìn vào kết các báo cáo phân tích đã đưa ra được
nhiều chiều của dữ liệu, đặc biệt là biểu đồ thống kê của báo cáo đã đánh giá được sự
hiệu quả của kho dữ liệu.



11

KẾT LUẬN
Những kết quả đạt đƣợc
Luận văn nghiên cứu xây dựng kho dữ liệu quản lý thông tin dịch vụ khách
hàng của Vinaphone đã được hoàn thành và đạt được các kết quả sau đây:
Sau khi nghiên cứu tổng quan về cơ sở lý thuyết của kho dữ liệu làm nền tảng
cho việc thiết kế xây dựng kho dữ liệu cụ thể, luận văn đã tìm hiểu quy trình thực
hiện việc thiết kế một kho dữ liệu với các yêu cầu cụ thể hỗ trợ cho việc xây dựng
kho dữ liệu thử nghiệm.
Thực hiện xây dựng kho dữ liệu thử nghiệm từ hệ thống nguồn CCBS của
Vinaphone. Tuy nhiên do thời gian thực hiện luận văn có hạn nên luận văn chỉ dừng
lại với dữ liệu thử nghiệm của năm 2017. Bước đầu đã đưa ra được một số báo cáo
phân tích sự tăng trưởng các sản phẩm dịch vụ viến thông tại các địa phương trên cả
nước.
Kết quả thu được khá khả quan, hệ thống kho dữ liệu cho báo cáo khá chính
xác giúp tra cứu, theo dõi và đưa ra các biểu đồ phân tích với từng phân khúc thị
trường của từng loại dịch vụ mà khách hàng đang sử dụng. Qua đó đánh giá được
chính xác, phản ảnh trung thực lại cho nhà quản lý biết được những dịch vụ nào đang
có sự tăng trưởng ấn tượng. Kết quả này cho thấy điểm ưu việt của kho dữ liệu so với
những phương pháp dự báo truyền thống như thống kê hay những báo cáo thông
thường.
Kho dữ liệu có thể khai thác, phục vụ tốt cho nhiều tiêu chí báo cáo, dữ liệu
giải quyết được bài toán định hướng quản lý tập trung không bị rời rạc, manh mún
của các hệ thống dữ liệu hiện hành. Kho dữ liệu có khả năng điều chỉnh tham số tùy ý
để thích nghi với những biến động của dữ liệu trong quá trình sử dụng. Độ chính xác
của dữ liệu trong kho dữ liệu chỉ phụ thuộc vào dữ liệu đầu vào, những biến động
thực tế đều được thể hiện trên số liệu.



12
Luận văn được thực hiện là một bước chuẩn bị về mặt lý thuyết,công cụ và đặc
biệt là một nghiệp vụ điển hình trên thực tế. Để sẵn sàng cho việc tổ chức triển khai
một kho dữ liệu theo yêu cầu thực tế tại Vinaphone.
Hƣớng phát triển
Tuy vậy, luận văn vấn còn một số hạn chế như chưa thể tiếp cận với dữ liệu
nguồn thực tế, hạn chế số chiều trong kho dữ liệu dẫn đến các kết quả thu được chưa
đủ rộng để thấy toàn cảnh vấn đề về quản lý dịch vụ khách hàng. Trong thời gian tới,
em sẽ nghiên cứu thêm để khắc phục những hạn chế trên. Đồng thời, mở rộng phạm
vi xây dựng kho dữ liệu cho các nghiệp vụ khác của Vinaphone.
Xin chân thành cảm ơn.


13

TÀI LIỆU THAM KHẢO
Tiếng Việt
[1]. />[2]. />[3]. />[4]. />[5]. />Tiếng Anh
[6]. W. H. Inmon (2005), Building the Data Warehouse, Fourth Edition
[7]. Oracle (2013), 11gr2 Data warehousing Guide Release 2,
/>[8]. Oracle Database Online Documentation, 10g Release 2,
/>[9]. />[10]. Implementing a Data Warehouse with SQL Server, Microsoft,
/>[11]. /> />[12]. hoặc
/>


×