Tải bản đầy đủ (.pdf) (25 trang)

Nghiên cứu ứng dụng mô hình obi cho phân tích dự báo số liệu kinh doanh trong doanh nghiệp viễn thông (tt)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.11 MB, 25 trang )

HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG
---------------------------------------

NGUYỄN MINH TUẤN

NGHIÊN CỨU ỨNG DỤNG MƠ HÌNH OBI CHO PHÂN TÍCH DỰ
BÁO SỐ LIỆU KINH DOANH TRONG DOANH NGHIỆP VIỄN
THÔNG

Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01

TĨM TẮT LUẬN VĂN THẠC SĨ

HÀ NỘI -2013


1
Luận văn được hồn thành tại:
HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG

Người hướng dẫn khoa học: TS TRỊNH ANH TUẤN
Phản biện 1: …………………………………………………………………………
Phản biện 2: …………………………………………………………………………..

Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học viện Cơng
nghệ Bưu chính Viễn thơng
Vào lúc: ....... giờ ....... ngày ....... tháng ....... .. năm ...............
Có thể tìm hiểu luận văn tại:
- Thư viện của Học viện Cơng nghệ Bưu chính Viễn thơng



2
MỞ ĐẦU
Khi DN hoạt động hiệu quả thì việc mở rộng phạm vi trên nhiều tỉnh thành, hay
nhiều quốc gia là nhu cầu tất yếu. Song song với việc phát triển như thế, thì ban quản trị
cũng vấp phải rất nhiều khó khăn trong quản lý. Dữ liệu của cơng ty, tập đoàn nằm rải rác ở
nhiều nơi và dưới nhiều hình thức khác nhau. Do đó, bất cứ nhu cầu truy vấn, phân tích hay
so sánh giữa các vùng với nhau đều tiêu tốn rất nhiều thời gian và công sức. Với Data
Warehouse (Kho dữ liệu) của BI, những dữ liệu quan trọng nằm rải rác nhiều nơi, dưới
nhiều định dạng khác nhau của DN sẽ được trích xuất đều đặn và được tập hợp lại thành
một cấu trúc thống nhất. Qua đó những báo cáo từ chi tiết đến tổng qt của tồn DN đều
ln đảm bảo được tính chính xác và kịp thời. “Kho dữ liệu” đã được rất nhiều tập đồn lớn
nhìn nhận là một phần quan trọng trên bước đường tồn cầu hóa của họ.
BI là giải pháp công nghệ mà các tổ chức dùng để thu thập, lưu trữ, phân tích và xử
lý dữ liệu nhằm giúp các nhà quản lý đưa ra các quyết định hiệu quả hơn. BI cung cấp một
cách nhìn toàn cảnh hoạt động của tổ chức từ quá khứ, đến hiện tại cũng như các dự đoán
trong tương lai. Việc đó giúp cho các doanh nghiệp đưa ra các quyết định kinh doanh hiệu
quả hơn:
Xác định được vị trí và sức cạnh tranh của DN
Phân tích thói quen sử dụng dịch vụ của khách hàng
Xác định mục đích và chiến lược Marketing
Dự đoán tương lai của doanh nghiệp
Xây dựng chiến lược kinh doanh
Giữ được khách hàng có giá trị và dự đoán khách hành tiềm năng
Các nhà cung cấp dịch vụ Viễn thông hàng đầu ở Việt Nam. Trong những năm gần
đây, luôn chú trọng công tác cung cấp dịch vụ, đảm bảo dịch vụ, nâng cao chất lượng sản
phẩm tới khách hàng một cách nhanh chóng và thuận tiện. Để thực hiện việc đó, các thành
phần và kiến trúc của công nghệ BI được nghiên cứu ứng dụng hỗ trợ doanh nghiệp trong
việc ra quyết định hiệu quả và kịp thời.
Trước thực trạng một số hạn chế như hiện nay, học viên đề xuất việc “xây dựng hệ

thống phân tích và dự báo số kinh doanh trong doanh nghiệp viễn thông” dựa trên kiến trúc
của hệ thống (BI) áp dụng mơ hình Oracle Business Intelligence (OBI).


3
Nội dung và mục tiêu của luận văn gồm 3 phần chính:
Chương 1: Kinh doanh thơng minh. Cung cấp cái nhìn tổng quát về hệ thống quản trị
bao gồm khái niệm của hệ thống, vai trò của hệ thống đối với doanh nghiệp, thành phần và
kiến trúc của hệ thống trong tổng thể kiến trúc của doanh nghiệp.
Chương 2: Giới thiệu mơ hình OBI. Cung cấp cái nhìn tổng qt về hệ thống OBI
bao gồm kiến trúc và các thành phần của hệ thống.
Chương 3: Đề xuất giải pháp hệ thống OBI cho dữ liệu lưu lượng và dịch vụ trong
doanh nghiệp Viễn thông: xây dựng và thiết kế cơ sở dữ liệu áp dụng giải pháp ở trên để
xây dựng các báo cáo phân tích, biểu đồ kinh doanh thông minh trong dữ liệu lưu lượng và
dịch vụ của doanh nghiệp Viễn thơng, Đề xuất mơ hình cài đặt và triển khai thử nghiệm,
đánh giá kết quả của việc thử nghiệm.


4

CHƯƠNG 1. TỔNG QUAN VỀ ETL TRONG KHO DỮ LIỆU
1.1

Giới thiệu

1.1.1 Business Intelligence là gì ?
Hệ hỗ trợ quản trị kinh doanh thơng minh (BI) là qui trình và cơng nghệ mà các
doanh nghiệp dùng để kiểm soát dữ liệu, khai phá tri thức giúp cho các doanh nghiệp có thể
đưa ra các quyết định hiệu quả hơn trong hoạt động kinh doanh của mình. Cơng nghệ BI (BI
technology) cung cấp một cách nhìn tồn cảnh hoạt động của doanh nghiệp từ quá khứ, hiện

tại và các dự đoán tương lai. Mục đích của BI là hỗ trợ cho doanh nghiệp ra quyết định tốt
hơn.

1.1.2 Vấn đề cốt lõi đối với BI
Hệ thống BI đơn giản có thể được xem là sự kết hợp của 3 thành phần chính như sau:

Phân tích

Khai phá

nghiệp vụ

dữ liệu
Hệ hỗ trợ
kinh doanh
thơng minh
Kho dữ liệu

Hình 1.1.2-1 Cơ bản về hệ thống BI

Trong đó:
-

Data Warehouse (Kho dữ liệu): Chứa dữ liệu tổng hợp của doanh nghiệp.

-

Data Mining (Khai phá dữ liệu): Các kỹ thuật dùng để khai phá dữ liệu và phát hiện

tri thức như phân loại (Classification), phân nhóm (Clustering), phát hiện luật kết hợp

(Association Rule), dự đốn (Predcition),…
Business Analyst (Phân tích kinh Doanh): Các nhà lãnh đạo doanh nghiệp đưa ra những
quyết định chiến lược đối với hoạt động kinh doanh của doanh nghiệp.


5

1.1.3 Lịch sử phát triển công nghệ Business Intelligence BI
Hệ thống kinh doanh thơng minh trên thế giới đã có một lịch sử khá lâu đời. Năm
1958, một chuyên gia nghiên cứu của IBM đã đưa ra thuật ngữ “Business Intelligence” và
định nghĩa nó như là “khả năng nhìn nhận những mối quan hệ hiện có để rồi đề ra các hành
động nhằm đạt được mục tiêu”.
Năm 1989, Howard Dresner (sau này là chuyên gia phân tích của Gartner Group) đề
xuất “kinh doanh thông minh” như là một lớp vỏ bọc để miêu tả “các khái niệm và phương
pháp để cải thiện việc ra quyết định trong kinh doanh bằng cách sử dụng các hệ thống hỗ trợ
trên thực tế”. Cho đến cuối những năm 1990, BI đã được sử dụng rộng rãi.
Business Intelligence hiện nay vẫn giữ nguyên ý nghĩa của nó nhưng được phát triển
rộng khắp trên nhiều lĩnh vực. Mặc dù chúng ta gọi là BI nhưng khái niệm và các kỹ thuật
của BI có thể dùng được cho hầu hết các lĩnh vực như: kinh doanh, viễn thơng(Telecom),
giáo dục (Education), chính phủ (Government), chăm sóc sức khỏe (health care)….

1.1.4 Vai trò của hệ thống BI trong doanh nghiệp
Đối với các tổ chức kinh doanh luôn đặt tiêu chí hàng đầu “Thời gian chính là tiền
bạc”, do đó họ khơng chỉ đơn thuần quản lý hiệu quả hoạt động kinh doanh qua các chỉ tiêu
tài chính, kinh doanh, sản xuất, hệ thống phân phối... mà còn quản lý thông qua một ma trận
các chỉ số hiệu suất chính (Key Performance Index - KPI) của tập hợp nhiều bộ phận với
nhau trong toàn bộ chuỗi cung ứng và hoạt động của doanh nghiệp.

1.2


Khái niệm về mơ hình BI

1.2.1 Khái niệm hệ hỗ trợ ra quyết định BI
Khác với hệ hỗ trợ quản trị thơng thường, mục đính chính của hệ thống hỗ trợ ra
quyết định BI là cung cấp cho các chun gia có tri thức cơng cụ và phương pháp cho phép
họ quyết đưa ra những quyết định hiệu quả và đúng thời gian.
Quyết định hiệu quả: Một quyết định hiệu quả là một quyết định có tác động tích
cực đến hoạt động sản xuất, kinh doanh, bán hàng hay quản lý của doanh nghiệp. Ngoài ra,
các kết quả tích cực đạt được từ việc ra quyết định cũng phải tương xứng với sự đầu tư cho
chiến dịch thực hiện quyết định đó.


6
Quyết định đúng thời điểm: Các doanh nghiệp hoạt động trong môi trường kinh tế
cạnh tranh cao và năng động. Như một hệ quả, khả năng phản ứng nhanh chóng với các
hoạt động của đối thủ cạnh tranh và với điều kiện mới của thị trường chính là nhân tốt cốt
yếu trong sự thành cơng và thậm chí là sự sống của doanh nghiệp.

1.2.2 Dữ liệu, thông tin và tri thức
Hệ hỗ trợ quản trị không dựa trên khái niệm duy nhất là dữ liệu mà đề cập đến các
khái niệm theo mức độ giá trị của dữ liệu: đó là dữ liệu, thông tin và tri thức.
Dữ liệu : Dữ liệu có trong hệ thống thơng tin của các tổ chức, doanh nghiệp. Các dữ liệu
được sinh ra từ các giao dịch, các hoạt động quản trị, bán hàng và có thể từ nhiều nguồn
khác nhau từ bên ngồi.
Thơng tin: là kết quả của hoạt động trích lọc và xử lý thơng tin trên dữ liệu, và nó
xuất hiện một cách có ý nghĩa cho những đối tượng nhận trong những lĩnh vực cụ thể.
Tri thức: Thông tin được chuyển thành tri thức khi nó được sử dụng để ra quyết định
hay phát triển những hành động tương ứng.

1.2.3 Mục tiêu và nhiệm vụ của hỗ trợ quyết định BI

Mục đích của hệ thống BI được là giải pháp biến đổi dữ liệu từ kho dữ liệu hoặc dữ liệu chủ
đề thành thông tin và tri thức, từ cách tổng hợp, phân tích các thơng tin đó doanh nghiệp có
được các tư duy chiến lược, hành động hiệu quả hoặc giá trị của hệ thống BI mang đến sự
đúc kết các ý tưởng đem lại các hợp tác mới, khách hàng mới, tạo ra các thị trường mới,
cung cấp các sản phẩm mới, dịch vụ mới cho khách hàng

1.3

Kiến trúc và thành phần mơ hình BI

1.3.1 Kho dữ liệu (Datawarehouse)
Kho dữ liệu (Data Warehouse) là tập hợp của các CSDL tích hợp, hướng chủ đề,
được thiết kế để hỗ trợ cho chức năng trợ giúp quyết định mà mỗi đơn vị dữ liệu đều liên
quan tới một khoảng thời gian cụ thể

1.3.1.1

Một data warehouse thường có các tính chất sau :

-

Dữ liệu có tính tích hợp

-

Dữ liệu gắn thời gian và có tính lịch sử

-

Dữ liệu tổng hợp và chi tiết



7
-

Lưu trữ lâu dài

-

Bất biến theo thời gian

-

Dữ liệu chỉ đọc

1.3.1.2

Các lớp kiến trúc của một Data Warehouse thông thường

-

Data Source Layer (Lớp dữ liệu nguồn)

-

Data Extraction Layer

-

Staging Area


-

ETL Layer

-

Data Storage Layer

1.3.1.3

Kho dữ liệu chủ đề (Datamart)

Kho dữ liệu chủ đề (Datamart - DM) là CSDL có những đặc điểm giống với kho dữ
liệu nhưng với quy mô nhỏ hơn và lưu trữ dữ liệu về một lĩnh vực, một chun ngành. Các
Datamart có thể được hình thành từ một tập con dữ liệu của kho dữ liệu hoặc cũng có thể
được xây dựng độc lập và sau khi xây dựng xong các Datamart có thể được kết nối, tích hợp
lại với nhau tạo thành kho dữ liệu.
Có thể chia Datamart ra làm 2 loại: Datamart độc lập và Datamart phụ thuộc

1.3.2 Xử lý dữ liệu trực tuyến (Online Analysis Processing - OLAP)
1.3.2.1

Khái niệm

OLAP là một kỹ thuật sử dụng các biểu diễn dữ liệu đa chiều gọi là các khối (cube) nhằm
cung cấp khả năng truy xuất nhanh đến dữ liệu của kho dữ liệu. Tạo khối (cube) cho dữ liệu
trong các bảng chiều (dimension table) và bảng sự kiện (fact table) trong kho dữ liệu và
cung cấp khả năng thực hiện các truy vấn tinh vi và phân h cho các ứng dụng client


1.3.2.2

Ưu điểm của OLAP

OLAP là kỹ thuật cho phép các ứng dụng client truy xuất hiệu quả dữ liệu này. OLAP
cung cấp nhiều lợi ích cho người phân tích như:
-

Cung cấp mơ hình dữ liệu đa chiều trực quan cho phép dễ dàng lựa chọn, định hướng
và khám phá dữ liệu

-

Cung cấp một ngôn ngữ truy vấn phân tích, cung cấp sức mạnh để khám phá các mối
quan hệ trong dữ liệu kinh doanh phức tạp.


8
-

Dữ liệu được tính tốn trước đối với các truy vấn thường xuyên nhằm làm cho thời
gian trả lời rất nhanh đối với các truy vấn đặc biệt

-

Cung cấp các cơng cụ mạnh giúp người dùng tạo các khung nhìn mới của dữ liệu dựa
trên một tập các hàm tính toán đặc biệt

1.3.3 Khai phá dữ liệu(Datamining)
Khai phá dữ liệu là quá trình khám phá các tri thức mới và các tri thức có ích tiềm ẩn

trong nguồn dữ liệu đã có. Hiện nay, ngồi thuật ngữ khai phá dữ liệu, người ta cịn dùng
một số thuật ngữ khác có ý nghĩa tương tự như: khai phá tri thức từ CSDL (Knowlegde
Mining from Databases), trích lọc dữ liệu (Knowlegde Extraction), phân tích dữ liệu/mẫu
(data/pattern analysis), khảo cổ dữ liệu (Data Archaeology), nạo vét dữ liệu (Data
Dredging).
Diễn giải các bước trong quá trình khai phá dữ liệu :
Bước 1: Làm sạch dữ liệu (data cleaning): là bước loại bỏ nhiễu hoặc các dữ liệu
khơng thích hợp.
Bước 2: Tích hợp dữ liệu (data integration): là bước tích hợp dữ liệu từ các nguồn
khác nhau.
Bước 3: Chọn dữ liệu (data selection): ở bước này, những dữ liệu liên quan đến
nhiệm vụ sẽ được thu thập từ CSDL.
Bước 4: Chuyển đổi dữ liệu (data transformation): trong bước này, dữ liệu sẽ được
chuyển đổi về dạng phù hợp cho việc khai phá bằng cách thực hiện các thao tác nhóm hoặc
tập hợp.
Bước 5: Khai phá dữ liệu (data mining): là giai đoạn thiết yếu, trong đó các phương
pháp thơng minh sẽ được áp dụng để trích xuất ra các mẫu dữ liệu.
Bước 6: Đánh giá mẫu (pattern evaluation): đánh giá sự hữu ích của các mẫu biểu
diễn tri thức dựa vào một số phép đo.
Bước 7: Trình diễn dữ liệu (knowlegde presentation): sử dụng các kĩ thuật trình diễn
và trực quan hố dữ liệu để biểu diễn tri thức khai phá được cho người sử dụng.


9

CHƯƠNG 2. MƠ HÌNH OBI
2.1

Giới thiệu


2.2

Các thành phần chính của mơ hình OBI
OBI là hệ thống cung cấp các tính năng rất mạnh hỗ trợ cho các ứng dụng BI trong

doanh nghiệp. Một hệ thống OBI bao gồm các thành phần: Oracle Business Intelligence
Enterprise Edition 11g, Oracle BI Publisher, Oracle Essbase, Oracle Scorecard and Strategy
Management, và Oracle Essbase Analytics Link (EAL). Dưới đây là cái nhìn tổng thể về các
thành phần chính trong hệ thống này

2.2.1 Các thành phần của Server
OBI Server là hệ thống server phục vụ cho việc truy vấn, lập báo cáo và phân tích dữ
liệu một cách nhanh chóng và hiệu quả. Hệ thống này cung cấp các dịch vụ cho các thành
phần khác của hệ thống BI như các ứng dụng phân tích số liệu, các bảng điều khiển, các ứng
dụng khai phá dữ liệu.

Hình 0-1 – Kiến trúc tổng quát của hệ thống OBI

Common Enterprise Information Model: mơ hình mức ngữ cảnh của hệ thống OBI. Nó
được truy cập thơng qua một API mở, do đó tích hợp được với các kênh dữ liệu cả dưới
dạng Oracle hoặc không phải Oracle.


10
Oracle BI Server: server phục vụ cho việc phân tích và trích xuất dữ liệu có khả năng
mở rộng và hiệu năng rất cao. Nó có khả năng tích hợp dữ liệu từ rất nhiều nguồn khác nhau
Oracle Essbase: server hỗ trợ việc xử lý phân tích trực tuyến (OLAP), cung cấp môi
trường cho việc phát triển các ứng dụng phân tích đặc thù cũng như các ứng dụng quản lý
hiệu năng của doanh nghiệp
Oracle Essbase Analytics Link: Cung cấp một kênh truyền tải các báo cáo quản trị và

phân tích tài chính dưới hình thức thời gian thực (real-time) hoặc khi có nhu cầu (ondemand) từ Oracle Hyperion Financial Management tới Oracle Essbase.

2.2.2 Các thành phần cung cấp cho người dùng cuối
Oracle BI Foundation Suite cung cấp một bộ tích hợp đầy đủ các sản phẩm bổ sung
cung cấp đầy đủ các chức năng phân tích và định kiểu. Mô tả sau đây là kỹ thuật nền tảng
của những khả năng đó cũng như thơng tin chi tiết về người dùng cuối và khả năng sản
phẩm, đặc biệt là phân tích, tìm kiếm, báo cáo thương mại và chiến lược quản lý.
-

Enterprise Reporting: Oracle Business Intelligence (BI) Publisher (trước đây là XML
Publisher) là giải pháp hỗ trợ việc tạo, quản lý và phân phối các văn bản với nhiều
định dạng, ví dụ như các báo cáo điều hành dưới dạng PDF, các thư báo vận chuyển,
kiểm tra, chào hàng, tiếp thị…

-

Ad hoc Query and Reporting: Cung cấp môi trường truy vấn và phân tích dữ liệu
mạnh cho phép tạo ra một hướng nhìn logic từ nhiều nguồn dữ liệu khác nhau trên
một giao diện Web.

-

Interactive Dashboards: các bảng điều khiển dưới dạng Web có tính tương tác cao có
chức năng hiển thị các thơng tin được cá nhân hóa hỗ trợ cho người dùng trong việc
ra quyết định.

-

Scorecard and Strategy Management: Mở rộng Oracle BI Enterprise Edition
(OBIEE) với các tính năng cho phép các mục tiêu chiến lược của tổ chức có sự tương

tác và ln được giám sát.

-

Actionable Intelligence: Bao gồm một Action Framework cung cấp khả năng gọi các
luồng công việc, các web service, nội dung web, nội dung BI bổ sung, phương thức
java và các thủ tục riêng khác từ bất kỳ một kênh phân phối nào.


11
-

Integrated Search: Cung cấp khả năng tìm kiếm dựa trên việc đánh chỉ mục các bảng
điều khiển, bảng phân tích, khung nhìn, các cảnh báo, các chỉ số KPI, các bảng
Scorecard, các báo cáo Publisher.

-

BI on the go: Cung cấp các tính năng của hệ thống BI trong trường hợp người dùng
không kết nối trực tiếp với hệ thống mạng của doanh nghiệp.

2.2.3 Các thành phần quản trị hệ thống
Oracle Enterprise Manager Integration: Cung cấp các công cụ quản trị tập trung dưới
dạng web. Cho phép người quản trị hệ thống OBI quản lý nhiều hệ thống server khác nhau
trên một giao diện.

2.3

Các đặc điểm của hệ thống OBI
OBI được thiết kế nhằm đưa ra các giải pháp cho các yêu cầu phân tích số liệu sản


xuất kinh doanh của doanh nghiệp. Nó bao gồm một loạt các tính năng như truy vấn và
phân tích dữ liệu, đưa ra các bảng điều khiển, scorecard, lập báo cáo, cảnh báo, phân tích từ
xa… Hệ thống được thiết kế với các đặc điểm cơ bản sau:

2.4

-

Khung nhìn thơng tin mức ngữ cảnh là thống nhất

-

Người dùng tự phục vụ

-

Truy nhập thông tin theo thời gian thực

-

Đưa ra các hoạt động dựa trên kết quả phân tích

-

Platform thống nhất

Kết chương
Trong chương này, học viên đã tìm hiểu được một số các lý thuyết, các kĩ thuật được


sử dụng trong hệ thống OBI như: kiến trúc và các thành phần của OBI. Trong chương này,
cũng chỉ ra những mục tiêu và nhiệm vụ mà học viên sẽ phải đạt được trong luận văn. Đọc
xong chương này, người đọc đã có thể có một cái nhìn tổng quan có tính hệ thống về đề tài
đang được thực hiện.


12

CHƯƠNG 3. ĐỀ XUẤT GIẢI PHÁP HỆ THỐNG PHÂN TÍCH VÀ DỰ
BÁO SỐ LIỆU KINH DOANH TRONG DOANH NGHIỆP VIỄN
THÔNG DỰA TRÊN MƠ HÌNH OBI
3.1

Đặt vấn đề

VNPT là doanh nghiệp cung cấp dịch vụ viễn thông hàng đầu của Việt Nam với thị phần rất
lớn đối với dịch vụ khác nhau như:
-

Dịch vụ Internet

-

Dịch vụ IPTV

-

Dịch vụ VPN

-


Dịch vụ thoại cố định

-

Dịch vụ Gphone

-

Các dịch vụ di động

-

Các dịch vụ giá trị gia tăng trên các dịch vụ cơ bản

Một số bài toán cơ bản hiện tại của VNPT đang rất mong muốn thực hiện để phục vụ cho
các cấp quản lý và các cấp lãnh đạo có thể kể ra như sau:
-

Thơng tin chính xác về số th bao hiện có của các dịch vụ (theo vùng, các
gói cước..)

-

Thơng tin chính xác về số lượng khách hàng sử dụng đa dịch vụ của VNPT
(HSI, IPTV, Mobile) theo tất cả các VNPT Tỉnh trên toàn quốc

-

Số thuê bao rời mạng trên dịch vụ theo các Tỉnh


-

Thông tin về chất lượng mạng lưới gắn với thông tin về dịch vụ

-

Thông tin chất lượng mạng lưới gắn với thông tin khách hàng

-

Thông tin chất lượng mạng lưới, chất lượng dịch vụ gắn với doanh thu trung
bình trên mỗi khách hàng (ARPU)

-

Doanh thu các dịch vụ của các Tỉnh gắn với thông tin điều hành cung cấp đảm
bảo dịch vụ

-

Hiệu quả đem lại của các gói dịch vụ so với đầu từ ban đầu và chi phí vận
hành (ROI)


13

3.1.1 Nhu cầu thực tế
Tất cả các thông tin vừa nêu trong phần trên về cơ bản đều hữu ích cho người quản lý dịch
vụ, người vận hành dịch vụ và những người hoạch định chiến lược kinh doanh đối với các

dịch vụ.
Từ các thông tin liệt kê trên hiện chưa có là
-

Chưa thể hiểu được khách hàng và các yêu cầu của khách hàng

-

Chưa thể đưa ra các dịch vụ mới cho khách hàng dựa trên yêu cầu

-

Chưa thể thấy rõ được hiệu quả sử dụng dịch vụ của khách hàng

-



Với những vấn đề như vậy, khả năng mất khách hàng, mất thị trường hay thua kém so với
đối thủ là khơng thể tránh được.
Do vậy việc cần có một hệ thống BI để phục vụ cho các nhu cầu quản lý, điều hành, nhu cầu
phân tích thị trường, phân tích dịch vụ, phân tích khách hàng và hàng loạt những nhu cầu
khác là rất cấp thiết.

3.2

Mô tả bài toán thử nghiệm

3.2.1 Lựa chọn nguồn dữ liệu
Dựa trên khảo sát thực tế tác giả xây dựng bảng tổng hợp các nguồn dữ liệu được

đưa ra dựa trên việc phân tích các hệ thống phục vụ cơng tác quản lý vận hành khai thác các
dịch vụ cơ bản của VNPT. Các đối tượng tham gia gồm có: Các cơng ty dịch vụ di động,
VNP, VMS, công ty hạ tầng VTN, công ty chủ quản dịch vụ Internet VDC, công ty chủ
quản dịch vụ IPTV VASC, công ty chủ quản dịch vụ VPN và VoIP: VTN.
Trong phạm vi đề tài này tác giả lựa chọn dịch vụ (NP, VoIP SP, VPN SP) của cơng
ty hạ tầng VTN để phân tích lưu lượng và dịch vụ.

3.2.2 Phân tích biểu mẫu báo cáo và chỉ tiêu phục vụ phân tích và dự báo
Hệ thống báo cáo số liệu, biểu đồ phân tích hiện tại của đơn vị Viễn thông được xây dựng
dựa trên nhu cầu thực tế của người dùng, và chỉ cung cấp được thơng tin theo một chiều
nhất định. Vì vậy, để đảm bảo tính chính xác của số liệu thơng tin và tối ưu hóa lưu trữ, xử
lý dữ liệu, học viên đã thực hiện thu thập, phân tích và xử lý các biểu mẫu, chỉ tiêu đối với
báo cáo về dữ liệu lưu lượng băng rộng, lưu lượng theo dịch vụ tại đơn vị như sau:
• Các mẫu báo cáo KPI gồm:


14
-

Thống kê Top 10 đơn vị có lưu lượng cao trong tháng

-

Thống kê Top 10 đơn vị có lưu lượng theo dịch vụ cao trong tháng

-

Báo tăng giảm lưu lượng theo tháng

• Các mẫu báo cáo lưu lượng và dịch vụ gồm:

-

Báo cáo lưu lượng theo ngày

-

Báo cáo lưu lượng theo từng loại dịch vụ

-

Báo cáo tổng hợp lưu lượng theo khu vực

-

Báo cáo tổng hợp lưu lượng theo dịch vụ và khu vực

-

Báo cáo tổng hợp lưu lượng theo tuần, tháng, năm

Dựa vào kết quả thu thập và phân tích ở trên học viên sẽ thiết kế hệ thống báo cáo, biểu đồ
để phục vụ hệ thống báo cáo phục vụ hỗ trợ quyết định cho đơn vị Viễn thông.

3.2.3 Phân loại và giới hạn dữ liệu đầu vào của hệ thống
• Dữ liệu chi tiết lưu lượng
Mỗi một kết nối trên mạng VN2 đi qua mỗi thiết bị tại một thời đều phát sinh một mẫu
tin của kết nối. Các mẫu tin này bao gồm các thông tin đặc tả thuộc tính quan trọng của kết
nối như : Địa chỉ IP, Port, tổng số bytes in và out của thiết bị. Thông thường các thông tin
trên không thể sử dụng được nếu thiếu thông tin về đơn vị th và Port đó được th dùng
cho dịch vụ gì.

• Dữ liệu lưu lượng theo dịch vụ
Mạng VN2 của Tập đồn bưu chính viễn thơng VNPT có cấu trúc rất phức tạp, được cấu
trúc bởi hàng ngàn thiết bị. Mỗi kết nối được thiết lập bởi các port và dịch vụ được khai báo
đến từng Vlan.
• Dữ liệu đơn vị thuê
Cũng như các lĩnh vực kinh doanh lớn khác, các thông tin về đơn vị thuê cần được lưu
trữ để dùng cho các ứng dụng như tính cước, tiếp thị... Thông tin về đơn vị thuê bao gồm
tên đơn vị, dịch vụ thuê, giá cước dịch vụ... Thông thường dữ liệu đơn vị thuê phải được kết
hợp với các dữ liệu khác, (ví dụ như dữ liệu chi tiết lưu lượng).
• Dữ liệu quản lý thiết bị
Dữ liệu thiết bị lưu trữ các thơng tin thuộc tính của thiết bị như: địa chỉ IP, port, tên thiết
bị, hướng kết nối, đơn vị thuê…
• Dữ liệu port


15
Dữ liệu port lưu trữ các thơng tin thuộc tính của port như: port, mô tả port, hướng kết
nối, thời gian bắt đầu, thời gian kết thúc, đơn vị thuê …

3.3

Xác định các mục tiêu

3.3.1 Mục tiêu gần
-

Nắm được một nguồn dữ liệu cần có cho các yêu cầu báo cáo

-


Có một số báo cáo mức cơ bản

-

Trước mắt là báo cáo offline, q trình lấy thơng tin cho báo cáo là bán tự
động/tự động

-

Chuẩn hóa được một số dữ liệu dữ liệu cơ bản

3.3.2 Mục tiêu xa
-

Xây dựng được hệ thống BI dựa trên nền tảng công nghệ OBI cho các dịch vụ
của VNPT

-

Có đầy đủ các mức độ báo cáo trong hệ thống từ báo cáo chung tới các báo
cáo đa chiều, các báo cáo dự báo, dự đốn, phân tích.

-

Các báo cáo là realtime, việc thu thập và phân tích thơng tin là hồn tồn tự
động

-

Chuẩn hóa được tất cả các dữ liệu cần có phục vụ các bài tốn kinh doanh,

quản lý.

3.4

Mơ hình triển khai

3.4.1 Đề xuất mơ hình triển khai thử nghiệm
mơ hình triển khai thử nghiệm
Căn cứ vào nhu cầu thực tế tại đơn vị tác giả đưa lựa chọn một số thành phần cơ bản để
đưa ra mơ hình triển khai như sau:


16
Web client

Ra quyết định
Theo dõi giám sát

VNPT NET
Web Server
Databaser
Server

Server
SNMP

DW

Hình 0-1: Mơ hình triển khai


Server SNMP thứ nhất đóng vai trị tự động lưu trữ các bản tin lấy từ các thiết bị
trong mạng core của công ty hạ tầng VTN dựa trên giao thức SNMP. Trong q trình tự
động hóa các bản tin được lấy định kỳ 5 phút một lần, và được lưu trữ trên FTP server.
Công cụ ETL sẽ tự động lấy về vào cuối ngày và đẩy vào kho dữ liệu (DW).
Server thứ 2 gồm các thành phần:
Kho dữ liệu (DW): là cơ sở dữ liệu được phân tích thiết kế, cài đặt trong DB Server
Khối ETL: các chương trình được cấu hình tự động login vào FTP server để
download bản tin SNMP.
Khối báo cáo: gồm các báo cáo dạng trực tuyến, báo cáo đồ họa và báo cáo theo định
dạng chuẩn của VNPT được cài đặt trên webserver.
Server thứ 2 có chức năng thu thập số liệu, phân tích các số liệu trong cơ sở dữ liệu
cung cấp cho các đối tượng quản lý để có cái nhìn tổng qt và đa chiều về các thơng tin về
đơn vị thuê và lưu lượng sử dụng vào cách thức điều hành nội bộ và phối hợp các đơn vị
trong VNPT.
Nhờ các thông số cung cấp bởi hệ thống, đối tượng chủ quản dịch vụ sẽ có thơng tin trực
quan, đa chiều và sẽ có những chỉ đạo kịp thời đối với công tác khai thác kinh doanh dịch
vụ Internet băng rộng (HSI) nói riêng và dịch vụ NGN nói chung.

3.4.2 Các bước thực hiện
Hệ thống thử nghiệm được tiến hành qua các bước như sau:


17
Dữ liệu chi
tiết lưu
lượng

Dữ liệu lưu
lượng theo
dịch vụ


Dữ liệu đơn
vị thuê

Dữ liệu
quản lý th iết
bị

Dữ liệu lưu
lượng tru ng
bìn h giờ cao
điểm

Hệ thốn g ETL

Dữ liệu por t

Kh o dữ liệu
DataW areh ou se

Dữ liệu lưu
lượn g theo
dịch vụ

Dữ liệu dun g
lượng

Dữ liệu du ng
lượn g theo
dịch vụ


Repository

100

90

80

Publish
 Report

70

Hình 0-1: Các bước thực hiện

Bước 1: Làm sạch dữ liệu thô bằng hệ thống ETL
Bước 2: Tính tốn và trích rút các thông tin cần thiết từ dữ liệu
Bước 3: Đưa vào kho dữ liệu DataWarehouse
Bước 4: Xử dụng hệ thống OBI thiết kế datamart
Bước 5: Thiết kế báo cáo
Bước 6: Cung cấp báo cáo cho người dùng sử dụng

3.4.3 Thiết kế cấu trúc dữ liệu thử nghiệm
Bảng 0-1:Bảng dữ liệu theo trục thời gian
STT

Tên Trường

Kiểu dữ liệu


1

CALENDAR_KEY

NUMBER

2

DAY_ID

DATE

3

WEEK_DAY_SHORT

VARCHAR2

4

DAY_NUM_OF_WEEK

NUMBER

5

MONTH_ID

VARCHAR2


6

MONTH_TIME_SPAN

NUMBER

7

MONTH_END_DATE

DATE

8

MONTH_SHORT_DESC

VARCHAR2


18
9

MONTH_LONG_DESC

VARCHAR2

10

MONTH_SHORT


VARCHAR2

11

MONTH_LONG

VARCHAR2

12

QUARTER_ID

VARCHAR2

13

QUARTER_TIME_SPAN

NUMBER

14

QUARTER_END_DATE

DATE

15

QUARTER_NUM_OF_YEAR NUMBER


16

YEAR_ID

VARCHAR2

17

YEAR_TIME_SPAN

NUMBER

18

WEEK_NUM_OF_YEAR

NUMBER

19

WEEK_ID

NUMBER

20

WEEK_SHORT

VARCHAR2


21

WEEK_END_DATE

DATE

22

DAY_J

NUMBER

23

DAY_ID_VN

VARCHAR2

24

YEAR_AND_WEEK

NUMBER

25

YEAR_AND_MONTH

NUMBER


Bảng 0-2: Bảng dữ liệu tổng hợp lưu lượng
STT

Tên Trường

Kiểu dữ liệu

1

CALENDAR_KEY

NUMBER

2

PROVINCE_ID

NUMBER

3

SERVICE_ID

NUMBER

4

DEVICE_ID


NUMBER

5

DESCR

VARCHAR2

6

DATA

NUMBER
Bảng 0-3:Bảng dữ liệu đơn vị thuê


19
S
TT

Tên Trường

Kiểu dữ liệu

1

PROVINCE_ID

NUMBER (10)


2

PROVINCE_CODE

VARCHAR2 (50 Byte)

3

PROVINCE_NAME

VARCHAR2 (150 Byte)

4

AREA REGION

VARCHAR2 (100 Byte)

5

DB_NAME

VARCHAR2 (50 Byte)

6

DB_SCHEMA

VARCHAR2 (50 Byte)


Bảng 0-4: Bảng dữ liệu dịch vụ
S
TT

Tên Trường

Kiểu dữ liệu

1

ID

NUMBER

2

NAME

VARCHAR2
Bảng 0-5: Bảng dữ liệu thiết bị

S
Tên Trường

TT

3.5

Kiểu dữ liệu


1

ID

NUMBER

2

IP

NVARCHAR2

3

COMMUNITY

NVARCHAR2

4

TYPE

NVARCHAR2

5

SYSDESCR

NVARCHAR2


6

SYSNAME

NVARCHAR2

7

NOTE

NVARCHAR2

8

SNMPGET

NUMBER

Ứng dụng triển khai


20

3.5.1 Cài đặt Oracle business intelligence
3.5.2 Cài đặt và thử nghiệm hệ thống với số liệu mẫu
Cài đặt kho siêu dữ liệu, thiết kế các chiều dữ liệu, chuẩn bị các đối tượng phục vụ thiết
kế báo cáo

Hình 0-1 Oracle BI Administrator


Hình 0-2 Quản trị hệ thống OBI server


21

Hình 0-3 Thiết kế báo cáo

3.5.3 Biểu đồ và mẫu báo cáo phân tích và dự báo dựa trên cơng nghệ OBI
Trong phần này tác giả sẽ demo một số báo cáo tổng hợp và phân tích lưu lượng và dịch
vụ. Báo cáo có các chiều xem: Thời gian, Đơn vị thuê. Các chiều xem có các mức như sau:
Thời gian à Năm à Tháng à Ngày
Đơn vị thuê à Vùng(TT1:miền bắc,TT2: miền trung, TT3 miền nam) à Đơn vị

Hình 0-1 Báo cáo tổng hợp lưu lượng theo dịch vụ và khu vực

3.6

Đánh giá kết quả thử nghiệm


22
Trong q trình cài đặt thử nghiệm theo mơ hình đề xuất, học viên nhận thấy được một
số lợi ích được đối chiếu so sánh trong hình dưới đây:
Các yếu tố \ Kết quả

Chưa triển khai

Khi triển khai

Dữ liệu về lưu lượng, Tồn tại dưới dạng file text và không Lưu trữ tập trung tại một nơi và

dịch vụ, đơn vị thuê, được lưu trữ theo thời gian

theo lịch sử để dễ dàng khai

thiết bị

thác

Nhân sự để thực hiện Hàng ngày, tuần q tốn nhiều nhân sự Khơng cần nhân sự cho việc
báo cáo

cho việc thu thập thống kế báo cáo cho thực hiện các báo cáo
lãnh đạo. Đôi khi số liệu không được
tin cậy

Định dạng các báo cáo

Txt, excel, word

Hiển thị số liệu trên Web, biểu
đồ tăng giảm

Khả năng thay đổi các Cần nhân sự thực hiện

Người theo dõi, quản lý có thể

báo cáo

tự xây các báo cáo theo nhu cầu
riêng


Độ tin cậy của thông Tùy thuộc người xây dựng báo cáo

Chính xác, tin cậy do phần

tin

mềm sinh tự động.

3.7

Kết chương
Trong chương 3 học viên đã thiết kế mô hình triển khai hệ thống thử nghiệm, xây

dựng cấu trúc cơ sở dữ liệu theo chủ đề nhằm mục đích phân loại các lưu lượng và dịch vụ,
từ đó xây dựng các tiêu chí báo cáo để xác định các nhu cầu sử dụng lưu lượng và dịch vụ.
Bên cạnh đó cũng chỉ ra một số hạn chế trong việc phân tích dữ liệu và tổng hợp các
thơng tin. Từ việc phân tích các hạn chế đó, dựa trên kiến trúc của mơ hình ra quyết định
BI, học viên đề xuất, phân tích thiết kế và xây dựng các báo cáo lưu lượng, lưu lượng theo
dịch vụ, đơn vị thuê. Phần cuối cùng trong chương minh họa các kết quả đã xây dựng được
về CSDL, các biểu đồ, các giao diện báo cáo.


23

KẾT LUẬN
Luận văn đã đưa ra cái nhìn từ tổng quan đến chi tiết của hệ thống OBI bao gồm khái
niệm BI, vai trò đối với doanh nghiệp cũng như kiến trúc và các thành phần của hệ thống
OBI.
Tuy nhiên, trong khuôn khổ luận văn tốt nghiệp, sản phẩm mẫu còn một số hạn chế. Thứ

nhất, dữ liệu thu được mới ở khía cạnh lưu lượng trung bình giờ cao điểm, dịch vụ sử dụng,
thông tin thiết bị và đơn vị thuê. Thứ hai, mức độ thông tin đưa ra chưa sâu, chưa nhiều. Thứ
ba: mới ứng dụng được cho một phần rất nhỏ của Viễn thông.


24

TÀI LIỆU THAM KHẢO
[1] Business Intelligence: Data Mining and Optimization for Decision Making. Carlo
Vercellis (2009)
[2] Successful BUSINESS INTELLIGENCE Secrets to Making BI a Killer App. Cindi
Howson (2008)
[3] Business Intelligence Roadmap: The Complete Project Lifecycle for Decision-Support
Applications. Larissa T. Moss, Shaku Atre (2003)
[4] Data Mining and Market Intelligence for Optimal Marketing Returns. Susan Chiu
Domingo Tavella
[5] Beyond Data Warehousing: What’s Next in Business Intelligence? Matteo Golfarelli
DEIS, Stefano Rizzi DEIS, Iuris Cella Gruppo
[6] BUSINESS INTELLIGENCE: CONCEPTS, COMPONENTS, TECHNIQUES AND
BENEFITS (2005 - 2009): JAYANTHI RANJAN Institute of Management Technology,
Ghaziabad, Uttar Pradesh, India.
[7] Decision Support Systems(2002): Marek J. Druzdzel and Roger R. Flynn, University of
Pittsburgh Pittsburgh.
[8] SAP Business Intelligence: Egger, Fiechter, Kramer,Sawicki, Straub, Weber.
[9]

Oracle

business


intelligence

:

/>
analytics/business-intelligence/index.html [Truy cập: 10/01/2013].


×