HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
NGUYỄN MINH TUẤN
NGHIÊN CỨU ỨNG DỤNG MÔ HÌNH OBI CHO PHÂN TÍCH DỰ
BÁO SỐ LIỆU KINH DOANH TRONG DOANH NGHIỆP VIỄN
THÔNG
Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01
TÓM TẮT LUẬN VĂN THẠC SĨ
HÀ NỘI -2013
1
Luận văn được hoàn thành tại:
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Người hướng dẫn khoa học: TS TRỊNH ANH TUẤN
Phản biện 1: …………………………………………………………………………
Phản biện 2: …………………………………………………………………………
Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học viện Công
nghệ Bưu chính Viễn thông
Vào lúc: giờ ngày tháng năm
Có thể tìm hiểu luận văn tại:
- Thư viện của Học viện Công nghệ Bưu chính Viễn thông
2
MỞ ĐẦU
Khi DN hoạt động hiệu quả thì việc mở rộng phạm vi trên nhiều tỉnh thành, hay
nhiều quốc gia là nhu cầu tất yếu. Song song với việc phát triển như thế, thì ban quản trị
cũng vấp phải rất nhiều khó khăn trong quản lý. Dữ liệu của công ty, tập đoàn nằm rải rác ở
nhiều nơi và dưới nhiề u hình thức khác nhau. Do đó, bất cứ nhu cầu truy vấn, phân tích hay
so sánh giữa các vùng với nhau đều tiêu tốn rấ t nhiều thời gian và công sức. Với Data
Warehouse (Kho dữ liệu) của BI, những dữ liệu quan trọng nằm rải rác nhiều nơi, dưới
nhiều định dạng khác nhau của DN sẽ được trích xuất đều đặn và được tập hợp lại thành
một cấu trúc thống nhất. Qua đó những báo cáo từ chi tiết đến tổng quát của toàn DN đều
luôn đảm bảo được tính chính xác và kịp thời. “Kho dữ liệu” đã được rất nhiều tập đoàn lớn
nhìn nhận là một phần quan trọng trên bước đường toàn cầu hóa của họ.
BI là giải pháp công nghệ mà các tổ chức dùng để thu thập, lưu trữ, phân tích và xử
lý dữ liệu nhằm giúp các nhà quả n lý đưa ra các quyết định hiệu quả hơn. BI cung cấp một
cách nhìn toàn cảnh hoạt động của tổ chức từ quá khứ, đến hiện tại cũng như các dự đoán
trong tương lai. Việc đó giúp cho các doanh nghiệp đưa ra các quyết định kinh doanh hiệu
quả hơn:
Xác định được vị trí và sức cạnh tranh của DN
Phân tích thói quen sử dụng dịch vụ của khách hàng
Xác định mục đích và chiến lược Marketing
Dự đoán tương lai của doanh nghiệp
Xây dựng chiến lược kinh doanh
Giữ được khách hàng có giá trị và dự đoán khách hành tiềm năng
Các nhà cung cấp dịch vụ Viễn thông hàng đầu ở Việt Nam. Trong những năm gần
đây, luôn chú trọng công tác cung cấp dịch vụ, đảm bảo dịch vụ, nâng cao chất lượng sản
phẩm tới khách hàng một cách nhanh chóng và thuận tiện. Để thực hiện việc đó, các thành
phần và kiến trúc của công nghệ BI được nghiên cứu ứng dụng hỗ trợ doanh nghiệp trong
việc ra quyết định hiệu quả và kịp thời.
Trước thực trạng một số hạn chế như hiện nay, học viên đề xuất việc “xây dựng hệ
thống phân tích và dự báo số kinh doanh trong doanh nghiệp viễn thông” dựa trên kiến trúc
của hệ thống (BI) áp dụng mô hình Oracle Business Intelligence (OBI).
3
Nội dung và mục tiêu của luận văn gồm 3 phần chính:
Chương 1: Kinh doanh thông minh. Cung cấp cái nhìn tổng quát về hệ thống quản trị
bao gồm khái niệm của hệ thống, vai trò của hệ thống đối với doanh nghiệp, thành phần và
kiến trúc của hệ thống trong tổng thể kiến trúc của doanh nghiệp.
Chương 2: Giới thiệu mô hình OBI. Cung cấp cái nhìn tổng quát về hệ thống OBI
bao gồm kiến trúc và các thành phần của hệ thống.
Chương 3: Đề xuất giải pháp hệ thống OBI cho dữ liệu lưu lượng và dịch vụ trong
doanh nghiệp Viễn thông: xây dựng và thiết kế cơ sở dữ liệu áp dụng giải pháp ở trên để
xây dựng các báo cáo phân tích, biểu đồ kinh doanh thông minh trong dữ liệu lưu lượ ng và
dịch vụ của doanh nghiệp Viễn thông, Đề xuất mô hình cài đặt và triển khai thử nghiệm,
đánh giá kết quả của việc thử nghiệm.
4
CHƯƠNG 1. TỔNG QUAN VỀ ETL TRONG KHO DỮ LIỆU
1.1 Giới thiệu
1.1.1 Business Intelligence là gì ?
Hệ hỗ trợ quản trị kinh doanh thông minh (BI) là qui trình và công nghệ mà các
doanh nghiệp dùng để kiểm soát dữ liệu, khai phá tri thức giúp cho các doanh nghiệp có thể
đưa ra các quyết định hiệu quả hơn trong hoạt động kinh doanh của mình. Công nghệ BI (BI
technology) cung cấp một cách nhìn toàn cảnh hoạt động của doanh nghiệp từ quá khứ, hiệ n
tại và các dự đoán tương lai. Mục đích của BI là hỗ trợ cho doanh nghiệp ra quyết định tốt
hơn.
1.1.2 Vấn đề cốt lõi đối với BI
Hệ thống BI đơn giản có thể được xem là sự kết hợp của 3 thành phần chính như sau:
Hình 1.1.2-1 Cơ bản về hệ thống BI
Trong đó:
- Data Warehouse (Kho dữ liệu): Chứa dữ liệu tổng hợp của doanh nghiệp.
- Data Mining (Khai phá dữ liệu): Các kỹ thuật dùng để khai phá dữ liệu và phát hiện
tri thức như phân loại (Classification), phân nhóm (Clustering), phát hiện luật kết hợp
(Association Rule), dự đoán (Predcition),…
Business Analyst (Phân tích kinh Doanh): Các nhà lãnh đạo doanh nghiệp đưa ra những
quyết định chiến lược đối với hoạt động kinh doanh của doanh nghiệp.
Phân tích
nghiệp vụ
Khai phá
dữ liệu
Kho dữ liệu
Hệ hỗ trợ
kinh doanh
thông minh
5
1.1.3 Lịch sử phát triển công nghệ Business Intelligence BI
Hệ thống kinh doanh thông minh trên thế giới đã có một lịch sử khá lâu đời. Năm
1958, một chuyên gia nghiên cứu của IBM đã đưa ra thuật ngữ “Business Intelligence” và
định nghĩa nó như là “khả năng nhìn nhận những mối quan hệ hiện có để rồi đề ra các hành
động nhằm đạt được mục tiêu”.
Năm 1989, Howard Dresner (sau này là chuyên gia phân tích của Gartner Group) đề
xuất “kinh doanh thông minh” như là một lớp vỏ bọc để miêu tả “các khái niệm và phương
pháp để cải thiện việc ra quyết định trong kinh doanh bằng cách sử dụng các hệ thống hỗ trợ
trên thực tế”. Cho đến cuối những năm 1990, BI đã được sử dụng rộng rãi.
Business Intelligence hiện nay vẫn giữ nguyên ý nghĩa của nó nhưng được phát triển
rộng khắp trên nhiều lĩnh vực. Mặc dù chúng ta gọi là BI nhưng khái niệm và các kỹ thuật
của BI có thể dùng được cho hầu hết các lĩnh vực như: kinh doanh, viễn thông(Telecom),
giáo dục (Education), chính phủ (Government), chăm sóc sức khỏe (health care)….
1.1.4 Vai trò của hệ thống BI trong doanh nghiệp
Đối với các tổ chức kinh doanh luôn đặt tiêu chí hàng đầu “Thời gian chính là tiền
bạc”, do đó họ không chỉ đơn thuần quả n lý hiệu quả hoạt động kinh doanh qua các chỉ tiêu
tài chính, kinh doanh, sản xuất, hệ thống phân phối mà còn quản lý thông qua một ma trận
các chỉ số hiệu suất chính (Key Performance Index - KPI) của tập hợp nhiều bộ phận với
nhau trong toàn bộ chuỗi cung ứng và hoạt động của doanh nghiệp.
1.2 Khái niệm về mô hình BI
1.2.1 Khái niệm hệ hỗ trợ ra quyết định BI
Khác với hệ hỗ trợ quản trị thông thường, mục đính chính của hệ thống hỗ trợ ra
quyết định BI là cung cấp cho các chuyên gia có tri thức công cụ và phương pháp cho phép
họ quyết đưa ra những quyết định hiệu quả và đúng thời gian.
Quyết định hiệu quả: Một quyết định hiệu quả là một quyết định có tác động tích
cực đến hoạt động sản xuất, kinh doanh, bán hàng hay quản lý của doanh nghiệp. Ngoài ra,
các kết quả tích cực đạt đ ượ c từ việc ra quyết định cũng phải tương xứng với sự đầu tư cho
chiến dịch thực hiện quyết định đó.
6
Quyết định đúng thời điểm: Các doanh nghiệp hoạt động trong môi trường kinh tế
cạnh tranh cao và năng động. Như một hệ quả, khả năng phản ứng nhanh chóng với các
hoạt động của đối thủ cạnh tranh và với điều kiện mới của thị trường chính là nhân tốt cố t
yếu trong sự thành công và thậm chí là sự sống của doanh nghiệp.
1.2.2 Dữ liệu, thông tin và tri thức
Hệ hỗ trợ quản trị không dựa trên khái niệm duy nhất là dữ liệu mà đề cập đến các
khái niệm theo mức độ giá trị của dữ liệu: đó là dữ liệu, thông tin và tri thức.
Dữ liệu : Dữ liệu có trong hệ thống thông tin của các tổ chức, doanh nghiệp. Các dữ liệu
được sinh ra từ các giao dịch, các hoạt động quản trị, bán hàng và có thể từ nhiều nguồn
khác nhau từ bên ngoài.
Thông tin: là kết quả của hoạt động trích lọc và xử lý thông tin trên dữ liệu, và nó
xuất hiện một cách có ý nghĩa cho những đối tượng nhận trong những lĩnh vực cụ thể.
Tri thức: Thông tin được chuyể n thành tri thức khi nó được sử dụng để ra quyết định
hay phát triển những hành động tương ứng.
1.2.3 Mục tiêu và nhiệm vụ của hỗ trợ quyết định BI
Mục đích của hệ thống BI đượ c là giải pháp biến đổi dữ liệu từ kho dữ liệu hoặc dữ liệu chủ
đề thành thông tin và tri thức, từ cách tổ ng hợp, phân tích các thông tin đó doanh nghiệp có
được các tư duy chiến lược, hành động hiệu quả hoặc giá trị của hệ thống BI mang đến sự
đúc kết các ý tưởng đem lại các hợp tác mới, khách hàng mới, tạo ra các thị trường mới,
cung cấp các sản phẩm mới, dịch vụ mới cho khách hàng
1.3 Kiến trúc và thành phần mô hình BI
1.3.1 Kho dữ liệu (Datawarehouse)
Kho dữ liệu (Data Warehouse) là tập hợp của các CSDL tích hợp, hướng chủ đề,
được thiết kế để hỗ trợ cho chức năng trợ giúp quyết định mà mỗi đơn vị dữ liệu đều liên
quan tới một khoảng thời gian cụ thể
1.3.1.1 Một data warehouse thường có các tính chất sau :
- Dữ liệu có tính tích hợp
- Dữ liệu gắn thời gian và có tính lịch sử
- Dữ liệu tổng hợp và chi tiết
7
- Lưu trữ lâu dài
- Bất biến theo thời gian
- Dữ liệu chỉ đọc
1.3.1.2 Các lớp kiến trúc của một Data Warehouse thông thường
- Data Source Layer (Lớp dữ liệu nguồn)
- Data Extraction Layer
- Staging Area
- ETL Layer
- Data Storage Layer
1.3.1.3 Kho dữ liệu chủ đề (Datamart)
Kho dữ liệu chủ đề (Datamart - DM) là CSDL có những đặc điểm giống với kho dữ
liệu nhưng với quy mô nhỏ hơn và lưu trữ dữ liệu về một lĩnh vự c, một chuyên ngành. Các
Datamart có thể được hình thành từ một tập con dữ liệu của kho dữ liệu hoặc cũng có thể
được xây dựng độc lập và sau khi xây dựng xong các Datamart có thể được kết nối, tích hợp
lại với nhau tạo thành kho dữ liệu.
Có thể chia Datamart ra làm 2 loại: Datamart độc lập và Datamart phụ thuộc
1.3.2 Xử lý dữ liệu trực tuyến (Online Analysis Processing - OLAP)
1.3.2.1 Khái niệm
OLAP là mộ t kỹ thuật sử dụng các biểu diễn dữ liệu đa chiều gọi là các khối (cube) nhằm
cung cấp khả năng truy xuất nhanh đến dữ liệu của kho dữ liệu. Tạo khối (cube) cho dữ liệu
trong các bảng chiều (dimension table) và bảng sự kiện (fact table) trong kho dữ liệu và
cung cấp khả năng thực hiện các truy vấn tinh vi và phân h cho các ứng dụng client
1.3.2.2 Ưu điểm của OLAP
OLAP là kỹ thuật cho phép các ứng dụng client truy xuất hiệu quả dữ liệu này. OLAP
cung cấp nhiều lợi ích cho người phân tích như:
- Cung cấp mô hình dữ liệu đa chiều trực quan cho phép dễ dàng lựa chọn, định hướng
và khám phá dữ liệu
- Cung cấp một ngôn ngữ truy vấn phân tích, cung cấp sức mạnh để khám phá các mối
quan hệ trong dữ liệu kinh doanh phức tạp.
8
- Dữ liệu được tính toán trước đối với các truy vấ n thường xuyên nhằm làm cho thời
gian trả lời rất nhanh đối với các truy vấn đặc biệt
- Cung cấp các công cụ mạnh giúp người dùng tạo các khung nhìn mới của dữ liệu dựa
trên một tập các hàm tính toán đặc biệt
1.3.3 Khai phá dữ liệu(Datamining)
Khai phá dữ liệu là quá trình khám phá các tri thức mới và các tri thức có ích tiề m ẩn
trong nguồn dữ liệu đã có. Hiện nay, ngoài thuật ngữ khai phá dữ liệu, người ta còn dùng
một số thuật ngữ khác có ý nghĩa tương tự như: khai phá tri thức từ CSDL (Knowlegde
Mining from Databases), trích lọc dữ liệu (Knowlegde Extraction), phân tích dữ liệu/mẫu
(data/pattern analysis), khảo cổ dữ liệu (Data Archaeology), nạo vét dữ liệu (Data
Dredging).
Diễn giải các bước trong quá trình khai phá dữ liệu :
Bước 1: Làm sạch dữ liệu (data cleaning): là bước loại bỏ nhiễu hoặc các dữ liệu
không thích hợp.
Bước 2: Tích hợp dữ liệu (data integration): là bước tích hợp dữ liệu từ các nguồn
khác nhau.
Bước 3: Chọn dữ liệu (data selection): ở bước này, những dữ liệu liên quan đến
nhiệm vụ sẽ được thu thập từ CSDL.
Bước 4: Chuyển đổi dữ liệu (data transformation): trong bước này, dữ liệu sẽ được
chuyển đổi về dạng phù hợp cho việc khai phá bằng cách thực hiện các thao tác nhóm hoặc
tập hợp.
Bước 5: Khai phá dữ liệu (data mining): là giai đoạn thiết yếu, trong đó các phương
pháp thông minh sẽ được áp dụng để trích xuất ra các mẫu dữ liệu.
Bước 6: Đánh giá mẫu (pattern evaluation): đánh giá sự hữu ích của các mẫu biểu
diễn tri thức dựa vào một số phép đo.
Bước 7: Trình diễn dữ liệu (knowlegde presentation): sử dụng các kĩ thuật trình diễn
và trực quan hoá dữ liệu để biểu diễn tri thức khai phá được cho người sử dụng.
9
CHƯƠNG 2. MÔ HÌNH OBI
2.1 Giới thiệu
2.2 Các thành phần chính của mô hình OBI
OBI là hệ thố ng cung cấp các tính năng rất mạnh hỗ trợ cho các ứng dụng BI trong
doanh nghiệp. Một hệ thống OBI bao gồm các thành phần: Oracle Business Intelligence
Enterprise Edition 11g, Oracle BI Publisher, Oracle Essbase, Oracle Scorecard and Strategy
Management, và Oracle Essbase Analytics Link (EAL). Dưới đây là cái nhìn tổng thể về các
thành phần chính trong hệ thống này
2.2.1 Các thành phần của Server
OBI Server là hệ thống server phục vụ cho việc truy vấn, lập báo cáo và phân tích dữ
liệu một cách nhanh chóng và hiệu quả. Hệ thống này cung cấp các dịch vụ cho các thành
phần khác của hệ thống BI như các ứng dụng phân tích số liệu, các bảng điều khiển, các ứng
dụng khai phá dữ liệu.
Hình 0-1 – Kiến trúc tổng quát của hệ thống OBI
Common Enterprise Information Model: mô hình mứ c ngữ cả nh của hệ thống OBI. Nó
được truy cập thông qua một API mở, do đó tích hợp được với các kênh dữ liệu cả dưới
dạng Oracle hoặc không phải Oracle.
10
Oracle BI Server: server phục vụ cho việc phân tích và trích xuất dữ liệu có khả năng
mở rộng và hiệu năng rất cao. Nó có khả năng tích hợp dữ liệu từ rất nhiều nguồn khác nhau
Oracle Essbase: server hỗ trợ việc xử lý phân tích trực tuyến (OLAP), cung cấp môi
trường cho việc phát triển các ứng dụng phân tích đặc thù cũng như các ứng dụng quản lý
hiệu năng của doanh nghiệp
Oracle Essbase Analytics Link: Cung cấp một kênh truyền tải các báo cáo quản trị và
phân tích tài chính dưới hình thức thời gian thực (real-time) hoặc khi có nhu cầu (on-
demand) từ Oracle Hyperion Financial Management tới Oracle Essbase.
2.2.2 Các thành phần cung cấp cho người dùng cuối
Oracle BI Foundation Suite cung cấp một bộ tích hợp đầy đủ các sản phẩm bổ sung
cung cấp đầy đủ các chức năng phân tích và định kiểu. Mô tả sau đây là kỹ thuật nền tảng
của những khả năng đó cũng như thông tin chi tiết về người dùng cuối và khả năng sản
phẩm, đặc biệt là phân tích, tìm kiếm, báo cáo thương mại và chiến lược quản lý.
- Enterprise Reporting: Oracle Business Intelligence (BI) Publisher (trước đây là XML
Publisher) là giải pháp hỗ trợ việc tạo, quản lý và phân phối các văn bản với nhiều
định dạng, ví dụ như các báo cáo điều hành dưới dạng PDF, các thư báo vận chuyển,
kiểm tra, chào hàng, tiếp thị…
- Ad hoc Query and Reporting: Cung cấp môi trường truy vấn và phân tích dữ liệu
mạnh cho phép tạ o ra một hướng nhìn logic từ nhiều nguồn dữ liệu khác nhau trên
một giao diện Web.
- Interactive Dashboards: các bảng điều khiển dưới dạng Web có tính tương tác cao có
chức năng hiển thị các thông tin được cá nhân hóa hỗ trợ cho người dùng trong việc
ra quyết định.
- Scorecard and Strategy Management: Mở rộng Oracle BI Enterprise Edition
(OBIEE) với các tính năng cho phép các mục tiêu chiến lược của tổ chức có sự tương
tác và luôn được giám sát.
- Actionable Intelligence: Bao gồm một Action Framework cung cấp khả năng gọi các
luồng công việc, các web service, nội dung web, nội dung BI bổ sung, phương thức
java và các thủ tục riêng khác từ bất kỳ một kênh phân phối nào.
11
- Integrated Search: Cung cấp khả năng tìm kiế m dựa trên việc đánh chỉ mục các bảng
điều khiển, bảng phân tích, khung nhìn, các cảnh báo, các chỉ số KPI, các bảng
Scorecard, các báo cáo Publisher.
- BI on the go: Cung cấp các tính năng của hệ thống BI trong trường hợp người dùng
không kết nối trực tiếp với hệ thống mạng của doanh nghiệp.
2.2.3 Các thành phần quản trị hệ thống
Oracle Enterprise Manager Integration: Cung cấp các công cụ quản trị tập trung dưới
dạng web. Cho phép người quản trị hệ thống OBI quản lý nhiều hệ thống server khác nhau
trên một giao diện.
2.3 Các đặc điểm của hệ thống OBI
OBI được thiết kế nhằm đưa ra các giải pháp cho các yêu cầu phân tích số liệu sản
xuất kinh doanh của doanh nghiệp. Nó bao gồm một loạt các tính năng như truy vấn và
phân tích dữ liệu, đưa ra các bảng điều khiển, scorecard, lập báo cáo, cảnh báo, phân tích từ
xa… Hệ thống được thiết kế với các đặc điểm cơ bản sau:
- Khung nhìn thông tin mức ngữ cảnh là thống nhất
- Người dùng tự phục vụ
- Truy nhập thông tin theo thời gian thực
- Đưa ra các hoạt động dựa trên kết quả phân tích
- Platform thống nhất
2.4 Kết chương
Trong chương này, học viên đã tìm hiểu đượ c một số các lý thuyết, các kĩ thuật được
sử dụng trong hệ thống OBI như: kiến trúc và các thành phần củ a OBI. Trong chương này,
cũng chỉ ra những mục tiêu và nhiệm vụ mà học viên sẽ phải đ ạt được trong luận văn. Đọc
xong chương này, người đọc đã có thể có một cái nhìn tổng quan có tính hệ thống về đề tài
đang được thực hiện.
12
CHƯƠNG 3. ĐỀ XUẤT GIẢI PHÁP HỆ THỐNG PHÂN TÍCH VÀ DỰ
BÁO SỐ LIỆU KINH DOANH TRONG DOANH NGHIỆP VIỄN
THÔNG DỰA TRÊN MÔ HÌNH OBI
3.1 Đặt vấn đề
VNPT là doanh nghiệp cung cấp dịch vụ viễn thông hàng đầu của Việt Nam với thị phần rất
lớn đối với dịch vụ khác nhau như:
- Dịch vụ Internet
- Dịch vụ IPTV
- Dịch vụ VPN
- Dịch vụ thoại cố định
- Dịch vụ Gphone
- Các dịch vụ di động
- Các dịch vụ giá trị gia tăng trên các dịch vụ cơ bản
Một số bài toán cơ bản hiện tại của VNPT đang rất mong muốn thực hiện để phục vụ cho
các cấp quản lý và các cấp lãnh đạo có thể kể ra như sau:
- Thông tin chính xác về số thuê bao hiện có của các dịch vụ (theo vùng, các
gói cước )
- Thông tin chính xác về số lượ ng khách hàng sử dụng đa dịch vụ củ a VNPT
(HSI, IPTV, Mobile) theo tất cả các VNPT Tỉnh trên toàn quốc
- Số thuê bao rời mạng trên dịch vụ theo các Tỉnh
- Thông tin về chất lượng mạng lưới gắn với thông tin về dịch vụ
- Thông tin chất lượng mạng lưới gắn với thông tin khách hàng
- Thông tin chất lượng mạng lưới, chất lượng dịch vụ gắn với doanh thu trung
bình trên mỗi khách hàng (ARPU)
- Doanh thu các dịch vụ củ a các Tỉnh gắn với thông tin điều hành cung cấp đảm
bảo dịch vụ
- Hiệu quả đem lại của các gói dịch vụ so với đầu từ ban đầu và chi phí vận
hành (ROI)
13
3.1.1 Nhu cầu thực tế
Tất cả các thông tin vừa nêu trong phần trên về cơ bản đều hữu ích cho người quản lý dịch
vụ, người vận hành dịch vụ và những người hoạch định chiến lược kinh doanh đối với các
dịch vụ.
Từ các thông tin liệt kê trên hiện chưa có là
- Chưa thể hiểu được khách hàng và các yêu cầu của khách hàng
- Chưa thể đưa ra các dịch vụ mới cho khách hàng dựa trên yêu cầu
- Chưa thể thấy rõ được hiệu quả sử dụng dịch vụ của khách hàng
- …
Với những vấn đề như vậy, khả năng mất khách hàng, mất thị trường hay thua kém so với
đối thủ là không thể tránh đượ c.
Do vậy việc cần có một hệ thống BI để phụ c vụ cho các nhu cầu quản lý, điều hành, nhu cầu
phân tích thị trường, phân tích dịch vụ, phân tích khách hàng và hàng loạt những nhu cầu
khác là rất cấp thiết.
3.2 Mô tả bài toán thử nghiệm
3.2.1 Lựa chọn nguồn dữ liệu
Dựa trên khảo sát thực tế tác giả xây dựng bả ng tổng hợp các nguồn dữ liệu được
đưa ra dựa trên việc phân tích các hệ thống phục vụ công tác quản lý vận hành khai thác các
dịch vụ cơ bản của VNPT. Các đối tượng tham gia gồm có: Các công ty dịch vụ di động,
VNP, VMS, công ty hạ tầng VTN, công ty chủ quản dị ch vụ Internet VDC, công ty chủ
quản dịch vụ IPTV VASC, công ty chủ quản dịch vụ VPN và VoIP: VTN.
Trong phạm vi đề tài này tác giả lựa chọn dịch vụ (NP, VoIP SP, VPN SP) của công
ty hạ tầng VTN để phân tích lưu lượng và dịch vụ.
3.2.2 Phân tích biểu mẫu báo cáo và chỉ tiêu phục vụ phân tích và dự báo
Hệ thống báo cáo số liệu, biểu đồ phân tích hiện tại của đơn vị Viễn thông đư ợc xây dựng
dựa trên nhu cầu thực tế của người dùng, và chỉ cung cấp được thông tin theo một chiề u
nhất định. Vì vậy, để đả m bảo tính chính xác của số liệu thông tin và tối ưu hóa lưu trữ, xử
lý dữ liệu, học viên đã thực hiện thu thập, phân tích và xử lý các biểu mẫu, chỉ tiêu đối với
báo cáo về dữ liệu lưu lượng băng rộng, lưu lượng theo dịch vụ tại đơn vị như sau:
• Các mẫu báo cáo KPI gồm:
14
- Thống kê Top 10 đơn vị có lưu lượng cao trong tháng
- Thống kê Top 10 đơn vị có lưu lượng theo dịch vụ cao trong tháng
- Báo tăng giảm lưu lượng theo tháng
• Các mẫu báo cáo lưu lượng và dịch vụ gồm:
- Báo cáo lưu lượng theo ngày
- Báo cáo lưu lượng theo từng loại dịch vụ
- Báo cáo tổng hợp lưu lượng theo khu vực
- Báo cáo tổng hợp lưu lượng theo dịch vụ và khu vực
- Báo cáo tổng hợp lưu lượng theo tuần, tháng, năm
Dựa vào kết quả thu thập và phân tích ở trên học viên sẽ thiết kế hệ thống báo cáo, biểu đồ
để phục vụ hệ thống báo cáo phục vụ hỗ trợ quyết định cho đơn vị Viễn thông.
3.2.3 Phân loại và giới hạn dữ liệu đầu vào của hệ thống
• Dữ liệu chi tiết lưu lượng
Mỗi một kết nối trên mạng VN2 đi qua mỗi thiết bị tại một thời đều phát sinh một mẫu
tin của kết nối. Các mẫu tin này bao gồm các thông tin đặc tả thuộc tính quan trọng của kết
nối như : Địa chỉ IP, Port, tổng số bytes in và out của thiết bị. Thông thường các thông tin
trên không thể sử dụng được nếu thiếu thông tin về đơn vị thuê và Port đó được thuê dùng
cho dịch vụ gì.
• Dữ liệu lưu lượng theo dịch vụ
Mạng VN2 của Tậ p đoàn bưu chính viễn thông VNPT có cấu trúc rất phức tạp, được cấu
trúc bởi hàng ngàn thiết bị. Mỗi kết nối đ ượ c thiết lập bởi các port và dịch vụ được khai báo
đến từng Vlan.
• Dữ liệu đơn vị thuê
Cũng như các lĩnh vực kinh doanh lớn khác, các thông tin về đơn vị thuê cần được lưu
trữ để dùng cho các ứng dụng như tính cước, tiếp thị Thông tin về đơn vị thuê bao gồm
tên đơn vị, dịch vụ thuê, giá cước dịch vụ Thông thường dữ liệu đơn vị thuê phải được kế t
hợp với các dữ liệu khác, (ví dụ như dữ liệu chi tiết lưu lượng).
• Dữ liệu quản lý thiết bị
Dữ liệu thiết bị lưu trữ các thông tin thuộc tính của thiết bị như: địa chỉ IP, port, tên thiết
bị, hướng kết nối, đơn vị thuê…
• Dữ liệu port
15
Dữ liệu port lưu trữ các thông tin thuộc tính của port như: port, mô tả port, hướng kết
nối, thời gian bắt đầu, thời gian kết thúc, đ ơn vị thuê …
3.3 Xác định các mục tiêu
3.3.1 Mục tiêu gần
- Nắm được một nguồn dữ liệu cần có cho các yêu cầu báo cáo
- Có một số báo cáo mức cơ bản
- Trước mắt là báo cáo offline, quá trình lấy thông tin cho báo cáo là bán tự
động/tự động
- Chuẩn hóa được một số dữ liệu dữ liệu cơ bản
3.3.2 Mục tiêu xa
- Xây dựng được hệ thống BI dựa trên nền tảng công nghệ OBI cho các dịch vụ
của VNPT
- Có đầy đủ các mức độ báo cáo trong hệ thống từ báo cáo chung tới các báo
cáo đa chiều, các báo cáo dự báo, dự đoán, phân tích.
- Các báo cáo là realtime, việc thu thập và phân tích thông tin là hoàn toàn tự
động
- Chuẩn hóa được tất cả các dữ liệu cần có phục vụ các bài toán kinh doanh,
quản lý.
3.4 Mô hình triển khai
3.4.1 Đề xuất mô hình triển khai thử nghiệm
mô hình triển khai thử nghiệm
Căn cứ vào nhu cầu thực tế tại đơn vị tác giả đưa lựa chọn một số thành phần cơ bản để
đưa ra mô hình triển khai như sau:
16
Server
SNMP
VNPT NET
Theo dõi giám sát
Ra quyết định
DW
Web client
Web Server
Databaser
Server
Hình 0-1: Mô hình triển khai
Server SNMP thứ nhất đóng vai trò tự động lưu trữ các bản tin lấy từ các thiết bị
trong mạng core của công ty hạ tầng VTN dựa trên giao thức SNMP. Trong quá trình tự
động hóa các bản tin được lấy định kỳ 5 phút một lần, và được lưu trữ trên FTP server.
Công cụ ETL sẽ tự động lấy về vào cuối ngày và đẩy vào kho dữ liệu (DW).
Server thứ 2 gồm các thành phần:
Kho dữ liệu (DW): là cơ sở dữ liệu được phân tích thiết kế, cài đặt trong DB Server
Khối ETL: các chương trình được cấu hình tự động login vào FTP server để
download bản tin SNMP.
Khối báo cáo: gồm các báo cáo dạng trực tuyến, báo cáo đồ họa và báo cáo theo định
dạng chuẩn của VNPT được cài đặt trên webserver.
Server thứ 2 có chức năng thu thập số liệu, phân tích các số liệu trong cơ sở dữ liệu
cung cấp cho các đối tượng quản lý để có cái nhìn tổng quát và đa chiều về các thông tin về
đơn vị thuê và lưu lượng sử dụng vào cách thức điều hành nội bộ và phối hợp các đơn vị
trong VNPT.
Nhờ các thông số cung cấp bởi hệ thống, đối tượng chủ quản dịch vụ sẽ có thông tin trực
quan, đa chiều và sẽ có những chỉ đạo kịp thời đối với công tác khai thác kinh doanh dịch
vụ Internet băng rộng (HSI) nói riêng và dịch vụ NGN nói chung.
3.4.2 Các bước thực hiện
Hệ thống thử nghiệm được tiến hành qua các bước như sau:
17
Dữ liệu chi
tiết lưu
lượng
Dữ liệu lưu
lượng theo
dịch vụ
Dữ liệu đơn
vị thuê
Dữ liệu
quản lý thiết
bị
Dữ liệu port
Hệ thốn g ETL
Kho dữ liệu
DataWarehouse
Dữ liệu lưu
lượng trung
bình giờ cao
điểm
Dữ liệu dung
lượng
Dữ liệu lưu
lượng theo
dịch vụ
Dữ liệu dung
lượng theo
dịch vụ
Repository
100
90
80
70
Publish4Report
Hình 0-1: Các bước thực hiện
Bước 1: Làm sạch dữ liệu thô bằng hệ thống ETL
Bước 2: Tính toán và trích rút các thông tin cần thiết từ dữ liệu
Bước 3: Đưa vào kho dữ liệu DataWarehouse
Bước 4: Xử dụng hệ thống OBI thiết kế datamart
Bước 5: Thiết kế báo cáo
Bước 6: Cung cấp báo cáo cho người dùng sử dụng
3.4.3 Thiết kế cấu trúc dữ liệu thử nghiệm
Bảng 0-1:Bảng dữ liệu theo trục thời gian
STT
Tên Trường
Kiểu dữ liệu
1
CALENDAR_KEY
NUMBER
2
DAY_ID
DATE
3
WEEK_DAY_SHORT
VARCHAR2
4
DAY_NUM_OF_WEEK
NUMBER
5
MONTH_ID
VARCHAR2
6
MONTH_TIME_SPAN
NUMBER
7
MONTH_END_DATE
DATE
8
MONTH_SHORT_DESC
VARCHAR2
18
9
MONTH_LONG_DESC
VARCHAR2
10
MONTH_SHORT
VARCHAR2
11
MONTH_LONG
VARCHAR2
12
QUARTER_ID
VARCHAR2
13
QUARTER_TIME_SPAN
NUMBER
14
QUARTER_END_DATE
DATE
15
QUARTER_NUM_OF_YEAR
NUMBER
16
YEAR_ID
VARCHAR2
17
YEAR_TIME_SPAN
NUMBER
18
WEEK_NUM_OF_YEAR
NUMBER
19
WEEK_ID
NUMBER
20
WEEK_SHORT
VARCHAR2
21
WEEK_END_DATE
DATE
22
DAY_J
NUMBER
23
DAY_ID_VN
VARCHAR2
24
YEAR_AND_WEEK
NUMBER
25
YEAR_AND_MONTH
NUMBER
Bảng 0-2: Bảng dữ liệu tổng hợp lưu lượng
STT
Tên Trường
Kiểu dữ liệu
1
CALENDAR_KEY
NUMBER
2
PROVINCE_ID
NUMBER
3
SERVICE_ID
NUMBER
4
DEVICE_ID
NUMBER
5
DESCR
VARCHAR2
6
DATA
NUMBER
Bảng 0-3:Bảng dữ liệu đơn vị thuê
19
S
TT
Tên Trường
Kiểu dữ liệu
1
PROVINCE_ID
NUMBER (10)
2
PROVINCE_CODE
VARCHAR2 (50 Byte)
3
PROVINCE_NAME
VARCHAR2 (150 Byte)
4
AREA REGION
VARCHAR2 (100 Byte)
5
DB_NAME
VARCHAR2 (50 Byte)
6
DB_SCHEMA
VARCHAR2 (50 Byte)
Bảng 0-4: Bảng dữ liệu dịch vụ
S
TT
Tên Trường
Kiểu dữ liệu
1
ID
NUMBER
2
NAME
VARCHAR2
Bảng 0-5: Bảng dữ liệu thiết bị
S
TT
Tên Trường
Kiểu dữ liệu
1
ID
NUMBER
2
IP
NVARCHAR2
3
COMMUNITY
NVARCHAR2
4
TYPE
NVARCHAR2
5
SYSDESCR
NVARCHAR2
6
SYSNAME
NVARCHAR2
7
NOTE
NVARCHAR2
8
SNMPGET
NUMBER
3.5 Ứng dụng triển khai
20
3.5.1 Cài đặt Oracle business intelligence
3.5.2 Cài đặt và thử nghiệm hệ thống với số liệu mẫu
Cài đặt kho siêu dữ liệu, thiết kế các chiều dữ liệu, chuẩn bị các đối tượng phục vụ thiết
kế báo cáo
Hình 0-1 Oracle BI Administrator
Hình 0-2 Quản trị hệ thống OBI server
21
Hình 0-3 Thiết kế báo cáo
3.5.3 Biểu đồ và mẫu báo cáo phân tích và dự báo dựa trên công nghệ OBI
Trong phần này tác giả sẽ demo một số báo cáo tổng hợp và phân tích lưu lượng và dịch
vụ. Báo cáo có các chiều xem: Thời gian, Đơn vị thuê. Các chiều xem có các mức như sau:
Thời gian ! Năm ! Tháng ! Ngày
Đơn vị thuê ! Vùng(TT1:miền bắc,TT2: miền trung, TT3 miền nam) ! Đơn vị
Hình 0-1 Báo cáo tổng hợp lưu lượng theo dịch vụ và khu vực
3.6 Đánh giá kết quả thử nghiệm
22
Trong quá trình cài đặt thử nghiệm theo mô hình đề xuất, học viên nhận thấy được một
số lợi ích được đối chiếu so sánh trong hình dưới đây:
Các yếu tố \ Kết quả
Chưa triển khai
Khi triển khai
Dữ liệu về lưu lượng,
dịch vụ, đơn vị thuê,
thiết bị
Tồn tại dưới dạng file text và không
được lưu trữ theo thời gian
Lưu trữ tập trung tại một nơi và
theo lịch sử để dễ dàng khai
thác
Nhân sự để thực hiện
báo cáo
Hàng ngày, tuần quí tốn nhiều nhân sự
cho việc thu thập thống kế báo cáo cho
lãnh đạo. Đôi khi số liệu không được
tin cậy
Không cần nhân sự cho việc
thực hiện các báo cáo
Định dạng các báo cáo
Txt, excel, word
Hiển thị số liệu trên Web, biểu
đồ tăng giảm
Khả năng thay đổi các
báo cáo
Cần nhân sự thực hiện
Người theo dõi, quản lý có thể
tự xây các báo cáo theo nhu cầu
riêng
Độ tin cậy của thông
tin
Tùy thuộc người xây dựng báo cáo
Chính xác, tin cậy do phần
mềm sinh tự động.
3.7 Kết chương
Trong chương 3 học viên đã thiết kế mô hình triển khai hệ thống thử nghiệm, xây
dựng cấu trúc cơ sở dữ liệu theo chủ đề nhằm mục đích phân loại các lưu lượng và dịch vụ,
từ đó xây dựng các tiêu chí báo cáo để xác định các nhu cầu sử dụng lưu lượng và dịch vụ.
Bên cạnh đó cũng chỉ ra một số hạn chế trong việc phân tích dữ liệu và tổng hợp các
thông tin. Từ việc phân tích các hạn chế đó, dựa trên kiến trúc của mô hình ra quyết định
BI, học viên đề xuất, phân tích thiết kế và xây dựng các báo cáo lưu lượng, lưu lượng theo
dịch vụ, đơn vị thuê. Phần cuối cùng trong chương minh họa các kết quả đã xây dựng đượ c
về CSDL, các biểu đồ, các giao diện báo cáo.
23
KẾT LUẬN
Luận văn đã đưa ra cái nhìn từ tổng quan đến chi tiết của hệ thống OBI bao gồm khái
niệm BI, vai trò đối với doanh nghiệp cũng như kiến trúc và các thành phần của hệ thống
OBI.
Tuy nhiên, trong khuôn khổ luận văn tốt nghiệp, sản phẩm mẫu còn một số hạn chế. Thứ
nhất, dữ liệu thu được mới ở khía cạnh lưu lượng trung bình giờ cao điểm, dịch vụ sử dụng,
thông tin thiết bị và đơn vị thuê. Thứ hai, mức độ thông tin đưa ra chưa sâu, chưa nhiều. Thứ
ba: mới ứng dụng được cho một phần rất nhỏ của Viễn thông.
24
TÀI LIỆU THAM KHẢO
[1] Business Intelligence: Data Mining and Optimization for Decision Making. Carlo
Vercellis (2009)
[2] Successful BUSINESS INTELLIGENCE Secrets to Making BI a Killer App. Cindi
Howson (2008)
[3] Business Intelligence Roadmap: The Complete Project Lifecycle for Decision-Support
Applications. Larissa T. Moss, Shaku Atre (2003)
[4] Data Mining and Market Intelligence for Optimal Marketing Returns. Susan Chiu
Domingo Tavella
[5] Beyond Data Warehousing: What’s Next in Business Intelligence? Matteo Golfarelli
DEIS, Stefano Rizzi DEIS, Iuris Cella Gruppo
[6] BUSINESS INTELLIGENCE: CONCEPTS, COMPONENTS, TECHNIQUES AND
BENEFITS (2005 - 2009): JAYANTHI RANJAN Institute of Management Technology,
Ghaziabad, Uttar Pradesh, India.
[7] Decision Support Systems(2002): Marek J. Druzdzel and Roger R. Flynn, University of
Pittsburgh Pittsburgh.
[8] SAP Business Intelligence: Egger, Fiechter, Kramer,Sawicki, Straub, Weber.
[9] Oracle business intelligence : />analytics/business-intelligence/index.html [Truy cập: 10/01/2013].