Tải bản đầy đủ (.pdf) (20 trang)

Xây dựng kho dữ liệu khách hàng sử dụng dịch vụ viễn thông phục vụ công tác quản lý

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.18 MB, 20 trang )



1

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG



TRẦN NAM QUỲNH


XÂY DỰNG KHO DỮ LIỆU KHÁCH HÀNG SỬ DỤNG DỊCH VỤ
VIỄN THÔNG PHỤC VỤ CÔNG TÁC QUẢN LÝ


CHUYÊN NGÀNH: TRUYỀN DỮ LIỆU VÀ MẠNG MÁY TÍNH
MÃ SỐ: 60.48.15

Ngư
ời h
ư
ớng dẫn khoa học:

PGS.TS. LÊ HỮU LẬP


TÓM TẮT LUẬN VĂN THẠC SĨ





HÀ NỘI - 2011














2

MỞ ĐẦU
1. Lý do chọn đề tài
Việc áp dụng công nghệ thông tin vào thực tiễn sản xuất kinh doanh đã
mang lại những hiệu quả và lợi ích to lớn. Các hệ thống thông tin từ chỗ chỉ giải
quyết những xử lý công việc hàng ngày nay đã tiến tới đáp ứng được những yêu
cầu ở mức độ cao hơn. Các nhà quản lý điều hành không những biết được công
việc đang diễn ra như thế nào mà còn biết cái gì sẽ xảy ra sau đó, có nghĩa là
thông tin mang tính phân tích và hệ thống thông tin có khả năng hỗ trợ quyết
định. Tuy nhiên việc xây dựng một hệ thống như thế vấp phải một số hạn chế về
mặt kỹ thuật, đặc biệt là khi kích thước cũng như độ phức tạp của môi trường
thông tin tăng lên. Lưu trữ phân tán ở nhiều dạng không tương thích với nhau,
thậm chí còn ở những dạng phi cấu trúc. Nhiều hệ CSDL đã được xây dựng
không tương thích với nhau và không tương thích với những hệ thông tin mới

được xây dựng. Nhiều khách hàng không thoả mãn với những hệ thống thông tin
hiện thời.
Một cách tiếp cận được đề xướng bởi B.Inmon là sự kết hợp của một số giải
pháp kỹ thuật và được đặt tên là Data Warehoushing - kỹ thuật xây dựng các
kho dữ liệu. Data Warehouse được định nghĩa như một tập hợp các phương tiện
cho phép hình dung dữ liệu một cách tổng thể, hướng đối tượng để giúp cho việc
phân tích và ra quyết định.
2. Mục đích của đề tài: Tiếp cận các phương pháp khai phá dữ liệu để tích hợp
dữ liệu và các siêu dữ liệu từ nhiều nguồn thành một nguồn mang tính lôgic duy
nhất nhằm cung cấp thông tin trợ giúp cho việc phân tích và ra quyết định.
3. Đối tượng và phạm vi nghiên cứu: Việc nghiên cứu sẽ tập trung xây dựng
các báo cáo dựa trên kho dữ liệu tích hợp từ các nguồn dữ liệu hiện có với các
ứng dụng quản lý điều hành sản xuất kinh doanh của VNPT Quảng Ninh.
4. Phương pháp nghiên cứu: Tìm hiểu các tài liệu liên quan đến Data
Warehouse các kỹ thuật truy cập, phân tích và khai phá dữ liệu.



3

5. Kết cấu của luận văn
Luận văn bao gồm 3 chương:
Chương 1: Tổng quan về Kho dữ liệu và Khai phá dữ liệu
Tìm hiểu về kho dữ liệu, đặc điểm, phân loại, sử dụng đồng thời nghiên
cứu và trình bày về Khai phá dữ liệu.
Chương 2: Xây dựng kho dữ liệu.
Chương này phân tích các yêu cầu xây dựng kho dữ liệu; Các mô hình dữ
liệu; Cấu trúc, kiến trúc trong việc xây dựng kho dữ liệu.
Chương 3: Xây dựng kho dữ liệu khách hàng sử dụng dịch vụ viễn thông phục
vụ công tác quản lý.


CHƯƠNG I
TỔNG QUAN VỀ KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU

1.1 Tổng quan về kho dữ liệu
Ngày nay, thông tin trở thành một yếu tố quan trọng cần được quản lý và
khai thác hiệu quả bởi chính việc quản lý và khai thác thông tin này sẽ mang lại
một phần lợi ích không nhỏ trong việc tổ chức và quản lý của các tổ chức kinh
tế. Hơn thế, các yêu về khả năng lưu trữ thông tin khối lượng lớn, xử lý thông
tin nhanh chóng ngày càng trở nên phổ biến. Điều này dẫn đến sự ra đời của
Data Warehouse. Data Warehouse không chỉ đáp ứng những nhu cầu về việc lưu
trữ và quản lý thông tin mà nó còn là nền tảng để người dùng có thể sử dụng
những kỹ thuật hỗ trợ trực tuyến OLAP và đặc biệt là nó tạo một nền tảng thuận
lợi để người dùng có thể khai thác, phân tích và dự đoán về số liệu của mình
thông qua những kỹ thuật khai phá dữ liệu (data mining).
1.1.1 Định nghĩa
Kho dữ liệu (Data Warehouse – DW) không phải là một khái niệm mới và
đã được định nghĩa theo rất nhiều cách khác nhau, vì vậy khó có thể định nghĩa
chuẩn xác được. Theo một nghĩa nào đó thì kho dữ liệu được xem như là một cơ
sở dữ liệu được duy trì riêng biệt từ nhiều nguồn cơ sở dữ liệu (CSDL) tác


4

nghiệp khác nhau, hỗ trợ phân tích trên cơ sở các dữ liệu lịch sử và các công cụ
truy vấn dữ liệu mạnh.
1.1.2 Đặc điểm
Một kho dữ liệu được xác định là một cơ sở dữ liệu trong đó có chứa bốn đặc
tính sau: hướng chủ đề, tính ổn định, được tích hợp, gắn với thời gian.
1.1.3 Phân loại

Tùy thuộc vào quy mô tổ chức, cách tổ chức và vị trí của Data Warehouse mà
người ta chia Data Warehouse nói chung ra thành hai loại là: Data Mart và
Enterprise Data Warehouse.


1.1.3.1. Khái niệm Enterprise Data Warehouse
Nếu như một Enterprise Data Warehouse là một cơ sở dữ liệu bao gồm dữ
liệu về nhiều đối tượng khác nhau, trên toàn bộ cơ quan và thường được xây
dựng tập trung.
1.1.3.2. Khái niệm Data Mart
Data Mart cũng là một cơ sở dữ liệu có những đặc điểm giống với kho dữ
liệu nhưng quy mô của nó nhỏ hơn và lưu trữ dữ liệu về một lĩnh vực, một
chuyên ngành cụ thể.
1.1.3.3. Phân loại Data Mart
- DM phụ thuộc.
- DM độc lập.
1.1.3.4. Siêu dữ liệu (Metadata)
Metadata là một loại “dữ liệu về dữ liệu”, nó được xây dựng nhằm mục
đích mô tả cấu trúc nội dung về dữ liệu bên trong cơ sở dữ liệu. Metadata có ý
nghĩa đặc biệt quan trọng trong việc xây dựng và tổ chức lưu trữ dữ liệu của
Data Warehouse.


5

1.1.4. Các phương pháp sử dụng kho dữ liệu
1.1.4.1. Cách sử dụng truyền thống
Trong cách sử dụng này việc khai thác thông tin dựa trên các công cụ truy
vấn và báo cáo. Nhờ có việc trích lọc, tích hợp và chuyển đổi các dữ liệu thô
sang dạng dữ liệu có chất lượng cao và có tính ổn định.

1.1.4.2. Hỗ trợ trực tuyến (OLAP)
Nếu ngôn ngữ truy vấn chuẩn SQL và các công cụ làm báo cáo truyền
thống chỉ có thể miêu tả những gì có trong cơ sở dữ liệu thì phân tích trực tuyến
có khả năng phân tích dữ liệu, xem xét xem giả thuyết là đúng hay sai. Tuy
nhiên phân tích trực tuyến lại không có khả năng đưa ra giả thuyết. Do kích
thước quá lớn và có tính chất phức tạp nên khó có thể sử dụng Data Warehouse
cho mục đích này.
1.1.4.3. Công nghệ khai phá dữ liệu (Data mining)
Trong hoàn cảnh hiện nay sự phát triển của dữ liệu đặt ra yêu cầu phải lưu
trữ dữ liệu phức tạp và có kích thước lớn. Việc khai phá dữ liệu trở thành một
nhu cầu khoa học và trong hoạt động thực tiễn.
1.2. Khai phá dữ liệu
1.2.1. Định nghĩa
Khai phá dữ liệu (data mining): là quá trình trích xuất các thông tin có giá
trị tiềm ẩn bên trong lượng lớn dữ liệu được lưu trữ trong các CSDL, kho dữ
liệu…
1.2.2. Vị trí của khai phá dữ liệu
1.2.2.1. Quá trình khám phá tri thức
Trên thực tế, nhiều người coi khai phá dữ liệu và một thuật ngữ thông
dụng khác là khám phá tri thức trong CSDL là như nhau. Một số người khác
quan niệm khai phá dữ liệu chỉ là một bước thiết yếu trong quá trình Khám phá
tri thức trong CSDL. Quá trình này gồm một số bước lặp đi lặp lại, và được thể
hiện trong hình 1.2:


6


Hình 1.2: Khai phá dữ liệu trong quá trình Khám phá tri thức


1.2.2.2. Hệ ra quyết định
Khai phá dữ liệu chiếm một vị trí quan trọng và nằm ở trung tâm của quá trình
Khám phá tri thức từ cơ sở dữ liệu. Nó có mối liên hệ chặt chẽ với hệ ra quyết
định như trong sơ đồ sau:

Hình 1.3: Khai phá dữ liệu với Hệ ra quyết định
Nhưng trên thực tế, thuật ngữ khai phá dữ liệu thông dụng và được sử
dụng rộng rãi hơn nhiều so với thuật ngữ khám phá tri thức trong CSDL (KDD).
Kho ch
ứa
dữ liệu
Khai phá
dữ liệu
Tri thức
Ngư
ời
dùng
Làm s
ạch
và tích hợp
L
ựa chọn
và chuyển
đổi dữ liệu
Ư
ớc l
ư
ợng
và biểu diễn
Cơ sở

DL

Các file
DL
Mẫu DL


7

Kiến trúc của một hệ thống khai phá dữ liệu thường gồm những thành phần
chính thể hiện trong hình 1.4.



Hình 1.4
1.2.3. So sánh Khai phá dữ liệu với các giải pháp dữ liệu truyền thống
Chúng ta có thể so sánh trực tiếp khai phá dữ liệu với một số phương
pháp truyền thống để thấy cụ thể hơn:
- Học máy.
- Phương pháp hệ chuyên gia.
- Phát kiến khoa học.
- Phương pháp thống kê.
1.3. Kết luận chương
Từ những lý thuyết cơ sở của Data Warehouse, với mục đích cơ bản của
việc xây dựng Data Warehouse là tạo thuận lợi tối đa khi phân tích dữ liệu. Khi
xây dựng Data Warehouse mang lại cho chúng ta rất nhiều lợi ích: Tích hợp dữ
Giao diện đồ hoạ người dùng
Đánh giá mẫu
Máy khai phá dữ liệu
Máy chủ CSDL hoặc kho dữ liệu

CSDL Kho dữ
liệu
Cơ sở tri
thức
Làm sạch dữ liệu
Tích hợp dữ liệu
Lọc


8

liệu và các siêu dữ liệu từ nhiều nguồn thành một nguồn mang tính lôgic duy
nhất nhằm cung cấp thông tin mềm dẻo từ các nguồn khác nhau và thỏa mãn
nhiều loại người dùng khác nhau. Nâng cao chất lượng dữ liệu bằng các phương
pháp làm sạch dữ liệu và tinh lọc dữ liệu theo những hướng chủ đề nhất định
nên dữ liệu sẽ rõ ràng, thống nhất hơn.
Sử dụng các phương pháp, kỹ thuật Khai phá dữ liệu nêu trên một cách
hợp lý sẽ giúp chúng ta có được những thông tin quan trọng, cần thiết và có giá
trị cao trong hoạt động quản lý điều hành, sản xuất kinh doanh cũng như trong
các lĩnh vực khác của đời sống xã hội.





9

CHƯƠNG II
XÂY DỰNG KHO DỮ LIỆU


2.1. Các yêu cầu của kho dữ liệu
2.1.1. Lập kế hoạch
Gồm các bước:
- Bước 1. Xác định chiến lược cài đặt
- Bước 2. Lựa chọn phương pháp và mô hình phát triển kho dữ liệu
2.1.2. Phân tích các yêu cầu của hệ thống
Bao gốm các bước sau:
- Bước 1. Xác định các yêu cầu của chủ sở hữu và công tác -quản lý
- Bước 2. Yêu cầu về kiến trúc:
- Bước 3. Xác định yêu cầu của người phát triển hệ thống
2.2. Công nghệ và cấu trúc chung kho dữ liệu
2.2.1. Công nghệ
Bảng 2.1 Các giải pháp công nghệ cho Dataware House
STT

Công nghệ Diễn giải
Giải pháp Microsoft .NET
1.

Ngôn ngữ lập
trình C#
Một trong những ngôn ngữ lập trình chính, phổ biến trên
MS .NET.
2.

WinForm Công nghệ xây dựng ứng dụng người sử dụng chuẩn
trên nền MS .NET
3.



SmartClient

/OneClick
Deployment
Solution
Công ngh
ệ phân tán ứng dụng dạng WinForm, một giải
pháp xây dựng ứng dụng mới bên cạnh các dạng công
nghệ có quá nhiều nhược điểm như thin-client (WEB: dễ
triển khai, khó phát triển), thick-client (desktop-client:
phát triển nhanh, khó triển khai, khó bảo trì).
4.

Internet
Explorer
Trình duyệt (Web browser) chuẩn, miễn phí của
Microsoft
5.

ASP.NET Công nghệ xây dựng ứng dụng WEB trên nền .NET


10

6.

Remoting/SOAP

Một trong hai công nghệ xây dựng ứng dụng phân tán
cấp doanh nghiệp chuẩn của Microsoft (công nghệ còn

lại là XML-Webservice). Công nghệ này cung cấp nhiều
tùy chọn khi cần hosting các đối tượng doanh nghiệp ở
khối “Business Object Server”, ở đây, do yêu cầu về
hiệu năng, sẽ chọn các thông số như sau:
 Chanel: TCP:<port-xác định sau>
 Formatter: binary
Nếu khi hosting ta chọn thêm Formatter là SOAP thì
chúng ta cũng có đồng thời giao diện SOAP cho các
Business Object. Điều này là rất tiện lợi cho quá trình
tích hợp hệ thống sau này.
7.

ADO.NET - Chuẩn công nghệ truy cập CSDL trên nền .NET. Hai
engine thực hiện theo chuẩn này được lựa chọn sử dụng
là:
 ODP.NET: là engine của Oracle; được khối
“Business Object Server” sử dụng để truy cập
CSDL Oracle.
 MS ADO.NET Driver for Oracle: là engine của
Microsoft; được khối “Report Server” sử dụng để
truy cập CSDL Oracle.
Giải pháp Crystal Decision Support
8.


Report
Application
Server (RAS)
Theo gi
ải pháp n

ày, các báo bi
ểu đ
ư
ợc hosting l
ên máy
chủ RAS, các client (Application hoặc WEB) truy xuất
báo biểu theo cùng một công nghệ, một cách thức
Giải pháp Oracle DBMS
9.

Oracle CSDL quan hệ mạnh & phổ biến nhất hiện nay


11



2.2.2. Cấu trúc chung thành phần truy cập dữ liệu
• Các công cụ truy cập
Cấu trúc chung của thành phần truy cập dữ liệu được mô tả tại hình 2.1:












Hình 2.1: Cấu trúc chung của thành phần truy cập dữ liệu

Cấu trúc tổng thể của kho dữ liệu, kho dữ liệu tác nghiệp và các chức
năng quản lý, xử lý phân tích dữ liệu có thể tổ chức như hình 2.2:
• Các công cụ thu nạp, làm sạch, ánh xạ và chuyển đổi dữ liệu
Lựa chọn dữ liệu từ ODS để đưa vào kho, đặt chúng các format thích
hợp. việc này có thể thực hiện bằng các công cụ: Các chương trình ứng dụng,
Các lệnh hay ngôn ngữ điều khiển như MVS Job Control Language, Unix
Script, SQL DDL, Oracle Warehouse Builder…
2.3. Xu hướng kho dữ liệu
2.3.1. Dữ liệu phi cấu trúc
Dữ liệu có cấu trúc thường dùng để chỉ dữ liệu lưu trữ trong các hệ quản
trị cơ sở dữ liệu quan hệ như Oracle, MS SQL Server, MySQL,…
2.3.2. Tìm kiếm
Phần này câu trả lời câu hỏi thứ hai, làm thế nào để bạn nhận được những
thông tin ra? Câu trả lời là bằng cách tìm kiếm (Search). Để có được thông tin từ
dữ liệu có cấu trúc, bạn có thể sử dụng các câu truy vấn như báo cáo, hoặc câu
truy vấn tự xây dựng…







Data Transfer

Data Access
Translate

to SQL

Split
query

Translate
to DB API

Control and administration

Translate
to API

Combine
results

Translate to
relational

Data source 1
Data source 2

Enquiry
Response


12


2.3.3. Kiến trúc hướng dịch vụ

Kiến trúc hướng dịch vụ SOA là một hướng tiếp cận với việc thiết kế và
tích hợp các phần mềm, chức năng, hệ thống theo dạng module, trong đó mỗi
module đóng vai trò là một dịch vụ và có khả năng truy nhập thông qua môi
trường mạng.
2.3.4. Kho dữ liệu thời gian thực
DWH ngày nay thông thường được cập nhật từng ngày, từng tuần, từng
tháng, Có một số yêu cầu của những người sử dụng muốn nhìn thấy dữ liệu
trong kho dữ liệu được cập nhật cứ hai phút một lần hay thậm chí thời gian thực.
2.4. Kiến trúc kho dữ liệu
DWH và kiến trúc của nó tùy thuộc vào vị trí của từng tổ chức. Có ba
kiến trúc phổ biến của DWH:
 Kiến trúc DWH cơ bản:

Hình 2.3: Kiến trúc DWH cơ bản

 Kiến trúc DWH với Staging Area:

Hình 2.4: Kiến trúc DWH với Staging Area


13

 Kiến trúc DWH với Staging Area và Data Mart:
Hình 2.5: Kiến trúc kho dữ liệu với Staging Area và Data Mart
2.5. Tổ chức dữ liệu logic
2.5.1. Lược đồ kho dữ liệu
Lược đồ là một tập hợp các đối tượng cơ sở dữ liệu bao gồm bảng, view,
index,…Lược đồ kho dữ liệu hay được sử dụng: lược đồ hình sao, lược đồ bông
tuyết rơi, lược đồ kết hợp,…
a. Lược đồ hình sao


Hình 2.6: Lược đồ hình sao

b. Lược đồ bông tuyết rơi

Hình 2.7: Lược đồ bông tuyết rơi
c. Lược đồ kết hợp
Là kết hợp giữa sơ đồ hình sao và sơ đồ hình tuyết rơi.
2.5.2. Mô hình dữ liệu đa chiều
Hình 2.8 thể hiện câu truy vấn theo bốn chiều: khách hàng, dịch vụ, thời gian.


14


Hình 2.8: Mô hình dữ liệu đa chiều
2.5.3. Bảng sự kiện
Bảng sự kiện điển hình có hai kiểu cột, chúng chứa đựng những sự kiện
số (thường gọi là thước đo), và chứa khóa của các bảng dimension.
2.5.4. Bảng chiều
Các chiều là cách mô tả chủng loại mà theo đó các dữ liệu số trong khối
được phân chia để phân tích. Khi xác định một chiều, chọn một hoặc nhiều cột
của một trong các bảng liên kết (bảng chiều).
2.5.5. Bảng sự kiện tổng hợp
Bảng tổng hợp
– Bảng tổng hợp nhằm mục đích trả lời nhanh các câu hỏi thường gặp.
Bảng sự kiện tổng hợp
– Nhận diện các bảng dữ kiện yêu cầu
– Các tổng hợp ở thứ tự cao có thể được tính toán từ các tổng hợp thứ tự
thấp,

2.5.6. Nguồn dữ liệu
Nguồn dữ liệu của DWH gồm nhiều loại khác nhau:
 Dữ liệu từ các hệ thống tác nghiệp
 Hệ thống kế thừa
 Các nguồn dữ liệu bên ngoài


15

2.5.7. Công cụ làm sạch, chuyển đổi dữ liệu
 Làm sạch
 Chuyển đổi
2.5.8. Tích hợp dữ liệu khách hàng
Tích hợp dữ liệu khách hàng CDI là MDM cho dữ liệu khách hàng. CDI
là một quá trình chiết, làm sạch, lưu trữ, duy trì, và phân phối dữ liệu của khách
hàng.
2.6. Mối quan hệ giữa kho dữ liệu và Khai phá dữ liệu
 Cả hai đều có thể đứng độc lập với nhau, tuy nhiên khi kết hợp được kho
dữ liệu với khai phá dữ liệu thì lợi ích rất lớn.
2.7. Kết luận chương
Chương này đi vào phân tích công nghệ, cấu trúc, kiến trúc dịch vụ, lược
đồ, mô hình dữ liệu và công cụ để xây dựng một kho dữ liệu. Trong chương tiếp
theo sẽ tìm hiểu về các hệ thống nguồn, phân tích , chuyển đổi, làm sạch dữ liệu.
Xây dựng và thử nghiệm kho dữ liệu, kết xuất ra báo cáo hỗ trợ công tác phân
tích và trợ giúp ra quyết định cho hoạt động sản xuất kinh doanh của VNPT
QUANG NINH.


16


CHƯƠNG III
XÂY DỰNG KHO DỮ LIỆU KHÁCH HÀNG SỬ DỤNG DỊCH VỤ VIỄN
THÔNG
3. 1. Nghiên cứu hệ thống nguồn ccbs
Hệ thống CCBS gồm 4 khối chức năng chính:
o Tính cước, chăm sóc và hỗ trợ khách hàng BCSS.
o Cắt mở thuê bao, dịch vụ tự động
o Quản lý điều hành sửa chữa báo hỏng.
o Quản lý mạng ngoại vi
Khách hàngKhách hàngKhách hàngKhách hàng Khách hàngKhách hàngKhách hàng
Call CenterCall Center
Điểm giao dịchĐiểm giao dịch WebWeb EmailEmail
Hệ thống tính
cước & hỗ trợ
khách hàng
Hệ thống Quản lý
mạng ngoại vi
Hệ thống Cắt mở
thuê bao dịch vụ tự
động
Hệ thống Điều
hành sửa chữa
báo hỏng
Hệ thống CCBS tổng thể

Hình 3. 1: Hệ thống CCBS tổng thể
3.2. Thiết kế kho dữ liệu
3.2.1. Kiến trúc kho dữ liệu viễn thông
Kiến trúc hệ thống kho dữ liệu viễn thông bao gồm máy chủ chuyển đổi
dữ liệu, máy chủ cở sở dữ liệu để lưu kho dữ liệu, máy chủ báo cáo + web

server + process server, máy chủ phân tích dữ liệu trực tuyến.

Hình 3.2: Kiến trúc kho dữ liệu viễn thông
3.2.2. Thiết kế mô hình dữ liệu
Việc thiết kế mô hình dữ liệu qua các bước, từ yêu cầu kinh doanh chọn


17

tiến trình kinh doanh cho mô hình, chọn cấp độ của tiến trình kinh doanh, chọn
các chiều, chọn các dữ kiện. Hình 3.3 trình bày mô hình dữ liệu hệ thống.


Hình 3.3: Mô hình dữ liệu hệ thống
3.2.2.1. Kho dữ liệu chủ đề bán hàng
3.2.2.2. Kho dữ liệu phát triển thuê bao
3.2.2.3. Kho dữ liệu cước khách hàng
3.2.2.4. Kho dữ liệu tổng hợp cước khách hàng
3.2.2.5. Kho dữ liệu thanh toán nợ của khách hàng
3.2.3. Tạo cấu trúc database
Ở đây sẽ sử dụng công cụ Warehouse Builder để thực hiện tạo bảng hoặc
thực hiện theo các lệnh script.
3.2.3.1. Sử dụng bảng tổng hợp, view và materialized view
3.2.3.2. Phân vùng
3.2.3.3. Chỉ mục
3.2.4. Thiết kế mô hình vật lý

Hình 3. 13: Mô hình vật lí của DWH



18

3.2.5. Trích xuất, chuyển đổi nạp dữ liệu
3.2.5.1. Mô tả chung
3.2.5.2. Ánh xạ cho các chiều
3.2.5.3. Ánh xạ cho các bảng sự kiện
3.2.6. Thiết kế công cụ báo cáo
Báo cáo là phần không thể thiếu trong các hệ thống kho dữ liệu. Việc
xây dựng công cụ tạo báo cáo động và hệ thống báo cáo từ xa được xem xét để
phát triển hệ thống báo cáo. Công cụ cho phép quản lý báo cáo đầu ra và cho
phép người dùng bổ xung báo cáo vào hệ thống, mở rộng khả năng khai thác
của người dùng và đáp ứng nhu cầu sử dụng lâu dài.
 Mô hình báo cáo từ xa sử dụng Webservice

Hình 3.19: Mô hình báo cáo từ xa sử dụng Webservice
3.2.6.1. Kiến trúc và công nghệ
3.2.6.2 Các chức năng cho hệ thống báo cáo
3.2.7. Thiết kế công cụ tra cứu động
Tương tự như phần báo cáo, tra cứu động là phần không thể thiếu trong
các hệ thống kho dữ liệu. Chức năng tra cứu động tương tự như phần báo cáo,
chỉ có cách hiển thị kết quả khác nhau.
3.2.8. Thiết kế công cụ quản trị hệ thống
Chức năng quản trị hệ thống cho phép người quản trị hệ thống định
nghĩa các quyền và phân quyền cho người dùng. Giúp cho hệ thống kiểm soát
được các phiên truy cập và đảm bảo tính toàn vẹn của dữ liệu.
H
ệ thống

khác
Máy chủ báo cáo

Engine báo cáo

Máy trạm

Engine báo cáo

Engine báo cáo


Web service
Máy ch

web

Browser

Window Form

Web viewer



19

3.2.8.1. Các chức năng công cụ quản trị hệ thống
3.2.8.2: Các bảng chức năng trong CSDL.
Phần tiếp theo luận văn sẽ giới thiệu một số giao diện chính, báo cáo phân tích
 Giao diện chính hệ thống báo cáo, tra cứu, quản trị hệ thống.

Hình 3.23: Giao diện chính chương trình

 Giao diện phân quyền sử dụng báo cáo
 Giao diện thiết lập xử lý số liệu
 Giao diện tạo danh mục báo cáo
 Giao diện báo cáo thông kê
 Giao diện biểu đồ thống kê
3.3. Kết luận chương
Với việc phân tích hệ thống nguồn CCBS hiện có của VNPT QUANG
NINH cũng như các nhu cầu thực tế nhằm nâng cao hiệu quả điều hành sản xuất
kinh doanh, để thấy được tầm quan trọng của việc phải xây dựng một hệ thống
kho dữ liệu. Thiết kế kho dữ liệu DWH tập trung dựa trên các hệ thống dữ liệu
rời rạc (từ nhiều nguồn dữ liệu khác nhau), nhằm mục đích khai thác tốt hơn,
hiệu quả hơn dữ liệu hỗ trợ việc ra quyết định. Từ các nguồn dữ liệu rời rạc khác
nhau không thể đưa ra cái nhìn tổng thể, hoặc hiệu quả của một vấn đế, nên các
quyết định sẽ không đạt độ chính xác cao. Sau khi nghiên cứu, ứng dụng với
công cụ warehouser builder của oracle… áp dụng thử nghiệm cho kho dữ liệu.
Dữ liệu đã được tích hợp, nhất là với dữ liệu báo cáo đã đạt đến độ chính xác
cao. Nhìn vào kết các báo cáo phân tích đã đưa ra được nhiều chiều của dữ liệu.
Nhất là biểu đồ thống kê của báo cáo đã đánh giá được sự hiệu quả của kho dữ
liệu.


20

KẾT LUẬN
Luận văn nghiên cứu “Xây dựng kho dữ liệu khách hàng sử dụng dịch vụ viễn
thông phục vụ công tác quản lý” đã được hoàn thành.
 Phân tích công nghệ, cấu trúc, kiến trúc dịch vụ, lược đồ, mô hình dữ liệu
và công cụ để xây dựng một kho dữ liệu. Tìm hiểu các phương pháp, kỹ
thuật Khai phá dữ liệu và cách sử dụng các phương pháp, kỹ thuật này với
từng loại dữ liệu để mang lại hiệu quả cao nhất cho kho dữ liệu.

 Thực hiện xây dựng kho dữ liệu thử nghiệm từ hệ thống nguồn CCBS của
VNPT QUANG NINH. Tuy nhiên do thời gian thực hiện luận văn có giới
hạn nên luận văn chỉ dừng lại với dữ liệu thử nghiệm của một quý đầu năm
2011. Bước đầu đã đưa ra được một số báo cáo phân tích ở phạm vi
khuyến mại khách hàng sử các dịch vụ viễn thông của VNPT trên địa bàn
tỉnh.
 Kết quả thu được rất khả quan, hệ thống kho dữ liệu cho báo cáo khá chính
xác giúp cho tra cứu, theo dõi và đưa ra các biểu đồ phân tích với từng phân
khúc thị trường của từng loại dịch vụ khuyến mại cho khách hàng. Qua đó
đánh giá được chính xác, phản ảnh trung thực lại cho nhà quản lý biết được
những dịch vụ nào đem lại doanh thu cao. Kết quả này cho thấy điểm ưu
việt của kho dữ liệu và khai phá dữ liệu so với những phương pháp dự báo
truyền thống như kinh tế lượng hay thống kê hay những báo cáo thông
thường:
 Kho dữ liệu có thể khai thác, phục vụ tốt cho nhiều tiêu chí báo cáo, dữ liệu
giải quyết được bài toán định hướng quản lý tập trung không bị rời rạc,
manh mún của các hệ thống dữ liệu hiện hành. Kho dữ liệu có khả năng
điều chỉnh tham số tùy ý để thích nghi với những biến động của dữ liệu
trong quá trình sử dụng. Độ chính xác của dữ liệu trong kh dữ liệu chỉ phụ
thuộc vào dữ liệu đầu vào, những biến động thực tế đều được thể hiện trên
số liệu.
Qua đó, có thể khẳng định xây dựng kho dữ liệu và khai phá dữ liệu là một
hướng đi hiệu quả để dự đoán số liệu, đưa ra một công cụ hỗ trợ các chuyên viên
và nhà quản lý trong công tác xử lý số liệu phục công tác điều hành sản xuất
kinh doanh của doanh nghiệp.

×