Tải bản đầy đủ (.doc) (24 trang)

Nghiên cứu giải pháp tích hợp CSDL các phần mềm Bưu chính hỗ trợ thống kê, báo cáo tại Bưu điện Quảng Bình (TT)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (936.18 KB, 24 trang )

MỞ ĐẦU
1. Lý do chọn đề tài
Việc ứng dụng công nghệ thông tin nói chung và việc ứng
dụng kho dữ liệu nói riêng vào hoạt động của các doanh nghiệp đã
góp phần thành công trong sự phát triển của họ. Các ngành đã áp
dụng rộng rãi công nghệ thông tin cũng như việc áp dụng kho dữ
liệu ngày càng nhiều và phần nào đã đạt được những thành công
nhất định của riêng mình.
Đối với Bưu chính Việt Nam nói chung và Bưu điện Quảng
Bình nói riêng đã áp dụng hầu hết hệ thống tin học vào quy trình
sản xuất. Nhưng do đặc trưng riêng của từng chương trình vì vậy
cơ sở dữ liệu không đồng nhất với nhau, do đó tạo nên sự rời rạc
có sở dữ liệu của các chương trình. Do đó rất khó khăn khi tập hợp
dữ liệu để báo cáo, tổng hợp, thống kê hàng tháng cũng như hàng
năm. Do đó, cần phải có một hệ thống nhằm tích hợp dữ liệu từ các
phần mềm đó tạo thành một cơ sở dữ liệu “đồng nhất”, nhằm xây
dựng chương trình tổng hợp số liệu để báo cáo, thống kê giúp cho
những người quản lý thấy được tình hình sản xuất, kinh doanh của
đơn vị diễn ra nhằm có những điều chỉnh về chính sách, phương
hướng, kế hoạch để đạt hiệu quả cao trong hoạt động sản xuất,
kinh doanh của đơn vị.
Trước thực tế đó và được sự đồng ý của PGS. TS Nguyễn
Thanh Bình, tôi chọn đề tài “Nghiên cứu giải pháp tích hợp CSDL
các phần mềm Bưu chính hỗ trợ thống kê, báo cáo tại Bưu điện
Quảng Bình” và mục đích đầu tiên là sử dụng tại Bưu điện Quảng
Bình.
1
2. Mục đích nghiên cứu
- Xây dựng kho dữ liệu tổng hợp của các phần mềm bưu
chính nhằm báo cáo, thống kê hiệu quả sản xuất kinh doanh (số
lượng, doanh thu,…), để kịp thời điều chỉnh nhanh chóng phương


pháp làm việc và chăm sóc khách hàng để đạt hiệu quả.
- Nâng cao hiệu quả kinh doanh, đủ sức cạnh tranh với các
doanh nghiệp khác.
- Tạo tiền đề để phát triển để phát triển các ứng dụng khác.
3. Đối tượng và phạm vi nghiên cứu
- Đối tượng nghiên cứu của đề tài
+ Các CSDL, quy trình sản xuất đang thực hiện tại Bưu điện
Quảng Bình.
+ Các công cụ lập trình, các hệ cơ sở dữ liệu liên quan đến đề
tài (Kho dữ liệu, tích hợp dữ liệu).
- Phạm vi nghiên cứu:
+ Các CSDL, quy trình sản xuất đang thực hiện tại Bưu điện
Quảng Bình.
+ Xây dựng ứng thống kê, báo cáo và hệ Cơ sở dữ liệu SQL
2005.
4. Phương pháp nghiên cứu
- Phương pháp nghiên cứu lý luận.
- Phương pháp nghiên cứu thực tiễn.
- Phương pháp nghiên cứu tài liệu.
5. Ý nghĩa khoa học và thực tiễn của đề tài
6. Bố cục của luận văn
Báo cáo của luận văn được được tổ chức thành ba chương
chính.
Chương 1. Cơ sở lý thuyết.
2
Chương 2. Giải pháp tích hợp các CSDL tại Bưu điện Quảng
Bình.
Chương 3. Phát triển ứng dụng.
3
CHƯƠNG 1.

CƠ SỞ LÝ THUYẾT
1.1. KHO DỮ LIỆU
1.1.1. Khái niệm
Theo W.H.Inmon, một nhà kiến trúc hàng đầu của việc xây
dựng kho dữ liệu, thì kho dữ liệu được định nghĩa như một “tập
hợp dữ liệu định hướng theo chủ đề, tích hợp, có tính ổn định, thay
đổi theo thời gian hỗ trợ cho xử lý thực hiện quyết định quản trị”.
Các đặc tính của kho dữ liệu
Một kho dữ liệu có thể được coi là một hệ thống thông tin với
những đặc tính:
- Là một cơ sở dữ liệu được thiết kế có nhiệm vụ phân tích,
sử dụng các dữ liệu từ các ứng dụng khác nhau.
- Hỗ trợ cho một số người dùng có liên quan với các thông
tin liên quan.
- Là dữ liệu chỉ đọc.
- Nội dung của nó được cập nhật thường xuyên theo cách
thêm thông tin.
- Chứa các dữ liệu lịch sử và hiện tại để cung cấp các xu
hướng thông tin.
- Chứa các bảng dữ liệu có kích thước lớn.
- Một câu hỏi thường trả về một tập kết quả liên quan đến
toàn bộ bảng và các liên kết nhiều bảng.
1.1.2. Cách thức xây dựng kho dữ liệu
a. Thiết kế kho dữ liệu
Kho dữ liệu, mục tiêu là hỗ trợ quyết định cho các nhà quản
lý. Tính chi tiết và riêng lẻ của các mẩu tin thì ít quan trọng hơn dữ
liệu có tính lịch sử, tổng kết và hợp nhất. Kho dữ liệu hỗ trợ các
truy vấn phức tạp với thời gian hồi đáp nhanh, các truy vấn phức
4
tạp có thể truy xuất hàng triệu mẩu tin và thực hiện nhiều lần các

thao tác quét, kết và tổng hợp. Đối với kho dữ liệu, số lượng truy
vấn đưa vào và thời gian hồi đáp quan trọng hơn số lượng giao
dịch đưa vào.
b. Cấu trúc kho dữ liệu
Hình 1.3. Kiến trúc kho dữ liệu
1.1.3. Các vấn đề liên quan đến kho dữ liệu
1.2. TÍCH HỢP DỮ LIỆU
1.2.1. Khái niệm
Tích hợp dữ liệu là quá trình tổng hợp có sự lựa chọn dữ liệu
từ các nguồn khác nhau sau đó kết hợp lại thành một tập hợp thông
tin chính xác, chất lượng và nhất quán tiếp tục chuẩn hóa, làm sạch
tạo thành kho dữ liệu để cung cấp người dùng với một cái nhìn
thống nhất của các dữ liệu này.
5
Hình 1.4. Mô hình tích hợp dữ liệu
1.2.2. Các phương pháp tích hợp dữ liệu
a. Tích hợp dữ liệu bằng phương pháp thủ công
Quan sát một CSDL và mã nguồn của nó và tìm thấy một số
trường dữ liệu cần trích xuất.
b. Tích hợp dữ liệu bằng phương pháp bán tự động
c. Tích hợp dữ liệu bằng phương pháp tự động
 Phương pháp ETL - trích xuất, biến đổi và tải.
1.3. XÂY DỰNG KHO DỮ LIỆU, TÍCH HỢP DỮ LIỆU
TRONG SQL SERVER
1.3.1. Tổng quan về hệ quản trị cơ sở dữ liệu Microsoft
SQL Server
Dưới đây là mô hình về các dịch vụ của SQL server 2005.
6
Hình 1.8. Các dịch vụ của SQL Server 2005
MSSQL 2005 có 4 dịch vụ lớn: Database Engine,Intergration

Service, Reporting service, Analysis Services.
1.3.2. Xây dựng kho dữ liệu trong SQL Server để lưu trữ
thông tin
Nguồn dữ liệu cho kho dữ liệu có thể bao gồm nhiều nguồn
khác nhau. Chúng ta sẽ dùng dịch vụ SSIS để xây dựng tiến trình
ETL để lấy dữ liệu từ hệ thống nguồn và đẩy vào kho dữ liệu.
7
Hình 1.9. Mô hình xây dựng kho dữ liệu
1.3.3. Tích hợp dữ liệu trong SQL Server
- Sử dụng SQL Server Integration Service(SSIS)
- Sử dụng SQL Server Analysis Service (SSAS)
- Sử dụng ngôn ngữ truy vấn MDX
- Sử dụng SQL Server Reporting Serveices (SSRS)
1.4. MÃ ĐỊA CHỈ BƯU CHÍNH
1.4.1. Khái niệm
Mã Bưu chính: Là một tập hợp các chữ số được gán cho một
địa chỉ hoặc một cụm địa chỉ theo những nguyên tắc xác định.
8
1.4.2. Phân cấp và phân loại địa chỉ
1.4.3. Cấu trúc và nguyên tắc xây dựng mã Bưu chính
a. Cấu trúc
b. Nguyên tắc xây dựng mã Bưu chính
1.4.4. Danh sách chi tiết mã địa chỉ Bưu chính tỉnh Quảng
Bình
9
CHƯƠNG 2.
GIẢI PHÁP TÍCH HỢP CÁC CSDL TẠI BƯU ĐIỆN
QUẢNG BÌNH
1.5. TRỰC TRẠNG CÁCH TỔ CHỨC CSDL TẠI BƯU ĐIỆN
QUẢNG BÌNH

1.5.1. Giới thiệu về Bưu điện Quảng Bình
Bưu điện Quảng Bình là đơn vị thành viên của Tổng công ty
Bưu chính Việt Nam (VNPOST), kinh doanh nhiều ngành nghề
trong đó chủ yếu là dịch vụ Chuyển phát Bưu chính và Tài chính
Bưu chính. Hiện nay, các dịch vụ Bưu chính đã được tin học hóa
hoàn toàn.
1.5.2. Các CSDL hiện đang ứng dụng tại Bưu điện tỉnh
Quảng Bình
Hiện tại Bưu điện tỉnh Quảng Bình có khoảng 10 hệ thống
phần mềm tin học được triển khai để khai thác quản lý dịch vụ và
điều hành sản xuất kinh doanh, các hệ thống này sử dụng hệ quản
trị CSDL SQL server để tổ chức lưu trữ dữ liệu.
Xét về tổ chức kiến trúc dữ liệu các chương trình tin học Bưu
chính, có thể chia làm 3 loại:
+ Loại 1: CSDL đặt tại cục bộ sau đó được truyền lên CSDL
tập trung ở tỉnh, rồi truyền ra Tổng công ty.
+ Loại 2: CSDL đặt tập trung tại tỉnh, rồi truyền đi Tổng công
ty.
+ Loại 3: CSDL đặt tại Tổng công ty.
Mô hình các CSDL đang triển khai tại Bưu điện tỉnh Quảng
Bình được trình bày tại hình dưới:
10
Hình 2.1. Mô hình CSDL hiện tại của Bưu điện Quảng Bình
1.6. MÔ TẢ BÀI TOÁN TÍCH HỢP
1.6.1. Mô tả bài toán
Như đã trình bày ở mô hình các CSDL đang triển khai tại Bưu
điện Quảng Bình, các bưu cục giao dịch nằm rãi rác khắc nơi trên
địa bàn tỉnh, tại Bưu cục có nhiều chương trình tin học ứng dụng,
mỗi chương trình tin học ứng dụng khai thác, quản lý một dịch vụ
đều có một CSDL chứa đựng dữ liệu khách hàng riêng, sau đó

được truyền về Trung tâm tỉnh nhưng cũng là riêng lẻ. Các trường
trong các CSDL thiết kế không đồng bộ và nhiều thuộc tính khác
nhau. Do vậy, vấn đề phát sinh là:
“Làm thế nào để tổng hợp tất cả các dữ liệu từ các dịch vụ
riêng lẻ thành một dữ liệu thống nhất, để từ đó phát triển các hệ
thống ứng dụng khác, chẳng hạn như chương trình từ nguồn dữ liệu
11
đó trích xuất nhằm thống kê và báo cáo cần thiết để hỗ trợ công tác
điều hành tại đơn vị”
1.7. ĐỀ XUẤT GIẢI PHÁP TÍCH HỢP
1.7.1. Giải pháp tổng thể tích hợp các CSDL tại Bưu điện
tỉnh Quảng Bình
Để tổng hợp dữ liệu khách hàng từ các CSDL riêng lẻ của các
chương trình tin học ứng dụng khai thác, quản lý các dịch vụ
chúng ta phải tích hợp dữ liệu khách hàng từ các CSDL riêng lẻ đó,
sau đó nạp vào một CSDL chung có tính thống nhất.
Mô hình tổng thể tích hợp các CSDL tại Bưu điện Quảng
Bình được trình bày tại hình.
Hình 2.2. Mô hình tổng thể tích hợp các CSDL
Các CSDL riêng lẻ sẽ được trích rút dữ liệu thông qua hệ
thống “trích rút, tích hợp dữ liệu” sau đó dữ liệu này sẽ được tải
vào kho dữ liệu được thiết kế sẵn.
1.8. PHÂN TÍCH VÀ THIẾT KẾ GIẢI PHÁP TÍCH HỢP
12
1.8.1. Phân tích các CSDL cần tích hợp
Cơ sở dữ liệu của các chương trình quản lý khai thác dịch vụ
chủ yếu là SQL server 2000, 2005 và 2008. Trong phạm vi đề tài,
chúng ta xem xét hai nhóm dịch vụ chính:
+ Nhóm dịch vụ Chuyển phát.
+ Nhóm dịch vụ Tài chính Bưu chính.

a. Nhóm dịch vụ chuyển phát Bưu chính
+ Chuyển phát nhanh EMS
Mô hình ứng dụng của chương trình tin học EMS được trình
bày tại hình sau:
b. Nhóm dịch vụ tài chính Bưu chính
+ Chuyển tiền (CT2003)
Mô hình ứng dụng của chương trình tin học CT2003 được
trình bày tại hình dưới:
13
1.8.2. Tổ chức CSDL tại kho dữ liệu
Tại kho dữ liệu, các khách hàng có thông tin đầy đủ tại các
CSDL riêng lẻ sẽ được lưu trữ trong một CSDL mới. Từ CSDL này
ta sẽ tiến hành áp dụng các thuật toán trên đó để thống kê và báo
cáo.
1.8.3. Xây dựng quy trình tích hợp
a. Trích rút dữ liệu
Mô hình chi tiết trích rút dữ liệu khách hàng được trình bày
tại hình dưới đây:
14
Hình 2.8. Mô hình chi tiết trích rút dữ liệu
Việc trích rút phải đảm bảo không phá vỡ CSDL riêng lẻ hiện
tại và phải phân biệt được dữ liệu nào đã được trích rút. Dữ liệu có
từ trước, và mới phát sinh cũng phải được trích rút.
Dữ liệu tại các bảng trong các CSDL riêng lẻ sẽ được chuyển
vào các bảng trương ứng trong kho dữ liệu.
b. Xử lý dữ liệu
Tích hợp dữ liệu khách hàng có thể nói là tương đối phức tạp,
trong phạm vi ứng dụng cho một doanh nghiệp, xử lý dữ liệu được
thực hiện bằng phương pháp bán tự động.
Việc xử lý gán mã Bưu chính tại các Bưu cục cho dữ liệu

khách hàng được trình bày tại hình:
15
Hình 2.9. Lưu đồ gán mã BC huyện cho dữ liệu khách hàng
1.9. TẠI KHO DỮ LIỆU, CSDL ĐƯỢC CÀI ĐẶT NHƯ SAU
16
Hinh 2.11. Sơ đồ quan hệ giữa các bảng
17
CHƯƠNG 3.
PHÁT TRIỂN ỨNG DỤNG
1.10. MÔ TẢ HỆ THỐNG ỨNG DỤNG
1.10.1. Mô tả bài toán
Dữ liệu khách hàng phát sinh hàng tháng tại Bưu cục (PO) sẽ
có trong CSDL của mỗi Bưu cục đó. Sau đó mỗi Bưu cục này tự
thống kê và báo cáo doanh thu riêng tại mỗi Bưu cục (Client).
Đồng thời dữ liệu này sẽ được truyền tự động lên máy chủ (Server)
và tại mỗi Server có thể thống kê chung hoặc riêng lẻ của tất cả các
Bưu cục trực thuộc tỉnh.
Căn cứ doanh thu, sản lượng của mỗi Bưu cục để nhanh
chóng hoạch định đường lối chăm sóc khách hàng và đưa ra
phương hướng kinh doanh mới.
Kết xuất những báo cáo theo quy định nghiệp vụ.
1.10.2. Xác định yêu cầu của hệ thống
Mục tiêu của hệ thống là xây dựng nên một chương trình
chăm sóc khách đáp ứng các yêu cầu sau đây:
 Xây dựng một chương trình cài đặt trên các máy Client và
Server tại Bưu cục và tại Bưu điện tỉnh.
 Cho phép người dùng chỉnh sửa các thông tin.
 Đưa ra các báo cáo thống kê định kỳ hay đột xuất.
 Hệ thống cung cấp các thông tin hỗ trợ cho chuyên viên
thống kê biến động về doanh thu của từng Bưu cục hay toàn tỉnh,

để từ đó tham mưu Lãnh đạo đưa ra những chính sách phù hợp.
 Hệ thống cung cấp các biểu mẫu báo cáo nghệp vụ dùng
cho tại Bưu cục và cấp cao hơn.
Ưu điểm của hệ thống là giúp cho các Bưu cục và cấp cao
hơn quản lý doanh thu thông qua phần mềm.
18
1.11. PHÂN TÍCH THIẾT KẾ HỆ THỐNG
1.11.1. Phân tích hệ thống
a. Danh sách các tác nhân
b. Danh sách các ca sử dụng
c. Sơ đồ và đặc tả các ca sử dụng
1.12. THỬ NGHIỆM
1.12.1. Thử nghiệm chương trình
Cấu trúc của CSDL đó bao gồm hàng trăm trường (Field) và
dữ liệu là rất lớn. Do đó trong quá trình trích rút dữ liệu phải đảm
bảo không phá vỡ CSDL riêng lẻ hiện tại và phải phân biệt được dữ
liệu nào đã được trích rút, cộng thêm CSDL mới được trích rút phải
đảm bảo được tính toàn vẹn của thông tin trong các bảng (Table).
Do vậy, sau khi trích rút và tích hợp CSDL mới đã được bóc
tách để có những thông tin cần thiết để khai thác nhưng bên cạnh
đó CSDL mới vẫn bảo đảm, toàn vẹn mọi thuộc tính và thông tin
như trên CSDL cũ.
CSDL mới khi được tích hợp, nó bao gồm các thông tin của
các CSDL đã được trích rút và các thông tin trên các CSDL đó
được gắn kết với nhau bởi những quan hệ nhất định.
Để thấy rõ được, chúng ta xem bảng thống kê sau đây:
19
1.12.2. Đánh giá kết quả
Qua thử nghiệm, chúng tôi rút ra được bảng thống kê/so sánh
như sau:

20
Qua ứng dụng cho thấy những kết quả đạt được sau đây:
Dữ liệu đầu vào bao gồm các CSDL với dung lượng rất lớn.
Nhưng qua chương trình thì đã trích rút và tích hợp lại thành
CSDL mới, cần thiết có độ phức tạp thấp hơn nhưng vẫn đảm bảo
đầy đủ thông tin.
Các chức năng hệ thống hoạt động theo đúng yêu cầu đặt ra,
tích hợp tất các dữ liệu dịch vụ Bưu chính về kho dữ liệu. Chương
trình đã triển khai áp dụng thực tế tại các Bưu cục và Bưu điện tỉnh
Quảng Bình bước đầu mang lại những kết quả như mong đợi.
Xây dựng được chương trình thống kê và báo cáo doanh thu
đã thay thế được cách làm thủ công trước đây mỗi tháng, mỗi quý
các Bưu điện huyện, thị lập file excel để quản lý. Chương trình
trích xuất ra các báo cáo dưới dạng Exel để dễ quản lý và báo cáo
21
lên lãnh đạo đơn vị. Các chức năng của phần mềm trả về các biểu
thống kê và báo cáo tương đối chính xác. Qua đó làm cho Giao
dịch viên tại các Bưu cục kiểm soát được doanh thu và báo cáo
chính xác, nắm bắt được số lượng khách hàng để phân ra các đối
tượng khách hàng để kịp thời có kế hoạch chăm sóc khách hàng.
Mặt khác Lãnh đạo đơn vị nắm bắt được kết quả kinh doanh
của từng Bưu cục và trên toàn đơn vị. Qua đó nhằm đánh giá kết
quả, hiệu quả kinh doanh để kịp thời chấn chỉnh và điều phối hoạt
động kinh doanh phù hợp.
3.3.3. Minh họa ứng dụng
22
KẾT LUẬN
1. Kết quả đạt được
Đề tài đã tìm hiểu cơ sở lý thuyết về kho dữ liệu, tích hợp dữ
liệu, đặc biệt là hệ quản trị CSDL SQL server, qua đó có thể ứng

dụng trong việc tổ chức lại việc lưu trữ của doanh nghiệp. Từ cở sở
lý thuyết đó, chúng tôi đã đề xuất giải pháp tích hợp các CSDL cần
thiết tạo thành kho dữ liệu thống nhất và triển khai xây dựng ứng
dụng hỗ trợ trong các hoạt động kinh doanh của đơn vị. Hệ thống
hoạt động tốt đúng theo yêu cầu đề ra và bước đầu áp dụng tại các
Bưu cục của các đơn vị tại Bưu điện tỉnh Quảng Bình đạt kết quả
khả quan được Lãnh đạo đánh giá cao về lợi ích và thuận lợi cho
cán bộ công nhân viên của đơn vị.
2. Hạn chế
- Chưa thiết kế và thực thi đầy đủ các công cụ, các luật để hỗ
trợ người dùng xử lý dữ liệu một cách tự động.
- Do sự eo hẹp về thời gian cũng như hạn chế về tài liệu và
trình độ bản thân còn hạn chế, nên bản luận văn chưa thể đi sâu
vào phân tích đầy đủ mọi nghiệp vụ cũng như các phát sinh thực
tế. Nên không tránh khỏi những thiếu sót và chưa đáp ứng được
đầy đủ các yêu cầu thực tế.
3. Hướng phát triển
Mặc dù bước đầu đã áp dụng thành công những vấn đề nêu
ra. Tuy nhiên, để có thể hoàn thiện tốt hơn, đề tài cần nghiên cứu
bổ sung thêm các nội dung sau:
- Cần phải tích hợp CSDL thành một thể thống nhất để khai
thác và ứng dụng thêm nhiều ứng dụng khác nhau và tiện ích hơn.
- Xây dựng hoàn thiện hệ thống tích hợp dữ liệu.
23
- Nghiên cứu khả năng tích hợp dữ liệu khách hàng từ nhiều
nguồn, đặc biệt từ nguồn Internet nhằm phát triển hoạt động kinh
doanh cho doanh nghiệp.
24

×