Nghiên cứu giải pháp Kho dữ liệu trong
Oracle Data Warehouse10g và áp dụng trong
bài toán xây dựng kho dữ liệu khách hàng –
Ngân hàng TMCP Tiên Phong
Trịnh Hồng Nam
Trường Đại học Công nghệ
Luận văn Thạc sĩ ngành: Hệ thống thông tin; Mã số: 60 48 05
Người hướng dẫn: PGS.TS. Đỗ Trung Tuấn
Năm bảo vệ: 2011
Abstract: Trình bày về khái niệm, mục tiêu, cấu trúc và thành phần của hệ quản trị cơ
sở dữ liệu. Nghiên cứu định nghĩa, đặc trưng , kiến trúc , thiết kế logic, thiết kế vật lý
của kho dữ liệu, qua đó tìm hiểu công cụ tích hợp dữ liệu, quản lý môi trường và bảo
trì kho dữ liệu. Giới thiệu về ngân hàng Tiên Phong qua mục đích, đặc tính và hỗ trợ
tích hợp của kho dữ liệu. Từ đó đưa ra giải pháp và đề xuất xây dựng kho dữ liệu
khách hàng. Cài đặt, thử nghiệm và kết quả.
Keywords: Hệ thống thông tin; Kho dữ liệu; Cơ sở dữ liệu
Content
GIỚI THIỆU BÀI TOÁN
Nguồn dữ liệu đối với các tập đoàn công nghệ, tài chính, ngân hàng là vô cùng lớn.
Xây dựng một kho dữ liệu cho phép rút trích tài nguyên, tính toán theo yêu cầu để cung cấp
các báo cáo dựa vào cơ sở dữ liệu hoạt động phục vụ sản xuất, kinh doanh trở nên thông minh
hơn, tăng thêm chất lượng và tính linh hoạt của việc phân tích kinh doanh có chất lượng cao
và ổn định.
Với sự phát triển của mô hình kho dữ liệu, ngày nay ở Việt nam các tổ chức, doanh
nghiệp luôn chú trọng khả năng lưu trữ, xử lý và khai thác thông tin giúp nhà quản trị, lãnh
đạo phân tích trên các lớp dữ liệu dự báo được các khuynh hướng phát triển, đưa ra các quyết
sách đúng đắn, kịp thời và hiệu quả cho cơ quản, tổ chức của mình. Để khắc phục những hạn
chế mà hiện nay tại đơn vị tôi đang công tác, trên cơ sở nghiên cứu, tìm hiểu về các giải pháp,
công nghệ do vậy đó là những lý do để tôi đăng ký đề tài luận văn này.
NỘI DUNG LUẬN VĂN
Việc hoạch định chiến lược, xây dựng mua sắm trang thiết bị, trang bị cơ sở hạ tầng
luôn phải đảm bảo đáp ứng đầy đủ cho cả một tổ chức vận hành do vậy nhu cầu thông tin
phục vụ công tác quản lý, điều hành, ra quyết định tại mỗi tổ chức đặc biệt với hoạt động
trong lĩnh vực ngành ngân hàng thì luôn có những đặc thù khác biệt, luôn mong muốn một mô
hình hoạt động hoàn hảo, ổn định và đáp ứng đầy đủ cả vấn đề công nghệ thông tin và nghiệp
vụ tác nghiệp.
2
Có thể nói hoạt động tác nghiệp trong lĩnh vực tài chính, ngân hàng thì nguồn khách
hàng luôn đem lại lợi nhuận chính của ngân hàng. Vì thế, khách hàng được xem như là nguồn
nuôi dưỡng cho các tổ chức, doanh nghiệp hoạt động chủ yếu qua các nghiệp vụ tín dụng.
Hoạt động kinh doanh của mỗi doanh nghiệp là khác nhau do vậy định nghĩa đối
tượng khách hàng cũng không giống nhau, đồng thời trong quá trình hoạt động kinh doanh, số
lượng khách hàng cũng không ngừng thay đổi. Căn cứ vào các tiêu chí và các điều kiện khác
để tiến hành phân loại khách hàng là khách hàng cá nhân hay khách hàng doanh nghiệp.
Sự đa dạng của nhu cầu thông tin, cùng với những yêu cầu báo cáo tình hình hoạt
động sản xuất kinh doanh, báo cáo tài chính lỗ/lãi, tài sản, tín dụng, nhân sự… cũng có tới
hàng trăm, hàng nghìn bảng biểu trong các quy trình nghiệp vụ tài chính, ngân hàng. Tất cả
đều được sử dụng phục vụ theo các đối tượng người sử dụng.
1. Lãnh đạo: Cần các thông tin tổng thể về hoạt động của ngân hàng, hỗ trợ quyết
định, hoạch định chính sách.
2. Các phòng ban chức năng: Tổng hợp, phân tích thông tin theo các yêu cầu nghiệp
vụ cụ thể.
3. Chi nhánh: Tình hình hoạt động của chi nhánh.
4. Khách hàng: Các thông tin hỗ trợ, tra cứu …
Nhu cầu cho hệ thống tác nghiệp đa chiều
Một trong những nhu cầu tất yếu với hệ thống tác nghiệp đa chiều đối với kho dữ liệu.
Việc xây dựng kho dữ liệu phục vụ đáp ứng nhu cầu phân tích thông tin đa chiều.
1. Các phân tích sâu hơn và nhiều chiều hơn …, các báo cáo phân tích phức tạp với
nhiều tiêu chí đan xen.
• Phân tích lợi nhuận (giá trị, tỷ suất) chi tiết đến từng chi nhánh.
• Phân tích lợi nhuận (giá trị, tỷ suất) chi tiết đến từng loại sản phẩm, dịch vụ.
2. Phân tích trên một khoảng thời gian dài.
• Phân tích sự tăng trưởng về giá trị huy động vốn từ những khách hàng cá nhân
trên địa bàn Hà Nội trong khoảng thời gian từ năm 2002 đến 2010.
3. Những phân tích dự báo, có sự kết hợp với các nguồn dữ liệu bên ngoài.
• Những phân tích kiểu “what-if” ? (các kịch bản nào có thể xảy ra với từng tình
huống cụ thể), ví dụ: tăng lãi suất.
• Dự báo nhu cầu vay vốn của một các khách hàng doanh nghiệp xuất nhập khẩu
trong quý III/2010.
• Dự báo tổng giá trị huy động từ các khách hàng cá nhân khu vực Hà Nội.
Giải pháp mang toàn diện và lâu dài để đáp ứng tốt nhất các nhu cầu thông tin
của ngân hàng:
1. Quan điểm thiết kế đa chiều (tổ chức dữ liệu đa chiều), chuyên để phân tích thông
tin, hỗ trợ quyết định đáp ứng tốt nhất các nhu cầu phân tích đa chiều, hỗ trợ
quyết định.
2. Phương pháp tối ưu để lưu trữ khối lượng lớn dữ liệu lịch sử, dữ liệu tích lũy theo
thời gian, cho phép phân tích theo thời gian dài.
3. Tích hợp dữ liệu từ nhiều nguồn đủ các thông tin liên quan.
4. DWH sẽ khai thác được kho dữ liệu quý giá đang có để tạo ra những thông tin giá
trị cho hoạch định chiến lược, chính sách kinh doanh, chính sách chăm sóc khách
hàng tốt nhất (từ khai phá dữ liệu để xác định các quy luật nghiệp vụ).
5. Tầng ứng dụng BI tạo ra một lớp các thông tin nghiệp vụ luôn ở trạng thái sẵn sàng
và thuận tiện truy vấn, do đó, mang đến cho người dùng sự chủ động cao khi phân
tích.
6. DWH củng cố nền tảng CNTT của ngân hàng, giúp ngân hàng quản trị hiệu quả tài
nguyên thông tin, đóng góp một phần quan trọng vào sự phát triển bền vững của
3
NH. Từ đó gia tăng sức cạnh tranh cho ngân hàng trong môi trường sôi động và
cạnh tranh ngày càng quyết liệt.
KẾT LUẬN
Một hệ thống kho dữ liệu xây dựng thành công giúp cho mô hình hoạt động tác nghiệp
ngành tài chính ngân hàng sẽ đạt hiệu quả, thuận tiện hơn trong các ứng dụng thực tiễn với
các hệ thống báo cáo, các dự báo và phân tích cho phép tổ chức/doanh nghiệp khai thác dữ
liệu từ nhiều nguồn khác nhau về khách hàng, thị trường, nhà cung cấp, đối tác, nhân sự và
phân tích/sử dụng các dữ liệu đó thành các nguồn thông tin có ý nghĩa nhằm hỗ trợ các nhà
lãnh đạo có được đầy đủ thông tin thể hiện tình hình hoạt động của tổ chức mình mà đưa ra
quyết định, định hướng, chiến lược hợp lý, kịp thời.
Do hạn chế về kinh nghiệm và thời gian thực hiện nên “Giải pháp xây dựng kho dữ
liệu thông tin khách hàng – Ngân hàng TMCP Tiên Phong” mới chỉ thể hiện được một phần
cho vấn đề khai phá thông tin khách hàng. Đề tài đã cố gắng tập trung tìm hiểu, nghiên cứu và
trình bày được một số kỹ thuật và sử dụng một số sản phẩm của Oracle phục vụ trong công
việc xây dựng kho dữ liệu, trình bày nội dung giải pháp và đưa ra các đề xuất, cài đặt thử
nghiệm. Trong tương lại tôi sẽ tiếp tục nghiên cứu để hoàn thiện và mở rộng hướng tiếp cận
với bài toán khai phá thông tin từ kho dữ liệu với nguồn dữ liệu tổng quát hơn kết hợp song
song ứng dụng vào bài toán thực tế và hy vọng sẽ đạt được kết quả mong muốn.