Data Warehouse and Business
Intelligence
Chương 2:
Qui trình phát triển kho dữ liệu
Data Warehouse and Business Intelligence
2
Mục tiêu
Xem xét những hoạt động cơ bản trong lập kế hoạch kho
dữ liệu
Chu trình cho một dự án kho dữ liệu
Thảo luận về tổ chức, vai trị và trách nhiệm của nhóm dự
án
Xem xét các dấu hiệu cảnh báo và nhân tố thành công
Data Warehouse and Business Intelligence
3
Nội dung
1.
2.
3.
4.
5.
6.
7.
Tổng quan
Các phương pháp luận phát triển kho dữ liệu
Hoạch định kho dữ liệu
Business Dimensional Lifecycle
Chuyển đổi dữ liệu
Quản trị kho dữ liệu
Các công cụ kỹ thuật cho kho dữ liệu
Data Warehouse and Business Intelligence
4
1. Tổng quan
Một số câu hỏi quan trọng cần được xem xét trước khi
quyết định xây dựng kho dữ liệu :
Theo các tiếp cận Top-down hay bottom-up ?
Dùng cho mức doanh nghiệp hay phòng ban ?
Cái nào trước - data warehouse hay data mart ?
Build pilot or go with a full-fledged implementation?
Data mart phục thuộc hay độc lập ?
Data Warehouse and Business Intelligence
5
2. Các phương pháp phát triển KDL
Có 2 phương pháp phát triển chính:
Top-Down
Bottom-Up
Data Warehouse and Business Intelligence
7
2.1 Top-Down
Cách tiếp cận của Bill Inmon
Dữ liệu trong KDL được lưu trữ ở mức “hạt”
(granularity) thấp nhất dựa trên mơ hình dữ liệu đã
chuẩn hóa
KDL là trung tâm của “Xưởng thông tin công ty”
(Corporate Information Factory-CIF) cung cấp một
khung nền luận lý (logical framework) cho việc chuyển
giao kinh doanh thông minh đến doanh nghiệp. Các hoạt
động kinh doanh cung cấp dữ liệu cho CIF.
KDL được tập trung hóa sẽ cung cấp các data mart phụ
thuộc có thể được thiết kế dựa trên mơ hình dữ liệu có
chiều
Data Warehouse and Business Intelligence
8
2.1 Top-Down (tt)
Nguồn: A Managers Guide to Data Warehousing
Data Warehouse and Business Intelligence
9
2.1 Top-Down (tt)
Thuận lợi:
Có được cái nhìn tồn diện (mức doanh nghiệp) về dữ liệu
Có kiến trúc rõ ràng, không phải là việc hợp nhất các data mart
khác nhau
Lưu trữ tập trung
Các luật và kiểm sốt tập trung
Có thể thấy kết quả nhanh chóng nếu được thực hiện bằng các
bước lặp
Hạn chế:
Mất nhiều thời gian
Tiềm ẩn rủi ro và thất bại cao
Cần có những kỹ năng của nhiều lĩnh vực ở mức cao
Tốn chi phí
Data Warehouse and Business Intelligence
10
2.2 Bottom-Up
Cách tiếp cận của Ralph Kimball
KDL công ty như là tập hợp của các data mart được làm
cho phù hợp
Data mart được tạo ra trước để cung cấp khả năng phân
tích và báo cáo cho những việc kinh doanh chun biệt
dựa trên mơ hình dữ liệu chiều
Data Warehouse and Business Intelligence
11
2.2 Bottom-Up (tt)
Nguồn: A Managers Guide to Data Warehousing
Data Warehouse and Business Intelligence
12
2.2 Bottom-Up (tt)
Thuận lợi:
Thực hiện nhanh và dễ hơn với những phần có thể quản lí
ROI có triển vọng và có thể thực hiện
Rủi ro thất bại ít
Có thể phát triển theo hướng tăng dần, các data mart quan
trọng có thể phát triển trước.
Cho phép nhóm dự án học tập và tăng trưởng
Hạn chế:
Mỗi data mart cho thấy góc nhìn hẹp về dữ liệu
Có q nhiều dữ liệu dư thừa trong mỗi data mart
Có quá nhiều dữ liệu khơng tương thích và bất thường
Gia tăng các giao diện khơng thể quản lí
Data Warehouse and Business Intelligence
13
3. Hoạch định cho KDL
3.1 Các vấn đề then chốt
3.2 Các yêu cầu nghiệp vụ phi công nghệ
3.3 Hỗ trợ của quản lí cấp cao
3.4 Biện minh cho KDL
3.5 Kế hoạch tổng thể
Data Warehouse and Business Intelligence
14
3.1 Các vấn đề then chốt (Key Issues)
Giá trị và những mong đợi
Đánh giá rủi ro
Top-Down hoặc Bottom-Up
Xây dựng hoặc mua
Single Vendor hoặc Best-of-Breed
Data Warehouse and Business Intelligence
15
3.2 Các yêu cầu nghiệp vụ phi công nghệ
Các yêu cầu nghiệp vụ chi phối KDL chứ không phải
công nghệ
Giải quyết nhu cầu người dùng về thông tin chiến lược
Không lập kế hoạch xây dựng KDL trước khi hiểu yêu
cầu
Bắt đầu bằng việc xác định thông tin cần thiết chứ không
phải cách để cung cấp thông tin
Không đặt nặng vào công cụ
Cấu trúc cơ bản và kiến trúc để hỗ trợ yêu cầu người dùng
là quan trọng hơn
Làm nghiên cứu sơ bộ
Data Warehouse and Business Intelligence
17
Nghiên cứu sơ bộ
At a minimum,obtain
Mission and functions of each user group
general information on
Computer systems used by the group
the following from
Key performance indicators
each group of users
Factors affecting success of the user group
Who the customers are and how they are classified
Types of data tracked for the customers, individually and as groups
Products manufactured or sold
Categorization of products and services
Locations where business is conducted
Levels at which profits are measured—per customer, per product,
per district
Levels of cost details and revenue
Current queries and reports for strategic information
Data Warehouse and Business Intelligence
18
3.3 Hỗ trợ của quản lí cấp cao
Để khởi tạo thành cơng cần có sự hỗ trợ của các nhà quản lí
(senior management)
Những nhà quản lí cấp cao nhất (top management) phải hỗ trợ
đầy đủ ngay từ đầu
KDL thường phải thỏa mãn các u cầu có tính xung đột.
Data Warehouse and Business Intelligence
19
3.5 Biện minh cho KDL
Một phác thảo của cấu trúc chi phí:
Hardware: 31%
Software (gồm DBMS): 24%
Nhân viên và người tích hợp hệ thống: 35%
Quản trị:10%
Làm sao để chứng minh về rủi ro và lợi ích (vơ hình và
hữu hình) ?
Làm sao tính tốn ROI và ROA ?
Xây dựng tình huống nghiệp vụ (business case) như thế
nào ?
Data Warehouse and Business Intelligence
20
3.6 Kế hoạch tổng thể
Có nhiều cách thức khác nhau để phát triển KDL
Cần có những khuyến cáo đối với CEO hoặc những nhà
điều hành cấp cao để đề xuất KDL như là giải pháp cho
các vấn đề về thơng tin của cơng ty
Có kế hoach thảo luận về kiểu KDL và danh sách những
kỳ vọng
Data Warehouse and Business Intelligence
22
4. The Business Dimensional Lifecycle
(Ralph Kimball,etc, 2001, The Data Warehouse Lifecycle Toolkit)
Data Warehouse and Business Intelligence
23
4. The Business Dimensional Lifecycle (cont.)
Minh họa luồng tổng thể của việc thực hiện KDL
Xác định tuần tự các nhiệm vụ và các hoạt động chính
thực hiện đồng thời
Có thể chỉnh sửa được để đáp ứng những nhu cầu đặc biệt
của tổ chức
Mỗi dự án sẽ thực hiện các tác vụ chi tiết khác nhau
Data Warehouse and Business Intelligence
24
4.1 Hoạch định dự án
Hoạch định dự án nhấn vào định nghĩa và phạm vi dữ liệu
bao gồm việc đánh giá sự sẵn sàng và minh chứng về mặt
kinh doanh
Tập trung vào nguồn lực và cấp độ kỹ năng của nhân viên
Hoạch định dự án phụ thuộc vào các yêu cầu kinh doanh
Data Warehouse and Business Intelligence
25
4.2 Xác định các yêu cầu kinh doanh
Hiểu yêu cầu kinh doanh của người dùng là trở ngại lớn
nhất đối với sự thành công của KDL
Các yêu cầu kinh doanh thiết lập thông qua 3 luồng song
song tập trung vào công nghệ, dữ liệu và các ứng dụng
người dùng
Data Warehouse and Business Intelligence
26
Ba luồng song song
Technology
Track
Data Track
Application
Track
Data Warehouse and Business Intelligence
27
Ba luồng song song (tt)
Luồng dữ liệu (Data Track)
Mơ hình chiều
Thiết kê vật lý
Thiết kế và phát triển giai đoạn dữ liệu (Data Staging)
Luồng công nghệ (Technology Track)
Thiết kế kiến trúc kỹ thuật
Chọn lựa và cài đặt kết quả
Luồng ứng dụng (Application Track)
Đặc tả ứng dụng người dùng cuối
Phát triển ứng dụng người dùng cuối
Data Warehouse and Business Intelligence
28