Tải bản đầy đủ (.pdf) (52 trang)

Bài giảng Kho dữ liệu và kinh doanh thông minh - Chương 2: Quy trình phát triển kho dữ liệu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.01 MB, 52 trang )

Data Warehouse and Business
Intelligence


Chương 2:
Qui trình phát triển kho dữ liệu

Data Warehouse and Business Intelligence

2


Mục tiêu
 Xem xét những hoạt động cơ bản trong lập kế hoạch kho
dữ liệu
 Chu trình cho một dự án kho dữ liệu
 Thảo luận về tổ chức, vai trị và trách nhiệm của nhóm dự
án
 Xem xét các dấu hiệu cảnh báo và nhân tố thành công

Data Warehouse and Business Intelligence

3


Nội dung
1.
2.
3.
4.
5.


6.
7.

Tổng quan
Các phương pháp luận phát triển kho dữ liệu
Hoạch định kho dữ liệu
Business Dimensional Lifecycle
Chuyển đổi dữ liệu
Quản trị kho dữ liệu
Các công cụ kỹ thuật cho kho dữ liệu

Data Warehouse and Business Intelligence

4


1. Tổng quan
 Một số câu hỏi quan trọng cần được xem xét trước khi
quyết định xây dựng kho dữ liệu :






Theo các tiếp cận Top-down hay bottom-up ?
Dùng cho mức doanh nghiệp hay phòng ban ?
Cái nào trước - data warehouse hay data mart ?
Build pilot or go with a full-fledged implementation?
Data mart phục thuộc hay độc lập ?


Data Warehouse and Business Intelligence

5


2. Các phương pháp phát triển KDL
Có 2 phương pháp phát triển chính:



Top-Down
Bottom-Up

Data Warehouse and Business Intelligence

7


2.1 Top-Down







Cách tiếp cận của Bill Inmon
Dữ liệu trong KDL được lưu trữ ở mức “hạt”
(granularity) thấp nhất dựa trên mơ hình dữ liệu đã

chuẩn hóa
KDL là trung tâm của “Xưởng thông tin công ty”
(Corporate Information Factory-CIF) cung cấp một
khung nền luận lý (logical framework) cho việc chuyển
giao kinh doanh thông minh đến doanh nghiệp. Các hoạt
động kinh doanh cung cấp dữ liệu cho CIF.
KDL được tập trung hóa sẽ cung cấp các data mart phụ
thuộc có thể được thiết kế dựa trên mơ hình dữ liệu có
chiều

Data Warehouse and Business Intelligence

8


2.1 Top-Down (tt)

Nguồn: A Managers Guide to Data Warehousing
Data Warehouse and Business Intelligence

9


2.1 Top-Down (tt)
 Thuận lợi:
 Có được cái nhìn tồn diện (mức doanh nghiệp) về dữ liệu
 Có kiến trúc rõ ràng, không phải là việc hợp nhất các data mart
khác nhau
 Lưu trữ tập trung
 Các luật và kiểm sốt tập trung

 Có thể thấy kết quả nhanh chóng nếu được thực hiện bằng các
bước lặp

 Hạn chế:





Mất nhiều thời gian
Tiềm ẩn rủi ro và thất bại cao
Cần có những kỹ năng của nhiều lĩnh vực ở mức cao
Tốn chi phí

Data Warehouse and Business Intelligence

10


2.2 Bottom-Up
 Cách tiếp cận của Ralph Kimball
 KDL công ty như là tập hợp của các data mart được làm
cho phù hợp
 Data mart được tạo ra trước để cung cấp khả năng phân
tích và báo cáo cho những việc kinh doanh chun biệt
dựa trên mơ hình dữ liệu chiều

Data Warehouse and Business Intelligence

11



2.2 Bottom-Up (tt)

Nguồn: A Managers Guide to Data Warehousing
Data Warehouse and Business Intelligence

12


2.2 Bottom-Up (tt)
 Thuận lợi:





Thực hiện nhanh và dễ hơn với những phần có thể quản lí
ROI có triển vọng và có thể thực hiện
Rủi ro thất bại ít
Có thể phát triển theo hướng tăng dần, các data mart quan
trọng có thể phát triển trước.
 Cho phép nhóm dự án học tập và tăng trưởng

 Hạn chế:






Mỗi data mart cho thấy góc nhìn hẹp về dữ liệu
Có q nhiều dữ liệu dư thừa trong mỗi data mart
Có quá nhiều dữ liệu khơng tương thích và bất thường
Gia tăng các giao diện khơng thể quản lí

Data Warehouse and Business Intelligence

13


3. Hoạch định cho KDL
3.1 Các vấn đề then chốt
3.2 Các yêu cầu nghiệp vụ phi công nghệ
3.3 Hỗ trợ của quản lí cấp cao
3.4 Biện minh cho KDL
3.5 Kế hoạch tổng thể

Data Warehouse and Business Intelligence

14


3.1 Các vấn đề then chốt (Key Issues)
 Giá trị và những mong đợi
 Đánh giá rủi ro
 Top-Down hoặc Bottom-Up
 Xây dựng hoặc mua
 Single Vendor hoặc Best-of-Breed

Data Warehouse and Business Intelligence


15


3.2 Các yêu cầu nghiệp vụ phi công nghệ
 Các yêu cầu nghiệp vụ chi phối KDL chứ không phải
công nghệ
 Giải quyết nhu cầu người dùng về thông tin chiến lược
 Không lập kế hoạch xây dựng KDL trước khi hiểu yêu
cầu
 Bắt đầu bằng việc xác định thông tin cần thiết chứ không
phải cách để cung cấp thông tin
 Không đặt nặng vào công cụ
 Cấu trúc cơ bản và kiến trúc để hỗ trợ yêu cầu người dùng
là quan trọng hơn
 Làm nghiên cứu sơ bộ
Data Warehouse and Business Intelligence

17


Nghiên cứu sơ bộ
At a minimum,obtain
Mission and functions of each user group
general information on
Computer systems used by the group
the following from
Key performance indicators
each group of users
Factors affecting success of the user group

Who the customers are and how they are classified
Types of data tracked for the customers, individually and as groups
Products manufactured or sold
Categorization of products and services
Locations where business is conducted
Levels at which profits are measured—per customer, per product,
per district
 Levels of cost details and revenue
 Current queries and reports for strategic information











Data Warehouse and Business Intelligence

18


3.3 Hỗ trợ của quản lí cấp cao
 Để khởi tạo thành cơng cần có sự hỗ trợ của các nhà quản lí
(senior management)
 Những nhà quản lí cấp cao nhất (top management) phải hỗ trợ
đầy đủ ngay từ đầu

 KDL thường phải thỏa mãn các u cầu có tính xung đột.

Data Warehouse and Business Intelligence

19


3.5 Biện minh cho KDL
 Một phác thảo của cấu trúc chi phí:





Hardware: 31%
Software (gồm DBMS): 24%
Nhân viên và người tích hợp hệ thống: 35%
Quản trị:10%

 Làm sao để chứng minh về rủi ro và lợi ích (vơ hình và
hữu hình) ?
 Làm sao tính tốn ROI và ROA ?
 Xây dựng tình huống nghiệp vụ (business case) như thế
nào ?

Data Warehouse and Business Intelligence

20



3.6 Kế hoạch tổng thể
 Có nhiều cách thức khác nhau để phát triển KDL
 Cần có những khuyến cáo đối với CEO hoặc những nhà
điều hành cấp cao để đề xuất KDL như là giải pháp cho
các vấn đề về thơng tin của cơng ty
 Có kế hoach thảo luận về kiểu KDL và danh sách những
kỳ vọng

Data Warehouse and Business Intelligence

22


4. The Business Dimensional Lifecycle

(Ralph Kimball,etc, 2001, The Data Warehouse Lifecycle Toolkit)

Data Warehouse and Business Intelligence

23


4. The Business Dimensional Lifecycle (cont.)
 Minh họa luồng tổng thể của việc thực hiện KDL
 Xác định tuần tự các nhiệm vụ và các hoạt động chính
thực hiện đồng thời
 Có thể chỉnh sửa được để đáp ứng những nhu cầu đặc biệt
của tổ chức
 Mỗi dự án sẽ thực hiện các tác vụ chi tiết khác nhau


Data Warehouse and Business Intelligence

24


4.1 Hoạch định dự án
 Hoạch định dự án nhấn vào định nghĩa và phạm vi dữ liệu
bao gồm việc đánh giá sự sẵn sàng và minh chứng về mặt
kinh doanh
 Tập trung vào nguồn lực và cấp độ kỹ năng của nhân viên
 Hoạch định dự án phụ thuộc vào các yêu cầu kinh doanh

Data Warehouse and Business Intelligence

25


4.2 Xác định các yêu cầu kinh doanh
 Hiểu yêu cầu kinh doanh của người dùng là trở ngại lớn
nhất đối với sự thành công của KDL
 Các yêu cầu kinh doanh thiết lập thông qua 3 luồng song
song tập trung vào công nghệ, dữ liệu và các ứng dụng
người dùng

Data Warehouse and Business Intelligence

26


Ba luồng song song

Technology
Track

Data Track

Application
Track

Data Warehouse and Business Intelligence

27


Ba luồng song song (tt)
 Luồng dữ liệu (Data Track)
 Mơ hình chiều
 Thiết kê vật lý
 Thiết kế và phát triển giai đoạn dữ liệu (Data Staging)

 Luồng công nghệ (Technology Track)
 Thiết kế kiến trúc kỹ thuật
 Chọn lựa và cài đặt kết quả

 Luồng ứng dụng (Application Track)
 Đặc tả ứng dụng người dùng cuối
 Phát triển ứng dụng người dùng cuối

Data Warehouse and Business Intelligence

28



×