Tải bản đầy đủ (.pdf) (36 trang)

Kho dữ liệu và Hệ hỗ trợ quyết định ( Nguyễn Thanh Bình ) - Chương 7 ppt

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (502.77 KB, 36 trang )

Chương
Chương
7:
7:
Phương th
Phương th


c xây
c xây
d
d


ng kho d
ng kho d


li
li


u
u
M
M


c đ
c đ
í


í
ch
ch
• Chứng thực việc sử dụng phương pháp luận
khi phát triển một giải pháp kho dữ liệu
• Xác định phương thức như là chuổi tiến trình
và tác vụ
• Giải thích lợi ích của hướng tăng tiến trong
việc phát triển kdl
• Xác định các kĩ năng đáp ứng cho việc thực
thi kho dữ liệu
Ti
Ti
ế
ế
n tr
n tr
ì
ì
nh
nh
• Phương thức
– Các tài liệu kĩ thuật, phân ra các module
– Xác lập các chuẩn hóa
– Cải tiến phương thức phân phối công việc
– Định nghĩa các tác vụ và phân phối công việc
• Các công cụ phần mềm và tài liệu hướng dẫn
• Phương thức kho dữ liệu
– Các tác vụ và phân phối công việc để xây dựng
kho dữ liệu và cài đặt

Phương th
Phương th


c
c
• Dựa trên cơ sở của công nghệ phần
mềm
• Cải tiến bằng:
– Nhận dạng các tác vụ lặp
– Định nghĩa các tác vụ một cách nhất quán
– Xác định các tiêu chuẩn đảm bảo chất
lượng và sự đầy đủ của dữ liệu
– Đinh nghĩa việc quản lí tác vụ
– Tối ưu hóa các tác vụ
C
C
á
á
c th
c th
à
à
nh ph
nh ph


n
n
• Nhằm vào các thành phần:

– Thu thập dữ liệu
– Siêu dữ liệu
– Thiết kế kĩ thuật cho kho dữ liệu
– Truy cập dữ liệu
– Chất lượng dữ liệu
– Khám phá
T
T
à
à
I li
I li


u v
u v
à
à
công c
công c


h
h


tr
tr



• Workplan
Templates
• Deliverables
Templates
• Online Handbooks
• Quick Tour
• Method Handbook
• Process and Task
Reference
• Deliverables Reference
Software Tools
Handbooks
Phương ph
Phương ph
á
á
p lu
p lu


n
n
• Tập trung vào phạm vi của ứng dụng
• Quản lí được các rủi ro
• Căn cứ vào các đóng góp của người dùng
• Cung cấp các giảI pháp có thể mở rộng
• Sử dụng nhiều công nghệ khác nhau
• Nhận dạng các tác vụ với các đối tượng và
định nghĩa rõ ràng
• Đưa các tác vụ vào trong các tiến trình, nhóm

tiến trình theo giai đoạn
C
C
á
á
c
c
l
l


i
i
í
í
ch
ch
Consistency
Productivity
Experience &
Best Practices
Flexibility
Risk
Avoidance
C
C
á
á
c y
c y

ế
ế
u t
u t


căn b
căn b


n
n
• Các tiến trình
• Các hướng
• Tác vụ và phân bố tác vụ
• Các chức năng
Phase 1 Phase 2 Phase 3
Phase 1 Task1
Phase 1 Task2
Phase 1 Task3
Phase 3 Task1
Phase 3 Task2
Phase 3 Task3
Phase 2 Task1
Phase 2 Task2
Phase 2 Task3
Process 1
Process 2
C
C

á
á
c ti
c ti
ế
ế
n tr
n tr
ì
ì
nh
nh
• Tập kết dính các tác vụ để thực hiện các mục
tiêu
• Tập các kĩ năng chung
• Dự án có thể chuyển giao
• Đa số là trùng lặp, một số thì lệ thuộc vào tiến
trình trước
C
C
á
á
c
c
ti
ti
ế
ế
n
n

tr
tr
ì
ì
nh
nh
Business Requirements Definition
Business Requirements Definition
Data Acquisition
Data Acquisition
Data Quality
Data Quality
Warehouse Administration
Warehouse Administration
Metadata Management
Metadata Management
Data Access
Data Access
Database Design and Build
Database Design and Build
Documentation
Documentation
Testing
Testing
Training
Training
Transition
Transition
Post
Post

-
-
Implementation Support
Implementation Support
Architecture
Architecture
Đ
Đ


nh ngh
nh ngh
ĩ
ĩ
a c
a c
á
á
c yêu c
c yêu c


u kinh doanh
u kinh doanh
• Định nghĩa các yêu cầu
• Phân lớp các vùng
• Khởi tạo các kế hoạch cài đặt
• Cung cấp sự khởi đầu tập trung vào việc tiến
hành xây dựng hệ thống cho công ty
• Xác định các yêu cầu về thông tin

• Các yêu cầu về mô hình
Thu th
Thu th


p d
p d


li
li


u
u
• Xác định, chiết, chuyển đổi, và chuyển tải dữ
liệu nguồn
• Xem xét dữ liệu bên trong và bên ngoài
• Chuyển dời dữ liệu giữa nguồn và đích
• Thực hiện phân tích kết nối giữa dữ liệu
nguồn và các đối tượng csdl đích
• Định nghĩa việc thu thập lần đầu và kế hoạch
làm tươi dữ liệu
• Định nghĩa các yêu cầu về công cụ
• Xây dựng, test, và thực hiện các module nạp
dữ liệu
Ki
Ki
ế
ế

n tr
n tr
ú
ú
c
c
• Định rõ các nền tảng kĩ thuật
• Thiết kế kiến trúc kho dữ liệu
• Tích hợp các thành phần kiến trúc cho mục
đích khả biến và mềm dẻo
• Xác định môi trường CSDL, phân tán hay tập
trung
• Định nghĩa các môi trường phát triển, test,
huấn luyện, và sản xuất
• Cấu hình nền Configure the platform
• Thực hiện việc tính dung lượng CSDL
• Xem xét việc làm sạch đĩa
Ch
Ch


t lư
t lư


ng c
ng c


a d

a d


li
li


u
u
• Đảm bảo tính nhất quán, đáng tin cậy và chính xác
của dữ liệu
• Phát triển một chiến lược để:
– Làm sạch dữ liệu
– Các chức năng đảm bảo tính toàn vẹn của dữ liệu
– Các chức năng quản lí chất lượng của dữ liệu
• Xác định các luật kinh doanh:
– Làm sạch dữ liệu
– Xử lí các lỗi
• Các yêu cầu cho việc tạo ra các công cụ kiểm tra
chất lượng của dữ liệu
• Xây dựng, test, và thực hiện các module cho việc tạo
và kiểm chứng chất lượng dữ liệu
B
B


o tr
o tr
ì
ì

kho d
kho d


li
li


u
u
• Định rõ một chiến lược bảo trì kho dữ liệu
– Quản lý cấu hình
– Quản lý kho dữ liệu
– Sự quản lí và chi phối dữ liệu
• Định nghĩa dòng công việc quản lí kdl và các
yêu cầu về công cụ
• Xây dựng, test, và thực hiện các module cho
việc bảo trì kho dữ liệu
• Quản lý việc truy cập dữ liệu và giám sát
• Tự động hóa các tác vụ quản lý kdl
C
C
á
á
c lo
c lo


i siêu d
i siêu d



li
li


u
u
• Định nghĩa chiến lược cho việc tạo và quản lí
siêu dữ liệu
• Định nghĩa các kiểu siêu dữ liệu
• Chỉ rõ các yêu cầu cho lưu trữ siêu dữ liệu
đáp ứng các yêu cầu quản lí việc tích hợp và
truy cập
• Khởi tạo các khung nhìn kĩ thuật và kinh
doanh cho siêu dữ liệu
• Phát triển các module cho việc nắm bắt, kết
nối và truy cập siêu dữ liệu
Truy c
Truy c


p d
p d


li
li



u
u
• Nhận diện, chọn lựa và thiết kế các công cụ quản lí
việc truy cập của người dùng
• Định nghĩa các hồ sơ của người dùng
• Xác định các yêu cầu của kiểu giao diện, các cấu
trúc câu hỏi, các báo cáo, và các loại người dùng
• Ước lược, đánh giá và cài đặt các công cụ quản lí
việc truy cập
• Thiết kế và phát triển các đối tượng truy cập dữ liệu
– Câu hỏi và báo cáo
– Catalogs
– Chiều và các phân cấp
Thi
Thi
ế
ế
t k
t k
ế
ế
v
v
à
à
xây d
xây d


ng cs d

ng cs d


li
li


u
u
• Hỗ trợ các yêu cầu dữ liệu
• Thiết kế CSDL nhằm mục đích cung cấp các
truy cập có hiệu quả
• Tạo và phê chuẩn các mô hình logic và vật lí
• Tạo lập các đối tượng CSDL quan hệ và đa
chiều
• Ước lược các phân đoạn, các đoạn, và việc
sắp xếp
• Nhận diện các khóa và chỉ mục
• Xây dựng và cài đặt các đối tượng csdl
L
L


p t
p t
à
à
i li
i li



u
u
• Cung cấp các văn bản có thể cung cấp
các thông tin:
– Từ điển thuật ngữ Glossary
– Tài liệu cho người dùng và tài liệu kĩ thuật
User and technical documentation
– Trợ giúp trực tuyến Online help
– Hướng dẫn tham khảo siêu dữ liệu
– Tham cứu sự quản lí kdl
– Hướng dẫn các tính năng mới
Test
Test
• Phát triển một chiến lược để test hệ thống
• Tạo lập các kế hoạch , kịch bản cho việc test
• Test tất cả các thành phần
– Thu thập dữ liệu
– Truy cập dữ liệu
– Các truy cập đặc biệt
– Hồi quy,
– Các volume
– Backup
– Sự khôi phục Recovery
Hu
Hu


n luy
n luy



n
n
• Định nghĩa các yêu cầu
– Về kĩ thuật Technical
– Của người dùng cuối End user
– Của yêu cầu kinh doanh
• Nhận diện các cá nhân cho việc huấn luyện
• Tạo lập khung thời gian cho việc huấn luyện
• Thiết kế và phát triển các tài liệu
• Tập trung vào việc huấn luyện sử dụng các
công cụ hỗ trợ hoạt động của kho dữ liệu
Chuy
Chuy


n giao
n giao
• Định nghĩa các tác vụ cho việc chuyển
giao sử dụng kdl
• Chuyển giao các chức năng và module
• Phát triển kế hoạch cài đặt
• Chuẩn bị môi trường bảo trì
• Chuẩn bị môi trường cho việc sử dụng
kho dữ liệu
H
H



tr
tr


h
h


u th
u th


c thi
c thi
• Ước lượng và khảo sát việc sử dụng kdl
• Giám sát việc sử dụng kdl
• Làm tươI kdl
• Giám sát và phản hồi các vấn đề xảy ra
• Điều khiển thực hiện test
• Có trách nhiệm chuyển giao sản phẩm
• Ước lượng và khảo sát các giải pháp thực thi
C
C
á
á
c
c





ng
ng
th
th


c
c
thi
thi
•Incremental
Packaged
Packaged
data
data
mart
mart
Warehouse
Infrastructure
Implementation
Business
Application
Implementation
Increment I
Proof of Concept
Increment II
through N
Increment II
through N

Warehouse
Warehouse
Data mart
Data mart
Data mart
Data mart
Data mart
Data mart

×