Tải bản đầy đủ (.ppt) (26 trang)

Tài liệu Mô hình kho dữ liệu pptx

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.96 MB, 26 trang )

1
MÔ HÌNH KHO DỮ LIỆU
02/23/14 MÔ HÌNH KHO DỮ LIỆU 2
02/23/14 MÔ HÌNH KHO DỮ LIỆU 3
Nội dung báo cáo
SƠ ĐỒ HÌNH TUYẾT RƠI ( SNOWFLAKE)
2
SƠ ĐỒ HÌNH SAO ( STAR SCHEMA )
31
SƠ ĐỒ KẾT HỢP
33
02/23/14 MÔ HÌNH KHO DỮ LIỆU 4
1.SƠ ĐỒ HÌNH SAO
1. ĐẶC ĐIỂM
2. LƯỢC ĐỒ HÌNH SAO
3. FACT VÀ DIMENSION
4. MỐI QUAN HỆ GIỮA FACT VÀ DIMENSION
5. ƯU ĐIỂM
6. NHƯỢC ĐIỂM
02/23/14 MÔ HÌNH KHO DỮ LIỆU 5
1.SƠ ĐỒ HÌNH SAO

Dữ liệu không chuẩn hóa.

Một bảng dữ kiện và các chiều bao quanh.

Các truy vấn nhằm vào bảng dữ kiện và được cấu
trúc bởi các bảng chiều.

Cho phép một hệ thống các đối tượng có thể kết nối
với nhiều đối tượng khác.


ĐẶC ĐIỂM:
Ví dụ
02/23/14 MÔ HÌNH KHO DỮ LIỆU 6
1.SƠ ĐỒ HÌNH SAO


02/23/14 MÔ HÌNH KHO DỮ LIỆU 7
1.SƠ ĐỒ HÌNH SAO
XÁC ĐỊNH VÀ PHÂN LOẠI DỮ LIỆU

Các sự kiện được tổ chức thành bảng Fact.

Phạm vi hay chiều của dữ liệu được tổ chức
thành các bảng Dimension.
02/23/14 MÔ HÌNH KHO DỮ LIỆU 8
1.SƠ ĐỒ HÌNH SAO
Fact chứa các thông tin cơ sở ở mức giao tác ở trong
nghiệp vụ mà các ứng dụng cần thiết.
Ví dụ: Khi phân tích kết quả học tập của sinh viên
trường DHTN thì cần những dữ liệu : Mã sinh viên, họ
tên, ngày sinh, giới tính, điểm thi… Trước khi đưa vào
kho dữ liệu thì cần phải chọn Mã sinh viên làm khóa
ngoại trong các quan hệ liên kết và khóa ngoại này được
lưu trong bảng Fact.
02/23/14 MÔ HÌNH KHO DỮ LIỆU 9
1.SƠ ĐỒ HÌNH SAO
Dimension chứa các thông tin mô tả, các dữ liệu cần thiết
cho việc thực hiện các giao tác nghiệp vụ theo một chiều
hay một phạm vi nào đó.
Ví dụ: Trong ứng dụng phân tích kết quả học tập của

sinh viên trường DHTN, các thông tin như: họ tên, ngày
sinh, giới tính, điểm thi,… được lưu trữ trên các bảng
Dimension
02/23/14 MÔ HÌNH KHO DỮ LIỆU 10
1.SƠ ĐỒ HÌNH SAO
Phân loại Dimension:
 Chiều phẳng (flat dimension)
 Chiều phân cấp (hierarchical dimension)
02/23/14 MÔ HÌNH KHO DỮ LIỆU 11
1.SƠ ĐỒ HÌNH SAO

Chiều phẳng (flat dimension): Các giá trị của
chiều có cùng mức, không giá trị nào đó là cha hay
con của giá trị khác
Dimension sinhvien
Holot Ten Phai Ngaysinh
02/23/14 MÔ HÌNH KHO DỮ LIỆU 12
1.SƠ ĐỒ HÌNH SAO

Chiều phân cấp ( hierarchiacal dimension):
Các giá trị của chiều có quan hệ một – nhiều.
Dimension thời gian
Năm Ngày nghỉ Chu kỳ
Qúy
Tuần
Tháng
Ngày
02/23/14 MÔ HÌNH KHO DỮ LIỆU 13
MỐI QUAN HỆ GIỮA BẢN FACT VÀ DIMENSION


Fact chứa khóa của các Dimension.

Dimension thường có định danh duy nhất và chứa
những thông tin về chiều của bảng Fact.

Một sơ đồ hình sao đơn giản chỉ gồm 1 bảng Fact và
ít nhất 3 bảng Dimension.

Một sơ đồ hình sao phức tạp gồm hàng trăm bảng
Fact và bảng Dimension.

02/23/14 MÔ HÌNH KHO DỮ LIỆU 14
MaCK Nam Quy Thang
001 2000 1 Một
002 2000 1 Hai
…. ………. …… ….
012 2000 4 Mười hai
MaKH HOTEN DIACHI
1004 Trần Hòa Hà Nội
1005 Lê An Hải Phòng
…. ………. ……
2010 Lê Nam ĐăkLăk
MaSP TenSP DVT
100 cam vắt LIT
105 Pepsi chai
…. ………. ….
201 Coca chai
MaSP MaCK MaKH Dongia Soluong
100 001 1004 15000 25
105 002 1005 12000 12

…. …. …. ….
100 001 1004 15000 25
1.SƠ ĐỒ HÌNH SAO
Bảng Demension:ChuKy
Bảng Demension:KhachHang
Bảng Demension:SanPham
Bảng FACT
02/23/14 MÔ HÌNH KHO DỮ LIỆU 15
1. SƠ ĐỒ HÌNH SAO

Hỗ trợ rất đa dạng các thao tác, xử lý khá hiệu
quả những câu truy vấn.

Phù hợp với cách mà NSD nhận và sử dụng dữ
liệu.

Nguyên lý cơ bản của sơ đồ hình sao là một dạng
dư thừa dữ liệu cải thiện sự thực hiện các truy vấn.

Trực quan, dễ sử dụng, thể hiện khung nhìn đa
chiều về dữ liệu trong CSDL quan hệ.
5.ƯU ĐIỂM:
02/23/14 MÔ HÌNH KHO DỮ LIỆU 16
1. SƠ ĐỒ HÌNH SAO
Vì bảng Fact được tổng hợp từ trước và được kết
hợp theo chiều nên xu hướng có rất nhiều hàng và
tăng trưởng một cách nhanh chóng  độ dư thừa
dữ liệu lớn.
6. NHƯỢC ĐIỂM:
02/23/14 MÔ HÌNH KHO DỮ LIỆU 17

2. SƠ ĐỒ HÌNH TUYẾT RƠI
1. ĐẶC ĐIỂM
2. LƯỢC ĐỒ HÌNH TUYẾT RƠI
3. ƯU ĐIỂM
4. PHÂN BIỆT SƠ ĐỒ HÌNH SAO VÀ HÌNH TUYẾT RƠI
02/23/14 MÔ HÌNH KHO DỮ LIỆU 18
2. SƠ ĐỒ HÌNH TUYẾT RƠI
ĐẶC ĐIỂM:

Là sự mở rộng của sơ đồ hình sao tại đó mỗi
cánh sao không phải là 1 bảng Deminsion mà là
nhiều bảng.

Các chiều được chuẩn hóa (chuẩn 3).
02/23/14 MÔ HÌNH KHO DỮ LIỆU 19
2. SƠ ĐỒ HÌNH TUYẾT RƠI

02/23/14 MÔ HÌNH KHO DỮ LIỆU 20
2. SƠ ĐỒ HÌNH TUYẾT RƠI

Cải thiện năng suất truy vấn.

Tối thiểu không gian đĩa cần thiết để lưu trữ dữ liệu.

Tăng tính linh hoạt của các ứng dụng bởi sự chuẩn hóa
ít mang bản chất theo chiều hơn.
ƯU ĐIỂM:
Ví dụ
02/23/14 MÔ HÌNH KHO DỮ LIỆU 21
2. SƠ ĐỒ HÌNH TUYẾT RƠI

PHÂN BIỆT SƠ ĐỒ HÌNH SAO VỚI SƠ ĐỒ TUYẾT RƠI
SƠ ĐỒ HÌNH SAO SƠ ĐỒ TUYẾT RƠI
-
Chưa tối thiểu không gian
đĩa cần thiết để lưu trữ data.
-
Việc truy cập đến các
bảng đơn giản hơn.
-
Chưa chuẩn hóa
-
Tốc độ truy vấn chậm
-
Tối thiểu không gian đĩa
cần thiết để lưu trữ data.
-
Việc truy cập đến các
bảng phức tạp hơn.
-
Đã chuẩn hóa .
-
Tốc độ truy vấn nhanh
02/23/14 MÔ HÌNH KHO DỮ LIỆU 22
3. SƠ ĐỒ KẾT HỢP
1. ĐẶC ĐIỂM
2. SƠ ĐỒ KẾT HỢP
3. ƯU ĐIỂM
02/23/14 MÔ HÌNH KHO DỮ LIỆU 23
3. SƠ ĐỒ KẾT HỢP
ĐẶC ĐIỂM:

Là sự kết hợp giữa sơ đồ hình sao dựa trên bảng fact
và những bảng dimension không chuẩn hóa và sơ đồ
hình tuyết rơi trong đó tất cả các bảng Dimension đều
được chuẩn hóa.
02/23/14 MÔ HÌNH KHO DỮ LIỆU 24
3. SƠ ĐỒ KẾT HỢP
VÍ DỤ:
02/23/14 MÔ HÌNH KHO DỮ LIỆU 25
3. SƠ ĐỒ KẾT HỢP
ƯU ĐIỂM:

Cải thiện năng suất truy vấn.

Hỗ trợ rất đa dạng các thao tác, xử lý khá hiệu quả
những câu truy vấn.

Tạo ra một khung nhìn đa chiều về dữ liệu trong CSDL.

×