Tải bản đầy đủ (.pdf) (50 trang)

Kho dữ liệu và Hệ hỗ trợ quyết định ( Nguyễn Thanh Bình ) - Chương 4 doc

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (731.43 KB, 50 trang )

Chương
Chương
4:
4:
Mô h
Mô h
ì
ì
nh d
nh d


li
li


u đa chi
u đa chi


u
u
N
N


i
i
dung
dung
chương


chương
• Các khái niệm chính của mô hình dữ
liệu đa chiều
– Dữ kiện (Fact)
– Chiều (Dimension)
– Độ thô
– Tổng hợp
• Các mô hình lưu trữ
Mô h
Mô h
ì
ì
nh d
nh d


li
li


u đa chi
u đa chi


u
u
• Được đề xuất và thiết kế cho một mục đích
phân tích dữ liệu
• Mô hình dữ liệu này không phù hợp cho hệ
thống OLTP

• Mô hình dữ liệu này được thao tác bởi các
công cụ OLAP
– Các công cụ này cung cấp các phương tiện truy
vấn mạnh dựa trên thiết kế mô hình dữ liệu đa
chiều
– Ví dụ như: TARGIT Analysis, SQL OLAP Server
Mô h
Mô h
ì
ì
nh d
nh d


li
li


u đa chi
u đa chi


u
u
Location
Time
Month
Year
Day
Week

All
Quarter
Store
District
Region
All
Product
Product
Brand
Manufacturer
All
C
C
á
á
c th
c th
à
à
nh ph
nh ph


n ch
n ch
í
í
nh
nh
• Các dữ kiện (Facts)

– Miêu tả các vùng kinh doanh
– Không thay đổi khi nó đã được sinh ra
– Được lưu tại một cấp thô nào đó
• Các chiều (Dimensions)
– Thông tin tham chiếu qua đó các dữ kiện
có thể được cấu trúc cho việc phân tích
– Định nghĩa các phân cấp
• Và các khối đa chiều (Cubes)
Kh
Kh


i
i
• Một khối có thể có nhiều chiều
– Nếu có nhiều hơn 3 chiều sẽ được gọi là ‘siêu
khối’ (”hypercube”)
– Về mặt lý thuyết thì số chiều là không hạn chế
– Thường thì số chiều là từ 4 đến 12
• Một khối bao gồm nhiều ô dữ liệu
– Là một liên kết giữa các giá trị của chiều
– Một ô có thể là rỗng (không có dữ liệu cho liên kết
này)
– Khối thưa (sparsecube): có nhiều ô rỗng
– Khối dày đặc (densecube): có ít ô rỗng
V
V
í
í
d

d


v
v


ô r
ô r


ng
ng
V
V
í
í
d
d


v
v


d
d


ki

ki


n
n
v
v
à
à
chi
chi


u
u
• Kho Grocery
• Dữ kiện:
– POS:point of sales sự kiện bán hàng
• Chiều:
– Thời gian (Time)
– Vị trí Kho (Location - Store)
– Sản phẩm (Product)
– Quảng cáo (Promotion)
Kh
Kh


i
i
Grocery

Grocery
C
C
á
á
c k
c k
h
h
á
á
i ni
i ni


m v
m v


chi
chi


u
u
• Miền phân cấp
• Các cấp (Levels), cấp tương ứng với
các độ thô
• Lược đồ chiều Dimension schema
• Các toán tử chiều Dimension operators

C
C
á
á
c v
c v
í
í
d
d


v
v


chi
chi


u
u
Thu
Thu


c t
c t
í
í

nh chi
nh chi


u
u
• Một chiều bao gồm nhiều thuộc tính. Ví dụ như:
– Time dimension: day, month, year
– Product dimension: ProductID, LineID, BrandID
• Một chiều được cấu trúc/ tổ chức ở dạng phân cấp:
– Time dimension: day week  quarter
– Product dimension: product  brand  manufacturer
• Các thuộc tính xác định cấp nào mà một phần tử
chiều thuộc vào
• Các phần tử time có cùng năm, tháng thuộc về cấp
‘month’
• Tất cả phần tử product có cùng brand thuộc về cấp
‘brand’
V
V
í
í
d
d


v
v



v
v
ù
ù
ng
ng
phân
phân
c
c


p
p
1999
Q1.1999
Jan.1999
W1.1999
all
W5.1999 W9.1999
Feb.1999 Mar.1999
1.Jan.1999
6.Jan.1999 1.Feb.1999 3.Feb.1999 3.Mar.1999




c đ
c đ



chi
chi


u v
u v
à
à
phân c
phân c


p
p
Product
Product
Brand
Manufacturer
All
Geography
Store
District
Region
All
Time
Month
Year
Day
Week

All
Quarter
C
C
á
á
c to
c to
á
á
n t
n t


chi
chi


u
u
1999
Q1.1999
Jan.1999
W1.1999
all
W5.1999 W9.1999
Feb.1999 Mar.1999
1.Jan.1999
6.Jan.1999 1.Feb.1999 3.Feb.1999 3.Mar.1999
D

D


ki
ki


n
n
(Fact
(Fact
Data)
Data)
• Các dữ kiện số (Numerical measures)
• Được truy cập bởi các chiều
Fact
Fact
Summary Fact
Summary Fact
D
D


ki
ki


n
n
(Fact

(Fact
Data)
Data)
• Chứa dữ kiện suy dẫn
Unit_Sales
Unit_Sales
Unit_Price
Unit_Price
/
/
Average_Selling_Price
Average_Selling_Price
January_Unit_Sales
January_Unit_Sales
Unit_Sales
Unit_Sales
Unit_Sales
Unit_Sales
Unit_Sales
Unit_Sales
Unit_Sales
Unit_Sales
Unit_Sales
Unit_Sales
Unit_Sales
Unit_Sales
+
+
January
January

D
D


ki
ki


n
n
(Fact
(Fact
Data)
Data)
• Các bảng chứa dữ liệu lớn
• Dữ liệu được dán nhãn thời gian
Time
Time
1992
1992
1997
1997
V
V
í
í
d
d



v
v


d
d


ki
ki


n
n
(Dollars_Sold,Min)
(Unit_Sold,Sum)
(Dollars_Cost,Max)
Kh
Kh


i đa chi
i đa chi


u (Cube)
u (Cube)
Time
Month
Year

Day
Week
All
Quarter
(Dollars_Sold,Min)
(Unit_Sold,Sum)
(Dollars_Cost,Max)
Store
District
Region
All
Product
Product
Brand
Manufacturer
All
Location
V
V
í
í
d
d


v
v


kh

kh


i 3 chi
i 3 chi


u
u
V
V
í
í
d
d


v
v


t
t


ng h
ng h


p (Aggregation)

p (Aggregation)
Geography
Product
Item
Type
Category
All
City
State
Country
All
Time
Month
Year
Day
Week
All
Quarter
V
V
í
í
d
d


c
c



a
a
chuy
chuy


n
n
d
d


ch
ch
Geography
Product
Item
Type
Category
All
City
State
Country
All
Time
Month
Year
Day
Week
All

Quarter
V
V
í
í
d
d


:
:
rolling
rolling
up
up
v
v
à
à
drilling
drilling
down
down
V
V
í
í
d
d



c
c


a
a
rolling
rolling
up
up

×