Chương
Chương
4:
4:
Mô h
Mô h
ì
ì
nh d
nh d
ữ
ữ
li
li
ệ
ệ
u đa chi
u đa chi
ề
ề
u
u
N
N
ộ
ộ
i
i
dung
dung
chương
chương
• Các khái niệm chính của mô hình dữ
liệu đa chiều
– Dữ kiện (Fact)
– Chiều (Dimension)
– Độ thô
– Tổng hợp
• Các mô hình lưu trữ
Mô h
Mô h
ì
ì
nh d
nh d
ữ
ữ
li
li
ệ
ệ
u đa chi
u đa chi
ề
ề
u
u
• Được đề xuất và thiết kế cho một mục đích
phân tích dữ liệu
• Mô hình dữ liệu này không phù hợp cho hệ
thống OLTP
• Mô hình dữ liệu này được thao tác bởi các
công cụ OLAP
– Các công cụ này cung cấp các phương tiện truy
vấn mạnh dựa trên thiết kế mô hình dữ liệu đa
chiều
– Ví dụ như: TARGIT Analysis, SQL OLAP Server
Mô h
Mô h
ì
ì
nh d
nh d
ữ
ữ
li
li
ệ
ệ
u đa chi
u đa chi
ề
ề
u
u
Location
Time
Month
Year
Day
Week
All
Quarter
Store
District
Region
All
Product
Product
Brand
Manufacturer
All
C
C
á
á
c th
c th
à
à
nh ph
nh ph
ầ
ầ
n ch
n ch
í
í
nh
nh
• Các dữ kiện (Facts)
– Miêu tả các vùng kinh doanh
– Không thay đổi khi nó đã được sinh ra
– Được lưu tại một cấp thô nào đó
• Các chiều (Dimensions)
– Thông tin tham chiếu qua đó các dữ kiện
có thể được cấu trúc cho việc phân tích
– Định nghĩa các phân cấp
• Và các khối đa chiều (Cubes)
Kh
Kh
ố
ố
i
i
• Một khối có thể có nhiều chiều
– Nếu có nhiều hơn 3 chiều sẽ được gọi là ‘siêu
khối’ (”hypercube”)
– Về mặt lý thuyết thì số chiều là không hạn chế
– Thường thì số chiều là từ 4 đến 12
• Một khối bao gồm nhiều ô dữ liệu
– Là một liên kết giữa các giá trị của chiều
– Một ô có thể là rỗng (không có dữ liệu cho liên kết
này)
– Khối thưa (sparsecube): có nhiều ô rỗng
– Khối dày đặc (densecube): có ít ô rỗng
V
V
í
í
d
d
ụ
ụ
v
v
ề
ề
ô r
ô r
ỗ
ỗ
ng
ng
V
V
í
í
d
d
ụ
ụ
v
v
ề
ề
d
d
ữ
ữ
ki
ki
ệ
ệ
n
n
v
v
à
à
chi
chi
ề
ề
u
u
• Kho Grocery
• Dữ kiện:
– POS:point of sales sự kiện bán hàng
• Chiều:
– Thời gian (Time)
– Vị trí Kho (Location - Store)
– Sản phẩm (Product)
– Quảng cáo (Promotion)
Kh
Kh
ố
ố
i
i
Grocery
Grocery
C
C
á
á
c k
c k
h
h
á
á
i ni
i ni
ệ
ệ
m v
m v
ề
ề
chi
chi
ề
ề
u
u
• Miền phân cấp
• Các cấp (Levels), cấp tương ứng với
các độ thô
• Lược đồ chiều Dimension schema
• Các toán tử chiều Dimension operators
C
C
á
á
c v
c v
í
í
d
d
ụ
ụ
v
v
ề
ề
chi
chi
ề
ề
u
u
Thu
Thu
ộ
ộ
c t
c t
í
í
nh chi
nh chi
ề
ề
u
u
• Một chiều bao gồm nhiều thuộc tính. Ví dụ như:
– Time dimension: day, month, year
– Product dimension: ProductID, LineID, BrandID
• Một chiều được cấu trúc/ tổ chức ở dạng phân cấp:
– Time dimension: day week quarter
– Product dimension: product brand manufacturer
• Các thuộc tính xác định cấp nào mà một phần tử
chiều thuộc vào
• Các phần tử time có cùng năm, tháng thuộc về cấp
‘month’
• Tất cả phần tử product có cùng brand thuộc về cấp
‘brand’
V
V
í
í
d
d
ụ
ụ
v
v
ề
ề
v
v
ù
ù
ng
ng
phân
phân
c
c
ấ
ấ
p
p
1999
Q1.1999
Jan.1999
W1.1999
all
W5.1999 W9.1999
Feb.1999 Mar.1999
1.Jan.1999
6.Jan.1999 1.Feb.1999 3.Feb.1999 3.Mar.1999
Lư
Lư
ợ
ợ
c đ
c đ
ồ
ồ
chi
chi
ề
ề
u v
u v
à
à
phân c
phân c
ấ
ấ
p
p
Product
Product
Brand
Manufacturer
All
Geography
Store
District
Region
All
Time
Month
Year
Day
Week
All
Quarter
C
C
á
á
c to
c to
á
á
n t
n t
ử
ử
chi
chi
ề
ề
u
u
1999
Q1.1999
Jan.1999
W1.1999
all
W5.1999 W9.1999
Feb.1999 Mar.1999
1.Jan.1999
6.Jan.1999 1.Feb.1999 3.Feb.1999 3.Mar.1999
D
D
ữ
ữ
ki
ki
ệ
ệ
n
n
(Fact
(Fact
Data)
Data)
• Các dữ kiện số (Numerical measures)
• Được truy cập bởi các chiều
Fact
Fact
Summary Fact
Summary Fact
D
D
ữ
ữ
ki
ki
ệ
ệ
n
n
(Fact
(Fact
Data)
Data)
• Chứa dữ kiện suy dẫn
Unit_Sales
Unit_Sales
Unit_Price
Unit_Price
/
/
Average_Selling_Price
Average_Selling_Price
January_Unit_Sales
January_Unit_Sales
Unit_Sales
Unit_Sales
Unit_Sales
Unit_Sales
Unit_Sales
Unit_Sales
Unit_Sales
Unit_Sales
Unit_Sales
Unit_Sales
Unit_Sales
Unit_Sales
+
+
January
January
D
D
ữ
ữ
ki
ki
ệ
ệ
n
n
(Fact
(Fact
Data)
Data)
• Các bảng chứa dữ liệu lớn
• Dữ liệu được dán nhãn thời gian
Time
Time
1992
1992
1997
1997
V
V
í
í
d
d
ụ
ụ
v
v
ề
ề
d
d
ữ
ữ
ki
ki
ệ
ệ
n
n
(Dollars_Sold,Min)
(Unit_Sold,Sum)
(Dollars_Cost,Max)
Kh
Kh
ố
ố
i đa chi
i đa chi
ề
ề
u (Cube)
u (Cube)
Time
Month
Year
Day
Week
All
Quarter
(Dollars_Sold,Min)
(Unit_Sold,Sum)
(Dollars_Cost,Max)
Store
District
Region
All
Product
Product
Brand
Manufacturer
All
Location
V
V
í
í
d
d
ụ
ụ
v
v
ề
ề
kh
kh
ố
ố
i 3 chi
i 3 chi
ề
ề
u
u
V
V
í
í
d
d
ụ
ụ
v
v
ề
ề
t
t
ổ
ổ
ng h
ng h
ợ
ợ
p (Aggregation)
p (Aggregation)
Geography
Product
Item
Type
Category
All
City
State
Country
All
Time
Month
Year
Day
Week
All
Quarter
V
V
í
í
d
d
ụ
ụ
c
c
ủ
ủ
a
a
chuy
chuy
ể
ể
n
n
d
d
ị
ị
ch
ch
Geography
Product
Item
Type
Category
All
City
State
Country
All
Time
Month
Year
Day
Week
All
Quarter
V
V
í
í
d
d
ụ
ụ
:
:
rolling
rolling
up
up
v
v
à
à
drilling
drilling
down
down
V
V
í
í
d
d
ụ
ụ
c
c
ủ
ủ
a
a
rolling
rolling
up
up