Tải bản đầy đủ (.pdf) (24 trang)

Cơ sở dữ liệu phân tán

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (164.9 KB, 24 trang )

Ng Duc Thuan
CƠ SỞ DỮ LIỆU PHÂN TÁN
(Distributed database)
ThS. Ng ĐứcThuần
BM Hệ Thống Thông Tin
ĐẠI HỌC THỦY SẢN
KHOA CÔNG NGHỆ THÔNG TIN
Mùa Xuân 2006
Ng Duc Thuan
Chương III: TỐI ƯU HÓA CÂU HỎI
PHÂN TÁN
SJ
F
, ><l
q
Nữa kết nối
theta
SL
F ,
δ
F
Chọn
NSJ, ><l
Nữa kết nối
tự nhiên
PJ
[X]
, Π
[X]
Chiếu
NJN, l><l


Kết nối tự
nhiên
DF, \Trừ
JN
F
, l><l
q
Kết nối thetaIN, ∩Giao
PR, xTích
Descartes
UN, UHợp
Ký hiệuPhép toánKý hiệuPhép toán
Ng Duc Thuan
Nhắc lại các phép biến đổi tương đương
l 1. Giao hoán: JN, PR, NJN
l 2. Kết hợp: JN, PR, NJN : (R JN S) JN T = R JN ( S JN T)
l 3. Dãy các phép chiếu: PJ
[X]
(PJ
[Y]
(R)) = PJ
[X]
(R) , nếu X Ì Y
l 4. Dãy các phép chọn: SL
F1
(SL
F2
(R)) = SL
F1 L F2
(R)

l 5. Giao hoán giữa phép chọn vàphép chiếu
SL
F
(PJ
[x]
(R)) = PJ
[x]
(SL
F
(R)),
nếu F chỉ liên quan đến các thuộc tính trong X
Ng Duc Thuan
Nhắc lại các phép biến đổi tương đương
l 6. Giao hoán giữa phép chọn vàphép tích Descartes
SL
F
(R
1
[X] PR R
2
[Y] ) =
6.1 SL
F
(R
1
) PR R
2
, nếu F chỉ liên quan đến R
1
6.2 R

1
PR SL
F
(R
2
), nếu F chỉ liên quan đến R
2
6.3 SL
F1
(R
1
) PR SL
F2
(R
2
), nếu F = F1 L F2
F1 chỉ liên quan đến X, F2 chỉ liên quan đến Y
6.4 SL
F2
(SL
F1
(R
1
) PR (R
2
), nếu F = F
1
[X] L F
2
[XY]

Ng Duc Thuan
Nhắc lại các phép biến đổi tương đương
l 7. Phân phối phép chọn vàphép hợp
SL
F
(R
1
UN R
2
) = SL
F
(R
1
) UN SL
F
(R
2
)
l 8. Phân phối phép chọn vàphép trừ
SL
F
(R
1
DF R
2
) = SL
F
(R
1
) DF SL

F
(R
2
)
l 9. Phân phối phép chiếu với phép tích Descartes
PJ
X
(R
1
[Y] PR R
2
[z]) = PJ
FÇY
(R
1
) PR PJ
F ÇZ
(R
2
)
l 10. Phân phối phép chiếu với phép hợp
PJ
X
(R
1
[Y] UN R
2
[z]) = PJ
FÇY
(R

1
) UN PJ
F ÇZ
(R
2
)
Nếu X Ì YZ
Ng Duc Thuan
Cây toán tử câu hỏi tổng thể
l Giả sử có2 quan hệ:
NHANCONG(E# , TEN, LUONG, THUE, D#)
PHONG(D#, TENPHG, MIEN)
Hãy đưa ra danh sách các nhân công làm việc ở MIEN=‘Bac’
PJ
TEN
SL
MIEN =‘Bac’
(NHANCONG NJNPHONG)
Ng Duc Thuan
Cây toán tử câu hỏi tổng thể
l Cây toán tử câu hỏi
PJ
TEN
SL
MIEN=‘Bac’
NJN
NHANCONGPHONG
Ng Duc Thuan
Cây toán tử câu hỏi tổng thể
l Tối ưu hóa theoa các qui tắc trên (6.1)

PJ
TEN
NJN
NHANCONGSL
MIEN=‘Bac’
PHONG
Ng Duc Thuan
Dịch cây tổng thể “tối ưu” sang cây đoạn
l Với phân đoạn
PHONG
PHONG1PHONG2PHONG3
D# <10
10<=D# <=20
D# >20
Ng Duc Thuan
Dịch cây tổng thể “tối ưu” sang cây đoạn
l Cây đoạn tương ứng
NHANCONG
NHCNG4
NHCG1 NHCG2 NHCG3
Với
PHONG = PHONG1 UN PHONG2 UN PHONG3
NHANCONG = (NHCG1 UN NHCG2 UN NHCG3) NJN NHCG4
E#, LUONG, THUE
E#, TEN, D#
D# <10
10<=D# <=20
D# >20
Ng Duc Thuan
Cây tổng thể được vẽ lại như sau

PJ
TEN
NJN
NJN SL
MIEN =‘Bac’
UN NHCG4 UN
NHCG1 NHCG2 NGCG3PHONG1 PHONG2 PHONG3
Ng Duc Thuan
Hoán đổi phép chọn vàphép hợp ta cócây tổng thể
UN
SL MIEN =‘Bac’
SL MIEN =‘Bac’
SL MIEN =‘Bac’
PHONG1
(D# < 10)
PHONG2
(10<= D# <= 20)
PHONG3
(D# > 20)
Ng Duc Thuan
Đại số quan hệ định tính
l Quan hệ định tính làcặp [ R:q
R
]
– R : làquan hệ
– q
R
: tiêu chuẩn của quan hệ định tính (các bộ của R phải
thỏa q
R

)
l Các phép toán của đại số quan hệ định tính
- Chọn: SL
F
[R:q
R
] = [SL
F
R: q
R
L F]
- Kết nối:[R:q
R
] JN
F
[S:q
s
] = [R JN
F
S:q
R
Lq
S
L F]
- Tích Descaster:[R:q
R
] PR [S:q
s
] = [R PR S:q
R

Lq
S
]
Ng Duc Thuan
Đại số quan hệ định tính
l Chiếu :PJ
X
[R:q
R
] = [PJ
X
R: q
R
]
l Hợp :[R:q
R
] UN [S:q
s
] = [R UN S:q
R
ν q
S
]
l Hiệu :[R:q
R
] DF [S:q
s
] = [R DF S:q
R
]

l Giao:[R:q
R
] IN [S:q
s
] = [R IN S:q
R
Lq
S
]
l Biểu diễn lại cây tổng thể sử dụng quan hệ định
tính
Ng Duc Thuan
PJ
TEN
NJN
UN
NHCG4
[NHCG1 NJN (SL
MIEN =‘Bac’
PHONG1) : D#<10 L MIEN =‘Bac’
Cây tổng thể
NHCG2 NJN (SL
MIEN= ‘Bac’
PHONG2) : D# >=10 L D#<=20 L MIEN =‘Bac’
NHCG3 NJN (SL
MIEN= ‘Bac’
PHONG3) : D# >20 L MIEN =‘Bac’
(E#, LUONG, THUE)
Ng Duc Thuan
Đánh giácâu hỏi phân tán

l Một số thông tin định lượng
– Số các bộ của R : Card(R)
– KÍch thước của 1 thuộc tính A : Size(A)
– Size (R) = ∑ size(A) = card (R) * length(R)
– Trạm mà Ri định vị : site (Ri)
A єR
Ng Duc Thuan
Đánh giácác phép toán ĐSQH
l Phépchọn:
– card (SL
F
(R)) = card (R) * SF
S
(F)
– Trong đó: SF
S
(F) đuợc tính bởi (Selinger et al., 1979)
l SF
S
(A = value) = 1/ (card (PR
A
(R))
l SF
S
(A >value) = (max(A) –value)/ (max(A) –min(A))
l SF
S
(A <value) = ( value –min(A))/ (max(A) –min(A))
l SF
S

( p(Ai) L p(Aj)) = SF
S
(p(Ai)) * SF
S
(p(Aj))
l SF
S
( p(Ai) v p(Aj)) = SF
S
(p(Ai)) + SF
S
(p(Aj)) -SF
S
(p(Ai)) * SF
S
(p(Aj))
l SF
S
(A є {value}) = SF
S
(A = value) *card({value} )
Ng Duc Thuan
Đánh giácác phép toán ĐSQH
l Phép chiếu:
– Card(PR
[x]
(R)) = card (R)), nếu x chứa 1 khóa của R
– Card(PR
[x]
(R)) = MAX(dom (A[R])), với Aє X

l Tích Descartes:
– Card (RxS) =card (R)* card(S)
l Phép kết nối:
– Card(R JN
F
S) = card(S),
nếu F= (A=B) , A làkhóa chính của R, B làkhóa ngoại của S
– Card(R NJN S) = SF
J
* card(R)*card(S),
Ng Duc Thuan
Đánh giácác phép toán ĐSQH
l Phép nữa kết nối: (Hevner and Yao, 79)
– Card(R SJ
A=B
S) = Card(R)*SF
SJ
(R SJ
A=B
S)
l SF
SJ
(R SJ
A=B
S) = card(PJ
A
(S)) / card(dom(A))
l Phép hợp:
– Card (R UN S) <= Card(R) + Card(S)
– Card (R UN S) >= Max( Card(R), Card(S))

l Phép trừ:
-Card(R-S) <= card (R)
-Card(R-S) >= 0
Ng Duc Thuan
ĐÁNH GIÁCHI PHÍCHO CÂU HỎI PHÂN TÁN
l Tối ưu hóa câu hỏi phân tán còn phụ thuộc chi phítruy vấn
(thời gian, giá, băng thông, )
l Vídụ:
Cần kết quả : R JN
A=B
S
Nếu dịch chuyển toàn bộ R từ site 1 đến site 2:
Chi phí: C
0
+C
1
*size(R)*card(R)
C
0
:Chi phícho 1 phiên liên lạc
C
1
: Chi phítruyền tin theo dung lượng
SR
Site 2Site 1
Ng Duc Thuan
ĐÁNH GIÁCHI PHÍCHO CÂU HỎI PHÂN TÁN
l Nếu sử dụng phép biến đổi
R JN
A=B

S = (R SJ
A=B
PJ
B
(S)) JN
A=B
S
Truyền PJ
B
(S) từ site 2 về site1 cógiá:
C
0
+ C
1
*size(B)*dom(B[S])
TínhR’=(R SJ
A=B
PJ
B
(S) tại site1: giá= 0 (không tính giátại trạm)
Truyền R’từsite 1 về site 2 giá:
C
0
+ C
1
*size(R’)*card(R’)
Tính R’JN
A=B
S tại site 2 : giá=0
Tổng chi phí:C

0
+ C
1
*size(B)*dom(B[S]) +C
0
+
C
1
*size(B)*dom(B[S])
Ng Duc Thuan
ĐÁNH GIÁCHI PHÍCHO CÂU HỎI PHÂN TÁN
l Chi phícâu hỏi truy vấn phụ thuộc ?
Sử dụng công thức phân rã
Giá
Cónhiều công trình nghiên cứu đưa ra các giải thuật
nhằm tối ưu chi phí:
R*(Selinger& Adiba-80, Lohman et al -85),
SDD-1(Bernstein-81),
AHY (Apers-Hevner-Yao-83)
Ng Duc Thuan
TÀI LIỆU THAM KHẢO
l M.Tamer Ozsu, Patrick Valdariez –Prentice-
Hall-1998
l Bài giảng TS. Trần Đình Khang –BKHN
Ng Duc Thuan
TÌM HIỂU
l Các thuật toán:
R*(Selinger& Adiba-80, Lohman et al -85),
SDD-1(Bernstein-81),
AHY (Apers-Hevner-Yao-83)

Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×