Tải bản đầy đủ (.pdf) (47 trang)

Các thuật toán biến đổi thuật toán lược đồ quan hệ và ứng dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (569.59 KB, 47 trang )


Số hóa bởi trung tâm học liệu
1

ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG





PHẠM NGỌC TOÁN







CÁC THUẬT TOÁN BIẾN ĐỔI
LƢỢC ĐỒ QUAN HỆ VÀ ỨNG DỤNG






LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH











THÁI NGUYÊN - 2013


Số hóa bởi trung tâm học liệu
1

ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG





PHẠM NGỌC TOÁN





CÁC THUẬT TOÁN BIẾN ĐỔI
LƢỢC ĐỒ QUAN HỆ VÀ ỨNG DỤNG



Chuyên ngành: KHOA HỌC MÁY TÍNH
Mã số: 60.48.01



LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH




Ngƣời hƣớng dẫn khoa học: PGS.TSKH. NGUYỄN XUÂN HUY





THÁI NGUYÊN - 2013


Số hóa bởi trung tâm học liệu
i
LỜI CAM ĐOAN

Học viên cam đoan luận văn này là do bản thân tự nghiên cứu và thực hiện
theo sự hƣớng dẫn khoa học của thầy giáo PGS. TSKH. Nguyễn Xuân Huy.
Học viên hoàn toàn chịu trách nhiệm về tính pháp lý quá trình nghiên
cứu khoa học của luận văn này.
Thái Nguyên, ngày 10 tháng 11 năm 2013
Ngƣời cam đoan




Phạm Ngọc Toán


Số hóa bởi trung tâm học liệu
ii
LỜI CẢM ƠN

Trƣớc tiên học viên bày tỏ lời cảm ơn chân thành đến các Thầy, cô giáo
đã giảng dạy, hƣớng dẫn và giúp đỡ học viên trong thời gian học tập và
nghiên cứu hoàn thành luận văn này.
Xin đƣợc bày tỏ lòng biết ơn sâu sắc tới Thầy giáo PGS.TSKH.
Nguyễn Xuân Huy đã tận tình hƣớng dẫn, giúp đỡ và đóng góp nhiều ý kiến
quí báu để hoàn thành luận văn này.
Xin chân thành cảm ơn các Thầy, cô giáo Trƣờng Đại Học Công nghệ
Thông tin và Truyền thông - Đại học Thái Nguyên, giúp đỡ và tạo điều kiện
thuận lợi cho em trong thời gian học tập.
Học viên xin chân thành cảm ơn đến Ban giám hiệu, các đồng nghiệp
trƣờng Trung học Nghiệp vụ quản lý LTTP, các bạn học viên lớp Cao học
khóa 2011 - 2013 đã giúp đỡ và tạo điều kiện thuận lợi trong quá trình học tập
và làm luận văn.
Cuối cùng, xin chân thành cảm ơn gia đình và bạn bè đã động viên,
quan tâm, giúp đỡ học viên hoàn thành khóa học và luận văn.









Số hóa bởi trung tâm học liệu
iii
MỤC LỤC


LỜI CAM ĐOAN i
LỜI CẢM ƠN ii
MỤC LỤC iii
DANH MỤC CÁC KÝ HIỆU, CHỮ CÁI VIẾT TẮT v
DANH MỤC CÁC HÌNH vi
MỞ ĐẦU 1
1. Lý do chọn đề tài 1
2. Đối tƣợng và phạm vi nghiên cứu 1
3. Hƣớng nghiên cứu của đề tài 1
4. Phƣơng pháp nghiên cứu 2
5. Ý nghĩa khoa học của đề tài 2
6. Tên đề tài 2
7. Bố cục luận văn 2
Chƣơng 1. CÁC KHÁI NIỆM VỀ LƢỢC ĐỒ QUAN HỆ 3
1.1. Quan hệ và bộ 3
1.2. Phụ thuộc hàm, hệ tiên đề Armstrong, lƣợc đồ quan hệ 3
1.2.1. Phụ thuộc hàm 3
1.2.2. Hệ tiên đề Armstrong 4
1.2.3. Lƣợc đồ quan hệ 4
1.3. Bao đóng của tập thuộc tính 4
1.4. Phủ của tập phụ thuộc hàm 8
1.5. Cơ sở của lƣợc đồ quan hệ 10
1.6. Cách tính giao các cơ sở 12

1.7. Thuật toán tìm 2 cơ sở của LĐQH 13

Số hóa bởi trung tâm học liệu
iv
Chƣơng 2. PHÉP GIẢN LƢỢC CỦA LƢỢC ĐỒ QUAN HỆ 16
2.1. Phép biến đổi LĐQH 16
2.2. Thuật toán biến đổi LĐQH 17
2.3. Định lý cơ bản của phép biến đổi LĐQH 20
2.4. Dạng biểu diễn thứ nhất của cơ sở 23
2.5. Dạng biểu diễn thứ hai của cơ sở 24
Chƣơng 3. CÀI ĐẶT CHƢƠNG TRÌNH 26
3.1. Giới thiệu 26
3.2. Các chức năng chính của chƣơng trình 26
3.3. Giao diện chƣơng trình 28
KẾT LUẬN VÀ ĐỀ NGHỊ 38
1. Kết luận 38
2. Đề nghị 38
TÀI LIỆU THAM KHẢO 39




Số hóa bởi trung tâm học liệu
v
DANH MỤC CÁC KÝ HIỆU, CHỮ CÁI VIẾT TẮT


Suy dẫn
!╞
Không suy dẫn


Khác

Thuộc

Không thuộc

Là tập con

Suy ra
:=
Gán
\
Phép trừ tập hợp

Phép giao tập hợp

Phép hợp tập hợp

Tƣơng đƣơng

Tƣơng đƣơng
!
Không tƣơng đƣơng

Chứa tập con

Với mọi

Tập rỗng

LĐQH
Lƣợc đồ quan hệ
PTH
Phụ thuộc hàm


Số hóa bởi trung tâm học liệu
vi
DANH MỤC CÁC HÌNH


Hình 3.1 Giao diện chính của chƣơng trình 28
Hình 3.2 In số thuộc tính, phụ thuộc hàm trong tệp ld1 và tìm cơ sở 1 31
Hình 3.3 Tính bao đóng của mã số 1 3 (A, C) 31
Hình 3.4 Tìm cơ sở 2 32
Hình 3.5 Thu gon lƣợc đồ 33
Hình 3.6 Thoát khỏi chƣơng trình 33
Hình 3.7 In số thuộc tính, phụ thuộc hàm trong tệp luocdo2 và tìm cơ
sở 1 36
Hình 3.8 Tính bao đóng mã số thuộc tính 3 và 5 36
Hình 3.9 Tìm cơ sở 2 37
Hình 3.10 Thu gọn lƣợc đồ với mã số thuộc tính 1 4 6 (ADH) 37


Số hóa bởi trung tâm học liệu
1
MỞ ĐẦU
1. Lý do chọn đề tài
Ngày nay, Công nghệ Thông tin đang phát triển rất nhanh, đƣợc ứng
dụng rộng rãi trong nhiều lĩnh vực của cuộc sống nhƣ: giáo dục, y tế, kinh tế,

khoa học, xây dƣng,… Việc dùng phƣơng tiện tin học để tổ chức và khai thác
cơ sở dữ liệu đã đƣợc phát triển từ những năm 60. Trong những năm gần đây
vai trò của máy tính trong việc lƣu trữ thông tin ngày càng trở nên quan trọng.
Vì vậy đã tạo ra những kho dữ liệu khổng lồ. Quản lý các cơ sở dữ liệu lớn và
phức tạp đòi hỏi nhiều thuật toán hữu hiệu để tính toán các đối tƣợng nhƣ bao
đóng, khóa, phủ
Một số thuật toán tốt theo nghĩa độ phức tạp tính toán giới hạn ở các
hàm tuyến tính hoặc đa thức theo chiều dài dữ liệu vào đã đƣợc công bố nhƣ
thuật toán tính bao đóng của tập thuộc tính, thuật toán tìm một khóa, thuật
toán xác định thành viên hay thuật toán xác định PTH suy dẫn, thuật toán tìm
giao các khóa, thuật toán xác định một LĐQH có một khóa duy nhất
2. Đối tƣợng và phạm vi nghiên cứu
Luận văn tập trung tìm hiểu các thuật toán biến đổi lƣợc đồ quan hệ và
ứng dụng thông qua phép biến đổi của lƣợc đồ quan hệ theo một tập thuộc
tính X. Tiếp tục phát triển dạng biểu diễn cơ sở thứ nhất và khảo sát biểu diễn
cơ sở dạng thứ 2 của lƣợc đồ quan hệ. Xây dựng một hệ trình minh họa và
đánh giá các kết quả lý thuyết.
3. Hƣớng nghiên cứu của đề tài
- Giới thiệu tổng quan về phép biến đổi của lƣợc đồ quan hệ
- Các thuật toán biến đổi, giản lƣợc lƣợc đồ quan hệ
- Thuật toán biểu diễn cơ sở, tính bao đóng
- Cài đặt chƣơng trình

Số hóa bởi trung tâm học liệu
2
4. Phƣơng pháp nghiên cứu
- Phƣơng pháp tổng hợp, phân tích các kết quả của các nhà nghiên cứu
liên quan đến lĩnh vực nghiên cứu trên các tài liệu đã xuất bản, trên các bài
báo, tạp chí khoa học, trên mạng Internet
- Giải quyết các vấn đề đặt ra trong phạm vi đề tài là tiên đề hóa. Các

hệ tiên đề đƣợc xây dựng trên cơ sở một hệ suy dẫn hình thức với các tính
chất cơ bản về các đối tƣợng cơ sở và các mối liên hệ giữa chúng. Cơ sở toán
học của các hệ tiên đề là định lý về tính xác đáng và đầy đủ cùng với các định
lý về điều kiện cần và đủ cho các hệ tiên đề tƣơng đƣơng.
- Kết hợp chặt chẽ giữa lý thuyết và thực hành, sử dụng và phát triển
các phần mềm nói chung và các phần mềm toán học nói riêng để kiểm định và
thể hiện các kết quả lý thuyết.
5. Ý nghĩa khoa học của đề tài
- Tổng hợp đƣợc lý thuyết về cơ sở của phép biến đổi của lƣợc đồ quan hệ.
- Vận dụng khái niệm, các thuật toán biến đổi lƣợc đồ quan hệ và ứng
dụng để giải quyết một số vấn đề trong quản lý ngữ nghĩa của dữ liệu nhƣ phụ
thuộc dữ liệu, cơ sở, các dạng chuẩn của dữ liệu
- Các kết quả thu đƣợc có thể vận dụng cho các quy trình thiết kế các
cơ sở dữ liệu quan hệ dùng trong các hệ thống thông tin là:
+ Tính bao đóng của các tập thuộc tính,
+ Tìm cơ sở của lƣợc đồ quan hệ.
+ Biểu diễn cơ sở dạng thứ hai
+ Giản lƣợc LĐQH
6. Tên đề tài: "Các thuật toán biến đổi lược đồ quan hệ và ứng dụng"
7. Bố cục luận văn
Toàn bộ nội dung của Luận văn đƣợc chia thành 3 chƣơng nhƣ sau:
CHƢƠNG 1. CÁC KHÁI NIỆM VỀ CƠ SỞ DỮ LIỆU
CHƢƠNG 2. PHÉP GIẢN LƢỢC CỦA LƢỢC ĐỒ QUAN HỆ
CHƢƠNG 3. CÀI ĐẶT CHƢƠNG TRÌNH

Số hóa bởi trung tâm học liệu
3
Chƣơng I
CÁC KHÁI NIỆM VỀ LƢỢC ĐỒ QUAN HỆ
1.1. Quan hệ và bộ [2]

Cho tập hữu hạn U = {A
1
, A
2
, , A
n
} khác trống (n ≥ 1). Các phần tử
của U đƣợc gọi là thuộc tính, ứng với mỗi thuộc tính A
i
U, i = 1, 2, , n có
một tập không rỗng dom(A
i
) đƣợc gọi là miền trị của thuộc tính A
i
(thập chí
đƣợc giả thiết là chứa hơn 1 giá trị).
Đặt
)(
1
A
i
n
i
domUD

Một quan hệ R với các thuộc tính U = {A
1
, A
2
, , A

n
}, ký hiệu là R(U),
là một tập các ánh xạ t: U D sao cho với mỗi A
i
U ta có t(A
i
) dom(A
i
).
Mỗi ánh xạ đƣợc gọi là một bộ của quan hệ R.
Mỗi quan hệ R(U) có hình ảnh là một bảng, mỗi cột ứng với một thuộc
tính, mỗi dòng là một bộ.
Ta ký hiệu t(X) hoặc t.X là một bộ trên tập thuộc tính X.
Một quan hệ rỗng, ký hiệu , là quan hệ không chứa bộ nào.
Chú ý: Mỗi quan hệ là một tập các bộ nên trong quan hệ không có hai
bộ trùng lặp.
1.2. Phụ thuộc hàm, hệ tiên đề Armstrong, lƣợc đồ quan hệ
1.2.1. Phụ thuộc hàm [2]
 Định nghĩa phụ thuộc hàm
Cho tập thuộc tính U. Giả sử X, Y U. Một phụ thuộc hàm (PTH) trên
U là biểu thức dạng f: X Y.
Nếu f: X Y là một PTH trên U thì ta nói tập thuộc tính Y phụ
thuộc hàm vào tập thuộc tính X, hoặc tập thuộc tính X xác định hàm tập
thuộc tính Y.

Số hóa bởi trung tâm học liệu
4
Cho quan hệ R(U) và một PTH f: X Y trên U. Ta nói quan hệ R thỏa
PTH f (hay PTH f đúng trong quan hệ R), ký hiệu R(f), nếu hai bộ tùy ý trong
R giống nhau trên X thì cũng giống nhau trên Y, tức là:

R(X Y) u,v R: u.X = v.X u.Y = v.Y
Cho quan hệ R(U) và tập PTH F trên tập thuộc tính U. Ta nói quan hệ
R thỏa tập PTH F, ký hiệu R(F), nếu R thỏa mọi PTH trong F, tức là R(F)
f F: R(f).
1.2.2. Hệ tiên đề Armstrong [2, 3]
Cho quan hệ R(U). Giả sử X, Y, Z, W U.
F1. Tính phản xạ:
Nếu X Y thì X Y

F2. Tính gia tăng:
Nếu X Y thì XZ YZ

F3. Tính bắc cầu:
Nếu X Y và Y Z thì X Z

Chú ý: Các PTH có vế trái chứa vế phải nhƣ mô tả trong F1 đƣợc gọi là
tầm thƣờng. Các PTH tầm thƣờng thoả trong mọi quan hệ.
1.2.3. Lược đồ quan hệ [2]
Lƣợc đồ quan hệ (LĐQH) là một cặp p = (U, F) trong đó U là tập hữu
hạn các thuộc tính, F là tập các PTH trên U.
Quy ƣớc: Trong trƣờng hợp không chỉ rõ tập PTH F, ta xem LĐQH chỉ
là một tập hữu hạn các thuộc tính U.
1.3. Bao đóng của tập thuộc tính [2]
Cho tập PTH F trên tập thuộc tính U và một tập con các thuộc tính X
trong U. Bao đóng của tập thuộc tính X, ký hiệu X
+
, là tập tất cả các thuộc tính
A U mà PTH X A có thể đƣợc suy diễn logic từ F nhờ hệ tiên đề Armstrong:
X
+

= {A U | X A F
+
}

Số hóa bởi trung tâm học liệu
5
 Một số tính chất của bao đóng
Cho LĐQH a = (U, F). Khi đó X, Y U ta có
1. Tính phản xạ: X X
+

2. Tính đồng biến: X Y X
+
Y
+

3. Tính lũy đẳng: (X
+
)
+
= X
+

4. (XY)
+
X
+
Y
+


5. (X
+
Y)
+
= (XY
+
)
+
= (XY)
+

6. X Y Y X
+

7. X X
+
và X
+
X


8. X
+
=Y
+
X Y

và Y

X

 Thuật toán tìm bao đóng của tập thuộc tính [2, 3]
Cho tập PTH F trên tập thuộc tính U và một tập con các thuộc tính X
trong U. Để xác định bao đóng của tập thuộc tính X , ký hiệu X
+
xuất phát từ
tập X và bổ sung dần cho X các thuộc tính thuộc vế phải của các PTH L R
F thoả điều kiện L X. Thuật toán sẽ dừng khi không thể bổ sung thêm
thuộc tính nào cho X.
Algorithm Closure
Input: - Tập thuộc tính X U
- Tập PTH F
Output: X
+
= {A U|X A F
+
}
Method
Y: = X ;
Repeat
Z: = Y ;
For each FD L R in F do
If L Y then Y: = Y R ;
Enddif ;
Endfor ;

Số hóa bởi trung tâm học liệu
6
Until Y: = Z;
Return Y;
End Closure.

 Đánh giá độ phức tạp
Giả sử n là số lƣợng các thuộc tính trong U, m là số lƣợng các PTH
trong F thì thuật toán trên có độ phức tạp đa thức bậc hai theo chiều dài dữ
liệu O(mn
2
).
Ví dụ 1: Cho lƣợc đồ quan hệ R = (U,F)
U = ABCDEGH
F= {AB C, D EG, ACD B, C A, BE C, CE AG,
BC D, CG BD, G H}
a. Tính D
+

b. Tính (BE)
+

c. Tính (DE)
+

d. Tính (CG)
+

Giải
a. Tính D
+

X
0
= D
1. X

1
= DEG (áp dụng D EG)
2. X
2
= DEGH (áp dụng G H)
Vậy (D)
+
= DEGH
b. Tính (BE)
+

X
0
= BE
1. X
1
= BEC (áp dụng BE C)
2. X
2
= BECAG (áp dụng CE AG)
3. X
3
= BECAGD (áp dụng BC D)
4. X
4
= BECAGDH (áp dụng G H)
Vậy (BE)
+
= ABCDEGH


Số hóa bởi trung tâm học liệu
7
c. Tính (DE)
+

X
0
= DE
1. X
1
= DEG (áp dụng D EG)
2. X
2
= DEGH (áp dụng G H)
Vậy (DE)
+
= DEGH
d. Tính (CG)
+

X
0
= CG
1. X
1
= CGA (áp dụng C A)
2. X
2
= CGABD (áp dụng CG BD)
3. X

3
= CGABDH (áp dụng G H)
4. X
4
= CGABDHE (áp dụng D EG)
Vậy (CG)
+
= ABCDEGH
Ví dụ 2: Cho lƣợc đồ quan hệ R = (U,F)
U = ABCDEG
F = {C G, BG CD, AEG BC, CG EA, B CG)
a. Tính C
+

b. Tính B
+

c. Tính (AEG)
+

Giải
a. Tính C
+

X
0
= C
1. X
1
= CG (áp dụng C G)

2. X
2
= CGEA (áp dụng CG EA)
3. X
3
= CGEAB (áp dụng AEB BC)
4. X
4
= CGEABD (áp dụng BG CD)
Vậy C
+
= ABCDEG

Số hóa bởi trung tâm học liệu
8
b. Tính B
+

X
0
= B
1. X
1
= BCG (áp dụng B CG)
2. X
2
= BCGD (áp dụng BG CD)
3. X
3
= BCGDEA (áp dụng CG EA)

Vậy B
+
= ABCDEG
c. Tính (AEG)
+

X
0
= AEG
1. X
1
= AEGBC (áp dụng AEG BC)
2. X
2
= AEGBCD (áp dụng BG CD)
Vậy (AEG)
+
= ABCDEG
1.4. Phủ của tập phụ thuộc hàm [2, 3]
Cho hai tập PTH F và G trên cùng một tập thuộc tính U. Ta nói F suy
dẫn đƣợc ra G, ký hiệu F╞ G nếu g G: F╞ g.
Ta nói F tƣơng đƣơng với G, ký hiệu F G, nếu F╞ G và G╞ F.
Nếu F G ta nói G là một phủ của F.
Ký hiệu: F !╞ G: F không suy dẫn ra đƣợc G
F ! G có nghĩa là F và G không tƣơng đƣơng.
Cho tập PTH F trên tập thuộc tính U và X là tập con của U, ta dùng ký
hiệu X
F
+
trong trƣờng hợp cần chỉ rõ bao đóng của tập thuộc tính X lấy theo

tập PTH F.
 Phủ thu gọn tự nhiên
Cho hai tập PTH F và G trên cùng một thuộc tính U. G là phủ thu gọn
tự nhiên của F nếu:
1. G là phủ của F, và
2. G có dạng thu gọn tự nhiên theo nghĩa sau:

Số hóa bởi trung tâm học liệu
9
a. Hai vế trái và phải của mọi PTH trong G rời nhau (không giao nhau)
f G: LS(f) RS(f) =
b. Các vế trái của mọi PTH trong G khác nhau đôi một.
f, g G: f g LS(f) LS(g)
 Thuật toán tìm phủ thu gọn tự nhiên của tập PTH F
Algorithm Natural_Reduced
Function: Tính phủ thu gọn tự nhiên của tập PTH
Format: Natural_Reduced (F)
Input: Tập PTH F
Output: Một phủ thu gọn tự nhiên G của F
i) G F
ii) L R G: L R =
iii) L
i
R
i
, L
j
R
j
G: i j L

i
L
j

Method
G := ;
For each FD L R in F do
Z := R \ L;
If Z then
If there is an FD L Y in G then
Replace L Y in G by L YZ
Else Add L Z to G;
Endif
Endif
Endfor
Return G;
End Natural_Reduced.

Số hóa bởi trung tâm học liệu
10
Độ phức tạp của thuật toán trên là O(mn), trong đó m là số lƣợng PTH
trong tập F, n là số lƣợng thuộc tính trong tập U. Để ý rằng mn là chiều dài dữ
liệu vào của thuật toán.
1.5. Cơ sở của lƣợc đồ quan hệ [2, 3]
Cho LĐQH p = (U, F). Tập thuộc tính B U đƣợc gọi là cơ sở của
LĐQH p nếu:
(i) B
+
= U
(ii) A K: (B\{A})

+
U
Hai điều kiện trên tƣơng đƣơng với
(i) B U
(ii) A B: (B\{A})

! U
Nếu B thỏa mãn điều kiện (i) thì B đƣợc gọi là một siêu cơ sở.
Thuộc tính A U đƣợc gọi là thuộc tính cơ sở (nguyên thủy hoặc cơ
sở) nếu A có mặt trong một cơ sở nào đấy. A đƣợc gọi là thuộc tính không cơ
sở (phi nguyên thủy hoặc thứ cấp) nếu A không có mặt trong bất kỳ cơ sở
nào. Ký hiệu U
B
là tập các thuộc tính cơ sở của LĐQH p và U
0
là tập các
thuộc tính không cơ sở của p.
Chú ý: Trong một số tài liệu, thuật ngữ cơ sở đƣợc dùng theo nghĩa
siêu cơ sở và thuật ngữ cơ sở tối tiểu đƣợc dùng theo nghĩa cơ sở .
 Thuật toán tìm một cơ sở của LĐQH
Tƣ tƣởng: Xuất phát từ một siêu cơ sở B tuỳ ý của LĐQH, duyệt lần
lƣợt các thuộc tính A của B, nếu bất biến (B\{A})
+
= U đƣợc bảo toàn thì A
loại khỏi B. Có thể thay kiểm tra (B\{A})
+
= U bằng kiểm tra A (B\{A})
+

Algorithm Base

Function: Tìm một cơ sở của LĐQH
Input: - Tập thuộc tính U

Số hóa bởi trung tâm học liệu
11
- Tập PTH F
Output: Cơ sở B U thoả
i) B
+
= U
ii) A B : (B\{A})
+
U
Method
B := U;
For each attribute A in U do
If A (B\{A})
+
then
B := B \ {A}
Endif;
Endfor;
Return B;
End Base.
Độ phức tạp tính toán: Thuật toán duyệt n thuộc tính, với mỗi thuộc
tính thực hiện phép lấy bao đóng với độ phức tạp n
2
m. Tổng hợp lại, độ phức
tạp tính toán của thuật toán là O(n
3

m).
Ví dụ 3: Cho LĐQH p = (U,F), trong đó:
U = {A, B, C, D, E}
F = { D E
AB CD
C AB }
Hãy tìm một cơ sở của p.
Dễ thấy rằng, LĐQH p có cơ sở B = C, vì thoả mãn hai điều kiện:
(i) B
+
= C
+
= ABCDE = U
(ii) C tối tiểu ( theo nghĩa (B \ {C})
+
U ).
Ví dụ 4: Cho P = (U,F), trong đó: U = ABCDE
F = { C B
DE AC
A DE }

Số hóa bởi trung tâm học liệu
12
Tìm cơ sở của LĐQH đã cho?
Ta thấy, LĐQH P có cơ sở B = A, vì thoả mãn 2 điều kiện:
(i) B
+
= A
+
= ABCDE = U

(ii) A tối tiểu ( theo nghĩa (B \ {A})
+
U ).
Mặt khác, tƣơng tự nhƣ trên, ta cũng dễ thấy rằng LĐQH P còn cơ sở
thứ 2, đó là B = DE.
Để trả lời cho câu hỏi: Lƣợc đồ có trên một cơ sở hay không, ta đi tìm
giao các cơ sở
1.6. Cách tính giao các cơ sở [2]
Những phần tử không xuất hiện ở vế phải thì nó có mặt ở mọi cơ sở, đó
chính là giao các cơ sở.
Vậy giao các cơ sở chính là những thuộc tính không xuất hiện ở vế phải.
Giả sử M là giao các cơ sở. Nếu M
+
= U thì lƣợc đồ chỉ có đúng 1 cơ
sở, nếu M
+
U thì lƣợc đồ có trên 1 cơ sở.
Gọi M là giao các cơ sở khi và chỉ khi: M
+
= U.
Cho LĐQH p = (U,F) với n thuộc tính trong U và m PTH trong F. Gọi
M là giao các cơ sở của p. Khi đó có thể xác định giao các cơ sở bằng một
thuật toán tuyến tính theo mn qua công thức:

FRL
LRUM )\(\
.
 Thuật toán xác định giao các cơ sở trong LĐQH
Algorithm BaseIntersec
Input: - Tập thuộc tính U

- Tập PTH F
Output: Giao các cơ sở

FRL
LRUM )\(\

Method
M:=U;
For each FD L R in F do

Số hóa bởi trung tâm học liệu
13
M:=M\(R\L);
Endfor;
Return M;
End BaseIntersec.
Ví dụ 5: Cho p = (U,F), trong đó: U = ABCDE
F = {AB C
AD B
B D}
Ta có, giao của các cơ sở là U
I
= ABCDE\BCD = AE
U
I
+
= (AE)
+
= AE U nên p có hơn một cơ sở. Vì U
I

là giao các cơ sở
nên ta có thể bổ sung cho U
I
một số thuộc tính để thu đƣợc các cơ sở.
Dễ xác định đƣợc p có hai cơ sở là B
1
= ABE và B
2
= ADE. Tập các
thuộc tính cơ sở là U
B
= ABDE, tập các thuộc tính không cơ sở là U
0
= C.
1.7. Thuật toán tìm 2 cơ sở của LĐQH [2]
Bƣớc 1: Tính giao các cơ sở
Bƣớc 2: Tính M
+
. Nếu M
+
= U Lƣợc đồ có 1 cơ sở M là duy nhất
M
+
U Lƣợc đồ có trên 1 cơ sở
Gọi thuật toán Base 1 – Tìm cơ sở 1
Gọi thuật toán Base 2 – Tìm cơ sở 2
 Thuật toán tìm cơ sở thứ hai của LĐQH
Tƣ tƣởng: Xuất phát từ tập thuộc tính M = U, trƣớc hết duyệt các thuộc
tính A của B, nếu bất biến (M\{A})
+

= U đƣợc bảo toàn thì loại A khỏi M.
Sau đó duyệt tƣơng tự với các thuộc tính trong U\B.
Algorithm Base 2
Function: Tìm một cơ sở thứ 2 của LĐQH
Input: - Tập thuộc tính U
- Tập PTH F
- Cơ sở B U

Số hóa bởi trung tâm học liệu
14
Output: Cơ sở thứ hai, nếu có, M U thoả
i) M
+
= U
ii) A M : (M\{A})
+
U
Nếu không có cơ sở thứ 2:
Method
M := U;
For each attribute A in B do
If A (M\{A})
+
then
M := M \ {A}
Endif;
Endfor;
For each attribute A in U \ B do
If A (M\{A})
+

then
M := M \ {A}
Endif;
Endfor;
If M = K then return
Else return M;
Endif
End Base 2.
Ví dụ 6: Cho LĐQH P = (U,F) trong đó: U = ABCDE
F = { BC D
CD A
D E
A B }
a. Hãy xác định phần giao của các cơ sở trong P
b. Tìm một cơ sở B
1
của P

Số hóa bởi trung tâm học liệu
15
c. P có còn cơ sở nào khác ngoài B
1
không ? Vì sao ?
d. Xác định tập các thuộc tính không cơ sở U
0
của P
Giải
a. Xác định phần giao của các cơ sở trong P
U
I

= U\vế phải của F = ABCDE – ABDE = C
b. Tìm một cơ sở B
1
của P
Lập bảng
Loại thử thuộc tính nào ta đánh dấu phẩy (') bên cạnh thuộc tính đó.
Nếu bao đóng các thuộc tính còn lại bằng U thì loại thuộc tính đó ký hiệu ( _ )
ví dụ: A
'
(loại). Những thuộc tính không loại đƣợc thì tô đậm.
Base (B)
A
'
B
'
C
'
D
'
E
'
BCDE (thử loại bỏ A)
A
B
C
D
E
CDE (thử loại bỏ B)
A
B

C
D
E
DE (thử loại bỏ C)



D
E
CE (thử loại bỏ D)


C

E
CD (thử loại bỏ E)
A
B
C
D
E
Vậy cơ sở B
1
của P là: CD
c. P còn cơ sở khác ngoài cơ sở B
1
vì:
M
+
= C

+
= C U nên lƣợc đồ có hơn một cơ sở .
Vậy ngoài cơ sở B
1
, lƣợc đồ còn có cơ sở B
2
= BC vì thoả 2 điều kiện sau:
(i) B
+
= (BC)
+
= ABCDE = U
(ii) BC tối tiểu ( theo nghĩa (B \ {BC})
+
U ).
d. Xác định tập các thuộc tính không cơ sở U
0

của P.
- Thuộc tính cơ sở là thuộc tính có mặt trong mọi cơ sở, ký hiệu là U
B.
- Thuộc tính không cơ sở là thuộc tính không có mặt trong bất cứ cơ sở
nào, ký hiệu U
0
.
Ta có: U
B
= ABCD U
0
= E.


Số hóa bởi trung tâm học liệu
16
Chƣơng 2
PHÉP GIẢN LƢỢC CỦA LƢỢC ĐỒ QUAN HỆ
2.1. Phép biến đổi LĐQH [2]
Cho hai LĐQH p = (U,F), q = (V,G) và tập thuộc tính M U. Ta nói
LĐQH q nhận đƣợc từ LĐQH p qua phép thu gọn (dịch chuyển) theo tập
thuộc tính M, nếu sau khi loại bỏ mọi xuất hiện của các thuộc tính của M
trong lƣợc đồ p thì thu đƣợc lƣợc đồ q.
Nếu sau khi thực hiện phép thu gọn theo M cho LĐQH p ta thu đƣợc
LĐQH q thì ta viết q = p\M.
Thao tác loại bỏ M đƣợc thực hiện trên lƣợc đồ p = (U,F) để thu đƣợc
lƣợc đồ q = (V,G) nhƣ sau:
1. Tính V = U\M có độ phức tạp O(n) với n là số lƣợng thuộc tính trong U.
2. Mỗi PTH X Y trong F ta tạo ra PTH X\M Y\M cho G. Thủ tục
này ký hiệu là G = F\M. Tính F\M đòi hỏi độ phức tạp O(mn) với m là số
lƣợng PTH trong F.
Nhƣ vậy q = p\M = (U\M,F\M) đƣợc thực hiện với độ phức tạp O(mn),
tức là tuyến tính theo chiều dài dữ liệu vào (của LĐQH p).
Sau khi thực hiện thủ tục G = F\M nếu:
- G chứa PTH tầm thƣờng (dạng X Y, X Y) thì ta loại các PTH này
khỏi G.
- G chứa các PTH trùng lặp thì ta bớt các PTH này.
Ví dụ 1
Cho LĐQH p = (U, F); U = ABCDEFG
F = {ABC DE,
BCD AG,
DE FC,
CE FG}

Với M = CFG, hãy xác định q = (V,G) = p\M.

Số hóa bởi trung tâm học liệu
17
Giải
Bƣớc 1: Tính V = U \ M = ABCDEFG \ CFG = ABDE
Vậy V = ABDE
Bƣớc 2: Tính G = F\M = { AB DE,
BD A,
DE , (Loại)
E , (Loại)}
Vậy G = {AB DE,
BD A}
Lƣợc đồ quan hệ q = (V,G) trong đó:
V = ABDE
G = {AB DE,
BD A}
Ta cũng dễ nhận thấy kỹ thuật thu gọn LĐQH thoả tính hợp thành và
giao hoán, cụ thể nếu p là LĐQH trên tập thuộc tính U và X, Y là hai tập con
rời nhau của U thì
p\XY = (p\X)\Y = (p\Y)\X
2.2. Thuật toán biến đổi LĐQH [2, 3]
Algorithm Translation
Input:
- LĐQH p = (U,F)
- Tập thuộc tính M U
Output:
LĐQH q = (V,G) = p\M, V = U\M, G = F\M.
Method
V := U\M;

G :=

×