BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC SƢ PHẠM HÀ NỘI 2
NGUYỄN THANH TƢỞNG
CÁC HỆ TIÊN ĐỀ
TRONG MÔ HÌNH DỮ LIỆU DẠNG KHỐI
Chuyên ngành: Khoa học máy tính
Mã số: 60 48 01 01
LUẬN VĂN THẠC SĨ MÁY TÍNH
Ngƣời hƣớng dẫn khoa học: PGS.TS Trịnh Đình Thắng
HÀ NỘI, 2013
LỜI CẢM ƠN
Để hoàn thành luận văn này tôi đã nhận đƣợc sự giúp đỡ tận tình của
thầy hƣớng dẫn khoa học, của các thầy cô trƣờng Đại học Sƣ phạm Hà Nội 2.
Tôi xin chân thành cảm ơn các thầy cô trƣờng Đại học Sƣ phạm Hà Nội 2 đã
tạo điều kiện học tập, nghiên cứu và giúp đỡ tôi rất nhiều trong quá trình làm
luận văn. Đặc biệt tôi xin cảm ơn thầy PGS.TS Trịnh Đình Thắng đã tận tình
hƣớng dẫn, chỉ bảo tôi trong suốt quá trình học tập, nghiên cứu đề tài và giúp
tôi hoàn thành bản luận văn này.
Vĩnh Phúc, ngày 10 tháng 12 năm 1013
Học viên
Nguyễn Thanh Tƣởng
LỜI CAM ĐOAN
Tôi xin cam đoan đây là kết quả nghiên cứu của tôi dƣới sự hƣớng dẫn
khoa học của PGS. TS Trịnh Đình Thắng.
Các số liệu, kết quả nêu trong luận văn là trung thực và chƣa từng đƣợc
ai công bố trong bất kỳ công trình nào khác.
Học viên
Nguyễn Thanh Tƣởng
MỤC LỤC
MỞ ĐẦU 1
CHƢƠNG 1: MÔ HÌNH CƠ SỞ DỮ LIỆU QUAN HỆ 3
1. 1. Các khái niệm cơ bản 3
1.1.1. Thuộc tính và miền thuộc tính 3
1.1.2. Quan hệ, lƣợc đồ quan hệ 3
1.1.3. Khoá của quan hệ 4
1.2. Các phép toán đại số quan hệ 5
1.2.1. Phép hợp 5
1.2.2. Phép giao 6
1.2.3. Phép trừ 6
1.2.4. Tích Đề-các 6
1.2.5. Phép chiếu 7
1.2.6. Phép chọn 8
1.2.7. Phép kết nối 9
1.2.8. Phép chia 10
1.3. Phụ thuộc hàm 11
1.3.1.Các tính chất của phụ thuộc hàm: 11
1.3.2. Hệ tiên đề Amstrong 12
1.3.3. Các hệ tiên đề khác cho phụ thuộc hàm 14
1.4. Bao đóng 14
1.4.1. Bao đóng của tập phụ huộc hàm 14
1.4.2. Bao đóng của tập thuộc tính đối với tập các phụ thuộc hàm 15
1.4.3. Bài toán thành viên và thuật toán tìm bao đóng của tập thuộc tính 17
1.4.4. Sự tƣơng đƣơng giữa hai loại suy dẫn 19
1.5. Khoá của lƣợc đồ quan hệ 21
CHƢƠNG 2: MÔ HÌNH CƠ SỞ DỮ LIỆU DẠNG KHỐI 24
2.1. Khối, lƣợc đồ khối 24
2.2. Lát cắt 25
2.3. Khóa của khối 26
2.4. Đại số quan hệ trên khối 28
2.4.1. Phép hợp 28
2.4.2. Phép giao 28
2.4.3. Phép trừ 29
2.4.4. Tích Đề các 29
2.4.5. Tích Đề các theo tập chỉ số 29
2.4.6. Phép chiếu 30
2.4.7. Phép chọn 30
2.4.8. Phép kết nối 31
2.4.9. Phép chia 32
2.5. Phụ thuộc hàm 32
2.6. Bao đóng của tập thuộc tính chỉ số 33
2.7. Khoá của lƣợc đồ khối R đối với tập phụ thuộc hàm F trên R 35
CHƢƠNG 3: CÁC HỆ TIÊN ĐỀTRONG MÔ HÌNH DỮ LIỆU DẠNG
KHỐI 38
3.1. Các tính chất của phụ thuộc hàm trên lƣợc đồ khối 38
3.2. Một số tính chất của bao đóng trên lƣợc đồ khối 40
3.3. Sự tƣơng đƣơng giữa hai loại suy dẫn 43
3.4. Các hệ tiên đề trong mô hình khối 45
KẾT LUẬN 51
TÀI LIỆU THAM KHẢO 52
1
MỞ ĐẦU
1. Lý do chọn đề tài
Trong những năm gần đây, việc ứng dụng công nghệ thông tin trở nên
rộng rãi và vai trò của công nghệ thông tin ngày càng đƣợc khẳng định trong
nhiều lĩnh vực khác nhau nhƣ : học tập, khoa học kỹ thuật, kinh doanh, quản
lý, với những quy mô khác nhau. Cơ sở dữ liệu là một trong những lĩnh
vực nghiên cứu đóng vai trò nền tảng trong sự phát triển của công nghệ thông
tin. Từ trƣớc đến nay cũng đã có một số loại mô hình đƣợc sử dụng trong các
hệ thống cơ sở dữ liệu nhƣ: mô hình thực thể - liên kết, mô hình mạng, mô
hình phân cấp, mô hình hƣớng đối tƣợng, mô hình dữ liệu datalog và mô hình
quan hệ. Trong số các mô hình này thì mô hình quan hệ là một trong những
mô hình đƣợc nhiều nhà khoa học quan tâm nghiên cứu, khai thác ứng dụng
hơn cả vì nó đƣợc xây dựng trên cơ sở toán học chặt chẽ. Tuy nhiên, mô hình
này cũng có những hạn chế đó là khó khăn trong việc biểu diễn các dữ liệu có
tính chất động. Ví dụ nhƣ tìm kiếm các cán bộ đến kỳ hạn tăng lƣơng trong
một cơ quan chẳng hạn. Để khắc phục khó khăn này thì mô hình dữ liệu dạng
khối là mở rộng của mô hình quan hệ ra đời. Trong đó, các khối có thể biểu
diễn các dữ liệu có tính chất động bằng cách sử dụng trục id làm trục thời
gian. Tuy nhiên, trong mô hình dữ liệu dạng khối còn nhiều loại phụ thuộc dữ
liệu chƣa đƣợc nghiên cứu. Vì vậy, trên cơ sở lý thuyêt của các nhà khoa học
nghiên cứu về mô hình dữ liệu quan hệ và mô hình dữ liệu khối, trong luận
văn này chúng tôi xây dựng “Các hệ tiên đề trong mô hình dữ liệu dạng
khối” nhằm góp phần hoàn thiện hơn lý thuyết về mô hình dữ liệu dạng khối.
2. Mục đích nghiên cứu
-Phát biểu và chứng minh các tính chất của PTH, các tính chất về bao đóng
của tập thuộc tính trong mô hình khối.
- Phát biểu và chứng minh sự tƣơng đƣơng của các hệ tiên đề trong mô hình
dữ liệu dạng khối.
2
3. Nhiệm vụ nghiên cứu
Tìm hiểu về các hệ tiên đề của các phụ thuộc hàm trong mô hình quan
hệ. Trên cơ sở đó xây dựng các hệ tiên đề; chứng minh tính tƣơng đƣơng của
các hệ tiên đề trong mô hình dữ liệu dạng khối.
4. Đối tƣợng và phạm vi nghiên cứu
Đối tƣợng và phạm vi nghiên cứu là các mô hình dữ liệu, tập trung
nghiên cứu về mô hình dữ liệu dạng khối.
5. Phƣơng pháp nghiên cứu
Trong luận văn sử dụng phƣơng pháp thu thập, phân tích và tổng hợp
các tài liệu khoa học liên quan đến đề tài.
6. Những đóng góp mới của đề tài
- Phát biểu và chứng minh các tính chất của phụ thuộc hàm, các tính chất của
bao đóng trong mô hình dữ liệu dạng khối.
- Phát biểu và chứng minh tính đúng tính đủ của hệ tiên đề trong mô hình dữ
liệu dạng khối.
-Chứng minh tính tƣơng đƣơng của các hệ tiên đề trong mô hình dữ liệu dạng
khối.
7. Cấu trúc của luận văn
Luận văn gồm: Lời mở đầu, ba chƣơng nội dung, phần kết luận và tài liệu
tham khảo.
Chƣơng 1 Trình bày các khái niệm cơ bản nhất về mô hình quan hệ. Trình
bày các phép toán đại số trên mô hình quan hệ, các vấn đề về phụ thuộc hàm,
khóa, bao đóng.
Chƣơng 2 Giới thiệu tổng quan về mô hình khối: định nghĩa khối, lƣợc đồ
khối, lát cắt, khóa, đại số quan hệ trên khối, phụ thuộc hàm.
Chƣơng 3 Phát biểu và chứng minh các tính chất của phụ thuộc hàm, các tính
chất về bao đóng của tập thuộc tính trong mô hình dữ liệu dạng khối. Sự
tƣơng đƣơng của các hệ tiên đề trong mô hình dữ liệu dạng khối.
3
CHƢƠNG 1: MÔ HÌNH CƠ SỞ DỮ LIỆU QUAN HỆ
1. 1. Các khái niệm cơ bản
1.1.1. Thuộc tính và miền thuộc tính
Định nghĩa 1.1 [4], [6]
- Thuộc tính là đặc trƣng của đối tƣợng.
-
Tập tất cả các giá trị có thể có của thuộc tính A
i
gọi là miền giá trị của
thuộc tính đó, ký hiệu: Dom(A
i
) hay viết tắt là D
Ai
Ví dụ 1.1:
Đối tƣợng Sinhviên có các thuộc tính nhƣ: MaSV, Hoten, NgSinh, Đchi,
Miền giá trị của các thuộc tính của đối tƣợng Sinh viên :
Dom(MaNV) = {char(4)} ={‘SV01’, ‘SV02’, ‘SV03’ };
Dom(Hoten) = {char(30)} ={‘Nguyễn Văn A’,‘Nguyễn Văn B’, } ;
Dom(NgSinh) = {date} ={‘30/03/78’, ‘22/12/96’, } ;
Dom(Đchi) ={char(10)} = {‘HN’, ‘HP’, ‘VP’, …}.
1.1.2. Quan hệ, lƣợc đồ quan hệ
Định nghĩa 1.2[4], [6]
Cho U= {A
1
, A
2
, …, A
n
} là một tập hữu hạn không rỗng các thuộc tính.
Mỗi thuộc tính A
i
(i=1,2, …, n) có miền giá trị là Dom(A
i
)
. Khi đó r là một
tập các bộ {h
1
, h
2
, …, h
m
} đƣợc gọi là quan hệ trên U với h
j
(j=1, 2, …, m) là
một hàm:
h
j
: U →
i
i
A
AU
D
sao cho h
j
(
A
i
)
D
A
i
(i=1, 2, ,n).
Ta có thể xem một quan hệ nhƣ một bảng, trong đó mỗi hàng (phần tử)
là một bộ và mỗi cột tƣơng ứng với một thành phần gọi là thuộc tính. Biểu
diễn quan hệ r thành bảng nhƣ sau:
4
A
1
A
2
…
A
n
h
1
h
1
(A
1
)
h
1
(A
2
)
…
h
1
(A
n
)
h
2
h
2
(A
1
)
h
2
(A
2
)
…
h
2
(A
n
)
…
…
…
…
…
h
m
h
m
(A
1
)
h
m
(A
2
)
…
h
m
(A
n
)
Bảng 1.1: Biểu diễn quan hệ r.
Ví dụ 1.2:
Trong đó các thuộc tính là MaSV: mã sinh viên; HOTEN: họ tên; NS: ngày
sinh; DC: địa chỉ; KHOA: khoa.
Bộ giá trị: (SV01, A, 24/01/92, HN, TOAN) là một bộ.
Nếu có một bộ t = (d
1
, d
2
, d
3
, , d
m
)
r, r xác định trên U, X
U thì
t(X) (hoặc t.X) đƣợc gọi là giá trị của tập thuộc tính X trên bộ t.
Định nghĩa 1.3 [4], [6]
Tập tất cả các thuộc tính trong một quan hệ cùng với mối liên hệ giữa
chúng đƣợc gọi là lược đồ quan hệ.
Lƣợc đồ quan hệ R với tập thuộc tính U={A
1
, A
2
, , A
n
} đƣợc viết là
R(U) hoặc R(A
1
, A
2
, , A
n
).
1.1.3. Khoá của quan hệ
Định nghĩa 1.4 [4],[6]
Khoá của quan hệ r xác định trên tập thuộc tính U={A
1
, A
2
, , A
n
} là
Sinhviên
MaSV
HOTEN
NS
DC
KHOA
SV01
A
24/01/92
HN
TOAN
SV02
B
3/05/92
VP
LY
SV03
B
3/05/92
VP
TOAN
5
tập con K
U sao cho bất kỳ hai bộ khác nhau t
1
, t
2
r luôn thoả t
1
(K) ≠
t
2
(K) và bất kỳ tập con thực sự K
1
K nào đó đều không có tính chất đó.
Tập thuộc tính K’ đƣợc gọi là siêu khoá nếu K’
K và K là một khoá
của quan hệ r.
Ví dụ 1.3:
Ta có
thuộc
Ta có thuộc tính MaSV là khóa của quan hệ.
1.2. Các phép toán đại số quan hệ.
Định nghĩa 1.5 [3], [6]
Hai quan hệ r và s đƣợc gọi là khả hợp nếu nhƣ hai quan hệ này xác
định trên cùng tập thuộc tính và các thuộc tính cùng tên có cùng miền giá trị.
1.2.1. Phép hợp.
Phép hợp hai quan hệ khả hợp r và s, kí hiệu là r ∪ s, là tập tất cả các
bộ thuộc r hoặc thuộc s. Ta có: r ∪ s = {t│ t ∈ r ∨ t ∈ s}
Ví dụ 1.4:
r (A B C) ; s (A B C)
x
1
y
1
z
1
x
1
y
1
z
1
x
2
y
1
z
2
x
2
y
2
z
2
x
2
y
2
z
1
r ∪ s (A B C)
x
1
y
1
z
1
x
2
y
1
z
2
x
2
y
2
z
1
x
2
y
2
z
2
Sinhviên
MaSV
HOTEN
NS
DC
KHOA
SV01
A
24/01/92
HN
TOAN
SV02
B
3/05/92
VP
LY
SV03
B
3/05/92
VP
TOAN
6
1.2.2. Phép giao
Phép giao của hai quan hệ khả hợp r và s, kí hiệu là r ∩ s, là tập tất cả
các bộ thuộc cả hai quan hệ r và s. Ta có:
r ∩ s = {t│ t ∈ r ∧ t ∈ s}
Ví dụ 1.5:
r (A B C) ; s (A B C)
x
1
y
1
z
1
x
1
y
1
z
1
x
2
y
1
z
2
x
2
y
2
z
2
x
2
y
2
z
1
r ∩ s (A B C)
x
1
y
1
z
1
1.2.3. Phép trừ
Phép trừ của hai quan hệ khả hợp r và s, kí hiệu: r - s là tập tất cả các bộ
thuộc r nhƣng không thuộc s. Ta có:
r - s = {t│ t ∈ r ∧ t ∉ s}
Ví dụ 1.6:
r (A B C) ; s (A B C)
x
1
y
1
z
1
x
1
y
1
z
1
x
2
y
1
z
2
x
2
y
2
z
2
x
2
y
2
z
1
r - s = (A B C) s - r = (A B C)
x
2
y
1
z
2
x
2
y
2
z
2
x
2
y
2
z
1
1.2.4. Tích Đề-các
Cho quan hệ r xác định trên tập thuộc tính {A
1
, A
2
, , A
n
} và quan hệ s
7
xác định trên tập thuộc tính {B
1
, B
2
, , B
m
}. Tích Đề-các của hai quan hệ r và
s kí hiệu là r × s, là tập tất cả các (m+n) - bộ có n thành phần đầu tiên là một
bộ thuộc r và m thành phần sau là một bộ thuộc s. Ta có:
r × s = {t=(a
1
, a
2
, , a
n
, b
1
, b
2
, , b
m
)│(a
1
, a
2
, , a
n
) ∈ r
(b
1
b
2
, , b
m
) ∈ s}
Ví dụ 1.7 :
Bảng 1.2: Biểu diễn các quan hệ r, s và quan hệ r× s.
1.2.5. Phép chiếu
Cho r là một quan hệ n ngôi xác định trên tập thuộc tính U={A
1
, A
2
, ,
A
n
}, X là tập con của U. Phép chiếu của quan hệ r trên tập thuộc tính X, kí
hiệu là
x
(r), là tập các bộ của r xác định trên tập thuộc tính X. Ta có:
x
(r) = {t.X│ t ∈ r}.
Phép chiếu thực chất là phép toán giữ lại một số thuộc tính cần thiết
r × s
A
B
C
G
H
F
x
1
y
1
z
1
x
1
y
1
z
1
x
1
y
1
z
1
x
2
y
2
z
2
x
1
y
1
z
1
x
1
y
2
z
2
x
2
y
1
z
2
x
1
y
1
z
1
x
2
y
1
z
2
x
2
y
2
z
2
x
2
y
1
z
2
x
1
y
2
z
2
x
2
y
2
z
1
x
1
y
1
z
1
x
2
y
2
z
1
x
2
y
2
z
2
x
2
y
2
z
1
x
1
y
2
z
2
r
A
B
C
s
G
H
F
x
1
y
1
z
1
x
1
y
1
z
1
x
2
y
1
z
2
x
2
y
2
z
2
x
2
y
2
z
1
x
1
y
2
z
2
8
của quan hệ và loại bỏ những thuộc tính không cần thiết.
Ví dụ 1.8:
r (A B C D)
x
1
1 x 4
y
1
5 y 2
z
1
5 z 5
x
1
8 x 5
y
1
1 y 4
B
(r)
(B)
1
5
8
BD
(r)
(B D)
1 4
5 2
5 5
8 5
1.2.6. Phép chọn
Phép chọn là phép toán lọc lấy ra một tập con các bộ của quan hệ đã
cho thoả mãn một điều kiện xác định. Điều kiện đó đƣợc gọi là điều kiện
chọn hay biểu thức chọn.
Biểu thức chọn F đƣợc định nghĩa là một tổ hợp logic của các toán
hạng, mỗi toán hạng là một phép so sánh đơn giản giữa hai biến là hai thuộc
tính hoặc giữa một biến là một thuộc tính và một giá trị hằng. Biểu thức chọn
F cho giá trị đúng hoặc sai đối với mỗi bộ đã cho của quan hệ khi kiểm tra
9
riêng bộ đó.
- Các phép toán so sánh trong biểu thức F: >, <, =, ≥, ≠, ≤.
- Các phép toán logic trong biểu thức F: ∧ (và), ∨ (hoặc),
(phủ định).
Cho r là một quan hệ và F là một biểu thức logic trên các thuộc tính của
r. Phép chọn trên quan hệ r với biểu thức chọn F, kí hiệu là
F
(r), là tập tất cả
các bộ của r thoả mãn F. Ta có:
F
(r) = {t│ t ∈ r
F(t)}.
Ví dụ 1.9:
r (A B C D)
x
1
1 x 4
y
1
5 y 2
z
1
5 z 5
x
1
8 x 5
y
1
1 y 4
BD
(r)(A B C D)
y
1
5 y 2
z
1
5 z 5
x
1
8 x 5
1.2.7. Phép kết nối
Cho hai quan hệ r(U) và s(V). Đặt M=U∩V. Phép kết nối (tự nhiên) hai
quan hệ r(U) và s(V), ký hiệu r*s, cho ta quan hệ giữa các bộ đƣợc dán từ các
bộ u của quan hệ R với mỗi bộ v của quan hệ S (sao cho các trị trên miền
thuộc tính chung M của hai bộ này giống nhau).
P(UV)= r*s= {u*v│u ∈ r, v ∈ s, u.M=v.M} .
Nếu M= U∩V=Ф, r*s sẽ cho ta tích Đề- các, trong đó mỗi bộ của quan
hệ r sẽ đƣợc ghép với mọi bộ của quan hệ s.
10
Ví dụ 1.10:
r (A B C) ; s (G H)
x
1
x x
2
x
2
x
3
y y
2
y
2
y
2
y
3
z
1
x z
2
r*s (A B C G H)
y
1
x x
2
x
2
x
3
z
1
y y
2
y
2
y
3
x
1
x z
2
y
2
y
3
1.2.8. Phép chia
Cho r là một quan hệ n ngôi xác định trên tập thuộc tính U và s là một
quan hệ m ngôi xác định trên tập thuộc tính V, với V ⊂ U, n > m và s ≠ ∅, có
nghĩa là lực lƣợng của s là khác 0 hay s có ít nhất một bộ. Phép chia quan hệ r
cho quan hệ s, kí hiệu là r ÷ s, là tập tất cả các bộ t trên U\V sao cho với mọi
bộ v ∈ s thì khi ghép bộ t với bộ v ta đƣợc một bộ thuộc r.
Ta có: r ÷ s = {
t│∀ v ∈ s, (t, v) ∈ r
}
Ví dụ 1.11:
r (A B C D) ; s (A B)
x
1
1 x
1
2 x
1
1
y
1
2 x
1
2 y
1
2
z
1
3 x
1
2 z
1
3
x
1
1 x
1
4
y
1
2 y
1
4
z
1
3 z
1
5
11
r ÷ s (C D)
x
1
2
1.3. Phụ thuộc hàm
Khi xét đến mối quan hệ giữa dữ liệu trong CSDL quan hệ một trong
nhƣng yếu tố quan trọng nhất đƣợc xét đến là sự phụ thuộc giữa các thuộc
tính này với thuộc tính khác. Từ đó có thể xây dựng những ràng buộc cũng
nhƣ loại bỏ đi những dƣ thừa dữ liệu trong một CSDL.
Phụ thuộc hàm là những mối quan hệ giữa các thuộc tính trong CSDL
quan hệ. Khái niệm về phụ thuộc hàm có một vai trò rất quan trọng trong việc
thiết kế mô hình dữ liệu. Một trạng thái phụ thuộc hàm chỉ ra rằng giá trị của
một thuộc tính đƣợc quyết định một cách duy nhất bởi giá trị của thuộc tính
khác. Sử dụng các phụ thuộc hàm để chuẩn hóa lƣợc đồ quan hệ về dạng
chuẩn 3 hoặc chuẩn Boye-Codd.
Định nghĩa 1.6 [3], [4],[6]
Cho lƣợc đồ quan hệ R xác định trên tập thuộc tính U, và X, Y ⊆ U.
Nói rằng, X xác định hàm Y hay Y phụ thuộc hàm vào X và kí hiệu X → Y
nếu với mọi quan hệ r xác định trên R và với hai bộ bất kỳ t
1
, t
2
∈ R mà t
1
(X)
= t
2
(X) thì t
1
(Y) = t
2
(Y).
1.3.1.Các tính chất của phụ thuộc hàm:
Cho lƣợc đồ quan hệ R xác định trên tập thuộc tính U = {A
1
, A
2
, ,
A
n
}, cho X, Y, Z, W
⊆
U thì ta có một số tính chất cơ bản của các phụ thuộc
hàm nhƣ sau:
F1) Nếu Y ⊆ X thì X → Y.
F2) Nếu X → Y thì XW → YW.
F3) Nếu X → Y, Y → Z thì X → Z.
F4) Nếu X → Y, YZ → W thì XZ → W.
F5) Nếu X → Y, Z → W thì XZ →YW.
12
F6) Nếu X → Y thì XZ→Y.
F7) Nếu X → Y, X → Z thì X → YZ.
F8) Nếu X → YZ thì X → Y.
F9) Nếu X → YZ, Z → WV thì X → YZW.
1.3.2. Hệ tiên đề Amstrong
Gọi R là quan hệ trên tập thuộc tính U. Khi đó với các tập thuộc tính X,
Y, Z ⊆ U ta có hệ tiên đề Amstrong [4] nhƣ sau:
1-Phản xạ: Nếu Y ⊆ X thì X → Y
2-Tăng trƣởng: Nếu X → Y thì XW → YW
3-Bắc cầu: Nếu X → Y, Y → Z thì X → Z
Định lý 1.1
Hệ tiên đề Amstrong là đúng và đầy đủ
Chứng minh:
a) Tính đúng.
1) Với mọi t
1
, t
2
r(R) và t
1
(X) = t
2
(X), cần chứng minh t
1
(Y) = t
2
(Y).
Thật vậy, từ giả thiết t
1
(X) = t
2
(X) mà Y
X suy ra t
1
(Y) = t
2
(Y).
Vậy từ t
1
(X) = t
2
(X) ⇒ t
1
(Y) = t
2
(Y).
2) Với mọi t
1
, t
2
r(R) và t
1
(XW) = t
2
(XW), cần chứng minh t
1
(YW)= t
2
(YW)
Phản chứng: Giả sử t
1
(YW) ≠ t
2
(YW).
Theo giả thiết có t
1
(XW) = t
2
(XW) ⇒ t
1
(X)= t
2
(X)
t
1
(W)= t
2
(W)
Nên để có t
1
(YW) ≠ t
2
(YW) thì t
1
(Y) ≠ t
2
(Y).
Nhƣng cũng theo giả thiết ta lại có X → Y nên t
1
(X) = t
2
(X) ⇒ t
1
(Y) =
t
2
(Y) (mâu thuẫn) ⇒ t
1
(YW)= t
2
(YW).
Vậy từ t
1
(XW) = t
2
(XW) ⇒ t
1
(YW)= t
2
(YW).
3) Với mọi t
1
, t
2
r(R) và t
1
(X) = t
2
(X), cần chứng minh t
1
(Z) = t
2
(Z)
Phản chứng: Giả sử t
1
(Z) ≠ t
2
(Z).
13
Theo giả thiết X → Y nên t
1
(X) = t
2
(X) ⇒ t
1
(Y) = t
2
(Y).
Mặt khác, cũng theo giả thiết có Y → Z nên t
1
(Y) = t
2
(Y) ⇒ t
1
(Z) =
t
2
(Z) (mâu thuẫn).
Vậy từ t
1
(X) = t
2
(X) ⇒ t
1
(Z)= t
2
(Z).
b) Tính đầy đủ.
Nếu X → Y không suy diễn logic đƣợc từ tập phụ thuộc hàm F bằng hệ
tiên đề Amstrong thì X → Y không thỏa mãn trên quan hệ r(R).
Giả sử, X → Y không suy diễn logic đƣợc từ F bằng hệ tiên đề, ta sẽ
xây dựng một quan hệ r sao cho các phụ thuộc hàm của F là thỏa mãn trên r,
nhƣng X → Y không thỏa trên r.
Xét quan hệ r gồm hai bộ t
1
, t
2
nhƣ sau:
r
A
B
F
G
H
M
t
1
1
1
1
1
1
1
t
2
1
1
1
0
0
0
Trong đó, các thuộc tính trong t
1
đều có giá trị 1, các thuộc tính trong t
2
chỉ có các thuộc tính thuộc X
+
là có giá trị 1 còn lại là giá trị 0.
Ta chứng tỏ rằng, với mọi phụ thuộc hàm của F đều thỏa mãn trên r.
Thật vậy, giả sử W → V
F không thỏa trên r. Nhƣ vậy, W
X
+
, vì nếu
không sẽ vi phạm tính bằng nhau của W trên hai bộ t
1
và t
2
. Hơn nữa, V
không thể là tập con của X
+
, bởi vì nếu V
X
+
thì W → V sẽ thỏa mãn trên
r. Vậy phải có ít nhất một thuộc tính A
X
+
. Theo tính chất phản xạ nếu W
X
+
thì X → W, mà W → V nên X → V (theo tính chất bắc cầu). Do A
X
+
nên X → A hay A
X
+
. Điều đó là vô lý, bởi vì A
X
+
Kết luận với mọi phụ thuộc hàm F đều thỏa trên r.
Tiếp theo ta chứng tỏ rằng X → Y không thỏa mãn trên r
Thật vậy, giả sử X → Y thỏa trên r(R). Nhƣ vậy X
X
+
và Y
X
+
, vì nếu
không sẽ vi phạm sự bằng nhau trên các bộ t
1
, t
2
của X và Y. Nhƣng nếu Y
14
X
+
thì X → Y sẽ suy diễn đƣợc từ F (theo tính chất phản xạ). Điều này mâu
thuẫn với giả thiết X → Y không suy diễn đƣợc từ F. Nhƣ vậy X → Y không
thể thỏa mãn trên r.
Kết luận X → Y không thỏa mãn trên r.
1.3.3. Các hệ tiên đề khác cho phụ thuộc hàm.
Gọi R là quan hệ trên tập thuộc tính U. Khi đó với các tập thuộc tính X,
Y, Z, W ⊆ U ta có các hệ tiên đề tƣơng đƣơng với hệ tiên đề Amstrong nhƣ
sau :
Hệ tiên đề B
0
Nếu X → YZ thì X → Y
Nếu X → YZ và Z → AW thì X → YZW
Hệ tiên đề S
0
Nếu Y ⊆X thì X → Y
Nếu X → Y và YZ → V thì XZ → V
Hệ tiên đề D
0
Nếu X → Y và Y → Z thì X → Z
Nếu X → Y và Z → W thì XZ → YW
Hệ tiên đề M
0
Nếu X → Y và YZ → V thì XZ → V
Nếu X → Y thì XZ → Y
1.4. Bao đóng.
1.4.1. Bao đóng của tập phụ thuộc hàm.
Định nghĩa 1.7 [1]
Cho tập phụ thuộc hàm F, bao đóng của tập phụ thuộc hàm F kí hiệu F
+
là tập lớn nhất chứa các phụ thuộc hàm đƣợc suy diễn từ các phụ thuộc hàm
thuộc F. Vậy F
+
= {f │F │= f}.
15
1.4.2. Bao đóng của tập thuộc tính đối với tập các phụ thuộc hàm
Định nghĩa 1.8 [1],
Cho lƣợc đồ quan hệ R xác định trên tập thuộc tính U, cho X ⊆ U, tập
các phụ thuộc hàm F. Bao đóng của tập thuộc tính X đối với F kí hiệu X
+
là
tập tất cả các thuộc tính A mà X → A đƣợc suy diễn từ F. Ta có:
X
+
= {A│ X → A ∈ F
+
}.
Đôi khi ta kí hiệu X
F
+
để chỉ lấy bao đóng của X theo tập phụ thuộc hàm F.
Tính chất của bao đóng:
1) X ⊆ X
+
2) Nếu X ⊆ Y thì X
+
⊆ Y
+
3) X → X
+
4) X
++
= X
+
5) X
+
Y
+
⊆ (XY)
+
6) (X
+
Y)
+
= (XY
+
)= (XY)
+
7) X → Y
Y ⊆ X
+
8) X → Y và Y → X
X
+
= Y
+
Chứng minh:
1) Lấy bất kỳ A ∈ X cần chứng minh A ∈ X
+
.
Ta có A ∈ X
{A} ⊆ X suy ra X → A (luật phản xạ)⇒ A ∈X
+
.
2) Lấy A ∈ X
+
, ta cần chứng minh A ∈ Y
+
.
Ta có A ∈ X
+
⇒X → A (1).
Mà theo luật phản xạ X⊆Y ⇒ Y → X (2).
Vậy từ (1) và (2) ta suy ra Y→ A ⇒ A∈ Y
+
.
3) Giả sử X
+
=A
1
A
2
A
k
Do A
1
∈ X
+
ta có X → A
1
Tƣơng tự: X → A
2
X → A
k
16
Theo luật hợp ta có X → A
1
A
2
A
k
⇒ X → X
+
4) Để chứng minh X
++
=X
+
ta đi chứng minh X
+
⊆ X
++
và
ngƣợc lại X
++
⊆ X
+
Theo tính chất 1 ta có X
+
⊆ X
++
. Ta cần chứng minh X
++
⊆ X
+
Lấy A ∈ X
++
, chứng minh A ∈ X
+
.
Do A ∈ X
++
⇒X
+
→ A (1).
Mặt khác theo tính chất 3 ta có: X → X
+
(2).
Từ (1) và (2) suy ra X→ A ⇒ A ∈ X
+
.
5) Ta có X ⊆ XY
Theo tính chất 2 ta có X
+
⊆ (XY)
+
(1).
Tƣơng tự ta cũng có : Y
+
⊆ (XY)
+
(2).
Từ (1) và (2) suy ra X
+
Y
+
⊆ (XY)
+
.
6) Theo những chững minh trên ta có:
X
+
⊆ X
+
Y (1).
X
+
⊆ (XY)
+
(2).
Y
+
⊆ (XY)
+
(3).
Từ (1), (2) và (3) suy ra X
+
Y ⊆ (XY)
+
⇒(X
+
Y)
+
⊆ (XY)
++
= (XY)
+
(theo tính chất 4).
Vậy ta có ⇒(X
+
Y)
+
⊆ (XY)
+
(4).
Mặt khác ta cũng có: X ⊆ X
+
(tính chất 1) ⇒ XY ⊆ X
+
Y
Từ XY ⊆ X
+
Y Theo tính chất 2 ⇒ (XY)
+
⊆ (X
+
Y)
+
(5).
Từ (4), (5) suy ra (X
+
Y)
+
= (XY)
+
.
7) Để chứng minh X→ Y
Y ⊆ X
+
ta có:
a) Giả sử có X→ Y ta cần chứng minh Y ⊆ X
+
Lấy bất kỳ A∈ Y, ta cần chứng minh A ∈ X
+
.
Ta có: A ∈ Y ⇒Y → A (1).
Theo giả thiết ta lại có: X→ Y (2).
Từ (1), (2) suy ra X→ Y⇒A ∈ X
+
.
17
b) Giả sử có A ⊆ X
+
ta cần chứng minh X→Y.
Do Y ⊆ X
+
⇒X
+
→ Y (luật phản xạ).
Mặt khác: X→ X
+
(theo tính chất 3).
Suy ra: X→ Y (luật bắc cầu).
8) Chứng minh X→ Y và Y→ X
X
+
= Y
+
ta có:
a) Giả sử có X→ Y và Y→ X ta cần chứng minh X
+
=Y
+
.
Do X→ Y ⇒ Y ⊆ X
+
⇒ Y
+
⊆ X
++
.
⇒ Y
+
⊆ X
+
. (theo tính chất 4) (1).
Do Y→ X ⇒ X ⊆ Y
+
.
⇒ X
+
⊆ Y
++
.
⇒ X
+
⊆ Y
+
. (theo tính chất 4) (2).
Từ (1), (2) ta có X
+
= Y
+
.
b) Giả sử có X
+
= Y
+
ta cần chứng minh X→Y và Y→ X
Do X
+
= Y
+
nên ta có
Y
+
⊆ X
+
(1’)
X
+
⊆ Y
+
(2’)
Theo tính chất 1 ta có Y ⊆ Y
+
mà Y
+
⊆ X
+
⇒Y ⊆ X
+
⇒ X→Y (theo
tính chất 7).
1.4.3. Bài toán thành viên và thuật toán tìm bao đóng của tập thuộc tính
• Bài toán thành viên:
Nói rằng X → Y là thành viên của F nếu X → Y ∈ F
+
.
Một vấn đề quan trọng khi nghiên cứu lý thuyết cơ sở dữ liệu là khi cho
trƣớc tập các phụ thuộc hàm F và một phụ thuộc hàm X → Y, làm thế nào để
biết X → Y ∈ F
+
hay không, bài toán này đƣợc gọi là bài toán thành viên.
Để trả lời câu hỏi này ta có thể tính F
+
rồi xác định xem X → Y có
thuộc F
+
hay không. Việc tính F
+
là một công việc đòi hỏi thời gian và công
18
sức. Tuy nhiên, thay vì tính F
+
chúng ta có thể dùng tính chất của bao đóng
của tập thuộc tính X để xác định X → Y có là thành viên của F
+
hay không.
Đó là: X → Y ∈ F
+
⇔ Y ⊆ X
+
. Ta chứng minh điều này.
Giả sử Y= {A
i1
, A
i2
, ,A
ik
}
{A
1
…A
n
} với A
1
…A
n là các thuộc tính
và Y ⊆ X
+
.
Từ định nghĩa X
+
ta có X → A
i
, áp dụng hệ tiên đề Amstrong cho
mỗi i suy ra X → Y nhờ luật hợp.
Ngƣợc lại, giả sử ta có X → Y, áp dụng hệ tiên đề Amstrong cho mỗi i
ta có X → A
i
, A
i
∈Y nhờ luật tách, suy ra A
i
∈ X
+
. Từ đó, suy ra Y ⊆ X
+
.
Vậy X → Y ∈ F
+
.
Thuật toán 1.1:
Xác định xem một phụ thuộc hàm X → Y có tồn tại không?
Vào: U, F, X, Y ⊆ U.
Ra: Kiểm tra X → Y ∈ F
+
?
Phƣơng pháp
Bƣớc 1: Tìm bao đóng của tập thuộc tính X: X
F
+
Bƣớc 2: Kiểm tra Y ⊆ X
+
nếu đúng thì X → Y ∈ F
+
, return (Y)
nếu sai thì X → Y ∉ F
+
, return (N)
Bƣớc 3: Kết thúc thuật toán.
• Thuật toán tìm bao đóng của tập thuộc tính:
Thuật toán 1.2: Tìm bao đóng của tập thuộc tính
Dữ liệu đầu vào: F, X ⊆ U.
Ra: X
+
là bao đóng của X đối với F.
Phƣơng pháp:
Tính liên tiếp các tập thuộc tính X
0
, X
1
, X
2
, theo các bƣớc sau:
Bƣớc 0: đặt X
0
= X.
Bƣớc i: Tính X
i
từ X
i-1
nhƣ sau:
19
X
i
= X
i-1
∪{A} nếu tồn tại Y → Z ∈ F mà Y
X
i-1
, A∈ Z và A
X
i-1
.
X
i-1
nếu ngƣợc lại.
Vì rằng X= X
0
…
X
i
…
U và U là hữu hạn cho nên sẽ tồn tại
một chỉ số i nào đó mà X
i
= X
i-1
, khi đó X
+
= X
i
.
Định lý 1.2
Thuật toán tìm bao đóng X
+
là đúng.
Ví dụ 1.12:
Cho tập thuộc tính U = {A, B, C, D, E, G, H} và tập phụ thuộc hàm
F = {A → D, AB → DE, CE → G, E → H}.
Tính (AB)
+
F
?
Bƣớc 0 : X
0 = AB.
Bƣớc 1: X
1 = X0 ∪ {D} vì ∃ A → D thoả mãn điều kiện.
Bƣớc 2: X
2 = X1 ∪ {E} vì ∃ AB → DE thoả mãn điều kiện.
Bƣớc 3: X
3 = X2 ∪ {H} vì ∃ E → H thoả mãn điều kiện.
Bƣớc 4: X
4 = X3.
Vậy AB
+
F
= {ABDEH}
1.4.4. Sự tƣơng đƣơng giữa hai loại suy dẫn
Định nghĩa 1.9 [1]
Cho tập phụ thuộc hàm F xác định trên tập thuộc tính U và f là một phụ
thuộc hàm trên U. Ta nói phụ thuộc hàm f đƣợc suy dẫn theo quan hệ từ tập
phụ thuộc hàm F kí hiệu F ⊢ f nếu mọi quan hệ r thỏa F thì cũng thỏa f.
Định nghĩa 1.10 [1]
Cho tập phụ thuộc hàm F xác định trên tập thuộc tính U và f là một phụ
thuộc hàm trên U. Ta nói phụ thuộc hàm f đƣợc suy dẫn theo tiên đề (hoặc
suy dẫn logic) từ tập phụ thuộc hàm F kí hiệu F ⊨ f nếu f ∈ F
+
. Nói cách
khác f đƣợc suy dẫn theo các tiên đề từ tập phụ thuộc hàm F nếu nhƣ áp dụng
20
hệ tiên đề Amstrong đối với các phụ thuộc hàm trong F thì sau hữu hạn lần ta
sẽ thu đƣợc f.
Định lý 1.3 (Định lý tƣơng đƣơng)
Với mọi tập phụ thuộc hàm F và phụ thuộc hàm f trên tập thuộc tính U
ta có F ⊢f khi và chỉ khi F ⊨ f.
Nói cách khác, suy dẫn theo tiên đề và suy dẫn theo quan hệ là một.
F ⊢f
F ⊨ f.
Chứng minh:
a- Giả sử ta có F ⊢f cần chứng minh F ⊨ f
Giả sử sau k bƣớc ứng dụng các luật của hệ tiên đề ta nhận đƣợc các
phụ thuộc hàm:
f
1
, F
1
= F ∪ {f
1
}
f
2
, F
2
= F
1
∪ {f
2
}
f
k
, F
k
= F
k-1
{f
k
}
Vậy ta có R(F)
R(F
1
)
R(F
2
)
R(F
k
)
R(
f
) hay F ⊨ f
b- Giả sử ta có F ⊨ f cần chứng minh F ⊢ f
Để chứng minh F ⊨ f
F ⊢ f ta sẽ chứng minh F ⊬ f thì F ⊭ f
Thật vậy, đặt f = X→ Y. Khi đó có F, X ta sẽ tính đƣợc X
+
Ta xây dựng quan hệ R nhƣ sau:
R
A
1
A
2
A
k
A
k+1
A
n
U
a
1
a
2
a
k
a
k+1
a
n
V
a
1
a
2
a
k
b
k+1
b
n
Giả sử X
+
= A
1
, A
2
, , A
k