Tải bản đầy đủ (.pdf) (74 trang)

Luận văn thạc sĩ VNU UET nghiên cứu một số vấn đề về phụ thuộc dữ liệu và khai phá dữ liệu trong cơ sở dữ liệu quan hệ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.11 MB, 74 trang )

đại học quốc gia hà nội
Trờng đại học CÔNG NGHệ

ưưư&ưưư

Trần Thnh Trung

NGHIÊN CứU Một số vấn đề về phụ
thuộc Dữ LIệU V KHAI PHá Dữ LIệU
TRONG CƠ Sở Dữ LIệU QUAN HƯ

LN V¡N TH¹C SÜ 

Hà Nội – 2009

LUAN VAN CHAT LUONG download : add


đại học quốc gia hà nội
Trờng đại học CÔNG NGHệ

ưưư&ưưư

Trần Thnh Trung

NGHIÊN CứU Một số vấn đề về phụ
thuộc Dữ LIệU V KHAI PHá Dữ LIệU
TRONG CƠ Sở Dữ LIệU QUAN Hệ

Ngành: Công nghệ thông tin
Chuyên ngành: Hệ thống thông tin


M∙ sè: 60 48 05
LN V¡N TH¹C SÜ
NG−êi h−íng dÉn khoa häc: pgs. ts vò ngäc lo∙n 

Hà Nội – 2009

LUAN VAN CHAT LUONG download : add




LỜI CAM ĐOAN 
Tơi xin cam đoan: Luận văn “Nghiên cứu một số vấn đề về Phụ thuộc 
dữ liệu và Khai phá dữ liệu  trong Cơ sở dữ liệu quan hệ” là cơng trình 
nghiên cứu riêng của tơi 
Các kết quả nghiên cứu trong luận văn là trung thực. Nếu sai tơi xin hồn 
tồn chịu trách nhiệm. 
Hà Nội, ngày 15 tháng 11 năm 2009 
Học viên 
Trần Thành Trung

LUAN VAN CHAT LUONG download : add




LỜI CẢM ƠN 
Tác giả xin bày tỏ lịng biết ơn sâu sắc tới PGS.TS Vũ Ngọc Lỗn, người 
đã  hướng dẫn, truyền đạt  những kinh  nghiệm  q báu  và tận tình  giúp đỡ tác 
giả hồn thành  luận văn này. 

Tác giả xin cảm ơn sự quan tâm giúp đỡ của các thầy, cơ trong khoa Cơng 
nghệ thơng tin đã tận tình giảng dạy cũng như giúp đỡ trong q trình học tập và 
nghiên cứu tại Khoa; đồng thời xin cảm ơn sự ủng hộ của các anh chị học viên 
lớp K13HTTT đã động viên và giúp đỡ tác giả trong q trình thực hiện đề tài 
này. 
Hà Nội, ngày 15 tháng 11 năm 2009 
Học viên 
Trần Thành Trung

LUAN VAN CHAT LUONG download : add




TĨM TẮT 
Lớp phụ thuộc dữ liệu đóng vai trị rất quan trọng trong q trình thiết kế 
cơ sở dữ liệu thì và một trong những lớp phụ thuộc dữ liệu đầu tiên là lớp phụ 
thuộc hàm. Ngày nay, việc mở rộng lớp phụ thuộc hàm này (mờ hố) đang được 
nghiên cứu và tiếp cận theo nhiều hướng khác nhau. Với mục tiêu nghiên cứu về 
việc mở rộng này cũng như các khái niệm liên quan, trong đề tài nghiên cứu đã 
tìm  hiểu sâu  về phụ thuộc dữ  liệu và trình bày các nội dung  liên quan đến lớp 
phụ  thuộc  hàm  mờ  (fuzzy  functional  dependency),  bao  đóng  tập  thuộc  tính  và 
thuật tốn tìm bao đóng tập thuộc tính mờ (fuzzy transitive closure),  khố mờ 
(fuzzy key) và thuật tốn tìm khố mờ, các dạng chuẩn mờ trong CSDL quan hệ. 
Bên cạnh đó đề tài cũng đã nghiên cứu về việc mở rộng một trong những định lý 
quan trọng nhất của việc nghiên cứu CSDL đó là định lý tương đương.

LUAN VAN CHAT LUONG download : add





ABSTRACT 
Data dependency plays a very important role in the process of designing 
the  database  and  one  of  the  first  data  dependency  class  is  the  functional 
dependency.  Today,  the  expansion  of  the  functional  dependency  (fuzzy 
functional dependency) are being studied and approached in several ways. With 
the  objective  of  researching  on  the  expansion  of  functional  dependency  and 
related concepts,  my  thesis  focus on researching about data  dependency,  fuzzy 
functional  dependency,  fuzzy  transitive  closure    and  the  algorithm  for  finding 
fuzzy  transitive  closure  of  attributes  ,  fuzzy  key    and  the  algorithm  of  finding 
fuzzy keys in relational database. Besides, my thesis also focuses on researching 
about the expansion of one of the most important theorems of rational database 
– the equivalence theorem.

LUAN VAN CHAT LUONG download : add




MỤC LỤC 
LỜI CAM ĐOAN .............................................................................................. 1 
LỜI CẢM ƠN .................................................................................................... 2 
TĨM TẮT.......................................................................................................... 3 
ABSTRACT....................................................................................................... 4 
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT ...................................... 7 
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ ............................................................. 8 
DANH MỤC CÁC BẢNG BIỂU ....................................................................... 9 
MỞ ĐẦU ..........................................................................................................10 
I.  Mục tiêu nghiên cứu của đề tài ..............................................................10 

II.  Một số kết quả đạt được.........................................................................10 
III.  Bố cục của Luận văn .............................................................................11 
CHƯƠNG 1. TỔNG QUAN .............................................................................12 
1.1 Cơ sở dữ liệu ...........................................................................................12 
1.1.1 Các khái niệm chung ........................................................................12 
1.1.2 Định nghĩa ........................................................................................12 
1.2 Phụ thuộc hàm .........................................................................................13 
1.2.1 Định nghĩa ........................................................................................13 
1.2.2 Tính chất của Phụ thuộc hàm (Hệ tiên đề Amstrong)........................14 
1.2.3 Bao đóng tập thuộc tính ....................................................................15 
1.2.4 Định lý tương đương.........................................................................18 
1.3 Khố........................................................................................................19 
CHƯƠNG 2. LỚP PHỤ THUỘC HÀM MỜ TRONG CƠ SỞ DỮ LIỆU QUAN 
HỆ.....................................................................................................................21 
2.1 Dữ liệu mờ ..............................................................................................21 
2.1.1 Tập rõ ...............................................................................................21 
2.1.2 Tập mờ .............................................................................................21 
2.1.3 Các phép tốn cơ bản trên tập mờ .....................................................22 
2.2 Phụ thuộc hàm mờ ...................................................................................23 
2.2.1 Định nghĩa ........................................................................................23 
2.2.2 Tính chất...........................................................................................27 
2.3 Xây dựng hệ tiên đề cho lớp Phụ thuộc hàm mờ ( Hệ tiên đề Amstrong 
mở rộng)........................................................................................................29 
CHƯƠNG 3. KHỐ MỜ TRONG CƠ SỞ DỮ LIỆU QUAN HỆ ....................31 
3.1  Khố mờ.................................................................................................31 
3.2  Bao đóng tập thuộc tính ..........................................................................31 

3.2.1. Tính chất của bao đóng tập thuộc tính (X ) .....................................32 
3.2.2  Bài tốn thành viên ..........................................................................33 
3.2.3 Thuật tốn tìm bao đóng ...................................................................34 

3.2.4 Tính đúng của thuật tốn tìm bao đóng .............................................37 
3.3  Định lý tương đương cho tập mờ ............................................................41 
3.3.1 Định nghĩa ........................................................................................42

LUAN VAN CHAT LUONG download : add




3.3.2 Định nghĩa ........................................................................................42 
3.3.3  Định lý.............................................................................................42 
3.4  Thuật tốn tìm khố mờ..........................................................................44 
3.5  Các dạng chuẩn mờ ................................................................................45 
3.5.1 Dạng chuẩn mờ F1NF.......................................................................45 
3.5.2 Dạng chuẩn mờ F2NF.......................................................................46 
3.5.2.1 Xác định dạng chuẩn mờ F2NF .....................................................47 
3.5.2.2 Đưa quan hệ về dạng chuẩn mờ F2NF ...........................................48 
3.5.3 Dạng chuẩn mờ F3NF.......................................................................50 
3.5.4 Dạng chuẩn mờ Boyce Codd (FBCNF) ............................................51 
KẾT LUẬN.......................................................................................................53 
4.1  Ý nghĩa khoa học và thực tiễn của đề tài.................................................53 
4.2  Kết luận và kiến nghị..............................................................................53 
4.2.1  Kết luận ...........................................................................................53 
4.2.2  Hướng phát triển đề tài ....................................................................54 
TÀI LIỆU THAM KHẢO .................................................................................55 
PHỤ LỤC .........................................................................................................57

LUAN VAN CHAT LUONG download : add





DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT 
TT 







Từ viết tắt 
CNTT 
CSDL 
HTTT 
HĐH 
FTH 
FFD 



FK 

Nghĩa đầy đủ 
Cơng nghệ thơng tin 
Cơ sở dữ liệu 
Hệ thống thơng tin 
Hệ điều hành 
Phụ thuộc hàm 
Fuzzy  Functional  Dependency  ­  Phụ  thuộc  hàm 

mờ 
Fuzzy Key – khố mờ

LUAN VAN CHAT LUONG download : add




DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ 
Hình 1: Hệ thống thơng tin ............................................................................... 12 
Hình 2: Hệ thống Cơ sở dữ liệu........................................................................ 13 
Hình 3: Tập mờ và tập rõ.................................................................................. 22 
Hình 4: Tập Input ............................................................................................. 71 
Hình 5: Giao diện cài đặt thuật tốn ................................................................. 71 
Hình 6: Giao diện chạy thuật tốn (Nhập tập thuộc tính cần tính bao đóng X + ) 72 
Hình 7: Kết quả bao đóng của tập thuộc tính {A,B,C} ..................................... 72

LUAN VAN CHAT LUONG download : add




DANH MỤC CÁC BẢNG BIỂU 
Bảng 1: Bảng quan hệ Học sinh ....................................................................... 14 
Bảng 2: Bảng các mở rộng của Phụ thuộc hàm................................................. 26 
Bảng 3: Bảng các khả năng kết hợp giữa các tập thuộc tính ............................. 27 
Bảng 4: Bảng các khả năng kết hợp giữa các tập thuộc tính ............................. 28 
Bảng 5: Bảng quan hệ Nhân viên ..................................................................... 46

LUAN VAN CHAT LUONG download : add



10 

MỞ ĐẦU 
I.  Mục tiêu nghiên cứu của đề tài 
Trong  những  năm  gần  đây,  việc  ứng  dụng  công  nghệ  thơng  tin  trở  nên 
rộng  rãi  và  vai  trị  của  cơng  nghệ  thơng  tin  ngày  càng  được  khẳng  định  trong 
nhiều lĩnh vực khác nhau như là: học tập, khoa học kỹ thuật, kinh doanh, quản 
lý, ... dưới nhiều quy mơ khác nhau. Cơ sở dữ liệu là một trong những lĩnh vực 
nghiên cứu đóng  vai trị  nền tảng  trong sự phát triển của cơng  nghệ thơng  tin. 
Tuy nhiên sự phát triển của cơ sở dữ liệu cũng chỉ mới bắt đầu trong thời gian 
gần  đây,  đặc  biệt  từ  khi  E.F.Codd  giới  thiệu  mơ  hình  Cơ  sở  dữ  liệu  quan  hệ 
(Relational Database Model). Ngày  nay có rất  nhiều  hệ quản  trị Cơ sở dữ  liệu 
được  xây  dựng  và  phát  triển  dựa  trên  mơ  hình  này  như  là  :  MS  Access,  SQL 
Server, Oracle,… 
Lớp phụ thuộc dữ liệu đóng vai trị rất quan trọng trong q trình thiết kế 
cơ sở dữ liệu thì và một trong những lớp phụ thuộc dữ liệu đầu tiên là lớp phụ 
thuộc  hàm.  Việc  khai  phá  lớp  phụ  thuộc  hàm  có  yếu  tố  quyết  định  trong  việc 
thiết kế Lược đồ khái niệm, bước đầu của q trình xây dựng Cơ sở dữ liệu. Một 
trong  những đặc điểm  quan trọng của phụ thuộc dữ  liệu  là  việc  nghiên cứu  về 
Khố ­ một khái niệm quan trọng trong việc xác định quan hệ phụ thuộc dữ liệu. 
Việc phát triển nghiên cứu về dữ liệu mờ (fuzzy data) địi hỏi việc nghiên cứu về 
khái niệm Khố mờ (fuzzy key) trong CSDL quan hệ. Đây cũng là sự mở rộng 
hết sức tự nhiên của q trình phát triển Cơ sở dữ liệu. 
Với mong muốn được đóng góp một phần cơng sức nhỏ bé của mình vào 
việc nghiên cứu về lớp phụ thuộc dữ liệu và khai phá dữ liệu trong CSDL quan 
hệ mục tiêu nghiên cứu của đề tài này chủ yếu chú trọng vào việc nghiên cứu về 
sự  phụ thuộc  dữ  liệu,  lớp  phụ thuộc  hàm  mờ,  bao  đóng  và  thuật  tốn  tìm bao 
đóng, khố mờ và thuật tốn tìm khố mờ. 

II. Một số kết quả đạt được 
Với mong muốn nghiên cứu sâu về lĩnh vực CSDL và các ứng dụng mở rộng 
CSDL đề tài nghiên cứu của tác giả đã đạt được một số kết quả nhất định như 
sau:
·  Tổng hợp lại khái niệm trong CSDL quan hệ truyền thống
·  Nghiên cứu về lớp Phụ thuộc hàm mờ: 
o  Hệ tiên đề cho lớp Phụ thuộc hàm mờ 
o  Khái niệm và thuật tốn tìm bao đóng trong ngữ cảnh mờ 
o  Khố mờ (fuzzy key) và thuật tốn tìm khố 
o  Định lý tương đương trong lớp phụ thuộc hàm mờ
·  Tìm hiểu mở rộng khái niệm các dạng chuẩn thành dạng chuẩn mờ 
( fuzzy normal form) F1NF, F2NF, F3NF, FBCNF.

LUAN VAN CHAT LUONG download : add


11 

III.  Bố cục của Luận văn 
Bố cục của luận văn được chia làm 3 chương chính theo trình tự nghiên 
cứu  từ  CSDL  quan  hệ  truyền  thống  đến  việc  mở  rộng  các  khái  niệm  trong 
CSDL này. Cụ thể luận văn bao gồm các vấn đề được trình bày theo thứ tự như 
sau: 
Chương 1: Tổng quan 
Chương 1 trình bày lại những khái niệm cơ bản như là: dữ liệu, thơng tin, 
cơ sở dữ liệu, hệ quản trị cơ sở dữ liệu, khái niệm về Phụ thuộc hàm, Bao đóng 
tập thuộc tính  và  Khóa. Bên cạnh đó trong chương  này cũng  trình bày  về  một 
trong những định lý quan trọng nhất của Cơ sở dữ liệu quan hệ ­ định lý tương 
đương. 
Chương 2: Lớp phụ thuộc hàm mờ trong Cơ sở dữ liệu quan hệ 

Chương 2 trình bày các khái niệm cơ bản về tập mờ, các phép tốn trên 
tập mờ, phụ thuộc hàm mờ trong cơ sở dữ liệu quan hệ và một số mở rộng của 
hệ tiên đề Amstrong trong ngữ cảnh mờ. 
Chương 3: Khố mờ trong Cơ sở dữ liệu quan hệ 
Chương 3 trình bày các khái niệm cơ bản về khố, khóa mờ, định nghĩa 
về khố mờ (fuzzy key), thuật tốn tìm khóa mờ trong CSDL quan hệ; trình bày 
khái niệm về bao đóng của tập thuộc tính đối với lớp phụ thuộc hàm mờ, thuật 
tốn tìm bao đóng; nêu và chứng minh định lý tương đương đối với hai kiểu suy 
dẫn trong lớp phụ thuộc hàm mờ . Bên cạnh đó chương này cũng trình bày một 
cách cơ bản về các dạng chuẩn mờ F1NF, F2NF, F3NF và FBCNF. 
Trong q trình thực hiện luận văn, mặc dù đã có nhiều cố gắng nhưng do 
thời  gian và  kinh  nghiệm  nghiên cứu cịn  hạn chế  nên  những  vấn đề trình bày 
trong luận văn, những kết quả đạt được vẫn cịn những điều cần phải khắc phục 
và bổ sung thêm. Tác giả rất mong nhận được những lời góp ý của các thầy cũng 
như các anh, các chị quan tâm đến chủ đề này.

LUAN VAN CHAT LUONG download : add


12 

CHƯƠNG 1. TỔNG QUAN 
1.1 Cơ sở dữ liệu 
1.1.1 Các khái niệm chung 
Dữ liệu:Dữ liệu là các sự kiện, văn bản, đồ họa, hình ảnh và đoạn phim video có 
ý nghĩa trong mơi trường người dùng. 
Thơng tin:Thơng tin  (information)  là dữ  liệu được  xử  lý để tăng  hiểu biết của 
người dùng về dữ liệu này 
Hệ thống thơng tin: Hệ thống thơng tin bao gồm bộ phận xử lý thơng tin, các 
thơng tin vào ra (I/O information);  bộ phận xử lý thơng tin được đặt trong mơi 

trường của hệ thống [2]. 

Hình 1: Hệ thống thơng tin 
1.1.2 Định nghĩa 
Cơ sở dữ liệu (CSDL) là một hệ thống thơng tin có cấu trúc được lưu trữ 
trên các thiết bị lưu trữ thơng tin thư cấp (như băng từ, đĩa từ…) để có thể thoả 
mãn u cầu khai thác thơng tin đồng thời của  nhiều người sử dụng hay nhiều 
chương trình ứng dụng với nhiều mục đích khác nhau.

LUAN VAN CHAT LUONG download : add


13 

Hình 2: Hệ thống Cơ sở dữ liệu 
Việc tổ chức dữ liệu tốt sẽ cho ta một hệ thống CSDL tốt, giúp cho người 
quản trị hệ thống dễ dàng trong việc làm chủ hệ thống này. Một số hệ quản trị 
CSDL phổ biến hiện nay như là: Oracle, SQL Server, DB2, My SQL, … 
1.2 Phụ thuộc hàm 
Khi xét đến mối quan hệ giữa dữ liệu trong CSDL quan hệ [2] một trong 
những yếu tố quan trọng nhất được xét đến là sự phụ thuộc giữa các thuộc tính 
này với thuộc tính khác. Từ  đó có thể xây dựng những ràng buộc cũng như loại 
bỏ đi những dư thừa dữ liệu trong một CSDL. 
Phụ thuộc hàm [3] là những mối quan hệ giữa các thuộc tính trong CSDL 
quan hệ. Khái niệm về phụ thuộc hàm có một vai trị rất quan trọng trong việc 
thiết kế mơ hình dữ liệu. Một trạng thái phụ thuộc hàm chỉ ra rằng  giá trị của 
một  thuộc  tính  được  quyết  định  một  cách  duy  nhất  bởi  giá  trị  của  thuộc  tính 
khác. Ở đây sẽ trình bày khái niệm một cách hình thức. 
1.2.1 Định nghĩa 
Định nghĩa : Cho tập thuộc tính U = {A 1 ... A n  }, R  là một quan hệ trên U. Gọi 

X,Y là hai tập con của U. Khi đó: X→Y (đọc là X xác định hàm Y hay Y phụ 
thuộc  hàm  vào X  ) sao cho  với  hai bộ bất kỳ t1,t2  Ỵ R mà   t1[X] =  t2[X]  thì 
t1[Y] = t2[Y]

LUAN VAN CHAT LUONG download : add


14 

Phụ thuộc hàm ký hiệu là FD. 
Ví dụ: Cho  quan hệ R = HS : 
HS 

STT 

Ten 

Namsinh 

Diachi 

DT 

Email 



Trung 

1983 


Việt Trì  0989313797 



Kiên 

1987 

Phú Thọ 

045596045 

kientt 



Nam 

1984 

Hà Nội 

045769823 

namlt 

Trungtt 

Bảng 1: Bảng quan hệ Học sinh 

Theo bảng trên ta thấy mỗi một trong số các thuộc tính  Namsinh, Diachi, 
DT, Email đều phụ thuộc hàm (PTH) vào thuộc tính Ten. Mỗi giá  trị của Ten 
đều tồn tại đúng một giá trị tương ứng đối với từng thuộc tính cịn lại. Khi đó có 
thể viết: Ten → Nam sinh, Ten → Diachi, … 
1.2.2 Tính chất của Phụ thuộc hàm (Hệ tiên đề Amstrong) 
Lớp phụ thuộc dữ liệu đóng vai trị rất quan trọng trong q trình thiết kế 
cơ sở dữ liệu thì và một trong những lớp phụ thuộc dữ liệu đầu tiên là lớp phụ 
thuộc  hàm.  Khi  nghiên  cứu  về  lớp  phụ  thuộc  hàm  trong  CSDL  quan  hệ 
Amstrong đã đưa ra một số tính chất như sau: 
1.2.2.1 Hệ tiên đề 
Gọi  R  là  quan  hệ  trên    tập  thuộc  tính  U.  Khi  đó  với  các  thuộc  tính 
X , Y , Z , W Í U ta có hệ tiên đề Amstrong [3] như sau : 
A1) Phản xạ : Nếu  Y Í  X thì  X ® Y
A2) Tăng trưởng: Nếu  W Í U và  X ® Y thì  XW ® YW 
A3) Bắc cầu : Nếu  X ® Y , Y ® Z thì  X ® Z
Chứng minh: 
A1) Giả sử  t1 , t2  Ỵ R và  t 1[X]=t 2 [X]  cần chứng minh  t 1[Y]=t 2 [Y] 
Thật vậy do  Y Í  X suy ra  t 1[Y]=t 2 [Y]  (đúng ) 

□ 

A2) Giả sử  t1 , t2  Ỵ R và  t 1[XW]=t 2 [XW] cần chứng minh  t 1[YW]=t 2 [YW] . 
Phản  chứng:  Giả  sử  t1[YW] ¹ t 2 [YW] .  Do  t 1[W]=t 2 [W]  nên  để  có 
t1[YW] ¹ t 2 [YW]  thì  t1[Y] ¹ t 2 [Y] .  Nhưng  theo  giả  thiết  ta  có  X→Y  nghĩa  là 
t 1[X]=t 2 [X]  thì  t1[Y]=t 2 [Y] Þ mâu thuẫn.Vậy  t 1[YW]=t 2 [YW] 


LUAN VAN CHAT LUONG download : add



15

A3)Theogithittacú X đ Y ,Y đZ lhaiPTHtrờnquanhR
Gis t1 ,t2 ẻR và  t 1[X]=t 2 [X]  cần chứng minh  t 1[Z]=t 2 [Z] 
Phản  chứng  :  Giả  sử  t1[Z] ạt 2[Z]. T X đY suy ra t1[X]=t 2[X] thì 
t 1[Y]=t 2 [Y] . Mặt khác ta lại có PTH  Y ® Z nghĩa là  t 1[Y]=t 2 [Y]  thì  t 1[Z]=t 2 [Z] 
nhưng  theo  giả  thiết  phản  chứng  ta  có  t1[Z]  ¹  t 2 [Z] (mâu  thuẫn).  Vậy 
t 1[Z]=t 2 [Z] 
□ 
Ví dụ :  BC ® A, A ® C
Cần chứng minh  AB ®  ABC
Thật vậy từ: 
1.  A ® C

(g/t) 

2.  AB ®  BC

(luật tăng trưởng của (1) thêm thuộc tính C ) 

3.  BC ®  A

(g/t) 

4.  BC ®  ABC (luật tăng trưởng của (3) thêm BC ) 
5.  AB ®  ABC (bắc cầu từ (2) và (4)) 

□ 

1.2.2.2 Hệ quả 

Từ các tính chất trên chúng ta có các hệ quả sau đây: 
1) Luật hợp :  Nếu  X ® Y và  X ® Z thì  X ® YZ
2) Luật tựa bắc cầu : Nếu  X ® Y và  WY ® Z thì  XW ® Z 
3) Luật tách :  Nếu  X ® Y và  Z Í Y thì  X ® Z
Chứng minh: 
1)  Từ  X ® Y dùng  luật  tăng  trưởng  thêm  X  có  X ®  XY (1).  Từ  X ® Z
dùng luật tăng trưởng thêm Y có  XY ® YZ (2) 
Vậy từ (1) và (2) áp dụng luật bắc cầu suy ra  X ® YZ

□ 

2) Từ  X ® Y dùng luật tăng trưởng, thêm W có  XW ® WY (3). Mặt khác 
theo giả thiết ta có  WY ® Z (4) 
Vậy từ (3) và (4) áp dụng luật bắc cầu ta có  XW ® Z 

□ 

3) Do  Z Í Y suy ra  Y ® Z (theo  luật phản  xạ).  Áp dụng  luật bắc cầu cho 
□ 
X ® Y và  Y ® Z suy ra  X ® Z
1.2.3 Bao đóng tập thuộc tính 
Trong một quan hệ R có thể tồn tại nhiều các phụ thuộc  hàm khác nhau 
giữa các thuộc tính (có thể nhiều thuộc tính phụ thuộc vào một thuộc tính hoặc 
cũng có thể  một thuộc tính phụ thuộc và  nhiều thuộc tính khác nhau). Để tổng

LUAN VAN CHAT LUONG download : add


16 


qt hố các phụ thuộc hàm này người ta đưa ra khái niệm Bao đóng tập thuộc 
tính [3]. 
Gọi  F  là  tập  tất  cả  các  phụ thuộc  hàm  đối  với quan  hệ  R  trên  tập  thuộc 
tính U và X ® Y là một phụ thuộc hàm ( X, Y Í U). Ta nói rằng X ® Y được suy 
diễn ra  từ  F  nếu quan  hệ  r  trên  R(U)  đều  thoả  mãn phụ thuộc  hàm  F  thì cũng 
thoả mãn X ® Y. Chẳng hạn như F = { A ® C, C ® D} thì A ® D  được suy ra từ 
F. Gọi F +  là bao đóng (transitive closure) của F tức là tập tất cả các phụ thuộc 
hàm được suy diễn logic từ  F. Nếu F=F +  thì F là họ đầy đủ của các phụ thuộc 
hàm. 
1.2.3.1 Định nghĩa 
Cho tập thuộc tính U, X Ì U và F là tập các phụ thuộc hàm nào đó trên U. 
Khi đó ta định nghĩa Bao đóng của tập thuộc tính Xtheoph thuchmFc
kýhiulX+F cxỏcnhnhsau:
X+F ={A|A è U,X đ A ẻ F+ } 
Ta viết gắn gọn X + F là X + . 
Nhận  xét:  Khái  niệm  Bao  đóng  tập  thuộc  tính  có  ý nghĩa  hết  sức  quan  trọng 
trong  việc  nghiên  cứu  về  lớp  phụ  thuộc  dữ  liệu.  Có  thể  nói  đây  là  một  trong 
những khái niệm quan trọng nhất vì tất cả các kết quả quan trọng nhất trong lớp 
phụ thuộc hàm đều liên quan đến khái niệm này. 
1.2.3.2 Tính chất của Bao đóng 
Dựa vào các tính chất của phụ thuộc hàm ta có các tính chất của Bao đóng 
tập thuộc tính như sau: 
1)  Tính phản xạ: X Í X + 
2)  Tính đơn điệu: Nếu X Í Y thì X + Í Y + . 
3)  X ®  X +
4)  Tính luỹ đẳng: X ++ = X + . 
5)  X + Y + Í (XY) + . 
6)  (X + Y) +  = (XY + ) = (XY) + . 
7)  X ® Y Û Y Í X + . 
8)  X ® Y và Y ® X Û X + =Y + . 

Chứng minh: 
1)  Lấy bất kỳ A Ỵ X, ta cần chứng minh A Ỵ X + . 
Ta có A Ỵ X {A} X.Vy theoLutphnxsuyraX đ A ị A Î X + . 
2)  Lấy A Î X + , ta cần chứng minh A Î Y + . 
Ta có A Î X+ ị X đ A(1)
MX Y ị Y đ X(2)(theoLutphnx)
Vy t(1)v(2)vLutbccutacúY đ A ị A ẻ Y+
3) GisX+=A1A2 Ak
DoA1 Ỵ X +  ta có  X ® A 1

□ 

□ 

LUAN VAN CHAT LUONG download : add


17

Tngt:

X đ A2

X đ Ak
TheoLuthptacúX đ A1A2 Ak ị Xđ X +
4)  Ta có X + Í X ++  ( tính chất 1). Ta cần chứng minh  X ++ Í X + 
Lấy A Ỵ X++,tacn chngminhA ẻ X+.
DoA ẻ X++ ị X+ đ A(1)
Mtkhỏctheotớnh cht3tacú:Xđ X + (2)
T(1)v(2)tacúX đ A(tớnhchtbccu) ị A ẻ X+


5) Ta có X Í XY 
Theo tính chất 2 ( tính đơn điệu ) ta có : X + Í (XY) +  (1) 
Tương tự ta cũng có: Y + Í (XY) +  (2) 
Từ (1) và (2) suy ra X + Y + Í (XY) + . 
□ 
6)  Theo những phần trên ta có: 
X Í X + Y (1) 
X + Í (XY) +  (2) 
Y Í (XY) +  (3) 
Từ (1), (2) và (3) ta có X + Y Í (XY) + Þ (X + Y) + Í (XY) ++  = (XY) +  ( theo tính luỹ 
đẳng ) 
Vậy ta có Þ (X + Y) + Í  (XY) +  (4) 
Mặt khác ta cũng có :  X Í X + 
( tính chất 1)

Þ XY Í  X  Y
+
+  + 
Þ (XY)  Í  (X  Y)  (5)       ( tính đơn điệu) 
Từ (4) và (5) suy ra (X + Y) +  = (XY) + 
□ 

7)  Để chứng minh X ® Y Û Y Í X  ta có: 
a)  Giả sử có X ® Y ta cần chứng minh Y Í X + 
Lấy bất kỳ A ẻ Y,tacn chngminhA ẻ X+
Tacú:A ẻ Y ị Y đ A(1)
Theogithittali cú:X đ Y(2)
T(1)v(2)vlutbccu tacúX đ A ị A ẻ X + 
b)  Giả sử có Y Í X +  ta cần chứng minh X ® Y 

Do Y Í X + Þ X + ® Y ( luật phản xạ ) 
Mặt khác: X ®  X + ( theo tính chất 3) 
Suy ra: X ® Y  ( luật bắc cầu) 
8)  Để chứng minh X ® Y và Y ® X Û X + =Y + ta có: 
a)  Giả sử có X ® Y và Y ® Xtacn chngminhX+=Y+
DoX đ Y ị Y ẻ X+
+
++
ị Y ẻ X
+
+
ị Y ẻ X (theotớnh chtlu ng)(1)
DoY đ X ị X ẻ Y+
+
++
ị X ẻ Y

LUAN VAN CHAT LUONG download : add


18
+

+

ị X ẻ Y (theotớnh chtlu ng)(2)

T(1)v(2)tacúX+=Y+

+

+
b) GiscúX =Y tacn chứng minh X ® Y và Y ® X 
Do X + =Y +  nên ta có 
Y + Í X +  (1’) 
X + Í Y +  (2’) 
Theo tính chất 1 ta có Y Í Y +  mà Y + Í X + Þ Y X+ ị X đ Y(theotớnhcht7)
Nhnxột: Trongcỏctớnhchttrờnthỡtớnhcht7lquantrngnht.Thctta
cnbitvimtphthuchmX đ Ythỡhirngphthuchmúcúc
suydnlogicttpph thuchmFhaykhụng?
Khi đó đặt ra 2 vấn đề: 
­  Nếu biết Y Í X +  thì X ® Y Ỵ F + 
­  Nếu Y Ë X +  thì X ® Y Ï F + 
Khi đó nếu ta xây dựng được một thuật tốn tìm X +  một cách dễ dàng như vậy 
thì ta cũng có thể trả lời câu hỏi X ® Y một cách dễ dàng. 
1.2.4 Định lý tương đương 
Định  nghĩa:  Cho  tập  phụ  thuộc  hàm  F  trên  tập  thuộc  tính  U  và  f  là  một  phụ 
thuộc  hàm  trên  U.  Ta  nói  PTH  f  được  suy  dẫn  theo  quan  hệ  từ  tập  phụ  thuộc 
hàm F và viết F = f nếu mọi quan hệ R(U) thoả F thì R cũng thoả f. 
Định  nghĩa:  Cho  tập  phụ  thuộc  hàm  F  trên  tập  thuộc  tính  U  và  f  là  một  phụ 
thuộc hàm trên U. Ta nói phụ thuộc hàm f được suy dẫn theo tiên đề ( hoặc suy 
dẫn logic) từ tập PTH  F và  viết  F├  f nếu fỴ F + . Nói cách khác  f được suy dẫn 
theo các tiên đề từ tập PTH F nếu như áp dụng các luật A1, A2, A3 đối các PTH 
trong F thì sau hữu hạn lần ta sẽ thu được f. 
Định lý: Với mọi tập FPT F và PTH f trên tập thuộc tính U ta có F├ f  khi và 
chỉ khi F = f . Hay, suy dẫn theo tiên đề và suy dần theo quan hệ là một. 
Ký hiệu: F├ f Û F = f . 
Chứng minh: 
a)  Giả sử ta có F├ f  ta cần chứng F = f. 
Giả sử sau k bước ứng dụng các luật của hệ tiên đề ta nhận được các phụ thuộc 
hàm: 

f 1 , F 1  = F È {f 1 } 
f 2  , F 2  = F 1 È {f 2  } 
……………….. 
f k  , F k  = F k -1  È {f k  } 
Vậy ta có R(F) Þ  R(F 1 ) Þ  R(F 2  ) Þ  … Þ R(F k  ) Þ  R(f) hay F = f 



LUAN VAN CHAT LUONG download : add


19 

b)  Giả sử ta có F = f ta cần chứng minh F├ f . 
Để chứng minh F = f Þ F├ f  ta sẽ chứng minh F├ f  thì F = f 
Thật vậy, đặt f = X ® Y. Khi đó có F, X ta sẽ tính được X + 
Xây dựng quan hệ R như sau: 


A 1 

A 2 

… 

A k 

A k + 1  … 

A n 




a 1 

a 2 

… 

a k 

a k + 1 

… 

a n 



a 1 

a 2 

… 

a k 

b k + 1 

… 


b n 

Giả sử X + = A 1 A 2  …A k 
Như vậy quan hệ R chỉ gồm 2 bộ u và v. Hai bộ này giống nhau trên tập X +  và 
với mọi thuộc tính B ¹ X +  thì u.B ¹ v.B tức là a j ¹ b  j  ( j = k+1,..n). 
Ta sẽ chứng minh f vừa dẫn xuất được theo quan hệ R và f vừa khơng dẫn xuất 
được theo quan hệ R. 
Hay là ta chứng minh R(f) và ┐R(f) 
1)  Ta chứng minh R thoả mãn mọi phụ thuộc hàm trong F +  hay R(f). 
Giả sử có PTH Z ® W ẻ F+ vu.Z=v.Z.Tacnchngminhu.W=v.W.
Tacú:u.Z=v.Z ị Z X+ ị X+ ® Z ( theo tính phản xạ ) 
Mà ta lại có X ® X +  (theo tính chất 3) 
Áp dụng tính chất bắc cầu cho các phụ thuộc hàm X ® X + , X + ® Z và Z ® W ta 
có X ® W 
Suy ra W Í X +  ( theo tính chất 7) 
Vậy u.W = v.W 

□ 

2)  Ta chứng minh R khơng thoả mãn PTH X ® Y hay ta cần chứng minh có 
u.X = v.X  nhưng u.Y ¹ v.Y . 
Từ là X ® Y Ï F Û  Y ậ X+ (theotớnhcht7)
Suyra:u.Y ạ v.Y(1)
Mtkhỏctheotớnh cht1tacúX X+ ị u.X=v.X(2)
T(1)v(2)suyraRkhụngthomón PTH X ® Y hay ┐R(f) 

□ 

1.3 Khố 

Trong một quan hệ có những thuộc tính đóng vai trị “chủ chốt”  và từ các 
thuộc tính này có thể suy ra được các thuộc tính khác thơng qua các phụ thuộc 
dữ liệu. Khái niệm về khố cũng là một trong những khái niệm quan trọng nhất 
trong việc nghiên cứu và xây dựng CSDL.

LUAN VAN CHAT LUONG download : add


20 

Nói đến khố (key) [3] trong quan hệ R là nói đến một tập nhỏ  nhất các 
thuộc  tính  nhằm  phân  biệt  các  đối  tượng.  Việc  xác  định  khố  cũng  xác  định 
được tính tồn vẹn dữ  liệu  trong CSDL quan  hệ. Do đó  việc tìm khố trong  1 
lược đồ mang ý nghĩa hết sức quan trọng. 
Định nghĩa:  Cho lược đồ quan hệ a  = (U,F), trong đó F là tập các phụ thuộc 
hàm trên quan hệ R 
Tập K Í U. Khi đó K được gọi là một siêu khố nếu K + =U 
R được gọi là quan hệ của a  nếu như ta có R(F). 
Nhận xét: 
­  Nếu K là siệu khố của lược đồ a  thì hai bộ t1, t2 bất kỳ khơng thể giống 
nhau trên K. 
­  Trong lược đồ quan hệ a có thể có một hoặc nhiều siêu khố 
­  Hợp của một siêu khố là một siêu khố 
­  Giao của các hố nói chung khơng là một siêu khố. 
Định nghĩa:  Cho lược đồ quan hệ a  = (U,F), trong đó F là tập các phụ thuộc 
hàm trên quan hệ R 
Tập K Í U 
Khi đó K được gọi là khố của lược đồ nếu K thoả mãn hai điều kiện sau: 
1.  K là 1 siêu khố 
2. " K 1 Í K thì K 1  khơng là siêu khố. 

Tức là:



K + =U 
"K1 Í K : K1 + ¹ U

Nhận xét: 
­  Trong lược đồ quan hệ a  có thể có một hoặc nhiều khố 
­  Hợp của các khố khác nhau khơng phải là một khố.

LUAN VAN CHAT LUONG download : add


21 

CHƯƠNG 2. LỚP PHỤ THUỘC HÀM MỜ TRONG 
CƠ SỞ DỮ LIỆU QUAN HỆ 
2.1 Dữ liệu mờ 
Cơ sở dữ liệu [2] là biểu hiện của thế giới thực, hầu hết các giá trị của nó 
là rõ ràng nhưng đơi khi cũng khơng xác định, khơng rõ ràng hay cịn gọi là mờ 
(fuzzy). Việc thiết kế Cơ sở dữ liệu với các giá trị ra sao là do nhà thiết kế lựa 
chọn và tuỳ vào mục đích sử dụng nhưng hầu hết các Cơ sở dữ liệu hiện nay đều 
rõ. Tuy nhiên để nắm bắt những giá trị chưa rõ ràng của thế giới thực đặc biệt là 
với những ứng dụng trong các ngành sinh học và gen, hệ thống thơng tin địa lý, 
hệ thống dự báo kinh tế và thời tiết,… người ta nghĩ đến việc mờ hố dữ liệu và 
xây dựng mơ hình Cơ sở dữ liệu mờ.Việc xây dựng cũng như phát triển các mơ 
hình cơ sở dữ liệu mờ cũng như lớp phụ thuộc hàm mờ (FFDs) có thể theo nhiều 
hướng khác nhau nhưng đều dựa trên các khái niệm cơ bản sau: 
2.1.1 Tập rõ 

Khái  niệm tập  rõ  là  khái  niệm được  sử  dụng  trong  CSDL  truyền thống. 
Khi đó các thuộc tính được xét đến coi như thoả mãn các u cầu một cách tuyệt 
đối. Ta có thể định nghĩa về tập rõ như sau: 
Cho U là tập các đối tượng, A là tập con của U. A được gọi là tập rõ (crisp 
set) [4] nếu A được định  nghĩa bởi hàm đặc trưng của nó sao cho: 


nếu x thuộc A

l (x) = 

0         nếu x khơng thuộc A 
2.1.2 Tập mờ 
Cho U là tập các đối tượng x Ỵ  U. A là tập con của  U, A được gọi là tập 
mờ (fuzzy set ) [4] nếu  các phần tử  x chỉ thuộc A với ngưỡng nào đó được xác 
định bởi ánh xạ m  A  : U → [ 0,1]  ( 0 £ m A £ 1 ), m  A  (x) là mức thoả của phần tử x 
thuộc A, nếu m  A  (x) = 0 thì  x Ï A cịn nếu m  A  (x) = 1 thì x hồn tồn thuộc vào 
A. Tập rõ là một trường hợp đặc biệt của tập mờ khi m  A  (x) = 1. 
Ký hiệu:  A =  {x, m A (x) x Ỵ U}  với x Ỵ  U và m  A  (x) là mức thỏa của x trong 
tập mờ A.

LUAN VAN CHAT LUONG download : add


22 

Hình 3: Tập mờ và tập rõ 
Như vậy ta có: 

m ( x ) ³ 0 "x Ỵ U


su p[ m A (x)]= 1
x ẻu

Vớd:ChocỏcphntA,B,CthucvotpXvicỏcmc0.4,0.7,0.8.
KhiútpmXscbiudinnhsau:
X={(A,0.4),(B,0.7),(C,0.8)}
2.1.3Cỏcphộptoỏncbntrờntpm
Trongtpmcúmtsphộptoỏncbnsau:
Đ Phộplyphnbự
C=~A(u)=1A(u)
Đ Phộphp
C=(A ẩ B)(u)=max [A(u),B(u)]
Đ Phộpgiao
C=(A Ç  B)(u)   = min [ A(u), B(u) ] 
Ví dụ: Cho 2 tập mờ : 
X = { (A,0.9), (B,0.8), (D,0.6)} 
Y = { (A,0.7), (B,0.65), (G,0.6)} 
Khi đó ta có: 
Phép lấy phần bù: Z= ~ X(u) = 1–X(u) = {(A,0.1),(B,0.2),(D,0.4)}.

LUAN VAN CHAT LUONG download : add


23 

Phép  giao:  Z  =  (X Ç Y)(u)  =  min  [  A(u),  B(u)  ]  =  {(A,0.7), 
(B,0.65), (D,0.6),(G,0.6)}. 
Phép  hợp:  Z=(X È Y)(u)  =  max  [  A(u),  B(u)  ]  =  {(A,0.9),  (B,0.8), 
(D,0.6),(G,0.6)}. 

2.2 Phụ thuộc hàm mờ 
Trong quá  trình  xác  định  những  ràng  buộc dữ  liệu, đặc biệt  là  việc  xác 
định  lớp  các  thụ  thuộc  hàm  đã  cho  thấy  vẫn  còn  những  vấn  đề  cần  được  giải 
quyết. như là trong cơ sở dữ liệu lớn, các dữ liệu nhiễu thì những xung đột dữ 
liệu và lỗi đều có thể xảy ra, cụ thể như sự thiếu chính xác trong việc nhập, thay 
đổi cũng như cập nhật dữ liệu. Nói chung khó có thể tìm được phụ thuộc hàm 
nếu ràng buộc giữa các thuộc tính chưa rõ ràng, chưa xác định hoặc mờ. Vì vậy 
việc mở rộng phụ thuộc hàm mờ (fuzzy functional dependency) [12] sẽ giúp cho 
việc thiết kế mơ hình dữ liệu để xử lý được những vấn đề về phụ thuộc dữ liệu 
với độ tin cậy a  (0< a <1) . Chúng ta sẽ xét đến phụ thuộc hàm (X → Y) a  nghĩa 
là Y phụ thuộc hàm vào X  với mức a  nào đó. 
2.2.1 Định nghĩa 
Định nghĩa: Cho một tập U ={ A 1 , A 2  , …, A n  } với mỗi phần tử A i Ỵ U là một 
thuộc tính, ứng với mỗi thuộc tính A i  ;  i =1,2,…,n sẽ có miền giá trị là D i  .Ký 
hiệu Dom(A i  ) = D i  . Ta chỉ xét  Di  ³  2.Khiú:
ViRlmtquanhtrờnUXYlphthuchmtrờnquanhR
Cpbbtk ti ,tj ẻ RcgilthomónphthuchmXYnu
ti (X)=tj(X)thỡti (Y)=tj(Y).
t:
0nuti (X)=tj(X)nhngti (Y) ạ t j (Y) 
T (  t  ,  t  ) (X→Y)       =




1   nếu ngược lại 
Nếu  T (  t  ,  t  )  (XY)=1tanúirng2cpbti ,tj thamónphthuc
i

j


hmX đ Y.
QuanhRcgilthomónphthuchmX đ Yvihaibbtk
ti ,tj ẻ RnuT( t  ,  t  )  (X→ Y) = 1. 




Nhận xét:  Nếu quan hệ R được gọi là thoả mãn phụ thuộc hàm X ® Y thì 
T R  (X→ Y) = 1 

LUAN VAN CHAT LUONG download : add


×