đồ án tốt nghiệp cơ sở dữ liệu quan hệ mờ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (489.28 KB, 71 trang )

Website: Email : Tel (: 0918.775.368
Giới Thiệu
Trong những năm gần đây, các ứng dụng máy tính cho quản lý ngày càng
nhiều. Cách mạng về máy vi tính đã tạo điều kiện để máy tính hỗ trợ tích cực các
nhà quản lý, họ có thể truy cập đến hàng ngàn cơ sở dữ liệu ở nhiều vị trí khác
nhau để thu thập các thông tin cần thiết. Hầu hết các tổ chức, các công ty đều dùng
phân tích có tính toán trong quyết định của mình. Hệ trợ giúp quyết định ngày càng
đóng một vai trò quan trọng trong quá trình ra quyết định của các nhà quản lý. Hiện
nay mô hình dữ liệu được sử dụng trong các hệ trợ giúp quyết định phổ biến vẫn là
mô hình cơ sở dữ liệu quan hệ (CSDLQH) truyền thống.
Trong mô hình CSDLQH truyền thống các dữ liệu được lưu trữ đều là dữ
liệu rõ. Các phép toán trên CSDL đều được xây dựng dựa trên cơ sở các phép so
sánh đơn giản như =, >, ≥, ≤, <, ≠. Trong đó các phép so sánh dùng để so sánh giữa
hai biến là hai thuộc tính hoặc giữa một biến là một thuộc tính và một hằng, kết quả
cho giá trị “TRUE” hoặc “FALSE” tùy theo mối quan hệ của chúng. Như vậy miền
giá trị của biến được so sánh là miền các giá trị rõ và việc so sánh là so sánh chính
xác. Tuy nhiên thông tin về thế giới thực cần lưu trữ hay xử lý thường có thể là
thông tin không đầy đủ, chúng có thể có nhiều dạng chẳng hạn như: không biết một
số thông tin về một đối tượng, thông tin lưu trữ có thể không chính xác, thông tin
lưu trữ có thể không chắc chắn hay mờ. Do đó, các nhà quản lý thường phải đối
mặt với vấn đề thiếu thông tin trong quá trình ra quyết định, họ phải dùng đến
những thông tin không hoàn toàn đầy đủ để rút ra các tri thức tổng hợp, hỗ trợ cho
việc ra quyết định.
Việc cần thiết phải có một mô hình cơ sở dữ liệu thích hợp để cho phép lưu
trữ và xử lý cả những thông tin đầy đủ và không đầy đủ đã được nhiều nhà khoa
học quan tâm nghiên cứu. Hiện tại đã có nhiều cách tiếp cận mở rộng đưa dữ liệu
mờ vào lý thuyết quan hệ với mong muốn tìm được những mô hình chấp nhận
1
Website: Email : Tel (: 0918.775.368
thông tin không đầy đủ, cho phép biểu diễn và khai thác thông tin một cách tốt hơn,
tiện lợi hơn trong những lớp bài toán thực tế nào đó.

Với mục đích tìm hiểu các mô hình đã được sử dụng để mở rộng CSDLQH,
đồ án này sẽ đề cập đến một số cách tiếp cận mờ để mở rộng CSDLQH trong
Chương I, trong đó nhấn mạnh vào mô hình CSDLQH dựa trên tính tương tự của
hai tác giả P.Buckles và E.Petry. Chương II sẽ trình bày mô hình CSDLQH dựa
trên tính tương tự của TS.Hồ Cẩm Hà. Dựa trên các tài liệu tham khảo và các kiến
thức đã được học trong môn cơ sở dữ liệu I, trong Chương III tác giả đồ án sẽ mở
rộng lý thuyết thiết kế CSDLQH truyền thống để chuẩn hoá lược đồ CSDLQH dựa
trên tính tương tự. Cuối cùng, Chương IV sẽ trình bày việc cài đặt một mô đun cho
phép thực hiện các thao tác xử lý dữ liệu theo mô hình được đề cập trong Chương
II.
Chương I. Khái quát về CSDLQH với thông tin không đầy đủ
Mô hình quan hệ mặc dù không phải là mô hình quản trị cơ sở dữ liệu
(CSDL) xuất hiện đầu tiên và cũng không phải là mô hình quản trị CSDL tiên tiến
nhất nhưng lại đóng vai trò quan trọng và được sử dụng phổ biến nhất hiện nay.
Chính vì vậy, việc áp dụng lý thuyết mờ vào mô hình CSDLQH là một trong những
xu hướng đã được rất nhiều nhà nghiên cứu quan tâm. Chương này gồm hai phần
chính, phần thứ nhất sẽ trình bày tóm tắt một số hướng tiếp cận CSDLQH mờ, phần
thứ hai sẽ trình bày tương đối chi tiết cách tiếp cận dựa trên cơ sở tính tương tự của
hai tác giả P.Buckles và E.Petry.
1. Một số cách tiếp cận CSDLQH mờ
Tiếp cận dựa trên cơ sở quan hệ mờ (The fuzzy relation – based approach)
2
Website: Email : Tel (: 0918.775.368
Tiếp cận này do Bladwin và Zhou đưa ra đầu tiên vào năm 1984, Zvieli đưa
ra năm 1986.
Theo đó quan hệ mờ R⊆D
1
×D
2
× ×D

n
được đặc trưng bởi hàm thuộc:
µ
R
: D
1
×D
2
× ×D
n
→[0,1].
Như vậy, mỗi bộ của R có dạng t=(u
1
,u
2
, ,u
n
,µ
R
(u
1
,u
2
, ,u
n
)), trong đó u
i
∈D
i
với i=1,2, ,n, µ

R
(u
1
,u
2
, ,u
n
) chỉ mức độ thuộc quan hệ R của t.
Với cách tiếp cận này, khái niệm một bộ thuộc về một quan hệ là một khái
niệm mờ trong khi các giá trị cụ thể của các thuộc tính lại là giá trị không mờ hoặc
cũng có thể là các biến ngôn ngữ nhưng được xử lý như một đơn giá trị.
Tiếp cận trên cơ sở tính khả năng (The possibility – based approach)
Tiếp cận này do Prade và Testemale đưa ra đầu tiên vào năm 1983,
Zemankova đưa ra năm 1984. Theo đó các giá trị thuộc tính bị mờ hoá bằng việc
cho phép các phân phối khả năng xuất hiện như một giá trị thuộc tính. Nghĩa là:
Một quan hệ R là một tập con của Π(D
1
)×Π(D
2
)× ×Π(D
n
), với Π(D
i
)={π|π
là một phân phối khả năng của A
i
trên D
i
}.
Một n bộ t∈R có dạng (π

1
, π
2
,…, π
n
), π
Ai
∈Π(D
i
). Ngoài ra còn có thêm phần
tử đặc biệt e để chỉ những giá trị không thể áp dụng. Như vậy π
Ai
được

định nghĩa
là một hàm xác định từ (D
i
∪e) lên [0,1].
Theo mô hình này các giá trị thuộc tính được làm mờ hóa bằng việc cho
phép các phân phối khả năng xuất hiện như một giá trị thuộc tính.
Vào năm 1989 và 1991, Rundensteiner, Hawkes, Bandler và Chen đã mở
rộng mô hình này bằng cách thêm vào một quan hệ c
i
xác định trên mỗi miền D
i
thể
hiện mối quan hệ “gần nhau” giữa các phần tử của miền, c
i
: D
i

×D
i
→[0,1] là một
quan hệ mờ hai ngôi trên D
i
thỏa các tính chất:
Phản xạ: c
i
(x,x)=1.
Đối xứng : c
i
(x,y)=c
i
(y,x).
3
Website: Email : Tel (: 0918.775.368
Tiếp cận dựa trên xấp xỉ ngữ nghĩa (The semantic proximity approach)
Cách tiếp cận này do Wei-Yi-Lin đưa ra để đo mức độ xấp xỉ về mặt ngữ
nghĩa giữa hai giá trị. Hàm xấp xỉ SP có các tính chất sau:
0 ≤ SP(f
1
, f
2
) ≤ 1,
SP(f
1
, f
2
) = SP(f
2

, f
1
),
SP(f
1
, f
1
) ≥ SP(f
1
, f
2
),
Tác giả đưa ra tiêu chuẩn để xây dựng hàm đo xấp xỉ ngữ nghĩa trên số mờ
dạng khoảng:
Cho f
1
=[a
1
,b
1
], f
2
=[a
2
,b
2
], g
1
=[c
1

,d
1
], g
2
=[c
2
,d
2
],
SP(f
1
,f
2
)=1 ⇔ a
1
=b
1
=a
2
=b
2
,
SP(f
1
,f
2
)=0 ⇔ f
1
∩f
2

=∅,
Nếu a
1
=a
2
, b
1
=b
2
, c
1
=c
2
, d
1
=d
2
và |d
1
-c
1
|>|b
1
-a
1
| thì SP(f
1
,f
2
)≥SP(g

1
,g
2
).
Đối với mô hình này, khi so sánh hai bộ thì phải so sánh về mặt ngữ nghĩa.
Nói cách khác, hai bộ được gọi là bằng nhau nếu độ xấp xỉ ngữ nghĩa của chúng
vượt quá một ngưỡng nào đó.
Tiếp cận phối hợp (The combined approach)
Với cách tiếp cận này, sẽ áp dụng việc mờ hoá cả trong sự thuộc vào một
quan hệ của một bộ cũng như tính mờ trong các giá trị thuộc tính hay mối quan hệ
giữa các phần tử của miền. Theo Van Schooten và Kere (1988), giá trị thuộc tính là
các phân phối khả năng và mỗi bộ được gán cho một cặp (p, n) để biểu diễn một
cách tương ứng các khả năng có thể thuộc quan hệ và khả năng không thể thuộc
quan hệ của bộ này. Như vậy một n-bộ có dạng: (π
A1
, π
A2
, π
An
, p
t
, n
t
), π
Ai
∈
Π(D
i
).
Ở đây, giá trị tại các thuộc tính không cần phải là giá trị nguyên tố, một đơn

giá trị, nhưng phải được đánh giá “gần nhau” ở cấp độ nào đó.
4
Website: Email : Tel (: 0918.775.368
2. Mô hình CSDLQH dựa trên tính tương tự
Mô hình CSDLQH dựa trên tính tương tự do P.Buckles và E.Petry đưa ra lần
đầu tiên vào năm 1983. Đây là việc mở rộng và làm mờ hoá CSDLQH truyền thống
đã được Codd đưa ra vào cuối những năm 70.
Trong mô hình này, các miền giá trị của CSDL hoặc là vô hướng rời rạc,
hoặc là tập số rời rạc lấy từ những tập vô hạn hay hữu hạn. Giá trị miền (giá trị tại
một thuộc tính) của một bộ cũng có thể là một giá trị vô hướng (đơn) hay một dãy
gồm nhiều giá trị vô hướng. Quan hệ bằng nhau ở đây được thay thế bởi một quan
hệ tương tự được mô tả tường minh mà quan hệ bằng nhau trong mô hình
CSDLQH truyền thống chỉ là một trường hợp riêng của nó.
2.1. Những định nghĩa cơ sở
Định nghĩa 1.1. Một quan hệ tương tự S
D
(x, y), trên một miền D, là một ánh xạ mọi
cặp phần tử của miền vào khoảng đóng [0, 1] thoả ba tính chất sau với mọi x, y,
z∈D:
1.Phản xạ S
D
(x, x)=1
2.Đối xứng S
D
(x, y) =S
D
(y, x)
3.Bắc cầu S
D
(x, z)

≥
Max
y
(Min[S
D
(x, y), S
D
(y, z)])
Một giá trị thuộc tính d
ij
, trong đó i là chỉ số của bộ thứ i, được định nghĩa là
một tập con không rỗng của miền tương ứng D
j
. Dùng kí hiệu 2
Dj
để chỉ tập tất cả
các tập con không rỗng của D
j
.
Định nghĩa 1.2. Một quan hệ mờ r, là một tập con của tích Đề-các 2
D1
×…×2
Dm
.
Định nghĩa 1.3. Một bộ t của một quan hệ mờ là một phần tử của tập 2
D1
×…×2
Dm
.
Một cách tổng quát, một bộ t

i
∈r có dạng: t
i
=(d
i1
, d
i2
,…, d
im
), d
ij
⊆D
j
.
Định nghĩa 1.4. Một thể hiện ℑ={a
1
, a
2,
…, a
m
} của một bộ t
i
=(d
i1
, d
i2
…, d
im
) là bất
cứ một phép gán nào sao cho a

j
∈d
ij
∀j=1, 2,…, m.
5
Website: Email : Tel (: 0918.775.368
Không gian thể hiện là D
1
× D
2
× × D
m
và bị giới hạn bởi tập các bộ hợp lệ
trong quan hệ mờ. Các bộ hợp lệ được xác định dưới ngữ nghĩa của quan hệ này.
Trong CSDLQH truyền thống thì bộ t trùng với thể hiện của chính nó.
Định nghĩa 1.5. Ngưỡng tương tự của một miền D
j
của một quan hệ (mờ) được kí
hiệu là Thres(D
j
) và được xác định như sau:
Thres(D
j
)≤min{min[s
j
(x,y)]}
i x,y∈d
ij
trong đó i=1, 2, là chỉ số của bộ.
Có thể thấy được rằng, CSDLQH truyền thống chính là trường hợp đặc biệt

của CSDL mờ khi ngưỡng Thres(D
j
)=1 với mọi j.
Trên cơ sở các ngưỡng tương tự đã cho trên mỗi miền trị thuộc tính, tính dư
thừa dữ liệu của một quan hệ trong mô hình này được xác định và đại số quan hệ
được xây dựng.
Định nghĩa 1.6. Trong quan hệ mờ r, hai bộ t
i
=(d
i1
, d
i2
,…, d
im
) và t
k
=(d
k1
, d
k2
,…,
d
km
), i≠k được coi là thừa đối với nhau nếu ∀j=1, 2,…,m:
Thres(D
j
)≤min[s
j
(x,y)]
x,y∈d

ij
∪d
kj
trong đó: Thres(D
j
)≤min{min[s
j
(x,y)]}, i=1, 2,… là chỉ số của bộ.
i x,y∈d
ij
Như vậy, mỗi bộ có thể tương ứng với một số lớn các thể hiện. Tuy nhiên,
với quan niệm về dư thừa dữ liệu như trên, mô hình CSDLQH này vẫn tương thích
với CSDLQH truyền thống. Ở đây, không cho phép tồn tại hai bộ có chung một thể
hiện.
6
Website: Email : Tel (: 0918.775.368
2.2. Đại số quan hệ
Các phép toán quan hệ mờ cũng gồm bốn thành phần (toán tử quan hệ, thuộc
tính, tên quan hệ, điều kiện) như trong mô hình quan hệ truyền thống thêm vào đó
là một câu xác định ngưỡng tương tự áp dụng cho phép toán này.
Kết quả cuối cùng của phép toán quan hệ là một quan hệ đạt được bằng việc
trộn các bộ thừa (tức là hợp các giá trị thuộc tính tương ứng) cho đến khi không
còn bộ thừa.
Một bộ được coi là nằm trong quan hệ kết quả của phép giao hai quan hệ sẽ
là một bộ thuộc một trong hai quan hệ này và có thể được trộn với một bộ nào đó
thuộc quan hệ kia mà không vi phạm các ngưỡng tương tự đã cho trước.
Phép hợp hai quan hệ cho kết quả là một quan hệ đạt được sau khi đã loại bỏ
các bộ thừa của tập gồm tất cả các bộ thuộc quan hệ này và tất cả các bộ thuộc quan
hệ kia.
Các phép chiếu, hợp và giao cho kết quả duy nhất. Phép chiếu và phép hợp

chỉ khác CSDLQH truyền thống ở cách thức loại bỏ các bộ thừa.
2.3. Phụ thuộc hàm
Để mở rộng khái niệm phụ thuộc hàm cho CSDLQH dựa trên tính tương tự,
trước hết khái niệm về độ tương tự giữa hai bộ cần phải được xác định.
Định nghĩa 1.7. Cho một miền D
k
của một quan hệ r, độ tương tự của hai bộ t
i
và t
j
trên D
k
được định nghĩa là:
T
s
[D
k
(t
i
,t
j
)]=Min(s
k
(p,q))
p,q
∈
d
ik
∪d
jk

Ở đây d
ik
và d
jk
là giá trị của bộ t
i
và bộ t
j
trên thuộc tính thứ k của quan hệ r,
có nghĩa là d
ik
và d
jk
đều là tập con của D
k
. Trong CSDLQH truyền thống cả d
ik
và
d
jk
đều chỉ gồm một phần tử, khi đó độ tương tự của hai bộ bất kỳ chỉ có thể là một
nếu hai bộ này có giá trị trùng nhau ở mọi thuộc tính, nếu không độ tương tự của
chúng phải bằng 0. Như vậy:
7
Website: Email : Tel (: 0918.775.368
Thres(D
k
)=Min{T
s

[D
k
(t
i
,t
j
)]}
∀i,j
Một phụ thuộc hàm trong mô hình này là một mở rộng trực tiếp phụ thuộc
hàm trong CSDLQH truyền thống.
Định nghĩa 1.8. Nếu A và B là hai thuộc tính của một quan hệ r thì ta nói r thoả phụ
thuộc hàm A→B nếu với mọi bộ t
i
, t
j
: T
s
[A(t
i
,t
j
)]≤T
s
[B(t
i
,t
j
)].
Định nghĩa 1.9. Nếu X và Y là hai thuộc tính của một quan hệ r thì ta nói r thoả phụ
thuộc hàm X→Y nếu với mọi bộ t

i
, t
j
:
Min{T
s
[A(t
i
,t
j
)]}≤Min{T
s
[B(t
i
,t
j
)]}
∀A,A∈X ∀B,B∈Y
3. Nhận xét
Việc sử dụng lý thuyết mờ, một mở rộng của lý thuyết tập hợp thông thường,
để mở rộng khả năng biểu diễn thông tin mơ hồ, không chính xác trong CSDL là
một điều tự nhiên và hợp lý. Có thể thấy có hai khuynh hướng chủ yếu đã được sử
dụng để mờ hóa thông tin:
Khuynh hướng thứ nhất là sử dụng nguyên lý thay thế quan hệ đồng nhất
thông thường của các giá trị trong cùng một miền (giá trị thuộc tính) bởi các độ đo
về sự “giống nhau” giữa chúng. Tính không chính xác của những giá trị dữ liệu ẩn
trong việc sử dụng các quan hệ mờ được cho bởi những bảng tách riêng. Khuynh
hướng này cho phép coi một tập các giá trị nào đó như một thể hiện có thể (hay một
xấp xỉ về mặt ngữ nghĩa) của một đơn giá trị. Mô hình CSDLQH được mở rộng
theo khuynh hướng này có thêm khả năng làm việc (lưu trữ và xử lý) với những

thông tin không chính xác.
Khuynh hướng thứ hai là dùng phân phối khả năng như một rằng buộc mờ về
các giá trị có thể lấy cho một bộ trên một thuộc tính. Tính không chắc chắn của dữ
liệu được thể hiện tường minh nhờ các phân phối khả năng. Các mô hình CSDLQH
8
Website: Email : Tel (: 0918.775.368
được mở rộng theo khuynh hướng này cho phép biểu diễn không chỉ các thông tin
chính xác, chắc chắn mà cả những thông tin không chắc chắn, những giá trị null.
Tuy nhiên việc lưu trữ và thao tác trên những thông tin trong các mô hình
CSDLQH được mở rộng theo hai khuynh hướng này thực sự phức tạp với quá
nhiều phép tính toán.
Để có được những mô hình mở rộng của CSDLQH có khả năng mạnh mẽ
trong việc lưu trữ và xử lý cả những giá trị có thể không chính xác khi biểu diễn
thông tin lẫn những giá trị thể hiện thông tin không chắc chắn, giải pháp đưa ra là
phối hợp cả hai khuynh hướng trên. Tuy có được một mô hình cho phép nắm bắt
thông tin không đầy đủ ở tình huống tổng quát song điều này càng làm cho mô hình
trở nên phức tạp cả ở lưu trữ lẫn xử lý.
Có thể nhận thấy rằng, mô hình của hai tác giả P.Buckles và E.Petry khác
với CSDLQH truyền thống ở hai điểm quan trọng: giá trị tại mỗi thuộc tính của
một đối tượng có thể là một tập và trên mỗi một miền của thuộc tính có một quan
hệ mờ thể hiện cấp độ tương tự giữa các phần tử của miền. Trong mô hình này, tuy
giá trị của mỗi bộ tại mỗi thuộc tính có thể chứa một hay nhiều phần tử của miền
tương ứng, nhưng có một ràng buộc là các phần tử trong cùng một giá trị thuộc tính
(của cùng một đối tượng) phải đủ tương tự với nhau nghĩa là cấp độ tương tự của
một cặp bất kỳ các phần tử trong cùng giá trị thuộc tính không nhỏ hơn ngưỡng
tương tự đã xác định. Cách mở rộng mô hình CSDL của hai tác giả này thuộc
khuynh hướng thứ nhất trong hai khuynh hướng cơ bản đã nêu ở trên, nhằm mục
đích có được khả năng biểu diễn thông tin không chính xác. Mặc dù giá trị của mỗi
bộ tại mỗi thuộc tính là một tập nhưng các phần tử trong tập này đều được coi là
những thể hiện (có thể không chính xác) của một giá trị đơn.

9
Website: Email : Tel (: 0918.775.368
Chương II. Mở rộng mô hình CSDLQH dựa trên tính tương tự
Chương này sẽ dành để trình bày mô hình CSDLQH dựa trên tính tương tự
do TS. Hồ Cẩm Hà đề xuất. Nội dung của chương được chia thành năm phần. Phần
thứ nhất sẽ nêu lên các khái niệm cơ sở của mô hình, dựa trên các khái niệm đó
trong phần hai sẽ trình bày các phép toán đại số quan hệ. Phần ba sẽ nêu lên các
quy tắc cập nhật dữ liệu, phần tiếp theo sẽ đề xuất một ngôn ngữ hỏi cho mô hình
này và phần cuối cùng sẽ trình bày về các phụ thuộc dữ liệu.
1. Mở rộng mô hình CSDLQH của P.Buckles và E.Petry
Như đã nêu trong phần nhận xét của Chương I, trong mô hình CSDLQH dựa
trên tính tương tự của P.Buckles và E.Petry mặc dù giá trị của mỗi bộ tại mỗi thuộc
tính là một tập nhưng các phần tử trong tập này đều được coi là những thể hiện của
một giá trị đơn. Trong công trình nghiên cứu của mình TS. Hồ Cẩm Hà đã đưa ra
một mô hình CSDLQH kế thừa ý tưởng của hai tác giả trên, nhưng cho phép các
phần tử của mỗi bộ tại mỗi giá trị thuộc tính không bị đòi hỏi đủ tương tự theo
ngưỡng. Điều này cho phép mỗi giá trị thuộc tính chứa các phần tử biểu diễn những
khả năng rất khác xa nhau có thể xảy ra bởi những giá trị không hề tương tự.
Khi mô hình hoá một CSDLQH theo cách này sẽ không chỉ cho phép nắm
bắt những thông tin không chính xác mà cả những thông tin không chắc chắn. Sự
phân tách thành các khả năng thực chất là nhờ vào độ đo tương tự trên mỗi miền và
ngưỡng đặt ra. Bởi vậy những thông tin không chắc chắn thể hiện bằng sự tồn tại
10
Website: Email : Tel (: 0918.775.368
của những giá trị mà độ tương tự giữa chúng nhỏ hơn ngưỡng đã cho chứ không
biểu diễn bằng các phân phối khả năng.
Theo một nghĩa nào đó, nếu coi các phần tử đủ tương tự với nhau (theo
ngưỡng cho biết) thuộc về cùng một khả năng có thể xảy ra thì mô hình của
P.Buckles và E.Petry chỉ cho phép nắm giữ thông tin của những đối tượng mà với
những đối tượng này thông tin biết được về mỗi thuộc tính chỉ thuộc về một khả

năng (tương tự của một đơn giá trị). Tuy nhiên trong cuộc sống có thể gặp những
thông tin không chắc chắn về một đối tượng mà trên một thuộc tính có thể xảy ra
nhiều khả năng.
Mô hình mới đã khắc phục những hạn chế trên do có các đặc tính sau: mỗi
miền trị thuộc tính được gắn với một độ đo “sự tương tự” của cặp hai phần tử bất
kỳ của miền trị này; thông tin về một đối tượng được thể hiện bởi một bộ trong
quan hệ; giá trị của một bộ tại một thuộc tính có thể là một tập gồm nhiều phần tử
và được phân hoạch thành các lớp tương đương bao gồm các phần tử “đủ” tương tự
(theo ngưỡng); có thể quan niệm rằng các phần tử trong một lớp tương đương là
những thể hiện không chính xác của một giá trị đơn hoặc cũng có thể coi mỗi lớp
tương đương thể hiện một khả năng có thể xảy ra.
Ngữ nghĩa của mỗi bộ trong mô hình mới sẽ được trình bày trong phần dưới
đây, một quan điểm tương ứng về dư thừa dữ liệu cũng được phát biểu. Khai niệm
về bộ dư thừa rất quan trọng vì nó là cơ sở để xây dựng các qui tắc cập nhật dữ
liệu, các phép toán quan hệ và khái niệm các phụ thuộc hàm.
1.1. Ngữ nghĩa của một bộ, quan niệm về các bộ thừa trong quan hệ
Cho một lược đồ quan hệ R(U), U là tập hữu hạn các thuộc tính, U = {A
1
, A
2
,
…, A
m
}. D
j
là miền trị của A
j
. Trên mỗi miền trị D
j
có một quan hệ tương tự (với

tính chất bắc cầu) s
j
. Dùng kí hiệu 2
Dj
để chỉ tập tất cả các tập con khác rỗng của D
j
.
Một quan hệ mờ r, là một tập con của tập tích Đề-các 2
D1
×…×2
Dm
. Một bộ t của
11
Website: Email : Tel (: 0918.775.368
một quan hệ mờ là một phần tử của tập 2
D1
×…×2
Dm
. Một cách tổng quát, một bộ t
∈ r có dạng: t = (d
1
, d
2
,…, d
m
), d
j
⊆D
j
. Bộ t cung cấp thông tin về một đối tượng O.

Giá trị d
j
của bộ t trên thuộc tính A
j
là một tập hợp khác rỗng, sử dụng kí
pháp tập hợp, chẳng hạn {a
1
,a
2
,…,a
k
}, trong đó ∀i = 1, 2,…, k, a
i
∈ D
j
. Khi đó có
một số cách hiểu khác nhau về ngữ nghĩa của bộ t (trên thuộc tính A
j
) như sau:
1. Chỉ một trong số các phần tử của d
j
là thông tin đúng về O trên A
j
(nhưng
chưa biết được chính xác là tập con nào) và không có phần tử nào ngoài
tập d
j
là thông tin đúng về O trên A
j
.

2. Một tập khác rỗng các phần tử của d
j
là thông tin đúng về O trên A
j
(nhưng chưa biết được chính xác là tập con nào) và không có tập con nào
của (D
j
-d
j
) là thông tin đúng về O trên A
j
.
3. Thông tin đúng về O trên A
j
chỉ có thể là một phần tử của D
j
và có thể
một trong số các phần tử của d
j
là thông tin đúng về O trên A
j
.
4. Có thể một tập khác rỗng các phần tử của d
j
là thông tin đúng về O trên
A
j
.
Với một ngưỡng α
j

của miền D
j
, kí hiệu THRES(D
j
)=α
j
, x, y
∈
D
j
, nếu s(x, y)
≥
α
j
thì chúng ta viết x∼
α
j
y. Rõ ràng ∼
α
j
là một quan hệ hai ngôi trên D
j
và:
Bổ đề 2.1. ∼
α
j
là một quan hệ tương đương trên D
j
.
Khi đã có một ngưỡng α

j
xác định trên miền D
j
và không sợ nhầm lẫn có thể
viết x∼y thay vì viết đầy đủ x∼
α
j
y.
Chứng minh:
∀x∈D
j
, s(x,x)=1
≥
α
j
nên x∼x. Từ x∼y ta có y∼x do tính đối xứng của quan hệ
s. Cuối cùng, nếu có x∼y và có y∼z sẽ có x∼z do s có tính bắc cầu T1.
Như vậy quan hệ ∼ phân hoạch D
j
thành các lớp tương đương, mỗi lớp tương
đương gồm các phần tử đủ tương tự với nhau hay còn nói rằng những phần tử này
xấp xỉ nhau (theo ngưỡng). Gọi mỗi lớp tương đương là một khả năng. Các lớp
12
Website: Email : Tel (: 0918.775.368
tương đương phân biệt cho các khả năng khác nhau. Khi ngưỡng thay đổi số khả
năng xuất hiện ở d
j
có thể thay đổi, dễ thấy khi lấy ngưỡng giảm đi số khả năng sẽ
không tăng và có thể giảm, khi lấy ngưỡng tăng lên số khả năng sẽ không giảm và
có thể tăng. Với quan niệm về khả năng nhờ vào khái niệm xấp xỉ theo một ngưỡng

tương tự giữa các phần tử như vậy, có một số cách hiểu khác nhau về ngữ nghĩa
của bộ t (trên thuộc tính A
j
) như sau:
5. Chỉ một trong số các khả năng xuất hiện ở d
j
là thông tin đúng về O trên
A
j
(nhưng chưa biết được chính xác là khả năng nào). Không có khả năng
nào không xuất hiện trong d
j
lại là thông tin đúng về O trên A
j
.
6. Một tập con khác rỗng của tập tất cả các khả năng xuất hiện ở d
j
là thông
tin đúng về O trên A
j
(nhưng chưa biết chính xác là tập con nào) và không
có tập con khả năng nào là thông tin đúng về O trên A
j
nếu như nó chứa
khả năng không xuất hiện ở d
j
.
7. Thông tin đúng về O trên A
j
chỉ có thể là một khả năng trong D

j
và có thể
một trong số các khả năng xuất hiện ở d
j
là thông tin đúng về O trên A
j
.
8. Có thể một tập khác rỗng các khả năng xuất hiện ở d
j
là thông tin đúng về
O trên A
j
.
Dễ dàng nhận thấy rằng, nếu lấy ngưỡng α
j
=1.0 thì sẽ có các cách hiểu 1. và
5. trùng nhau, 2. và 6. trùng nhau.
Ở đây chỉ xem xét mô hình mở rộng, giới hạn trong cách hiểu 6. đối với kí
pháp tập hợp và phần tử trong tập hợp {a
1
, a
2
,…, a
k
}, kí pháp đã được dùng để biểu
thị giá trị d
j
của bộ t trên thuộc tính A
j
.

Qui ước:
. Dùng
j
d
để chỉ tập tất cả các lớp tương đương của d
j
được phân hoạch bởi
ngưỡng đã xác định cho A
j
. Nghĩa là
j
d
={
i
a
/a
i
∈
d
j
}.
. Dùng 2
j
D
để chỉ tập tất cả các tập con khác rỗng của tập thương (D
j
/∼
α
j
).

13
Website: Email : Tel (: 0918.775.368
Định nghĩa 2.1. Với ngưỡng α=(α
1
, α
2
,…, α
m
). Một thể hiện khả năng theo α,
T
α
=(v
1
, v
2
,…, v
m
) của một bộ t=(d
1
, d
2
,…, d
m
) là bất cứ phép gán nào sao cho ∀i=1,
2,…, m: ∅≠v
i
⊆
i
d
.

Định nghĩa 2.2. Ngữ nghĩa theo ngưỡng α của một bộ t, kí hiệu là S
p
(t)
α
, là tập tất
cả các thể hiện khả năng theo α của bộ t.
Ví dụ 2.1:
Cho quan hệ t như dưới đây:
A B
{a
1
, a
2
, a
3
} {b
1
, b
2
}
Giả sử với ngưỡng α đang xét thì
a
1
=
a
3
≠
a
2
,

b
1
≠
b
2
. Khi đó sẽ có
d
A
={
a
1
,
a
2
}={
a
3
,
a
2
},
d
B
={
b
1
,
b
2
}.

Các thể hiện khả năng theo α có thể có của bộ t là:
1. ({
a
1
,
a
2
},{
b
1
,
b
2
})
2. ({
a
1
},{
b
1
,
b
2
})
3. ({
a
2
},{
b
1

,
b
2
})
4. ({
a
1
,
a
2
},{
b
1
})
5. ({
a
1,
a
2
},{
b
2
})
6. ({
a
1
},{
b
1
})

7. ({
a
1
},{
b
2
})
8. ({
a
2
},{
b
1
})
9. ({
a
2
},{
b
2
})
Như vậy ngữ nghĩa S
p
(t)
α
là tập gồm 9 thể hiện khả năng kể trên. Trong mô
hình của P.Buckles và E.Petry, tuy một bộ có thể có nhiều thể hiện nhưng vẫn chỉ
có một thể hiện khả năng.
Trong một CSDL rõ, một bộ được coi là thừa nếu và chỉ nếu nó trùng hoàn
toàn với một bộ khác. Theo quan điểm của P.Buckles và E.Petry, một bộ là thừa

nếu có thể trộn nó với một số bộ khác mà vẫn không vi phạm ngưỡng tương tự đã
cho, hay nói cách khác, nếu nó có chung một thể hiện với một bộ khác. Trong mô
hình đang xem xét ở đây, hai bộ được coi là thừa với nhau nếu chúng có cùng một
tập các khả năng trên mỗi thuộc tính. Có thể hình thức hoá điều này như sau:
14
Website: Email : Tel (: 0918.775.368
Định nghĩa 2.3. Trong quan hệ mờ r, hai bộ t
i
=(d
i1
, d
i2
,…, d
im
) và t
k
=(d
k1
, d
k2
,…,
d
km
), i≠k được gọi là thừa đối với nhau nếu ∀j=1, 2,…, m, ∀x∈d
ij
∃x’∈d
kj
: x∼
α
j

x’
và ngược lại, nghĩa là ∀j=1, 2,…, m, ∀x∈d
kj
∃x’∈d
ij
: x∼
α
j
x’. Dùng kí hiệu t
i
∼
α
t
k
để
nói rằng t
i
là thừa đối với t
k
theo ngưỡng α, trong đó α=(α
1
, α
2
,…,α
m
).
Không có gì là mâu thuẫn khi dùng kí hiệu d
ij
∼
α

d
kj
để nói rằng giá trị tương
ứng của hai bộ t
i
, t
k
trên thuộc tính A
j
là d
ij
và d
kj
tương đương (hay thừa) với nhau.
Nếu không sợ nhầm lẫn có thể viết d
ij
≈d
kj
thay cho viết d
ij
≈
α
j
d
kj
.
Bổ đề 2.2. ≈
α
là quan hệ tương đương trên một quan hệ mờ r.
Việc chứng minh tính đúng đắn của bổ đề này rất đơn giản.

Như vậy quan hệ ≈
α
cho một phân hoạch trên r. Có thể gọi hai bộ thừa đối
với nhau (theo α) là hai bộ tương đương nhau (theo α).
Bổ đề 2.3. Cần và đủ để hai bộ là thừa đối với nhau (theo α) là ngữ nghĩa (theo α)
của chúng bằng nhau.
Ta cũng có thể dễ dàng chứng minh được bổ đề này.
Ví dụ 2.2:
Các hình: Hình 2.1, Hình 2.2, Hình 2.3 dưới đây cho một quan hệ mờ với các
quan hệ tương tự trên các miền thuộc tính.
Giả sử ngưỡng α=(0.0, 0.6, 0.8) khi đó ngưỡng của Dom(TÊN) là 0.0,
ngưỡng của Dom(Màu xe) là 0.6, ngưỡng của Dom(Nghề nghiệp) là 0.8.
Dom(Màu xe) được phân hoạch thành 3 lớp tương đương (ngưỡng 0.6):
{xanh đậm, xanh nhạt, xanh đen}, {hồng, tím, đỏ}, {trắng, kem}.
r
1
TÊN MÀU XE NGHỀ NGHIỆP
t
1
t
2
t
3
t
4
An
Bình
Phúc
Lộc
xanh đậm, xanh nhạt, hồng

xanh đen, tím đỏ
trắng, hồng
hồng, kem
nhà văn, giáo sư
đạo diễn, giáo viên
nhà thơ
nhà thơ
15
Website: Email : Tel (: 0918.775.368
t
5
Thọ xanh đen, đỏ phi công
Hình 2.1. Một quan hệ mờ.
xanh
đậm
xanh
nhạt
xanh
đen
hồng đỏ tím đỏ trắng kem
xanh đậm 1.0 0.6 0.8 0.0 0.0 0.0 0.1 0.1
xanh nhạt 0.6 1.0 0.6 0.0 0.0 0.0 0.1 0.1
xanh đen 0.8 0.6 1.0 0.0 0.0 0.0 0.1 0.1
hồng 0.0 0.0 0.0 1.0 0.6 0.6 0.0 0.0
đỏ 0.0 0.0 0.0 0.6 1.0 0.9 0.0 0.0
tím đỏ 0.0 0.0 0.0 0.6 0.9 1.0 0.0 0.0
trắng 0.1 0.1 0.1 0.0 0.0 0.0 1.0 0.7
kem 0.1 0.1 0.1 0.0 0.0 0.0 0.7 1.0
Hình 2.2. Quan hệ tương tự trên Dom(Màu xe).
nhà văn nhà thơ đạo diễn giáo viên giáo sư phi công

nhà văn 1.0 1.0 0.9 0.5 0.5 0.2
nhà thơ 1.0 1.0 0.9 0.5 0.5 0.2
đạo diễn 0.9 0.9 1.0 0.5 0.5 0.2
giáo viên 0.5 0.5 0.5 1.0 0.8 0.2
giáo sư 0.5 0.5 0.5 0.8 1.0 0.2
phi công 0.2 0.2 0.2 0.2 0.2 1.0
Hình 2.3. Quan hệ tương tự trên Dom(Nghề nghiệp).
Dom(Nghề nghiệp) cũng được phân hoạch thành 3 lớp tương đương (ngưỡng
0.8):
{nhà văn, nhà thơ, đạo diễn}, {giáo viên, giáo sư}, {phi công}.
Như vậy với ngưỡng α cho ở trên thì trong r
1
, t
1
thừa đối với t
2
và t
3
thừa đối
với t
4
.
Việc loại trừ những bộ thừa theo một ngưỡng α trong một quan hệ r được
tiến hành bằng cách trộn những bộ thừa lại với nhau cho đến khi không còn tồn tại
hai bộ thừa đối với nhau nữa.
Định nghĩa 2.4. Cho một quan hệ mờ r, hai bộ t
i
, t
k
∈r, t

i
=(d
i1
,d
i2
,…,d
im
) và
t
k
=(d
k1
,d
k2
,…,d
km
). Kết quả của việc trộn hai bộ t
i
, t
k
là mộ bộ t sao cho t=(d
1
,d
2
,
…,d
m
) và d
j
=d

ij
∪
d
kj
, h=1, 2,…,m.
16
Website: Email : Tel (: 0918.775.368
Bổ đề 2.4. Việc loại bỏ các bộ thừa (theo một ngưỡng xác định) bằng phép trộn các
bộ thừa với nhau cho một kết quả duy nhất không phụ thuộc vào thứ tự trộn các bộ.
Cho một quan hệ r, một ngưỡng tương tự α, có thể đưa ra một r’ duy nhất
bằng cách loại bỏ các bộ thừa của r. Kí hiệu r’=M
α
(r).
Ví dụ 2.2:
Với quan hệ r
1
cho ở Hình 2.1, α=(0.0, 0.6, 0.8), ta có r
2
=M
α
(r
1
) cho ở Hình
2.4.
TÊN MÀU XE NGHỀ NGHIỆP
{An, Bình} {xanh đậm, xanh nhạt, xanh
đen, hồng, tím đỏ}
{nhà văn, giáo sư, đạo
diễn, giáo viên}
{Phúc, Lộc} {trắng, hồng, kem} {nhà thơ}

{ℑọ}
{xanh đen, đỏ} {phi công}
Hình 2.4. Quan hệ r
2
.
Bổ đề 2.5. Cho một quan hệ mờ trên lược đồ R(U), nếu kết quả của việc trộn hai
bộ t
i
, t
k
là một bộ t thì t tương đương với t
i
và t
k
. Nghĩa là:
M
α
(t{t
i
, t
k
})=t thì ((t
i
≈
α
t) và t
k
≈
α
t)).

Chứng minh:
Điều kiện để t
i
và t
k
được trộn với nhau theo α là t
i
≈
α
t
k
, cụ thể là nếu t
i
=(d
i1
,
d
i2
,…, d
im
) và t
k
=(d
k1
, d
k2
,…, d
km
) thì ∀j∈{1, 2,…, m} d
ij

≈d
kj
. Theo định nghĩa của
phép trộn M
α
thì t=(d
1
, d
2
,…, d
m
) với ∀j∈{1, 2,…, m}: d
j
=d
ij
∪d
kj
. Dễ thấy d
j
≈d
ij
và
d
j
≈d
kj
, suy ra điều cần chứng minh.
Định lý 2.1. Cho một quan hệ mờ trên lược đồ R(U), nếu kết quả của phép trộn M
α
trên tập T gồm các bộ tương đương nhau theo α là một bộ t thì t ttương đương theo

α với bất kỳ bộ nào trong T.
Như vậy, nếu có T={t
1
, t
2
, t
k
}⊆r sao cho ∀i, j∈{1, 2,…, m}: t
i
≈
α
t
j
và t=M
α
(T)
thì có ∀i∈{1, 2,…, k}: t
i
≈
α
t.
Chứng minh :
17
Website: Email : Tel (: 0918.775.368
Từ Bổ đề 2.4, Bổ đề 2.5 và tính bắc cầu của quan hệ tương đương ≈
α
dễ dàng
chứng minh được định lý.
Định nghĩa 2.5. Cho hai quan hệ mờ r, r’ trên cùng một lược đồ R(U). Hai quan hệ
gọi là tương đương với nhau theo ngưỡng α nếu ∀t∈r ∃t’∈r’: t≈

α
t’ và ngược lại,
nghĩa là ∀t’∈r’ ∃t
∈
r: t≈
α
t’.
Ví dụ 2.3:
Cho r
3
trong Hình 2.5, r
2
trong Hình 2.4. Với α=(0.0,0.6,0.8), thì r
3
≅
α
r
2
.
TÊN MÀU XE NGHỀ NGHIỆP
{An, Bình} {xanh đậm, xanh nhạt,
hồng, tím đỏ}
{giáo sư, đạo diễn,
giáo viên}
{Phúc} {trắng, hồng, tím đỏ} {nhà thơ, đạo diễn}
{Thọ, Lộc} {xanh đen, đỏ} {phi công}
Hình 2.5. Quan hệ r
3
.
1.2. Các giá trị NULL

Trong nghiên cứu về CSDL theo mô hình quan hệ, thông tin không đầy đủ
được biểu diễn bằng các giá trị null. Nhiều người sử dụng thuật ngữ này với những
ý nghĩa khác nhau. Nói chung có các trường hợp như sau:
1) Những giá trị không tồn tại, thường kí hiệu là ⊥. Nếu ⊥ xuất hiện ở bộ t
ứng với một thuộc tính A thì điều đó được thể hiểu là bất cứ một phần tử
nào ở Dom(A) cũng không thể là giá trị của bộ t trên thuộc tính A. Nói
cách khác, bộ t là thông tin về một đối tượng mà đối tượng này không thể
xét thuộc tính A. Ví dụ, không thể có tên cơ quan của một người đang
thất nghiệp.
2) Những giá trị tồn tại nhưng chưa biết tại thời điểm đang xét, thường kí
hiệu là D. Nếu D xuất hiện ở bộ t tương ứng với một thuộc tính A thì điều
đó được hiểu là bất cứ một phần tử nào thuộc Dom(A) cũng có thể là giá
trị của bộ t trên thuộc tính A. Nói cách khác, biết rằng bộ t có một giá trị
18
Website: Email : Tel (: 0918.775.368
trên thuộc tính A nhưng giá trị đó là gì thì chưa xác định được. Ví dụ biết
An đi làm bằng xe của anh ta nhưng không hề biết xe anh ta màu gì.
3) Không có thông tin về một thuộc tính A của bộ t, chúng ta không biết một
giá trị xác định, lại cũng không rơi vào tình huống nào trong hai loại null
kể trên. Chẳng hạn chúng ta không biết nhà An có điện thoại hay không
khi xét thuộc tính điện thoại của An.
Để tăng cường khả năng biểu diễn thông tin không đầy đủ cho mô hình đã đề
xuất, chúng ta sử dụng hai kí hiệu null D và ⊥ cho trường hợp 1) và 2). Có thể dùng
<D, ⊥> để nói rằng có hai khả năng 1) và 2) cho giá trị trên thuộc tính đang xét,
không xác định được thực tế rơi vào tình huống nào, đây chính là trường hợp 3).
Ví dụ 2.4:
Quan hệ r
null
cho trong Hình 2.6 sẽ giải thích rõ hơn ý nghĩa của hai kí hiệu
null đã sử dụng ở trên.

TÊN MÀU XE NGHỀ NGHIỆP
An xanh đậm, xanh nhạt, hồng bác sĩ, nha sĩ, kế toán
Bắc
xanh đậm, xanh nhạt, ⊥ D, ⊥
Yến D
⊥
Hình 2.6. Quan hệ r
null
.
Nhìn vào quan hệ r
null
, có thể thấy rõ được ý nghĩa của các kí hiệu null đã sử
dụng. Cụ thể, những thông tin trong bảng trên cho biết Bắc có thể không có xe mô
tô và cũng có thể có, nếu có thì xe của anh ta phải có màu xanh đậm hoặc xanh
nhạt. Không biết Bắc có nghề nghiệp hay không (thất nghiệp). Yến có xe nhưng
không biết một chút gì về màu xe của cô ấy, Yến không có nghề nghiệp.
Ở đây, giới hạn rằng các kí hiệu null không được xuất hiện trong các giá trị
của thuộc tính là khoá. Và khi cho phép sử dụng kí hiệu null trong các giá trị thuộc
tính, cần thiết phải xác định lại qui tắc cú pháp viết giá trị của một bộ trên một
thuộc tính cùng với ngữ nghĩa tương ứng.
Định nghĩa 2.6 (Biểu thức trị của một bộ trên một thuộc tính A
j
)
19
Website: Email : Tel (: 0918.775.368
. ∀a∈D
j
, {a} là một biểu thức tập hợp của D
j
,

. Nếu M là một biểu thức tập hợp của D
j
thì ∀a∈D
j
, M∪{a} là một biểu thức
tập hợp của D
j
,
.M ọi biểu thức tập hợp của D
j
đều là biêu thức trị trên A
j
,
.Nếu M là một biểu thức tập hợp của D
j
thì <M, ⊥> là biểu thức trị trên A
j
,
.<D> là biểu thức trị trên D
j
, <⊥> là biểu thức trị trên A
j
,
.<D, ⊥> là biểu thức trị trên A
j
.
Định nghĩa 2.7. (Thể hiện khả năng của một bộ trên một thuộc tính A
j
)
Một thể hiện khả năng của một bộ t trên một thuộc tính A

j
theo ngưỡng α
j
được xác định một cách tương ứng trong các trường hợp của biểu thức trị d
j
của bộ
t trên thuộc tính A
j
như sau:
. Nếu d
j
là một biểu thức tập hợp M của D
j
, thì ∀v, ∅≠v⊆
M
, v là một thể
hiện khả năng của t trên A
j
theo α
j
, với
M
=M/∼
α
j
,
. Nếu d
j
=<M, ⊥>, trong đó M là biểu thức tập hợp của D
i

thì ∀v, ∅≠v⊆M, v
là một thể hiện khả năng của t trên A
j
và {∅} cũng là một thể hiện khả năng của t
trên A
j
,
. Nếu d
j
=<D> thì ∀v∈2
Dj
, v là một thể hiện khả năng của t trên A
j
,
.Nếu d
j
=<⊥> thì {∅} là một thể hiện khả năng của t trên A
j
,
.Nếu d
j
=<D, ⊥> thì
∀
v
∈
2
Dj
, v là một thể hiện khả năng của t trên A
j
và {∅}

cũng là một thể hiện khả năng của t trên A
j
.
Định nghĩa 2.8. (Thể hiện khả năng của một bộ)
Với ngưỡng α=(α
1
, α
2
,…, α
m
). Một thể hiện khả năng theo α, T
α
=(v
1
, v
2
,…,
v
m
) của một bộ t=(d
1
, d
2
,…, d
m
) là bất cứ phép gán nào sao cho ∀i=1, 2,…, m: v
i
là
một thể hiện khả năng của bộ t trên A
i

(theo α
i
).
Định nghĩa 2.9. Ngữ nghĩa theo ngưỡng α của một bộ t, kí hiệu là S
p
(t)
α
, là tập tất
cả các thể hiện khả năng theo α của bộ t.
20
Website: Email : Tel (: 0918.775.368
Ví dụ 2.5:
Cho quan hệ sau:
A B
t a
1
, a
2
b
1
, b
2
, ⊥
Giả sử với ngưỡng α đang xét thì a
1
=a
2
, b
1
≠b

2
.
Các thể hiện khả năng theo α có thể có của bộ t là:
1) ({a
1
}, {b
1
, b
2
})
2) ({a
1
}, {b
1
})
3) ({a
1
}, {b
2
})
4) ({a
1
}, ∅).
Như vậy ngữ nghĩa S
p
(t)
α
là tập gồm 4 thể hiện khả năng kể trên.
Nếu cho phép kí hiệu null xuất hiện trong biểu thức trị của một bộ trên một
thuộc tính thì khái niệm hai bộ thừa (hay tương đương) với nhau trước đây cần

được mở rộng.
Định nghĩa 2.10. (Hai bộ tương đương với nhau trên một thuộc tính)
Trong quan hệ mờ r, hai bộ t=(d
1
, d
2
,…, d
m
) và t’=(d
1
’, d
2
’,…, d
m
’) được coi
là tương đương đối với nhau trên A
j
theo α
j
nếu rơi vào một trong những trường
hợp sau:
. d
j
và d
j
’ đều là các biểu thức tập hợp của D
j
thoả mãn điều kiện sau đây:
∀x∈d
j

’ ∃x’∈d
j
: x ∼
α
j
x’ và ngược lại, nghĩa là ∀x∈d
j
∃x’∈d
j
’: x ∼
α
j
x’.
. d
j
và d
j
’ đều chỉ chứa kí hiệu null và cùng chứa các kí hiệu null như nhau.
Cụ thể là: d
j
=d
j
’=<D> hoặc d
j
=d
j
’=<⊥> hoặc d
j
=d
j

’=<D, ⊥>.
. d
j
=<M, ⊥> và d
j
’=<M’, ⊥> trong đó M và M’ đều là biểu thức tập hợp trên
D
j
và M∼
α
j
M’ (theo(1)).
Dùng kí hiệu d
j
≈
α
j
d
j
’ để nói rằng d
j
tương đương (thừa) đối với d
j
’ trên A
j
theo ngưỡng α
j
.
Định nghĩa 2.11. (Hai bộ tương đương với nhau)
21

Website: Email : Tel (: 0918.775.368
Trong quan hệ mờ r, hai bộ t=(d
1
, d
2
,…, d
m
) và t’=(d
1
, d
2
,…, d
m
) được coi là
thừa đối với nhau theo ngưỡng α=(α
1
, α
2
,…, α
m
) nếu ∀j=1, 2,…, m, d
j
≈
α
j
d
j
’. Dùng
kí hiệu t≈
α

t’ để nói rằng t thừa đối với t’.
Theo các định nghĩa 2.9 và 2.11 có thể dễ dàng chứng minh được phát biểu
của bổ đề 2.3 vẫn đúng trong trường hợp cho phép kí hiệu null xuất hiện.
Bổ đề 2.6. Cần và đủ để hai bộ là thừa đối với nhau (theo α) là ngữ nghĩa (theo α)
của chúng là bằng nhau.
Nội dung của Định lý 2.1 phát biểu cho trường hợp không có kí hiệu null,
rằng việc trộn các bộ tương đương với nhau sẽ cho kết quả là một bộ tương đương
với một bộ bất kỳ đã tham gia vào phép trộn, vẫn đúng trong trường hợp có kí hiệu
null.
2. Mở rộng các phép toán quan hệ
2.1. Mở rộng phép hợp
Cho r
1
và r
2
là hai quan hệ trên cùng một lược đồ R(U). Hợp theo ngưỡng α của
r
1
và r
2
là một quan hệ kí hiệu là r
1
∪
α
r
2
được xác định như sau:
r
1
∪

α
r
2
=M
α
(r
1
∪r
2
).
Tính chất của phép hợp:
Từ định nghĩa của phép hợp (với ngưỡng α) trên đây, kết hợp với bổ đề 2.3
về kết quả trộn các bộ thừa với nhau không phụ thuộc thứ tự trộn, dễ suy ra phép
hợp có tính giao hoán và kết hợp. Nghĩa là:
r∪
α
s=s∪
α
r
(r
1
∪
α
r
2
)∪
α
r
3
=r

1
∪
α
(r
2
∪
α
r
3
).
2.2. Mở rộng phép giao
Cho r
1
và r
2
là hai quan hệ trên cùng một lược đồ R(U). Giao theo ngưỡng α
của r
1
, r
2
là một quan hệ kí hiệu là r
1
∩
α
r
2
được xác định như sau:
r
1
∩

α
r
2
=M
α
({t|(t∈r
1
và ∃t’∈r
2
: t≈
α
t’) hoặc (t∈r
2
và ∃t’∈r
1
: t≈
α
t’)}).
22
Website: Email : Tel (: 0918.775.368
Tính chất của phép giao:
Tương tự như phép hợp, phép giao cũng có tính chất giao hoán và kết hợp:
r∩
α
s=s∩
α
r
(r
1
∩

α
r
2
)∩
α
r
3
=r
1
∩
α
(r
2
∩
α
r
3
).
2.3. Mở rộng phép hiệu
Cho r
1
và r
2
là hai quan hệ trên cùng một lược đồ R(U). Hiệu theo ngưỡng α
của r
1
đối với r
2
là một quan hệ kí hiệu là r
1

-
α
r
2
được xác định như sau:
r
1
-
α
r
2
=M
α
{t∈r
1
|∀t’∈r
2
: t
α
≈
/
t’}.
Tính chất của phép hiệu:
Cũng như trường hợp CSDL truyền thống, phép giao có thể được biểu thị
qua phép hiệu, nghĩa là (r
1
∩
α
r
2

)≅
α
r
1
-
α
(r
1
-
α
r
2
).
Chứng minh:
a) Với t∈r
1
∩
α
r
2
, theo định nghĩa phép ∩
α
, ∃t
1
∈r
1
, ∃t
2
∈r
2

: t
1
≈
α
t
2
, t=M
α
({t
1
,t
2
}).
Theo định lý trộn 2.1, t ≈
α
t
1
. Chúng ta sẽ chỉ ra t
1
∈(r
1
-
α
(r
1
-
α
r
2
)) bằng cách chứng tỏ

rằng ∀t’∈(r-
α
r
2
): t
1
≈
α
t’. Thật vậy, giả sử có t’∈(r
1
-
α
r
2
) sao cho t
1
≈
α
t’, khi đó do tính
bắc cầu của ≈
α
chúng ta có t
2
≈
α
t’, điều này mâu thuẫn với giả sử phản chứng t’∈(r
1
-
α
r

2
). Như vậy ∀t∈r
1
∩
α
r
2
, ∃t
1
∈(r
1
-
α
(r
1
-
α
r
2
): t ≈
α

t
1
.
b) Với t
∈
(r
1
-

α
(r
1
-
α
r
2
)) thì:
t
∈
r
1
(1) và
∀
t’
∈
(r
1
-
α
r
2
) : t
≈
/
α
t’ (2)
Để chứng minh rằng t
∈
r

1
∩
α
r
2
chỉ cần chứng tỏ rằng
∃
t
2
∈
r
2
: t
≈
α
t
2
. Giả sử
∀
t*
∈
r
2
: t
≈
/
α
t*, từ đó thấy được t
∈
(r

1
-
α
r
2
), và theo (2) suy ra t
≈
/
α
t, đây là một điều vô
lý. Vậy
∀
t
∈
(r
1
-
α
(r
1
-
α
r
2
)), thì t
∈
r
1
∩
α

r
2
.
Theo định nghĩa hai quan hệ tương đương theo
α
(
≅
α
), kết hợp với chứng
minh a) và b) trên đây, có (r
1
∩
α
r
2
)
≅
α
r
1
-
α
(r
1
-
α
r
2
).
23

Website: Email : Tel (: 0918.775.368
2.4. Mở rộng phép chiếu
Cho r là quan hệ trên cùng một lược đồ R(U), U={A
1
, A
2
,…, A
m
}, ∀i=1, 2,
…, m, miền trị của A
i
là D
i
, X⊆U. Chiếu theo ngưỡng α của r trên X là một quan
hệ trên lược đồ R(X) kí hiệu là r
α
[X] được xác định như sau:
r
α
[X]=M
α
(r[X]).
Ví dụ 2.6:
Cho 2 quan hệ r
1
(Hình 2.10) và r
2
(Hình 2.11) trên lược đồ R(A, B, C), và
các quan hệ tương tự trên các miền ở các hình : Hình 2.7, Hình 2.8, Hình 2.9.
a

1
a
2
a
3
a
5
a
1
1.0 0.3 0.8 0.7
a
2
0.3 1.0 0.3 0.3
a
3
0.8 0.3 1.0 0.7
a
5
0.7 0.3 0.7 1.0
Hình 2.7. Quan hệ tương tự trên Dom(A).
b
1
b
2
b
3
b
4
b
1

1.0 0.1 0.6 0.1
b
2
0.1 1.0 0.1 0.9
b
3
0.6 0.1 1.0 0.1
b
4
0.1 0.9 0.1 1.0
Hình 2.8. Quan hệ tương tự trên Dom(B).
c
1
c
2
c
3
c
1
1.0 0.0 0.8
c
2
0.0 1.0 0.0
c
3
0.8 0.0 1.0
Hình 2.9. Quan hệ tương tự trên Dom(C).
A B C
a
1

b
1
, b
3
c
1
, c
2
a
2
, a
3
b
2
c
3
Hình 2.10. Quan hệ r
1
.
A B C
a
2
, a
5
b
4
c
3
24
Website: Email : Tel (: 0918.775.368

a
1
, a
3
b
2
c
2
Hình 2.11. Quan hệ r
2
.
Với α=(0.7, 0.6, 0.8) sẽ có:
r
1
∪
α
r
2
A B C
a
1
b
1
, b
2
c
1
, c
2
a

2
, a
3
, a
5
b
2
, b
4
c
3
a
1
, a
3
b
2
c
2
Hình 2.12. r
1
∪
α
r
2
.
r
1
∩
α

r
2
A B C
a
2
, a
3
, a
5
b
2
, b
4
c
3
Hình 2.13. r
1
∩
α
r
2
.
r
1
-r
2
A B C
a
1
b

1
, b
3
c
1
, c
2
Hình 2.14. r
1
-r
2
.
r
2
,
α
[B]
B
b
2
, b
4
Hình 2.15. r
2
,
α
[B].
2.5. Mở rộng phép tích Đề-các
Cho r và s là hai quan hệ tương ứng trên các lược đồ R(A
1

, A
2
,…, A
m
) và
S(A’
1
, A’
2
,…, A’
n
). Tích Đề-các theo ngưỡng
α
của r và s là một quan hệ trên lược
đồ (A
1
, A
2
,…, A
m
, A’
1
, A
2
,…, A
n
) kí hiệu là r×
α
s, được xác định như sau:
r×

α
s=M
α
(r×s).
2.6. Mở rộng phép chọn
Định nghĩa phép giao khả năng
Cho d
i
và d
i
’ là hai biểu thức tập hợp trên D
i
, giao khả năng của d
i
và d
i
’ theo
ngưỡng α
i
là một biểu thức tập hợp trên D
i
hoặc là tập ∅, kí hiệu là d
i
∩
P
α
i
d
i
’, được

xác định như sau:
d
i
∩
P
α
i
d
i
’={a∈d
i
/∃a’∈d
i
’: a∼
α
i
a’}∪{a’∈d
i
: a ∼
α
i
a’}.
25

đồ án tốt nghiệp cơ sở dữ liệu quan hệ mờ

Trích đoạn

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về