154
Chương 4
MÔ HÌNH CƠ SỞ DỮ LIỆU MỜ
THEO CÁCH TIẾP CẬN ðẠI SỐ GIA TỬ
4.1. Mô hình biểu diễn CSDL mờ theo cách tiếp cận ðại số gia tử
Xét một lược ñồ CSDL trên miền vũ trụ U = {A
1
, A
2
, …, A
n
}. Mỗi
thuộc tính A
i
ñược gắn với một miền trị thuộc tính, ký hiệu là Dom(A
i
), trong
ñó một số thuộc tính cho phép nhận các giá trị ngôn ngữ trong lưu trữ hay
trong các câu truy vấn và ñược gọi là thuộc tính mờ. Các thuộc tính còn lại
ñược gọi là thuộc tính kinh ñiển. Thuộc tính kinh ñiển A
i
ñược gắn với một
miền giá trị kinh ñiển, ký hiệu là
i
A
D
. Thuộc tính mờ A
i
sẽ ñược gắn một miền
giá trị kinh ñiển
i
A
D
và một miền giá trị ngôn ngữ
i
A
LD
hay là tập các phần tử
của một ðSGT. Xem giá trị ngôn ngữ như là một phần tử của ðSGT. ðể bảo
ñảm tính nhất quán trong xử lý ngữ nghĩa dữ liệu trên cơ sở thống nhất kiểu
dữ liệu của thuộc tính mờ, mỗi thuộc tính mờ sẽ ñược gắn với một ánh xạ ñịnh
lượng ngữ nghĩa ðSGT.
Theo cách tiếp cận này giá trị ngôn ngữ là dữ liệu, không phải là nhãn
của các tập mờ biểu diễn ngữ nghĩa của giá trị ngôn ngữ và ưu ñiểm cơ bản
của nó là việc cho phép tìm kiếm, ñánh giá ngữ nghĩa của thông tin không
chắc chắn chỉ bằng các thao tác dữ liệu kinh ñiển thường dùng và do ñó bảo
ñảm tính thuần nhất của kiểu dữ liệu trong xử lý ngữ nghĩa của chúng.
Vì tất cả các thuộc tính có miền trị chứa giá trị số trong CSDL ñều
tuyến tính, nên một cách tự nhiên ta giả thiết ðSGT ñược sử dụng là ðSGT
tuyến tính, do ñó tập H
+
và H
-
là tập sắp thứ tự tuyến tính. Như vậy, cho X = (
X, G, H,
≤
) với G = {0, c
-
, W, c
+
, 1
}, H = H
-
∪ H
+
với giả thiết H
−
=
{h
1
,h
2
, , h
p
}, H
+
= {h
-1
, , h
-q
}, h
1
> h
2
> > h
p
và h
-1
< < h
-q
là dãy các
gia tử.
Cho một ðSGT tuyến tính ñầy ñủ AX
AXAX
AX = (X, G, H,
Σ
,
Φ
, ≤), trong ñó
Dom(X
XX
X) = X là miền các giá trị ngôn ngữ của thuộc tính ngôn ngữ X
XX
X ñược sinh
155
từ tập các phần tử sinh G = {0, c
-
, W, c
+
, 1} bằng việc tác ñộng các gia tử
trong tập H,
Σ
và
Φ
là hai phép tính với ngữ nghĩa là cận trên ñúng và cận
dưới ñúng của tập H(x), tức là
Σ
x = supremum H(x) and
Φ
x = infimum H(x),
quan hệ ≤ là quan hệ sắp thứ tự tuyến tính trên X cảm sinh từ ngữ nghĩa của
ngôn ngữ.
4.1.1. Ngữ nghĩa dữ liệu dựa trên việc ñịnh lượng ðại số gia tử
4.1.1.1. ðặt vấn ñề
Cho một CSDL DB = {U ; R
1
, R
2
, …., R
n
; Const}, với U = {A
1
, A
2
,….,
A
n
} là tập vũ trụ các thuộc tính, R
1
, R
2
, …., R
n
là các lược ñồ xác ñịnh trên U,
Const là tập các ràng buộc trong CSDL. Mỗi thuộc tính A
i
ñược gắn với một
miền trị, ký hiệu là Dom(A
i
). Thuộc tính kinh ñiển A
i
ñược gắn với một miền
giá trị kinh ñiển, ký hiệu là
i
A
D
. Thuộc tính mờ A
i
sẽ ñược gắn một miền giá
trị kinh ñiển
i
A
D
và một miền giá trị ngôn ngữ
i
A
LD . Như vậy, ta có Dom(A
i
) =
i
A
D
∪
i
A
LD
, với
i
A
D
là tập các giá trị kinh ñiển của A
i
,
i
A
LD
là tập các giá trị
ngôn ngữ của A
i
. Tuy nhiên, ñể rút gọn khi trình bày, trong chương này nếu
cho U = {A
1
, A
2
,…., A
n
} thì ta cũng gọi U là một lược ñồ quan hệ.
Ví dụ 4.1. Cho lược ñồ quan hệ U = {STT, TEN, SOCTRINH, SONCSINH,
NAMSINH} và quan hệ Lylichkhoa hoc ñược xác ñịnh như sau:
STT TEN SOCTRINH
SONCSINH
NAMSINH
1 Bình 6 1 1950
2 Nhanh 10 2 1953
3 Huế nhiều rất nhiều 1960
4 Hồng 2 3 1975
5 Hà khả năng ít 5 1954
6 Thuỷ 2 ít 1950
7 Minh 5 6 1945
Bảng 4.1. Quan hệ Lylichkhoahoc
156
Trong quan hệ Lylichkhoahoc, các thuộc tính STT (Số thứ tự), TEN (Tên),
NAMSINH (Năm sinh) ñược gọi là thuộc tính kinh ñiển và có miền trị tương
ứng D
STT
, D
TEN
, D
NAMSINH
. Các thuộc tính SOCTRINH (Số công trình ),
SONCSINH (Số nghiên cứu sinh) ñược gọi là thuộc tính mờ và có miền trị
tương ứng D
SOCTRINH
∪ LD
SOCTRINH
, D
SONCSINH
∪ LD
SONCSINH
. Do ñó, ñối với
mô hình CSDL mờ này, các khái niệm như lược ñồ, quan hệ, bộ dữ liệu ñược
hiểu tương tự như trong CSDL quan hệ. Tuy nhiên, miền trị của các thuộc tính
mờ ñược xác ñịnh là một tập bao gồm miền trị kinh ñiển và miền giá trị ngôn
ngữ ñược sinh ra khi tác ñộng các gia tử vào các phần tử sinh. Chẳng hạn,
trong quan hệ Lylichkhoahoc, miền trị thuộc tính LD
SOCTRINH
, LD
SONCSINH
chứa hai phần tử ít và nhiều. Vấn ñề ñặt ra ở ñây, tìm một phương pháp ñối
sánh dữ liệu ñể ứng dụng thao tác dữ liệu trên miền trị của các thuộc tính mờ.
Ví dụ tìm những cán bộ có nhiều công trình khoa học và hướng dẫn rất nhiều
nghiên cứu sinh. Nếu chúng ta xem LD
SOCTRINH
, LD
SONCSINH
là hai ðSGT và
các giá trị nhiều, rất nhiều thuộc hai ðSGT ñó, thì việc ñối sánh dữ liệu trên
miền trị của thuộc tính mờ sẽ ñược dựa trên ñịnh lượng ngữ nghĩa của ðSGT.
ðể ñề xuất các phép ñối sánh dữ liệu trên mô hình CSDL mờ, một số
ñịnh nghĩa ñược giới thiệu. Các ñịnh lý, hệ quả và bổ ñề liên quan ñược chúng
ta trình bày làm cơ sở cho phần tiếp theo.
4.1.1.2. Ngữ nghĩa dữ liệu dựa trên việc ñịnh lượng ðSGT
Trong phần này, các khái niệm như: bằng nhau theo mức k, khác nhau
theo mức k và bé hơn theo mức k ñược trình bày. Về nguyên tắc, chúng ta có
thể ñịnh nghĩa với mức k là số nguyên dương bất kỳ. Tuy nhiên, trong ngôn
ngữ tự nhiên, người ta thường chỉ sử dụng một số gia tử tác ñộng liên tiếp,
ñiều này dẫn ñến trong CSDL chỉ có một số giới hạn các gia tử tác ñộng liên
tiếp vào phần tử sinh. Vì vậy, một cách hợp lý chúng ta giả thiết số gia tử tác
ñộng liên tiếp vào phần tử sinh không vượt quá p cho trước. Do ñó, trong
chương này, giá trị k ñược xét là 1 ≤ k ≤ p, với k, p nguyên.
Vì tính mờ của các giá trị trong ðSGT là một ñoạn con của [0,1] cho
nên họ các ñoạn con như vậy của các giá trị có cùng ñộ dài sẽ tạo thành phân
hoạch của [0,1]. Phân hoạch ứng với các giá trị có ñộ dài từ lớn hơn sẽ mịn
hơn và khi ñộ dài lớn vô hạn thì ñộ dài của các ñoạn trong phân hoạch giảm
157
dần về 0. Do ñó, các phân hoạch ñược xây dựng dựa trên tính mờ các giá trị
trong ðSGT hay là dựa trên tính mờ các giá trị trong Dom(A
i
).
Với A
i
là thuộc tính mờ, ñể ñối sánh hai giá trị trong Dom(A
i
) ta xây
dựng phân hoạch của Dom(A
i
). Nếu ñặt miền giá trị kinh ñiển D
Ai
= [a,b],
bằng một phép biến ñổi tuyến tính hoặc sử dụng một hàm chuyển ñổi nào ñó
thì ta có thể xem mỗi D
Ai
= [0,1]. Do ñó, xây dựng phân hoạch của Dom(A
i
)
trở thành xây dựng phân hoạch của [0,1].
ðịnh nghĩa 4.1. Cho X
k
= {x∈X: |x| = k}, xét P
k
= {I(x): x∈X
k
} là một phân
hoạch của [0,1]. Gọi
υ
là hàm ñịnh lượng ngữ nghĩa trên X.
(1) u bằng v theo mức k, ñược ký hiệu u =
k
v, khi và chỉ khi I(u) và I(v)
cùng chứa trong một khoảng mờ mức k. Có nghĩa là với ∀u, v∈X, u =
k
v ⇔
∃∆
k
∈ P
k
: I(u) ⊆ ∆
k
và I(v) ⊆ ∆
k
.
(2) u khác v theo mức k, ñược ký hiệu u ≠
k
v, khi và chỉ khi I(u) và I(v)
không cùng chứa trong một khoảng mờ mức k.
(3) u nhỏ hơn v theo mức k, ñược ký hiệu u <
k
v, khi và chỉ khi I(u) và
I(v) không cùng chứa trong một khoảng mờ mức k và
υ
(u) <
υ
(v).
Ví dụ 4.2. Cho ðSGT X = (X, G, H,
≤
), Trong ñó H = H
+
∪
H
-
, H
+
= {hơn,
rất}, hơn < rất, H
-
= {ít, khả năng}, ít > khả năng, G = { trẻ, già}. Ta có P
1
=
{I(trẻ), I(già)} là một phân hoạch của [0,1]. Tương tự, P
2
= {I(hơn trẻ), I(rất
trẻ), I(ít trẻ), I(khả năng trẻ), I(hơn già), I(rất già), I(ít già), I(khả năng già)}
là phân hoạch của [0,1].
(a) Ta có P
1
là phân hoạch của [0,1]. Do ñó hơn trẻ
=
1
rất trẻ vì ∃∆
1
= I(trẻ) ∈
P
1
: I(hơn trẻ) ⊆ ∆
1
và I(rất trẻ) ⊆ ∆
1
.
Ta có P
2
là phân hoạch của [0,1]. Do ñó ít già
=
2
rất ít già vì ∃∆
2
=I(ít già
)∈P
2
: I(ít già) ⊆ ∆
2
và I(rất ít già) ⊆ ∆
2
.
(b) Ta có P
2
là phân hoạch của [0,1]. Chọn ∆
2
= I(rất trẻ)∈P
2
, ta có I(ít trẻ) ⊄
∆
2
và I(rất trẻ) ⊆ ∆
2
(1’).
Mặc khác với mọi ∆
2
≠ I(ít trẻ)∈P
2
, ta có I(ít trẻ) ⊄ ∆
2
và I(rất trẻ) ⊄ ∆
2
(2’).
Từ (1’) và (2’) suy ra ít trẻ
≠
2
rất trẻ. Hơn nữa, vì ít trẻ
≠
2
rất trẻ và
υ
(ít trẻ
)
>
υ
(rất trẻ) nên ít trẻ
>
2
rất trẻ.
158
Bổ ñề 4.1. Quan hệ =
k
là một quan hệ tương ñương trong P
k
.
Chứng minh: Tính phản xạ : Ta chứng minh bằng quy nạp.
∀x∈Dom(A
i
)
nếu |x| = 1 thì x = c
+
hoặc x = c
-
.
Ta có ∃∆
1
= I(c
+
)∈P
1
: I(c
+
) = I(x) ⊆ ∆
1
hoặc ∃∆
1
= I(c
-
)∈P
1
: I(c
-
) = I(x) ⊆ ∆
1
.
Vậy =
k
ñúng với k = 1, hay x =
1
x.
Giả sử |x| = n ñúng, có nghĩa =
k
ñúng với k = n, hay x =
n
x, ta cần chứng minh
=
k
ñúng với k = n+1. ðặt x = h
1
x’, với |x’| = n. Vì x =
n
x nên theo ñịnh nghĩa ta
có: ∃∆
n
∈ P
n
: I(x) ⊆ ∆
n
. Mặc khác ta có P
n+1
= {I(h
1
x’), I(h
2
x’),…….}, với h
1
≠
h
2
≠…là một phân hoạch của I(x’). Do ñó ∃∆
(n+1)
= I(h
1
x’)∈P
(n+1)
: I(h
1
x’) = I(x)
⊆ ∆
(n+1)
. Vậy =
k
ñúng với k = n + 1, hay x =
n+1
x.
Tính ñối xứng: ∀x, y ∈Dom(A
i
), nếu x =
k
y thì theo ñịnh nghĩa ∃∆
k
∈ P
k
: I(x)
⊆ ∆
k
và I(y) ⊆ ∆
k
hay ∃∆
k
∈ P
k
: I(y) ⊆ ∆
k
và I(x) ⊆ ∆
k
. Vậy y =
k
x thì y =
k
x.
Tính bắc cầu: Ta chứng minh bằng phương pháp qui nạp
Trường hợp k = 1
Ta có P
1
= {I(c
+
), I(c
-
)}, nếu x =
1
y và y =
1
z thì ∃∆
1
= I(c
+
)∈P
1
: I(x) ⊆ ∆
1
và
I(y) ⊆ ∆
1
và I(z) ⊆ ∆
1
hoặc ∃∆
1
= I(c
-
)∈P
1
: I(x) ⊆ ∆
1
và I(y) ⊆ ∆
1
và I(z) ⊆ ∆
1
,
có nghĩa là ∃∆
1
∈P
1
: I(x) ⊆ ∆
1
và I(z) ⊆ ∆
1
hay x =
1
z. Vậy =
k
ñúng với k = 1.
Giả sử quan hệ =
k
ñúng với trường hợp k = n có nghĩa là ta có ∀x, y, z
∈Dom(A
i
)
nếu x =
n
y và y =
n
z thì x =
n
z.
Ta cần chứng minh quan hệ =
k
ñúng với trường hợp k = n+1. Tức là ∀x, y, z
∈Dom(A
i
)
nếu x =
n +1
y và y =
n+1
z thì x =
n+1
z.
Theo giả thiết nếu x =
n +1
y và y =
n+1
z thì ∃ ∆
(n+1)
∈P
(n+1)
: I(x) ⊆ ∆
(n+1)
và I(y) ⊆
∆
(n+1)
và I(z) ⊆ ∆
(n+1)
, có nghĩa là ∃ ∆
(n+1)
∈P
(n+1)
: I(x) ⊆ ∆
(n+1)
và I(z) ⊆ ∆
(n+1)
.
Vậy
x =
n+1
z.
Bổ ñề 4.2. Cho u = h
n
…h
1
x và v = h’
m
…h’
1
x là biểu diễn chính tắc của u và v
ñối với x.
(1): Nếu u = v thì u =
k
v với mọi k.
(2): Nếu h
1
≠ h’
1
thì u =
|x|
v.
Chứng minh:
(1) Ta có u =
k
u và v =
k
v, vì u = v nên theo bổ ñề 2.2 ta có u =
k
v, với
mọi k.
159
(2) Nếu |u| = |v| = 2, tức là u = h
1
x và v = h’
1
x, do h
1
≠ h’
1
nên u ≠ v. Ta
có I(h
1
x) ⊆ I(x), I(h’
1
x) ⊆ I(x) và I(h
1
x) ⊄ I(h’
1
x) nên ∃∆
1
= I(x)∈P
1
: I(h
1
x) ⊆
∆
1
và I(h’
1
x) ⊆ ∆
1
hay h
1
x =
1
h’
1
x. Vậy u =
|x|
v.
Nếu |u| ≠ |v|, do h
1
≠ h’
1
nên I(h
1
x) ⊄ I(h’
1
x) (1’). Giả sử ∃ k >1 sao cho
u =
k
v thì ∃∆
k
∈P
k
= { I(h
k-1
h
1
x), I(h’
k-1
… h’
1
x)}, với P
k
là một phân hoạch
của I(x)
: I(u) ⊆ ∆
k
và I(v) ⊆ ∆
k
.
Nếu chọn ∆
k
= I(h
k-1
… h
1
x) thì I(u) ⊆ I(h
k-1
… h
1
x) và I(v) ⊆ I(h
k-1
…
h
1
x) hay I(h
n
…h
1
x) ⊆ I(h
k-1
… h
1
x) và I(h’
m
….h’
1
x) ⊆ I(h
k-1
… h
1
x) ñiều này
mâu thuẩn vì I(h’
m
….h’
1
x) ⊄ I(h
k-1
… h
1
x) do (1’).
Nếu chọn ∆
k
= I(h’
k-1
… h’
1
x) thì I(h
n
…h
1
x) ⊆ I(h’
k-1
… h’
1
x) và
I(h’
m
….h’
1
x) I(h’
m
….h’
1
x) ⊆ I(h’
k-1
… h’
1
x), ñiều này mâu thuẩn vì I(h
n
…h
1
x)
⊄ I(h’
k-1
… h’
1
x) do (1’). Vậy không tồn tại k > 1 sao cho u =
k
v hay k = 1. Vậy
u =
|x|
v.
Ví dụ 4.3. Cho u = rất hơn trẻ và v = hơn rất trẻ. Ta có h
1
= hơn, h’
1
= rất, x =
trẻ. Vì h
1
≠ h’
1
nên theo tính chất (2) của bổ ñề 4.2 ta có u =
|trẻ|
v, hay u =
1
v.
ðịnh lý 4.1. Cho X
k
={x∈X: |x| = k}, xét P
k
={I(x): x∈X
k
} là một phân hoạch
của [0,1], u = h
n
….h
1
x và v = h’
m
….h’
1
x là biểu diễn chính tắc của u và v ñối
với x.
(1) Nếu u =
k
v thì u =
k’
v, ∀ 0 < k’< k.
(2) Nếu tồn tại một chỉ số j ≤ min(m,n) lớn nhất sao cho với mọi s =
1 j ta có h
s
= h’
s
thì u =
j+|x|
v.
Chứng minh: (1) Ta có P
k
= {I(h
k-1
…h
1
x), I(h’
k-1
…h
1
x)}. Vì u =
k
v nên theo
ñịnh nghĩa ∃∆
k
∈ P
k
: I(u) ⊆ ∆
k
và I(v) ⊆ ∆
k
(1’).
Ta có P
1
= {I(x)}, P
2
= {I(h
1
x), I(h’
1
x)},…P
k
={I(h
k-1
…h
1
x), I(h’
k-
1
…h
1
x)}. Mặt khác, I(h
k-1
…h
1
x) ⊆ I(h
k-2
…h
1
x) ⊆… ⊆ I(h
1
x) ⊆ I(x) và I(h’
k-
1
…h’
1
x) ⊆ I(h’
k-2
…h’
1
x) ⊆ ⊆ I(h’
1
x) ⊆ I(x) nên ∃∆
k
= I(h
k-1
…h
1
x) ∈P
k
hoặc
∃∆
k
= I(h’
k-1
…h’
1
x) ∈P
k
và ∃∆
k-1
= I(h
k-2
…h
1
x)∈P
k-1
hoặc ∃∆
k-1
= I(h’
k-
2
…h’
1
x)∈P
k-1
… và ∃∆
2
= I(h
1
x)∈P
2
hoặc ∃∆
2
= I(h’
1
x)∈P
2
và ∃∆
1
= I(x)∈P
1
sao cho: ∆
k
⊆ ∆
k-1
⊆….⊆ ∆
2
⊆ ∆
1
(2’).
160
Từ (1’) và (2’) ta có I(u) ⊆ ∆
k
⊆∆
k-1
⊆….⊆ ∆
2
⊆ ∆
1
và I(v) ⊆ ∆
k
⊆ ∆
k-1
⊆….⊆
∆
2
⊆ ∆
1
, có nghĩa là ∀ 0 < k’< k luôn ∃∆
k’
∈P
k’
: I(u) ⊆ ∆
k’
và I(v) ⊆ ∆
k’
. Vậy
∀ 0 < k’< k nếu u =
k
v thì u =
k’
v.
(2): Nếu j =1 ta có h
1
= h’
1
, khi ñó u = h
n
….h
2
h
1
x và v = h’
m
… h’
2
h’
1
x
hay u = h
n
…h
2
h
1
x và v = h’
m
…h’
2
h
1
x. ðặt x’ = h
1
x ta có u = h
n
…h
2
x’ và v =
h’
m
…h’
2
x’. Vì h
2
≠ h’
2
nên theo bổ ñề 2.3 ta có u =
|x’|
v (do |x’| = 2, |x| = 1) hay
u =
2
v. Vậy u =
j+|x|
v.
Nếu j ≠1, ñặt k = j, ta cần chứng minh u =
k+|x|
v. Vì u =
k
v nên theo giả thiết ta
có ∀s =1 k ta có h
s
= h’
s
. Khi ñó u = h
n
….h
2
h
1
x và v = h’
m
… h’
2
h’
1
x hay u =
h
n
.h
k
h
k-1
…h
1
x và v = h’
m
….h
k
h
k-1
…h
1
x.
ðặt x’ = h
k
h
k-1
….h
1
x ta có u = h
n
…h
k+1
x’ và v = h’
m
…h’
k+1
x’. Vì h
k+1
≠
h’
k+1
nên theo bổ ñề 2.2 ta có u =
|x’|
v hay u =
k+|x|
v (do |x’| = k, |x| = 1).
Ví dụ 4.4. Cho u = rất rất trẻ và v = hơn rất trẻ. Ta có h
1
= rất, h
2
= rất, h’
1
=
rất, h’
2
= hơn, x = trẻ. Ta thấy tồn tại chỉ số j =1 lớn nhất sao cho h
1
= h’
1
, do
ñó theo tính chất (2) của ñịnh lý 4.1 ta có u =
j+|trẻ|
v, hay u =
2
v.
Hệ quả 4.1. Nếu u ∈H(v) thì u =
|v|
v.
Ví dụ 4.5. Cho u = rất rất trẻ và v = rất trẻ. Vì u ∈H(v) nên theo hệ quả 4.1 ta
có u =
|rất trẻ|
v, hay u =
2
v.
Bổ ñề 4.3. Cho X
k
={x∈X: |x| = k}, xét P
k
={I(x): x∈X
k
} là một phân hoạch
của [0,1], u = h
n
….h
1
x và v = h’
m
….h’
1
x là biểu diễn chính tắc của u và v ñối
với x.
(1) Nếu tồn tại chỉ số k ≤ min(m,n) lớn nhất sao cho u =
k
v thì u ≠
k+1
v.
(2) Nếu u <
k
v hoặc u >
k
v thì với ∀ a ∈ H(u), với ∀ b ∈ H(v) ta có a
<
k
b hoặc a >
k
b.
Ví dụ 4.6. Cho u = rất rất trẻ và v = hơn rất trẻ. Theo ví dụ 4.4 ta có u =
2
v
nên theo bổ ñề 4.3 ta có u ≠
3
v.
Hệ quả 2.2
(1) Nếu u∈H(v) thì u ≠
|v|+1
v.
(2) Nếu u ≠
k
v thì u ≠
k’
v ∀ 0 < k < k’.
161
ðịnh nghĩa 4.2. Cho Dom(A
i
) =
i
A
D
∪
i
A
LD
,
υ
là hàm ñịnh lượng ngữ nghĩa
của Dom(A
i
). Hàm f : Dom(A
i
) → [0,1] ñược xác ñịnh như sau:
Nếu
i
A
LD
= ∅ và
i
A
D
≠ ∅ thì ∀ω∈Dom(A
i
) ta có f(ω)=
minmax
min
ψψ
ψ
ω
−
−
Nếu
i
A
D
≠ ∅,
i
A
LD
≠ ∅ thì ∀ω ∈Dom(A
i
) ta có f(ω) =
{ω
*
υ
(ψ
maxLV
)}/ψ
max
Với
i
A
D
= [ψ
min
, ψ
max
] là miền trị kinh ñiển của A
i
và
i
A
LD
= [ψ
minLV
, ψ
maxLV
]
là miền trị ngôn ngữ của A
i
.
Ví dụ 4.7. Cho miền trị cơ sở U(Tuoi) = {0…100, …rất rất trẻ,……, rất rất
già}.
D
TUOI
= {20, 25, 27, 30, 45, 60, 75, 66, 80}.
LD
TUOI
= {trẻ, rất trẻ, già, hơn trẻ, hơn già, ít già, rất già, rất rất trẻ}.
Dom(TUOI) = D
TUOI
∪ LD
TUOI
. Nếu LD
TUOI
= ∅ khi ñó Dom(TUOI) = D
TUOI
= {20, 25, 27, 30, 45, 60, 75, 66, 80}. Do ñó ∀ω ∈Dom(Tuoi), chuyển ñổi giá
trị ω về một số trong [0,1] nhờ hàm f(ω), ta có Dom(Tuoi) = {0.2, 0.25, 0.27,
0.3, 0.45, 0.6, 0.75, 0.66, 0.8}.
Nếu
i
A
D
≠ ∅ và
i
A
LD
≠ ∅ ta có Dom(Tuoi) =
i
A
D
∪ LD
Tuoi
= {trẻ, rất
trẻ, già, hơn trẻ, hơn già, ít giá, rất già, rất rất trẻ, 20, 25, 27, 30, 45, 60, 75,
66, 80}. Giả sử tính ñược
υ
(ψ
maxLV
) =
υ
(rất rất già) = 0.98.
Khi ñó ∀ω ∈
i
A
D
ta có f(ω) = {ω
*
υ
(ψ
maxLV
)}/ψ
max
= (ω*0.98)/100, hay
∀ω∈
i
A
D
chuyển ñổi giá trị ω về một số trong [0,1] nhờ hàm f(ω), ta có
i
A
D
=
{0.196, 0.245, 0.264, 0.294, 0.441, 0.588, 0.735, 0.646, 0.784}.
Nếu chúng ta chọn các tham số W và ñộ ño tính mờ cho các gia tử sao
cho
υ
(ψ
maxLV
) =1.0 thì ({ω
*
υ
(ψ
maxLV
)}/ψ
max
)
=
minmax
min
ψψ
ψ
ω
−
−
.
Tiếp theo, chúng ta ñi xây dựng một hàm Φ
k
ñể chuyển một giá trị
trong [0,1] thành một giá trị ngôn ngữ tương ứng trong ðSGT X.
ðịnh nghĩa 4.3. Cho ðSGT X = (X, G, H,
≤
),
υ
là hàm ñịnh lượng ngữ nghĩa
của X. Φ
k
: [0,1]→X gọi là hàm ngược của hàm
υ
theo mức k ñược xác ñịnh:
∀a∈[0,1], Φ
k
(a) = x
k
khi và chỉ khi a ∈I(x
k
), với x
k
∈X
k
.
162
Ví dụ 4.8. Cho ðSGT X
= (X, C, H,
≤
), Trong ñó H = H
+
∪
H
-
.
Trong ñó H
+
= {hơn, rất} với hơn < rất và H
-
= {ít, khả năng} với ít > khả
năng.
G = {nhỏ, lớn}. Giả sử cho W = 0.6, fm(hơn) = 0.2, fm(rất) = 0.3, fm(ít) = 0.3,
fm(khả năng) = 0.2, fm(nhỏ) = 0.6, fm(lớn) = 0.4.
Ta có P
2
= {I(hơn lớn), I(rất lớn), I(ít lớn), I(khả năng lớn), I(hơn nhỏ),
I(rất nhỏ), I(ít nhỏ), I(khả năng nhỏ)} là phân hoạch của [0,1]. Ta có fm(rất
lớn) = 0.12, fm(khả năng lớn) = 0.08. Ta có |I(rất lớn)| = fm(rất lớn) = 0.12,
hay I(rất lớn) = [0.88,1]. Do ñó theo ñịnh nghĩa Φ
2
(0.9) = rất lớn vì 0.9 ∈
I(rất lớn).
Tương tự ta có |I(khả năng lớn)| = fm(khả năng lớn) = 0.08, hay I(khả
năng lớn) = [0.72,0.8]. Do ñó theo ñịnh nghĩa Φ
2
(0.75) = khả năng lớn vì 0.75
∈ I(khả năng lớn).
Trong phần này, giả sử chúng ta chỉ xét các phần tử ñược sinh từ phần
tử lớn.
Ít lớn khả năng lớn lớn hơn lớn rất lớn
0.6 0.72 0.75 0.8 0.88 0.9 1
|I(ít lớn)| = 0.12 |I(rất lớn)| = 0.12
|I(khả năng lớn)| = 0.08 |I(hơn lớn)| = 0.08
|I(lớn)| = 0.4
Hình 4.1. Tính mờ của phần tử sinh lớn
ðịnh lý 4.2. Cho ðSGT X= (X, C, H,
≤
),
υ
là hàm ñịnh lượng ngữ nghĩa của
X, Φ
k
là hàm ngược của
υ
, ta có:
(1) ∀ x
k
∈ X
k
, Φ
k
(
υ
(x
k
)) = x
k
.
(2) ∀a ∈ I(x
k
),∀ b ∈ I(y
k
), x
k
≠
k
y
k
, nếu a < b thì Φ
k
(a) <
k
Φ
k
(b).
163
Chứng minh:
(1) ðặt a =
υ
(x
k
) ∈ [0,1]. Vì
υ
(x
k
) ∈ I(x
k
) nên a ∈ I(x
k
). Vậy, theo ñịnh
nghĩa ta có Φ
k
(a) = x
k
, hay Φ
k
(
υ
(x
k
)) = x
k
.
(2) Vì a ∈ I(x
k
) và b ∈ I(y
k
) nên theo ñịnh nghĩa ta có Φ
k
(a) = x
k
và
Φ
k
(b) = y
k
.
Mặc khác theo giả thiết x
k
≠
k
y
k
nên I(x
k
) ≠ I(y
k
). Vì a < b nên I(x
k
) <
I(y
k
), hay Φ
k
(a) <
k
Φ
k
(b).
4.1.2. Phương pháp xử lý giá trị khoảng
Trong cơ sở dữ liệu mờ, có nhiều quan hệ mà miền trị của các thuộc
tính không phải là giá trị ngôn ngữ, không phải giá trị số mà là giá trị khoảng,
chẳng hạn như quan hệ lưu trữ nhiệt ñộ sốt một căn bệnh của các bệnh nhân
trong một bệnh viện nào ñó, quan hệ thu nhập cá nhân trong một cơ quan
ðối với loại dữ liệu này, việc lưu trữ phức tạp nên việc xử lý dữ liệu loại này
càng phức tạp hơn. Vì vậy, trong phần này, một phương pháp ñể xử lý giá trị
khoảng giúp cho việc thao tác dữ liệu dễ dàng ñược trình bày. Trước hết, một
ví dụ ñược xem xét ñể từ ñó phân tích ngữ nghĩa của các giá trị khoảng trong
một quan hệ.
Ví dụ 4.8. Cho lược ñồ quan hệ U = { STT, TEN, TUOI, THUNHAP } và quan
hệ Thunhapcanhan ñược xác ñịnh như sau:
STT TEN TUOI THUNHAP
1 An 30 2.500.000
2 Hải Khoảng 25 1.500.000
3 Hằng [25,40] Khoảng 3.500.000
4 Phương
[45,50] [1.500.00,1.800.000]
5 Thúy 45 Khoảng 1.000.000
Bảng 4.2. Quan hệ Thunhapcanhan
164
Chúng ta thấy rằng các giá trị trên thuộc tính TUOI và THUNHAP rất ña dạng,
tuy nhiên, chúng ta chỉ quan tâm ñến vấn ñề xử lý các giá trị khoảng. Vì vậy,
tất cả các giá trị trên quan hệ Thunhapcanhan có thể chuyển về các giá trị
khoảng tương ứng. Một cách tổng quát, nếu là giá trị a ta chuyển thành [a,a],
nếu là giá trị khoảng a ta chuyển thành [a-ε, a+ε], với ε ñược xem là bán kính
với tâm a. Nếu giá trị từ a ñến b, thì ñược chuyển thành [a,b]. Do ñó, quan hệ
Thunhapcanhan có thể chuyển thành quan hệ sau:
STT TEN TUOI THUNHAP
1
An
[30, 30]
[2.500.000, 2.500.000]
2 Hải [23, 27] [1.500.000, 1.500.000]
3 Hằng [25, 40] [3.400.000, 3.600.000]
4 Phương [45, 50] [1.500.00, 1.800.000]
5 Thúy [45, 45] [9.00.00, 1.100.000]
Bảng 4.3. Quan hệ Thunhapcanhan (sau khi chuyển ñổi), với ε
TUOI
= 2 và ε
THUNHAP
=
100.000
4.1.2.1. Chuyển các giá trị khoảng về ñoạn con [0,1] tương ứng
Gọi Dom(A
i
) = [min, max] là miền trị kinh ñiển của thuộc tính mờ A
i
trong một quan hệ, trong ñó min, max tương ứng là giá trị nhỏ nhất và giá trị
lớn nhất của Dom(A
i
). Trước hết, ta sử dụng hàm f ñể chuyển ñổi giá trị thuộc
Dom(A
i
) thành giá trị thuộc [0,1]. Tiếp theo, khoảng [a,b] ñược biến ñổi thành
ñoạn con [0,1] tương ứng khi sử dụng hàm f , hay [f (a),f (b)] ⊆[0,1].
Ví dụ 4.9. Sử dụng quan hệ Thunhapcanhan (sau khi chuyển ñổi)
Chọn D
TUOI
= [0,100] và D
THUNHAP
= [500.000,6.000.000], khi ñó ta có các kết
quả chuyển các giá trị khoảng tương ứng về ñoạn con của [0,1] như sau:
STT TEN TUOI THUNHAP
1 An [0.3, 0.3] [0.36, 0.36]
2 Hải [0.23, 0.27] [0.18, 0.18]
3 Hằng [0.25, 0.4] [0.52, 0.56]
4 Phương [0.45, 0.50] [0.18, 0.23]
5 Thúy [0.45, 0.45] [0.07, 0.11]
Bảng 4.4. Quan hệ Thunhapcanhan sau khi sử dụng hàm f
165
4.1.2.2. ðối sánh các giá trị khoảng
Cho ðSGT X = (X, G, H, ≤ ) và một giá trị khoảng [a,b]. ðể so sánh
một giá trị x∈X với [a,b], trước hết chuyển [a,b] về ñoạn con của [0,1]. Vì tính
mờ của x là một ñoạn con của [0,1], do ñó ñể so sánh x∈X và ñoạn con [0,1],
chúng ta chỉ cần dựa vào phần giao của hai ñoạn con của [0,1] tương ứng.
Với x∈X, ký hiệu I(x) ⊆ [0,1] và |I(x)| = fm(x), [I
a
,I
b
] = [f(a),f(b)] ⊆
[0,1] tương ứng với việc chuyển ñổi giá trị khoảng [a,b] về ñoạn con của [0,1].
(1) Với mỗi [I
a
,I
b
] nếu tồn tại x∈X sao cho [I
a
,I
b
] ⊆ I(x) thì [a,b] =
|x|
x.
I
a
I
b
I(x)
Hình vẽ 4.2. Khi [I
a
,I
b
] ⊆ I(x)
(2) Với mỗi [I
a
,I
b
] sao cho [I
a
,I
b
]⊄ I(x) ∀x, x
1
∈X thì:
Khi ñó với x và x
1
, giả sử x < x
1
nếu |[I
a
,I
b
]∩I(x)| ≥ |[I
a
,I
b
]|/ £ thì [a,b] =
|x|
x.
I
a
I
b
I(x) I(x
1
)
Hình vẽ 4.3. Khi [I
a
,I
b
]⊄ I(x) (i)
ngược lại nếu |[I
a
,I
b
] ∩ I(x
1
)| ≥ |[I
a
,I
b
]|/£ thì [a,b] =
|x1|
x
1
.
I
a
I
b
I(x) I(x
1
)
Hình vẽ 4.4. Khi [I
a
,I
b
]⊄ I(x) (ii)
với £ là số ñoạn I(x
i
) ⊆ [0,1] sao cho [I
a
,I
b
] ∩ I(x
i
) ≠ ∅.
(3) Với mỗi [I
a
,I
b
] nếu tồn tại x∈X sao cho [I
a
,I
b
] ∩ I(x) = ∅ thì:
Nếu tồn tại z∈X sao cho [I
a
,I
b
] ⊆ I(z) và I(x) ⊆ I(z) thì [a,b] =
|z|
x.
166
I
a
I
b
I(x)
I(z)
Hình vẽ 4.5. Khi [I
a
,I
b
] ∩ I(x) = ∅
Ví dụ 4.10. Cho ðSGT X
Tuoi
= ( X
Tuoi
, G
Tuoi
, H
Tuoi
, ≤ ), với G
Tuoi
= {trẻ, già},
H
+
Tuoi
= {rất, hơn}, H
-
Tuoi
= {khả năng, ít}, rất > hơn và ít > khả năng. W
Tuoi
=
0.6.
fm(trẻ) = 0.6, fm(già) = 0.4, fm(rất) = 0.25, fm(hơn) = 0.25, fm(khả năng) =
0.25, fm(ít) = 0.25. Ta có fm(rất trẻ) = 0.15, fm(hơn trẻ) = 0.15, fm(ít trẻ) =
0.15, fm(khả năng trẻ) = 0.15.
Vì rất trẻ < hơn trẻ < trẻ < khả năng trẻ < ít trẻ nên I(rất trẻ) = [0,0.15],
I(hơn trẻ) = [0.15,0.3], I(khả năng trẻ) = [0.3,0.45], I(ít trẻ) = [0.45,0.6]
Ta có fm(rất già) = 0.1, fm(hơn già) = 0.1, fm(ít già) = 0.1, fm(khả năng già) =
0.1.
Vì ít già < khả năng già < già < hơn già < rất già nên I(ít già) = [0.6,0.7],
I(khả năng già) = [0.7,0.8], I(hơn già) = [0.8,0.9], I(rất già) = [0.9,1].
Hình vẽ 4.6. Tính mờ của trẻ và già
Vì [0.23,0.27] ⊆ I(hơn trẻ) mà [f(23),f(27)] = [0.23,0.27] nên [23,27] =
2
hơn trẻ. Hay khoảng 25 =
2
hơn trẻ. Tương tự ta có [0.25,0.4] ∩ I(hơn trẻ) =
[0.25,0.3] và [0.25,0.4] ∩ I(khả năng trẻ) = [0.3,0.4].
Mặt khác ta có |[0.25,0.3]| = 0.05, |[0.3,0.4]| = 0.1, |[0.25,0.4]|/2 =
0.075. Vì [f(25),f(40)] = [0.25,0.4] và |[0.25,0.4] ∩ I(khả năng trẻ)| ≥
|[0.25,0.4]|/2 nên [25,40] =
2
khả năng trẻ.
167
4.1.3. Ngữ nghĩa dữ liệu dựa trên lân cận tôpô của ðSGT
4.1.3.1. ðộ tương tự mức k
Chúng ta có thể lấy các khoảng mờ của các phần tử ñộ dài k làm ñộ
tương tự giữa các phần tử, nghĩa là các phần tử mà các giá trị ñại diện của
chúng thuộc cùng một khoảng mờ mức k là tương tự mức k. Tuy nhiên, theo
cách xây dựng các khoảng mờ mức k, giá trị ñại diện của các phần từ x có ñộ
dài nhỏ hơn k luôn luôn là ñầu mút của các khoảng mờ mức k. Một cách hợp
lý, khi ñịnh nghĩa lân cận mức k chúng ta mong muốn các giá trị ñại diện như
vậy phải là ñiểm trong (theo nghĩa tôpô) của lân cận mức k. Vì vậy ta ñịnh
nghĩa ñộ tương tự mức k như sau:
Chúng ta luôn luôn giả thiết rằng mỗi tập H
−
và H
+
chứa ít nhất 2 gia
tử. Xét X
k
là tập tất cả các phần từ ñộ dài k. Dựa trên các khoảng mờ mức k và
các khoảng mờ mức k+1 chúng ta mô tả không hình thức việc xây dựng một
phân hoạch của miền [0,1] như sau :
Với k = 1, các khoảng mờ mức 1 gồm I(c
−
) và I(c
+
). Các khoảng mờ
mức 2 trên khoảng I(c
−
) là I(h
p
c
−
) ≤ I(h
p-1
c
−
) ≤ … ≤ I(h
2
c
−
) ≤ I(h
1
c
−
) ≤
υ
A
(c
−
)
≤ I(h
-1
c
−
) ≤ I(h
-2
c
−
) ≤ … ≤ I(h
-q+1
c
−
) ≤ I(h
-q
c
−
). Khi ñó, ta xây dựng phân
hoạch về ñộ tương tự mức 1 gồm các lớp tương ñương sau:
S(0) = I(h
p
c
−
); S(c
−
) = I(c
−
) \ [I(h
-q
c
−
) ∪ I(h
p
c
−
)]; S(W) = I(h
-q
c
−
) ∪ I(h
-q
c
+
);
và một cách tương tự, S(c
+
) = I(c
+
) \ [I(h
-q
c
+
) ∪ I(h
p
c
+
)] và S(1) = I(h
p
c
+
).
Ta thấy, trừ hai ñiểm ñầu mút
υ
A
(0) = 0 và
υ
A
(1) = 1, các giá trị ñại
diện
υ
A
(c
−
),
υ
A
(W) và
υ
A
(c
+
) ñều là ñiểm trong tương ứng của các lớp tương
tự mức 1 S(c
−
), S(W) và S(c
+
).
Tương tự, với k = 2, ta có thể xây dựng phân hoạch các lớp tương tự
mức 2. Chẳng hạn, trên một khoảng mờ mức 2, chẳng hạn, I(h
i
c
+
) =
(
υ
A
(
Φ
h
i
c
+
),
υ
A
(
Σ
h
i
c
+
)] với hai khoàng mờ kề là I(h
i-1
c
+
) và I(h
i+1
c
+
) chúng ta
sẽ có các lớp tương ñương dạng sau: S(h
i
c
+
) = I(h
i
c
+
) \ [I(h
p
h
i
c
+
) ∪ I(h
-q
h
i
c
+
)],
S(
Φ
h
i
c
+
) = I(h
-q
h
i-1
c
+
) ∪ I(h
-q
h
i
c
+
) và S(
Φ
h
i
c
+
) = I(h
p
h
i
c
+
) ∪ I(h
p
h
i
c
+
), với i
sao cho -q ≤ i ≤ p và i ≠ 0.
168
Bằng cách tương tự như vậy ta có thể xây dựng các phân hoạch các lớp
tương tự mức k bất kỳ.
Các giá trị kinh ñiển và các giá trị ngôn ngữ ñược gọi là có ñộ tương tự
mức k nếu các giá trị ñại diện của chúng (ở ñây ñại diện của giá trị thực là
chính nó) cùng nằm trong một lớp tương tự mức k.
4.1.3.2. Lân cận mức k của khái niệm mờ
Giả sử phân hoạch các lớp tương tự mức k là các khoảng S(x
1
), S(x
2
),
…, S(x
m
). Khi ñó, mỗi giá trị ngôn ngữ u chỉ và chỉ thuộc về một lớp tương tự,
chẳng hạn ñó là S(x
i
) và nó gọi là lân cận mức k của u và ký hiệu là
Ω
k
(u).
Dựa trên khái niệm ñộ tương tự, các quan hệ ñối sánh ñược ñịnh nghĩa như
sau :
ðịnh nghĩa 4.4. Cho U là tập vũ trụ các thuộc tính, r là quan hệ xác ñịnh trên
U, giả sử t
1
và t
2
là hai bộ dữ liệu thuộc quan hệ r. Ta ký hiệu t
1
[A
i
] =
k
t
2
[A
i
]
và gọi là chúng bằng nhau mức k, nếu một trong các ñiều kiện sau xảy ra :
(1) Nếu t
1
[A
i
], t
2
[A
i
] ∈
i
A
D
thì t
1
[A
i
] = t
2
[A
i
] ;
(2) Nếu một trong hai giá trị t
1
[A
i
], t
2
[A
i
] là khái niệm mờ, chẳng hạn ñó
là t
1
[A
i
], thì ta phải có t
2
[A
i
] ∈
Ω
k
(t
1
[A
i
]) ;
(3) Nếu cả hai giá trị t
1
[A
i
], t
2
[A
i
] là khái niệm mờ, thì
Ω
k
(t
1
[A
i
]) =
Ω
k
(t
2
[A
i
]).
Như thông thường, nếu ñiều kiện t
1
[A
i
] =
k
t
2
[A
i
] không xảy ra ta có
t
1
[A
i
] ≠
k
t
2
[A
i
].
Do quan hệ tương tự mức k ñược xây dựng bằng một phân hoạch của
ñoạn [0,1], nên có thể thấy quan hệ =
k
là tương ñương trên [0,1]. Ngoài ra, ta
cần nhấn mạnh rằng ñẳng thức t
1
[A
i
] =
k
t
2
[A
i
] có nghĩa L
k
≤ t
1
[A
i
], t
2
[A
i
] ≤ R
k
,
trong ñó L
k
và R
k
là hai ñiểm mút của khoảng
Ω
k
(t
1
[A
i
]) hay
Ω
k
(t
2
[A
i
]). Nghĩa
là, việc kiểm chứng t
1
[A
i
] =
k
t
2
[A
i
] ñược ñưa về việc kiểm chứng các quan hệ
ñối sánh kinh ñiển. Hơn nữa, tính mềm dẻo trong thích nghi với các ứng dụng
cụ thể có thể ñạt ñược bằng việc ñiều chỉnh các tham số của ánh xạ ñịnh lượng
i
A
υ
. ðây chính là ưu ñiểm nổi bật của cách tiếp cận ñại số ñến thông tin mờ.
Dựa trên quan hệ tương ñương này ta có thể dễ dàng ñịnh nghĩa các quan hệ
ñối sánh khác. Trước hết, ñể ñơn giản ta quy ước là ký pháp
Ω
k
(t[A
i
]) có nghĩa
169
cả khi t[A
i
] ∈ D
Ai
. Khi ñó
Ω
k
(t[A
i
]) ñược hiểu là tập bao gồm chỉ ñúng một giá
trị thực t[A
i
]. Với quy ước ñó, với mọi cặp lân cận mức k,
Ω
k
(x) and
Ω
k
(y), ta
sẽ viết
Ω
k
(x) <
Ω
k
(y) khi u < v, với mọi u ∈
Ω
k
(x) và mọi v ∈
Ω
k
(y).
ðịnh nghĩa 4.5. Cho U là tập vũ trụ các thuộc tính, r là quan hệ xác ñịnh trên
U, giả sử t
1
và t
2
là hai bộ dữ liệu thuộc quan hệ r. Khi ñó,
(1) Ta viết t
1
[A
i
] ≤
k
t
2
[A
i
], nếu t
1
[A
i
] =
k
t
2
[A
i
] hoặc
Ω
k
(t
1
[A
i
]) <
Ω
k
(t
2
[A
i
]);
(2) Ta viết t
1
[A
i
] <
k
t
2
[A
i
], nếu
Ω
k
(t
1
[A
i
]) <
Ω
k
(t
2
[A
i
]);
(3) Ta viết t
1
[A
i
] >
k
t
2
[A
i
], nếu
Ω
k
(t
1
[A
i
]) >
Ω
k
(t
2
[A
i
]).
Sau ñây là ñịnh lý khẳng ñịnh họ các khoảng Ω
k
(x) là một phân hoạch của
Dom(A
i
) và giá trị ñịnh lượng của x ∈X luôn là ñiểm trong của lân cận mức k
của x.
ðịnh lý 4.3. Cho một ðSGT tuyến tính ñầy ñủ, tập các gia tử H
−
và H
+
có ít
nhất hai phần tử. Khi ñó, họ các khoảng {Ω
k
(x): x ∈X } ñược gọi là lân cận
mức k của miền trị ngôn ngữ của thuộc tính A
i
và là một phân hoạch của
Dom(A
i
). Hơn nữa, mỗi giá trị x của A
i
có duy nhất một lân cận mức k,
i
A
υ
(x)
là ñiểm trong của
Ω
k
(x) với mọi x∈X.
Mệnh ñề 4.1. Quan hệ =
k
là tương ñương trên Dom(A
i
).
4.2. Phụ thuộc dữ liệu trong cơ sở dữ liệu mờ
4.2.1. Phụ thuộc hàm mờ
Như chúng ta ñã biết, trong mô hình quan hệ, hai dạng phụ thuộc dữ
liệu quan trọng giúp cho việc chuẩn hoá tốt các CSDL là phụ thuộc hàm và
phụ thuộc ña trị. Khi mở rộng mô hình quan hệ ñể có thể biểu diễn và xử lý
ñược những thông tin không chắc chắn, không ñầy ñủ gọi chung là dữ liệu mờ
ñã có rất nhiều công trình tập trung nghiên cứu mở rộng hai dạng phụ thuộc
này trên mô hình mới. ðối với mô hình trong các công trình này là sự mở
rộng mô hình quan hệ theo hai cách : mở rộng ngữ nghĩa và mở rộng miền trị
của thuộc tính. Tuy nhiên, cách mở rộng miền trị của thuộc tính là tốt hơn mở
rộng ngữ nghĩa, bởi vì, cách mở rộng này cho phép bổ sung thêm các cú pháp
170
trong biểu diễn dữ liệu nhằm cho phép biểu diễn ñược dữ liệu mờ. Vì thế, vấn
ñề mở rộng miền trị của thuộc tính, ngoài việc ñưa ký hiệu vào hệ thống, việc
quan trong hơn là giải quyết vấn ñề ngữ nghĩa của các ký hiệu.
Như vậy, khái niệm phụ thuộc hàm mờ (fuzzy functional dependencies)
ñược nhiều tác giả nghiên cứu phát triển dựa trên ý nghĩa của khái niệm phụ
thuộc hàm cổ ñiển với nhiều cách tiếp cận khác nhau. Tuy nhiên, các cách tiếp
cận mở rộng phụ thuộc hàm kinh ñiển này dựa vào 2 nguyên tắc chính:
Nguyên tắc thứ nhất (mở rộng ký hiệu): Nguyên tắc mở rộng này thay
cho quan hệ bằng nhau trên dữ liệu rõ bởi quan hệ gần nhau hoặc quan hệ
tương tự trên dữ liệu mờ và ñặt ngưỡng ñể xác ñịnh ñộ gần nhau.
Nguyên tắc thứ hai (mở rộng ngữ nghĩa): Nguyên tắc này dựa vào ý
nghĩa của các phụ thuộc dữ liệu ñể xây dựng ñịnh nghĩa tương ứng cho mô
hình mới sao cho bảo toàn một số kết quả quan trọng ñã ñược xây dựng trong
mô hình quan hệ.
Ví dụ 4.11. Với cách tiếp cận mở rộng ngữ nghĩa, một phụ thuộc hàm mờ
X~>Y thoả trên quan hệ r khi và chỉ khi ñộ gần nhau của dữ liệu của các bộ
trên tập thuộc tính X kéo theo ñộ gần nhau của các bộ trên tập thuộc tính Y.
Do ñó, phép kéo theo mờ ñóng vai trò quan trọng trong cách tiếp cận này.
Với mô hình CSDL mờ ñược xây dựng trong mục 4.1, một số dạng phụ
thuộc dữ liệu mờ trong mô hình này sẽ ñược ñề xuất.
Xét CSDL mờ {U; R
1
, R
2
…, R
n
, Const}, trong ñó U = {A
1
, A
2
, …, A
n
}
là tập vũ trụ các thuộc tính, const là tập các ràng buộc dữ liệu. Một khi ngữ
nghĩa của CSDL ñược mở rộng, như cho phép lưu trữ trong CSDL các thông
tin không chắc chắn hay cho phép các câu truy vấn chứa các thông tin như
vậy, khi ñó ngữ nghĩa của các phụ thuộc dữ liệu cũng thay ñổi, nghĩa là phải
mở rộng ñịnh nghĩa các dạng phụ thuộc dữ liệu.
Trong thực tế, chúng ta thường gặp các tri thức dạng như Nếu một tập
thể T
1
và
T
2
lao ñộng chăm chỉ như nhau và Tính kỷ luật lao ñộng là tốt thì
Thu nhập của tập thể T
1
và T
2
cao như nhau. Ở ñây ta không nhìn nhận mối
quan hệ trên như là một luật của một cơ sở tri thức nào ñó mà xem như là mối
quan hệ giữa các thuộc tính trong CSDL với thuộc tính Số ngày làm việc trong
tháng, Tính kỷ luật lao ñộng và Thu nhập. Hoặc trong một trường hợp khác
Nếu một tập thể T
1
và T
2
lao ñộng không chăm chỉ và Tính kỷ luật kém giống
171
nhau thì Thu nhập của tập thể T
1
và T
2
thấp như nhau. Trong cả hai trường
hợp trên, mối quan hệ giữa các thuộc tính là không chính xác không giống
như mối quan hệ của các phụ thuộc kinh ñiển, và những phụ thuộc như vậy
ñược gọi là phụ thuộc hàm mờ. Ta giả thiết rằng, trong một trường hợp cụ thể,
mức ñộ xấp xỉ mức k ñược xác ñịnh ứng với mỗi thuộc tính mờ phù hợp với
các phụ thuộc dữ liệu mờ. Nghĩa là, trên cùng một CSDL mờ, có thể có những
hệ phụ thuộc dữ liệu mờ, tùy theo quan ñiểm khai thác dữ liệu của người
dùng.
Với X ⊆ U, r là quan hệ xác ñịnh trên U, t
1
và t
2
là hai bộ thuộc r. Ta
nói rằng bộ t
1
và t
2
bằng nhau mức k trên tập X, ký hiệu t
1
[X] =
k
t
2
[X], nếu với
mọi A ∈ X, ta có t
1
[A] =
k
t
2
[A].
ðịnh nghĩa 4.6. Cho U là một lược ñồ quan hệ, r là một quan hệ xác ñịnh trên
U, xét X, Y ⊆ U. Ta nói rằng, quan hệ r thỏa mãn phụ thuộc hàm mờ X xác
ñịnh Y với mức k, ký hiệu là X
~>
k
Y nếu ta có: với ∀ t
1
, t
2
∈ r, t
1
[X] =
k
t
2
[X]
⇒ t
1
[Y] =
k
t
2
[Y].
Khi ñó, ta cũng nói r ñúng với phụ thuộc hàm mờ X ~>
k
Y, hay ta X
~>
k
Y thỏa trong quan hệ r.
Ví dụ 4.12. Ta xét lược ñồ quan hệ U = { MASO, TENCN, SONLV,
THUNHAP } với ý nghĩa: Mã số công nhân (MASO), Tên công nhân
(TENCN) là 2 thuộc tính kinh ñiển, Số ngày làm việc trong tháng (SONLV),
Thu nhập (THUNHAP) là 2 thuộc tính mờ. Trong ñó D
SONLV
= [0, 30] và
D
THUNHAP
= [0, 100]. LD
SONLV
và LD
THUNHAP
có cùng tập các xâu giống nhau
với tập các phần tử sinh là {0, thấp, W, cao, 1} và tập các gia tử là {ít, khả
năng, hơn, rất}. Mặc dù các thuộc tính ngôn ngữ ñang xét có cùng tập các
xâu, nhưng ngữ nghĩa ñịnh lượng của chúng khác nhau.
(a). ðối với thuộc tính SONLV: fm(cao) = 0.35, fm(thấp) = 0.65,
µ
(khả
năng) = 0.25,
µ
(ít) = 0.20,
µ
(hơn) = 0.15 và
µ
(rất) = 0.40. Ta phân hoạch
ñoạn [0, 30] thành 5 khoảng tương tự mức 1 là: fm(rất cao) × 30 = 0.35 × 0.35
× 30 = 3.675. Vậy S(1) × 30 = (26.325, 30];
(fm(khả năng cao) + fm(hơn cao)) × 30 = (0.25 × 0.35 + 0.15 × 0.35) ×
30 = 4.2 và S(cao) × 30 = (22.125, 26.325];
172
(fm(ít thấp) + fm(ít cao)) × 30 = (0.25 × 0.65 + 0.25 × 0.35) × 30 = 7.5
và S(W) × 30 = (14.625, 22.125];
(fm(khả năng thấp) + fm(hơn thấp)) × 30 = (0.25 × 0.65 + 0.15 × 0.65)
× 30 = 7.8 và S(thấp) × 30 = (6.825, 14.625], S(0) × 30 = [0, 6.825].
(b). ðối với thuộc tính THUNHAP: fm(cao) = 0.6, fm(thấp) = 0.4,
µ
(khả năng) = 0.15,
µ
(ít) = 0.25,
µ
(hơn) = 0.25 và
µ
(rất) = 0.35. Ta phân
hoạch ñoạn [0, 100] thành 5 khoảng tương tự mức 1 là: fm(rất cao) × 100 =
0.35 × 0.6 × 100 = 21. Vậy S(1) × 100 = (79, 100];
(fm(khả năng cao) + fm(hơn cao)) × 100 = (0.25 × 0.6 + 0.15 × 0.6) ×
100 = 24 và S(cao)) × 100 = (55, 79];
(fm(ít thấp) + fm(ít cao)) × 100 = (0.25 × 0.6 + 0.25 × 0.4) × 100 = 25
và S(W) × 100 = (30, 55];
(fm(khả năng thấp) + fm(hơn thấp)) × 100 = (0.25 × 0.4 + 0.15 × 0.4) ×
100 = 16 và S(thấp) × 100 = (14, 30], S(0) × 100 = [0, 14].
Quan hệ Chamcong trong ví dụ này ñược cho ở bảng 4.5
MASO
TENCN SONLV THUNHAP
N1 An 27 90
N2 Cường 17 25
N3 Hà 28 94
N4 Hương cao cao
N5 Lan 24 72
N6 Kiên cao cao
N7 Thanh 20 thấp
N8 Thủy 21 29
N9 Yến thấp 11
Bảng 4.5. Quan hệ Chamcong
Chúng ta có thể thấy rằng phụ thuộc hàm mờ SONLV ~>
1
THUNHAP
ñúng trong quan hệ Chamcong.
Gọi
F
FF
F
k
là họ tất cả các phụ thuộc hàm mờ X ~>
k
Y trên lược ñồ quan hệ
U. Ta ký hiệu
F
FF
F
k
+
là tập tất cả các phụ thuộc hàm mờ X ~>
k
Y mà ñược suy
diễn từ
F
FF
F
k
, tức là với mọi quan hệ r trên U, nếu r thỏa các thụ thuộc dữ liệu
173
trong
F
FF
F
k
thì r cũng thỏa X ~>
k
Y. Ta có thể dễ dàng kiểm chứng họ các phụ
thuộc hàm mờ
F
FF
F
k
+
thoả các tiên ñề sau:
ðịnh lý 4.4. Trong CSDL mờ với tập vũ trụ các thuộc tính U, họ
F
FF
F
k
+
thỏa
mãn các tiên ñề sau:
(1) Phản xạ: X ~>
k
X ∈
F
FF
F
k
+
.
(2) Gia tăng: X ~>
k
Y ∈
F
FF
F
k
+
⇒ XZ ~>
k
YZ ∈
F
FF
F
k
+
.
(3) Bắc cầu: X ~>
k
Y ∈
F
FF
F
k
+
, Y ~>
k
Z ∈
F
FF
F
k
+
⇒ X ~>
k
Z ∈
F
FF
F
k
+
.
(4) Bao hàm mức: X ~>
k
Y ∈
F
FF
F
k
+
⇒ X ~>
k’
Y ∈
F
FF
F
k
+
với mọi 0 < k’≤ k.
Các tiên ñề (1)-(4) trong ñịnh lý 4.4 là ñúng ñắn và ñầy ñủ.
Chứng minh: Tính ñúng ñắn của hệ tiên ñề (1)-(4)
(1): Hiển nhiên ta có với ∀t
1
, t
2
∈ r, t
1
[X] =
k
t
2
[X] ⇒ t
1
[X] =
k
t
2
[X], hay X ~>
k
X ∈
F
FF
F
k
+
.
(2): Vì X ~>
k
Y ∈
F
FF
F
k
+
(giả thiết) nên theo ñịnh nghĩa ta có với ∀t
1
, t
2
∈ r, t
1
[X]
=
k
t
2
[X] ⇒ t
1
[Y] =
k
t
2
[Y]. Từ t
1
[XZ] =
k
t
2
[XZ] và t
1
[X] =
k
t
2
[X] suy ra t
1
[Z] =
k
t
2
[Z] (1’).
Từ t
1
[Y] =
k
t
2
[Y] và t
1
[Z] =
k
t
2
[Z] suy ra t
1
[YZ] =
k
t
2
[YZ] (2’). Vậy, từ (1’), (2’)
ta có ∀t
1
, t
2
∈ r, t
1
[XZ] =
k
t
2
[XZ] ⇒ t
1
[YZ] =
k
t
2
[YZ], hay XZ ~>
k
YZ ∈
F
FF
F
k
+
.
(3): Vì X ~>
k
Y ∈
F
FF
F
k
+
(giả thiết) nên theo ñịnh nghĩa ta có với ∀ t
1
, t
2
∈ r,
t
1
[X] =
k
t
2
[X] ⇒ t
1
[Y] =
k
t
2
[Y] (1’) và Y ~>
k
Z ∈
F
FF
F
k
+
(giả thiết) nên theo ñịnh
nghĩa ta có với ∀t
1
, t
2
∈ r, t
1
[Y] =
k
t
2
[Y] ⇒ t
1
[Z] =
k
t
2
[Z] (2’). Từ (1’), (2’) ta
có với ∀ t
1
, t
2
∈ r, t
1
[X] =
k
t
2
[X] ⇒ t
1
[Z] =
k
s[Z], hay X ~>
k
Z ∈
F
FF
F
k
+
.
(4): Vì X ~>
k
Y ∈
F
FF
F
k
+
(giả thiết) nên theo ñịnh nghĩa ta có với ∀t
1
, t
2
∈ r, t
1
[X]
=
k
t
2
[X] ⇒ t
1
[Y] =
k
t
2
[Y]. Ta có ∀t
1
, t
2
∈ r, t
1
[X] =
k
t
2
[X] ⇒ t
1
[X] =
k’
t
2
[X] với
mọi 0 < k’≤ k (1’). Ta có với ∀t
1
, t
2
∈ r, t
1
[Y] =
k
t
2
[Y] ⇒ t
1
[Y] =
k’
t
2
[Y] với
mọi 0 < k’≤ k (2’). Từ (1’), (2’) ta có với ∀t
1
, t
2
∈ r, t
1
[X] =
k’
t
2
[X] ⇒ t
1
[Y] =
k’
t
2
[Y] với mọi 0 < k’≤ k, hay X ~>
k’
Y ∈
F
FF
F
k
+
với mọi 0 < k’≤ k.
Tính ñầy ñủ của hệ tiên ñề (1)-(4)
Chúng ta dễ dàng thấy rằng trong một quan hệ 2-bộ r với các bộ t
1
và t
2
chỉ
chứa các giá trị lớn nhất và nhỏ nhất trong miền giá trị thuộc tính, ñiều kiện
t
1
[X] =
k
t
2
[X] và t
1
[Y] =
k
t
2
[Y] là tương ñương với ñiều kiện t
1
[X] = t
2
[X] và
t
1
[Y] = t
2
[Y], vì khi ñó các khoảng phân hoạch (do nó chứa ít nhất hai lớp
174
tương ñương) của các thuộc tính mờ chỉ chứa một trong hai giá trị này. Do ñó,
nếu quan hệ 2-bộ r như vậy thỏa một phụ thuộc hàm mờ nào ñó ở mức k, thì
nó cũng thỏa phụ thuộc ñó khi ñược xem như là một phụ thuộc hàm kinh ñiển.
Vì vậy, cũng như ñối với họ phụ thuộc hàm kinh ñiển, nếu X ~>
k
Y ∉
F
FF
F
k
+
thì
tồn tại một quan hệ 2-bộ r sao cho r thỏa
F
FF
F
k
nhưng không thỏa phụ thuộc hàm
mờ X ~>
k
Y. Có nghĩa là, hệ tiên ñề (1)-(4) trong ñịnh lý 4.4 là ñầy ñủ.
Như vậy, chúng ta thấy ở mức cú pháp, phụ thuộc hàm mờ trùng với
phụ thuộc hàm kinh ñiển nhưng ngữ nghĩa khác nhau, ñặc biệt một quan hệ r
có thể thỏa mãn một phụ thuộc hàm mờ X ~>
k
Y nào ñó nhưng không nhất
thiết phải thỏa mãn X ~>
k
Y với tư cách là một phụ thuộc hàm kinh ñiển.
Vì phụ thuộc hàm kinh ñiển là trường hợp riêng của phụ thuộc hàm mờ,
nên ta có mệnh ñề thể hiện mối quan hệ giữa hai loại phụ thuộc này.
Mệnh ñề 4.2
(1) Nếu X → Y và Y ~>
k
Z ∈
F
FF
F
k
+
thì X ~>
k
Z ∈
F
FF
F
k
+
.
(2) Nếu X ~>
k
Y ∈
F
FF
F
k
+
và Y → Z thì X ~>
k
Z ∈
F
FF
F
k
+
.
Chứng minh :
(1): Vì X → Y nên với ∀t
1
, t
2
∈ r, t
1
[X] = t
2
[X] ⇒ t
1
[Y] = t
2
[Y]. Mặc khác, ta
có t
1
[X] = t
2
[X] ⇒ t
1
[X] =
k
t
2
[X] và t
1
[Y] = t
2
[Y] ⇒ t
1
[Y] =
k
t
2
[Y], do ñó X ~>
k
Y ∈
F
FF
F
k
+
(1’).
Theo giả thiết, ta có Y ~>
k
Z ∈
F
FF
F
k
+
(2’). Từ (1’), (2’) ta suy ra X ~>
k
Z ∈
F
FF
F
k
+
.
(2): Vì Y → Z nên với ∀t
1
, t
2
∈ r, t
1
[Y] = t
2
[Y] ⇒ t
1
[Z] = t
2
[Z]. Mặc khác, ta
có t
1
[Y] = t
2
[Y] ⇒ t
1
[Y] =
k
t
2
[Y] và t
1
[Z] = t
2
[Z] ⇒ t
1
[Z] =
k
t
2
[Z], do ñó Y ~>
k
Z
∈
F
FF
F
k
+
(1’).
Theo giả thiết, ta có X ~>
k
Y ∈
F
FF
F
k
+
(2’). Từ (1’), (2’) ta suy ra X ~>
k
Z ∈
F
FF
F
k
+
.
Một phụ thuộc hàm mờ X ~>
k
Y ñúng trong quan hệ r có nghĩa là “với mọi”
hai bộ dữ liệu bất kỳ thuộc quan hệ r, nếu giá trị trên tập thuộc tính X bằng
nhau theo mức k thì giá trị trên tập thuộc tính Y bằng nhau theo mức k. Tuy
nhiên, trong thực tế, khi xét một quan hệ nào ñó, có thể “tồn tại” hai bộ dữ
liệu mà giá trị trên tập thuộc tính X bằng nhau theo mức k nhưng giá trị trên
tập thuộc tính Y khác nhau theo mức k. Như vậy, ở ñây không tồn tại phụ
thuộc hàm mờ, bởi vì nó không thoả mãn “với mọi” nhưng có thể thoả mãn
175
“hầu hết” hoặc “một ít”, các dạng phụ thuộc này ñược gọi là phụ thuộc hàm
mờ với lượng từ ngôn ngữ.
4.2.2. Phụ thuộc hàm mờ với lượng từ ngôn ngữ
4.2.2.1. ðặt vấn ñề
Chúng ta thường gặp những tri thức dạng: trong cơ quan những cán bộ
có kinh nghiệm làm việc xấp xỉ nhau thì có thu nhập xấp xỉ nhau. ðối với
dạng tri thức như vậy, trong phần 4.2.1 chúng ta ñã nghiên cứu và gọi ñó là
phụ thuộc hàm mờ. Ở phụ thuộc hàm mờ này có ý nghĩa là với mọi hai cán bộ
bất kỳ trong cơ quan nếu có kinh nghiệm làm việc xấp xỉ nhau thì có thu nhập
xấp xỉ nhau. Tuy nhiên, trong thực tế có những cán bộ có kinh nghiệm làm
việc xấp xỉ nhau nhưng có thu nhập khác nhau do nhiều yếu tố khác tác ñộng
như: chủ nhiệm ñề tài nghiên cứu cơ bản, kiêm nhiệm các chức vụ chủ chốt
trong cơ quan… Do ñó các tri thức thỏa mãn với mọi ñòi hỏi khá chặt về ràng
buộc dữ liệu trong CSDL.
Vì vậy, việc sử dụng các lượng từ ngôn ngữ như một vài, hầu hết… vào
trong phụ thuộc hàm mờ làm cho việc mô tả các phụ thuộc dữ liệu ñược mềm
dẽo và thực tế hơn, chẳng hạn như: hầu hết trong cơ quan những cán bộ có
kinh nghiệm làm việc xấp xỉ nhau thì có thu nhập xấp xỉ nhau.
4.2.2.2. Phụ thuộc hàm mờ với lượng từ ngôn ngữ
Trước tiên, phương pháp ñịnh giá lượng từ ngôn ngữ ñược trình bày
trước khi xây dựng dạng phụ thuộc dữ liệu.
a. Phương pháp ñịnh giá lượng từ ngôn ngữ
Zadeh chia lượng từ ngôn ngữ thành hai loại ñó là: lượng từ tuyệt ñối
và lượng từ tỉ lệ. Lượng từ tuyệt ñối thường dùng trong các mệnh ñề có số
lượng xác ñịnh như “ít nhất 5”, “nhiều hơn 3” Lượng từ tỉ lệ thể hiện
những số lượng phụ thuộc vào số lượng tập các ñối tượng ñang xử lý, chẳng
hạn như “hầu hết”, “một vài”
Gọi D
r
= [0 ||r||], trong ñó ||r|| là số bộ dữ liệu trong quan hệ r. Chúng
ta có thể chia lượng từ thành hai trường hợp:
176
Trường hợp Q là lượng từ tuyệt ñối: Ký hiệu ||Q|| là số lượng xác ñịnh
lượng từ Q.
Nếu Q ñơn ñiệu tăng : Ta xây dựng một hàm f
Q
A
: D
r
→ {0, 1} sao cho:
∀x∈D
r
, f
Q
A
(x) = 1 nếu x ≥ ||Q|| và f
Q
A
(x) = 0 nếu ngược lại.
Nếu Q ñơn ñiệu giảm : Ta xây dựng một hàm f
Q
D
: D
r
→ {0, 1} sao cho:
∀x∈D
r
, f
Q
D
(x) = 1 nếu x ≤ ||Q|| và f
Q
D
(x) = 0 nếu ngược lại.
Trường hợp Q là lượng từ tỷ lệ: Khi ta nói hầu hết các bộ dữ liệu t trong r
thỏa mãn ñiều kiện (fc
1
, fc
2
, fc
n
), có nghĩa là tổng số bộ dữ liệu t phải xấp
xỉ ||r||. Hoặc trong trường hợp khác, chỉ một ít các bộ dữ liệu t trong r thỏa
mãn ñiều kiện (fc
1
, fc
2
, fc
n
), có nghĩa là tổng số bộ dữ liệu t phải xấp xỉ
1/||r||. Hay một giả thiết ta thường gặp ñó là khoảng một nửa các bộ dữ liệu t
trong r thỏa mãn ñiều kiện (fc
1
, fc
2
, fc
n
), khi ñó chắc chắn rằng tổng số bộ
dữ liệu t phải là xấp xỉ của ||r||/2.
ðiều này gợi ý cho chúng ta có thể ñánh giá lượng từ tỉ lệ dựa trên sự
phân hoạch của [0 ||r||]. Theo mục 2.1 ñể chuẩn hóa [0 ||r||], nhờ một phép
biến ñổi tuyến tính, ta giả thiết mọi miền D
r
= [0 ||r||] như vậy ñều là khoảng
[0,1]. Khi ñó ta xây dựng hai khoảng mờ của hai khái niệm nguyên thủy nhỏ
và lớn, ký hiệu là I(nhỏ) và I(lớn) với ñộ dài tương ứng là fm(nhỏ) và fm(lớn)
sao cho chúng tạo thành một phân hoạch của miền tham chiếu [0,1]. Tiếp ñến,
ñi xây dựng các lớp tương ñương S(1), S(lớn), S(W), S(nhỏ), S(0) dựa vào ñộ
ño tính mờ của các gia tử và các khái niệm nguyên thủy.
Do ñó, nếu gọi ||r
1
||, ||r
2
|| tương ứng là tổng số bộ dữ liệu t trong r thỏa
mãn ñiều kiện (fc
1
, fc
2
, fc
n
) với lượng từ hầu hết và một ít thì ||r
1
|| ∈ S(1) ×
||r|| và ||r
2
|| ∈ S(0) × ||r||.
Như vậy, ta có thể khẳng ñịnh rằng tổng số bộ dữ liệu t trong r thỏa
mãn ñiều kiện (fc
1
, fc
2
, fc
n
) áp dụng với lượng từ Q ñược ký hiệu ||r
Q
||, khi
ñó: ||r
Q
|| ∈ S(1) × ||r|| hoặc ||r
Q
|| ∈ S(lớn) × ||r||, hoặc ||r
Q
|| ∈ S(W) × ||r||, hoặc
||r
Q
|| ∈ S(nhỏ) × ||r||, hoặc ||r
Q
|| ∈ S(0) × ||r|| hay nói cách khác: ||r
Q
||/||r|| phải
thuộc về 1 trong các khoảng: S(1), S(lớn), S(W), S(nhỏ), S(0).
b. ðưa lượng từ ngôn ngữ vào phụ thuộc hàm mờ
177
ðể ñưa lượng từ ngôn ngữ vào phụ thuộc hàm mờ, chúng ta ñề xuất một số
khái niệm liên quan ñến các bộ trong quan hệ.
ðịnh nghĩa 4.7. Cho U là một lược ñồ quan hệ, r là một quan hệ trên U, xét
hai tập X, Y ⊆ U. Ta nói rằng bộ t thỏa mãn tập X và tập Y trong quan hệ r
với mức k, ñược xác ñịnh t
k
(XY) = 1 nếu một trong các ñiều kiện sau xảy ra:
(1) : Tồn tại bộ t
’
≠ t : t[X] =
k
t
’
[X] và t[Y] =
k
t
’
[Y] hoặc là
(2) : Với mọi bộ t
’
≠ t : t[X] ≠
k
t
’
[X].
Khi ñó ta cũng nói bộ t’ thỏa mãn tập X và tập Y trong quan hệ r với mức k,
ñược xác ñịnh t
’
k
(XY) = 1.
ðịnh nghĩa 4.8. Cho U là một lược ñồ quan hệ, r là một quan hệ xác ñịnh trên
U, xét X, Y ⊆ U. Ta nói rằng bộ t thỏa mãn tập X nhưng không thỏa mãn tập
Y trong quan hệ r với mức k, ñược xác ñịnh t
k
(XY)=0 nếu tồn tại bộ t’≠ t : t[X]
=
k
t’ [X] và t[Y]≠
k
t’ [Y].
Khi ñó ta cũng nói bộ t’ thỏa mãn tập X và không thỏa mãn tập Y trong
quan hệ r với mức k, ñược xác ñịnh t’
k
(XY) = 0.
Ký hiệu r
thoa
= {t∈r : t
k
(XY) = 1} và r
khong
= {t ∈ r : t
k
(XY) = 0}. Trong
phụ thuộc hàm mờ chỉ xét các lượng từ tuyệt ñối và lượng từ tỉ lệ “Hầu hết”.
ðể ñảm bảo một số kết quả như trong CSDL kinh ñiển, chúng tôi chỉ
xét lượng từ Q ñơn ñiệu tăng trong trường hợp lượng từ tuyệt ñối.
ðịnh nghĩa 4.9. Cho U là một lược ñồ quan hệ, r là một quan hệ xác ñịnh trên
U, xét X, Y ⊆ U. Ta nói rằng quan hệ r thỏa mãn phụ thuộc hàm mờ X xác
ñịnh Y mức k và lượng từ ngôn ngữ Q, ký hiệu là X~>
kQ
Y khi và chỉ khi
f
Q
A
(||r
thoa
||) = 1, với Q là lượng từ tuyệt ñối hoặc ||r
thoa
||/(||r
thoa
|| + ||r
khong
||)
∈S(1), với Q là lượng từ “Hầu hết”.
Ví dụ 4.13. Ta xét lược ñồ quan hệ U = {STT, TEN, HESO, THAMNIEN,
LUONG} với ý nghĩa: Số thứ tự (STT), Tên cán bộ (TEN), Hệ số lương
(HESO) là 3 thuộc tính kinh ñiển, Thâm niên (THAMNIEN), Lương (LUONG)
là 2 thuộc tính mờ. Trong ñó D
THAMNIEN
= [0, 40] và D
LUONG
= [0, 500].
LD
THAMNIEN
và LD
LUONG
có cùng tập các xâu giống nhau với tập các phần tử
sinh là {0, thấp, W, cao, 1} và tập các gia tử là {ít, khả năng, hơn, rất}.
178
(a). ðối với thuộc tính THAMNIEN: fm(cao) = 0.35, fm(thấp) = 0.65,
µ
(khả
năng) = 0.25,
µ
(ít) = 0.20,
µ
(hơn) = 0.15 và
µ
(rất) = 0.40.
Ta phân hoạch ñoạn [0, 40] thành 5 khoảng tương tự mức 1 là: fm(rất
cao) × 40 = 0.35 × 0.35 × 40 = 4.9. Vậy S(1) × 40 = (35.1, 40].
(fm(khả năng cao) + fm(hơn cao)) × 40 = (0.25 × 0.35 + 0.15 × 0.35) ×
40 = 5.6 và S(cao) × 40 = (29.5, 35.1];
(fm(ít thấp) + fm(ít cao)) × 40 = (0.25 × 0.65 + 0.25 × 0.35) × 40 = 10
và S(W) × 40 = (19.5, 29.5];
(fm(khả năng thấp) + fm(hơn thấp)) × 40 = (0.25 × 0.65 + 0.15 × 0.65)
× 40 = 10.4 và S(thấp) × 40 = (9.1, 19.5]; S(0) × 40 = [0, 9.1].
(b). ðối với thuộc tính LUONG: fm(cao) = 0.6, fm(thấp) = 0.4,
µ
(khả năng) =
0.15,
µ
(ít) = 0.25,
µ
(hơn) = 0.25 và
µ
(rất) = 0.35.
Ta phân hoạch ñoạn [0, 500] thành 5 khoảng tương tự mức 1 là: fm(rất
cao) × 500 = 0.35 × 0.6 × 500 = 105. Vậy S(1) × 500 = (395, 500].
(fm(khả năng cao) + fm(hơn cao)) × 500 = (0.25 × 0.6 + 0.15 × 0.6) ×
500 = 120 và S(cao)) × 500 = (275, 395];
(fm(ít thấp) + fm(ít cao)) × 500 = (0.25 × 0.6 + 0.25 × 0.4) × 500 = 125
và S(W) × 500 = (150, 275];
(fm(khả năng thấp) + fm(hơn thấp)) × 500 = (0.25 × 0.4 + 0.15 × 0.4) ×
500 = 80 và S(thấp) × 500 = (70, 150]; S(0) × 500 = [0, 70].
Quan hệ Luong trong ví dụ này ñược cho ở bảng 4.6
STT TEN HESO THAMNIEN LUONG
1 Thanh 3.5 20 300
2 Loan 3.7 25 cao
3 Hàng 4.5 36 450
4 Hà 4.3 37 470
5 Thủy 2.5 thấp thấp
6 Nhật 1.9 thấp 185
7 Cường 3.0 27 350
8 Thương 3.1 28 cao
9 Miên 2.8 22 310
Bảng 4.6. Quan hệ Luong