Áp dụng lý thuyết tập mờ để mở rộng CSDL quan hệ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (627.08 KB, 11 trang )

TẠP CHÍ KHOA HỌC ĐẠI HỌC SÀI GÒN

Số 1 (26) - Tháng 1/2015

ÁP DỤNG LÝ THUYẾT TẬP M

ĐỂ MỞ RỘNG CSDL QUAN HỆ
NGUYỄN HỊA(*)
NGUYỄN THỊ UN NHI (**)

T M TẮT
-Fuzzy Relational
eM e)
)

r

ủ

r
)

r

r

r

ủ

M

ủ

r

r

ủ

M

ủ
r

ủ
r

óa: tậ

r

.
ờ, qu

ờ,

sở d

u qu

ờ

é o

ạ s qu

ờ.

ABSTRACT
This paper introduces a fuzzy relational data base model (FRDB) that extends the
conventional relational data base model with two key features: (1) the relations represent
the set of data tuples to be the fuzzy relations; (2) selection conditions are associated with
fuzzy set values to be able to query the fuzzy, imprecise information of objects in relations.
An interpretation of the membership degree of tuples for fuzzy relations is proposed on the
foundation of the fuzzy set theory as the basis to develop the data and data manipulating
model of FRDB including schemas, fuzzy relations and algebraic operations. Some
properties of the fuzzy relational algebraic operations also are formulated and proven as
those that are extended of the properties of relational algebraic operations in the
conventional relational data base model.
Keywords: fuzzy set, fuzzy relation, fuzzy relational data base, fuzzy relational
algebraic operation.
1. GIỚI THIỆU(*)(**)
Như chúng ta đã biết, mơ hình
sở
d
u qu
uyề
(conventional
relational data base), được đề nghị bởi
Codd E.F năm 1 70 ([2]), đã chứng tỏ

nhiều ưu điểm trong các vấn đề mơ hình
hóa, thiết kế và hiện thực các hệ thống lớn,
(*)

từ phần mềm cho đến cơ sở dữ liệu
(CSDL). Tuy nhiên, các ứng dụng dựa trên
mơ hình CSDL quan hệ truyền thống
khơng biểu diễn được các đối tượng mà
thơng tin về chúng khơng được xác định
một cách rõ ràng và chính xác. Điều đó
làm hạn chế khả năng mơ hình hóa và giải
quyết các bài tốn áp dụng trong thế giới
thực. Chẳng hạn, các ứng dụng mơ hình

TS, Trường Đại học Sài Gòn
ThS, Trường Đại học Sài Gòn

(**)

108

CSDL truyền thống không thể trả lời được
các truy vấn kiểu như “tìm tất cả những
bệnh nhân ẻ có tiền sử bệnh viêm thanh
quản”; hoặc “tìm tất cả các gói bưu kiện có
trọng lượng k oả
10 kg và được vận
chuyển trong thời gian k oả 36 giờ từ
Hà Nội đến Sài Gòn”, v.v. Trong đó ẻ,

k oả 10 kg và k oả 36 giờ là những
khái niệm và giá trị không chính xác. Để
khắc phục được các hạn chế như vậy, cần
phải xây dựng các mô hình dữ liệu có khả
năng biểu diễn và xử lý được các đối tượng
mà các thông tin về chúng có thể không rõ
ràng (mờ) và không chính xác.
Trong những năm qua đã có nhiều mô
hình cơ sở dữ liệu quan hệ dựa trên lý
thuyết ậ
ờ (fuzzy set) được nghiên cứu
và xây dựng nhằm mô hình hóa các đối
tượng mà thông tin về chúng mờ, không
chính xác [1], [3], [7], [9], [10]. Các mô
hình như vậy gọi là ô ì
sở d
u
qu
ờ (fuzzy relational data base
model). Tuy nhiên, do tính đa dạng và
phức tạp về sự tồn tại của các đối tượng
cũng như các mối quan hệ của chúng nên
khó có mô hình nào có thể biểu diễn và xử
lý hết mọi khía cạnh không chắc chắn và
không chính xác về thông tin của các đối
tượng trong thế giới thực. Vì vậy, các mô
hình CSDL mờ vẫn được tiếp tục nghiên
cứu và phát triển để đáp ứng các mục tiêu
ứng dụng khác nhau.
Có hai cách tiếp cận chính để biểu diễn

dữ liệu mờ trong mô hình CSDL mờ: (1)
biểu diễn giá trị thuộc tính bằng các giá trị
tập mờ trong quan hệ mờ; (2) biểu diễn giá
trị thuộc tính bằng các giá trị rõ trong quan
hệ mờ.

Trong cách tiếp cận thứ nhất, giá trị
thuộc tính quan hệ được biểu diễn bằng
một tập mờ và được diễn dịch bởi hàm
thành viên của nó ([4], [7], [ ], [11]).
Trong các mô hình được xây dựng bằng
cách tiếp cận này, các quan hệ hai ngôi cổ
điển giữa các thuộc tính được mở rộng
thành các quan hệ mờ. Mức độ thành viên
của các bộ được ẩn trong mức độ thành
viên của các giá trị thuộc tính. Trong cách
tiếp cận thứ hai, giá trị thuộc tính quan hệ
được biểu diễn bằng một giá trị đơn rõ
trong một quan hệ mờ trên các miền giá trị
của các thuộc tính đó ([ ], [ ], [10]). Trong
các mô hình được xây dựng bằng cách tiếp
cận này, các quan hệ nhiều ngôi cổ điển
(quan hệ trên các lược đồ CSDL) được mở
rộng thành các quan hệ nhiều ngôi mờ và
mức độ thành viên của các giá trị thuộc
tính được ẩn trong mức độ thành viên của
các bộ trong các quan hệ mờ này.
Trong bài báo này, chúng tôi đề nghị
một mô hình CSDL quan hệ mờ (FRDB)
dựa trên cách tiếp cận thứ hai. Để xây dựng

FRDB, chúng tôi áp dụng lý thuyết tập mờ
([6], [12]), mở rộng quan hệ và các phép
toán đại số quan hệ truyền thống ([5])
thành quan hệ mờ và các phép toán đại số
quan hệ mờ. Chúng tôi cũng đề nghị một
diễn dịch mức độ thành viên của các bộ đối
với một quan hệ cho các điều kiện chọn
làm cơ sở để truy vấn với thông tin mờ,
không chính xác trong FRDB.
Cơ sở toán học để phát triển FRDB
được trình bày trong Phần 2, lược đồ và thể
hiện FRDB được giới thiệu trong Phần 3.
Phần 4 trình bày các phép toán đại số trên
FRDB và cuối cùng, Phần là một số kết
109

luận và hướng nghiên cứu trong tương lai.
2. CƠ SỞ TOÁN HỌC CỦA FRDB
Phần này giới thiệu tập mờ và quan hệ
mờ như là cơ sở toán để phát triển FRDB.
Tập mờ được sử dụng để biểu diễn các truy
vấn với thông tin không rõ ràng, quan hệ
mờ được sử dụng để mở rộng các quan hệ
trong FRDB.
2.1. ập mờ
Tập mờ là khái niệm mở rộng của tập
cổ điển và được định nghĩa như sau.
Định nghĩa 2.1.1 Giả sử X là một tập
khác rỗng, một ánh xạ từ X đến khoảng

đóng [0, 1],

A:

X

[0, 1], xác định

2.2. Bi u diễn tập mờ
Trong các ứng dụng, ngoài cách biểu
diễn tập mờ A như một hàm thành viên A:
X → [0, 1], còn có một số cách biểu diễn
tập mờ như sau:
1. Đối với tập X hữu hạn, một tập mờ
A trên X thường được biểu diễn bởi một hệ
thức có dạng A =
, trong đó ai =
A(xi) ≠ 0.
2. Đối với tập X vô hạn không đếm
được, thường là tập số thực, một tập mờ A
trên X có thể được biểu diễn bởi
A = ∫x
A(x)/x.
Chúng tôi lưu ý dấu tích phân ở đây
chỉ có ý nghĩa thể hiện một tập vô hạn
không đếm được các cặp x và A(x) trong X
định nghĩa cho A.
2.3. C c p ép t n trên tập mờ
Các phép toán trên các tập mờ được
định nghĩa một cách tổng quát dựa trên các

ánh xạ từ tập tích Descartes của các khoảng
đóng [0,1] đến khoảng đóng [0,1]. Tuy
nhiên, phần này chỉ giới thiệu các phép
o
uẩ (standard operation) trên các
tập mờ ([6], [12]) được ứng dụng trong
FRDB.
Định nghĩa 2.3.1 Giả sử A, B là hai tập
mờ trên tập X và có các hàm thành viên lần

ộ

ậ
ờ (fuzzy set) A trên X. Ánh xạ A
được gọi là hàm thành viên (membership
function) của tập mờ A. Với mỗi x  X,
là
ộ
(membership
degree) của x đối với A.
Để đơn giản, ký hiệu A: X
[0, 1] có
thể được sử dụng để biểu diễn tập mờ A.
Ví dụ 2.1.1 Một ví dụ đơn giản về tập
mờ là tập các số gần số 2, about_2, được
cho bởi hàm thành viên của nó như sau:
A(x)

 x  1 x  [1, 2]


about _ 2  3  x x  (2, 3]
0 x  [1,3]


và đồ thị hàm thành viên của about_2
như trong Hình 2.2.1.

lượt là A, B. Phép toán lấy phần bù của
A, hợp, giao và hiệu của A và B được định
nghĩa theo hàm thành viên của chúng như
sau.
1. Ac(x) = 1-A(x), x X
2. AB(x) = max(

A(x),

B(x)),

x  X

3. AB(x) = min(

A(x),

B(x)),

x X

4. A-B(x) = min(
Hì

2.1.1: Tậ

ờ

s

ầ 2
110

A(x),

1-B(x)), x X.

Chúng tôi lưu ý rằng, như trong CSDL
quan hệ truyền thống, để đơn giản, có thể
viết R(U, ) thay cho cách viết R = (U, ).
Ngoài ra, mỗi t = (v1, v2, …, vk) được gọi là
một bộ trên tập thuộc tính {A1, A2, …, Ak}.
Ví dụ 3.1.1 Một lược đồ quan hệ mờ
PATIENT trong FRDB mô tả về các bệnh
nhân có thể như sau:
PATIENT(PATIENT_ID,
PATIENT_NAME, AGE, SEX, ), với 
là ánh xạ
: string  string real  binary[0,
1], trong đó string, real và binary là các
miền giá trị của các thuộc tính
PATIENT_ID, PATIENT_NAME, AGE

và SEX
3.2. Quan ệ FRDB
Quan hệ mờ được mở rộng từ quan hệ
truyền thống với mức độ thuộc được gán
cho mỗi bộ như định nghĩa dưới đây.
Định nghĩa 3.2.1 Giả sử U = {A1, A2,
… Ak} là một tập thuộc tính đôi một khác
nhau, một quan h mờ (fuzzy relation) r
trên lược đồ R(U, ) là một tập hữu hạn
các bộ {t1, t2,…, tn} trên tập các thuộc tính
{A1, A2, …, Ak}, được kết hợp tương ứng
với các giá trị (ti) biểu diễn mức độ thuộc
của ti trong r. Các ký hiệu t.A hoặc t[A]
biểu thị giá trị thuộc tính A của bộ t trong r.
Mức độ thuộc của ti trong r được ký hiệu là
r(ti).
Chúng tôi cũng dùng ký hiệu t[X] để
biểu thị giá trị thu hẹp của bộ t trên tập
thuộc tính X  {A1, A2 … Ak}.
Ví dụ 3.2.1
Một quan hệ mờ r
trên lược đồ PATIENT(PATIENT_ID,
PATIENT_NAME,
SEX,
MEDICAL_HISTORY, ) có thể như

2.4. Quan ệ mờ
Khái niệm quan hệ mờ là cơ sở để xây
dựng CSDL quan hệ mờ. Quan hệ mờ được
định nghĩa bằng cách mở rộng quan hệ cổ

điển như sau.
Định nghĩa 2.4.1 Giả sử A1, A2,…, Ak
là các tập khác rỗng, một quan hệ mờ kngôi R giữa k tập A1, A2,…, Ak là một tập
con mờ của tập tích Descartes A1A2
…Ak.
Như vậy, một quan hệ mờ k-ngôi R
được kết hợp với một hàm thành viên R:
A1A2 …Ak [0,1]. Trường hợp quan hệ
mờ 2-ngôi R giữa X, Y (là cơ sở để xây
dựng các phép toán mờ 2-ngôi), là một tập
mờ R = {(x,y): R(x,y) | (x, y)  X×Y } với
hàm thành viên R(x,y): X×Y → [0,1].
3. LƯỢC ĐỒ VÀ QUAN HỆ FRDB
Lược đồ và quan hệ FRDB được mở
rộng từ lược đồ và quan hệ CSDL quan hệ
truyền thống để biểu diễn khả năng các bộ
thuộc về một quan hệ mờ.
3.1. ược đồ FRDB
Một lược đồ FRDB gồm một tập thuộc
tính kết hợp với một hàm thành viên làm
cơ sở để xác định các quan hệ mờ, được
định nghĩa như sau:
Định nghĩa 3.1.1 Một ượ ồ quan h
mờ (fuzzy relational schema) là một bộ đôi
R = (U, ) trong đó
1. U = {A1, A2, …, Ak} là một tập các
thuộc tính đôi một khác nhau (biểu diễn
thông tin về giá trị các đối tượng trong
quan hệ).
2.  là một ánh xạ đặt tương ứng mỗi

(v1, v2, …, vk)  D1D2…Dk với một số
thực thuộc [0, 1], trong đó Di là miền giá
trị của thuộc tính Ai (i = 1, …, k).
111

mở rộng từ phụ thuộc hàm trong CSDL
truyền thống như định nghĩa 3.2.2.

Bảng 3.2.1.
Phụ thuộc hàm mờ trong FRDB được

Bảng 3.2.1: M t quan hệ mờ trên lược đồ PATIENT
PATIENT_ID PATIENT_NAME
SEX
MEDICAL_HISTORY



PT001

P.V. Ba

male

Bronchitis

0.8

PT002

T.T. Mai

female

Cholecystitis

0.5

PT003

N. Tuan

male

Gall-stone

0.4

Định nghĩa 3.2.2 Cho một lược đồ
quan hệ mờ R(U, ), r là một quan hệ mờ
bất kì trên R, X và Y là hai tập con các
thuộc tính của U. Một ph thuộc hàm mờ
(fuzzy function dependence) của Y đối với
X trên lược đồ quan hệ R, ký hiệu là X ⇝
Y, nếu
t1, t2  r (r(t1)  r(t2)  t1[X] =
t2[X]) f (t1[Y] = t2[Y]), trong đó
1, khi a  b
a f b = 

1  (a  b), khi a  b

Định nghĩa 3.2.3 Một
sở d li u
quan h mờ (fuzzy relational database) trên
một tập các thuộc tính A là một tập các
quan hệ mờ tương ứng với tập các lược đồ
quan hệ mờ của chúng.
Lưu ý rằng, nếu chỉ quan tâm đến một
quan hệ duy nhất trên một lược đồ thì có
thể đồng nhất ký hiệu tên quan hệ và lược
đồ của chúng.
Ví dụ 3.2.3 Một CSDL quan hệ mờ
đơn giản các bệnh nhân tại phòng khám
của một bệnh viện có thể được tổ chức như
các Bảng 3.2.2, 3.2.3, 3.2.4. Ở đây, quy
ước đơn vị thời gian điều trị, chi phí điều
trị tương ứng là ngày và 1000 (đồng VN).
Kinh nghiệm điều trị của bác sĩ được tính
theo năm. Chúng tôi lưu ý rằng, một số
thuộc tính đã bị lược bỏ bớt (cho đơn giản)
và chúng cũng không ảnh hưởng đến việc
minh họa cho mô hình CSDL quan hệ mờ.

Phụ thuộc hàm X ⇝ Y còn được gọi là
“X xác định hàm Y” hoặc “Y phụ thuộc
hàm vào X”.
Lưu ý rằng, khi giá trị hàm r bằng 1
với mọi r trên R, phụ thuộc hàm mờ trong
định nghĩa này sẽ đồng nhất với phụ thuộc

hàm trong CSDL truyền thống.
Bây giờ CSDL quan hệ mờ là mở rộng
của CSDL quan hệ truyền thống và được
định nghĩa như sau.

Bảng 3.2.2: Quan hệ PATIENT
PATIENT_ID PATIENT_NAME
PT005
L.V. Tam
PT006
N..T. Trang
PT007
T. T. Tu

AGE
53
29
21

112

WEIGHT MEDICAL_HISTORY
70
Bronchitis
49
Gall-stone
65
Hepatitis



0.9
0.5
1.0

Bảng 3.2.3: Quan hệ DIAGNOSE
PATIENT_ID PHYSICIAN_ID
DISEASE
PT005
DT001
Tuberculosis
PT006
DT002
Hepatitis
PT007
DT003
Lung cancer

DURATION COST
400
300
40
30
500
350


0.7
0.5
0.4

Bảng 3.2.4: Quan hệ PHYSICIAN
PHYSICIAN_ID
DT001
DT002
DT003

PHYSICIAN_NAME
N. T. Son
H. V. Tuan
T. T. T. Nhan

4. CÁC PH P TOÁN ĐẠI SỐ FRDB
Các phép toán đại số quan hệ mờ như
phép chọn, phép giao, phép hợp và phép
trừ là cơ sở để truy vấn và thao tác dữ liệu
mờ, không chính xác trong FRDB. Các
phép toán này được mở rộng từ các phép
toán đại số quan hệ truyền thống, trong đó
mức độ thành viên của các bộ là một giá trị
trong khoảng [0, 1].
4.1. P ép c n
Phép chọn trên một quan hệ FRDB là
cơ sở để thực hiện các truy vấn tìm kiếm
thông tin trong CSDL. Trước khi định
nghĩa phép chọn, chúng tôi giới thiệu cú
pháp và ngữ nghĩa của các điều kiện chọn
như dưới đây.
Định nghĩa 4.1.1 Giả sử R là một lược
đồ FRDB, X là một tập các biến bộ quan

EXPERIENCE
30
25
6


0.6
0.8
0.9

hai ngôi mờ và v là một giá tr tập mờ.
3. x.A1  x.A2, trong đó x  X, A1 và A2 là
hai thuộc tính phân biệt trong R.
4. E nếu E là một điều kiện chọn mờ.
5. E1  E2 nếu E1 và E2 là các điều kiện
chọn mờ trên cùng một biến quan hệ.
6. E1  E2 nếu E1 và E2 là các điều kiện
chọn mờ trên cùng một biến quan hệ.
Ba dạng đầu của điều kiện chọn mờ
được gọi là các ều k
sở
(atomic selection condition). Ba dạng sau
của điều kiện chọn mờ được suy dẫn từ các
dạng cơ sở bằng đệ quy. Chúng tôi lưu ý có
thể coi mỗi giá trị rõ, chính xác cũng là
một giá trị tập mờ với hàm thành viên của
nó bằng 1.
Ví dụ 4.1.1 Với lược đồ quan hệ
PATIENT trong CSDL các bệnh nhân ở

Ví dụ 3.2.3, một số điều kiện chọn mờ có
thể như sau (x là biến bộ):
1. Tìm những bệnh nhân trẻ tuổi (young).
Yêu cầu này có thể được biểu diễn bởi
điều kiện chọn cơ sở x.AGE 
young.
2. Tìm tất cả bệnh nhân trẻ tuổi và có
tiền sử bệnh viêm gan (hepatitis). Yêu

hệ,  là một quan hệ hai ngôi trong =, ,
, , , ≥. Các ều k
n mờ (fuzzy
selection condition) được định nghĩa một
cách đệ quy và có một trong các dạng sau:
1. x.A  v, trong đó x  X, A là một thuộc
tính trong R và v là một giá trị.
2. x.A  v, trong đó x  X, A là một
thuộc tính trong R,  là một quan hệ
113

(t) = v(t.A).

cầu này có thể được biểu diễn bởi điều
kiện chọn x.AGE  young
x.MEDICAL_HISTORY=hepatitis.
3. Tìm tất cả bệnh nhân cao tuổi (old)
hoặc có cân nặng dưới 50 kg. Yêu cầu
này có thể được biểu diễn bởi điều
kiện chọn x.AGE  old  x.WEIGHT

 50.
Định nghĩa 4.1.2 Giả sử R(U, ) là một
lược đồ quan hệ FRDB, r là một quan hệ
trên R, x là một biến bộ quan hệ và t là một
bộ trong r. Di n d ch (interpretation) của
các điều kiện chọn mờ theo R, r và t, được
biểu thị bởi intR,r,t, là một ánh xạ bộ phận
từ tập tất cả các điều kiện chọn mờ đến
khoảng [0, 1] và được định nghĩa đệ qui
như sau:
1. intR,r,t(x.A  v) = r(t) nếu t.A  v và
intR,r,t(x.A  v) = 0 nếu ngược lại.
2. intR,r,t(x.A v) = min(r(t), (t)), với
 = t.A  v
3. intR,r,t(x.A1  x.A2) = r(t) nếu t.A1  t.A2
và intR,r,t(x.A1  x.A2) = 0 nếu ngược lại.
4. intR,r,t(E) = 1 − intR,r,t(E)
5. intR,r,t(E1  E2) = min(intR,r,t(E1),
intR,r,t(E2))
6. intR,r,t(E1  E2) = max(intR,r,t(E1),
intR,r,t(E2))
Chúng tôi lưu ý rằng, v là một tập mờ
trong t.A  v nên  = t.A  v là một quan
hệ mờ. Vì vậy  cũng là một tập mờ. Cụ
thể  là tập mờ mà hàm thành viên của nó
có đối số là các bộ t của R. Với mỗi t  R,

Về trực giác, intR,r,t(x.A  v) và intR,r,t(x.A
 v) tương ứng cho biết mức độ thỏa mãn
các điều kiện (quan hệ) t.A  v và t.A  v

(ở đây v là tập mờ) của bộ t trong r còn
intR,r,t(x.A1  x.A2) cho biết mức độ thỏa
mãn điều kiện t.A1  t.A2 của bộ t trong r.
Ví dụ 4.1.2 Giả sử các tập mờ young,
middle_aged, old tương ứng biểu diễn tuổi
ẻ, trung niên và
của các bệnh nhân
với các hàm thành viên như dưới đây:
1 x  [0, 20]

young  (35  x) / 15 x  (20, 35),
0 x  35

( x  20) / 15 x  [20, 35)
1 x  [ 35, 45)

middle_ aged  
(60  x) / 15 x  [45, 60)

0 x  (20, 60)

( x  60) / 15 x  [45, 60)

old  1 x  [60, 120]
0 x  [45, 120]


Thì diễn dịch của các điều kiện chọn mờ E1
= “x.AGE  young” và E2= “x.AGE 
young  x.MEDICAL_HISTORY =

hepatitis” theo quan hệ r = PATIENT trong
CSDL các bệnh nhân ở Ví dụ 3.2.3 được
tính toán như trong Bảng 5.2.1. Lưu ý rằng,
để tiện theo dõi kết quả tính toán, các bộ
trong quan hệ PATIENT được đánh số
theo thứ tự xuất hiện của chúng trong Bảng
4.1.1.

114

t
t1
t2
t3

Bảng 4.1.1. Di n dịch biểu thức chọn mờ trên uan hệ PATIENT
intR,r,t(E1)
intR,r,t (E2)
min(0.9, 0.0) =
min(min(0.9, 0.0),
)=0
min(0.5, 0.4) = 0.4
min(min(0.5, 0.4),
)=0
min(1.0, 0.93) = 0.93
min(min(1.0, 0.93), 1.0 ) = 0.93

Bây giờ, phép chọn trong FRDB được
mở rộng từ phép chọn trong CSDL quan hệ

truyền thống như sau.
Định nghĩa 4.1.3 Giả sử R(U, ) là một
lược đồ quan hệ mờ FRDB, r là một quan
hệ trên R và  là một điều kiện chọn trên
biến bộ x. Phép ch n trên r theo , được ký
hiệu (r), là một quan hệ mờ
trên R,
bao gồm tất cả các bộ t được định nghĩa
bởi:
r’=t  r | intR,r,t() 0  r’(t)=intR,r,t()
Một cách đơn giản hơn, (r) = {t  r |
intR,r,t() 0}.

Ví dụ 4.1.3 Xét quan hệ r = PATIENT
trong cơ sở dữ liệu các bệnh nhân ở Ví dụ
3.2.3, truy vấn “Tìm tất cả bệnh nhân trẻ và
có tiền sử bệnh viêm gan” có thể được thực
hiện bởi phép chọn = (PATIENT) với

=
“x.AGE

young

x.MEDICAL_HISTORY= hepatitis”.
Phép chọn được thực hiện bằng cách
kiểm tra sự thỏa mãn của tất cả các bộ
trong PATIENT đối với điều kiện chọn .
Từ Ví dụ 4.1.2 ta dễ dàng thấy chỉ có bộ t3
thỏa mãn  với giá trị hàm thành viên là

0.93. Vì vậy kết quả phép chọn là quan hệ
r’ như trong Bảng 4.1.2.

Bảng 4.1.2. Quan hệ r’= (PATIENT)
PATIENT_ID PATIENT_NAME AGE WEIGHT MEDICAL_HISTORY
PT007

T. T. Tu

21

65

4.2. Phép hợp, giao và tr

Hepatitis


0.93

r và s, kí hiệu là r  s, là một quan hệ mờ
trên R bao gồm các bộ t được định nghĩa
bởi
r  s = {t | rs(t)=max(r(t), s(t))}.

Sử dụng các phép toán trên các tập hợp
mờ trong Định nghĩa 2.3.1 chúng tôi mở
rộng các phép toán hợp, giao và trừ các
quan hệ trong CSDL truyền thống thành
các phép toán hợp, giao và trừ các quan hệ

trong FRDB như các định nghĩa dưới đây.

Ví dụ 4.2.1 Giả sử hai quan hệ
DIAGNOSE1 và DIAGNOSE2 trên lược đồ
quan hệ DIAGNOSE(PATIENT_ID,
DISEASE, COST, ) như trong các Bảng
4.2.1, 4.2.2. Khi đó hợp của chúng là quan
hệ DIAGNOSE được tính toán như trong
Bảng 4.2.3.

Định nghĩa 4.2.1 Giả sử r và s là hai quan
hệ mờ trên cùng một lược đồ R(U,). Phép
hợp (union) của hai quan hệ

115

Bảng 4.2.1: Quan hệ DIAGNOSE1
PATIENT_ID
DISEASE
COST



PT005

Tuberculosis

300

0.7

PT006

Hepatitis

30

0.5

Bảng 4.2.2: Quan hệ DIAGNOSE2
PATIENT_ID
DISEASE
COST



PT005

Tuberculosis

300

0.3

PT006

Hepatitis

30

0.8

PT017

Cirrhosis

70

0.4

Bảng 4.2.3: DIAGNOSE = DIAGNOSE1  DIAGNOSE2
PATIENT_ID
DISEASE
COST

PT005

tuberculosis

300

0.7

PT006

hepatitis

30

0.8

PT017

cirrhosis

70

0.4

các tính chất của các phép toán đại số quan
hệ truyền thống.
Sau đây là các định lý về các tính chất
của các phép toán đại số trên FRDB được
chúng tôi mở rộng từ các tính chất của các
phép toán đại số quan hệ truyền thống.

Định nghĩa 4.2.2 Giả sử r và s là hai quan
hệ trên cùng một lược đồ R(U, ). Phép
giao (intersection) của hai quan hệ r và s,
kí hiệu là r  s, là một quan hệ trên R bao
gồm các bộ t được định nghĩa bởi
r  s = {t | rs(t) = min(r(t), s(t))}.

Định lý 4.3.1 Giả sử r là một quan hệ mờ
trên lược đồ R(U, ) trong FRDB. Gọi 1
và 2 là hai điều kiện chọn. Khi đó
1(2(r)) = 2(1(r)) = 12(r) (1)
Với giả thiết trong 12(r) các điều
kiện chọn 1 và 2 là có cùng một biến bộ.

Định nghĩa 4.2.3 Giả sử r và s là hai quan
hệ mờ trên cùng một lược đồ R(U,). Phép
trừ (difference) của quan hệ r cho s, kí hiệu
là r – s, là một quan hệ trên R bao gồm các
bộ t được định nghĩa bởi
r–s = {t | rs(t) = min(r(t), 1-s(t))}.
4.3.

n c ất của c c p ép t

Chứng minh Đặt s = 2(r), ta có
1(2(r))=ts  intR,s,t(1)0
(Định nghĩa 4.1.3)
=tr intR,r,t(2)0 intR,s,t(1)0}
=tr intR,r,t(2)0  intR,r,t(1)0)
(do sr)
=trmin(intR,r,t(2), intR,r,t(1))0)
(Định nghĩa 4.1.2)

n đại s

Như đã thấy ở các phần trên, mô hình
FRDB được mở rộng từ mô hình CSDL
quan hệ truyền thống cả về biểu diễn dữ
liệu và các phép toán đại số quan hệ. Hệ
quả logic là các tính chất của các phép toán
đại số trong FRDB cũng được mở rộng từ

116

=trintR,r,t(21)> 0) = 12(r).
Từ đó hệ thức 1(2(r)) = 1 2(r)
được chứng minh. Hệ thức 2(1(r)) =
2 1(r) được chứng minh tương tự. Vì 1
 2  2  1 (phép hội trên tập các điều
kiện chọn mờ cũng như trên mệnh đề có
tính giao hoán), nên 1  2(r) = 21(r).
Từ đó suy ra hệ thức 1(2(r)) =
2(1(r)) và do đó 1(2(r)) =
2(1(r)) = 12(r)

. KẾT LUẬN
Trong bài báo này, chúng tôi đã giới
thiệu một mô hình cơ sở dữ liệu quan hệ
mờ, được gọi là FRDB, cùng với các phép
toán đại số cơ bản như chọn, hợp, giao và
trừ để cho phép thao tác và truy vấn thông
tin không rõ ràng, không chính xác. Mỗi
quan hệ FRDB là một tập mờ với mức độ
thành viên bộ trong khoảng [0,1], các uy
ấ ề (soft query) có thể được thực hiện
bằng cách sử dụng các điều kiện chọn kết
hợp với các giá trị tập mờ. Một số các tính
chất của các phép toán đại số trên FRDB
cũng được đề nghị và chứng minh.
Trong các bước tiếp theo, chúng tôi
sẽ xây dựng các phép toán đại số khác như
phép

u (projection), phép tích
Descartes và phép k (join) các quan hệ để
hoàn thiện mô hình FRDB. Ngoài ra, việc
phát triển một hệ quản trị cho FRDB với
ngôn ngữ thao tác và truy vấn tựa SQL để
hỗ trợ ườ sử d
ầu u (end-user)
cũng là một nghiên cứu có nhiều ý nghĩa.

Định lý 4.3.2 Nếu r1, r2 và r3 là các quan
hệ mờ trên cùng một lược đồ R(U, ) thì
r1  r2 = r2  r1
(2)
(r1  r2)  r3 = r1  (r2  r3) (3)
r1  r2 = r2  r1
(4)
(r1  r2)  r3 = r1  (r2  r3) (5)
Chứng minh Các hệ thức trong định lý
này được chứng minh như sau:
Do các phép toán giao và hợp các tập
hợp, phép lấy min và max có tính giao hoán
và kết hợp nên từ các Định nghĩa 4.2.1 và
4.2.2 ta suy các hệ thức (2), (3), (4) và ( ).

TÀI LIỆU THAM KHẢO
1. Dubois, D., and Prade, (2009) H. Using fuzzy sets in flexible querying: why and how?.
In Proceedings of the workshop on flexible query-answering systems (FQAS’1
),
Denmark, 89-103.
2. Codd, E.F. (1970) A Relational model of data for large shared data banks.

Communications of the ACM, 13(6), 377-387.
3. Cubero, J.C., Medina, J.M., Pons, O., and Vila, M.A. (1999) Data summarization in
relational databases through fuzzy dependencies. International Journal of Information
Sciences, 121, 22-43.
4. Chakraborty, S. (2012) Codd s e o
d
ode
d fuzzy o :
approach to find the computer solution. International Journal of Advanced Technology
& Engineering Research (IJATER), 2(4), 21-27.
117

5. Date C.J. (2008) An introduction to database systems. Addision–Wesley. 8th Edition.
6. Klir, G.J. and Yuan, B. (1994) Fuzzy sets and fuzzy logic -Theory and applications.
Prentice Hall PTR.
7. Meng, X., Ma, Z.M., and Zhu, X. (2010) A Knowledge-based fuzzy query and results
ranking approach for relational databases. Journal of Computational Information
Systems, 6, 2037-2044.
8. Mishra, J., and Ghosh, S. (2012) A new functional dependency in a vague relational
database Model. International Journal of Computer Applications, 39(8), 29-36.
9. Nguyen Cat Ho. (2006) A model of relational with linguistic data of hedge algebrasbased semantics. In Proceedings of the 3rd National Symposium on Research,
Development and Application of Information and Communication Technology
(ICTrda’0 ) Hanoi-Vietnam, 145-156.
10.
Petry, F.E. (1996) Fuzzy databases: Principles and applications. Kluwer Academic
Publishers.
11.
Yan, L., and Ma, Z.M. (2013) A Fuzzy probabilistic relational database model and
algebra. International Journal of Fuzzy Systems, 15(1), 244-253.

12.

Zadeh, L.A. (1965) Fuzzy sets. Information and Control, 8, 338-353.
* Ngày nhận bài: 13/10/2014. Biên tập xong: /1/201 . Duyệt đăng: 10/1/201 .

118

Áp dụng lý thuyết tập mờ để mở rộng CSDL quan hệ

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về