Tải bản đầy đủ (.doc) (24 trang)

Mô hình cơ sở dữ liệu hướng đối tượng mờ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (262.29 KB, 24 trang )

MỤC LỤC
5.3 Giá trị thuộc tính.................................................................................14
5.4 Phương thức.......................................................................................15
5.5 Quan hệ lớp đối tượng mờ..................................................................16
5.6 Quan hệ kế thừa mờ............................................................................17
5.7 Mô hình lớp đối tượng mờ..................................................................18
6. Ngôn ngữ truy vấn dữ liệu.............................................................................22
KẾT LUẬN...................................................................................................................23


2

MỞ ĐẦU
Như chúng ta đã biết, mô hình hướng đối tượng (HĐT) truyền thống đã

chứng tỏ nhiều ưu điểm trong các vấn đề mô hình hóa, thiết kế và hiện thực các
hệ thống lớn, từ phần mềm cho đến cơ sở dữ liệu (CSDL). Đó là nhờ mô hình
này có khả năng biểu diễn trạng thái và hành vi của các đối tượng cũng như
sự phân cấp, phân loại và quan hệ giữa chúng trong các ứng dụng thực tế. Hơn
nữa, mô hình hướng đối tượng còn giúp tối ưu dữ liệu và tái sử dụng mã khi
xây dựng hệ thống thông qua cơ chế thừa kế thông tin giữa các lớp đối tượng.
Tuy nhiên, trong mô hình HĐT truyền thống, các mối quan hệ cũng như trạng
thái và hành vi của các đối tượng luôn luôn được thể hiện một cách chắc chắn
và chính xác. Điều này không hoàn toàn phù hợp với thực tế, bởi thông tin về
các đối tượng trong thế giới thực có thể mơ hồ, không chắc chắn, không đầy đủ.
Hệ quả là các ứng dụng dựa trên mô hình CSDL HĐT truyền thống không
biểu diễn được các đối tượng mà thông tin về chúng không được xác định một
cách chắc chắn và chính xác. Chẳng hạn, các ứng dụng mô hình CSDL truyền thống
không thể trả lời các truy vấn như “tìm tất cả những bệnh nhân trẻ có tiền sử bệnh
viêm thanh quản”; hoặc “tìm tất cả các gói bưu kiện có thể tích khoảng 25000 cm 3”.
trong đó trẻ và khoảng 25000 cm 3 là những khái niệm và giá trị không chính xác. Để


khắc phục được các hạn chế như vậy, các nghiên cứu gần đây đã tập trung nghiên cứu
mô hình CSDL HĐT có khả năng biểu diễn và xử lý được các đối tượng mà thông tin
về chúng có thể không chắc chắn và không chính xác.
Chúng em xin chân thành cảm ơn sự dạy bảo, định hướng nghiên cứu, cung
cấp tài liệu và hướng dẫn của Thầy TS. Nguyễn Công Hào đã giúp chúng em hoàn
thành tiểu luận này. Chúng em cũng xin chân thành cảm ơn các đồng nghiệp, anh
chị em học viên đã đóng góp ý kiến cho chúng em trong tiểu luận này. Do thời
gian cũng như kiến thức có hạn nên chắc chắn không tránh khỏi những thiếu sót,
rất mong nhận được sự góp ý của Thầy và các bạn học viên trong lớp để tiểu luận
này hoàn thiện hơn.

2


NỘI DUNG
1. Giới thiệu
Trong những năm gần đây, mô hình CSDL HĐT với thông tin mờ và không
chắc chắn được nhiều tác giả trong và ngoài nước quan tâm nghiên cứu. Tất cả
các cách tiếp cận nhằm mục đích nắm bắt và xử lý một cách thỏa đáng trên một
luận điểm nào đó các thông tin không chính xác, không chắc chắn hay không
đầy đủ. Dưới đây, chúng tôi tóm tắt lại một số mô hình CSDL HĐT mờ theo
các cách tiếp cận và các kết quả đạt được trên các mô hình đã được đề xuất.
Trước hết, một số nghiên cứu cho phép giá trị thuộc tính đối tượng là một
tập các giá trị mờ kết hợp với một quan hệ tương tự trên miền giá trị thuộc tính
này. Tùy theo ngữ cảnh, tập giá trị thuộc tính được định nghĩa như là tuyển hoặc
hội logic của các giá trị này. Ngữ nghĩa của các giá trị tập mờ được xác định
thông qua các quan hệ tương tự trên các miền giá trị thuộc tính tương ứng. Các
phép toán đại số trên các lớp đối tượng như chọn, chiếu, kết nối, .v.v.., dựa trên
độ đo tương tự đã được xây dựng làm ngôn ngữ thao tác truy vấn đối tượng.
Vì các giá trị thuộc tính đối tượng có thể là những tập mờ, nên các lớp đối

tượng cũng trở nên mờ. Trong các mô hình này, sự phân loại, phân cấp các lớp là
mờ nên mức độ thành viên lớp của các đối tượng cũng được mờ hóa theo. Các độ
đo tương ứng được sử dụng để tính toán mức độ bao hàm lớp và mức độ thành
viên lớp. Độ đo bao hàm lớp con trong lớp cha được xác định bởi mức độ tương
tự tương ứng của các miền giá trị các thuộc tính của lớp con đối với lớp cha.
Độ đo thành viên lớp của mỗi đối tượng được định nghĩa thông qua mức độ
tương tự giữa giá trị tương ứng của mỗi thuộc tính của đối tượng với tập giá trị
của miền giá trị thuộc tính lớp.
Ngoài ra, mô hình này được Yazici và George mở rộng bằng một tập luật cho
phép suy diễn trên các thông tin mờ về các đối tượng trong CSDL. Nhóm tác giả
Yazici, George và Aksoy (1999) đã đề xuất các vấn đề về thiết kế và thực hiện
các mô hình hướng đối tượng mờ dựa trên quan hệ tương tự. Các tác giả này
cũng đã xây dựng một hệ thống CSDL mờ dựa trên tính tương tự cho phép thao
tác và truy vấn thông tin mờ của các đối tượng thực tế.
Như các mô hình CSDL quan hệ mờ, trong các mô hình CSDL HĐT mờ,

3


phương pháp biểu diễn giá trị thuộc tính đối tượng bởi các phân bố khả năng
cũng được nghiên cứu rộng rãi. Các đề nghị theo tiếp cận này rất đa dạng và khả
năng mô hình hóa các đối tượng mờ cũng rất khác nhau. Bordogna, Lucarella và
Pasi (1994) đã đề nghị một mô hình dữ liệu hướng đối tượng dựa trên đồ thị,
trong đó giá trị thuộc tính được biểu diễn bởi các phân bố khả năng, bao hàm
các lớp con trong lớp cha được biểu diễn bởi các tập mờ. Mức độ thành viên mờ
của các đối tượng được xác định thông qua mức độ bao hàm lớp và mức độ bao
hàm giá trị thuộc tính của đối tượng trong miền giá trị thuộc tính tương ứng của
lớp. Một ngôn ngữ truy vấn đối tượng dựa trên các độ đo khả năng đã được xây
dựng cho mô hình này và khả năng áp dụng của các tính chất lớp là chắc chắn.
Nhóm tác giả này tiếp tục mở rộng bằng cách kết hợp giá trị thuộc tính đối

tượng với một giá trị trong khoảng [0, 1] để biểu diễn mức độ không chắc chắn
về giá trị mà thuộc tính có thể nhận.
Nhóm tác giả Rossazza, Duboi và Prade (1997) định nghĩa lớp như một tập
thuộc tính mà giá trị cũng như miền giá trị của thuộc tính có thể là các tập mờ. Bao
hàm và phân cấp lớp mờ đã được định nghĩa trên cơ sở logic mờ và lý thuyết khả
năng, thừa kế được xem xét khi quan hệ lớp thực sự là quan hệ lớp cha lớp con. Đa
thừa kế của một thuộc tính là lấy giao của các miền giá trị thuộc tính mờ tương ứng
của các lớp cha.
Van Gyseghem và De Caluwe (1997) định nghĩa lớp như một tập các thuộc
tính và phương thức xác định các đối tượng mờ của lớp. Mỗi phương thức được
biểu diễn như một hàm thao tác trên các giá trị tập mờ của thuộc tính đối tượng.
Trong mô hình này, khả năng không chắc chắn các tính chất lớp của các đối
tượng đã được đề cập, nhưng mức độ áp dụng của mỗi tính chất không được định
nghĩa hình thức trong biểu diễn lớp. Bao hàm và phân cấp lớp mờ được xác định
thông qua bao hàm các miền trị thuộc tính tương ứng của các lớp. Thừa kế
không chắc chắn thuộc tính lớp được tính toán thông qua mức độ bao hàm lớp
con trong lớp cha.
Marin, Pons và Vila (2001), Berzal và cộng sự (2005a) đã áp dụng lý thuyết
khả năng để xây dựng một tập các độ đo cho các quan hệ trên các tập mờ làm
cơ sở để các thao tác và truy vấn đối tượng. Các phương thức lớp cũng đã được
định nghĩa hình thức để biểu diễn thao tác của các đối tượng. De Tre và De

4


Caluwe (2005) đã biểu diễn dữ liệu mờ của đối tượng như các ràng buộc trên các
tính chất của chúng. Một truy vấn được kết hợp với các ràng buộc, và các đối
tượng được chọn nếu thỏa mãn các ràng buộc này.
Eiter và cộng sự (2001) đã mở rộng mô hình CSDL HĐT xác suất của Kormatzky và Shimony (1994) và gọi là mô hình POB (Probabilistic Object Base).
Đây là một mô hình cơ sở đối tượng xác suất dựa trên thủ tục. Theo đó, giá trị

thuộc tính của đối tượng được biểu diễn như một tập, kết hợp với hai hàm phân
bố xác suất cận dưới và cận trên để đo độ không chắc chắn về giá trị trong tập
mà thuộc tính có thể nhận.
Kết hợp tập mờ và xác suất, Baldwin và cộng sự (2000), Cao và Rossiter (2003) đã
đề xuất một mô hình CSDL HĐT xác suất mờ dựa trên cơ sở logic. Trong đó, lớp
được định nghĩa bởi một tập tính chất được diễn dịch như các vị từ mờ kết hợp với
một khoảng xác suất biểu diễn khả năng áp dụng không chắc chắn của chúng đối với
lớp. Các vị từ không có tiền điều kiện biểu diễn thuộc tính, ngược lại chúng biểu diễn
phương thức của một lớp. Mỗi tính chất đối tượng có thể nhận một giá trị tập mờ với
một xác suất thuộc về khoảng xác suất được suy dẫn từ mức độ áp dụng của nó đối
với đối tượng.
Năm 2013, Vũ Đức Quảng đã thực hiện các nghiên cứu về các phụ thuộc dữ
liệu của các đối tượng mờ trên mô hình CSDL hướng đối tượng mờ với dữ liệu
được biểu diễn bởi phân bố khả năng được đề xuất bởi ZongMin Ma. Trên mô
hình mà Zong Min Ma đề xuất ngoài việc đảm bảo các khái niệm, tính chất cốt
lõi của mô hình CSDL hướng đối tượng rõ, nó còn giải quyết được tương đối đầy
đủ tính mờ của đối tượng, lớp, tính mờ trong mối quan hệ giữa đối tượng và
lớp, giữa lớp cha và lớp con.
Như đã trình bày ở trên, các hướng tiếp cận nghiên cứu mô hình CSDL HĐT với
thông tin mờ và không chắc chắn cũng đã chứng tỏ được khả năng mô hình hóa
thông tin mờ, không chính xác và không chắc chắn về các đối tượng. Tuy nhiên,
do sự đa dạng của những loại thông tin không đầy đủ, do những khó khăn khi phải
thao tác trên những thông tin như vậy nên còn rất nhiều vấn đề cần được tiếp tục
nghiên cứu. Trong những năm gần đây đại số gia tử được nhiều tác giả nghiên cứu
và đã có được những kết quả đáng kể trong các nghiên cứu về CSDL mờ. Vì vậy,
mặc dù có nhiều kết quả nghiên cứu về CSDL HĐT mờ, theo chiều hướng đó cách

5



tiếp cận nghiên cứu CSDL HĐT mờ với ngữ nghĩa dựa trên đại số gia tử vẫn có thể
được xem là một vấn đề nghiên cứu mới. Trong phần sau, một số khái niệm ĐSGT
và ĐSGT tuyến tính đầy đủ, các mệnh đề, định lý liên quan được trình bày làm
cơ sở nghiên cứu trên mô hình này.

2. Thông tin không đầy đủ trong mô hình CSDL
Một trong những lĩnh vực nghiên cứu chủ yếu trong CSDL là tiếp tục phát
triển các kết quả đã đạt được trong các mô hình CSDL truyền thống với một tập
các khái niệm có ngữ nghĩa mở rộng. Một trong các yêu cầu không được giải quyết
đầy đủ bởi các các mô hình truyền thống, đó là việc biểu diễn và xử lý thông tin
không chính xác và không chắc chắn. Các mô hình truyền thống giả định rằng mô
hình cơ sở dữ liệu phản ánh một cách chính xác thế giới thực, dữ liệu được lưu trữ
là được xác định, chính xác và đầy đủ. Tuy nhiên, trong thực tế cuộc sống, nhiều
khi các giả định này không được thỏa đáng. Vì vậy trong những năm gần đây,

các mô hình dữ liệu khác nhau được đề xuất để giải quyết các loại đặc trưng
của dữ liệu.
Trong các hệ thống CSDL, chúng ta thường quan tâm đến ba loại thông tin
không hoàn hảo (imperfect) sau: thông tin sai lệch, thông tin không chính xác,
thông tin không chắc chắn .
2.1 Thông tin sai lệch
Thông tin sai lệch là loại thông tin không hoàn hảo đơn giản nhất. Thông tin
của cơ sở dữ liệu là sai lệch khi nó khác với “thông tin thực” (true information).
Mọi sai số lớn hay nhỏ của thông tin đều làm ảnh hưởng đến tính toàn vẹn của
CSDL, đó là vấn đề không thể chấp nhận và cần được xem xét trong các
hệ CSDL. Một loại thông tin sai lệch quan trọng là sự không nhất quán.
Đôi khi cùng một khía cạnh của thế giới thực được biểu diễn nhiều lần trong
cùng một CSDL hay trong nhiều CSDL khác nhau. Khi các biểu diễn đó là đối
lập không thể kết hợp được, dẫn đến thông tin là không nhất quán. Trong việc
tích hợp thông tin từ nhiều CSDL khác nhau, các vấn đề về sự không nhất quán

của thông tin phải được quan tâm một cách đầy đủ.
2.2 Thông tin thiếu chính xác
Thông tin trong CSDL là thiếu chính xác khi nó biểu diễn một tập các giá trị có
thể, và giá trị thực là một phần tử của tập đó. Như vậy, thông tin thiếu chính xác

6


không phải là thông tin sai lệch và không làm ảnh hưởng tới tính toàn vẹn của
CSDL. Sau đây là một số thông tin thiếu chính xác đặc trưng:
- Thông tin tuyển, chẳng hạn tuổi của Nam hoặc là 35 hoặc là 36.
- Thông tin âm, chẳng hạn tuổi của Nam không phải là 30.
- Thông tin khoảng/miền, chẳng hạn tuổi của Nam nằm trong khoảng từ 35 đến

40 hoặc tuổi của Nam lớn hơn 35.
- Thông tin với các cận sai số, chẳng hạn tuổi của Nam là 30 ± 1.

Hai loại thông tin không chính xác cực biên là thông tin chính xác (ứng với
trường hợp tập các giá trị có thể là một phần tử) và các giá trị null (được hiểu
theo nghĩa là thông tin không chính xác, trong đó tập các giá trị có thể bao gồm
toàn bộ miền các giá trị hợp lệ).
2.3 Thông tin không chắc chắn
Tri thức của chúng ta về thế giới thực (chính xác hoặc không chính xác), đôi
khi không thể được phát biểu với một mức độ chân lý tuyệt đối, và đòi hỏi ta
phải xác định giá trị chân lý về thông tin được phát biểu. Thông tin với độ chắc
chắn nhất định không phải là thông tin sai lệch và không làm ảnh hưởng tới tính
nhất quán của CSDL.
Trong phát biểu “tuổi của Nam hoặc là 35 hoặc là 36 ” thể hiện tính không
chính xác, phát biểu “tuổi của Nam có khả năng là 35 ” lại thể hiện tính không
chắc chắn.

3. Tập mờ
Mỗi lĩnh vực khoa học kỹ thuật đều có một miền ứng dụng của nó. Khoa
học kỹ thuật lấy tính “chính xác” làm cơ sở để xây dựng, phát triển và cũng có
những giới hạn xác định không thể vượt qua, chúng chỉ có khả năng mô phỏng
được một phần thế giới thực. Câu hỏi đặt ra ở đây là liệu có một lý thuyết toán
học nào cho phép mô hình hóa phần thế giới thực mà con người vẫn chỉ có thể
nhận thức, mô tả bằng ngôn ngữ tự nhiên vốn hàm chứa những thông tin không
chính xác (inexact), không chắc chắn (uncertain).
Lý thuyết tập mờ được Zadeh đề xuất năm 1965 bằng cách mở rộng khái niệm
tập cổ điển, với ý tưởng đầu tiên là giúp biểu diễn và đo ngữ nghĩa các khái niệm
không chính xác, mơ hồ trong thực tế. Ngày nay, sau hơn 40 năm, một thời gian rất

7


ngắn so với lịch sử toán học, lý thuyết tập mờ không chỉ đã phát triển bùng nổ vượt
bậc mà còn đặt nền móng cho việc xây dựng một loạt các lý thuyết quan trọng như
logic mờ, lý thuyết khả năng, lý thuyết xác suất mờ v.v. . . Nhu cầu phát triển của lý
thuyết tập mờ là tìm kiếm các công cụ để mô hình hóa tính không chắc chắn, không
rõ ràng, rất phổ biến trong thực tế mà nếu chỉ dùng lý thuyết xác suất không đủ.
Toán học dựa trên lý thuyết tập mờ phát triển chủ yếu bằng cách mở rộng hầu hết
các khái niệm và lý thuyết của toán học cổ điển như logic, số học, quan hệ, độ đo
v.v. . . thành logic, số học, hay độ đo mờ v.v. . . Lý thuyết tập mờ, với những khả
năng như đã nói, là cơ sở toán học được ứng dụng rộng rãi trong thực tế nói chung
và khoa học kỹ thuật nói riêng, đặc biệt là khoa học máy tính, khi xây dựng các hệ
thống tính toán biết phân tích, xử lý và ra quyết định thông minh.
3.1 Tập mờ
Trước hết chúng ta xuất phát từ tập hợp kinh điển. Cho U là một tập hợp
và F là một tập con của U. Nếu một phần tử x thuộc F, ký hiệu x ∈ F , ngược
lại x ∈/ F . Như vậy, để mô tả khái niệm “thuộc” ta sử dụng hàm thuộc µF :


1
µF ( X ) = 
0

X ∈F
X ∉F

Rõ ràng, trong tập hợp kinh điển, hàm thuộc của một phần tử nào đó của F
chỉ nhận giá trị trong {0,1}.
Trong tập mờ, hàm thuộc của một phần tử nào đó của F không chỉ nhận giá
trị trong {0,1} mà có thể nhận giá trị trong [0,1]
3.2 Các phép toán trên tập mờ
Tương tự như lý thuyết tập hợp, trên các tập mờ cũng định nghĩa một số
phép toán: bằng nhau, bao nhau, giao, hợp ...[1] là sự mở rộng các định nghĩa
trên lý thuyết tập hợp.
Định nghĩa 1.5. Cho F và F1 là hai tập mờ trên U
(1): F bằng F1, ký hiệu F = F1, nếu µF (x) = µF1 (x), ∀x ∈ U .
(2): F chứa trong F1, ký hiệu F ⊆ F1, nếu µF (x) ≤ µF1 (x), ∀x ∈ U .
(3): Hợp của hai tập mờ F và F1, ký hiệu F ∪ F1, là một tập mờ trên U với

8


hàm thuộc xác định bởi: µF ∪F1 (x) = M ax{µF (x), µF1 (x)}, ∀x ∈ U .
(4): Giao của hai tập mờ F và F1, ký hiệu F ∩ F1, là một tập mờ trên U với
hàm thuộc xác định bởi: µF ∩F1 (x) = Min{µF (x), µF1 (x)}, ∀x ∈ U .
(5): Phần bù của tập mờ F, ký hiệu F là một tập mờ trên U với hàm thuộc
xác định bởi: µF (x) = 1 − µF (x), ∀x ∈ U .
Định nghĩa 1.6. [1] Cho F và F1 là hai tập mờ trên U

(1): Tổng đại số
F + F1 = {(x, µF +F1 (x))|x ∈ U, µF +F1 (x) = µF (x) + µF1 (x) − µF (x).µF1
(x)}
(2): Tích đại số
F.F1 = {(x, µF.F1 (x))|x ∈ U, µF.F1 (x) = µF (x).µF1 (x)}
3.3 Tổng quát hoá ba phép toán cơ bản trên tập mờ
Ngoài ba phép toán cơ bản min, max và phần bù được dùng thao tác trên
các tập mờ, để tổng quát hơn có thể định nghĩa họ các toán tử T là t-norm,
t-conorm và N-Negation cho các phép toán trên.
Định nghĩa 1.7. Hàm T: [0,1] x [0,1] → [0,1] được gọi là t-norm khi và chỉ
khi thoả mãn ∀x, y, z ∈ [0, 1]:
(1) T(x,y) = T(y,x).
(2) T(x,y) ≤ T(x,z), ∀y ≤ z. (3) T(x,T(y,z)) = T(T(x,y),z).
(4) T(x,1) = x.
Định nghĩa 1.8. Hàm S : [0, 1]*[0, 1] → [0, 1] được gọi là t-conorm khi và
chỉ khi thoả mãn ∀x, y, z ∈ [0, l]:
(1) S(x,y) = S(y,x).
(2) S(x,y) ≤ S(x,z), ∀y ≤ z. (3) S(x,S(y,z)) = S(S(x,y),z). (4) S(x,0) = 0.
Định nghĩa 1.9. Hàm N : [0, 1] → [0, 1] được gọi là hàm phủ định khi và chỉ
khi N thoả mãn ∀x, y ∈ [0,1]:

9


(1) N(0) = 1, N(1) = 0.
(2) N(x) ≤ N(y), ∀y ≤ x.
Theo định nghĩa, tập các tập mờ là không gian F(U, [0,1]) các hàm từ U vào
đoạn [0,1], một không gian tương đối giàu về cấu trúc tính toán.
Việc xây dựng hàm thuộc của các tập mờ dựa trên ngữ nghĩa của các khái
niệm mờ. Ngược lại, một lớp các khái niệm mờ có thể được mô hình hoá ngữ

nghĩa qua các tập mờ. Trên cơ sở mối quan hệ này, L.A.Zadeh đã đưa ra khái
niệm mới đó là biến ngôn ngữ.
3.4 Biến ngôn ngữ
Trong L.A.Zadeh đã viết "thiếu hụt tính chính xác bề ngoài của những vấn đề
phức tạp một cách tự nhiên là tìm cách sử dụng các biến ngôn ngữ, đó là các biến
mà giá trị của chúng không phải là số mà là các từ hoặc các câu trong ngôn ngữ tự
nhiên hoặc nhân tạo. Động lực cho việc sử dụng các từ, các câu hơn các số là đặc
trưng ngôn ngữ của các từ, các câu thường là ít xác định hơn của số".
Nói tóm lại, ý trên đây đã khái quát cho khái niệm biến ngôn ngữ. Một cách
hình thức biến ngôn ngữ được định nghĩa như sau.
Định nghĩa 1.10. Biến ngôn ngữ là một bộ năm (X, T (X), U, R, M ), trong đó X
là tên biến, T (X) là tập các giá trị ngôn ngữ của biến X, U là không gian tam chiếu
của biến cơ sở u, mỗi giá trị ngôn ngữ xem như là một biến mờ trên U kết hợp với
biến cơ sở u, R là một qui tắc cú pháp sinh các giá trị ngôn ngữ của T (X), M là qui
tắc ngữ nghĩa gán mỗi giá trị ngôn ngữ trong T (X) với một tập mờ trên U .
Các đặc trưng của biến ngôn ngữ
Trong thực tế có rất nhiều biến ngôn ngữ khác nhau về các giá trị nguyên
thủy, chẳng hạn như biến ngôn ngữ SỐ NGÀY LÀM VIỆC có giá trị nguyên
thuỷ là ít, nhiều, biến ngôn ngữ LƯƠNG có giá trị nguyên thủy là thấp, cao,. . .
Tuy nhiên, những kết quả nghiên cứu đối với một miền trị của một biến ngôn
ngữ cụ thể vẫn giữ được ý nghĩa về mặt câu trúc đối với miền giá trị của các
biến còn lại. Đặc trưng này được gọi là tính phổ quát của biến ngôn ngữ.
Ngữ nghĩa của các gia tử và các liên từ hoàn toàn độc lập với ngữ cảnh, điều
này khác với giá trị nguyên thủy của các biến ngôn ngữ lại phụ thuộc vào ngữ
cảnh. Ví dụ, ta nói LƯƠNG của cán bộ An là rất cao, khi đó được hiểu rằng
LƯƠNG khoảng trên 8.000.000 đồng, nhưng ta nói CHIỀU CAO của cán bộ An là

10



rất cao thì được hiểu rằng CHIỀU CAO khoảng trên 1.8m. Do đó, khi tìm
kiếm mô hình cho các gia tử và các liên từ chúng ta không quan tâm đến giá trị
nguyên thuỷ của biến ngôn ngữ đang xét. Đặc trưng này được gọi là tính độc lập
ngữ cảnh của gia tử và liên từ.
Các đặc trưng trên cho phép chúng ta sử dụng cùng một tập các gia tử và
xây dựng một cấu trúc toán học cho miền giá trị của các biến ngôn ngữ khác
nhau.
4. Mô hình biểu diễn dữ liệu mờ với ngữ nghĩa của đại số gia tử
4.1 Đại số gia tử
Vấn đề sử dụng tập mờ để biểu diễn các giá trị ngôn ngữ và dùng các phép
toán trên tập mờ để biểu thị các gia tử ngôn ngữ như µrattre = (µtre)2, µitnhieutre =
(µtre)1/2,... đã cho phép thực hiện các thao tác dữ liệu mờ, đáp ứng nhu cầu thực
tế của con người. Tuy nhiên, theo cách sử dụng tập mờ ta thấy có nhiều nhược
điểm do việc xây dựng các hàm thuộc và xấp xỉ các giá trị ngôn ngữ bởi các
tập mờ còn mang tính chủ quan, phụ thuộc nhiều vào ý kiến chuyên gia cho
nên dễ mất mát thông tin. Mặc khác, bản thân các giá trị ngôn ngữ có một
cấu trúc thứ tự nhưng ánh xạ gán nghĩa sang tập mờ, không bảo toàn cấu trúc
đó nữa.
Do đó, vấn đề đặt ra là cần có một cấu trúc toán học để mô phỏng được chính
xác hơn cấu trúc ngữ nghĩa của một khái niệm mờ. Trong N.C.Ho và cộng sự đã
đưa ra ĐSGT và ĐSGT mở rộng, đề xuất ĐSGT tuyến tính đầy đủ đã giải đáp đầy
đủ cho bài toán trên.
4.2 Đại số gia tử tuyến tính đầy đủ
Cho một ĐSGT tuyến tính đầy đủ AX = (X, G, H, Σ, Φ, ≤), trong đó Dom(X ) =
X là miền các giá trị ngôn ngữ của thuộc tính ngôn ngữ X được sinh tự do từ tập các
phần tử sinh G = {1, c−, W, c+, 0} bằng việc tác động tự do các phép toán một ngôi
trong tập H, Σ và Φ là hai phép tính với ngữ nghĩa là cận trên đúng và cận dưới
đúng của tập H(x), tức là Σx = supermumH(x) and Φx = infimumH(x), trong đó
H(x) là tập các phần tử sinh ra từ x, còn quan hệ ≤ là quan hệ sắp thứ tự tuyến tính
trên X cảm sinh từ ngữ nghĩa của ngôn ngữ.

5. Mô hình CSDL hướng đối tượng mờ

11


Trong phần trước đã trình bày tổng quan về các hướng tiếp cận cho việc nghiên
cứu mô hình CSDL HĐT với thông tin mờ và không chắc chắn. Các nghiên cứu,
phát triển trên mô hình CSDL HĐT mờ dựa trên mô hình CSDL HĐT truyền thống
thường tập trung vào các vấn đề sau:
1.

Biểu diễn giá trị thuộc tính không chắc chắn hoặc không chính xác của các

đối tượng.
2. Biểu diễn và thực thi các phương thức lớp.
3.

Mô hình hóa khả năng áp dụng không chắc chắn của các tính chất (thuộc

tính hoặc phương thức) lớp.
4. Mô hình hóa các quan hệ lớp và định nghĩa mức độ không chắc chắn của

các đối tượng.
5. Xác định cơ chế thừa kế không chắc chắn của các đối tượng.

Như đã đề cập ở trên, các nghiên cứu về mô hình CSDL hướng đối tượng
mờ chủ yếu tập trung vào việc mở rộng mô hình dữ liệu rõ đã có theo các cách
tiếp cận khác nhau và cho phép biểu diễn, thao tác trên dữ liệu mờ. Do đó, các
mô hình CSDL mờ này cũng chỉ thống nhất trên một tập các khái niệm chung
nhất (tập lõi) trong mô hình hạt nhân của ODMG. Có thể thấy rằng, các kết

quả nghiên cứu trên CSDL HĐT mờ luôn được xem xét với một mô hình cụ thể,
các kết quả này sẽ giải quyết cho một lớp các bài toán với một tập con các khái
niệm, tính chất đặc trưng hướng đối tượng đã được cài đặt trên mô hình.
Nhờ những ưu điểm của cấu trúc ĐSGT như đã trình bày trong phần mở đầu,
chúng tôi xem các giá trị trên miền của thuộc tính đối tượng là một cấu trúc ĐSGT
và các giá trị này được sinh ra từ hai phần tử dương và âm trong ĐSGT. Ngoài ra,
chúng tôi xem mỗi phương thức được biểu diễn như một hàm thao tác trên các giá
trị tập mờ của thuộc tính đối tượng. Trong mô hình này, chúng tôi dựa trên tính
toán lân cận tương tự, độ đo ngữ nghĩa và các quan hệ đối sánh của chúng để đưa
ra các phụ thuộc dữ liệu của đối tượng mờ và các vấn đề liên quan, một số phép
toán đại số, tích hợp nhiều đại số gia tử để thực hiện việc thao tác và truy vấn dữ
liệu trên mô hình CSDL HDT với thông tin ngôn ngữ mờ.
5.1 Đối tượng mờ
Các đối tượng được dùng để đặc tả các thực thể trong thế giới thực hoặc các
khái niệm trừu tượng. Các đối tượng có các thuộc tính hay các mối quan hệ giữa

12


đối tượng này với một hay nhiều đối tượng khác. Mỗi đối tượng lưu trữ trong hệ
thống CSDL HĐT được xác định bởi một định danh duy nhất. Định danh này
do hệ thống tự động tạo và được gọi là định danh đối tượng (OID). Giá trị OID
được hệ thống sử dụng để xác định duy nhất một đối tượng và dùng để tạo ra
các tham chiếu bên trong đối tượng, người sử dụng không tham chiếu được giá
trị này. Các OID thỏa mãn hai tính chất sau :
1.

Giá trị OID của một đối tượng không thay đổi, điều này đảm bảo tính duy

nhất của mỗi đối tượng. Do đó, một hệ thống CSDL HĐT phải có cơ chế tạo ra

các OID và đảm bảo tính bất biến của chúng.
2.

Mỗi giá trị OID chỉ được sử dụng duy nhất một lần; nghĩa là, nếu một đối

tượng bị xóa khỏi hệ thống CSDL thì giá trị OID này cũng không được gán cho
một đối tượng khác.
Từ hai tính chất này chứng tỏ rằng OID không phụ thuộc vào giá trị thuộc
tính của bất kỳ đối tượng nào, bởi vì giá trị của thuộc tính có thể thay đổi và
chỉnh sửa. Ngoài ra, OID cũng không dựa trên địa chỉ vật lý của đối tượng, bởi
vì địa chỉ vật lý có thể thay đổi sau mỗi lần tổ chức lại CSDL về phương diện
vật lý. Tuy nhiên, một số hệ thống vẫn có thể sử dụng địa chỉ vật lý làm OID để
tăng hiệu quả truy vấn. Thông thường, các hệ thống HĐT sử dụng số nguyên
lớn để biểu diễn giá trị của OID, và đó sử dụng sử dụng một bảng băm để ánh
xạ giạ trị OID đến địa chỉ vật lý hiện tại của đối tượng.
Mỗi đối tượng được xác định bởi tập các thuộc tính mô tả các thông tin đặc
trưng của đối tượng và các phương thức thể hiện các hành vi xử lý các thông tin
và mối quan hệ giữa các đối tượng trong hệ thống. Thuộc tính của đối tượng
được xác định bởi các giá trị cụ thể, giá trị này có thể là giá trị rõ hoặc vì một lý
do nào đó mà ta không xác định được giá trị chính xác của nó. Chẳng hạn, thuộc
tính tuổi của một đối tượng được cho là “khoảng 18 ”, hoặc “từ 20 đến 22 ”, hoặc
có thể là một giá trị ngôn ngữ “rất trẻ ”. Hoặc trong một ngữ cảnh khác, thuộc
tính lương của đối tượng là “cao”, “khả năng thấp”,. . . Những thông tin không
chính xác, không rõ ràng như vậy gọi là thông tin mờ. Như vậy, một đối tượng là
mờ vì có một hoặc nhiều thuộc tính có chứa thông tin mờ (gọi là thuộc tính mờ),
và phương thức sử dụng các thuộc tính này để đọc hay sửa đổi thì phương thức

13



cũng trở nên mờ. Không mất tính tổng quát, về mặt hình thức, đối tượng có ít
nhất một thuộc tính mờ được gọi là đối tượng mờ.
5.2 Lớp mờ
Các đối tượng có những thuộc tính và hành vi ứng xử giống nhau thường
được đưa vào một lớp và tổ chức các lớp thành hệ thống phân cấp. Về mặt lý
thuyết, một lớp có thể được xem xét từ hai quan điểm khác nhau :
1. Thứ nhất, một lớp mở rộng được định nghĩa bởi danh sách các đối tượng
của nó.
2. Thứ hai, một lớp khái niệm được xác định bởi một tập các thuộc tính và
các giá trị hợp lệ của các thuộc tính (và các phương thức thao tác trên các
thuộc tính này).
Vì vậy, một lớp đươc xem là mờ bởi các lý do sau:
1. Thứ nhất, một số đối tượng của một lớp được xác định là đối tượng mờ,
khi đó, những đối tượng này thuộc về lớp với độ thuộc nhất định.
2. Thứ hai, khi một lớp được định nghĩa, miền trị của một thuộc tính nào đó
có thể là mờ và như vậy một lớp mờ được hình thành.
3. Thứ ba, một lớp con được thừa kế một hoặc nhiều lớp cha, trong đó có ít
nhất một lớp cha là lớp mờ.
Sự khác nhau chính giữa các lớp mờ và các lớp rõ đó là ranh giới của các lớp
mờ không rõ ràng. Sự không chính xác trong ranh giới giữa các lớp mờ là do
sự không chính xác của những giá trị trong miền thuộc tính. Trong CSDL HĐT
mờ, các lớp là mờ vì miền trị thuộc tính của chúng chứa các giá trị mờ. Do đó,
một đối tượng thuộc mờ vào một lớp xảy ra vì lớp hoặc đối tượng đó có thể mờ,
và một lớp là lớp con của một lớp khác với độ thuộc k (k ∈ Z +) nào đó vì đó là
lớp mờ. Do vậy, việc đánh giá mối quan hệ lớp đối tượng mờ và phân cấp thừa
kế mờ là quan trọng của mô hình CSDL HĐT mờ.
5.3 Giá trị thuộc tính
Giá trị thuộc tính của đối tượng có thể là một trong bốn trường hợp sau:
1.


Giá trị chính xác: Giá trị có thể là các giá trị của các kiểu dữ liệu

14


nguyên thủy như các kiểu số hoặc kiểu xâu ký tự, hoặc là tập hợp các giá trị
nguyên thủy. Miền giá trị trong trường hợp này chúng ta có thể dễ dàng thao
tác bằng việc sử dụng các phép toán (≤, ≥, =) trong biểu thức điều kiện của
câu hỏi truy vấn; hoặc chúng ta có thể xây dựng các điều kiện mờ để thực
hiện truy vấn dữ liệu, ví dụ “cho biết tất cả đối tượng nhân viên có thu nhập
thấp hơn lương trung bình? ”
2.

Giá trị thiếu chính xác (hoặc mờ): Trường hợp với giá trị thiếu chính xác

(hoặc mờ) rất phức tạp, thường thì nhãn ngôn ngữ được sử dụng để biểu diễn cho
những loại giá trị này. Những kiểu giá trị thiếu chính xác phải được xem xét theo
ngữ nghĩa của các giá trị thiếu chính xác.
3.

Đối tượng: Trong trường hợp này giá trị thuộc tính có thể tham chiếu đến

một đối tượng khác (đối tượng phức). Đối tượng mà nó tham chiếu đến có thể mờ.
4.

Sưu tập (collection): Giá trị thuộc tính có thể là tập các giá trị hoặc tập các

đối tượng. Sự thiếu chính xác của các giá trị thuộc tính này được chia thành 2 mức:
a. Tập các giá trị này có thể mờ.
b. Tập các đối tượng mà các đối tượng này có thể mờ.

5.4 Phương thức
Thuộc tính và phương thức đối tượng, là một trong những khái niệm trung
tâm của mô hình CSDL HĐT. Theo đó các thuộc tính thể hiện thông tin về
trạng thái của đối tượng, còn các phương thức được xem như là những đặc tính
mô tả các hành vi của chúng. Phương thức biểu diễn các hành động hay thao
tác có thể được thực hiện bởi một đối tượng hoặc trên một đối tượng. Việc thực
hiện một thao tác có thể làm thay đổi giá trị thuộc tính của đối tượng, nghĩa là
làm thay đổi trạng thái của đối tượng. Ngoài ra, phương thức còn là công cụ xác
định kết quả để hỗ trợ trong cơ chế trao đổi thông tin giữa các đối tượng qua
thông báo. Mỗi phương thức có một tên và một thân thực hiện một thao tác nào
đó của đối tượng hoặc trên đối tượng. Thông thường, việc thực thi các thao tác
của đối tượng bởi phương thức có một kết quả nào đó. Phương thức không chỉ
cho phép biểu diễn các thao tác của đối tượng hoặc trên đối tượng mà còn cho
phép truy vấn thông tin trong CSDL thông qua thực thi phương thức.
Trong mô hình CSDL HĐT mờ, các giá trị thuộc tính là các giá trị chính xác

15


hoặc mờ, trong khi đó phương thức được biểu diễn như một hàm thao tác trên
giá trị các thuộc tính này. Chính vì vậy, phương thức xác định các đối tượng lớp
này cũng trở nên mơ hồ và không chắc chắn.
Cho C là một lớp với tập thuộc tính Attr(C) = {A1, A2,. . . , An}. Với những tính
chất của giá trị thuộc tính đã nêu ở trên, vậy miền giá trị của thuộc tính kinh điển của
Ai là Dom(Ai) = Cdom(Ai), miền giá trị thuộc tính mờ Aj là Dom(Aj ) = Cdom(Aj )
∪ Fdom(Aj ). o là một đối tượng có các thuộc tính {A1, A2,. . . , An}, và o.Ai biểu
thị giá trị của o trên thuộc tính Ai (1≤ i ≤ n). Lớp C chứa tập các đối tượng (mờ), ký
hiệu C = {o1, o2,. . . , om}, và o(C) là đối tượng o của lớp C.
5.5 Quan hệ lớp đối tượng mờ
Trong mô hình CSDL HĐT mờ, bốn trường hợp sau đây có thể được dùng

để phân biệt cho các quan hệ lớp đối tượng mờ :
(a)

Lớp rõ và đối tượng rõ: Trường hợp này giống như trong CSDL HĐT

truyền thống, nghĩa là đối tượng thuộc hay không thuộc lớp một cách chắc chắn.
(b)

Lớp rõ và đối tượng mờ: Lớp được xác định chính xác và có ranh giới

chính xác, còn đối tượng là mờ vì giá trị thuộc tính của nó có thể mờ. Trong
trường hợp này, đối tượng có thể là thành viên của lớp với độ thuộc nào đó.
(c)

Lớp mờ và đối tượng rõ: Giống như trường hợp ở (b), các đối tượng có

thể thuộc về lớp với mức độ thuộc k. Ví dụ, một đối tượng học viên cao học
và một lớp sinh viên trẻ.
(d)

Lớp mờ và đối tượng mờ: Trong trường hợp này, đối tượng thuộc về lớp

với mức độ thuộc k.
Các mối quan hệ lớp đối tượng trong (b), (c), và (d) trên đây được gọi là
quan hệ lớp đối tượng mờ. Trong thực tế, trường hợp (a) có thể được xem như
là trường hợp đặc biệt của mối quan hệ lớp đối tượng mờ, với độ thuộc vào lớp
là 1. Rõ ràng, sự đánh giá mức độ thành viên không chắc chắn của các đối tượng
vào lớp là rất quan trọng trong quan hệ lớp đối tượng mờ.
Trong CSDL HĐT, một đối tượng thuộc về một lớp nếu các giá trị thuộc
tính của nó lần lượt được bao hàm trong các miền thuộc tính tương ứng của

lớp. Tương tự, để tính độ thuộc thành viên của một đối tượng thuộc về một lớp

16


trong mối quan hệ lớp đối tượng mờ, ta cần phải xác định mức độ mà các miền
thuộc tính của lớp bao hàm các giá trị thuộc tính của đối tượng.
Trong luận án này, chúng tôi xem miền trị của mỗi thuộc tính mờ trong lớp đối
tượng mờ là một đại số gia tử, từ đó, xây dựng các phân hoạch dựa trên tính mờ của
các giá trị trong đại số gia tử và lân cận mức k của khái niệm mờ. Khi đó, độ thuộc
thành viên của đối tượng thuộc vào lớp trong mối quan hệ lớp đối tượng mờ được
xác định dựa vào mức độ thuộc k của các miền thuộc tính của lớp đối với các giá trị
thuộc tính của các đối tượng này.
5.6 Quan hệ kế thừa mờ
Sự thừa kế là một trong những khái niệm trung tâm của mô hình CSDL
HĐT. Thừa kế là cơ chế cho phép một lớp được áp dụng các tính chất của lớp
cha, phản ánh một đặc trưng vốn có trong quan hệ giữa các đối tượng thực tế.
Cơ chế kế thừa là một ưu điểm lớn của mô hình hướng đối tượng, bởi không chỉ
phản ánh bản chất của các quan hệ thực tế mà còn cho phép tối ưu dữ liệu và
tái sử dụng mã khi xây dựng hệ thống. Vì lớp đối tượng không chắc chắn và mơ
hồ nên cơ chế kế thừa cũng trở nên không chắc chắn [23].
Trong CSDL HĐT mờ, các lớp có thể là mờ hoặc rõ. Ba dạng cơ bản của
quan hệ kế thừa mờ trong mô hình này đó là:
1. Lớp cha rõ và lớp con rõ.
2. Lớp cha rõ và lớp con mờ.
3. Lớp cha mờ và lớp con mờ.
Trường hợp 1 giống như trong các CSDL HĐT truyền thống, nghĩa là các lớp
có thể có hoặc không có sự kế thừa một cách chắc chắn. Trường hợp 2, 3 được
gọi là quan hệ kế thừa mờ, nghĩa là hai lớp có sự kế thừa với mức độ thuộc k.
Trong thực tế, trường hợp 1 có thể được xem như là trường hợp đặc biệt của

quan hệ kế thừa mờ, với độ thuộc thành viên của mô hình phân cấp lớp con-lớp
cha là một.
Trong CSDL HĐT truyền thống, một lớp con được phát triển từ một lớp cha bằng
cách kế thừa một số thuộc tính, phương thức từ lớp cha, ghi đè một số thuộc tính và
phương thức của lớp cha, hoặc định nghĩa một số thuộc tính và phương thức mới. Vì
lớp con là một cụ thể hóa của lớp cha, do đó bất kỳ đối tượng nào thuộc về lớp con
phải thuộc về lớp cha. Đặc điểm này có thể dùng để xác định hai lớp có thể quan hệ

17


cha-con hay không. Trong CSDL HĐT mờ, các lớp có thể mờ. Một lớp con được
sinh ra từ lớp cha mờ, thì lớp con này là lớp mờ, và mối quan hệ này là quan hệ kế
thừa mờ. Phương pháp được sử dụng để xác định mối quan hệ lớp con - lớp cha mờ
trong CSDL HĐT mờ là: với bất kỳ đối tượng (mờ) nếu mức độ thuộc k mà nó thuộc
vào lớp con là nhỏ hơn hoặc bằng mức độ thuộc k mà nó thuộc vào lớp cha.
Một lớp là lớp con của một lớp cha với mức độ thuộc k là nhỏ nhất trong các mức
độ thuộc k mà các đối tượng của lớp thuộc vào nó. Một cách hình thức, cho hai lớp
C1 và C2, k1 và k2 là mức độ thuộc tương ứng, và 0 ≤ k1 ≤ k2 ≤ k(trong thực tế, số
gia tử trong các giá trị ngôn ngữ là hữu hạn nên tồn tại một số nguyên dương k). Ta
nói, C2 là lớp con của lớp C1 nếu (∀o)(µC2,k2 ≤ µC1,k1 ), trong đó µC,k (o) là độ
thuộc mức k của đối tượng o thuộc vào lớp C.
Ngoài ra, có một trường hợp có thể xảy ra là lớp cha mờ - lớp con rõ. Trong
tính chất kế thừa có tính chất thừa kế riêng (private), có nghĩa là những thuộc
tính và phương thức khi khai báo private, và không có phương thức công khai
xử lý trên những thuộc tính mờ ở lớp cha thì các đặc tính riêng của lớp cha sẽ
không được truyền cho lớp con, lúc đó lớp con sẽ trở thành rõ.

5.7 Mô hình lớp đối tượng mờ
5.7.1 Chuyển các giá trị thuộc tính về giá trị khoảng [a, b]

Giá trị thuộc tính mờ là hợp của hai thành phần giá trị rõ và giá trị mờ. Đối
với giá trị rõ, các kiểu dữ liệu bao gồm các loại đơn giản như số nguyên, thực,
chuỗi. Đối với giá trị mờ, giá trị ngôn ngữ thường được sử dụng để biểu diễn
thông tin không chính xác. Như vậy, ta cần phải có phương pháp biểu diễn một
cách thống nhất các dạng dữ liệu, nhằm thuận tiện cho việc đánh giá quan hệ
gần nhau giữa chúng.
Trong phần này, sẽ trình bày phương pháp biến đổi các giá trị này về các
khoảng [a, b] tương ứng. Với phương pháp biểu diễn này, sẽ xem xét các kiểu dữ
liệu khác nhau trên một quan điểm thống nhất. Phương pháp chuyển về giá trị
khoảng được thực hiện như sau:
1. Giá trị thuộc tính là giá trị số:

18


• Nếu giá trị thuộc tính là a thì chuyển thành [a, a]. Ví dụ, giá trị thuộc

tính a = 10 thì khi chuyển thành khoảng sẽ là [10, 10].
• Nếu giá trị thuộc tính là vào khoảng a thì chuyển thành [a − ε, a + ε],
• với ε là bán kính với tâm a. Ví dụ, giá trị thuộc tính là vào khoảng 10 và

chọn ε = 1 thì khi chuyển thành giá trị khoảng sẽ là [9, 11].
• Nếu giá trị thuộc tính là a đến b thì chuyển thành [a, b]. Ví dụ, nếu giá

trị thuộc tính là 24 đến 26 thì khi chuyển thành giá trị khoảng sẽ là [24, 26].
2. Giá trị thuộc tính là giá trị ngôn ngữ:

• Thuộc tính của đối tượng được xem như là thuộc tính ngôn ngữ và

được biểu diễn theo cấu trúc ĐSGT. Từ đó, xây dựng phân hoạch các lớp

tương tự mức k cho thuộc tính ngôn ngữ này.
• Xác định giá trị ngôn ngữ thuộc lớp tương tự mức k và từ đó xác định

được khoảng giá trị tương ứng cho giá trị thuộc tính này.
5.7.2 Định nghĩa lớp mờ
Các lớp trong CSDL HĐT mờ có thể mờ. Theo đó, một đối tượng thuộc một
lớp tùy theo mức k và một lớp là lớp con của một lớp khác theo mức k (k ∈ Z+).
Trong CSDL HĐT, một lớp được xác định bởi mối quan hệ kế thừa, thuộc tính
và phương thức. Về mặt hình thức, định nghĩa của một lớp mờ được thể hiện
như sau:
CLASS tênlớp
INHERITES
tên lớp thứ 1 WITH LEVEL OF mức 1
...
tên lớp thứ n WITH LEVEL OF mức n
ATTRIBUTES

19


tên thuộc tính thứ 1: [FUZZY] DOMAIN dom 1: TYPE OF kiểu 1
...
tên thuộc tính thứ n: [FUZZY] DOMAIN dom n: TYPE OF kiểu n
METHODS
...

END
Ví dụ 1.3. Cho một lớp “Nhân viên trẻ ” như sau:
CLASS


NhanVienTre{

Oid: alllD hoTen: string
tuoi: [fuzzy] domain [18...60]: int queQuan: string
HSL: [fuzzy] domain [0...0.75]: float SLSP:
[fuzzy] domain [0...30]: int
}
Dưới đây, là một số đối tượng của lớp NhanVienTre (ký hiệu C):
o1(C) = 15>;
o2(C) = thấp”, SLSP: “rất cao”>;
o3(C) = năng ít thấp”, SLSP: “khả năng cao”>;
o4(C) = “khoảng 3.0”, SLSP: “khoảng 17”>;
Khi cần xác định mức độ thuộc của các đối tượng vào lớp, ta chỉ cần xác
định mức trong quan hệ bằng nhau của thuộc tính tuổi.
Trước tiên, ta xem miền trị của thuộc tính tuổi là một đại số gia tử và được xác
định như sau: G ={0, trẻ, W , già, 1}, H−= {gần, ít}, H+ = {khá, rất}. Các tham
số mờ fm(trẻ) = 0.42; fm(già) = 0.58, µ(rất) = 0.2; µ(khá) = 0.28;
µ(gần) = 0.27; µ(ít) = 0.25, và miền trị của thuộc tính tuổi của những người

20


đang công tác là DOMtuoi = [18, 60].
Đối với giá trị thuộc tính là giá trị số, ta sử dụng phương pháp 1 trong mục
trước để chuyển về các giá trị khoảng:
o1.Tuổi = 27, sẽ chuyển thành o1.Tuổi = [27, 27].

o2.Tuổi = “khoảng 30”, sẽ chuyển thành o2.Tuổi = [29, 31].
Đối với giá trị thuộc tính là ngôn ngữ, ta sử dụng phương pháp 2 ở mục trước
để chuyển về các giá trị khoảng. Các lân cận mức k được xây dựng như sau:
Với k = 1, ta có:
fm(rất trẻ) = 0.2*0.42*42 = 3.528, vậy I(rất trẻ) = [18, 21.528]; fm(khá trẻ) =
0.28*0.42*42 = 4.9392, vậy I(khá trẻ) = (21.528, 26.4672] fm(ít khá trẻ) =
0.25*0.28*0.42*42 = 1.2342, vậy I(ít khá trẻ) = (25.2324,
26.4672]
Với k = 2, ta có:
fm(ít khá trẻ) = 0.25*0.28*0.42*42 = 1.2342, vậy I(ít khá trẻ) = (25.2324,
26.4672].
I(khá trẻ) = I(khá khá trẻ) ∪ I(gần khá trẻ), mà fm(khá khá trẻ) = 0.28
*0.28*0.42*42 = 1.382976 và fm(gần khá trẻ) = 0.27 *0.28*0.42*42 =
1.333584, vậy I(khá trẻ) = (22.51584, 25.2324].
Với k = 3, tương tư cách tính k = 2, ta có: I(khá trẻ) = (23.55308, 24.16554],

I((ít khá trẻ) = (25.4794, 26.1585].
Với “Nhân Viên Trẻ ”, ta có các lớp tương đương FNk(trẻ) như sau:
F N1 (trẻ) = I(khá trẻ) ∪ I(gần trẻ) = (21.5280, 31.23].
F N2 (trẻ) = I(ít khá trẻ) ∪ I(rất gần trẻ) = (25.2324, 27.91476].
F N3 (trẻ) = I(ít ít khá trẻ) ∪ I(rất rất gần trẻ) = (26.1585, 26.2767].
Vậy, sử dụng định nghĩa trên ta được các đối tượng thuộc vào lớp “Nhân Viên
Trẻ ” như sau:

21


Khi k = 1, cả o1, o2, o3, o4 đều thuộc lớp “Nhân Viên Trẻ ”, vì:
Tuổi = [27, 27] ∈ F N1 (trẻ); o2.Tuổi = [29, 31] ∈ F N1 (trẻ); o3.Tuổi =
[21.5280, 26.4672] ∈ F N1 (trẻ); o4.Tuổi = [25.2324, 26.4672] ∈ F N1 (trẻ);

Khi k = 2, cả o1, o4 thuộc lớp “Nhân Viên Trẻ ”, vì:
Tuổi = [27, 27] ∈ F N2 (trẻ); o4.Tuổi = [25.2324, 26.4672] ∈ F N2 (trẻ);
và khi k = 3, không có đối tượng nào thuộc lớp “Nhân Viên Trẻ ”.
6. Ngôn ngữ truy vấn dữ liệu
Trong ngôn ngữ truy vấn, thành phần quan trọng nhất đó là điều kiện dùng
để chọn các đối tượng hay bộ dữ liệu trong một CSDL nào đó. Trong CSDL mờ,
các điều kiện được sử dụng để truy vấn dữ liệu gọi là điều kiện mờ. Có thể phân
tích các thành phần chính trong một điều kiện mờ được biểu diễn bởi ngữ nghĩa
của đại số gia tử như sau:
i. Vị từ nguyên tố (atomic predicate): là ánh xạ từ tập các miền trị thuộc
tính vào [0, 1]. Một vị từ nguyên tố thường tương ứng với một giá trị ngôn ngữ
như “già ”, “trẻ ”. . .
ii. Toán tử sửa đổi: là ánh xạ từ [0, 1] vào [0, 1] ứng với một từ nhấn như
“rất ”, “có thể ”. . .
iii. Các toán tử so sánh: là các phép toán đối sánh giữa các giá trị mờ trên
những miền trị, chẳng hạn như phép so sánh “xấp xỉ ”, “gần nhau”. . .
iv. Liên kết logic: thường dùng các phép toán hội, tuyển, phủ định.

22


KẾT LUẬN
Trong nội dung đã trình bày một cách ngắn gọn các khái niệm liên quan đến
tập mờ, biến ngôn ngữ, là những khái niệm cơ bản làm cơ sở cho việc mở rộng
và xây dựng các mô hình CSDL HĐT mờ. Cho đến nay, việc mở rộng mô hình
CSDL HĐT truyền thống để xử lý các thông tin mờ, không chắc chắn được nhiều
tác giả tập trung nghiên cứu dựa trên các tiếp cận khác nhau: Mô hình theo cách
tiếp cận lý thuyết đồ thị, mô hình theo cách tiếp cận quan hệ tương tự, mô hình
theo cách tiếp cận lý thuyết khả năng, mô hình theo cách tiếp cận lý thuyết xác
suất. Mỗi cách tiếp cận có những ưu điểm khác nhau, tuy nhiên có một điểm


chung là làm thế nào thể hiện và mô tả dữ liệu gần với thực tế hơn. Với những
ưu điểm của cấu trúc ĐSGT, trong đó giá trị tập mờ của mỗi thuộc tính được
biểu diễn bởi một nhãn ngôn ngữ, các giá trị thuộc tính như vậy không được
diễn dịch bởi hàm thành viên mà ngữ nghĩa của nó được xác định bởi ĐSGT
trên miền trị của các thuộc tính tương ứng. Trên cơ sở đó, chúng tôi trình bày
một cách ngắn ngọn các khái niệm của ĐSGT, ĐSGT tuyến tính đầy đủ, các
mệnh đề, định lý liên quan làm cơ sở nghiên cứu mô hình CSDL HĐT với thông
tin mờ và không chắc chắn. Việc tập trung nghiên cứu mô hình CSDL HĐT mờ
được bắt đầu từ cách xây dựng quan hệ đối sánh trên miền trị thuộc tính.
Chúng ta xem miền trị của thuộc tính mờ là một ĐSGT tuyến tính, dựa vào sự
phân hoạch của các giá trị trong ĐSGT để từ đó xây dựng các khái niệm lân cận
mức k, xấp xỉ mức k. Các quan hệ đối sánh trên miền trị của thuộc tính mờ được
định nghĩa, và quan hệ đối sánh "bằng nhau mức k" trên mô hình này là quan hệ
tương đương mức k trên miền trị.

23


TÀI LIỆU THAM KHẢO
[1] Nguyễn Công Hào (2008), Cơ sở dữ liệu mờ với thao tác dữ liệu dựa trên đại
số gia tử, Luận án tiến sĩ toán học, Viện Công nghệ thông tin – Viện khoa học
và Công nghệ Việt Nam.
[2] Hồ Cẩm Hà (2002), Một cách tiếp cận mở rộng cơ sở dữ liệu quan hệ với
thông tin không đầy đủ, Luận án tiến sĩ toán học, Trường Đại học Bách Khoa
Hà Nội.
[3] Z. M. MA+ AND LI YAN (2008), A Literature Overview of Fuzzy Database
Models

24




×