Cơ sở dữ liệu hướng đối tượng với thông tin ngôn ngữ mờ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (608.2 KB, 115 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
..

VIỆN HÀN LÂM KHOA HỌC VÀ
CƠNG NGHỆ VIỆT NAM

VIỆN CƠNG NGHỆ THƠNG TIN

ĐỒN VĂN THẮNG

CƠ SỞ DỮ LIỆU HƯỚNG ĐỐI TƯỢNG VỚI
THÔNG TIN NGÔN NGỮ MỜ

LUẬN ÁN TIẾN SĨ TOÁN HỌC

HÀ NỘI – 2014

BỘ GIÁO DỤC VÀ ĐÀO TẠO

VIỆN HÀN LÂM KHOA HỌC VÀ
CƠNG NGHỆ VIỆT NAM

VIỆN CƠNG NGHỆ THƠNG TIN

ĐỒN VĂN THẮNG

CƠ SỞ DỮ LIỆU HƯỚNG ĐỐI TƯỢNG VỚI
THÔNG TIN NGÔN NGỮ MỜ

Chun ngành: Bảo đảm tốn học cho máy tính và hệ thống tính tốn

Mã số: 62. 46. 35. 01

LUẬN ÁN TIẾN SĨ TỐN HỌC

NGƯỜI HƯỚNG DẪN KHOA HỌC:
1. PGS.TS ĐỒN VĂN BAN
2. PGS.TS TRƯƠNG CÔNG TUẤN

HÀ NỘI – 2014

LỜI CẢM ƠN
Luận án được hồn thành tại Viện Cơng nghệ Thơng tin. Để hồn thành luận
án này, tác giả đã nhận được sự chỉ bảo tận tình, cùng những địi hỏi nghiêm
khắc của PGS.TS Đồn Văn Ban, người đã truyền đạt rất nhiều kiến thức quí
báu cũng như những kinh nghiệm nghiên cứu khoa học trong suốt thời gian tác
giả theo học nghiên cứu sinh. Tác giả cũng đã nhận được sự hướng dẫn và quan
tâm giúp đỡ của PGS.TS Trương Công Tuấn. Nhân dịp này, tác giả xin được
bày tỏ lịng biết ơn chân thành và sự kính trọng sâu sắc đối với các Thầy.
Trong thời gian làm nghiên cứu sinh ở Viện Công nghệ Thông tin, tác giả
được tiếp nhận những kiến thức quý giá và sự quan tâm chân tình từ các thầy,
cơ giáo ở Viện. Tác giả xin gửi tới các thầy, cơ lịng biết ơn, và lời cảm ơn chân
thành nhất.
Tác giả xin chân thành cảm ơn Ban lãnh đạo, Bộ phận quản lý Nghiên cứu
sinh và các Phịng chức năng của Viện Cơng nghệ Thông tin đã tạo mọi điều
kiện thuận lợi trong quá trình học tập, nghiên cứu của tác giả tại Viện.
Tác giả xin cảm ơn Ban Giám hiệu trường Cao đẳng Công nghệ Thông tin
hữu nghị Việt Hàn, Ban Giám hiệu trường Cao đẳng Cơng Thương Hồ Chí Minh,
Ban Chủ nhiệm khoa Cơng nghệ Thơng tin và các Phịng chức năng của trường
Cao đẳng Công Thương đã quan tâm giúp đỡ mọi mặt để tác giả hoàn thành

nhiệm vụ học tập.
Xin chân thành cảm ơn sự quan tâm, động viên và những đóng góp quý báu
của các đồng nghiệp.
Sự quan tâm, mong mỏi của mọi thành viên trong Gia đình là một trong
những động cơ để tác giả nỗ lực học tập, nghiên cứu. Luận án này, như một món
quà tinh thần, xin đáp lại những niềm quan tâm, mong mỏi đó.
Cuối cùng, tác giả xin biểu thị sự biết ơn tới những người thân và bạn bè đã
ưu ái, giúp đỡ, động viên, khích lệ để tác giả hồn thành luận án này.

LỜI CAM ĐOAN

Tác giả xin khẳng định tất cả các kết quả được trình bày trong luận án là
của riêng tác giả, không sao chép từ bất kỳ một công trình nào khác. Nếu có
điều gì khơng trung thực, tác giả xin chịu hoàn toàn trách nhiệm.
Tác giả

Đoàn Văn Thắng

Mục lục

Danh mục các thuật ngữ và từ viết tắt

i

Danh sách hình vẽ

ii

Danh sách bảng

iii

MỞ ĐẦU

1

Chương 1. TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU HƯỚNG ĐỐI
TƯỢNG MỜ

6

1.1. Giới thiệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

6

1.2. Thơng tin khơng đầy đủ trong mơ hình CSDL . . . . . . . . . . .

9

1.2.1. Thông tin sai lệch . . . . . . . . . . . . . . . . . . . . . . . 10
1.2.2. Thông tin thiếu chính xác . . . . . . . . . . . . . . . . . . 10
1.2.3. Thông tin không chắc chắn . . . . . . . . . . . . . . . . . 11
1.3. Tập mờ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3.1. Tập mờ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3.2. Các phép toán trên tập mờ

. . . . . . . . . . . . . . . . . 14

1.3.3. Tổng quát hoá ba phép toán cơ bản trên tập mờ . . . . . . 14
1.3.4. Biến ngôn ngữ . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.4. Mơ hình biểu diễn dữ liệu mờ với ngữ nghĩa của đại số gia tử . . . 17
1.4.1. Đại số gia tử . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.4.2. Đại số gia tử tuyến tính đầy đủ . . . . . . . . . . . . . . . 20
1.5. Mơ hình CSDL hướng đối tượng mờ . . . . . . . . . . . . . . . . . 26
1.5.1. Đối tượng mờ . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.5.2. Lớp mờ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

1.5.3. Giá trị thuộc tính . . . . . . . . . . . . . . . . . . . . . . . 29
1.5.4. Phương thức

. . . . . . . . . . . . . . . . . . . . . . . . . 30

1.5.5. Quan hệ lớp đối tượng mờ . . . . . . . . . . . . . . . . . . 30
1.5.6. Quan hệ kế thừa mờ . . . . . . . . . . . . . . . . . . . . . 32
1.5.7. Mơ hình lớp đối tượng mờ . . . . . . . . . . . . . . . . . . 33
1.6. Ngôn ngữ truy vấn dữ liệu . . . . . . . . . . . . . . . . . . . . . . 37
1.7. Kết luận . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
Chương 2. PHỤ THUỘC DỮ LIỆU TRONG MƠ HÌNH CƠ SỞ
DỮ LIỆU HƯỚNG ĐỐI TƯỢNG MỜ

39

2.1. Quan hệ ngữ nghĩa của dữ liệu mờ . . . . . . . . . . . . . . . . . 39
2.1.1. Đối sánh giá trị khoảng

. . . . . . . . . . . . . . . . . . . 39

2.1.2. Sự tương đương hai giá trị thuộc tính . . . . . . . . . . . . 41
2.1.3. Xấp xỉ ngữ nghĩa . . . . . . . . . . . . . . . . . . . . . . . 43
2.2. Phụ thuộc thuộc tính mờ và tập luật suy dẫn . . . . . . . . . . . 45
2.2.1. Phụ thuộc thuộc tính mờ trong lớp đối tượng . . . . . . . 46
2.2.2. Các luật suy dẫn trên phụ thuộc thuộc tính mờ . . . . . . 50
2.3. Phụ thuộc phương thức mờ trong lớp đối tượng . . . . . . . . . . 51
2.4. Truy vấn Null và lập luận tương tự . . . . . . . . . . . . . . . . . 52
2.4.1. Các giá trị Null . . . . . . . . . . . . . . . . . . . . . . . . 52
2.4.2. Truy vấn Null . . . . . . . . . . . . . . . . . . . . . . . . . 52
2.4.3. Lập luận tương tự . . . . . . . . . . . . . . . . . . . . . . 53
2.4.4. Thuật toán tìm câu trả lời gần đúng cho truy vấn Null . . 54
2.5. Một số ví dụ minh họa . . . . . . . . . . . . . . . . . . . . . . . . 63
2.6. Kết luận . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
Chương 3. TRUY VẤN DỮ LIỆU TRONG HỆ THỐNG HƯỚNG
ĐỐI TƯỢNG VỚI THÔNG TIN KHÔNG CHẮC CHẮN

70

3.1. Đối tượng mờ dư thừa . . . . . . . . . . . . . . . . . . . . . . . . 71

3.2. Các phép toán đại số mờ . . . . . . . . . . . . . . . . . . . . . . . 73
3.2.1. Phép chọn mờ . . . . . . . . . . . . . . . . . . . . . . . . . 73
3.2.2. Phép chiếu mờ . . . . . . . . . . . . . . . . . . . . . . . . 75
3.2.3. Phép tích mờ . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.2.4. Phép kết nối mờ . . . . . . . . . . . . . . . . . . . . . . . 75
3.2.5. Phép hợp mờ . . . . . . . . . . . . . . . . . . . . . . . . . 77
3.2.6. Phép giao mờ . . . . . . . . . . . . . . . . . . . . . . . . . 78
3.2.7. Phép trừ mờ . . . . . . . . . . . . . . . . . . . . . . . . . . 79
3.3. Phương pháp truy vấn dữ liệu mờ . . . . . . . . . . . . . . . . . . 80

3.3.1. Tìm kiếm dữ liệu theo lân cận ngữ nghĩa . . . . . . . . . . 81
3.3.2. Truy vấn mờ với lượng từ ngôn ngữ . . . . . . . . . . . . . 85
3.4. Một số ví dụ minh họa . . . . . . . . . . . . . . . . . . . . . . . . 90
3.5. Kết luận . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
KẾT LUẬN

97

DANH MỤC CÔNG TRÌNH CỦA TÁC GIẢ

98

TÀI LIỆU THAM KHẢO

100

i

Danh mục thuật ngữ, từ viết tắt

Tiếng Việt

Tiếng Anh

Ký hiệu

Biến ngôn ngữ

Linguistic variable

Cơ sở dữ liệu hướng đối tượng

Object-Oriented DataBase

OODB

Cơ sở dữ liệu hướng đối tượng mờ

Fuzzy Object-Oriented DataBase

FOODB

Dữ liệu ngơn ngữ

Linguistic data

Đại số gia tử tuyến tính

Linear Hedge algebra

Đại số gia tử

Hedge algebra

Đại số đối tượng mờ

Fuzzy Object Algebra

Đối tượng phức hợp

Composite object

Định danh đối tượng

Object Identity

Giá trị chân lý

Truth value

Lập luận xấp xỉ

Approximate reasoning

Lược đồ đối tượng

Object Schemas

Nhóm quản trị cơ sở đối tượng

Object DataBase

HA

OID

ODMG

Management Group

Ngôn ngữ truy vấn đối tượng

Object Query Language

OQL

Ngôn ngữ truy vấn đối tượng mờ

Fuzzy Object Query Language

FOQL

Quan hệ kế thừa

Inheritance relationship

Quan hệ kết nhập

Aggregation relationship

Phân cấp thừa kế mờ

Fuzzy inheritance hierarchy

Phụ thuộc hàm mờ

Fuzzy Fuctional Dependency

FFD

Phụ thuộc phương thức mờ

Fuzzy Method Dependency

FMD

Lân cận mờ

Fuzzy Neighborhood

FN

ii

Danh sách hình vẽ

2.1

[fa , fb ] ∈ ℑ(x) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

2.2

[fa , fb ] ̸⊂ ℑ(x) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

2.3

khi [fa , fb ] ∩ ℑ(x) = ∅ . . . . . . . . . . . . . . . . . . . . . . . . 41

2.4

Tính mờ của trẻ và già . . . . . . . . . . . . . . . . . . . . . . . . 41

2.5

Lớp đối tượng Sinh Viên . . . . . . . . . . . . . . . . . . . . . . . 46

2.6

Lược đồ lớp NhanVien . . . . . . . . . . . . . . . . . . . . . . . . 66

3.1

Mối quan hệ giữa lớp SinhVien và PhongHoc . . . . . . . . . . . . 90

iii

Danh sách bảng

2.1

Thể hiện của lớp SinhVien . . . . . . . . . . . . . . . . . . . . . . 47

2.2

Thể hiện của lớp SinhVien khi chuyển về giá trị khoảng và đối
sánh với các khoảng mờ của thuộc tính. . . . . . . . . . . . . . . . 49

2.3

Kết quả thực hiện truy vấn 2.1 . . . . . . . . . . . . . . . . . . . 64

2.4

Kết quả thực hiện truy vấn 2.2 . . . . . . . . . . . . . . . . . . . 65

2.5

Thể hiện của lớp BoPhan và QuanLy . . . . . . . . . . . . . . . . 66

2.6

Ma trận độ tương tự giữa các thuộc tính . . . . . . . . . . . . . . 66

2.7

Kết quả thực hiện trong truy vấn 2.4 . . . . . . . . . . . . . . . . 68

3.1

Các thể hiện của lớp PhongHoc và SinhVien . . . . . . . . . . . . 91

3.2

Kết quả truy vấn 3.2 . . . . . . . . . . . . . . . . . . . . . . . . . 93

3.3

Kết quả truy vấn 3.2 . . . . . . . . . . . . . . . . . . . . . . . . . 95

MỞ ĐẦU

Như chúng ta đã biết, mơ hình hướng đối tượng (HĐT) truyền thống đã
chứng tỏ nhiều ưu điểm trong các vấn đề mơ hình hóa, thiết kế và hiện thực các
hệ thống lớn, từ phần mềm cho đến cơ sở dữ liệu (CSDL). Đó là nhờ mơ hình
này có khả năng biểu diễn trạng thái và hành vi của các đối tượng cũng như
sự phân cấp, phân loại và quan hệ giữa chúng trong các ứng dụng thực tế. Hơn
nữa, mơ hình hướng đối tượng cịn giúp tối ưu dữ liệu và tái sử dụng mã khi
xây dựng hệ thống thông qua cơ chế thừa kế thông tin giữa các lớp đối tượng.
Tuy nhiên, trong mơ hình HĐT truyền thống, các mối quan hệ cũng như trạng
thái và hành vi của các đối tượng luôn luôn được thể hiện một cách chắc chắn
và chính xác. Điều này khơng hồn tồn phù hợp với thực tế, bởi thơng tin về
các đối tượng trong thế giới thực có thể mơ hồ, không chắc chắn, không đầy đủ.
Hệ quả là các ứng dụng dựa trên mơ hình CSDL HĐT truyền thống khơng
biểu diễn được các đối tượng mà thông tin về chúng khơng được xác định một
cách chắc chắn và chính xác. Chẳng hạn, các ứng dụng mơ hình CSDL truyền
thống khơng thể trả lời các truy vấn như “tìm tất cả những bệnh nhân trẻ có
tiền sử bệnh viêm thanh quản”; hoặc “tìm tất cả các gói bưu kiện có thể tích
khoảng 25000 cm3 ”,. . . trong đó trẻ và khoảng 25000 là những khái niệm và giá
trị khơng chính xác. Để khắc phục được các hạn chế như vậy, các nghiên cứu gần
đây đã tập trung nghiên cứu mô hình CSDL HĐT có khả năng biểu diễn và xử
lý được các đối tượng mà thơng tin về chúng có thể khơng chắc chắn và khơng
chính xác.
Trên tinh thần đó, trong những năm qua đã có nhiều cách tiếp cận khác
nhau để giải quyết các vấn đề này. Một số nghiên cứu của George, Buckles và
Petry, 1993 [25]; Yazici và George, 1999 [47]; Yazici, George và Aksoy 1999 [48]
cho phép giá trị thuộc tính đối tượng là một tập các giá trị mờ kết hợp với một
quan hệ tương tự trên miền giá trị thuộc tính. Tùy theo ngữ cảnh, tập các giá trị

2

thuộc tính được định nghĩa là tuyển hoặc hội logic của các giá trị này. Ngữ nghĩa
của các giá trị tập mờ được xác định thông qua các quan hệ tương tự trên các
miền giá trị thuộc tính tương ứng. Vì các giá trị thuộc tính đối tượng là những
tập mờ, nên các lớp đối tượng cũng trở nên mờ. Ngoài ra, sự phân loại và phân
cấp lớp là mờ nên mức độ thành viên lớp của các đối tượng cũng được mờ hóa
theo.
Như trong mơ hình CSDL quan hệ mờ, trong các các mơ hình CSDL HĐT
mờ, phương pháp biểu diễn giá trị thuộc tính đối tượng bởi các phân bố khả
năng. Các nghiên cứu theo tiếp cận này rất đa dạng và khả năng mơ hình hóa các
đối tượng mờ cũng rất khác nhau. Nhóm tác giả Van Gyseghem và De Caluwe
[44] kết hợp với lý thuyết tập mờ đã định nghĩa lớp như một tập các tính chất
gồm các thuộc tính và phương thức lớp xác định các đối tượng mờ của lớp. Mỗi
phương thức được biểu diễn như một hàm thao tác trên các giá trị tập mờ của
thuộc tính đối tượng. Bao hàm và phân cấp lớp mờ được xác định thông qua
bao hàm các miền giá trị thuộc tính tương ứng của các lớp. Thừa kế khơng chắc
chắn thuộc tính lớp được tính tốn thông qua mức độ bao hàm lớp con trong
lớp cha.
Mô hình dựa trên lý thuyết xác suất đầu tiên được nhóm tác giả Kornatzky
và Shimony đề xuất năm 1994 [27]. Trong mơ hình này, lớp được định nghĩa như
một tập các thuộc tính mà giá trị của chúng có thể kết hợp với một phân bố xác
suất. Lược đồ được định nghĩa như một tập các lớp có phân cấp kết hợp với xác
suất có điều kiện để một đối tượng của một lớp thuộc về lớp con của nó. Các tác
giả cũng đã phát triển một ngôn ngữ truy vấn để thao tác chọn các đối tượng
thỏa một xác suất được kết hợp với các truy vấn.
Rõ ràng, trở ngại lớn nhất trong việc phát triển các hệ thống CSDL HĐT
mờ đó là chưa có một mơ hình dữ liệu chuẩn hay cơ sở toán học thống nhất cho

việc biểu diễn và xử lý dữ liệu đối tượng mờ. Cho đến nay, các nghiên cứu về mơ
hình CSDL HĐT mờ chủ yếu tập trung vào việc mở rộng mô hình dữ liệu rõ đã
có theo nhiều cách tiếp cận khác nhau và cho phép biểu diễn, thao tác trên dữ
liệu mờ. Do đó, các mơ hình CSDL HĐT mờ này chỉ thống nhất trên một tập

3

các khái niệm chung nhất trong mơ hình của ODMG [22]. Có thể thấy rằng, các
kết quả nghiên cứu trên CSDL HĐT mờ luôn được xem xét với một mô hình cụ
thể, các kết quả này sẽ giải quyết cho một lớp các bài toán với một tập con các
khái niệm, tính chất đặc trưng hướng đối tượng. Như vậy, việc chọn lựa một mơ
hình dữ liệu để nghiên cứu các vấn đề trong CSDL HĐT mờ là rất quan trọng.
Trong cơ sở dữ liệu quan hệ mờ, ở trong nước, từ năm 1985 Lê Tiến Vương
đã nghiên cứu áp dụng lý thuyết tập mờ trong mơ hình quan hệ. Một số các kết
quả về mơ hình cơ sở dữ liệu mở rộng sử dụng lý thuyết tập mờ và biến ngôn
ngữ của Lê Tiến Vương và Hồ Thuần đã được công bố vào năm 1989. Vẫn tiếp
tục đi sâu vào hướng đó, có các cơng trình nghiên cứu của Đinh Thị Ngọc Thanh
(1991) và Trương Đức Hùng (1996). Năm 2002, Hồ Cẩm Hà đã mở rộng mơ hình
cơ sở dữ liệu mờ dựa trên quan hệ tương tự và phát triển một số các kết quả
dựa trên mơ hình [25]. Năm 2004, Trần Thiên Thanh đã đề xuất một số kết quả
về phụ thuộc dữ liệu và tổng kết dữ liệu trên mơ hình lý thuyết khả năng.
Trên cơ sở những mơ hình mở rộng, những kết quả đã đạt được trên mơ hình
quan hệ như phụ thuộc hàm, phụ thuộc đa trị, các dạng chuẩn, phân tách lược
đồ quan hệ, ngôn ngữ hỏi đáp, . . . được mở rộng theo nhiều cách khác nhau để
phù hợp với từng mơ hình. Ngồi ra, để khai thác dữ liệu trên mơ hình cơ sở dữ
liệu mờ nhiều tác giả nghiên cứu đã mở rộng những ngôn ngữ hỏi đáp trên mơ
hình quan hệ như đại số quan hệ, phép tính quan hệ trên bộ, phép tính quan hệ
trên miền, ngôn ngữ SQL,. . . cho phù hợp với mô hình mới và đáp ứng yêu cầu
khai thác dữ liệu đa dạng của người dùng.

Tuy đã có nhiều cách tiếp cận để xử lý thông tin mờ nhưng hầu hết việc biểu
diễn và đối sánh dữ liệu vẫn phức tạp và mang tính chủ quan, phụ thuộc vào
nhiều yếu tố làm ảnh hưởng đến hiệu quả của việc thao tác dữ liệu. Chẳng hạn
như theo cách tiếp cận quan hệ mờ, yếu tố ảnh hưởng vào việc biểu diễn ngữ
nghĩa là việc xây dựng hàm thuộc và chọn ngưỡng lát cắt α của tập mờ, theo
cách tiếp cận quan hệ tương tự là việc chọn ngưỡng tương tự hai giá trị, ngưỡng
của mỗi thuộc tính và ngưỡng của bộ dữ liệu,. . . Vì vậy, cần có một cách tiếp
cận để xử lý thông tin mờ một cách hiệu quả, đơn giản và trực quan hơn.

4

Nếu xem thuộc tính mờ A là một biến ngơn ngữ và F DA là miền các giá
trị ngôn ngữ của A được sắp theo một thứ tự tuyến tính, thì F DA được xét
như là một đại số gia tử (ĐSGT) tuyến tính. Cách tiếp cận từ đại số đến ngữ
nghĩa ngôn ngữ được nghiên cứu đầu tiên bởi tác giả Nguyễn Cát Hồ và Wechler
[30][31], trong mơ hình này giá trị tập mờ của mỗi thuộc tính được biểu diễn bởi
một nhãn ngôn ngữ. Tuy nhiên, các giá trị thuộc tính như vậy khơng được diễn
dịch bởi hàm thành viên mà ngữ nghĩa của nó được xác định bởi đại số gia tử
trên miền trị của thuộc tính tương ứng. Nhờ những ưu điểm của cấu trúc ĐSGT
[5][6][20][35], chúng tôi tập trung nghiên cứu CSDL HĐT với thông tin ngôn ngữ
mờ dựa trên cách tiếp cận ngữ nghĩa định lượng của ĐSGT, trong đó ngữ nghĩa
ngơn ngữ được lượng hóa bằng các ánh xạ định lượng của ĐSGT. Theo cách tiếp
cận này, giá trị ngôn ngữ là dữ liệu, không phải là nhãn của các tập mờ biểu
diễn ngữ nghĩa của giá trị ngôn ngữ và ưu điểm cơ bản của nó là việc cho phép
tìm kiếm, xác định ngữ nghĩa của thông tin không chắc chắn chỉ bằng các thao
tác dữ liệu kinh điển thường dùng và do đó đảm bảo tính thuần nhất của kiểu
dữ liệu trong xử lý ngữ nghĩa của chúng. Điều này khác với CSDL HĐT mờ theo
các cách tiếp cận trước đây là vừa phải xử lý ngữ nghĩa kinh điển, vừa phải xử
lý ngữ nghĩa được biểu diễn dưới dạng tập mờ hay hàm thuộc của chúng. Ngoài

ra, theo cách tiếp cận ngữ nghĩa định lượng của ĐSGT, ngữ nghĩa ngôn ngữ có
thể biểu thị bằng một lân cận các khoảng được xác định bởi độ đo tính mờ của
các giá trị ngơn ngữ của một thuộc tính với vai trị là biến ngơn ngữ. Ví dụ, ngữ
nghĩa của giá trị ngơn ngữ "rất cao" của thuộc tính lương nhân viên sẽ được
biểu thị bằng những khoảng lân cận của giá trị đại diện của giá trị ngôn ngữ "rất
cao" thông qua ánh xạ định lượng của ĐSGT của thuộc tính lương nhân viên.
Với ý nghĩa như vậy, luận án đặt ra mục tiêu nghiên cứu cụ thể như sau:
1. Nghiên cứu mơ hình CSDL HĐT với thơng tin ngơn ngữ mờ dựa trên định
lượng của ĐSGT và lân cận ngữ nghĩa của ĐSGT.
2. Xây dựng một số dạng phụ thuộc dữ liệu và các vấn đề liên quan.
3. Tiến hành nghiên cứu một số thao tác dữ liệu trong mô hình CSDL HĐT
mờ.

5

Để thực hiện được các mục tiêu nêu trên, luận án được tổ chức như sau: Phần
mở đầu, ba chương và phần kết luận.
Chương 1 trình bày khái quát về cơ sở dữ liệu hướng đối tượng mờ. Nội
dung cụ thể của chương: tóm tắt các hướng tiếp cận khác nhau cho việc nghiên
cứu mơ hình CSDL HĐT mờ. Tiếp đến, trình bày tóm tắt một số khái niệm và
tính chất cơ bản của ĐSGT như độ đo tính mờ, hàm dấu, hàm định lượng ngữ
nghĩa,... Phần cuối, trình bày một số khái niệm cơ bản trong mơ hình CSDL
HĐT như đối tượng, lớp, quan hệ lớp đối tượng, v.v. . . được mở rộng sang mơ
hình CSDL HĐT với thông tin ngôn ngữ mờ theo tiếp cận ĐSGT.
Chương 2 giới thiệu các phụ thuộc và ràng buộc dữ liệu trong một lớp đối
tượng mờ. Dựa trên hàm đo xấp xỉ ngữ nghĩa của hai giá trị mờ, chúng tôi đưa
ra khái niệm phụ thuộc hàm mờ cho các thuộc tính của lớp, phụ thuộc hàm mờ
giữa thuộc tính và phương thức lớp, và các vấn đề liên quan. Trong chương này,
lý thuyết suy diễn tương tự được trình bày và áp dụng quá trình suy diễn tương

tự để tìm ra câu trả lời gần đúng cho truy vấn Null.
Chương 3 trình bày ngơn ngữ truy vấn hướng đối tượng mờ và các phép
toán đại số mờ. Đưa lượng từ ngôn ngữ vào trong câu truy vấn được đề xuất phù
hợp với mơ hình CSDL hướng đối tượng mờ theo cách tiếp cận đại số gia tử.
Các kết quả chính của luận án được báo cáo và thảo luận tại các hội nghị,
hội thảo khoa học:
- Hội thảo quốc gia “Một số vấn đề chọn lọc về công nghệ thông tin và truyền
thông”, tại Cần Thơ ngày 7-8/10/2011, và Hà Nội ngày 3-4/12/2012.
- Hội nghị khoa học kỷ niệm 35 năm thành lập Viện công nghệ thông tin, Hà
Nội 26/12/2011.
- The Fourth International Conference on Knowledge and Systems Engineering, KSE12, Da Nang - Viet Nam, 08/2012.
- Hội nghị khoa học FAIR “Nghiên cứu cơ bản và ứng dụng công nghệ thông
tin”, tại Huế ngày 20-21/06/2013, và Thái Nguyên ngày 19-20/06/2014.
Các kết quả của luận án được công bố trong 8 cơng trình ở trang 98.

Chương 1
TỔNG QUAN VỀ CƠ SỞ DỮ
LIỆU HƯỚNG ĐỐI TƯỢNG MỜ

1.1.

Giới thiệu

Trong những năm gần đây, mơ hình CSDL HĐT với thông tin mờ và không
chắc chắn được nhiều tác giả trong và ngoài nước quan tâm nghiên cứu. Tất cả
các cách tiếp cận nhằm mục đích nắm bắt và xử lý một cách thỏa đáng trên một
luận điểm nào đó các thơng tin khơng chính xác, khơng chắc chắn hay khơng
đầy đủ. Dưới đây, chúng tơi tóm tắt lại một số mơ hình CSDL HĐT mờ theo
các cách tiếp cận và các kết quả đạt được trên các mô hình đã được đề xuất.

Trước hết, một số nghiên cứu cho phép giá trị thuộc tính đối tượng là một
tập các giá trị mờ kết hợp với một quan hệ tương tự trên miền giá trị thuộc tính
này (George, Buckles và Petry, 1993 [25]; Yazici và George, 1999 [47]). Tùy theo
ngữ cảnh, tập giá trị thuộc tính được định nghĩa như là tuyển hoặc hội logic của
các giá trị này. Ngữ nghĩa của các giá trị tập mờ được xác định thông qua các
quan hệ tương tự trên các miền giá trị thuộc tính tương ứng. Các phép tốn đại
số trên các lớp đối tượng như chọn, chiếu, kết nối, .v.v.., dựa trên độ đo tương
tự đã được xây dựng làm ngơn ngữ thao tác truy vấn đối tượng.
Vì các giá trị thuộc tính đối tượng có thể là những tập mờ, nên các lớp đối
tượng cũng trở nên mờ. Trong các mơ hình này, sự phân loại, phân cấp các lớp
là mờ nên mức độ thành viên lớp của các đối tượng cũng được mờ hóa theo.
Các độ đo tương ứng được sử dụng để tính tốn mức độ bao hàm lớp và mức độ
thành viên lớp. Độ đo bao hàm lớp con trong lớp cha được xác định bởi mức độ

7

tương tự tương ứng của các miền giá trị các thuộc tính của lớp con đối với lớp
cha. Độ đo thành viên lớp của mỗi đối tượng được định nghĩa thông qua mức độ
tương tự giữa giá trị tương ứng của mỗi thuộc tính của đối tượng với tập giá trị
của miền giá trị thuộc tính lớp.
Ngồi ra, mơ hình này được Yazici và George (1999b) [47] mở rộng bằng một
tập luật cho phép suy diễn trên các thông tin mờ về các đối tượng trong CSDL.
Nhóm tác giả Yazici, George và Aksoy (1999) [48] đã đề xuất các vấn đề về thiết
kế và thực hiện các mơ hình hướng đối tượng mờ dựa trên quan hệ tương tự.
Các tác giả này cũng đã xây dựng một hệ thống CSDL mờ dựa trên tính tương
tự cho phép thao tác và truy vấn thông tin mờ của các đối tượng thực tế.
Như các mơ hình CSDL quan hệ mờ, trong các mơ hình CSDL HĐT mờ,
phương pháp biểu diễn giá trị thuộc tính đối tượng bởi các phân bố khả năng
cũng được nghiên cứu rộng rãi. Các đề nghị theo tiếp cận này rất đa dạng và khả

năng mơ hình hóa các đối tượng mờ cũng rất khác nhau. Bordogna, Lucarella và
Pasi (1994) [17] đã đề nghị một mơ hình dữ liệu hướng đối tượng dựa trên đồ thị,
trong đó giá trị thuộc tính được biểu diễn bởi các phân bố khả năng, bao hàm
các lớp con trong lớp cha được biểu diễn bởi các tập mờ. Mức độ thành viên mờ
của các đối tượng được xác định thông qua mức độ bao hàm lớp và mức độ bao
hàm giá trị thuộc tính của đối tượng trong miền giá trị thuộc tính tương ứng của
lớp. Một ngơn ngữ truy vấn đối tượng dựa trên các độ đo khả năng đã được xây
dựng cho mơ hình này và khả năng áp dụng của các tính chất lớp là chắc chắn.
Nhóm tác giả này [18] tiếp tục mở rộng bằng cách kết hợp giá trị thuộc tính đối
tượng với một giá trị trong khoảng [0, 1] để biểu diễn mức độ không chắc chắn
về giá trị mà thuộc tính có thể nhận.
Nhóm tác giả Rossazza, Duboi và Prade (1997) [23] định nghĩa lớp như một
tập thuộc tính mà giá trị cũng như miền giá trị của thuộc tính có thể là các tập
mờ. Bao hàm và phân cấp lớp mờ đã được định nghĩa trên cơ sở logic mờ và lý
thuyết khả năng, thừa kế được xem xét khi quan hệ lớp thực sự là quan hệ lớp
cha lớp con. Đa thừa kế của một thuộc tính là lấy giao của các miền giá trị thuộc
tính mờ tương ứng của các lớp cha.

8

Van Gyseghem và De Caluwe (1997) [44] định nghĩa lớp như một tập các
thuộc tính và phương thức xác định các đối tượng mờ của lớp. Mỗi phương thức
được biểu diễn như một hàm thao tác trên các giá trị tập mờ của thuộc tính đối
tượng. Trong mơ hình này, khả năng khơng chắc chắn các tính chất lớp của các
đối tượng đã được đề cập, nhưng mức độ áp dụng của mỗi tính chất khơng được
định nghĩa hình thức trong biểu diễn lớp. Bao hàm và phân cấp lớp mờ được xác
định thông qua bao hàm các miền trị thuộc tính tương ứng của các lớp. Thừa
kế khơng chắc chắn thuộc tính lớp được tính tốn thơng qua mức độ bao hàm
lớp con trong lớp cha.

Marin, Pons và Vila (2001) [29], Berzal và cộng sự (2005a) [15] đã áp dụng
lý thuyết khả năng để xây dựng một tập các độ đo cho các quan hệ trên các tập
mờ làm cơ sở để các thao tác và truy vấn đối tượng. Các phương thức lớp cũng
đã được định nghĩa hình thức để biểu diễn thao tác của các đối tượng. De Tre và
De Caluwe (2005) [24] đã biểu diễn dữ liệu mờ của đối tượng như các ràng buộc
trên các tính chất của chúng. Một truy vấn được kết hợp với các ràng buộc, và
các đối tượng được chọn nếu thỏa mãn các ràng buộc này.
Eiter và cộng sự (2001) đã mở rộng mơ hình CSDL HĐT xác suất của Kormatzky và Shimony (1994) và gọi là mơ hình POB (Probabilistic Object Base).
Đây là một mơ hình cơ sở đối tượng xác suất dựa trên thủ tục. Theo đó, giá trị
thuộc tính của đối tượng được biểu diễn như một tập, kết hợp với hai hàm phân
bố xác suất cận dưới và cận trên để đo độ không chắc chắn về giá trị trong tập
mà thuộc tính có thể nhận.
Kết hợp tập mờ và xác suất, Baldwin và cộng sự (2000) [16], Cao và Rossiter
(2003) [19] đã đề xuất một mơ hình CSDL HĐT xác suất mờ dựa trên cơ sở
logic. Trong đó, lớp được định nghĩa bởi một tập tính chất được diễn dịch như
các vị từ mờ kết hợp với một khoảng xác suất biểu diễn khả năng áp dụng không
chắc chắn của chúng đối với lớp. Các vị từ khơng có tiền điều kiện biểu diễn
thuộc tính, ngược lại chúng biểu diễn phương thức của một lớp. Mỗi tính chất
đối tượng có thể nhận một giá trị tập mờ với một xác suất thuộc về khoảng xác
suất được suy dẫn từ mức độ áp dụng của nó đối với đối tượng.

9

Năm 2013, Vũ Đức Quảng [13] đã thực hiện các nghiên cứu về các phụ thuộc
dữ liệu của các đối tượng mờ trên mơ hình CSDL hướng đối tượng mờ với dữ liệu
được biểu diễn bởi phân bố khả năng được đề xuất bởi ZongMin Ma [51]. Trên
mơ hình mà Zong Min Ma đề xuất ngoài việc đảm bảo các khái niệm, tính chất
cốt lõi của mơ hình CSDL hướng đối tượng rõ, nó cịn giải quyết được tương đối
đầy đủ tính mờ của đối tượng, lớp, tính mờ trong mối quan hệ giữa đối tượng

và lớp, giữa lớp cha và lớp con.
Như đã trình bày ở trên, các hướng tiếp cận nghiên cứu mơ hình CSDL HĐT
với thơng tin mờ và không chắc chắn cũng đã chứng tỏ được khả năng mơ hình
hóa thơng tin mờ, khơng chính xác và không chắc chắn về các đối tượng. Tuy
nhiên, do sự đa dạng của những loại thông tin không đầy đủ, do những khó khăn
khi phải thao tác trên những thơng tin như vậy nên cịn rất nhiều vấn đề cần
được tiếp tục nghiên cứu. Trong những năm gần đây đại số gia tử được nhiều tác
giả nghiên cứu [5][6][10][20][34][35] và đã có được những kết quả đáng kể trong
các nghiên cứu về CSDL mờ. Vì vậy, mặc dù có nhiều kết quả nghiên cứu về
CSDL HĐT mờ, theo chiều hướng đó cách tiếp cận nghiên cứu CSDL HĐT mờ
với ngữ nghĩa dựa trên đại số gia tử vẫn có thể được xem là một vấn đề nghiên
cứu mới. Trong phần sau, một số khái niệm ĐSGT và ĐSGT tuyến tính đầy đủ,
các mệnh đề, định lý liên quan được trình bày làm cơ sở nghiên cứu trên mơ
hình này.

1.2.

Thơng tin khơng đầy đủ trong mơ hình CSDL

Một trong những lĩnh vực nghiên cứu chủ yếu trong CSDL là tiếp tục phát
triển các kết quả đã đạt được trong các mơ hình CSDL truyền thống với một
tập các khái niệm có ngữ nghĩa mở rộng. Một trong các yêu cầu khơng được giải
quyết đầy đủ bởi các các mơ hình truyền thống, đó là việc biểu diễn và xử lý
thơng tin khơng chính xác và khơng chắc chắn. Các mơ hình truyền thống giả
định rằng mơ hình cơ sở dữ liệu phản ánh một cách chính xác thế giới thực, dữ
liệu được lưu trữ là được xác định, chính xác và đầy đủ. Tuy nhiên, trong thực
tế cuộc sống, nhiều khi các giả định này khơng được thỏa đáng. Vì vậy trong

10

những năm gần đây, các mơ hình dữ liệu khác nhau được đề xuất để giải quyết
các loại đặc trưng của dữ liệu.
Trong các hệ thống CSDL, chúng ta thường quan tâm đến ba loại thơng tin
khơng hồn hảo (imperfect) sau: thơng tin sai lệch, thơng tin khơng chính xác,
thơng tin không chắc chắn [1].

1.2.1.

Thông tin sai lệch

Thông tin sai lệch là loại thơng tin khơng hồn hảo đơn giản nhất. Thông tin
của cơ sở dữ liệu là sai lệch khi nó khác với “thơng tin thực” (true information).
Mọi sai số lớn hay nhỏ của thông tin đều làm ảnh hưởng đến tính tồn vẹn
của CSDL, đó là vấn đề không thể chấp nhận và cần được xem xét trong các
hệ CSDL. Một loại thông tin sai lệch quan trọng là sự khơng nhất qn. Đơi
khi cùng một khía cạnh của thế giới thực được biểu diễn nhiều lần trong cùng
một CSDL hay trong nhiều CSDL khác nhau. Khi các biểu diễn đó là đối lập
khơng thể kết hợp được, dẫn đến thông tin là không nhất quán. Trong việc tích
hợp thơng tin từ nhiều CSDL khác nhau, các vấn đề về sự không nhất quán của
thông tin phải được quan tâm một cách đầy đủ.

1.2.2.

Thơng tin thiếu chính xác

Thơng tin trong CSDL là thiếu chính xác khi nó biểu diễn một tập các giá
trị có thể, và giá trị thực là một phần tử của tập đó. Như vậy, thơng tin thiếu
chính xác khơng phải là thơng tin sai lệch và khơng làm ảnh hưởng tới tính tồn
vẹn của CSDL. Sau đây là một số thơng tin thiếu chính xác đặc trưng:

- Thông tin tuyển, chẳng hạn tuổi của Nam hoặc là 35 hoặc là 36.
- Thông tin âm, chẳng hạn tuổi của Nam không phải là 30.
- Thông tin khoảng/miền, chẳng hạn tuổi của Nam nằm trong khoảng từ 35
đến 40 hoặc tuổi của Nam lớn hơn 35.
- Thông tin với các cận sai số, chẳng hạn tuổi của Nam là 30 ± 1.

11

Hai loại thơng tin khơng chính xác cực biên là thơng tin chính xác (ứng với
trường hợp tập các giá trị có thể là một phần tử) và các giá trị null (được hiểu
theo nghĩa là thơng tin khơng chính xác, trong đó tập các giá trị có thể bao gồm
tồn bộ miền các giá trị hợp lệ).

1.2.3.

Thơng tin khơng chắc chắn

Tri thức của chúng ta về thế giới thực (chính xác hoặc khơng chính xác), đơi
khi khơng thể được phát biểu với một mức độ chân lý tuyệt đối, và đòi hỏi ta
phải xác định giá trị chân lý về thông tin được phát biểu. Thông tin với độ chắc
chắn nhất định không phải là thông tin sai lệch và khơng làm ảnh hưởng tới tính
nhất qn của CSDL.
Trong phát biểu “tuổi của Nam hoặc là 35 hoặc là 36 ” thể hiện tính khơng
chính xác, phát biểu “tuổi của Nam có khả năng là 35 ” lại thể hiện tính khơng
chắc chắn.

1.3.

Tập mờ

Mỗi lĩnh vực khoa học kỹ thuật đều có một miền ứng dụng của nó. Khoa
học kỹ thuật lấy tính “chính xác” làm cơ sở để xây dựng, phát triển và cũng có
những giới hạn xác định khơng thể vượt qua, chúng chỉ có khả năng mô phỏng
được một phần thế giới thực. Câu hỏi đặt ra ở đây là liệu có một lý thuyết tốn
học nào cho phép mơ hình hóa phần thế giới thực mà con người vẫn chỉ có thể
nhận thức, mơ tả bằng ngôn ngữ tự nhiên vốn hàm chứa những thông tin khơng
chính xác (inexact), khơng chắc chắn (uncertain).
Lý thuyết tập mờ được Zadeh đề xuất năm 1965 bằng cách mở rộng khái
niệm tập cổ điển, với ý tưởng đầu tiên là giúp biểu diễn và đo ngữ nghĩa các
khái niệm khơng chính xác, mơ hồ trong thực tế. Ngày nay, sau hơn 40 năm,
một thời gian rất ngắn so với lịch sử tốn học, lý thuyết tập mờ khơng chỉ đã
phát triển bùng nổ vượt bậc mà còn đặt nền móng cho việc xây dựng một loạt
các lý thuyết quan trọng như logic mờ, lý thuyết khả năng, lý thuyết xác suất
mờ v.v. . . Nhu cầu phát triển của lý thuyết tập mờ là tìm kiếm các cơng cụ để

12

mơ hình hóa tính khơng chắc chắn, khơng rõ ràng, rất phổ biến trong thực tế
mà nếu chỉ dùng lý thuyết xác suất khơng đủ. Tốn học dựa trên lý thuyết tập
mờ phát triển chủ yếu bằng cách mở rộng hầu hết các khái niệm và lý thuyết
của toán học cổ điển như logic, số học, quan hệ, độ đo v.v. . . thành logic, số
học, hay độ đo mờ v.v. . . Lý thuyết tập mờ, với những khả năng như đã nói, là
cơ sở tốn học được ứng dụng rộng rãi trong thực tế nói chung và khoa học kỹ
thuật nói riêng, đặc biệt là khoa học máy tính, khi xây dựng các hệ thống tính
tốn biết phân tích, xử lý và ra quyết định thơng minh.

1.3.1.

Tập mờ

Trước hết chúng ta xuất phát từ tập hợp kinh điển. Cho U là một tập hợp
và F là một tập con của U. Nếu một phần tử x thuộc F, ký hiệu x ∈ F , ngược
lại x ∈
/ F . Như vậy, để mô tả khái niệm “thuộc” ta sử dụng hàm thuộc µF :

 1 nếu x ∈ F
µF (x) =
 0 nếu x ∈
/ F
Rõ ràng, trong tập hợp kinh điển, hàm thuộc của một phần tử nào đó của F
chỉ nhận giá trị trong {0,1}.
Trong tập mờ, hàm thuộc của một phần tử nào đó của F khơng chỉ nhận giá
trị trong {0,1} mà có thể nhận giá trị trong [0,1]
Định nghĩa 1.1. [50] Cho U là vũ trụ các đối tượng. Tập mờ F trên U là một
tập các cặp có thứ tự (x, µF (x)), với µF là hàm từ U → [0, 1] gán cho mỗi phần
tử x thuộc U giá trị µF (x) để chỉ mức độ của x thuộc hàm tập mờ F .
Có nghĩa là: F = {(x, µF (x))|x ∈ U, µF : U → [0, 1]}
Tập mờ được biểu diễn dưới dạng:
F = µF (x1 )/x1 + µF (x2 )/x2 + ... + µF (xn )/xn =

n
∑
i=1

hữu hạn.
∫
F =
E

µF (x)
x ,

µF (xi )
xi ,

với x1 , . . . , xn ∈ U

nếu U khơng hữu hạn.

Ví dụ 1.1. Xét tập U gồm 5 người là x1 , x2 , . . . , x5 tương ứng có tuổi là 10,
15, 50, 55, 70 và F là tập hợp các người “trẻ”. Khi đó ta có thể xây dựng hàm

13

thuộc như sau: µtrẻ (10) = 0.95, µtrẻ (15) = 0.75, µtrẻ (50) = 0.35, µtrẻ (55) = 0.30,
µtrẻ (70) = 0.05 và tập mờ F =

0.95
x1

+

0.75
x2

+

0.35
x3

+

0.30
x4

+

0.05
x5 .

Tập U thường được gọi là vũ trụ hay không gian tham chiếu, hàm µF được
gọi là hàm thuộc của tập mờ F , là ánh xạ của U vào [0,1]. Do luận án làm việc
chủ yếu trên tập mờ, nên từ đây ta ký hiệu F cho tập mờ thay vì F .
Như vậy, tập mờ được hiểu là tập mô tả thuộc tính nào đó của một đối tượng
được nhúng trong không gian tất cả các hàm F(U,[0,1]) với U là vũ trụ ứng với
thuộc tính đó.
Định nghĩa 1.2. [50] Tập mờ F được gọi là chuẩn nếu tồn tại ít nhất một phần
tử x ∈ U sao cho µF (x) = 1.
Định nghĩa 1.3. [50] Tập mờ F có dạng hình thang xác định bởi bộ 4 giá trị
(a, b, c, d), và được xác định:



0
nếu x ≤ a





x−a


nếu a < x < b

 b−a
µA (x) =
1 nếu b ≤ x ≤ c



d−x



d−c nếu c < x < d



 0
nếu d < x
Định nghĩa 1.4. [1] Cho F là tập mờ trên tập vũ trụ U
(1): Giá đỡ (Support) SF của tập mờ F là tập các phần tử có giá trị hàm
thuộc lớn hơn 0. Có nghĩa là SF = {x ∈ U |µF (x) > 0}.
(2): Lõi (Core) CF của tập mờ F là tập các phần tử có giá trị hàm thuộc
bằng 1. Có nghĩa là CF = {x ∈ U |µF (x) = 1}.
(3): Tập mức α của tập mờ F là tập các phần tử có giá trị hàm thuộc ≥ α.
F (α) = {x ∈ U |µF (x) ≥ α}.

(4): Tập mờ mức α của tập mờ F, ký hiệu Fα là một tập mờ trên tập F (α),
được xác định: Fα = {(x, µF (x))|x ∈ F (α)} ∪ {(x, 0.0)|x ∈
/ F (α)}.

14

1.3.2.

Các phép toán trên tập mờ

Tương tự như lý thuyết tập hợp, trên các tập mờ cũng định nghĩa một số
phép toán: bằng nhau, bao nhau, giao, hợp ...[1] là sự mở rộng các định nghĩa
trên lý thuyết tập hợp.
Định nghĩa 1.5. [1] Cho F và F1 là hai tập mờ trên U
(1): F bằng F1 , ký hiệu F = F1 , nếu µF (x) = µF1 (x), ∀x ∈ U .
(2): F chứa trong F1 , ký hiệu F ⊆ F1 , nếu µF (x) ≤ µF1 (x), ∀x ∈ U .
(3): Hợp của hai tập mờ F và F1 , ký hiệu F ∪ F1 , là một tập mờ trên U với
hàm thuộc xác định bởi: µF ∪F1 (x) = M ax{µF (x), µF1 (x)}, ∀x ∈ U .
(4): Giao của hai tập mờ F và F1 , ký hiệu F ∩ F1 , là một tập mờ trên U với
hàm thuộc xác định bởi: µF ∩F1 (x) = M in{µF (x), µF1 (x)}, ∀x ∈ U .
(5): Phần bù của tập mờ F, ký hiệu F là một tập mờ trên U với hàm thuộc
xác định bởi: µF (x) = 1 − µF (x), ∀x ∈ U .
Định nghĩa 1.6. [1] Cho F và F1 là hai tập mờ trên U
(1): Tổng đại số
F + F1 = {(x, µF +F1 (x))|x ∈ U, µF +F1 (x) = µF (x) + µF1 (x) − µF (x).µF1 (x)}
(2): Tích đại số
F.F1 = {(x, µF.F1 (x))|x ∈ U, µF.F1 (x) = µF (x).µF1 (x)}

1.3.3.

Tổng quát hoá ba phép tốn cơ bản trên tập mờ

Ngồi ba phép tốn cơ bản min, max và phần bù được dùng thao tác trên
các tập mờ, để tổng quát hơn có thể định nghĩa họ các toán tử T là t-norm,
t-conorm và N-Negation cho các phép toán trên.
Định nghĩa 1.7. [1] Hàm T: [0,1] x [0,1] → [0,1] được gọi là t-norm khi và chỉ
khi thoả mãn ∀x, y, z ∈ [0, 1]:
(1) T(x,y) = T(y,x).
(2) T(x,y) ≤ T(x,z), ∀y ≤ z.
(3) T(x,T(y,z)) = T(T(x,y),z).

15

(4) T(x,1) = x.
Định nghĩa 1.8. [1] Hàm S : [0, 1]x[0, 1] → [0, 1] được gọi là t-conorm khi và
chỉ khi thoả mãn ∀x, y, z ∈ [0, l]:
(1) S(x,y) = S(y,x).
(2) S(x,y) ≤ S(x,z), ∀y ≤ z.
(3) S(x,S(y,z)) = S(S(x,y),z).
(4) S(x,0) = 0.
Định nghĩa 1.9. [1] Hàm N : [0, 1] → [0, 1] được gọi là hàm phủ định khi và
chỉ khi N thoả mãn ∀x, y ∈ [0, l]:
(1) N(0) = 1, N(1) = 0.
(2) N(x) ≤ N(y), ∀y ≤ x.
Theo định nghĩa, tập các tập mờ là không gian F(U, [0,1]) các hàm từ U vào
đoạn [0,1], một không gian tương đối giàu về cấu trúc tính tốn.
Việc xây dựng hàm thuộc của các tập mờ dựa trên ngữ nghĩa của các khái
niệm mờ. Ngược lại, một lớp các khái niệm mờ có thể được mơ hình hố ngữ

nghĩa qua các tập mờ. Trên cơ sở mối quan hệ này, L.A.Zadeh đã đưa ra khái
niệm mới đó là biến ngơn ngữ.

1.3.4.

Biến ngơn ngữ

Trong [51] L.A.Zadeh đã viết "thiếu hụt tính chính xác bề ngồi của những
vấn đề phức tạp một cách tự nhiên là tìm cách sử dụng các biến ngơn ngữ, đó là
các biến mà giá trị của chúng không phải là số mà là các từ hoặc các câu trong
ngôn ngữ tự nhiên hoặc nhân tạo. Động lực cho việc sử dụng các từ, các câu hơn
các số là đặc trưng ngôn ngữ của các từ, các câu thường là ít xác định hơn của
số".
Nói tóm lại, ý trên đây đã khái qt cho khái niệm biến ngơn ngữ. Một cách
hình thức biến ngôn ngữ được định nghĩa như sau.
Định nghĩa 1.10. [51] Biến ngôn ngữ là một bộ năm (X, T (X), U, R, M ), trong
đó X là tên biến, T (X) là tập các giá trị ngôn ngữ của biến X, U là không gian

Cơ sở dữ liệu hướng đối tượng với thông tin ngôn ngữ mờ

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về