cơ sở dữ liệu hướng đối tượng với thông tin ngôn ngữ mờ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (534.33 KB, 115 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ
CÔNG NGHỆ VIỆT NAM

VIỆN CÔNG NGHỆ THÔNG TIN

ĐOÀN VĂN THẮNG

CƠ SỞ DỮ LIỆU HƯỚNG ĐỐI TƯỢNG VỚI
THÔNG TIN NGÔN NGỮ MỜ

LUẬN ÁN TIẾN SĨ TOÁN HỌC

HÀ NỘI – 2014

BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ
CÔNG NGHỆ VIỆT NAM

VIỆN CÔNG NGHỆ THÔNG TIN

ĐOÀN VĂN THẮNG

CƠ SỞ DỮ LIỆU HƯỚNG ĐỐI TƯỢNG VỚI
THÔNG TIN NGÔN NGỮ MỜ

Chuyên ngành: Bảo đảm toán học cho máy tính và hệ thống tính toán
Mã số: 62. 46. 35. 01

LUẬN ÁN TIẾN SĨ TOÁN HỌC

NGƯỜI HƯỚNG DẪN KHOA HỌC:
1. PGS.TS ĐOÀN VĂN BAN
2. PGS.TS TRƯƠNG CÔNG TUẤN

HÀ NỘI – 2014

LỜI CẢM ƠN
Luận án được hoàn thành tại Viện Công nghệ Thông tin. Để hoàn thành luận
án này, tác giả đã nhận được sự chỉ bảo tận tình, cùng những đòi hỏi nghiêm
khắc của PGS.TS Đoàn Văn Ban, người đã truyền đạt rất nhiều kiến thức quí
báu cũng như những kinh nghiệm nghiên cứu khoa học trong suốt thời gian tác
giả theo học nghiên cứu sinh. Tác giả cũng đã nhận được sự hướng dẫn và quan
tâm giúp đỡ của PGS.TS Trương Công Tuấn. Nhân dịp này, tác giả xin được
bày tỏ lòng biết ơn chân thành và sự kính trọng sâu sắc đối với các Thầy.
Trong thời gian làm nghiên cứu sinh ở Viện Công nghệ Thông tin, tác giả
được tiếp nhận những kiến thức quý giá và sự quan tâm chân tình từ các thầy,
cô giáo ở Viện. Tác giả xin gửi tới các thầy, cô lòng biết ơn, và lời cảm ơn chân
thành nhất.
Tác giả xin chân thành cảm ơn Ban lãnh đạo, Bộ phận quản lý Nghiên cứu
sinh và các Phòng chức năng của Viện Công nghệ Thông tin đã tạo mọi điều
kiện thuận lợi trong quá trình học tập, nghiên cứu của tác giả tại Viện.
Tác giả xin cảm ơn Ban Giám hiệu trường Cao đẳng Công nghệ Thông tin
hữu nghị Việt Hàn, Ban Giám hiệu trường Cao đẳng Công Thương Hồ Chí Minh,
Ban Chủ nhiệm khoa Công nghệ Thông tin và các Phòng chức năng của trường
Cao đẳng Công Thương đã quan tâm giúp đỡ mọi mặt để tác giả hoàn thành
nhiệm vụ học tập.
Xin chân thành cảm ơn sự quan tâm, động viên và những đóng góp quý báu
của các đồng nghiệp.
Sự quan tâm, mong mỏi của mọi thành viên trong Gia đình là một trong
những động cơ để tác giả nỗ lực học tập, nghiên cứu. Luận án này, như một món
quà tinh thần, xin đáp lại những niềm quan tâm, mong mỏi đó.
Cuối cùng, tác giả xin biểu thị sự biết ơn tới những người thân và bạn bè đã
ưu ái, giúp đỡ, động viên, khích lệ để tác giả hoàn thành luận án này.
LỜI CAM ĐOAN
Tác giả xin khẳng định tất cả các kết quả được trình bày trong luận án là
của riêng tác giả, không sao chép từ bất kỳ một công trình nào khác. Nếu có

điều gì không trung thực, tác giả xin chịu hoàn toàn trách nhiệm.
Tác giả
Đoàn Văn Thắng
Mục lục
Danh mục các thuật ngữ và từ viết tắt i
Danh sách hình vẽ ii
Danh sách bảng iii
MỞ ĐẦU 1
Chương 1. TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU HƯỚNG ĐỐI
TƯỢNG MỜ 6
1.1. Giới thiệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2. Thông tin không đầy đủ trong mô hình CSDL . . . . . . . . . . . 9
1.2.1. Thông tin sai lệch . . . . . . . . . . . . . . . . . . . . . . . 10
1.2.2. Thông tin thiếu chính xác . . . . . . . . . . . . . . . . . . 10
1.2.3. Thông tin không chắc chắn . . . . . . . . . . . . . . . . . 11
1.3. Tập mờ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3.1. Tập mờ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3.2. Các phép toán trên tập mờ . . . . . . . . . . . . . . . . . 14
1.3.3. Tổng quát hoá ba phép toán cơ bản trên tập mờ . . . . . . 14
1.3.4. Biến ngôn ngữ . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.4. Mô hình biểu diễn dữ liệu mờ với ngữ nghĩa của đại số gia tử . . . 17
1.4.1. Đại số gia tử . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.4.2. Đại số gia tử tuyến tính đầy đủ . . . . . . . . . . . . . . . 20
1.5. Mô hình CSDL hướng đối tượng mờ . . . . . . . . . . . . . . . . . 26
1.5.1. Đối tượng mờ . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.5.2. Lớp mờ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.5.3. Giá trị thuộc tính . . . . . . . . . . . . . . . . . . . . . . . 29
1.5.4. Phương thức . . . . . . . . . . . . . . . . . . . . . . . . . 30
1.5.5. Quan hệ lớp đối tượng mờ . . . . . . . . . . . . . . . . . . 30
1.5.6. Quan hệ kế thừa mờ . . . . . . . . . . . . . . . . . . . . . 32

1.5.7. Mô hình lớp đối tượng mờ . . . . . . . . . . . . . . . . . . 33
1.6. Ngôn ngữ truy vấn dữ liệu . . . . . . . . . . . . . . . . . . . . . . 37
1.7. Kết luận . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
Chương 2. PHỤ THUỘC DỮ LIỆU TRONG MÔ HÌNH CƠ SỞ
DỮ LIỆU HƯỚNG ĐỐI TƯỢNG MỜ 39
2.1. Quan hệ ngữ nghĩa của dữ liệu mờ . . . . . . . . . . . . . . . . . 39
2.1.1. Đối sánh giá trị khoảng . . . . . . . . . . . . . . . . . . . 39
2.1.2. Sự tương đương hai giá trị thuộc tính . . . . . . . . . . . . 41
2.1.3. Xấp xỉ ngữ nghĩa . . . . . . . . . . . . . . . . . . . . . . . 43
2.2. Phụ thuộc thuộc tính mờ và tập luật suy dẫn . . . . . . . . . . . 45
2.2.1. Phụ thuộc thuộ c tính mờ trong lớp đối tượng . . . . . . . 46
2.2.2. Các luật suy dẫn trên phụ thuộc thuộc tính mờ . . . . . . 50
2.3. Phụ thuộc phương thức mờ trong lớp đối tượng . . . . . . . . . . 51
2.4. Truy vấn Null và lập luận tương tự . . . . . . . . . . . . . . . . . 52
2.4.1. Các giá trị Null . . . . . . . . . . . . . . . . . . . . . . . . 52
2.4.2. Truy vấn Null . . . . . . . . . . . . . . . . . . . . . . . . . 52
2.4.3. Lập luận tương tự . . . . . . . . . . . . . . . . . . . . . . 53
2.4.4. Thuật toán tìm câu trả lời gần đúng cho truy vấn Null . . 54
2.5. Một số ví dụ minh họa . . . . . . . . . . . . . . . . . . . . . . . . 63
2.6. Kết luận . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
Chương 3. TRUY VẤN DỮ LIỆU TRONG HỆ THỐNG HƯỚNG
ĐỐI TƯỢNG VỚI THÔNG TIN KHÔNG CHẮC CHẮN 70
3.1. Đối tượng mờ dư thừa . . . . . . . . . . . . . . . . . . . . . . . . 71
3.2. Các phép toán đại số mờ . . . . . . . . . . . . . . . . . . . . . . . 73
3.2.1. Phép chọn mờ . . . . . . . . . . . . . . . . . . . . . . . . . 73
3.2.2. Phép chiếu mờ . . . . . . . . . . . . . . . . . . . . . . . . 75
3.2.3. Phép tích mờ . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.2.4. Phép kết nối mờ . . . . . . . . . . . . . . . . . . . . . . . 75
3.2.5. Phép hợp mờ . . . . . . . . . . . . . . . . . . . . . . . . . 77
3.2.6. Phép giao mờ . . . . . . . . . . . . . . . . . . . . . . . . . 78

3.2.7. Phép trừ mờ . . . . . . . . . . . . . . . . . . . . . . . . . . 79
3.3. Phương pháp truy vấn dữ liệu mờ . . . . . . . . . . . . . . . . . . 80
3.3.1. Tìm kiếm dữ liệu theo lân cận ngữ nghĩa . . . . . . . . . . 81
3.3.2. Truy vấn mờ với lượng từ ngôn ngữ . . . . . . . . . . . . . 85
3.4. Một số ví dụ minh họa . . . . . . . . . . . . . . . . . . . . . . . . 90
3.5. Kết luận . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
KẾT LUẬN 97
DANH MỤC CÔNG TRÌNH CỦA TÁC GIẢ 98
TÀI LIỆU THAM KHẢO 100
i
Danh mục thuật ngữ, từ viết tắt
Tiếng Việt Tiếng Anh Ký hiệu
Biến ngôn ngữ Linguistic variable
Cơ sở dữ liệu hướng đối tượng Object-Oriented DataBase OODB
Cơ sở dữ liệu hướng đối tượng mờ Fuzzy Object-Oriented DataBase FOODB
Dữ liệu ngôn ngữ Linguistic data
Đại số gia tử tuyến tính Linear Hedge algebra
Đại số gia tử Hedge algebra HA
Đại số đối tượng mờ Fuzzy Object Algebra
Đối tượng phức hợp Composite object
Định danh đối tượng Object Identity OID
Giá trị chân lý Truth value
Lập luận xấp xỉ Approximate reasoning
Lược đồ đối tượng Object Schemas
Nhóm quản trị cơ sở đối tượng Object DataBase ODMG
Management Group
Ngôn ngữ truy vấn đối tượng Object Query Language OQL
Ngôn ngữ truy vấn đối tượng mờ Fuzzy Object Query Language FOQL
Quan hệ kế thừa Inheritance relationship
Quan hệ kết nhập Aggregation relationship

Phân cấp thừa kế mờ Fuzzy inheritance hierarchy
Phụ thuộc hàm mờ Fuzzy Fuctional Dependency FFD
Phụ thuộc phương thức mờ Fuzzy Method Dependency FMD
Lân cận mờ Fuzzy Neighborhood FN
ii
Danh sách hình vẽ
2.1 [f
a
, f
b
] ∈ ℑ(x) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.2 [f
a
, f
b
] ̸⊂ ℑ(x) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.3 khi [f
a
, f
b
] ∩ ℑ(x) = ∅ . . . . . . . . . . . . . . . . . . . . . . . . 41
2.4 Tính mờ của trẻ và già . . . . . . . . . . . . . . . . . . . . . . . . 41
2.5 Lớp đối tượng Sinh Viên . . . . . . . . . . . . . . . . . . . . . . . 46
2.6 Lược đồ lớp NhanVien . . . . . . . . . . . . . . . . . . . . . . . . 66
3.1 Mối quan hệ giữa lớp SinhVien và PhongHoc . . . . . . . . . . . . 90
iii
Danh sách bảng
2.1 Thể hiện của lớp SinhVien . . . . . . . . . . . . . . . . . . . . . . 47
2.2 Thể hiện của lớp SinhVien khi chuyển về giá trị khoảng và đối
sánh với các khoảng mờ của thuộc tính. . . . . . . . . . . . . . . . 49

2.3 Kết quả thực hiện truy vấn 2.1 . . . . . . . . . . . . . . . . . . . 64
2.4 Kết quả thực hiện truy vấn 2.2 . . . . . . . . . . . . . . . . . . . 65
2.5 Thể hiện của lớp BoPhan và QuanLy . . . . . . . . . . . . . . . . 66
2.6 Ma trận độ tương tự giữa các thuộc tính . . . . . . . . . . . . . . 66
2.7 Kết quả thực hiện trong truy vấn 2.4 . . . . . . . . . . . . . . . . 68
3.1 Các thể hiện của lớp PhongHoc và SinhVien . . . . . . . . . . . . 91
3.2 Kết quả truy vấn 3.2 . . . . . . . . . . . . . . . . . . . . . . . . . 93
3.3 Kết quả truy vấn 3.2 . . . . . . . . . . . . . . . . . . . . . . . . . 95
MỞ ĐẦU
Như chúng ta đã biết, mô hình hướng đối tượng (HĐT) truyền thống đã
chứng tỏ nhiều ưu điểm trong các vấn đề mô hình hóa, thiết kế và hiện thực các
hệ thống lớn, từ phần mềm cho đến cơ sở dữ liệu (CSDL). Đó là nhờ mô hình
này có khả năng biểu diễn trạng thái và hành vi của các đối tượng cũng như
sự phân cấp, phân loại và quan hệ giữa chúng trong các ứng dụng thực tế. Hơn
nữa, mô hình hướng đối tượng còn giúp tối ưu dữ liệu và tái sử dụng mã khi
xây dựng hệ thống thông qua cơ chế thừa kế thông tin giữa các lớp đối tượng.
Tuy nhiên, trong mô hình HĐT truyền thống, các mối quan hệ cũng như trạng
thái và hành vi của các đối tượng luôn luôn được thể hiện một cách chắc chắn
và chính xác. Điều này không hoàn toàn phù hợp với thực tế, bởi thông tin về
các đối tượng trong thế giới thực có thể mơ hồ, không chắc chắn, không đầy đủ.
Hệ quả là các ứng dụng dựa trên mô hình CSDL HĐT truyền thống không
biểu diễn được các đối tượng mà thông tin về chúng không được xác định một
cách chắc chắn và chính xác. Chẳng hạn, các ứng dụng mô hình CSDL truyền
thống không thể trả lời các truy vấn như “tìm tất cả những bệnh nhân trẻ có
tiền sử bệnh viêm thanh quản”; hoặc “tìm tất cả các gói bưu kiện có thể tích
khoảng 25000 cm
3
”,. . . trong đó trẻ và khoảng 25000 là những khái niệm và giá
trị không chính xác. Để khắc phục được các hạn chế như vậy, các nghiên cứu gần
đây đã tập trung nghiên cứu mô hình CSDL HĐT có khả năng biểu diễn và xử

lý được các đối tượng mà thông tin về chúng có thể không chắc chắn và không
chính xác.
Trên tinh thần đó, trong những năm qua đã có nhiều cách tiếp cận khác
nhau để giải quyết các vấn đề này. Một số nghiên cứu của George, Buckles và
Petry, 1993 [25]; Yazici và George, 1999 [47]; Yazici, George và Aksoy 1999 [48]
cho phép giá trị thuộc tính đối tượng là một tập các giá trị mờ kết hợp với một
quan hệ tương tự trên miền giá trị thuộc tính. Tùy theo ngữ cảnh, tập các giá trị
2
thuộc tính được định nghĩa là tuyển hoặc hội logic của các giá trị này. Ngữ nghĩa
của các giá trị tập mờ được xác định thông qua các quan hệ tương tự trên các
miền giá trị thuộc tính tương ứng. Vì các giá trị thuộc tính đối tượng là những
tập mờ, nên các lớp đối tượng cũng trở nên mờ. Ngoài ra, sự phân loại và phân
cấp lớp là mờ nên mức độ thành viên lớp của các đối tượng cũng được mờ hóa
theo.
Như trong mô hình CSDL quan hệ mờ, trong các các mô hình CSDL HĐT
mờ, phương pháp biểu diễn giá trị thuộc tính đối tượng bởi các phân bố khả
năng. Các nghiên cứu theo tiếp cận này rất đa dạng và khả năng mô hình hóa các
đối tượng mờ cũng rất khác nhau. Nhóm tác giả Van Gyseghem và De Caluwe
[44] kết hợp với lý thuyết tập mờ đã định nghĩa lớp như một tập các tính chất
gồm các thuộc tính và phương thức lớp xác định các đối tượng mờ của lớp. Mỗi
phương thức được biểu diễn như một hàm thao tác trên các giá trị tập mờ của
thuộc tính đối tượng. Bao hàm và phân cấp lớp mờ được xác định thông qua
bao hàm các miền giá trị thuộc tính tương ứng của các lớp. Thừa kế không chắc
chắn thuộc tính lớp được tính toán thông qua mức độ bao hàm lớp con trong
lớp cha.
Mô hình dựa trên lý thuyết xác suất đầu tiên được nhóm tác giả Kornatzky
và Shimony đề xuất năm 1994 [27]. Trong mô hình này, lớp được định nghĩa như
một tập các thuộc tính mà giá trị của chúng có thể kết hợp với một phân bố xác
suất. Lược đồ được định nghĩa như một tập các lớp có phân cấp kết hợp với xác
suất có điều kiện để một đối tượng của một lớp thuộc về lớp con của nó. Các tác

giả cũng đã phát triển một ngôn ngữ truy vấn để thao tác chọn các đối tượng
thỏa một xác suất được kết hợp với các truy vấn.
Rõ ràng, trở ngại lớn nhất trong việc phát triển các hệ thống CSDL HĐT
mờ đó là chưa có một mô hình dữ liệu chuẩn hay cơ sở toán học thống nhất cho
việc biểu diễn và xử lý dữ liệu đối tượng mờ. Cho đến nay, các nghiên cứu về mô
hình CSDL HĐT mờ chủ yếu tập trung vào việc mở rộng mô hình dữ liệu rõ đã
có theo nhiều cách tiếp cận khác nhau và cho phép biểu diễn, thao tác trên dữ
liệu mờ. Do đó, các mô hình CSDL HĐT mờ này chỉ thống nhất trên một tập
3
các khái niệm chung nhất trong mô hình của ODMG [22]. Có thể thấy rằng, các
kết quả nghiên cứu trên CSDL HĐT mờ luôn được xem xét với một mô hình cụ
thể, các kết quả này sẽ giải quyết cho một lớp các bài toán với một tập con các
khái niệm, tính chất đặc trưng hướng đối tượng. Như vậy, việc chọn lựa một mô
hình dữ liệu để nghiên cứu các vấn đề trong CSDL HĐT mờ là rất quan trọng.
Trong cơ sở dữ liệu quan hệ mờ, ở trong nước, từ năm 1985 Lê Tiến Vương
đã nghiên cứu áp dụng lý thuyết tập mờ trong mô hình quan hệ. Một số các kết
quả về mô hình cơ sở dữ liệu mở rộng sử dụng lý thuyết tập mờ và biến ngôn
ngữ của Lê Tiến Vương và Hồ Thuần đã được công bố vào năm 1989. Vẫn tiếp
tục đi sâu vào hướng đó, có các công trình nghiên cứu của Đinh Thị Ngọc Thanh
(1991) và Trương Đức Hùng (1996). Năm 2002, Hồ Cẩm Hà đã mở rộng mô hình
cơ sở dữ liệu mờ dựa trên quan hệ tương tự và phát triển một số các kết quả
dựa trên mô hình [25]. Năm 2004, Trần Thiên Thanh đã đề xuất một số kết quả
về phụ thuộc dữ liệu và tổng kết dữ liệu trên mô hình lý thuyết khả năng.
Trên cơ sở những mô hình mở rộng, những kết quả đã đạt được trên mô hình
quan hệ như phụ thuộc hàm, phụ thuộc đa trị, các dạng chuẩn, phân tách lược
đồ quan hệ, ngôn ngữ hỏi đáp, được mở rộng theo nhiều cách khác nhau để
phù hợp với từng mô hình. Ngoài ra, để khai thác dữ liệu trên mô hình cơ sở dữ
liệu mờ nhiều tác giả nghiên cứu đã mở rộng những ngôn ngữ hỏi đáp trên mô
hình quan hệ như đại số quan hệ, phép tính quan hệ trên bộ, phép tính quan hệ
trên miền, ngôn ngữ SQL,. . . cho phù hợp với mô hình mới và đáp ứng yêu cầu

khai thác dữ liệu đa dạng của người dùng.
Tuy đã có nhiều cách tiếp cận để xử lý thông tin mờ nhưng hầu hết việc biểu
diễn và đối sánh dữ liệu vẫn phức tạp và mang tính chủ quan, phụ thuộc vào
nhiều yếu tố làm ảnh hưởng đến hiệu quả của việc thao tác dữ liệu. Chẳng hạn
như theo cách tiếp cận quan hệ mờ, yếu tố ảnh hưởng vào việc biểu diễn ngữ
nghĩa là việc xây dựng hàm thuộc và chọn ngưỡng lát cắt α của tập mờ, theo
cách tiếp cận quan hệ tương tự là việc chọn ngưỡng tương tự hai giá trị, ngưỡng
của mỗi thuộc tính và ngưỡng của bộ dữ liệu, Vì vậy, cần có một cách tiếp
cận để xử lý thông tin mờ một cách hiệu quả, đơn giản và trực quan hơn.
4
Nếu xem thuộc tính mờ A là một biến ngôn ngữ và F D
A
là miền các giá
trị ngôn ngữ của A được sắp theo một thứ tự tuyến tính, thì F D
A
được xét
như là một đại số gia tử (ĐSGT) tuyến tính. Cách tiếp cận từ đại số đến ngữ
nghĩa ngôn ngữ được nghiên cứu đầu tiên bởi tác giả Nguyễn Cát Hồ và Wechler
[30][31], trong mô hình này giá trị tập mờ của mỗi thuộc tính được biểu diễn bởi
một nhãn ngôn ngữ. Tuy nhiên, các giá trị thuộc tính như vậy không được diễn
dịch bởi hàm thành viên mà ngữ nghĩa của nó được xác định bởi đại số gia tử
trên miền trị của thuộc tính tương ứng. Nhờ những ưu điểm của cấu trúc ĐSGT
[5][6][20][35], chúng tôi tập trung nghiên cứu CSDL HĐT với thông tin ngôn ngữ
mờ dựa trên cách tiếp cận ngữ nghĩa định lượng của ĐSGT, trong đó ngữ nghĩa
ngôn ngữ được lượng hóa bằng các ánh xạ định lượng của ĐSGT. Theo cách tiếp
cận này, giá trị ngôn ngữ là dữ liệu, không phải là nhãn của các tập mờ biểu
diễn ngữ nghĩa của giá trị ngôn ngữ và ưu điểm cơ bản của nó là việc cho phép
tìm kiếm, xác định ngữ nghĩa của thông tin không chắc chắn chỉ bằng các thao
tác dữ liệu kinh điển thường dùng và do đó đảm bảo tính thuần nhất của kiểu
dữ liệu trong xử lý ngữ nghĩa của chúng. Điều này khác với CSDL HĐT mờ theo

các cách tiếp cận trước đây là vừa phải xử lý ngữ nghĩa kinh điển, vừa phải xử
lý ngữ nghĩa được biểu diễn dưới dạng tập mờ hay hàm thuộc của chúng. Ngoài
ra, theo cách tiếp cận ngữ nghĩa định lượng của ĐSGT, ngữ nghĩa ngôn ngữ có
thể biểu thị bằng một lân cận các khoảng được xác định bởi độ đo tính mờ của
các giá trị ngôn ngữ của một thuộc tính với vai trò là biến ngôn ngữ. Ví dụ, ngữ
nghĩa của giá trị ngôn ngữ "rất cao" của thuộc tính lương nhân viên sẽ được
biểu thị bằng những khoảng lân cận của giá trị đại diện của giá trị ngôn ngữ "rất
cao" thông qua ánh xạ định lượng của ĐSGT của thuộc tính lương nhân viên.
Với ý nghĩa như vậy, luận án đặt ra mục tiêu nghiên cứu cụ thể như sau:
1. Nghiên cứu mô hình CSDL HĐT với thông tin ngôn ngữ mờ dựa trên định
lượng của ĐSGT và lân cận ngữ nghĩa của ĐSGT.
2. Xây dựng một số dạng phụ thuộc dữ liệu và các vấn đề liên quan.
3. Tiến hành nghiên cứu một số thao tác dữ liệu trong mô hình CSDL HĐT
mờ.
5
Để thực hiện được các mục tiêu nêu trên, luận án được tổ chức như sau: Phần
mở đầu, ba chương và phần kết luận.
Chương 1 trình bày khái quát về cơ sở dữ liệu hướng đối tượng mờ. Nội
dung cụ thể của chương: tóm tắt các hướng tiếp cận khác nhau cho việc nghiên
cứu mô hình CSDL HĐT mờ. Tiếp đến, trình bày tóm tắt một số khái niệm và
tính chất cơ bản của ĐSGT như độ đo tính mờ, hàm dấu, hàm định lượng ngữ
nghĩa, Phần cuối, trình bày một số khái niệm cơ bản trong mô hình CSDL
HĐT như đối tượng, lớp, quan hệ lớp đối tượng, v.v. . . được mở rộng sang mô
hình CSDL HĐT với thông tin ngôn ngữ mờ theo tiếp cận ĐSGT.
Chương 2 giới thiệu các phụ thuộc và ràng buộc dữ liệu trong một lớp đối
tượng mờ. Dựa trên hàm đo xấp xỉ ngữ nghĩa của hai giá trị mờ, chúng tôi đưa
ra khái niệm phụ thuộc hàm mờ cho các thuộc tính của lớp, phụ thuộc hàm mờ
giữa thuộc tính và phương thức lớp, và các vấn đề liên quan. Trong chương này,
lý thuyết suy diễn tương tự được trình bày và áp dụng quá trình suy diễn tương
tự để tìm ra câu trả lời gần đúng cho truy vấn Null.

Chương 3 trình bày ngôn ngữ truy vấn hướng đối tượng mờ và các phép
toán đại số mờ. Đưa lượng từ ngôn ngữ vào trong câu truy vấn được đề xuất phù
hợp với mô hình CSDL hướng đối tượng mờ theo cách tiếp cận đại số gia tử.
Các kết quả chính của luận án được báo cáo và thảo luận tại các hội nghị,
hội thảo khoa học:
- Hội thảo quốc gia “Một số vấn đề chọn lọc về công nghệ thông tin và truyền
thông”, tại Cần Thơ ngày 7-8/10/2011, và Hà Nội ngày 3-4/12/2012.
- Hội nghị khoa học kỷ niệm 35 năm thành lập Viện công nghệ thông tin, Hà
Nội 26/12/2011.
- The Fourth International Conference on Knowledge and Systems Engineer-
ing, KSE12, Da Nang - Viet Nam, 08/2012.
- Hội nghị khoa học FAIR “Nghiên cứu cơ bản và ứng dụng công nghệ thông
tin”, tại Huế ngày 20-21/06/2013, và Thái Nguyên ngày 19-20/06/2014.
Các kết quả của luận án được công bố trong 8 công trình ở trang 98.
Chương 1
TỔNG QUAN VỀ CƠ SỞ DỮ
LIỆU HƯỚNG ĐỐI TƯỢNG MỜ
1.1. Giới thiệu
Trong những năm gần đây, mô hình CSDL HĐT với thông tin mờ và không
chắc chắn được nhiều tác giả trong và ngoài nước quan tâm nghiên cứu. Tất cả
các cách tiếp cận nhằm mục đích nắm bắt và xử lý một cách thỏa đáng trên một
luận điểm nào đó các thông tin không chính xác, không chắc chắn hay không
đầy đủ. Dưới đây, chúng tôi tóm tắt lại một số mô hình CSDL HĐT mờ theo
các cách tiếp cận và các kết quả đạt được trên các mô hình đã được đề xuất.
Trước hết, một số nghiên cứu cho phép giá trị thuộc tính đối tượng là một
tập các giá trị mờ kết hợp với một quan hệ tương tự trên miền giá trị thuộc tính
này (George, Buckles và Petry, 1993 [25]; Yazici và George, 1999 [47]). Tùy theo
ngữ cảnh, tập giá trị thuộc tính được định nghĩa như là tuyển hoặc hội logic của
các giá trị này. Ngữ nghĩa của các giá trị tập mờ được xác định thông qua các
quan hệ tương tự trên các miền giá trị thuộc tính tương ứng. Các phép toán đại

số trên các lớp đối tượng như chọn, chiếu, kết nối, .v.v , dựa trên độ đo tương
tự đã được xây dựng làm ngôn ngữ thao tác truy vấn đối tượng.
Vì các giá trị thuộc tính đối tượng có thể là những tập mờ, nên các lớp đối
tượng cũng trở nên mờ. Trong các mô hình này, sự phân loại, phân cấp các lớp
là mờ nên mức độ thành viên lớp của các đối tượng cũng được mờ hóa theo.
Các độ đo tương ứng được sử dụng để tính toán mức độ bao hàm lớp và mức độ
thành viên lớp. Độ đo bao hàm lớp con trong lớp cha được xác định bởi mức độ
7
tương tự tương ứng của các miền giá trị các thuộc tính của lớp con đối với lớp
cha. Độ đo thành viên lớp của mỗi đối tượng được định nghĩa thông qua mức độ
tương tự giữa giá trị tương ứng của mỗi thuộc tính của đối tượng với tập giá trị
của miền giá trị thuộ c tính lớp.
Ngoài ra, mô hình này được Yazici và George (1999b) [47] mở rộng bằng một
tập luật cho phép suy diễn trên các thông tin mờ về các đối tượng trong CSDL.
Nhóm tác giả Yazici, George và Aksoy (1999) [48] đã đề xuất các vấn đề về thiết
kế và thực hiện các mô hình hướng đối tượng mờ dựa trên quan hệ tương tự.
Các tác giả này cũng đã xây dựng một hệ thống CSDL mờ dựa trên tính tương
tự cho phép thao tác và truy vấn thông tin mờ của các đối tượng thực tế.
Như các mô hình CSDL quan hệ mờ, trong các mô hình CSDL HĐT mờ,
phương pháp biểu diễn giá trị thuộc tính đối tượng bởi các phân bố khả năng
cũng được nghiên cứu rộng rãi. Các đề nghị theo tiếp cận này rất đa dạng và khả
năng mô hình hóa các đối tượng mờ cũng rất khác nhau. Bordogna, Lucarella và
Pasi (1994) [17] đã đề nghị một mô hình dữ liệu hướng đối tượng dựa trên đồ thị,
trong đó giá trị thuộc tính được biểu diễn bởi các phân bố khả năng, bao hàm
các lớp con trong lớp cha được biểu diễn bởi các tập mờ. Mức độ thành viên mờ
của các đối tượng được xác định thông qua mức độ bao hàm lớp và mức độ bao
hàm giá trị thuộc tính của đối tượng trong miền giá trị thuộc tính tương ứng của
lớp. Một ngôn ngữ truy vấn đối tượng dựa trên các độ đo khả năng đã được xây
dựng cho mô hình này và khả năng áp dụng của các tính chất lớp là chắc chắn.
Nhóm tác giả này [18] tiếp tục mở rộng bằng cách kết hợp giá trị thuộc tính đối

tượng với một giá trị trong khoảng [0, 1] để biểu diễn mức độ không chắc chắn
về giá trị mà thuộc tính có thể nhận.
Nhóm tác giả Rossazza, Duboi và Prade (1997) [23] định nghĩa lớp như một
tập thuộc tính mà giá trị cũng như miền giá trị của thuộc tính có thể là các tập
mờ. Bao hàm và phân cấp lớp mờ đã được định nghĩa trên cơ sở logic mờ và lý
thuyết khả năng, thừa kế được xem xét khi quan hệ lớp thực sự là quan hệ lớp
cha lớp con. Đa thừa kế của một thuộc tính là lấy giao của các miền giá trị thuộc
tính mờ tương ứng của các lớp cha.
8
Van Gyseghem và De Caluwe (1997) [44] định nghĩa lớp như một tập các
thuộc tính và phương thức xác định các đối tượng mờ của lớp. Mỗi phương thức
được biểu diễn như một hàm thao tác trên các giá trị tập mờ của thuộc tính đối
tượng. Trong mô hình này, khả năng không chắc chắn các tính chất lớp của các
đối tượng đã được đề cập, nhưng mức độ áp dụng của mỗi tính chất không được
định nghĩa hình thức trong biểu diễn lớp. Bao hàm và phân cấp lớp mờ được xác
định thông qua bao hàm các miền trị thuộc tính tương ứng của các lớp. Thừa
kế không chắc chắn thuộc tính lớp được tính toán thông qua mức độ bao hàm
lớp con trong lớp cha.
Marin, Pons và Vila (2001) [29], Berzal và cộng sự (2005a) [15] đã áp dụng
lý thuyết khả năng để xây dựng một tập các độ đo cho các quan hệ trên các tập
mờ làm cơ sở để các thao tác và truy vấn đối tượng. Các phương thức lớp cũng
đã được định nghĩa hình thức để biểu diễn thao tác của các đối tượng. De Tre và
De Caluwe (2005) [24] đã biểu diễn dữ liệu mờ của đối tượng như các ràng buộc
trên các tính chất của chúng. Một truy vấn được kết hợp với các ràng buộc, và
các đối tượng được chọn nếu thỏa mãn các ràng buộc này.
Eiter và cộng sự (2001) đã mở rộng mô hình CSDL HĐT xác suất của Kor-
matzky và Shimony (1994) và gọi là mô hình POB (Probabilistic Object Base).
Đây là một mô hình cơ sở đối tượng xác suất dựa trên thủ tục. Theo đó, giá trị
thuộc tính của đối tượng được biểu diễn như một tập, kết hợp với hai hàm phân
bố xác suất cận dưới và cận trên để đo độ không chắc chắn về giá trị trong tập

mà thuộc tính có thể nhận.
Kết hợp tập mờ và xác suất, Baldwin và cộng sự (2000) [16], Cao và Rossiter
(2003) [19] đã đề xuất một mô hình CSDL HĐT xác suất mờ dựa trên cơ sở
logic. Trong đó, lớp được định nghĩa bởi một tập tính chất được diễn dịch như
các vị từ mờ kết hợp với một khoảng xác suất biểu diễn khả năng áp dụng không
chắc chắn của chúng đối với lớp. Các vị từ không có tiền điều kiện biểu diễn
thuộc tính, ngược lại chúng biểu diễn phương thức của một lớp. Mỗi tính chất
đối tượng có thể nhận một giá trị tập mờ với một xác suất thuộc về khoảng xác
suất được suy dẫn từ mức độ áp dụng của nó đối với đối tượng.
9
Năm 2013, Vũ Đức Quảng [13] đã thực hiện các nghiên cứu về các phụ thuộc
dữ liệu của các đối tượng mờ trên mô hình CSDL hướng đối tượng mờ với dữ liệu
được biểu diễn bởi phân bố khả năng được đề xuất bởi ZongMin Ma [51]. Trên
mô hình mà Zong Min Ma đề xuất ngoài việc đảm bảo các khái niệm, tính chất
cốt lõi của mô hình CSDL hướng đối tượng rõ, nó còn giải quyết được tương đối
đầy đủ tính mờ của đối tượng, lớp, tính mờ trong mối quan hệ giữa đối tượng
và lớp, giữa lớp cha và lớp con.
Như đã trình bày ở trên, các hướng tiếp cận nghiên cứu mô hình CSDL HĐT
với thông tin mờ và không chắc chắn cũng đã chứng tỏ được khả năng mô hình
hóa thông tin mờ, không chính xác và không chắc chắn về các đối tượng. Tuy
nhiên, do sự đa dạng của những loại thông tin không đầy đủ, do những khó khăn
khi phải thao tác trên những thông tin như vậy nên còn rất nhiều vấn đề cần
được tiếp tục nghiên cứu. Trong những năm gần đây đại số gia tử được nhiều tác
giả nghiên cứu [5][6][10][20][34][35] và đã có được những kết quả đáng kể trong
các nghiên cứu về CSDL mờ. Vì vậy, mặc dù có nhiều kết quả nghiên cứu về
CSDL HĐT mờ, theo chiều hướng đó cách tiếp cận nghiên cứu CSDL HĐT mờ
với ngữ nghĩa dựa trên đại số gia tử vẫn có thể được xem là một vấn đề nghiên
cứu mới. Trong phần sau, một số khái niệm ĐSGT và ĐSGT tuyến tính đầy đủ,
các mệnh đề, định lý liên quan được trình bày làm cơ sở nghiên cứu trên mô
hình này.

1.2. Thông tin không đầy đủ trong mô hình CSDL
Một trong những lĩnh vực nghiên cứu chủ yếu trong CSDL là tiếp tục phát
triển các kết quả đã đạt được trong các mô hình CSDL truyền thống với một
tập các khái niệm có ngữ nghĩa mở rộng. Một trong các yêu cầu không được giải
quyết đầy đủ bởi các các mô hình truyền thống, đó là việc biểu diễn và xử lý
thông tin không chính xác và không chắc chắn. Các mô hình truyền thống giả
định rằng mô hình cơ sở dữ liệu phản ánh một cách chính xác thế giới thực, dữ
liệu được lưu trữ là được xác định, chính xác và đầy đủ. Tuy nhiên, trong thực
tế cuộc sống, nhiều khi các giả định này không được thỏa đáng. Vì vậy trong
10
những năm gần đây, các mô hình dữ liệu khác nhau được đề xuất để giải quyết
các loại đặc trưng của dữ liệu.
Trong các hệ thống CSDL, chúng ta thường quan tâm đến ba loại thông tin
không hoàn hảo (imperfect) sau: thông tin sai lệch, thông tin không chính xác,
thông tin không chắc chắn [1].
1.2.1. Thông tin sai lệch
Thông tin sai lệch là loại thông tin không hoàn hảo đơn giản nhất. Thông tin
của cơ sở dữ liệu là sai lệch khi nó khác với “thông tin thực” (true information).
Mọi sai số lớn hay nhỏ của thông tin đều làm ảnh hưởng đến tính toàn vẹn
của CSDL, đó là vấn đề không thể chấp nhận và cần được xem xét trong các
hệ CSDL. Một loại thông tin sai lệch quan trọng là sự không nhất quán. Đôi
khi cùng một khía cạnh của thế giới thực được biểu diễn nhiều lần trong cùng
một CSDL hay trong nhiều CSDL khác nhau. Khi các biểu diễn đó là đối lập
không thể kết hợp được, dẫn đến thông tin là không nhất quán. Trong việc tích
hợp thông tin từ nhiều CSDL khác nhau, các vấn đề về sự không nhất quán của
thông tin phải được quan tâm một cách đầy đủ.
1.2.2. Thông tin thiếu chính xác
Thông tin trong CSDL là thiếu chính xác khi nó biểu diễn một tập các giá
trị có thể, và giá trị thực là một phần tử của tập đó. Như vậy, thông tin thiếu
chính xác không phải là thông tin sai lệch và không làm ảnh hưởng tới tính toàn

vẹn của CSDL. Sau đây là một số thông tin thiếu chính xác đặc trưng:
- Thông tin tuyển, chẳng hạn tuổi của Nam hoặc là 35 hoặc là 36.
- Thông tin âm, chẳng hạn tuổi của Nam không phải là 30.
- Thông tin khoảng/miền, chẳng hạn tuổi của Nam nằm trong khoảng từ 35
đến 40 hoặc tuổi của Nam lớn hơn 35.
- Thông tin với các cận sai số, chẳng hạn tuổi của Nam là 30 ± 1.
11
Hai loại thông tin không chính xác cực biên là thông tin chính xác (ứng với
trường hợp tập các giá trị có thể là một phần tử) và các giá trị null (được hiểu
theo nghĩa là thông tin không chính xác, trong đó tập các giá trị có thể bao gồm
toàn bộ miền các giá trị hợp lệ).
1.2.3. Thông tin không chắc chắn
Tri thức của chúng ta về thế giới thực (chính xác hoặc không chính xác), đôi
khi không thể được phát biểu với một mức độ chân lý tuyệt đối, và đòi hỏi ta
phải xác định giá trị chân lý về thông tin được phát biểu. Thông tin với độ chắc
chắn nhất định không phải là thông tin sai lệch và không làm ảnh hưởng tới tính
nhất quán của CSDL.
Trong phát biểu “tuổi của Nam hoặc là 35 hoặc là 36” thể hiện tính không
chính xác, phát biểu “tuổi của Nam có khả năng là 35” lại thể hiện tính không
chắc chắn.
1.3. Tập mờ
Mỗi lĩnh vực khoa học kỹ thuật đều có một miền ứng dụng của nó. Khoa
học kỹ thuật lấy tính “chính xác” làm cơ sở để xây dựng, phát triển và cũng có
những giới hạn xác định không thể vượt qua, chúng chỉ có khả năng mô phỏng
được một phần thế giới thực. Câu hỏi đặt ra ở đây là liệu có một lý thuyết toán
học nào cho phép mô hình hóa phần thế giới thực mà con người vẫn chỉ có thể
nhận thức, mô tả bằng ngôn ngữ tự nhiên vốn hàm chứa những thông tin không
chính xác (inexact), không chắc chắn (uncertain).
Lý thuyết tập mờ được Zadeh đề xuất năm 1965 bằng cách mở rộng khái
niệm tập cổ điển, với ý tưởng đầu tiên là giúp biểu diễn và đo ngữ nghĩa các

khái niệm không chính xác, mơ hồ trong thực tế. Ngày nay, sau hơn 40 năm,
một thời gian rất ngắn so với lịch sử toán học, lý thuyết tập mờ không chỉ đã
phát triển bùng nổ vượt bậc mà còn đặt nền móng cho việc xây dựng một loạt
các lý thuyết quan trọng như logic mờ, lý thuyết khả năng, lý thuyết xác suất
mờ v.v. . . Nhu cầu phát triển của lý thuyết tập mờ là tìm kiếm các công cụ để
12
mô hình hóa tính không chắc chắn, không rõ ràng, rất phổ biến trong thực tế
mà nếu chỉ dùng lý thuyết xác suất không đủ. Toán học dựa trên lý thuyết tập
mờ phát triển chủ yếu bằng cách mở rộng hầu hết các khái niệm và lý thuyết
của toán học cổ điển như logic, số học, quan hệ, độ đo v.v. . . thành logic, số
học, hay độ đo mờ v.v. . . Lý thuyết tập mờ, với những khả năng như đã nói, là
cơ sở toán học được ứng dụng rộng rãi trong thực tế nói chung và khoa học kỹ
thuật nói riêng, đặc biệt là khoa học máy tính, khi xây dựng các hệ thống tính
toán biết phân tích, xử lý và ra quyết định thông minh.
1.3.1. Tập mờ
Trước hết chúng ta xuất phát từ tập hợp kinh điển. Cho U là một tập hợp
và F là một tập con của U. Nếu một phần tử x thuộc F, ký hiệu x ∈ F, ngược
lại x /∈ F . Như vậy, để mô tả khái niệm “thuộc” ta sử dụng hàm thuộc µ
F
:
µ
F
(x) =



1 nếux ∈ F
0 nếux /∈ F
Rõ ràng, trong tập hợp kinh điển, hàm thuộc của một phần tử nào đó của F
chỉ nhận giá trị trong {0,1}.

Trong tập mờ, hàm thuộc của một phần tử nào đó của F không chỉ nhận giá
trị trong {0,1} mà có thể nhận giá trị trong [0,1]
Định nghĩa 1.1. [50] Cho U là vũ trụ các đối tượng. Tập mờ F trên U là một
tập các cặp có thứ tự (x, µ
F
(x)), với µ
F
là hàm từ U → [0, 1] gán cho mỗi phần
tử x thuộc U giá trị µ
F
(x) để chỉ mức độ của x thuộc hàm tập mờ F .
Có nghĩa là: F = {(x, µ
F
(x))|x ∈ U, µ
F
: U → [0, 1]}
Tập mờ được biểu diễn dưới dạng:
F = µ
F
(x
1
)/x
1
+ µ
F
(x
2
)/x
2
+ + µ

F
(x
n
)/x
n
=
n
∑
i=1
µ
F
(x
i
)
x
i
, với x
1
, . . . , x
n
∈ U
hữu hạn.
F =
∫
E
µ
F
(x)
x
, nếu U không hữu hạn.

Ví dụ 1.1. Xét tập U gồm 5 người là x
1
, x
2
, . . . , x
5
tương ứng có tuổi là 10,
15, 50, 55, 70 và F là tập hợp các người “trẻ”. Khi đó ta có thể xây dựng hàm
13
thuộc như sau: µ
trẻ
(10) = 0.95, µ
trẻ
(15) = 0.75, µ
trẻ
(50) = 0.35, µ
trẻ
(55) = 0.30,
µ
trẻ
(70) = 0.05 và tập mờ F =
0.95
x
1
+
0.75
x
2
+
0.35

x
3
+
0.30
x
4
+
0.05
x
5
.
Tập U thường được gọi là vũ trụ hay không gian tham chiếu, hàm µ
F
được
gọi là hàm thuộc của tập mờ F, là ánh xạ của U vào [0,1]. Do luận án làm việc
chủ yếu trên tập mờ, nên từ đây ta ký hiệu F cho tập mờ thay vì F .
Như vậy, tập mờ được hiểu là tập mô tả thuộc tính nào đó của một đối tượng
được nhúng trong không gian tất cả các hàm F(U,[0,1]) với U là vũ trụ ứng với
thuộc tính đó.
Định nghĩa 1.2. [50] Tập mờ F được gọi là chuẩn nếu tồn tại ít nhất một phần
tử x ∈ U sao cho µ
F
(x) = 1.
Định nghĩa 1.3. [50] Tập mờ F có dạng hình thang xác định bởi bộ 4 giá trị
(a, b, c, d), và được xác định:
µ
A
(x) =






















0 nếu x ≤ a
x−a
b−a
nếu a < x < b
1 nếu b ≤ x ≤ c
d−x
d−c
nếu c < x < d
0 nếu d < x
Định nghĩa 1.4. [1] Cho F là tập mờ trên tập vũ trụ U
(1): Giá đỡ (Support) S

F
của tập mờ F là tập các phần tử có giá trị hàm
thuộc lớn hơn 0. Có nghĩa là S
F
= {x ∈ U|µ
F
(x) > 0}.
(2): Lõi (Core) C
F
của tập mờ F là tập các phần tử có giá trị hàm thuộc
bằng 1. Có nghĩa là C
F
= {x ∈ U|µ
F
(x) = 1}.
(3): Tập mức α của tập mờ F là tập các phần tử có giá trị hàm thuộc ≥ α.
F (α) = {x ∈ U|µ
F
(x) ≥ α}.
(4): Tập mờ mức α của tập mờ F, ký hiệu F
α
là một tập mờ trên tập F (α),
được xác định: F
α
= {(x, µ
F
(x))|x ∈ F (α)} ∪ {(x, 0.0)|x /∈ F (α)}.
14
1.3.2. Các phép toán trên tập mờ
Tương tự như lý thuyết tập hợp, trên các tập mờ cũng định nghĩa một số

phép toán: bằng nhau, bao nhau, giao, hợp [1] là sự mở rộng các định nghĩa
trên lý thuyết tập hợp.
Định nghĩa 1.5. [1] Cho F và F
1
là hai tập mờ trên U
(1): F bằng F
1
, ký hiệu F = F
1
, nếu µ
F
(x) = µ
F
1
(x), ∀x ∈ U .
(2): F chứa trong F
1
, ký hiệu F ⊆ F
1
, nếu µ
F
(x) ≤ µ
F
1
(x), ∀x ∈ U.
(3): Hợp của hai tập mờ F và F
1
, ký hiệu F ∪ F
1
, là một tập mờ trên U với

hàm thuộc xác định bởi: µ
F ∪F
1
(x) = Max{µ
F
(x), µ
F
1
(x)}, ∀x ∈ U.
(4): Giao của hai tập mờ F và F
1
, ký hiệu F ∩ F
1
, là một tập mờ trên U với
hàm thuộc xác định bởi: µ
F ∩F
1
(x) = Min{µ
F
(x), µ
F
1
(x)}, ∀x ∈ U.
(5): Phần bù của tập mờ F, ký hiệu F là một tập mờ trên U với hàm thuộc
xác định bởi: µ
F
(x) = 1 − µ
F
(x), ∀x ∈ U.
Định nghĩa 1.6. [1] Cho F và F

1
là hai tập mờ trên U
(1): Tổng đại số
F + F
1
= {(x, µ
F +F
1
(x))|x ∈ U, µ
F +F
1
(x) = µ
F
(x) + µ
F
1
(x) − µ
F
(x).µ
F
1
(x)}
(2): Tích đại số
F.F
1
= {(x, µ
F .F
1
(x))|x ∈ U, µ
F .F

1
(x) = µ
F
(x).µ
F
1
(x)}
1.3.3. Tổng quát hoá ba phép toán cơ bản trên tập mờ
Ngoài ba phép toán cơ bản min, max và phần bù được dùng thao tác trên
các tập mờ, để tổng quát hơn có thể định nghĩa họ các toán tử T là t-norm,
t-conorm và N-Negation cho các phép toán trên.
Định nghĩa 1.7. [1] Hàm T: [0,1] x [0,1] → [0,1] được gọi là t-norm khi và chỉ
khi thoả mãn ∀x, y, z ∈ [0, 1]:
(1) T(x,y) = T(y,x).
(2) T(x,y) ≤ T(x,z), ∀y ≤ z.
(3) T(x,T(y,z)) = T(T(x,y),z).
15
(4) T(x,1) = x.
Định nghĩa 1.8. [1] Hàm S : [0, 1]x[0, 1] → [0, 1] được gọi là t-conorm khi và
chỉ khi thoả mãn ∀x, y, z ∈ [0, l]:
(1) S(x,y) = S(y,x).
(2) S(x,y) ≤ S(x,z), ∀y ≤ z.
(3) S(x,S(y,z)) = S(S(x,y),z).
(4) S(x,0) = 0.
Định nghĩa 1.9. [1] Hàm N : [0, 1] → [0, 1] được gọi là hàm phủ định khi và
chỉ khi N thoả mãn ∀x, y ∈ [0, l]:
(1) N(0) = 1, N(1) = 0.
(2) N(x) ≤ N(y), ∀y ≤ x.
Theo định nghĩa, tập các tập mờ là không gian F(U, [0,1]) các hàm từ U vào
đoạn [0,1], một không gian tương đối giàu về cấu trúc tính toán.

Việc xây dựng hàm thuộc của các tập mờ dựa trên ngữ nghĩa của các khái
niệm mờ. Ngược lại, một lớp các khái niệm mờ có thể được mô hình hoá ngữ
nghĩa qua các tập mờ. Trên cơ sở mối quan hệ này, L.A.Zadeh đã đưa ra khái
niệm mới đó là biến ngôn ngữ.
1.3.4. Biến ngôn ngữ
Trong [51] L.A.Zadeh đã viết "thiếu hụt tính chính xác bề ngoài của những
vấn đề phức tạp một cách tự nhiên là tìm cách sử dụng các biến ngôn ngữ, đó là
các biến mà giá trị của chúng không phải là số mà là các từ hoặc các câu trong
ngôn ngữ tự nhiên hoặc nhân tạo. Động lực cho việc sử dụng các từ, các câu hơn
các số là đặc trưng ngôn ngữ của các từ, các câu thường là ít xác định hơn của
số".
Nói tóm lại, ý trên đây đã khái quát cho khái niệm biến ngôn ngữ. Một cách
hình thức biến ngôn ngữ được định nghĩa như sau.
Định nghĩa 1.10. [51] Biến ngôn ngữ là một bộ năm (X, T (X), U, R, M), trong
đó X là tên biến, T(X) là tập các giá trị ngôn ngữ của biến X, U là không gian

cơ sở dữ liệu hướng đối tượng với thông tin ngôn ngữ mờ

Trích đoạn

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về