Tải bản đầy đủ (.pdf) (76 trang)

Xây dựng hệ luật mờ từ cơ sở dữ liệu cách tiếp cận theo lý thuyết đại số gia tử

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.71 MB, 76 trang )

LỜI CAM ĐOAN

Tên tôi là : Đặng Thị Thu
Sinh ngày 05 tháng 8 năm 1983
Học viên cao học lớp: CK11G - trường Đại học CNTT&TT
Thái Nguyên
Xin cam đoan : Đề tài luận văn “Xây dựng hệ luật mờ từ cơ sở dữ
liệu - cách tiếp cận theo lý thuyết Đại số gia tử” do TS.Trần Thái Sơn
hướng dẫn là công trình nghiên cứu của riêng tôi. Tất cả tài liệu tham khảo
đều có nguồn gốc, xuất xứ rõ ràng.
Tôi xin cam đoan tất cả những nội dung trong luận văn đúng như nội
dung trong đề cương và yêu cầu của thầy giáo hướng dẫn. Nếu sai tôi xin
hoàn toàn chịu trách nhiệm trước Hội đồng khoa học và trước pháp luật.
Thái Nguyên, ngày 25 tháng 8 năm 2014
Người cam đoan

Đặng Thị Thu


LỜI CẢM ƠN

Trong quá trình làm luận văn vừa qua, dưới sự giúp đỡ và chỉ bảo
nhiệt tình của TS. Trần Thái Sơn - Viện Công nghệ thông tin - Viện khoa
học Việt Nam, luận văn của tôi đã được hoàn thành. Mặc dù đã cố gắng
không ngừng cùng với sự tận tâm của thầy hướng dẫn nhưng do thời gian
và khả năng vẫn còn hạn chế nên luận văn khó tránh khỏi những thiếu sót.
Để hoàn thành luận văn này, em xin bày tỏ lòng biết ơn sâu sắc đến
TS. Trần Thái Sơn - Người thầy đã tận tình giúp đỡ em trong suốt quá trình
làm luận văn.
Em cũng xin bày tỏ lòng biết ơn đến ban lãnh đạo và các thầy giáo,
cô giáo trong Trường Đại học Công Nghệ Thông Tin & Truyền Thông Đại


học Thái Nguyên đã giúp đỡ, tạo điều kiện tốt nhất cho em học tập và thực
hiện luận văn này.
Thái Nguyên, ngày 25 tháng 8 năm 2014
Tác giả

Đặng Thị Thu


i
MỤC LỤC
MỤC LỤC .................................................................................................. i
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT ............................. iii
DANH MỤC CÁC HÌNH ......................................................................... iv
PHẦN MỞ ĐẦU ........................................................................................ 1
Chương 1: NHỮNG KIẾN THỨC CƠ BẢN VỀ LÝ THUYẾT TẬP MỜ . 3
1.1. Lý thuyết về tập mờ ......................................................................... 3
1.1.1 Kiến thức cơ sở về tập mờ ([5]) ................................................. 3
1.1.2 Biến ngôn ngữ ........................................................................... 8
1.2. Lý thuyết về Đại số gia tử ([1-3]) .................................................. 14
1.2.1. Những khái niệm cơ bản về đại số gia tử ............................... 14
1.2.2 Vấn đề định lượng ngữ nghĩa trong đại số gia tử..................... 17
Chương 2: GIẢI THUẬT DI TRUYỀN ................................................... 25
2.1. Những khái niệm cơ bản về giải thuật di truyền ............................. 25
2.2. Các tính chất đặc thù của thuật giải di truyền ................................. 28
2.3. Các bước quan trọng trong việc áp dụng giải thuật di truyền ......... 29
2.4. Các phương thức biến hoá của giải thuật di truyền ........................ 29
Chương 3: XÂY DỰNG HỆ LUẬT MỜ VÀ GIẢI BÀI TOÁN HỒI QUY
MỜ THEO CÁCH TIẾP CẬN CỦA ĐẠI SỐ GIA TỬ ............................ 32
3.1. Bài toán hồi quy mờ ...................................................................... 32
3.1.1 Bài toán hồi quy mờ................................................................. 32

3.1.2 Chuyển đổi CSDL số sang hệ luật mờ dựa trên lý thuyết tập mờ cổ
điển ................................................................................................... 36
3.1.3 Xây dựng hệ luật mờ theo cách tiếp cận ĐSGT ...................... 40
3.2. Bài toán thiết kế tối ưu hệ luật mờ ................................................. 56
3.2.1

Đặt bài toán......................................................................... 56

3.2.2

Tìm kiếm hệ luật tối ưu dựa trên giải thuật di truyền lai ...... 57


ii
3.3. Chương trình thử nghiệm............................................................... 60
3.3.1. Cài đặt chương trình ............................................................... 60
3.3.2. Giao diện của chương trình ..................................................... 60
KẾT LUẬN CHUNG ............................................................................... 69
TÀI LIỆU THAM KHẢO ........................................................................ 70


iii
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
Các kí hiệu,
các chữ viết tắt
ĐSGT

Ý nghĩa
Đại số gia tử


Α

Tổng độ đo tính mờ của các gia tử âm

Β

Tổng độ đó tính mờ của các gia tử dương

AX

Đại số gia tử

AX

Đại số gia tử tuyến tính đầy đủ

µ(h) fm(x)

Độ đo tính mờ gia tử h và của hạng từ x



Là đầu ra mờ,



Là các hệ số mờ

CSDL
GA


Cơ sở dữ liệu
Giải thuật di truyền
Khoảng tính mờ của giá trị ngôn ngữ

Xk

Tập các hạng từ có độ dài đúng k

Ik

Hệ khoảng tính mờ mức k của các giá trị ngôn ngữ

IFRG1

Initial Fuzzy Rules Generation 1

IFRG2

Initial Fuzzy Rules Generation 2

HAFRG

Hedge Algebras based Fuzzy Rules Generation

FPO-SGA

Fuzzy Parameters Optimization - SGA

RBO-SGA


Rule base Optimization - SGA


iv
DANH MỤC CÁC HÌNH

Hình

Mô tả

Hình 1

Đồ thị biểu diễn hàm thuộc của tập mờ “già” (old)

Hình 2

Độ đo tính mờ của biến TRUTH

Hình 3

Khoảng tính mờ của các hạng từ của biến TRUTH

Hình 4

Mã hóa cá thể từ không gian các lời giải của bài toán

Hình 5

Hàm định lượng dạng tam giác của các hạng từ


Hình 6:

Sơ đồ mã hóa cá thể chọn hệ luật cho thuật toán SGA


1
PHẦN MỞ ĐẦU
Trong cuộc sống hàng ngày hay trong công việc giảng dạy tại trường,
chúng ta thường xuyên phải đưa ra những quyết định. Chẳng hạn, với một học
sinh kém, ta cần có chế độ bồi dưỡng các kiến thức cơ sở mà thông thường
học sinh đó bị rỗng. Với một học sinh giỏi, ta cũng cần bồi dưỡng các kiến
thức, nhưng là các kiến thức mới, đòi hỏi phải tư duy tốt và tính sáng tạo
trong suy nghĩ... Nói chung, cách tiến hành cụ thể là phụ thuộc vào từng học
sinh và căn cứ vào kinh nghiệm giảng dạy cũng như kinh nghiệm sống của
từng giáo viên và kinh nghiệm học được của đồng nghiệp, của người xung
quanh.. Các kinh nghiệm này, trong tư duy của con người, có thể khái quát
dưới dạng mệnh đề kiểu “ Nếu... thì..”. Thí dụ “Nếu Học lực của học sinh là
Kém và Ý thức học tập của học sinh là trung bình Thì Dạy kèm theo phương
án C1”; Thí dụ “Nếu Học lực của học sinh là Khá và Ý thức học tập của học
sinh là Tốt Thì Dạy kèm theo phương án C2”...
Hiện tại, người ta nhận thấy, các mệnh đề dạng như trên có thể bắt gặp
rất nhiều trong những lĩnh vực nghiên cứu khác nhau như điều khiển tối ưu,
phân loại tự động, hồi quy. Và một hướng nghiên cứu, thuộc về khai phá dữ
liệu, liên quan đến việc xây dựng các mệnh đề như vậy, mà người ta gọi là
luật, để giải các bài toán khác nhau, đã và đang phát triển rất mạnh mẽ. Cụ
thể, vấn đề đặt ra là từ một Cơ sở dữ liệu số (CSDL số), sử dụng các thuật
toán để sinh tự động một hệ luật tối ưu (theo nghĩa gọn nhất có thể và đạt độ
chính xác theo yêu cầu đặt ra). Nếu một hệ M luật được tạo ra, có dạng:
Rm:

THEN

XF+1

IF
is

X1 is

AND ... AND XF

is

; m = 1,...,M, trong đó Xi là

các biến ngôn ngữ (như “tuổi”, “học lực”..) và Ai,j là các giá trị biến ngôn ngữ


2
(như “khá”, “kém”..) thì người ta gọi đó là hệ luật mờ Mamdani (Mamdani
fuzzy rule-based system:
MFRBS). MFRBS có đặc điểm khác các mô hình khác là các biến đầu
vào và ra đều là mờ dưới dạng từ của ngôn ngữ tự nhiên. Đặc điểm này mang
lại tính “thân thiện” với con người vì suy luận trên các từ của ngôn ngữ tự
nhiên là đặc điểm của con người. Các luật cũng được biểu diễn dưới dạng
quen thuộc với suy nghĩ và lập luận của con người. Ngoài ra, việc có những
số liệu chính xác để xây dựng một hệ luật (không mờ) trong thời gian tính
toán chấp nhận được là điều không dễ dàng. Để xây dựng MFRBS có thể có
nhiều cách tiếp cận khác nhau. Trong luận văn này sử dụng cách tiếp cận của
Đại số gia tử (ĐSGT), một cách tiếp cận tương đối mới và hứa hẹn cho những

kết quả khả quan so với một số cách tiếp cận khác.
Được sự đồng ý của trường Đại học Công nghệ thông tin và Truyền
thông với sự hướng dẫn của Thầy giáo em xin mạnh dạn nhận đề tài: “Xây
dựng hệ luật mờ từ cơ sở dữ liệu - cách tiếp cận theo lý thuyết Đại số
gia tử” làm đề tài luận văn của mình.
Luận văn có bố cục như sau:
Chương 1: Tổng quan về tập mờ và đại số gia tử
Trong chương này trình bày những kiến thức cơ bản về lý thuyết tập
mờ và lý thuyết Đại số gia tử.
Chương 2: Giải thuật di truyền
Trong chương này nêu khái niệm cơ bản về giải thuật di truyền, các
tính chất đặc thù của thuật giải di truyền.
Chương 3: Xây dựng hệ luật mờ và giải bài toán hồi quy mờ theo
cách tiếp cận của đại số gia tử.
Trong chương này trình bày việc chuyển đổi CSDL số sang hệ luật mờ
và áp dụng giải bài toán hồi quy


3

Chương 1
NHỮNG KIẾN THỨC CƠ BẢN VỀ LÝ THUYẾT TẬP MỜ
1.1. Lý thuyết về tập mờ
1.1.1 Kiến thức cơ sở về tập mờ ([5])
Là người đầu tiên nghiên cứu lý thuyết tập mờ, L. A. Zadeh đã có rất
nhiều công trình nghiên cứu cho sự phát triển và ứng dụng . Ý tưởng nổi bật
của Zadeh là từ những khái niệm trừu tượng về ngữ nghĩa của thông tin mờ,
không chắc chắn như trẻ-già, nhanh-chậm, cao-thấp,… Ông đã tìm cách biểu
diễn chúng bằng một khái niệm toán học, được gọi là tập mờ và được định
nghĩa như sau.

Định nghĩa 1. Cho một tập vũ trụ U với các phần tử ký hiệu bởi x,
U={x}. Một tập mờ A trên U là tập được đặc trưng bởi một hàm A(x) mà nó
liên kết mỗi phần tử x∈U với một số thực trong đoạn [0,1]. Giá trị hàm A(x)
biểu diễn mức độ thuộc của x trong A. A(x) là một ánh xạ từ U vào [0,1] và
được gọi là hàm thuộc của tập mờ A.
Như vậy, giá trị hàm A(x) càng gần tới 1 thì mức độ thuộc của x trong
A càng cao. Khi A là một tập hợp kinh điển, hàm thuộc của nó, A(x), chỉ
nhận 2 giá trị 1 hoặc 0, tương ứng với x có nằm trong A hay không. Rõ ràng,
tập mờ là sự mở rộng của khái niệm tập hợp kinh điển. Các khái niệm, phép
toán trong lý thuyết tập kinh điển cũng được mở rộng cho các tập mờ.
Họ tất cả các tập mờ trên miền cơ sở U là không gian các hàm từ U vào
đoạn [0,1], tức là

F (U,[0,1]) = {A

: U[0,1]}, một không gian tương đối

giàu về cấu trúc tính toán mà nhiều nhà nghiên cứu đã sử dụng cho việc mô
phỏng các phương pháp suy luận của con người.


4
Chúng ta có thể biểu diễn tập mờ bằng các cách sau, tùy theo tập U là
hữu hạn, đếm được hay vô hạn liên tục:
- Trường hợp U hữu hạn, U={ui : 1 i  n}, ta có thể viết
A = A(u1)/u1 + A(u2)/u2 + … + A(un)/un = 1 i n A(ui)/ui
- Trường hợp U vô hạn đếm được, U={ui : i=1,2,… }, ta viết:
A = 1 i < A(ui)/ui
- Trường hợp U vô hạn liên tục, U=[a,b], ta viết:
b


A=



A

(u ) / u

a

Sau đây ta định nghĩa một số khái niệm đặc trưng liên quan đến tập mờ.
Định nghĩa 2. Cho một tập mờ A trên tập vũ trụ U và [0,1]. Tập lát
cắt  của A là một tập kinh điển, ký hiệu A, được xác định như sau :
A = {u  U : A(u)}.
Tập A còn gọi là tập mức  của A.
Định nghĩa 3. Cho một tập mờ A trên tập vũ trụ U,
i) Giá của tập mờ A, ký hiệu support(A), là tập con của U trên đó

A(u)0, tức là support(A) = {u  U : A(u)0}.
ii) Độ cao của tập mờ A, ký hiệu high(A), là cận trên đúng của hàm
thuộc A(u) trên U, tức là high(A) = sup{A(u) : uU}.
iii) A được gọi là tập mờ chuẩn nếu high(A)=1. Ngược lại gọi là tập mờ
dưới chuẩn.
iv) Lõi của tập mờ A, ký hiệu core(A), là một tập con của U được xác
định như sau:
core(A) = {uU : A(u) = high(A)}.


5

Định nghĩa 4. Cho một tập mờ A trên tập vũ trụ U,
i) Lực lượng vô hướng hay bản số của tập mờ A, ký hiệu count(A),
được xác định là:
count(A) = uU A(u), nếu U là hữu hạn hay đếm được,
= U A(u)du, nếu U là vô hạn liên tục.
ii) Lực lượng mờ hay bản số mờ của tập mờ A, ký hiệu card(A), là một
tập mờ trên tập các số nguyên không âm N, được xác định như sau:
card(A) = N card(A)(n)dn , trong đó, card(A)(n) được xác định theo công
thức sau, với |A| là lực lượng tập mức A,

card(A)(n) = sup{t[0,1] : |A| = n}.
Ví dụ 1. Cho tập vũ trụ chỉ tuổi tính chẵn năm U={u : 0 u 120}, A là
một tập mờ chỉ tuổi già (old) được xác định bởi hàm thuộc sau (hình 1):

u[0,60]
0
u60 2 1
(1( 6 ) ) u [61,120]

old (u)  

Khi đó tập mức =0.5 của A là A0.5 = {u : 66 u 120} ;
support(A) = {u : 61 u 120} ; high(A) = 1.01-1; core(A) = {120}.

Hình 1. Đồ thị biểu diễn hàm thuộc của tập mờ già (old)
Tiếp theo chúng ta định nghĩa một số phép toán cơ bản trên tập mờ, các
phép này làm cơ sở cho việc phát triển lôgíc mờ sau này.


6

Định nghĩa 5. Cho hai tập mờ A và B trên tập nền U có hàm thuộc
tương ứng là A và B, ba phép toán cơ bản là hợp, giao của hai tập mờ và lấy
phần bù của tập mờ A là một tập mờ C, được viết là
C = A  B, hoặc C = A  B, hoặc C = A~ với hàm thuộc được xác
định như sau:

AB(u) = max(A(u), B(u)), u  U,
AB(u) = min(A(u), B(u)), u  U,
A~(u) = 1- A(u), u  U.
Hay viết ở dạng thu gọn là:

AB(u) = A(u)  B(u)),
AB(u) = A(u)  B(u)).
Ví dụ 2. Xét tập nền U = {1,2,3,4,5,6,8,9,10,11} là tập các giá trị trong
thang điểm 10 đánh giá kết quả học tập của học sinh. Hai tập mờ G và K
tương ứng là hai khái niệm mờ về năng lực học giỏi và học kém, với hàm
thuộc được cho dưới dạng bảng như sau:
uU

1

2

3

4

5

6


7

8

9

10

G(u) 0.0 0.0 0.0 0.1 0.3 0.5 0.7 0.9 1.0 1.0
K(u) 1.0 0.9 0.8 0.6 0.4 0.2 0.0 0.0 0.0 0.0
Ta có kết quả của các phép toán trên hai tập mờ này với hàm thuộc thể
hiện trong bảng sau:
uU

1

2

3

4

5

6

7

8


9

10

GK(u) 0.0 0.0 0.0 0.6 0.5 0.5 0.7 0.9 1.0 1.0
GK(u) 0.0 0.0 0.0 0.1 0.3 0.2 0.0 0.0 0.0 0.0
G~(u)

1.0

1.0

1.0

0.9

0.7

0.5

0.3

0.1

0.0

0.0



7
Một lớp đặc biệt các tập mờ là lớp các quan hệ mờ, chúng là các tập mờ
trên không gian tích Đề-các các miền cơ sở. Như tên gọi, quan hệ mờ mô tả
mối quan hệ mờ giữa các đối tượng trong miền cơ sở. Về mặt hình thức chúng
ta định nghĩa quan hệ mờ như sau.
Định nghĩa 6. Cho U là tích Đề-Các của n miền cơ sở Ui, i=1, ,…, n.
Khi đó mỗi một tập mờ trên U được gọi là một quan hệ mờ n-ngôi và được kí
hiệu là R, gọi là tên của quan hệ đó, và nó được biểu thị bằng công thức sau:
R

U1 ...U n

 (u1 ,..., u1 ) / (u1 ,..., u1 )

Trong đó (u1,…,un) là hàm thuộc của tập mờ R. Dấu  biểu diễn hình
thức của hàm thuộc, có thể một trong ba trường hợp là hữu hạn hoặc đếm
được hoặc liên tục.
Quan hệ mờ cũng có các phép tính cơ bản như trên tập mờ vì bản thân
nó cũng là tập mờ. Ngoài ra, quan hệ mờ có những phép tính đặc thù riêng mà
trên tập mờ không có, đó là phép hợp thành dưới đây.
Định nghĩa 7. Cho R là một quan hệ mờ trên UV và S là quan hệ mờ
trên VW. Khi đó, phép hợp thành của hai quan hệ này là một quan hệ trên
UW, được ký hiệu là RS và được định nghĩa như sau:
RS = vV [R(u,v)S(v,w)]/(u,w)
Trong đó  là một phép tính 2 ngôi trong [0,1] có tính giao hoán, kết
hợp và phân phối đối với phép max . Nếu  là phép min , thì ta có phép hợp
thành max-min, nếu  là phép nhân số học thì ta có phép hợp thành
max-product.
Ví dụ 3. Cho U = {u1, u2, u3}, V = {v1, v2} và W = {w1, w2}, với quan
hệ mờ R trên UV và S trên VW được cho hàm thuộc dưới dạng ma trận



8
v1

w1

v2

u1
R  u2

 0.4 1 
 1 0.3 

 và
u 3  0.7 0.8 

S

w2

v1 0.2 0.8
v2 0.7 0.1
w1

w2

u1  0.7 1 



khi đó phép hợp thành max-min là R  S  u 2  0.3 0.8  ,
u 3  0.7 0.7 
w1

w2

u1  0.8 0.32 


và max-product là R  S  u 2  0.21 0.8  .
u3  0.56 0.56 
Phép hợp thành các quan hệ mờ đóng vai trò quan trọng trong quá trình
lập luận xấp xỉ sau này.
Trong hầu hết các ứng dụng, tri thức được biểu diễn dưới dạng luật
“if-then” và mỗi luật được xem như một quan hệ mờ.
Ta thấy rằng lý thuyết tập mờ với mục tiêu mô hình hóa toán học ngữ
nghĩa của các khái niệm mờ và, hơn nữa, mô hình hóa cách lập luận của con
người. Tuy nhiên, những vấn đề này thuộc loại có cấu trúc yếu, khó có thể có
một cấu trúc toán duy nhất mô hình hóa trọn vẹn những vấn đề đó.
1.1.2 Biến ngôn ngữ
L. A. Zadeh đã viết “Khi thiếu hụt tính chính xác bề ngoài của những
vấn đề phức tạp cố hữu, một cách tự nhiên là tìm cách sử dụng các biến ngôn
ngữ, đó là các biến mà giá trị của chúng không phải là số mà là các từ hoặc
các câu trong ngôn ngữ tự nhiên hoặc nhân tạo. Động lực cho việc sử dụng
các từ, các câu hơn các số là ở chỗ đặc trưng ngôn ngữ của các từ và các câu
thường ít xác định cụ thể hơn của các số”. và ông đã đưa ra một lớp khái
niệm rộng hơn có thể mô hình qua các tập mờ, đó là biến ngôn ngữ.



9
Định nghĩa 8. Biến ngôn ngữ là một bộ năm (X,T(X),U,R,M), trong đó
X là tên biến, T(X) là tập các giá trị ngôn ngữ của biến X, U là không gian
tham chiếu hay còn gọi là miền cơ sở của biến X, R là một quy tắc ký pháp
sinh các giá trị ngôn ngữ cho T(X), M là quy tắc gán ngữ nghĩa biểu thị bằng
tập mờ trên U cho các từ ngôn ngữ trong T(X).
Ví dụ 4. Cho X là biến ngôn ngữ có tên AGE, miền tham chiếu của X
là U=[0,120]. Tập các giá trị ngôn ngữ T(AGE)={very old, old, possible old,
less old, less young, quite young, more young,…}. Chẳng hạn với giá trị ngôn
ngữ old, quy tắc gán ngữ nghĩa M cho old bằng tập mờ cho bởi ví dụ 1:
M(old) = {(u,old(u)) : u[0,120]}.
Biến ngôn ngữ được cấu trúc theo hướng mà trong đó có hai quy tắc cơ
bản. Thứ nhất là quy tắc cú pháp, qui định cách thức để sinh các giá trị ngôn
ngữ. Thứ hai là quy tắc ngữ nghĩa, qui định thủ tục tính toán ngữ nghĩa của
các giá trị ngôn ngữ. Ngoài các giá trị sinh nguyên thủy, các giá trị ngôn ngữ
có thể gồm các từ liên kết như and, or, not,… và các gia tử ngôn ngữ như
very, possible, less, quite, more,….Zadeh cũng nêu ra một vài thí dụ về cách
sinh ra các hàm thuộc từ các hàm thuộc đã có như nếu A là nhãn ngôn ngữ
mờ có hàm thuộc là μA thì veryA có hàm thuộc là (μA)2 còn lessA có hàm
thuộc là căn bặc hai của μA...
Trong thực tế có nhiều biến ngôn ngữ khác nhau về giá trị sinh nguyên
thủy, tuy nhiên cấu trúc miền giá trị của chúng tồn tại một “đẳng cấu” sai
khác nhau bởi giá trị sinh nguyên thủy này. Đây gọi là tính phổ quát của biến
ngôn ngữ.
Khác với giá trị nguyên thủy của các biến ngôn ngữ phụ thuộc vào ngữ
cảnh, ngữ nghĩa của các gia tử và các từ liên kết hoàn toàn độc lập với ngữ
cảnh. Đây là tính độc lập ngữ cảnh của gia tử và liên kết.


10

Chúng ta thấy rằng lý thuyết tập mờ với mục tiêu mô hình hóa toán học
ngữ nghĩa của các khái niệm mờ và hơn nữa mô hình hóa cách lập luận của
con người. Tuy nhiên, những vấn đề này thuộc loại có cấu trúc yếu, khó có
thể có một cấu trúc toán duy nhất mô hình hóa trọn vẹn những vấn đề đó.
1.1.3 Lôgic mờ
Cùng với khái niệm biến ngôn ngữ, L. A. Zadeh đã phát triển lôgic mờ
mà các giá trị chân lý nhận trong T(Truth) = {true, very true, more false,
possible false, very very false,…}, tập các giá trị của biến ngôn ngữ Truth.
Khi đó, một mệnh đề dạng “X is A”, với A là một khái niệm mờ, sẽ có giá trị
chân lý thuộc T(Truth) và được biểu thị bởi một tập mờ có hàm thuộc A trên
không gian tham chiếu U.
Lý thuyết tập mờ là cơ sở toán học cho việc phát triển các phương pháp
mô phỏng lập luận của con người. Về nguyên tắc, vấn đề tư duy, lập luận của
con người rất phức tạp và do đó không thể sử dụng một cấu trúc toán học duy
nhất để mô phỏng. Vì vậy, mục tiêu của chúng ta là càng xây dựng được nhiều
cấu trúc đại số các tập mờ càng tốt để linh hoạt trong tiếp cận các vần đề ứng
dụng. Ở đây, chúng ta sẽ định nghĩa một họ các cặp đối ngẫu t-norm và tconorm cùng với phép phủ định làm cơ sở cho lôgic mờ và lập luận xấp xỉ.
Định nghĩa 9. Một hàm 2-biến T : [0,1][0,1]  [0,1] được gọi là
phép t-norm nếu nó thỏa các tính chất sau với a,a’,b,c [0,1]:
i) Tính chất điều kiện biên:

T(a,1) = a

ii) Tính giao hoán: T(a,b) = T(b,a)
iii) Tính đơn điệu: a  a’  T(a,b)  T(a’,b)
iv) Tính kết hợp:

T(a,T(b,c)) = T(T(a,b),c)

Ngoài ra, một số tính chất khác cần đòi hỏi phải có trong nhiều ứng

dụng đối với phép t-norm bao gồm:
v) Tính liên tục:

T là hàm hai biến liên tục


11
vi) Tính lũy đẳng dưới: T(a,b) < a
vii) Tính đơn điệu chặt: a  a’ và b  b’  T(a,a’) < T(b,b’)
Định nghĩa 10. Một hàm 2-biến S : [0,1][0,1]  [0,1] được gọi là
phép t-conorm nếu nó thỏa các tính chất sau với a,a’,b,c [0,1]:
i) Tính giới nội: S(a,0) = a
ii) Tính giao hoán: S(a,b) = S(b,a)
iii) Tính đơn điệu: a  a’  S(a,b)  S(a’,b)
iv) Tính kết hợp: S(a,S(b,c)) = S(S(a,b),c)
Như vậy, chỉ có hai tính chất điều kiện biên và giới nội làm nên sự khác
biệt giữa hai họ phép tính t-norm và t-conorm.
Chúng ta cũng có thể mở rộng định nghĩa cho phép t-norm và t-conorm
này đối với trường hợp nhiều biến vào, tức là Tex : [0,1]n  [0,1] và Sex : [0,1]n
 [0,1], bằng cách áp dụng liến tiếp các phép t-norm và t-conorm ở trên.
Định nghĩa 11. Hàm N : [0,1]  [0,1] được gọi là phép phủ định
(negation) nếu nó thỏa các tính chất sau với a,a’ [0,1]:
i) Tính đơn điệu giảm: a  a’  N(a)  N(a’)
iv) Tính lũy đẳng: N(N(a)) = a
Ví dụ 5: Các phép t-norm, t-conorm và phép phủ định hay được sử
dụng như:
TM(a,b) = min{a,b}
TP(a,b) = a.b
TL(a,b) = max{0,a+b-1}
a


T (a, b)  b
0

*

khi b  1
khi a  1
khi a  1& b  1

SM(a,b) = max{a,b}
SP(a,b) = a+b-a.b


12
SL(a,b) = min{1,a+b}
a

S (a, b)  b
0

*

khi b  0
khi a  0
khi a  0 & b  0

N(a) = 1-a.
Định nghĩa 12. Ba phép tính t-norm T, t-conorm S và phép phủ định N
được gọi là một hệ đối ngẫu (T,S,N) nếu chúng thỏa điều kiện sau:

N(S(a,b)) = T(N(a),N(b)), a,b[0,1].
Việc áp dụng các phép t-norm, t-conorm và phép phủ định cho việc
tính toán các toán tử hội, tuyển và phủ định trong lôgic mờ làm tăng tính mềm
dẻo trong ứng dụng. Thực vậy, khi hai mệnh đề “X is A” và “X is B” có giá trị
chân lý được biểu thị bởi hai hàm thuộc tương ứng A và B trên không gian
tham chiếu U và V thì mệnh đề mờ “X is A and B” có hàm thuộc biểu thị giá
trị chân lý là AB = T(A,B), với T là một t-norm nào đó. Tương tự, mệnh đề
“X is A or B” có hàm thuộc là AB = S(A,B) và mệnh đề “X is not A” có
hàm thuộc là ~A = N(A), ở đây S là một t-conorm và N là một phép phủ định
được chọn nào đó.
Các mệnh đề mờ cùng với giá trị chân lý của chúng là những đối tượng
nghiên cứu chính của lôgíc mờ. Trong đó, một dạng mệnh đề mờ thường biểu
diễn cho tri thức dạng luật trong lập luận xấp xỉ và ứng dụng, đó là mệnh đề
mờ có điều kiện dạng “If X is A then Y is B” và được biểu diễn bằng toán tử
kéo theo mờ.
Ở đây, một cách tổng quát, chúng ta đưa ra một số tính chất cho một
phép kéo theo mờ.
Định nghĩa 13. Phép kéo theo là một hàm số I : [0,1]2  [0,1] có các
tính chất sau:
i) Tính đơn điệu giảm đối với biến thứ nhất


13
x  z  I(x,y)  I(z,y), y[0,1]
ii) Tính đơn điệu tăng đối với biến thứ hai
y  u  I(x,y)  I(x,u), x[0,1]
iii) Tính chi phối của giá trị chân lý sai
I(0,x) = 1
iv) Tính trung tính của giá trị chân lý đúng
I(1,x) = x

v) Tính đồng nhất
I(x,x) = x
vi) Tính chất hoán đổi
I(x,I(y,z)) = I(y,I(x,z))
vii) Tính chất về điều kiện giới nội
I(x,y) = 1 nếu và chỉ nếu x  y
viii) Tính chất khái quát hóa của phép kéo theo kinh điển
I(x,y) = I(N(y),N(x)), trong đó N là phép phủ định
ix) I là hàm liên tục theo cả hai biến.
Rõ ràng mệnh đề điều kiện ở dạng “If X is A then Y is B” thể hiện mối
quan hệ giữa hai khái niệm mờ A và B. Vì vậy, chúng cảm sinh một quan hệ
mờ R thể hiện bởi một tập mờ trên không gian tích Đề-Các UV được xác
định bởi hàm thuộc thông qua một phép kéo theo được chọn.
Ví dụ 6. Một số dạng phép kéo theo thường dùng
Mamdani
I(x,y) = min{x,y}
Dạng khái quát từ phép kéo theo kinh điển
I(x,y) = S(N(x),y), hoặc
I(x,y) = S(N(x),T(x,y)), hoặc
I(x,y) = S(T(N(x),N(y)),y), với T, S và N là các phép


14
t-norm, t-conorm và phép phủ định.
Reichenbach
I(x,y) = 1-x+x.y
Lukasiewicz
I(x,y) = min{1, 1-x+y}.
Định lý sau đây cho chúng ta xem xét liệu phép kéo theo như thế nào sẽ
thỏa mãn tất cả các tính chất trong định nghĩa 13.

Định lý 1. Một hàm 2-biến I : [0,1]2  [0,1] thỏa các tính chất từ i)
đến ix) trong định nghĩa 13 nếu và chỉ nếu có tồn tại một hàm liên tục đơn
điệu tăng thực sự f : [0,1]  [0,+) sao cho f(0) = 0 và
I(x,y) = f-1(f(1)-f(x)+f(y)), với x,y  [0,1], và
N(x) = f-1(f(1)-f(x)), với x [0,1].
Tuy nhiên, bản chất ngữ nghĩa của phép kéo theo mờ trong lập luận của
con người rất phức tạp, khó có một hệ tiên đề chung cho mọi tình huống. Vì
vậy, các tính chất ở định nghĩa 13 không bắt buộc mọi phép kéo theo mờ đều
phải thỏa mãn. Hơn nữa, cũng không có quyền đặt ra các yêu cầu về một tính
chất nào đó khác mà một phép kéo theo cần phải có. Chỉ có ứng dụng thực
tiễn là tiêu chuẩn cuối cùng chứng minh tính phù hợp của một định nghĩa
phép kéo theo mờ.
1.2. Lý thuyết về Đại số gia tử ([1-3])
1.2.1. Những khái niệm cơ bản về đại số gia tử
Phương pháp lập luận tính toán nhằm giải quyết vấn đề mô phỏng tư
duy, lập luận của con người chính là việc chúng ta mượn cấu trúc tính
toán rất phong phú của tập tất cả các hàm F(U,[0,1]) để mô phỏng các cách
lập luận của con người mà chúng ta thường được thực hiện trên nền ngôn
ngữ tự nhiên. Tuy nhiên, các tác giả đã chỉ ra rằng tập các giá trị ngôn ngữ
của một biến ngôn ngữ sẽ là một cấu trúc đại số đủ giàu để tính toán và


15
nghiên cứu các phương pháp lập luận. Như vậy thay vì mượn cấu trúc của
F(U,[0,1]), chúng ta có một khả năng lựa chọn khác là sử dụng cấu trúc đại số
của chính các tập các giá trị ngôn ngữ.
Đại số gia tử (ĐSGT) được ra đời do đề xuất của N.C. Ho và W.
Wechler vào năm 1990, đến nay đã có nhiều nghiên cứu phát triển và ứng
dụng thành công.
Các tác giả đã chứng minh miền ngôn ngữ X = Dom(X) của một

biến ngôn ngữ X có thể được tiên đề hóa và được gọi là đại số gia tử
và được ký hiệu là AX = (X, G, H, ≤) trong đó G là tập các phần tử
sinh, H là tập các gia tử (hedge) còn “≤” là quan hệ cảm sinh ngữ
nghĩa trên X. Giả thiết trong G có chứa các phần tử hằng 0, 1, W với ý
nghĩa là phần tử bé nhất, phần tử lớn nhất và phần tử trung hòa (neutral) trong
X. Ta gọi mỗi giá trị ngôn ngữ x ∈ X là một hạng từ (term) trong ĐSGT.
Nếu tập X và H là các tập sắp thứ tự tuyến tính, khi đó AX = (X, G, H,
≤) là ĐSGT tuyến tính. Hơn nữa, nếu được trang bị thêm hai gia tử tới hạn là
∑ và Φ với ngữ nghĩa là cận trên đúng và cận dưới đúng của tập H(x) khi tác
động lên x, thì ta được ĐSGT truyến tính đầy đủ, ký hiệu AX = (X, G, H, ∑,
Φ, ≤). Vì trong luận án chỉ quan tâm đến ĐSGT tuyến tính, kể từ đây nói
ĐSGT cũng có nghĩa là ĐSGT tuyến tính.
Khi tác động gia tử h ∈ H vào phần tử x ∈ X, thì thu được phần tử ký
hiệu hx.
Với mỗi x ∈ X, ký hiệu H(x) là tập tất cả các hạng từ u ∈ X sinh từ x
bằng cách áp dụng các gia tử trong H và viết u = hn…h1x, với h, …, h1∈ H.
Tập H gồm các gia tử dương H+ và gia tử âm H-. Các gia tử dương làm
tăng ngữ nghĩa của một hạng từ mà nó tác động, còn gia tử âm làm giảm ngữ


16
nghĩa của hạng từ. Không mất tính tổng quát, ta luôn giả thiết rằng
H- = {h-1 < h-2 < ... < h-q} và H+ = {h1< h2< ... < hp}.
Để ý rằng biểu thức hn...h1u được gọi là một biểu diễn chính tắc của
một hạng từ x đối với u nếu x = hn...h1u và hi...h1u ≠ hi-1...h1u với i nguyên và
i ≤ n. Ta gọi độ dài của một hạng từ x là số gia tử trong biểu diễn chính tắc
của nó đối với phần tử sinh cộng thêm 1, ký hiệu l(x).
Ví dụ 1.2. Cho biến ngôn ngữ TRUTH, có G = {0, FALSE, W, TRUE,
1}, H- = { Possible < Little } và H+= { More < Very }. Khi đó
TRUE < More TRUE < Very TRUE, Little TRUE < TRUE,...

Bây giờ chúng ta xét một số tính chất của đại số gia tử tuyến tính. Định
lý sau cho thấy tính thứ tự ngữ nghĩa của các hạng từ trong ĐSGT.
Định lý 1.1. Cho tập H- và H+ là các tập sắp thứ tự tuyến tính của
ĐSGT AX = (X, G, H, ≤). Khi đó ta có các khẳng định sau:
(1) Với mỗi u ∈ X thì H(u) là tập sắp thứ tự tuyến tính.
(2) Nếu X được sinh từ G bởi các gia tử và G là tập sắp thứ tự tuyến
tính thì X cũng là tập sắp thứ tự tuyến tính. Hơn nữa nếu u < v, và u, v là độc
lập với nhau, tức là u H(v) và v H(u), thì H(u) ≤ H(v).
Định lý tiếp theo xem xét sự so sánh của hai hạng từ trong miền ngôn
ngữ của biến x.
Định lý 1.2. Cho x = hn…h1u và y = km…k1u là hai biểu diễn chính
tắc của x và y đối với u. Khi đó tồn tại chỉ số j ≤ min{n, m} + 1 sao cho
hj’ = kj’ với mọi j' < j (ở đây nếu j = min {n, m} + 1 thì hoặc hj là toán tử đơn
vị I, hj = I, j = n + 1 ≤ m hoặc kj= I, j = m + 1 ≤ n) và
(1) x < y khi và chỉ khi hjxj < kjxj, trong đó xj= hj-1...h1u.
(2) x = y khi và chỉ khi m = n và hjxj= kjxj.
(3) x và y là không so sánh được với nhau khi và chỉ khi hjxj và kjxj là
không so sánh được với nhau.


17
Trong phần tiếp theo, chúng ta trình bày một số vần đề của đại số gia tử
làm cơ sở cho việc nghiên cứu và phát triển một số mô hình lập luận
và ứng dụng về sau.
1.2.2 Vấn đề định lượng ngữ nghĩa trong đại số gia tử
Trong phần này chúng ta xem xét ba vấn đề cơ bản đó là độ đo
tính mờ của các giá trị ngôn ngữ (hạng từ), phương pháp định lượng ngữ
nghĩa và khoảng tính mờ của các khái niệm mờ.
Tính mờ của các giá trị ngôn ngữ xuất phát từ thực tế rằng một
giá trị ngôn ngữ mang ý nghĩa mô tả cho nhiều sự vật và hiện tượng trong

thế giới thực, với lý do tập hữu hạn các giá trị ngôn ngữ không đủ để phản
ánh thế giới vô hạn các sự vật hiện tượng. Như vậy khái niệm tính mờ và độ
đo tính mờ của một giá trị ngôn ngữ được hình thành và nó là một khái
niệm rất khó xác định, đặc biệt trong lý thuyết tập mờ. Tuy nhiên,
trong ĐSGT các tác giả đã cho thấy độ đo tính mờ được xác định một
cách hợp lý: “tính mờ của một hạng từ x được hiểu như là ngữ nghĩa của nó
vẫn có thể được thay đổi khi tác động vào nó bằng các gia tử”. Do đó, tập các
hạng từ sinh từ x bằng các gia tử sẽ thể hiện cho tính mờ của x và do đó, H(x)
có thể sử dụng như là một mô hình biểu thị tính mờ của x và kích
thước tập H(x) được xem như độ đo tính mờ của x. Ta có định nghĩa sau về
độ đo tính mờ.
Định nghĩa 14. Cho AX = (X, G, H, ∑, Φ, ≤) là một ĐSGT tuyến
tính đầy đủ. Ánh xạ fm : X → [0,1] được gọi là một đo tính mờ của các hạng
từ trong X nếu:
(1) fm là đầy đủ, tức là fm(c-) + fm(c+) =1 và ∑h∈H fm(hu) = fm(u),

∀u∈X;
(2) fm(x) = 0, với các x thỏa H(x) = {x}. Đặc biệt, fm(0) = fm(W) =
fm(1) = 0;


18
(3) ∀x,y ∈ X, h ∈ H,

fm( hx ) fm( hy )
, tỷ số này không phụ thuộc vào
=
fm( x )
fm( y )


x và y, vì vậy nó được gọi là độ đo tính mờ của các gia tử và được ký hiệu bởi
µ(h).
Trong đó, điều kiện (1) thể hiện tính đầy đủ của các phần tử sinh và các
gia tử cho việc biểu diễn ngữ nghĩa của miền thực đối với các biến. (2) thể
hiện tính rõ của các hạng từ và (3) có thể được chấp nhận vì chúng ta đã chấp
nhận giả thiết rằng các gia tử là độc lập với ngữ cảnh và, do vậy, khi áp dụng
một gia tử h lên các hạng từ thì hiệu quả tác động tương đối làm thay đổi ngữ
nghĩa của các hạng từ đó là như nhau. Các tính chất của độ đo tính mờ của
các hạng từ và gia tử được thể hiện qua mệnh đề sau:
Mệnh đề 1. Với độ đo tính mờ fm và µ đã được định nghĩa trong Định
nghĩa 14, ta có:
(1) fm(c-) + fm(c+) = 1 và ∑h∈H fm(hx) fm(x)



_1

(2)

j=_ q

µ(hj)= α ,


p

j=1

µ(hj) = β , với α, β > 0 và α + β = 1;


(3) ∑ x∈Xk fm(x) = 1, trong đó Xk là tập các hạng từ có độ dài đúng k;
(4) fm(hx) = µ(h).fm(x), và ∀x∈X, fm(∑x) = fm(Φx) = 0;
(5) Cho fm(c-), fm(c+) và µ(h) với ∀h∈H, khi đó với x = hn...h1 c ε , ε
∈ {-,+}, dễ dàng tính được độ đo tính mờ của x như sau:
fm(x) =µ(hn)...µ(h1)fm(c ε ).
True
Little
True

W

fm(MLTr)
fm(VLTr)

Poss.
True

More
True

fm(MTr)

fm(LLTr)

fm(PLTr)

fm(LittleTr)

Very
True

fm(PVTr)
fm(LVTr)

fm(PossTr))

1
fm(VVTr)

fm(MVTr)

fm(VeryTrue)

fm(True)
Hình 2: Độ đo tính mờ của biến TRUTH


19

Thông thường, ngữ nghĩa của các hạng từ thuần túy mang tính định
tính. Tuy nhiên, trong nhiều ứng dụng, chúng ta cần giá trị định lượng của các
hạng từ này cho việc tính toán và xử lý. Theo tiếp cận của tập mờ, việc định
lượng hóa các khái niệm mờ được thực hiện qua các phương pháp khử mờ.
Đối với ĐSGT, giá trị định lượng của các hạng từ được định nghĩa dựa trên
cấu trúc thứ tự ngữ nghĩa của miền giá trị của các biến ngôn ngữ, cụ thể là độ
đo tính mờ của các hạng từ và gia tử.
Trước hết chúng ta xét định nghĩa về dấu của các hạng từ như sau.
Định nghĩa 15. Một hàm dấu Sign: X → {-1,0,1} là một ánh xạ
được định nghĩa đệ qui như sau, trong đó h, h' ∈ H và c ∈ {c-, c+}:
(1) Sign(c-) = -1, Sign(c+) = 1;
(2) Sign(hc) = -Sign(c) nếu h âm đối với c; Sign(hc) = Sign(c)

nếu h dương đối với c;
(3) Sign(h'hx) = -Sign(hx), nếu h'hx ≠ hx và h' âm đối với h;
Sign(h'hx) = Sign(hx), nếu h'hx ≠ hx và h' dương đối với h;
(4) Sign(h'hx) = 0, nếu h'hx = hx.
Mệnh đề 2. Với bất kỳ h và x, nếu Sign(hx)=1 thì hx > x; nếu Sign (hx)=-1
thì hx < x và nếu hx = x thì hx = x.
Định nghĩa 16. Cho AX là một ĐSGT tuyến tính đầy đủ và fm là một
độ đo tính mờ trên X. Ta nói ánh xạ υ : X → [0,1] được cảm sinh bởi độ đo
tính mờ fm nếu được định nghĩa bằng đệ qui như sau:
(1) υ(W) = θ = fm(c-), υ(c-) = θ –α.fm(c-) = β.fm(c-), υ(c+) = θ +α.fm(c+);
Sign( j )μ(h ) fm( x) ω(h x)μ(h x) fm( x)
(2) υ(h j x) = υ( x) + Sign(h j x) ∑ij= Sign
( j) i
j
j


×