Tải bản đầy đủ (.doc) (75 trang)

Khai phá luật kết hợp mờ dựa trên đại số gia tử

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (613.81 KB, 75 trang )

ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

LÊ THỊ BÍCH THẢO

KHAI PHÁ LUẬT KẾT HỢP MỜ DỰA
TRÊN ĐẠI SỐ GIA TỬ

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Thái Nguyên - 2013


ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

LÊ THỊ BÍCH THẢO

KHAI PHÁ LUẬT KẾT HỢP MỜ DỰA
TRÊN ĐẠI SỐ GIA TỬ
Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

NGƯỜI HƯỚNG DẪN KHOA HỌC
TS.Trần Thái Sơn

Thái Nguyên - 2012



LỜI CAM ĐOAN
Tên tôi là : Lê Thị Bích Thảo
Sinh ngày 02 tháng 7 năm 1983
Học viên cao học lớp: K9B- trường Đại học CNTT&TT Thái Nguyên
Xin cam đoan : Đề tài luận văn“Khai phá luật kết hợp mờ dựa trên
đại số gia tử” do TS.Trần Thái Sơn hướng dẫn là công trình nghiên cứu của
riêng tôi. Tất cả tài liệu tham khảo đều có nguồn gốc, xuất xứ rõ ràng.
Tôi xin cam đoan tất cả những nội dung trong luận văn đúng như nội
dung trong đề cương và yêu cầu của thầy giáo hướng dẫn. Nếu sai tôi xin
hoàn toàn chịu trách nhiệm trước Hội đồng khoa học và trước pháp luật.
Thái Nguyên, tháng 01 năm 2013
Người cam đoan

Lê Thị Bích Thảo


LỜI CẢM ƠN
Trong quá trình làm luận văn vừa qua, dưới sự giúp đỡ và chỉ bảo nhiệt
tình của TS. Trần Thái Sơn – Viện Công nghệ thông tin – Viện khoa học Việt
Nam, luận văn của tôi đã được hoàn thành. Mặc dù đã cố gắng không ngừng
cùng với sự tận tâm của thầy hướng dẫn nhưng do thời gian và khả năng vẫn
còn hạn chế nên luận văn khó tránh khỏi những thiếu sót.
Để hoàn thành luận văn này, em xin bày tỏ lòng biết ơn sâu sắc đến TS
Trần Thái Sơn – Người thầy đã tận tình giúp đỡ em trong suốt quá trình làm
luận văn.
Em cũng xin bày tỏ lòng biết ơn đến ban lãnh đạo và các thầy giáo, cô
giáo trong Trường Đại học Công Nghệ Thông Tin & Truyền Thông Đại Học
Thái Nguyên đã giúp đỡ, tạo điều kiện tốt nhất cho em học tập và thực hiện
luận văn này.
Thái Nguyên, tháng 01 năm 2013

Tác giả

Lê Thị Bích Thảo


i
MỤC LỤC
LỜI CAM ĐOAN...............................................................................................iii
LỜI CẢM ƠN.....................................................................................................iv
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT............................................ii
DANH MỤC CÁC HÌNH ẢNH..........................................................................iii
............................................................................................................................iii
PHẦN MỞ ĐẦU...................................................................................................1
Chương 1..............................................................................................................4
LÝ THUYẾT CHUNG VỀTẬP MỜ VÀLÝTHUYÊT
́ ........................................4
ĐAỊ SỐGIA TỬ..................................................................................................4
1.1. Lýthuyêt́ chung về tập mờ ....................................................................4
1.2. Lôgic mờ...................................................................................................9
1.3. Biến ngôn ngữ........................................................................................13
1.4. Một số khái niệm cơ bản về Đại số gia tử........................................15
1.4.1. Đại số gia tử ..................................................................................................................16

1.4.2. Định nghĩa đại số gia tử ................................................................................................17

Chương 2............................................................................................................31
LUẬT KẾT HỢP TRONG KHAI PHÁ DỮ LIỆU.............................................31
2.1. Bài toán kinh điển dẫn đến việc khai phá luật kết hợp...................31
2.2. Khai phá luật kết hợp mờ:....................................................................36
Chương 3............................................................................................................38

ỨNG DUNG
̣
ĐAỊ SỐGIA TỬ GIAỈ BAÌ TOAN
́ KHAI PHÁDỮLIÊU
̣ .......38
3.1. Ưng
́ dung
̣ đaị sốgia tử trong khai phádữliêu.
̣ ...................................38
3.1.1.Tiếp cận Đại số gia tử trong khai phá dữ liệu: ................................................................38
3.1.2.Thuật toán trích xuất luật kết hợp từ cơ sở dữ liệu:......................................................40

*Ví dụ minh họa:..........................................................................................42
3.1.3.Thuật toán giải bài toán khai phá luật kết hợp mờ dựa trên đại số gia tử .....................48

3.2 .Bài toán...................................................................................................48
3.3. Xác định đầu vào, đầu ra của bài toán..............................................49
3.3.1. Thuật toán giải...............................................................................................................49
3.3.2.Chương trình thử nghiệm...............................................................................................49
3.3.3. Cài đặt chương trình......................................................................................................49
3.3.4.Giao diện của chương trình............................................................................................50

KẾT LUẬN.........................................................................................................52
TÀI LIÊU THAM KHẢO....................................................................................53
PHẦN PHỤ LỤC.................................................................................................55


ii
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
Các kí hiệu,

các chữ viết tắt
ĐSGT
α
β
AX, AT
AX
W

Ý nghĩa
Đại số gia tử
Tổng độ đo tính mờ của các gia tử âm
Tổng độ đó tính mờ của các gia tử dương
Đại số gia tử
Đại số gia tử tuyến tính đầy đủ
Phần tử trung hòa trong đại số gia tử


iii
DANH MỤC CÁC HÌNH ẢNH
Hình
Hình 1
Hình 2
Hình 3
Hình 4
Hình 5

Mô tả
Đồ thị biểu diễn hàm thuộc của tập mờ già (old)
Biểu diễn bộ 2
Độ đo tính mờ của biến TRUTH

Giao diện của chương trình
Kết quả thực hiện chương trình thử nghiệm


1
PHẦN MỞ ĐẦU
Trong những năm gần đây, việc nắm bắt được thông tin được coi là cơ
sở của mọi hoạt động sản xuất, kinh doanh. Cá nhân hoặc tổ chức nào thu
thập và hiểu được thông tin, và hành động dựa trên các thông tin được kết
xuất từ các thông tin đã có sẽ đạt được thành công trong mọi hoạt động.
Chính vì lý do đó, việc tạo ra thông tin, tổ chức lưu trữ và khai thác ngày càng
trở nên quan trọng và gia tăng không ngừng.
Sự tăng trưởng vượt bậc của các cơ sở dữ liệu (CSDL) trong cuộc sống
như: thương mại, quản lý và khoa học đã làm nảy sinh và thúc đẩy sự phát
triển của kỹ thuật thu thập, lưu trữ, phân tích và khai phá dữ liệu… không chỉ
bằng các phép toán đơn giản thông thường như: phép đếm, thống kê… mà đòi
hỏi cách xử lý thông minh hơn, hiệu quả hơn. Từ đó các nhà quản lý có được
thông tin có ích để tác động lại quá trình sản xuất, kinh doanh của mình… đó
là tri thức. Các kỹ thuật cho phép ta khai thác được tri thức hữu dụng từ
CSDL (lớn) được gọi là các kỹ thuật khai phá dữ liệu (DM – Data Mining).
Khai phá luật kết hợp là một nội dung quan trọng trong khai phá dữ liệu.
Luận văn trình bày một số vấn đề về phát hiện tri thức, khai phá dữ
liệu, tập trung vào vấn đề khai phá luật kết hợp và ứng dụng lý thuyết Đại số
gia tử trong khai phá luật kết hợp trên CSDL.
Khai phá dữ liệu, cụ thể là trích xuất các luật kết hợp từ cơ sở dữ liệu,
có xuất phát điểm từ bài toán nghiên cứu số liệu bán hàng trong siêu thị. Ở bài
toán này, số liệu được biểu diễn dưới dạng bảng hai chiều, trong đó các cột
thể hiện các loại mặt hàng (item), các hàng thể hiện các giao dịch
(transactions) đã được tiến hành, số 1 cho thấy mặt hàng được mua, số 0 chỉ
điều ngược lại. Từ bảng dữ liệu rất lớn này, người ta mong muốn rút ra được

các quy luật giúp cho quản lý, kiểu như "Nếu một người đã mua bánh mỳ và
bơ, khả năng người đó cũng mua giăm bông là rất cao". Luật có dạng như vậy


2
gọi là luật kết hợp và là hướng nghiên cứu quan trọng trong lĩnh vực khai phá
dữ liệu. Về sau, người ta thấy sẽ là rất không đầy đủ nếu chỉ xem xét các cơ
sở dữ liệu chỉ bao gồm các phần tử 0 và 1. Chẳng hạn, trong CSDL nhân sự
của một cơ quan có các mục như tuổi, thu nhập.. có giá trị trong miền số thực
rất rộng. Để trích xuất ra các luật kết hợp, một phương pháp thường được sử
dụng là chuyển số liệu trong CSDL đã cho về CSDL chỉ chứa các giá trị 0, 1
và áp dụng các kết quả đã có. Thí dụ, trong mục "tuổi", có thể chia ra các
miền "trẻ", "trung niên" và "già" với các miền giá trị tương ứng là [0,35],
[36,55], [56,80] và nếu một giá trị của CSDL ban đầu rơi vào miền giá trị nào
thì ta ghi 1 cho vị trí tương ứng trong CSDL chuyển đổi, ngược lại gán giá trị
0. Phương pháp này đơn giản về mặt thực thi nhưng có thể gây băn khoăn do
ranh giới cứng mà người ta đưa ra khi tiến hành chuyển đổi. Chẳng hạn hai
người tuổi 35 và 36 tuy rất gần nhau về mặt tuổi tác nhưng lại thuộc hai lớp
khác nhau là "trẻ" và "trung niên", dẫn tới việc đưa ra những luật kết hợp có
thể thiếu tính chính xác. Và người ta sử dụng cách tiếp cận mờ để khắc phục
điều này, theo đó, một giá trị bất kỳ của CSDL ban đầu không chuyển đổi về
giá trị 0 hoặc 1 như trên mà sẽ chuyển về một tập giá trị thực thuộc đoạn
[0,1], là độ thuộc của giá trị đã cho vào các tập mờ được xác định trước. Thí
dụ, người tuổi 35 trong ví dụ trên, ở CSDL đã chuyển đổi sẽ nhận tập giá trị
(trẻ, 0,8), (trung niên, 0,6), (già, 0,1). Phương pháp này, tuy dẫn tới việc xử lý
phức tạp hơn nhưng dễ chấp nhận hơn về mặt trực quan và hiện đang được
nhiều nhà nghiên cứu quan tâm. Mặc dù vậy, theo ý chúng tôi, phương pháp
trích xuất luật kết hợp mờ vẫn có một số điểm yếu cần khắc phục. Đó là sự
phụ thuộc chủ quan rất lớn vào việc lựa chọn các hàm thuộc cho các tập mờ
dẫn đến việc xử lý vừa phức tạp vừa có thể thiếu chính xác. Trong bài báo này

chúng tôi trình bày việc giải bài toán trích xuất luật kết hợp mờ theo cách tiếp
cận của Đại số gia tử, ở đó các giá trị độ thuộc mờ sẽ nhận được thông qua


3
các giá trị định lượng ngữ nghĩa, được xác định dựa trên các kết quả nghiên
cứu lý thuyết về ĐSGT đã có từ trước.
Luận văn có bố cục như sau:
Chương 1: Lý thuyết chung về tập mờ và lý thuyết đại số gia tử
Trong chương này trình bày những kiến thức cơ bản về lý thuyết tập
mờ, và một số khái niệm cơ bản về đại số gia tử.
Chương 2: Khai phá luật kết hợp mờ dựa trên đại số gia tử
Trong chương này trình bày luật kết hợp mờ, thuật toán khai phá luật
kết hợp mờ dựa trên đại số gia tử.
Chương 3 : Ứng dụng ĐSGT giải bài toán khai phá dữ liệu
Trong chương này trình bày bài toán, thuật toán và cách giải bài toán
khái phá luật kết hợp mờ dựa trên đại số gia tử bằng cách sử dụng giá trị định
lượng ngữ nghĩa của các hạng từ trong đại số gia tử.


4
Chương 1
LÝ THUYẾT CHUNG VỀ TẬP MỜ VÀ LÝ THUYẾT
ĐẠI SỐ GIA TỬ
1.1. Lý thuyết chung về tập mờ
Là người khởi xướng cho lý thuyết tập mờ, L. A. Zadeh đã có rất nhiều
nghiên cứu mở đường cho sự phát triển và ứng dụng [14]. Ý tưởng nổi bật của
Zadeh là từ những khái niệm trừu tượng về ngữ nghĩa của thông tin mờ,
không chắc chắn như trẻ-già, nhanh-chậm, cao-thấp,… ông đã tìm cách biểu
diễn chúng bằng một khái niệm toán học, được gọi là tập mờ và được định

nghĩa như sau.
Định nghĩa 1. [14] Cho một tập vũ trụ U với các phần tử ký hiệu bởi x,
U={x}. Một tập mờ A trên U là tập được đặc trưng bởi một hàm µA(x) mà nó
liên kết mỗi phần tử x∈U với một số thực trong đoạn [0,1]. Giá trị hàm µA(x)
biểu diễn mức độ thuộc của x trong A. µA(x) là một ánh xạ từ U vào [0,1] và
được gọi là hàm thuộc của tập mờ A.
Như vậy, giá trị hàm µA(x) càng gần tới 1 thì mức độ thuộc của x trong A
càng cao. Khi A là một tập hợp kinh điển, hàm thuộc của nó, µA(x), chỉ nhận 2
giá trị 1 hoặc 0, tương ứng với x có nằm trong A hay không. Rõ ràng, tập mờ
là sự mở rộng của khái niệm tập hợp kinh điển. Các khái niệm, phép toán
trong lý thuyết tập kinh điển cũng được mở rộng cho các tập mờ.
Họ tất cả các tập mờ trên miền cơ sở U là không gian các hàm từ U vào
đoạn [0,1], tức là

F (U ,[0,1])

= {µA : U→[0,1]}, một không gian tương đối

giàu về cấu trúc tính toán mà nhiều nhà nghiên cứu đã sử dụng cho việc mô
phỏng các phương pháp suy luận của con người.
Chúng ta có thể biểu diễn tập mờ bằng các cách sau, tùy theo tập U là
hữu hạn, đếm được hay vô hạn liên tục:


5
- Trường hợp U hữu hạn, U={ui : 1≤ i ≤ n}, ta có thể viết
A = µA(u1)/u1 + µA(u2)/u2 + … + µA(un)/un = ∑1≤ i ≤n µA(ui)/ui
- Trường hợp U vô hạn đếm được, U={ui : i=1,2,… }, ta viết
A = ∑1≤ i <∞ µA(ui)/ui
- Trường hợp U vô hạn liên tục, U=[a,b], ta viết

b

A=

∫ µ (u ) / u
A

a

Sau đây ta định nghĩa một số khái niệm đặc trưng liên quan đến tập mờ.
Định nghĩa 2. [1] Cho một tập mờ A trên tập vũ trụ U và α∈[0,1]. Tập
lát cắt α của A là một tập kinh điển, ký hiệu Aα, được xác định như sau :
Aα = {u ∈ U : µA(u)≥α}.
Tập Aα còn gọi là tập mức α của A.
Định nghĩa 3. [1] Cho một tập mờ A trên tập vũ trụ U,
i) Giá của tập mờ A, ký hiệu support(A), là tập con của U trên đó

µA(u)≠0, tức là support(A) = {u ∈ U : µA(u)≥0}.
ii) Độ cao của tập mờ A, ký hiệu high(A), là cận trên đúng của hàm
thuộc µA(u) trên U, tức là high(A) = sup{µA(u) : u∈U}.
iii) A được gọi là tập mờ chuẩn nếu high(A)=1. Ngược lại gọi là tập
mờ dưới chuẩn.
iv) Lõi của tập mờ A, ký hiệu core(A), là một tập con của U được
xác định như sau:
core(A) = {u∈U : µA(u) = high(A)}.
Định nghĩa 4. [1] Cho một tập mờ A trên tập vũ trụ U,
i) Lực lượng vô hướng hay bản số của tập mờ A, ký hiệu count(A),
được xác định là:
count(A) = ∑u∈U µA(u), nếu U là hữu hạn hay đếm được,



6
= ∫U µA(u)du, nếu U là vô hạn liên tục.
ii) Lực lượng mờ hay bản số mờ của tập mờ A, ký hiệu card(A), là
một tập mờ trên tập các số nguyên không âm N, được xác định như sau:
card(A) = ∫N µcard(A)(n)dn , trong đó, µcard(A)(n) được xác
định theo công thức sau, với |Aα| là lực lượng tập mức Aα,

µcard(A)(n) = sup{t∈[0,1] : |Aα| = n}.
Ví dụ 1. Cho tập vũ trụ chỉ tuổi tính chẵn năm U={u : 0≤ u ≤120}, A là
một tập mờ chỉ tuổi già (old) được xác định bởi hàm thuộc sau (hình 1):
u ∈ [0, 60]
0
µold (u ) = 

2

1
(1 + ( u −660 ) ) u ∈ [61,120]

Khi đó tập mức α=0.5 của A là A0.5 = {u : 66≤ u ≤120} ;
support(A) = {u : 61≤ u ≤120} ; high(A) = 1.01-1; core(A) = {120}.

Hình 1. Đồ thị biểu diễn hàm thuộc của tập mờ già (old)
Tiếp theo chúng ta định nghĩa một số phép toán cơ bản trên tập mờ, các
phép này làm cơ sở cho việc phát triển lôgíc mờ sau này.
Định nghĩa 5. [1,14] Cho hai tập mờ A và B trên tập nền U có hàm
thuộc tương ứng là µA và µB, ba phép toán cơ bản là hợp, giao của hai tập mờ
và lấy phần bù của tập mờ A là một tập mờ C, được viết là
C = A ∪ B, hoặc C = A ∩ B, hoặc C = A~ với hàm thuộc được xác

định như sau:

µA∪B(u) = max(µA(u), µB(u)), ∀u ∈ U,
µA∩B(u) = min(µA(u), µB(u)), ∀u ∈ U,


7

µA~(u) = 1- µA(u), ∀u ∈ U.
Hay viết ở dạng thu gọn là

µA∪B(u) = µA(u) ∨ µB(u)),
µA∩B(u) = µA(u) ∧ µB(u)).
Ví dụ 2. [1] Xét tập nền U = {1,2,3,4,5,6,8,9,10,11} là tập các giá trị
trong thang điểm 10 đánh giá kết quả học tập của học sinh. Hai tập mờ G và
K tương ứng là hai khái niệm mờ về năng lực học giỏi và học kém, với hàm
thuộc được cho dưới dạng bảng như sau:
u∈U
µG(u

1
2
3
4
5
6
7
8
9
0.0 0.0 0.0 0.1 0.3 0.5 0.7 0.9 1.0


10
1.0

)
µK(u

1.0 0.9 0.8 0.6 0.4 0.2 0.0 0.0 0.0

0.0

)
Ta có kết quả của các phép toán trên hai tập mờ này với hàm thuộc thể
hiện trong bảng sau:
1
2
3
4
5
6
7
8
9
10
u∈U
µG∪K(u) 0.0 0.0 0.0 0.6 0.5 0.5 0.7 0.9 1.0 1.0
µG∩K(u) 0.0 0.0 0.0 0.1 0.3 0.2 0.0 0.0 0.0 0.0
µG~(u) 1.0 1.0 1.0 0.9 0.7 0.5 0.3 0.1 0.0 0.0
Một lớp đặc biệt các tập mờ là lớp các quan hệ mờ, chúng là các tập mờ
trên không gian tích Đề-các các miền cơ sở. Như tên gọi, quan hệ mờ mô tả

mối quan hệ mờ giữa các đối tượng trong miền cơ sở. Về mặt hình thức chúng
ta định nghĩa quan hệ mờ như sau.
Định nghĩa 6. [1] Cho U là tích Đề-Các của n miền cơ sở Ui, i=1, ,…, n.
Khi đó mỗi một tập mờ trên U được gọi là một quan hệ mờ n-ngôi và được kí
hiệu là R, gọi là tên của quan hệ đó, và nó được biểu thị bằng công thức sau:
R=∫

U1 ×...×U n

µ (u1 ,..., u1 ) / (u1 ,..., u1 )


8
Trong đó µ(u1,…,un) là hàm thuộc của tập mờ R. Dấu ∫ biểu diễn hình
thức của hàm thuộc, có thể một trong ba trường hợp là hữu hạn hoặc đếm
được hoặc liên tục.
Quan hệ mờ cũng có các phép tính cơ bản như trên tập mờ vì bản thân
nó cũng là tập mờ. Ngoài ra, quan hệ mờ có những phép tính đặc thù riêng mà
trên tập mờ không có, đó là phép hợp thành dưới đây.
Định nghĩa 7. [1] Cho R là một quan hệ mờ trên U×V và S là quan hệ
mờ trên V×W. Khi đó, phép hợp thành của hai quan hệ này là một quan hệ
trên U×W, được ký hiệu là R°S và được định nghĩa như sau:
R°S = ∫∨v∈V [µR(u,v)°µS(v,w)]/(u,w)
Trong đó ° là một phép tính 2 ngôi trong [0,1] có tính giao hoán, kết hợp
và phân phối đối với phép max ∨. Nếu ° là phép min ∧, thì ta có phép hợp
thành max-min, nếu ° là phép nhân số học thì ta có phép hợp thành maxproduct.
Ví dụ 3. Cho U = {u1, u2, u3}, V = {v1, v2} và W = {w1, w2}, với quan hệ
mờ R trên U×V và S trên V×W được cho hàm thuộc dưới dạng ma trận
v1


v2

w1
w2
u1  0.4 1 
v1  0.2 0.8


R = u2  1 0.3 và S = 
v2 0.7 0.1
u3  0.7 0.8
w1

w2

u1 0.7 1 
khi đó phép hợp thành max-min là R o S = u2  0.3 0.8  ,


u3 0.7 0.7 
w1

w2

u1  0.8 0.32 
và max-product là R o S = u2  0.21 0.8  .


u3 0.56 0.56 


Phép hợp thành các quan hệ mờ đóng vai trò quan trọng trong quá trình
lập luận xấp xỉ sau này.


9
Trong hầu hết các ứng dụng, tri thức được biểu diễn dưới dạng luật “ifthen” và mỗi luật được xem như một quan hệ mờ
Chúng ta thấy rằng lý thuyết tập mờ với mục tiêu mô hình hóa toán học
ngữ nghĩa của các khái niệm mờ và, hơn nữa, mô hình hóa cách lập luận của
con người. Tuy nhiên, những vấn đề này thuộc loại có cấu trúc yếu, khó có
thể có một cấu trúc toán duy nhất mô hình hóa trọn vẹn những vấn đề đó
1.2. Lôgic mờ
Cùng với khái niệm biến ngôn ngữ, L. A. Zadeh đã phát triển lôgic mờ
mà các giá trị chân lý nhận trong T(Truth) = {true, very true, more false,
possible false, very very false,…}, tập các giá trị của biến ngôn ngữ Truth.
Khi đó, một mệnh đề dạng “X is A”, với A là một khái niệm mờ, sẽ có giá trị
chân lý thuộc T(Truth) và được biểu thị bởi một tập mờ có hàm thuộc µA trên
không gian tham chiếu U.
Lý thuyết tập mờ là cơ sở toán học cho việc phát triển các phương pháp
mô phỏng lập luận của con người. Về nguyên tắc, vấn đề tư duy, lập luận của
con người rất phức tạp và do đó không thể sử dụng một cấu trúc toán học duy
nhất để mô phỏng. Vì vậy, mục tiêu của chúng ta là càng xây dựng được
nhiều cấu trúc đại số các tập mờ càng tốt để linh hoạt trong tiếp cận các vần
đề ứng dụng. Ở đây, chúng ta sẽ định nghĩa một họ các cặp đối ngẫu t-norm
và t-conorm cùng với phép phủ định làm cơ sở cho lôgic mờ và lập luận xấp
xỉ.
Định nghĩa 8 [1] Một hàm 2-biến T : [0,1]×[0,1] → [0,1] được gọi là
phép t-norm nếu nó thỏa các tính chất sau với ∀a,a’,b,c ∈[0,1]:
i) Tính chất điều kiện biên:

T(a,1) = a


ii) Tính giao hoán:

T(a,b) = T(b,a)

iii) Tính đơn điệu:

a ≤ a’ ⇒ T(a,b) ≤ T(a’,b)

iv) Tính kết hợp:

T(a,T(b,c)) = T(T(a,b),c)


10
Ngoài ra, một số tính chất khác cần đòi hỏi phải có trong nhiều ứng dụng
đối với phép t-norm bao gồm:
v) Tính liên tục:

T là hàm hai biến liên tục

vi) Tính lũy đẳng dưới:

T(a,b) < a

vii) Tính đơn điệu chặt:

a ≤ a’ và b ≤ b’ ⇒ T(a,a’) <

T(b,b’)

Định nghĩa 9 [1] Một hàm 2-biến S : [0,1]×[0,1] → [0,1] được gọi là
phép t-conorm nếu nó thỏa các tính chất sau với ∀a,a’,b,c ∈[0,1]:
i) Tính giới nội:

S(a,0) = a

ii) Tính giao hoán:

S(a,b) = S(b,a)

iii) Tính đơn điệu:

a ≤ a’ ⇒ S(a,b) ≤ S(a’,b)

iv) Tính kết hợp:

S(a,S(b,c)) = S(S(a,b),c)

Như vậy, chỉ có hai tính chất điều kiện biên và giới nội làm nên sự khác
biệt giữa hai họ phép tính t-norm và t-conorm.
Chúng ta cũng có thể mở rộng định nghĩa cho phép t-norm và t-conorm
này đối với trường hợp nhiều biến vào, tức là Tex : [0,1]n → [0,1] và Sex : [0,1]n
→ [0,1], bằng cách áp dụng liến tiếp các phép t-norm và t-conorm ở trên.
Định nghĩa 10 [1] Hàm N : [0,1] → [0,1] được gọi là phép phủ định
(negation) nếu nó thỏa các tính chất sau với ∀a,a’ ∈[0,1]:
i) Tính đơn điệu giảm:
iv) Tính lũy đẳng:

a ≤ a’ ⇒ N(a) ≥ N(a’)


N(N(a)) = a

Ví dụ 4: Các phép t-norm, t-conorm và phép phủ định hay được sử dụng
như:
TM(a,b) = min{a,b}
TP(a,b) = a.b
TL(a,b) = max{0,a+b-1}


11
a

T (a, b) = b
0

*

khi b = 1
khi a = 1
khi a ≠ 1& b ≠ 1

SM(a,b) = max{a,b}
SP(a,b) = a+b-a.b
SL(a,b) = min{1,a+b}
a

S ( a , b ) = b
0

*


khi b = 0
khi a = 0
khi a ≠ 0 & b ≠ 0

N(a) = 1-a.
Định nghĩa 11 [1] Ba phép tính t-norm T, t-conorm S và phép phủ định
N được gọi là một hệ đối ngẫu (T,S,N) nếu chúng thỏa điều kiện sau:
N(S(a,b)) = T(N(a),N(b)), ∀a,b∈[0,1].
Việc áp dụng các phép t-norm, t-conorm và phép phủ định cho việc tính
toán các toán tử hội, tuyển và phủ định trong lôgic mờ làm tăng tính mềm dẻo
trong ứng dụng. Thực vậy, khi hai mệnh đề “X is A” và “X is B” có giá trị
chân lý được biểu thị bởi hai hàm thuộc tương ứng µA và µB trên không gian
tham chiếu U và V thì mệnh đề mờ “X is A and B” có hàm thuộc biểu thị giá
trị chân lý là µA∩B = T(µA,µB), với T là một t-norm nào đó. Tương tự, mệnh đề
“X is A or B” có hàm thuộc là µA∪B = S(µA,µB) và mệnh đề “X is not A” có hàm
thuộc là µ~A = N(µA), ở đây S là một t-conorm và N là một phép phủ định được
chọn nào đó.
Các mệnh đề mờ cùng với giá trị chân lý của chúng là những đối tượng
nghiên cứu chính của lôgíc mờ. Trong đó, một dạng mệnh đề mờ thường biểu
diễn cho tri thức dạng luật trong lập luận xấp xỉ và ứng dụng, đó là mệnh đề
mờ có điều kiện dạng “If X is A then Y is B” và được biểu diễn bằng toán tử
kéo theo mờ.


12
Ở đây, một cách tổng quát, chúng ta đưa ra một số tính chất cho một
phép kéo theo mờ.
Định nghĩa 12 [1] Phép kéo theo là một hàm số I : [0,1]2 → [0,1] có các
tính chất sau:

i) Tính đơn điệu giảm đối với biến thứ nhất
x ≤ z ⇒ I(x,y) ≥ I(z,y), ∀y∈[0,1]
ii) Tính đơn điệu tăng đối với biến thứ hai
y ≤ u ⇒ I(x,y) ≤ I(x,u), ∀x∈[0,1]
iii) Tính chi phối của giá trị chân lý sai
I(0,x) = 1
iv) Tính trung tính của giá trị chân lý đúng
I(1,x) = x
v) Tính đồng nhất
I(x,x) = x
vi) Tính chất hoán đổi
I(x,I(y,z)) = I(y,I(x,z))
vii) Tính chất về điều kiện giới nội
I(x,y) = 1 nếu và chỉ nếu x ≤ y
viii) Tính chất khái quát hóa của phép kéo theo kinh điển
I(x,y) = I(N(y),N(x)), trong đó N là phép phủ định
ix) I là hàm liên tục theo cả hai biến.
Rõ ràng mệnh đề điều kiện ở dạng “If X is A then Y is B” thể hiện mối
quan hệ giữa hai khái niệm mờ A và B. Vì vậy, chúng cảm sinh một quan hệ
mờ R thể hiện bởi một tập mờ trên không gian tích Đề-Các U×V được xác
định bởi hàm thuộc thông qua một phép kéo theo được chọn.
Ví dụ 5. Một số dạng phép kéo theo thường dùng
Mamdani


13
I(x,y) = min{x,y}
Dạng khái quát từ phép kéo theo kinh điển
I(x,y) = S(N(x),y), hoặc
I(x,y) = S(N(x),T(x,y)), hoặc

I(x,y) = S(T(N(x),N(y)),y), với T, S và N là các phép
t-norm, t-conorm và phép phủ định.
Reichenbach
I(x,y) = 1-x+x.y
Lukasiewicz
I(x,y) = min{1, 1-x+y}.
Định lý sau đây cho chúng ta xem xét liệu phép kéo theo như thế nào sẽ
thỏa mãn tất cả các tính chất trong định nghĩa 12.
Định lý 1. [1] Một hàm 2-biến I : [0,1]2 → [0,1] thỏa các tính chất từ i)
đến ix) trong định nghĩa 12 nếu và chỉ nếu có tồn tại một hàm liên tục đơn
điệu tăng thực sự f : [0,1] → [0,+∞) sao cho f(0) = 0 và
I(x,y) = f-1(f(1)-f(x)+f(y)), với ∀x,y ∈ [0,1], và
N(x) = f-1(f(1)-f(x)), với ∀x ∈[0,1].
Tuy nhiên, bản chất ngữ nghĩa của phép kéo theo mờ trong lập luận của
con người rất phức tạp, khó có một hệ tiên đề chung cho mọi tình huống. Vì
vậy, các tính chất ở định nghĩa 12 không bắt buộc mọi phép kéo theo mờ đều
phải thỏa mãn. Hơn nữa, cũng không có quyền đặt ra các yêu cầu về một tính
chất nào đó khác mà một phép kéo theo cần phải có. Chỉ có ứng dụng thực
tiễn là tiêu chuẩn cuối cùng chứng minh tính phù hợp của một định nghĩa
phép kéo theo mờ.
1.3. Biến ngôn ngữ
Trong [14], L. A. Zadeh đã viết “Khi thiếu hụt tính chính xác bề ngoài
của những vấn đề phức tạp cố hữu, một cách tự nhiên là tìm cách sử dụng


14
các biến ngôn ngữ, đó là các biến mà giá trị của chúng không phải là số mà
là các từ hoặc các câu trong ngôn ngữ tự nhiên hoặc nhân tạo. Động lực cho
việc sử dụng các từ, các câu hơn các số là ở chỗ đặc trưng ngôn ngữ của các
từ và các câu thường ít xác định cụ thể hơn của các số”. và ông đã đưa ra một

lớp khái niệm rộng hơn có thể mô hình qua các tập mờ, đó là biến ngôn ngữ.
Định nghĩa 13. [14] Biến ngôn ngữ là một bộ năm (X,T(X),U,R,M),
trong đó X là tên biến, T(X) là tập các giá trị ngôn ngữ của biến X, U là không
gian tham chiếu hay còn gọi là miền cơ sở của biến X, R là một quy tắc ký
pháp sinh các giá trị ngôn ngữ cho T(X), M là quy tắc gán ngữ nghĩa biểu thị
bằng tập mờ trên U cho các từ ngôn ngữ trong T(X).
Ví dụ 6 Cho X là biến ngôn ngữ có tên AGE, miền tham chiếu của X là
U=[0,120]. Tập các giá trị ngôn ngữ T(AGE)={very old, old, possible old, less
old, less young, quite young, more young,…}. Chẳng hạn với giá trị ngôn ngữ
old, quy tắc gán ngữ nghĩa M cho old bằng tập mờ cho bởi ví dụ 1
M(old) = {(u,µold(u)) : u∈[0,120]}.
Chúng ta thấy rằng một biến ngôn ngữ được cấu trúc theo hướng mà
trong đó có hai quy tắc cơ bản. Thứ nhất là quy tắc cú pháp, qui định cách
thức để sinh các giá trị ngôn ngữ. Thứ hai là quy tắc ngữ nghĩa, qui định thủ
tục tính toán ngữ nghĩa của các giá trị ngôn ngữ. Ngoài các giá trị sinh
nguyên thủy, các giá trị ngôn ngữ có thể gồm các từ liên kết như and, or, not,
… và các gia tử ngôn ngữ như very, possible, less, quite, more,….Zadeh cũng
nêu ra một vài thí dụ về cách sinh ra các hàm thuộc từ các hàm thuộc đã có
như nếu A là nhãn ngôn ngữ mờ có hàm thuộc là μ A thì veryA có hàm thuộc
là (μA)2 còn lessA có hàm thuộc là căn bặc hai của μA...
Trong thực tế có nhiều biến ngôn ngữ khác nhau về giá trị sinh nguyên
thủy, tuy nhiên cấu trúc miền giá trị của chúng tồn tại một “đẳng cấu” sai


15
khác nhau bởi giá trị sinh nguyên thủy này. Đây gọi là tính phổ quát của biến
ngôn ngữ.
Khác với giá trị nguyên thủy của các biến ngôn ngữ phụ thuộc vào ngữ
cảnh, ngữ nghĩa của các gia tử và các từ liên kết hoàn toàn độc lập với ngữ
cảnh. Đây là tính độc lập ngữ cảnh của gia tử và liên kết.

Chúng ta thấy rằng lý thuyết tập mờ với mục tiêu mô hình hóa toán học
ngữ nghĩa của các khái niệm mờ và hơn nữa mô hình hóa cách lập luận của
con người. Tuy nhiên, những vấn đề này thuộc loại có cấu trúc yếu, khó có
thể có một cấu trúc toán duy nhất mô hình hóa trọn vẹn những vấn đề đó.
1.4. Một số khái niệm cơ bản về Đại số gia tử
Để xây dựng phương pháp luận tính toán nhằm giải quyết vấn đề mô
phỏng các quá trình tư duy, suy luận của con người chúng ta phải thiết lập ánh
xạ: gán mỗi khái niệm mờ một tập mờ trong không gian tất cả các hàm
F(U, [0, 1]). Nghĩa là ta mượn cấu trúc tính toán rất phong phú của tập để mô
phỏng phương pháp lập luận của con người thường vẫn được thực hiện trên
nền ngôn ngữ tự nhiên.
Vậy một vấn đề đặt ra là liệu bản thân ngôn ngữ có cấu trúc tính toán không?
Nếu có thì các phương pháp lập luận xây dựng trên đó đem lại những lợi ích
gì? Thông qua lý thuyết về đại số gia tử ta có thể thấy rằng tập các giá trị của
một biến ngôn ngữ (biến mà giá trị của nó được lấy trong miền ngôn ngữ) là
một cấu trúc đại số đủ mạnh để tính toán.
Lý thuyết đại số gia tử đã cố gắng nhúng tập ngôn ngữ vào một cấu trúc đại
số thích hợp và tìm cách xem chúng như là một đại số để tiên đề hóa sao cho
cấu trúc thu được mô phỏng tốt ngữ nghĩa ngôn ngữ.


16
1.4.1. Đại số gia tử
Xét một tập giá trị ngôn ngữ là miền của biến ngôn ngữ (linguistic
domain) của biến chân lý TRUTH gồm các từ sau:
T = dom(TRUTH) = {true, false, very true, very false, more true, more
false, approximately true, approximately false, little true, little false, less true,
less false, very more true, very more false, very possible true, very possible
false, very more true, very more false, …}
Khi đó miền ngôn ngữ T = dom (TRUTH) có thể biểu thị như là một

cấu trúc đại số AT = (T, G, H, ≤), trong đó:
- T: Là tập cơ sở của AT.
- G: Là tập các từ nguyên thủy (tập các phần tử sinh: true, false).
- H: Là tập các toán tử một ngôi, gọi là các gia tử (các trạng từ nhấn).
- ≤: Là biểu thị quan hệ thứ tự trên các từ (các khái niệm mờ), nó được
“cảm sinh” từ ngữ nghĩa tự nhiên. Ví dụ: dựa trên ngữ nghĩa, các quan hệ thứ
tự sau là đúng: false≤ true, more true ≤ very true, very false ≤ more false,
possible true ≤ true, false ≤ possible false, …
Ta luôn giả thiết rằng các gia tử trong H là các toán tử thứ tự, nghĩa là
(∀h ∈ H, h: T → T), (∀x ∈ T) {hx ≤ x hoặc hx ≥ x}. Hai gia tử h, k ∈ H
được gọi là ngược nhau nếu (∀x ∈ T) {hx ≤ x khi và chỉ khi kx ≥ x} và
chúng được gọi là tương thích nhau nếu (∀x ∈ T) {hx ≤ x khi và chỉ khi kx ≤
x}.
Ta ký hiệu h ≥ k nếu h, k tương thích nhau và (∀x ∈ T) {hx ≤ kx ≤ x
hoặc hx ≥ kx ≥ x}.
Ngoài ra, tập H còn có thể được phân hoạch thành hai tập H+ và H- với
các gia tử trong tập H+ hay H- là tương thích nhau, mỗi phần tử trong H+
cũng ngược với bất kỳ phần tử nào trong H- và ngược lại.


17
Giả sử trong tập H+ có phần tử V (ngầm định là very – rất) và trong tập
H- có phần tử L (ngầm định là less – ít) là phần tử lớn nhất thì phần tử sinh g
∈ G là dương nếu g ≤ Vg và là âm nếu g ≥ Vg (hoặc g ∈ G là âm nếu g ≥ Lg
và là âm nếu g ≤ Lg).
Một gia tử h dương (hoặc âm) đối với một gia tử k nếu (∀x ∈ T) {hkx ≤
kx ≤ x hoặc hkx ≥ kx ≥ x} (hoặc (∀x ∈ T) { kx ≤ hkx ≤ x hoặc kx ≥ hkx ≥ x}).
T được sinh ra từ G bởi các gia tử trong H. Như vậy mỗi phần tử của T
sẽ có dạng biểu diễn là x = hnhn-1h…h1u, u ∈ G.
Tập tất cả các phần tử được sinh ra từ phần tử x có dạng biểu diễn là H(x).

Nếu G chỉ có đúng 2 từ nguyên thủy mờ, thì một được gọi là phần tử
sinh dương ký hiệu là t, một được gọi là phần tử sinh âm ký hiệu là f và ta có
f < t (Trong ví dụ trên, t tương ứng với true là dương, còn f tương ứng với
false là âm).
1.4.2. Định nghĩa đại số gia tử
Một cấu trúc đại số AT = (T, G, H, ≤) với H được phân hoạch thành
H+ và H- các gia tử ngược nhau được gọi là một đại số gia tử nếu nó thỏa
mãn các tiên đề sau:
(1) Mỗi gia tử hoặc là dương hoặc là âm đối với bất kỳ một gia tử nào
khác, kể cả với chính nó.
(2) Nếu hai khái niệm u và v là độc lập nhau, nghĩa là u∉H(v) và
v∉H(u), thì (∀x∈H(u)) {x∉H(v)}. Ngoài ra nếu u và v là không
sánh được thì bất kỳ x∈H(u) cũng không sánh được với bất kỳ
y∈H(v). (H(u) là tập các giá trị được sinh ra do tác động của các
gia tử của H vào u).
(3) Nếu x ≠ hx thì x∉H(hx) và nếu h ≠ k và hx ≤ kx thì h’hx ≤ k’kx, với
mọi gia tử h, k, h’ và k’. Hơn nữa nếu hx ≠ kx thì hx và kx là độc
lập.


18
(4) Nếu u∉H(v) và u ≤ v (hoặc u ≥ v) thì u ≤ hv (hoặc u ≥ hv) đối với
mọi gia tử h.
Xét đại số gia tử AT có đúng 3 phần tử sinh: dương, âm và một phần
tử trung hòa w nằm giữa hai phần tử sinh kia và có tính chất hw = w, với
mọi h∈H. Một phần tử y được gọi là phần tử đối nghịch của phần tử x nếu
có tồn tại một biểu diễn của x có dạng x = h n…h1g, w ≠ g ∉ G, sao cho y =
hn…h1g’, với w ≠ g’∈G và g’ ≠ g (nói cách khác: hai phần tử của đại số
gia tử được gọi là đối nghịch nhau nếu chúng có dạng biểu diễn với cùng
một dãy các gia tử nhưng phần tử sinh của chúng khác nhau, một cái là

dương và một cái là âm).
Đặc biệt phần đối nghịch của w được định nghĩa chính là w. Phần tử
đối nghịch của x được ký hiệu là –x với chỉ số nếu cần thiết. Nhìn chung
một phần tử có thể có nhiều phần tử đối nghịch.
Nếu mỗi phần tử của T chỉ có duy nhất một phần tử đối nghịch thì
AT được gọi là đại số gia tử đối xứng.
1.4.2.1. Một số tính chất của đại số gia tử
Định lý sau cho thấy tính thứ tự ngữ nghĩa của các hạng từ trong ĐSGT.
Định lý 2. Cho tập H- và H+ là các tập sắp thứ tự tuyến tính của ĐSGT
AX = (X, G, H, ≤). Khi đó ta có các khẳng định sau:
(1) Với mỗi u ∈ X thì H(u) là tập sắp thứ tự tuyến tính.
(2) Nếu X được sinh từ G bởi các gia tử và G là tập sắp thứ tự tuyến tính
thì X cũng là tập sắp thứ tự tuyến tính. Hơn nữa nếu u < v, và u, v là độc lập
với nhau, tức là u ∉ H(v) và v ∉ H(u), thì H(u) ≤ H(v).
Định lý tiếp theo xem xét sự so sánh của hai hạng từ trong miền ngôn
ngữ của biến X.


×