Tải bản đầy đủ (.pdf) (80 trang)

Khai phá luật kết hợp mờ dựa trên đại số gia tử

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.04 MB, 80 trang )



Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên




ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG





LÊ THỊ BÍCH THẢO




KHAI PHÁ LUẬT KẾT HỢP MỜ DỰA
TRÊN ĐẠI SỐ GIA TỬ






LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH









Thái Nguyên - 2013


Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên


ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG




LÊ THỊ BÍCH THẢO


KHAI PHÁ LUẬT KẾT HỢP MỜ DỰA
TRÊN ĐẠI SỐ GIA TỬ

Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01


LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH



NGƢỜI HƢỚNG DẪN KHOA HỌC
TS.Trần Thái Sơn



Thái Nguyên - 2012


Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

LỜI CAM ĐOAN

Tên tôi là : Lê Thị Bích Thảo
Sinh ngày 02 tháng 7 năm 1983
Học viên cao học lớp: K9B- trƣờng Đại học CNTT&TT Thái Nguyên
Xin cam đoan : Đề tài luận văn“Khai phá luật kết hợp mờ dựa trên
đại số gia tử” do TS.Trần Thái Sơn hƣớng dẫn là công trình nghiên cứu của
riêng tôi. Tất cả tài liệu tham khảo đều có nguồn gốc, xuất xứ rõ ràng.
Tôi xin cam đoan tất cả những nội dung trong luận văn đúng nhƣ nội
dung trong đề cƣơng và yêu cầu của thầy giáo hƣớng dẫn. Nếu sai tôi xin
hoàn toàn chịu trách nhiệm trƣớc Hội đồng khoa học và trƣớc pháp luật.

Thái Nguyên, tháng 01 năm 2013
Ngƣời cam đoan


Lê Thị Bích Thảo


Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên


LỜI CẢM ƠN
Trong quá trình làm luận văn vừa qua, dƣới sự giúp đỡ và chỉ bảo nhiệt
tình của TS. Trần Thái Sơn – Viện Công nghệ thông tin – Viện khoa học Việt
Nam, luận văn của tôi đã đƣợc hoàn thành. Mặc dù đã cố gắng không ngừng
cùng với sự tận tâm của thầy hƣớng dẫn nhƣng do thời gian và khả năng vẫn
còn hạn chế nên luận văn khó tránh khỏi những thiếu sót.
Để hoàn thành luận văn này, em xin bày tỏ lòng biết ơn sâu sắc đến TS
Trần Thái Sơn – Ngƣời thầy đã tận tình giúp đỡ em trong suốt quá trình làm
luận văn.
Em cũng xin bày tỏ lòng biết ơn đến ban lãnh đạo và các thầy giáo, cô
giáo trong Trƣờng Đại học Công Nghệ Thông Tin & Truyền Thông Đại Học
Thái Nguyên đã giúp đỡ, tạo điều kiện tốt nhất cho em học tập và thực hiện
luận văn này.
Thái Nguyên, tháng 01 năm 2013
Tác giả




Lê Thị Bí ch Thả o
i

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

MỤC LỤC
LỜI CAM ĐOAN iii
LỜI CẢM ƠN iv
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT iii
DANH MỤC CÁC HÌNH ẢNH iv

PHẦN MỞ ĐẦU 1
Chƣơng 1: LÝ THUYẾT CHUNG VỀ TẬP MỜ V L THUYẾT 4
ĐẠ I SỐ GIA TƢ̉ 4
1.1. L thuyết chung về tập mờ 4
1.2. Lôgic mờ 9
1.3. Biến ngôn ngữ 14
1.4. Một số khái niệm cơ bản về Đại số gia tử 15
1.4.1. Đại số gia tử 17
1.4.2. Định nghĩa đại số gia tử 18
Chƣơng 2: LUẬT KẾT HỢP TRONG KHAI PHÁ DỮ LIỆU 33
2.1. Bài toán kinh điển dẫn đến việc khai phá luật kết hợp 33
2.2. Khai phá luật kết hợp mờ: 39
Chƣơng 3: NG DỤNG ĐI S GIA T GIẢI BI TON KHAI PH DỮ
LIỆ U 41
3.1. ng dụng đại số gia tử trong khai phá dữ liệu. 41
3.1.1.Tiếp cận Đại số gia tử trong khai phá dữ liệu: 41
3.1.2.Thuật toán trích xuất luật kết hợp từ cơ sở dữ liệu: 43
ii

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

3.1.3.Thuật toán giải bài toán khai phá luậ t kế t hợ p mờ dƣ̣ a trên đại số gia
tử 51
3.2 .Bài toán 51
3.3. Xác định đầu vào, đầu ra của bài toán 52
3.3.1. Thuật toán giải 52
3.3.2.Chƣơng trình thử nghiệm 52
3.3.3. Cài đặt chƣơng trình 52
3.3.4.Giao diện của chƣơng trình 53
KẾT LUẬN 55

TÀI LIÊU THAM KHẢO 56
PHẦN PHỤ LỤC 58

iii

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT


Các kí hiệu,
các chữ viết tắt
Ý nghĩa
ĐSGT
Đại số gia tử
α
Tổng độ đo tính mờ của các gia tử âm
β
Tổng độ đó tính mờ của các gia tử dƣơng
AX, AT
Đại số gia tử
AX
Đại số gia tử tuyến tính đầy đủ
W
Phần tử trung hòa trong đại số gia tử
iv

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

DANH MỤC CÁC HÌNH ẢNH


Hình
Mô tả
Hình 1
Đồ thị biểu diễn hàm thuộc của tập mờ già (old)
Hình 2
Biểu diễn bộ 2
Hình 3
Độ đo tính mờ của biến TRUTH
Hình 4
Giao diện của chƣơng trình
Hình 5
Kết quả thực hiện chƣơng trình thử nghiệm



1

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

PHẦN MỞ ĐẦU
Trong những năm gần đây, việc nắm bắt đƣợc thông tin đƣợc coi là cơ
sở của mọi hoạt động sản xuất, kinh doanh. Cá nhân hoặc tổ chức nào thu
thập và hiểu đƣợc thông tin, và hành động dựa trên các thông tin đƣợc kết
xuất từ các thông tin đã có sẽ đạt đƣợc thành công trong mọi hoạt động.
Chính vì l do đó, việc tạo ra thông tin, tổ chức lƣu trữ và khai thác ngày càng
trở nên quan trọng và gia tăng không ngừng.
Sự tăng trƣởng vƣợt bậc của các cơ sở dữ liệu (CSDL) trong cuộc sống
nhƣ: thƣơng mại, quản lý và khoa học đã làm nảy sinh và thúc đẩy sự phát
triển của kỹ thuật thu thập, lƣu trữ, phân tích và khai phá dữ liệu… không chỉ

bằng các phép toán đơn giản thông thƣờng nhƣ: phép đếm, thống kê… mà đòi
hỏi cách xử l thông minh hơn, hiệu quả hơn. Từ đó các nhà quản l có đƣợc
thông tin có ích để tác động lại quá trình sản xuất, kinh doanh của mình… đó
là tri thức. Các kỹ thuật cho phép ta khai thác đƣợc tri thức hữu dụng từ
CSDL (lớn) đƣợc gọi là các kỹ thuật khai phá dữ liệu (DM – Data Mining).
Khai phá luật kết hợp là một nội dung quan trọng trong khai phá dữ liệu.
Luận văn trình bày một số vấn đề về phát hiện tri thức, khai phá dữ
liệu, tập trung vào vấn đề khai phá luật kết hợp và ứng dụng lý thuyết Đại số
gia tử trong khai phá luật kết hợp trên CSDL.
Khai phá dữ liệu, cụ thể là trích xuất các luật kết hợp từ cơ sở dữ liệu,
có xuất phát điểm từ bài toán nghiên cứu số liệu bán hàng trong siêu thị. Ở bài
toán này, số liệu đƣợc biểu diễn dƣới dạng bảng hai chiều, trong đó các cột
thể hiện các loại mặt hàng (item), các hàng thể hiện các giao dịch
(transactions) đã đƣợc tiến hành, số 1 cho thấy mặt hàng đƣợc mua, số 0 chỉ
điều ngƣợc lại. Từ bảng dữ liệu rất lớn này, ngƣời ta mong muốn rút ra đƣợc
các quy luật giúp cho quản lý, kiểu nhƣ "Nếu một ngƣời đã mua bánh mỳ và
2

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

bơ, khả năng ngƣời đó cũng mua giăm bông là rất cao". Luật có dạng nhƣ vậy
gọi là luật kết hợp và là hƣớng nghiên cứu quan trọng trong lĩnh vực khai phá
dữ liệu. Về sau, ngƣời ta thấy sẽ là rất không đầy đủ nếu chỉ xem xét các cơ
sở dữ liệu chỉ bao gồm các phần tử 0 và 1. Chẳng hạn, trong CSDL nhân sự
của một cơ quan có các mục nhƣ tuổi, thu nhập có giá trị trong miền số thực
rất rộng. Để trích xuất ra các luật kết hợp, một phƣơng pháp thƣờng đƣợc sử
dụng là chuyển số liệu trong CSDL đã cho về CSDL chỉ chứa các giá trị 0, 1
và áp dụng các kết quả đã có. Thí dụ, trong mục "tuổi", có thể chia ra các
miền "trẻ", "trung niên" và "già" với các miền giá trị tƣơng ứng là [0,35],
[36,55], [56,80] và nếu một giá trị của CSDL ban đầu rơi vào miền giá trị nào

thì ta ghi 1 cho vị trí tƣơng ứng trong CSDL chuyển đổi, ngƣợc lại gán giá trị
0. Phƣơng pháp này đơn giản về mặt thực thi nhƣng có thể gây băn khoăn do
ranh giới cứng mà ngƣời ta đƣa ra khi tiến hành chuyển đổi. Chẳng hạn hai
ngƣời tuổi 35 và 36 tuy rất gần nhau về mặt tuổi tác nhƣng lại thuộc hai lớp
khác nhau là "trẻ" và "trung niên", dẫn tới việc đƣa ra những luật kết hợp có
thể thiếu tính chính xác. Và ngƣời ta sử dụng cách tiếp cận mờ để khắc phục
điều này, theo đó, một giá trị bất kỳ của CSDL ban đầu không chuyển đổi về
giá trị 0 hoặc 1 nhƣ trên mà sẽ chuyển về một tập giá trị thực thuộc đoạn
[0,1], là độ thuộc của giá trị đã cho vào các tập mờ đƣợc xác định trƣớc. Thí
dụ, ngƣời tuổi 35 trong ví dụ trên, ở CSDL đã chuyển đổi sẽ nhận tập giá trị
(trẻ, 0,8), (trung niên, 0,6), (già, 0,1). Phƣơng pháp này, tuy dẫn tới việc xử lý
phức tạp hơn nhƣng dễ chấp nhận hơn về mặt trực quan và hiện đang đƣợc
nhiều nhà nghiên cứu quan tâm. Mặc dù vậy, theo  chúng tôi, phƣơng pháp
trích xuất luật kết hợp mờ vẫn có một số điểm yếu cần khắc phục. Đó là sự
phụ thuộc chủ quan rất lớn vào việc lựa chọn các hàm thuộc cho các tập mờ
dẫn đến việc xử lý vừa phức tạp vừa có thể thiếu chính xác. Trong bài báo này
3

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

chúng tôi trình bày việc giải bài toán trích xuất luật kết hợp mờ theo cách tiếp
cận của Đại số gia tử, ở đó các giá trị độ thuộc mờ sẽ nhận đƣợc thông qua
các giá trị định lƣợng ngữ nghĩa, đƣợc xác định dựa trên các kết quả nghiên
cứu lý thuyết về ĐSGT đã có từ trƣớc.
Luận văn có bố cục nhƣ sau:
Chƣơng 1: L thuyết chung về tập mờ v l thuyết đi s gia t
Trong chƣơng này trình bày những kiến thức cơ bản về lý thuyết tập
mờ, và một số khái niệm cơ bả n về đạ i số gia tƣ̉ .
Chƣơng 2: Khai phá luậ t kế t hợ p mờ dƣ̣ a trên đi s gia t
Trong chƣơng này trình bày luậ t kế t hợ p mờ , thuậ t toá n khai phá luậ t

kế t hợ p mờ dƣ̣ a trên đạ i số gia tử.
Chƣơng 3 : Ứng dụng ĐSGT giải bài toán khai phá dữ liệu
Trong chƣơng này trình bày bài toán, thuật toán và cách giải bài toán
khái phá luật kết hợp mờ dƣ̣ a trên đại số gia tử bằng cách sử dụng giá trị định
lƣợng ngữ nghĩa của các hạng từ trong đại số gia tử.








4

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Chƣơng 1
LÝ THUYẾT CHUNG VỀ TẬP MỜ V LÝ THUYẾT
ĐẠ I SỐ GIA TƢ̉
1.1. L thuyết chung về tập mờ
Là ngƣời khởi xƣớng cho lý thuyết tập mờ, L. A. Zadeh đã có rất nhiều
nghiên cứu mở đƣờng cho sự phát triển và ứng dụng [14].  tƣởng nổi bật của
Zadeh là từ những khái niệm trừu tƣợng về ngữ nghĩa của thông tin mờ,
không chắc chắn nhƣ trẻ-già, nhanh-chậm, cao-thấp,… ông đã tìm cách biểu
diễn chúng bằng một khái niệm toán học, đƣợc gọi là tập mờ và đƣợc định
nghĩa nhƣ sau.
Định nghĩa 1. [14] Cho một tập vũ trụ U với các phần tử ký hiệu bởi x,
U={x}. Một tập mờ A trên U là tập đƣợc đặc trƣng bởi một hàm


A
(x) mà nó
liên kết mỗi phần tử xU với một số thực trong đoạn [0,1]. Giá trị hàm

A
(x)
biểu diễn mức độ thuộc của x trong A.

A
(x) là một ánh xạ từ U vào [0,1] và
đƣợc gọi là hàm thuộc của tập mờ A.
Nhƣ vậy, giá trị hàm

A
(x) càng gần tới 1 thì mức độ thuộc của x trong A
càng cao. Khi A là một tập hợp kinh điển, hàm thuộc của nó,

A
(x), chỉ nhận 2
giá trị 1 hoặc 0, tƣơng ứng với x có nằm trong A hay không. Rõ ràng, tập mờ
là sự mở rộng của khái niệm tập hợp kinh điển. Các khái niệm, phép toán
trong lý thuyết tập kinh điển cũng đƣợc mở rộng cho các tập mờ.
Họ tất cả các tập mờ trên miền cơ sở U là không gian các hàm từ U vào
đoạn [0,1], tức là
( ,[0,1])UF
= {

A
: U


[0,1]}, một không gian tƣơng đối
giàu về cấu trúc tính toán mà nhiều nhà nghiên cứu đã sử dụng cho việc mô
phỏng các phƣơng pháp suy luận của con ngƣời.
Chúng ta có thể biểu diễn tập mờ bằng các cách sau, tùy theo tập U là
hữu hạn, đếm đƣợc hay vô hạn liên tục:
5

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

- Trƣờng hợp U hữu hạn, U={u
i
: 1 i  n}, ta có thể viết
A =

A
(u
1
)/u
1
+

A
(u
2
)/u
2
+ … +

A
(u

n
)/u
n
= 
1 i n


A
(u
i
)/u
i

- Trƣờng hợp U vô hạn đếm đƣợc, U={u
i
: i=1,2,… }, ta viết
A = 
1 i <


A
(u
i
)/u
i

- Trƣờng hợp U vô hạn liên tục, U=[a,b], ta viết
A =
( ) /
b

A
a
uu



Sau đây ta định nghĩa một số khái niệm đặc trƣng liên quan đến tập mờ.
Định nghĩa 2. [1] Cho một tập mờ A trên tập vũ trụ U và [0,1]. Tập
lát cắt  của A là một tập kinh điển, ký hiệu A

, đƣợc xác định nhƣ sau :
A

= {u  U :

A
(u)}.
Tập A

còn gọi là tập mức  của A.
Định nghĩa 3. [1] Cho một tập mờ A trên tập vũ trụ U,
i) Giá của tập mờ A, ký hiệu support(A), là tập con của U trên đó

A
(u)0, tức là support(A) = {u  U :

A
(u)0}.
ii) Độ cao của tập mờ A, ký hiệu high(A), là cận trên đúng của hàm
thuộc


A
(u) trên U, tức là high(A) = sup{

A
(u) : uU}.
iii) A đƣợc gọi là tập mờ chuẩn nếu high(A)=1. Ngƣợc lại gọi là tập
mờ dƣới chuẩn.
iv) Lõi của tập mờ A, ký hiệu core(A), là một tập con của U đƣợc
xác định nhƣ sau:
core(A) = {uU :

A
(u) = high(A)}.
Định nghĩa 4. [1] Cho một tập mờ A trên tập vũ trụ U,
i) Lực lƣợng vô hƣớng hay bản số của tập mờ A, ký hiệu count(A),
đƣợc xác định là:
count(A) = 
uU


A
(u), nếu U là hữu hạn hay đếm đƣợc,
6

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

= 
U



A
(u)du, nếu U là vô hạn liên tục.
ii) Lực lƣợng mờ hay bản số mờ của tập mờ A, ký hiệu card(A), là
một tập mờ trên tập các số nguyên không âm N, đƣợc xác định nhƣ sau:
card(A) = 
N


card(A)
(n)dn , trong đó,

card(A)
(n) đƣợc xác
định theo công thức sau, với |A

| là lực lƣợng tập mức A

,


card(A)
(n) = sup{t[0,1] : |A

| = n}.
Ví dụ 1. Cho tập vũ trụ chỉ tuổi tính chẵn năm U={u : 0 u 120}, A là
một tập mờ chỉ tuổi già (old) đƣợc xác định bởi hàm thuộc sau (hình 1):

21
60

6
0 [0,60]
()
(1 ( ) ) [61,120]
old
u
u
u
u












Khi đó tập mức =0.5 của A là A
0.5
= {u : 66 u 120} ;
support(A) = {u : 61 u 120} ; high(A) = 1.01
-1
; core(A) = {120}.

Hình 1. Đồ thị biểu diễn hàm thuộc của tập mờ già (old)
Tiếp theo chúng ta định nghĩa một số phép toán cơ bản trên tập mờ, các

phép này làm cơ sở cho việc phát triển lôgíc mờ sau này.
Định nghĩa 5. [1,14] Cho hai tập mờ A và B trên tập nền U có hàm
thuộc tƣơng ứng là

A


B
, ba phép toán cơ bản là hợp, giao của hai tập mờ
và lấy phần bù của tập mờ A là một tập mờ C, đƣợc viết là
C = A  B, hoặc C = A  B, hoặc C = A
~
với hàm thuộc đƣợc xác
định nhƣ sau:

AB
(u) = max(

A
(u),

B
(u)), u  U,
7

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên


AB
(u) = min(


A
(u),

B
(u)), u  U,

A~
(u) = 1-

A
(u), u  U.
Hay viết ở dạng thu gọn là

AB
(u) =

A
(u) 

B
(u)),

A

B
(u) =

A
(u) 


B
(u)).
Ví dụ 2. [1] Xét tập nền U = {1,2,3,4,5,6,8,9,10,11} là tập các giá trị
trong thang điểm 10 đánh giá kết quả học tập của học sinh. Hai tập mờ G và K
tƣơng ứng là hai khái niệm mờ về năng lực học giỏi và học kém, với hàm
thuộc đƣợc cho dƣới dạng bảng nhƣ sau:
uU
1
2
3
4
5
6
7
8
9
10

G
(u)
0.0
0.0
0.0
0.1
0.3
0.5
0.7
0.9
1.0

1.0

K
(u)
1.0
0.9
0.8
0.6
0.4
0.2
0.0
0.0
0.0
0.0
Ta có kết quả của các phép toán trên hai tập mờ này với hàm thuộc thể
hiện trong bảng sau:
uU
1
2
3
4
5
6
7
8
9
10

GK
(u)

0.0
0.0
0.0
0.6
0.5
0.5
0.7
0.9
1.0
1.0

GK
(u)
0.0
0.0
0.0
0.1
0.3
0.2
0.0
0.0
0.0
0.0

G~
(u)
1.0
1.0
1.0
0.9

0.7
0.5
0.3
0.1
0.0
0.0
Một lớp đặc biệt các tập mờ là lớp các quan hệ mờ, chúng là các tập mờ
trên không gian tích Đề-các các miền cơ sở. Nhƣ tên gọi, quan hệ mờ mô tả
mối quan hệ mờ giữa các đối tƣợng trong miền cơ sở. Về mặt hình thức chúng
ta định nghĩa quan hệ mờ nhƣ sau.
Định nghĩa 6. [1] Cho U là tích Đề-Các của n miền cơ sở U
i
, i=1, ,…, n.
Khi đó mỗi một tập mờ trên U đƣợc gọi là một quan hệ mờ n-ngôi và đƣợc kí
hiệu là R, gọi là tên của quan hệ đó, và nó đƣợc biểu thị bằng công thức sau:
8

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

1
1 1 1 1

( , , ) / ( , , )
n
UU
R u u u u






Trong đó

(u
1
,…,u
n
) là hàm thuộc của tập mờ R. Dấu  biểu diễn hình
thức của hàm thuộc, có thể một trong ba trƣờng hợp là hữu hạn hoặc đếm
đƣợc hoặc liên tục.
Quan hệ mờ cũng có các phép tính cơ bản nhƣ trên tập mờ vì bản thân
nó cũng là tập mờ. Ngoài ra, quan hệ mờ có những phép tính đặc thù riêng mà
trên tập mờ không có, đó là phép hợp thành dƣới đây.
Định nghĩa 7. [1] Cho R là một quan hệ mờ trên UV và S là quan hệ
mờ trên VW. Khi đó, phép hợp thành của hai quan hệ này là một quan hệ
trên UW, đƣợc ký hiệu là RS và đƣợc định nghĩa nhƣ sau:
RS = 
vV
[

R
(u,v)

S
(v,w)]/(u,w)
Trong đó  là một phép tính 2 ngôi trong [0,1] có tính giao hoán, kết hợp
và phân phối đối với phép max . Nếu  là phép min , thì ta có phép hợp
thành max-min, nếu  là phép nhân số học thì ta có phép hợp thành max-
product.
Ví dụ 3. Cho U = {u

1
, u
2
, u
3
}, V = {v
1
, v
2
} và W = {w
1
, w
2
}, với quan hệ
mờ R trên UV và S trên VW đƣợc cho hàm thuộc dƣới dạng ma trận
12
1
2
3
0.4 1
1 0.3
0.7 0.8
vv
u
Ru
u








12
1
2
0.2 0.8
0.7 0.1
ww
v
S
v





khi đó phép hợp thành max-min là
12
1
2
3
0.7 1
0.3 0.8
0.7 0.7
ww
u
R S u
u








,
và max-product là
12
1
2
3
0.8 0.32
0.21 0.8
0.56 0.56
ww
u
R S u
u







.
9

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên


Phép hợp thành các quan hệ mờ đóng vai trò quan trọng trong quá trình
lập luận xấp xỉ sau này.
Trong hầu hết các ứng dụng, tri thức đƣợc biểu diễn dƣới dạng luật “if-
then” và mỗi luật đƣợc xem nhƣ một quan hệ mờ
Chúng ta thấy rằng lý thuyết tập mờ với mục tiêu mô hình hóa toán học
ngữ nghĩa của các khái niệm mờ và, hơn nữa, mô hình hóa cách lập luận của
con ngƣời. Tuy nhiên, những vấn đề này thuộc loại có cấu trúc yếu, khó có
thể có một cấu trúc toán duy nhất mô hình hóa trọn vẹn những vấn đề đó
1.2. Lôgic mờ
Cùng với khái niệm biến ngôn ngữ, L. A. Zadeh đã phát triển lôgic mờ
mà các giá trị chân lý nhận trong T(Truth) = {true, very true, more false,
possible false, very very false,…}, tập các giá trị của biến ngôn ngữ Truth.
Khi đó, một mệnh đề dạng “X is A”, với A là một khái niệm mờ, sẽ có giá trị
chân lý thuộc T(Truth) và đƣợc biểu thị bởi một tập mờ có hàm thuộc

A
trên
không gian tham chiếu U.
Lý thuyết tập mờ là cơ sở toán học cho việc phát triển các phƣơng pháp
mô phỏng lập luận của con ngƣời. Về nguyên tắc, vấn đề tƣ duy, lập luận của
con ngƣời rất phức tạp và do đó không thể sử dụng một cấu trúc toán học duy
nhất để mô phỏng. Vì vậy, mục tiêu của chúng ta là càng xây dựng đƣợc
nhiều cấu trúc đại số các tập mờ càng tốt để linh hoạt trong tiếp cận các vần
đề ứng dụng. Ở đây, chúng ta sẽ định nghĩa một họ các cặp đối ngẫu t-norm
và t-conorm cùng với phép phủ định làm cơ sở cho lôgic mờ và lập luận xấp
xỉ.
Định nghĩa 8 [1] Một hàm 2-biến T : [0,1][0,1]  [0,1] đƣợc gọi là
phép t-norm nếu nó thỏa các tính chất sau với a,a’,b,c [0,1]:
i) Tính chất điều kiện biên: T(a,1) = a

10

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

ii) Tính giao hoán: T(a,b) = T(b,a)
iii) Tính đơn điệu: a  a’  T(a,b)  T(a’,b)
iv) Tính kết hợp: T(a,T(b,c)) = T(T(a,b),c)
Ngoài ra, một số tính chất khác cần đòi hỏi phải có trong nhiều ứng dụng
đối với phép t-norm bao gồm:
v) Tính liên tục: T là hàm hai biến liên tục
vi) Tính lũy đẳng dƣới: T(a,b) < a
vii) Tính đơn điệu chặt: a  a’ và b  b’  T(a,a’) <
T(b,b’)
Định nghĩa 9 [1] Một hàm 2-biến S : [0,1][0,1]  [0,1] đƣợc gọi là
phép t-conorm nếu nó thỏa các tính chất sau với a,a’,b,c [0,1]:
i) Tính giới nội: S(a,0) = a
ii) Tính giao hoán: S(a,b) = S(b,a)
iii) Tính đơn điệu: a  a’  S(a,b)  S(a’,b)
iv) Tính kết hợp: S(a,S(b,c)) = S(S(a,b),c)
Nhƣ vậy, chỉ có hai tính chất điều kiện biên và giới nội làm nên sự khác
biệt giữa hai họ phép tính t-norm và t-conorm.
Chúng ta cũng có thể mở rộng định nghĩa cho phép t-norm và t-conorm
này đối với trƣờng hợp nhiều biến vào, tức là T
ex
: [0,1]
n
 [0,1] và S
ex
:
[0,1]

n
 [0,1], bằng cách áp dụng liến tiếp các phép t-norm và t-conorm ở
trên.
Định nghĩa 10 [1] Hàm N : [0,1]  [0,1] đƣợc gọi là phép phủ định
(negation) nếu nó thỏa các tính chất sau với a,a’ [0,1]:
i) Tính đơn điệu giảm: a  a’  N(a)  N(a’)
iv) Tính lũy đẳng: N(N(a)) = a
11

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Ví dụ 4: Các phép t-norm, t-conorm và phép phủ định hay đƣợc sử dụng
nhƣ:
T
M
(a,b) = min{a,b}
T
P
(a,b) = a.b
T
L
(a,b) = max{0,a+b-1}

*
khi 1
( , ) khi 1
0 khi 1& 1
ab
T a b b a
ab










S
M
(a,b) = max{a,b}
S
P
(a,b) = a+b-a.b
S
L
(a,b) = min{1,a+b}

*
khi 0
( , ) khi 0
0 khi 0& 0
ab
S a b b a
ab










N(a) = 1-a.
Định nghĩa 11 [1] Ba phép tính t-norm T, t-conorm S và phép phủ định
N đƣợc gọi là một hệ đối ngẫu (T,S,N) nếu chúng thỏa điều kiện sau:
N(S(a,b)) = T(N(a),N(b)), a,b[0,1].
Việc áp dụng các phép t-norm, t-conorm và phép phủ định cho việc tính
toán các toán tử hội, tuyển và phủ định trong lôgic mờ làm tăng tính mềm dẻo
trong ứng dụng. Thực vậy, khi hai mệnh đề “X is A” và “X is B” có giá trị
chân l đƣợc biểu thị bởi hai hàm thuộc tƣơng ứng

A


B
trên không gian
tham chiếu U và V thì mệnh đề mờ “X is A and B” có hàm thuộc biểu thị giá
trị chân lý là

AB
= T(

A
,

B
), với T là một t-norm nào đó. Tƣơng tự, mệnh đề

“X is A or B” có hàm thuộc là

AB
= S(

A
,

B
) và mệnh đề “X is not A” có
hàm thuộc là

~A
= N(

A
), ở đây S là một t-conorm và N là một phép phủ định
đƣợc chọn nào đó.
12

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Các mệnh đề mờ cùng với giá trị chân lý của chúng là những đối tƣợng
nghiên cứu chính của lôgíc mờ. Trong đó, một dạng mệnh đề mờ thƣờng biểu
diễn cho tri thức dạng luật trong lập luận xấp xỉ và ứng dụng, đó là mệnh đề
mờ có điều kiện dạng “If X is A then Y is B” và đƣợc biểu diễn bằng toán tử
kéo theo mờ.
Ở đây, một cách tổng quát, chúng ta đƣa ra một số tính chất cho một
phép kéo theo mờ.
Định nghĩa 12 [1] Phép kéo theo là một hàm số I : [0,1]

2
 [0,1] có các
tính chất sau:
i) Tính đơn điệu giảm đối với biến thứ nhất
x  z  I(x,y)  I(z,y), y[0,1]
ii) Tính đơn điệu tăng đối với biến thứ hai
y  u  I(x,y)  I(x,u), x[0,1]
iii) Tính chi phối của giá trị chân lý sai
I(0,x) = 1
iv) Tính trung tính của giá trị chân l đúng
I(1,x) = x
v) Tính đồng nhất
I(x,x) = x
vi) Tính chất hoán đổi
I(x,I(y,z)) = I(y,I(x,z))
vii) Tính chất về điều kiện giới nội
I(x,y) = 1 nếu và chỉ nếu x  y
viii) Tính chất khái quát hóa của phép kéo theo kinh điển
I(x,y) = I(N(y),N(x)), trong đó N là phép phủ định
ix) I là hàm liên tục theo cả hai biến.
13

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Rõ ràng mệnh đề điều kiện ở dạng “If X is A then Y is B” thể hiện mối
quan hệ giữa hai khái niệm mờ A và B. Vì vậy, chúng cảm sinh một quan hệ
mờ R thể hiện bởi một tập mờ trên không gian tích Đề-Các UV đƣợc xác
định bởi hàm thuộc thông qua một phép kéo theo đƣợc chọn.
Ví dụ 5. Một số dạng phép kéo theo thƣờng dùng
Mamdani

I(x,y) = min{x,y}
Dạng khái quát từ phép kéo theo kinh điển
I(x,y) = S(N(x),y), hoặc
I(x,y) = S(N(x),T(x,y)), hoặc
I(x,y) = S(T(N(x),N(y)),y), với T, S và N là các phép
t-norm, t-conorm và phép phủ định.
Reichenbach
I(x,y) = 1-x+x.y
Lukasiewicz
I(x,y) = min{1, 1-x+y}.
Định l sau đây cho chúng ta xem xét liệu phép kéo theo nhƣ thế nào sẽ
thỏa mãn tất cả các tính chất trong định nghĩa 12.
Định lý 1. [1] Một hàm 2-biến I : [0,1]
2
 [0,1] thỏa các tính chất từ i)
đến ix) trong định nghĩa 12 nếu và chỉ nếu có tồn tại một hàm liên tục đơn
điệu tăng thực sự f : [0,1]  [0,+) sao cho f(0) = 0 và
I(x,y) = f
-1
(f(1)-f(x)+f(y)), với x,y  [0,1], và
N(x) = f
-1
(f(1)-f(x)), với x [0,1].
Tuy nhiên, bản chất ngữ nghĩa của phép kéo theo mờ trong lập luận của
con ngƣời rất phức tạp, khó có một hệ tiên đề chung cho mọi tình huống. Vì
vậy, các tính chất ở định nghĩa 12 không bắt buộc mọi phép kéo theo mờ đều
14

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên


phải thỏa mãn. Hơn nữa, cũng không có quyền đặt ra các yêu cầu về một tính
chất nào đó khác mà một phép kéo theo cần phải có. Chỉ có ứng dụng thực
tiễn là tiêu chuẩn cuối cùng chứng minh tính phù hợp của một định nghĩa
phép kéo theo mờ.
1.3. Biến ngôn ngữ
Trong [14], L. A. Zadeh đã viết “Khi thiếu hụt tính chính xác bề ngoài
của những vấn đề phức tạp cố hữu, một cách tự nhiên là tìm cách sử dụng các
biến ngôn ngữ, đó là các biến mà giá trị của chúng không phải là số mà là
các từ hoặc các câu trong ngôn ngữ tự nhiên hoặc nhân tạo. Động lực cho
việc sử dụng các từ, các câu hơn các số là ở chỗ đặc trưng ngôn ngữ của các
từ và các câu thường ít xác định cụ thể hơn của các số”. và ông đã đƣa ra một
lớp khái niệm rộng hơn có thể mô hình qua các tập mờ, đó là biến ngôn ngữ.
Định nghĩa 13. [14] Biến ngôn ngữ là một bộ năm (X,T(X),U,R,M),
trong đó X là tên biến, T(X) là tập các giá trị ngôn ngữ của biến X, U là không
gian tham chiếu hay còn gọi là miền cơ sở của biến X, R là một quy tắc ký
pháp sinh các giá trị ngôn ngữ cho T(X), M là quy tắc gán ngữ nghĩa biểu thị
bằng tập mờ trên U cho các từ ngôn ngữ trong T(X).
Ví dụ 6 Cho X là biến ngôn ngữ có tên AGE, miền tham chiếu của X là
U=[0,120]. Tập các giá trị ngôn ngữ T(AGE)={very old, old, possible old, less
old, less young, quite young, more young,…}. Chẳng hạn với giá trị ngôn ngữ
old, quy tắc gán ngữ nghĩa M cho old bằng tập mờ cho bởi ví dụ 1
M(old) = {(u,

old
(u)) : u[0,120]}.
Chúng ta thấy rằng một biến ngôn ngữ đƣợc cấu trúc theo hƣớng mà
trong đó có hai quy tắc cơ bản. Thứ nhất là quy tắc cú pháp, qui định cách
thức để sinh các giá trị ngôn ngữ. Thứ hai là quy tắc ngữ nghĩa, qui định thủ
tục tính toán ngữ nghĩa của các giá trị ngôn ngữ. Ngoài các giá trị sinh nguyên
15


Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

thủy, các giá trị ngôn ngữ có thể gồm các từ liên kết nhƣ and, or, not,… và
các gia tử ngôn ngữ nhƣ very, possible, less, quite, more,….Zadeh cũng nêu ra
một vài thí dụ về cách sinh ra các hàm thuộc từ các hàm thuộc đã có nhƣ nếu
A là nhãn ngôn ngữ mờ có hàm thuộc là μ
A
thì veryA có hàm thuộc là (μ
A
)
2

còn lessA có hàm thuộc là căn bặc hai của μ
A

Trong thực tế có nhiều biến ngôn ngữ khác nhau về giá trị sinh nguyên
thủy, tuy nhiên cấu trúc miền giá trị của chúng tồn tại một “đẳng cấu” sai
khác nhau bởi giá trị sinh nguyên thủy này. Đây gọi là tính phổ quát của biến
ngôn ngữ.
Khác với giá trị nguyên thủy của các biến ngôn ngữ phụ thuộc vào ngữ
cảnh, ngữ nghĩa của các gia tử và các từ liên kết hoàn toàn độc lập với ngữ
cảnh. Đây là tính độc lập ngữ cảnh của gia tử và liên kết.
Chúng ta thấy rằng lý thuyết tập mờ với mục tiêu mô hình hóa toán học
ngữ nghĩa của các khái niệm mờ và hơn nữa mô hình hóa cách lập luận của
con ngƣời. Tuy nhiên, những vấn đề này thuộc loại có cấu trúc yếu, khó có
thể có một cấu trúc toán duy nhất mô hình hóa trọn vẹn những vấn đề đó.
1.4. Một s khái niệm cơ bản về Đi s gia t
Để xây dựng phƣơng pháp luận tính toán nhằm giải quyết vấn đề mô
phỏng các quá trình tƣ duy, suy luận của con ngƣời chúng ta phải thiết lập ánh

xạ: gán mỗi khái niệm mờ một tập mờ trong không gian tất cả các hàm
F(U, [0, 1]). Nghĩa là ta mƣợn cấu trúc tính toán rất phong phú của tập để mô
phỏng phƣơng pháp lập luận của con ngƣời thƣờng vẫn đƣợc thực hiện trên
nền ngôn ngữ tự nhiên.
Vậy một vấn đề đặt ra là liệu bản thân ngôn ngữ có cấu trúc tính toán không?
Nếu có thì các phƣơng pháp lập luận xây dựng trên đó đem lại những lợi ích
gì? Thông qua lý thuyết về đại số gia tử ta có thể thấy rằng tập các giá trị của
16

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

một biến ngôn ngữ (biến mà giá trị của nó đƣợc lấy trong miền ngôn ngữ) là
một cấu trúc đại số đủ mạnh để tính toán.
Lý thuyết đại số gia tử đã cố gắng nhúng tập ngôn ngữ vào một cấu trúc đại
số thích hợp và tìm cách xem chúng nhƣ là một đại số để tiên đề hóa sao cho
cấu trúc thu đƣợc mô phỏng tốt ngữ nghĩa ngôn ngữ.
17

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

1.4.1. Đại số gia tử
Xét một tập giá trị ngôn ngữ là miền của biến ngôn ngữ (linguistic
domain) của biến chân l TRUTH gồm các từ sau:
T = dom(TRUTH) = {true, false, very true, very false, more true, more
false, approximately true, approximately false, little true, little false, less true,
less false, very more true, very more false, very possible true, very possible
false, very more true, very more false, …}
Khi đó miền ngôn ngữ T = dom (TRUTH) có thể biểu thị nhƣ là một
cấu trúc đại số AT = (T, G, H, ≤), trong đó:
- T: Là tập cơ sở của AT.

- G: Là tập các từ nguyên thủy (tập các phần tử sinh: true, false).
- H: Là tập các toán tử một ngôi, gọi là các gia tử (các trạng từ nhấn).
- ≤: Là biểu thị quan hệ thứ tự trên các từ (các khái niệm mờ), nó đƣợc
“cảm sinh” từ ngữ nghĩa tự nhiên. Ví dụ: dựa trên ngữ nghĩa, các quan hệ thứ
tự sau là đúng: false≤ true, more true ≤ very true, very false ≤ more false,
possible true ≤ true, false ≤ possible false, …
Ta luôn giả thiết rằng các gia tử trong H là các toán tử thứ tự, nghĩa là
(∀h ∈ H, h: T → T), (∀x ∈ T) {hx ≤ x hoặc hx ≥ x}. Hai gia tử h, k ∈ H đƣợc
gọi là ngƣợc nhau nếu (∀x ∈ T) {hx ≤ x khi và chỉ khi kx ≥ x} và chúng đƣợc
gọi là tƣơng thích nhau nếu (∀x ∈ T) {hx ≤ x khi và chỉ khi kx ≤ x}.
Ta ký hiệu h ≥ k nếu h, k tƣơng thích nhau và (∀x ∈ T) {hx ≤ kx ≤ x
hoặc hx ≥ kx ≥ x}.
Ngoài ra, tập H còn có thể đƣợc phân hoạch thành hai tập H+ và H- với
các gia tử trong tập H+ hay H- là tƣơng thích nhau, mỗi phần tử trong H+
cũng ngƣợc với bất kỳ phần tử nào trong H- và ngƣợc lại.

×