Tải bản đầy đủ (.pdf) (63 trang)

Phân lớp miền xác định thuộc tính trong bài toán khai phá dữ liệu mờ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.34 MB, 63 trang )

ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

PHÙNG THỊ NGA

PHÂN LỚP MIỀN XÁC ĐỊNH
THUỘC TÍNH TRONG BÀI TOÁN
KHAI PHÁ DỮ LIỆU MỜ

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

THÁI NGUYÊN - 2015
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

PHÙNG THỊ NGA

PHÂN LỚP MIỀN XÁC ĐỊNH
THUỘC TÍNH TRONG BÀI TOÁN
KHAI PHÁ DỮ LIỆU MỜ
Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01.01

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Ngƣời hƣớng dẫn khoa học: TS. TRẦN THÁI SƠN


THÁI NGUYÊN - 2015
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

i

LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi dƣới sự
hƣớng dẫn trực tiếp của Ts. Trần Thái Sơn.
Mọi trích dẫn sử dụng trong báo cáo này đều đƣợc ghi rõ nguồn tài liệu
tham khảo theo đúng qui định.
Mọi sao chép không hợp lệ, vi phạm quy chế đào tạo, hay gian trá, tôi
xin chịu hoàn toàn trách nhiệm.
Thái Nguyên, ngày … tháng … năm 2014
Tác giả

Phùng Thị Nga

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

ii

LỜI CẢM ƠN
Luận văn đƣợc viết dƣới sự hƣớng dẫn tận tình và nghiêm khắc của
TS. Trần Thái Sơn. Lời đầu tiên, tác giả xin bày tỏ lòng kính trọng và biết
ơn sâu sắc tới thầy.
Xin chân thành gửi lời cảm ơn tới thầy về những đóng góp quý báu trong

quá trình nghiên cứu cũng nhƣ trong thời gian hoàn thành luận văn. Tác giả
xin chân thành gửi lời cảm ơn đến Phòng Đào tạo sau đại học đã tạo điều kiện
thuận lợi trong quá trình học tập, nghiên cứu và hoàn thành luận văn, đảm bảo
tiến độ.
Cuối cùng, tác giả xin chân thành cảm ơn các thành viên trong gia đình,
những ngƣời luôn dành cho tác giả những tình cảm nồng ấm và sẻ chia những
lúc khó khăn trong cuộc sống, luôn động viên giúp đỡ tác giả trong quá trình
nghiên cứu.

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

iii
MỤC LỤC
LỜI CAM ĐOAN ...................................................................................................... i
LỜI CẢM ƠN ........................................................................................................... ii
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT ........................................... iv
DANH MỤC CÁC HÌNH .........................................................................................v
MỞ ĐẦU ....................................................................................................................1
CHƢƠNG 1. KHAI PHÁ TRI THỨC VỚI HỆ LUẬT MỜ .................................4
1.1. Khai phá tri thức từ cơ sở dữ liệu với hệ luật mờ .......................................4
1.2. Khai phá tri thức theo cách tiếp cận của lý thuyết tập mờ .........................5
1.2.1. Kiến thức cơ sở về tập mờ ..........................................................................5
1.2.2. Khai phá tri thức với thông tin mờ .............................................................6
1.3. Khai phá tri thức theo cách tiếp cận của lý thuyết Đại số gia tử .............12
1.3.1. Kiến thức cơ sở về ĐSGT ........................................................................12
1.3.2. Khai phá tri thức với thông tin mờ theo cách tiếp cận ĐSGT ..................15
CHƢƠNG 2. BÀI TOÁN PHÂN CHIA MIỀN XÁC ĐỊNH THUỘC TÍNH ...22
2.1. Bài toán phân chia miền xác định thuộc tính .............................................22

2.2. Các phƣơng pháp giải bài toán phân chia miền xác định thuộc tính ......27
2.2.1. Phƣơng pháp tiền định..............................................................................27
2.2.2. Tối ƣu hóa các hàm thuộc MF (Membership functions) ..........................28
CHƢƠNG 3. ĐẠI SỐ GIA TỬ, CÁCH TIẾP CẬN MỚI CHO BÀI TOÁN
PHÂN LỚP MIỀN XÁC ĐỊNH THUỘC TÍNH ..................................................41
3.1. Giải bài toán phân chia miền xác định thuộc tính sử dụng khoảng tính
mờ và giá trị định lƣợng ngữ nghĩa ...................................................................41
3.2. Thuật toán giải bài toán phân chia miền xác định thuộc tính theo cách
tiếp cận của ĐSGT ...............................................................................................41
KẾT LUẬN ..............................................................................................................49
TÀI LIỆU THAM KHẢO ......................................................................................49
PHỤ LỤC: CHƢƠNG TRÌNH TỐI ƢU HÓA THAM SỐ TẬP MỜ ...............52

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

iv

DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT
Các ký hiệu
AX

Đại số gia tử tuyến tính

AX

Đại số gia tử tuyến tính đầy đủ

A X2


Đại số 2 gia tử

µ(h), fm(x) Độ đo tính mờ gia tử h và của hạng từ xυ Giá trị định
lƣợng theo điểm của giá trị ngôn ngữ
µA(v)

Hàm định lƣợng của giá trị ngôn ngữ A (đo độ thuộc của v)

sm(x,y)

Hàm xác định mức độ gần nhau của hai hạng từ x và y



Khoảng tính mờ của giá trị ngôn ngữ

Xk

Tập các hạng từ có độ dài đúng k

X(k)

Tập các hạng từ có độ dài không quá k

Ik

Hệ khoảng tính mờ mức k của các giá trị ngôn ngữ

I(k)


Hệ khoảng tính mờ từ mức 1 đến mức k của các giá trị
ngôn ngữ

Tg

Khoảng tƣơng tự bậc g của giá trị ngôn ngữ

S(k)

Hệ khoảng tƣơng tự ở mức k của các giá trị ngôn ngữ

Các chữ viết tắt
CSDL

Cơ sở dữ liệu

ĐSGT

Đại số gia tử

ĐS2GT

Đại số 2 gia tử

ĐLNN

Định lƣợng ngữ nghĩa

RB


Rule-Base

FB

Fuzzy Base

HAFRG

Hedge Algebras based Fuzzy Rules Generation

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

v

MOGA

Thuật giải di truyền đa đối tƣợng

NST

Nhiễm sắc thể

DANH MỤC CÁC HÌNH
Hình 1.1. Độ đo tính mờ của biến TRUTH .................................................... 17
Hình 1.2. Khoảng tính mờ của các hạng từ của biến TRUTH ....................... 20
Hình 2.1. Lƣới phân hoạch mờ trên miền của 2 thuộc tính ............................ 25
Hình 2.2. Phƣơng pháp phân hoạch mờ scatter-partitio ................................. 27

Hình 2.3. Tập các MF của thuộc tính Ij .......................................................... 30
Hình 2.4. Hai dạng không thích hợp của các MF ........................................... 30
Hình 3.1. Tập hàm thuộc cho thuộc tính AGE ............................................... 46
Hình 3.2. Tập hàm thuộc cho thuốc tính Hours .............................................. 47
Hình 3.3. Tập hàm thuộc cho thuốc tính IncFam ........................................... 47
Hình 3.4. Tập hàm thuộc cho thuốc tính IncHead .......................................... 48
Hình 3.5. Tập hàm thuộc cho thuốc tính MARCHWGT ................................ 48

DANH MỤC BẢNG BIỂU
Bảng 2.1: Dữ liệu mờ từ dữ liệu bảng 1 ......................................................... 36
Bảng 2.2: Cơ sở dữ liệu................................................................................... 36
Bảng 3.1. Cơ sở dữ liệu ................................................................................... 44

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

1
MỞ ĐẦU
1. Lý do chọn đề tài
Trong lĩnh vực khai phá dữ liệu, một khó khăn thƣờng gặp là hệ thống
phải xử lý khối lƣợng thông tin rất lớn, đòi hỏi phải có những thuật toán hữu
hiệu để khai thác các tri thức ngầm chứa trong khối thông tin to lớn đó.
Một trong những bài toán cơ bản đặt ra trong lĩnh vực nghiên cứu này
là cho trƣớc một Cơ sở dữ liệu (thƣờng là CSDL số, tức các giá trị của CSDL
là các số thực), từ đó, bằng các phƣơng pháp xử lý nhất định, rút ra một hệ tri
thức phản ánh các quy luật chứa trong CSDL số này. Các quy luật này có thể
biểu diễn dƣới dạng hệ luật IF X is A and Y is B THEN Z is C, trong đó X, Y,
Z là các biến mờ (thƣờng là các biến ngôn ngữ), A, B, C là các giá trị biến
ngôn ngữ (thƣờng là các tập mờ). Thí dụ luật IF đường là xa và tốc độ di

chuyển là trung bình THEN thời gian đến đích sẽ là lâu. Để có thể sinh ra
những luật nhƣ vậy, đầu tiên ta phải chuyển hóa miền giá trị của các thuộc
tính “khoảng cách”, “tốc độ”, “thời gian” thành các miền mờ, hay nói cách
khác là phân chia các miền giá trị đó thành các miền mờ cho các bƣớc xử lý
tiếp theo. Chẳng hạn, có thể chia miền giá trị thuộc tính độ dài (có các giá trị
min, max tƣơng ứng chẳng hạn là 0km, 200km) thành các miền mờ “gần”
(0km- 50km), “trung bình” (51km-100km), “xa” (100km-200km). Trong lý
thuyết tập mờ, mỗi miền mờ nhƣ vậy đƣợc coi là một tập mờ và ứng với một
hàm thuộc (MF- membership function) nhằm xác định độ “thuộc” của giá trị
biến vào tập mờ đã cho. Khi đó, một giá trị của một thuộc tính CSDL sẽ ứng
với một tập các giá trị của các hàm thuộc ứng với với các tập mờ của thuộc
tính đó. Và ta sẽ xây dựng hệ luật mờ dựa trên việc xử lý tập giá trị độ thuộc
này thay vì xử lý bản thân giá trị ban đầu của CSDL. Việc xây dựng các MF
phân chia miền xác định thuộc tính là bƣớc đầu tiên nhƣng rất quan trọng
trong quy trình xây dựng hệ luật mờ vì chỉ có trên cơ sở phân chia hợp lý các
miền xác định thuộc tính ta mới có thể có các tập mờ ngôn ngữ phản ánh
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

2
tƣơng đối chính xác ngữ nghĩa định tính của nhãn ngôn ngữ dùng trong hệ
luật đƣợc xây dựng tiếp theo.Phƣơng pháp tiếp cận theo lý thuyết tập mờ cho
ta một cách xử lý dữ liệu khá mềm dẻo, nhanh chóng so với các phƣơng pháp
xử lý số cổ điển. Tuy vậy, vẫn còn nhiều vấn đề đặt ra nhƣ việc phân chia các
miền mờ thế nào cho hợp lý, làm sao xây dựng đƣợc các hàm thuộc nhanh
chóng, phù hợp và cách xử lý các hàm thuộc này thế nào để giữ đƣợc ngữ
nghĩa gắn với chúng... Đại số gia tử (ĐSGT) ra đời dựa trên một cấu trúc thứ
tự tốt trong tập các giá trị ngôn ngữ của biến ngôn ngữ có thể khắc phục phần
nào những điểm yếu đó. Luận văn đặt mục tiêu sử dụng cách tiếp cận ĐSGT

trong việc xác định các MF tối ƣu phân chia miền mờ cho các thuộc tính của
CSDL, để có thể xây dựng đƣợc các hệ luật mờ tốt trong các bƣớc tiếp theo
nhằm giải quyết các bài toán quan tâm trong lĩnh vực khai phá dữ liệu hay
điều khiển mờ.
Đƣợc sự đồng ý của trƣờng Đại học Công nghệ thông tin và Truyền
thông với sự hƣớng dẫn của Thầy giáo em xin mạnh dạn nhận đề tài: “Phân
lớp miền xác định thuộc tính trong bài toán khai phá dữ liệu mờ” làm đề
tài luận văn của mình.
2. Đối tƣợng và phạm vi nghiên cứu
Đối tƣợng nghiên cứu của luận văn là cơ sở dữ liệu đầu vào dùng để
khai phá dữ liệu. Lý thuyết tập mờ và đại số gia tử cũng đƣợc nghiên cứu nhƣ
là công cụ để giải bài toán đặt ra.
3. Hƣớng nghiên cứu của đề tài
Luận văn nghiên cứu các phƣơng pháp giải bài toán phân lớp miền xác
định thuộc tính của các tác giả trong nƣớc cũng nhƣ trên thế giới, ƣu, khuyết
điểm của các phƣơng pháp đã có và nghiên cứu cách giải bài toán theo cách
tiếp cận của Đại số gia tử, sử dụng giá trị định lƣợng ngữ nghĩa của các giá trị
biến ngôn ngữ, phân chia miền thuộc tính tiến hành khai phá dữ liệu
4. Phƣơng pháp nghiên cứu
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

3

Tìm hiểu các lý thuyết về tập mờ, các dạng tập mờ, tìm hiểu cách biểu
diễn tập giá trị chân lý ngôn ngữ cho tập mờ. Tìm hiểu mối quan hệ giữa các
dạng biểu diễn tập mờ với hàm định lƣợng ngữ nghĩa của đại số gia tử, tìm
hiểu cách thức chuyển đổi giá trị chân lý ngôn ngữ thành một giá trị số.
Phân tích, đối sánh, liệt kê, nghiên cứu tài liệu, tổng hợp các kết quả của

các nhà nghiên cứu liên quan đến lĩnh vực nghiên cứu.
5. Ý nghĩa khoa học
Bài toán phân chia miền xác định thuộc tính nói chung đóng vai trò
quan trọng trong quá trình khai phá dữ liệu và do đó nó có ý nghĩa ứng dụng
rộng lớn, đặc biệt loại bài toán liên quan đến thông tin mờ vì con ngƣời
thƣờng quyết định thông qua thông tin mờ ngôn ngữ. Cho đến nay các
phƣơng pháp giải bài toán này chủ yếu dựa trên các tập mờ.
Giải bài toán phân chia miền xác định thuộc tính theo cách tiếp cận Đại
số gia tử cho ta một phƣơng pháp tƣơng đối đơn giản nhƣng khá hữu hiệu
trong các cách mà Đại số gia tử nói riêng và lý thuyết tập mờ nói chung có thể
sử dụng.

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

4

CHƢƠNG 1. KHAI PHÁ TRI THỨC VỚI HỆ LUẬT MỜ
1.1. Khai phá tri thức từ cơ sở dữ liệu với hệ luật mờ
Từ nhu cầu cần xử lý một khối lƣợng thông tin lớn đặc biệt đối tƣợng thông
tin chỉ mang tính định tính hay còn gọi là thông tin mờ thông thƣờng ngƣời ta có
thể chọn các cách tiếp cận theo lý thuyết tập mờ, xác suất thống kê...
Trong thực tế khái niệm mờ luôn tồn tại, hiện hữu trong các bài toán,
trong cách suy luận của con ngƣời. Ví dụ nhƣ hiện nay thang điểm của học
sinh tiểu học đƣợc đánh giá không phải là con số mà là bài làm tốt, bài làm
khá tốt, bài làm rất tốt,.... Hơn nữa B.Russel đã viết: “Tất cả logic cổ điển
luôn giả sử rằng các đối tƣợng đƣợc sử dụng là rõ ràng. Vì thế không thể áp
dụng tốt trong cuộc sống trên trái đất này”. Nhƣ vậy cần một hƣớng nghiên
cứu mới.

L. A. Zadeh đã đề xuất hình thức hóa toán học của khái niệm mờ vào
năm 1965, từ đó lý thuyết tập mờ đƣợc hình thành và ngày càng thu hút nhiều
nghiên cứu của các tác giả cũng nhƣ phát triển ứng dụng. Bằng các phƣơng
pháp tiếp cận khác nhau, các nhà nghiên cứu nhƣ Dubois, Prade, Mamdani,
Tagaki, Sugeno,Ishibuchi, Herrera… đã đƣa ra những kết quả cả về lý thuyết
và ứng dụng trong các bài toán điều khiển mờ, khai phá dữ liệu mờ, cơ sở dữ
liệu mờ, các hệ hỗ trợ quyết định.
Bài toán đặt ra từ CSDL số chuyển sang CSDL mờ chuyển sang hệ luật
và hệ luật mờ đƣợc biểu diễn dƣới dạng : IF X is A and Y is B THEN Z is C,
trong đó X, Y, Z là các biến mờ (thƣờng là các biến ngôn ngữ), A, B, C là các
giá trị biến ngôn ngữ (thƣờng là các tập mờ).
Ví dụ: If X1 is Large and X2 is Very Small then Y is Normal
If X1 is Small and X2 is Large then Y = “Iris-Setosa”.
Hệ luật mờ áp dụng cho luật xấp xỉ sẽ đƣợc trình bày cụ thể hơn trong
phần sau.
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

5
Từ CSDL xây dựng hệ luật Mamdani để giải quyết bài toán hồi quy mờ,
phân loại, điều khiển thông qua việc xử lý phân chia miền giá trị của các
thuộc tính của CSDL theo cách tiếp cận của lý thuyết tập mờ và ĐSGT.
1.2. Khai phá tri thức theo cách tiếp cận của lý thuyết tập mờ
1.2.1. Kiến thức cơ sở về tập mờ
Định nghĩa 1.1.[2] Cho một tập vũ trụ U với các phần tử ký hiệu bởi
x,U={x}. Một tập mờ A trên U là tập đƣợc đặc trƣng bởi một hàm

A(x)


mà nó

liên kết mỗi phần tử x U với một số thực trong đoạn [0,1]. Giá trị hàm
biểu diễn mức độ thuộc của x trong A.

A(x)

A(x)

là một ánh xạ từ U vào [0,1] và

đƣợc gọi là hàm thuộc của tập mờ A.
Giá trị hàm

càng gần tới 1 thì mức độ thuộc của x trong A càng

A(x)

cao. Tập mờ là sự mở rộng của khái niệm tập hợp kinh điển. Thật vậy, khi A
là một tập hợp kinh điển, hàm thuộc của nó,

A(x),

chỉ nhận 2 giá trị 1 hoặc 0,

tƣơng ứng với x có nằm trong A hay không.
Một số hàm thuộc thông dụng trong ứng dụng của lý thuyết tập mờ:
- Dạng tam giác:

A(x)


= max(min((x-a)/(b-a),(c-x)/(c-b)),0),

- Dạng hình thang:

A(x)

- Dạng Gauss:

= exp(-(c-x)2/(2 2)),... trong đó a, b, c, d, ,... là các

A(x)

= max(min((x-a)/(b-a),(d-x)/(d-c),1),0),

tham số của hàm thuộc tƣơng ứng.
Các khái niệm, tính chất, phép toán trong lý thuyết tập kinh điển cũng đƣợc
mở rộng cho các tập mờ. Theo đó, các phép toán nhƣ t-norm,t-conorm, negation
và phép kéo theo (implication),... trong lôgíc mờ đƣợc đề xuất, nghiên cứu chi
tiết cung cấp cho các mô hình ứng dụng giải các bài toán thực tế.
Một khái niệm quan trọng trong việc tiếp cận giải bài toán phân lớp về
sau trong luận văn đó là phân hoạch mờ (fuzzy partition). Về hình thức, chúng
ta định nghĩa nhƣ sau.

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

6
Định nghĩa 1.2 [2] Cho p điểm cố định m1

b]

R. Khi đó tập Ф gồm p tập mờ A1, A2,..., Ap(với

,

,...,

là các

hàm thuộc tƣơng ứng) định nghĩa trên U đƣợc gọi là một phân hoạch mờ của
U nếu các điều kiện sau thỏa mãn, k=1,..., p:
(1)

(mk) = 1 (mk đƣợc gọi là một điểm trong lõi của Ak);

(2) Nếu x [mk-1, mk+1],

(x) = 0 (trong đó m0 = m1 = a và mp+1 = mp= b);

(3)

(x) liên tục;

(4)

(x) đơn điệu tăng trên [mk-1, mk] và đơn điệu giảm trên [mk,

mk+1];
(5)


x U,

k, sao cho

(x) > 0 (tất cả mọi điểm trong U đều thuộc

một lớp của phân hoạch này với độ thuộc nào đó khác không).
Ngoài ra, các tác giả trong đƣa thêm một số điều kiện để đảm bảo phân
hoạch mờ là đều và mạnh.
Nhƣ vậy, theo định nghĩa, tập các tập mờ là không gian Ƒ (U,[0,1]) các
hàm từ U vào đoạn [0,1], một không gian tƣơng đối giàu về cấu trúc tính toán
mà nhiều nhà nghiên cứu đã sử dụng cho việc mô phỏng phƣơng pháp lập
luận của con ngƣời.
Thực tế các khái niệm mờ trong các bài toán ứng dụng rất đa dạng và
khó để xác định đƣợc các hàm thuộc của chúng một cách chính xác, thông
thƣờng dựa trên ngữ cảnh mà khái niệm mờ đó đang đƣợc sử dụng. Một lớp
rộng các khái niệm mờ có thể mô hình qua các tập mờ mà L. A. Zadeh đã đƣa
ra gọi là biến ngôn ngữ.
1.2.2. Khai phá tri thức với thông tin mờ
Biến ngôn ngữ
L.A.Zadeh viết “khi thiếu hụt tính chính xác bề ngoài của những vấn đề
phức tạp, một cách tự nhiên là tìm cách sử dụng các biến ngôn ngữ, đó là các
biến mà giá trị của chúng không phải là số mà là các từ hoặc các câu trong
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

7
ngôn ngữ tự nhiên hoặc nhân tạo. Động lực cho việc sử dụng các từ, các câu

hơn các số là đặc trƣng ngôn ngữ của các từ, các câu thƣờng là ít xác định hơn
của số”(Zaddeh [9]).
Trong cơ sở dữ liệu quan hệ, các quan hệ hay các bảng dữ liệu chứa các
thuộc tính hay các tên cột. Nó chỉ tính chất của đối tƣợng. Các thuộc tính này
cũng thể hiện trong ngôn ngữ nhƣ để mô tả tính chất đối tƣợng là con ngƣời,
trong ngôn ngữ tự nhiên chúng ta có những thuộc tính TUỔI, CHIỀU CAO,
LƢƠNG, NĂNG LỰC …. Các thuộc tính này có thể đƣợc mô tả bằng giá trị
ngôn ngữ nhƣ trẻ, già, rất trẻ, … Vì lý do nhƣ vậy, Zadeh gọi các thuộc tính
kiểu nhƣ vậy là biến ngôn ngữ và miền giá trị của chúng là giá trị ngôn ngữ
hay gọi là miền ngôn ngữ (linguistic domain). Tuy nhiên, nhƣ chúng ta đã đề
cập trong Mục 1.1, vì bản thân giá trị ngôn ngữ không phải là đối tƣợng toán
học, ngữ nghĩa của chúng đƣợc biểu thị bằng các tập mờ hay hàm thuộc. Để
khái niệm biến ngôn ngữ trở thành một khái niệm toán học, Zadeh hình thức
hóa khái niệm này nhƣ sau:
Định nghĩa 1.3. [4] Biến ngôn ngữ là một bộ năm (X, T (X), U, R, M ),
trong đó X là tên biến, T(X) là tập các giá trị ngôn ngữ của biến X, U là không
gian tham chiếu của biến cơ sở u, mỗi giá trị ngôn ngữ xem nhƣ là một biến
mờ trên U kết hợp với biến cơ sở u, R là một qui tắc cú pháp sinh các giá trị
ngôn ngữ của T(X), M là qui tắc ngữ nghĩa gán mỗi giá trị ngôn ngữ trong
T(X) với một tập mờ trên U.
Ví dụ 1.1. [4] Cho X là biến ngôn ngữ có tên là AGE, biến cơ sở u lấy
theo số điểm của học viên có thang điểm miền xác định là U = [0,100]. Tập
các giá trị ngôn ngữ T(AGE) = {good, very good, more or less bed, less bed,
very bed….}. R là một qui tắc sinh các giá trị này. M gán ngữ nghĩa mỗi tập

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

8

mờ với một giá trị ngôn ngữ. Chẳng hạn, đối với giá trị nguyên thủy good,
quy tắc gắn ngữ nghĩa M cho good bằng tập mờ sau:
M(good) ={(u, µgood(u))}: u∈[0,100]},
Trong đó µgood(u) = max(min(1,(u-50)/20),0), là một cách chọn hàm
thuộc cho khái niệm mờ good.
Các đặc trƣng của biến ngôn ngữ
Trong thực tế có rất nhiều biến ngôn ngữ khác nhau về các giá trị nguyên
thuỷ, chẳng hạn nhƣ biến ngôn ngữ SỐ NGÀY LÀM VIỆC có giá trị nguyên
thuỷ là ít, nhiều, biến ngôn ngữ LƢƠNG có giá trị nguyên thuỷ là thấp,
cao…..Tuy nhiên, những kết quả nghiên cứu đối với một miền trị của một
biến ngôn ngữ cụ thể vẫn giữ đƣợc ý nghĩa về mặt cấu trúc đối với miền giá
trị của các biến còn lại. Đặc trƣng này đƣợc gọi là tính phổ quát của biến
ngôn ngữ. Ngữ nghĩa của các gia tử và các liên từ hoàn toàn độc lập với
ngữ cảnh, điều này khác với giá trị nguyên thủy của các biến ngôn ngữ lại
phụ thuộc vào ngữ cảnh. Ví dụ ta nói LƢƠNG của cán bộ An là rất cao, khi
đó đƣợc hiểu rằng LƢƠNG khoảng trên 8.000.000 đồng, nhƣng ta nói
CHIỀU CAO của cán bộ An là rất cao thì đƣợc hiểu rằng CHIỀU CAO
khoảng trên 1.8 m. Do đó khi tìm kiếm mô hình cho các gia tử và các liên
từ chúng ta không quan tâm đến giá trị nguyên thuỷ của biến ngôn ngữ
đang xét. Đặc trƣng này đƣợc gọi là tính độc lập ngữ cảnh của gia tử và
liên từ. Các đặc trƣng trên cho phép chúng ta sử dụng cùng một tập các gia
tử và xây dựng một cấu trúc toán học duy nhất cho miền giá trị của các
biến ngôn ngữ khác nhau.
Xét một biến ngôn ngữ X nhƣ đã đƣợc định nghĩa ở trên. Trƣớc hết,
chúng ta có nhận xét rằng, nhìn chung, tập ảnh của tập T(X) qua ánh xạ M(X)
không có cấu trúc đại số, trên đó chúng ta không định nghĩa đƣợc các phép u
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>


9
∈ [0,50] u ∈ [50,100]. Một lý do nữa làm cho chúng ta không quan tâm đến
điều này là cấu trúc đại số của tập gốc T(X) cũng chƣa đƣợc phát hiện. Trong
khi chúng ta chƣa phát hiện ra cấu trúc đại số của miền T(X), trong mục này
chúng ta sẽ định nghĩa trên tập F(U, [0,1]) một cấu trúc đại số. Cũng cần nhấn
mạnh rằng mục tiêu của lý thuyết tập mờ là mô hình hóa toán học ngữ nghĩa
của các khái niệm mờ và, quan trọng nhất, là mô hình hóa phƣơng pháp lập
luận của con ngƣời. Đây là một vấn đề cực kỳ khó và phức tạp vì những vấn
đề này thuộc loại có cấu trúc yếu, hay khó có thể có một cấu trúc toán duy
nhất mô hình hóa trọn vẹn những vấn đề nêu trên. Nhƣ là một hệ quả, khó
lòng chúng ta tìm đƣợc một cấu trúc toán học chặt chẽ, đẹp của tập F(U, [0,
1]). Chính vì vậy chúng ta không có một ràng buộc chặt chẽ, minh bạch trong
định nghĩa các phép toán trong F(U, [0, 1]). Nhƣ chúng ta sẽ thấy dƣới đây,
chúng ta có nhiều cách khác nhau để định nghĩa các phép tính và do đó nó tạo
ra tính mềm dẻo, đa dạng trong tiếp cận, thích nghi với các bài toán ứng dụng
khác nhau, miễn là nó cho phép giải quyết đƣợc các bài toán ứng dụng, đặc
biệt các bài toán thuộc lĩnh vực trí tuệ nhân tạo.
Trƣớc khi định nghĩa các phép tính trong F(U, [0, 1]), chúng ta hãy xem
đoạn [0, 1] nhƣ là một cấu trúc dàn L[0, 1] = ([0, 1], ∪, ∩, -) với thứ tự tự
nhiên trên đoạn [0, 1]. Khi đó, với mọi a, b ∈ [0, 1], ta có:
a ∪ b = max {a, b}, a ∩ b = min {a, b} và - a = 1 − b.
Chúng ta có thể kiểm chứng rằng L[0, 1] = ([0, 1], ∪, ∩, -) là một đại số
De Morgan, hơn nữa nó có các tính chất sau:
- Các phép tính hợp ∪ và giao ∩ có tính giao hoán
a ∪ b = b ∪ a và a ∩ b = b ∩ a
- Các phép tính hợp ∪ và giao ∩ có tính chất phân phối lẫn nhau
a ∪(b ∩ c) = (a ∪ b) ∩ (a ∪ c) và a ∩ (b ∪ c) = (a ∩ b) ∪(a ∩ c)
- Tính chất nuốt (absorption) và nuốt đối ngẫu (dual absorption):
- Tính chất nuốt
Số hóa bởi Trung tâm Học liệu - ĐHTN


: a ∩ (a ∪ b) = a,
/>

10
- Tính chất nuốt đối ngẫu

: a ∪(a ∩ b) = a.

- Tính lũy đẳng

: a ∪ a = a và a ∩ a = a

- Tính chất phủ phủ định

: -(-a) = a

- Tính đơn điệu giảm

: a ≤ b ⇒ -a ≥ -b

- Tính chất De Morgan

: -(a ∪b)= -a∩-b; -(a ∩ b) = -a ∪ -b.

Dựa trên cấu trúc L[0,1] chúng ta sẽ định nghĩa các phép tính trên tập
mờ thông qua các phép tính của dàn L[0,1].
Lập luận xấp xỉ
Hệ mờ áp dụng cho lập luận xấp xỉ đƣợc phát triển dựa trên lý thuyết tập
mờ, với những ràng buộc nhất định, đƣợc xem nhƣ là một bộ xấp xỉ vạn năng.

Hơn nữa, thế mạnh của hệ mờ là có thể xấp xỉ các hành vi hệ thống mà ở đó
các hàm giải tích hoặc các quan hệ dạng số không tồn tại. Vì vậy, hệ mờ có
tiềm năng to lớn để ứng dụng vào việc giải quyết các vấn đề của các hệ thống
phức tạp nhƣ hệ sinh học, hệ xã hội, hệ kinh tế và hệ thống chính trị. Mặt
khác, hệ mờ còn có thể ứng dụng trong các hệ thống ít phức tạp, ở đó không
cần một giải pháp chính xác mà chỉ cần một giải pháp xấp xỉ nhƣng nhanh
hơn, hiệu quả hơn và giảm chi phí tính toán.
Trong mô hình hệ mờ dạng luật, mỗi luật mờ thể hiện một tri thức của
con ngƣời về một bài toán ứng dụng và đƣợc biểu diễn dƣới dạng “If
Antecedents then Consequents”, trong đó Antecedents là các điều kiện chứa
các từ ngôn ngữ thƣờng đƣợc liên kết bởi liên từ “and” và Consequents là
phần kết luận biểu thị qua các vị từ mờ chứa khái niệm mờ hoặc vị từ kinh
điển. Nếu kết luận của luật là khái niệm mờ thì hệ mờ ở dạng Mamdani,
ngƣợc lại kết luận là giá trị rõ thì hệ mờ dạng Sugeno.Ví dụ về hai dạng luật
mờ tƣơng ứng [6]:
If X1 is Large and X2 is Very Small then Y is Normal,
If X1 is Small and X2 is Large then Y = “Iris-Setosa”.
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

11
Dƣới dạng tổng quát, một hệ mờ dạng luật có n đầu vào 1 đầu ra (MISO)
thƣờng phát biểu nhƣ sau:
If x1 is Ai1 and... and Xn is Ain then Y is Bi,

(1.1)

Trong đó X1, X2, …, Xn và Y là các biến ngôn ngữ thuộc không gian tham
chiếu U1,U2,..., Un và V, Aij, Bi (i = 1,…, M; j = 1,…, n) là các giá trị ngôn ngữ

tƣơng ứng.
Các luật mờ này đƣợc xây dựng hoặc dựa trên ý kiến chuyên gia về bài
toán ứng dụng hoặc sử dụng các kỹ thuật học máy để sinh trực tiếp từ các
mẫu dữ liệu thu thập đƣợc. Tuy nhiên, không phải bài toán nào cũng có
chuyên gia với các ý kiến đủ để xây dựng một hệ luật, thƣờng phải kết hợp
các phƣơng pháp sinh luật đảm bảo tính đầy đủ cho hệ luật đó.
Giải bài toán lập luận xấp xỉ theo mô hình (1.1) là xây dựng một phƣơng
pháp lập luận dựa trên các luật mờ để tính toán đầu ra từ các dữ liệu đầu vào
tƣơng ứng, tức tìm kết quả B′ của Y khi biết giá trị A′1, A′2,..., A′n tƣơng ứng
với các biến X1, X2, …, Xn. Vì chúng ta đang ở trong môi trƣờng thông tin mờ,
không chắc chắn, nên không có một phƣơng pháp lập luận chính xác và duy
nhất. Mỗi phƣơng pháp sẽ xuất phát từ một quan sát trực quan nào đó.
Theo phƣơng pháp truyền thống, quy tắc modus ponens tổng quát hóa
đƣợc áp dụng cho hệ mờ dạng (1.1) cùng với việc sử dụng các phép toán lôgíc
mờ đã đƣợc nhiều tác giả đề cập. Ở đây tóm tắt nhƣ sau:
Xét mỗi luật mờ trong (1.1) là một quan hệ mờ Ri trên miền tích Đề-các
U =U1 × U2 ×... × Un× V với hàm thuộc đƣợc xác định bởi:
µRi = I(Tn(µAi,1,..., µAi,n), µBi)

(1.2)

Trong đó µAi,j, µBi là các hàm thuộc tƣơng ứng với Ai,j, Bi, Tn là phép tnorm n-ngôi và I là phép kéo theo. Kết nhập các luật mờ Ri (i = 1,..., m) của hệ
bằng phép t-conorm với hàm thuộc µR và áp dụng quy tắc suy diễn hợp thành
ta có kết quả:
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

12


Ở đây
Công thức (1.3) cho thấy phƣơng pháp lập luận này với những cách chọn
các phép t-norm, t-conorm hay kéo theo I dẫn đến những kết quả tính toán tập
mờ B′ khác nhau. Điều này phù hợp với đặc trƣng của lập luận xấp xỉ. Câu
hỏi về cách chọn các phép trên nhƣ thế nào để có một phƣơng pháp lập luận
tốt nói chung không có câu trả lời khẳng định mà phụ thuộc vào từng tình
huống ứng dụng cụ thể và đƣợc kiểm chứng qua kết quả thực nghiệm.
Mặt khác, hệ luật mờ dạng Sugeno với phần kết luận của các luật là một
mệnh đề kinh điển chứa hằng cá thể sẽ trở thành một trƣờng hợp riêng của
dạng (1.1) khi chọn đầu ra Bi có hàm thuộc ở dạng đơn tử. Tuy nhiên, luật mờ
dạng Sugeno với ƣu điểm có thể thể hiện các hành vi cục bộ của hệ thống
đƣợc ứng dụng và không cần giải mờ sau khi lập luận. Hơn nữa, trong nhiều
nghiên cứu của các tác giả nhƣ Ishibuchi H., Herrera F., Khotanzad A.,
Mansoori E.G.,... với việc sử dụng các luật mờ có phần kết luận chỉ chứa các
giá trị hằng cá thể đã đem lại kết quả rất khả quan. Đây là những lý do thúc
đẩy những nghiên cứu hơn nữa về các mô hình ứng dụng hệ luật mờ, đặc biệt
trƣờng hợp luật.
1.3. Khai phá tri thức theo cách tiếp cận của lý thuyết Đại số gia tử
1.3.1. Kiến thức cơ sở về ĐSGT
Vấn đề sử dụng tập mờ để biểu diễn các giá trị ngôn ngữ và dùng các
phép toán trên tập mờ để biểu thị các gia tử ngôn ngữ nhƣ µrất trẻ = (µ

trẻ)

2

,

µítnhiều trẻ= (µtrẻ)1/2 đã cho phép thực hiện các thao tác dữ liệu mờ, đáp ứng nhu
cầu thực tế của con ngƣời. Tuy nhiên, theo cách sử dụng tập mờ ta thấy có

nhiều nhƣợc điểm do việc xây dựng các hàm thuộc và xấp xỉ các giá trị ngôn
ngữ bởi các tập mờ còn mang tính chủ quan, phụ thuộc nhiều vào kiến chuyên
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

13
gia cho nên dễ mất mát thông tin và còn nhiều vấn đề đặt ra nhƣ việc phân
chia miền mờ thế nào cho hợp lý, làm sao xây dựng đƣợc các hàm thuộc
nhanh chóng, phù hợp và cách xử lý các hàm thuộc này thế nào để giữ đƣợc
ngữ nghĩa gắn với chúng. Mặt khác, bản thân các giá trị ngôn ngữ có một cấu
trúc thứ tự nhƣng ánh xạ gán nghĩa sang tập mờ, không bảo toàn cấu trúc đó
nữa. Do đó, vấn đề đặt ra là có một cấu trúc toán học mô phỏng chính xác hơn
cấu trúc ngữ nghĩa của một khái niệm mờ. N.C.Ho và cộng sự đƣa ra ĐSGT
và ĐSGT mở rộng và ĐSGT tuyến tính đầy đủ đƣợc giải đáp đầy đủ cho câu
hỏi này.
Đại số gia tử đƣợc ra đời do đề xuất của N.C. Ho và W. Wechler vào
năm 1990, đến nay đã có nhiều nghiên cứu phát triển và ứng dụng thành công
của các tác giả.
Các tác giả đã chứng minh miền ngôn ngữ X = Dom(X) của một biến
ngôn ngữ X có thể đƣợc tiên đề hóa và đƣợc gọi là đại số gia tử và đƣợc ký
hiệu là AX = (X, G, H, ) trong đó G là tập các phần tử sinh, H là tập các gia
tử (hedge) còn “ ” là quan hệ cảm sinh ngữ nghĩa trên X. Giả thiết trong G có
chứa các phần tử hằng 0, 1, W với ý nghĩa là phần tử bé nhất, phần tử lớn nhất
và phần tử trung hòa (neutral) trong X. Ta gọi mỗi giá trị ngôn ngữ x

X là

một hạng từ (term) trong ĐSGT [1].
Nếu tập X và H là các tập sắp thứ tự tuyến tính, khi đó AX = (X, G, H, )

là ĐSGT tuyến tính. Hơn nữa, nếu đƣợc trang bị thêm hai gia tử tới hạn là ∑
và Ф với ngữ nghĩa là cận trên đúng và cận dƣới đúng của tập H(x) khi tác
động lên x, thì ta đƣợc ĐSGT tuyến tính đầy đủ, ký hiệu AX = (X, G, H, ).
Ngoài ra, thông thƣờng trong các ứng dụng, miền giá trị của biến ngôn ngữ
bao gồm ccs từ sinh ra từ hai phần tử sinh đối xứng (nhƣ “cao” và “thấp”, “xa
và “gần”...). Vì trong luận văn chỉ quan tâm đến ĐSGT tuyến tính kể từ đây
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

14
nói ĐSGT cũng có nghĩa là ĐSGT tuyến tính. ĐSGT tuyến tính có hai phần
tử sinh đối xứng ký hiệu là c+ và c-. Nhƣ vậy, G={0, c+, W, c-,1}.
Thí dụ ĐSGT có X là miền giá trị của biến ngôn ngữ “chiều cao”, là tập
các từ nhƣ {“rất cao”, “thấp”, “rất rất thấp”, “tƣơng đối thấp”, “tƣơng đối rất
thấp”...}, với G={0, cao, W, thấp,1} và H = {“rất”, “tƣơng đối”,...} có quan
hệ

cảm sinh ngữ nghĩa nhƣ “rất cao” > “thấp” > “rất rất thấp”> “tƣơng đối

thấp”> “tƣơng đối rất thấp”...
Khi tác động gia tử h
hiệu hx.Với mỗi x

H vào phần tử x

X, thì thu đƣợc phần tử ký

X, ký hiệu H(x) là tập tất cả các hạng từ u


X sinh từ x

bằng cách áp dụng các gia tử trong H và viết u = hn…h1x, với hn, …, h1 H.
Tập H gồm các gia tử dƣơng H+ và gia tử âm H-. Các gia tử dƣơng làm
tăng ngữ nghĩa của một hạng từ mà nó tác động, còn gia tử âm làm giảm ngữ
nghĩa của hạng từ. Không mất tính tổng quát, ta luôn giả thiết rằng H- = {h-1<
h2<... < h-q}và H+ = {h1 < h2<... < hp}.
Để ý rằng biểu thức hn...h1u đƣợc gọi là một biểu diễn chính tắc của một
hạng từ x đối với u nếu x = hn...h1u và hi...h1u-1≠hi-1...h1u với i nguyên và i
n. Ta gọi độ dài của một hạng từ x là số gia tử trong biểu diễn chính tắc của
nó đối với phần tử sinh cộng thêm 1, ký hiệu l(x).
Ví dụ 1.2. Cho biến ngôn ngữ TRUTH, có G = {0, FALSE, W, TRUE,
1}, H-= { Possible < Little } và H+= { More < Very }. Khi đó TRUE TRUE Bây giờ chúng ta xét một số tính chất của đại số gia tử tuyến tính. Định
lý sau cho thấy tính thứ tự ngữ nghĩa của các hạng từ trong ĐSGT.
Định lý 1.1. [1] Cho tập H- và H+ là các tập sắp thứ tự tuyến tính của
ĐSGT AX = (X, G, H, ). Khi đó ta có các khẳng định sau:
(1) Với mỗi u

X thì H(u) là tập sắp thứ tự tuyến tính.

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

15
(2) Nếu X đƣợc sinh từ G bởi các gia tử và G là tập sắp thứ tự tuyến tính
thì X cũng là tập sắp thứ tự tuyến tính. Hơn nữa nếu u < v, và u, v là độc lập
với nhau, tức là u H(v) và v H(u), thì H(u) H(v).

Định lý tiếp theo xem xét sự so sánh của hai hạng từ trong miền ngôn
ngữ của biến x.
Định lý 1.2. [1] Cho x = hn…h1u và y = km…k1u là hai biểu diễn chính tắc
của x và y đối với u. Khi đó tồn tại chỉ số j ≤ min{n, m} + 1 sao cho hj' = kj' với
mọi j' j = n + 1 ≤ m hoặc kj = I, j = m + 1 ≤ n) và
(1) x < y khi và chỉ khi hjxj< kjxj, trong đó xj = hj-1...h1u.
(2) x = y khi và chỉ khi m = n và hjxj< kjxj.
(3) x và y là không so sánh đƣợc với nhau khi và chỉ khi hjxj< kjxj là
không so sánh đƣợc với nhau.
Trong phần tiếp theo, chúng ta trình bày một số vần đề của đại số gia tử
làm cơ sở cho việc nghiên cứu và phát triển một số mô hình lập luận và ứng
dụng về sau.
1.3.2. Khai phá tri thức với thông tin mờ theo cách tiếp cận ĐSGT
Trong phần này chúng ta xem xét ba vấn đề cơ bản đó là độ đo tính mờ
của các giá trị ngôn ngữ (hạng từ), phƣơng pháp định lƣợng ngữ nghĩa và
khoảng tính mờ của các khái niệm mờ.
Tính mờ của các giá trị ngôn ngữ xuất phát từ thực tế rằng một giá trị
ngôn ngữ mang ý nghĩa mô tả cho nhiều sự vật và hiện tƣợng trong thế giới
thực, với lý do tập hữu hạn các giá trị ngôn ngữ không đủ để phản ánh thế
giới vô hạn các sự vật hiện tƣợng. Nhƣ vậy khái niệm tính mờ và độ đo tính
mờ của một giá trị ngôn ngữ đƣợc hình thành và nó là một khái niệm rất khó
xác định, đặc biệt trong lý thuyết tập mờ. Tuy nhiên, trong ĐSGT các tác giả
đã cho thấy độ đo tính mờ đƣợc xác định một cách hợp lý: “tính mờ của một
Số hóa bởi Trung tâm Học liệu - ĐHTN
/>

16
hạng từ x được hiểu như là ngữ nghĩa của nó vẫn có thể được thay đổi khi tác
động vào nó bằng các gia tử”. Do đó, tập các hạng từ sinh từ x bằng các gia

tử sẽ thể hiện cho tính mờ của x và do đó, H(x) có thể sử dụng nhƣ là một mô
hình biểu thị tính mờ của x và kích thƣớc tập H(x) đƣợc xem nhƣ độ đo tính
mờ của x. Ta có định nghĩa sau về độ đo tính mờ.
Định nghĩa 1.4. [1] Cho AX = (X, G, H, Σ,Φ,µ,≤) là một ĐSGT tuyến
tính đầy đủ. Ánh xạ fm : X → [0,1] đƣợc gọi là một đo tính mờ của các hạng
từ trong X nếu:
(1) fm là đo mờ đầy đủ trên X, tức là fm(c-) + fm(c+) =1 và ∑h Hfm(hu) =
fm(u), u

X;

(2) fm(x) = 0, với các x thỏa H(x) = {x}. Đặc biệt, fm(0) = fm(W) = fm(1) = 0;
, nghĩa là tỷ số này không phụ

(3)

thuộc vào x và y, vì vậy nó đƣợc gọi là độ đo tính mờ của các gia tử và đƣợc
ký hiệu bởi μ(h).
Trong đó, điều kiện (1) thể hiện tính đầy đủ của các phần tử sinh và các
gia tử cho việc biểu diễn ngữ nghĩa của miền thực đối với các biến. (2) thể
hiện tính rõ của các hạng từ và (3) có thể đƣợc chấp nhận vì chúng ta đã chấp
nhận giả thiết rằng các gia tử là độc lập với ngữ cảnh và, do vậy, khi áp dụng
một gia tử h lên các hạng từ thì hiệu quả tác động tƣơng đối làm thay đổi ngữ
nghĩa của các hạng từ đó là nhƣ nhau. Hình vẽ sau (Hình 1.1) minh họa rõ
hơn cho khái niệm độ đo tính mờ của biến ngôn ngữ TRUTH.
Các tính chất của độ đo tính mờ của các hạng từ và gia tử đƣợc thể hiện
qua mệnh đề sau:
Mệnh đề 1.1. Với độ đo tính mờ fm và m đã đƣợc định nghĩa trong Định
nghĩa 1.4, ta có:
(1) fm(c-) + fm(c+) = 1 và Σh

(2)
Số hóa bởi Trung tâm Học liệu - ĐHTN

H

fm(hx) = fm(x);
với >0 và
/>

17
fm, trong đó Xk là tập các hạng từ có độ dài đúng k;

(3)

(4) fm(hx) = µ(h).fm(x), và x X, fm(Σx) = fm(Φx) = 0;
(5) Cho fm(c-), fm(c+) và µ(h) với h H, khi đó với x = hn...h1c ,

{-,+},

dễ dàng tính đƣợc độ đo tính mờ của x nhƣ sau:
fm(x) = µ(hn)...µ(h1)fm(c ).

Hình 1.1. Độ đo tính mờ của biến TRUTH
Với ĐSGT, các khoảng tính mờ của tập các phần tử có cùng độ dài sẽ
tạo nên một phân hoạch trên miền xác định của thuộc tính. Các khoảng tính
mờ này có độ dài tƣơng ứng với độ đo tính mờ của từng phần tử. Ngoài ra,
các khoảng tính mờ này đƣợc sắp xếp trên miền xác định theo thứ tự tự nhiên
của các phần tử và trong mỗi khoảng tính mờ có một điểm đại diện cho
khoảng tính mờ đó, gọi là giá trị định lƣợng ngữ nghĩa. Tuy có nhiều phƣơng
pháp xác định giá trị định lƣợng của các hạng từ dựa trên các tham số này

nhƣng phải thỏa mãn một số ràng buộc nhất định và đƣợc thể hiện trong định
nghĩa sau.
Định nghĩa 1.5. Cho AX = (X, G, H, ∑, Φ, ≤) là một ĐSGT tuyến tính
đầy đủ. Ánh xạ υ : X → [0,1] đƣợc gọi là một hàm định lƣợng ngữ nghĩa
(SQM) của AX nếu:
(1) υ là ánh xạ 1-1 từ tập X vào đoạn [0,1] và đảm bảo thứ tự trên X, tức
là x, y∈X, x < y⇒υ(x) <υ(y) và υ(0) = 0, υ(1) = 1.

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

18
(2) υ liên tục: ∀x ∈X, υ(Φx) = infimumυ(H(x)) và υ(∑x) = supremum
υ(H(x)).
Điều kiện (1) là bắt buộc tối thiểu đối với bất kỳ phƣơng pháp định
lƣợng nào, còn điều kiện (2) đảm bảo tính trù mật của H(G) trong X. Dựa trên
những ràng buộc này, các tác giả trong đã xây dựng một phƣơng pháp định
lƣợng ngữ nghĩa của các hạng từ trong ĐSGT.
Các gia tử dƣơng làm tăng ngữ nghĩa của một hạng từ mà nó tác động,
còn gia tử âm làm giảm ngữ nghĩa của hạng từ. Để biểu diễn tính dƣơng âm
của một gia tử đối với một hạng từ Trƣớc hết chúng ta xét định nghĩa về dấu
của các hạng từ nhƣ sau.
Định nghĩa 1.6.[1] Một hàm dấu Sign : X → {-1,0,1} là một ánh xạ
đƣợc định nghĩa đệ qui nhƣ sau, trong đó h, h'∈H và c ∈ {c -, c + }:
(1) Sign(c-) = -1, Sign(c+) = 1;
(2) Sign(hc) = -Sign(c) nếu h âm đối với c; Sign(hc) = Sign(c) nếu h
dƣơng đối với c;
(3) Sign(h'hx) = -Sign(hx), nếu h'hx ≠ hx và h' âm đối với h; Sign(h'hx) =
Sign(hx), nếu h'hx ≠ hx và h' dƣơng đối với h;

(4) Sign(h'hx) = 0, nếu h'hx = hx.
Dựa trên hàm dấu này, chúng ta có tiêu chuẩn để so sánh hx và x.
Mệnh đề 1.2.[1] Với bất kỳ h và x, nếu Sign(hx) = 1 thì hx>x; nếu
Sign(hx) = -1 thì hx < x và nếu Sign(hx) = 0 thì hx = x.
Định nghĩa 1.7.[1] Cho AX là một ĐSGT tuyến tính đầy đủ và fm là
một độ đo tính mờ trên X. Ta nói ánh xạ υ : X → [0,1] đƣợc cảm sinh bởi độ
đo tính mờ fm nếu đƣợc định nghĩa bằng đệ qui nhƣ sau:
(1) υ(W) = θ = fm(c-), υ(c-) = θ - α.fm(c-) = β. fm(c-), υ(c+) = θ
+α.fm(c+);

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

×