Tải bản đầy đủ (.pdf) (120 trang)

Nghiên cứu về tập mờ loại hai đại số gia tử

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.43 MB, 120 trang )

....

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
––––––––––––––––––

PHAN ANH PHONG

NGHIÊN CỨU VỀ TẬP MỜ LOẠI HAI
ĐẠI SỐ GIA TỬ

LUẬN ÁN TIẾN SĨ KỸ THUẬT

Hà Nội – 2012


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

––––––––––––––––––

NGHIÊN CỨU VỀ TẬP MỜ LOẠI HAI
ĐẠI SỐ GIA TỬ

Chuyên ngành: Hệ thống thông tin.
Mã số: 62.48.05.01

LUẬN ÁN TIẾN SĨ KỸ THUẬT

Hà Nội – 2012



- ii -

LỜI CAM ĐOAN

Tôi xin cam đoan đây là cơng trình nghiên cứu của riêng tơi. Các kết quả trong
luận án là trung thực và chưa từng được công bố trong bất kỳ cơng trình nào
khác. Các kết quả được viết chung với các tác giả khác đều được sự đồng ý của
đồng tác giả trước khi đưa vào luận án.

Hà Nội, ngày 02 tháng 4 năm 2012
Nghiên cứu sinh

Phan Anh Phong


- iii -

LỜI CẢM ƠN

Luận án được hoàn thành tại trường Đại học Bách khoa Hà Nội. Để hoàn thành
luận án này, tác giả đã nhận được sự chỉ bảo tận tình, cùng những yêu cầu
nghiêm khắc của PGS. TS. Trần Đình Khang, người đã truyền đạt nhiều kiến
thức q báu cũng như những kinh nghiệm nghiên cứu khoa học trong suốt thời
gian tác giả theo học chương trình đào tạo tiến sĩ. Lời đầu tiên, tác giả xin bày tỏ
lịng kính trọng và biết ơn sâu sắc tới Thầy.
Xin chân thành gửi lời cảm ơn tới PGS. TS. Nguyễn Kim Anh, PGS. TS.
Nguyễn Văn Long, PGS. TS. Lê Thanh Hương, TS. Trần Đức Khánh, TS. Vũ
Như Lân, TS. Vũ Tuyết Trinh, TS. Huỳnh Thị Thanh Bình, TS. Nguyễn Thị
Oanh, TS. Phạm Thanh Hà và TS. Lê Văn Hưng về các báo cáo hữu ích tại các

seminar của Bộ mơn Hệ thống thông tin.
Tác giả xin chân thành gửi lời cảm ơn đến Viện Công nghệ thông tin và
Truyền thông, Viện Đào tạo Sau đại học, và Bộ môn Hệ thống thông tin thuộc
trường Đại học Bách khoa Hà Nội đã tạo điều kiện thuận lợi trong quá trình học
tập, nghiên cứu và hoàn thành luận án.
Xin cảm ơn Ban giám hiệu, Ban chủ nhiệm khoa Công nghệ Thông tin và
các Phòng ban chức năng thuộc trường Đại học Vinh đã quan tâm giúp đỡ để tác
giả có thể thực hiện kế hoạch nghiên cứu đúng tiến độ.
Qua đây, cho phép tác giả gửi lời cám ơn đến Quỹ Phát triển Khoa học và
Công nghệ Quốc gia Việt Nam (Nafosted) đã tài trợ một phần kinh phí cho
nghiên cứu này.
Cảm ơn các Thầy giáo, cô giáo và các anh chị em ở Bộ môn Hệ thống thông
tin - Viện Công nghệ thông tin và Truyền Thông, trường Đại học Bách khoa Hà
Nội, các đồng nghiệp thuộc Khoa Công nghệ thông tin - Trường Đại học Vinh
đã động viên và trao đổi kinh nghiệm để tác giả có thể hồn thành luận án.


- iv -

Cám ơn Kỹ sư Đinh Khắc Đông đã phối hợp nhiệt tình với tác giả trong quá
trình nghiên cứu.
Sự quan tâm, mong mỏi của mọi thành viên trong Gia đình là một trong
những động cơ để tác giả nỗ lực học tập, nghiên cứu. Luận án này, như một món
quà tinh thần, xin đáp lại những niềm quan tâm, mong mỏi đó.
Cuối cùng, tác giả xin biểu thị sự biết ơn tới những người thân và bạn bè đã
ưu ái, giúp đỡ, động viên, khích lệ để tác giả hoàn thành luận án này.


-v-


MỤC LỤC

Lời cam đoan ........................................................................................ ii
Danh mục các ký hiệu và chữ viết tắt .............................................. viii
Danh mục các bảng. .............................................................................ix
Danh mục các hình vẽ ........................................................................... x
MỞ ĐẦU ....................................................................................................... 1
1. CÁC KIẾN THỨC LIÊN QUAN ........................................................... 7
1.1. Tập mờ ................................................................................................... 7
1.1.1. Kiến thức cơ bản về tập mờ.............................................................. 7
1.1.2. Biến ngôn ngữ.................................................................................. 9
1.1.3. Hệ lôgic mờ loại một...................................................................... 12
1.1.4. Một số vấn đề của hệ lôgic mờ loại một ......................................... 15
1.2. Tập mờ loại hai ..................................................................................... 16
1.2.1. Tập mờ loại hai và các khái niệm ................................................... 16
1.2.2. Biểu diễn tập mờ loại hai ................................................................ 18
1.2.3. Các phép toán tập hợp trên tập mờ loại hai..................................... 21
1.2.4. Hệ lôgic mờ loại hai ....................................................................... 24
1.3. Đại số gia tử.......................................................................................... 28
1.3.1. Đại số gia tử của biến ngơn ngữ ..................................................... 29
1.3.2. Độ đo tính mờ, khoảng tính mờ, ánh xạ định lượng ngữ nghĩa ....... 31
1.4. Tập mờ loại hai đại số gia tử ................................................................. 35
1.5. Kết luận Chương 1 ................................................................................ 35


- vi -

2. CÁC PHÉP TOÁN VỚI CÁC GIÁ TRỊ CHÂN LÝ NGÔN NGỮ .. 36
2.1. Một số thuật ngữ và khái niệm .............................................................. 36
2.2. Phép rút gọn gia tử ................................................................................ 37

2.3. Meet và Join các giá trị chân lý ngơn ngữ ............................................. 39
2.4. Tiếp cận tính tốn Meet và Join các trị chân lý ngôn ngữ ...................... 42
2.5. Kết luận Chương 2 ................................................................................ 49

3. TẬP MỜ LOẠI HAI ĐẠI SỐ GIA TỬ ............................................... 50
3.1. Định nghĩa và các khái niệm liên quan.................................................. 50
3.2. Biểu diễn tập mờ loại hai đại số gia tử .................................................. 51
3.3. Các phép toán tập hợp ........................................................................... 55
3.4. Suy diễn với tập mờ loại hai đại số gia tử ............................................. 58
3.5. Quan hệ giữa HaT2FS với tập mờ loại hai khoảng................................ 61
3.5.1. Trọng tâm của tập mờ loại hai đại số gia tử .................................... 61
3.5.2. Quan hệ giữa HaT2FS với tập mờ loại hai khoảng ......................... 62
3.6. Quan hệ giữa HaT2FS với tập mờ loại một ........................................... 68
3.6.1. Giảm loại tập mờ loại hai đại số gia tử ........................................... 68
3.6.2. Chuyển tập mờ loại một thành tập mờ loại hai đại số gia tử ........... 68
3.7. Kết luận Chương 3 ................................................................................ 71

4. MỘT PHƯƠNG PHÁP XÂY DỰNG HỆ LÔGIC MỜ LOẠI HAI
ĐẠI SỐ GIA TỬ ........................................................................................ 72
4.1. Hệ lôgic mờ loại hai đại số gia tử .......................................................... 73
4.1.1. Mờ hóa........................................................................................... 73
4.1.2. Cơ sở luật ....................................................................................... 74
4.1.3. Mô tơ suy diễn ............................................................................... 74
4.1.4. Bộ phận xử lý đầu ra ...................................................................... 75
4.2. Xây dựng hệ lôgic mờ loại hai đại số gia tử .......................................... 76


- vii -

4.2.1. Thuật toán FCM và thuật toán di truyền ......................................... 77

4.2.2. Xây dựng hệ lôgic mờ loại một ...................................................... 79
4.2.3. Xây dựng hệ lôgic mờ loại hai đại số gia tử ................................... 84
4.2.4. Thử nghiệm 1: Xấp xỉ hàm phi tuyến .............................................. 86
4.2.4.1. Bài toán .................................................................................... 86
4.2.4.1. So sánh kết quả ........................................................................ 86
4.2.5. Thử nghiệm 2: Dự báo thời gian sống của bệnh nhân viêm tủy ....... 88
4.2.5.1. Bài toán .................................................................................... 88
4.2.5.2. So sánh kết quả ........................................................................ 89
4.3. Kết luận Chương 4 ................................................................................ 92

5. KẾT QUẢ VÀ BÀN LUẬN .................................................................. 93
KẾT LUẬN VÀ KIẾN NGHỊ................................................................... 97

Tài liệu tham khảo .............................................................................. 99
Danh mục các cơng trình khoa học đã công bố của luận án........... 106
Phụ lục 1 – Bộ dữ liệu bệnh nhân viêm tủy ..................................... 108


- viii -

DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT

Các ký hiệu :

Giải nghĩa

Ã

Một tập mờ loại hai


Â

Một tập mờ loại hai đại số gia tử

⊓, ⊔

Phép Meet và Join các tập mờ loại một



Phép t-norm min hoặc product
Một giá trị chân lý ngôn ngữ

∆, ∇



Phép HA-Meet, HA-Join các giá trị chân lý ngôn ngữ
kế thừa ngữ nghĩa từ
Hợp gia tử

Các chữ viết tắt: Giải nghĩa
ĐSGT

Đại số gia tử

GA

Genetic Algorithm


FCM

Fuzzy C-Means

JAC

Join Approximation Criterion

HaT2FS

Hedge Algebraic Type-2 Fuzzy Set

HaT2-FLS

Hedge Algebraic Type-2 Fuzzy Logic System

HR

Hedge Reduction

LSE

Leats Square Error

LMF

Lower Membership Function

MAC


Meet Approximation Criterion

MSE

Mean Square Error

FOU

Footprint of Uncertainty

T1FS

Type-1 Fuzzy Set

T1-FLS

Type-1 Fuzzy Logic System

T2FS

Type-2 Fuzzy Set

T2-FLS

Type-2 Fuzzy Logic System

UMF

Upper Membership Function



- ix -

DANH MỤC CÁC BẢNG

1.1

Các giá trị ngôn ngữ của biến HEALTH và AGE............................... 11

1.2

Một ví dụ về quan hệ SIG,. ............................................................... 31

4.1

Sai số MSE của các hệ lôgic mờ ...................................................... 81

4.2

Sai số LSE của các hệ lôgic mờ ........................................................ 91


-x-

DANH MỤC CÁC HÌNH VẼ

1.1

Một ví dụ về tập mờ hình thang .......................................................... 8


1.2

Các thành phần của hệ lơgic mờ loại một.......................................... 12

1.3

Một ví dụ về hàm thuộc loại hai........................................................ 17

1.4

Một ví dụ về FOU của tập mờ loại hai .............................................. 18

1.5

Một tập mờ loại hai nhúng của hàm thuộc loại hai............................ 20

1.6

Các thành phần của hệ lôgic mờ loại hai ........................................... 24

2.1

Kết quả trực quan của

2.2

Kết quả trực quan của

4.1


Các thành phần của hệ lôgic mờ loại hai đại số gia tử. ...................... 74

4.2

Sơ đồ xây dựng hệ lôgic mờ loại hai đại số gia tử ............................. 78

4.3

Tập tham số của các hàm thuộc loại một .......................................... 79

4.4

Minh họa quá trình lai ghép đơn điểm .............................................. 82

4.5

Các T1FS tương ứng với các biến LogBUN, HGB và S_TIME. ....... 90

4.6

Dự báo thời gian sống của bệnh nhân viêm tủy với các hệ mờ. ......... 91

khi
khi

kế thừa ngữ nghĩa từ .......... 42
kế thừa ngữ nghĩa từ

........... 42



-1-

MỞ ĐẦU

1. Tính cấp thiết của đề tài
Vào những năm 60 của thế kỷ trước L. A. Zadeh đã sáng tạo ra tập mờ (tập mờ
loại một –T1FS), đây là cơng cụ tốn học đầu tiên có thể phối hợp với hai dạng
dữ liệu phổ biến trong thế giới thực, là giá trị số và giá trị ngôn ngữ [70].
Cùng với tập mờ, biến ngôn ngữ và lập luận xấp xỉ là những kiến thức cơ sở
quan trọng để phát triển các hệ lơgic mờ (hay cịn gọi là hệ lôgic mờ loại một).
Hơn 40 năm qua, các tập mờ loại một đã có mặt trong rất nhiều ứng dụng, chẳng
hạn, ứng dụng trong kỹ thuật điều khiển [11, 15, 32, 69, 72, 74], trong chẩn đoán
y tế [32, 33, 59], hay ứng dụng trong tìm kiếm thơng tin [35, 58, 72],…
Tuy nhiên, theo M. Black, các giá trị số vẫn khơng hồn tồn chính xác, vì
kết quả của các phép đo khoa học ln ẩn chứa nhiễu và có phần không chắc
chắn [12]. Các trị ngôn ngữ là mờ và khơng chắc chắn là điều dễ hiểu, vì bản
chất của chúng là định tính [71], hơn nữa các giá trị ngơn ngữ cịn phụ thuộc vào
nhận thức, văn hóa,…[54]. Vì vậy, sự phối hợp của tập mờ loại một và các hệ
lôgic mờ loại một với hai dạng dữ liệu trên có những khó khăn nhất định. Mấu
chốt của vấn đề này đều xuất phát từ độ thuộc rõ trong các tập mờ loại một [32].
Gần đây, J. M. Mendel và R. I. John đã cho thấy, có ít nhất bốn lý do về sự
không chắc chắn khi xây dựng và sử dụng các hệ lôgic mờ dựa trên luật. Một là,
sự không chắc chắn về ngữ nghĩa của các từ sử dụng trong các luật, vì mỗi từ có
ngữ nghĩa khác nhau từ những người khác nhau. Hai là, sự không chắc chắn của
phần kết luận sử dụng trong mỗi luật, vì các chun gia có thể có các ý kiến khác
nhau về kết luận của một luật. Ba là, sự không chắc chắn về các độ đo kích hoạt
hệ lơgic mờ, và cuối cùng, là sự khơng chắc chắn về dữ liệu dùng huấn luyện hệ
lôgic mờ [48, 52].
Theo G. J. Klir và T. A. Folger [32], mặc dầu những khó khăn trên khơng gây

ra vấn đề gì nghiêm trọng trong những ứng dụng sử dụng T1FS, tuy nhiên, sẽ


-2-

hợp lý hơn khi sử dụng tập mờ có độ thuộc mờ thay vì độ thuộc rõ, và tập được
mơ tả như vậy chính là tập mờ loại hai (T2FS- Type 2 Fuzzy Set). Trong [48 52], J. M. Mendel và R. I. John cũng nhấn mạnh, T2FS và các hệ lơgic mờ loại
hai có thể khắc phục phần nào các nhược điểm của các T1FS cũng như các hệ
lôgic mờ loại một.
Năm 1975, bằng cách mở rộng tập mờ loại một, L. A. Zadeh đã đề xuất khái
niệm tập mờ loại hai. Một cách hình thức, T2FS là tập mờ mà độ thuộc của mỗi
phần tử cũng mờ, đó là một T1FS trên J  [0,1]. Như một quy luật, càng mở
rộng thì các lý thuyết càng phức tạp, do vậy khả năng ứng dụng của T2FS gặp
nhiều khó khăn. Việc tính tốn trên tập mờ loại hai đều dựa vào độ thuộc mờ của
chúng, là những tập mờ loại một, nên khối lượng tính tốn trong các hệ thống sử
dụng tập mờ loại hai tổng quát là rất lớn. Hơn nữa, quá trình suy diễn, giảm loại
trong các hệ lôgic mờ loại hai cũng rất phức tạp,… Một trong những giải pháp
để giảm sự phức tạp trong xử lý, tính tốn trên các tập mờ này là xét các tập mờ
loại hai đặc biệt, như tập mờ loại hai khoảng [16, 33, 44, 53, 76], T2FS hình học
[18, 45, 46], hay tập mờ loại hai có độ thuộc ngơn ngữ [2, 26 - 28, 64 ],…
Có thể thấy rằng, T2FS là khó hiểu và khơng dễ sử dụng, từ khi T2FS ra đời năm 1975, cho đến năm 1995 các nghiên cứu liên quan đến dạng tập mờ này là
rất ít [25]. Tuy nhiên, hơn 10 năm trở lại đây, các nghiên cứu về tập mờ loại hai
đã thu hút rất nhiều sự quan tâm cả về phương diện lý thuyết lẫn ứng dụng [16,
25,48, 49, 51, 54]. Để giải thích cho lý do này R. I. John và J. M. Mendel đã bàn
luận chi tiết và sâu sắc trong các tài liệu [25, 49, 50].
Nhìn chung, hiện nay các nghiên cứu về tập mờ loại hai đều tập trung vào
một số hướng chính sau đây.
(1) Đưa ra các tiếp cận biểu diễn T2FS, như biểu diễn theo lát cắt lượn sóng biểu diễn theo T2FS nhúng [52], biểu diễn theo độ thuộc mờ [48, 52], biểu diễn
theo FOU [52],…;
(2) Xây dựng cơ sở lý thuyết để hướng tới một hệ lơgic mờ loại hai hồn chỉnh,

bao gồm các phép toán tập hợp, phương pháp suy diễn, phép giảm loại [29-31,
48, 59], …;


-3-

(3) Nghiên cứu các độ đo trên T2FS như trọng tâm, độ tương tự,… [30, 75, 76]
và áp dụng chúng trong các ứng dụng, chẳng hạn, trong mơ hình hóa nhận thức
[27, 28], tính tốn với từ [51, 54], hướng tới tính tốn theo nhận thức [54];
(4) Nghiên cứu các dạng T2FS có hàm thuộc đơn giản để khối lượng tính tốn
được giảm nhẹ, như T2FS khoảng [16, 33, 44, 53, 75, 76], T2FS tam giác [60],
hay T2FS hình học [18, 45, 46];…
(5) Chứng tỏ sự phù hợp của T2FS và T2-FLS trong các ứng dụng, khi dữ liệu
huấn luyện không chắc chắn trong các lĩnh vực như điều khiển, y tế,… ở các bài
toán dự báo [16, 22, 23, 48, 62], bài toán phân lớp [16, 48, 63, 65], phân cụm
[43],… Tuy nhiên, cần chú ý rằng, cho đến nay, vẫn chưa có một cơ sở lý thuyết
đảm bảo T2FS luôn tốt hơn T1FS trong những công việc này.
Theo R. Yager [66], “một ưu điểm của T2FS là cho phép mở rộng độ thuộc là
các giá trị ngôn ngữ” và gần đây, chủ đề này có nhiều nghiên cứu quan tâm [2,
23, 26-28, 64, 66]. Trong [26, 27], R. I. John đã chỉ ra điểm mạnh của T2FS
trong việc biểu diễn tri thức và suy diễn. Tuy nhiên, trong các nghiên cứu đó
quan hệ ngữ nghĩa giữa các độ thuộc ngôn ngữ chưa đề cập nhiều nên kết quả
thu được có thể phản trực quan [2]. Mặt khác, các nghiên cứu về T2FS có độ
thuộc ngơn ngữ [23, 26 - 28, 64, 66] đều tiếp cận theo kiểu truyền thống, đó là
“diễn dịch” mỗi độ thuộc ngơn ngữ thành các T1FS trên đoạn [0,1] để tính tốn
và xử lý.
Đại số gia tử (ĐSGT) là một tiếp cận nghiên cứu các giá trị của biến ngôn ngữ
dựa vào cấu trúc ngữ nghĩa của chúng [37, 38]. Có thể xem đây là một tiếp cận
khác với tập mờ để biểu diễn và xử lý các giá trị của biến ngôn ngữ. Việc khai
thác các đặc trưng của ngôn ngữ trong cấu trúc của ĐSGT đã mang lại những kết

quả nhất định trong một số bài toán, chẳng hạn, ứng dụng trong lập luận xấp xỉ
[1, 39], ứng dụng trong cơ sở dữ liệu quan hệ mờ [5, 7], ứng dụng trong bài toán
điều khiển [8, 10, 36], hay ứng dụng trong lập trình lơgic mờ ngơn ngữ [42],…
Như vậy, có thể thấy rằng, ý tưởng mượn cấu trúc của biến ngôn ngữ trong
ĐSGT để kết hợp với một số bài toán đang tỏ ra khá hiệu quả.


-4-

Từ đây nảy sinh câu hỏi : Liệu có thể sử dụng các giá trị chân lý ngôn ngữ
trong ĐSGT làm độ thuộc cho các phần tử của một tập mờ khơng ! Về hình thức,
sự kết hợp này sẽ tạo ra một dạng tập mờ có độ thuộc ngơn ngữ, trong [2], T. Đ.
Khang và Đ. K. Dũng đã tiếp cận hướng này và đưa ra khái niệm tập mờ loại hai
dựa trên ĐSGT. Các kết quả thu được trong [2, 4] trình bày các khái niệm khởi
đầu cho phép biểu diễn dạng T2FS mới này. Tuy nhiên, khi thao tác, xử lý trên
dạng tập mờ này các tác giả chỉ sử dụng hàm định lượng ngữ nghĩa nên chưa thể
hiện hết điểm mạnh là tính cấu trúc trong đại số gia tử, đặt ra các vấn đề có thể
nghiên cứu tiếp.
Trên đây là những lý do để tác giả luận án chọn đề tài “Nghiên cứu tập mờ
loại hai đại số gia tử” làm đề tài luận án tiến sỹ.

2. Mục tiêu của luận án
Luận án tập trung nghiên cứu các khía cạnh quan trọng của tập mờ loại hai
ĐSGT. Cụ thể là:
(1) Nghiên cứu khả năng biểu diễn tính khơng chắc chắn của tập mờ loại hai
ĐSGT (Hedge Algebraic Type 2 Fuzzy Set - HaT2FS);
(2) Nghiên cứu các kỹ thuật tính tốn trên tập mờ loại hai ĐSGT; và
(3) Hướng tới một hệ lôgic mờ loại hai ĐSGT (Hedge Algebraic Type 2 Fuzzy
System, HaT2 – FLS).


3. Ý nghĩa khoa học và thực tiễn
Với mục tiêu đặt ta trên đây, luận án này có ý nghĩa:
(1) Góp phần chứng tỏ tính khả dụng của lý thuyết ĐSGT của biến ngôn ngữ; và
(2) Làm phong phú hơn về lý thuyết các nghiên cứu trên tập mờ loại hai cũng
như các hệ lôgic mờ loại hai.

4. Cấu trúc của luận án
Bố cục luận án gồm các phần: Mở đầu, năm chương, kết luận và kiến nghị, tài
liệu tham khảo và một phụ lục. Chương 1 là tổng quan về các kiến thức cơ sở,


-5-

được tổng hợp từ các tài liệu tham khảo. Chương 2, Chương 3 và Chương 4 trình
bày những đóng góp của luận án. Chương 5 là sự thảo luận về các kết quả đạt
được. Cụ thể:
Chương 1 trình bày các khái niệm cơ bản của lý thuyết tập mờ, bao gồm khái
niệm về tập mờ, biến ngôn ngữ, hệ lôgic mờ loại một cùng các hạn chế của hệ
lôgic mờ này. Tiếp theo, giới thiệu các định nghĩa, các phép toán tập hợp cùng
các tiếp cận biểu diễn tập mờ loại hai, và trình bày cách thức hoạt động của một
hệ lơgic mờ loại hai. Sau đó, giới thiệu về tập mờ loại hai khoảng, là dạng tập
mờ loại hai được quan tâm nhiều. Phần cuối của Chương 1 trình bày tổng quan
về đại số gia tử, và đưa ra khái niệm tập mờ loại hai ĐSGT.
Chương 2 đề nghị các phép tốn trên các giá trị chân lý ngơn ngữ theo đặc
trưng của ĐSGT, bao gồm phép rút gọn gia tử, phép meet, phép join và phép phủ
định. Tiếp theo, đưa ra các tiếp cận tính tốn phép meet và phép join, từ đó đề
xuất các định nghĩa và xây dựng các thuật tốn để tính HA-Meet, HA-Join. Các
phép toán trong chương này là cơ sở lý thuyết để biểu diễn và thao tác với tập
mờ loại hai ĐSGT.
Chương 3 đưa ra khái niệm tập mờ loại hai ĐSGT nhúng mức-k cùng các

khái niệm liên quan. Tiếp theo, đề xuất phương pháp biểu diễn HaT2FS dựa vào
các đặc trưng ngôn ngữ trong ĐSGT - mỗi HaT2FS được xem là hợp gia tử của
các HaT2FS nhúng mức-k trong nó. Từ đó, cho thấy rõ hơn khả năng biểu diễn
tính khơng chắc chắn của HaT2FS. Để thao tác, suy diễn với tập mờ loại hai
ĐSGT, và xa hơn là hệ lôgic mờ loại hai ĐSGT, các phép toán tập hợp trên
HaT2FS được đề nghị. Phần cuối Chương 3 đưa ra quan hệ giữa tập mờ loại hai
ĐSGT với T2FS khoảng, và quan hệ giữa tập mờ loại hai ĐSGT với T1FS.
Chương 4 trình bày cơ chế hoạt động của các thành phần chính trong hệ lơgic
mờ loại hai ĐSGT. Sau đó, đề xuất một phương pháp xây dựng hệ lôgic mờ này
từ dữ liệu vào-ra. Quy trình xây dựng hệ lơgic mờ loại hai ĐSGT gồm hai pha
độc lập. Pha một thiết kế một hệ lôgic mờ loại một “tốt nhất” từ dữ liệu bằng
cách kết hợp thuật toán Fuzzy C-Means (FCM) và thuật toán di truyền (GA). Pha
hai, sử dụng kết quả tốt nhất trong Pha một để xây dựng hệ lôgic mờ loại hai


-6-

ĐSGT. Ngoài ra, trong pha hai, GA được dùng để tối ưu các tham số của
HaT2FS. Trong phần cuối Chương 4 là các thử nghiệm của hệ lôgic mờ loại hai
ĐSGT với bài toán xấp xỉ hàm phi tuyến và bài toán dự báo thời gian sống của
bệnh nhân viêm tủy. Các kết quả thu được, bước đầu cho thấy khả năng ứng
dụng của tập mờ loại hai ĐSGT.
Chương 5 mô tả cô đọng các kết quả đạt được, kết hợp so sánh, đánh giá về
các khía cạnh quan trọng của tập mờ loại hai ĐSGT, qua đó cho thấy rõ hơn ý
nghĩa của hướng nghiên cứu trong luận án này.
Các kết quả chính của luận án được cơng bố trong các bài báo [1], [2], [3], [4],
[5], [6], [7], [8] và [9], và đã báo cáo tại:
 Các xêmina ở Bộ môn Hệ thống thông tin, Viện công nghệ thông tin và
Truyền thông, trường Đại học Bách Khoa Hà Nội.
 Hội thảo Khoa học Quốc gia lần thứ IX: “Một số vấn đề chọn lọc của Công

nghệ thông tin và Truyền thông”, 12 -13 tháng 6, 2008, Huế.
 Hội thảo Khoa học Quốc gia lần thứ IV: “Nghiên cứu, phát triển và ứng
dụng Công nghệ thông tin và Truyền Thông – ICT.rda”, 8 – 9 tháng 8,
2008, Hà Nội.
 Hội thảo Khoa học Quốc tế KSE lần thứ I: “Knowledge and Systems
Engineering - KSE”, 13 – 17 October - 2009, Hanoi,Vietnam.
 Hội thảo Khoa học Quốc gia lần thứ IV: “Nghiên cứu cơ bản và ứng dụng
Công nghệ thông tin - FAIR”, 25 – 26 tháng 12, 2009, Hà Nội.
 Hội thảo Khoa học Quốc tế FUZZ - IEEE 2010: “IEEE International
Conference on Fuzzy Systems”, 18 - 23 July – 2010, Barcelona, Spain.
 Hội thảo Khoa học Quốc tế SoICT 2010 “Symposium on Information and
Communication Technology”, 27 – 28 August, 2010, Hanoi, Vietnam.
 Hội thảo Khoa học Quốc tế SSCI 2011 - IEEE: “T2FUZZ 2011 - IEEE
Symposium on Advances in Type-2 Fuzzy Logic Systems”, 11 - 15 April –
2011, Paris, France.


-7-

1. CÁC KIẾN THỨC LIÊN QUAN

Phần này của luận án trình bày một số kiến thức liên quan, dùng để nghiên cứu
tập mờ loại hai đại số gia tử. Nội dung của phần này được tổng hợp từ các tài
liệu tham khảo, bao gồm: tập mờ và hệ lôgic mờ loại một; tập mờ loại hai và hệ
lôgic mờ loại hai; sơ lược lý thuyết về đại số gia tử của biến ngôn ngữ; và tập mờ
loại hai đại số gia tử.

1.1. Tập mờ
1.1.1. Kiến thức cơ bản về tập mờ
Một tập mờ A xác định trên không gian nền X được đặc trưng bằng một hàm

thuộc A : X  [0,1]. Điều này có nghĩa, với mỗi x  X, tồn tại một giá trị A(x)
thuộc đoạn [0,1] thể hiện độ thuộc của x vào tập A. Nếu A(x) = 0 thì x khơng
thuộc vào A, nếu A(x) = 1 thì x thuộc hồn tồn vào A.
Tập hợp những giá trị x X mà A(x) > 0 được gọi là giá đỡ của tập mờ A.
Một tập mờ có thể gồm hữu hạn hoặc vô hạn phần tử. Nếu tập mờ A là hữu
hạn thì được viết dưới dạng:
hạn thì được viết:

= ∫

=∑

( )/

và khi tập mờ A là khơng hữu

( )/

Ví dụ 1.1. [72] Đặt A là tập các số nguyên gần 10, khi đó hàm thuộc của A(x) có
thể được chọn là:
A = 0.1/7 + 0.5/8 + 0.8/9 + 1/10 + 0.8/11 + 0.5/12 + 0.1/13
Có nhiều dạng hàm thuộc để biểu diễn cho tập mờ A, trong đó dạng hình tam
giác, hình thang và hình chng là thơng dụng nhất. Sau đây là một ví dụ về hàm
thuộc dạng hình thang của một tập mờ.
Ví dụ 1.2. Cho A là một tập mờ, A có thể được biểu diễn dưới dạng hình thang
với hàm thuộc A(x) như sau:


-8-


0, x  a

x  a, a  x  b
b  a

 A (x; a, b, c, d)  1, b  x  c
,
d  x

, cxd
d c
0, x  d


xR

(1.1)

trong đó a, b, c, d là các số thực và a ≤ b ≤ c ≤ d . Hình 1.1 mơ tả hàm thuộc A
tương ứng.

µ
1
µA

0

a
b
c

d
Hình 1.1. Một ví dụ về tập mờ hình thang

x

Từ khái niệm tập mờ cho thấy: tập mờ là một sự mở rộng của tập hợp thông
thường; độ thuộc thể hiện mức độ trực thuộc của mỗi phần tử vào tập mờ, độ
thuộc càng lớn (trong [0,1]) thì độ trực thuộc càng lớn; cách biểu diễn đồ thị của
hàm thuộc là rất có ý nghĩa, nó cho phép hình dung về tập mờ một cách trực
quan.
Mỗi tập mờ được biểu diễn bằng hàm thuộc tương ứng, nên việc tính tốn trên
các tập mờ đều thực hiện thông qua các hàm thuộc của chúng. Các phép toán tập
hợp, bao gồm phép hợp, phép giao và phần bù giữ một vị trí rất quan trọng khi
nghiên cứu về lý thuyết tập mờ. Phép hợp được định nghĩa dựa vào các t-conorm
và phép giao dựa vào các t-norm.
Một hàm u từ [0,1]×[0,1] → [0,1] là một t-conorm nếu thỏa các điều kiện: (i)
u có tính giao hốn, u(x, y) = u(y, x); (ii) u có tính kết hợp, u(u(x, y), z) = u(x,
u(y, z)); (iii) u là đơn điệu, tức là nếu x ≤ x’ và y ≤ y’ thì u(x, y) ≤ u(x’, y’); và (iv)


-9-

u(x, 0) = x, u(1,1) = 1. Tương tự, một hàm w từ [0,1]×[0,1] → [0,1] là một tnorm nếu thỏa các điều kiện: (i) w có tính giao hốn; (ii) w có tính kết hợp; (iii)
w là đơn điệu; và (iv) w(0, 0) = 0, w(x, 1) = x.
Giả sử A và B là các tập mờ trên X với các hàm thuộc A(x) và B(x) tương
ứng, khi đó, ta có ba phép tốn tập hợp:
Phép hợp:

AB(x) = A(x) •  B(x)


(1.2)

Phép giao:

AB(x) = A(x) ⋆ B(x)

(1.3)

Phần bù:

̅(

)=1−

( )

(1.4)

Trong cơng thức (1.2) và (1.3), ký hiệu • và ⋆ là toán tử t-conorm và t-norm
tương ứng.
Từ các phép toán tập hợp, khái niệm quan hệ mờ và phép hợp thành được xây
dựng. Quan hệ mờ thể hiện mức độ liên quan hay tính liên kết giữa các phần tử
của 2 hay nhiều tập mờ. Một quan hệ mờ giữa các tập U1, …, Un là một tập con
mờ trên tích Đề-các U1 … Un.
Phép hợp thành các quan hệ mờ được định nghĩa như một cách thức suy diễn
bắc cầu. Theo [72], phép hợp thành của quan hệ mờ R(U, V) với quan hệ mờ
S(V, W) được xác định như sau:


( , )=




[

( , )⋆

( , )]

(1.5)

và gọi là phép hợp thành sup-star. Trường hợp đặc biệt, nếu R là một tập mờ
trên U và S(U,V) là một quan hệ mờ thì (1.5) được viết:


( )=



[

( )⋆

( , )]

(1.6)

Cơng thức (1.6) được dùng nhiều trong suy diễn mờ.

1.1.2. Biến ngôn ngữ

Trong [71], L. A. Zadeh đã giới thiệu về biến ngôn ngữ, đây là một trong những
khái niệm cơ sở quan trọng để phát triển phương pháp lập luận xấp xỉ dựa trên
lơgic mờ. Trích dẫn sau đây có thể xem là động cơ để nghiên cứu biến ngôn ngữ.
“Khi thiếu hụt tính chính xác bề ngồi của những vấn đề phức tạp cố hữu,
một cách tự nhiên là tìm cách sử dụng các biến gọi là biến ngơn ngữ; đó là các


- 10 -

biến mà các giá trị của chúng không phải là các số mà là các từ hoặc các câu
trong một ngôn ngữ tự nhiên hoặc nhân tạo. Động cơ cho việc sử dụng các từ
hoặc các câu hơn là các số bởi vì các đặc trưng ngơn ngữ nói chung là ít xác
định hơn các đặc trưng số”
Biến ngơn ngữ, xét trên một góc độ nào đó có thể xem là thuộc tính để mơ tả
sự vật, sự kiện. Chẳng hạn, Temperature có thể xem là một biến ngơn ngữ khi
miền giá trị của nó là các giá trị ngôn ngữ như hot, very hot, cold,… Theo [71],
khi tính tốn với các giá trị ngơn ngữ, L. A. Zadeh đã sử dụng tập mờ để biểu thị
ngữ nghĩa của các giá trị ngơn ngữ, ví dụ như từ hot có thể biểu thị bằng một tập
mờ, tức là một hàm thuộc hot(u), trên không gian tham chiếu U – tập nhiệt độ cụ
thể tính theo oC, và nhận trị trong đoạn [0,1]. Từ cách nhìn này L. A. Zadeh đã
biểu diễn biến ngôn ngữ bằng định nghĩa sau.
Định nghĩa 1.1. [71] Biến ngôn ngữ là một bộ gồm năm thành phần (X,T(X), U,
R, M), trong đó X là tên biến, T(X) là tập các giá trị ngôn ngữ của biến X, U là
không gian tham chiếu của biến cơ sở u, mỗi giá trị ngôn ngữ xem như là một
biến mờ trên U kết hợp với biến cơ sở u, R là một qui tắc cú pháp sinh các giá trị
ngôn ngữ cho tập T(X), M là qui tắc ngữ nghĩa gán mỗi giá trị ngôn ngữ trong
T(X) với một tập mờ trên U.
Ví dụ 1.3. [71] Xét biến ngôn ngữ AGE, tức là X = AGE, biến cơ sở u có miền
xác định U = [1, 100]. Khi đó, các giá trị ngơn ngữ tương ứng của biến AGE là
T(AGE) có thể bao gồm các giá trị:

young

old

not young or old

not young

not old

not very young not very old

very young

very old

young or old

possibly young

possibly old

...

Các giá trị ngôn ngữ young và old được gọi là các giá trị nguyên thủy. Mỗi giá
trị ngôn ngữ trong T(AGE) là tên của một biến mờ trên U, tức là biến có thể nhận
giá trị trên U với một mức độ tương thích trong đoạn [0,1], ràng buộc trên mỗi
giá trị ngôn ngữ hình thành ngữ nghĩa cho giá trị ngơn ngữ đó, ví dụ ngữ nghĩa
của old được cho như sau:



- 11 -

( )=∫

1+

/

(1.7)

Các giá trị khác trong T(AGE) có thể được tính thơng qua tập mờ của các giá trị
nguyên thủy bởi các phép toán tương ứng với các gia tử tác động, ví dụ như phép
CON cho gia tử very hay phép DIL cho gia tử more or less [71].
Trong các nghiên cứu của mình về biến ngơn ngữ và lập luận xấp xỉ L. A.
Zadeh luôn nhấn mạnh hai đặc trưng quan trọng của biến ngôn ngữ. Đặc trưng
thứ nhất là tính phổ quát của cấu trúc miền giá trị của chúng, tức là miền giá trị
của hầu hết các biến ngơn ngữ có cùng cấu trúc cơ sở, theo nghĩa các giá trị ngôn
ngữ tương ứng là giống nhau ngoại trừ phần tử sinh nguyên thủy. Ví dụ như các
giá trị ngơn ngữ tương ứng với hai biến ngôn ngữ HEALTH và AGE trong Bảng
1.1. Đặc trưng thứ hai là tính chất độc lập ngữ cảnh của các gia tử và các liên từ,
trong khi ngữ nghĩa của các phần tử sinh nguyên thủy là phụ thuộc ngữ cảnh.
Đặc trưng này có thể thấy ở cách xác định ngữ nghĩa tập mờ cho các giá trị ngôn
ngữ như đã nêu ở trên.
Bảng 1.1 [71]. Các giá trị ngôn ngữ của biến HEALTH và AGE
HEALTH

AGE

Good


Old

Very Good

Very Old

More-or-less Good

More-or-less Old

...

...

Poor

Young

Very Poor

Very Young

More-or-les Poor

More-or-less Young

...

...


Từ các đặc trưng trên cho phép chúng ta sử dụng một tập các gia tử ngôn ngữ
cho nhiều biến ngôn ngữ khác nhau và có thể mơ tả hình thức miền giá trị của
biến ngơn ngữ bởi một cấu trúc tốn học thuần nhất. Để mơ hình cấu trúc tự
nhiên miền giá trị của các biến ngôn ngữ, một cấu trúc đại số gọi là đại số gia tử


- 12 -

đã đề xuất trong [37, 38]. Tổng quan về ĐSGT của biến ngôn ngữ sẽ được đề
cập ở Mục 1.3 của luận án.

1.1.3. Hệ lôgic mờ loại một
Mục này trình bày việc sử dụng tập mờ trong các hệ thống tính tốn dựa trên
lơgic mờ. Hiện nay, có một số thuật ngữ có thể được sử dụng về hệ thống này
như hệ mờ, hệ lôgic mờ, hệ chuyên gia mờ, hệ dựa trên tri thức mờ hay hệ lôgic
mờ dựa trên luật,... Trong luận án này sử dụng thuật ngữ hệ lôgic mờ hoặc hệ mờ
để mô tả một hệ thống tính tốn sử dụng tập mờ trong các luật IF - THEN. Như
vậy, một hệ lôgic mờ loại một (T1-FLS) là hệ lôgic mờ sử dụng tập mờ loại một
trong phần giả thiết hoặc (và) phần kết luận của tập luật. Tương tự ta có khái
niệm hệ lôgic mờ loại hai (T2-FLS), và khái niệm hệ lôgic mờ loại hai đại số gia
tử (HaT2-FLS).
Theo [47], một hệ lơgic mờ loại một có thể xem như một ánh xạ phi tuyến từ
không gian đầu vào tới không gian đầu ra. Các thành phần chính trong hệ lơgic
mờ loại một được minh họa trong Hình 1.2.

Hình 1.2. Các thành phần của hệ lơgic mờ loại một [47]
Mờ hóa có nhiệm vụ ánh xạ giá trị rõ thành tập mờ loại một tương ứng biểu
diễn giá trị đó. Hiện nay, có hai phương pháp mờ hóa, là mờ hóa đơn trị và mờ
hóa khơng đơn trị. Mờ hóa đơn trị: A(x) = 1 tại x = x 0 và  A(x) = 0 với x  x0.

Mờ hóa khơng đơn trị: A(x) = 1 tại x = x0 và A(x) sẽ giảm dần khi x xa x0, ví dụ
như mờ hóa tam giác, mờ hóa Gauss,... [48, 74].


- 13 -

Cơ sở luật là tập các luật IF – THEN, đây là cơ sở tri thức của hệ lôgic mờ. Cơ
sở luật của hệ lôgic mờ hoặc được xác định từ các chuyên gia hoặc được xây
dựng từ dữ liệu số [24, 41, 47]. Nói chung, trong một hệ lơgic mờ thường có p
đầu vào x1X1 , x 2X2,…, x pXp, một đầu ra yY và M luật, trong đó luật thứ l
có dạng:
Rl: IF x1 is

and … and x p is

THEN y is Gl, l = 1, …, M

(1.8)

Suy diễn đóng một vai trị quan trọng trong một hệ lôgic mờ, phương pháp suy
diễn quyết định đến tính phức tạp và chất lượng của hệ lơgic mờ. Mô tơ suy diễn
dựa vào cơ sở luật và các nguyên tắc trong lý thuyết mờ để xác định tập mờ đầu
ra ứng với mỗi tập mờ đầu vào. Nếu mỗi luật được xem như một phép kéo theo
thì luật Rl trong (1.8) có thể được biểu diễn như một quan hệ mờ giữa không gian
đầu vào X = X1  X2  …  Xp và không gian đầu ra Y:
:

 …

Lúc này, luật


=



, = 1, … ,



, với

 …

=

(1.9)

được đặc trưng bởi hàm thuộc:

 ( , )= 

,…,

,

(1.10)

trong đó,

 ( , )= 




( , )

(1.11)

Sử dụng phép kéo theo Mamdani (ứng với t-norm là min) hoặc Larsen (t-norm là
product) trong [11, 47, 56], thì (1.8) được biểu diễn:

 ( , )=

×…×



( , )=

=  ( )⋆…⋆

×…×

⋆

( )⋆ ( )

( )

(1.12)


Giả sử p giá trị đầu vào của hệ lơgic mờ xác định một tập mờ Ax có hàm thuộc:

 ( )=

( )⋆…⋆

(1.13)

với Xi, i = 1, …p, là không gian tham chiếu của các biến vào xi.
Lúc này, mỗi luật
mờ đầu vào
=

xác định một tập mờ đầu ra

trên Y tương ứng với mỗi tập

bằng cách sử dụng phép hợp thành:


Nếu áp dụng phép hợp thành mờ sup-star trong (1.6) thì:

(1.14)


- 14 -

( )=




( )=

( )⋆ 





( , )

(1.15)

Công thức (1.15) thể hiện mối liên hệ giữa tập mờ đầu vào và tập mờ đầu ra
thông qua khối suy diễn của hệ lôgic mờ khi áp dụng luật Rl.
Thay (1.12) và (1.13) vào (1.15) ta có:
( )=

( )⋆ 





( , )

=




( ) ⋆ …⋆

=



( )⋆ ( ) ⋆…⋆

=

(

) ⋆  ( ) ⋆ …⋆  (

⋆ ( )

⋆

( )⋆ ( ) ⋆…⋆



(



) ⋆ ( )

)⋆ (


) ⋆ ( )
(1.16)

Áp dụng phép mờ hóa đơn trị, nên



( ) = 1 với = 1, … , , hay ta

có thể viết lại (1.16) như sau:
( ) =  ( ) ⋆ …⋆  (

) ⋆ ( )

(1.17)

Trong (1.17) biểu thức trong dấu ngoặc vuông gọi là mức độ đốt cháy (firing
level) của một luật

.

Khi đó, tập mờ đầu ra B trên Y của hệ lôgic mờ là:
=⋃
ở đây,

(1.18)

là tập mờ đầu ra khi suy diễn bằng luật

và M là số luật.


Giải mờ hay cịn gọi là khử mờ, bước này có nhiệm vụ chuyển tập mờ loại
một thành một giá trị rõ tương ứng với nó. Hiện nay có nhiều phương pháp giải
mờ, như giải mờ trọng tâm, giải mờ trung bình các điểm cực đại, hay giải mờ
tổng quát,… Giả sử ( ) là hàm thuộc của tập mờ B trong (1.18) và B được rời
rạc thành N điểm thì giá trị giải mờ của B theo phương pháp giải mờ trọng tâm
là:

=




( )
( )

Chi tiết hơn về các phép giải mờ có thể tham khảo trong [3, 48, 67].

(1.19)


×