Một số mở rộng của hệ suy diễn mờ phức cho bài toán hỗ trợ ra quyết định

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.18 MB, 165 trang )

VIỆN HÀN LÂM KHOA HỌC VÀ
BỘ GIÁO DỤC VÀ ĐÀO TẠO

CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ

LƯƠNG THỊ HỒNG LAN

MỘT SỐ MỞ RỘNG CỦA HỆ SUY DIỄN MỜ PHỨC CHO

BÀI TOÁN HỖ TRỢ RA QUYẾT ĐỊNH

LUẬN ÁN TIẾN SĨ NGÀNH MÁY TÍNH

Hà Nội - 2021

VIỆN HÀN LÂM KHOA HỌC VÀ
BỘ GIÁO DỤC VÀ ĐÀO TẠO

CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ

LƯƠNG THỊ HỒNG LAN

MỘT SỐ MỞ RỘNG CỦA HỆ SUY DIỄN MỜ PHỨC CHO BÀI
TOÁN HỖ TRỢ RA QUYẾT ĐỊNH

Chuyên ngành: Khoa học máy tính

Mã số: 9.48.01.01

LUẬN ÁN TIẾN SĨ NGÀNH MÁY TÍNH

NGƯỜI HƯỚNG DẪN KHOA HỌC:
1. PGS.TS Lê Hồng Sơn
2. PGS.TS Nguyễn Long Giang

Hà Nội - 2021

LỜI CAM ĐOAN
Tác giả xin cam đoan đây là công trình nghiên cứu của bản thân tác
giả, được hồn thành dưới sự hướng dẫn của PGS.TS Lê Hoàng Sơn và
PGS.TS Nguyễn Long Giang. Các kết quả nghiên cứu và các kết luận trong
luận án này là trung thực, không sao chép từ bất kỳ một nguồn nào và dưới
bất kỳ hình thức nào. Việc tham khảo các nguồn tài liệu đã được thực hiện
trích dẫn và ghi nguồn tài liệu tham khảo đúng quy định.
Hà Nội, ngày 19 tháng 06 năm 2021
Tác giả luận án

Lương Thị Hồng Lan

LỜI CẢM ƠN
Luận án này được hoàn thành với sự nỗ lực không ngừng của tác giả
và sự giúp đỡ hết mình từ các thầy giáo hướng dẫn, bạn bè và người thân.
Đầu tiên, tác giả xin bày tỏ lòng biết ơn chân thành và sâu sắc tới các
thầy giáo hướng dẫn PGS.TS Lê Hoàng Sơn và PGS.TS Nguyễn Long
Giang. Sự tận tình chỉ bảo, hướng dẫn và động viên của các thầy dành cho

tác giả suốt thời gian thực hiện luận án là không thể nào kể hết được.
Tác giả xin gửi lời cảm ơn tới các thầy, cô giáo và cán bộ của bộ
phận quản lý nghiên cứu sinh - Học viện Khoa học và Công nghệ (Viện Hàn
lâm Khoa học và Công nghệ Việt Nam), bộ phận quản lý nghiên cứu sinh
của Viện Công nghệ thông tin đã nhiệt tình giúp đỡ và tạo ra mơi trường
nghiên cứu tốt để tác giả hồn thành cơng trình của mình.
Tác giả xin chân thành cảm ơn các anh chị em trong Lab Tại Viện
Công nghệ thông tin - Đại học Quốc gia Hà Nội đã giúp đỡ tác giả trong
suốt quá trình học tập và nghiên cứu tại Lab.
Tác giả xin chân thành cảm ơn tới Ban Giám hiệu trường Đại học Sư
phạm, Đại học Thái Nguyên, các đồng nghiệp khoa Tốn, nơi tác giả đã cơng
tác những năm đầu nghiên cứu sinh; và Ban Giám hiệu trường Đại học Thủy
Lợi Hà Nội, các đồng nghiệp khoa Công nghệ thông tin, nơi tác giả hiện đang
công tác đều đã luôn động viên, giúp đỡ tác giả trong công tác để tác giả có
thời gian tập trung nghiên cứu và hoàn thành luận án đúng thời hạn.
Đặc biệt tác giả xin bày tỏ lòng biết ơn sâu sắc tới Bố, Mẹ, các em
trong gia đình, những người ln dành cho những tình cảm nồng ấm và sẻ
chia những lúc khó khăn trong cuộc sống, luôn động viên giúp đỡ tôi trong
q trình nghiên cứu. Cảm ơn con gái ln ngoan ngỗn và ủng hộ để mẹ
tập trung nghiên cứu, hồn thành luận án. Luận án cũng là món quà tinh
thần mà tôi trân trọng gửi tặng đến các thành viên trong Gia đình.
Tơi xin trân trọng cảm ơn!
Hà Nội, ngày 19 tháng 06 năm 2021
Người thực hiện

Lương Thị Hồng Lan

i

MỤC LỤC
Danh mục các bảng
Danh mục các hình vẽ, đồ thị
MỞ ĐẦU
Chương 1. TỔNG QUAN NGHIÊN CỨU VÀ CƠ SỞ LÝ THUYẾT
1.1 Giới thiệu . . . . . . . . . . . . . . . . . . . .

1.2 Vấn đề Hệ suy diễn mờ trong Hệ hỗ

1.3 Tổng quan các nghiên cứu liên qua
1.3.1
1.3.2
1.3.3
1.4 Cơ sở lý thuyết . . . . . . . . . . . . . . .
1.4.1
1.4.2
1.4.3
1.4.4
1.4.5
1.5 Dữ liệu thực nghiệm . . . . . . . . . . .
1.5.1
1.5.2
1.5.3
1.6 Kết Chương 1 . . . . . . . . . . . . . . . .

Chương 2. XÂY DỰNG HỆ SUY DIỄN MỜ PHỨC DẠNG MAMDANI

2.1 Giới thiệu . . . . . . . . . . . . . . . . . . . .

2.2 Đề xuất toán tử t-chuẩn và t- đối ch
2.2.1
2.2.2
2.2.3

2.3 Hệ suy diễn mờ phức Mamdani (M2.3.1
2.3.2
2.3.3
2.3.4
2.3.5
2.4 Kết Chương 2 . . . . . . . . . . . . . . . .
Chương 3. TINH GIẢM HỆ LUẬT TRONG HỆ SUY DIỄN MỜ PHỨC

3.1 Giới thiệu . . . . . . . . . . . . . . . . . . . .

3.2 Đề xuất độ đo tương tự mờ phức .
3.2.1
3.2.2
3.2.3

3.3 Đề xuất mơ hình hệ suy diễn M-CF
3.3.1
3.3.2
3.3.3

3.4 Thử nghiệm và đánh giá kết quả . .
3.4.1
3.4.2

3.5

Kết Chương 3 . . . . . . . . . . . . . . . .

Chương 4. MỞ RỘNG HỆ SUY DIỄN MỜ PHỨC MAMDANI VỚI ĐỒ

4.1

Giới thiệu . . . . . . . . . . . . . . . . . . . .

4.2

Một số mở rộng của mơ hình M-CF
4.2.1
4.2.2
4.2.3

4.3

Đề xuất mơ hình hệ suy diễn mờ ph
4.3.1
4.3.2
4.3.3
4.3.4

4.4

Thực nghiệm và đánh giá kết quả .
4.4.1
4.4.2

4.5

Kết Chương 4 . . . . . . . . . . . . . . . .

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
Những kết quả chính của luận án . . . . . . . . . . . . . . . . . . . . . . . .
Hướng phát triển của luận án . . . . . . . . . . . . . . . . . . . . . . . . . .
TÀI LIỆU THAM KHẢO

iv

Kí hiệu và viết tắt
STT
1
2
3
4

Từ tắt
FS
CFS
CFL
FIS

5

CFIS

6

IFIS

7

ANFIS

8

CANFIS

9

ANCFIS

10

CNS

11

MCDM

12

FISA

13
14

KG
FKG

15

M-FIS

16

M-CFIS

17

M-CFIS-R

M-CFIS18
FKG
19
20

GRC
UCI

21

RANCFIS

22

FANCFIS

vi

Danh mục các bảng
1.1 Các bộ dữ liệu thực nghiệm chuẩn Benchmark . . . . . .
1.2 Các thuộc tính dữ liệu đầu vào trong tập dữ liệu bệnh gan

2.1 Ma trận ra quyết định dựa trên các mẫu dữ liệu . . . . .

2.2 Ma trận quyết định mờ . . . . . . . . . . . . . . . . . . . . . . . . .
2.3 Ma trận chuẩn hóa . . . . . . . . . . . . . . . . . . . . . . . . . . .

2.4 Ma trận quyết định mờ . . . . . . . . . . . . . . . . . . . . . . . . .

2.5 Ma trận quyết định kết quả . . . . . . . . . . . . . . . . . . . . . .

2.6 Bộ dữ liệu đầu vào . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2.7 Bộ cơ sở luật . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1 Hệ cơ sở luật mờ phức . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Kịch bản 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3 Kịch bản 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

vii

Danh mục các hình vẽ, đồ thị
1

Cấu trúc luận án . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.1

Hệ suy diễn mờ trong Hệ hỗ trợ ra quyết định . . . . . .

1.2

Sơ đồ tổng quan của hệ suy diễn mờ . . . . . . . . . . . . .

1.3

Hệ thống suy diễn Mamdani với hai đầu vào và hai luật

1.4

Hệ suy diễn mờ Tagaki- Sugeno với hai đầu vào và hai lu

1.5

Hệ suy diễn mờ Tsukamoto với hai đầu vào và hai luật .

1.6

Hệ thống logic mờ do Ramot đề xuất . . . . . . . . . . . . . .

1.7

Kiến trúc của hệ thống CANFIS . . . . . . . . . . . . . . . . . .

1.8

Biểu diễn của hàm thuộc mờ phức . . . . . . . . . . . . . . .

2.1

Mơ hình hệ suy diễn mờ phức Mamdani . . . . . . . . . . .

2.2

Kết quả chạy thực nghiệm so sánh trên Bộ dữ liệu WBCD

2.3

Kết quả chạy thực nghiệm so sánh trên Bộ dữ liệu Diebe

2.4

Kết quả chạy thực nghiệm so sánh trên Bộ dữ liệu thực Li

3.1

Giai đoạn Training của mơ hình đề xuất . . . . . . . . . . .

3.2

Giai đoạn Testing của mô hình M-CFIS-R đề xuất . . . .

3.3

Kết quả thực nghiệm trên bộ dữ liệu WBCD . . . . . . . .

3.4

Kết quả thực nghiệm trên bộ dữ liệu Diebetes . . . . . .

3.5

Kết quả thực nghiệm trên bộ dữ liệu thực Liver . . . . .

4.1

Quá trình Training . . . . . . . . . . . . . . . . . . . . . . . . . . . .

4.2

Quá trình Testing . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

4.3

Biểu diễn của luật mờ phức . . . . . . . . . . . . . . . . . . . .

viii

4.4

Đồ thị tri thức mờ . . . . . . . . . . . . . . . . . . . . . . . . .

4.5

Đồ thị FKG cho sáu luật . . . . . . . . . . . . . . . . . . . .

4.6

Phân bố dữ liệu với từng nhãn đối với bộ dữ liệu có

4.7

Phân bố dữ liệu với từng nhãn đối với bộ dữ liệu có n

4.8

So sánh mơ hình M-CFIS-R và M-CFIS-FKG trên bộ d

4.9

So sánh mơ hình M-CFIS-R và M-CFIS-FKG trên bộ d

4.10

So sánh mơ hình M-CFIS-R và M-CFIS-FKG trên bộ

4.11

So sánh mơ hình M-CFIS-R và M-CFIS-FKG trên bộ

4.12

So sánh mơ hình M-CFIS-R và M-CFIS-FKG trên bộ d

4.13

So sánh mơ hình M-CFIS-R và M-CFIS-FKG trên bộ d

1

MỞ ĐẦU
Mở đầu
Ra quyết định là một phần vô cùng quan trọng trong cuộc sống, do đó
gần đây rất nhiều nhà nghiên cứu đã đưa ra nhiều hướng tiếp cận khác
nhau để giải quyết, hỗ trợ quá trình ra quyết định như tiếp cận mờ, mơ hình
giá trị độ đo... Quá trình hỗ trợ ra quyết định chủ yếu tập trung vào việc đưa
ra những phương pháp, cách thức để có thể hỗ trợ đưa ra quyết định cuối
cùng một cách đúng đắn nhất, nhất là đối với môi trường dữ liệu ngày càng
nhiều biến động, dữ liệu không chắc chắn, không xác định rõ ràng.
Tập mờ (Fuzzy Set-FS) được Zadel đề xuất năm 1965 [1] được coi là một
trong những công cụ hữu hiệu để giải quyết các bài tốn mà có dữ liệu khơng
chắc chắn, khơng xác định rõ ràng. Rất nhiều những nghiên cứu mở rộng của FS
đã được giới thiệu trong vài năm gần đây [2, 3, 4, 5, 6] và được ứng dụng nhiều
trong bài toán hệ hỗ trợ ra quyết định. Một trong những kĩ thuật quan trọng dựa
trên lý thuyết FS và ứng dụng trong việc giải quyết các bài toán của hệ hỗ trợ ra
quyết định là Hệ suy diễn mờ (Fuzzy Inference System - FIS). FIS hiện đã và đang
được ứng dụng rộng rãi trong nhiều bài toán phân loại/dự báo và các bài toán của
hệ hỗ trợ ra quyết định như lựa chọn nhân sự, lựa chọn nhà cung cấp, hỗ trợ ra
chiến lược phát triển công ty... Bên cạnh đó, trong một vài ứng dụng khác thì hệ

FIS được sử dụng để tạo ra một tập hợp các luật mờ nhằm mục đích phát hiện,
dự báo hoặc phân loại các đối tượng như phát hiện ung thư phổi, phát hiện bệnh
đái tháo đường, dự đoán bị bệnh tim ... [7, 8, 9, 10, 11, 12, 13].
Một phiên bản mở rộng của FIS nhúng vào mạng nơ ron và kết hợp với học dựa
trên phương pháp gradient có tên gọi là Hệ suy diễn mờ nơ ron thích nghi (ANFIS)
[14] và cho kết quả tốt trong vấn đề dự báo bệnh mạch vành, ước tính sự tăng cường

độ dẫn nhiệt của kim loại và oxit kim loại ... [15, 16, 17, 18]. Ngồi ra, ANFIS cịn
được kết hợp với các mơ hình học máy khác như thuật tốn tối ưu hóa bầy đàn và áp

2

dụng đối với các bài toán trong hệ hỗ trợ ra quyết định [19, 20, 21].
Bên cạnh đó, nhiều phiên bản khác nhau của hệ FIS trên các tập mờ
mở rộng áp dụng đối với bài toán hỗ trợ ra quyết định cũng đã và đang được
nghiên cứu rộng rãi. Ví dụ như hệ suy diễn mờ trực cảm (IFIS) được sử dụng
trong hồi quy và ứng dụng hỗ trợ dự báo phá sản của doanh nghiệp [22, 23,
24, 25, 25, 26, 27]. Một số nghiên cứu kết hợp giữa hệ suy diễn mờ bức tranh
(PFS) với thuật toán phân cụm mờ bức tranh và độ đo mờ bức tranh được ứng
dụng trong việc giải quyết một số vấn đề ra quyết định như dự báo thời tiết, dự
báo giá cổ phiếu và phân đoạn hình ảnh [28, 29, 30, 31, 32, 33, 34, 35].
Gần đây, cùng với sự gia tăng của các vấn đề ra quyết định dựa trên các dữ liệu
có sự thay đổi về thời gian hay các dữ liệu có yếu tố chu kì, định kì thì khái niệm tập mờ
phức (CFS) [36] ra đời với hàm thuộc bao gồm cả thành phần biên độ và thành phần pha
để biểu diễn, mô tả các dữ liệu có yếu tố chu kì, định kì hay các dữ liệu có sự thay đổi về
thời gian. CFS được áp dụng trong nhiều nghiên cứu, tập trung chủ yếu vào các vấn đề
như các toán tử tổng hợp mờ phức, thông tin mềm mờ phức, độ đo khoảng cách mờ
phức và mạng các khái niệm mờ phức [37, 38, 39, 40, 41, 42, 43]. Ưu điểm của CFS là
khả năng mơ hình hóa các hiện tượng và sự kiện theo thời gian, theo giai đoạn để từ đó

có thể cho thấy tổng thể chúng trong một ngữ cảnh nhất định.

Ví dụ như để xác nhận chẩn đoán huyết áp của bệnh nhân là “cao” hay
“thấp” thì một bệnh nhân được đo 30 lần rồi ghi lại giá trị tương ứng với mỗi lần
đo, sau đó giá trị trung bình và phương sai được tính tốn đối với giá trị huyết áp
đo được. Từ đó huyết áp của bệnh nhân có thể tính được dễ dàng bằng cách lấy
giá trị trung bình và phương sai của các lần đo (sử dụng ý nghĩa của mờ hóa của
hệ FIS trên tập CFS), ví dụ như là huyết áp thấp với giá trị trung bình và phương
sai cho giá trị nhỏ. Cịn nếu như huyết áp chỉ đo tại một thời điểm và đưa ra quyết
định thì có thể dẫn đến quyết định về huyết áp của bệnh nhân khơng chính xác.
Một ví dụ khác về vấn đề chẩn đoán bệnh: nếu chỉ dựa vào các giá trị thuộc
tính bệnh mà khơng xét tới các thuộc tính khác thì làm cho kết quả chẩn đốn khơng
được chính xác, do kết luận bệnh khơng chỉ phụ thuộc vào mỗi một giá trị thuộc tính

3
bệnh mà còn cần phải xét tới các yếu tố liên quan tới bệnh đó. Hơn nữa, cũng có
nhiều kịch bản, dữ liệu trong thực tế liên quan đến yếu tố pha, trong dữ liệu có xu
hướng tuần hồn, chẳng hạn như lượng mưa được ghi lại trong một vùng hoặc sóng
âm thanh do một nhạc cụ tạo ra. Do đó, hiển nhiên rằng số phức cũng phải có một vị
trí trong hệ thống suy luận mờ. Đây cũng là động cơ chính của luận án này.

Hệ suy diễn mờ phức được coi là một công cụ hiệu quả đối với việc giải
quyết các vấn đề không chắc chắn và có yếu tố định kỳ, chu kì. Hệ suy diễn
mờ phức đầu tiên được giới thiệu Ramot [44] được gọi là Hệ logic mờ phức
được phát triển từ hệ thống logic mờ thông thường nhưng thay thế tập mờ và
phép kéo theo mờ bởi biến đổi phức tương ứng của nó. Một nghiên cứu khác
bởi Man và cộng sự [45] dựa trên sự kết hợp giữa phương pháp học quy nạp
với hệ suy diễn trong tập phức. Một phiên bản học nhúng khác với mạng mờ
nơ ron trên tập CFS với tên gọi Hệ thống suy diễn mờ phức nơ ron thích nghi

(ANCFIS) được giới thiệu bởi Chen và cơng sự [46]. Sau đó 2 cải tiến của
ANCFIS với mục đích làm gia tăng tốc độ tính tốn được đưa ra trong [47, 48].
Mặc dù nhiều hệ thống suy diễn phát triển dựa trên tập mờ phức đã được nghiên
cứu và ứng dụng nhưng các hệ thống đã có đều chưa thực sự đúng với ý nghĩa của hệ
thống suy diễn mờ phức thực sự. Hầu hết các hệ thống đều sử dụng tập mờ phức làm
biến đầu vào nhưng các nghiên cứu đều chỉ sử dụng thành phần biên độ trong quá trình
ra quyết định mà bỏ qua thành phần pha. Ví dụ như hệ logic mờ phức của Ramot thì bỏ
qua thành phần pha trong giải mờ kết quả đầu ra, làm cho hệ thống không đủ yếu tố khi
xử lý với dữ liệu có yếu tố lặp lại hoặc dữ liệu xảy ra định kì, và điều này làm giảm đi ý
nghĩa của mơ hình hệ suy diễn mờ phức, trở thành hệ suy diễn mờ thường. Cịn mơ hình
ANCFIS của Man và Chen [46] thì sử dụng phép tích vơ hướng vec tơ cho q trình tổng
hợp kết quả, và coi các giá trị đầu vào phức như là các giá trị thực. Do đó, hệ thống
ANCFIS không thực sự là hệ thống phức khi đầu ra của hệ thống khơng thể đại diện cho
tính tuần hồn của các thành phần trong đó.

Khi xử lý đối với dữ liệu có yếu tố chu kì, định kì, dữ liệu có yếu tố thay đổi
theo thời gian thì các hệ FIS, ANFIS hay các hệ phát triển trên tập mờ phức đều đưa

4

ra hai phương thức xử lý chung: (1) Bỏ qua thông tin liên quan đến yếu tố
thành phần pha; (2) Biểu diễn thành phần biên độ và pha riêng biệt với nhau
thành 2 thành phần riêng biệt bằng cách sử dụng 2 tập mờ. Điều này sẽ làm
cho thông tin bị mất mát và kết quả thu được khơng có độ tin cậy cao (nếu các
thông tin về thành phần pha bị bỏ qua), làm sai lệch thông tin và giảm hiệu
năng tính tốn (nếu thơng tin về biên độ và pha được xử lý riêng biệt), thời
gian tính tốn sẽ tăng thêm do số lượng các bộ cần được xử lý tăng thêm.

Thêm nữa, các nghiên cứu đã có hệ suy diễn dựa trên lý thuyết tập

mờ phức vẫn cịn tồn tại một số hạn chế như sau:
• Các hệ suy diễn mờ phức chưa đưa ra được quy trình tổng thể xây

dựng hệ suy diễn mờ phức cho hệ hỗ trợ ra quyết định.
• Các hệ luật trong các hệ suy diễn mờ phức đã có chỉ sinh ra dựa trên

kinh nghiệm, dựa trên tư duy logic suy diễn mà chưa đề cập đến vấn
đề tối ưu, tinh giảm hệ luật suy diễn mờ phức.
• Các hệ suy diễn chưa được nghiên cứu để áp dụng đối với bộ dữ liệu

mới mà khơng có trong dữ liệu huấn luyện khi sinh mơ hình suy diễn.
• Các tốn tử t-chuẩn và t-đối chuẩn mờ phức còn chưa được quan tâm

nghiên cứu tìm hiểu và ứng dụng trong hệ hỗ trợ ra quyết định.

Mục tiêu nghiên cứu của luận án
Xuất phát từ những tồn tại và hạn chế của các công bố về tập mờ
phức và hệ suy diễn dựa trên tập mờ phức thì luận án tập trung nghiên cứu
tìm hiểu và áp dụng hệ suy diễn mờ phức đối với bài toán hệ hỗ trợ ra quyết
định với dữ liệu có yếu tố thời gian , cụ thể như sau:
• Nghiên cứu lý thuyết về tập mờ phức, logic mờ phức, các độ đo dựa

trên tập mờ phức.
• Nghiên cứu và phát triển các hệ suy diễn dựa trên tập mờ phức.

5
• Nghiên cứu các kĩ thuật để giảm luật mờ trong hệ suy diễn mờ phức.
• Nghiên cứu đồ thị tri thức mờ trong biểu diễn luật mờ để giảm thời gian

tính tốn suy diễn đối với tập testing và xử lí suy diễn khi có một tập dữ
liệu mới mà khơng có sẵn trong tập dữ liệu huấn luyện.
Xuất phát từ mục tiêu nghiên cứu, phạm vi nghiên cứu của luận án
tập trung nghiên cứu một số các vấn đề sau:
• Nghiên cứu lý thuyết về tập mờ phức, các phép toán và hệ suy diễn

dựa trên tập mờ phức
• Luận án chỉ nghiên cứu và thử nghiệm các bài toán hệ hỗ trợ ra quyết

định với dữ liệu có yếu tố thời gian.
Với mục tiêu đặt ra như trên, luận án đạt được một số kết quả chính như sau:
• Đề xuất hệ suy diễn mờ phức theo mơ hình Mamdani: Dựa trên mơ hình hệ

suy diễn mờ cổ điển Mamdani, luận án phát triển mơ hình suy diễn Mamdani
trên tập mờ phức. Mơ hình cấu trúc của hệ suy diễn mờ phức đề xuất cũng
như các bước cụ thể trong hệ suy diễn mờ phức Mamdani cũng được đưa
ra và áp dụng thực nghiệm mơ hình suy diễn đối với với các bộ dữ liệuchuẩn
UCI và dữ liệu thực. Thêm nữa, NCS cũng đề xuất các toán tử t-chuẩn, t-đối
chuẩn mờ phức và ví dụ số với hệ hỗ trợ ra quyết định. Các đóng góp này
được trình bày trong nội dung Chương 2 của luận án.
• Đề xuất các độ đo tương tự dựa trên tập mờ phức, kết hợp giữa độ đo

tương tự mờ phức và tính tốn hạt để giải quyết vấn đề tinh giảm hệ luật
trong mơ hình suy diễn mờ phức Mamdani. Cải tiến mơ hình hệ suy diễn mờ
phức Mamdani ở Chương 2 và xây dựng hệ suy diễn mờ phức M-CFIS-R.
Các đóng góp này được trình bày chi tiết trong Chương 3 của luận án.
• Đề xuất mở rộng hệ suy diễn mờ phức theo mơ hình Sugeno và Tsukamoto và

các độ đo mờ phức, tích phân mờ phức dựa trên lý thuyết tập hợp. Nghiên cứu

6
cách biểu diễn luật mờ dựa trên đồ thị tri thức và cải tiến mơ hình hệ suy diễn
mờ phức M-CFIS-R để đưa ra mơ hình M-CFIS-FKG. Thực nghiệm trên các bộ
dữ liệu cũng chứng minh hiệu quả về thời gian tính tốn của mơ hình và suy
diễn trong trường hợp bộ dữ liệu kiểm tra khơng có trong bộ dữ liệu huấn luyện

Đối tượng nghiên cứu của luận án là các hệ suy diễn theo tiếp cận tập
mờ phức, các phương pháp cải tiến hệ luật và biểu diễn hệ luật qua đồ thị tri thức.

Phương pháp nghiên cứu của luận án là nghiên cứu lý thuyết và
nghiên cứu thực nghiệm.
i) Nghiên cứu lý thuyết: Nghiên cứu tổng quan lý thuyết về tập mờ phức,

các phép toán mờ phức t-chuẩn, t-đối chuẩn, các độ đo dựa trên tập mờ phức
và các hệ suy diễn mờ phức đã công bố, phân tích ưu điểm, nhược điểm và
các vấn đề cịn tồn tại của các nghiên cứu liên quan. Trên cơ sở đó, đề xuất
các phép tốn, các độ đo tương tự, độ đo dựa trên lý thuyết tập hợp và các hệ
suy diễn mờ phức theo mơ hình Mamdani, Sugeno và Tsukamoto. Các đề xuất,
cải tiến được chứng minh chặt chẽ về lý thuyết bởi các định lý, mệnh đề.
ii) Nghiên cứu thực nghiệm: Các thuật toán đề xuất được cài đặt, chạy

thử nghiệm, so sánh, đánh giá với các hệ suy diễn khác trên các bộ số liệu
mẫu từ kho dữ liệu UCI và bộ dữ liệu thực tế tại Bệnh viện Gang thép Thái
Nguyên nhằm minh chứng về tính hiệu quả của các nghiên cứu về lý thuyết.

Cấu trúc của luận án
Bố cục của luận án gồm bốn chương nội dung chính, phần Mở đầu, Kết luận và
danh mục các tài liệu tham khảo. Phần Mở đầu trình bày tổng quan về vấn đề nghiên
cứu, lý do chọn đề tài, đối tượng, mục tiêu và nội dung nghiên cứu của luận án. Phần Kết

luận tổng kết những kết quả đã đạt được của luận án và hướng phát triển, hướng nghiên
cứu trong tương lai. Các chương nội dung chính được tổ chức như trong Hình 1 cụ thể
như sau: Chương đầu tiên NCS trình bày về các kiến thức tổng quan sử dụng trong luận
án như các kiến thức nền tảng về tập mờ, tập mờ phức và hệ suy diễn dựa trên tập mờ
và tập mờ phức. Thêm nữa các độ đo phát triển dựa trên tập mờ và tập

7

Hình 1: Cấu trúc luận án

mờ phức cũng được trình bày trong chương mở đầu này. Từ các kiến thức nền
đó mà chúng tơi đưa ra lí do để sử dụng hệ suy diễn mờ phức đối với việc giải
quyết bài tốn hỗ trợ ra quyết định có dữ liệu thay đổi theo thời gian. Các bộ
dữ liệu thực nghiệm trong luận án cùng với các thước đo dùng để đánh giá
thực nghiệm cũng được trình bày chi tiết trong chương đầu tiên này.
Chương 2, dựa trên hệ suy diễn mờ cổ điển Mamdani, NCS phát triển hệ
suy diễn Mamdani trên tập mờ phức và đồng thời cũng trình bày chi tiết các thành
phần cũng như phép toán sử dụng trong mơ hình đề xuất. Các phép tốn t- chuẩn
và t-đối chuẩn cũng được định nghĩa và ứng dụng trong bài toán hỗ trợ ra quyết
định. Cuối chương là kết quả thực nghiệm và nhận xét so sánh của hệ suy diễn đã
đề xuất trên các bộ dữ liệu thực nghiệm với hệ suy diễn mờ Mamdani.
Vấn đề tinh giảm hệ luật trong hệ suy diễn mờ phức Mamdani là nội dung được đề
cập và xem xét đến trong nội dung của chương 3. Xuất phát từ lý thuyết về tính tốn hạt,
NCS đề xuất ra các độ đo tương tự mờ phức và độ đo mờ phức kết hợp với tính tốn hạt
để thực hiện việc tinh giảm hệ luật trong hệ suy diễn mờ phức Mamdani

8
đã đề xuất ở chương 2 (hệ suy diễn mờ phức M-CFIS-R). Ví dụ số và thực nghiệm

trên các bộ dữ liệu cũng đã được trình bày để chứng minh được tính hiệu quả của
vấn đề giảm luật và tối ưu hóa hệ luật trong hệ suy diễn mờ phức Mamdani.

Chương 4, NCS mở rộng mơ hình M-CFIS-R sang hệ mờ Sugeno và
Tsukamoto đồng thời đề xuất thêm độ đo mờ phức và tích phân mờ phức dựa
trên lý thuyết tập hợp. Nếu trong Chương 3, NCS chỉ đi tập trung vào vấn đề
giảm luật, tối ưu luật trong phần Training thì Chương 4 NCS lại tập trung vào
cải tiến đối với bộ Testing bằng cách sử dụng lý thuyết về đồ thị tri thức mờ để
biểu diễn luật và thực hiện suy luận xấp xỉ đối với những bản ghi khơng có
trong bộ dữ liệu Training. Việc biểu diễn luật mờ phức bằng đồ thị tri thức mờ
đã giảm khá nhiều thời gian tính tốn của hệ suy diễn mờ phức M-CFIS-R.

9

Chương 1. TỔNG QUAN NGHIÊN
CỨU VÀ CƠ SỞ LÝ THUYẾT
1.1. Giới thiệu
Lý thuyết tập mờ nói chung và tập mờ phức nói riêng được coi là một
trong những cơng cụ toán học hiệu quả để biểu diễn và xử lý những khái niệm
không chắc chắn, không tường minh. Trong chương đầu tiên này, luận án trình
bày một số lý thuyết tổng quan về tập mờ nói chung và tập mờ phức nói riêng.
Tổng quan Các nghiên cứu liên quan về hệ suy diễn mờ cũng như các hệ mờ
phức cũng được trình bày khái quát trong nội dung chương để đưa ra một cái
nhìn tổng quan chung về các hệ suy diễn phát triển dựa trên lý thuyết tập mờ
phức. Thêm nữa, trong nội dung chương cũng giới thiệu khái quát về các bộ
dữ liệu và thước đo đánh giá hiệu năng của các hệ suy diễn trên tập mờ phức.

1.2. Vấn đề Hệ suy diễn mờ trong Hệ hỗ trợ ra quyết định
Con người đưa ra quyết định dựa trên các quy luật mà họ tổng kết được từ thực

tiễn cuộc sống, hay nói cách khác là thơng qua quá trình học để cung cấp phương án đầu
ra tốt nhất cho quá trình ra quyết định. Với đặc trưng gần gũi với suy luận tự nhiên của
con người và khả năng học, hệ mờ đã và đang được nghiên cứu, ứng dụng thành cơng
với vai trị như là một trong những công cụ làm cho "máy học thông minh hơn".

Để giải quyết bài toán hệ hỗ trợ ra quyết định thì đã có rất nhiều
phương pháp được áp dụng như cây quyết định, trí tuệ nhân tạo, hệ chuyên
gia, các hệ mờ... Tuy nhiên trong thực tế việc lựa chọn phương pháp nào
thì lại tùy thuộc vào từng bài toán cụ thể như đối tượng, mục tiêu cần hỗ trợ
ra quyết định hay dữ liệu trong hệ hỗ trợ ra quyết định ...

10
Với khả năng làm việc với các đối tượng là biến ngôn ngữ, gần gũi với suy luận tự
nhiên của con người, khả năng học, tổng kết tri thức để hình thành nên hệ luật, thì hệ mờ
dược coi là một trong những công cụ mạnh mẽ và được ứng dụng nhiều trong các hệ hỗ
trợ ra quyết định. Hệ thống với các mơ hình suy diễn mờ có thể cung cấp các lựa chọn
thay thế và đẩy nhanh kết quả trong việc quyết định đầu ra mong muốn
Dữ liệu huấn
luyện

Sinh luật

Hệ các luật mờ

Dữ liệu vào

Tổng hợp các luật mờ

Dự báo

Ra quyết định

Hình 1.1: Hệ suy diễn mờ trong Hệ hỗ trợ ra quyết định
Hình 1.1 mơ tả quy trình chung của phương pháp sử dụng hệ mờ trong các hệ
hỗ trợ ra quyết định. Ban đầu dựa trên dữ liệu mẫu huấn luyện, một quy trình sinh luật
được áp dụng để tạo ra hệ các luật mờ. Hệ luật này là trung tâm tập hợp các quy luật,
kiến thức trích rút ra từ tập dữ liệu huấn luyện. Tiếp theo, với mỗi đầu vào mới được
áp dụng với từng luật và tính tốn các đầu ra. Một quy trình tổng hợp kết quả từ các
luật để cho ra một giá trị chung. Cuối cùng, ở bước ra quyết định thì giá trị này được
điều chỉnh, chuẩn hóa để đưa ra quyết định cuối cùng.

1.3. Tổng quan các nghiên cứu liên quan
Logic mờ lần đầu tiên được giới thiệu coi như là một khái niệm để mô tả những
thông tin khơng chắc chắn, mơ hồ. Nó được ứng dụng rộng rãi để giải quyết các vấn đề
liên quan đến dự báo, điều khiển, phát hiện mẫu và các hệ hỗ trợ ra quyết định với thông
tin không chắc chắn. Đó được coi là mơ hình tính tốn mà có khả năng xử lý đồng thời cả
tri thức ngôn ngữ và dữ liệu số. Đó là cách lập trình cho máy tính hiểu và bắt chước suy
nghĩ của con người, với mục tiêu là làm tăng hiệu quả của quá trình ra quyết định đối với
các thơng tin đầu vào là thông tin mơ hồ và không chắc chắn. Từ lý thuyết về logic mờ đã
dẫn đến sự phát triển của các hệ thống suy diễn mờ. Một hệ

11

suy diễn mờ được định nghĩa như là một ánh xạ phi tuyến để đưa ra kết
quả dựa trên các lập luận mờ và một tập các luật mờ dạng if-then.

1.3.1. Hệ suy diễn mờ
Suy diễn là cơ chế liên kết các tri thức đã có để suy dẫn ra các tri thức mới.

Cơ chế suy diễn phụ thuộc rất nhiều vào phương thức biễu diễn tri thức và khơng
có một phương pháp suy diễn duy nhất cho mọi loại tri thức. Hệ suy diễn mờ (FIS)
là một khung tính toán phổ biến dựa trên khái niệm lý thuyết tập mờ, thường được
áp dụng khi xây dựng các quá trình hỗ trợ ra quyết định. Hệ suy diễn mờ tỏ ra
hiệu quả trong trường hợp tri thức không đầy đủ, bất định hoặc khơng chính xác.

Sơ đồ chung của một hệ FIS bao gồm ba phần chính: một bộ mờ
hóa, một bộ cơ sở luật và một bộ giải mờ. Hệ suy diễn mờ [2, 7] (mơ tả
trong Hình 1.2) có cấu trúc cơ bản như sau:
- Giao diện mờ hóa: chuyển đổi các lớp đầu vào thành các biên độ

phù hợp với các giá trị ngôn ngữ.
- Cơ sở trí thức bao gồm hai phần: Cơ sở dữ liệu ( định nghĩa các

hàm thuộc của các tập mờ được sử dụng trong các luật mờ) và bộ luật
( gồm các luật mờ IF – THEN)
- Đơn vị thực thi: thực hiện các hoạt động suy diễn trong các luật
- Giao diện giải mờ: chuyển đổi các giá trị kết quả mờ của hệ suy diễn

ra các lớp đầu ra rõ.

Hình 1.2: Sơ đồ tổng quan của hệ suy diễn mờ

Các bước suy diễn mờ:
• Mờ hóa các biến đầu vào: ta cần mờ hóa những giá trị rõ bởi hàm thuộc mờ để

12

tham gia vào q trình suy diễn

• Áp dụng các toán tử mờ (AND hoặc OR) cho các giả thiết của từng luật.
• Áp dụng phép kéo theo để tính toán giá trị các giá trị từ giả thiết đến

kết luận của từng luật.
• Áp dụng tốn tử gộp để kết hợp các kết quả trong từng luật thành một

kết quả duy nhất cho cả hệ.
• Giải mờ kết quả tìm được cho ta một kết quả rõ.

Các phương pháp suy diễn mờ được phân loại theo ba phương pháp
chính: Hệ suy diễn mờ Mamdani, hệ suy diễn mờ Sugeno (hay còn gọi là hệ
suy diễn mờ Takagi – Sugeno) và hệ suy diễn mờ Tsukamoto.
1.3.1.1 Hệ suy diễn mờ Mamdani

Hệ suy diễn mờ Mamdani [49] là hệ có phương pháp suy diễn mờ
đầu tiên được xây dựng bằng cách sử dụng lý thuyết tập mờ.

Hình 1.3: Hệ thống suy diễn Mamdani với hai đầu vào và hai luật

Hình 1.3 mơ tả về hệ suy diễn mờ Mamdani có hai biến đầu vào x, y
và một biến đầu ra z. Mỗi đầu vào có hai hàm thuộc đầu vào, kí hiệu lần
lượt là fA1; A2g ; fB1; B2g và đầu ra kí hiệu là fC1; C2g.
k

k

k

Luật thứ k sẽ có dạng như sau: k: IF x is A i and y is Bj THEN z is Cl với
k = 1; :::; R; i = 1; ::; N; j = 1; ::; M và l = 1; ::; L trong đó N; M; L là số lượng hàm

Một số mở rộng của hệ suy diễn mờ phức cho bài toán hỗ trợ ra quyết định

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về