Tải bản đầy đủ (.pdf) (143 trang)

Một số mở rộng của hệ suy diễn mờ phức cho bài toán hỗ trợ ra quyết định

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.08 MB, 143 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO

VIỆN HÀN LÂM KHOA HỌC VÀ
CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ

LƯƠNG THỊ HỒNG LAN

MỘT SỐ MỞ RỘNG CỦA HỆ SUY DIỄN MỜ PHỨC CHO
BÀI TOÁN HỖ TRỢ RA QUYẾT ĐỊNH

LUẬN ÁN TIẾN SĨ NGÀNH MÁY TÍNH

Hà Nội - 2021


BỘ GIÁO DỤC VÀ ĐÀO TẠO

VIỆN HÀN LÂM KHOA HỌC VÀ
CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ

LƯƠNG THỊ HỒNG LAN

MỘT SỐ MỞ RỘNG CỦA HỆ SUY DIỄN MỜ PHỨC CHO BÀI TOÁN
HỖ TRỢ RA QUYẾT ĐỊNH

Chuyên ngành: Khoa học máy tính
Mã số: 9.48.01.01



LUẬN ÁN TIẾN SĨ NGÀNH MÁY TÍNH

NGƯỜI HƯỚNG DẪN KHOA HỌC:
1. PGS.TS Lê Hồng Sơn
2. PGS.TS Nguyễn Long Giang

Hà Nội - 2021


LỜI CAM ĐOAN
Tác giả xin cam đoan đây là công trình nghiên cứu của bản thân tác giả, được
hồn thành dưới sự hướng dẫn của PGS.TS Lê Hoàng Sơn và PGS.TS Nguyễn Long
Giang. Các kết quả nghiên cứu và các kết luận trong luận án này là trung thực, không
sao chép từ bất kỳ một nguồn nào và dưới bất kỳ hình thức nào. Việc tham khảo các
nguồn tài liệu đã được thực hiện trích dẫn và ghi nguồn tài liệu tham khảo đúng quy
định.
Hà Nội, ngày 19 tháng 06 năm 2021
Tác giả luận án

Lương Thị Hồng Lan


LỜI CẢM ƠN
Luận án này được hoàn thành với sự nỗ lực không ngừng của tác giả và sự giúp
đỡ hết mình từ các thầy giáo hướng dẫn, bạn bè và người thân.
Đầu tiên, tác giả xin bày tỏ lòng biết ơn chân thành và sâu sắc tới các thầy giáo
hướng dẫn PGS.TS Lê Hoàng Sơn và PGS.TS Nguyễn Long Giang. Sự tận tình chỉ
bảo, hướng dẫn và động viên của các thầy dành cho tác giả suốt thời gian thực hiện
luận án là không thể nào kể hết được.

Tác giả xin gửi lời cảm ơn tới các thầy, cô giáo và cán bộ của bộ phận quản
lý nghiên cứu sinh - Học viện Khoa học và Công nghệ (Viện Hàn lâm Khoa học và
Công nghệ Việt Nam), bộ phận quản lý nghiên cứu sinh của Viện Công nghệ thông
tin đã nhiệt tình giúp đỡ và tạo ra mơi trường nghiên cứu tốt để tác giả hồn thành
cơng trình của mình.
Tác giả xin chân thành cảm ơn các anh chị em trong Lab Tại Viện Công nghệ
thông tin - Đại học Quốc gia Hà Nội đã giúp đỡ tác giả trong suốt quá trình học tập
và nghiên cứu tại Lab.
Tác giả xin chân thành cảm ơn tới Ban Giám hiệu trường Đại học Sư phạm,
Đại học Thái Nguyên, các đồng nghiệp khoa Tốn, nơi tác giả đã cơng tác những năm
đầu nghiên cứu sinh; và Ban Giám hiệu trường Đại học Thủy Lợi Hà Nội, các đồng
nghiệp khoa Công nghệ thông tin, nơi tác giả hiện đang công tác đều đã luôn động
viên, giúp đỡ tác giả trong công tác để tác giả có thời gian tập trung nghiên cứu và
hoàn thành luận án đúng thời hạn.
Đặc biệt tác giả xin bày tỏ lòng biết ơn sâu sắc tới Bố, Mẹ, các em trong gia
đình, những người ln dành cho những tình cảm nồng ấm và sẻ chia những lúc khó
khăn trong cuộc sống, ln động viên giúp đỡ tơi trong q trình nghiên cứu. Cảm ơn
con gái ln ngoan ngoãn và ủng hộ để mẹ tập trung nghiên cứu, hồn thành luận án.
Luận án cũng là món q tinh thần mà tôi trân trọng gửi tặng đến các thành viên trong
Gia đình.
Tơi xin trân trọng cảm ơn!
Hà Nội, ngày 19 tháng 06 năm 2021
Người thực hiện

Lương Thị Hồng Lan


i

MỤC LỤC

Danh mục các bảng

vi

Danh mục các hình vẽ, đồ thị

vii

MỞ ĐẦU
Chương 1.

1
TỔNG QUAN NGHIÊN CỨU VÀ CƠ SỞ LÝ THUYẾT

9

1.1 Giới thiệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

9

1.2 Vấn đề Hệ suy diễn mờ trong Hệ hỗ trợ ra quyết định . . . . . . . . . .

9

1.3 Tổng quan các nghiên cứu liên quan . . . . . . . . . . . . . . . . . . .

10

1.3.1 Hệ suy diễn mờ . . . . . . . . . . . . . . . . . . . . . . . . . . .


11

1.3.2 Các hệ phát triển dựa trên tập mờ phức . . . . . . . . . . . . .

14

1.3.3 Các vấn đề còn tồn tại cần giải quyết của hệ CFIS hiện nay . .

19

1.4 Cơ sở lý thuyết . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

20

1.4.1 Tập mờ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

21

1.4.2 Tập mờ phức . . . . . . . . . . . . . . . . . . . . . . . . . . . .

21

1.4.3 Các phép toán trên tập mờ phức . . . . . . . . . . . . . . . . . .

24

1.4.4 Logic mờ phức . . . . . . . . . . . . . . . . . . . . . . . . . . .

27


1.4.5 Độ đo mờ và độ đo mờ phức . . . . . . . . . . . . . . . . . . . .

28

1.5 Dữ liệu thực nghiệm . . . . . . . . . . . . . . . . . . . . . . . . . . . .

30

1.5.1 Bộ dữ liệu chuẩn . . . . . . . . . . . . . . . . . . . . . . . . . .

30

1.5.2 Bộ dữ liệu thực- Bệnh gan Liver . . . . . . . . . . . . . . . . . .

31

1.5.3 Các độ đo đánh giá thực nghiệm . . . . . . . . . . . . . . . . .

32

1.6 Kết Chương 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

33


ii

Chương 2.

XÂY DỰNG HỆ SUY DIỄN MỜ PHỨC DẠNG MAMDANI

(M-CFIS)

34

2.1 Giới thiệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

34

2.2 Đề xuất toán tử t-chuẩn và t- đối chuẩn mờ phức . . . . . . . . . . . . .

36

2.2.1 Toán tử t-chuẩn và t-đối chuẩn . . . . . . . . . . . . . . . . . .

37

2.2.2 Toán tử t-chuẩn và t-đối chuẩn mờ phức . . . . . . . . . . . . .

38

2.2.3 Ví dụ minh họa hỗ trợ ra quyết định . . . . . . . . . . . . . . . .

41

2.3 Hệ suy diễn mờ phức Mamdani (M-CFIS) . . . . . . . . . . . . . . . .

44

2.3.1 Đề xuất hệ suy diễn mờ phức Mamdani . . . . . . . . . . . . . .


44

2.3.2 Các lựa chọn sử dụng trong hệ suy diễn mờ phức Mamdani . .

45

2.3.3 Cấu trúc của hệ suy diễn mờ phức Mamdani

. . . . . . . . . .

47

2.3.4 Ví dụ số minh họa mơ hình suy diễn M-CFIS . . . . . . . . . . .

49

2.3.5 Thử nghiệm và đánh giá kết quả . . . . . . . . . . . . . . . . . .

51

2.4 Kết Chương 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

53

Chương 3.

TINH GIẢM HỆ LUẬT TRONG HỆ SUY DIỄN MỜ PHỨC
MAMDANI (M-CFIS-R)

55


3.1 Giới thiệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

55

3.2 Đề xuất độ đo tương tự mờ phức . . . . . . . . . . . . . . . . . . . . .

60

3.2.1 Độ đo tương tự mờ phức Cosine . . . . . . . . . . . . . . . . . .

61

3.2.2 Độ đo tương tự mờ phức Dice . . . . . . . . . . . . . . . . . . .

62

3.2.3 Độ đo tương tự mờ phức Jaccard . . . . . . . . . . . . . . . . .

63

3.3 Đề xuất mơ hình hệ suy diễn M-CFIS-R . . . . . . . . . . . . . . . . .

64

3.3.1 Ý tưởng xây dựng mơ hình . . . . . . . . . . . . . . . . . . . . .

64

3.3.2 Phần Training . . . . . . . . . . . . . . . . . . . . . . . . . . . .


65

3.3.3 Phần Testing . . . . . . . . . . . . . . . . . . . . . . . . . . . .

70

3.4 Thử nghiệm và đánh giá kết quả . . . . . . . . . . . . . . . . . . . . . .

71

3.4.1 Kết quả thực nghiệm trên bộ dữ liệu UCI . . . . . . . . . . . . .

71

3.4.2 Kết quả thực nghiệm trên bộ dữ liệu thực . . . . . . . . . . . . .

73


iii

3.5 Kết Chương 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Chương 4.

75

MỞ RỘNG HỆ SUY DIỄN MỜ PHỨC MAMDANI VỚI ĐỒ
THỊ TRI THỨC (M-CFIS-FKG)


77

4.1 Giới thiệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

77

4.2 Một số mở rộng của mơ hình M-CFIS-R . . . . . . . . . . . . . . . . .

79

4.2.1 Hệ suy diễn mờ phức Sugeno và Tsukamoto . . . . . . . . . . .

79

4.2.2 Độ đo mờ phức dựa trên lý thuyết tập hợp . . . . . . . . . . . .

80

4.2.3 Tích phân mờ phức . . . . . . . . . . . . . . . . . . . . . . . . .

86

4.3 Đề xuất mơ hình hệ suy diễn mờ phức M-CFIS-FKG . . . . . . . . . .

93

4.3.1 Ý tưởng xây dựng mơ hình . . . . . . . . . . . . . . . . . . . . .

93


4.3.2 Xây dựng đồ thị tri thức mờ . . . . . . . . . . . . . . . . . . . .

95

4.3.3 Thuật toán suy diễn nhanh trên đồ thị tri thức mờ . . . . . . . .

96

4.3.4 Ví dụ minh họa hệ suy diễn mờ phức M-CFIS-FKG . . . . . . .

98

4.4 Thực nghiệm và đánh giá kết quả . . . . . . . . . . . . . . . . . . . . . 103
4.4.1 Thực nghiệm . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
4.4.2 Kết quả thực nghiệm . . . . . . . . . . . . . . . . . . . . . . . . 104
4.5 Kết Chương 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

114

Những kết quả chính của luận án . . . . . . . . . . . . . . . . . . . . . . . . 114
Hướng phát triển của luận án . . . . . . . . . . . . . . . . . . . . . . . . . . 116
TÀI LIỆU THAM KHẢO

119


iv

Kí hiệu và viết tắt

STT
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

Từ tắt
FS
CFS
CFL
FIS

Tiếng anh
Fuzzy Set
Complex Fuzzy Set
Complex Fuzzy Logic
Fuzzy Inference System

Complex Fuzzy Inference
CFIS
System
Intituition Fuzzy Inference
IFIS
System
Adaptive Neuro Fuzzy
ANFIS
Inference System
Complex
Neuro-Fuzzy
CANFIS
Inference System
Adaptive Neuro Complex
ANCFIS
Fuzzy Inference System
CNS
Complex Neutrosophic Set
Multicriteria
decision
MCDM
making
Fast Inference Search
FISA
Algorithm
KG
Knowledge Graph
FKG
Fuzzy Knowledge Graph
Mamdani Fuzzy Inference

M-FIS
System
Mamdani Complex Fuzzy
M-CFIS
Inference System
Mamdani Complex Fuzzy
M-CFIS-R Inference System Reduce
Rule

Diễn dải
Tập mờ
Tập mờ phức
Logic mờ phức
Hệ suy diễn
Hệ suy diễn mờ phức
Hệ suy diễn mờ trực cảm
Hệ suy diễn mờ noron thích
nghi
Hệ suy diễn mờ noron thích
nghi phức
Mạng noron giá trị mờ phức
thích nghi
Tập Neutrosophic phức
Hệ hỗ trợ ra quyết định đa tiêu
chí
Thuật tốn tìm kiếm suy diễn
nhanh
Đồ thị tri thức
Đồ thị tri thức mờ
Hệ suy diễn mờ Mamdani

Hệ suy diễn
Mamdani

mờ

phức

Hệ suy diễn mờ
Mamdani - giảm luật

phức


v

18

M-CFISFKG

19
20

GRC
UCI

21

RANCFIS

22


FANCFIS

Mamdani Complex Fuzzy
Inference System FuzzyKnowledge Graph
Granular Computing
UC Irvine Machine
Randomized
AdaptiveNetwork Based Fuzzy
Inference System
Fast
Adaptive-Network
Based Fuzzy Inference
System

Hệ suy diễn mờ phức
Mamdani - Đồ thị tri thức mờ
Tính tốn hạt
Kho dữ liệu chuẩn UCI
Mạng nơ ron giá trị mờ phức
thích nghi ngẫu nhiên
Mạng nơ ron giá trị mờ phức
thích nghi nhanh


vi

Danh mục các bảng
1.1 Các bộ dữ liệu thực nghiệm chuẩn Benchmark . . . . . . . . . . . . . .


31

1.2 Các thuộc tính dữ liệu đầu vào trong tập dữ liệu bệnh gan Liver . . . .

32

2.1 Ma trận ra quyết định dựa trên các mẫu dữ liệu . . . . . . . . . . . . .

42

2.2 Ma trận quyết định mờ . . . . . . . . . . . . . . . . . . . . . . . . . . .

43

2.3 Ma trận chuẩn hóa . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

43

2.4 Ma trận quyết định mờ . . . . . . . . . . . . . . . . . . . . . . . . . . .

43

2.5 Ma trận quyết định kết quả . . . . . . . . . . . . . . . . . . . . . . . . .

44

2.6 Bộ dữ liệu đầu vào . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

50


2.7 Bộ cơ sở luật . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

50

4.1 Hệ cơ sở luật mờ phức . . . . . . . . . . . . . . . . . . . . . . . . . . .

95

4.2 Kịch bản 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
4.3 Kịch bản 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103


vii

Danh mục các hình vẽ, đồ thị
1

Cấu trúc luận án . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

7

1.1 Hệ suy diễn mờ trong Hệ hỗ trợ ra quyết định . . . . . . . . . . . . . .

10

1.2 Sơ đồ tổng quan của hệ suy diễn mờ . . . . . . . . . . . . . . . . . . .

11

1.3 Hệ thống suy diễn Mamdani với hai đầu vào và hai luật . . . . . . . . .


12

1.4 Hệ suy diễn mờ Tagaki- Sugeno với hai đầu vào và hai luật . . . . . . .

13

1.5 Hệ suy diễn mờ Tsukamoto với hai đầu vào và hai luật . . . . . . . . .

14

1.6 Hệ thống logic mờ do Ramot đề xuất . . . . . . . . . . . . . . . . . . .

15

1.7 Kiến trúc của hệ thống CANFIS . . . . . . . . . . . . . . . . . . . . . .

17

1.8 Biểu diễn của hàm thuộc mờ phức . . . . . . . . . . . . . . . . . . . .

22

2.1 Mơ hình hệ suy diễn mờ phức Mamdani . . . . . . . . . . . . . . . . .

45

2.2 Kết quả chạy thực nghiệm so sánh trên Bộ dữ liệu WBCD . . . . . . .

52


2.3 Kết quả chạy thực nghiệm so sánh trên Bộ dữ liệu Diebetes . . . . . .

52

2.4 Kết quả chạy thực nghiệm so sánh trên Bộ dữ liệu thực Liver . . . . . .

53

3.1 Giai đoạn Training của mơ hình đề xuất . . . . . . . . . . . . . . . . .

66

3.2 Giai đoạn Testing của mơ hình M-CFIS-R đề xuất . . . . . . . . . . . .

71

3.3 Kết quả thực nghiệm trên bộ dữ liệu WBCD . . . . . . . . . . . . . . .

72

3.4 Kết quả thực nghiệm trên bộ dữ liệu Diebetes . . . . . . . . . . . . . .

73

3.5 Kết quả thực nghiệm trên bộ dữ liệu thực Liver . . . . . . . . . . . . .

74

4.1 Quá trình Training . . . . . . . . . . . . . . . . . . . . . . . . . . . . .


94

4.2 Quá trình Testing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

95

4.3 Biểu diễn của luật mờ phức . . . . . . . . . . . . . . . . . . . . . . . .

96


viii

4.4 Đồ thị tri thức mờ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

97

4.5 Đồ thị FKG cho sáu luật . . . . . . . . . . . . . . . . . . . . . . . . . . 100
4.6 Phân bố dữ liệu với từng nhãn đối với bộ dữ liệu có 2 nhãn

. . . . . . 104

4.7 Phân bố dữ liệu với từng nhãn đối với bộ dữ liệu có nhiều nhãn . . . . 105
4.8 So sánh mơ hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu WBCD . 106
4.9 So sánh mơ hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu Diebetes 107
4.10 So sánh mô hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu Liver . . 108
4.11 So sánh mơ hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu Wine . . 109
4.12 So sánh mô hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu CTG . . 110
4.13 So sánh mơ hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu Arrhythmia111



1

MỞ ĐẦU
Mở đầu
Ra quyết định là một phần vô cùng quan trọng trong cuộc sống, do đó gần đây
rất nhiều nhà nghiên cứu đã đưa ra nhiều hướng tiếp cận khác nhau để giải quyết, hỗ
trợ quá trình ra quyết định như tiếp cận mờ, mơ hình giá trị độ đo... Quá trình hỗ trợ
ra quyết định chủ yếu tập trung vào việc đưa ra những phương pháp, cách thức để có
thể hỗ trợ đưa ra quyết định cuối cùng một cách đúng đắn nhất, nhất là đối với môi
trường dữ liệu ngày càng nhiều biến động, dữ liệu không chắc chắn, không xác định
rõ ràng.
Tập mờ (Fuzzy Set-FS) được Zadel đề xuất năm 1965 [1] được coi là một trong
những công cụ hữu hiệu để giải quyết các bài tốn mà có dữ liệu khơng chắc chắn,
khơng xác định rõ ràng. Rất nhiều những nghiên cứu mở rộng của FS đã được giới
thiệu trong vài năm gần đây [2, 3, 4, 5, 6] và được ứng dụng nhiều trong bài toán
hệ hỗ trợ ra quyết định. Một trong những kĩ thuật quan trọng dựa trên lý thuyết FS
và ứng dụng trong việc giải quyết các bài toán của hệ hỗ trợ ra quyết định là Hệ suy
diễn mờ (Fuzzy Inference System - FIS). FIS hiện đã và đang được ứng dụng rộng
rãi trong nhiều bài toán phân loại/dự báo và các bài toán của hệ hỗ trợ ra quyết định
như lựa chọn nhân sự, lựa chọn nhà cung cấp, hỗ trợ ra chiến lược phát triển công
ty... Bên cạnh đó, trong một vài ứng dụng khác thì hệ FIS được sử dụng để tạo ra một
tập hợp các luật mờ nhằm mục đích phát hiện, dự báo hoặc phân loại các đối tượng
như phát hiện ung thư phổi, phát hiện bệnh đái tháo đường, dự đoán bị bệnh tim ...
[7, 8, 9, 10, 11, 12, 13].
Một phiên bản mở rộng của FIS nhúng vào mạng nơ ron và kết hợp với học dựa
trên phương pháp gradient có tên gọi là Hệ suy diễn mờ nơ ron thích nghi (ANFIS)
[14] và cho kết quả tốt trong vấn đề dự báo bệnh mạch vành, ước tính sự tăng cường
độ dẫn nhiệt của kim loại và oxit kim loại ... [15, 16, 17, 18]. Ngồi ra, ANFIS cịn

được kết hợp với các mơ hình học máy khác như thuật tốn tối ưu hóa bầy đàn và áp


2

dụng đối với các bài toán trong hệ hỗ trợ ra quyết định [19, 20, 21].
Bên cạnh đó, nhiều phiên bản khác nhau của hệ FIS trên các tập mờ mở rộng
áp dụng đối với bài toán hỗ trợ ra quyết định cũng đã và đang được nghiên cứu rộng
rãi. Ví dụ như hệ suy diễn mờ trực cảm (IFIS) được sử dụng trong hồi quy và ứng
dụng hỗ trợ dự báo phá sản của doanh nghiệp [22, 23, 24, 25, 25, 26, 27]. Một số
nghiên cứu kết hợp giữa hệ suy diễn mờ bức tranh (PFS) với thuật toán phân cụm
mờ bức tranh và độ đo mờ bức tranh được ứng dụng trong việc giải quyết một số vấn
đề ra quyết định như dự báo thời tiết, dự báo giá cổ phiếu và phân đoạn hình ảnh
[28, 29, 30, 31, 32, 33, 34, 35].
Gần đây, cùng với sự gia tăng của các vấn đề ra quyết định dựa trên các dữ liệu
có sự thay đổi về thời gian hay các dữ liệu có yếu tố chu kì, định kì thì khái niệm tập
mờ phức (CFS) [36] ra đời với hàm thuộc bao gồm cả thành phần biên độ và thành
phần pha để biểu diễn, mô tả các dữ liệu có yếu tố chu kì, định kì hay các dữ liệu có
sự thay đổi về thời gian. CFS được áp dụng trong nhiều nghiên cứu, tập trung chủ yếu
vào các vấn đề như các toán tử tổng hợp mờ phức, thông tin mềm mờ phức, độ đo
khoảng cách mờ phức và mạng các khái niệm mờ phức [37, 38, 39, 40, 41, 42, 43].
Ưu điểm của CFS là khả năng mơ hình hóa các hiện tượng và sự kiện theo thời gian,
theo giai đoạn để từ đó có thể cho thấy tổng thể chúng trong một ngữ cảnh nhất định.
Ví dụ như để xác nhận chẩn đoán huyết áp của bệnh nhân là “cao” hay “thấp”
thì một bệnh nhân được đo 30 lần rồi ghi lại giá trị tương ứng với mỗi lần đo, sau đó
giá trị trung bình và phương sai được tính tốn đối với giá trị huyết áp đo được. Từ đó
huyết áp của bệnh nhân có thể tính được dễ dàng bằng cách lấy giá trị trung bình và
phương sai của các lần đo (sử dụng ý nghĩa của mờ hóa của hệ FIS trên tập CFS), ví
dụ như là huyết áp thấp với giá trị trung bình và phương sai cho giá trị nhỏ. Cịn nếu
như huyết áp chỉ đo tại một thời điểm và đưa ra quyết định thì có thể dẫn đến quyết

định về huyết áp của bệnh nhân khơng chính xác.
Một ví dụ khác về vấn đề chẩn đoán bệnh: nếu chỉ dựa vào các giá trị thuộc
tính bệnh mà khơng xét tới các thuộc tính khác thì làm cho kết quả chẩn đốn khơng
được chính xác, do kết luận bệnh khơng chỉ phụ thuộc vào mỗi một giá trị thuộc tính


3

bệnh mà còn cần phải xét tới các yếu tố liên quan tới bệnh đó. Hơn nữa, cũng có nhiều
kịch bản, dữ liệu trong thực tế liên quan đến yếu tố pha, trong dữ liệu có xu hướng
tuần hồn, chẳng hạn như lượng mưa được ghi lại trong một vùng hoặc sóng âm thanh
do một nhạc cụ tạo ra. Do đó, hiển nhiên rằng số phức cũng phải có một vị trí trong
hệ thống suy luận mờ. Đây cũng là động cơ chính của luận án này.
Hệ suy diễn mờ phức được coi là một công cụ hiệu quả đối với việc giải quyết
các vấn đề không chắc chắn và có yếu tố định kỳ, chu kì. Hệ suy diễn mờ phức đầu
tiên được giới thiệu Ramot [44] được gọi là Hệ logic mờ phức được phát triển từ hệ
thống logic mờ thông thường nhưng thay thế tập mờ và phép kéo theo mờ bởi biến đổi
phức tương ứng của nó. Một nghiên cứu khác bởi Man và cộng sự [45] dựa trên sự
kết hợp giữa phương pháp học quy nạp với hệ suy diễn trong tập phức. Một phiên bản
học nhúng khác với mạng mờ nơ ron trên tập CFS với tên gọi Hệ thống suy diễn mờ
phức nơ ron thích nghi (ANCFIS) được giới thiệu bởi Chen và cơng sự [46]. Sau đó
2 cải tiến của ANCFIS với mục đích làm gia tăng tốc độ tính tốn được đưa ra trong
[47, 48].
Mặc dù nhiều hệ thống suy diễn phát triển dựa trên tập mờ phức đã được nghiên
cứu và ứng dụng nhưng các hệ thống đã có đều chưa thực sự đúng với ý nghĩa của
hệ thống suy diễn mờ phức thực sự. Hầu hết các hệ thống đều sử dụng tập mờ phức
làm biến đầu vào nhưng các nghiên cứu đều chỉ sử dụng thành phần biên độ trong quá
trình ra quyết định mà bỏ qua thành phần pha. Ví dụ như hệ logic mờ phức của Ramot
thì bỏ qua thành phần pha trong giải mờ kết quả đầu ra, làm cho hệ thống không đủ
yếu tố khi xử lý với dữ liệu có yếu tố lặp lại hoặc dữ liệu xảy ra định kì, và điều này

làm giảm đi ý nghĩa của mơ hình hệ suy diễn mờ phức, trở thành hệ suy diễn mờ
thường. Còn mơ hình ANCFIS của Man và Chen [46] thì sử dụng phép tích vơ hướng
vec tơ cho q trình tổng hợp kết quả, và coi các giá trị đầu vào phức như là các giá
trị thực. Do đó, hệ thống ANCFIS không thực sự là hệ thống phức khi đầu ra của hệ
thống khơng thể đại diện cho tính tuần hồn của các thành phần trong đó.
Khi xử lý đối với dữ liệu có yếu tố chu kì, định kì, dữ liệu có yếu tố thay đổi
theo thời gian thì các hệ FIS, ANFIS hay các hệ phát triển trên tập mờ phức đều đưa


4

ra hai phương thức xử lý chung: (1) Bỏ qua thông tin liên quan đến yếu tố thành phần
pha; (2) Biểu diễn thành phần biên độ và pha riêng biệt với nhau thành 2 thành phần
riêng biệt bằng cách sử dụng 2 tập mờ. Điều này sẽ làm cho thông tin bị mất mát và
kết quả thu được khơng có độ tin cậy cao (nếu các thông tin về thành phần pha bị bỏ
qua), làm sai lệch thông tin và giảm hiệu năng tính tốn (nếu thơng tin về biên độ và
pha được xử lý riêng biệt), thời gian tính toán sẽ tăng thêm do số lượng các bộ cần
được xử lý tăng thêm.
Thêm nữa, các nghiên cứu đã có hệ suy diễn dựa trên lý thuyết tập mờ phức
vẫn cịn tồn tại một số hạn chế như sau:
• Các hệ suy diễn mờ phức chưa đưa ra được quy trình tổng thể xây dựng hệ suy
diễn mờ phức cho hệ hỗ trợ ra quyết định.
• Các hệ luật trong các hệ suy diễn mờ phức đã có chỉ sinh ra dựa trên kinh
nghiệm, dựa trên tư duy logic suy diễn mà chưa đề cập đến vấn đề tối ưu, tinh
giảm hệ luật suy diễn mờ phức.
• Các hệ suy diễn chưa được nghiên cứu để áp dụng đối với bộ dữ liệu mới mà
khơng có trong dữ liệu huấn luyện khi sinh mơ hình suy diễn.
• Các tốn tử t-chuẩn và t-đối chuẩn mờ phức còn chưa được quan tâm nghiên cứu
tìm hiểu và ứng dụng trong hệ hỗ trợ ra quyết định.


Mục tiêu nghiên cứu của luận án
Xuất phát từ những tồn tại và hạn chế của các công bố về tập mờ phức và hệ
suy diễn dựa trên tập mờ phức thì luận án tập trung nghiên cứu tìm hiểu và áp dụng
hệ suy diễn mờ phức đối với bài toán hệ hỗ trợ ra quyết định với dữ liệu có yếu tố thời
gian , cụ thể như sau:
• Nghiên cứu lý thuyết về tập mờ phức, logic mờ phức, các độ đo dựa trên tập mờ
phức.
• Nghiên cứu và phát triển các hệ suy diễn dựa trên tập mờ phức.


5

• Nghiên cứu các kĩ thuật để giảm luật mờ trong hệ suy diễn mờ phức.
• Nghiên cứu đồ thị tri thức mờ trong biểu diễn luật mờ để giảm thời gian tính
tốn suy diễn đối với tập testing và xử lí suy diễn khi có một tập dữ liệu mới mà
khơng có sẵn trong tập dữ liệu huấn luyện.
Xuất phát từ mục tiêu nghiên cứu, phạm vi nghiên cứu của luận án tập trung
nghiên cứu một số các vấn đề sau:
• Nghiên cứu lý thuyết về tập mờ phức, các phép toán và hệ suy diễn dựa trên tập
mờ phức
• Luận án chỉ nghiên cứu và thử nghiệm các bài toán hệ hỗ trợ ra quyết định với
dữ liệu có yếu tố thời gian.
Với mục tiêu đặt ra như trên, luận án đạt được một số kết quả chính như sau:
• Đề xuất hệ suy diễn mờ phức theo mơ hình Mamdani: Dựa trên mơ hình hệ suy
diễn mờ cổ điển Mamdani, luận án phát triển mơ hình suy diễn Mamdani trên
tập mờ phức. Mơ hình cấu trúc của hệ suy diễn mờ phức đề xuất cũng như các
bước cụ thể trong hệ suy diễn mờ phức Mamdani cũng được đưa ra và áp dụng
thực nghiệm mơ hình suy diễn đối với với các bộ dữ liệuchuẩn UCI và dữ liệu
thực. Thêm nữa, NCS cũng đề xuất các toán tử t-chuẩn, t-đối chuẩn mờ phức và
ví dụ số với hệ hỗ trợ ra quyết định. Các đóng góp này được trình bày trong nội

dung Chương 2 của luận án.
• Đề xuất các độ đo tương tự dựa trên tập mờ phức, kết hợp giữa độ đo tương tự
mờ phức và tính tốn hạt để giải quyết vấn đề tinh giảm hệ luật trong mơ hình
suy diễn mờ phức Mamdani. Cải tiến mơ hình hệ suy diễn mờ phức Mamdani ở
Chương 2 và xây dựng hệ suy diễn mờ phức M-CFIS-R. Các đóng góp này được
trình bày chi tiết trong Chương 3 của luận án.
• Đề xuất mở rộng hệ suy diễn mờ phức theo mơ hình Sugeno và Tsukamoto và
các độ đo mờ phức, tích phân mờ phức dựa trên lý thuyết tập hợp. Nghiên cứu


6

cách biểu diễn luật mờ dựa trên đồ thị tri thức và cải tiến mơ hình hệ suy diễn
mờ phức M-CFIS-R để đưa ra mơ hình M-CFIS-FKG. Thực nghiệm trên các bộ
dữ liệu cũng chứng minh hiệu quả về thời gian tính tốn của mơ hình và suy diễn
trong trường hợp bộ dữ liệu kiểm tra khơng có trong bộ dữ liệu huấn luyện
Đối tượng nghiên cứu của luận án là các hệ suy diễn theo tiếp cận tập mờ
phức, các phương pháp cải tiến hệ luật và biểu diễn hệ luật qua đồ thị tri thức.
Phương pháp nghiên cứu của luận án là nghiên cứu lý thuyết và nghiên cứu
thực nghiệm.
i) Nghiên cứu lý thuyết: Nghiên cứu tổng quan lý thuyết về tập mờ phức, các
phép toán mờ phức t-chuẩn, t-đối chuẩn, các độ đo dựa trên tập mờ phức và các hệ
suy diễn mờ phức đã công bố, phân tích ưu điểm, nhược điểm và các vấn đề còn tồn
tại của các nghiên cứu liên quan. Trên cơ sở đó, đề xuất các phép tốn, các độ đo
tương tự, độ đo dựa trên lý thuyết tập hợp và các hệ suy diễn mờ phức theo mơ hình
Mamdani, Sugeno và Tsukamoto. Các đề xuất, cải tiến được chứng minh chặt chẽ về
lý thuyết bởi các định lý, mệnh đề.
ii) Nghiên cứu thực nghiệm: Các thuật toán đề xuất được cài đặt, chạy thử
nghiệm, so sánh, đánh giá với các hệ suy diễn khác trên các bộ số liệu mẫu từ kho
dữ liệu UCI và bộ dữ liệu thực tế tại Bệnh viện Gang thép Thái Nguyên nhằm minh

chứng về tính hiệu quả của các nghiên cứu về lý thuyết.

Cấu trúc của luận án
Bố cục của luận án gồm bốn chương nội dung chính, phần Mở đầu, Kết luận và
danh mục các tài liệu tham khảo. Phần Mở đầu trình bày tổng quan về vấn đề nghiên
cứu, lý do chọn đề tài, đối tượng, mục tiêu và nội dung nghiên cứu của luận án. Phần
Kết luận tổng kết những kết quả đã đạt được của luận án và hướng phát triển, hướng
nghiên cứu trong tương lai. Các chương nội dung chính được tổ chức như trong Hình
1 cụ thể như sau: Chương đầu tiên NCS trình bày về các kiến thức tổng quan sử dụng
trong luận án như các kiến thức nền tảng về tập mờ, tập mờ phức và hệ suy diễn dựa
trên tập mờ và tập mờ phức. Thêm nữa các độ đo phát triển dựa trên tập mờ và tập


7

Hình 1: Cấu trúc luận án

mờ phức cũng được trình bày trong chương mở đầu này. Từ các kiến thức nền đó mà
chúng tơi đưa ra lí do để sử dụng hệ suy diễn mờ phức đối với việc giải quyết bài tốn
hỗ trợ ra quyết định có dữ liệu thay đổi theo thời gian. Các bộ dữ liệu thực nghiệm
trong luận án cùng với các thước đo dùng để đánh giá thực nghiệm cũng được trình
bày chi tiết trong chương đầu tiên này.
Chương 2, dựa trên hệ suy diễn mờ cổ điển Mamdani, NCS phát triển hệ suy
diễn Mamdani trên tập mờ phức và đồng thời cũng trình bày chi tiết các thành phần
cũng như phép toán sử dụng trong mơ hình đề xuất. Các phép tốn t- chuẩn và t-đối
chuẩn cũng được định nghĩa và ứng dụng trong bài toán hỗ trợ ra quyết định. Cuối
chương là kết quả thực nghiệm và nhận xét so sánh của hệ suy diễn đã đề xuất trên
các bộ dữ liệu thực nghiệm với hệ suy diễn mờ Mamdani.
Vấn đề tinh giảm hệ luật trong hệ suy diễn mờ phức Mamdani là nội dung được
đề cập và xem xét đến trong nội dung của chương 3. Xuất phát từ lý thuyết về tính

tốn hạt, NCS đề xuất ra các độ đo tương tự mờ phức và độ đo mờ phức kết hợp với
tính tốn hạt để thực hiện việc tinh giảm hệ luật trong hệ suy diễn mờ phức Mamdani


8

đã đề xuất ở chương 2 (hệ suy diễn mờ phức M-CFIS-R). Ví dụ số và thực nghiệm
trên các bộ dữ liệu cũng đã được trình bày để chứng minh được tính hiệu quả của vấn
đề giảm luật và tối ưu hóa hệ luật trong hệ suy diễn mờ phức Mamdani.
Chương 4, NCS mở rộng mơ hình M-CFIS-R sang hệ mờ Sugeno và Tsukamoto
đồng thời đề xuất thêm độ đo mờ phức và tích phân mờ phức dựa trên lý thuyết tập
hợp. Nếu trong Chương 3, NCS chỉ đi tập trung vào vấn đề giảm luật, tối ưu luật trong
phần Training thì Chương 4 NCS lại tập trung vào cải tiến đối với bộ Testing bằng
cách sử dụng lý thuyết về đồ thị tri thức mờ để biểu diễn luật và thực hiện suy luận
xấp xỉ đối với những bản ghi khơng có trong bộ dữ liệu Training. Việc biểu diễn luật
mờ phức bằng đồ thị tri thức mờ đã giảm khá nhiều thời gian tính tốn của hệ suy diễn
mờ phức M-CFIS-R.


9

Chương 1. TỔNG QUAN NGHIÊN
CỨU VÀ CƠ SỞ LÝ THUYẾT
1.1.

Giới thiệu
Lý thuyết tập mờ nói chung và tập mờ phức nói riêng được coi là một trong

những cơng cụ tốn học hiệu quả để biểu diễn và xử lý những khái niệm không chắc
chắn, không tường minh. Trong chương đầu tiên này, luận án trình bày một số lý thuyết

tổng quan về tập mờ nói chung và tập mờ phức nói riêng. Tổng quan Các nghiên cứu
liên quan về hệ suy diễn mờ cũng như các hệ mờ phức cũng được trình bày khái quát
trong nội dung chương để đưa ra một cái nhìn tổng quan chung về các hệ suy diễn
phát triển dựa trên lý thuyết tập mờ phức. Thêm nữa, trong nội dung chương cũng giới
thiệu khái quát về các bộ dữ liệu và thước đo đánh giá hiệu năng của các hệ suy diễn
trên tập mờ phức.

1.2.

Vấn đề Hệ suy diễn mờ trong Hệ hỗ trợ ra quyết định
Con người đưa ra quyết định dựa trên các quy luật mà họ tổng kết được từ thực

tiễn cuộc sống, hay nói cách khác là thơng qua q trình học để cung cấp phương án
đầu ra tốt nhất cho quá trình ra quyết định. Với đặc trưng gần gũi với suy luận tự nhiên
của con người và khả năng học, hệ mờ đã và đang được nghiên cứu, ứng dụng thành
cơng với vai trị như là một trong những công cụ làm cho "máy học thông minh hơn".
Để giải quyết bài tốn hệ hỗ trợ ra quyết định thì đã có rất nhiều phương pháp
được áp dụng như cây quyết định, trí tuệ nhân tạo, hệ chuyên gia, các hệ mờ... Tuy
nhiên trong thực tế việc lựa chọn phương pháp nào thì lại tùy thuộc vào từng bài tốn
cụ thể như đối tượng, mục tiêu cần hỗ trợ ra quyết định hay dữ liệu trong hệ hỗ trợ ra
quyết định ...


10

Với khả năng làm việc với các đối tượng là biến ngôn ngữ, gần gũi với suy luận
tự nhiên của con người, khả năng học, tổng kết tri thức để hình thành nên hệ luật, thì
hệ mờ dược coi là một trong những công cụ mạnh mẽ và được ứng dụng nhiều trong
các hệ hỗ trợ ra quyết định. Hệ thống với các mơ hình suy diễn mờ có thể cung cấp
các lựa chọn thay thế và đẩy nhanh kết quả trong việc quyết định đầu ra mong muốn

Dữ liệu huấn
luyện

Sinh luật

Hệ các luật mờ

Dữ liệu vào

Tổng hợp các luật mờ

Dự báo

Ra quyết định

Hình 1.1: Hệ suy diễn mờ trong Hệ hỗ trợ ra quyết định

Hình 1.1 mơ tả quy trình chung của phương pháp sử dụng hệ mờ trong các hệ
hỗ trợ ra quyết định. Ban đầu dựa trên dữ liệu mẫu huấn luyện, một quy trình sinh luật
được áp dụng để tạo ra hệ các luật mờ. Hệ luật này là trung tâm tập hợp các quy luật,
kiến thức trích rút ra từ tập dữ liệu huấn luyện. Tiếp theo, với mỗi đầu vào mới được
áp dụng với từng luật và tính tốn các đầu ra. Một quy trình tổng hợp kết quả từ các
luật để cho ra một giá trị chung. Cuối cùng, ở bước ra quyết định thì giá trị này được
điều chỉnh, chuẩn hóa để đưa ra quyết định cuối cùng.

1.3.

Tổng quan các nghiên cứu liên quan
Logic mờ lần đầu tiên được giới thiệu coi như là một khái niệm để mô tả những


thông tin khơng chắc chắn, mơ hồ. Nó được ứng dụng rộng rãi để giải quyết các vấn
đề liên quan đến dự báo, điều khiển, phát hiện mẫu và các hệ hỗ trợ ra quyết định với
thơng tin khơng chắc chắn. Đó được coi là mơ hình tính tốn mà có khả năng xử lý
đồng thời cả tri thức ngôn ngữ và dữ liệu số. Đó là cách lập trình cho máy tính hiểu
và bắt chước suy nghĩ của con người, với mục tiêu là làm tăng hiệu quả của quá trình
ra quyết định đối với các thông tin đầu vào là thông tin mơ hồ và không chắc chắn. Từ
lý thuyết về logic mờ đã dẫn đến sự phát triển của các hệ thống suy diễn mờ. Một hệ


11

suy diễn mờ được định nghĩa như là một ánh xạ phi tuyến để đưa ra kết quả dựa trên
các lập luận mờ và một tập các luật mờ dạng if-then.

1.3.1. Hệ suy diễn mờ
Suy diễn là cơ chế liên kết các tri thức đã có để suy dẫn ra các tri thức mới. Cơ
chế suy diễn phụ thuộc rất nhiều vào phương thức biễu diễn tri thức và không có một
phương pháp suy diễn duy nhất cho mọi loại tri thức. Hệ suy diễn mờ (FIS) là một
khung tính toán phổ biến dựa trên khái niệm lý thuyết tập mờ, thường được áp dụng
khi xây dựng các quá trình hỗ trợ ra quyết định. Hệ suy diễn mờ tỏ ra hiệu quả trong
trường hợp tri thức không đầy đủ, bất định hoặc khơng chính xác.
Sơ đồ chung của một hệ FIS bao gồm ba phần chính: một bộ mờ hóa, một bộ
cơ sở luật và một bộ giải mờ. Hệ suy diễn mờ [2, 7] (mơ tả trong Hình 1.2) có cấu trúc
cơ bản như sau:
- Giao diện mờ hóa: chuyển đổi các lớp đầu vào thành các biên độ phù hợp với
các giá trị ngôn ngữ.
- Cơ sở trí thức bao gồm hai phần: Cơ sở dữ liệu ( định nghĩa các hàm thuộc
của các tập mờ được sử dụng trong các luật mờ) và bộ luật ( gồm các luật mờ IF –
THEN)
- Đơn vị thực thi: thực hiện các hoạt động suy diễn trong các luật

- Giao diện giải mờ: chuyển đổi các giá trị kết quả mờ của hệ suy diễn ra các
lớp đầu ra rõ.

Hình 1.2: Sơ đồ tổng quan của hệ suy diễn mờ

Các bước suy diễn mờ:
• Mờ hóa các biến đầu vào: ta cần mờ hóa những giá trị rõ bởi hàm thuộc mờ để


12

tham gia vào q trình suy diễn
• Áp dụng các toán tử mờ (AND hoặc OR) cho các giả thiết của từng luật.
• Áp dụng phép kéo theo để tính toán giá trị các giá trị từ giả thiết đến kết luận
của từng luật.
• Áp dụng tốn tử gộp để kết hợp các kết quả trong từng luật thành một kết quả
duy nhất cho cả hệ.
• Giải mờ kết quả tìm được cho ta một kết quả rõ.
Các phương pháp suy diễn mờ được phân loại theo ba phương pháp chính: Hệ
suy diễn mờ Mamdani, hệ suy diễn mờ Sugeno (hay còn gọi là hệ suy diễn mờ Takagi
– Sugeno) và hệ suy diễn mờ Tsukamoto.
1.3.1.1 Hệ suy diễn mờ Mamdani

Hệ suy diễn mờ Mamdani [49] là hệ có phương pháp suy diễn mờ đầu tiên
được xây dựng bằng cách sử dụng lý thuyết tập mờ.

Hình 1.3: Hệ thống suy diễn Mamdani với hai đầu vào và hai luật

Hình 1.3 mơ tả về hệ suy diễn mờ Mamdani có hai biến đầu vào x, y và một biến
đầu ra z . Mỗi đầu vào có hai hàm thuộc đầu vào, kí hiệu lần lượt là {A1 , A2 } , {B1 , B2 }

và đầu ra kí hiệu là {C1 , C2 }.

Luật thứ k sẽ có dạng như sau: k : IF x is Aki and y is Bjk THEN z is Clk với

k = 1, ..., R; i = 1, .., N ; j = 1, .., M và l = 1, .., L trong đó N, M, L là số lượng hàm


13

thuộc của hai biến đầu vào và biến đầu ra. Trong hệ suy diễn này, phương pháp giải
mờ thường được sử dụng là lấy cực đại và tính tốn điểm trọng tâm.
1.3.1.2 Hệ suy diễn mờ Tagaki- Sugeno

Xét theo luật mờ Mamdani ở mục trên, nếu ở phần kết luận ta thay các tập mờ
Clk bởi một hàm của các biến đầu vào thì sẽ thu được luật mờ Tagaki-Sugeno [50].

Như vậy, trong hệ suy diễn Sugeno (Hình 1.4), các luật được hình thành có dạng như
sau:
k : IF x is Aki and y is Bjk THEN z k = f (x, y)

Cũng giống như Mamdani, k = 1, ..., R; i = 1, .., N và j = 1, .., M trong đó
N, M là số lượng hàm thuộc cho biến đầu vào.

Hình 1.4: Hệ suy diễn mờ Tagaki- Sugeno với hai đầu vào và hai luật

Phương pháp giải mờ thường được sử dụng đối với hệ suy diễn Tagaki- Sugeno
là tốn tử tính độ mạnh trung bình.
Do hệ suy diễn Tagaki-Sugeno được đánh giá hiệu quả tính tốn cao hơn so
với hệ suy diễn Mamdani nên thường được sử dụng cho các kỹ thuật thích ứng trong
việc xây dựng các mơ hình mờ. Những kỹ thuật thích ứng có thể được sử dụng để tùy

chỉnh các hàm thuộc để đạt được mơ hình hiệu quả nhất cho từng loại dữ liệu.
Lợi thế của hệ suy diễn Sugeno là tính tốn hiệu quả, làm việc tốt với các kỹ
thuật tuyến tính, tối ưu hóa, và rất thích hợp để phân tích tốn học.Tuy nhiên, một
trong những vấn đề cịn hạn chế của hệ suy diễn mờ Tagaki- Sugeno là khơng có
phương pháp trực quan tốt nào để xác định các hệ số p, q , và r. Thêm nữa, trong hệ


×