ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Phạm Đình Phong
PHÁT TRIỂN MỘT SỐ PHƯƠNG PHÁP THIẾT KẾ
HỆ PHÂN LỚP TRÊN CƠ SỞ LÝ THUYẾT TẬP MỜ
VÀ ĐẠI SỐ GIA TỬ
Chuyên ngành: Khoa học máy tính
Mã số: 62 48 01 01
TÓM TẮT LUẬN ÁN TIẾN SĨ KHOA HỌC MÁY TÍNH
Hà Nội – 2017
Cơng trình được hồn thành tại: Trường Đại học Cơng nghệ, Đại học
Quốc gia Hà Nội
Người hướng dẫn khoa học: GS. TS. Nguyễn Thanh Thủy
PGS. TSKH. Nguyễn Cát Hồ
Phản biện: TS. Nguyễn Công Điều
Viện Công nghệ thông tin, Viện Hàn lâm KH&CN VN
Phản biện: TS. Dương Thăng Long
Viện Đại học mở Hà Nội
Phản biện: PGS. TS. Nguyễn Đình Hóa
Viện Cơng nghệ thông tin, Đại học Quốc gia Hà Nội
Luận án sẽ được bảo vệ trước Hội đồng cấp Đại học Quốc gia chấm luận
án tiến sĩ họp tại phòng 212, nhà E3, trường Đại học Công nghệ, Đại học Quốc
gia Hà Nội, 144 Xuân Thủy, Cầu Giấy, Hà Nội vào hồi 14 giờ 00 ngày 22
tháng 09 năm 2017.
Có thể tìm hiểu luận án tại:
-
Thư viện Quốc gia Việt Nam
-
Trung tâm Thông tin - Thư viện, Đại học Quốc gia Hà Nội
MỞ ĐẦU
Bài toán phân lớp thường gặp trong các lĩnh vực khác nhau của đời sống xã hội như
bao gồm y tế, kinh tế, nhận dạng lỗi, xử lý ảnh, xử lý dữ liệu văn bản, lọc dữ liệu Web,
loại bỏ thư rác, … Có nhiều hệ phân lớp quan trọng đã được đề xuất như hệ phân lớp
thống kê, mạng nơ-ron, phân lớp dựa trên luật ngôn ngữ mờ, …
Hầu hết các kỹ thuật phân lớp thống kê đều dựa trên lý thuyết quyết định Bayesian có
hiệu huất phân lớp phụ thuộc vào mơ hình xác suất. Hệ phân lớp mạng nơ-ron cần một
lượng lớn các tham số cần phải ước lượng. Mặt khác, kỹ thuật phân lớp thống kê và mạng
nơ-ron là những hộp đen nên thiếu tính dễ hiểu đối với người sử dụng. Hệ phân lớp dựa
trên luật ngôn ngữ mờ (FLRBC) được nghiên cứu rộng rãi do người dùng cuối có thể sử
dụng những tri thức dạng luật được trích rút từ dữ liệu có tính dễ hiểu, dễ sử dụng đối với
con người như là những tri thức của họ. Tiếp cận lý thuyết tập mờ không vận dụng các từ
ngôn ngữ nhằm truyền đạt ngữ nghĩa của các từ do thiếu một cầu nối hình thức giữa các từ
với các tập mờ tương ứng. Đại số gia tử (ĐSGT) cung cấp một cơ chế hình thức sinh các
tập mờ từ ngữ nghĩa vốn có (inherent sematic) của các từ ngơn ngữ và ứng dụng một cách
hiệu quả vào quá trình thiết kế tập giá trị ngơn ngữ cùng với ngữ nghĩa tính tốn dựa trên
tập mờ tam giác của chúng cho bài toán xây dựng tự động cơ sở luật cho FLRBC.
Trong ứng dụng lý thuyết tập mờ thường đòi hỏi lõi của tập mờ là một khoảng do ngữ
nghĩa của từ ngôn ngữ chứa một miền có giá trị phù hợp với ngữ nghĩa của từ nhất. Ngữ
nghĩa dựa trên tập mờ của các từ ngôn ngữ được xem là dạng hạt (granule) và có lõi
(core). Như vậy, ngữ nghĩa của mỗi từ ngơn ngữ đều có lõi và được gọi là lõi ngữ nghĩa
(semantics core). Trong xu thế nghiên cứu ĐSGT, một cơ sở hình thức tốn học cần được
phát triển để sinh lõi khoảng của tập mờ biểu diễn ngữ nghĩa của từ ngôn ngữ. Luận án
nghiên cứu trường hợp cụ thể sinh lõi khoảng của tập mờ hình thang do lõi của hình thang
có dạng khoảng nên chúng có thể được sử dụng để biểu diễn lõi ngữ nghĩa được biểu thị
bằng tập mờ của các từ ngôn ngữ. Mặt khác, vấn đề tối ưu các tham số ngữ nghĩa, sinh luật
và tìm kiếm hệ luật tối ưu vẫn cần những nghiên cứu cải tiến.
Mục tiêu đặt ra của luận án: Thứ nhất là mở rộng ĐSGT để làm cơ sở hình thức tốn
học cho việc sinh lõi của các tập mờ gán cho các từ ngôn ngữ, cụ thể là lõi của tập mờ
hình thang và ứng dụng giải bài toán thiết kế tự động cơ sở luật cho hệ phân lớp dựa trên
luật ngôn ngữ mờ. Thứ hai là nghiên cứu thiết kế hiệu quả hệ phân lớp dựa trên luật ngơn
ngữ mờ với ngữ nghĩa tính tốn của từ ngơn ngữ được xác định dựa trên ĐSGT dựa trên
kỹ thuật tính tốn mềm.
Với các mục tiêu đặt ra của luận án, các đóng góp của luận án là:
Đề xuất mở rộng lý thuyết đại số gia tử biểu diễn lõi ngữ nghĩa của các từ ngôn
ngữ nhằm cung cấp một cơ sở hình thức cho việc sinh tự động ngữ nghĩa tính tốn
dựa trên tập mờ có lõi là một khoảng của khung nhận thức ngơn ngữ. Luận án
nghiên cứu trường hợp cụ thể là ngữ nghĩa dựa trên tập mờ hình thang.
Ứng dụng lõi ngữ nghĩa và ngữ nghĩa tính tốn dựa trên tập mờ hình thang của
khung nhận thức ngơn ngữ giải bài tốn thiết kế tối ưu FLRBC đảm bảo tính giải
1
nghĩa được (interpretability) của chúng. So sánh đánh giá kết quả của các đề xuất
so với một số kết quả được cơng bố trước đó.
Nghiên cứu các yếu tố ảnh hưởng đến hiệu quả của các phương pháp thiết kế
FLRBC với ngữ nghĩa tính tốn của từ ngơn ngữ được xác định dựa trên ĐSGT và
đề xuất giải pháp nâng cao hiệu quả thiết kế FLRBC bằng kỹ thuật tính toán mềm.
Các nội dung và kết quả nghiên cứu được trình bày trong luận án đã được cơng bố
trong 8 cơng trình khoa học, bao gồm: 1 bài báo quốc tế trong danh mục SCI; 3 bài báo ở
Tạp chí Tin học và Điều khiển học; 1 bài báo ở Tạp chí khoa học, Đại học Quốc gia Hà
Nội; 1 bài báo ở Tạp chí Khoa học và Cơng nghệ, Viện Hàn Lâm Khoa học và Công nghệ
Việt Nam; 1 báo cáo trong kỷ yếu hội nghị quốc tế có phản biện được xuất bản bởi IEEE
và 1 báo cáo tại hội nghị quốc gia có phản biện.
Cấu trúc của luận án. Luận án được bố cục thành các phần: Mở đầu, 3 chương, kết luận,
tài liệu tham khảo và các phụ lục.
Chương 1 giới thiệu tổng quan về hệ dựa trên tri thức luật ngôn ngữ mờ và ĐSGT và
khả năng ứng dụng của ĐSGT. Chương 2 trình bày phương pháp mở rộng lý thuyết
ĐSGT nhằm cung cấp một cơ sở hình thức sinh lõi ngữ nghĩa và ngữ nghĩa tính tốn dựa
trên tập mờ hình thang của khung nhận thức ngôn ngữ và ứng dụng trong thiết kế hệ dựa
trên tri thức luật ngôn ngữ mờ cho bài tốn phân lớp. Chương 3 trình bày đề xuất thiết kế
hiệu quả FLRBC với ngữ nghĩa tính tốn của từ ngôn ngữ được xác định dựa trên ĐSGT
bằng kỹ thuật tính tốn mềm.
CHƯƠNG 1
TỔNG QUAN VỀ HỆ DỰA TRÊN TRI THỨC LUẬT NGÔN NGỮ MỜ
1.1. MỘT SỐ KHÁI NIỆM CƠ BẢN
1.1.1. Tập mờ
1.1.2. Biến ngôn ngữ
1.1.3. Phân hoạch mờ
1.1.4. Luật ngôn ngữ mờ và hệ luật ngôn ngữ mờ
Luật ngôn ngữ mờ hay luật mờ if-then, được gọi tắt là luật mờ, là một phát biểu có
điều kiện dưới dạng if A then B. Phần if của luật được gọi là giả thuyết hay tiền đề luật,
phần then của luật được gọi là phần kết luận.
1.1.5. Bài toán phân lớp dữ liệu
Bài toán phân lớp dữ liệu P được phát biểu như sau: cho một tập dữ liệu mẫu D = {(dp,
Cp), p = 1, …, m}, trong đó m là số mẫu dữ liệu, d p = [dp,1, dp,2, ..., d p,n] là dòng thứ p trong
m mẫu dữ liệu có n thuộc tính, C = {Cs | s = 1, …, M} là một tập gồm M nhãn lớp.
Q trình xây dựng mơ hình phân lớp thường được chia thành hai bước:
Bước 1. Huấn luyện: mơ hình phân lớp được xây dựng dựa trên các tập dữ liệu mẫu đã
được gán nhãn, được gọi là các tập dữ liệu huấn luyện.
2
Bước 2. Thử nghiệm mơ hình: sử dụng mơ hình đã được xây dựng tại bước 1 để phân
lớp tập dữ liệu mới đã được gán nhãn được chọn ngẫu nhiên và độc lập với tập dữ liệu
huấn luyện.
1.2. HỆ DỰA TRÊN TRI THỨC LUẬT NGÔN NGỮ LUẬT MỜ
1.2.1. Cấu trúc của hệ dựa trên luật ngôn ngữ mờ
Hệ dựa trên luật ngôn ngữ mờ bao gồm hai thành phần chính: cơ sở tri thức và hệ suy
luận. Cơ sở tri thức bao gồm cơ sở dữ liệu và cơ sở luật. Cơ sở dữ liệu bao gồm tập các giá
trị ngôn ngữ được dùng trong biểu diễn cơ sở luật và các hàm thuộc biểu diễn ngữ nghĩa
của các giá trị ngôn ngữ. Cơ sở luật là tập hợp các tri thức liên quan đến các bài toán cần
giải quyết dưới dạng các luật mờ if-then.
1.2.2. Bài toán thiết kế hệ phân lớp dựa trên luật ngôn ngữ mờ
Hệ các luật mờ phân lớp bao gồm một tập luật mờ có trọng số dạng:
Luật Rq: if X1 is Aq,1 and ... and Xn is Aq,n then Cq with CFq, với q=1..N
(1.1)
trong đó X = {Xj, j = 1, .., n} là tập n biến ngơn ngữ (thuộc tính) và Aq,j (j=1, ..., n) là các
giá trị ngôn ngữ của các điều kiện mờ trong tiền đề, Cq là nhãn lớp kết luận của Rq và N là
số luật mờ, CFq là trọng số hay độ tin cậy của luật thứ q. Luật Rq có thể được viết tắt dưới
dạng
⟹
with CFq, trong đó Aq là tiền đề của luật thứ q.
Ký hiệu fp(S), fn(S) và fa(S) lần lượt là hàm đánh giá độ chính xác phân lớp của hệ S
đối với tập dữ liệu huấn luyện, số luật trong hệ S và độ dài trung bình hệ S. Khi đó, mục
tiêu xây dựng hệ phân lớp thỏa các mục tiêu:
fp(S) → max, fn(S) → min và fa(S) → min.
(1.2)
Các mục tiêu trên mâu thuẫn nhau nên các phương pháp giải bài toán phân lớp dựa
trên luật mờ phải cân bằng các mục tiêu trên.
Các bước của bài toán thiết kế FLRBC theo tiếp cận lý thuyết tập mờ bao gồm:
Bước 1. Phân hoạch miền giá trị của các thuộc tính của tập dữ liệu thành các vùng mờ
sử dụng các tập mờ tương ứng với các từ ngôn ngữ của biến ngơn ngữ.
Bước 2. Trích rút các luật mờ từ các phân hoạch mờ được tạo ở bước 1 sao cho hệ luật
mờ S thu được nhỏ gọn, dễ hiểu và có hiệu suất phân lớp cao.
Hai phương pháp phân hoạch mờ thường được sử dụng là phân hoạch lưới và phân
hoạch rời rạc. Các thước đo đánh giá luật dựa trên độ tin cậy (confidence) và độ hỗ trợ
(support) làm tiêu chuẩn sàng để sàng lọc ra các luật ứng viên:
trong đó
⟹
=
⟹
=
∑
∈
∑
∑
∈
(
)
.
(1.3)
.
(1.4)
là độ tương thích hay độ đốt cháy của mẫu dữ liệu dp đối với điều kiện
Aq của luật Rq và thường được tính bằng biểu thức tốn tử nhân như sau:
=∏
,
3
,
,
.
(1.5)
- Độ tin cậy (c), độ hỗ trợ (s) và tích (c × s) đều có thể dùng làm tiêu chuẩn sàng.
- Nhãn lớp của từng điều kiện tiền đề Aq được xác định như sau:
=
{ (
⇒
)|ℎ = 1, … ,
}.
(1.6)
- Các luật có thể được gán trọng số luật, công thức sau thường được sử dụng:
=
⟹
−
,
,
(1.9)
cq,2nd là độ tin cậy lớn nhất của các luật có cùng điều kiện Aq nhưng khác kết luận khác Cq.
= max
,
⟹
ℎ |ℎ = 1, … ,
;ℎ ≠
,
(1.12)
Hai phương pháp lập luận phân lớp cho một mẫu dữ liệu dp = [dp,1, dp,2, ..., dp,n]:
- Phương pháp lập luận là Single Winner Rule:
×
= argmax
×
∈
.
(1.14)
- Phương pháp lập luận bầu cử có trọng số (weighted vote):
= argmax ∑
∈
×
, ℎ = 1, …
.
(1.15)
1.2.3. Những vấn đề tồn tại
- Hầu hết các đề xuất theo hướng tiếp cận lý thuyết tập mờ vẫn thiếu một cơ chế hình
thức liên kết giữa ngữ nghĩa vốn có của các từ ngôn ngữ với các tập mờ tương ứng của
chúng; thiếu một cơ sở hình thức hóa tốn học trong thiết kế tự động ngữ nghĩa tính tốn
dựa trên tập mờ từ ngữ nghĩa vốn có của các từ ngơn ngữ, dẫn đến hệ phân lớp thu được
không là kết quả của sự tương tác giữa ngữ nghĩa của các từ ngơn ngữ với dữ liệu.
- Chưa có cơ chế hình thức đánh giá tính khái qt và tính cụ thể của các từ ngơn ngữ
và bài tốn thiết kế các thể hạt (granularity) cho các phân hoạch mờ trên miền các thuộc
tính đảm bảo sự cân bằng giữa tính khái qt và tính cụ thể của các từ ngơn ngữ chưa được
đặt ra.
1.3. Đại số gia tử
1.3.1. Đại số gia tử của biến ngôn ngữ
Định nghĩa 1.4. [50] Giả sử X là một biến ngơn ngữ có miền giá trị là Dom(X). Một ĐSGT
AX tương ứng của X là một bộ 5 thành phần AX = (X, G, C, H, ≤), trong đó: (X, ≤) là cấu
trúc dựa trên quan hệ thứ tự, X là một tập giá trị ngôn ngữ của X với X Dom(X) và ≤ là
quan hệ thứ tự được cảm sinh bởi ngữ nghĩa vốn có của các từ ngơn ngữ trên X; G = {c-,
c+} là tập các phần tử sinh có quan hệ ngữ nghĩa c- ≤ c+, trong đó c- và c+ tương ứng là
phần tử sinh nguyên thủy âm và dương; C = {0, W, 1} là tập các hằng thỏa quan hệ ngữ
nghĩa 0 ≤ c- ≤ W ≤ c+ ≤ 1, trong đó 0 và 1 tương ứng là phần tử nhỏ nhất và phần tử lớn
nhất trong cấu trúc (X, ≤), W là phần tử trung hòa; H là tập gia tử của biến ngôn ngữ X. □
Với mỗi x X, ký hiệu H(x) là tập tất cả các giá trị ngôn ngữ u X được cảm sinh từ
x bởi các gia tử trong H và được biểu diễn bởi chuỗi u = hn…h1x, với hn, …, h 1 H.
Trong trường hợp x {c-, c+} thì chuỗi u = hn…h1c được gọi là một biểu diễn chính tắc
nếu h j+1…h1c ≠ hj…h1c với mọi j = 1, …, n - 1 và khi đó u có độ dài n + 1, được ký hiệu là
4
|u| hoặc l(u). Ký hiệu sau: Xk là tập tất cả các giá trị ngơn ngữ có độ dài đúng bằng k và X(k)
là tập tất cả các giá trị ngơn ngữ có độ dài nhỏ hơn hoặc bằng k.
Trong ĐSGT AX = (X, G, C, H, ≤) nếu X, G và H là tập sắp thứ tự tuyến tính thì AX
được gọi là ĐSGT tuyến tính. Một số tính chất của ĐSGT:
- Dấu của c+ là sign(c+) = +1, dấu của c- là sign(c-) = -1.
- Tập các gia tử dương là H+ = {hj: 1 ≤ j ≤ p} và có dấu sign(hj) = +1, tập các gia tử là
H- = {hj: -q ≤ j ≤ -1} và có dấu sign(h j) = -1 và ta có H = H+ H-.
- Gia tử k là dương đối với gia tử h nếu k làm tăng ngữ nghĩa của h và khi đó dấu
sign(k, h) = +1. Ngược lại, k là âm đối với h nếu k làm giảm ngữ nghĩa của h và có dấu
sign(k, h) = -1. Dấu của một hạng từ x với x = hmhm-1…h2h 1c, trong đó c {c-, c+} và hj
H, được tính như sau:
Sign(x) = sign(hm, hm-1) × … × sign(h2, h1) × sign(h1) × sign(c).
(1.16)
Ý nghĩa của dấu của từ là: nếu sign(hx) = +1 thì x ≤ hx, và nếu sign(hx) = -1 thì hx ≤ x.
- Tính kế thừa trong cảm sinh các giá trị ngơn ngữ của các gia tử. Khi một giá trị
ngôn ngữ hx được cảm sinh từ x bằng việc tác động gia tử h vào x thì ngữ nghĩa của hx
thay đổi nhưng vẫn truyền đạt ngữ nghĩa gốc của x. Tính chất này góp phần bảo tồn quan
hệ thứ tự ngữ nghĩa: nếu hx ≤ kx thì h’hx ≤ k’kx, hay h’ và k’ bảo tồn quan hệ ngữ nghĩa
của hx và kx một cách tương ứng.
Hai từ ngôn ngữ x và y được gọi là độc lập nếu x H(y) và y H(x).
Một ĐSGT AX được gọi là tự do nếu với mọi x H(G) thì hx ≠ x. Nghĩa là AX là tự do
nếu và chỉ nếu chỉ có các hằng tử là các phần tử bất động.
Định lý 1.1. [50] Cho tập H- và H+ là các tập sắp thứ tự tuyến tính của ĐSGT AX = (X, G,
C, H, ≤). Khi đó ta có các khẳng định sau:
(1) Với mỗi u X thì H(u) là tập sắp thứ tự tuyến tính.
(2) Nếu X được sinh từ G bởi các gia tử và G là tập sắp thứ tự tuyến tính thì X cũng là
tập sắp thứ tự tuyến tính. Hơn nữa nếu u < v, và u, v là độc lập với nhau, tức là u H(v)
và v H(u), thì H(u) H(v). □
1.3.2. Lượng hóa đại số gia tử
Xét bất kỳ ánh xạ υ của một ĐSGT AX đảm bảo tính bảo tồn cấu trúc thứ tự trên
miền giá trị của X. Đẳng cấu υ đảm bảo việc cảm sinh ánh xạ của mọi mơ hình tính mờ
H(x) của một từ ngôn ngữ x tới một khoảng nằm trong đoạn [0, 1], được gọi là khoảng tính
mờ của x và được ký hiệu là (x). Độ dài của (x) được gọi là độ đo tính mờ của x và
được ký hiệu là fm(x). Với ý tưởng trên, độ đo tính mờ được tiên đề hóa như sau:
Định nghĩa 1.5. [52, 53] Một hàm fm: X [0, 1] được gọi là một độ đo tính mờ của biến
ngơn ngữ X, nếu nó có các tính chất sau:
(FM1) fm là một độ đo đầy đủ trên X, nghĩa là fm(c) + fm(c+) = 1 và, u X,
fm(hu) fm(u) ;
hH
5
(FM2) Nếu H(x) = x, thì fm(x) = 0. Đặc biệt ta có: fm(0) = fm(W) = fm(1) = 0;
(FM3) x, y X, h H, ta có fm(hx)/x = fm(hy)/y, nghĩa là tỷ số này không phụ
thuộc vào một phần tử cụ thể nào trong X mà chỉ phụ thuộc vào h được gọi là độ đo tính
mờ của gia tử h và được ký hiệu là (h). □
Cơng thức tính đệ quy độ đo tính mờ của x = hm...h1c với c {c-, c+} như sau:
fm(x) = (hm)...(h1) fm(c), trong đó
( h) 1 .
(1.17)
hH
Mệnh đề 1.1. [52, 53] Độ đo tính mờ fm của các khái niệm và (h) của các gia tử thỏa:
1)
fm(hx) = (h)fm(x), x X;
2) fm(c) + fm(c+) = 1;
p
3)
fm(h c) fm(c) , với c {c, c+};
i
i q ,i 0
fm ( h x )
4)
i
fm ( x ) , x X.
q i p ,i 0
1
5)
p
(h )
i
i q
và
(h ) , với , > 0 và + = 1. □
i
i 1
Định nghĩa 1.6. [52, 53] Ngữ nghĩa số của các từ ngôn ngữ hay ánh xạ định lượng ngữ
nghĩa của AX là ánh xạ bảo toàn thứ tự υ: X [0,1] thỏa mãn các điều kiện sau:
SQM1) υ bảo toàn thứ tự trên X, tức là x < y υ(x) < υ(y) và υ(0) = 0, υ(1) = 1;
SQM2) υ là song ánh và ảnh của X, υ(X), là trù mật trong đoạn [0, 1] ; □
Mệnh đề 1.2. [52, 53] Ánh xạ định lượng ngữ nghĩa υ được xác định quy nạp như sau:
1) υ(W) = = fm(c), υ(c) = - fm(c), υ(c+) = +fm(c+);
j
2) υ(hjx) = υ(x)+ Sign ( h j x )( i 1 fm ( hi x ) ( h j x ) fm ( h j x )) , với 1 j p,
j
và υ(hjx) = υ(x)+ Sign ( h j x )( i 1 fm ( hi x ) ( h j x ) fm ( h j x )) , với q j 1.
Hai công thức này có thể viết thành một cơng thức chung, với j [-q^p] và j 0 là:
j
( h j x ) ( x ) Sign( h j x )( i sign ( j ) fm( hi x ) ( h j x ) fm( h j x )) , và
( h j x ) 1 2 [1 Sign ( h j x ) Sign ( h p h j x )( )] { , } . □
1.3.3. Ý nghĩa ứng dụng của đại số gia tử
ĐSGT đã được ứng dụng thành công trong các lĩnh vực như điều khiển mờ, hồi quy
và dự báo, thiết kế FLRBC, ... Trong những ứng dụng như vậy, ngữ nghĩa của các từ ngôn
ngữ được sử dụng trong biểu diễn các luật ngôn ngữ mờ cần được biểu thị bằng tập mờ
phù hợp với ngữ nghĩa vốn có của chúng. Với độ đo tính mờ của |H| - 1 gia tử, độ đo tính
mờ của một phần tử sinh (fm(c-) hoặc fm(c+)) và một số nguyên dương k giới hạn độ dài tối
đa của các từ ngôn ngữ được gọi là các tham số ngữ nghĩa, ký hiệu là Л. Khi cho một bộ
giá trị cụ thể của các tham số ngữ nghĩa, các giá trị định lượng của các từ ngôn ngữ được
6
tính tốn và ngữ nghĩa tính tốn dựa trên tập mờ của chúng được xây dựng. Giá trị định
lượng của mỗi từ ngôn ngữ là một điểm nằm trong khoảng tính mờ liên kết với độ đo tính
mờ tương ứng xác định đỉnh của tập mờ tam giác. Như vậy, ngữ nghĩa tính tốn dựa trên
tập mờ của các từ ngơn ngữ được tích hợp với nhau dựa trên cơ chế hình thức hóa chặt
chẽ, trong đó các tham số tính mờ của ĐSGT sinh ra các tập mờ tam giác của tất cả các từ
ngôn ngữ của ĐSGT hay biến ngôn ngữ. Nghĩa là các đại lượng xác định các tập mờ bị
ràng buộc với nhau và có thể được hiệu chỉnh thích nghi nhờ các tham số tính mờ.
1.3.4. Những vấn đề tồn tại
Trong lý thuyết ĐSGT AX mới chỉ sử dụng giá trị định lượng ngữ nghĩa điểm, tức lõi
ngữ nghĩa điểm, nên phần tử trung hòa W và hai phần tử 0 và 1 khơng có lõi. Điều này
đồng nghĩa với độ đo tính mờ của chúng được quy ước bằng 0 mặc dù trong các ứng dụng
thực tế đều thường xây dựng các tập mờ cho chúng.
Do ngữ nghĩa của từ ngôn ngữ chứa một miền có giá trị phù hợp với ngữ nghĩa của từ
nhất nên tập mờ biểu diễn ngữ nghĩa của từ phải có lõi là một khoảng. Tuy nhiên, lý thuyết
ĐSGT AX với giá trị định lượng ngữ nghĩa điểm chỉ sinh được các tập mờ tam giác. Luận
án mong muốn xây dựng một cơ sở hình thức cho việc sinh tự động ngữ nghĩa dựa trên tập
mờ hình thang từ ngữ nghĩa vốn có của các từ trên cơ sở phát triển mở rộng ĐSGT biểu
diễn lõi ngữ nghĩa của các từ ngơn ngữ và ứng dụng giải bài tốn thiết kế FLRBC.
1.4. KẾT LUẬN CHƯƠNG 1
Trong chương này, luận án đã hệ thống lại những kiến thức cơ sở liên quan đến các
hệ dựa trên luật ngôn ngữ mờ, đại số gia tử và khả năng ứng dụng.
CHƯƠNG 2
LÕI NGỮ NGHĨA VÀ NGỮ NGHĨA HÌNH THANG CỦA KHUNG NHẬN THỨC
NGƠN NGỮ VÀ ỨNG DỤNG GIẢI BÀI TỐN PHÂN LỚP
2.1. MỞ RỘNG ĐSGT CHO VIỆC MƠ HÌNH HĨA LÕI NGỮ NGHĨA CỦA CÁC
TỪ NGƠN NGỮ
rất nhanh
nhanh
1
lõi
150
200
Hình 2.1. Mối quan hệ giữa từ “nhanh” và “rất nhanh” của biến ngôn ngữ TOCDO và
các giá trị của tập nền U được biểu diễn dưới dạng các tập mờ.
Mọi từ mang ngữ nghĩa không rõ ràng x của một biến ngôn ngữ với miền tham chiếu
số U biểu diễn mối quan hệ của x với các giá trị của U, tức là mọi giá trị số của U phù hợp
với x ở một độ chắc chắn nhất định. Mối quan hệ giữa từ “nhanh” và “rất nhanh” của biến
ngôn ngữ TOCDO và các giá trị của U có thể được biểu diễn dưới dạng các tập mờ như
7
trong Hình 2.1. Ký hiệu Core(x) là lõi ngữ nghĩa của của x thì Core(x) = {u: x(u) = 1} và
ngữ nghĩa của x là tập Sem(x) = {u: x(u) (0, 1]}. Lõi ngữ nghĩa của hai từ ngôn ngữ bất
kỳ x, y X và ngữ nghĩa tương ứng của chúng thỏa các điều kiện sau:
(C1) Core(x) Sem(x);
(C2) Nếu x ≤ y thì Core(x) ≤ Core(y), Core(x) ≤ Sem(y) và Sem(x) ≤ Core(y).
Trong phương pháp hình thức hóa ĐSGT, lõi ngữ nghĩa của từ ngơn ngữ x cần được
sinh từ gia tử nên một gia tử nhân tạo h0 được bổ sung nhằm cảm sinh lõi ngữ nghĩa của x
là h0x. Việc mở rộng một ĐSGT tuyến tính AX được thực hiện như sau.
Định nghĩa 2.1. Mở rộng ngữ cảnh của một ĐSGT tuyến tính và tự do AX = (X, C, G, H,
) là ĐSGT mở rộng AX mr = (Xmr, C, G, Hmr, ), trong đó C cũng là tập các hằng tử của
AX mr, Hmr = HI {h 0} = H+ H {I, h 0}, ở đó H = {h-q, …, h-2, h-1}, h-q < ... < h-2 < h-1
và H+ = {h 1, h2 ,... , hp}, h1 < h 2 < ... < hp, nghĩa là HI = H {I}, Xmr = X {h0x | x X}
và ≤ là quan hệ thứ tự mở rộng của X trên Xmr, nếu nó thỏa các tiên đề sau:
(A1) Toán tử đơn vị V trong H+ là dương hoặc âm đối với đối với mọi gia tử trong H.
Chẳng hạn V là dương đối với chính nó và đối với L trong H-.
(A2) Nếu u, v X là độc lập, tức là u HI(v) và v HI(u) thì x HI(u) x HI(v).
(A3) Kế thừa gia tử: Với x X, h, k, h’, k’ H, ta có:
(i) x ≠ hx x HI(hx).
(ii) h ≠ k & hx kx h’hx k’kx.
(iii) hx ≠ kx thì hx và kx là độc lập.
(A4) u X, nếu v HI(u) và v u (v ≥ u) thì v hu (v ≥ hu) với h HI.
(A5 mr) Các tiên đề cho lõi ngữ nghĩa của từ ngôn ngữ: với x, y Xmr và x ≠ y,
(i) hh0x = h0x với h Hmr và với x X, h0x = x khi và chỉ khi x là hằng,
ngược lại x và h0x là không sánh được.
(ii) Với ∀ ,
∈ ,
< ⟹ℎ
< & < ℎ
.□
Các tiên đề của AXmr được bổ sung nhằm mục đích mơ tả các đặc trưng của lõi ngữ
nghĩa của các từ ngôn ngữ dưới dạng quan hệ thứ tự.
Định lý 2.1. Cho AX mr = (Xmr, C, G, Hmr, ) là một ĐSGT mở rộng của một ĐSGT tuyến
tính và tự do AX = (X, C, G, H, ). Khi đó,
(i) Xmr = X {h0x: x X \ C } và với x C, h0x X.
(ii) x, y Xmr, x ≠ y, ta có < ⟺ < ℎ ⟺ ℎ < ⟺ ℎ
tập {h0x: x X} được sắp tuyến tính.
(iii) Tập
=
∪ {ℎ : ∈ ( ) } được sắp tuyến tính. □
<ℎ
. Vì vậy
Định lý sau khẳng định các tiên đề từ (A2) đến (A4) vẫn đúng đối với AX mr .
Định lý 2.2. Cho AX mr = (Xmr, C, G, Hmr, ) là một ĐSGT mở rộng của một ĐSGT tuyến
tính và tự do AX = (X, C, G, H, ). Nếu các tập X và H xuất hiện trong các tiên đề (A2),
8
(A3), (A4) được thay thế tương ứng trong bởi Xmr và Hmr thì các mệnh đề được ký hiệu
tương ứng là (A2mr), (A3mr), (A4mr) vẫn đúng đối với AX mr. □
Định lý 2.3. Mọi từ ngôn ngữ được cảm sinh từ AX mr có biểu diễn chính tắc duy nhất. □
2.2. MỞ RỘNG KHÁI NIỆM ĐỘ ĐO TÍNH MỜ
Để bảo đảm tính linh hoạt trong ứng dụng, ta giả thiết độ đo tính mờ của phần tử trung
hịa W là khác 0, tức fm(W) ≠ 0. Khi đó, hệ tiên đề của độ đo tính mờ mở rộng của AXmr
được phát biểu như sau:
Định nghĩa 2.2. Cho AXmr = (Xmr, C, G, Hmr, ) là một ĐSGT mở rộng của một ĐSGT
tuyến tính và tự do AX. Một hàm fm : Xmr [0,1] được gọi là độ đo tính mờ của ĐSGT
AX mr nếu nó thỏa các tính chất sau:
(fm1) fm(c-) + fm(W) + fm(c+) = 1;
(fm2) hHmr fm(hu) = fm(u), uH(G);
(fm3) h Hmr và x, y H(G) thỏa x, y ≠ h 0z thì
fm ( hx )
fm ( hy )
.□
fm ( x )
fm ( y )
Tỷ số fm(hx)/fm(x) là không phụ thuộc vào x được gọi đó là độ đo tính mờ của gia tử h
và ký hiệu là (h) và h bao gồm cả h0.
Mệnh đề 2.1. Độ đo tính mờ fm của các từ ngôn ngữ của ĐSGT AX mr được định nghĩa như
trong Định nghĩa 2.2 thỏa các tính chất sau:
(1) fm(hx) = (h)×fm(x) với h Hmr, x H({c, c+}) và hx ≠ x;
(2) fm(x) = (h n)×...×(h 1)fm(c), với x = hn...h1c, c {c, c+} là biểu diễn chính tắc
của x Xmr;
(3)
(4) ∑
hH mr
∈
(
(h ) 1 ;
)
(ℎ
)+∑
∈
( ) = 1 với ∀ > 0. Với k = 1, ta có (fm1). □
2.3. HỆ KHOẢNG TÍNH MỜ LIÊN KẾT VỚI ĐỘ ĐO TÍNH MỜ
Gọi PI([0, 1]) là tập tất cả các khoảng con của đoạn [0, 1]. Ta ln ln quy ước là các
khoảng đều đóng ở đầu mút trái và mở ở đầu mút phải, trừ khi đầu mút phải là giá trị 1. Ta
có khái niệm khoảng tính mờ của các từ ngơn ngữ của Xmr, (x) với ∈ ( ) =
{ ∈
: | | ≤ } = ( ) ∪ {ℎ : ∈ ( ) }, dựa trên hệ tiên đề của độ đo tính mờ:
Định nghĩa 2.3. Cho một ĐSGT mở rộng AX mr = (Xmr, C, G, Hmr, ) của một ĐSGT tuyến
tính và tự do AX và độ đo tính mờ fm: Xmr [0, 1] thỏa các tính chất trong Định nghĩa
2.2. Giả sử mỗi từ ngôn ngữ x ( ) được liên kết với một khoảng trong PI([0, 1]). Các
khoảng này được gọi là các khoảng tính mờ mức k của các từ ngôn ngữ tương ứng của
AX mr và nó được xây dựng quy nạp theo k như sau:
1) Với k = 1, xây dựng các khoảng tính mờ 1(c-), 1(W), 1(c+) với |1(x)| = fm(x),
sao cho chúng có thứ tự tương đồng với thứ tự của các hạng từ c-, W, c+.
9
2) Với k > 1 và xC, xây dựng các khoảng tính mờ k(x) sao cho (i) nếu |x| < k - 1 thì
|k(x)| = |k-1(x)|, (ii) nếu |x| = k - 1 thì |k(x)| = (h0)fm(x), (iii) nếu |x| = k thì |k(x)| =
fm(x), (iv) thứ tự của các khoảng tính mờ tương đồng với thứ tự của các hạng từ x, tức là,
với x, y {hx: h Hmr}, nếu x ≤ y thì k(x) ≤ k(y). □
Thuật tốn 2.1. Thuật tốn xây dựng hệ khoảng tính mờ.
Đầu vào: Các độ đo tính mờ fm(c-), fm(W), (h) với h Hmr và số k >= 1 xác định độ dài tối đa
của các từ ngôn ngữ. Lưu ý: fm(c+) = 1 - fm(c-) - fm(W).
Đầu ra: là tập các khoảng với nhãn là các từ ngôn ngữ trong ( ) .
Begin
Khởi tạo j = 1 và tập bằng rỗng.
Bước 1: Với j = 1, ta có = 1(c-) 1(W) 1(c+), trong đó:
1(c-) = [0, fm(c-)), 1(W) = [fm(c-), fm(c-)+ fm(W)), 1(c+) = [fm(c-) + fm(W), 1].
Nếu k = 1 thì dừng, ngược lại nếu k > 1 thì thực hiện Bước 2.
Bước 2: j = j + 1. Với mỗi từ ngôn ngữ x ( ) thực hiện:
(i) Nếu |x| < j – 1 thì ta có = j(x) với j(x) = j-1(x) .
(ii) Nếu từ ngôn ngữ x thỏa |x| = j – 1 thì:
Nếu Sign(max(Hmr)) = 1 thì lặp l = 1 đến |Hmr| và đặt i = l, ngược lại thì lặp l = |H mr|
giảm đến 1 và đặt i = |Hmr| – l + 1, để tính các khoảng tính mờ mức j cho các từ hix
được sinh ra từ x với hi Hmr.
Nếu i = 1, j(hix) = [L(j-1(x)), L(j-1(x)) + (hi)|j-1(x)|), ngược lại nếu i > 1 thì,
Đặt Km = R (j(hi-1x)) + (hi)|j-1(x)|. Nếu Km = 1 thì j(h ix) = [R (j(h i-1x)),
Km), ngược lại thì j(hix) = [R (j(hi-1x)), 1] (đóng phải).
= j(h ix).
Bước 3 (bước lặp): Lặp lại Bước 2 cho đến khi j = k.
Trả lại là tập các khoảng với nhãn là các từ ngôn ngữ trong ( ) .
End.
Ký hiệu L(•) và R (•) là điểm mút trái và mút phải của một khoảng bất kỳ.
Kết thúc thuật toán, ta thu được là tập các khoảng với nhãn là các từ trong
( ).
Định lý 2.4. Thuật toán 2.1 về xây dựng các khoảng tính mờ là đúng đắn và các khoảng
tính mờ của ( ) có các tính chất sau:
(1) Với mỗi x thỏa |x| = k, khoảng tính mờ mức k của x, k(x), thỏa |k(x)| = fm(x), còn
với x mà |x| < j k, k(x) = I(h0x) và |k(x)| = (h0)fm(x), tức là các hạng từ độ dài ngắn
hơn j có mặt trong ngữ cảnh cùng các hạng từ độ dài j sẽ có ngữ nghĩa bị co lại;
(2) Với mọi x
( )
thỏa |x| = j < k, ta có k(x) = I(h0x) và |k(x)| = (h0)fm(x). Với x
thỏa |x| = j k – 2, ta có k(x) = k-1(x).
(3) Tập tất cả các khoảng tính mờ mức k, FI(k) = {k(x), x
( ) },
có các tính chất:
a- Đối với hạng từ hằng W, ta có k(W) = 1(W);
b- Với mỗi x H({c,c+}) thỏa |x| = k – 1, tập các khoảng tính mờ {k(hx): h Hmr}
là một phân hoạch nhị phân của khoảng tính mờ k-1(x) mức k – 1 của x.
10
c- Các khoảng tính mờ trong FI(k) có thứ tự tương đồng với thứ tự của các hạng từ của
chúng và lập thành một phân hoạch nhị phân của đoạn [0,1]. □
2.4. ÁNH XẠ ĐỊNH LƯỢNG NGỮ NGHĨA KHOẢNG
Định nghĩa 2.4. Cho AXmr là ĐSGT mở rộng của AX tuyến tính và tự do, ánh xạ f : Xmr
PI([0, 1]) được gọi là ánh xạ định lượng ngữ nghĩa khoảng của AXmr nếu nó thỏa các điều
kiện sau:
(IQ1) f bảo toàn thứ tự trên Xmr, tức là nếu x y thì f(x) f(y), với x, y Xmr;
(IQ2) f(Xmr) là tập trù mật trong [0, 1]. □
Định lý 2.5. Cho độ đo tính mờ fm của ĐSGT AXmr và là tập tất cả các khoảng tính mờ
của các từ ngôn ngữ của AXmr được xác định bởi fm. Khi đó ánh xạ f: Xmr PI[0, 1]
được định nghĩa như sau là ánh xạ định lượng ngữ nghĩa khoảng:
f(x) = |x|+1(h0x) PI[0, 1], với x, y Xmr
(2.5)
với lưu ý rằng, nếu x = h0z thì f(x) = |x|+1(h0x) = |x|(h0z). □
2.5. MỞ RỘNG ĐỘ ĐO TÍNH MỜ CỦA CÁC PHẦN TỬ 0 VÀ 1
ĐSGT mở rộng AXmr được mở rộng thành ĐSGT mở rộng tồn phần với độ đo tính mờ
của hai phân tử 0 và 1 khác 0 và được ký hiệu là AXmrtp. Khi đó, hệ tiên đề của độ đo tính
mờ mở rộng của AXmrtp được phát biểu như sau:
Định nghĩa 2.5. Cho một ĐSGT mở rộng toàn phần AX mrtp = (Xmr, C, G, Hmr, ) của một
ĐSGT mở rộng tự do AXmr. Một hàm fm : Xmr [0,1] được gọi là độ đo tính mờ của
ĐSGT AX mrtp nếu nó thỏa các tính chất sau:
(fmc1) fm(0) + fm(c-) + fm(W) + fm(c+) + fm(1) = 1;
(fmc2) hHmr fm(hu) = fm(u), uH(G);
(fmc3) h Hmr và x, y H(G) thỏa x, y ≠ h 0z thì fm(hx)/fm(x) = fm(hy)/fm(y). □
Từ Định lý 2.4, điểm mút trái của f(x) qua các độ đo tính mờ với k = |x| được tính:
L(f(x)) = ∑ ∈
( ) + ∑ ∈ ( )&
(ℎ ).
(2.6)
&
Công thức (2.6) chưa thể hiện mối quan hệ giữa giá trị định lượng và các tham số của
từ. Định lý sau cung cấp công thức đệ quy tính L(f(x)). Giả sử H+ = {hj: j = 1, …, p}, H- =
{ hj: j = -1, …, -q}, = ∑
(ℎ ) và = ∑
(ℎ ). Ta có, + + (ℎ ) = 1.
Định lý 2.6. Điểm mút trái của giá trị định lượng f được cảm sinh bởi các độ đo tính mờ
fm được tính đệ quy theo thủ tục sau:
(1) Với các từ có độ dài 1: L(f(0)) = 0, L(f(c-)) = fm(0) + × fm(c-), L(f(W)) = fm(0) +
fm(c-), L(f(c+)) = fm(0) + fm(c-) + fm(W) và L(f(1)) = 1 - fm(1).
(2) Với y = hjx, x X: đặt (x) = {1 + Sign(hjx)[(h0x) + Sign(hphjx)( - )]}/2, thì
L(f(hjx)) = L(f(x)) + Sign(hjx) × fm(x) × {
∑
( )
(ℎ ) − ( ) × (ℎ )}.
11
1+
ℎ
× (ℎ ) +
2.6. ỨNG DỤNG LÕI NGỮ NGHĨA VÀ NGỮ NGHĨA HÌNH THANG TRONG
THIẾT KẾ HỆ PHÂN LỚP DỰA TRÊN LUẬT NGÔN NGỮ MỜ
Luận án áp dụng phương pháp hai giai đoạn thiết kế FLRBC với ngữ nghĩa tính tốn
của các từ được xác định bởi ĐSGT AXmr và AXmrtp, điểm khác biệt so với ĐSGT AX:
1) Thứ nhất, trong bước thiết kế các từ ngơn ngữ cho các thuộc tính của tập dữ liệu
huấn luyện, mỗi thuộc tính được liên kết với một ĐSGT AXmr hoặc AXmrtp thay vì AX. Tập
các từ mức k trong Xk đã bao gồm đầy đủ các hạng từ ngơn ngữ có độ dài nhỏ hơn hoặc
bằng k và tạo thành một phân hoạch trên miền giá trị định lượng chuẩn hóa [0, 1].
2) Thứ hai, ngữ nghĩa tính tốn dựa trên tập mờ tam giác của các từ ngôn ngữ trong
biểu diễn cơ sở luật của FLRBC được thay bằng tập mờ hình thang.
2.6.1. Thiết kế ngữ nghĩa tính tốn dựa trên tập mờ của các từ ngôn ngữ
Phương pháp luận cho việc thiết kế các từ ngôn ngữ với ngữ nghĩa dựa trên tập mờ có
độ dài tối đa của từ là kj cho bài toán phân lớp dựa trên luật mờ như sau:
+ Mỗi thuộc tính thứ j của tập dữ liệu huấn luyện được liên kết với một ĐSGT AXmrj
hoặc AXmrtpj, cảm sinh tập các từ ,( ) có thứ tự theo ngữ nghĩa định tính của chúng.
+ Ký hiệu
thể, ta có
tương ứng là tập các tham số tính mờ của AXmr và AXmrtp. Cụ
và
={
(
), fm(Wj), (hj,i), (h0,j)} và
={
(
), fm(Wj), fm(0j),
fm(1j), (hj,i), (h0,j)}. Khi cho các giá trị cụ thể của các tham số mờ, tất cả các khoảng tính
mờ ℑ
mức k ≤ kj và f(xj,i) của các từ trong ,( ) được xây dựng và tạo thành một
,
phân hoạch trên [0, 1]. Do (
,
)ℑ (
,
), nên ta có (
,
)≤⋯≤ (
,
,
). Giả sử
đặt a = R(f(xj,i-1)), b = L(f(xj,i)), c = R(f(xj,i)), d = L(f(xj,i+1)), ta có cơng thức tính giá trị hàm
( ) của từ xj,i theo (2.7), trong đó v là một điểm dữ liệu.
thuộc của tập mờ hình thang
,
,
( ) =
⎧
⎪
⎨
⎪
⎩
0vớihoặc < hoặc >
với ≤ <
1với ≤ ≤
với < ≤
(2.7)
Hai cấu trúc phân hoạch mờ được sử dụng là: 1) Cấu trúc đơn thể hạt (Hình 2.5), chỉ
duy nhất một phân hoạch mờ trên miền giá trị của mỗi thuộc tính của tập dữ liệu huấn
luyện và tất cả các tập mờ đều có mặt tại mức kj. 2) Cấu trúc đa thể hạt (Hình 2.7) sử dụng
nhiều phân hoạch mờ trên miền giá trị của mỗi thuộc tính của tập dữ liệu huấn luyện. Mỗi
thể hạt được cấu tạo bởi các tập mờ của các từ ngơn ngữ có độ dài bằng nhau.
Hình 2.5. Các tập mờ được thiết kế theo cấu trúc đơn thể hạt được sinh bởi ĐSGT AXmr.
12
a. Ngữ nghĩa tính tốn dựa trên tập mờ hình thang của các từ có độ dài 1.
b. Ngữ nghĩa tính tốn dựa trên tập mờ hình thang của các từ có độ dài 2.
Hình 2.7. Các tập mờ được thiết kế theo cấu trúc đa thể hạt được sinh bởi ĐSGT AXmr.
2.6.2. Sinh tập luật khởi đầu từ dữ liệu dựa trên ngữ nghĩa ĐSGT mở rộng
Đặt Л = {
{kj} | j = 1, …, n} với AXmr hoặc Л = {
{kj} | j = 1, …,
n} với AXmrtp và gọi chung các giá trị trong Л là các tham số ngữ nghĩa. Thủ tục xây dựng
tập luật khởi đầu từ m t mẫu dữ liệu của D là E_IFRG(Л, D, NR0, K, λ) như sau:
Thuật toán 2.2. E_IFRG (Thuật toán sinh tập luật khởi đầu).
Input: Tập mẫu dữ liệu D = {(d p, Cp) | p = 1, …, m t}, M lớp kết luận, n thuộc tính, các
tham số ngữ nghĩa Л, NR0 số luật khởi đầu, K giới hạn độ dài của các từ ngôn ngữ, λ giới
hạn độ dài tối đa của luật.
Output: Tập luật khởi đầu S0.
Begin
Bước 1: Xây dựng tập các hạng từ, tập khoảng tính mờ, tập ánh xạ định lượng khoảng
và các tập mờ hình thang của các từ đối với mọi thuộc tính của tập dữ liệu huấn luyện.
Bước 2: Sinh tập luật ứng viên từ tập dữ liệu huấn luyện.
Tập các khoảng tính mờ ℑ (
, ( ))
chứa thành phần dữ liệu dl,j xác định một khối hộp
Hl chứa mẫu dữ liệu dl. Khối hộp Hl cùng với lớp kết luận Cl của p l xác định luật mờ cơ sở
độ dài n có dạng sau:
IF X1 is x1,i(1) AND … AND Xn is xn,i(n) THEN Cl
(Rb)
Phần kết luận của luật là lớp Cq được chọn từ các nhãn lớp có độ tin cậy của luật là lớn
nhất. Từ các luật cơ sở có độ dài n, các luật ứng viên có độ dài nhỏ hơn n được xây dựng
bằng cách bỏ đi một số điều kiện tiền đề Al,j của luật cơ sở.
Bước 3. Chọn lọc tập luật khởi đầu S0 từ tập luật ứng viên sử dụng tiêu chuẩn sàng.
Sắp xếp các luật giảm dần trong mỗi nhóm theo tiêu chuẩn sàng và chọn ra NB0 luật
trong mỗi nhóm từ trên xuống dưới. Trả lại tập luật khởi đầu S0.
End.
13
Sau Bước 3 ta thu được hệ luật khởi đầu S0 có NR0 = NB0 * M luật. Các luật được gán
một trọng số được tính bằng một trong các công thức (1.7), (1.8), (1.9), (1.10).
Độ phức tạp của thủ tục E_IFRG là đa thức đối với kích thước và số thuộc tính của tập
dữ liệu mẫu D.
2.6.3. Tối ưu các tham số ngữ nghĩa và tìm kiếm hệ luật tối ưu
Để hiệu chỉnh thích nghi các tham số ngữ nghĩa được nêu ở trên cho phù hợp với từng
tập dữ liệu huấn luyện, bài tốn tiến hóa tối ưu hóa đa mục tiêu thiết kế các từ ngơn ngữ
tối ưu cho bài toán phân lớp P được đặt ra với E_IFRG(Л, D, NR0, K, λ) là thủ tục xây
dựng hệ luật khởi đầu và với các ràng buộc về các tham số ngữ nghĩa đã được nêu ở trên.
Khi đó, các mục tiêu của bài tốn tìm kiếm giá trị tối ưu của các tham số ngữ nghĩa với cơ
sở luật S0 được sinh ra bởi thủ tục E_IFRG là:
fp(S0) → max và fa(S0) → min
(2.9)
trong đó, fp(S0) là tỷ lệ phân lớp đúng của hệ S0 trên tập huấn luyện, fa(S0) là độ dài trung
bình của hệ S0. Số luật của hệ S0 được cố định theo từng tập dữ liệu huấn luyện cụ thể.
Sau quá trình tối ưu trên ta thu được tập các bộ tham số ngữ nghĩa gần tối ưu Лopt. Sinh
tập luật khởi đầu S0 với NR0 luật sử dụng một bộ tham số ngữ nghĩa trong Лopt. Bài toán
đặt ra là phải chọn ra một tập luật con của S0 cho FLRBC sao cho đạt các mục tiêu sau:
fp(S) → max, fn(S) → min và fa(S) → min
(2.10)
với ràng buộc S S0, NR(S) Nmax.
trong đó, fn(S) là số luật của hệ S và Nmax là số luật tối đa được chọn và được xác định
trước. Mỗi cá thể ứng với mỗi lời giải là một tập luật S được chọn từ S0 và được biểu diễn
bởi một chuỗi số thực ri = (p1, ..., pNmax), pj [0, 1]. Giá trị p j xác định chỉ số của luật trong
S0 được chọn cho S có giá trị là p j × |S0|, ta có 0 pj × |S0| |S0|.
S = {Ri S0 | i = pj × |S0|, i ≥ 0}
(2.11)
trong đó • là phép lấy phần ngun.
2.6.4. Đánh giá kết quả ứng dụng lõi ngữ nghĩa và ngữ nghĩa hình thang trong thiết
kế hệ phân lớp dựa trên luật ngôn ngữ mờ
2.6.4.1. Dữ liệu và phương pháp thực nghiệm
Các thực nghiệm được tiến hành đối với 23 tập dữ liệu mẫu UCI được cộng đồng
nghiên cứu thừa nhận bao gồm: Appendicitis, Australian, Bands, Bupa, Cleveland,
Dermatology, Glass, Haberman, Hayes-roth, Heart, Hepatitis, Ionosphere, Iris,
Mammographic, Newthyroid, Pima, Saheart, Sonar, Tae, Vehicle, Wdbc, Wine, Wisconsin.
Phương pháp kiểm tra chéo 10 nhóm (10-fold cross-validation) được sử dụng và được lặp
lại 3 lần đối với một tập dữ liệu được thử nghiệm. Kết quả cuối cùng của các lần thử
nghiệm sau khi lựa chọn được hệ luật tối ưu được tính trung bình đối với số luật #R, độ
phức tạp của hệ luật #C, tỷ lệ phân lớp đúng trên tập huấn luyện Ptr và trên tập kiểm tra
Pte. Độ phức tạp của hệ luật được tính theo cơng thức #C = #R × Avg, trong đó Avg là độ
dài trung bình của hệ luật.
14
Số thế hệ khi tối ưu các tham số ngữ nghĩa MOPSO_SPO là 250, tìm kiếm hệ luật tối
ưu MOPSO_RBO là 1000. Số cá thể mỗi thế hệ là 600.
Các ràng buộc đối với các tham số ngữ nghĩa như sau: số gia tử âm và gia tử dương
đều được lấy là 1. Giới hạn độ dài của các từ ngôn ngữ 0 < kj ≤ 3. Giá trị của các độ đo
tính mờ: Với ĐSGT AXmr: 0,2 ≤
( ), (Lj) ≤ 0,7; 0,0001 ≤ fm(Wj) ≤ 0,2;
+
= 1; 0,0001 ≤ (h0,j) ≤ 0,5. Với ĐSGT AXmrtp: 0,00001 ≤ fm(0), fm(1)
( )+
( ), (Lj) ≤ 0,7; 0,0001 ≤ fm(Wj) ≤ 0,2;
+
+
≤ 0,01; 0,15 ≤
+
+
( ) = 1; 0,0001 ≤ (h0,j) ≤ 0,5.
Trừ trường hợp được đề cập cụ thể, phương pháp lập luận phân lớp được sử dụng là
Single winner rule, cơng thức tính trọng số luật là CFIII, tiêu chuẩn sàng luật là tích của độ
tin cậy và độ hỗ trợ (c × s).
Bảng 2.8. Các kết quả thực nghiệm và so sánh giữa các hệ phân lớp FRBC_AXmrtp, FRBC_AXmr,
FRBC_AX, All Granularities và Product-1-ALL TUN.
FRBC_AXmrtp
FRBC_AXmr
Tập
dữ
liệu
#C
Ptr
Pte
#C
Ptr
Pte
#C
Ptr
App
Aus
Ban
Bup
Cle
Der
Gla
Hab
Hay
Hea
Hep
Ion
Iri
Mam
New
Pim
Sah
Son
Tae
Veh
Wdb
Win
Wis
16,77
46,50
58,20
181,19
468,13
182,84
474,29
10,80
114,66
123,29
25,53
88,03
30,37
73,84
39,82
56,12
59,28
49,31
210,70
195,07
25,04
40,39
69,81
92,38
88,56
78,19
79,78
66,64
96,37
78,78
77,60
89,40
89,19
93,68
94,69
98,25
85,49
96,76
78,69
75,51
87,59
68,97
70,74
97,08
99,60
97,78
88,15
87,15
73,46
72,38
62,39
94,40
72,24
77,40
84,17
84,57
89,28
91,56
97,33
84,20
95,67
77,01
70,05
78,61
61,00
68,20
96,78
98,49
96,95
16,91
41,85
78,19
170,70
640,19
189,46
488,38
20,00
139,42
120,69
25,75
83,71
34,59
82,08
30,93
50,33
58,41
53,91
163,61
216,19
23,08
42,09
59,81
91,30
87,72
76,28
77,54
69,86
96,88
80,26
77,67
89,98
88,07
94,44
94,67
98,35
85,31
96,30
78,53
74,55
86,84
68,36
71,64
97,16
100,0
97,20
88,09
86,86
72,10
69,41
63,40
95,52
72,78
77,43
83,33
84,57
89,17
90,98
96,67
84,46
95,03
76,66
70,27
77,29
59,46
68,12
95,96
98,52
96,51
21,32
36,20
52,20
187,20
657,43
198,05
343,60
10,20
122,27
122,72
26,16
90,33
26,29
92,25
45,18
60,89
86,75
79,76
261,00
242,79
37,35
35,82
74,36
92,28
88,06
76,17
78,13
72,44
98,03
80,45
76,91
90,11
89,63
95,83
95,35
98,40
86,05
97,02
78,28
76,35
88,39
72,11
70,30
97,62
99,88
97,81
TB
114,78 86,16 82,67 123,05 86,04 82,29 126,53 86,77 81,92
FRBC_AX
All Granularities
Pte
#C
Ptr
Product/1-ALL TUN
Pte
#C
Ptr
Pte
87,55
8,84 91,86 87,91 20,89 93,47 87,30
86,38
4,00 85,51 85,51 62,43 89,18 85,65
72,80
57,18 71,36 68,73 104,09 71,18 65,80
68,09 112,59 69,50 63,99 210,91 78,59 67,19
62,19 1132,14 73,11 55,11 1020,66 77,21 58,80
96,07 220,36 99,07 94,12 185,28 99,28 94,48
72,09 408,83 78,65 60,48 534,88 83,68 71,28
75,76
90,55 79,46 71,89 21,13 76,82 71,88
84,17 140,03 90,88 78,03 158,52 90,99 78,88
84,44 109,45 90,19 83,46 164,61 91,87 82,84
88,44
35,34 96,10 90,44 20,29 97,88 88,53
90,22 141,33 95,64 88,62 86,75 96,25 90,79
96,00
27,40 99,11 95,11 18,54 98,30 97,33
84,20 102,46 83,07 81,04 106,74 83,90 80,49
94,42
49,40 96,19 91,78 56,47 98,02 94,60
76,18
95,01 77,80 74,92 57,20 79,06 77,05
69,33
76,24 76,70 71,14 110,84 77,73 70,13
76,80
70,67 86,54 78,88 47,59 87,91 78,90
59,47 147,09 66,55 54,57 215,92 71,21 60,78
67,62 492,55 69,34 62,81 382,12 71,11 66,16
96,96
55,74 97,12 94,90 44,27 97,33 94,90
98,30
32,10 100,0 96,08 58,99 99,92 93,03
96,74
77,41 98,22 96,07 69,11 98,33 96,35
160,29 85,74 79,37
163,0 87,36 80,57
Số có chữ đậm thể hiện kết quả tốt nhất trong các phương pháp (trên cùng dòng).
2.6.4.2. So sánh đánh giá hai cấu trúc phân hoạch mờ đơn và đa thể hạt
Dựa trên kết quả thực nghiệm và so sánh đối với 23 tập dữ liệu được thực nghiệm và
sử dụng phương pháp kiểm định thống kê Wilcoxon Signed Rank (WSR) đối với hiệu suất
phân lớp và độ phức tạp của hệ luật, ta có thể kết luận tiếp cận thiết kế hệ phân lớp dựa
15
trên phương pháp luận ĐSGT áp dụng phương pháp thiết kế đa thể hạt cho hiệu suất phân
lớp tốt hơn phương pháp thiết kế đơn thể hạt.
2.6.4.3. So sánh hai phương pháp lập luận single winner rule và weigted vote
Phân tích kết quả thực nghiệm đối với 23 tập dữ liệu mẫu và kết quả kiểm định giả
thuyết thống kê WSR đối với hiệu suất phân lớp và độ phức tạp của hệ luật, ta có thể kết
luận rằng, các tiếp cận thiết kế hệ phân lớp dựa trên phương pháp luận ĐSGT AX, AXmr,
AXmrtp sử dụng phương pháp lập luận single winner rule đều cho hiệu suất phân lớp tốt hơn
so với phương pháp lập luận weighted vote tương ứng.
2.6.4.4. So sánh các phương pháp thiết kế hệ phân lớp theo tiếp cận ĐSGT
Ký hiệu phương pháp thiết kế FLRBC với ngữ nghĩa tính tốn của từ được xác định
dựa trên ĐSGT AX, ĐSGT AXmr và ĐSGT AXmrtp tương ứng là FRBC_AX, FRBC_AXmr và
FRBC_AXmrtp. Theo các kết quả thực nghiệm trong Bảng 2.8, hệ phân lớp FRBC_AXmrtp
cho kết quả phân lớp trên tập kiểm tra cao hơn so với hệ phân lớp FRBC_AX đối với 19
tập dữ liệu và cao hơn so với hệ phân lớp FRBC_AXmr đối với 15 tập dữ liệu trong số 23
tập dữ liệu mẫu được thực nghiệm. Với các kết quả kiểm định thống kê WSR, ta có thể
khẳng định rằng, việc ứng dụng ĐSGT AXmrtp trong thiết kế FLRBC cho hiệu suất phân
lớp tốt hơn so với việc ứng dụng ĐSGT AXmr và ĐSGT AX, ĐSGT AXmr cho hiệu suất
phân lớp tốt hơn ĐSGT AX.
2.6.4.5. So sánh với một số phương pháp theo tiếp cận lý thuyết tập mờ
Các kết quả thực nghiệm của hai hệ phân lớp FRBC_AXmr và FRBC_AXmrtp được so
sánh với một số các kết quả theo tiếp cận lý thuyết tập mờ được công bố gần đây của R.
Alcalá, 2011 và M. Antonelli, 2014.
Trong R. Alcalá, 2011, đã đề xuất kỹ thuật lựa chọn phân hoạch đơn thể hạt từ các
phân hoạch đa thể hạt. Theo kết quả thực nghiệm, có hai kỹ thuật cho kết quả tốt hơn cả là
All Granularities và Product/1-ALL TUN. Các kết quả thực nghiệm, so sánh tương ứng
được thể hiện trong Bảng 2.8. Cả hai hệ phân lớp FRBC_AXmr và FRBC_AXmrtp đều cho
hiệu suất phân lớp trung bình trên tập kiểm tra đối với 23 tập dữ liệu thử nghiệm cao hơn
so nhưng có độ phức tạp của hệ phân lớp thấp hơn so với hai hệ phân lớp All
Granularities và Product/1-ALL TUN. Theo kết quả kiểm định giả thuyết thống kê
WSR, ta có thể khẳng định rằng cả hai hệ phân lớp FRBC_AXmr và FRBC_AXmrtp đều tốt
hơn so với các phương pháp được đề xuất trong R. Alcalá, 2011 về hiệu suất phân lớp
nhưng không tăng độ phức tạp của hệ phân lớp.
Hai hệ phân lớp được đề xuất trong luận án được so sánh với các kết quả được đề xuất
của M. Antonelli, 2014 có tên là PAES-RCS, một tiếp cận khai thác tiến hóa đa mục tiêu
để học đồng thời cơ sở luật và các tham số của các hàm thuộc của FLRBC. Các kết quả
thực nghiệm và so sánh giữa hệ phân lớp PAES-RCS và các hệ phân lớp FRBC_AXmrtp và
FRBC_AXmr được thể hiện trong Bảng 2.13. Hai hệ phân lớp FRBC_AXmrtp và
FRBC_AXmr lần lượt có 21 và 19 trong số 23 tập dữ liệu được thực nghiệm có độ chính
xác trên tập kiểm tra cao hơn so với hệ phân lớp PAES-RCS. Theo kết quả kiểm định
16
thống kê WSR, cả hai hệ phân lớp FRBC_AXmrtp và FRBC_AXmr đều cho kết quả tốt hơn
hệ phân lớp PAES-RCS cả về hiệu suất phân lớp và độ phức tạp của hệ phân lớp.
Bảng 2.13. Các kết quả thực nghiệm và so sánh giữa các hệ phân lớp FRBC_AX mrtp, FRBC_AXmr,
PAES-RCS, FURIA và C4.5.
Tập dữ
liệu
FRBC_AX mrtp
#C
Pte
FRBC_AX mr
#C
Pte
App
Aus
Ban
Bup
Cle
Der
Gla
Hab
Hay
Hea
Hep
Ion
Iri
Mam
New
Pim
Sah
Son
Tae
Veh
Wdb
Win
Wis
16,77
46,50
58,20
181,19
468,13
182,84
474,29
10,80
114,66
123,29
25,53
88,03
30,37
73,84
39,82
56,12
59,28
49,31
210,70
195,07
25,04
40,39
69,81
88,15
87,15
73,46
72,38
62,39
94,40
72,24
77,40
84,17
84,57
89,28
91,56
97,33
84,20
95,67
77,01
70,05
78,61
61,00
68,20
96,78
98,49
96,95
16,91
41,85
78,19
170,70
640,19
189,46
488,38
20,00
139,42
120,69
25,75
83,71
34,59
82,08
30,93
50,33
58,41
53,91
163,61
216,19
23,08
42,09
59,81
TB
114,78
82,67
123,05 82,29
PAES-RCS
#C
Pte
FURIA
#C
88,09
35,28 85,09
19,00
86,86 329,64 85,80
89,60
72,10 756,00 67,56 535,15
69,41 256,20 68,67 324,12
63,40 1140,00 59,06 134,67
95,52 389,40 95,43 303,88
72,78 487,90 72,13 474,81
22,04
77,43 202,41 72,65
83,33 120,00 84,03 188,10
84,57 300,30 83,21 193,64
89,17 300,30 83,21
52,38
90,98 670,63 90,40 372,68
96,67
69,84 95,33
31,95
84,46 132,54 83,37
16,83
95,03
97,75 95,35 100,82
76,66 270,64 74,66 127,50
70,27 525,21 70,92
50,88
77,29 524,60 77,00 309,96
59,46 323,14 60,81
43,00
68,12 555,77 64,89 2125,97
95,96 183,70 95,14 356,12
80,00
98,52 170,94 93,98
96,51 328,02 96,46 521,10
355,23 80,66
281,49
Pte
C4.5
#C
Pte
85,18
15,00 85,84
85,22 5859,00 84,05
64,65 10608,00 63,28
69,02 3692,00 67,82
56,20 13938,00 48,48
95,24
280,00 95,25
72,41 5610,00 69,15
75,44
15,00 71,56
83,13
780,00 83,12
80,00 2080,00 77,40
84,52
216,00 86,25
91,75 1870,00 90,59
94,66
45,76 95,20
83,89
70,00 83,97
342,00 92,09
96,30
74,62 2220,00 74,67
69,69 1110,00 70,77
82,14 1805,00 72,11
43,08 7820,00 59,60
71,52 89964,00 75,57
96,31
588,00 94,02
96,60
60,00 93,82
96,35
462,00 95,60
80,34
6497,82 79,57
Số có chữ đậm thể hiện kết quả tốt nhất trong các phương pháp (trên cùng dòng).
2.6.4.6. So sánh đánh giá với một số tiếp cận khác
Các kết quả được đề xuất trong luận án được so sánh với kết quả của hai phương pháp
thiết kế hệ phân lớp khơng dựa vào cơ chế tiến hóa là FURIA (Fuzzy Unordered Rules
Induction Algorithm) và C4.5. FURIA là một mở rộng của giải thuật RIPPER với tập luật
không cần thiết phải được sắp xếp. Hệ phân lớp C4.5 là hệ phân lớp dựa trên cây quyết
định khai thác khái niệm entropy thông tin. Các kết quả thực nghiệm và so sánh hai hệ
phân lớp FRBC_AXmrtp và FRBC_AXmr so với hai hệ phân lớp FURIA và C4.5 được thể
hiện trong Bảng 2.13. Cụ thể, hai hệ phân lớp FRBC_AXmrtp và FRBC_AXmr lần lượt có
17 và 18 tập dữ liệu, trong số 23 tập dữ liệu được thực nghiệm, có độ chính xác trên tập
kiểm tra cao hơn so với hệ phân lớp FURIA. Cả hai hệ phân lớp FRBC_AXmrtp và
FRBC_AXmr đều có độ chính xác trên tập kiểm tra cao hơn so với hệ phân lớp C4.5 đối
với 20 trong số 23 tập dữ liệu được thực nghiệm. Các kết quả kiểm định giả thuyết thống
17
kê, ta có thể kết luận rằng cả hai hệ phân lớp FRBC_AXmr và FRBC_AXmrtp thực sự tốt
hơn FURIA và C4.5 cả về hiệu suất phân lớp lẫn độ phức tạp của hệ phân lớp.
2.6.5. Biểu diễn ngữ nghĩa tính tốn dựa trên tập mờ hình thang đảm bảo tính giải
nghĩa được của khung nhận thức ngơn ngữ
Đảm bảo tính giải nghĩa được của khung nhận thức ngôn ngữ (LFoC) là đảm bảo ngữ
nghĩa tính tốn (tập mờ) của các từ ngôn ngữ phải được xây dựng từ ngữ nghĩa vốn có của
chúng và phải bảo tồn những đặc trưng riêng của ngữ nghĩa định tínhcủa chúng (khái
quát và cụ thể). N. C. Hồ và các cộng sự đã đưa ra 4 ràng buộc trên ngữ nghĩa tính tốn
của các từ ngơn ngữ nhằm đảm bảo tính giải được của khung nhận thức ngôn ngữ.
Ràng buộc thứ nhất. [58] Ngữ nghĩa vốn có của các từ ngơn ngữ của một biến ngôn ngữ
xuất hiện trong một cơ sở luật về nguyên tắc được sử dụng để tạo ra một cơ sở hình thức
hóa cho việc xác định ngữ nghĩa định lượng của các từ ngôn ngữ, bao gồm ngữ nghĩa dựa
trên tập mờ, cho biểu diễn ngữ nghĩa của cơ sở luật.
Ràng buộc thứ hai. [58] Ngữ nghĩa tính tốn của các từ ngôn ngữ, bao gồm ngữ nghĩa
dựa trên tập mờ, phải được sinh ra dựa trên một cơ chế hình thức hóa đầy đủ của miền giá
trị của các biến ngôn ngữ.
Ràng buộc thứ ba. [58] Với một tập các từ cụ thể của một biến ngôn ngữ X, phép gán
: ⟶
với Intv là tập các khoảng trên miền giá trị số được chuẩn hóa của X biểu
thị ngữ nghĩa khoảng của các từ của phải bảo toàn tính khái quát và tính cụ thể của các
từ. Cụ thể, hai từ x và hx ∈ với h là một gia tử, quan hệ (ℎ ) ⊆ ( ) phải được thỏa.
Ràng buộc thứ tư. [58] Để bảo toàn ngữ nghĩa của các luật ngôn ngữ, các phép gán ngữ
nghĩa tính tốn của các từ ngơn ngữ của một biến X xuất hiện trong các luật phải bảo toàn
thứ tự ngữ nghĩa của các từ của X.
Cấu trúc phân hoạch mờ đơn thể hạt không thỏa Ràng buộc thứ ba, tức (ℎ ) ⊈
( ), do độ hỗ trợ của tập mờ ứng với từ ngôn ngữ x không chứa độ hỗ trợ của từ ngôn
ngữ hx được cảm sinh từ x nhờ gia tử h.
Với cấu trúc phân hoạch mờ đa thể hạt dựa trên độ dài của các từ, độ hỗ trợ của từ x
không chứa độ hỗ trợ của các từ hx, do đó phân hoạch được tạo ra không thỏa Ràng buộc
thứ ba nêu trên. Để thỏa Ràng buộc thứ ba, N. C. Hồ và các cộng sự đề xuất tách các từ
ngơn ngữ có độ dài bằng 1 tại mức k = 1 thành hai mức: mức k = 0 chỉ bao gồm 3 từ ngôn
ngữ 00, W và 1 0, mức k = 1 bao gồm 4 từ ngôn ngữ 01, c-, c+ và 11. Với cách biểu diễn này,
độ hỗ trợ của tập mờ ứng với từ ngơn ngữ x hồn tồn chứa độ hỗ trợ của từ ngôn ngữ hx
và Ràng buộc thứ ba, tức (ℎ ) ⊆ ( ) và kết quả là thỏa cả bốn ràng buộc nêu trên.
Các kết quả thực nghiệm cho thấy, hệ phân lớp với cấu trúc đa thể hạt mới có độ chính
xác trên tập kiểm tra cao hơn so với hệ phân lớp với cấu trúc đa thể hạt cũ đối với 18 tập
dữ liệu mẫu trong số 23 tập dữ liệu được thử nghiệm. So sánh dựa trên kết quả trung bình
của độ chính xác trên tập kiểm tra đối với 23 tập dữ liệu, hệ phân lớp FRBC_AXmrtp_k0 có
độ chính xác trung bình là 82,94%, cao hơn so với hệ phân lớp FRBC_AXmrtp có độ chính
xác trung bình là 82,67%, trong khi có độ phức tạp trung bình cao hơn khơng nhiều
(122,61 so với 114,78). Các kết quả kiểm định giả thuyết thống kê WSR cho ta kết luận,
18
phương pháp thiết kế đa thể hạt với mức k = 1 được tách thành hai mức 0 và 1 có ngữ
nghĩa dựa trên tập mờ hình thang của các từ ngôn ngữ thỏa Ràng buộc thứ ba và đảm bảo
tính giải nghĩa được của khung ngơn nhận thức ngơn ngữ và cho độ chính xác phân lớp
cao hơn so với phương pháp thiết kế đa thể hạt không tách mức k = 1.
2.7. KẾT LUẬN CHƯƠNG 2
Chương này trình bày các nghiên cứu phát triển mở rộng lý thuyết ĐSGT biểu diễn lõi
ngữ nghĩa và ngữ nghĩa tính tốn dựa trên tập mờ hình thang và ứng dụng trong thiết kế tự
động FLRBC cũng như trình bày các thực nghiệm, đánh giá và so sánh.
CHƯƠNG 3
THIẾT KẾ HIỆU QUẢ HỆ PHÂN LỚP DỰA TRÊN LUẬT NGÔN NGỮ MỜ
SỬ DỤNG KỸ THUẬT TÍNH TỐN MỀM
Chương này trình bày các thiết kế hiệu quả hệ phân lớp dựa trên luật ngôn ngữ mờ trên
cơ sở đại số gia tử dựa trên kỹ thuật tính tốn mềm.
3.1. THIẾT KẾ HIỆU QUẢ HỆ PHÂN LỚP DỰA TRÊN LUẬT NGÔN NGỮ MỜ
SỬ DỤNG CÁC THUẬT TỐN TỐI ƯU
3.1.1. Đánh giá tính hiệu quả của thuật toán MOPSO so với thuật toán GSA
3.1.1.1. Giải thuật tối ưu bầy đàn đa mục tiêu
- Chia sẻ thích nghi (fitness sharing): Khi một cá thể i đang chia sẻ các nguồn tài
ngun thì sự thích nghi fi của nó bị giảm bớt tỷ lệ với số cá thể xung quanh nó.
- Tiêu chuẩn tính trội (dominance criterion): Một phương án u được gọi là trội hơn
phương án v nếu phương án u không tồi hơn phương án v đối với tất cả các mục tiêu và
phương án u thực sự tốt hơn phương án v tại ít nhất một mục tiêu.
Giải thuật PSO đa mục tiêu (MOPSO) dựa trên tiêu chuẩn tính trội và khái niệm chia
sẻ thích nghi được Lechuga M. S. đề xuất năm 2006 như sau:
Thuật toán 3.1. MOPSO //[83] Giải thuật tối ưu đa mục tiêu PSO
Đầu vào: ω, c1, c2, Npop, Gmax.
//ω: hệ số inertia, c1, c2: hệ số tăng tốc, Npop: số particle mỗi thế hệ, Gmax: số thế hệ
Đầu ra: Tập các phương án tối ưu Лopt là kết quả của quá trình huấn luyện.
Begin
Bước 1: Các biến popi, pbesti, gbesti, fSharei được khởi tạo. Biến fSharei được tính như sau:
fSharei = x / nCounti
(3.4)
2
1 (di j / share ) nếu
trong đó, x = 10, nCounti sharingi
các trường hợp còn lại
j 0
0
n
j
(3.5)
n là số particle trong bộ nhớ lưu trữ, σshare là khoảng cách giữa các cá thể mà chúng ta muốn
duy trì và d i j là khoảng cách giữa các cá thể i và j.
Bước 2: Tốc độ của mỗi particlei được tính tốn như sau:
veli = ω × veli + c1 × r1 × (pbesti − popi) + c2 × r2 × (Лh − popi)
(3.6)
19
trong đó, ω là hệ số inertia, c1 và c2 là các hệ số tăng tốc, veli là giá trị tốc độ liền trước đó, r1
và r2 là các giá trị ngẫu nhiên giữa 0 và 1, pbesti là vị trí tốt nhất được tìm thấy bởi particle,
Лh là particle được đi theo và popi là vị trí hiện tại của particle trong khơng gian biến.
Bước 3: Vị trí mới của các particlei được tính như sau: pop i = pop i + veli
(3.7)
Bước 4: Các vị trí mới của bầy được đánh giá.
Bước 5: Bộ nhớ lưu trữ Лopt được cập nhật theo tiêu chuẩn tính trội và chia sẻ thích nghi.
Bước 6: Bộ nhớ của từng particle được cập nhật sử dụng tiêu chuẩn tính trội.
Bước 7: Chấm dứt và trả về Лopt nếu đạt số thế hệ Gmax, ngược lại thì trở về Bước 2.
End.
3.1.1.2. Ứng dụng thuật toán MOPSO tối ưu các tham số ngữ nghĩa và tìm kiếm hệ luật
tối ưu
Tối ưu các tham số ngữ nghĩa sử dụng giải thuật MOPSO là MOPSO_SPO.
Thuật toán 3.2. MOPSO_SPO //[CT2] Tối ưu các tham số ngữ nghĩa
Đầu vào: tập dữ liệu mẫu D = {(dp, Cp) | p = 1, …, m}; Các ràng buộc của các tham số tính mờ;
Các tham số: NR0, Npop, Gmax, K, λ; //Npop là kích thước bầy, Gmax là số thế hệ
Đầu ra: Tập các tham số ngữ nghĩa tối ưu Лopt;
Begin
Cụ thể hóa Giải thuật 3.1 với vị trí của mỗi cá thể là một bộ tham số ngữ nghĩa cần tối ưu;
Trả lại tập các giá trị tốt nhất của tập các bộ tham số ngữ nghĩa (gần) tối ưu Лopt;
End.
3.1.1.3. Thực nghiệm so sánh thuật toán MOPSO so với thuật toán GSA
Theo các kết quả thực nghiệm, việc sử dụng giải thuật tối ưu MOPSO trong thiết kế
FLRBC với ngữ nghĩa dựa trên ĐSGT AX cho độ chính xác trên tập kiểm tra cao hơn so
với sử dụng giải thuật tối ưu GSA đối với 13 trong số 17 tập dữ liệu được thực nghiệm.
Xét theo độ chính xác trung bình trên tập kiểm tra, việc sử dụng giải thuật tối ưu MOPSO
cho độ chính xác trung bình cao hơn (80,83% so với 80,50%) và có độ phức tạp trung bình
của các hệ luật thấp hơn (141,64 so với 177,49) so với sử dụng giải thuật tối ưu GSA.
Theo các kết quả kiểm định thống kê, ta có thể kết luận rằng tiếp cận thiết kế FLRBC dựa
trên ĐSGT AX sử dụng MOPSO cho kết quả tốt hơn so với sử dụng GSA đối với cả hai
tiêu chí so sánh là độ chính xác và độ phức tạp của hệ phân lớp.
3.1.2. Đánh giá tính hiệu quả của thuật toán MOPSO-SA so với thuật toán MOPSO
3.1.2.1. Giải thuật tối ưu đa mục tiêu lai MOPSO-SA
Giải thuật mô phỏng tôi luyện (simulated annealing - SA) được sử dụng nhằm giúp các
particle của MOPSO thoát khỏi vùng tối ưu địa phương để tiếp tục quá trình tìm kiếm do
giải thuật SA sử dụng luật chấp thuận Metropolis (metropolis acceptance rule).
Giải thuật mơ phỏng tơi luyện SA
Thuật tốn 3.3. SA //Thuật tốn mơ phỏng tơi luyện
Đầu vào: các tham số: E, T0, α, điều kiện kết thúc.
Đầu ra: Phương án tối ưu là kết quả của quá trình huấn luyện.
Begin
Bước 1: Khởi tạo cấu hình ban đầu = 0 năng lượng E, tỷ suất làm lạnh α [0, 1], T = T0.
20
Bước 2: Chọn ngẫu nghiên một new là lân cận của và tính sự thay đổi năng lượng ∆E.
Bước 3: Nếu giá trị ∆E âm thì = new (cấu hình mới được chấp nhận). Ngược lại, cấu hình
mới được chấp nhận với xác suất P e( E / kBT ) , kB là hằng số Boltzman.
Bước 4: Nếu đạt điều kiện kết thúc thì trả lại và q trình tơi luyện kết thúc. Ngược lại,
giảm nhiệt độ T = α×T và nhảy tới Bước 2.
End.
Giải thuật tối ưu đa mục tiêu lai MOPSO-SA
Thuật toán 3.4. MOPSO-SA //[CT6] giải thuật tối ưu bầy đàn mô phỏng tôi luyện
Đầu vào: các tham số: Gmax, Tmax, α, Npop, D.
Đầu ra: Tập các phương án tối ưu Лopt là kết quả của quá trình huấn luyện.
Begin
Bước 1: Khởi tạo t = 0, và sinh ngẫu nhiên n particle của thế hệ ban đầu. Nhiệt độ ban đầu T0
= Tmax, tỷ suất làm lạnh α, số thế hệ Gmax. Các giá trị của các hàm mục tiêu của mỗi particle
đánh giá. Giá trị chia sẻ thích nghi của từng each particle được tính theo cơng thức (3.4).
Bước 2: Với mỗi i trong bầy đàn.
Bước 2.1: Tính tốc độ của velit 1 của particle i theo cơng thức (3.6).
Bước 2.2: Tính vị trí mới popit 1 của particle i theo cơng thức (3.7).
Bước 2.3: Đánh giá các giá trị mục tiêu của particle thứ i.
Bước 2.4: Kiểm tra tiêu chuẩn tính trội giữa vị trí mới popit 1 của particle i và vị trí cũ của nó
tại thế hệ trước đó popit . Nếu vị trí pop it 1 trội hơn vị trí pop it , nghĩa là vị trí mới tốt hơn, thì
vị trí pop it 1 được chấp nhận là vị trí mới của particle i. Ngược lại, tính giá trị RMSR:
RMSR =
1
D
D
t 1
i, j
( fitness
fitnessit, j ) 2
(3.8)
j 1
trong đó, D là số mục tiêu. Sinh ngẫu nhiên một số δ [0, 1]. Vị trí mới được chấp nhận nếu
δ > e( RMSR/Tt ) hoặc số lần di chuyển thất bại lớn hơn 100. Nếu vị trí mới được chấp nhận thì
nhảy tới Bước 2. Ngược lại, nhảy tới Bước 2.1.
Bước 3: Cập nhật bộ nhớ lưu trữ Лopt theo tiêu chuẩn tính trội và chia sẻ thích nghi.
Bước 4: Cập nhật bộ nhớ của các particle dựa trên tiêu chuẩn tính trội.
Bước 5: Nếu đạt số thệ hệ Gmax thì trả về tập các phương án tốt nhất được lưu trong bộ nhớ
lưu trữ Лopt và giải thuật chấm dứt. Ngược lại, thay đổi nhiệt độ tôi luyện Tt 1 Tt , tăng t = t
+ 1, và nhảy tới Bước 2.
End.
3.1.2.2. Ứng dụng giải thuật MOPSO-SA thiết kế tối ưu các từ ngôn ngữ và lựa chọn
hệ luật tối ưu
Với các mục tiêu tối ưu (2.8), giải thuật tối ưu các tham số ngữ nghĩa được cấu trúc
hóa bằng giải thuật MOPSO-SA và được đặt tên là MOPSOSA_SPO.
Thuật toán 3.5. MOPSOSA_SPO //[CT6] Tối ưu các tham số ngữ nghĩa
Đầu vào: tập dữ liệu mẫu D = {(dp, Cp) | p = 1, …, m}, các tham số: a, b, NR0, Npop, Gmax, K, λ,
Tmax, α; //Npop là kích thước bầy, Gmax là số thế hệ.
Đầu ra: Tập các tham số ngữ nghĩa tối ưu Лopt;
Begin
21
Giải thuật này cụ thể hóa Giải thuật 3.4 với vị trí của mỗi cá thể là một bộ tham số ngữ nghĩa;
Trả lại tập các giá trị tốt nhất của tập các bộ tham số ngữ nghĩa (gần) tối ưu Лopt;
End.
3.1.2.3. Thực nghiệm so sánh giải thuật MOPSO-SA so với giải thuật MOPSO
Theo các kết quả thực nghiệm đối với 23 tập dữ liệu, hệ phân lớp MOPSO-SAAX có
độ chính xác trên tập kiểm tra cao hơn so với hệ phân lớp MOPSOAX đối với 16 trong số
23 tập dữ liệu được thực nghiệm và có độ chính xác bằng nhau đối với 3 tập dữ liệu. Hệ
phân lớp MOPSO-SAAXmrtp có độ chính xác trên tập kiểm tra cao hơn so với hệ phân lớp
MOPSOAXmrtp đối với 17 tập dữ liệu trong số 23 tập dữ liệu được thực nghiệm và có độ
chính xác bằng nhau đối với 1 tập dữ liệu. Qua các kết quả kiểm định WSR, ta có thể kết
luận rằng, việc sử dụng giải thuật tối ưu MOPSO-SA trong thiết kế FLRBC với ngữ nghĩa
dựa trên ĐSGT AX cho độ chính xác phân lớp tốt hơn so với việc sử dụng giải thuật
MOPSO (82,48% so với 81,92%) nhưng không làm tăng độ phức tạp của hệ phân lớp.
Việc sử dụng giải thuật tối ưu MOPSO-SA trong thiết kế FLRBC với ngữ nghĩa dựa trên
ĐSGT AXmrtp khơng những cho độ chính xác phân lớp tốt hơn (82,94% so với 82,67%) mà
còn cho độ phức tạp trung bình thấp hơn (107,52 so với 114,78) so với việc sử dụng giải
thuật tối ưu MOPSO.
3.2. NÂNG CAO HIỆU QUẢ SINH LUẬT MỜ VỚI NGỮ NGHĨA DỰA TRÊN ĐẠI
SỐ GIA TỬ BẰNG KỸ THUẬT LỰA CHỌN ĐẶC TRƯNG
Với mục tiêu làm giảm số chiều của các tập dữ liệu có số chiều lớn trước khi thực hiện
sinh luật sử dụng ĐSGT, luận án đề xuất ứng dụng kỹ thuật lựa chọn đặc trưng với trọng
số động do Sun X. đề xuất năm 2013 như một bước tiền xử lý bổ sung cho phương pháp
hai bước thiết kế FLRBC trên cơ sở ĐSGT.
3.2.1. Một số khái niệm cơ bản về lý thuyết thông tin
3.2.2. Kỹ thuật lựa chọn đặc trưng sử dụng trọng số động
( ; )
Cơng thức phân tích tính hợp lý: ( , ) = 2 ×
( )
( )
(0 ≤
( , ) ≤ 1)
(3.15)
Một thuộc tính fi được bị dư thừa với thuộc tính fj nếu thỏa bất đẳng thức sau:
;
≤ ( ;
Tỷ lệ dư thừa tương đối giữa hai thuộc tính:
)
;
( , )= 2×
Hai thuộc tính fi và fj là phụ thuộc lẫn nhau nếu:
Tỷ lệ phụ thuộc lẫn nhau giữa fi và fj:
(3.16)
( )
;
( , )=2×
( ;
(
)
≥ ( ;
;
( ;
( )
(
)
)
)
)
(3.17)
(3.18)
(3.19)
Tỷ lệ phụ thuộc lẫn nhau giữa fi và fj biểu thị tỷ lệ tăng hoặc giảm của tính hợp lý giữa
fi và nhãn lớp bởi có sự tham gia của thuộc tính mới được định nghĩa như sau:
(, )=
( , ),
( , ),
;
> ( ;
;
≤ ( ;
)
)
( , ) ≤ 1.
Ta thấy rằng −1 ≤
Giải thuật lựa chọn đặc trưng DWFS được đề xuất bởi Sun X. dưới dạng mã giả:
22
(3.20)
Thuật tốn 3.6. DWFS //mơ phỏng thuật tốn trong [116]
Đầu vào: Tập dữ liệu huấn luyện D với không gian thuộc tính F và lớp C.
Đầu ra: Tập con S được lựa chọn có thuộc tính.
Begin
Khởi tạo các biến: k = 1, = ∅; Khởi tạo trọng số w(f) cho từng thuộc tính f trong F bằng 1;
Tính giá trị U(f, class) cho từng thuộc tính f trong F;
While ≤ do
For từng thuộc tính ứng viên ∈ do
Tính ( ) = ( ,
) × ( );
End;
Chọn thuộc tính ứng viên fj có J(f) lớn nhất;
= ∪ { }; F = F \ {fj};
For từng thuộc tính ứng viên ∈ do
Tính tỷ lệ phụ thuộc lẫn nhau CR(i, j); ( ) = ( ) × (1 + ( , ));
End; k = k + 1;
End.
Độ phức tạp của giải thuật DWFS là ( × ) như đã được chứng minh bởi Sun X.,
trong đó, n là số thuộc tính gốc và số thuộc tính được lựa chọn.
3.2.3. Ứng dụng giải thuật DWFS trong thiết kế FLRBC trên cơ sở ĐSGT
Phương pháp hai giai đoạn thiết kế FLRBC theo tiếp cận ĐSGT được bổ sung thêm
một giai đoạn tiền xử lý áp dụng giải thuật DWFS. Bước tiền xử lý như sau: Với mỗi tập
dữ liệu cụ thể, các thuộc tính có giá trị liên tục được phân hoạch thành các cụm bằng việc
áp dụng kỹ thuật phân cụm mờ c-means với hàm chỉ số hợp lệ cụm (cluster validity index
function) PBMF để rời rạc hóa dữ liệu và sau đó áp dụng giải thuật DWFS để lựa chọn
một tập con các thuộc tính có tính phân biệt nhất.
3.2.4. Kết quả thực nghiệm và thảo luận
Sau khi áp dụng kỹ thuật lựa chọn đặc trưng, thời gian sinh luật giảm rất nhiều. Chẳng
hạn, thời gian sinh tập luật khởi đầu từ tập dữ liệu Dermatology gốc trong trường hợp độ
dài luật tối đa là 3 hết 07:41:03 hay 27.663 giây, lớn hơn 5.532 lần so với sau khi áp dụng
kỹ thuật lựa chọn đặc trưng lựa chọn ra 7 thuộc tính.
Kết quả thực nghiệm về độ chính xác phân lớp của FLRBC trên cơ sở ĐSGT AX và
ĐSGT AXmrtp đối với tập dữ liệu gốc và các tập dữ liệu đã áp dụng kỹ thuật lựa chọn đặc
trưng trên kết quả trung bình đối với 8 tập dữ liệu được thử nghiệm, độ chính xác và độ
phức tạp trung bình của các hệ phân lớp khơng có nhiều khác biệt. Các kết quả kiểm định
giả thuyết thống kê cho ta kết luận, việc áp dụng phương pháp lựa chọn đặc trưng như một
bước tiền xử lý trong phương pháp thiết kế FLRBC trên cơ sở ĐSGT không làm giảm chất
lượng của hệ phân lớp. Để giảm thời gian sinh luật từ các tập dữ liệu có số chiều lớn, kỹ
thuật lựa chọn đặc trưng nên được áp dụng như một kỹ thuật tiền xử lý dữ liệu.
3.3. Kết luận chương 3
Chương này trình bày giải pháp nâng cao chất lượng của FLRBC được thiết kế trên cơ
sở ĐSGT sử dụng hai thuật toán tối ưu bầy đàn đa mục tiêu MOPSO và thuật toán lai
23