Tải bản đầy đủ (.pdf) (61 trang)

Một số độ đo mức tương tự giữa các tập mờ trực cảm (vague sets), thử nghiệm trong phân cụm dữ liệu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.04 MB, 61 trang )

i

LỜI CAM ĐOAN
Tôi xin cam đoan những kết quả nêu trong luận văn là những kết quả tìm
hiểu, nghiên cứu của tôi dưới sự hướng dẫn của Thầy giáo PGS.TS: Nguyễn Tân
Ân. Mọi trích dẫn sử dụng trong báo cáo này đều được ghi rõ nguồn tài liệu
tham khảo theo đúng quy định.
Vũ Thị Lành


ii

MỤC LỤC
LỜI CAM ĐOAN ............................................................................................... i
MỤC LỤC ......................................................................................................... ii
LỜI CẢM ƠN ................................................................................................... iv
DANH MỤC HÌNH ........................................................................................... v
MỞ ĐẦU ........................................................................................................... 1
CHƯƠNG I: TẬP MỜ VÀ TẬP MỜ TRỰC CẢM............................................ 3
1.1. Tập mờ ..................................................................................................... 3
1.1.1. Định nghĩa tập mờ ............................................................................. 4
1.1.2. Các phép toán trên tập mờ ................................................................. 4
1.1.3. Khoảng cách giữa các tập mờ .......................................................... 10
1.2. Tập mờ trực cảm ( Intuitionistic Fuzzy Sets - IFSs) ............................... 11
1.2.1. Định nghĩa tập mờ trực cảm ............................................................. 11
1.2.2. Một số phép toán trên tập mờ trực cảm hình thang......................... 11
1.2.3.Các phép toán trên số mờ trực cảm hình thang, hình tam giác .......... 13
Kết luận chương 1: ........................................................................................... 14
CHƯƠNG II. ĐỘ TƯƠNG TỰ GIỮA CÁC TẬP MỜ TRỰC CẢM ............... 16
2.1. Khoảng cách giữa các tập mờ trực cảm .................................................. 16
2.1.1 Khoảng cách S C ( A, B ) ...................................................................... 16


2.1.2. Khoảng cách giữa S H và S L ............................................................. 19
2.1.3. Khoảng cách SO ............................................................................... 21
2.2. Độ đo mức tương tự ............................................................................... 21
2.2.1. Độ đo mức tương tự dựa trên khoảng cách ...................................... 22
2.2.2. Độ đo mức tương tự dựa trên lý thuyết tập hợp ................................ 26
2.2.3. Độ đo mức tương tự dựa trên hàm xác định mức phù hợp................ 26
Kết luận chương 2:........................................................................................ 27
CHƯƠNG III. THỬ NGHIỆM MỘT SỐ ĐỘ ĐO MỨC ĐỘ TƯƠNG TỰ
TRONG BÀI TOÁN PHÂN CỤM ................................................................... 28


iii

3.1. Bài toán phân cụm ................................................................................. 28
3.1.1. Phân cụm và ứng dụng ..................................................................... 28
3.1.2. Một số phương pháp phân cụm ........................................................ 28
3.2. Thử nghiệm số độ đo mức tương tự trong phân cụm .............................. 47
3.2.1. Ngôn ngữ lập trình .......................................................................... 47
3.2.2. Biểu diễn dữ liệu sinh viên nhờ tập mờ trực cảm ............................. 47
3.2.3. Giao diện và hướng dẫn sử dụng chương trình ................................. 48
3.2.4. Thử nghiệm phân cụm dữ liệu sinh viên trường Đại học Hoa Lư ........ 49
3.2.5. So sánh các kết quả phân cụm trong các trường hợp sử dụng độ đo
mức tương tự khác nhau. .................................................................................. 50
KẾT LUẬN...................................................................................................... 54
TÀI LIỆU THAM KHẢO ................................................................................ 55


iv

LỜI CẢM ƠN


Trước hết, tôi xin chân thành cảm ơn các Thầy cô Trường Đại học Công
nghệ Thông tin & Truyền thông, đặc biệt là các Thầy cô đã tận tình giảng dạy
tôi trong suốt quá trình học tập tại trường.
Tôi xin gửi lời biết ơn sâu sắc đến Thầy giáo PGS.TS Nguyễn Tân Ân,
Thầy hướng dẫn, đã dành nhiều thời gian và tâm huyết hướng dẫn tôi nghiên
cứu trong suốt thời gian qua.
Tôi cũng xin chân thành cảm ơn đồng nghiệp trong nhóm tin Trường Đại
học Hoa Lư đã tạo điều kiện về mặt thời gian để tôi có thể hoàn thành chương
trình học và bảo vệ Luận văn Tốt nghiệp.
Cuối cùng, tôi xin gửi lời cảm ơn tới những người thân trong gia đình tôi,
bạn bè tôi đã luôn động viên, khích lệ tôi trong quá trình học tập và nghiên cứu.
Mặc dù tôi đã có nhiều cố gắng hoàn thành luận văn một cách tốt nhất, tuy
nhiên do năng lực còn nhiều hạn chế nên không thể tránh khỏi những thiếu sót.
Vì vậy, tôi rất mong nhận được những đóng góp quý báu của thầy cô và các bạn.
Thái Nguyên, ngày 14 tháng 7 năm 2014
Học viên

Vũ Thị Lành


v

DANH MỤC HÌNH
Trang
Hình 1.1. Đồ thị biểu diễn hàm thuộc ................................................................. 5
Hình 1.2. Đồ thị biểu diễn phép giao .................................................................. 7
Hình 1.3. Đồ thị biểu diễn phép hợp ................................................................... 8
Hình 1.4: Số mờ trực cảm hình thang ............................................................... 14
Hình 1.5: Số mờ trực cảm tam giác .................................................................. 14

Hình 3.1. Minh họa nguyên tắc của thuật toán phân cụm K-means .................. 30
Hình 3.2. Lân cận của p với ngưỡng Eps .......................................................... 32
Hình 3.3. Mật độ - đến được trực tiếp............................................................... 33
Hình 3.4. Mật độ - đến được............................................................................. 33
Hình 3.5. Mật độ - liên thông ........................................................................... 34
Hình 3.6. Cụm và Nhiễu................................................................................... 34
Hình 3.7. Các cụm dữ liệu được tìm ra bởi thuật toán CURE ........................... 36
Hình 3.8. Mô hình biểu diễn dữ liệu sinh viên .................................................. 48
Hình 3.9. Giao diện chương trình ..................................................................... 48
Hình 3.10. Giao diện trước khi phân cụm ......................................................... 49
Hình 3.11. Giao diện sau khi phân cụm ............................................................ 50
Hình 3.12. Biểu đồ phân cụm áp dụng độ đo khoảng cách ............................. 51
Hình 3.13. Biểu đồ phân cụm áp dụng độ đo lý thuyết tập hợp....................... 51
Hình 3.14. Biểu đồ phân cụm áp dụng độ đo hàm xác định ............................ 52


1

MỞ ĐẦU
1. Đặt vấn đề:
Độ đo mức tương tự có ý nghĩa rất quan trọng trong khai phá dữ liệu,
tìm kiếm thông tin và phát hiện tri thức. Trong trường hợp không đủ thông tin
hoặc thông tin về các đối tượng là không rõ ràng ta rất khó xác định mức
tương tự giữa các đối tượng.
Lý thuyết tập mờ được L. Zadeh đưa ra năm 1965 đã giúp cho việc biểu
diễn các đối tượng mờ có cơ sở lý thuyết chắc chắn. Với một hàm thành viên,
tập mờ của Zadeh đã cho phép biểu diễn và xử lý nhiều trường hợp mờ một
cách hiệu quả. Tuy nhiên thế giới khách quan vô cùng phong phú. Khi biểu
diễn các đối tượng mờ người ta phát hiện ra rằng tập mờ của Zadeh cũng trở
nên chật hẹp khi diễn tả những khái niệm không rõ ràng. Năm 1986,

Atanassov đã đưa ra tập mờ trực cảm (intuitionistic fuzzy set), một mở rộng
của tập mờ Zadeh. Năm 1993 Gau & Buehrer cũng giới thiệu một loại tập mờ
mà các ông gọi là Vague set. Sau này người ta đã chỉ ra rằng intuitionistic
fuzzy set và Vague set chỉ là một (trong luận văn này chúng tôi dịch là tập
mờ trực cảm). Trong tập mờ trực cảm các tác giả đã dựa vào hai hàm thành
viên: Hàm thành viên đúng thể hiện mức độ thuộc của phần tử đang xét vào
tập mờ đã cho. Hàm thành viên sai thể hiện mức độ không thuộc của phần tử
đang xét vào tập mờ đã cho. Tập mờ của Zadeh trở thành trường hợp riêng
của tập mờ trực cảm. Với tập mờ trực cảm ta có thể biểu diễn các đối tượng
mờ một cách sát thực với bản chất của nó hơn.
Trong cơ sở dữ liệu mờ biểu diễn bằng tập mờ trực cảm, xác định độ
tương tự giữa các phần tử đòi hỏi cách làm khác. Càng tính được độ tương tự
giữa các phần tử phản ánh đúng bản chất của sự giống nhau, ta có các kết quả
truy vấn, kết quả tìm kiếm và các qui luật trong dữ liệu càng đúng đắn.
Trong khuôn khổ của một luận văn thạc sỹ, tôi chọn đề tài “Một số độ
đo mức tương tự giữa các tập mờ trực cảm (Vague sets), thử nghiệm


2

trong phân cụm dữ liệu” tìm hiểu về các độ đo mức tương tự giữa các tập
mờ trực cảm, ứng dụng trong phân cụm dữ liệu độ đo mức tương tự và lý
thuyết tập mờ, ứng dụng tập mờ để biểu diễn thông tin.
2. Đối tượng và phạm vi nghiên cứu
- Lý thuyết về tập mờ và tập mờ trực cảm trực cảm.
- Các độ đo mức tương tự giữa các tập mờ trực cảm và ứng dụng trong
phân cụm dữ liệu.
- Nghiên cứu lý thuyết và ứng dụng của tập mờ, tập mờ trực cảm.
- Nghiên cứu về độ tương tự giữa các tập mờ trực cảm.
- Thử nghiệm một số độ đo mức tương tự khi phân cụm dữ liệu.

3. Hướng nghiên cứu của đề tài
- Tìm hiểu về tập mờ và tập mờ trực cảm.
- Tìm hiểu về các độ đo sự tương tự giữa các tập mờ trực cảm. Tìm
hiểu và độ đo khoảng cách giữa các tập mờ, xác định độ tương tự dựa trên xác
định khoảng cách.
- Tìm hiểu về phân cụm dữ liệu.
- Cài đặt thử nghiệm chương trình phân cụm dữ liệu biểu diễn nhờ tập
mờ trực cảm.
4. Phương pháp nghiên cứu
- Phương pháp đọc tài liệu, phân tích, tổng hợp.
- Phương pháp thực nghiệm và đối chứng.
5. Ý nghĩa khoa học của đề tài
- Việc áp dụng các độ đo mức tương tự giữa các tập mờ trực cảm giúp

phân cụm dữ liệu và từ đó có thể ứng dụng vào việc phân cụm dữ liệu một
cách khoa học và chính xác.
- Hỗ trợ và góp phần nâng cao hiệu quả việc đánh giá, phân loại năng
lực của sinh viên.


3

CHƯƠNG I: TẬP MỜ VÀ TẬP MỜ TRỰC CẢM
1.1. Tập mờ
L.A. Zadeh lần đầu tiên đưa ra khái niệm và lý thuyết về tập mờ thông
qua bài báo “Fuzzy Set” được đăng trên tạp chí Information and Control năm
1965, và sau đó với hàng loạt bài báo sau này đã mở đầu cho sự phát triển và
ứng dụng của lý thuyết này. Ngày nay, lý thuyết tập mờ vẫn không ngừng
phát triển và đóng góp ứng dụng của nó vào trong nhiều ngành nghiên cứu
như: lý thuyết điều khiển, trí tuệ nhân tạo, khai phá dữ liệu,…

Ý tưởng cơ bản của tập mờ xuất phát từ những khái niệm trừu tượng về
ngữ nghĩa của thông tin không chắc chắn như: trẻ, xinh, cao, tốt,… Khi nói
đến khái niệm tập hợp thường là những phần tử có cùng một số tính chất
chung nào đó, ví dụ như tập các sinh viên. Ta có:
S = {s | s là sinh viên}
Vậy nếu một người nào đó là sinh viên thì thuộc tập S, ngược lại thì
không thuộc tập S. Tuy nhiên, trong thực tế có rất nhiều trường hợp mà khái
niệm không được định nghĩa một cách rõ ràng. Ví dụ, khi nhận xét về một
người: “người này trẻ” thì khi đó sẽ có một câu hỏi: “như thế nào là trẻ?”,
hoặc có những ví dụ khác như: “lớp những chiếc xe đẹp”, “lớp những người
cao”,… Khi đó những khái niệm trên được gọi là những khái niệm mờ, đó là
những khái niệm không được định nghĩa một cách rõ ràng. Những tập hợp
dạng này đã được Zadeh biểu diễn bằng một khái niệm toán học được gọi là
tập mờ và được coi như là một trường hợp riêng được khái quát từ khái niệm
tập hợp kinh điển. [8]
Xét lại ví dụ trên, ta sẽ đi biểu diễn ngữ nghĩa của khái niệm “trẻ” trong
việc đánh giá về một người. Giả sử tuổi của con người được biểu diễn trong
đoạn từ [0, 140] tính theo đơn vị năm. Theo Zadeh, khái niệm “trẻ” có thể
biểu diễn như sau: Xét tập hợp Atrẻ là những người được đánh giá là trẻ. Ông


4

đưa ra một câu hỏi cần trả lời “Một người có tuổi x được hiểu là thuộc tập Atrẻ
như thế nào?”. Thông thường ta có thể thấy những người có tuổi từ 0-25 sẽ
thuộc vào tập Atrẻ tức là độ thuộc bằng 1; nhưng với người có tuổi là 26 thì có
lẽ chỉ thuộc vào tập Acao với độ thuộc 0.3, còn người có tuổi 40 sẽ thuộc vào
tập Atrẻ với độ thuộc 0,… Từ đó ông đưa ra, ngữ nghĩa của khái niệm trẻ sẽ
được biểu diễn bằng một hàm số  trÎ : U  [0, 1] .
1.1.1. Định nghĩa tập mờ

Cho

tập



trụ

U  u 1 , u 2 , ..., u n  .

Tập

hợp

A

=

 u,  (u) | u U,  (u) 0, 1 được gọi là tập hợp mờ trên tập U.
A

A

Trong đó:
+ Biến u được gọi là biến cơ sở.
+ Hàm A : U  0, 1 được gọi là hàm thành viên.
+ Giá trị  A ( u ) được gọi là độ thành viên của phần tử u thuộc vào tập
hợp A.
Ví dụ: Xét tập U gồm 5 người là x1 , x2 ,..., x5 có tuổi tương ứng là: 1, 15,
20, 30, 50 và A là tập hợp những người “trẻ”. Khi đó ta có thể xây dựng được

hàm thuộc như sau:  trÎ (1)  1, trÎ (15)  1, trÎ (20)  1, trÎ (30)  0.1,  trÎ (50)  0
và tập mờ AtrÎ   0,1 , 15,1 ,  20,1 ,  30,0.1 ,  50,0 .
1.1.2. Các phép toán trên tập mờ
Để có thể tiến hành mô hình hóa các hệ thống có chứa tập mờ và biểu
diễn các quy luật vận hành của hệ thống này trước tiên ta cần tới việc suy
rộng các phép toán logic cơ bản với các mệnh đề có chân trị trên đoạn [0,1].
Cho Ω = {P1, P2,...} với P1, P2,... là các mệnh đề. Tập mờ A trên Ω
tương ứng với ánh xạ v như sau:
v: Ω → [0,1]
 Pi  Ω → v(Pi)
Ta gọi v(Pi) là chân trị của mệnh đề Pi trên [0,1].


5

1.1.2.1. Phép phủ định mờ
Định nghĩa 1:
Hàm n: [0,1] → [0,1] không tăng thỏa mãn các điều kiện n(0) = 1, n (1) = 0
và thỏa 4 điều kiện:
- v(NOT P) chỉ phụ thuộc vào v(P).
- Nếu v(P) = 1 thì v(NOT P) = 0
- Nếu v(P) = 0 thì v(NOT P) = 1
- Nếu v(P1) ≤ v(P2) thì v(NOT P1) ≥ v(NOT P2)
được gọi là hàm phủ định.
Ví dụ: n(x) = 1 - x hay n(x) = 1 - x2 là các hàm phủ định.
Dễ thấy rằng các hàm đó thỏa các điều kiện của định nghĩa trên.
Định nghĩa 2 (Phần bù của một tập mờ):
Cho n là hàm phủ định, phần bù Ac của tập mờ A là một tập mờ với
hàm thuộc về được xác định bởi:
μAc (a) = n(μA(a)), với mỗi a  Ω.

Đồ thị của hàm thuộc về có dạng sau:

a

b

Hình 1.1. Đồ thị biểu diễn hàm thuộc
Hình a: Hàm thuộc của tập mờ A, Hình b: Hàm thuộc của tập mờ Ac
Ví dụ: với n(x) = 1 - x
Ta có:
μAc (a) = n(μA(a)) = 1 - μA(a), với mỗi a  Ω.


6

Cho Ω = {1, 2, 3, 4, 5}, và A là tập mờ trong Ω như sau:
A = {(1,0), (2,1), (3,0.5), (4,0.3), (5,0.2)}
Ta có:
Ac = {(1,1), (2,0), (3,0.5), (4,0.7), (5,0.8)}
Định nghĩa 3:
a. Hàm phủ định n là chặt nếu nó là hàm liên tục và giảm chặt.
b. Hàm phủ định n là mạnh nếu nó là chặt và thỏa n(n(x)) = x,  x  [0,1].
Định nghĩa 4:
Hàm : [a,b] → [a,b] gọi là một tự đồng cấu (automorphism) của đoạn
[a,b] nếu nó là hàm liên tục, tăng chặt và (a) = a, (b) = b.
1.1.2.2. Phép hội mờ
Định nghĩa 5 (Phép hội mờ):
Hàm T: [0,1]2 → [0,1] là phép hội khi và chỉ khi T thỏa các điều kiện sau:
- T(1,x) = x, với mọi 0≤ x ≤1.
- T có tính giao hoán, nghĩa là: T(x,y) = T(y,x), với mọi 0 ≤ x, y ≤1.

- T không giảm theo nghĩa: T(x,y) ≤ T(u,v), với mọi x ≤ u, y ≤ v.
- T có tính kết hợp: T(x,T(y,z)) = T(T(x,y),x), với mọi 0 ≤ x, y, z ≤1.
Từ các tính chất trên có thể suy ra T(0,x) = 0.
Dễ thấy T(x,y) = min(x,y) thỏa các điều kiện trên.
Định nghĩa 6 (Giao của hai tập mờ):
Cho hai tập mờ A, B trên cùng không gian nền Ω với hàm thuộc μA(a),
μB(a) và cho T là một phép hội.
Ứng với phép hội T, giao của hai tập mờ A, B là một tập mờ trên Ω với
hàm thuộc cho bởi:
μA∩B(a) = T(μA(a), μB(a))  a  Ω
Ví dụ:
Với T(x,y) = min(x,y) ta có:
μA∩B(a) = min(μA(a), μB(a))


7

Với T(x,y) = x.y ta có:
μA∩B(a) = μA(a).μB(a) (tích đại số)
Ta có thể biểu diễn phép giao của hai tập mờ qua hai hàm
T(x,y)=min(x,y) và T(x,y) = x.y theo các đồ thị sau đây:

b

a

c

Hình 1.2. Đồ thị biểu diễn phép giao
- Hình a: Hàm thuộc của hai tập mờ A và B

- Hình b: Giao của hai tập mờ theo T(x,y) = min(x,y)
- Hình c: Giao của hai tập mờ theo T(x,y) = x.y
Ví dụ:
Cho Ω, T(x,y) = min(x,y) và A, B là các tập mờ, phép giao của hai tập
mờ được tính và cho trong bảng sau:
Ω

1

2

3

4

5

A

(1,0)

(2,1)

(3,0.5)

(4,0.3)

(5,0.2)

B


(1,0)

(2,0.5)

(3,0.7)

(4,0.2)

(5,0.4)

AB

(1,0)

(2,0.5)

(3,0.5)

(4,0.2)

(5,0.2)

1.1.2.3. Phép tuyển mờ
Định nghĩa 7 (Phép tuyển mờ):
Hàm S: [0,1]2 → [0,1] được gọi là phép tuyển mờ nếu S thỏa các điều
kiện sau:
- S(0, x) = x, với mọi 0≤ x ≤1.



8

- S có tính giao hoán, nghĩa là: S(x,y) = S(y,x), với mọi 0≤ x,y ≤1.
- S không giảm theo nghĩa: S(x,y) ≤ S(u,v), với mọi x ≤ u, y ≤ v.
- S có tính kết hợp: S(x,S(y,z)) = S(S(x,y),x), với mọi 0≤ x,y,z ≤1.
Từ các tính chất trên suy ra S(1,x) = 1.
Ví dụ: S(x,y) = max(x,y);
S(x,y) = x + y - x.y
Thỏa các tính chất trên, vậy S là phép tuyển mờ.
Định nghĩa 8 (Hợp của hai tập mờ):
Cho hai tập mờ A, B trên cùng không gian nền Ω với hàm thuộc μA(a),
μB(a). Cho S là phép tuyển, phép hợp của hai tập mờ A, B (Ký hiệu AB) là
một tập mờ trên Ω với hàm thuộc về cho bởi:
μAB(a) = S(μA(a), μB(a)), a  Ω
Với S(x,y) = max(x,y) ta có:
μAB(a) = max(μA(a), μB(a)) (xem hình b)
Với S(x,y) = x + y - x.y
μAB(a) = μA(a) + μB(a) - μA(a).μB(a) (xem hình c)
Có thể biểu diễn giao của các tập mờ với các phép toán trên bằng các
đồ thị sau:

a

b
Hình 1.3. Đồ thị biểu diễn phép hợp

- Hình a: Hàm thuộc của hai tập mờ A và B
- Hình b: Hợp của hai tập mờ theo S(x,y) = max(x,y)

c



9

- Hình c: Hợp của hai tập mờ theo S(x,y) = x + y - x.y
Ví dụ:
Cho Ω, S(x,y) = max(x,y) và A, B là các tập mờ, phép hợp của hai tập
mờ được tính và cho trong bảng sau:
Ω

1

2

3

4

5

A

(1,0)

(2,1)

(3,0.5)

(4,0.3)


(5,0.2)

B

(1,0)

(2,0.5)

(3,0.7)

(4,0.2)

(5,0.4)

AB

(1,0)

(2,1)

(3,0.7)

(4,0.3)

(5,0.4)

AAc

(1,1)


(2,1)

(3,0.5)

(4,0.7)

(5,0.8)

1.1.2.4. Phép kéo theo
Định nghĩa 9:
Phép kéo theo của một hàm số I: [0,1]2 → [0,1] thỏa các điều kiện sau:
- Nếu x ≤ z thì I(x,y) ≥ I(z,y),  y  [0,1].
- Nếu y ≤ u thì I(x,y) ≤ I(z,y),  x  [0,1].
- I(0,x) = 1,  x  [0,1].
- I(x,1) = 1,  x  [0,1].
- I(1,0) = 0
1.1.2.5. Hệ thống suy luận mờ
Suy diễn mờ là quá trình suy ra những kết luận dưới dạng các mệnh đề
mờ trong điều kiện của quy tắc "Nếu... Thì...", với các dữ liệu đầu vào cho
trước là không được rõ ràng.
Thông thường, suy diễn mờ hay sử dụng luật Modus Ponnens hoặc
Modus Tollen.
Trong logic rõ, Modus Ponnen diễn đạt như sau:
Mệnh đề 1 (Luật hoặc tri thức): P → Q
Mệnh đề 2 (sự kiện): P đúng
Kết luận: Q đúng


10


Trong suy diễn mờ, luật được diễn đạt dưới dạng sau:
Luật mờ: Nếu x = A thì y = B
Sự kiện mờ: x = A'
Kết luận: y = B'
Trong đó A, A' là các tập mờ trên không gian nền U, B và B' là các tập
mờ trên không gian nền V.
Ví dụ:
Luật mờ: Nếu góc tay quay ga lớn thì xe đi nhanh.
Sự kiện mờ: Góc tay quay khá lớn.
Kết luận: Xe đi khá nhanh.
Trong logic rõ Modus Tollen có dạng:
Mệnh đề 1 (Luật hoặc tri thức): P → Q
Mệnh đề 2 (sự kiện): ¬Q đúng.
Kết luận: ¬P đúng.
Trong suy diễn mờ, luật được diễn đạt dưới dạng sau:
Luật mờ (hoặc tri thức mờ): P → Q
Sự kiện mờ: ¬ Q khá đúng.
Kết luận: ¬P khá đúng.
Ví dụ:
Luật mờ: Nếu góc tay quay ga lớn thì xe đi nhanh.
Sự kiện mờ: Xe không đi nhanh lắm. [1]
1.1.3. Khoảng cách giữa các tập mờ
Khoảng cách Hamming
n

d(A,B) =  j 1 | µA(xj)

µB(xj)|

Khoảng cách Ơclid

d(A,B) =

1 n
2
  A x j    B x j 
n j 1


11

1.2. Tập mờ trực cảm ( Intuitionistic Fuzzy Sets - IFSs)
Trong cách định nghĩa tập mờ thông thường, chỉ sử dụng một hàm
thuộc để mô tả cho độ thuộc của một đối tượng vào một tập. Để tăng tính hiệu
quả cho việc mô tả các đối tượng người ta đã sử dụng thêm một hàm không
thuộc để biểu thị cho độ không thuộc vào một tập của một đối tượng. Tập mới
này được gọi là tập mờ trực cảm.
1.2.1. Định nghĩa tập mờ trực cảm
Cho U là tập vũ trụ khởi tạo, U  u1 , u2 ,..., un  . Một tập mờ trực cảm
trên U được xác định bởi hàm thành viên tv ( u ) chỉ mức độ thành viên của u
trong V và hàm không là thành viên f v chỉ mức độ không là thành viên của u
trong V, tv : U  0, 1 , fv : U  0, 1 . Tập mờ trực cảm V là:
V  (u, tv (u ), f v (u )) | u U , tv (u )  [ 0, 1], f v (u )  [ 0, 1],0  tv (u )  f v (u )  1

Thực chất tv ( ui ) là biên thấp nhất của mức độ thuộc của ui , f v ( ui ) là
biên thấp trên mức độ không thuộc của ui và tv ( ui )  f v ( ui )  1 . Mức độ thành
viên của ui trong tập mờ trực cảm được bao bởi khoảng con

tv (ui ),1  fv (ui ) của 0, 1 . Giá trị mờ trực cảm tv (ui ),1  fv (ui )

chỉ ra mức


độ chính xác của thành viên  v ( ui ) của ui có thể không xác định, nhưng được
bao bởi tv (ui )  v ( ui )  1  f v ( ui ) với tv ( ui )  f v ( ui )  1 . [2]

Ví dụ: Hãy xem xét một tập vũ trụ
U = {DOG; CAT; RAT},
một tập mờ trực cảm A là:
A = {< DOG, (0.6, 0.3) >, < CAT, (0.7, 0.5) < RAT, (0.5, 0.2 >}
1.2.2. Một số phép toán trên tập mờ trực cảm hình thang
* Định nghĩa 2.1. Cho a j ( j  1,..., n ) là một tập mờ trực cảm hình
thang và IT  WAA : n   , nếu:


12

n

IT  WAA (a1 , a2 ,..., an )   j a j
j 1

với  là tập tất cả các tập mờ trực cảm hình thang và   (1 , 2 ,..., n ) T
n

là véc-tơ trọng số của a j ( j  1,..., n ) ,  j  [0, 1] ,



j

 1 . IT-WAA được gọi


j 1

là phép toán trung bình số học có trọng số trên tập mờ trực cảm hình thang.
T

1 1
1
Đặc biệt, nếu    , ,...,  , IT-WAA là phép toán trung bình số học
n
n n

trên tập mờ trực cảm hình thang.
* Định lý 2.1. Cho a j  ([ a j , b j , c j , d j ];a , a )( j  1,..., n) là một tập mờ
j

j

trực cảm hình thang, có:
n
n
n
 n

IT  WAA ( a1 , a 2 ,..., a n )      j a j ,   j b j ,   j c j ,   j d j  ;
 j 1
j 1
j 1
j 1



n
n

 
1   (1  a j ) j ,  ( a j ) j 
j 1
j 1


với   (1 , 2 ,..., n ) T



véc-tơ

trọng

số

của

n

a j ( j  1,..., n), j  [0, 1],  j  1 .
j 1

* Định lý 2.2. Cho a j ( j  1,..., n ) là tập mờ trực cảm hình thang, và
IT  WGA : n   , nếu:
n




IT  WGA ( a1 , a2 ,..., a n )   a j j
j 1

với  là tập tất cả các tập mờ trực cảm hình thang, và   (1 , 2 ,..., n ) T
n

là véc-tơ trọng số của a j ( j  1,..., n ) ,  j  [0, 1],  j  1 , thì IT-WGA được
j 1

gọi là phép toán trung bình hình học có trọng số.


13

T

1 1
1
Đặc biệt nếu    , ,...,  , IT-WGA là phép toán trung bình số học
n
n n

(IT-GA) trên tập mờ trực cảm hình thang.
* Định lý 2.2. Cho a j  ([ a j , b j , c j , d j ]; a , a )( j  1,..., n ) là tập mờ trực
j

j


cảm hình thang thì:
n
n
n
 n

IT  WGA ( a1 , a 2 ,..., a n )     j a j ,   j b j ,   j c j ,   j d j  ;
 j 1
j 1
j 1
j 1


n

n
j
 
(

)
,1

(1   a j ) j 


a j
j 1
j 1



với   (1 , 2 ,..., n ) T



véc-tơ

trọng

số

n

a j ( j  1,..., n), j  [0, 1],  j  1 . [1]
j 1

1.2.3.Các phép toán trên số mờ trực cảm hình thang, hình tam giác
Cộng:
[a,b] + [d,e] = [a+d, b+e]
Trừ:
[a,b] - [d,e] = [a-e, b-d]
Nhân:
[a,b] * [d,e] = [min(ad,ae, bd, be), max(ad,ae, bd, be)]
Chia:
[a,b] / [d,e] = [min(a/d,a/e, b/d, b/e), max(a/d,a/e, b/d, b/e)]
Số mờ hình thang
M(a,b,c,d)

của



14

0
z a

b  a

M  z   1
d  z

d  c
0

a

b c

za
a zb
bzc
czd
dz

d

Hình 1.4: Số mờ trực cảm hình thang
Số mờ tam giác
M(a,b,c)

0
z a


M  z    b  a
c  z
c  b
0


za
a zb
bzc
cz

1

0

a

b c

Hình 1.5: Số mờ trực cảm tam giác
Kết luận chương 1:
Như vậy qua chương 1 luận văn đã trình bày cơ sở lý thuyết tập mờ,
các phép toán trên tập mờ, khoảng cách giữa các tập mờ. Phần tiếp theo trình
bày khái niệm tập mờ trực cảm, số mờ trực cảm và các phép toán trên số mờ
trực cảm.



15

Như đã trình bày ở trên, tập mờ đóng vai trò quan trọng trong việc phân
cụm đối với các tập dữ liệu ràng buộc. Trong cách biểu diễn tập mờ chỉ sử
dụng đến một hàm thuộc để biểu thị tính thuộc (thành viên) của đối tượng vào
một tập, ngoài cách biểu diễn trên thì có một cách định nghĩa khác được đưa
ra nhằm tăng tính mô tả cho các đối tượng đó là tập mờ trực cảm, bằng cách
sử dụng thêm một hàm không thuộc để biểu thị tính không thuộc (không phải
thành viên) của đối tượng trong một tập. Trong chương tiếp theo luận văn sẽ
trình bày đến độ tương tự giữa các tập mờ trực cảm.


16

CHƯƠNG II. ĐỘ TƯƠNG TỰ GIỮA CÁC TẬP MỜ TRỰC CẢM
2.1. Khoảng cách giữa các tập mờ trực cảm
2.1.1 Khoảng cách S C ( A, B )
Khoảng cách SC ( A, B ) giữa A  IFSs( X ) và B  IFSs( X ) với IFSs( X ) là
tập mờ trực cảm X, được Chen đề xuất năm 1995 và được định nghĩa như sau:
Cho x  t x ,1  f x  là một giá trị trực cảm, với t x   0,1 , f x   0,1 , và
t x  f x  1 . Điểm số của x có thể được đánh giá bằng hàm điểm số S được xác

định như sau:
(7)

S ( x)  t x  f x

với


S ( x )   1,1 .

Cho

f x*  1  f x ,

chúng ta có thể thấy rằng

x  t x ,1  f x   t x , f x*  . Trong trường hợp này, chúng ta có thể thấy
S ( x )  t x  f x  t x  f x*  1

(8)

Cho X và Y là 2 giá trị trực cảm,

X  t X ,1  f X   t X , f X*  và

Y   tY ,1  fY   tY , fY*  . Mức độ tương tự giữa các giá trị trực cảm X và Y có thể

được đánh giá bởi hàm M.
M ( X ,Y )  1

S ( X )  S (Y )
2

(9)

với S ( X )  t X  f X  t X  f X*  1 và S (Y )  tY  fY  tY  fY*  1 . Xem xét các
trường hợp dưới đây:
Trường hợp 1: Nếu các giá trị trực cảm X  1,1 và Y   0, 0 , ta có thể

thấy S ( X )  1 và S (Y )  1 . Áp dụng công thức (9), mức độ tương tự giữa các
giá trị trực cảm X và Y có thể được đánh giá và có kết quả là:


17

1

1  (1)
0
2

(10)

Trường hợp 2: Nếu các giá trị trực cảm X  1,1 và Y  1, 0  , ta có thể
thấy S ( X )  1 và S (Y )  0 . Áp dụng công thức (9), mức độ tương tự giữa các
giá trị trực cảm X và Y có thể được đánh giá và có kết quả là:
1

1 0 1

2
2

(11)

Trường hợp 3: Nếu các giá trị trực cảm X  1, 0  và Y  1,1 , ta có thể
thấy S ( X )  0 và S (Y )  1 . Áp dụng công thức (9), mức độ tương tự giữa các
giá trị trực cảm X và Y có thể được đánh giá và có kết quả là:
1


0 1 1

2
2

(12)

Trường hợp 4: Nếu các giá trị trực cảm X   0,1 và Y   0,1 , ta có thể
thấy S ( X )  1 và S (Y )  1 . Áp dụng công thức (9), mức độ tương tự giữa các
giá trị trực cảm X và Y có thể được đánh giá và có kết quả là:
1

1  1
0
2

(13)

Rõ ràng là nếu X và Y các giá trị trực cảm giống hệt nhau (nghĩa là X=Y),
thì S ( X )  S (Y ) . Áp dụng công thức (9) ta có thể thấy rằng M ( X , Y )  1 , nghĩa
là mức độ tương tự giữa tập mờ trực cảm X và Y là 1.
Cho A và B là 2 tập mờ trực cảm trong tập vũ trụ U, U  u1 , u2 ,..., un  , với
A  t A (u1 ),1  f A (u1 ) / u1  t A (u2 ),1  f A (u2 ) / u2     t A (un ),1  f A (un ) / un
 t A (u1 ), f A* (u1 ) / u1  t A (u2 ), f A* (u2 ) / u2    t A (un ), f A* (un ) / un
n

  t A (ui ), f A* (ui )  / ui
i 1


(14)


18

B  tB (u1 ),1  f B (u1 ) / u1  tB (u2 ),1  f B (u2 ) / u2    tB (un ),1  f B (un ) / un
 tB (u1 ), f B* (u1 ) / u1  tB (u2 ), f B* (u2 ) / u2    tB (un ), f B* (un ) / un
n

  tB (ui ), f B* (ui )  / ui

(15)

i 1

với f A* (ui )  1  f A (ui ), f B* (ui )  1  f B (ui )



1 i  n .

Cho

VA (ui )  t A (ui ), f A* (ui )  là giá trị thành viên trực cảm của ui trong tập trực cảm

A, và cho VB (ui )  tB (ui ), f B* (ui )  là giá trị thành viên trực cảm của ui trong tập
trực cảm B. Áp dụng công thức (8), ta có thể thấy
S (V A (ui ))  t A (ui )  f A* (ui )  1

(16)


S (VB (ui ))  t B (ui )  f B* (ui )  1

(17)

với 1  i  n . Mức độ giống nhau giữa các tập trực cảm A và B có thể
đánh giá bởi hàm T,
T ( A, B) 

1 n
 M (VA (ui ),VB (ui ))
n i 1


S (VA (ui ))  S (VB (ui )) 
1 n 

1 

n i 1 
2


(18)

với T ( A, B)  0,1 . Giá trị của T ( A, B ) càng lớn thì độ giống nhau giữa tập
trực cảm A và tập trực cảm B càng nhiều. [13]
Ví dụ 3.1. Cho A và B là 2 tập trực cảm của tập vũ trụ U.
U  u1 , u2 , u3 , u4 , u5 
A   0.2, 0.4 / u1   0.3, 0.5 / u2   0.5, 0.7  / u3   0.7, 0.9 / u4   0.8,1 / u5

B   0.3, 0.5 / u1   0.4, 0.6  / u2   0.6, 0.8 / u3   0.7, 0.9  / u4   0.9,1 / u5

với


19

VA (u1 )   0.2,0.4 , VB (u1 )   0.3, 0.5
VA (u2 )   0.3,0.5 , VB (u2 )   0.4,0.6
VA (u3 )   0.5,0.7 , VB (u3 )   0.6, 0.8
VA (u4 )   0.7, 0.9 , VB (u4 )   0.7,0.9
VA (u5 )   0.8,1 ,

VB (u5 )   0.9,1

Áp dụng công thức (8) ta thu được
S (VA (u1 ))  0.2  0.4  1  0.4
S (VA (u2 ))  0.3  0.5  1  0.2
S (VA (u3 ))  0.5  0.7  1  0.2
S (VA (u4 ))  0.7  0.9  1  0.6
S (VA (u5 ))  0.8  1.0  1  0.8
S (VB (u1 ))  0.3  0.5  1  0.2
S (VB (u2 ))  0.4  0.6  1  0
S (VB (u3 ))  0.6  0.8  1  0.4
S (VB (u4 ))  0.7  0.9  1  0.6
S (VB (u5 ))  0.9  1.0  1  0.9

Áp dụng công thức (18), độ giống nhau giữa tập trực cảm A và B có thể
được tính bằng hàm T,
T ( A, B) 


S (VA (ui ))  S (VB (ui ))
1 n 

1 
5 i 1 
2


  0.93


(19)

Nó chỉ ra rằng độ giống nhau giữa tập mờ trực cảm A và tập mờ trực
cảm B là 0.93.
2.1.2. Khoảng cách giữa S H và S L
* khoảng cách SH
Năm 1999, Hong và Kim, năm 2001, Fan và Zhangyan đã giới thiệu một
độ đo mới là S H và SL nhằm khắc phục những vấn đề của độ đo SC . Độ đo
S H được xác định như sau:


20

n

 t
s H ( A, B ) 


A

( x i )  t B ( x i  f A ( x i )  f B ( xi ) 

(2)

i 1

2n

S H tập trung vào sự khác nhau giữa t A và tB cũng như sự khác nhau giữa

fA



f B . Giả sử A, B, C, D là các tập mờ. Cho

tA ( xi )  tB ( xi )  tC ( xi )  tD ( xi )

S H , nếu

f A ( xi )  f B ( xi )  fC ( xi )  f D ( xi )



thì

S H ( A, B )  S H (C , D ) . Bởi vì các dấu giá trị tuyệt đối nên khi tính toán


tA ( xi )  tB ( xi ) ,

tC ( xi )  tD ( xi ) ,

f A ( xi )  f B ( xi )

hoặc

fC ( xi )  f D ( xi ) , S H

không phân biệt được sự khác nhau dương hay âm, do đó vẫn có trường hợp
loại I như sau: Giả sử A  ( x,0.3,0.3 , B  ( x,0.4,0.4) , C  ( x,0.3,0.4 và

D  ( x,0.4,0.3) , theo công thức (2) ta có S H ( A, B )  S H (C , D )  0.9 vì vậy
không phải là trực cảm nhất quán.
Ngoài

ra,

tA ( xi )  tB ( xi )  f A ( xi )  f B ( xi )

khi

= tC ( xi )  tD ( xi )  fC ( xi )  f D ( xi ) , S H ( A, B )  S H (C , D ) một trường hợp trực
cảm khác (Loại II) xuất hiện khi

A  ( x,1,0) ,

B  ( x,0,0) và


C  ( x,0.5,0.5) , S H ( A, B )  S H (C , B )  0.5 .
* khoảng cách SL
Khoảng cách SL được xác định:
n

n

 S A ( xi )  S B ( xi )
S A ( A, B) 

i 1

4n

t


A

( xi )  t B ( xi )  f A ( xi )  f B ( xi )

i 1

4n

Khoảng cách SL thừa hưởng những điểm mạnh của SC và SH, khắc phục
những khuyết điểm của 2 độ đo trước liên quan đến cả mức độ hỗ trợ và sự
khác nhau giữa tA và tB cũng như fA và fB. SL so với SH thể hiện ở việc ưu tiên
trường hợp t A  t B ,1  f A  1  f B trong điều kiện sự giống nhau giữa các mức
độ thành viên cũng như sự giống nhau giữa các mức độ không là thành viên,



×