Tải bản đầy đủ (.doc) (53 trang)

Hệ tư vấn mờ trực cảm và ứng dụng trong chẩn đoán bệnh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (476.59 KB, 53 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

NGUYỄN THỌ THÔNG

HỆ TƯ VẤN MỜ TRỰC CẢM
VÀ ỨNG DỤNG TRONG CHẨN ĐOÁN BỆNH

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

NGUYỄN THỌ THÔNG

HỆ TƯ VẤN MỜ TRỰC CẢM
VÀ ỨNG DỤNG TRONG CHẨN ĐOÁN BỆNH

Ngành: Công nghệ thông tin
Chuyên ngành: Hệ thống thông tin
Mã số: 60480104

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

NGƯỜI HƯỚNG DẪN KHOA HỌC: TS. LÊ HOÀNG SƠN
PGS.TS. NGUYỄN ĐÌNH HÓA


Lời cảm ơn
Trước tiên, em xin trân trọng gửi lời cảm ơn sâu sắc đến thầy giáo TS. Lê


Hoàng Sơn – ĐH Khoa học Tự nhiên và thầy giáo PGS.TS. Nguyễn Đình Hóa – Viện
CNTT – ĐH Công nghệ đã trực tiếp hướng dẫn và tận tình giúp đỡ em trong suốt thời
gian thực hiện luận văn.
Em xin trân trọng cảm ơn các Thầy, Cô giáo trong khoa Công nghệ thông tin –
Trường ĐH Công nghệ – ĐH Quốc gia Hà Nội đã tận tình chỉ dạy, cung cấp cho em
những kiến thức quý báu và luôn nhiệt tình giúp đỡ, tạo điều kiện thuận lợi nhất trong
suốt quá trình em học tập tại trường.
Đồng thời em xin chân thành cảm ơn những người thân trong gia đình cùng
toàn thể bạn bè đã luôn giúp đỡ, động viên em những lúc gặp phải khó khăn trong học
tập, công việc và cuộc sống.

Luận văn này được thực hiện dưới sự tài trợ của đề tài NAFOSTED, mã
số: 102.05-2014.01.

3


Lời cam đoan
Những kiến thức trình bày trong luận văn là do tôi tìm hiểu, nghiên cứu và trình
bày lại theo cách hiểu. Trong quá trình làm luận văn, tôi có tham khảo các tài liệu có
liên quan và đã ghi rõ nguồn tài liệu tham khảo. Tôi xin cam đoan đây là công trình
nghiên cứu của tôi và không sao chép của bất kỳ ai.
Hà Nội, ngày … tháng … năm 2016
Học viên

Nguyễn Thọ Thông

4



Mục lục
Lời cảm ơn..................................................................................................................... 3
Lời cam đoan................................................................................................................. 4
Mục lục.......................................................................................................................... 5
Danh mục các ký hiệu và chữ viết tắt............................................................................6
Danh mục các bảng........................................................................................................7
Danh mục các hình vẽ, đồ thị.........................................................................................8
MỞ ĐẦU....................................................................................................................... 9
CHƯƠNG 1. TỔNG QUAN VỀ TẬP MỜ TRỰC CẢM, HỆ TƯ VẤN VÀ BÀI
TOÁN CHẨN ĐOÁN BỆNH......................................................................................10
I.Bài toán chẩn đoán bệnh........................................................................................10
II.Tổng quan về tập mờ trực cảm.............................................................................11
III.Hệ tư vấn.............................................................................................................21
IV.Kết luận...............................................................................................................25
CHƯƠNG 2. HỆ TƯ VẤN MỜ TRỰC CẢM.............................................................26
I.Giới thiệu...............................................................................................................26
II.Hệ tư vấn mờ trực cảm.........................................................................................26
CHƯƠNG 3. KẾT QUẢ THỰC NGHIỆM VÀ SO SÁNH........................................37
I.Giới thiệu...............................................................................................................37
II.Kết quả thực nghiệm và so sánh...........................................................................39
KẾT LUẬN.................................................................................................................48
Nội dung luận văn trình bày một số kết quả nghiên cứu đạt được sau đây..................48
Các kiến thức cơ bản về bài toán chẩn đoán bệnh, tập mờ trực cảm và hệ tư vấn........48
Trình bày nghiên cứu nhóm đã đề xuất. Đó là hệ tư vấn mờ trực cảm cho bài toán chẩn
đoán bệnh bao gồm các định nghĩa về hệ tư vấn mờ trực cảm, một số phép toán, tính
chất và thuật toán lọc mờ trực cảm..............................................................................48
Cài đặt thực nghiệm các thuật toán đã có và thuật toán đã được đề xuất, đánh giá về
chất lượng và thời gian chạy của các thuật toán...........................................................48
TÀI LIỆU THAM KHẢO...........................................................................................49


5


Danh mục các ký hiệu và chữ viết tắt
Từ viết tắt
Từ đầy đủ
CF
collaborative filtering
FS
Fuzzy Sets
IFS
Intuitionistic Fuzzy Set
IFV
Intuitionistic Fuzzy Value
RS
Recommender System
Intuitionistic Fuzzy Recommender
IFRS
System
Single-criterion Intuitionistic Fuzzy
SC-IFRS
Recommender System
Multi-criteria Intuitionistic Fuzzy
MC-IFRS
Recommender System
IFM
Intuitionistic fuzzy matrix
IFCM
Intuitionistic fuzzy composition matrix
IFSM

Intuitionistic fuzzy similarity matrix
IFSD
Intuitionistic fuzzy similarity degree
Intuitionistic fuzzy collaborative
IFCF
filtering

Ý nghĩa
Phương pháp lọc cộng tác
Tập mờ
Tập mờ trực cảm
Giá trị mờ trực cảm
Hệ tư vấn
Hệ tư vấn mờ trực cảm
Hệ tư vấn mờ trực cảm đơn tiêu chí
Hệ tư vấn mờ trực cảm đa tiêu chí
Ma trận mờ trực cảm
Ma trận hợp thành mờ trực cảm
Ma trận tương đồng mờ trực cảm
Độ đo tương đồng mờ trực cảm
Phương pháp lọc cộng tác mờ trực
cảm

6


Danh mục các bảng
Bảng 1. Quan hệ giữa bệnh nhân và triệu chứng ()......................................................11
Bảng 2. Quan hệ giữa triệu chứng và bệnh ()...............................................................11
Bảng 3. Quan hệ giữa bệnh nhân và bệnh ()................................................................11

Bảng 4. Bệnh của bệnh nhân........................................................................................11
Bảng 5. Quan hệ giữa bệnh nhân và bệnh () trong phương pháp của De, Biswas và Roy
..................................................................................................................................... 17
Bảng 6. Ma trận...........................................................................................................17
Bảng 7. Ma trận...........................................................................................................18
Bảng 8. Ma trận giảm thiểu..........................................................................................18
Bảng 9. Quan hệ giữa bệnh nhân và bệnh khi sử dụng hàm Hamming........................19
Bảng 10. Quan hệ giữa bệnh nhân và bệnh khi sử dụng hàm Euclidean......................20
Bảng 11. Tập dữ liệu huấn luyện với các giá trị * cần được dự báo.............................24
Bảng 12. Tập dữ liệu huấn luyện thô với các giá trị * cần được dự báo......................24
Bảng 13. Tập dữ liệu đầy đủ được xác định bởi phương pháp của Hassan và Syed, các
giá trị in đậm thể hiện bệnh của bệnh nhân..................................................................24
Bảng 14. Tập dữ liệu đầy đủ được xác định bởi phương pháp của Davis và cộng sự [9],
các giá trị in đậm thể hiện bệnh có thể mắc phải nhất..................................................24
Bảng 15. MC-IFRS cho chẩn đoán bệnh với các giá trị * cần được dự báo.................30
Bảng 16. Miêu tả về tập dữ liệu thực nghiệm..............................................................37
Bảng 17. Tập dữ liệu huấn luyện với các giá trị * cần được dự báo.............................39
Bảng 18. Tập dữ liệu SC-IFRS được trích xuất với các giá trị * cần được dự báo.......39
Bảng 19. Bệnh được khuyến nghị, bệnh với khả năng mắc cao nhất được in đậm......40
Bảng 20. Kết quả MAE của thực nghiệm ngẫu nhiên trên bộ dữ liệu HEART............41
Bảng 21. Kết quả thời gian chạy của thực nghiệm ngẫu nhiên trên bộ dữ liệu HEART
..................................................................................................................................... 42
Bảng 22. Kết quả MAE của thực nghiệm k-fold trên bộ dữ liệu HEART....................42
Bảng 23. Kết quả của thực nghiệm k-fold trên bộ dữ liệu HEART..............................42
Bảng 24. Kết quả MAE của thực nghiệm ngẫu nhiên trên bộ dữ liệu RHC.................44
Bảng 25. Kết quả thời gian chạy của thực nghiệm ngẫu nhiên trên bộ dữ liệu RHC...44
Bảng 26. Kết quả MAE của thực nghiệm k-fold trên bộ dữ liệu RHC.........................45
Bảng 27. Kết quả thời gian chạy của thực nghiệm k-fold trên bộ dữ liệu RHC...........45

7



Danh mục các hình vẽ, đồ thị
Hình 1. Tập rõ và biểu diễn tập rõ...............................................................................12
Hình 2. Ví dụ tập mờ...................................................................................................13
Hình 3. Thuật toán IFCF..............................................................................................36
Hình 4. Phân bố 2 chiều của HEART..........................................................................38
Hình 5. Phân bố 2 chiều của RHC...............................................................................38
Hình 6. Kết quả MAE của thực nghiệm ngẫu nhiên trên bộ dữ liệu HEART..............43
Hình 7. Kết quả MAE của thực nghiệm k-fold trên bộ dữ liệu HEART......................43
Hình 8. Kết quả MAE của thực nghiệm ngẫu nhiên trên bộ dữ liệu RHC...................45
Hình 9. Kết quả MAE của thực nghiệm k-fold trên bộ dữ liệu RHC...........................46

8


MỞ ĐẦU
Ngày này, công nghệ thông tin được ứng dụng rất nhiều lĩnh vực trong thực tế
như y tế, giáo dục, nông nghiệp, lâm nghiệm, v.v. Trong đó, ứng dụng công nghệ thông
tin trong y tế được coi là nhiệm vụ trọng điểm trong những năm gần đây nhằm giảm
bớt tình trạng quá tải trong các bệnh viện. Một trong những ứng dụng điển hình của
công nghệ thông tin trong y tế như tư vấn khám, chữa bệnh từ xa và dịch vụ cổng trực
tuyến, v.v.
Mục tiêu của luận văn là tìm hiểu lý thuyết về tập mờ trực cảm và áp dụng nó
trong hệ tư vấn trong bài toán chẩn đoán bệnh. Các thuật toán liên quan sẽ được cài đặt
kiểm chứng đánh giá trên các bộ dữ liệu chuẩn.
Luận văn gồm các các phần sau:
Chương 1. Trình bày các khái niệm chung về bài toán chẩn đoán bệnh, tập trờ trực
cảm và hệ tư vấn.
Chương 2. Hệ tư vấn mờ trực cảm cho bài toán chẩn đoán bệnh.

Chương 3. Kết quả thực nghiệm và so sánh.

9


CHƯƠNG 1. TỔNG QUAN VỀ TẬP MỜ TRỰC CẢM, HỆ TƯ
VẤN VÀ BÀI TOÁN CHẨN ĐOÁN BỆNH
I.

Bài toán chẩn đoán bệnh

1.

Giới thiệu
Bài toán chẩn đoán bệnh là bài toán rất phổ biến trong y học. Nó là một khâu

rất quan trọng trong quy trình điều trị của bệnh nhân. Bernegger và cộng sự [5] cho
rằng chẩn đoán là khâu trung tâm trong y học lâm sàng và việc chẩn đoán chính xác là
một yêu cầu quan trọng trong các quyết định điều trị đúng. Chẩn đoán bệnh là dự báo
khả năng mắc bệnh cho bệnh nhân dựa vào những thông tin triệu chứng mà bệnh nhân
gặp phải. Với mức độ quan trọng của chẩn đoán trong điều trị bệnh nhân nên vấn đề
nâng cao chất lượng chẩn đoán là vấn đề đang được quan tâm hàng đầu.

2.

Bài toán chẩn đoán bệnh

Định nghĩa 1 [46]: Cho P = { P1 ,.., Pn } là tập bệnh nhân, S = { S1 ,.., S m } là tập triệu
chứng, D = { D1 ,.., Dk } là tập bệnh. Mối quan hệ giữa bệnh nhân và triệu chứng được
PS

PS
thể hiện bởi tập RPS = { R ( Pi , S j ) | ∀i = 1, n; ∀j = 1, m} . Ở đây R ( Pi , S j ) thể hiện cấp độ

bệnh nhân Pi có triệu chứng S j và được biểu diễn bằng giá trị số hay giá trị mờ, mờ
trực cảm. Tương tự, quan hệ giữa triệu chứng và bệnh nhân được thể hiện bởi tập

{

}

RSD = R SD ( S i , D j ) | ∀i = 1, m; ∀j = 1, k . Ở đây R SD ( S i , D j ) phản ánh khả năng triệu chứng
Si sẽ dẫn đến bệnh D j . Bài toán chẩn đoán bệnh nhằm xác định mối quan hệ giữa
PD
bệnh nhân và bệnh được thể hiện bởi tập RPD = { R ( Pi , D j ) | ∀i = 1, n; ∀j = 1, k } . Ở đây

R PD ( Pi , D j ) nhận giá trị 0 hoặc 1 tương ứng với bệnh nhân Pi có bị bệnh D j hay

không. Bài toán chẩn đoán bệnh có thể thể hiện ngắn gọn bởi ánh xạ: { RPS , RSD } → RPD

3.

Ví dụ bài toán chẩn đoán bệnh
Ví dụ 1: Xem xét tập dữ liệu của Samuel và Balamurugan [35] bao gồm bốn

bệnh nhân P = {Ram, Mari, Sugu, Somu}, năm triệu chứng S = {Temperature,
Headache, Stomach-pain, Cough, Chest-pain} và năm bệnh D = {Viral-Fever, Malaria,
Typhoid, Stomach, Heart}. Quan hệ giữa bệnh nhân – triệu chứng và triệu chứng –
bệnh được cho trong Bảng 1 và 2.
10



P
Ram
Mari
Sugu
Somu

Temperature
(0.8, 0.1)
(0, 0.8)
(0.8, 0.1)
(0.6, 0.1)

Cough
(0.6, 0.1)
(0.1, 0.7)
(0.2, 0.7)
(0.7, 0.2)
Bảng 1. Quan hệ giữa bệnh nhân và triệu chứng ( RPS )

S
Temperature
Headache
Stomach_pain
Cough
Chest_pain

Headache
(0.6, 0.1)
(0.4, 0.4)

(0.8, 0.1)
(0.5, 0.4)

Viral-Fever
(0.4, 0)
(0.3, 0.5)
(0.1, 0.7)
(0.4, 0.3)
(0.1, 0.7)

Malaria
(0.7, 0)
(0.2, 0.6)
(0, 0.9)
(0.7, 0)
(0.1, 0.8)

Stomach_pain
(0.2, 0.8)
(0.6, 0.1)
(0, 0.6)
(0.3, 0.4)

Chest_pain
(0.1, 0.6)
(0.1, 0.8)
(0, 0.5)
(0.3, 0.4)

Typhoid

(0.3, 0.3)
(0.6, 0.1)
(0.2, 0.7)
(0.2, 0.6)
(0.1, 0.9)

Heart
(0.1, 0.8)
(0, 0.8)
(0.2, 0.8)
(0.2, 0.8)
(0.8, 0.1)

Stomach
(0.1, 0.7)
(0.2, 0.4)
(0.8, 0)
(0.2, 0.7)
(0.2, 0.7)
Bảng 2. Quan hệ giữa triệu chứng và bệnh ( RSD )

Quan hệ giữa bệnh nhân và bệnh được cho bởi các giá trị mờ trực cảm (IFV)
được thể hiện trong Bảng 3
P
Ram
Mari
Sugu
Somu

Viral_Fever

(0.4, 0.1)
(0.3, 0.5)
(0.4, 0.1)
(0.4, 0.1)

Malaria
(0.7, 0.1)
(0.2, 0.6)
(0.7, 0.1)
(0.7, 0.1)

Typhoid
(0.6, 0.1)
(0.4, 0.4)
(0.6, 0.1)
(0.5, 0.3)

Stomach
(0.2, 0.4)
(0.6, 0.1)
(0.2, 0.4)
(0.3, 0.4)
Bảng 3. Quan hệ giữa bệnh nhân và bệnh ( RPD )

Heart
(0.2, 0.6)
(0.1, 0.7)
(0.2, 0.5)
(0.3, 0.4)


Bệnh mà bệnh nhân có khả năng mắc phải nhất được cho trong Bảng 4. Nó
được xác định từ Bảng 3 bằng việc sử dụng một phương pháp giải mờ đơn giản, đó là
cực đại độ thuộc của các bệnh.
P
Ram
Mari
Sugu
Somu

Viral_Fever
0
0
0
0

Malaria
1
0
1
1

Typhoid
0
0
0
0

II.

Bảng 4. Bệnh của bệnh nhân

Tổng quan về tập mờ trực cảm

1.

Tập rõ

Stomach
0
1
0
0

Heart
0
0
0
0

Định nghĩa 2 [6]: Cho tập nền X và x là phần tử của tập X . Một tập C trên tập X
là một tập hợp rõ, với x là phần tử của tập hợp C , chỉ có thể có x ∈ C hoặc x ∉ C . Có
thể sử dụng hàm µ ( x ) để mô tả khái niệm thuộc về. Hàm µ ( x ) được gọi là hàm thuộc
hay hàm đặc trưng của tập hợp C .
11


1
µ ( x) = 
0

Ví dụ 2: X = { X 1 , X 2 , X 3 , X 4 }


if x ∈ C
if x ∉ C

(1)

µ( x1 ) = 1; µ( x2 ) = 1; µ( x3 ) = 1; µ( x4 ) = 0

Biểu diễn tập rõ theo đồ thị
Hình 1. Tập rõ và biểu diễn tập rõ

2.

Tập mờ
Lý thuyết mờ được biết đến lần đầu tiên trong nghiên cứu về tập mờ của Lotfi

A. Zadeh, Dieter Klaua (1965) và nhanh chóng được ứng dụng rộng rãi trong hầu hết
các lĩnh vực khoa học kỹ thuật như kinh tế, nông nghiệp, dịch vụ, y tế, v.v.
Trong thực tế khi định nghĩa một tập các số lớn hơn 100 và ký hiệu là A , ta
định nghĩa như sau
A = { x | x > 100}

Khi đó rất dễ xác định được các phần tử chắc chắn thuộc và không thuộc khái
niệm A . Tuy nhiên, nếu đưa ra khái niệm về tập nhà giàu (với những người có thu
nhập hơn hay bằng 10 triệu một tháng) và ký hiệu là B
B = { tn | tn ≥ 10000000}

Khi đó ta bảo một người có thu nhập là 10 triệu/tháng là thuộc nhà giàu, tuy
nhiên bằng trực giác bình thường nó sẽ không hợp lý nếu gọi người có thu nhập
9999999/tháng không phải là nhà giàu.

Vì vậy, khái niệm tập mờ xuất hiện để giải quyết các tập không có ranh giới rõ
ràng hay những dữ liệu không chắc chắn.
2.1.

Định nghĩa tập mờ

Xét tập X khác rỗng. Ta sẽ gọi X là không gian nền.
Định nghĩa 3 [54]: A là tập mờ trên không gian nền X nếu A được xác định bởi
hàm
µ A : X → [ 0,1]
(2)
µ A là hàm thuộc (membership function) còn µ A ( x ) là độ thuộc của x vào tập mờ A

Ví dụ 3:
12


Ví dụ 4: A1 = một vài quả cam

Hình 2. Ví dụ tập mờ

Ví dụ 5: A2 = “số thực gần 10” có hàm thuộc µ A ( x ) =

1
2
1 + ( x − 10 )

Ta sẽ ký hiệu F ( x ) = { A tập mờ trên X }
2.2.


Các phép toán đại số trên tập mờ
Các phép toán trên tập mờ được định nghĩa thông qua các hàm thuộc của chúng

và được xây dựng tương tự như các phép toán trong tập mờ kinh điển.
a) Phép hợp
Cho A, B là hai tập mờ trên khôn gian nền X , có hàm thuộc µ A , µ B khi đó phép
hợp A ∪ B là tập mờ trên X với hàm thuộc cho bởi
µ A∪ B ( x ) = max{ µ A ( x ) , µ B ( x )} , x ∈ X

(3)

b) Phép giao
Cho A, B là hai tập mờ trên khôn gian nền X , có hàm thuộc µ A , µ B khi đó phép
hợp A ∩ B là tập mờ trên X với hàm thuộc cho bởi
µ A∩B ( x ) = min{ µ A ( x ) , µ B ( x )} , x ∈ X
c) Phép lấy phần bù

(4)

Cho A là một tập mờ trên khôn gian nền X , có hàm thuộc µ A , µ B khi đó phần
bù AC là tập mờ trên X với hàm thuộc cho bởi
µ AC ( x ) = 1 − µ A ( x ) , x ∈ X

(5)

d) Phép chứa và phép bằng nhau
Cho A, B ∈ F ( x ) . Ta nói
A ⊆ B nếu µ A ( x ) ≤ µ B ( x ) với mọi x ∈ X

(6)


A ⊇ B nếu µ A ( x ) ≥ µ B ( x ) với mọi x ∈ X

Do đó
A = B nếu µ A ( x ) = µ B ( x ) với mọi x ∈ X

(7)
13


2.3.

Một số tính chất
Cho A, B, C ∈ F ( x ) .

a) Giao hoán
A∪ B = B ∪ A; A∩ B = B ∩ A

(8)

A ∪ ( B ∪ C ) = ( A ∪ B) ∪ C ; A ∩ ( B ∩ C ) = ( A ∩ B) ∩ C

(9)

b) Kết hợp
c) Lũy đẳng
A ∪ A = A; A ∩ A = A

(10)


A ∪ ( B ∩ C ) = ( A ∪ B) ∩ ( A ∪ C ) ; A ∩ ( B ∪ C ) = ( A ∩ B) ∪ ( A ∩ C )

(11)

d) Phân phối
e) Đồng nhất
A ∪ Ø = A và A ∩ X = A

(12)

A ∪ ( A ∩ B ) = A và A ∩ ( A ∪ B ) = A

(13)

f) Hấp thu
g) Luật De Morgan

( A ∪ B) C

= AC ∩ B C và ( A ∩ B ) = AC ∪ B C
C

(14)

h) Cuộn

(A )

C C


i) Dạng tương đương

(A
3.

C

) (

(15)

=A

) (

)

∪ B ∩ A ∪ B C = AC ∩ B C ∪ ( A ∩ B )

(16)

Tập mờ trực cảm
Lý thuyết tập mờ thông thường (tập mờ loại một) gặp phải vấn đề đó là để phát

triển một hệ logic mờ phải xây dựng hàm thuộc cho các tập mờ sử dụng trong hệ, hay
phải mô tả sự không chắc chắn bằng các hàm thuộc rõ ràng và chính xác, với độ thuộc
là một số thực trên đoạn [0, 1].
Năm 1975, Zadeh đã giới thiệu khái niệm tập mờ loại hai [29] nhằm giải quyết
vấn đề gặp phải của tập mờ thông thường. Với tập mờ loại hai thì độ thuộc là một tập
mờ loại một trên đoạn [0, 1], nó cho phép biểu diễn độ thuộc bằng các giá trị mờ, các

giá trị ngôn ngữ chứ không phải các giá trị số chính xác.
Atanassov đưa ra khái niệm tập mờ trực cảm IFS [4]. Gau và Buehrer (1993)
đưa ra khái niệm tập mơ hồ VS và đã được chứng minh rằng VS có ý nghĩa tương tự
IFS.

14


Ngoài ra, Pawlak (1982) đề xuất khái niệm tập thô RS, sau đó bằng cách phối
hợp tập mờ và tập thô, Nanra và Majumdar (1992) đã đưa ra khái niệm tập thô mờ
FRS, còn Banerjee và Pal (1996) đưa ra khái niệm tập mờ thô RFS.
3.1.

Định nghĩa tập mờ trực cảm

Định nghĩa 4 [4]: Một tập mờ trực cảm trên tập nền X , ký hiệu là A , được định nghĩa
bởi hàm thuộc µ A ( x ) ∈ [ 0,1] là mức độ khẳng định độ thuộc của x trong A (degree of
membership/validity) và độ không thuộc v A ( x ) ∈ [ 0,1] là mức độ phủ định độ thuộc của
x trong A (degree of non-membership/non-validity) thỏa mãn điều kiện với
∀x ∈ X ,0 ≤ µ A ( x) + v A ( x, y ) ≤ 1 .
A = { (x, µ A ( x ) , v A ( x ) ) | x ∈ X}

(17)
Với x ∈ X , π ( x) = 1 - µ (x) - v (x) được gọi là độ không chắc chắn của x trong
A
A
A
A (degree of indeterminacy/uncertainty), là thành phần đại diện cho lượng thông tin bị

thiếu trong việc xác định khả năng x thuộc vào A .

Trường hợp với ∀x ∈ X , π A ( x) = 0 thì v A (x) = 1 - µ A (x) , khi đó tập mờ trực cảm
IFS có dạng

{ ( x, µ A ( x ) , 1 - µ A ( x ) ) | ∀x ∈ X} , và thường được biểu diễn ở dạng

{ ( x, µ A ( x ) ) | ∀x ∈ X} . Vậy với ∀x ∈ X , π A ( x ) = 0 thì IFS trở thành tập mờ FS.
Định nghĩa 5: Cho hai tập không rỗng X , Y . Một quan hệ mờ trực cảm, ký hiệu là R ,
là một tập mờ trực cảm trên X × Y , được định nghĩa như sau:
R = { ( ( x, y ), µ R ( x, y ), vR ( x, y ) ) | x ∈ X , y ∈ Y }

(18)

Với µ R ( x, y) ∈ [0,1] , vR ( x, y ) ∈ [0,1] thỏa mãn điều kiện:
∀( x, y ) ∈ ( X × Y ),0 ≤ µ R ( x, y ) + vR ( x, y ) ≤ 1

3.2.

Một số phép toán đại số trên tâp mờ trực cảm

a) Phép hợp
Cho A, B là hai tập mờ trực cảm trên khôn gian nền X , khi đó phép hợp A ∪ B
là tập mờ trực cảm trên X cho bởi
A ∪ B = { x, max( µ A ( x ) , µ B ( x ) ) , min ( v A ( x ) , vB ( x ) ) | x ∈ X }

(19)

b) Phép Giao
Cho A, B là hai tập mờ trực cảm trên khôn gian nền X , khi đó phép giao A ∩ B
là tập mờ trực cảm trên X cho bởi
A ∩ B = { x, min ( µ A ( x ) , µ B ( x ) ) , max( v A ( x ) , vB ( x ) ) | x ∈ X }


(20)
15


c) Phần bù
Phần bù của A , ký hiệu AC , được xác định như sau:
A C = { ( x, v A ( x ) , 1 - µ A ( x ) ) | x ∈ X}

(21)

d) Phép chứa và phép bằng
Cho A, B là hai IFS. Khi đó
A ⊆ B nếu µ A ( x ) ≤ µ B ( x ) và v A ( x ) ≥ v B ( x )

(22)

A ⊇ B nếu µ A ( x ) ≥ µ B ( x ) và v A ( x ) ≤ v B ( x )

Do đó
A = B nếu µ A ( x ) = µ B ( x ) và v A ( x ) = v B ( x )

3.3.

(23)

Một số tính chất
Cho A, B, C là ba tập IFS trên X . Khi đó

a) Giao hoán

A ∪ B = B ∪ A; A ∩ B = B ∩ A

(24)

( A ∪ B ) ∪ C = A ∪ ( B ∪ C ); ( A ∩ B ) ∩ C = A ∩ ( B ∩ C )

(25)

b) Kết hợp
c) Lũy đẳng
A ∪ A = A; A ∩ A = A

(26)

d) Phép cuộn

(A )

C C

e) Phân phối

(27)

=A

A ∪ ( B ∩ C ) = ( A ∪ B) ∩ ( A ∪ C ) ; A ∩ ( B ∪ C ) = ( A ∩ B) ∪ ( A ∩ C )

(28)


f) Luật De Morgan

( A ∪ B) C

= AC ∩ B C và ( A ∩ B ) = AC ∪ B C
C

(29)

g) Hấp thu
A ∪ ( A ∩ B ) = A và A ∩ ( A ∪ B ) = A

3.4.

(30)

Biến ngôn ngữ
Biến ngôn ngữ (Linguistic Variables) là thành phần chủ đạo trong các hệ thống

dùng logic mờ. Các luật trong hệ logic mờ mô tả tri thức trong hệ và chúng dùng các
biến ngôn ngữ như là từ vựng để mô tả các tầng điều khiển của hệ. Biến ngôn ngữ là
biến nhận các giá trị ngôn ngữ (Linguistic Terms) chẳng hạn như “già”, “trẻ” và “trung
niên”, v.v. trong đó, mỗi giá trị ngôn ngữ thực chất là một tập mờ xác định bởi một
hàm thuộc và khoảng giá trị số tương ứng, chẳng hạn giá trị ngôn ngữ “trung niên” là
một tập mờ có hàm thuộc dạng hình tam giác cân xác định trong khoảng độ tuổi
16


[25,55]. Các tập này có thể xếp phủ lên nhau, chẳng hạn, một người ở tuổi 50 có thể
thuộc cả tập mờ “trung niên” lẫn tập mờ “già”, với mức độ thuộc với mỗi tập là khác

nhau.
3.5.

Một số nghiên cứu liên quan
Tiếp cận đầu tiên cho bài toán chẩn đoán bệnh được rút ra từ khái niệm tri thức

y học của Sanchez [36]. Từ một vài cải tiến cách tiếp cận của Sanchez bằng việc kết
hợp IFS và tập mờ cải tiến khác đã được giới thiệu. De, Biswas và Roy [10] đã mờ hóa
quan hệ giữa bệnh nhân – triệu chứng và triệu chứng – bệnh bằng giá trị mờ trực cảm.
Sau đó sử dụng thuật toán sau để xác định mối quan hệ giữa bệnh nhân – bệnh.
1. Tính toán quan hệ giữa bệnh nhân – bệnh bởi quan hệ mờ trực cảm với
hàm thuộc và không thuộc được thể hiện trong công thức (31-32).
µ PD ( Pi , D j ) = max{min{ µ PS ( Pi , S l ) , µ SD ( S l , D j )}} , ∀i = 1, n , ∀j = 1, k ,
l =1, m
γ PD ( Pi , D j ) = min{ max{γ PS ( Pi , S l ) , γ SD ( S l , D j )}} , ∀i = 1, n , ∀j = 1, k .
l =1, m

(31)
(32)

2. Thực hiện giải mờ
S PD = µ PD − γ PD × π PD .

(33)

3. Xác định bệnh của bệnh nhân dựa trên cực đại S PD và cực tiểu π PD
P
Ram
Mari
Sugu

Somu

Viral_Fever
(0.4, 0.1)
(0.3, 0.5)
(0.4, 0.1)
(0.4, 0.1)

Malaria
(0.7, 0.1)
(0.2, 0.6)
(0.7, 0.1)
(0.7, 0.1)

Typhoid
(0.6, 0.1)
(0.4, 0.4)
(0.6, 0.1)
(0.5, 0.3)

Stomach
(0.2, 0.4)
(0.6, 0.1)
(0.2, 0.4)
(0.3, 0.4)

Heart
(0.2, 0.6)
(0.2, 0.5)
(0.2, 0.5)

(0.3, 0.4)

Bảng 5. Quan hệ giữa bệnh nhân và bệnh ( RPD ) trong phương pháp của De, Biswas và
Roy
Ví dụ 6: Xem xét tập dữ liệu tại Ví dụ 1. Quan hệ giữa bệnh nhân – bệnh được
tính toán bởi công thức (31-32) được thể hiện trong Bảng 5. Ma trận S PD được miêu tả
trong Bảng 6. Dựa trên bảng này Ram, Sugu và Somu có khả năng mắc bệnh Malaria
và Mari mắc bệnh Stomach
P
Ram
Mari
Sugu
Somu

Viral_Fever
0.35
0.2
0.35
0.35

Malaria
0.68
0.08
0.68
0.68

Typhoid
0.57
0.32
0.57

0.44
Bảng 6. Ma trận S PD

Stomach
0.04
0.57
0.04
0.18

Heart
0.08
0.05
0.05
0.18

17


Samuel và Balamurugan [35] cải tiến phương pháp của De, Biswas và Roy [10]
bởi kỹ thuật mới tên là tổ hợp max – min mờ trực cảm. Phương pháp này giống với
phương pháp của De, Biswas và Roy [10] chỉ khác ở bước 2 và 3 được thay thế bởi
1. Tính toán WPD = ( µ PD ,1 − γ PD )

{min( µ PD ( Pi , D j ),1 − γ PD ( Pi , D j ) )} và kết luận
2. Cho mỗi Pi tìm kiếm max
j
bệnh có khả năng nhất.
P
Ram
Mari

Sugu
Somu

Viral_Fever
(0.4, 0.9)
(0.3, 0.5)
(0.4, 0.9)
(0.4, 0.9)

Malaria
(0.7, 0.9)
(0.2, 0.4)
(0.7, 0.9)
(0.7, 0.9)

Typhoid
(0.6, 0.9)
(0.4, 0.6)
(0.6, 0.9)
(0.5, 0.7)
Bảng 7. Ma trận WPD

Stomach
(0.2, 0.6)
(0.6, 0.9)
(0.2, 0.6)
(0.3, 0.6)

Heart
(0.2, 0.4)

(0.2, 0.5)
(0.2, 0.5)
(0.3, 0.6)

Ví dụ 7: Xem xét lại tập dữ liệu trong Ví dụ 1. Ma trận WPD được thể hiện trong
Bảng 7. Ma trận giảm thiểu của WPD được thể hiện trong Bảng 8. Từ bảng này Ram,
Sugu và Somu khả năng mắc bệnh Malaria và Mari mắc bệnh Stomach.
P
Ram
Mari
Sugu
Somu

Viral_Fever
0.4
0.3
0.4
0.4

Malaria
0.7
0.2
0.7
0.7

Typhoid
0.6
0.4
0.6
0.5


Stomach
0.2
0.6
0.2
0.3

Heart
0.2
0.2
0.2
0.3

Bảng 8. Ma trận giảm thiểu
Một phương pháp khác cho chẩn đoán bệnh được sử dụng hàm khoảng cách để
tính toán quan hệ giữa bệnh nhân và bệnh từ quan hệ giữa bệnh nhân – triệu chứng và
triệu chứng – bệnh như được miêu tả trong Szmidt và Kacprzyk [47, 48, 49], Khatibi
và Montazer [20], Shinoj và John [37]. Các thuật toán được thể hiện qua các bước
1. Sử dụng hàm Hamming và Euclidean để tính toán quan hệ giữa bệnh
nhân và bệnh như công thức (34-35)
R

PD

(P,D ) =
i

j

(


1 m
∑ µ PS ( Pi , Sl ) − µ SD ( Sl , D j ) + γ PS ( Pi , Sl ) − γ SD ( Sl , D j )
2m l =1

(34)

)

+ π PS ( Pi , S l ) − π SD ( S l , D j ) ,

(

 1 m
( µ PS ( Pi , Sl ) − µ SD ( Sl , D j ) ) 2 + (γ PS ( Pi , Sl ) − γ SD ( Sl , D j ) ) 2
R PD ( Pi , D j ) = 

 2m l =1
+ (π PS ( Pi , S l ) − π SD ( S l , D j ) )

2

(35)

))

1/ 2

.
2. Kết luận bệnh có thể của bệnh nhân dựa trên tiêu chí cực tiểu khoảng

cách
18


Ví dụ 8: Sử dụng phương pháp này cho tập dữ liệu ở Ví dụ 1. Chúng ta có quan
hệ giữa bệnh nhân và bệnh bởi hàm Hamming (Bảng 9) hay Euclidean (Bảng 10). Các
bệnh mà bệnh nhân có thể mắc phải được in đậm
P
Ram
Mari
Sugu
Somu

Viral_Fever
0.28
0.40
0.38
0.28

Malaria
0.24
0.50
0.44
0.30

Typhoid
0.28
0.31
0.32
0.38


Stomach
0.54
0.14
0.50
0.44

Heart
0.56
0.42
0.55
0.54

Bảng 9. Quan hệ giữa bệnh nhân và bệnh khi sử dụng hàm Hamming

19


P
Ram
Mari
Sugu
Somu

Viral_Fever
0.29
0.43
0.36
0.25


Malaria
0.25
0.56
0.41
0.29

Typhoid
0.32
0.33
0.32
0.35

Stomach
0.53
0.14
0.52
0.43

Heart
0.58
0.46
0.57
0.50

Bảng 10. Quan hệ giữa bệnh nhân và bệnh khi sử dụng hàm Euclidean
Bên cạnh các cách tiếp cận này, một số tác giả đã mở rộng chúng cho các
trường hợp đặc biệt, ví dụ, chẩn đoán bệnh đa tiêu chí và đa mô hình khoảng thời gian
cho quan hệ giữa bệnh nhân và triệu chứng. Điều này đòi hỏi việc triển khai trên tập
mờ mở rộng như tập mờ loại 2 (Own, 2009 [28]), tập mềm mờ (Neog và Sut, 2011
[27]; Xiao, Yang, Niu, Dong, Gong, Xia và Pang, 2012 [52]) và tập mềm mờ trực cảm

(Agarwal, Hanmandlu và Biswas, 2011 [1]; Meenakshi và Kaliraja, 2011 [23]). Sự kết
hợp của các tập mờ với các phương pháp học máy khác để xử lý các trường hợp đặc
biệt như hệ tự động nơ ron mờ (Parthiban và Subramanian, 2008 [29]; Moein,
Monadjemi và Moallem, 2009 [26]) và thuật toán di chuyền mờ loại 2 (Tan, Yu, Heng
và Lee, 2003 [50]; Hosseini, Ellis, Mazinani và Dehmeshki, 2011 [15]) cũng đã được
xem xét
Giới hạn các nghiên cứu trước
a) Các nghiên cứu trước chỉ tính toán quan hệ bệnh nhân và bệnh ( RPD ) từ quan hệ
giữa bệnh nhân – triệu chứng ( RPS ) và triệu chứng – bệnh nhân. Trong một số
trường hợp thực tế mối quan hệ giữa bệnh nhân – triệu chứng hoặc triệu chứng
– bệnh là thiếu, các nghiên cứu trước không thể thực hiện được. Thực tế này đã
xảy ra trong thực tế khi bác sĩ không thể hiện chính xác các giá trị độ thuộc và
không thuộc của triệu chứng tới bệnh hay ngược lại.
b) Các thông tin về chẩn đoán trước đó của bệnh nhân không được sử dụng. Ví dụ,
một bệnh nhân có một vài bản ghi về mối quan hệ giữa bệnh nhân – bệnh trước
đó trong cơ sở dữ liệu. Tuy nhiên, việc tính toán của các bản ghi tiếp theo của
bệnh nhân chỉ được tạo dựa trên hai thông tin RPS và RSD . Chẩn đoán lịch sử
của bệnh nhân không được tạo tới quá trình tính toán, như vậy kết quả độ chính
xác của chẩn đoán có thể không cao.
c) Việc xác định bệnh phụ thuộc vào phương pháp giải mờ. Ví dụ, De, Biswas và
Roy [10] đã sử dụng giải mờ, Samuel và Balamurugan [35] dựa trên ma trận
giảm thiểu WPD và Szmidt và Kacprzyk [47, 48, 49], Khatibi và Montazer [20]
20


và Shinoj và John [37] sử dụng hàm khoảng cách. Xác định độc lập từ phương
pháp giải mờ cần được xem xét cho hiệu xuất ổn định của thuật toán
d) Các tính chất toán học của các phép toán như ý nghĩa mờ trong De, Biswas và
Roy [10], Samuel và Balamurugan [35] và hàm khoảng cách trong Szmidt và
Kacprzyk [47, 48, 49], Khatibi và Montazer [20] và Shinoj và John [37] là

không được thảo luận trong bài viết tương ứng. Người đọc sẽ không biết được
cơ sở lý thuyết của các hoạt động và lý do tại sao chúng lại được lựa chọn cho
bài toán chẩn đoán bệnh

III. Hệ tư vấn
1.

Giới thiệu
Hệ thống tư vấn là một thành phần trong hệ thống thông tin. Mục đích của nó là

hỗ trợ người dùng tìm kiếm các thông tin cần thiết.
Ngày nay với tình trạng bùng nổ thông tin trên mạng, hệ tư vấn đã được sử
dụng rộng rãi, nhằm giảm bớt tình trạng quá tải thông tin. Đã có rất nhiều hệ thống áp
dụng hệ tư vấn tới hệ thống của mình để đưa ra những lời khuyên về những sản phẩm
(sách, phim, tin tức, v.v.) phù hợp với khách hàng của mình như Amazone, Youtube,

MovieLens, v.v.
2.

Định nghĩa hệ tư vấn

Định nghĩa 6 [31]: Cho U là tập tất cả các người dùng và I là tập tất cả các tài
nguyên trong hệ thống. Hàm R là một ánh xạ trên U1 ⊆ U và I1 ⊆ I được cho bởi
R : U 1 × I1 → P

( u1 , i1 ) 

(36)

R( u1 , i1 )


Ở đây R( u1 , i1 ) là một số nguyên không âm hay một số thực trong phạm vi nhất định.
P là tập các đánh giá có thể của hệ thống. RS là hệ thống cung cấp hai chức năng có

bản
a) Dự báo: khả năng xác định R( u*,i *) cho bất kỳ ( u*, i *) ∈ (U , I ) \ (U1 , I1 )

R( u , i ) cho tất cả u ∈ U
b) Khuyến nghị: Khả năng chọn i * thỏa i* = arg max
i∈I
Hệ tư vấn thường sử dụng ba phương pháp để đưa ra ước lượng đánh giá cho
các tài nguyên. Đó là lọc cộng tác, lọc dựa theo nội dung và phương pháp lai ghép.

21


3.
3.1.

Một số thuật toán trong RS
Phương pháp lọc cộng tác
Phương pháp lọc cộng tác (CF - collaborative filtering) hoạt động dựa trên toàn

bộ những tài nguyên đã được đánh giá trước đó bởi người dùng. CF được chia thành
hai hướng tiếp cận, dựa trên người hàng xóm gần nhất và dựa trên mô hình. Với hướng
tiếp cận dựa trên người hàng xóm gần nhất được khái quát bằng những bước sau,

a) Gán trọng số tương đồng, wa ,u tới tất cả những người dùng với người dùng
cần tư vấn (active user)
wa ,u =


∑ (r
i∈I

∑ (r
i∈I

a ,i

a ,i

)(

− ra ru ,i − ru

− ra

) ∑ (r
2

u ,i

i∈I

)

− ru

(37)


)

2

ru ,i là đánh giá cho tài nguyên i bởi người dùng u . ru là đánh giá trung bình

của người dùng u

b) Lựa chọn K người dùng tương đồng nhất cho người dùng cần tư vấn
c) Tính toán dự báo từ những trọng số tương đồng dựa vào các đánh giá của
những người hàng xóm gần nhất được lựa chọn. được cho bởi công thức
pa ,i = ra +

∑ (r

u∈K

u ,i

)

− ru × wa ,u

u∈K

(38)

wa ,u

pa ,i là dự báo đánh giá cho người dùng a tới tài nguyên i


3.2.

Phương pháp lọc theo nội dung
Phương pháp lọc theo nội dung bắt nguồn từ những nghiên cứu về truy hồi

thông tin (IR – information retrieval) và lọc thông tin (IF – information filtering). Do
đó, rất nhiều những hệ thống dựa trên nội dung hiện nay tập chung vào tư vấn các đối
tượng chứa dữ liệu text như văn bản, tin tức, v.v. Những tiến bộ so với hướng tiếp cận
cũ của IR, là do việc sử dụng hồ sơ của người dùng. Mỗi người dùng u ∈ U có chứa
một hồ sơ cá nhân về người dùng này (Nó bao gồm những thông tin cá nhân của người
dùng đó như, tên, tuổi, sở thích, nhu cầu, v.v.). Hồ sơ này được xây dựng dựa trên
ngưỡng thông tin mà người dùng cung cấp.
Cho content (i) là các thông tin về sản phẩm i và cho profile (a ) là hồ sơ về
người dùng a . content (i) = ( w1,i ,..., wk ,i ) , với w1,i ,..., wk ,i là các trọng số của các từ khóa
từ 1 tới k (có thể tính bằng TF-IDF [34]).

22


Và profile (a) = ( w1,a ,..., wk ,a ) . Với w j ,a là biểu thị độ quan trọng của từ khóa k j
tới người dùng a và có thể tính toán từ các vector nội dung đã được đánh giá khi sử
dụng một vài kỹ thuật như thuật toán Rocchio [32], thuật toán Winnow [22]. Độ phù
hợp của người dùng a và tài nguyên i được cho bởi công thức.
utility (a, i ) = score ( profile ( a), content (i )) =

3.3.





k
j =1

k
j =1

(39)

w j ,a w j ,i

w 2j ,a



k
j =1

w 2j ,i

Phương pháp lai ghép
Phương pháp lai ghép, là sự kết hợp hai hay nhiều phương pháp khác nhau

trong hệ tư vấn nhằm tránh những hạn chế của các phương pháp và tăng hiệu xuất cho
hệ tư vấn. Ví dụ, một số hệ tư vấn kết hợp cả hai phương pháp lọc cộng tác và lọc nội
dung.

4.

Một số nghiên cứu liên quan

RS đã được ứng dụng tới bài toán chẩn đoán bệnh. Davis, Chawla, Blumm,

Christakis và Barabási [9] đã đề xuất CARE, đánh giá cộng tác và công cụ khuyến
nghị chỉ dựa trên lịch sử y tế của bệnh nhân để dự đoán rủi ro bệnh trong tương lai và
kết hợp phương pháp lọc cộng tác với phân cụm để dự báo rủi ro bệnh của bệnh nhân
dựa trên lịch sử y tế và các bệnh nhân tương đồng. Một phiên bản lặp của CARE với
tên ICARE được giới thiệu. Đó là sự kết hợp các khái niệm quần thể nhằm cải thiện
hiệu xuất của hệ thống.
Hassan và Syed [14] cũng đã sử dụng phương pháp lọc cộng tác để đánh giá
nguy cơ mắc bệnh của bệnh nhân bằng việc kết hợp các trường hợp mới tới dữ liệu
trước đó và kết hợp yết tố dân cư của bệnh nhân tới kết quả, như vậy nó có thể đạt
được kết quả với độ chính xác cao hơn cho cả hai trường hợp đột tử do tim và nhồi
máu cơ tim so với các cách tiếp cận phân lớp như hồi quy logic và SVM. Thêm các
nghiên cứu liên quan như Duan và cộng sự [11], Meisamshabanpoor và Mahdavi [24].
Ví dụ 9: Xem xét tập dữ liệu trong Bảng 11. Tạo một phương thức mã hóa đơn
giản bằng cách nhân độ thuộc với 10 và cộng với độ không thuộc, chúng ta có tập
huấn luyện thô trong Bảng 12.

P

Viral_Fever

Malaria

Typhoid

Stomach

Heart
23



Ram
Mari
Sugu
Somu

(0.4, 0.1)
(0.3, 0.5)
(0.4, 0.1)
*

(0.7, 0.1)
(0.2, 0.6)
(0.7, 0.1)
*

(0.6, 0.1)
(0.4, 0.4)
*
(0.5, 0.3)

(0.2, 0.4)
(0.6, 0.1)
*
(0.3, 0.4)

(0.2, 0.6)
(0.1, 0.7)
*

*

Bảng 11. Tập dữ liệu huấn luyện với các giá trị * cần được dự báo
P
Ram
Mari
Sugu
Somu

Viral_Fever
4.1
3.5
4.1
*

Malaria
7.1
2.6
7.1
*

Typhoid
6.1
4.4
*
5.3

Stomach
2.4
6.1

*
3.4

Heart
2.6
1.7
*
*

Bảng 12. Tập dữ liệu huấn luyện thô với các giá trị * cần được dự báo
P
Ram
Mari
Sugu
Somu

Viral_Fever
4.1
3.5
4.1
5.9

Malaria
7.1
2.6
7.1
9.8

Typhoid
6.1

4.4
4.8
5.3

Stomach
2.4
6.1
1.9
3.4

Heart
2.6
1.7
3.2
5.5

Bảng 13. Tập dữ liệu đầy đủ được xác định bởi phương pháp của Hassan và Syed, các
giá trị in đậm thể hiện bệnh của bệnh nhân
Phương pháp của Hassan và Syed [14] đã sử dụng lọc cộng tác bao gồm hệ số
Pearson để tính toán độ tương đồng giữa những người dùng và phương pháp k hàng
xóm gần nhất để dự báo các giá trị * trong Bảng 12. Các kết quả được thể hiện trong
Bảng 13. Nếu lấy giá trị cực đại trong mỗi hàng để xác định bệnh cho bệnh nhân trong
Bảng 13 thì chúng ta có thể kết luận Ram, Sugu và Somu bị bệnh Malaria và Mari bị
bệnh Stomach. Tương tự, Bảng 14 thể hiện kết quả của Davis, Chawla, Blumm,
Christakis và Barabási [9]. Ở đây Ram bị bệnh Malaria, Mari bị bệnh Stomach và
Sugu, Somu bị bệnh Typhoid

P
Ram
Mari

Sugu
Somu

Viral_Fever
4.1
3.5
4.1
2.6

Malaria
7.1
2.6
7.1
4.7

Typhoid
6.1
4.4
7.3
5.3

Stomach
2.4
6.1
5.2
3.4

Heart
2.6
1.7

2.1
0.2

Bảng 14. Tập dữ liệu đầy đủ được xác định bởi phương pháp của Davis và cộng sự [9],
các giá trị in đậm thể hiện bệnh có thể mắc phải nhất
24


Từ Ví dụ 9, chúng ta nhận thấy
a) RS có thể được ứng dụng trong chẩn đoán bệnh. Tuy nhiên trong trường hợp
các quan hệ được thể hiện bởi các giá trị mờ như trong Bảng 11. Độ chính xác
của chẩn đoán trong RS phụ thuộc vào phương pháp mã hóa. Nói cách khác, RS
là hiệu quả với tập dữ liệu thô như trong Bảng 12
b) Vấn đề của các nghiên cứu trước đây về sự phụ thuộc của việc xác định bệnh từ
phương pháp giải mờ, ví dụ, hàm cực đại trong Ví dụ 9
c) RS chỉ làm việc nếu tập dữ liệu huấn luyện được cung cấp. Điều đó có nghĩa
chúng ta phải có lịch sử chẩn đoán của các bệnh nhân cho dự báo.

IV.

Kết luận
Chương một giới thiệu về bài toán chuẩn đoán bệnh và cơ bản về tập mờ, tập

mờ trực cảm, một số ứng dụng của tập mờ trong thực tế và một số nghiên cứu liên
quan đã sử dụng IFS trong bài toán chẩn đoán bệnh. Cuối cùng, trình bày sơ lược về
hệ tư vấn cùng một số thuật toán và các nghiên cứu liên quan đã sử dụng RS trong bài
toán chẩn đoán bệnh

25



×