Tải bản đầy đủ (.pdf) (79 trang)

Hệ logic mờ với bài toán dự báo trong y học

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.58 MB, 79 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC VINH

VÕ DUY THANH

HỆ LOGIC MỜ VỚI BÀI TOÁN DỰ BÁO TRONG Y HỌC
Chuyên ngành: Công nghệ thông tin
Mã số: 60.48.02.01

LUẬN VĂN THẠC SĨ NGÀNH CÔNG NGHỆ THÔNG TIN

NGHỆ AN, 2017


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC VINH

VÕ DUY THANH

HỆ LOGIC MỜ VỚI BÀI TOÁN DỰ BÁO TRONG Y HỌC
Chuyên ngành: Công nghệ thông tin
Mã số: 60.48.02.01

LUẬN VĂN THẠC SĨ NGÀNH CÔNG NGHỆ THÔNG TIN

Người hướng dẫn: TS. Phan Anh Phong

NGHỆ AN, 2017


i



LỜI CAM ĐOAN
Tơi xin cam đoan đây là cơng trình nghiên cứu của riêng tôi. Các
số liệu và kết quả nghiên cứu trong luận văn là trung thực và chưa hề
được sử dụng để bảo vệ một học vị nào. Các thơng tin được lược trích từ
nguồn tài liệu chính thống và được chỉ rõ nguồn gốc rõ ràng. Nếu sai tơi
hồn tồn chịu trách nhiệm.
Tác giả luận văn
Võ Duy Thanh


ii

LỜI CẢM ƠN
Đầu tiên, tôi xin gửi lời cảm ơn sâu sắc nhất đến nhà khoa học TS.
Phan Anh Phong, thầy đã tận tình chỉ bảo, giúp đỡ, định hướng và tạo
điều kiện cho tơi hồn thành luận văn này.
Tơi xin trân trọng cảm ơn sự giúp đỡ của các nhà khoa học, thầy,
cô trường Đại học Vinh, Trường Đại học Đồng Tháp đã giảng dạy,
truyền đạt kiến thức và hỗ trợ các điều kiện học tập cho tôi.
Mặc dù, tác giả đã nỗ lực và cố gắng để hoàn thành luận văn,
nhưng do trình độ và kinh nghiệm trong nghiên cứu khoa học còn hạn
chế. Nên chắc chắn luận văn này khơng tránh khỏi những thiếu sót. Tác
giả kính mong nhận được sự đóng góp và chỉ dẫn của các nhà khoa học,
bạn bè, đồng nghiệp giúp cho luận văn được hồn thiện hơn.
Để có được kết quả như hơm nay, tơi cũng xin tỏ lịng biết ơn đến
gia đình, bạn bè, đồng nghiệp đã động viên, giúp đỡ, chia sẻ những khó
khăn để tơi hồn thành nhiệm vụ học tập, nghiên cứu của mình.
Xin chân thành cảm ơn!
Nghệ An, ngày……tháng……năm 2017

Học viên thực hiện
Võ Duy Thanh


iii

MỤC LỤC
LỜI CAM ĐOAN ..................................................................................... i
LỜI CẢM ƠN .......................................................................................... ii
MỤC LỤC ............................................................................................... iii
DANH MỤC CÁC TỪ VIẾT TẮT ....................................................... vi
DANH MỤC HÌNH ............................................................................... vii
DANH MỤC BẢNG ............................................................................... ix
MỞ ĐẦU .................................................................................................. 1
1. Sự cần thiết của vấn đề nghiên cứu ................................................... 1
2. Lịch sử của vấn đề nghiên cứu: ......................................................... 2
3. Mục tiêu nghiên cứu ........................................................................... 2
4. Đối tượng và phạm vi nghiên cứu ..................................................... 2
5. Nội dung nghiên cứu ........................................................................... 3
6. Đóng góp của luận văn ....................................................................... 3
7. Kết cấu của luận văn........................................................................... 3
Chương 1. GIỚI THIỆU BÀI TOÁN DỰ BÁO TRONG Y HỌC ..... 5
1.1. Đặt vấn đề .......................................................................................... 5
1.2. Các nghiên cứu liên quan đến bài toán dự báo trong y học ............... 7
1.3. Bài toán dự báo bệnh nhân viêm tủy ................................................. 8

1.3.1. Bài toán ........................................................................................... 8
1.3.2. Các tiếp cận nghiên cứu và kết quả đạt được ................................. 9
1.4. Kết luận chương 1 .............................................................................. 9
Chương 2. TỔNG QUAN VỀ TẬP MỜ VÀ HỆ LOGIC MỜ.......... 10



iv

2.1. Đặt vấn đề ........................................................................................ 10
2.2. Lý thuyết tập mờ .............................................................................. 10

2.2.1. Các khái niệm cơ bản.................................................................... 10
2.2.2. Các phép toán trên tập mờ............................................................ 14
2.2.3. T-norm và T-cornorm ................................................................... 18
2.2.4. Quan hệ mờ ................................................................................... 19
2.2.5. Phép hợp thành ............................................................................. 20
2.3. Hệ logic mờ ...................................................................................... 21

2.3.1. Mờ hóa .......................................................................................... 21
2.3.2. Cơ sở luật ...................................................................................... 22
2.3.3. Suy diễn ......................................................................................... 23
2.3.4. Giải mờ.......................................................................................... 24
2.4. Những thách thức khi xây dựng một hệ mờ .................................... 27
2.5. Kết luận chương 2 ............................................................................ 27
Chương 3. XÂY DỰNG HỆ LOGIC MỜ DỰ BÁO THỜI GIAN
SỐNG CỦA BỆNH NHÂN VIÊM TỦY ............................................. 28
3.1. Đặt vấn đề ........................................................................................ 28
3.2. Xây dựng cơ sở luật từ dữ liệu bằng phương pháp của Wang –
Mendel..................................................................................................... 28

3.2.1. Quy trình thực hiện ....................................................................... 29
3.2.2. Một ví dụ đơn giản về xây dựng cơ sở luật ................................... 32
3.3. Thiết kế hệ logic mờ cho bài toán dự báo ........................................ 35


3.3.1. Xác định các thuộc tính của mơ hình và các giá trị ngơn ngữ ..... 35
3.3.2. Xây dựng hàm thuộc cho các giá trị ngôn ngữ ............................. 36
3.3.3. Suy diễn ......................................................................................... 40
3.4. Kết quả thử nghiệm .......................................................................... 41
3.5. Kết luận chương 3 ............................................................................ 47


v

Chương 4. NÂNG CAO HIỆU QUẢ DỰ BÁO CỦA HỆ MỜ VỚI
THUẬT TỐN TỐI ƯU HĨA BẦY ĐÀN ......................................... 49
4.1. Đặt vấn đề ........................................................................................ 49
4.2. Giải thuật tối ưu hóa bầy đàn (PSO) ................................................ 49

4.2.1. Tổng quan giải thuật PSO............................................................. 49
4.2.2. Các bước thực hiện của giải thuật ................................................ 50
4.2.3. Hạn chế của PSO .......................................................................... 52
4.3. Áp dụng giải thuật tối ưu hóa bầy đàn ............................................. 52

4.3.1. Hàm mục tiêu ................................................................................ 53
4.3.2. Biểu biến cá thể: ........................................................................... 55
4.3.3. Khởi tạo quần thể .......................................................................... 55
4.4. Kết quả thử nghiệm .......................................................................... 55
4.5. Kiểm tra kết quả dự báo của hệ mờ đề xuất với Tool box của
Matlab. .................................................................................................... 56
4.6. Kết luận chương 4 ............................................................................ 62
KẾT LUẬN ............................................................................................ 63
TÀI LIỆU THAM KHẢO .................................................................... 64
Phụ lục .................................................................................................... 66



vi

DANH MỤC CÁC TỪ VIẾT TẮT
Các chữ viết tắt: Giải nghĩa
PSO Particle Swarm Optimization
MISO Multi Input Single Output
MIMO Multi Input Multi Output

GA Genetic Algorithm
LOM Largest of Maximum
MOM Middle of Maximum
SOM Smallest of Maximum


vii

DANH MỤC HÌNH
Hình 2.1. Hàm thuộc µA ( x) có mức chuyển đổi tuyến tính. ................... 11
Hình 2.2. Hàm thuộc của tập B. .............................................................. 11
Hình 2.3. Miền xác định và miền tin cậy của tập mờ A. ........................ 12
Hình 2.4. Biểu diễn tập mờ chiều cao ..................................................... 14
Hình 2.5. Hợp hai tập mờ có cùng tập vũ trụ.......................................... 14
Hình 2.6. Giao hai tập mờ có cùng tập vũ trụ ......................................... 15
Hình 2.7. Tập bù A của tập mờ A. ........................................................... 16
Hình 2.8. Giải mờ bằng phương pháp điểm cực đại. .............................. 25
Hình 2.9. Giải mờ bằng phương pháp điểm trọng tâm. .......................... 27
Hình 3.1. Biểu diễn hàm thuộc cho các thuộc tính x1, x2, y ................... 34
Hình 3.2 Sơ đồ thuật tốn xây dựng hệ mờ ............................................ 36
Hình 3.3. Tập tham số của các hàm thuộc cho biến ngôn ngữ LogBun . 38

Hình 3.4. Tập tham số của các hàm thuộc cho biến ngơn ngữ HGB...... 39
Hình 3.5. Tập tham số của các hàm thuộc cho biến ngôn ngữ LogTime 40
Hình 3.6. Mơ hình của hệ thống ............................................................. 41
Hình 3.7. Suy diễn và giải mờ dựa trên cơ sở luật.................................. 44
Hình 3.8 Đồ thị biểu thị kết quả tìm được từ hệ mờ và kết quả thực tế . 46
Hình 4.1. Sơ đồ giải thuật PSO áp dụng cho tối ưu tham số hàm thuộc
của hệ logic mờ ....................................................................................... 54
Hình 4.2 Mơ hình hệ thống ..................................................................... 57
Hình 4.3 Thiết lập các tham số cho các giá trị ngôn ngữ của biến ngôn


viii

ngữ LogBun ............................................................................................ 58
Hình 4.4 Thiết lập các tham số cho các giá trị ngôn ngữ của biến ngôn
ngữ HGB ................................................................................................. 58
Hình 4.5 Thiết lập các tham số cho các giá trị ngơn ngữ của biến ngơn
ngữ LogTime ........................................................................................... 59
Hình 4.6 Thêm vào tập cơ sở các luật..................................................... 59
Hình 4.7 Tính kết quả với đầu vào của bản ghi 19 trong bộ dữ liệu kiểm
tra............................................................................................................. 60
Hình 4.8 Đồ thị biểu thị kết quả tìm được từ hệ mờ và kết quả thực tế . 61


ix

DANH MỤC BẢNG
Bảng 3.1. Tham số của các hàm thuộc cho thuộc tính LogBun ............. 40
Bảng 3.2. Tham số của các hàm thuộc cho thuộc tính HGB .................. 40
Bảng 3.3. Tham số của các hàm thuộc cho thuộc tính LogTime............ 40

Bảng 3.4 Tập luật và trọng số mỗi luật tương ứng với các bảng ghi trong
bộ dữ liệu huấn luyện .............................................................................. 42
Bảng 3.5. Cơ sở luật xây dựng bằng phương pháp của Wang và Mendel
trong trường hợp chưa tối ưu các tham số của hàm thuộc. ..................... 43
Bảng 3.6. Kết quả dữ liệu LogTime tìm được của hệ mờ và dữ liệu mẫu45
Bảng 4.1. Tham số của các hàm thuộc cho thuộc tính LogBun ............. 55
Bảng 4.2. Tham số của các hàm thuộc cho thuộc tính HGB .................. 56
Bảng 4.3. Tham số của các hàm thuộc cho thuộc tính LogTime............ 56
Bảng 4.4. Cơ sở luật xây dựng bằng phương pháp của Wang và Mendel
trong trường hợp đã tối ưu các tham số của hàm thuộc. ......................... 56
Bảng 4.5. Kết quả dữ liệu LogTime tìm được của hệ mờ và dữ liệu mẫu60


1

MỞ ĐẦU
1. Sự cần thiết của vấn đề nghiên cứu
Chuẩn đốn, dự báo về tình trạng sức khỏe của người bệnh trong y
học là một lĩnh vực tương đối phức tạp. Đối tượng của lĩnh vực này là
những bệnh nhân, những con người thực sự. Đó là những thực thể sống
được tổ chức rất phức tạp về mặt sinh học kèm theo đó là hàng loạt
những q trình sống tác động qua lại, ảnh hưởng lẫn nhau. Những quá
trình này luôn bị chi phối bởi điều kiện môi trường như: xuất hiện đối
kháng mới, mầm bệnh, nguồn bệnh... Kiến thức y học cũng khá phức
tạp. Để tìm ra những đáp án cho tình trạng bệnh, bằng kinh nghiệm và
kiến thức người bác sĩ phải dựa trên sự mô tả về bệnh án và các số liệu
xét nghiệm để đưa ra đáp án có độ chính xác cao nhất. Với các mơ tả
khơng chắc chắn và số liệu đơi khi có độ lệch thì việc nghiên cứu và ứng
dụng Logic mờ trong bài toán chuẩn đoán hoặc dự báo sẽ mang lại nhiều
kết quả thực tiễn.

Bài toán dự báo thời gian sống của bệnh nhân viêm tủy là bài toán
căn cứ vào các số liệu xét nghiệm liên quan đến công thức máu và một
số dữ liệu khác để đưa ra kết quả về thời gian còn sống của người bệnh
về tủy. Do trong lĩnh vực y tế phần lớn các thông tin được phát biểu
bằng ngôn ngữ mờ và không chắc chắn. Vì vậy, việc nghiên cứu và xây
dựng một hệ chuyên gia dùng để thu thập, phân tích dữ liệu và đưa ra
những dự báo một cách đúng nhất sẽ hỗ trợ rất nhiều cho việc xây dựng
phác đồ điều trị cho bệnh nhân.
Logic mờ được công bố lần đầu tiên tại Mỹ vào năm 1965 do giáo
sư Lotfi Zadeh. Kể từ đó, logic mờ đã có nhiều phát triển qua các chặng
đường sau: phát minh ở Mỹ, áp dụng ở Châu Âu và đưa vào các sản


2

phẩm thương mại ở Nhật. Với đầu vào là những dữ liệu không chắc
chắn, nhiều nghiên cứu và ứng dụng thành công về Logic mờ như: Hệ
thống hỗ trợ điều kiển xe ôtô, hệ thống điều khiển máy giặt, hệ thống dự
báo về lượng nước mưa…Như vậy ngoài cách dự báo bằng kỹ thuật hồi
quy thì logic mờ cịn là một cách tiếp cận mới và đặt biệt phù hợp với
những dữ liệu đầu vào chưa rõ.
Xuất phát từ nhu cầu đưa ra một dự báo có tính đúng nhất về thời
gian còn sống của người bệnh viêm tủy căn cứ vào các mô tả, dấu hiệu
và các số liệu xét nghiệm có độ sai lệch. Đó là lý do tơi chọn đề tài “Hệ
logic mờ với bài tốn dự báo trong y học” nhằm tìm hiểu logic mờ, xem
xét hiệu quả của logic mờ khi ứng dụng vào bài toán dự báo và thử
nghiệm các phương pháp tối ưu để nâng cao độ chính xác của dự báo.
2. Lịch sử của vấn đề nghiên cứu:
Bài toán đã được xây dựng bằng phương pháp hồi quy [13], hệ mờ
loại khoảng thống kê [14] và hệ mờ loại hai đại số gia tử [3].

3. Mục tiêu nghiên cứu
Nghiên cứu về lý thuyết tập mờ và thuật tốn tối ưu hóa bầy đàn
để ứng dụng cho mơ hình dự báo sử dụng tập mờ.
4. Đối tượng và phạm vi nghiên cứu
4.1. Đối tượng nghiên cứu
o Lý thuyết về logic mờ.
o Phương pháp dự báo trong y học đối với bệnh nhân viêm
tủy.
o Lý thuyết về giải thuật tối ưu hóa bầy đàn.
4.2. Phạm vi nghiên cứu


3

Nghiên cứu hệ logic mờ và ứng dụng vào bài toán dự báo thời
gian sống của bệnh nhân viêm tủy.
5. Nội dung nghiên cứu
Khảo sát các ứng dụng dự báo sử dụng logic mờ từ đó xác định
được ưu điểm và nhược điểm của hệ thống.
Nghiên cứu ngôn ngữ lập trình Matlab để cài đặt mơ phỏng các
giải thuật trên máy tính.
Nghiên cứu hệ logic mờ.
Nghiên cứu xây dựng bộ luật cho hệ mờ từ dữ liệu mẫu.
Nghiên cứu giải thuật tối ưu hóa bầy đàn.
Lập trình cho bài tốn dự báo trong y học bằng hệ mờ.
6. Đóng góp của luận văn
Luận văn sẽ cung cấp cách tiếp cận việc xây dựng cơ sở luật từ dữ
liệu.
Ứng dụng giải thuật tối ưu hóa bầy đàn, một giải thuật cịn nhiều
mới mẻ vào việc tối ưu các tham số của bài tốn.

7. Kết cấu của luận văn
Ngồi phần mở đầu và kết luận bố cục của luận văn bao gồm 4
chương như sau:
Chương 1: Giới thiệu bài toán dự báo trong y học
Chương 2: Tổng quan về tập mờ và hệ logic mờ.
Chương 3: Xây dựng hệ logic mờ dự báo thời gian sống của bệnh
nhân viêm tủy.


4

Chương 4: Nâng cao hiệu quả dự báo của hệ mờ với thuật tốn tối
ưu hóa bầy đàn.


5

CHƯƠNG 1. GIỚI THIỆU BÀI TOÁN DỰ BÁO TRONG Y HỌC
1.1. Đặt vấn đề
Trong nền y học hiện nay, việc chuẩn đốn hay dự báo chính xác
tình trạng bệnh sẽ góp phần khơng nhỏ cho q trình theo dõi và điều trị.
Thơng qua việc phân tích các thơng tin y tế, hồ sơ bệnh án, quá
trình xét nghiệm, khám bệnh, thông tin bác sĩ điều trị… sẽ đưa ra thông
tin kịp thời về nhu cầu của bệnh nhân, báo cáo dự đoán.
Hiện tại một số hệ thống đã được xây dựng để phục vụ trong lĩnh
vực y học như: các phần mềm của IBM (gồm có phần mềm NEXT dự
báo và phân loại bệnh thận, phần mềm HYCONES dự báo và phân loại
bệnh tim), phần mềm phân tích của SAS/STAS, phần mềm của dự đoán
bệnh từ xa Intouch Health. Về cơ bản các hệ thống này đã được triển
khai và ứng dụng thành công trong các trường hợp nhất định góp phần

hỗ trợ cho bác sĩ và nâng cao chất lượng cuộc sống cho người bệnh. Việc
khai phá dữ liệu và các phân tích dự báo đang giúp các bác sĩ chăm sóc y
tế tạo ra các biện pháp điều trị hợp lý cho các nhóm người khác nhau. Ví
dụ, trong trường hợp của bệnh tim mạch, nhờ bắt tay làm việc chặt chẽ
với các bệnh nhân được xác định bằng một giải pháp dự báo là có nguy
cơ cao, các biện pháp phịng ngừa đơn giản có thể được thực hiện như
cắt giảm lượng chất béo bão hòa vào cơ thể, giảm cân và bỏ hút thuốc lá,
có thể làm giảm đáng kể nguy cơ của một cơn đau tim. Theo cách này,
các bác sĩ chăm sóc y tế có thể đưa ra những hướng dẫn khác nhau để
giữ cho bệnh nhân có nguy cơ thấp vẫn giữ ở mức nguy cơ thấp, trong
khi giảm thiểu các nguy cơ liên quan đến các bệnh nhân có nguy cơ cao.
Ngồi những căn bệnh nguy hiểm thường được biết đến như bệnh


6

về các chức năng gan, thận… một trong số những căn bệnh không kém
phần quan trọng quyết định đến thể trạng và sinh mạng của người bệnh
đó là căn bệnh viêm tủy. Căn bệnh này tiến triển nhanh chóng hàng ngày
hàng giờ lan dần từ thấp lên cao và có thể tổn thương lên não, gây tử
vong nhanh. Như vậy việc cần thiết là phải có một dự báo chính xác về
thời gian sống của bệnh nhân để đưa ra những phương pháp xử lý theo
đúng định hướng trong điều trị. Tuy nhiên, hiện nay đối với một bài toán
dự báo việc đưa ra kết quả dự báo có tính chính xác cịn gặp phải những
thách thức sau:
Đầu tiên, để xây dựng một mơ hình dự báo, trước tiên bạn cần phải
chuẩn bị các dữ liệu sẽ được sử dụng để huấn luyện. Để làm điều đó, một
tập hợp các thuộc tính đại diện cho một đối tượng được tổ chức lại với
nhau thành một bản ghi. Khi tất cả các bản ghi được tập hợp với nhau,
chúng trở thành một tập dữ liệu có thể chứa hàng triệu bản ghi. Việc cần

thiết là phải lựa chọn trong tập hợp các thuộc tính của đối tượng cần phân
tích những thuộc tính nào có ảnh hưởng lớn nhất, quyết định đến kết quả
dự đốn và số lượng thuộc tính cần sử dụng là bao nhiêu để đem lại hiệu
quả dự đoán tốt nhất.
Tiếp theo, cần phải kết hợp dữ liệu và một mơ hình tốn học để từ
đó làm nền tảng cho cơ sở lập luận. Hiện nay một số phương pháp mơ
hình hóa bài tốn bao gồm: hồi quy, xác suất, mạng nơ ron, lan truyềnngược, máy véc tơ hỗ trợ, cây quyết định, phân cụm, hệ logic mờ… Mỗi
một mơ hình kể trên đều có những ưu điểm và hạn chế riêng. Như vậy,
vấn đề đặt ra là lựa chọn một mơ hình phù hợp đối với bài tốn.
Kế đến, trên cơ sở mơ hình được chọn cần tìm ra những tham số
thích hợp cho việc xây dựng mơ hình bài tốn. Trong bước này các kỹ


7

thuật tối ưu sẽ mang tính chất quyết định đầu ra dựa vào việc tìm kiếm
nghiệm cho các tham số.
Cuối cùng, một vấn đề quan trọng quyết định lớn nhất đến kết quả
bài tốn đó chính là bộ dữ liệu thí nghiệm bị nhiễu khi thu thập. Ta nhận
thấy việc đầu tiên là nếu khơng có bộ dữ liệu thì sẽ khơng có cơ sở để
phân tích và cũng khơng thể nào phân tích dự báo. Đối với một số mơ
hình dự báo để có thể học và tổng qt hóa, phải cần đến hàng ngàn bản
ghi hoặc nhiều hơn. Nếu dữ liệu không đủ cho việc huấn luyện một mơ
hình, có thể khơng có khả năng phân tích một cách tổng quát. Nếu dữ
liệu có sẵn đã đủ cho việc phân tích, thì tiếp theo là vấn đề dữ liệu tốt
đến mức nào. Chất lượng của dữ liệu sẽ trực tiếp phản ánh vào chất
lượng của mơ hình dự báo. Có thể nói rằng, chất lượng đầu ra của dự báo
dựa vào chất lượng của dữ liệu đầu vào.
Đối với bệnh nhân viêm tủy, một căn bệnh nguy hiểm đến tính
mạng, việc dự báo thời gian sống chính xác sẽ hỗ trợ cho phác đồ điều trị

của bác sĩ và việc chuẩn bị tâm lý của bệnh nhân. Trong phần 1.3 sẽ
trình bày cụ thể hơn về bài tốn này.
1.2. Các nghiên cứu liên quan đến bài toán dự báo trong y học
Hiện nay một số hệ thống dự báovề lĩnh vực y học đã được
nghiên cứu như:
- Hệ thống chuẩn đốn dựa trên phần mềm phân tích số liệu
SAS/STAT [13].
- Hệ thống dự đoán bệnh lâm sàng của Y. Zhang và Y. Zhao
[14].
- Ví dụ về bài tốn dự báo trong tài liệu tham khảo tập mờ
loại 2 đại số gia tử của TS. Phan Anh Phong [3].


8

- Hệ thống chuẩn đoán bệnh tâm thần [5].
- Hệ thống chuẩn đoán bệnh đau co thắt ngực [4].
1.3. Bài toán dự báo bệnh nhân viêm tủy

1.3.1. Bài toán
Bộ dữ liệu về bệnh nhân viêm tủy được tìm thấy trong tài liệu
SAS/STAT 9.2 User’s Guide The PHREG Procedure (2008). Trong số
65 bệnh nhân này, có 48 người đã chết và 17 người cịn sống sau q
trình nghiên cứu.
Theo bộ dữ liệu MYELOMA, biến TIME mô tả thời gian sống của
bệnh nhân tính bằng tháng. Biến VSTATUS nhận hai giá trị 0 và 1, thể
hiện bệnh nhân còn sống hay đã chết sau quá trình nghiên cứu. Nếu
VSTATUS nhận giá trị 0 thì giá trị TIME tương ứng là thiếu (vì bệnh
nhân còn sống). Các biến liên quan đến sự sống của bệnh nhân là
LOGBUN – giá trị logarithm (log) của urát nitơ trong máu, HGB –

Hemoglobin, PLATELET – tiểu cầu khi phân tích (PLATELET = 0 là bất
bình thường, PLATELET = 1 là bình thường), AGE – tuổi của bệnh nhân,
LOGWBC – log của WBC khi phân tích, FRAC – các vết rạn xương
(FRAC = 0: khơng có rạn xương, FRAC = 1: có rạn xương), LOGPBM –
log phần trăm của tế bào huyết tương trong tủy xương, PROTEIN – hiện
tượng nước tiểu có protein và SCALC – huyết thanh canxi.
Mặc dù các tham số trong bài toán trên đều liên quan đến thời gian
sống của bệnh nhân nhưng trong các nghiên cứu, hai nhân tố có ảnh
hưởng lớn nhất là LOGBUN và HGB. Vì vậy, khi thiết kế hệ lôgic mờ,
ta chọn 2 tham số này làm 2 đầu vào, và đầu ra là log thời gian sống của
các bệnh nhân.
Dữ liệu được lấy từ User’s Guide The PHREG Procedure 2008,


9

sau đó tính logarit cơ số 10 của hai tham số BUN và TIME, chi tiết về bộ
dữ liệu được trình bày trong [phụ lục 1].

1.3.2. Các tiếp cận nghiên cứu và kết quả đạt được
Trong các nghiên cứu đã kể ở phần 1.2 nhiều phương pháp đã
được ứng dụng như: kỹ thuật phân tích hồi quy, hệ mờ loại 1, hệ mờ lại 2
khoảng thống kê, hệ mờ loại 2 đại số gia tử. Bên cạnh đó 2 phương pháp
sử dụng hệ mờ này đều dùng giải thuật di truyền (GA) dùng để tối ưu
các tham số của hệ mờ. Các kỹ thuật hồi quy địi hỏi phải tìm một hàm
biểu diễn phù hợp, trong khi đó khó tìm được hàm cho kết quả chuẩn
xác. Các phương pháp áp dụng hệ logic mờ về cơ bản đã thể hiện được
tổng quan bài tốn. Trong đó các phương pháp sử dụng hệ mờ loại 2 đã
đem đến 1 số kết quả dự đoán như mong đợi.
1.4. Kết luận chương 1

Chương 1 đã trình bày khái qt về bài tốn dự báo trong y học.
Những vấn đề khó khăn khi xây dựng một bài tốn dự báo. Bên cạnh đó
đã giới thiệu một số nghiên cứu liên quan đến dự báo và các phương
pháp, kỹ thuật đã được sử dụng.
Dựa vào cái nhìn khái quát này ta nhận thấy rằng, mặc dù các hệ
thống dự báo đã được xây dựng nhưng trên thực tế để tìm ra một hướng
tiếp cận phù hợp với dữ liệu và yêu cầu bài toán là một vấn đề phức
tạp. Đây là một thách thức tạo tiền đề để tìm ra những nghiên cứu tiếp
cận hệ thống một cách tốt hơn.


10

CHƯƠNG 2. TỔNG QUAN VỀ TẬP MỜ VÀ HỆ LOGIC MỜ
2.1. Đặt vấn đề
Chương này sẽ nhắc lại các khái niệm về tập mờ, các phép toán hỗ
trợ cho việc thực hiện tính tốn trên tập mờ, về quan hệ mờ, và các phép
hợp thành. Từ đó để làm cơ sở để tìm hiểu cách xây dựng hệ logic mờ
[1,7,11].
2.2. Lý thuyết tập mờ

2.2.1. Các khái niệm cơ bản
2.2.1.1. Định nghĩa tập mờ
Tập mờ A xác định trên tập vũ trụ X là một tập mà mỗi phần tử của
nó là một cặp các giá trị (x,µA(x)), trong đó x ∈ X và µA là ánh xạ:
µA : X → [0,1]
Ánh xạ µA được gọi là hàm thuộc hoặc hàm liên thuộc (hoặc hàm
thành viên - membership function) của tập mờ A. Tập X được gọi là cơ
sở của tập mờ A.
µA(x) là độ phụ thuộc, sử dụng hàm thuộc để tính độ phụ thuộc

của một phần tử x nào đó, có hai cách:
Tính trực tiếp nếu µA(x) ở dạng cơng thức tường minh.
Tra bảng nếu µA(x) ở dạng bảng.
Kí hiệu:
A = {(µA(x)/x) : x ∈ X}
Các hàm thuộc µA(x) có dạng “trơn” được gọi là hàm thuộc kiểu
S. Đối với hàm thuộc kiểu S, do các công thức biểu diễn µA(x) có độ


11

phức tạp lớn nên thời gian tính độ phụ thuộc cho một phần tử lớn. Trong
kỹ thuật điều khiển mờ thông thường, các hàm thuộc kiểu S thường được
thay gần đúng bằng một hàm tuyến tính từng đoạn.
Một hàm thuộc có dạng tuyến tính từng đoạn được gọi là hàm
thuộc có mức chuyển đổi tuyến tính.

Hình 2.1. Hàm thuộc µA ( x) có mức chuyển đổi tuyến tính.

Hàm thuộc như trên với m1 = m2 và m3 = m4 chính là hàm thuộc
của một tập vũ trụ.
Ví dụ 2.1: Một tập mờ B của các số tự nhiên nhỏ hơn 5 với hàm
thuộc µB(x) có dạng như Hình 2.2 định nghĩa trên tập vũ trụ X sẽ chứa các
phần tử sau:
B = {(1,1),(2,1),(3,0.95),(4,0.7)}

Hình 2.2. Hàm thuộc của tập B.

Các số tự nhiên 1, 2, 3 và 4 có độ phụ thuộc như sau:



12

µB(1) = µB(2) = 1, µB(3) = 0.95, µB(4) = 0.7
Những số khơng được liệt kê đều có độ phụ thuộc bằng 0.
Ví dụ 2.2: Xét X là tập các giá trị trong thang điểm 10 đánh giá kết
quả học tập của học sinh về mơn Tốn, X = {1, 2, …, 10}. Khi đó khái
niệm mờ về năng lực học mơn tốn giỏi có thể được biểu thị bằng tập
mờ A sau:
A = 0.1/4 + 0.2/5 + 0.4/6 + 0.7/7 + 0.9/8 + 1.0/9 +1.0/10
Trong trường hợp tập mờ rời rạc ta có thể biểu diễn tập mờ ở dạng
bảng.
2.2.1.2. Một số khái niệm cơ bản của tập mờ
Miền xác định: Biên giới tập mờ A, ký hiệu là supp(A), là tập rõ
gồm các phần tử của X có mức độ phụ thuộc của x vào tập mờ A lớn hơn
0.
supp(A) = {x | µA(x) > 0}
Miền tin cậy: Lõi tập mờ A, ký hiệu là core(A), là tập rõ gồm

Hình 2.3. Miền xác định và miền tin cậy của tập mờ A.

các phần tử của X có mức độ phụ thuộc của x vào tập mờ A bằng 1.
core(A) = {x | µA(x) = 1}


13

Độ cao tập mờ: Độ cao tập mờ A, ký hiệu: h(A), là mức độ phụ
thuộc cao nhất của x vào tập mờ A.
h(A) = sup µA(x)


x∈X

Một tập mờ có ít nhất một phần tử có độ phụ thuộc bằng 1 được
gọi là tập mờ chính tắc, tức là h(A) = 1, ngược lại một tập mờ A với h(A)
< 1 được gọi là tập mờ khơng chính tắc.
Biểu diễn tập mờ: Tập mờ A trên tập vũ trụ X là tập mà các phần
tử x ∈ X với mức độ phụ thuộc của x vào tập mờ A tương ứng. Có ba
phương pháp biểu diễn tập mờ: phương pháp ký hiệu, phương pháp tích
phân và phương pháp đồ thị.
Phương pháp ký hiệu: Liệt kê các phần tử và các thành viên tương
ứng theo ký hiệu.
Cho X = {x1, x2,…,xn} là tập hữu hạn:
𝑛

𝐴 = ∑
𝑖=1

𝜇𝐴 (𝑥𝑖 )
𝑥𝑖

Phương pháp tích phân: với X là tập vô hạn ta thường dùng ký hiệu
sau:
𝐴 = ∫
𝑥

𝜇𝐴 (𝑥)
𝑥

Lưu ý rằng các biểu thức trên chỉ có tính hình thức, các phép

cộng +, phép tổng ∑

và phép lấy tích phân đều khơng có nghĩa theo

quy ước thông thường. Tuy nhiên cách biểu diễn như vậy sẽ rất tiện
dụng khi định nghĩa và thao tác các phép tính trên các tập mờ sau này.


14

Phương pháp đồ thị:

Hình 2.4. Biểu diễn tập mờ chiều cao

2.2.2. Các phép toán trên tập mờ
2.2.2.1. Hợp của các tập mờ
Cho tập mờ A, B trên tập vũ trụ X, tập mờ hợp của A và B là một
tập mờ, ký hiệu là C = A ∪ B.
Theo phép hợp chuẩn ta có 𝜇C(x)từ các hàm thành viên µA(x),
µB(x) như sau:
µC(x) = µA∪B( x) = max[µA(x), µB(x)], x ∈ X

Hình 2.5. Hợp hai tập mờ có cùng tập vũ trụ.

Một cách tổng quát ta dùng hàm hợp u : [0,1] ì [0,1] [0,1]. Hm
thnh viờn àC(x) cú th c suy từ hàm thành viên µA(x), µB(x) như sau:
µC(x) = u (µA(x), µB(x))



×