Tải bản đầy đủ (.doc) (96 trang)

Tìm hiểu phương pháp lập luận mờ và ứng dụng để xây dựng hệ dự đoán bệnh đái tháo đường

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.56 MB, 96 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC HUẾ
TRƯỜNG ĐẠI HỌC KHOA HỌC

TRẦN THỊ THU HUYỀN

TÌM HIỂU PHƯƠNG PHÁP LẬP LUẬN MỜ
VÀ ỨNG DỤNG ĐỂ XÂY DỰNG HỆ DỰ
ĐOÁN BỆNH ĐÁI THÁO ĐƯỜNG

CHUYÊN NGÀNH: KHOA HỌC MÁY TÍNH
MÃ SỐ: 60.48.01.01

LUẬN VĂN THẠC SĨ KHOA HỌC
CÔNG NGHỆ THÔNG TIN

NGƯỜI HƯỚNG DẪN KHOA HỌC
PGS.TS. LÊ MẠNH THẠNH

Thừa Thiên Huế, 2018


LỜI CAM ĐOAN
Tôi xin cam đoan những kiến thức trình bày trong luận văn này là do tôi tìm
hiểu, nghiên cứu và trình bày lại theo cách hiểu của tôi. Trong quá trình làm luận
văn tôi có tham khảo các tài liệu có liên quan và đã ghi rõ nguồn tài liệu tham khảo
đó. Phần lớn những kiến thức tôi trình bày trong luận văn này chưa được trình bày
hoàn chỉnh trong bất cứ tài liệu nào.
Luận văn này chưa bao giờ được nộp để nhận bất kỳ bằng cấp nào tại các
trường đại học hoặc cơ sở đào tạo khác.
Thừa Thiên Huế, tháng 09 năm 2018


Học viên

Trần Thị Thu Huyền

i


LỜI CẢM ƠN
Để hoàn thành được luận văn này, trước hết tôi xin gửi lời cảm ơn sâu sắc
nhất tới PGS. TS Lê Mạnh Thạnh, Khoa CNTT trường Đại học khoa học - Đại Học
Huế đã tận tình hướng dẫn, chỉ bảo, định hướng, đóng góp những ý kiến quý báu
trong suốt quá trình tôi thực hiện luận văn.
Tôi cũng bày tỏ lòng biết ơn các điều dưỡng và các bác sỹ chuyên khoa tại
Bệnh viện đa khoa tỉnh Quảng Trị. Các anh, chị đã rất nhiệt tình giải thích vấn đề
chuyên môn giúp tôi hoàn thành tốt công việc của mình.
Tôi xin chân thành cảm ơn quý thầy, cô trong Khoa Công nghệ thông tin,
Phòng Đào tạo Sau đại học, Trường Đại học Khoa học - Đại học Huế đã tạo mọi
điều kiện tốt nhất để tôi hoàn thành khóa học này.
Cuối cùng, tôi xin chân thành cảm ơn cơ quan và các đồng nghiệp đã hết sức
tạo điều kiện cho tôi trong suốt quá trình học tập và làm luận văn. Đồng thời, chân
thành cảm ơn gia đình, bạn bè, những người luôn khuyến khích và giúp đỡ tôi trong
những lúc khó khăn để tôi có thể hoàn thành tốt luận văn của mình.
Thừa Thiên Huế, tháng 09 năm 2018
Học viên

Trần Thị Thu Huyền

ii



MỤC LỤC
Lời cam đoan...................................................................................................I
Lời cảm ơn......................................................................................................II
Mục lục..........................................................................................................III
Danh mục các bảng.......................................................................................VI
Danh mục các hình......................................................................................VII
Danh mục các chữ viết tắt.........................................................................VIII
MỞ ĐẦU..........................................................................................................1
1. Lý do chọn đề tài......................................................................................1
2. Mục tiêu nghiên cứu.................................................................................3
3. Đối tượng và phạm vi nghiên cứu.............................................................3
4. Phương pháp nghiên cứu..........................................................................3
5. Ý nghĩa khoa học và thực tiễn của luận văn.............................................4
6. Bố cục luận văn........................................................................................4
CHƯƠNG 1. CƠ SỞ LÝ THUYẾT...............................................................5
1.1. LÝ THUYẾT TẬP MỜ.....................................................................5
1.1.1. Tập kinh điển.............................................................................6
1.1.2. Định nghĩa tập mờ.....................................................................6
1.1.3. Các thông số đặc trưng cho tập mờ...........................................9
1.1.4. Biến ngôn ngữ............................................................................9
1.1.5. Các phép tính trên tập mờ .......................................................11
1.1.6. Quan hệ mờ..............................................................................14
1.2. CÂY QUYẾT ĐỊNH.......................................................................15
1.2.1. Định nghĩa cây quyết định.......................................................15
1.2.2. Ưu điểm của cây quyết định.....................................................16
1.2.3. Vấn đề xây dựng cây quyết định...............................................17
1.2.4. Rút ra các luật từ cây quyết định.............................................17
1.2.5. Thuật toán xây dựng cây quyết định C4.5................................17
1.3. CÂY QUYẾT ĐỊNH MỜ................................................................19


iii


1.3.1. Định nghĩa cây quyết định mờ.................................................19
1.3.2. Dữ liệu mẫu với biểu diễn mờ..................................................19
1.4. TIỂU KẾT CHƯƠNG 1..................................................................23
CHƯƠNG 2. LOGIC MỜ VÀ LẬP LUẬN MỜ.........................................24
2.1. LOGIC MỜ.....................................................................................24
2.1.1. Mệnh đề mờ.............................................................................24
2.1.2. Tập luật mờ..............................................................................25
2.1.3. Phép toán kéo theo mờ............................................................26
2.2. PHƯƠNG PHÁP LẬP LUẬN XẤP XỈ DỰA TRÊN TẬP MỜ.......26
2.3. PHÉP SUY DIỄN MỜ.....................................................................29
2.4. HỆ MỜ............................................................................................31
2.4.1. Cấu trúc và hoạt động của hệ mờ tổng quát............................31
2.4.2. Cơ sở luật mờ...........................................................................32
2.4.3. Bộ suy diễn mờ.........................................................................33
2.4.4. Bộ mờ hoá................................................................................35
2.4.5. Bộ giải mờ................................................................................36
2.5. TIỂU KẾT CHƯƠNG 2..................................................................37
CHƯƠNG 3. XÂY DỰNG HỆ DỰ ĐOÁN BỆNH ĐÁI THÁO ĐƯỜNG....38
3.1. TỔNG QUAN VỀ BỆNH ĐÁI THÁO ĐƯỜNG............................38
3.1.1. Thực trạng bệnh đái tháo đường..............................................38
3.1.2. Định nghĩa bệnh đái tháo đường............................................39
3.1.3. Nguyên nhân, các yếu tố nguy cơ của bệnh đái tháo đường....39
3.1.4. Triệu chứng đặc trưng của bệnh đái tháo đường.....................40
3.1.5. Chẩn đoán và phân loại bệnh đái tháo đường.........................42
3.2. QUY TRÌNH CHẨN ĐOÁN BỆNH...............................................47
3.2.1. Lập luận chẩn đoán bệnh:........................................................47
3.2.2. Các kiểu triệu chứng................................................................48

3.2.3. Quy trình chẩn đoán bệnh........................................................48
3.2.4. Các quy luật chẩn đoán...........................................................49

iv


3.3. QUY TRÌNH ỨNG DỤNG LOGIC MỜ VÀO CHẨN ĐOÁN
BỆNH ĐÁI THÁO ĐƯỜNG..........................................................................49
3.3.1. Mô tả bài toán..........................................................................49
3.3.2. Mô hình kiến trúc hệ thống......................................................49
3.3.3. Thu thập dữ liệu.......................................................................50
3.3.4. Xây dựng và biểu diễn tri thức mờ...........................................52
3.4. THIẾT KẾ HỆ THỐNG..................................................................63
3.5. THỬ NGHIỆM VÀ ĐÁNH GIÁ.....................................................66
3.6. TIỂU KẾT CHƯƠNG 3..................................................................67
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN....................................................68
TÀI LIỆU THAM KHẢO............................................................................70
PHỤ LỤC

v


DANH MỤC CÁC BẢNG
Bảng 1.1. Bảng dữ liệu phân lớp mức lương.......................................................16
Bảng 1.2. Dữ liệu mẫu về việc tự lái xe đi làm (Car Driving).............................20
Bảng 1.3. Biểu diễn mờ của tập mẫu....................................................................22
Bảng 3.1. Bảng dữ liệu huấn luyện.......................................................................54
Bảng 3.2. Bảng phân loại chức năng....................................................................63

vi



DANH MỤC CÁC HÌNH
Hình 1.1. Hàm thuộc µA(x) của tập kinh điển A....................................................6
Hình 1.2. Hàm thuộc µB(x) của tập mờ B..............................................................7
Hình 1.3. Ba tập mờ Cold (lạnh), Warm (ấm) và Hot (nóng) dạng hình thang.. 8
Hình 1.4. Đồ thị hàm thuộc của tập mờ A với các số tự nhiên nhỏ hơn 5............8
Hình 1.5. Độ cao, miền xác định, miền tin cậy của tập mờ...................................9
Hình 1.6. Biến ngôn ngữ........................................................................................10
Hình 1.7. Hợp của hai tập mờ...............................................................................11
Hình 1.8. Giao của hai tập mờ..............................................................................12
Hình 1.9. Bù của một tập mờ................................................................................12
Hình 1.10. Cây quyết định phân lớp mức lương.................................................16
Hình 1.11. Hình biểu diễn hàm thuộc của thuộc tính Tắc đường (MF).............21
Hình 1.12. Quá trình phát triển cây của thuật toán Fuzzy ID3.........................23
Hình 2.1. Cấu trúc của mô hình mờ.....................................................................31
Hình 2.2. Mô hình hệ mờ nhiều đầu vào – một đầu ra.......................................32
Hình 2.3. Các dạng hàm thuộc thường được sử dụng trong hệ mờ...................36
Hình 2.4. Phương pháp giải mờ cực đại...............................................................37
Hình 2.5. Phương pháp giải mờ trọng tâm..........................................................37
Hình 3.1. Mô hình kiến trúc hệ thống chẩn đoán bệnh......................................50
Hình 3.2. Các hàm thuộc của mức độ tiểu...........................................................55
Hình 3.3. Các hàm thuộc của mức độ uống nước................................................56
Hình 3.4. Các hàm thuộc của mức độ ăn.............................................................57
Hình 3.5. Các hàm thuộc của mức độ giảm cân..................................................58
Hình 3.6. Các hàm thuộc biểu diễn nồng độ Glucose máu lúc đói.....................59
Hình 3.8. Form chẩn đoán bệnh đái tháo đường.................................................64
Hình 3.9. Form chẩn đoán bệnh đái tháo đường với bộ dữ liệu cụ thể.............64
Hình 3.10. Form chỉ dẫn cách phòng bệnh đái tháo đường...............................65
Hình 3.11. Form chỉ dẫn cách điều trị bệnh đái tháo đường..............................66


vii


DANH MỤC CÁC CHỮ VIẾT TẮT
WHO (World Health Organization):

Tổ chức Y tế Thế giới

IDF (International Diabetes Federation): Liên đoàn Đái tháo đường quốc tế
OGTT (Oral glucose tolerance test):

Nghiệm pháp dung nạp glucose

FPG (fasting plasma glucose):

Glucose máu lúc đói

TCYTTG:

Tổ chức y tế thế giới

KPDL (Data mining)

Khai phá dữ liệu

CNTT:

Công nghệ thông tin


ĐTĐ:

Đái tháo đường

viii


MỞ ĐẦU
1. Lý do chọn đề tài
Chuẩn đoán bệnh trong y học là một lĩnh vực tương đối phức tạp, lĩnh vực này
có những đặc điểm khác biệt đó là mối quan hệ tương hỗ giữa lý thuyết và thực
hành. Đối tượng của lĩnh vực này là những bệnh nhân, những con người thực sự.
Kiến thức y học cũng khá phức tạp. Để tìm ra những kiến thức mới, phương
pháp truyền thống là dựa trên sự mô tả của các hồ sơ bệnh án, nhật ký y khoa, cơ sở
dữ liệu đề tài nghiên cứu,… Chính vì thế, người bác sỹ thường bị tràn ngập trong
núi dữ liệu khổng lồ. Và đặc biệt là những dữ liệu đó ở mỗi bệnh nhân lại có sự mơ
hồ khác nhau, gắn với cảm xúc của mỗi người. Người bác sỹ luôn phải làm việc
trong trạng thái căng thẳng trong khi yêu cầu phải đưa ra được những quyết định
đúng đắn hiệu quả nhất.
Hiện nay, Đái tháo đường là bệnh nhận được sự quan tâm đặc biệt trong giới y
khoa. Bệnh này nằm trong số 10 nguyên nhân gây tử vong và tàn phế hàng đầu ở cả
hai giới, gây ra các biến chứng nặng nề về tim mạch, tổn thương thần kinh, mù mắt,
suy thận, nhiễm trùng và gây tổn thương bàn chân có thể dẫn đến phải cắt cụt chi.
Bệnh đã và đang trở thành vấn đề mang tính xã hội cao ở nhiều quốc gia bởi sự
bùng phát nhanh chóng, mức độ nguy hại đến sức khoẻ. ĐTĐ còn trở thành lực cản
của sự phát triển, gánh nặng cho toàn xã hội khi mà mỗi năm thế giới phải chi số
tiền khổng lồ từ 232 tỷ đến 430 tỷ USD cho việc phòng chống và điều trị.
Theo Tổ chức y tế thế giới (WHO), năm 1985 có khoảng 30 triệu người mắc
đái tháo đường trên toàn cầu, năm 2004 có khoảng 98,9 triệu người mắc, đến năm
2009 có khoảng 180 triệu người và con số đó có thể tăng gấp đôi lên tới 366 triệu

người vào năm 2030.
Hiện Việt Nam có trên 5 triệu người mắc bệnh đái tháo đường. Theo Bộ y tế,
con số này được dự báo tiếp tục gia tăng trong thời gian tới. Theo thống kê trong 10
năm qua, số lượng bệnh nhân mắc bệnh đái tháo đường ở nước ta tăng 211%, và với
con số này, Việt Nam nằm trong số các quốc gia có tốc độ tăng bệnh nhân đái tháo

1


đường cao nhất thế giới. Thống kê của Liên đoàn Đái tháo đường quốc tế (IDF) cho
thấy, trên 50% bệnh nhân đái tháo đường ở Việt Nam chết vì căn bệnh này trước
năm 60 tuổi.
Biện pháp hữu hiệu để làm giảm tiến triển và biến chứng của bệnh, chi phí
chữa bệnh ít tốn kém nhất là phải phát hiện sớm và điều trị cho bệnh nhân kịp thời.
Tuy nhiên, công tác phát hiện sớm, chăm sóc và điều trị bệnh đái tháo đường còn
gặp rất nhiều khó khăn do kết quả chẩn đoán phụ thuộc rất nhiều vào kinh nghiệm
của bác sỹ cũng như suy luận tại thời điểm chẩn đoán, chứ không dựa trên quy tắc
tiêu chuẩn nào.
Một hệ thống chẩn đoán bệnh, sẽ hỗ trợ cho bác sỹ rất nhiều trong việc đưa ra
kết quả chẩn đoán cuối cùng. Với việc áp dụng CNTT, ngành y tế hiện nay đã đạt
được nhiều thành tựu to lớn trong việc vận hành hệ thống khám chữa bệnh. Đặc biệt
là việc ứng dụng các kỹ thuật như hệ hỗ trợ quyết định, khai phá dữ liệu, hệ chuyên
gia, logic mờ để xây dựng các hệ thống chẩn đoán bệnh đã giúp các bác sỹ chuyên
khoa có thể tiếp cận và đưa ra chẩn đoán bệnh một cách nhanh chóng, chính xác. Từ
đó, có thể đưa ra phương pháp điều trị bệnh hiệu quả, đồng thời tiết giảm chi phí
điều trị.
Trong lĩnh vực y tế tri thức chuyên gia là rất quan trọng và những tri thức này
phần lớn được phát biểu bằng ngôn ngữ với các thông tin mờ và không chắc chắn,
chuyên gia càng làm việc lâu năm thì càng tích luỹ nhiều kinh nghiệm, nhưng kinh
nghiệm này không tồn tại mãi mãi với thời gian, vì vòng đời của con người là có

giới hạn. Vì vậy, nghiên cứu phát triển phương pháp luận nhằm thu thập, duy trì và
khai thác để phát huy được các tri thức chuyên gia này là một nhu cầu rất cần thiết.
Chính vì vậy, tôi chọn đề tài nghiên cứu: “Tìm hiểu phương pháp lập luận
mờ và ứng dụng để xây dựng hệ dự đoán bệnh đái tháo đường”, nhằm góp phần
phát triển phương pháp luận phục vụ việc thu thập các tri thức chuyên gia y tế trong
môi trường thông tin mờ, không chắc chắn và xây dựng một hệ hỗ trợ chẩn đoán
giúp các y bác sỹ chuyên khoa có thể đưa ra chẩn đoán bệnh đái tháo đường chính
xác hơn và có cách điều trị phù hợp.
2


2. Mục tiêu nghiên cứu
- Mục tiêu chung: Tìm hiểu Logic mờ, phương pháp lập luận mờ và ứng dụng
một số kỹ thuật tổng hợp trong hệ hỗ trợ quyết định để xây dựng hệ dự đoán bệnh
đái tháo đường.
- Các mục tiêu cụ thể: Ứng dụng cấu trúc của hệ hỗ trợ ra quyết định, logic
mờ, các phương pháp xây dựng cơ sở dữ liệu; Kết hợp thu thập ý kiến chuyên gia,
khai phá hồ sơ bệnh án và các nguồn dữ liệu khác để xây dưng tập luật, đánh giá tập
luật nhằm phục vụ cho việc xây dựng hệ dự đoán bệnh.
3. Đối tượng và phạm vi nghiên cứu
- Về lý thuyết: Nghiên cứu về Logic mờ, phương pháp mờ hóa, hệ hỗ trợ
quyết định (hệ mờ), phân lớp dữ liệu bằng cây quyết định để xây dựng hệ chẩn đoán
bệnh đái tháo đường.
- Về thực hành: Địa bàn tỉnh Quảng Trị, khảo sát các bệnh nhân tuổi từ 30 đến
65 nhập viện điều trị bệnh đái tháo đường tại bệnh viện đa khoa tỉnh Quảng Trị,
thời gian khảo sát một năm từ tháng 12/2016 - 12/2017.
4. Phương pháp nghiên cứu
- Phương pháp nghiên cứu lý thuyết: Tổng hợp, phân tích các công trình
nghiên cứu liên quan đến logic mờ, hệ hỗ trợ quyết định; hồ sơ bệnh án, hướng dẫn
chẩn đoán và điều trị bệnh đái tháo đường của Bộ y tế. Lựa chọn các kỹ thuật ứng

dụng cho bài toán thực tế.
- Phương pháp kế thừa: các thông tin và các số liệu thống kê đã được thu thập;
- Phương pháp chuyên gia: Hỏi ý kiến chuyên gia về các lĩnh vực chuyên
môn: Y tế, giáo dục, khoa học môi trường,...
- Phương pháp nghiên cứu thực tiễn: tìm hiểu kết quả khám và chữa bệnh của
các bệnh nhân đái tháo đường tại một số bệnh viện trên địa bàn.
- Phương pháp tổng hợp thu thập thông tin, phân tích thông tin: xác định cấu trúc
và tính chất của thông tin, để tìm ra phương pháp thu thập, xử lý số liệu thích hợp.

3


5. Ý nghĩa khoa học và thực tiễn của luận văn
- Biết các yếu tố cơ bản của logic mờ và ứng dụng.
- Hiểu được phương pháp chẩn đoán bệnh đái tháo đường.
- Ứng dụng được lý thuyết logic mờ trong CNTT vào hệ hỗ trợ chẩn đoán
bệnh đái tháo đường.
- Luận văn mang tính nhân văn và xã hội.
6. Bố cục luận văn
Nội dung chính của luận văn gồm 3 chương:
Chương 1. Cơ sở lý thuyết về tập mờ và cây quyết định.
Nội dung của Chương này chủ yếu giới thiệu cơ sở lý thuyết về tập mờ, biến
ngôn ngữ, quan hệ mờ, cây quyết định và cây quyết định mờ.
Chương 2. Logic mờ và lập luận mờ.
Nội dung của Chương 2 trình bày tổng quan về Logic mờ, các phương pháp
lập luận xấp xỉ, lập luận mờ và hệ mờ tổng quát.
Chương 3. Xây dựng hệ dự đoán bệnh đái tháo đường.
Nội dung của Chương là trình bày tổng quan về bệnh đái tháo đường, quy
trình chẩn đoán bệnh và ứng dụng logic mờ, cây quyết định mờ để xây dựng hệ dự
đoán bệnh đái tháo đường.


4


CHƯƠNG 1. CƠ SỞ LÝ THUYẾT
Logic mờ được giáo sư L.A.Zadeh công bố lần đầu tiên tại Mỹ vào năm 1965.
Ứng dụng đầu tiên của logic mờ vào công nghiệp được thực hiện ở Châu Âu,
khoảng sau năm 1970. Tại trường Queen Mary ở Luân Đôn – Anh, Ebrahim
Mamdani dùng logic mờ để điều khiển một máy hơi nước mà trước đây ông ấy
không thể điều khiển được bằng các kỹ thuật cổ điển. Ở Đức, Hans Zimmermann
dùng logic mờ cho các hệ ra quyết định và liên tiếp sau đó, logic mờ được áp dụng
vào các lĩnh vực khác nhau. Kể từ năm 1980, logic mờ đạt được nhiều thành công
trong các ứng dụng ra quyết định và phân tích dữ liệu ở Châu Âu. Nhiều kỹ thuật
logic mờ cao cấp được nghiên cứu và phát triển trong lĩnh vực này.
Các công ty của Nhật bắt đầu dùng logic mờ vào kỹ thuật điều khiển từ năm
1980. Nó được ứng dụng trong nhà máy xử lý nước của Fuji Electric vào năm 1983,
hệ thống xe điện ngầm của Hitachi vào năm 1987. Những thành công đầu tiên đã
tạo ra nhiều quan tâm ở Nhật. Có nhiều lý do để giải thích tại sao logic mờ được ưa
chuộng. Thứ nhất, logic mờ cho phép tạo nhanh các bản mẫu rồi tiến đến việc tối
ưu. Thứ hai, các hệ dùng logic mờ đơn giản và dễ hiểu. Logic mờ cung cấp cho họ
một phương tiện rất minh bạch để thiết kế hệ thống. Do đó, logic mờ được dùng
nhiều trong các ứng dụng thuộc lĩnh vực điều khiển thông minh hay xử lý dữ liệu.
Ngoài ra, logic mờ cũng được dùng để tối ưu nhiều quá trình hóa học và sinh học.
Từ những thành công tại Nhật Bản, Mỹ và các nước Châu Âu đã bắt đầu quan
tâm đến logic mờ và ứng dụng chúng trong các lĩnh vực điều khiển tự động, công
nghiệp dân dụng và cũng từ đó logic mờ đã trở thành một kỹ thuật thiết kế “chuẩn”
và được chấp nhận rộng rãi trong cộng đồng.
1.1. LÝ THUYẾT TẬP MỜ
Ý tưởng nổi bật của khái niệm tập mờ của Zadeh là từ những khái niệm trừu
tượng về ngữ nghĩa của thông tin mờ, không chắc chắn như trẻ, nhanh, cao-thấp,

xinh đẹp,... Ông đã tìm ra cách biểu diễn nó bằng một khái niệm toán học, được
gọi là tập mờ, như là một sự khái quát trực tiếp của khái niệm tập hợp kinh điển.

5


1.1.1. Tập kinh điển
Khái niệm tập hợp được hình thành trên nền tảng lôgic và được định nghĩa
như là sự sắp xếp chung các đối tượng có cùng tính chất, được gọi là phần tử của
tập hợp đó.
Cho một tập hợp A, một phần tử x thuộc A được ký hiệu: x ∈ A. Thông thường
ta dùng hai cách để biểu diễn tập hợp kinh điển, đó là: Liệt kê các phần tử của tập
hợp, chẳng hạn: tập A1 = {Trắng, đen, xanh, đỏ, tím, vàng}.
Biểu diễn tập hợp thông qua tính chất tổng quát của các phần tử, chẳng hạn:
tập các số thực (R), Tập các số tự nhiên (N).
Để biểu diễn một tập hợp A trên tập nền X, ta dùng hàm thuộc µA(x), với:
.

Ký hiệu A

. Ta nói: tập A

được định nghĩa trên nền tập X.
Ví dụ 1.1. Tập A = {x ∈ X | -5 ≤ x ≤ 5}.

Hình 1.1. Hàm thuộc µA(x) của tập kinh điển A

1.1.2. Định nghĩa tập mờ
Các tập mờ hay tập hợp mờ (Fuzzy set) là một mở rộng của lý thuyết tập
hợp cổ điển và được dùng trong lôgic mờ. Trong lý thuyết tập hợp cổ điển, quan hệ

thành viên của các phần tử trong một tập hợp được đánh giá theo kiểu nhị phân theo
một điều kiện rõ ràng - một phần tử hoặc thuộc hoặc không thuộc về tập hợp.
Ngược lại, lý thuyết tập mờ cho phép đánh giá từ từ về quan hệ thành viên giữa một
phần tử và một tập hợp; quan hệ này được mô tả bằng một hàm thuộc µ→[0,1]. [5]
6


Tập hợp mờ là tập hợp mà mỗi thành phần là một bộ số ( x,  ( x)) . Như vậy, ta
nói A là tập mờ nếu A có biểu diễn: A = {(x, µA(x)) | x ∈ X}.
A là tập mờ trên không gian nền X nếu A được xác định bởi hàm:
.
Trong đó:
X : là tập nền hay được gọi là tập vũ trụ của tập mờ A;
là hàm thuộc (membership function);
là độ thuộc của x vào tập mờ A.
Các tập mờ được coi là một mở rộng của lý thuyết tập hợp cổ điển là vì, với
một universe (Không gian tham chiếu hay không gian nền) nhất định, một hàm
thuộc có thể giữ vai trò của một hàm đặc trưng (indicator function) ánh xạ mỗi
phần tử tới một giá trị 0 hoặc 1 như trong khái niệm cổ điển.
Trong khái niệm tập hợp kinh điển hàm thuộc µA(x) của tập A, chỉ có một trong
hai giá trị là "1" nếu x ∈ A hoặc "0" nếu x ∉ A.
Ví dụ 1.2. Cách biểu diễn hàm thuộc như trên sẽ không phù hợp với những tập
được mô tả "mờ" như tập B gồm các số thực gần bằng 5:
B = { x ∈ R | x ≈5 }.

Khi đó ta không thể khẳng định chắc chắn số 4 có thuộc B hay không? mà chỉ
có thể nói nó thuộc B bao nhiêu phần trăm. Để trả lời được câu hỏi này, ta phải coi

hàm thuộc


có giá trị trong khoảng từ 0 đến 1 tức là:

7

1.


Hình 1.2. Hàm thuộc µB(x) của tập mờ B

Từ phân tích trên ta có định nghĩa: Tập mờ B xác định trên tập kinh điển M là

tập mà một phần tử của nó được biểu diễn bởi một cặp giá trị

Trong đó x ∈ M và

là ánh xạ. Ánh xạ

.

được gọi là hàm thuộc của

tập mờ B. Tập kinh điển M được gọi là cơ sở của tập mờ B.
Như vậy về phương diện giải tích mỗi tập mờ ứng với một hàm số và hàm số
có đồ thị của nó. Những tập mờ thường gặp đồ thị của hàm thuộc (membership
function) có hình dạng là hình tam giác hoặc hình thang mà người ta thường gọi vắn
tắt là “tập mờ hình thang” hoặc “tập mờ hình tam giác” như hình vẽ dưới đây:

h1
Hình 1.3. Ba tập mờ Cold (lạnh), Warm (ấm) và Hot (nóng) dạng hình thang.


Theo hình vẽ này tại điểm h1 trên trục nhiệt độ (temperature) chiếu lên đầu
tiên ta thấy cắt tập mờ warm tại điểm mà ta có thể thấy được là “hơi ấm”, đồng
thời cắt tập mờ cold tại điểm mà ta thấy là “tương đối lạnh”. Tóm lại ở nhiệt độ h1
có thể xem là “hơi ấm” hoặc “tương đối lạnh”.

8


Ví dụ 1.3. Một tập mờ A với các số tự nhiên nhỏ hơn 5 được mô tả bằng hàm
thuộc

có đồ thị như sau:

Hình 1.4. Đồ thị hàm thuộc của tập mờ A với các số tự nhiên nhỏ hơn 5

Ta có tập mờ

.

 Số tự nhiên 1 và 2 có độ phụ thuộc là 1;
 Số tự nhiên 3 và 4 có độ phụ thuộc thấp hơn 1;
 Các số không liệt kê có độ phụ thuộc là 0.
1.1.3. Các thông số đặc trưng cho tập mờ
Các thông số đặc trưng cho tập mờ là độ cao, miền xác định và miền tin cậy.

Hình 1.5. Độ cao, miền xác định, miền tin cậy của tập mờ

- Độ cao của một tập mờ B (Định nghĩa trên cơ sở M), ký hiệu là H(B), là cận
trên đúng (giá trị lớn nhất) của hàm thuộc µB trên M, có nghĩa:
H(B) = sup{µB(x)| x ∈ M}.

Một tập mờ B được gọi là tập mờ chuẩn nếu H(B) = 1. Ngược lại, tập mờ B
được gọi là dưới chuẩn (H(B) < 1).

9


- Miền xác định (Giá) của tập mờ B (Định nghĩa trên cơ sở M), ký hiệu là
S(B), là tập con của M có giá trị hàm thuộc khác không, có nghĩa:
S(B) = {x ∈ M|µB(x) > 0}.
- Miền tin cậy của tập mờ B (định nghĩa trên cơ sở M), ký hiệu là T(B), là tập
con của M có giá trị hàm thuộc bằng 1:
T(B) = {x ∈ M|µB(x) = 1}.
1.1.4. Biến ngôn ngữ
Biến ngôn ngữ là phần chủ đạo trong các hệ thống dùng logic mờ. Các biến
ngôn ngữ được xác định thông qua các tập giá trị mờ của nó.
Ví dụ các tập mờ mô tả biến nhiệt độ là “rất nóng”, “hơi nóng”, “trung bình”,
“hơi lạnh” và “rất lạnh”. Chúng được gọi là các tập ngôn ngữ, mang một khoảng giá
trị nào đó của biến ngôn ngữ và được thể hiện trong cùng một không gian nền U.

Hình 1.6. Biến ngôn ngữ

Các luật trong hệ logic mờ mô tả tri thức của hệ. Chúng dùng các biến ngôn
ngữ như là từ vựng để mô tả các tầng điều khiển trong hệ. Việc giải thích các luật
mờ cũng là việc trình bày cách tính các khái niệm ngôn ngữ.
Khái niệm biến ngôn ngữ [5], [13]:
Một biến ngôn ngữ được xác định bởi bộ năm (X, T(X), U, R, M), trong đó:
- X là tên biến.
Ví dụ 1.4. Các biến ngôn ngữ: “nhiệt độ”, “tốc độ”, “độ ẩm”,…
- T(X) là tập các giá trị ngôn ngữ của biến X.


10


Ví dụ 1.5. T(tốc độ)={rất chậm, hơi chậm, trung bình, hơi nhanh, rất nhanh}.
- U là không gian tham chiếu của biến cơ sở u, mỗi giá trị ngôn ngữ xem như
là một biến mờ trên U kết hợp với biến cơ sở u (các giá trị mà biến X có thể nhận).
Ví dụ 1.6. X là “tốc độ” thì U = [0, 150] (km/h).
- R là tập luật cú pháp sinh các giá trị ngôn ngữ của T(X).
Ví dụ 1.7. R phát sinh tên các phần tử trong T(tốc độ) là hoàn toàn trực giác.
- M là tập các luật ngữ nghĩa gán mỗi giá trị ngôn ngữ trong T(X) với một
tập mờ trên U.

11


Ví dụ 1.8. Luật ngữ ngĩa M được định nghĩa là :
M (rất chậm) = tập mờ đối với tốc độ là 0 km/h và có hàm thuộc là µrất chậm;
M (hơi chậm) = tập mờ đối với tốc độ là 20 km/h và có hàm thuộc là µhơi chậm;
M (trung bình) = tập mờ đối với tốc độ là 40 km/h và có hàm thuộc là µtrung bình;
M (hơi nhanh) = tập mờ đối với tốc độ là 60 km/h và có hàm thuộc là µhơi nhanh;
M (rất nhanh) = tập mờ đối với tốc độ là 80 km/h và có hàm thuộc là µrất nhanh.
Từ định nghĩa trên chúng ta có thể nói rằng biến ngôn ngữ là biến có thể nhận
giá trị là các tập mờ trên một vũ trụ nào đó. Để biểu diễn sự nhấn mạnh một biến
ngôn ngữ, người ta hay dùng các từ như rất, hơi, ít, nhiều,… gọi là các gia tử.
1.1.5. Các phép tính trên tập mờ [5], [14]
Phép hợp mờ (Union)
Cho A, B là hai tập mờ xác định trên tập vũ trụ X và có các hàm thuộc lần lượt
là µA, µB. Hợp của hai tập mờ A và B là một tập mờ, ký hiệu A∪B, với hàm thuộc
µA∪B được định nghĩa như sau:
.


Hình 1.7. Hợp của hai tập mờ

Phép giao mờ (Intersection)
Cho A, B là hai tập mờ xác định trên tập vũ trụ X và có các hàm thuộc lần luợt
là µA, µB. Giao của hai tập mờ A và B là một tập mờ, ký hiệu A∩B, với hàm thuộc

được định nghĩa như sau:

12


.

Hình 1.8. Giao của hai tập mờ

Phép lấy phần bù của một tập mờ.
Cho A là tập mờ xác định trên tập vũ trụ X, có hàm thuộc µA. Phép lấy bù của
tập A là một tập mờ, ký hiệu ~A, với hàm thuộc được định nghĩa như sau:
µ~A = 1- µA, ∀x ∈ X.

Hình 1.9. Bù của một tập mờ

Tích đại số của hai tập mờ
Cho A, B là hai tập mờ xác định trên tập vũ trụ X và có các hàm thuộc lần lượt



. Tích đại số của hai tập mờ A và B là một tập mờ, ký hiệu A.B, với


hàm thuộc được định nghĩa như sau:

µA.B(x) = µA(x).µB(x), ∀x∈X.
Tổng đại số của hai tập mờ

13


Cho A, B là hai tập mờ xác định trên tập vũ trụ X và có các hàm thuộc lần lượt



,

. Tổng đại số của hai tập mờ A và B là một tập mờ, ký hiệu

, với hàm

thuộc được định nghĩa như sau:
∀x ∈ X.

Tích Descartes của hai tập mờ
Cho A, B là hai tập mờ xác định trên tập vũ trụ tương ứng X và Y. Tích
Descartes của hai tập mờ A và B trong X, ký hiệu AxB là một tập mờ trên tập vũ trụ
XxYcó hàm thuộc được xác định như sau:
µA x B(x, y) = min{µA(x), µB(y)}, ∀(x, y) ∈ XxY.
Phép T-norm
Định nghĩa : Một hàm 2 biến T: [0,1]x[0,1]  [0,1] được gọi là phép t-norm
nếu thỏa mãn các tính chất sau với ∀x, x’, y, z ∈ [0,1] :
1) Tính chất điều kiện biên : T(x, 1) = x (Tồn tại phần tử đơn vị);

2) Tính chất giao hoán : T(x, y) = T(y, x) ;
3) Tính chất đơn điệu : x ≤ x’ � T(x, y) ≤ T(x’, y) ;
4) Tính chất kết hợp : T(T(x, y),z) = T(x, T(y, z)).
Dễ dàng kiểm chứng phép min và phép tích đại số là các phép t-norm, chúng
được ký hiệu là Tm và Tp. Phép t-norm Tm được gọi là phép giao mờ chuẩn.
Một số phép t-norm hay được sử dụng :
- Phép giao mờ chuẩn: Tm = min{x, y} ;
- Phép tích đại số: x.y ;
- Phép hiệu giới nội: T(x, y) = max{0, x + y - 1} ;

14


x nếu y = 1,
- Phép giao chặt: T(x, y) =

y nếu x = 1,
0 nếu x ≠ 1 và y ≠ 1.

Phép T-conorm
Một phép tính ‘‘đối ngẫu’’ với phép t-norm được gọi là phép t-conorm và được
định nghĩa như sau :
Định nghĩa: Một hàm 2 biến S: [0,1]x[0,1] [0,1] được gọi là phép t-conorm,
hay còn gọi là S-norm nếu thỏa mãn các tính chất sau với ∀x, x’, y, z ∈ [0,1]:
1) Tính chất giới nội : S(x, 0) = x (Tồn tại phần tử đơn vị) ;
2) Tính chất giao hoán : S(x, y) = S(y, x) ;
3) Tính chất đơn điệu : x ≤ x’ � S(x, y) ≤ S(x’, y) ;
4) Tính chất kết hợp : S(S(x, y), z) = S(x, S(y, z)).
Như vậy, chỉ có tính chất 1) làm nên sự khác biệt giữa hai họ phép tính
T-norm và S-norm.

Một số phép t-norm hay được sử dụng :
- Sm(x, y) = min{x, y} ;
- SL(x, y) = min{1, x + y} ;
- SP(x, y) = x + y - x.y ;
x nếu y = 0,
- S*(x, y) =

y nếu x = 0,
1 nếu x ≠ 0 và y ≠ 0.

Về mặt ý nghĩa logic, phép T-norm được sử dụng để mở rộng ngữ nghĩa của
phép AND, còn phép S-norm để mở rộng ngữ nghĩa của phép OR.
1.1.6. Quan hệ mờ
Khái niệm về quan hệ mờ:
Cho X và Y là hai không gian nền, R được gọi là một quan hệ mờ trên X x Y
nếu R là một tập mờ trên X x Y, tức là có một hàm thuộc :
15


µR: X x Y  [0, 1], ở đây, µR(x, y) = R(x, y) là độ thuộc của cặp (x, y) vào
quan hệ R.
Trong trường hợp R là quan hệ rời rạc thì nó có thể biểu thị bằng một bảng
với tên hàng là tên các phần tử trong X, còn tên cột là tên các phần tử trong Y.
Nói cách khác, R được biểu diễn bởi ma trận với các giá trị chỉ mức độ quan hệ
của các cặp (x, y).

Các phép tính trên quan hệ mờ :
Vì quan hệ mờ cũng là tập mờ nên các phép tính trên tập mờ cũng là phép tính
trên quan hệ mờ. Tuy nhiên, trên quan hệ mờ có những phép tính đặc thù riêng mà
trên tập mờ nói chung không có, chẳng hạn :

 Phép đảo của quan hệ mờ R(X,Y) là R-1(Y, X) cho bởi: R-1(y, x) = R(x, y) ;
 Phép hợp thành của hai quan hệ mờ R1 và R2.
Cho R1 là quan hệ mờ trên X x Y và R2 là quan hệ mờ trên Y x Z, thì phép hợp
thành R1 o R2 là một quan hệ mờ trên X x Z.
Có 3 phép hợp thành thông dụng :

.

1.2. CÂY QUYẾT ĐỊNH
Kỹ thuật cây quyết định là một công cụ mạnh và hiệu quả trong việc phân lớp
và dự báo. Các đối tượng dữ liệu được phân thành các lớp. Các giá trị của đối tượng

16


×