ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
VÕ THỊ THỦY TÚ
ỨNG DỤNG HỆ THỐNG NHẬN DẠNG
MIỄN DỊCH NHÂN TẠO MỜ
TRONG CHẨN ĐOÁN UNG THƯ
LUẬN VĂN THẠC SĨ NGÀNH KHOA HỌC MÁY TÍNH
Thành phố Hồ Chí Minh - 2009
ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
VÕ THỊ THỦY TÚ
ỨNG DỤNG HỆ THỐNG NHẬN DẠNG
MIỄN DỊCH NHÂN TẠO MỜ
TRONG CHẨN ĐOÁN UNG THƯ
: KHOA HỌC MÁY TÍNH
: 60.48.01
LUẬN VĂN THẠC SĨ
(Chuyên ngành Khoa Học Máy Tính)
NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS. TS. LÊ HOÀI BẮC
Thành phố Hồ Chí Minh - 2009
Võ Thị Thủy Tú | Ứng dụng hệ thống nhận dạng miễn dịch nhân tạo
mờ trong chẩn đoán ung thư | K15
Trang 1
Lời cảm ơn
Đầu tiên, em xin chân thành cám ơn Ban Giám Hiệu, các Thầy Cô trường Đại học
Khoa Học Tự Nhiên cùng các Thầy Cô Khoa Công Nghệ Thông Tin đã tận tình
truyền đạt những kiến thức quí báu cho chúng em trong thời gian vừa qua.
Tiếp đến, em xin gởi lời cám ơn chân thành nhất đến PGS.TS Lê Hoài Bắc. Thầy đã
tận tình chỉ bảo em cũng như giúp đỡ kịp thời khi cần thiết trong suốt quá trình thực
hiện đề tài này.
Cuối cùng, em xin gởi tất cả tình cảm thân thương nhất đến gia đình, thầy cô và bạn
bè; những người luôn ủng hộ em về mọi mặt.
Tp. HCM, Ngày 01 Tháng 03 Năm 2009
Võ Thị Thủy Tú
Trang 2
Lời nói đầu
Ung thư là một nhóm các bệnh gồm hơn 100 căn bệnh khác nhau, trong đó các bệnh
này đều ảnh hưởng đến đơn vị cơ bản nhất của cơ thể sống, đó là tế bào. Ung thư
xuất hiện khi việc phân chia tế bào trở nên bất thường, không thể kiểm soát được từ
đó sẽ dẫn đến tử vong nhanh chóng. Tại hội thảo quốc tế “Ung thư phụ nữ và trẻ em”
tổ chức tại Hà Nội ngày 6 và 7 tháng 11 năm 2003, qua thống kê, mỗi năm Việt
Nam có 100.000 đến 150.000 người mắc bệnh ung thư được phát hiện, trong đó số
người tử vong lên đến 70.000 người. Các nghiên cứu đã chứng minh rằng nhiều loại
bệnh ung thư có thể ngăn chặn nếu được phát hiện và điều trị sớm, chẳng hạn như
ung thư vú, ung thư cổ tử cung, ung thư da, ung thư tuyến tiền liệt,… Khi các bệnh
này được phát hiện sớm và điều trị thích hợp, 95% bệnh nhân có thể sống thêm ít
nhất 5 năm.
Theo Bách khoa toàn thư mở Wikipedia tiếng Việt, Ung thư vú là loại ung thư
thường gặp nhất và gây tử vong hàng đầu ở phụ nữ nhiều nước công nghiệp phát
triển. Theo Cơ quan Nghiên cứu Ung thư Thế giới (IARC), vào năm 1998 ung thư
vú đứng đầu chiếm 21% trong tổng số các loại ung thư ở phụ nữ trên toàn thế giới
[18]. Chúng ta có thể phát hiện sớm ung thư vú bằng cách tự khám sau chu kỳ kinh
nguyệt hàng tháng; hoặc khám vú do chuyên viên y tế thực hiện (Clinical Breast
Examination – CBE); hoặc chụp quang tuyến vú (Mammogram). Nếu những
phương pháp truy tầm này khám phá ra những thay đổi bất thường của vú, tùy
trường hợp, các bác sĩ sẽ cho bệnh nhân thực hiện các thử nghiệm khác như siêu âm
(ultrasound), MRI, hay sinh thiết (thử thịt, biopsy),… để định bệnh [16]. Tuy nhiên,
kết quả chẩn đoán phụ thuộc rất nhiều đến kinh nghiệm của bác sỹ cũng như suy
luận tại thời điểm chẩn đoán, chứ không dựa trên quy tắc tiêu chuẩn nào.
Trang 3
Một hệ thống chẩn đoán ung thư, cụ thể là hệ thống phân loại mẫu ung thư, sẽ hỗ
trợ cho bác sỹ rất nhiều trong việc đưa ra kết quả chẩn đoán cuối cùng. Khi đứng
trước một quyết định khó khăn, không dựa trên một luật cố định nào, hệ thống phân
loại dựa trên vectơ đặc trưng sẽ có hiệu quả to lớn và khách quan hơn nhiều so với
các hệ thống phân loại dựa trên luật. Hệ thống nhận dạng miễn dịch nhân tạo mờ
(Artificial Immune Recognition System – AIRS) có thể đáp ứng tốt nhu cầu chẩn
đoán trong y khoa nói chung và trong chẩn đoán ung thư nói riêng. Độ chính xác
phân lớp đạt trên 96% tùy theo dữ liệu kiểm nghiệm và các tham số của thuật toán.
Logic mờ được tích hợp vào giai đoạn phân phối tài nguyên của thuật toán AIRS,
gọi là Hệ thống nhận dạng miễn dịch nhân tạo mờ (Fuzzy Artificial Immune
Recognition System – Fuzzy AIRS), nhằm làm tăng độ chính xác phân lớp. Dữ liệu
kiểm nghiệm được lấy từ trường Đại học California tại Urvine (UCI) [15].
Luận văn này gồm 5 chương, trình bày phương pháp ứng dụng Hệ thống nhận dạng
miễn dịch nhân tạo mờ vào chẩn đoán ung thư nói chung và ung thư vú nói riêng.
Chương 1 trình bày tổng quan về luận văn này. Chương 2 tiếp theo sẽ nói về hệ
thống miễn dịch tự nhiên và nhân tạo, làm tiền đề cho thuật toán cơ bản về hệ thống
AIRS được nêu ở chương 3. Chương 4 và Chương 5 giới thiệu cách xây dựng hệ
thống chẩn đoán cũng như kết quả đạt được. Tài liệu tham khảo và Phụ lục sẽ đóng
lại cuốn luận văn bằng một số định nghĩa và đề mục tham khảo thêm.
Trang 4
Mục lục
Lời cảm ơn 1
Lời nói đầu 2
Mục lục 4
Danh mục thuật ngữ và viết tắt 8
Danh mục các hình vẽ 10
Danh mục các bảng 11
Chương 1 Tổng quan 12
1.1 Phát biểu vấn đề 12
1.2 Hệ thống nhận dạng miễn dịch nhân tạo mờ 13
1.3 Hệ thống nhận dạng miễn dịch nhân tạo mờ và chẩn đoán ung thư 14
1.4 Một số nghiên cứu gần đây 15
1.4.1 Những nghiên cứu AIRS 15
1.4.2 Những nghiên cứu ung thư vú 16
1.5 Phân tích nhu cầu thực tế của ứng dụng 16
1.6 Mục tiêu của đề tài 17
1.7 Nội dung của luận văn 18
Chương 2 Các hệ thống miễn dịch: Tự nhiên và Nhân tạo 19
2.1 Hệ thống miễn dịch tự nhiên 19
2.1.1 Các thành phần miễn dịch 20
2.1.2 Nhớ và học 25
2.1.3 Tính đa dạng và tính phân phối 26
Trang 5
2.1.4 Bản chất của tự nhận biết 27
2.2 Hệ thống miễn dịch nhân tạo 27
2.2.1 Kháng nguyên, kháng thể và tế bào B 27
2.2.2 Quả cầu nhận dạng nhân tạo và sự cạnh tranh tài nguyên 28
2.3 Tế bào nhớ, đột biến và chọn lọc dòng 29
2.4 Mạng miễn dịch và sự tương tác tế bào – tế bào 30
2.5 Sự phân lớp 31
Chương 3 Thuật toán Hệ thống nhận dạng miễn dịch nhân tạo 32
3.1 Các định nghĩa 32
3.2 Thuật toán nhận dạng miễn dịch nhân tạo 35
3.2.1 Khởi tạo 36
3.2.2 Xác định tế bào nhớ và phát sinh ARB 37
3.2.3 Cạnh tranh tài nguyên và phát triển tế bào nhớ ứng viên 39
3.2.4 Giới thiệu tế bào nhớ 43
3.2.5 Phân lớp 44
3.3 Thảo luận về thuật toán AIRS 44
Chương 4 Ứng dụng vào hệ thống chẩn đoán ung thư 47
4.1 Tiến trình chẩn đoán ung thư 47
4.2 Dữ liệu nhập của hệ thống 49
4.2.1 Dữ liệu nhập ung thư vú 49
4.2.2 Dữ liệu nhập ung thư cổ tử cung 50
4.3 Dữ liệu xuất của hệ thống 51
4.3.1 Dữ liệu xuất ung thư vú 51
4.3.2 Dữ liệu xuất ung thư cổ tử cung 52
Trang 6
4.4 Xây dựng hệ thống AIRS 52
4.4.1 Khởi tạo 53
4.4.2 Xác định tế bào nhớ và phát sinh ARB 53
4.4.3 Cạnh tranh tài nguyên và phát triển tế bào nhớ ứng viên 56
4.4.4 Giới thiệu tế bào nhớ 59
4.4.5 Phân lớp 61
4.5 Tích hợp logic mờ vào AIRS – FAIRS 61
4.5.1 Biến mờ 61
4.5.2 Tập luật mờ 62
4.5.3 Hàm thành viên 63
Chương 5 Kết luận 65
5.1 Bộ dữ liệu ung thư vú 65
5.1.1 Mục đích thử nghiệm 65
5.1.2 Kết quả đạt được 65
5.2 Bộ dữ liệu ung thư cổ tử cung 67
5.2.1 Mục đích thử nghiệm 67
5.2.2 Kết quả đạt được 67
5.3 Nhận xét 67
5.3.1 Ưu điểm 67
5.3.2 Khuyết điểm 68
5.4 Hướng phát triển 68
Tài liệu tham khảo 69
Phụ lục 73
Chức năng phần mềm 73
Trang 7
Các độ đo để đánh giá khả năng thực hiện 73
Thuật toán K láng giềng gần nhất 74
Trang 8
Danh mục thuật ngữ và viết tắt
Tiếng Anh
Viết tắt
Tiếng Việt
Artificial Immune Recognition
System
AIRS
Hệ thống nhận dạng miễn dịch
nhân tạo
affinity
Độ tương đồng
affinity threshold
AT
Ngưỡng tương đồng
affinity threshold scalar
ATS
Ngưỡng tương đồng vô hướng
antibody
Kháng thể
antigen
Kháng nguyên
Artificial Immune System
AIS
Hệ thống miễn dịch nhân tạo
Artificial Recognition Ball
ARB
Quả cầu nhận dạng nhân tạo
B cell
Tế bào B
Bone-marrow
Tủy xương
candidate memory cell
Tế bào nhớ ứng viên
class
Lớp
clonal rate
Tỷ lệ dòng
established memory cell
Tế bào nhớ thiết lập
feature vector
Vectơ đặc trưng
Fuzzy - Artificial Immune
Recognition System
FAIRS
Hệ thống nhận dạng miễn dịch
nhân tạo mờ
hyper – mutation rate
Tỷ lệ tăng đột biến
K nearest neighbor
KNN
K láng giềng gần nhất
k value
Giá trị k
Major Histocompatibility
Complex
MHC
Mô phức hợp chính
memory cell
mc
Tế bào nhớ
Trang 9
mutation rate
Tỷ lệ đột biến
Natural Immune System
NIS
Hệ thống miễn dịch tự nhiên
output
Dữ liệu xuất
Resource allocation
Mechanism
Cơ chế định vị tài nguyên
resources
Tài nguyên
seed cell
Tế bào giống
Specialized Antigen Presenting
Cell
APC
Tế bào kháng nguyên chuyên
dụng
stimulation function
Hàm kích hoạt
stimulation threshold
Ngưỡng kích hoạt
stimulation value
Giá trị kích hoạt
test set
Tập kiểm nghiệm
The University of California at
Irvine
UCI
Trường Đại học California tại
Irvine
Thymus
Tuyến ức
training set
Tập huấn luyện
Bảng 0.1: Một số thuật ngữ và chữ viết tắt
Trang 10
Danh mục các hình vẽ
Hình 1.1: Tiến trình phân tích ứng dụng chẩn đoán ung thư 13
Hình 1.2: Giai đoạn phát triển thuật toán 15
Hình 2.1: Phản ứng miễn dịch kháng nguyên tổng quát 21
Hình 2.2: Khái niệm không gian hình thái 23
Hình 3.1: Tăng đột biến để phát sinh ARB 38
Hình 3.2: Thủ tục đột biến 39
Hình 3.3: Sự kích hoạt, sự phân phối tài nguyên và sự loại bỏ ARB 42
Hình 3.4: Sự đột biến của ARB sống sót 43
Hình 3.5: Sự giới thiệu tế bào nhớ 44
Hình 4.1: Tiến trình chẩn đoán ung thư 48
Hình 4.2: Quá trình xác định tế bào nhớ, 55
Hình 4.3: Tìm MC
match
trong tập tế bào nhớ 55
Hình 4.4: Sự phát sinh ARB 56
Hình 4.5: Sự tiếp xúc của ARB với kháng nguyên 58
Hình 4.6: Sự phát triển tế bào nhớ ứng viên 58
Hình 4.7: Sự so sánh giữa MC
candidate
và MC
match
59
Hình 4.8: Sự giới thiệu tế bào nhớ 60
Hình 4.9: Cơ sở luật cho việc phân phối tài nguyên mờ 62
Hình 4.10: (a) Hàm thành viên đầu vào; (b) Hàm thành viên đầu ra 63
Hình 5.1: So sánh kết quả giữa các phương pháp 66
Trang 11
Danh mục các bảng
Bảng 0.1: Một số thuật ngữ và chữ viết tắt 9
Bảng 4.1: Ví dụ về dữ liệu ung thư vú 50
Bảng 4.2: Các tham số được dùng trong hệ thống AIRS mờ 53
Bảng 4.3: Tập tế bào nhớ khởi tạo 53
Bảng 4.4: Bảng tính xác định tế bào nhớ 54
Bảng 4.5: Tập ARB – Tập con đột biến 55
Bảng 4.6: Giá trị kích thích của kháng nguyên lên arb 57
Bảng 4.7: Tập tế bào ARB 59
Bảng 4.8: Bảng tính giá trị kích hoạt của tập tế bào ARB 60
Bảng 4.9: Các biến ngôn ngữ cho hàm thành viên đầu vào và đầu ra 62
Bảng 5.1: Kết quả so sánh AIRS và AIRS mờ trên dữ liệu ung thư vú 65
Bảng 5.2: Độ chính xác và thời gian phân lớp của AIRS và AIRS mờ 66
Bảng 5.3: So sánh ANFIS và AIRS mờ 67
Trang 12
Chương 1
Tổng quan
Nội dung của Chương 1 trình bày tổng quan về Hệ thống nhận dạng miễn dịch
nhân tạo (Artificial Immune Regconition System – AIRS), Hệ thống nhận dạng miễn
dịch nhân tạo mờ (Fuzzy Artificial Immune Regconition System – FAIRS), và ứng
dụng chẩn đoán ung thư vú thông qua hai hệ thống này; giới thiệu chung về tình
hình nghiên cứu hiện nay trên thế giới cũng như trong nước; đồng thời nêu lên mục
đích, nội dung và ý nghĩa của đề tài.
1.1 Phát biểu vấn đề
Khi khoa học kĩ thuật phát triển, cuộc sống của con người không ngừng cải thiện
nhờ vào các thành tựu nghiên cứu. Máy móc thiết bị đóng vai trò quan trọng trong
việc cơ giới hoá mọi hoạt động của con người, trong đó phải kể đến các thiết bị y tế,
y khoa dùng trong việc xét nghiệm và chẩn đoán bệnh.
Việc tích hợp những ứng dụng giúp hỗ trợ chẩn đoán trong y khoa bắt đầu hình
thành khi độ chính xác trong các bài toán phân lớp dần tăng cao, khởi đầu từ logic
mờ, tiếp đến là các loại mạng nơron truyền thống, thuật giải di truyền, các mô hình
tích hợp… Ở đây, một hệ thống phân lớp được sử dụng để thực hiện phân lớp hay
còn gọi là chẩn đoán ung thư, được nghiên cứu, phân tích và ứng dụng – gọi là hệ
thống nhận dạng miễn dịch nhân tạo mờ (FAIRS).
Cũng như các hệ thống nhận dạng khác, FAIRS cũng bao gồm 2 giai đoạn: huấn
luyện và thử nghiệm. Trong đó, giai đoạn huấn luyện sẽ sử dụng “cơ chế miễn dịch”
để đào thải những “tác nhân xấu” (những mẫu không tốt hoặc không cần thiết cho
việc nhận dạng), chỉ giữ lại những tế bào có ích cho cơ thể. Giai đoạn thử nghiệm
Trang 13
được thực hiện bằng cách so khớp mẫu cần phân lớp và những tế bào có ích, nếu
khớp với mẫu nào nhất thì phân lớp của mẫu cũng chính là kết quả chẩn đoán ung
thư.
Quá trình phân tích ứng dụng chẩn đoán ung thư được mô tả trong Hình 1.1.
Hình 1.1: Tiến trình phân tích ứng dụng chẩn đoán ung thư
1.2 Hệ thống nhận dạng miễn dịch nhân tạo mờ
Thuật toán phân lớp bằng Hệ thống nhận dạng miễn dịch nhân tạo (Artificial
Immune Regconition System - AIRS) là một thuật toán quan trọng trong lĩnh vực
Hệ thống miễn dịch nhân tạo (Artificial Immune System - AIS) và có khả năng ứng
dụng rất hiệu quả và hấp dẫn. AIRS được ứng dụng chủ yếu trong các bài toán phân
lớp y khoa như ung thư vú, bệnh tim, đái tháo đường… và cho những kết quả thỏa
đáng. Vì vậy, AIRS chứng tỏ được nó là một kỹ thuật trí tuệ nhân tạo trong lĩnh vực
y khoa. Bên cạnh đó, cơ chế phân phối tài nguyên trong thuật toán AIRS được thực
hiện bằng logic mờ, gọi là Hệ thống nhận dạng miễn dịch nhân tạo mờ (Fuzzy
Artificial Regconition System - Fuzzy AIRS).
Trang 14
1.3 Hệ thống nhận dạng miễn dịch nhân tạo mờ và chẩn
đoán ung thư
Hiện nay, việc sử dụng các hệ thống phân lớp trong chẩn đoán y khoa đang ngày
càng tăng. Chúng ta không thể phủ định vai trò quan trọng của việc đánh giá bệnh
án và quyết định của chuyên gia trong chẩn đoán bệnh. Tuy nhiên, những hệ
chuyên gia cùng những kỹ thuật trí tuệ nhân tạo khác dùng để phân lớp cũng hỗ trợ
các chuyên gia rất nhiều. Những hệ thống phân lớp có thể xác định được các lỗi hợp
lý mà một chuyên gia khi mệt mỏi hoặc thiếu kinh nghiệm có thể gặp phải, với thời
gian ngắn hơn và chi tiết hơn.
Những đổi mới trong cách điều trị ung thư đã tạo được tỷ lệ sống cao hơn cho
những người bị bệnh này. Đặc biệt, bệnh được chẩn đoán càng sớm, tỷ lệ sống càng
tăng. Theo thống kê của các Tổ chức Y tế Thế giới, Ung thư vú là một loại bệnh
phổ biến ở phụ nữ, chỉ đứng sau ung thư cổ tử cung. Do đó việc đưa kỹ thuật trí tuệ
nhân tạo vào giải quyết bài toán chẩn đoán ung thư nói chung và ung thư vú nói
riêng là rất quan trọng.
Khi hệ thống AIS nổi lên vào thập niên 90, khả năng thực hiện của những phương
pháp đưa ra không thực sự tốt để giải quyết vấn đề phân lớp. Tuy nhiên, hệ thống
AIRS đề xuất năm 2001 đã thay đổi được vấn đề này nhờ một số thuộc tính:
AIRS thực hiện tốt trên những vấn đề khác nhau như không gian đặc trưng
có số chiều lớn, có nhiều lớp…
AIRS tự điều chỉnh theo cấu trúc không gian của vấn đề.
Bên cạnh đó, sự phân phối tài nguyên của AIRS được thực hiện bởi logic mờ làm
tăng khả năng thực hiện phân lớp, giảm được số lượng tài nguyên và thời gian phân
lớp một cách đáng kể.
Như vậy, cả hai hệ thống AIRS và Fuzzy AIRS sẽ được dùng để phân lớp tập dữ
liệu ung thư vú, được thực hiện bởi trường Đại học California tại Urvine (UCI) [15].
Trang 15
Các giai đoạn phát triển từ thuật toán đến ứng dụng được thể hiện trong Hình 1.2.
Hình 1.2: Giai đoạn phát triển thuật toán
1.4 Một số nghiên cứu gần đây
1.4.1 Những nghiên cứu AIRS
AIRS là bộ phân lớp dựa trên nguyên lý của hệ miễn dịch nhân tạo giới hạn tài
nguyên được đề xuất bởi Watkins năm 2001 [1]. AIRS có khả năng thực hiện phân
lớp rất tốt.
Trong nghiên cứu của Donald E. Goodman, AIRS được áp dụng vào vấn đề đa lớp
và được so sánh với Learning Vector Quantisation (LVQ) Kohonen [11]. Trong hầu
hết những lời giải, AIRS cho kết quả tốt hơn LVQ và LVQ tối ưu. Gaurav Marwah
và Lois Boggess cũng cố gắng thực hiện những phép biến đổi trên sự định vị tài
nguyên và những hướng tiếp cận cho việc tổ chức tập ARB [23]. Họ khai thác một
vài thuật toán khác nhằm tăng độ chính xác thuật toán và những phân lớp k láng
giềng gần nhất. Trong nghiên cứu của Donald E. Goodman, AIRS được kiểm tra
thực nghiệm bằng cách thay thế một trong hai nguồn năng lượng phân lớp bởi
Hệ miễn dịch tự nhiên
Natural Immune System - NIS
Hệ miễn dịch nhân tạo
Artificial Immune System - AIS
Hệ nhận dạng miễn dịch nhân tạo
Artificial Immune System - AIRS
Hệ nhận dạng miễn dịch nhân tạo mờ
Fuzzy Artificial Immune System - Fuzzy AIRS
Ứng dụng vào hệ thống phân lớp chẩn đoán
ung thư
Trang 16
những biến đổi khác [12]. Họ kết luận những biến đổi này cho kết quả thử nghiệm
nhanh đối với người dùng. Bên cạnh những nghiên cứu này, Hamaker và Boggess
cũng phân tích hiệu quả của việc thêm độ đo khoảng cách phi Euclidean đối với
thuật toán AIRS nguyên thủy [13].
1.4.2 Những nghiên cứu ung thư vú
Cũng như những vấn đề chẩn đoán bệnh án khác, các hệ thống phân lớp cũng được
sử dụng để chẩn đoán ung thư vú. Khi những nghiên cứu liên quan đến các ứng
dụng phân lớp được kiểm nghiệm, chúng ta có thể thấy một số lượng lớn các
phương pháp được sử dụng để đạt được hiệu quả phân lớp cao. Phương pháp C4.5
cho độ chính xác phân lớp là 94.74% sử dụng ngưỡng hợp lý 10 (10 CV) [26].
Hamilton thu được độ chính xác 96% với phương pháp RIAC (10 CV) [14].
Trong khi đó Ster và Dobnikar đạt 96.8% với phương pháp Linear Discriminant
Analysis (LDA) (10 CV) [30]. Độ chính xác thu được bởi Bennett và Blue là
97.2% khi sử dụng phương pháp SVM [7]. Nơron mờ được áp dụng và cho độ
chính xác là 95.06% (10 CV) [24] và 97.51% với di truyền mờ (huấn luyện 75%,
kiểm nghiệm 25%) [25]. Hơn nữa, Setiono đạt 98.1% khi sử dụng nơron mờ [29].
Goodman cũng áp dụng ba phương pháp khác nhau phương pháp LVQ tối ưu,
phương pháp LVQ lớn và AIRS với độ chính xác tương ứng là 96.7%, 96.8% và
97.2% (10 CV) [11].
1.5 Phân tích nhu cầu thực tế của ứng dụng
Theo những tài liệu chuyên ngành cũng như thông tin đại chúng, trên thế giới, ung
thư vú là nguyên nhân gây tử vong hàng đầu ở phụ nữ. Cứ 5 phụ nữ thì có 1 người
bị tử vong. Ở Việt Nam, tỷ lệ phát sinh ung thư hàng năm là 116,8 trên 100.000 dân.
Trong đó, ung thư vú chiếm 22,8% trên tổng số ung thư. Còn ở thành phố Hồ Chí
Minh, ung thư vú chiếm 12,1% trên tổng số ung thư phát sinh [17].
Trang 17
Ung thư khởi nguồn từ sự phân bào không kiểm soát được và kết quả là xuất hiện
một khối u có thể nhìn thấy. Khối u có thể lành tính hay ác tính. Khối u ác tính phát
triển nhanh chóng và xâm lấn một loạt những mô xung quanh gây nguy hiểm cho
chúng. Ung thư vú là một mô ác tính bắt đầu phát triển bên trong vú. Những bất
thường xuất hiện bên trong vú làm thay đổi hình dạng và kích thước vú, màu da, sự
đau nhức,… là những triệu chứng của ung thư vú. Việc chẩn đoán ung thư được
thực hiện dựa trên những tiêu chuẩn phi phân tử như loại mô, những thuộc tính
bệnh lý, định vị bệnh án. Cũng như các loại ung thư khác, ung thư vú có thể chữa trị
tốt hơn khi được phát hiện sớm hơn. Do đó rất cần xây dựng một hệ thống hỗ trợ
chẩn đoán ung thư vú nói riêng và các loại ung thư nói chung.
1.6 Mục tiêu của đề tài
Xây dựng một hệ chẩn đoán ung thư nói riêng và y khoa nói chung là một công việc
rất rộng nhưng ý nghĩa. Trong phạm vi đề tài này, mục tiêu nghiên cứu tập trung
vào một số vấn đề sau:
Tìm hiểu, xây dựng và đánh giá một thuật toán trí tuệ nhân tạo: Hệ thống
nhận dạng miễn dịch nhân tạo. Đây là một thuật toán mô phỏng hệ thống
miễn dịch tự nhiên để giải quyết bài toán phân lớp.
Cải tiến thuật toán Hệ thống nhận dạng miễn dịch nhân tạo bằng cách tích
hợp logic mờ vào bước phân phối tài nguyên hệ thống, nhằm nâng cao độ
chính xác của quá trình phân lớp. Hệ thống cải tiến được gọi là hệ thống
nhận dạng miễn dịch nhân tạo mờ - FAIRS.
Dùng cơ sở dữ liệu bệnh ung thư vú để đánh giá và so sánh mức độ thực hiện
của hai hệ thống thuật toán.
Thực hiện chẩn đoán ung thư vú thông qua các đặc trưng bệnh án, gồm 9
thuộc tính được phân tích từ việc lấy sinh thiết tế bào vú.
Thực hiện chẩn đoán ung thư cổ tử cung, theo các đặc tính luật chuyên gia và
luật theo thuật toán trích chọn đặc trưng.
Trang 18
1.7 Nội dung của luận văn
Nội dung của luận văn bao gồm những phần sau:
Chương 1 trình bày tổng quan về hệ thống AIRS, hệ thống AIRS mờ, cũng
như giới thiệu mục đích, ý nghĩa và nội dung đề tài.
Chương 2 nêu lên mối quan hệ giữa hệ thống miễn dịch tự nhiên và hệ thống
miễn dịch nhân tạo, nhằm đưa ra luận cứ xây dựng hệ nhận dạng miễn dịch
nhân tạo.
Chương 3 giới thiệu thuật toán AIRS cơ bản và nhận xét khả năng thực hiện
của thuật toán về mặt lý thuyết.
Chương 4 nêu lên cách ứng dụng thuật toán AIRS vào hệ thống chẩn đoán
ung thư vú, đồng thời cải tiến thuật toán bằng cách tích hợp logic mờ vào
giai đoạn phân phối tài nguyên hệ thống.
Chương 5 phân tích dữ liệu thử nghiệm và đánh giá kết quả thực nghiệm.
Tài liệu tham khảo chứa thông tin nguồn tài liệu tham khảo cho đề tài.
Phụ lục giới thiệu chức năng phần mềm, các độ đo sử dụng để đánh giá khả
năng thực hiện của thuật toán và thuật toán k láng giềng gần nhất.
Trang 19
Chương 2
Các hệ thống miễn dịch: Tự nhiên
và Nhân tạo
Chương 2 khảo sát nền tảng của việc xây dựng hệ thống học từ ý tưởng miễn dịch
tự nhiên (Natural Immune System - NIS). Ở đây, các thành phần trong hệ thống
miễn dịch sinh học được nêu ra, nhằm giải thích khung làm việc chung của hệ
thống học miễn dịch này. Thông qua NIS, hệ thống miễn dịch nhân tạo được hình
thành dựa trên một số cơ chế học và nhớ trong tự nhiên. Những khái niệm cơ bản
này sẽ giúp cho việc tiếp cận thuật toán được nhanh chóng và dễ dàng hơn.
2.1 Hệ thống miễn dịch tự nhiên
Khi nói về hệ thống miễn dịch, ý tưởng cho việc học hay nhận dạng không hề xuất
hiện trong suy nghĩ. Hệ thống miễn dịch được xem như một người bảo vệ tuyệt vời,
tránh đi những sinh vật siêu vi có thể gây tử vong hoặc phá hoại cơ thể, truyền đi sự
bảo vệ cơ thể đúng như nhiệm vụ của nó. Việc học ứng dụng ở đâu tại đây? Nếu
xem xét một cách đầy đủ, chúng ta có thể thấy rằng hệ thống miễn dịch có khả năng
học và phát triển qua thời gian. Khái niệm tiêm chủng hay vacxin là những ví dụ
điển hình nhất. Cơ thể luôn tiếp xúc với các mầm bệnh. Khi tiêm một lượng nhỏ
mầm bệnh vào cơ thể, hệ miễn dịch bảo vệ chúng ta trong những lần tiếp xúc với
mầm bệnh tiếp sau đó bằng cách nào? Bằng cách nào hệ miễn dịch có khả năng làm
tiêu tan nhanh chóng những mầm bệnh có thể hoặc không thể thấy được? Như vậy,
chắc chắn phải tồn tại ít nhất một cơ chế nhớ cho hệ miễn dịch và có những dấu
hiệu từ kinh nghiệm hàng ngày để hệ miễn dịch học cách bảo vệ cơ thể. Điều gì
Trang 20
trong hệ miễn dịch cho phép học từ những tương tác với môi trường và cung cấp sự
phản ứng thích hợp khi đối mặt với những trường hợp tương tự (mầm bệnh)?
2.1.1 Các thành phần miễn dịch
Hệ thống miễn dịch có thể được xem như một hệ thống các lớp: đầu tiên là da, sau
đó là các cơ quan thụ cảm nhận dạng những mẫu bệnh để đưa cho các lớp khác
trong hệ thống. Khả năng nhận dạng mẫu của những tế bào bẩm sinh này khá ổn
định trong suốt đời sống của sinh vật.
2.1.1.1 Bạch cầu
Bạch cầu là nơi mà việc học và thích nghi trong hệ miễn dịch xảy ra, là nơi mà sự
phản ứng miễn dịch thích hợp xuất hiện. Ngoài ra, bạch cầu bao gồm những cấu
trúc khá phức tạp, nhưng chúng ta chỉ quan tâm đến các loại bạch cầu – tế bào T và
tế bào B. Hai tế bào này có tên từ nơi sản sinh ra nó (thymus, tuyến ức và bone-
marrow, tủy xương). Hai tế bào này quan trọng như thế nào đối với khả năng tương
tác và thay đổi phản ứng khi mầm bệnh (còn gọi là kháng nguyên) xâm nhập?
Do các tế bào miễn dịch phải biết cách không tấn công cơ thể mà chỉ tấn công
kháng nguyên, nên cần có một vài cơ chế truyền bá tri thức này đến cấp tế bào. Đối
với tế bào T, điều này được thực hiện thông qua quá trình trưởng thành và lựa chọn
âm tính. Các tế bào T chưa trưởng thành trong tuyến ức phải tiếp xúc với chính
chúng liên tục, tế bào nào tự phản ứng sẽ bị tiêu hủy. Tuy nhiên, sau một khối
lượng tiếp xúc nào đó, nếu tế bào T không phản ứng lại chính nó thì nó được phép
đi vào cơ thể như một tế bào T trưởng thành. Quá trình này gọi là sự lựa chọn âm
tính và thông qua nó, chúng ta có một hệ miễn dịch với các tế bào T có khả năng
phản ứng với các kháng nguyên có hại (hoặc ít nhất là không phản ứng với chính
nó). Như vậy, các tế bào T phải học cách phản ứng với sự nguy hiểm hay không
nguy hiểm, vì trong cơ thể có rất nhiều những tác nhân vô hại như thức ăn trong
ruột, dạ con, tử cung… Thông qua quá trình nhận dạng mẫu và học trong hệ miễn
dịch, tế bào T (hay cụ thể hơn là tế bào T hỗ trợ) sẽ đưa mẫu kháng nguyên vào tế
Trang 21
bào B, tế bào này cũng phản ứng với kháng nguyên theo cách riêng và tăng nhanh
số lượng để bảo vệ cơ thể chống lại vật lạ.
Hình 2.1: Phản ứng miễn dịch kháng nguyên tổng quát
Theo hình 2.1, đầu tiên, kháng nguyên xâm nhập vào cơ thể, chạm trán với những tế
bào kháng nguyên chuyên dụng (Specialized Antigen Presenting Cell – APC) và
phân chia thành những peptide kháng nguyên (I). Những mẫu peptide này kết hợp
với những phân tử mô phức hợp chính (Major Histocompatibility Complex – MHC)
tồn tại trong APC (II). Sự kết hợp MHC – peptide trên bề mặt tế bào, bị tế bào T
phát hiện và là nguyên nhân gây kích thích (III). Các tế bào T kích thích tiết ra
những lymphokines như những tín hiệu báo động cho các đơn vị khác phản ứng với
sự phát hiện này. Tế bào B là một trong những đơn vị nhận được tín hiệu và bị kích
thích bởi những kháng thể của nó xuất hiện trong cùng thời điểm (IV). Lúc này, tế
Tế bào T kích thích
Tế bào B
Lymphokines
( IV )
( V )
( VI )
Tế bào B kích thích
( VII )
APC
MHC protein Kháng nguyên
Peptide
Tế bào T
( I )
( II )
( III )
Trang 22
bào B bị kích thích sẽ tạo ra những kháng thể trên bề mặt của nó (V). Những kháng
thể này kết hợp với kháng nguyên và làm vô hiệu hóa chúng, truyền tín hiệu cho các
thành phần khác trong hệ miễn dịch để phá hủy phức hợp kháng nguyên – kháng
thể (VI).
Bây giờ chúng ta sẽ khảo sát những tế bào bạch cầu chủ yếu, tế bào B. Như đã nói,
tế bào B phát triển từ tủy xương và tương tác với tế bào T để sản xuất ra sự phản
ứng miễn dịch. Ngoài mặt của mỗi tế bào B là tập hợp những kháng thể đồng nhất
về mặt cấu trúc / hóa học. Đó là những kháng thể ràng buộc với những mẫu kháng
nguyên và sản sinh một sự phản ứng dựa trên mức độ nhận dạng trong quá trình
hưởng ứng với một kháng nguyên. Công đoạn nhận dạng được thực hiện và sự phản
ứng của tế bào B khi trả lời nhận dạng này sẽ hình thành vấn đề chính trong hệ
thống học miễn dịch.
Trong lý thuyết thực hiện hệ miễn dịch, có vài đề xuất khác nhau đề cập đến cách
mà tế bào B nào đó tương tác với một kháng nguyên và cách mà tương tác này ảnh
hưởng đến sự dừng lại của hệ thống. Lý thuyết lựa chọn dòng nói rằng, khi một
kháng nguyên xâm nhập vào hệ miễn dịch, các tế bào B tùy ý được chọn dựa trên sự
phản ứng của chúng với kháng nguyên này để trải qua sự tạo dòng và mở rộng
nhanh chóng. Khi một kháng nguyên được đưa vào một tế bào B, những kháng thể
của tế bào B phản ứng lại kháng nguyên tùy theo mức độ. Sự phản ứng này thường
gọi là sự tương đồng của tế bào B đó (hay kháng thể) với kháng nguyên đã cho.
Những tế bào B có độ tương đồng đủ (dựa trên một vài ngưỡng phản ứng bên trong)
được phép sản xuất con liên quan đến mức tương đồng. Điều này cho phép sự mở
rộng tế bào nhanh chóng để tấn công kháng nguyên xâm nhập.
Đặc biệt hơn, khi một tế bào B nhận dạng một kháng nguyên, nó đòi hỏi sự kích
thích từ tế bào T hỗ trợ để phản ứng. Sự cùng kích thích này sẽ chuyển tế bào T vào
tế bào huyết thanh, nơi tập trung những kháng thể tự do để làm việc với tế bào T
hủy diệt, nhằm làm vô hiệu hóa sự đe dọa của kháng nguyên. Khi nguy cơ sụt giảm,
các tế bào B bị kích thích cao bởi kháng nguyên sẽ được chọn để trở thành tế bào