Tải bản đầy đủ (.pdf) (87 trang)

Luận văn:ứng dụng mô hình nơron - mờ trong việc phát hiện tế bào cổ tử cung giai đoạn tiền ung thư docx

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.07 MB, 87 trang )



Luận văn
ứng dụng mô hình nơron -
mờ trong việc phát hiện tế
bào cổ tử cung giai đoạn
tiền ung thư




KHOA CNTT – ĐH KHTN




Trang 1

LỜI CẢM ƠN

Đầu tiên, em xin chân thành cám ơn Ban giám hiệu, các thầy cô trường Đại học
Khoa Học Tự Nhiên cùng các thầy cô Khoa Công Nghệ Thông Tin đã tận tình truyền
đạt những kiến thức quí báu cho chúng em trong suốt bốn năm học qua.
Tiếp đến, em xin gởi lời cám ơn chân thành nhất đến Tiến sĩ Lê Hoài Bắc. Thầy
đã cho em một định hướng đúng đắn cho đề tài của mình và luôn tận tình theo dõi quá
trình thực hiện đề tài cũng như giúp đỡ kị
p thời khi cần thiết.
Em cũng xin chân thành cám ơn bác sĩ Trần Hòa, trưởng khoa Giải phẫu bệnh
(Bệnh viện C, Đà Nẵng) và Thạc sĩ Bác sĩ Nguyễn Thị Tuyết Mai (Bệnh viện Đa khoa,
Đà Nẵng) đã tận tình chỉ dẫn những kiến thức chuyên ngành cần thiết và tạo điều kiện
cho em tiếp cận thực tế.


Cuối cùng, em xin gởi tất cả tình cảm thân th
ương nhất đến gia đình, thầy cô và
bạn bè; những người luôn ủng hộ em về mọi mặt.


TP. Hồ Chí Minh, ngày 1 tháng 7 năm 2004
Võ Thị Thuỷ Tú




KHOA CNTT – ĐH KHTN




Trang 2

LỜI NÓI ĐẦU
Ung thư là một nhóm các bệnh gồm hơn 100 căn bệnh khác nhau, trong đó các
bệnh này đều ảnh hưởng đến đơn vị cơ bản nhất của cơ thể sống, đó là tế bào. Ung thư
xuất hiện khi việc phân chia tế bào trở nên bất thường, không thể kiểm soát được từ đó
sẽ dẫn đến tử vong nhanh chóng. Tại hội thảo quốc tế “Ung thư phụ nữ
và trẻ em” tổ
chức tại Hà Nội ngày 6 và 7 tháng 11 năm 2003, qua thống kê, mỗi năm Việt Nam có
100000 đến 150000 người mắc bệnh ung thư được phát hiện, trong đó số người tử
vong lên đến 70000 người. Các nghiên cứu đã chứng minh rằng nhiều loại bệnh ung
thư có thể ngăn chặn nếu được phát hiện và điều trị sớm, chẳng hạn như ung thư vú,
ung thư cổ tử
cung, ung thư da, ung thư tuyến tiền liệt,… Khi các bệnh này được phát

hiện sớm và điều trị thích hợp, 95% bệnh nhân có thể sống thêm ít nhất 5 năm.
Ung thư cổ tử cung là loại ung thư phụ khoa nguy hiểm thứ hai sau ung thư vú,
chiếm khoảng 18% các trường hợp ung thư ở hệ cơ quan sinh dục nữ. Bệnh là nguyên
nhân gây tử vong do ung thư cao nhất cho phụ nữ ở các nước đang phát triển. Đó là do
những nước này chưa thực hiện chương trình khám sàng lọc nhằm phát hiện sớm ung
thư. Việc chẩn đoán và điều trị cho từng bệnh nhân bị chi phối bởi tiến triển bệnh tại
thời điểm chẩn đoán. Quá trình điều trị sẽ trở nên đơn giản, hiệu quả, với chi phí thấp
nếu bệnh được phát hiện trong giai đoạn tiề
n ung thư, ngược lại nếu không điều trị kịp
thời thì bệnh sẽ không chữa được. Vì vậy, phát hiện sớm ung thư cổ tử cung rất quan
trọng, liên quan đến lợi ích người bệnh và hiệu quả điều trị. Để làm được điều này, các
bác sĩ giải phẫu bệnh sẽ khám sàng lọc cho tất cả các bệnh nhân ở độ tuổi có thể mắc
bệnh.
Năm 1943, bác sĩ George Papanicolaou đã giới thiệu một phương pháp đơn
giản, hiệu quả, thích hợp cho việc chẩn đoán tế bào cổ tử cung trong giai đoạn tiền ung
thư; đó chính là xét nghiệm Pap. Xét nghiệm này thỉnh thoảng vẫn cho kết quả không
chính xác do nhiều nguyên nhân khách quan và chủ quan. Nhiều phụ nữ sau khi được




KHOA CNTT – ĐH KHTN




Trang 3

khám sàng lọc vẫn chết do bệnh này. Một trong những nguyên nhân chính là do các tế
bào ung thư phát triển rất phức tạp, nên tỷ lệ chẩn đoán âm tính giả và dương tính giả

rất cao. Tỷ lệ chẩn đoán sai có thể giảm xuống bằng cách kiểm tra lại toàn bộ các mẫu
đã khám sàng lọc. Giải pháp này không khả thi vì tốn nhiều thời gian và công sức mà
hiệu quả lại không cao. Do đó, một hệ thống nh
ận dạng tự động tế bào tiền ung thư là
rất cần thiết và rất hữu ích.
Bên cạnh đó, việc xác định các hệ thống tự động đang là một công cụ ứng dụng
rất quan trọng trong nhiều lĩnh vực của xã hội. Trong đó, mô hình nơron – mờ dần dần
được thiết lập không chỉ trong lĩnh vực nghiên cứu mà còn trong lĩnh vực ứng dụng. Cả
mạng nơron và hệ thống mờ đều được phát triển dựa trên qui trình lập luận của con
người. Ở hệ thống mờ, các mối liên hệ được mô tả rõ ràng bằng các luật nếu – thì
nhưng lại thiếu khả năng tự điều chỉnh (khả năng “học”). Còn ở mạng nơron, các mối
liên hệ thể hiện không rõ ràng mà chỉ có thể thiết lập được những mô hình liên quan
nhân quả, tuy nhiên dữ liệu lại được mã hóa vào mạng thành các tham số có khả năng
“học”. Như vậy, các hệ thống tích hợp mạng nơron và logic mờ sẽ kết hợp được khả
năng ngữ nghĩa của hệ thống mờ và khả năng “học” của mạng nơron để tạo ra được
một mô hình suy luận hiệu quả nhất.
Với tính chất phức tạ
p của hệ thống phân lớp tế bào cổ tử cung, một hệ thống
nơron - mờ có thể khắc phục được một số lỗi thường gặp trong chẩn đoán, mà bác sĩ
hay mắc phải. Mô hình nơron – mờ kiểu ANFIS (hệ suy luận mờ loại Sugeno dựa trên
mạng thích nghi) được dùng để thực hiện phân lớp tế bào là bình thường hay bất
thường.
Báo cáo sẽ gồm 5 phần chính và 3 phầ
n phụ:
• Chương 1: Tổng quan
Giới thiệu sơ lược về đề tài và các kiến thức cơ bản liên quan đến đề tài.





KHOA CNTT – ĐH KHTN




Trang 4

• Chương 2: Hệ thống suy luận mờ dựa trên mạng thích nghi
Trình bày về lý thuyết mô hình ANFIS: cấu trúc ANFIS và thuật toán học.
• Chương 3: Trích chọn đặc trưng
Nêu phương pháp tạo dữ liệu cho hệ thống phân loại tế bào và cách tính các đặc
trưng được trích ra từ ảnh tế bào.
• Chương 4: Phân lớp tế bào cổ tử cung sử dụng mô hình ANFIS
Mô tả cách thức mà mô hình ANFIS thực hiện phân lớ
p tế bào cổ tử cung trên
một số hệ thống luật mờ: luật chuyên gia, luật chuyên gia biến đổi và luật trích
dẫn từ hệ thống.
• Chương 5: Tổng kết
Giới thiệu chương trình và đánh giá mức độ thực hiện của hệ thống, cũng như
một số ưu, khuyết điểm và định hướng.




KHOA CNTT – ĐH KHTN




Trang 5


MỤC LỤC
LỜI CẢM ƠN 1
LỜI NÓI ĐẦU 2
MỤC LỤC 5
DANH MỤC HÌNH ẢNH 6
DANH MỤC BẢNG BIỂU 7
BẢNG KÝ HIỆU CÁC CHỮ VIẾT TẮT 8
Chương 1: TỔNG QUAN 9
1.1. Giới thiệu sơ lược đề tài 9
1.2. Mục đích của đề tài 10
1.3. Mẫu xét nghiệm Pap 11
1.4. Một số nguyên nhân dẫn đến chẩn đoán sai 16
1.5. Một số hệ thống phân lớp tế bào tự động và bán tự động 17
1.6. Phát biểu vấn đề 19
1.7. Các tiêu chuẩn đánh giá mức độ thực hiện hệ thống 20
Chương 2: HỆ SUY LUẬN MỜ DỰA TRÊN MẠNG THÍCH NGHI 22
2.1. Giới thiệu sơ lược về mô hình nơron - mờ 22
2.2. Hệ thống suy luận mờ 23
2.3. Mạng thích nghi 27
2.4. Hệ thống suy luận mờ dựa trên mạng thích nghi 33
Chương 3: TRÍCH CHỌN ĐẶC TRƯNG 37
3.1. Giới thiệu sơ lược về trích đặc trưng 37
3.2. Dữ liệu nhập của hệ thống 37
3.3. Dữ liệu xuất của hệ thống 39
3.4. Trích chọn đặc trưng 40
3.5. Các đặc trưng rút trích 46
Chương 4: PHÂN LOẠI TẾ BÀO CỔ TỬ CUNG SỬ DỤNG MÔ HÌNH ANFIS48
4.1. Cấu trúc ANFIS trong phân loại tế bào cổ tử cung 48
4.2. Các hệ thống luật mờ trong phân loại tế bào 54

Chương 5: TỔNG KẾT 59
5.1. Chương trình 59
5.2. Mức độ thực hiện chương trình 66
5.3. Đánh giá đề tài 75
5.4. Hướng phát triển cho đề tài 75
PHỤ LỤC 76
PHỤ LỤC A: MỘT SỐ KIẾN THỨC Y KHOA CƠ BẢN 76
PHỤ LỤC B: PHÂN ĐOẠN ẢNH 80
PHỤ LỤC C: PHƯƠNG PHÁP LỌC KALMAN 82
TÀI LIỆU THAM KHẢO 84




KHOA CNTT – ĐH KHTN




Trang 6

DANH MỤC HÌNH ẢNH
Hình 1-1: Cấu trúc mô tế bào ở cổ tử cung 12
Hình 1-2: Phân lớp trong mô tế bào gai 13
Hình 1-3: (a) tế bào gai cận đáy, (b) tế bào gai trung gian, (c) tế bào gai bề mặt, 14
Hình 1-4: Phân lớp trong mô tế bào trụ 14
Hình 1-5: Sơ đồ các bước thực hiện chẩn đoán 19
Hình 2-1: Hệ thống suy luận mờ 25
Hình 2-2: Các luật mờ và các hệ thống suy luận 27
Hình 2-3: Mạng thích nghi 27

Hình 2-4: (a) Suy luận mờ loại 3, (b) cấu trúc ANFIS tương ứng 34
Hình 3-1: Ảnh đã phân đoạn 40
Hình 3-2: Ảnh đã gán nhãn 40
Hình 3-3: Các phép tính diện tích 41
Hình 3-4: Vị trí đường kính nhỏ nhất và lớn nhất 42
Hình 3-5: Tâm của trọng lực đối với nhân và bào tương 44
Hình 3-6: Đường tròn cực tiểu cho nhân 46
Hình 4-1: Ý nghĩa các tham số trong hàm dạng chuông 49
Hình 4-2: Cấu trúc ANFIS với 2 dữ liệu vào và 4 luật 50





KHOA CNTT – ĐH KHTN




Trang 7

DANH MỤC BẢNG BIỂU
Bảng 1-1: Thống kê kích thước tế bào 16
Bảng 2-1: Hai quá trình trong thuật toán học lai 36
Bảng 3-1 : Danh sách các đặc trưng trích chọn vào cơ sở dữ liệu 47
Bảng 4-1: Ví dụ luật mờ phân loại tế bào 48
Bảng 4-2: Luật chuyên gia 54
Bảng 4-3: Luật chuyên gia biến đổi 55
Bảng 5-1: Luật chuyên gia số hóa 66
Bảng 5-2: Mức độ thực hiện luật chuyên gia 67

Bảng 5-3: Mức độ kiểm nghiệm của luật chuyên gia 67
Bảng 5-4: Luật chuyên gia biến đổi số hóa 68
Bảng 5-5: Mức độ thực hiện luật chuyển gia biến đổi 68
Bảng 5-6: Mức độ kiểm nghiệm của luật chuyên gia biến đổi 69
Bảng 5-7: Luật trích từ hệ thống với 2 dữ liệu xuất 70
Bảng 5-8: Luật trích từ hệ thống với 7 dữ liệu xuất 72
Bảng 5-9: Mức độ thực hiện mạng của luật trích từ hệ thống 72
Bảng 5-10: Mức độ kiểm nghiệm của luật trích từ hệ thống 73





KHOA CNTT – ĐH KHTN




Trang 8

BẢNG KÝ HIỆU CÁC CHỮ VIẾT TẮT
ANFIS Adaptive – Network – Based Fuzzy Inference System
RMSE Root Mean Square Error
FN False Negative
FP False Positive
PP Positive Predictive
NP Negative Predictive
LSE Least squares estimate
FDA the Food and Drug Administration





KHOA CNTT – ĐH KHTN




Trang 9

Chương 1: TỔNG QUAN

Để có thể hiểu rõ về đề tài này, chương đầu tiên xin được trình bày về một số
kiến thức cơ bản liên quan đến ung thư cổ tử cung và một số công việc đã thực hiện
được trong lĩnh vực khám sàng lọc tự động. Tất cả những thông tin này phần nào nói
lên được những khó khăn, những tồn tại của các hệ thống chẩn đoán tự động, bán tự
động hoặc thủ công (do bác sĩ thực hiện), để từ đó nêu bật được sự cần thiết phải xuất
hiện một hệ thống mới.
1.1.Giới thiệu sơ lược đề tài
Ung thư cổ tử cung là loại bệnh nguy hiểm, chiếm tỉ lệ cao thứ hai sau ung thư
vú. Ở Úc, hơn một nghìn trường hợp ung thư cổ tử cung được chẩn đoán hằng năm, và
khoảng 350 phụ nữ chết vì bệnh này (Viện Sức khoẻ Úc, 1991). Độ tuổi trung bình
người bệnh là 52,2 và thường tập trung vào hai độ tuổi 35-39 và 60-64. Thống kê tại
Mĩ cho thấy, ở phụ nữ da trắng, 54% bệnh nhân ung thư cổ tử cung khi được chẩn đoán
bệnh còn ở giai đoạn khu trú (tiền ung thư), 31% có tổn thương trong vùng (ung thư)
và 8% có di căn xa (ung thư giai đoạn cuối); ở phụ nữ Mỹ gốc Phi, tỉ lệ này tương ứng
là 40%, 40% và 12%; Tỉ lệ mắc ung thư cổ tử cung theo độ tuổi cao nhất là ở những
phụ nữ gốc Việt sống ở Mỹ (43/100.000). Trong vòng 45 nă
m qua, tần xuất mắc ung
thư cổ tử cung giảm từ 45/100.000 xuống còn 8/100.000. Khi tần xuất mắc bệnh xâm

lấn (ung thư) giảm xuống thì tần xuất mắc bệnh tiền xâm lấn (tiền ung thư) lại tăng
đáng kể. Tỉ lệ sống 5 năm của bệnh nhân ung thư cổ tử cung mọi giai đoạn là 71% cho
phụ nữ da trắng và 57% cho phụ nữ Mỹ gốc Phi. Tỉ
lệ sống phụ thuộc vào giai đoạn
của bệnh; khi bệnh còn khu trú tỷ lệ sống 5 năm là 92%, con số này giảm xuống 10%
khi bệnh đã di căn. Vì vậy, phát hiện ung thư cổ tử cung giai đoạn tiền ung thư là một
biện pháp hữu hiệu chăm sóc sức khỏe phụ nữ.




KHOA CNTT – ĐH KHTN




Trang 10

Năm 1943, Georges Papanicolaou đã đưa ra phương pháp chẩn đoán các tế bào
cổ tử cung giai đoạn tiền ung thư. Phương pháp này dựa vào mẫu xét nghiệm Pap để có
thể xác định các tế bào cổ tử cung tiền ung thư, nhằm đem lại hiệu quả điều trị cao cho
người bệnh. Chương trình tầm soát tế bào học British Columbia ở Canada
(www.chrcrm.org
) đã chỉ ra rằng tỷ lệ tử vong và tình trạng bệnh tật giảm đi đáng kể
khi đưa việc khám sàng lọc Pap vào khu dân cư tại British Columbia. Do đó mà hiện
nay, phương pháp này được sử dụng phổ biến trên toàn thế giới không chỉ vì hiệu quả
của nó, mà còn vì giá thành của nó rẻ.
Tại Đan Mạch, mặc dù có chương trình khám sàng lọc trên diện rộng, nhưng
mỗi năm lại có hơn 500 ca mới được phát hiện, trong đó có khoảng 5% chẩn đoán âm
tính giả (không tìm ra bệnh). Cách hiệu quả nhất để khắc phục vấn đề này là thực hiện

tầm soát lại toàn bộ mẫu xét nghiệm bằng phương pháp thủ công. Tuy nhiên, điều này
khó có thể thực hiện được vì vấn đề chi phí và số lượng bác sĩ giải phẫu bệnh. Vì vậy,
việc khảo sát tự động bằng máy tính là một biến
đổi lớn. Một số hệ thống chẩn đoán
ung thư cổ tử cung tự động và bán tự động cũng đã hoàn thành, nhưng chi phí cho
chúng lại đắt hơn chi phí đào tạo bác sĩ chuyên khoa. Do đó mà khoa Giải phẫu bệnh
của trường đại học Herlev kết hợp với công ty thương mại DIMAC đã thực hiện cơ sở
dữ liệu gồm các ảnh tế bào cổ tử cung cùng kết quả phân lớp loại tế bào chính xác để
có thể phát triển các ứng dụng công nghệ thông tin trong lĩnh vực này. Đề tài này sử
dụng toàn bộ dữ liệu lấy từ đây. Hệ thống suy luận mờ sẽ sử dụng bộ dữ liệu này để
thực hiện phân lớp tế bào cổ tử cung.
1.2.Mục đích của đề tài
Đề tài được thực hiện với một số mục đích sau:
¾ Phát hiện những tế bào cổ tử cung có thay đổi bất thường, và xác định mức
độ thay đổi của chúng (nhẹ, vừa, nặng), những thay đổi này còn gọi là loạn
sản và chúng cũng chính là nguyên nhân gây ra ung thư cổ tử cung sau này.




KHOA CNTT – ĐH KHTN




Trang 11

¾ Giảm tỷ lệ chẩn đoán âm tính giả và dương tính giả
¾ Giúp các sinh viên y khoa dễ dàng tiếp cận với việc chẩn đoán tế bào học,
giảm thiểu được chi phí đào tạo, huấn luyện bác sĩ

¾ Giúp các bác sĩ giải phẫu bệnh kiểm tra lại các mẫu xét nghiệm đã chẩn
đoán; và nếu được thử nghiệm nhiều thì chương trình có thể thực hiệ
n sàng
lọc bước đầu, loại bỏ những mẫu xét nghiệm không nghi vấn và các bác sĩ
chỉ cần kiểm tra lại các mẫu có những thay đổi bất thường.
1.3.Mẫu xét nghiệm Pap
Xét nghiệm Pap là một phương pháp y khoa dùng để xác định ung thư cổ tử
cung trong giai đoạn tiến triển sớm. Nó có ý nghĩa rất lớn trong vấn đề y tế cộng đồng
vì thực hiện đơn giản và chi phí rẻ.
1.3.1.Mục đích thực hiện xét nghiệm Pap
Mục đích của việc khám sàng lọc bằng mẫu xét nghiệm Pap là nhằm chẩn đoán
các thay đổi “ác tính” trong tế bào ở giai đoạn tiền ung thư trước khi chúng tiến triển
thành ung thư.
1.3.2.Cách thực hiện mẫu xét nghiệm Pap
Dùng chổi y khoa hoặc que gỗ lấy mẫu xét nghiệm từ cổ tử cung, quét lên một
miếng thủy tinh mỏng, hình chữ nhật để thu được một mẫu Pap. Mẫu này sau đó sẽ
được nhuộm theo phương pháp Papanicolaou. Bằng cách này, đặc điểm của những tế
bào khác nhau sẽ có màu khác nhau, dễ phân biệt dưới kính hiển vi. Sau đó, các bác sĩ
giải phẫu bệnh sẽ khảo sát trực tiếp trên kính hiển vi. Việc này làm tố
n nhiều thời gian
mà tỷ lệ lỗi lại rất cao khi mà mỗi mẫu như vậy có thể chứa đến 300000 tế bào.




KHOA CNTT – ĐH KHTN





Trang 12

1.3.3.Các tế bào trong mẫu xét nghiệm Pap
1.3.3.1.Cấu trúc cổ tử cung
Cổ tử cung được trải bởi các mô tế bào gai và mô tế bào trụ, trong đó mỗi mô
gồm nhiều loại tế bào khác nhau. Mô tế bào gai được tìm thấy ở phần dưới của cổ tử
cung, trái lại mô tế bào trụ được tìm thấy ở phần trên. Vùng chuyển tiếp (mô trung
gian) giữa hai phần trên và dưới là nơi có cả hai loại mô tế bào này, gọi là mô trung
gian (Hình 1.1).



Hình 1-1: Cấu trúc mô tế bào ở cổ tử cung
1.3.3.2.Mô tế bào gai
Mô tế bào gai có 4 lớp tế bào (Hình 1.2). Tế bào gai bắt đầu hình thành từ lớp
đáy, và khi trưởng thành chúng chuyển qua lớp cận đáy, lớp trung gian và cuối cùng là
lớp bề mặt. Như vậy, các tế bào lớp đáy sẽ phân chia và phân phát tế bào cho các lớp
trên nó. Khi các tế bào trưởng thành và di chuyển giữa các lớp, chúng thay đổi hình
dạng, màu sắc và các đặc tính khác. Khi đến lớp bề mặt, chúng sẽ bị đào thải và được




KHOA CNTT – ĐH KHTN




Trang 13


thay thế bằng các tế bào đến sau. Lớp đáy có các tế bào hình tròn nhỏ, với nhân lớn và
bào tương nhỏ. Khi trưởng thành, nhân sẽ càng lúc càng nhỏ, trong khi bào tương càng
lớn và hình dạng tế bào càng ít tròn đi. Tế bào cận đáy (Hình 1.3a) dạng tròn, kích
thước khoảng 300µm
2
và kích thước nhân là 50µm
2
. Tế bào trung gian (Hình 1.3b) và
tế bào bề mặt (Hình 1.3c) có dạng đa giác, kích thuớc tương ứng 800 - 1200µm
2

1600µm
2
, và kích thước nhân tương ứng là 35µm
2
và 20µm
2
.



Hình 1-2: Phân lớp trong mô tế bào gai






KHOA CNTT – ĐH KHTN





Trang 14


Hình 1-3: (a) tế bào gai cận đáy, (b) tế bào gai trung gian, (c) tế bào gai bề mặt,
(d) tế bào trụ, (e) tế bào loạn sản nhẹ, (f) tế bào loạn sản vừa, (g) tế bào loạn sản nặng
1.3.3.3.Mô tế bào trụ
Mô tế bào trụ chỉ chứa một lớp tế bào duy nhất, lớp đáy (Hình 1.4). Lớp đáy ở
đây chứa các tế bào trụ (Hình 1.3d) và các tế bào dự trữ. Các tế bào dự trữ sẽ phân chia
thành các tế bào dự trữ mới và các tế bào trụ. Khi nhìn tế bào trụ từ bên hông, chúng có
hình trụ với nhân ở dưới đáy. Khi nhìn từ trên xuống, chúng nhỏ và có hình đa giác. Tế
bào chất có kích thước khoảng 180µm
2
và nhân 50µm
2
.



Hình 1-4: Phân lớp trong mô tế bào trụ




KHOA CNTT – ĐH KHTN





Trang 15

1.3.3.4.Mô trung gian
Mô trung gian (vùng chuyển tiếp giữa mô tế bào gai và mô tế bào trụ) chứa các
tế bào dự trữ từ mô tế bào trụ. Khi các tế bào này trưởng thành, chúng trông như các tế
bào gai.
1.3.3.5.Các tế bào loạn sản
Khi thông tin di truyền của tế bào vì một lý do nào đó bị thay đổi, tế bào sẽ
không phân chia theo cách thông thường, và có thể tạo thành một tế bào tiền ung thư.
Những biến đổi ác tính trong tế bào ở giai đoạn tiền ung thư được gọi là loạn sản. Tùy
theo cách phân chia của các tế bào này mà nó sẽ được chẩn đoán là loạn sản hay ung
thư mô tế bào.
Loạn sản có nhiều mức độ khác nhau: loạn sản nhẹ, loạ
n sản vừa và loạn sản
nặng. Loạn sản chưa sừng hoá là loại phổ biến (chiếm 85% các ca loạn sản), phát triển
từ mô trung gian hoặc từ mô tế bào gai. Tế bào loạn sản nhẹ (Hình 1.3e) có nhân sáng
và lớn hơn tế bào bình thường. Tế bào loạn sản vừa (Hình 1.3f) có nhân tối và lớn hơn
tế bào loạn sản nhẹ. Tế bào loạn sản nặng (Hình 1.3g) có nhân giống như loạn sản vừa
nhưng bào tương nhỏ hơn.
1.3.3.6.Một số đặc điểm giải phẫu bệnh
Một số đặc điểm dưới đây được dùng cho các bác sĩ giải phẫu bệnh khi thực
hiện chẩn đoán trên xét nghiệm Pap bằng phương pháp thủ công:
¾ nhân mở rộng, tối hơn; tức là hình dạng và màu sắc của nhân biến đổi
¾ tỷ lệ nhân / bào tương tăng lên

Bảng 1.1 tóm tắt một số đánh giá các loại tế bào khác nhau và được sử dụng để
tham khả
o.






KHOA CNTT – ĐH KHTN




Trang 16

Loại tế bào Diện tích nhân
trung bình µm
2

Diện tích bào tươn
g

trung bình µm
2

Tỷ lệ nhân / bào
tương %
Cận đáy 50 300 20
Trung gian 35 1000 5
Bề mặt 20 1600 2
Trụ 50 180 30
Loạn sản nhẹ 175 1000 – 1500 10 – 20
Loạn sản vừa 175 1000 – 1500 20 – 50
Loạn sản nặng 175 1000 – 1500 trên 50


Bảng 1-1: Thống kê kích thước tế bào
1.4.Một số nguyên nhân dẫn đến chẩn đoán sai
1.4.1.Nguyên nhân khách quan
¾ Do điều kiện trang thiết bị y tế thấp kém như: các thiết bị lấy mẫu không
theo tiêu chuẩn, dính quá nhiều tạp chất,… làm cho chất lượng mẫu lấy
được thấp.
¾ Ý thức người dân không cao, không chấp nhận khám sàng lọc hoặc nếu có
thì cũng không thực hiện theo định kì, …
¾ Thiếu đội ngũ cán bộ y tế có chuyên môn để thực hiện khám sàng lọc
1.4.2.Nguyên nhân chủ quan
¾ Một chẩn đoán ung thư hay tiền ung thư dựa trên các tế bào bất thường
trong mẫu Pap được xác định bởi các bác sĩ giải phẫu bệnh. Một mẫu có thể
chứa hàng trăm đến hàng ngàn tế bào, nhưng đa số là tế bào bình thường,
chỉ có một số trong chúng ác tính, cho nên các tế bào bất thường có thể bị
bỏ sót do bác sĩ không tập trung hoặc mệt mỏi




KHOA CNTT – ĐH KHTN




Trang 17

¾ Nếu mẫu xét nghiệm có chứa các tế bào ung thư hoặc tiền ung thư nhưng
trong mẫu nhỏ lấy ra để chẩn đoán lại không có thì chẩn đoán sẽ bị lỗi.
¾ Các thay đổi tế bào học do vi khuẩn, vi rút, thuốc, hoặc sự thay đổi hóc môn

có thể gần giống với các thay đổi ác tính, gây phức tạp thêm nhiệm vụ của
bác sĩ. Do đó, khi các tế bào bất thường
được xác định, việc phân loại chính
xác mức độ thay đổi ác tính hay tiền ác tính mang tính chủ quan cao.
1.5.Một số hệ thống phân lớp tế bào tự động và bán tự động
1.5.1.Lịch sử phát triển
Hệ thống bán tự động đầu tiên là Cytoanalyzer, xuất hiện vào đầu thập niên 50,
do Mellors thực hiện. Hệ thống này đo được đường kính nhân và bào tương cùng với
độ sáng của chúng. Tuy nhiên nó không thể phân đoạn được các cụm tế bào gần nhau,
và đây cũng chính là mối quan tâm của các hệ thống hiện nay. Hệ thống tuy không đưa
ra được một kết quả mong muốn được nhưng nó là một bước ngoặt cho các hướng phát
triển kế tiếp.
Một sản phẩm khác xuất hiện vào giữa những năm 60 là TICAS. Hệ thống này
sử dụng máy tính loại DEC LINC – 8 để phát triển các phương pháp phân loại nhạy
cảm hơn so với các kĩ thuật tế bào học. Nhưng do giới hạn phần cứng của máy tính nên
việc khảo sát dữ liệu bị giới hạn trong 475 tế bào. Vì vậy mà việc ứng dụng vào thực tế
bị hạn chế. Tuy nhiên, sản phẩm đã thành công trong việc nghiên cứu các hệ thống
phân loại trong tương lai. Vào thập niên 80, TICAS được mở rộng thành microTICAS,
sử dụng kính hiển vi, kết hợp camera kĩ thuật số và máy IBM chạy trên DOS phiên bản
2.0.
Năm 1965, Husain đã xây dựng một hệ thống chẩn đoán tự động, phát hiện các
tế bào có nhân lớn và tối thông qua một hệ thống kính hiển vi điện tử, để
có thể xác
định tế bào là ung thư hay tiền ung thư. Đầu những năm 70, ông tiếp tục phát triển các




KHOA CNTT – ĐH KHTN





Trang 18

khả năng của hệ thống này, giúp giảm tỷ lệ lỗi chẩn đoán một cách đáng kể (FN 17%,
FP 34%).
Giữa thập niên 70, Zahniser, Oud, Raajimakers, Vooys và van de Walle đã xây
dựng hệ thống BioPEPR, bao gồm các máy tính với bộ nhớ 28K, cho phép thực hiện
các phần mềm tinh vi, đưa ra kết quả từ 120 đến 180 mẫu xét nghiệm 1 giờ (FP 10%,
FN 1%).
Năm 1989, khi phần cứng và phần mềm được cải tiến đáng kể
thì hệ thống
LEYTAS xuất hiện, cho kết quả FN là 0.3% và FP là 13%, nhưng do qui trình lấy mẫu
mất thời gian và đòi hỏi sự tác động đáng kể của con người nên không được ứng dụng
rộng rãi.
Tất cả những người thiết kế các hệ thống này đều nhận thấy rằng khám sàng lọc
cổ tử cung tự động là một vấn đề cực kì khó khăn. Từ đó đế
n nay cũng có nhiều hệ
thống mới ra đời, nhưng vẫn chỉ có thể cho hiệu suất cao khi có bàn tay con người trợ
giúp.
1.5.2.Một số hệ thống khám sàng lọc thương mại
Tổ chức FDA của Mĩ thông qua hai hệ thống khám sàng lọc tự động:
¾ Hệ thống PAPNET là một thiết bị khám sàng lọc nhằm bổ sung thêm cho hệ
thống khám thủ công. Từ mỗi mẫu, hệ thống chọn 128 vùng khả nghi và lưu
lại cho các bác sĩ giải phẫu học xem xét.
¾ Hệ thống AutoPap 300 nhận ra các mẫu âm tính, và được dùng cho việc sàng
lọc lại các mẫu đã khám bằng phương pháp thủ
công.
Cả hai hệ thống đều làm giảm tỷ lệ chẩn đoán bệnh sai, nhưng đồng thời chúng

cũng làm tăng chi phí xét nghiệm.




KHOA CNTT – ĐH KHTN




Trang 19

1.6.Phát biểu vấn đề
Việc phân loại tế bào cổ tử cung dựa trên mẫu Pap được thực hiện theo 3 bước
chính:
¾ Phân đoạn ảnh: đánh dấu từng vùng ảnh riêng biệt: nhân, bào tương và nền
¾ Trích đặc trưng: dựa vào các vùng ảnh thu được ở bước trên, chúng ta có thể
trích ra các đặc trưng của tế bào để thực hiện phân loại
¾ Phân loại tế bào dựa trên các đặc trưng đã có, dùng hệ thố
ng suy luận mờ sử
dụng mạng thích nghi để thực hiện.

Có thể hình dung các bước thực hiện theo sơ đồ sau:



Hình 1-5: Sơ đồ các bước thực hiện chẩn đoán
Dữ liệu thử nghiệm
Ảnh tiền xử lý Ảnh tiền xử lý
Trích đặc trưng Trích đặc trưng

Đặc trưng tế bào Đặc trưng tế bào
Huấn luyện phân lớp
Phân lớp tế bào
Dữ liệu huấn luyện
Phân lớp
Chuẩn đoán bệnh




KHOA CNTT – ĐH KHTN




Trang 20

1.7.Các tiêu chuẩn đánh giá mức độ thực hiện hệ thống
Các giá trị sau được dùng để đánh giá mức độ thực hiện việc phân lớp tự động
tế bào:
¾ Sai số trung bình bình phương lỗi (RMSE)
¾ Tỷ lệ âm tính giả (FN%)
¾ Tỷ lệ dương tính giả (FP%)
¾ Độ nhạy (Sensitivity)
¾ Độ đặc trưng (Specificity)
¾ Giá trị dự đoán dương tính (PP%)
¾ Giá trị dự
đoán âm tính (NP%)
1.7.1.Sai số trung bình bình phương lỗi - RMSE
RMSE là độ sai khác giữa phân lớp d đích và giá trị thực y có được nhờ vào việc

phân lớp tự động tế bào. RMSE khác với độ lệch chuẩn
σ
ở chỗ
σ
là độ lệch chuẩn so
với giá trị µ của y:
()
1
2
n
yd
RMSE
n
i
ii

=

=
(1.1)
()
n
y
n
i
i

=

=

1
2
µ
σ
(1.2)
trong đó, n = |d| = |y| là số lượng tế bào được phân lớp.
1.7.2.Tỷ lệ âm tính giả - FN%
FN% là tỷ lệ tế bào được phân lớp bình thường nhưng thực chất là loạn sản.
ySensitivit
FNTP
FN
FN −=
+
×
= %100
%100
%
(1.3)
với TP là số lượng tế bào phân lớp dương tính đúng.




KHOA CNTT – ĐH KHTN




Trang 21


FN là số lượng tế bào phân lớp âm tính sai.
1.7.3.Tỷ lệ dương tính giả - FP%
FP% là tỷ lệ tế bào được phân lớp loạn sản nhưng thực ra là bình thường.
ionSpecificat
FPTN
FP
FP −=
+
×
= %100
%100
%
(1.4)
với TN là số lượng tế bào phân lớp âm tính đúng.
FP là số lượng tế bào phân lớp dương tính sai.
1.7.4.Độ nhạy - Sensitivity
Độ nhạy đánh giá xác suất phân lớp tự động tìm thấy tế bào loạn sản.
FNTP
TP
ySensitivit
+
×
=
%100
(1.5)
Như vậy, số lượng tế bào loạn sản trong cơ sở dữ liệu là P = TP + FN.
1.7.5.Độ đặc trưng - Specificity
Độ đặc trưng là xác suất phân lớp tự động tìm ra tế bào bình thường.
FPTN
TN

ySpecificit
+
×
=
%100
(1.6)
Như vậy, số lượng tế bào bình thường trong cơ sở dữ liệu là N = TN + FP
1.7.6.Giá trị dự đoán dương tính – PP%
PP% là tỷ lệ tế bào được phân lớp loạn sản đúng.
FPTP
TP
PP
+
×
=
%100
%
(1.7)
1.7.7.Giá trị dự đoán âm tính – NP%
NP% là tỷ lệ tế bào được phân lớp bình thường đúng.
FNTN
TN
NP
+
×
=
%100
%
(1.8)





KHOA CNTT – ĐH KHTN




Trang 22

Chương 2: HỆ SUY LUẬN MỜ DỰA TRÊN MẠNG
THÍCH NGHI

Chương này đưa ra một cấu trúc và thủ tục học của hệ thống suy luận mờ dựa
trên mạng thích nghi, gọi tắt là ANFIS. Thông qua việc sử dụng thủ tục học lai ghép,
ANFIS có thể tạo một ánh xạ dữ liệu nhập - xuất dựa trên tri thức con người (dưới
dạng các luật mờ nếu - thì) và dữ liệu nhập - xuất thực. Cấu trúc ANFIS được dùng để
mô hình hóa các hàm phi tuyến, xác đị
nh trực tiếp các thành phần phi tuyến trong một
hệ thống điều khiển, và dự đoán một loạt sự kiện hỗn loạn với một hiệu quả nhất định.
2.1.Giới thiệu sơ lược về mô hình nơron - mờ
Một mạng nơron với các trọng số được điều chỉnh có thể xem như là một thiết
bị điều khiển tự động nhờ vào tính chất hồi qui phi tuyến của các đối tượng rời rạc.
Tuy nhiên tri thức được lưu trữ trong mạng không rõ ràng, không mô tả được những
mối liên hệ giữa dữ liệu nhập và dữ liệu xuất, mà chỉ có thể xác
định các mối liên hệ
này thông qua những tham số thích nghi của mạng. Trái lại, một luật mờ nếu – thì lại
có thể diễn tả được các mối liên hệ đó dưới dạng ngôn ngữ tự nhiên, nhưng lại không
có khả năng điều chỉnh luật cho phù hợp. Hai vấn đề này được kết hợp lại tạo thành
một hệ thống nơron - mờ nhằm đạt được khả

năng “đọc” và “học” cùng một lúc. Các
luật thu được từ hệ thống này có thể điều chỉnh phù hợp với dữ liệu phát sinh mô hình,
và đối với các ứng dụng điều khiển tự động, mô hình nơron - mờ có thể tích hợp với
các luật chuyên gia nhằm đưa ra những kết quả chính xác.
Bên cạnh các luật chuyên gia, các luật trích ra từ dữ liệu cũng là một hình thức
mô hình hoá hệ thố
ng điều khiển tự động, chẳng hạn như trong Nhận dạng, khai mỏ dữ
liệu, Mục tiêu đưa ra các luật này là nhằm giảm độ phức tạp của vấn đề cũng như
lượng dữ liệu liên quan đến vấn đề. Có rất nhiều phương pháp phân tích dữ liệu để đưa




KHOA CNTT – ĐH KHTN




Trang 23

ra hệ thống các luật để có thể thực hiện một sự kết hợp tối ưu giữa logic mờ và mạng
nơron.
Các nghiên cứu về mạng nơron đã bắt đầu từ thập niên năm 40, và logic mờ từ
thập niên 60, nhưng mô hình nơron - mờ là một lĩnh vực mới. Năm 1992, Roger Jang
đã đề xuất mô hình ANFIS nhằm đáp ứng việc xây dựng một tậ
p luật mờ nếu - thì với
các hàm thành viên xấp xỉ dữ liệu nhập - xuất đích. Kết quả là, một hệ thống suy luận
mờ dựa trên mạng thích nghi không chỉ thể hiện tốt thông tin ngôn ngữ (các luật ngôn
ngữ) từ các chuyên gia, mà còn phù hợp với việc sử dụng dữ liệu dạng số để thu được
mức độ thực hiện tốt hơn.

2.2.Hệ thống suy luận mờ
2.2.1.Tập mờ
Trong tập rõ, chúng ta có thể xác định rõ một phần tử là thành viên hay không là
thành viên của một tập rõ cho trước. Tuy nhiên trong đời sống thực tế, có nhiều vấn đề
mà chúng ta không biết rõ là đúng hay sai, điều này đồng nghĩa với việc tồn tại một
phần tử x mà ta không thể xác định rõ ràng tính thành viên của x trong tất cả các tập rõ
mà chúng ta đã biết. Để giải thích vấn đề này, Dr. Zadeh đã đưa ra khái niệm tập mờ và
khái niệm hàm thành viên để thể hiện tính thành viên của biến trong tập mờ.
Tập mờ A trong X là tập các phần tử có dạng A = {(x,
µ
A
(x)) | x ∈ X}, trong đó x
là phần tử của tập vũ trụ X và
µ
A
(x) là giá trị thể hiện tính thành viên của x trong tập
mờ A, với
()
10 ≤≤ x
A
µ
.
Nói cách khác, tập mờ A chính là nhãn được gán cho ánh xạ:
[]
1,0: →X
A
µ


(

)
xyx
A
µ
=→




KHOA CNTT – ĐH KHTN




Trang 24

Xét về mặt ý nghĩa, tập mờ là một khái niệm dùng để thể hiện mức độ phụ thuộc
vào một tính chất nào đó của các phần tử trong khôn gian vũ trụ. Ví dụ như tính chất
nóng, mát, lạnh của tập nhiệt độ…
2.2.2.Luật mờ
Luật mờ là biểu thức điều kiện có dạng “NẾU A THÌ B”, trong đó A và B là
nhãn của các tập mờ được mô tả bằng cách xấp xỉ các hàm thành viên. Nhờ vào dạng
rút gọn, luật mờ thường được dùng để thiết lập những phương thức lập luận không
chính xác, nhằm thể hiện tính đa dạng trong tri thức của con người. Ví dụ sau mô tả
một s
ự kiện đơn giản là (đây là luật mờ loại Mamdani):
Nếu nhiệt độ cao, thì giá máy lạnh tăng.
trong đó nhiệt độ và giá máy lạnh là các biến ngôn ngữ, cao và tăng là các giá
trị ngôn ngữ hoặc các nhãn được mô tả bởi các hàm thành viên.
Một dạng khác của luật mờ do Takagi và Sugeno đề xuất, có các tập mờ chỉ

xuất hiện trong phần giả thuyết củ
a luật. Ví dụ (đây là luật mờ loại Sugeno):
Nếu lưu lượng dòng chảy cao thì mực nước sông = k* lưu lượng dòng chảy.
trong đó, cao là phần giả thuyết được mô tả bởi hàm thành viên xấp xỉ. Tuy
nhiên, phần kết luận được định nghĩa bởi phương trình theo biến lưu lượng dòng chảy.
Cả hai loại luật mờ trên đều được mở rộng trong cả hai lĩnh v
ực mô hình hóa và
điều khiển tự động. Bởi vì lợi ích của các nhãn ngôn ngữ và các hàm thành viên, một
luật mờ có thể nắm bắt dễ dàng qui luật điều khiển của con người.
2.2.3.Hệ thống suy luận mờ
2.2.3.1.Cấu trúc
Một hệ thống suy luận mờ gồm 5 khối cơ bản sau (Hình 2.1):
¾ Một cơ sở luật chứa các luật mờ nếu - thì

×