Tải bản đầy đủ (.pdf) (143 trang)

luận án nghiên cứu một số phương pháp phân cụm bán giám sát mờ trong phân đoạn ảnh nha khoa

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.14 MB, 143 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO

VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
-----------------------------

TRẦN MẠNH TUẤN

NGHIÊN CỨU MỘT SỐ PHƢƠNG PHÁP PHÂN CỤM BÁN
GIÁM SÁT MỜ TRONG PHÂN ĐOẠN ẢNH NHA KHOA

LUẬN ÁN TIẾN SỸ TOÁN HỌC

HÀ NỘI – 2016

i


VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
--------------------------

TRẦN MẠNH TUẤN

NGHIÊN CỨU MỘT SỐ PHƢƠNG PHÁP PHÂN
CỤM BÁN GIÁM SÁT MỜ TRONG PHÂN ĐOẠN
ẢNH NHA KHOA

LUẬN ÁN TIẾN SỸ TOÁN HỌC


Chuyên ngành: cơ sở toán học cho tin học
Mã số: 62 46 01 10
Ngƣời hƣớng dẫn khoa học:
1. PGS.TS. LÊ BÁ DŨNG
2. TS. VŨ NHƢ LÂN

Hà Nội – 2016

ii


LỜI CAM ĐOAN
Tơi xin cam đoan đây là cơng trình nghiên cứu của riêng tơi đƣợc hồn
thành dƣới sự hƣớng dẫn của tập thể hƣớng dẫn gồm PGS.TS. Lê Bá Dũng và
TS. Vũ Nhƣ Lân. Các kết quả đƣợc viết chung với các tác giả khác đã đƣợc sự
nhất trí của đồng tác giả khi đƣa vào luận án. Các kết quả nêu trong luận án là
trung thực và chƣa từng đƣợc cơng bố trong bất kỳ cơng trình nào trƣớc thời
gian công bố.
Tác giả luận án

Trần Mạnh Tuấn
Trần Mạnh Tuấn

i


LỜI CẢM ƠN
Trƣớc hết, tác giả xin bày tỏ lòng biết ơn chân thành và sâu sắc tới các
thầy giáo hƣớng dẫn, PGS.TS. Lê Bá Dũng và TS. Vũ Nhƣ Lân. Sự tận tình
giúp đỡ, chỉ bảo, động viện tận tình và q báu mà các thầy đã dành cho tác

giả trong suốt quá trình thực hiện luận án là không thể nào kể hết đƣợc.
Xin chân thành cảm ơn các thầy các cô, các nhà khoa học thuộc Viện
Công nghệ thông tin - Viện hàm lâm và khoa học Việt Nam đã tận tình giúp
đỡ và tạo một mơi trƣờng làm việc hết sức thuận lợi giúp tác giả thực hiện tốt
cơng việc nghiên cứu của mình.
Xin chân thành gửi lời cảm ơn tới các anh chị em và các bạn trong
Trung tâm tính tốn hiệu năng cao, Trƣờng Đại học Khoa học Tự Nhiên đã
giúp đỡ tác giả trong suốt quá trình học tập và nghiên cứu tại trung tâm. Xin
đặc biệt cảm ơn TS. Lê Hoàng Sơn ngƣời đã nhiệt tình hƣớng dẫn, tạo điều
kiện thuận lợi giúp tác giả hoàn thành luận án một cách tốt nhất.
Xin gửi lời cảm ơn chân thành tới PGS. TS. Võ Trƣơng Nhƣ Ngọc,
Viện đào tạo Răng Hàm Mặt, Đại học Y Hà Nội đã cung cấp số liệu, tƣ vấn
chuyên môn, cung cấp các tài liệu cần thiết trong q trình nghiên cứu và
hồn thành luận án.
Xin chân thành cảm ơn Ban Giám Hiệu Trƣờng đại học Công nghệ
thông tin và Truyền thông – Đại học Thái Nguyên đã hết sức tạo điều kiện về
thời gian và công việc để tác giả có thể tập trung hồn thành q trình học tập,
nghiên cứu của mình. Đặc biệt xin gửi lời cảm ơn đến các thầy cô, các bạn
đồng nghiệp trong Khoa Công nghệ thông tin đã động viên, giúp đỡ tác giả
trong suốt quá trình nghiên cứu.
Cuối cùng, xin gửi lời cảm ơn sâu sắc nhất tới gia đình, bạn bè và
ngƣời thân, những ngƣời đã luôn là nguồn động viên để tác giả có thể học tập
và nghiên cứu, ln sẻ chia những khó khăn vất vả trong q trình nghiên cứu
và hồn thiện đề tài.
Hà Nội, ngày…..tháng….năm 2016
Tác giả luận án
Trần Mạnh Tuấn

ii



Trần Mạnh Tuấn
MỤC LỤC
MỞ ĐẦU ............................................................................................................1
CHƢƠNG 1. TỔNG QUAN VỀ PHÂN CỤM BÁN GIÁM SÁT MỜ
TRONG PHÂN ĐOẠN ẢNH NHA KHOA......................................................6
1.1. Bài toán phân đoạn ảnh nha khoa ................................................... 6
1.1.1. Khái niệm.................................................................................... 6
1.1.2. Ảnh X-quang nha khoa ............................................................... 7
1.1.3. Nhu cầu và ứng dụng trong y học ............................................. 9
1.2. Tổng quan về các nghiên cứu liên quan .......................................... 9
1.3. Một số kiến thức cơ sở ..................................................................... 14
1.3.1 Tập mờ ......................................................................................... 14
1.3.2. Phân cụm ................................................................................... 17
1.3.3. Phương pháp giải bài toán tối ưu đa mục tiêu ......................... 27
1.4. Kết luận............................................................................................. 31
CHƢƠNG 2. MỘT SỐ THUẬT TOÁN PHÂN CỤM BÁN GIÁM SÁT MỜ
CHO PHÂN ĐOẠN ẢNH NHA KHOA .........................................................32
2.1. Thuật toán phân cụm bán giám sát mờ lai ghép .......................... 32
2.1.1. Lược đồ tổng quan lai ghép....................................................... 32
2.1.2. Thuật toán tách ngưỡng Otsu ................................................... 34
2.1.3. Thuật toán phân cụm bán giám mờ lai ghép ........................... 37
2.1.4. Phân tích và đánh giá thuật toán phân cụm bán giám sát mờ lai
ghép....................................................................................................... 38
2.2. Thuật tốn phân cụm bán giám sát mờ có đặc trƣng không gian ..
............................................................................................................. 38
2.2.1. Lược đồ tổng quát ...................................................................... 39
2.2.2. Xây dựng đặc trưng ảnh nha khoa ........................................... 39

iii



2.2.3. Xác định thơng tin bổ trợ........................................................... 44
2.2.4. Thuật tốn phân cụm bán giám sát mờ SSFC-SC ................... 46
2.2.5. Phân tích và đánh giá thuật tốn SSFC-SC ............................. 51
2.3. Thuật toán phân cụm bán giám sát mờ giải nghiệm bằng thỏa
dụng mờ ................................................................................................... 52
2.3.1. Thuật toán phân cụm bán giám sát mờ (SSFC-FS) ................ 52
2.3.2. Các tính chất và hệ quả từ phân tích nghiệm của thuật tốn . 57
2.3.3. Phân tích và đánh giá thuật tốn SSFC-FS ............................. 69
2.4. Xác định thông tin bổ trợ phù hợp cho thuật toán SSFC-FS ...... 70
2.4.1. Lược đồ tổng quát ...................................................................... 71
2.4.2. Xây dựng tập các hàm thông tin bổ trợ .................................... 71
2.4.3. Xác định hàm thông tin bổ trợ phù hợp cho ảnh nha khoa .... 74
2.5. Kết luận............................................................................................. 78
CHƢƠNG 3. ĐÁNH GIÁ THỰC NGHIỆM...................................................79
3.1. Mô tả dữ liệu ảnh X-quang nha khoa ............................................ 79
3.1.1. Đặc tả dữ liệu ............................................................................. 79
3.1.2. Xác định các đặc trưng của ảnh nha khoa .............................. 82
3.2. Độ đo và tiêu chí đánh giá kết quả ................................................. 85
3.3. Các kết quả so sánh phân đoạn ảnh............................................... 88
3.3.1. Kết quả trên tập cơ sở dữ liệu ảnh nha khoa ........................... 88
3.3.2. Kết quả với các tham số thay đổi ............................................... 91
3.4. Ứng dụng phân đoạn ảnh trong hỗ trợ chẩn đốn bệnh nha khoa
............................................................................................................. 98
3.4.1. Mơ hình hóa bài tốn ................................................................ 99
3.4.2. Chọn phân đoạn có khả năng mắc bệnh ................................ 102
3.4.3. Chẩn đoán từng phân đoạn ................................................... 103
3.4.4 . Xây dựng bảng tổng hợp của các đoạn ................................. 106


iv


3.4.5. Phân tích và đánh giá mơ hình DDS ...................................... 107
3.4.6. Kết quả thực nghiệm ................................................................ 108
3.5. Kết luận ........................................................................................... 112
KẾT LUẬN ....................................................................................................113
NHỮNG ĐÓNG GÓP MỚI CỦA LUẬN ÁN ..............................................115
DANH MỤC CÁC CƠNG TRÌNH ĐÃ CƠNG BỐ .....................................116
TÀI LIỆU THAM KHẢO ..............................................................................117
PHỤ LỤC 1 ....................................................................................................125
PHỤ LỤC 2 ....................................................................................................128

v


DANH MỤC THUẬT NGỮ VÀ TỪ VIẾT TẮT
Từ đầy đủ

Từ viết tắt
APC

Affinity propagation clustering

APC+

Affinity propagation clustering cải tiến

BH


Ball and Hall

BR

Banfeld-Raftery

CH

Calinski-Harabasz

DB

Davies-Bouldin

DDS

Dental Diagnosis System

DL

Difference-Like

EEI

Entropy, Edge and Intensity

eSFCM

Semi-supervised Entropy regularized Fuzzy Clustering


FCM

Fuzzy C-Mean

FIS

Fuzzy Inference System

FKNN

Fuzzy k-Nearest Neighbor

LA

Lagrange

LBP

Local Binary Patterns

MAE

Mean Absolute Error

MF

Membership Function

MSE


Mean Squared Error

PBM

Pakhira, Bandyopadhyay and Maulik

RGB

Red-Green-Blue

vi


SSFCM

Semi-Supervised Fuzzy C-Mean

SSFC-FS

Semi-Supervised Fuzzy Clustering algorithm with Spatial
Constraints using Fuzzy Satisficing method
Semi-Supervised Fuzzy Clustering algorithm with Spatial
Constraints using Fuzzy Satisficing method on the
Additional Function

SSFC-FSAI

SSFC-SC

Semi-Supervised Fuzzy Clustering algorithm with Spatial

Constraints

SSSFC

Semi-Supervised Standard Fuzzy Clustering

SVM

Support Vector Machine

SSWC

Simplified Silhouete Width Criterion

CSDL

Cơ sở dữ liệu

CT

Công trình

LT

Lý thuyết

TN

Thực nghiệm


vii


DANH MỤC BẢNG BIỂU
Bảng 1.1. Thuật toán phân cụm mờ .................................................................21
Bảng 1.2. Thuật toán phân cụm bán giám sát mờ chuẩn .................................23
Bảng 1.3. Thuật toán phân cụm bán giám sát mờ theo quy tắc entropy ..........25
Bảng 1.4. Thuật toán phân cụm bán giám sát mờ ............................................26
Bảng 2.1. Thuật toán tách ngƣỡng Otsu ..........................................................35
Bảng 2.2. Thuật toán phân cụm bán giám sát mờ lai ghép ..............................37
Bảng 2.3. Ma trận độ thuộc cuối cùng của FCM .............................................45
Bảng 2.4. Xác định u1 ......................................................................................45
Bảng 2.5. Trọng số các đặc trƣng nha khoa .....................................................46
Bảng 2.6. Xác định u2 ......................................................................................46
Bảng 2.7. Xác định ma trận bổ trợ ...................................................................46
Bảng 2.8. Thuật toán SSFC-SC .......................................................................51
Bảng 2.9. Bảng đánh giá hàm mục tiêu (pay-off) của phƣơng pháp thỏa dụng
mờ .....................................................................................................................55
Bảng 2.10. Các giá trị của IFV để chọn hàm bổ trợ thích hợp nhất ................76
Bảng 3.1. Thơng tin về các nhóm bệnh nhân ...................................................80
Bảng 3.2. Đặc trƣng của tập dữ liệu.................................................................82
Bảng 3.3. Thống kê các ảnh trong toàn bộ dữ liệu ảnh X-quang. ...................85
Bảng 3.4. Các giá trị kỳ vọng và phƣơng sai của các thuật toán .....................89
Bảng 3.5. So sánh hiệu năng của các thuật toán trên bộ dữ liệu thực .............89
Bảng 3.6. Giá trị độ đo khi thực hiện thuật toán SSFC-SC với C = 3 và giá trị
 .......................................................................................................................91

Bảng 3.7. Giá trị độ đo khi thực hiện thuật toán SSFC-SC với C = 5 và giá trị
 .......................................................................................................................92


Bảng 3.8. Kết quả thuật toán SSFC-FS với các bộ tham số (b1, b2, b3) ...........95
Bảng 3.9. Giá trị trung bình của thuật tốn SSFC-FS với các bộ tham số ......96

viii


Bảng 3.10. Giá trị trung bình IFV lý thuyết và IFV thực nghiệm ...................97
Bảng 3.11. Thuật toán của phƣơng pháp DDS ..............................................101
Bảng 3.12. Thuật toán APC+ .........................................................................106
Bảng 3.13. Bảng tổng hợp bệnh của các vùng ...............................................107
Bảng 3.14. Các kết quả tổng hợp bệnh của ảnh .............................................107
Bảng 3.15. Dự đoán bệnh cuối cùng cho dữ liệu kiểm tra .............................110
Bảng 3.16. Đánh giá hiệu năng của tất cả các phƣơng pháp .........................110

ix


DANH MỤC HÌNH VẼ
Hình 1.1. Ảnh phân đoạn ...................................................................................6
Hình 1.2. Một số loại ảnh X – quang nha khoa .................................................8
Hình 1.3. Ảnh nha khoa ...................................................................................10
Hình 1.4. Các phƣơng pháp phân đoạn ảnh .....................................................11
Hình 1.5. Một số dạng hàm thuộc cơ bản ........................................................15
Hình 1.6. Minh họa phân cụm dữ liệu .............................................................17
Hình 2.1. Lƣợc đồ tổng quan của thuật toán lai ghép ......................................33
Hình 2.2. Ảnh đầu vào cỡ 9x9 .........................................................................36
Hình 2.3. Ảnh nhị phân của ảnh đầu vào khi áp dụng thuật tốn Otsu ...........37
Hình 2.4. Lƣợc đồ hoạt động của thuật tốn mới ............................................40
Hình 2.5. Cách tính LBP ..................................................................................42
Hình 2.6. Cửa sổ khơng gian thích ứng ...........................................................47

Hình 2.7. Sơ đồ hoạt động của phƣơng pháp SSFC-FSAI ..............................71
Hình 2.8. Minh họa các giá trị màu của ảnh ....................................................75
Hình 2.9. Giá trị đặc trƣng của từng điểm ảnh ................................................76
Hình 2.10. Giá trị tâm cụm và độ thuộc sau phân cụm bằng thuật toán FCM 76
Hình 3.1. Ảnh X-quang nha khoa theo từng nhóm bệnh .................................81
Hình 3.2. Ảnh phân đoạn .................................................................................90
Hình 3.3. Độ chính xác của các phƣơng pháp phân cụm với số cụm thay đổi 94
Hình 3.5. Biểu đồ biểu diễn vùng phân đoạn và 4 mẫu bệnh. .......................103
Hình 3.6. Kết quả thực nghiệm trên đồ thị.....................................................111

x


MỞ ĐẦU
Phân đoạn ảnh là chia nhỏ một ảnh thành các vùng đồng nhất cấu tạo nên
ảnh hoặc các đối tƣợng [17], [52]. Phân đoạn ảnh thƣờng đƣợc sử dụng để xác
định vị trí đối tƣợng (chẳng hạn nhƣ các loại cây trồng, khu vực đơ thị, rừng của
một hình ảnh vệ tinh, v.v.) và các đƣờng biên, ranh giới (đƣờng thẳng, đƣờng
cong, v.v.) trong ảnh. Với ảnh nha khoa thì mục đích của phân đoạn ảnh nha khoa
là bƣớc xử lý quan trọng trong nha khoa thực hành nhằm hỗ trợ bác sĩ chẩn đoán
một cách hiệu quả các bệnh quanh răng.
Ảnh X-quang nha khoa gồm 3 phần chính [54]: i) Phần răng: phần có độ
xám cao và là phần ta nhìn thấy rõ nhất trên ảnh; ii) Phần cấu trúc răng: là phần có
độ xám trung bình gồm lợi răng, xƣơng, phần khác (tủy, xi măng v.v.); iii) Phần
nền: là phần có giá trị độ xám nhỏ nhất, là nền tảng của cấu trúc răng. Với cấu trúc
của ảnh X-quang nha khoa thì việc phân đoạn ảnh phức tạp hơn phân đoạn ảnh
thơng thƣờng [70].
Bài tốn phân đoạn ảnh nha khoa đã đƣợc sử dụng để hỗ trợ việc chẩn đoán
bệnh nha khoa và dự đoán tuổi nha khoa [51]. Đồng thời, phân đoạn ảnh nha khoa
mang lại những thơng tin có giá trị cho nha sĩ trong q trình phân tích các thơng

tin từ một hình ảnh [51]. Liên quan đến độ chính xác của phân đoạn ảnh nha khoa,
có các phƣơng pháp học máy khác nhau đƣợc áp dụng [30], [35]. Kết quả phân
đoạn ảnh nha khoa cịn cung cấp thêm các thơng tin cho các nha sỹ trong q trình
chẩn đốn bệnh, giúp các nha sỹ chẩn đốn bệnh chính xác và hiệu quả hơn.
Với bài toán phân đoạn ảnh nha khoa, các nghiên cứu trƣớc đây đã đƣa ra
các kỹ thuật phân đoạn nhƣ phân đoạn ảnh dựa trên phân ngƣỡng [21], [27], phân
đoạn ảnh dựa trên phân cụm [44], [70]. Tuy nhiên các phƣơng pháp này thƣờng
gặp vấn đề khi xác định tham số ngƣỡng hay biên chung của các mẫu răng và
phƣơng pháp phân cụm mờ đƣợc cho là xử lý tốt hơn [59].

1


Trong phân cụm rõ, dữ liệu đƣợc chia vào các nhóm, trong đó mỗi điểm dữ
liệu thuộc vào chính xác một cụm [10]. Trong phân cụm mờ, mỗi điểm dữ liệu có
thể thuộc vào nhiều hơn một cụm với độ thuộc tƣơng ứng [10]. Khi đó, tƣơng ứng
với các điểm dữ liệu là ma trận độ thuộc, với giá trị của các phần tử trong ma trận
chỉ ra mức độ các điểm dữ liệu thuộc vào các cụm khác nhau [10]. Các phƣơng
pháp phân cụm mờ đƣợc sử dụng nhiều trong các bài toán nhận dạng mẫu, phát
hiện tri thức từ các cơ sở dữ liệu, đánh giá rủi ro và nó có ứng dụng nhiều trong
phân đoạn ảnh. Trong các nghiên cứu gần đây việc sử dụng các thông tin bổ trợ
cung cấp bởi ngƣời dùng đƣợc gắn với đầu vào trong phân cụm mờ để hƣớng dẫn,
giám sát và điều khiển q trình phân cụm. Các thuật tốn phân cụm mờ kết hợp
với các thông tin bổ trợ do ngƣời dùng xác định trƣớc hình thành lên nhóm các
thuật toán phân cụm bán giám sát mờ [23].
Một số nghiên cứu gần đây cho thấy các thuật toán phân cụm bán giám sát
mờ rất hiệu quả trong nhiều lĩnh vực nhƣ xử lý ảnh [16], [31], [49], nhận dạng
mẫu, nhận dạng khuôn mặt [5], [33], đánh giá rủi ro [15], dự báo phá sản [36]. Đặc
biệt là trong xử lý ảnh với các ảnh màu và ảnh y học. Cũng đã có một số kết quả
đƣợc đƣa ra cho bài toán phân đoạn ảnh nha khoa nhƣ sử dụng các đặc trƣng của

ảnh nha khoa nhƣ cấu trúc ảnh, màu sắc, hình dáng trong quá trình phân đoạn gồm
phƣơng pháp lấy ngƣỡng [21], [27], phƣơng pháp phân cụm [70]. Tuy nhiên, trong
nghiên cứu này, chƣa có kết quả nào của phân cụm bán giám sát mờ đƣợc áp dụng
cho các ảnh X-quang nói chung và ảnh X-quang nha khoa nói riêng. Các nghiên
cứu trƣớc cũng đã sử dụng phân cụm mờ cùng với các đặc trƣng của ảnh nha khoa
nhƣng chƣa khai thác thông tin không gian của ảnh.
Nội dung nghiên cứu chính của luận án tập trung vào việc đề xuất, cải tiến
các kỹ thuật phân đoạn ảnh bằng thuật toán phân cụm bán giám sát mờ. Trong quá
trình phân đoạn ảnh nha khoa, các kỹ thuật phân cụm mờ (FCM) [10], phân cụm
bán giám sát mờ (eSFCM) [67] và kỹ thuật tách ngƣỡng Otsu [43] là các kỹ thuật

2


cơ bản làm tiền đề cho các phƣơng pháp mới đƣợc đề xuất trong luận án. Trong
các phƣơng pháp mới trình bày trong luận án, thơng tin bổ trợ đƣợc xác định là ma
trận độ thuộc của thuật toán phân cụm mờ FCM kết hợp với các thông tin đặc
trƣng của ảnh nha khoa. Đây là một cách tiếp cận mới mà các phƣơng pháp trƣớc
đó chƣa đề cập đến. Đồng thời, luận án trình bày một số cách xác định thông tin bổ
trợ phù hợp ứng với từng đối tƣợng đầu vào khác nhau. Từ đó thực hiện việc cài
đặt và đánh giá các đề xuất trên máy tính.
Mục tiêu nghiên cứu:
Nghiên cứu các thuật toán phân cụm bán giám sát mờ vào phân đoạn ảnh.
Phát triển các nghiên cứu đề xuất cải tiến các phƣơng pháp phân cụm bán giám sát
mờ cho phân đoạn ảnh nha khoa. Các thuật tốn cải tiến đƣợc đề xuất dựa trên
các thơng tin không gian đặc trƣng của ảnh nha khoa nhằm mục đích nâng cao
chất lƣợng phân cụm của các thuật toán phân cụm bán giám sát mờ áp dụng với
bài toán phân đoạn ảnh nha khoa.
Với mục tiêu nghiên cứu ở trên luận án đã thu đƣợc một số đóng góp
mới nhƣ sau:



Luận án đã nghiên cứu phát triển các thuật toán phân cụm bán giám

sát mờ trong phân đoạn ảnh nha khoa, cụ thể:
-

Đề xuất các phƣơng pháp phân đoạn ảnh nha khoa dựa trên phân cụm

bán giám sát mờ lai ghép. (Lai ghép giữa phân cụm bán giám sát mờ với phân
cụm mờ và phƣơng pháp tách ngƣỡng Otsu).
-

Đề xuất phân cụm bán giám sát mờ có sử dụng đặc trƣng khơng gian

ảnh nha khoa vào bài tốn phân đoạn ảnh;
-

Vận dụng các phƣơng pháp giải tối ƣu đa mục tiêu để giải bài toán tối

ƣu đa mục tiêu của phân cụm bán giám sát mờ, từ đó đƣa ra các mệnh đề, định lý
và tính chất nghiệm của bài toán;

3


-

Xây dựng kho dữ liệu các hàm xác định thông tin bổ trợ cho phân


cụm bán giám sát mờ, từ đó lựa chọn hàm thơng tin bổ trợ phù hợp với từng ảnh
đầu vào để chất lƣợng cụm đƣợc tốt hơn.


Cài đặt thực nghiệm các thuật toán cải tiến dựa trên thu thập và phân

tích dữ liệu ảnh về các mẫu bệnh nha khoa. Ứng dụng phân đoạn ảnh trong hệ hỗ
trợ chẩn đốn nha khoa.
Ngồi phần phần mở đầu và kết luận, luận án đƣợc cấu trúc thành ba chƣơng:
Chƣơng 1 trình bày về tổng quan về phân cụm bán giám sát mờ trong bài
toán phân đoạn ảnh. Đồng thời trình bày các lý thuyết cơ sở sử dụng trong q
trình học tập và nghiên cứu. Thơng qua chƣơng này, luận án đƣa ra đƣợc cái nhìn
tổng quan về bài toán nghiên cứu, các khái niệm và thuật toán cơ bản sử dụng
trong nghiên cứu của luận án.
Các đóng góp chính của luận án lần lƣợt đƣợc trình bày trong chƣơng 2,
chƣơng 3.
Chƣơng 2 trình bày kết quả nghiên cứu các phƣơng pháp phân cụm bán giám
sát mờ sử dụng cho phân đoạn ảnh nha khoa. Chƣơng này trình bày về phân cụm
bán giám sát mờ lai ghép. Đặc biệt luận án cịn trình bày đề xuất phát triển của phân
cụm bán giám mờ có sử dụng thơng tin đặc trƣng không gian và áp dụng phƣơng
pháp nhân tử Lagrange và thỏa dụng mờ giải bài toán tối ƣu đa mục tiêu. Đồng thời,
trong chƣơng 2, luận án xây dựng cách xác định thông tin bổ trợ phù hợp từng ảnh
đầu vào để có đƣợc kết quả phù hợp nhất.
Chƣơng 3 trình bày các kết quả thực nghiệm thu đƣợc khi cài đặt các thuật
toán phân cụm bán giám sát mờ đề xuất ở chƣơng 2 trên bộ dữ liệu ảnh X-quang
nha khoa. Trong đó có trình bày về dữ liệu sử dụng và các tiêu chí đánh giá thông
qua các độ đo. Các kết quả này đƣợc sử dụng để đánh giá hiệu năng của các thuật
toán đề xuất và so sánh với các thuật toán khác đã đƣợc nghiên cứu gần đây đối với

4



các bài toán tƣơng tự. Ứng dụng của phân đoạn ảnh trong thiết kế hệ hỗ trợ chẩn
đoán bệnh.
Cuối cùng, kết luận nêu những đóng góp, hƣớng phát triển, những vấn đề
quan tâm và các cơng trình đã đƣợc cơng bố của luận án.

5


CHƢƠNG 1. TỔNG QUAN VỀ PHÂN CỤM BÁN GIÁM SÁT MỜ TRONG
PHÂN ĐOẠN ẢNH NHA KHOA
1.1. Bài toán phân đoạn ảnh nha khoa
1.1.1. Khái niệm
Phân đoạn ảnh là chia nhỏ một ảnh thành các vùng đồng nhất tạo nên ảnh
hoặc các đối tƣợng [17], [52]. Phân đoạn ảnh thƣờng đƣợc sử dụng để xác định vị
trí đối tƣợng (chẳng hạn nhƣ các loại cây trồng, khu vực đô thị, rừng của một hình
ảnh vệ tinh, v.v.) và các đƣờng biên/ranh giới (đƣờng thẳng, đƣờng cong, v.v.)
trong ảnh. Chính xác hơn, phân đoạn ảnh là quá trình gán nhãn cho mọi pixel trong
ảnh mà những pixel có cùng nhãn thì có chung một số đặc điểm nhất định nào đó.
Với phân đoạn ảnh nha khoa thì mục đích của phân đoạn ảnh nha khoa là bƣớc xử
lý quan trọng trong nha khoa thực hành nhằm hỗ trợ bác sĩ chẩn đoán một cách
hiệu quả các bệnh quanh răng nhƣ viêm chân răng, bệnh nha chu, viêm túi răng,
v.v. Hình 1.1 cho thấy kết quả của phân đoạn ảnh X-quang nha khoa chia ảnh Xquang thành các vùng, vùng màu xanh trong ảnh phân đoạn có thể mắc một bệnh
nha khoa nào đó mà các bác sỹ cần đặc biệt chú ý.

(a)

(b)


Hình 1.1. Ảnh phân đoạn
(a) Ảnh X-quang nha khoa; (b) Ảnh phân đoạn.

6


Kết quả của phân đoạn ảnh là một tập các phân đoạn mà nó bao trùm tồn
bộ ảnh. Mỗi một điểm ảnh trong một phân đoạn là tƣơng đồng nhau về một số
thuộc tính hoặc tính chất tính tốn, ví dụ nhƣ màu sắc, cƣờng độ hoặc cách cấu tạo,
v.v. Việc áp dụng với ảnh phân đoạn nha khoa ngƣời ta có thể xây dựng lên các
ứng dụng nhƣ: hỗ trợ việc thu thập thơng tin trong chẩn đốn bệnh nha khoa của
bác sỹ, các đƣờng mức thu đƣợc sau khi phân đoạn ảnh có thể đƣợc sử dụng để tạo
dựng thành 3D với sự giúp đỡ của các thuật tốn nội suy để từ đó các bác sĩ có thể
nắn chỉnh lại răng sao cho phù hợp v.v.
1.1.2. Ảnh X-quang nha khoa
Cơ quan của răng bao gồm răng và nha chu quanh răng là đơn vị hình thái
và chức năng của bộ răng. Răng là bộ phận trực tiếp nhai nghiền thức ăn, nha chu
là bộ phận giữ và nâng đỡ răng đồng thời là bộ phận nhận cảm, tiếp nhận và dẫn
truyền lực nhai. Răng gồm men, ngà (mô cứng) và tủy (mô mềm). Nha chu gồm
xƣơng chân răng, men chân răng, dây chằng, xƣơng ổ răng, nƣớu (lợi), xƣơng. Bộ
răng là một thể thống nhất thuộc hệ thống nhai tạo thành bởi sự sắp xếp có tổ chức
của các cơ quan răng [2].
Mỗi răng có phần thân răng và chân răng. Giữa thân răng và chân răng là
đƣờng cổ răng hay cổ răng giải phẫu là một đƣờng cong. Thân răng đƣợc bao bọc
bởi men răng, chân răng đƣợc men chân răng bao phủ.
Nƣớu răng viền xung quanh cổ răng tạo thành một bờ gọi là cổ răng sinh lý.
Phần răng thấy đƣợc trong miệng là thân răng lâm sàng. Cổ răng sinh lý thay đổi
tùy theo nơi bám và bờ của viền nƣớu, khi tuổi càng cao thì nơi bám này càng có
khuynh hƣớng di chuyển dần về phía chóp răng. Nhiều trƣờng hợp bệnh lý, nƣớu
răng có thể bị sƣng hoặc trụt, làm thân răng bị ngắn lại hoặc dài ra [2].

Các thông tin về răng đƣợc hiển thị thông qua ảnh X-quang nha khoa. Do đó
ảnh X-quang nha khoa là một trong các cơng cụ chính để trợ giúp các nha sĩ thu
đƣợc các thơng tin nha khoa. Ảnh X-quang nha khoa có thể trợ giúp việc thu thập

7


một số thơng tin mà nha sĩ có thể khơng thấy đƣợc trong q trình thăm khám trực
tiếp. Từ đó ảnh X-quang có thể trợ giúp cho việc xác định thông tin các bệnh nha
khoa nhƣ [2]: Lỗ sâu giữa các răng hoặc phát hiện sâu răng bên dƣới lớp trám
răng, răng mọc ngầm, viêm lợi, tiêu xƣơng quanh răng….
Có rất nhiều loại ảnh X-quang nha khoa khác nhau, trong đó đƣợc chia
thành hai kiểu ảnh X-quang nha khoa chính: ảnh X-quang phạm vi trong miệng và
ảnh X-quang phạm vi cả ngoài miệng [9], [68].
Ảnh trong miệng: là loại ảnh X-quang nha khoa phổ biến. Nó mơ tả các răng
một cách chi tiết và cho phép nha sĩ tìm sâu răng, kiểm tra sức khỏe của các răng
và xƣơng xung quanh răng, kiểm tra tình trạng phát triển của răng và theo dõi sức
khỏe chung của răng và xƣơng hàm. Ảnh X-quang thuộc kiểu trong miệng gồm
ảnh cắn cánh và ảnh quanh chóp.
Ảnh ngồi miệng: cũng cho chúng ta thấy các răng nhƣng mục đích chính là
cho thấy tồn bộ hàm răng và xƣơng sọ. Nó khơng cung cấp các đặc điểm chi tiết
về từng răng nhƣ ảnh trong miệng và do đó, nó khơng đƣợc sử dụng để phát hiện
sâu răng hoặc một số vấn đề khác với từng chiếc răng. Thay vào đó, nó đƣợc sử
dụng để tìm các răng nêm vào nhau, theo dõi sự tăng trƣởng và phát triển hàm
trong quan hệ với răng, để xác định các vấn đề tiềm ẩn giữa răng và hàm, hội
chứng rối loạn thái dƣơng hàm hoặc các xƣơng mặt khác. Các ảnh X-quang thuộc
kiểu ngoài miệng gồm ảnh toàn cảnh, ảnh cắt lớp, phim sọ nghiêng, ảnh X-quang
tuyến nƣớc bọt, ảnh cắt lớp điện tốn.
Một số hình ảnh X-quang nha khoa đƣợc thể hiện ở Hình 1.2.


a) Ảnh cắn cánh. b) Ảnh quanh chóp.

c) Ảnh tồn hàm

Hình 1.2. Một số loại ảnh X – quang nha khoa

8


1.1.3. Nhu cầu và ứng dụng trong y học
Phân đoạn ảnh là giai đoạn đầu tiên trong quá trình xử lý ảnh và đóng vai trị
rất quan trọng [32], [49] trong q trình này. Khi đó, phân đoạn ảnh nha khoa là
bƣớc xử lý then chốt trong nha khoa nhằm hỗ trợ bác sĩ chẩn đoán một cách hiệu
quả các bệnh về răng nhƣ: viêm chân răng, răng mọc ngầm [55], [56]. Khi đó ứng
dụng đầu tiên của phân đoạn ảnh là hỗ trợ việc chẩn đoán bệnh nha khoa.
Một trong những ứng dụng thú vị của phân đoạn ảnh nha khoa từ hình ảnh
X-quang là giám định pháp y [23], [50], việc giám định pháp y thƣờng sử dụng các
cơng nghệ khoa học để phân tích (trong đó có phân tích răng) trong việc xác định
con ngƣời, ví dụ: một vụ máy bay rơi sau khi rơi ngƣời ta phải giám định pháp y
để nhận dạng với từng ngƣời trong tất cả những ngƣời đã chết [50]. Khi đó ngƣời
ta xác định thông qua các nhận dạng sinh trắc học, đặc điểm hình dạng nha khoa
cịn tồn tại của các nạn nhân (trong trƣờng hợp chết trong một thời gian dài [50]).
Do đó, nó trở nên quan trọng để đƣa ra quyết định xác định hình thái mặt của con
ngƣời dựa trên các đặc tính kích thƣớc răng, khoảng cách giữa các răng và các
mẫu xoang, xƣơng trên mặt v.v. [50]. Bên cạnh việc giám định pháp y, phân đoạn
ảnh nha khoa cịn có một số ứng dụng khác: xác định số răng [35], ƣớc lƣợng tuổi
nha khoa [65], phân đoạn ảnh nha khoa có thể phân tích các mảng bám răng [24],
v.v.
1.2. Tổng quan về các nghiên cứu liên quan
Phân đoạn ảnh là giai đoạn đầu tiên trong q trình xử lý ảnh và đóng vai trị

rất quan trọng [32], [49]. Phân đoạn ảnh cũng là công việc khó khăn của xử lý ảnh.
Trong đó, phân đoạn ảnh nha khoa là bƣớc xử lý then chốt nhằm hỗ trợ bác sĩ chẩn
đoán một cách hiệu quả các bệnh về răng nhƣ viêm chân răng, bệnh nha chu, viêm
túi răng [42], [43]. Khi đó q trình phân đoạn ảnh là một trong các bƣớc quan
trọng và cần thiết để phân tích ảnh X-quang nha khoa cho các q trình xử lý sau

9


này nhƣ: hỗ trợ chẩn đoán bệnh [50], xác định các thành phần khác nhau trong ảnh
(răng, lợi, tủy v.v.) [51].

(a)

(b)

Hình 1.3. Ảnh nha khoa
(a) Ảnh X-quang nha khoa; (b) Lỗ trống răng bị thiếu
Ảnh X-quang nha khoa gồm 3 phần chính (hình 1.3 a) [54]: i) Phần răng:
phần có độ xám cao và là phần ta nhìn thấy rõ nhất trên ảnh; ii) Phần cấu trúc răng:
là phần có độ xám trung bình gồm lợi răng, xƣơng, phần khác (tủy, xi măng v.v.);
iii) Phần nền: là phần có giá trị độ xám nhỏ nhất là nền tảng của cấu trúc răng. Với
cấu trúc của ảnh X-quang nha khoa thì việc phân đoạn ảnh phức tạp hơn phân đoạn
ảnh thông thƣờng [70]. Nói cách khác, sự kết nối giữa các phần khác nhau của một
hình ảnh nha khoa X-quang và chất lƣợng thấp của hình ảnh do tạp chất, độ tƣơng
phản thấp, sai sót về chức năng qt hình ảnh, v.v. làm giảm hiệu suất phân đoạn.
Ví dụ, các lỗ trống trong răng bị mất (hình 1.3 b) khơng thể đƣợc xử lý bằng kỹ
thuật xử lý ảnh dựa trên ngƣỡng thơng thƣờng [26]. Vì vậy, phƣơng pháp khai phá
dữ liệu phân đoạn ảnh X-quang nha khoa đã đƣợc nghiên cứu để đạt đƣợc độ chính
xác cao của phân đoạn [40].


10


Các phƣơng pháp phân đoạn ảnh

Dựa trên điểm ảnh

Lấy ngƣỡng

Phân cụm

Dựa trên biên

Dựa trên vùng

Phát hiện biên

Xây dựng
vùng

Otsu

K-Means

Kỹ thuật
Gradient

Phân tách/
Kết hợp


Tồn cục

Fuzzy C Means

Đƣờng mức
kích hoạt

Phƣơng pháp
đồ thị

Kích hoạt

Tập mức

Hình 1.4. Các phƣơng pháp phân đoạn ảnh
Hình 1.4 giới thiệu một số phƣơng pháp phân đoạn ảnh dựa trên điểm ảnh,
dựa trên biên và dựa trên vùng. Trong phân đoạn ảnh có rất nhiều kỹ thuật khác
nhau đƣợc sử dụng và các kỹ thuật đó có thể đƣợc chia thành 2 loại xu hƣớng cơ
bản là: i) Áp dụng các kỹ thuật xử lý ảnh [13], [37] gồm: phƣơng pháp ngƣỡng,
các phƣơng pháp dựa biên và dựa trên vùng; ii) Áp dụng phƣơng pháp phân cụm
[46] gồm: K-means [60], Fuzzy C-Means (FCM) [10]. Các phƣơng pháp có sử
dụng kỹ thuật xử lý ảnh thƣờng phải biến đổi để biểu diễn ảnh dƣới dạng nhị phân,
thông qua ngƣỡng hoặc sử dụng một đƣờng cong phức tạp để xác định biên. Một
phƣơng pháp thƣờng đƣợc sử dụng là phƣơng pháp tách ngƣỡng Otsu [43]. Các
phƣơng pháp này thƣờng gặp vấn đề hết sức khó khăn là xác định tham số ngƣỡng
hay biên chung của các mẫu răng [59]. Trong khi các phƣơng pháp sử dụng kỹ
thuật phân cụm để xác định các cụm thì khơng cần biết trƣớc thơng tin về ngƣỡng
và các đƣờng cong. Tuy nhiên các phƣơng pháp này đặt ra một thách thức là việc


11


lựa chọn các tham số và phát hiện biên giữa các cụm [12], [38], [39], [53]. Điều
này đặt ra các động lực của việc cải tiến các phƣơng pháp phân đoạn ảnh để đạt
đƣợc hiệu suất tốt hơn.
Các nghiên cứu trƣớc đây [6], [66] cho thấy rằng nếu có thêm thơng tin bổ
sung kết hợp với q trình phân cụm thì chất lƣợng phân cụm đƣợc tăng cƣờng.
Việc nghiên cứu đề xuất các phƣơng pháp phân cụm bán giám sát mờ với các
thông tin bổ trợ là một trong ba loại [69]: các ràng buộc Must-link và Cannot-link,
các nhãn lớp của một phần dữ liệu, độ thuộc đƣợc xác định trƣớc. Ví dụ, nếu
chúng ta biết rằng một điểm ảnh đại diện cho một vùng tƣơng ứng là răng thì ta
gán nhãn cho điểm ảnh vào lớp răng, các điểm ảnh khác trong ảnh X-quang nha
khoa đƣợc phân cụm cùng với sự hỗ trợ của các điểm ảnh đã biết. Thông tin về
điểm ảnh đã biết làm cho kết quả phân đoạn ảnh chính xác hơn. Trong các thuật
tốn phân cụm bán giám sát mờ đƣợc đề xuất trong luận án, thông tin bổ trợ đƣợc
sử dụng là ma trận độ thuộc đƣợc xác định trƣớc (cách xác định đƣợc thực hiện chi
tiết cho từng phƣơng pháp trình bày trong chƣơng 2). Đối với thơng tin này, các
thuật tốn phân cụm bán giám sát mờ (SSSFC) [66], thuật toán phân cụm bán giám
sát mờ sử dụng Entropy (eSFCM) [67] có hiệu quả hơn so với thuật toán phân cụm
mờ FCM.
Một ảnh X-quang đầu vào có thể chỉ ra một số bệnh về răng chứ không phải
một bệnh duy nhất. Nếu việc chẩn đoán đƣợc thực hiện trên từng vùng của ảnh
càng chi tiết thì kết quả chẩn đốn cho tồn bộ ảnh càng chính xác. Mục tiêu của
phân đoạn từ một hình ảnh X-quang nha khoa là tạo ra nhiều phân đoạn khác nhau
từ một ảnh đầu vào sao cho các điểm ảnh trong một phân đoạn có sự tƣơng đồng
cao hơn so với các phân đoạn khác. Những ảnh X-quang nha khoa có thể đƣợc
phân loại theo từng vùng khác nhau cụ thể là vùng nền và vùng cấu trúc răng hoặc
vùng có bệnh và vùng khơng có bệnh [70]. Những vùng này sau đó đƣợc so sánh
với các mẫu bệnh bằng một phƣơng pháp tìm kiếm nhanh để xác định hình ảnh


12


nha khoa có hay khơng chứa bệnh nha khoa nào. Vấn đề này đã đƣợc nghiên cứu
rộng rãi trong các cơng trình [10], [12], [19], [29], [30], [43], [45]. Trong đó, các
phƣơng pháp điển hình và phổ biến là phƣơng pháp tách ngƣỡng Otsu [43], phân
cụm mờ FCM [10], phân cụm bán giám sát mờ theo quy tắc Entropy eSFCM [67].
Khi ảnh đƣợc phân đoạn tạo thành các phân đoạn, thuật toán phân lớp đƣợc
sử dụng để xác định bệnh có thể có của từng phân đoạn riêng lẻ và hệ hỗ trợ ra
quyết định đƣợc áp dụng để xác định các bệnh của toàn bộ ảnh đầu vào. Quá trình
phân lớp đơi khi cịn đƣợc gọi là q trình tìm kiếm ảnh X-quang nha khoa nhằm
trợ giúp cho quá trình khớp một ảnh hoặc một phân đoạn X-quang nha khoa với
một mẫu bệnh có trong cơ sở dữ liệu.
Ở trong nƣớc, những năm gần đây cũng có một số nhóm nghiên cứu về các
phƣơng pháp phân đoạn ảnh. Chẳng hạn nhóm tác giả Ngơ Thành Long và cộng sự
[39] đã nghiên cứu phƣơng pháp phân cụm bán giám sát mờ loại 2 dùng với ảnh
viễn thám. Nhóm tác giả Lê Hoàng Sơn và cộng sự [57] cũng đã đề xuất phƣơng
pháp phân cụm áp dụng cho bộ dữ liệu chuẩn từ UCI với các giai đoạn: phân cụm
dữ liệu đầu vào thành các phân hoạch; áp dụng các kỹ thuật phân cụm thông
thƣờng để xác định ma trận tƣơng tự cho từng phân hoạch; tính tốn trọng số cho
các phân đoạn bằng các độ đo phân cụm và xác định ma trận độ thuộc cuối cùng
của thuật toán phân đoạn đƣợc xác định dựa trên nguyên tắc cực tiểu hóa bình
phƣơng sai số từ phƣơng pháp giảm Gradient. Phƣơng pháp này chƣa sử dụng các
thơng tin bổ trợ có lợi trong q trình phân cụm khi thực hiện. Nhóm tác giả Phạm
Huy Thơng và Lê Hồng Sơn [63] đề xuất thuật toán phân cụm mờ bức tranh nhƣ
là một phƣơng pháp của trí tuệ tính tốn. Các thực nghiệm của phƣơng pháp này
đƣợc áp dụng cho bộ dữ liệu số Iris và một vài bộ dữ liệu khác trên UCI. Một cách
tiếp cận của thuật toán phân cụm trong một ứng dụng khác đƣợc tác giả Lê Hồng
Sơn trình bày trong [56], thuật toán phân cụm mờ đƣợc sử dụng trong phân tích


13


×