BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC QUY NHƠN
ĐOÀN THỊ XƢƠNG
NGHIÊN CỨU MỘT SỐ KỸ THUẬT
XỬ LÝ ẢNH DỰNG MƠ HÌNH 3D CỦA GAN
TỪ ẢNH DỮ LIỆU ẢNH CT
Chun ngành: Khoa học máy tính
Mã số: 8480101
Ngƣời hƣớng dẫn: TS. Lê Thị Kim Nga
LỜI CAM ĐOAN
Tôi xin cam đoan đây là luận văn do tôi thực hiện dƣới sự hƣớng dẫn
trực tiếp của giảng viên TS. Lê Thị Kim Nga.
Các số liệu, kết quả thực nghiệm đƣợc trình bày trong luận văn này là
trung thực. Những tƣ liệu đƣợc sử dụng trong luận văn có nguồn gốc và trích
dẫn rõ ràng, đầy đủ.
Học viên
Đoàn Thị Xƣơng
LỜI CẢM ƠN
Trong quá trình thực hiện nghiên cứu luận văn này em đã nhận đƣợc
nhiều sự quan tâm, giúp đỡ, hƣớng dẫn dìu dắt của q thầy cơ, bạn bè và
ngƣời thân.
Trƣớc tiên em xin gửi đến Tiến sĩ Lê Thị Kim Nga lời cảm ơn chân
thành nhất, cô là ngƣời hƣớng dẫn cho em trong suốt quá trình thực hiện luận
văn này, với một tinh thân nhiệt tình và chu đáo để em có thể làm tốt đƣợc
cơng việc nghiên cứu của mình.
Em xin gửi lời cảm ơn quý thầy cô trong Trƣờng Đại học Quy Nhơn,
Khoa Công nghệ thông tin và các thầy cô bộ môn Khoa học máy tính đã tận
tậm dạy bảo em trong suốt quá trình học tập và giúp đỡ em trau dồi kiến thức
phục vụ cho quá trình nghiên cứu.
Em xin chân thành cảm ơn những ngƣời thân trong gia đình, cùng các
anh chị em, bạn bè, đồng nghiệp đã giúp đỡ, động viên em trong q trình
thực hiện và hồn thành luận văn này.
Bình Định, ngày 11 tháng 9 năm 2020
Học viên
Đoàn Thị Xƣơng
MỤC LỤC
LỜI CAM ĐOAN
LỜI CẢM ƠN
DANH MỤC TỪ VIẾT TẮT
DANH MỤC CÁC BẢNG
DANH MỤC CÁC HÌNH
MỞ ĐẦU .......................................................................................................... 1
1. Lý do chọn đề tài ...................................................................................... 1
2. Mục đích nghiên cứu ................................................................................ 2
3. Đối tƣợng và phạm vi nghiên cứu ............................................................ 2
4. Phƣơng pháp nghiên cứu .......................................................................... 3
5. Cấu trúc luận văn ...................................................................................... 3
CHƢƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH TRONG DỰNG MƠ HÌNH
3D GAN............................................................................................................ 4
1.1. DỮ LIỆU ẢNH SỐ Y KHOA .................................................................. 4
1.1.1. Giới thiệu ............................................................................................ 4
1.1.2. Khái niệm ảnh y khoa và dữ liệu ảnh CT Gan ................................... 7
1.1.3. Một số chuẩn hình ảnh y khoa............................................................ 8
1.2. MỘT SỐ PHƢƠNG PHÁP XỬ LÝ ẢNH TRONG DỰNG MƠ HÌNH
3D GAN.......................................................................................................... 10
1.2.1. Phát hiện Gan trên dữ liệu ảnh CT, MRI ......................................... 12
1.2.2. Định vị vùng Gan dựa trên kỹ thuật hồi quy .................................... 14
1.2.3. Một số vấn đề xử lý ảnh trong quy trình dựng mơ hình 3D Gan ..... 17
1.3. BÀI TỐN DỰNG MƠ HÌNH 3D ........................................................ 18
1.3.1. Giới thiệu .......................................................................................... 18
1.3.2. Cấu tạo mơ hình 3D.......................................................................... 19
1.4. KẾT LUẬN CHƢƠNG 1 ....................................................................... 22
CHƢƠNG 2: MỘT SỐ KỸ THUẬT TRONG DỰNG MƠ HÌNH 3D GAN
TỪ ẢNH CT ................................................................................................... 24
2.1. TĂNG CƢỜNG CHẤT LƢỢNG ẢNH CT GAN ................................. 24
2.1.1. Kỹ thuật tăng cƣờng chất lƣợng ảnh CT Gan cơ bản ....................... 24
2.1.2. Kỹ thuật dựa trên Gradient ............................................................... 29
2.1.3. Kỹ thuật dựa trên biến đổi Wavelet.................................................. 31
2.1.4. Kỹ thuật dựa trên hiệu chỉnh Gamma .............................................. 35
2.2. PHÂN ĐOẠN GAN ............................................................................... 37
2.2.1. Kỹ thuật phân đoạn Ganđơn giản ..................................................... 37
2.2.2. Phân đoạn Gan dựa trên mạng U - Net............................................. 42
2.2.3. Phân đoạn Gan dựa vào mơ hình chất liệu ....................................... 45
2.3. KỸ THUẬT DỰNG MƠ HÌNH 3D GAN ............................................. 49
2.3.1. Thuật tốn Marching Cubes ............................................................. 49
2.3.2. Dựng lát cắt từ ảnh chụp cắt lớp....................................................... 53
2.4. KẾT LUẬN CHƢƠNG 2 ....................................................................... 54
CHƢƠNG 3: CÀI ĐẶT VÀ THỬ NGHIỆM ................................................ 55
3.1. PHÁT BIỂU BÀI TOÁN ....................................................................... 55
3.2. PHÂN TÍCH BÀI TỐN ....................................................................... 55
3.2.1. Dữ liệu mơ tả và xử lý ...................................................................... 55
3.2.2. Chi tiết thực hiện .............................................................................. 56
3.3. MỘT SỐ KẾT QUẢ THỰC NGHIỆM ................................................. 57
3.4. ĐÁNH GIÁ ............................................................................................ 66
3.5. HƢỚNG PHÁT TRIỂN ......................................................................... 67
3.6. KẾT LUẬN CHƢƠNG 3 ....................................................................... 67
KẾT LUẬN VÀ KIẾN NGHỊ ........................................................................ 68
DANH MỤC CƠNG TRÌNH KHOA HỌC ĐÃ CƠNG BỐ CỦA TÁC GIẢ71
DANH MỤC TÀI LIỆU THAM KHẢO ....................................................... 72
QUYẾT ĐỊNH GIAO ĐỀ TÀI LUẬN VĂN THẠC SĨ (bản sao)
DANH MỤC TỪ VIẾT TẮT
CNTT
Công nghệ thông tin
CT
Computed Tomography
MRI
Magnetic Resonance Imaging
2D
Two-Dimensional
3D
Three-Dimensional
PACS
Picture Archiving and Communication System
DICOM
The Digital Image and Communication in Medicine
RF
Random Forests
DIMSE
Dicom Message Service Elements
SVM
Support Vector Machine
DANH MỤC BẢNG BIỂU
Bảng 3.1. Số lƣợng lát cắt, thời gian phân đoạn Gan, tái tạo mơ hình 3D
Gan ................................................................................................ 66
DANH MỤC HÌNH
Hình 1.1. Các bƣớc cơ bản trong xử lý ảnh y khoa [2] .................................... 5
Hình 1.2. Một số nghiên cứu về xử lý ảnh y tế trên thế giới .......................... 11
Hình 1.3. Phát hiện vùng Gan bán tự động .................................................... 12
Hình 1.4. Mơ hình hóa hoạt động của Gan .................................................... 13
Hình 1.5. Phát hiện u Gan trên 4 ảnh CT ....................................................... 14
Hình 1.6. Định vị Gan dựa vào kỹ thuật hồi quy tích hợp bản đồ vote map .. 15
Hình 1.7. Định vị Gan dựa vào kỹ thuật hồi quy ........................................... 16
Hình 1.8. Xác định kích thƣớc Gan từ ảnh MRI 3D dựa trên thuật tốn phân
tích contour động ............................................................................ 17
Hình 1.9. Mơ hình 3D tim ngƣời .................................................................... 19
Hình 1.10. Mơ hình 3D hình cầu cắt vắt ........................................................ 19
Hình 1.11. Một mặt của hình hộp đƣợc tạo bởi 2 mặt tam giác ..................... 21
Hình 1.12. Mơ hình 3D thu đƣợc từ tập đỉnh: VertexList, tập mặt: FaceList,
tập UV: Uvs .................................................................................... 22
Hình 2.1. Sơ đồ biểu diễn một tầng biến đổi Wavelet ................................... 32
Hình 2.2. Sơ đồ biểu diễn một tầng biến đổi Wavelet cho ảnh ...................... 32
Hình 2.3. Sơ đồ cây triển khai Wavelet hai mức............................................ 33
Hình 2.4. Nâng cao chất lƣợng hình ảnh CT dựa vào biến đổi Wavelet ........ 34
Hình 2.5. Quy trình hiệu chỉnh Gamma ......................................................... 36
Hình 2.6. Minh họa thuật tốn đối xứng nền.................................................. 40
Hình 2.7. Minh họa thuật tốn tam giác ......................................................... 41
Hình 2.8. Bimodal Histogram ........................................................................ 42
Hình 2.9. Kiến trúc mơ hình U –Net .............................................................. 43
Hình 2.10. Minh họa thuật tốn Marching Cubes ........................................ 49
Hình 2.11. Một khối con với các giá trị đƣợc xác định tại 8 đỉnh................ 50
Hình 2.12. Các trƣờng hợp cơ bản áp dụng cho Marching Cubes ............... 51
Hình 2.13. Đa giác đƣợc xây dựng trong một khối con ............................... 52
Hình 2.14. Đánh số thứ tự cho 12 cạnh của một khối con ........................... 53
Hình 2.15. Kết quả thử nghiệm .................................................................... 53
Hình 3.1. Giao diện chính của chƣơng trình .................................................. 58
Hình 3.2. Ảnh DICOM CT 30 lát cắt ổ bụng ................................................. 59
Hình 3.3. Ảnh phân đoạn Gan (màu xanh) tƣơng ứng của 30 lát cắt DICOM ổ
bụng đầu vào
........................................................................ 59
Hình 3.4. Mơ hình 3D Gan từ 30 lát cắt Gan ................................................. 60
Hình 3.5. Ảnh DICOM 90 lát cắt ổ bụng ....................................................... 61
Hình 3.6. Ảnh phân đoạn Gan (màu xanh) tƣơng ứng của 90 ảnh DICOM ổ
bụng đầu vào
........................................................................ 63
Hình 3.7. Mơ hình 3D của Gan từ 90 ảnh phân đoạn Gan ............................. 64
Hình 3.8. Mơ hình 3D của Gan từ 129 ảnh phân đoạn Gan ........................... 64
Hình 3.9. Mơ hình 3D của Gan từ 172 ảnh phân đoạn Gan ........................... 65
Hình 3.10. Mơ hình 3D của Gan từ 225 ảnh phân đoạn Gan ....................... 65
1
MỞ ĐẦU
1. LÝ DO CHỌN ĐỀ TÀI
Trong những năm qua, với sự phát triển mạnh mẽ, Công nghệ thông tin
(CNTT) đã thâm nhập vào mọi mặt của đời sống xã hội và đem lại nhiều lợi ích
to lớn. Trong lĩnh vực y tế, có thể thấy rằng, CNTT cũng đã và đang tạo ra
những thay đổi mới mẻ, thúc đẩy sự phát triển, hiện đại hóa nền Y học nƣớc nhà.
Y học hiện đại chẩn đoán bệnh dựa vào các triệu chứng lâm sàng (chẩn
đoán lâm sàng) và các triệu chứng cận lâm sàng (chẩn đoán cận lâm sàng).
Trong chẩn đốn cận lâm sàng thì chẩn đốn dựa trên hình ảnh thu đƣợc từ
các thiết bị, máy y tế (chẩn đốn hình ảnh) ngày càng chiếm một vai trị quan
trọng, nhất là ngày nay với sự trợ giúp của các thiết bị, máy y tế hiện đại,
cơng nghệ cao có các phần mềm tin học hỗ trợ khiến cho hình ánh rõ nét và
chính xác hơn. Một trong những kênh thơng tin quan trọng hỗ trợ chẩn đốn
và điều trị bệnh chính là dựa vào hình ảnh y khoa nhƣ X-quang, CT, MRI,
chụp xạ hình…
Chụp hình ảnh cắt lớp (Computed Tomography – CT) đƣợc ứng dụng
rộng rãi cho chẩn đoán cận lâm sàng để phát hiện bệnh lý từ sọ não, đầu mặt
cổ, tim, ngực, bụng, chậu, xƣơng, mô mềm cho đến bệnh lý mạch máu não,
cổ, mạch máu chi và các mạch máu tạng khác. Ảnh đƣợc chụp từ thiết bị chụp
cắt lớp CT còn đƣợc dùng để hƣớng dẫn phẫu thuật xạ trị, theo dõi sau phẫu
thuật. Kỹ thuật xây dựng mơ hình 3D (3 chiều) của đối tƣợng từ ảnh chụp cắt
lớp cho phép đánh giá chính xác vị tí tổn thƣơng trong khơng gian 3 chiều, từ
đó định hƣớng tốt cho phẫu thuật cũng nhƣ xạ trị. Ngồi ra, kỹ thuật này cịn
dùng để tái tạo đối tƣợng 3D trong các bệnh lý bất thƣờng bẩm sinh, giúp cho
các nhà phẫu thuật tạo hình chỉnh sửa tốt hơn các dị tật bẩm sinh.
Ngày nay cùng với thói quen ăn uống tùy tiện, mơi trƣờng ơ nhiễm,
2
thực phẩm độc hại... đang khiến lá gan phải làm việc quá sức, dẫn đến nhiều
bệnh tật nhƣ xơ gan, ung thƣ gan, suy gan…Theo thông báo của bệnh viện
Trung ƣơng, bệnh ung thƣ ngày càng có xu hƣớng gia tăng. Hiện nay trên
tồn cầu có khoảng 32,6 triệu ngƣời sống chung với bệnh ung thƣ và mỗi năm
có khoảng trên 14,1 triệu ngƣời mới mắc, 8,2 triệu ca tử vong. Số lƣợng
ngƣời bị ung thƣ Gan xếp thứ 3 trên thế giới và xếp thứ 2 ở Việt Nam. Để
phòng bệnh ung thƣ gan, cần điều trị bệnh gan mạn tính, ngăn ngừa xơ gan
phát triển thành ung thƣ gan. Bằng cách phát hiện ngay khi có khối u nhỏ
dƣới 2 cm thì tiên lƣợng tốt nhất.
Qua đó, chúng ta thấy đƣợc tầm quan trọng cũng nhƣ sự nhƣ nhu cầu
cấp bách cho nghiên cứu về xử lý chuyên sâu trên hình ảnh CT hỗ trợ chẩn
đốn và điều trị sớm bệnh Gan.
Từ những lý do ở trên, tôi chọn đề tài “NGHIÊN CỨU MỘT SỐ KỸ
THUẬT XỬ LÝ ẢNH DỰNG MƠ HÌNH 3D CỦA GAN TỪ ẢNH DỮ
LIỆU ẢNH CT”.
2. MỤC ĐÍCH NGHIÊN CỨU
Tìm hiểu và nghiên cứu chung về quy trình dựng mơ hình 3D gan từ dữ
liệu ảnh CT, từ đó đi sâu vào các kỹ thuật đƣợc ứng dụng trong quy trình này.
Bên cạnh đó cũng tiến hành tìm hiểu về chuẩn dữ liệu ảnh y tế nói chung
đƣợc áp dụng trên thế giới và tại Việt Nam.
Đầu vào: Một tập hợp các lát cắt song song đƣợc sắp xếp theo kiểu ngăn
xếp của Gan đƣợc chụp bởi thiết bị chụp cắt lớp và đƣợc lƣu dƣới dạng chuẩn
DICOM.
Đầu ra: Mơ hình 3D của Gan
Phƣơng pháp hiển thị sử dụng là kỹ thuật Marchinh Cubes.
3. ĐỐI TƢỢNG VÀ PHẠM VI NGHIÊN CỨU
- Đối tƣợng nghiên cứu: Một số kỹ thuật xử lý ảnh đƣợc ứng dụng trong
3
quy trình dựng mơ hình 3D gan từ dữ liệu ảnh CT.
- Phạm vi nghiên cứu: Ảnh của Gan đƣợc chụp từ thiết bị chụp cắt lớp CT.
4. PHƢƠNG PHÁP NGHIÊN CỨU
Phƣơng pháp nghiên cứu của đề tài đƣợc lựa chọn là lý thuyết kết hợp
với thực nghiệm. Các vấn đề cần giải quyết liên quan đến các thuật toán và lý
thuyết truyền thông mạng, xử lý ảnh, thị giác máy và đồ họa máy tính đƣợc
thực hiện trên phần mềm máy tính với đầu vào là các thơng tin thu nhận đƣợc
từ thực tế. Quá trình đƣợc tiến hành dựa trên việc tìm hiểu tài liệu, cài đặt thử
nghiệm sau đó đánh giá kết quả thực nghiệm và cải tiến nhằm nâng cao chất
lƣợng hệ thống.
Nhƣ vậy, cần tiến hành tìm hiểu lý thuyết về một số kỹ thuật xử lý ảnh
đƣợc ứng dụng trong quy trình dựng mơ hình 3D gan từ dữ liệu ảnh CT. Tìm
hiểu kỹ thuật về mặt lý thuyết sẽ đƣợc kết hợp với việc cài đặt thực nghiệm
trên dữ liệu ảnh chụp cắt lớp thực tế để kiểm chứng và đánh giá những nội
dung lý tìm hiểu lý thuyết và từ đó cải tiến và hồn thiện chƣơng trình.
5. CẤU TRÚC LUẬN VĂN
Ngồi phần mở đầu, mục lục, danh mục các bảng biểu, danh mục các từ
viết tắt, kết luận và tài liệu than khảo, luận văn gồm 3 chƣơng.
Chƣơng 1: Tổng quan về xử lý ảnh dựng mơ hình 3D Gan
Chƣơng 2: Một số kỹ thuật trong dựng mơ hình 3d Gan từ ảnh CT
Chƣơng 3: Cài đặt và thử nghiệm
4
CHƢƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH TRONG DỰNG
MÔ HÌNH 3D GAN
Nội dung chính trong chương này sẽ trình bày khái quát về ảnh y khoa,
xử lý ảnh y khoa, một số thuật toán cơ bản trong xử lý ảnh cũng như trong xử
lý ảnh y khoa. Tìm hiểu cấu tạo mơ hình 3D, một số nghiên cứu về vấn đề
dựng mơ hình 3D của Gan từ dữ liệu ảnh CT trên thế giới cũng như tại Việt
Nam. Bên cạnh đó, cũng nêu ra một số vấn đề trong xử lý ảnh y tế CT.
1.1.
DỮ LIỆU ẢNH SỐ Y KHOA
1.1.1. Giới thiệu
Công nghệ điện tử đã và đang phát triển rất nhanh trong hơn một thập
niên gần đây, nhờ đó các thiết bị máy tính, máy ảnh và y tế cũng đƣợc phát
triển với nhiều chức năng tiện nghi, tốc độ và hiện đại hơn.
Trong đó, máy tính đã trở thành một phần không thể tách rời của hệ
thống hình ảnh y tế và đƣợc sử dụng cho việc thu thập dữ liệu ảnh để hiển thị
và phân tích. Từ đó, nhiều thiết bị y tế nhƣ máy chụp X-quang, máy chụp ảnh
cắt lớp (CT scanner), chụp cộng hƣởng từ (MRI), chụp cắt lớp phát xạ
(PET/CT) và những loại ảnh y tế khác đã đƣợc áp dụng những phƣơng pháp
xử lý hiện đại để cho ra ảnh rõ nhất có thể, để giúp các bác sĩ trong việc chẩn
đốn. Sự phát triển của cơng nghệ hình ảnh ngày càng tăng, các kỹ thuật tiên
tiến, do vậy, luôn đƣợc áp dụng để giải quyết những vấn đề rất thách thức
trong chẩn đoán ảnh y tế hiện nay.
Xử lý ảnh đã có từ lâu và những ứng dụng của nó là rất nhiều trong
cuộc sống dân sự, quân sự, y tế và nhiều lĩnh vực khác [1].
Ứng dụng của xử lý ảnh có khả năng tác động mạnh mẽ nhất đến cuộc
sống của chúng ta là trong lĩnh vực y tế. Soi chụp bằng máy tính dựa trên cơ
sở định lý cắt lớp (projection_slice) đƣợc dùng thƣờng xuyên trong xét
5
nghiệm lâm sàng, ví dụ nhƣ phát hiện và nhận dạng u não. Những ứng dụng y
học khác của xử lý ảnh số gồm cải thiện ảnh X-quang và nhận dạng đƣờng
biên mạch máu từ những ảnh chụp mạch bằng tia X(angiograms). Ảnh sau khi
đƣợc tái tạo chƣa thể sử dụng ngay đƣợc, ảnh hƣởng đến chất lƣợng, gây khó
khăn cho việc chẩn đốn bệnh.
Thu nhận
ảnh
Tiền xử lý
ảnh
Biểu diễn
và mơ tả
Nhận
dạng và
nội suy
Cơ sở tri thức
Hình 1.1. Các bƣớc cơ bản trong xử lý ảnh y khoa [2]
Do vậy cần phải sử dụng nhiều phƣơng pháp xử lý ảnh để nâng cao chất
lƣợng ảnh. Các bƣớc cần thiết trong xử lý ảnh nhƣ sau:
* Phần thu nhận ảnh (Image Acquisition)
Qua các camera (tƣơng tự,số).
- Từ vệ tinh qua các bộ cảm ứng(Sensors).
- Qua các máy quét ảnh(Scaners).
Các thiết bị thu nhận này có thể cho ảnh đen trắng. Các thiết bị thu nhận
ảnh có 2 loại chính ứng với 2 loại ảnh thơng dụng là Raster và Vector. Nhìn
chung các hệ thống thu nhận ảnh thực hiện q trình đó là Cảm biến nhằm
biến đổi năng lƣợng quang học thành năng lƣợng điện và sau đó là Tổng hợp
năng lƣợng điện thành ảnh.
* Tiền xử lý (ImagePreprocessing)
Sau bộ thu nhận, ảnh có thể bị nhiễu, mờ, khơng sắc nét nên cần đƣa vào
6
bộ tiền xử lý để nâng cao chất lƣợng. Chức năng chính của bộ tiền xử lý là lọc
nhiễu, nâng dần độ tƣơng phản để làm ảnh rõ hơn, nét hơn.
* Phân đoạn (Segmentation) hay phân vùng ảnh
Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để
biểu diễn phân tích, nhận dạng ảnh. Ví dụ: để nhận dạng chữ (hoặc mã vạch)
trên phong bì thƣ cho mục đích phân loại bƣu phẩm, cần chia các câu, chữ về
địa chỉ hoặc tên ngƣời thành các từ, các chữ, các số (hoặc các vạch) riêng biệt
để nhận dạng. Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ
gây lỗi, làm giảm độ chính xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc rất
nhiều vào công đoạn này.
* Biểu diễn ảnh (ImageRepresentation)
Ảnh trên máy tính là kết quả thu nhận theo các phƣơng pháp số hoá đƣợc
nhúng trong các thiết bị kỹ thuật khác nhau. Quá trình lƣu trữ ảnh nhằm 2
mục đích. Trƣớc hết là để tiết kiệm bộ nhớ và sau đó là giảm thời gian xử lý.
Việc lƣu trữ thơng tin trong bộ nhớ có ảnh hƣởng rất lớn đến việc hiển
thị, in ấn và xử lý ảnh đƣợc xem nhƣ là một tập hợp các điểm với cùng kích
thƣớc nếu sử dụng càng nhiều điểm ảnh thì bức ảnh càng đẹp, càng mịn và
càng thể hiện rõ hơn chi tiết của ảnh ngƣời ta gọi đặc điểm này là độ phân
giải. Việc lựa chọn độ phân giải thích hợp tuỳ thuộc vào nhu cầu sử dụng và
đặc trƣng của mỗi ảnh cụ thể.
* Nhận dạng và nội suy ảnh (Image Recognition andInterpretation)
Nhận dạng ảnh là quá trình xác định ảnh. Quá trình này thƣờng thu đƣợc
bằng cách so sánh với mẫu chuẩn đã đƣợc học (hoặc lƣu) từ trƣớc. Nội suy là
phán đoán theo ý nghĩa trên cơ sở nhận dạng.
Có nhiều cách phân loại ảnh khác nhau về ảnh. Theo lý thuyết về nhận dạng,
các mơ hình toán học về ảnh đƣợc phân theo hai loại nhận dạng ảnh cơ bản:
Nhận dạng theo tham số.
7
Nhận dạng theo cấu trúc.
Một số đối tƣợng nhận dạng khá phổ biến hiện nay đang đƣợc áp dụng
trong khoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký
điện tử), nhận dạng văn bản (Text), nhận dạng vân tay, nhận dạng mã vạch,
nhận dạng mặt ngƣời…
* Cơ sở tri thức (KnowledgeBase)
Nhƣ đã nói ở trên, ảnh là một đối tƣợng khá phức tạp về đƣờng nét, độ
sáng tối, dung lƣợng điểm ảnh, môi trƣờng để thu ảnh phong phú kéo theo
nhiễu. Trong nhiều khâu xử lý và phân tích ảnh ngồi việc đơn giản hóa các
phƣơng pháp tốn học đảm bảo tiện lợi cho xử lý, ngƣời ta mong muốn bắt
chƣớc quy trình tiếp nhận và xử lý ảnh theo cách của con ngƣời. Trong các
bƣớc xử lý đó, nhiều khâu hiện nay đã xử lý theo các phƣơng pháp trí tuệ con
ngƣời. Vì vậy, ở đây các cơ sở tri thức đƣợc pháthuy.
* Mơ tả (biểu diễnảnh)
Từ Hình 1.1, ảnh sau khi số hoá sẽ đƣợc lƣu vào bộ nhớ, hoặc chuyển
sang các khâu tiếp theo để phân tích. Nếu lƣu trữ ảnh trực tiếp từ các ảnh thơ,
địi hỏi dung lƣợng bộ nhớ cực lớn và không hiệu quả theo quan điểm ứng
dụng và công nghệ. Thông thƣờng, các ảnh thô đó đƣợc đặc tả (biểu diễn) lại
(hay đơn giản là mã hoá) theo các đặc điểm của ảnh đƣợc gọi là các đặc trƣng
ảnh (Image Features) nhƣ: biên ảnh (Boundary/Egde), vùng ảnh (Region).
Một số phƣơng pháp biểu diễn thƣờng dùng:
- Biểu diễn bằng mã chạy (Run-LengthCode)
- Biểu diễn bằng mã xích (Chaine-Code)
- Biểu diễn bằng mã tứ phân (Quad-TreeCode)
1.1.2. Khái niệm ảnh y khoa và dữ liệu ảnh CT Gan
Ảnh y tế là kỹ thuật và quá trình đƣợc sử dụng để tái tạo ra hình ảnh cơ
thể con ngƣời hoặc bộ phận cơ thể ngƣời phục vụ cho mục đích lâm sàng và
8
cận lâm sàng nhƣ chẩn đoán bệnh, kiểm tra bệnh hoặc khoa học y tế (bao gồm
cả giải phẫu và sinh lý). Ảnh y tế theo nghĩa rộng của nó có nghĩa là một phần
narh sinh học và kết hợp X-quang, y học hạt nhân, nội soi, … dùng trong chẩn
đoán bệnh lý con ngƣời.
Ảnh CT Gan là một kỹ thuật áp dụng đồng thời kỹ thuật X – quang và kỹ
thuật máy tính để phân tích hình ảnh Gan trong ổ bụng thông qua các lớp cắt
của tia X – quang để chẩn đoán bệnh Gan. Khi Gan bị bệnh, các tổ chức trong
gan sẽ bị biến đổi, dẫn đến sự biến đổi tỷ trọng chung của Gan. Vì vậy, hình
ảnh các lớp cắt qua kỹ thuật chụp cắt lớp cũng sẽ thể hiện khác biệt so với gan
bình thƣờng, dựa vào nguyên lý này mà các bác sĩ chẩn đốn hình ảnh có thể
chẩn đốn bệnh về gan một cách chính xác nhất.
1.1.3. Một số chuẩn hình ảnh y khoa
Các máy thiết bị và máy y tế chẩn đốn hình ảnh đầu tiên khi mới ra đời chỉ
là tín hiệu dạng sóng (Analog) đƣa lên màn hình VIDEO của máy. Theo thời
gian, máy đƣợc chế tạo ngày càng có cấu hình cao hơn và chuyển dần sang tín
hiệu số, các phần mềm xử lý tín hiệu lƣu trữ thơng tin số ngay tại các máy đó (ví
dụ máy siêu âm có thể lƣu đƣợc 5000 ảnh của bệnh nhân gần đây nhất).Tuy
nhiên, dần từng bƣớc khi có các điều kiện đặt ra và nhu cầu giao tiếp giữa các
máy với nhau (ví dụ: máy CT Scanner chuyển cho máy chiếu tia Coban...) và
truyền ảnh số giữa các vùng với nhau để trợ giúp chẩn đốn thì các chuẩn dữ liệu
chung về hình ảnh của y tế dần ra đời. Vì vậy, các máy y tế ngày nay có gắn thiết
bị tin học thì đã sẵn sàng đƣa ra các tín hiệu thơng qua các D-Shell chuẩn nhƣ
COM, LPT... hoặc USB port. Tuy nhiên, phần tín hiệu đƣa ra các cổng này tuỳ
nhà cung cấp trang bị phần mềm khi ngƣời sử dụng yêu cầu.
Tuy nhiên có nhiều chuẩn để truyền ảnh trên mạng nhƣ chuẩn PACS
(Picture Archiving and Communication System) là hệ thống lƣu trữ, xử lý và
truyền ảnh động, hoặc mạng xử lý và truyền ảnh số hoá DICOM (Digital
9
Imaging and Communications in Medicine). Tất cả các chuẩn này có chung
một tiêu chí là nén ảnh ở mức độ tối đa để giảm kích thƣớc lƣu trữ, giảm kích
thƣớc khi truyền trên mạng, có các mức độ phân giải khác nhau khi truyền.
Nếu hình ảnh khơng cần chất lƣợng cao thì có thể truyền ở độ phân giải thấp
và khi cần độ nét để chẩn đoán với chất lƣợng cao thì truyền ảnh với các độ
phân giải cao hơn, nhƣng tốc độ truyền trên mạng sẽ chậm đi nhiều. Các ảnh
truyền thƣờng là các ảnh về X quang, ảnh siêu âm, ảnh nội soi, ảnh CT
Scanner... Việc truyền ảnh này giúp cho hỗ trợ chẩn đoán từ xa, cho các thầy
thuốc, học viên, sinh viên học tập và nghiên cứu.
DICOM là từ viết tắt của The Digital Image and Communication in
Medicine - Tiêu chuẩn ảnh số và truyền thông trong y tế - Là hệ thống tiêu
chuẩn công nghiệp đƣợc phát triển nhằm tạo ra một chuẩn chung trong trao
đổi ảnh y tế giữa các nhà sản xuất cũng nhƣ ngƣời sử dụng. Tiêu chuẩn này
bao gồm cả việc định nghĩa cấu trúc khuôn dạng tập tin cũng nhƣ giao thức
truyền tin.
* Các thành phần của tiêu chuẩn DICOM.
- Nghi thức thực hiện (Conformance).
- Định nghĩa đối tƣợng thông tin (Information Object Definitions).
- Định nghĩa lớp dịch vụ (Service Class Definitions).
- Cấu trúc dữ liệu và mã hóa (Data Structure and Encoding).
- Từ điển dữ liệu (Data Dictionary).
- Giao thức trao đổi bản tin (Message Exchange Protocol).
- Hỗ trợ truyền thông mạng trao đổi bản tin (Network Communication
Support for Message Exchange).
- Hỗ trợ trao đổi kiểu điểm – điểm (Point to Point Support).
- Profiles ứng dụng lƣu trữ Media (Media Storage Application
Profiles).
10
- Media vật lý và khuôn dạng dùng cho trao đổi dữ liệu (Media Formats
and Physical Media for Data Interchange).
- Chức năng hiển thị chuẩn mức xám (Grayscale Standard Display
Function).
- Profiles quản lý hệ thống và an ninh bảo mật (Security and System
Management Profiles).
- Nguồn ánh xạ nội dung (Content Mapping Resource).
* Lớp đối tƣợng và lớp dịch vụ DICOM
DICOM có 2 lớp thơng tin là “Lớp đối tƣợng” và “Lớp dịch vụ”; trong
đó lớp đối tƣợng IOD (Information Object Definition) bao gồm từ điển dữ
liệu và đối tƣợng thế giới thực. Lớp dịch vụ bao gồm các định nghĩa dịch vụ:
lƣu trữ, truyền hình ảnh, hiển thị, truy vấn… đƣợc xây dựng dựa trên tập các
phần tử dịch vụ truyền thông DIMSE (Dicom Message Service Elements) mà
thực chất là các chƣơng trình phần mềm có nhiệm vụ thực thi các chức năng
xác định theo yêu cầu.
1.2.
MỘT SỐ PHƢƠNG PHÁP XỬ LÝ ẢNH TRONG DỰNG MƠ
HÌNH 3D GAN
Ngày nay, các mơ hình 3D đƣợc sử dụng trong nhiều lĩnh vực. Ngành y
tế sử dụng các mơ hình chi tiết của các cơ quan trong cơ thể. Chúng có thể
đƣợc tạo bằng nhiều lát ảnh 2 chiều từ quét MRI hoặc CT. Ngành công
nghiệp điện ảnh sử dụng chúng làm nhân vật và đối tƣợng cho các hình ảnh
chuyển động sống động và chân thực. Ngành cơng nghiệp trị chơi video sử
dụng chúng làm tài sản cho máy tính và trị chơi video. Ngành khoa học sử
dụng chúng nhƣ các mô hình chi tiết cao của các hợp chất hóa học. Ngành
kiến trúc sử dụng chúng để trình diễn các tịa nhà và cảnh quan đƣợc đề xuất
thay cho các mô hình kiến trúc vật lý truyền thống. Cộng đồng kỹ thuật sử
dụng chúng nhƣ thiết kế của các thiết bị, phƣơng tiện và cấu trúc mới cũng
11
nhƣ một loạt các ứng dụng khác. Trong những thập kỷ gần đây, cộng đồng
khoa học trái đất đã bắt đầu xây dựng các mơ hình địa chất 3D nhƣ một thơng
lệ tiêu chuẩn. Mơ hình 3D cũng có thể là cơ sở cho các thiết bị vật lý đƣợc
xây dựng bằng máy in 3D hoặc máy CNC.
Trên thế giới tái tạo ảnh 3D đã có những bƣớc tiến rất xa do đã đƣợc
phát triển trong vài chục năm gần đây. Năm 1970, phƣơng pháp chụp ảnh CT
cùng với các phƣơng pháp chụp ảnh số dùng trong chẩn đoán y khoa ra đời.
Từ đó, có khá nhiều phần mềm thƣơng mại tái tạo ảnh 3D từ các lát cắt, các
gói phần mềm này thƣờng phải cài đặt trên máy tính hệ thống của nhà sản
xuất và có giá thành khá cao.
Một số kết quả nghiên cứu trong xử lý hình ảnh y tế năm những năm gần
đây:
Hình 1.2. Một số nghiên cứu về xử lý ảnh y tế trên thế giới
Từ trên bên trái sang dưới cùng bên phải: Phát hiện khối u vú (Kooi và cộng sự,
2016), Phát hiện các tổn thương trong não trên ảnh MRI (Ghafoorian và các cơng sự,
2016), Phát hiện rị cây khí phế quản (Charbonnier và các cộng sự, 2017), Phân loại võng
mạc của người bị bệnh tiểu đường (Grinsven và cộng sự, 2016), Phát hiện bất thường trên
tiền liệt (2012), Phân loại nốt bất thường trên phổi (2016), Phát hiện di căn ung thư vú
12
trong hạch bạch huyết (2016), Phát hiện tổn thương da (Esteva và các cộng sự, 2017),
Phát hiện gãy xương bằng tia X Yang và cộng sự, 2016).
1.2.1. Phát hiện Gan trên dữ liệu ảnh CT, MRI
Năm 2014, tác giả Vladimir Lukes và các cộng của Trƣờng Đại học
West Bohemia, Pilsen, Cộng hịa Czech đã nghiên cứu thuật tốn phát hiện
Gan dựa trên phƣơng pháp lát cắt đồ thị (Graph – Cut) [8] và mô phỏng khả
năng truyền dịch thông qua các mạch máu trong Gan dựa trên phƣơng trình vi
phân đạo hàm riêng (Partial Differential Equation) và các kỹ thuật phân đoạn
ảnh dựa trên mơ hình học máy SVM, tuy kết quả phát hiện Gan của cơng
trình này mới chỉ đạt đƣợc ở mức độ bán tự động.
Hình 1.3. Phát hiện vùng Gan bán tự động
Phát hiện vùng Gan bằng cách đánh dấu màu xanh, được giới hạn bởi các đánh
dấu màu đỏ
Năm 2014, Nhóm nghiên cứu Cộng hịa Séc đã nghiên cứu mơ hình hóa
hoạt động của Gan
13
Hình 1.4. Mơ hình hóa hoạt động của Gan
Năm 2015, tác giả Wen Li và các cộng sự của Viện phát triển cơng nghệ
hình ảnh y tế và phẫu thuật ảo tại Trung Quốc cũng đã nghiên cứu phát hiện u
Gan tự động từ dữ liệu ảnh CT dựa vào mơ hình học sâu (Deep Learning).
Kết quả thu đƣợc đƣợc đánh giá là tốt hơn so với nhiều phƣờng pháp học máy
truyền thống nhƣ AdaBoost, RF (Random Forests), SVM (Support Vector
Machine), tuy nhiên kết quả này cũng còn nhiều hạn chế trong trƣờng hợp các
khối u có mật độ khơng đồng nhất, biên không rõ ràng và nhiều khối u liền kề
có cấu trúc mật độ khá giống nhau (các vùng bất thƣờng có sự phân biệt nhỏ
so với vùng Gan bình thƣờng và các vùng Gan với các vùng không phải Gan
14
có độ tƣơng đồng rất cao).
Hình 1.5. Phát hiện u Gan trên 4 ảnh CT
Từ dòng đầu tiên đến dòng dưới cùng: phương pháp AdaBoost (màu tím); Phương pháp
Random Forests (màu xanh lá cây); Phương pháp Support Vector machine (màu xanh da
trời); Phương pháp học sâu Convolutional Neural Networks (màu đỏ).
1.2.2. Định vị vùng Gan dựa trên kỹ thuật hồi quy
Năm 2017, nhóm Lê Thị Kim Nga và các cộng sự đã công bố bài báo về
“Một kỹ thuật định vị đối tƣợng không cấu trúc trên ảnh dựa vào tiếp cận hồi
quy” [3]. Thuật toán này đƣợc cài đặt thử nghiệm với đối tƣợng gan trong ảnh
chụp cắt lớp CT trên cơ sở xây dựng cây hồi quy kết hợp với bản đồ vote
map. Trong y tế, dữ liệu Gan có độ tƣơng phản thấp so với vùng mơ xung
quanh; hơn nữa, độ tƣơng phản của Gan có thể thay đổi do ảnh hƣởng của
nồng độ chất béo trong gan. Một điểm quan trọng nữa là hình dạng của lá gan
có rất nhiều biến thể. Đây là một loại đối tƣợng phức tạp và rất khó quan sát
chi tiết kể cả với mắt ngƣời. Kết quả thử nghiệm đã xác định đƣợc tƣơng đối
vị trí xuất hiện của Gan nhƣng vẫn còn một số vấn đề cần giải quyết với
những vùng biên, vùng góc. Dƣới đây là một số kết quả hình ảnh trong định
vị Gan trong bài báo của nhóm tác giả.
15
Kết quả trường hợp hình dạng lá gan tương Kết quả trường hợp tổng quát: bên trái là
đồng: bên trái là ảnh chụp cắt lớp, bên phải ảnh chụp cắt lớp, bên phải là vote map
là vote map
Hình 1.6. Định vị Gan dựa vào kỹ thuật hồi quy tích hợp bản đồ vote map
16
Kết quả hình ảnh khi phân ngưỡng từng mức Kết quả hình ảnh khi phân ngưỡng từng mức
trên vote map với một kết quả của trường hợp trên vote map với một kết quả của trường hợp
hình dạng lá gan tương đồng
tổng quát
Hình 1.7. Định vị Gan dựa vào kỹ thuật hồi quy
Năm 2017: Nhóm nghiên cứu của Lê Trọng Ngọc của Đại học Khoa học
tự nhiên TP HCM công bố bài báo về xác định kích thƣớc Gan từ ảnh MRI
3D dựa trên thuật tốn phân tích contour động. (Hình 1.8)