Tải bản đầy đủ (.pdf) (19 trang)

Xây dựng phần mềm trí tuệ nhân tạo trong chẩn đoán mô bệnh học hạch di căn của ung thư phổi

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (7.26 MB, 19 trang )

Xây dựng phần mềm trí tuệ nhân tạo
(AI) trong chẩn đốn mơ bệnh học
hạch di căn của ung thư phổi
TS. BS. Phạm Hoàng Ngọc Hoa và cộng sự
Trung tâm Giải phẫu bệnh – Tế bào học, Bệnh viện Bạch Mai
Trường Đại học Nagasaki, Nhật Bản.


Đặt vấn đề
• Ứng dụng A.I. đặc biệt là deep learning trong y học
đang nổi lên là một xu hướng mới trên thế giới, vì
những lợi ích rất rõ ràng mà nó mang lại trong chẩn
đốn và điều trị.
• Chẩn đoán hạch di căn trong ung thư là một bước quan
trọng nhằm phân độ ung thư và đưa ra quyết định điều
trị phù hợp.
• Tuy nhiên việc sàng lọc nhiều tiêu bản hạch là công việc
dễ gây mệt mỏi và nhàm chán, dẫn đến khả năng xảy ra
sai sót trong chẩn đốn.
• Trong các loại ung thư, ung thư phổi là nguyên nhân
gây tử vong nhiều nhất trên thế giới.
• Đây cũng là đề tài mới chưa có cơng bố quốc tế nào.

Source: Halo AI ® in automated breast cancer metastasis challenge


Phương pháp nghiên cứu
• 349 tiêu bản H&E hạch (160 hạch di căn và 189 hạch
không di căn theo kết quả GPB thường quy) của bệnh
nhân ung thư phổi được thu thập ở 2 bệnh viện ĐH
Nagasaki và Kameda, Nhật Bản từ năm 2014-2018.


• 233 tiêu bản để dạy máy (training), 10 tiêu bản để kiểm
định ban đầu (validation) và 106 tiêu bản để đánh giá
thuật tốn (testing).
• Mục tiêu:
1. Xây dựng phần mềm ứng dụng trí tuệ nhân tạo (A.I.) có
khả năng phát hiện tế bào ung thư phổi di căn hạch.
2. Giảm thiểu các lỗi sai thường gặp của phần mềm A.I.
trong chẩn đoán ung thư di căn hạch.

Di căn

vs.

Không
di căn


- Tiêu bản scan bằng máy Aperio Scancope CS2 (Leica) ở vật kính 40x.
- Xây dựng thuật tốn trên phần mềm Halo v.2.2 (Indica Labs, USA).
- Pilot study: Bước đầu tạo khoảng 4000 chú thích cho 2 phân loại u và
khơng u để training thuật tốn deep learning (VGG - CNN).

3900 chú thích
3000 chú thích


• Sử dụng cửa sổ “real time” để kiểm tra tức thì khả
năng phân loại của thuật tốn.
• Model của chúng tơi ban đầu dường như có thể
phát hiện u khá tốt.


Đỏ: vùng u được tiên đốn, xanh: mơ nền,
Đường vàng: tiêu chuẩn vàng của BS


Lỗi sai!!!

Khó khăn ban đầu

• Nhiều vùng dương tính giả lớn.
• Những lỗi sai giả u thường gặp: mơ bào,
tâm mầm của nang lympho.
-> Hướng giải quyết: Làm bước tiếp theo: cho
thêm nhiều chú thích (10,000) và thêm nhiều
bước dạy nhắc lại (iteration) (10,000,000 lần)
Kết quả: vẫn còn nhiều lỗi sai tương tự.
Nguyên nhân: do cắt ngưỡng của u (tumor
threshold) trong bản đồ nóng (heatmap) của
phần mềm bị cố định là 50% (mức thấp).

Lỗi sai!!


Tìm hướng giải quyết
Tạo một model deep learning mới trong đó đưa nang lympho thành một
phân loại riêng, gồm 3 loại: Nang lympho, u và mô khác.

Nang lympho

Mô u


Mô khác

(2371 chú thích)

(3902 chú thích)

(3030 chú thích)

Kết quả:




Độ phân giải cao: 0.25 µm/ pixel
740,000 bước dạy nhắc lại

Dương tính giả nang
lympho.

Nang lympho
Mơ u
Mơ khác

Dương tính giả mơ u.


Quyết định của bạn là gì?
1. Chờ đợi phiên bản mới của phần mềm Halo có chức năng chỉnh ngưỡng u dành cho
người dùng?

2. Tiếp tục cung cấp thêm thật nhiều data (Big Data) cho thuật toán?
3. Chờ đợi sự giúp đỡ của kĩ sư máy tính của hãng?
4. Đầu hàng và chuyển sang đề tài nghiên cứu khác?


• Giả thuyết mới: sử dụng 2 bước (2 models) cho 2 mục tiêu:
- Bước 1: loại bỏ các nang lympho phản ứng
- Bước 2: tìm kiếm u trên nền hạch đã loại bỏ nang lympho.
=> có thể giảm được sai sót và tăng độ chính xác cho mục tiêu phát hiện u di căn hạch.


Bước 1: Phát hiện và loại bỏ nang lympho
✓ Các nang lympho có hình dáng và kích thước khá tương đồng.
✓ Xây dựng 2 model khác nhau để chọn 1 model hiệu quả nhất:

1. Random forest classifier (model 1)
– 2 phân loại
• Chỉ cần những chú thích ít, nhỏ
• Mục tiêu phát hiện nang lympho.

2. Deep learning (model 2) - 2 phân loại.
• Cần số lượng chú thích vừa phải.
• Mục tiêu phát hiện nang lympho.

Nang lympho
(20 chú thích)

Nang lympho
(1243 chú thích)


Mơ khác
(45 chú thích)

Mơ khác
(1089 chú thích)






Độ phân giải thấp: 4.4 µm/ pixel

Độ phân giải cao: 1.04 µm/ pixel
33,500 bước dạy nhắc lại


Bước 2: Xây dựng model phát hiện u





Deep learning (Model 3) - 2 phân loại: U và không u
Cần số lượng chú thích nhiều, đa dạng.
Độ phân giải cao: 0.25 µm/ pixel
10,000,000 bước dạy nhắc lại.
Mục tiêu phát hiện tế bào u trên tiêu bản hạch.

Mơ u

(4196 chú thích)

Mơ khác
(5959 chú thích)


Phương pháp đánh giá kết quả
• Bước 1: Hình ảnh được chia thành các ơ nhỏ (100 x 100 µm) và so sánh với hình
vẽ chú thích của BS GPB (tiêu chuẩn vàng).
Ơ nhỏ được coi là:
- Dương tính thật: nếu khu vực tiên đoán u trùng >50% với tiêu chuẩn vàng.
- Dương tính giả: nếu khu vực tiên đốn u trùng <50% với tiêu chuẩn vàng.
- Âm tính thật: nếu khu vực tiên đốn khơng-u nằm ngồi tiêu chuẩn vàng.
- Âm tính giả: nếu khu vực tiên đốn khơng-u nằm trong tiêu chuẩn vàng.
• Bước 2: Đánh giá dương tính, âm tính trên mức độ tiêu bản (slide-level):
- Có u: gán nhãn dương tính
- Khơng u: gán nhãn âm tính.
- Phân loại u theo kích thước: Di căn lớn, Vi di căn và Tế bào u đơn độc.
- Công thức tính sự giảm diện tích dương tính giả:
Giảm Diện tích dương tính giả (DTDTG) =

vs.

𝐷𝑇𝐷𝑇𝐺 𝑐ủ𝑎 𝑃𝑃 1 𝑏ướ𝑐 −𝐷𝑇𝐷𝑇𝐺 𝑐ủ𝑎 𝑃𝑃 2 𝑏ướ𝑐
𝐷𝑇𝐷𝑇𝐺 𝑐ủ𝑎 𝑃𝑃 1 𝑏ướ𝑐


Kết quả
Bước 1: Mục tiêu phát hiện nang lympho
Random forest


Deep learning

Nang lympho
Mơ khác

Khu vực bị bỏ sót của
nang lympho (Âm tính giả)

Khu vực bị chẩn đốn q
mức của nang lympho
(dương tính giả)

• Độ chính xác (Accuracy):
Model 1: 51.7%
Model 2: 94.5%
• Model 2 có kết quả khá
tương đồng với nang
lympho nguyên gốc.

Khơng bị
dương tính giả

Dương
tính giả

• Model 2 khơng mắc
những lỗi sai của model
1.
Nhuộm H&E


Model 1

Model 2

Được
chọn!


Kết quả: Bước 2: Phát hiện u
• Phần mềm của chúng tơi có khả năng phát hiện u với các kích thước khác nhau di căn hạch.
• Đánh giá trên 106 tiêu bản của 2 bệnh viện (24 Di căn lớn, 23 Vi di căn, 2 Tế bào u đơn độc và 57 Khơng u).
2 mm

200 µm

2 mm

100 µm

200 µm

Di căn lớn

100 µm

Vi di căn

Tế bào u đơn độc (ITC)



Tiêu bản H&E

Trở lại vấn đề trước…
• Phần lớn các khu vực dương tính giả có
diện tích lớn đã bị xóa bỏ.
• Giảm 36.5% lỗi sai ở nhóm hạch phản
ứng, có trường hợp giảm tới 89%.
• Vẫn cịn tồn tại một số ổ dương tính giả
nhỏ trên tiêu bản.

Khơng di căn

Có nang
lympho

Khơng có
nang lympho

PP 1 bước

PP 2 bước

Di căn

Giảm các lỗi dương tính giả

Tiêu bản H&E

PP 1 bước


PP 2 bước

(Đỏ: phát hiện u, đường vàng:
tiêu chuẩn vàng của bác sĩ)


Đưa ra ngưỡng loại bỏ ổ nhỏ tiên đoán dương tính trên tiêu bản.

Dương tính
Âm tính
Độ nhạy
Độ đăc hiệu

Tiêu bản di
căn

Tiêu bản khơng
di căn

39
10

2
55

79.6%
96.5%

1

0.9
0.8
0.7

Sensitivity

0.6mm

0.6
0.5
0.4

0.7mm

Tiêu bản di
căn

Tiêu bản khơng
di căn

Dương tính

37

1

0.1

Âm tính


12

56

0

Độ nhạy

75.5%

Độ đăc hiệu

98.2%

0.3
0.2

0

0.2

0.4

0.6

False positive rate

- Đường ROC tạo bởi ngưỡng lọc do loại bỏ các ổ nhỏ theo kích cỡ được phần mềm
tiên đốn dương tính. Thay đổi ngưỡng lọc từ 0 – 1.2mm, ta có đường ROC của phần
mềm phát hiện u di căn hạch với AUC = 0.922.

- 2 ngưỡng loại bỏ tốt nhất là 0.6 và 0.7mm, cho ta độ nhạy và độ đặc hiệu lần lượt là
79.6 – 96.5% và 75.5 – 98.2%.

0.8

1


Kết luận
• Phần mềm AI của chúng tơi có khả năng phát hiện hạch di căn của ung thư
phổi trên mơ bệnh học.
• Phương pháp sử dụng 2 bước deep learning nhằm loại bỏ các nang lympho

có tiềm năng là 1 phương pháp tốt nhằm giảm thiểu các lỗi sai đặc biệt là
dương tính giả.
• Vẫn cịn một số hạn chế trong phần mềm của chúng tôi như số lượng data
chưa nhiều, độ nhạy và độ đặc hiệu khó cân bằng để cùng cao (có thể khắc
phục ở phần mềm bản mới cho phép chỉnh ngưỡng u trên heatmap).

• Sự kết hợp giữa AI và BS GPB vẫn là ưu tiên hàng đầu cho việc chẩn đoán tốt
nhất cho người bệnh.


Nghiên cứu được đăng trên tạp chí The
American Journal of Pathology (2019). IF = 4.307

Giải poster xuất sắc nhất về Phân tích hình
ảnh tại hội thảo Pathology Vision 2018, Mỹ.



Nagasaki, Japan
World’s new top three night views

Xin chân thành cảm ơn!



×