Xây dựng phần mềm trí tuệ nhân tạo
(AI) trong chẩn đốn mơ bệnh học
hạch di căn của ung thư phổi
TS. BS. Phạm Hoàng Ngọc Hoa và cộng sự
Trung tâm Giải phẫu bệnh – Tế bào học, Bệnh viện Bạch Mai
Trường Đại học Nagasaki, Nhật Bản.
Đặt vấn đề
• Ứng dụng A.I. đặc biệt là deep learning trong y học
đang nổi lên là một xu hướng mới trên thế giới, vì
những lợi ích rất rõ ràng mà nó mang lại trong chẩn
đốn và điều trị.
• Chẩn đoán hạch di căn trong ung thư là một bước quan
trọng nhằm phân độ ung thư và đưa ra quyết định điều
trị phù hợp.
• Tuy nhiên việc sàng lọc nhiều tiêu bản hạch là công việc
dễ gây mệt mỏi và nhàm chán, dẫn đến khả năng xảy ra
sai sót trong chẩn đốn.
• Trong các loại ung thư, ung thư phổi là nguyên nhân
gây tử vong nhiều nhất trên thế giới.
• Đây cũng là đề tài mới chưa có cơng bố quốc tế nào.
Source: Halo AI ® in automated breast cancer metastasis challenge
Phương pháp nghiên cứu
• 349 tiêu bản H&E hạch (160 hạch di căn và 189 hạch
không di căn theo kết quả GPB thường quy) của bệnh
nhân ung thư phổi được thu thập ở 2 bệnh viện ĐH
Nagasaki và Kameda, Nhật Bản từ năm 2014-2018.
• 233 tiêu bản để dạy máy (training), 10 tiêu bản để kiểm
định ban đầu (validation) và 106 tiêu bản để đánh giá
thuật tốn (testing).
• Mục tiêu:
1. Xây dựng phần mềm ứng dụng trí tuệ nhân tạo (A.I.) có
khả năng phát hiện tế bào ung thư phổi di căn hạch.
2. Giảm thiểu các lỗi sai thường gặp của phần mềm A.I.
trong chẩn đoán ung thư di căn hạch.
Di căn
vs.
Không
di căn
- Tiêu bản scan bằng máy Aperio Scancope CS2 (Leica) ở vật kính 40x.
- Xây dựng thuật tốn trên phần mềm Halo v.2.2 (Indica Labs, USA).
- Pilot study: Bước đầu tạo khoảng 4000 chú thích cho 2 phân loại u và
khơng u để training thuật tốn deep learning (VGG - CNN).
3900 chú thích
3000 chú thích
• Sử dụng cửa sổ “real time” để kiểm tra tức thì khả
năng phân loại của thuật tốn.
• Model của chúng tơi ban đầu dường như có thể
phát hiện u khá tốt.
Đỏ: vùng u được tiên đốn, xanh: mơ nền,
Đường vàng: tiêu chuẩn vàng của BS
Lỗi sai!!!
Khó khăn ban đầu
• Nhiều vùng dương tính giả lớn.
• Những lỗi sai giả u thường gặp: mơ bào,
tâm mầm của nang lympho.
-> Hướng giải quyết: Làm bước tiếp theo: cho
thêm nhiều chú thích (10,000) và thêm nhiều
bước dạy nhắc lại (iteration) (10,000,000 lần)
Kết quả: vẫn còn nhiều lỗi sai tương tự.
Nguyên nhân: do cắt ngưỡng của u (tumor
threshold) trong bản đồ nóng (heatmap) của
phần mềm bị cố định là 50% (mức thấp).
Lỗi sai!!
Tìm hướng giải quyết
Tạo một model deep learning mới trong đó đưa nang lympho thành một
phân loại riêng, gồm 3 loại: Nang lympho, u và mô khác.
Nang lympho
Mô u
Mô khác
(2371 chú thích)
(3902 chú thích)
(3030 chú thích)
Kết quả:
•
•
Độ phân giải cao: 0.25 µm/ pixel
740,000 bước dạy nhắc lại
Dương tính giả nang
lympho.
Nang lympho
Mơ u
Mơ khác
Dương tính giả mơ u.
Quyết định của bạn là gì?
1. Chờ đợi phiên bản mới của phần mềm Halo có chức năng chỉnh ngưỡng u dành cho
người dùng?
2. Tiếp tục cung cấp thêm thật nhiều data (Big Data) cho thuật toán?
3. Chờ đợi sự giúp đỡ của kĩ sư máy tính của hãng?
4. Đầu hàng và chuyển sang đề tài nghiên cứu khác?
• Giả thuyết mới: sử dụng 2 bước (2 models) cho 2 mục tiêu:
- Bước 1: loại bỏ các nang lympho phản ứng
- Bước 2: tìm kiếm u trên nền hạch đã loại bỏ nang lympho.
=> có thể giảm được sai sót và tăng độ chính xác cho mục tiêu phát hiện u di căn hạch.
Bước 1: Phát hiện và loại bỏ nang lympho
✓ Các nang lympho có hình dáng và kích thước khá tương đồng.
✓ Xây dựng 2 model khác nhau để chọn 1 model hiệu quả nhất:
1. Random forest classifier (model 1)
– 2 phân loại
• Chỉ cần những chú thích ít, nhỏ
• Mục tiêu phát hiện nang lympho.
2. Deep learning (model 2) - 2 phân loại.
• Cần số lượng chú thích vừa phải.
• Mục tiêu phát hiện nang lympho.
Nang lympho
(20 chú thích)
Nang lympho
(1243 chú thích)
Mơ khác
(45 chú thích)
Mơ khác
(1089 chú thích)
•
•
•
Độ phân giải thấp: 4.4 µm/ pixel
Độ phân giải cao: 1.04 µm/ pixel
33,500 bước dạy nhắc lại
Bước 2: Xây dựng model phát hiện u
•
•
•
•
Deep learning (Model 3) - 2 phân loại: U và không u
Cần số lượng chú thích nhiều, đa dạng.
Độ phân giải cao: 0.25 µm/ pixel
10,000,000 bước dạy nhắc lại.
Mục tiêu phát hiện tế bào u trên tiêu bản hạch.
Mơ u
(4196 chú thích)
Mơ khác
(5959 chú thích)
Phương pháp đánh giá kết quả
• Bước 1: Hình ảnh được chia thành các ơ nhỏ (100 x 100 µm) và so sánh với hình
vẽ chú thích của BS GPB (tiêu chuẩn vàng).
Ơ nhỏ được coi là:
- Dương tính thật: nếu khu vực tiên đoán u trùng >50% với tiêu chuẩn vàng.
- Dương tính giả: nếu khu vực tiên đốn u trùng <50% với tiêu chuẩn vàng.
- Âm tính thật: nếu khu vực tiên đốn khơng-u nằm ngồi tiêu chuẩn vàng.
- Âm tính giả: nếu khu vực tiên đốn khơng-u nằm trong tiêu chuẩn vàng.
• Bước 2: Đánh giá dương tính, âm tính trên mức độ tiêu bản (slide-level):
- Có u: gán nhãn dương tính
- Khơng u: gán nhãn âm tính.
- Phân loại u theo kích thước: Di căn lớn, Vi di căn và Tế bào u đơn độc.
- Công thức tính sự giảm diện tích dương tính giả:
Giảm Diện tích dương tính giả (DTDTG) =
vs.
𝐷𝑇𝐷𝑇𝐺 𝑐ủ𝑎 𝑃𝑃 1 𝑏ướ𝑐 −𝐷𝑇𝐷𝑇𝐺 𝑐ủ𝑎 𝑃𝑃 2 𝑏ướ𝑐
𝐷𝑇𝐷𝑇𝐺 𝑐ủ𝑎 𝑃𝑃 1 𝑏ướ𝑐
Kết quả
Bước 1: Mục tiêu phát hiện nang lympho
Random forest
Deep learning
Nang lympho
Mơ khác
Khu vực bị bỏ sót của
nang lympho (Âm tính giả)
Khu vực bị chẩn đốn q
mức của nang lympho
(dương tính giả)
• Độ chính xác (Accuracy):
Model 1: 51.7%
Model 2: 94.5%
• Model 2 có kết quả khá
tương đồng với nang
lympho nguyên gốc.
Khơng bị
dương tính giả
Dương
tính giả
• Model 2 khơng mắc
những lỗi sai của model
1.
Nhuộm H&E
Model 1
Model 2
Được
chọn!
Kết quả: Bước 2: Phát hiện u
• Phần mềm của chúng tơi có khả năng phát hiện u với các kích thước khác nhau di căn hạch.
• Đánh giá trên 106 tiêu bản của 2 bệnh viện (24 Di căn lớn, 23 Vi di căn, 2 Tế bào u đơn độc và 57 Khơng u).
2 mm
200 µm
2 mm
100 µm
200 µm
Di căn lớn
100 µm
Vi di căn
Tế bào u đơn độc (ITC)
Tiêu bản H&E
Trở lại vấn đề trước…
• Phần lớn các khu vực dương tính giả có
diện tích lớn đã bị xóa bỏ.
• Giảm 36.5% lỗi sai ở nhóm hạch phản
ứng, có trường hợp giảm tới 89%.
• Vẫn cịn tồn tại một số ổ dương tính giả
nhỏ trên tiêu bản.
Khơng di căn
Có nang
lympho
Khơng có
nang lympho
PP 1 bước
PP 2 bước
Di căn
Giảm các lỗi dương tính giả
Tiêu bản H&E
PP 1 bước
PP 2 bước
(Đỏ: phát hiện u, đường vàng:
tiêu chuẩn vàng của bác sĩ)
Đưa ra ngưỡng loại bỏ ổ nhỏ tiên đoán dương tính trên tiêu bản.
Dương tính
Âm tính
Độ nhạy
Độ đăc hiệu
Tiêu bản di
căn
Tiêu bản khơng
di căn
39
10
2
55
79.6%
96.5%
1
0.9
0.8
0.7
Sensitivity
0.6mm
0.6
0.5
0.4
0.7mm
Tiêu bản di
căn
Tiêu bản khơng
di căn
Dương tính
37
1
0.1
Âm tính
12
56
0
Độ nhạy
75.5%
Độ đăc hiệu
98.2%
0.3
0.2
0
0.2
0.4
0.6
False positive rate
- Đường ROC tạo bởi ngưỡng lọc do loại bỏ các ổ nhỏ theo kích cỡ được phần mềm
tiên đốn dương tính. Thay đổi ngưỡng lọc từ 0 – 1.2mm, ta có đường ROC của phần
mềm phát hiện u di căn hạch với AUC = 0.922.
- 2 ngưỡng loại bỏ tốt nhất là 0.6 và 0.7mm, cho ta độ nhạy và độ đặc hiệu lần lượt là
79.6 – 96.5% và 75.5 – 98.2%.
0.8
1
Kết luận
• Phần mềm AI của chúng tơi có khả năng phát hiện hạch di căn của ung thư
phổi trên mơ bệnh học.
• Phương pháp sử dụng 2 bước deep learning nhằm loại bỏ các nang lympho
có tiềm năng là 1 phương pháp tốt nhằm giảm thiểu các lỗi sai đặc biệt là
dương tính giả.
• Vẫn cịn một số hạn chế trong phần mềm của chúng tôi như số lượng data
chưa nhiều, độ nhạy và độ đặc hiệu khó cân bằng để cùng cao (có thể khắc
phục ở phần mềm bản mới cho phép chỉnh ngưỡng u trên heatmap).
• Sự kết hợp giữa AI và BS GPB vẫn là ưu tiên hàng đầu cho việc chẩn đoán tốt
nhất cho người bệnh.
Nghiên cứu được đăng trên tạp chí The
American Journal of Pathology (2019). IF = 4.307
Giải poster xuất sắc nhất về Phân tích hình
ảnh tại hội thảo Pathology Vision 2018, Mỹ.
Nagasaki, Japan
World’s new top three night views
Xin chân thành cảm ơn!