BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC LẠC HỒNG
***
TẠ THANH TÂM
SỬ DỤNG DEEP LEARNING HỖ TRỢ CHẨN ĐOÁN
MỘT SỐ BỆNH VỀ VIÊM HỌNG THÔNG QUA
ẢNH CHỤP NỘI SOI
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
Đồng Nai, Năm 2023
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC LẠC HỒNG
***
TẠ THANH TÂM
SỬ DỤNG DEEP LEARNING HỖ TRỢ CHẨN ĐOÁN
MỘT SỐ BỆNH VỀ VIÊM HỌNG THÔNG QUA
ẢNH CHỤP NỘI SOI
Chuyên ngành: Công nghệ thông tin
Mã số chuyên ngành: 8480201
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS. VŨ ĐỨC LUNG
Đồng Nai - Năm 2023
LỜI CAM ĐOAN
Tơi xin cam đoan đây là cơng trình nghiên cứu của riêng tôi, dưới sự hướng dẫn
của thầy PGS.TS. VŨ ĐỨC LUNG. Các tài liệu và kết quả nghiên cứu trong luận
văn là trung thực.
Mọi nội dung tôi tham khảo từ các tài liệu được trích dẫn và chú thích đầy đủ.
Tơi xin chịu trách nhiệm về luận văn của mình.
Học viên
Tạ Thanh Tâm
LỜI CẢM ƠN
Lời đầu tiên, tơi xin bày tỏ lịng biết ơn Trường Đại học Lạc Hồng đã tổ
chức khóa học này, để tơi có điều kiện được học tập lĩnh hội các kiến thức mới và có
thời gian để hồn thành luận văn.
Tơi xin chân thành cảm ơn các thầy cô trong Khoa Sau Đại Học và các
thầy cô khoa Cơng nghệ Thơng tin đã tận tình truyền đạt cho tôi nhiều kiến thức cũng
như các kỹ năng cần thiết cho em trong suốt q trình học tập.
Tơi xin chân thành cảm ơn thầy PGS.TS VŨ ĐỨC LUNG đã hướng dẫn,
chia sẻ và góp ý tận tình và tạo điều kiện để tơi hồn thành luận văn này.
Học viên
Tạ Thanh Tâm
TRƯỜNG ĐẠI HỌC LẠC HỒNG KHOA SAU ĐẠI HỌC
TÓM TẮT LUẬN VĂN
(Dùng cho học viên và người hướng dẫn)
Đề tài: Sử dụng deep learning hỗ trợ chẩn đoán một số bệnh về viêm họng thông
qua ảnh chụp nội soi
Ngành: Công nghệ thông tin
Mã số: 8480201
Học viên: Tạ Thanh Tâm
Người hướng dẫn: PGS.TS Vũ Đức Lung
NỘI DUNG TÓM TẮT
1.Nội dung được giao và kết quả mong đợi của người hướng dẫn.
Thu thập thông tin, dữ liệu, các nghiên cứu liên quan.
- Tiền xử lý ảnh. Phân tích dữ liệu.
- Lựa chọn mơ hình, giải thuật đề xuất và cơng nghệ sử dụng.
- Xây dựng hệ thống.
- Thử nghiệm và đánh giá kết quả.
- Hoàn thiện hệ thống, viết báo cáo luận văn.
2. Cách thức giải quyết vấn đề
Môi trường ô nhiễm, chất lượng cuộc sống kém và điều kiện làm việc khắc
nghiệt là tình hình chung và đáng lo ngại hiện nay. Điều này làm cho các bệnh về hệ
hô hấp trên gia tăng đáng kể đặc biệt là các bệnh về họng. Việc chẩn đoán sớm để
điều trị kịp thời là cấp thiết.
Để tăng cường khả năng nhận biết sớm, nhanh hiệu quả cho người bệnh và cũng
là giảm tải cho các bác sĩ khi tiến hành thăm khám. Từ các lý do trên cho thấy sự cần
thiết của việc nghiên cứu công cụ hỗ trợ việc phát hiện bệnh lý về viêm họng thơng
qua hình ảnh từ camera nội soi là một điều cần thiết.
Vấn đề đầu tiên của quá trình này là thu thập dữ liệu, lựa chọn những hình ảnh
phù hợp. Những hình ảnh đạt tiêu chuẩn phải đẹp rõ nét, có nhiều đặc trưng.
Tiếp theo là nghiên cứu các lý thuyết có liên quan đến bài tốn nhận dạng, phát
hiện đối tượng, lựa chọn Yolo để huấn luyện và thử nghiệm vào việc nhận dạng các
bệnh lý về họng. Xây dựng chương trình hỗ trợ nhận diện các bệnh viêm họng.
3. Đánh giá về mặt khoa học của kết quả
- Tạo ra bộ dữ liệu hơn 2000 ảnh được gán nhãn một số bệnh lý viêm họng.
- Luận văn đã hoàn thành các mục tiêu nghiên cứu và thực hiện phần mềm Demo
thử nghiệm nhận diện bệnh.
- Luận văn nghiên cứu thành công với bộ dữ liệu lớn hơn nữa và nhiều thời gian
huấn luyện hơn nữa có thể đưa vào sử dụng hỗ trợ các bác sĩ trong quá trình cơng tác.
4. Những vấn đề cịn tồn tại so với nội dung được giao (nếu có)
Học viên
Tạ Thanh Tâm
MỤC LỤC
LỜI CAM ĐOAN
LỜI CẢM ƠN
TÓM TẮT LUẬN VĂN
DANH MỤC TỪ VIẾT TẮT
DANH MỤC HÌNH
DANH MỤC BẢNG
CHƯƠNG 1: KHÁI QUÁT VỀ PHÁT HIỆN ĐỐI TƯỢNG .............................. 1
1.1 Tổng quan ....................................................................................................... 1
1.1.1 Các đặc trưng của bệnh viêm họng. ......................................................... 1
1.1.2 Các ứng dụng và nghiên cứu liên quan trong và ngoài nước. .................. 2
1.2 Mục tiêu. ......................................................................................................... 4
1.3 Đối tượng, phạm vi nghiên cứu. ...................................................................... 5
1.4 Nội dung nghiên cứu. ...................................................................................... 5
1.5 Phương pháp thực hiện ( Cách thực hiện ) ...................................................... 5
1.6 Dự kiến kết quả và bố cục luận văn. ............................................................... 6
CHƯƠNG 2: LÝ THUYẾT LIÊN QUAN ............................................................ 7
2.1 ANN ................................................................................................................ 7
2.2 Mạng thần kinh tích chập (CNN) .................................................................... 9
2.2.1 Lớp tích chập ......................................................................................... 10
2.2.3 Lớp kích hoạt ......................................................................................... 14
2.2.4 Lớp kết nối đầy đủ ................................................................................. 15
2.3 R-CNN .......................................................................................................... 15
2.4 Fast-CNN ...................................................................................................... 16
2.5 Faster-CNN ................................................................................................... 17
2.6 Yolo Các khái niệm, ứng dụng và phiên bản: ............................................... 18
2.6.1 Khái niệm: ............................................................................................. 18
2.6.2 Ứng dụng ............................................................................................... 19
2.6.3 Kiến trúc Yolo ....................................................................................... 22
2.6.4 Hàm tính IOU. ....................................................................................... 25
2.6.5 Loss Function......................................................................................... 26
2.6.6 Classifycation loss ................................................................................. 26
2.6.7 Localization loss .................................................................................... 27
2.6.8 Confidence loss ...................................................................................... 28
2.6.9 Total loss................................................................................................ 28
2.6.10 Các phiên bản Yolo.............................................................................. 29
CHƯƠNG 3: XÂY DỰNG DATASET ............................................................... 40
3.1 Chuẩn bị dataset. ........................................................................................... 40
3.2 Gán nhãn dữ liệu. .......................................................................................... 40
CHƯƠNG 4: THIẾT LẬP MÔI TRƯỜNG, THỬ NGHIỆM MODEL, ỨNG
DỤNG DEMO VÀ ĐÁNH GIÁ KẾT QUẢ ........................................................ 47
4.1 Môi trường ứng dụng: ................................................................................... 47
4.2 Thử nghiện model ......................................................................................... 47
4.3 Thiết kế và thực hiện ứng dụng Demo. ......................................................... 56
CHƯƠNG 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ................................... 61
5.1 Kết quả đạt được và đóng góp chính của luận văn ........................................ 61
5.2 Hạn chế và hướng phát triển: ........................................................................ 61
TÀI LIỆU THAM KHẢO
DANH MỤC TỪ VIẾT TẮT
ANN
Artificial Neural Network
AP
Average Precision
CNN
Convolutional Neural Network
FCNN
Fully-connected Convolutional Neuron Network
IoU
Intersection over Union
mAP
Mean Average Precision
R-CNN
Region based Convolution Neural Network
SSD
Single Shot Detector
YOLO
You Only Look Once
ADANH MỤC HÌNH
Hình 2. 1Mơ tả mạng thần kinh nhân tạo. ......................................................... 8
Hình 2. 2 Kết quả của ma trận tích chập. ........................................................ 11
Hình 2. 3:Ma trận đầu vào của lớp tích chập kích thước 7x7 .......................... 12
Hình 2. 4:Hàm giảm thuộc tính Max pooling. ................................................ 13
Hình 2. 5:Kiến trúc mạng R-CNN. ................................................................. 16
Hình 2. 6:Thời gian ra đời các Ver Yolo. ....................................................... 22
Hình 2. 7:Kiến trúc tổng quát của Yolo. ......................................................... 23
Hình 2. 8:Cách thức hoạt động mơ hình Yolo. ............................................... 24
Hình 2. 9:Yolo so với những thuật tốn khác. ................................................ 25
Hình 2. 10: Phương Pháp Tính IoU. ............................................................... 26
Hình 2. 11:Mơ tả tính độ lỗi vị trí và khung bao đối tượng. ........................... 27
Hình 2. 12: Phát hiện nhiều đối tượng trên một ơ lưới. ................................... 30
Hình 2. 13: Số lượng Anchor trong mạng RetinalNet. .................................... 31
Hình 2. 14: Cấu trúc Darkness 53. .................................................................. 32
Hình 2. 15: Yolo V3. ...................................................................................... 32
Hình 2. 16: Ảnh giảm mẫu.............................................................................. 33
Hình 2. 17: Cấu trúc Yolo V4. ........................................................................ 34
Hình 2. 18: Cấu trúc Yolo V5. ........................................................................ 36
Hình 2. 19: Sơ đồ tổng hợp lớp YOLO V7. .................................................... 37
Hình 2. 20: Cấu trúc YOLO V8. ..................................................................... 38
Hình 3. 1 Giao dien gán nhãn. ........................................................................ 41
Hình 3. 2:Giao diện lưu trữ sau khi dán nhãn. ................................................ 42
Hình 3. 3: Ảnh sau khi dán nhãn. .................................................................... 43
Hình 3. 4:Hình trong thư mục train................................................................. 45
Hình 3. 5: Các file chứa thơng tin nhãn. ......................................................... 46
Hình 3. 6: Nội dung file Yaml. ....................................................................... 46
Hình 4. 1: Nội dung file gán nhãn. .................................................................. 47
Hình 4. 2: Tạo thư mục trên Google Driver. ................................................... 48
Hình 4. 3: Tạo Colaboratory mới. ................................................................... 49
Hình 4. 4: Tạo một Notebook mới. ................................................................. 50
Hình 4. 5: Tải thư viện mã nguồn mở cho YOLO V8. .................................... 50
Hình 4. 6: Kết quả mơ hình thử nghiệm 1. ...................................................... 55
Hình 4. 7: Kết quả mơ hình thử nghiệm 2. ...................................................... 55
Hình 4. 8:Kết quả thử nghiệm 3. ..................................................................... 56
Hình 4. 9:Sơ đồ khối ứng dụng. ...................................................................... 57
Hình 4. 10: Bệnh viêm Amidan được dán nhãn. ............................................. 57
Hình 4. 11:Bệnh viêm thanh đai được dán nhãn. ............................................ 58
Hình 4. 12:Bệnh viêm Thanh quản được dán nhãn.
................................... 58
Hình 4. 13: Giao diện ban đầu của phần mềm. ............................................... 59
Hình 4. 14:Giao diện lựa chọn ảnh.
........................................................... 59
Hình 4. 15:Sau khi xử lý ảnh được dán nhãn bệnh lý.
............................... 60
Hình 4. 16:Khi ảnh khơng phát hiện đối tượng.. ............................................. 60
DANH MỤC BẢNG
Bảng 4.1: Kết quả thử trên 60 Epoch.
53
Bảng 4.2: Kết quả thử trên 100 Epoch.
54
1
CHƯƠNG 1
KHÁI QUÁT VỀ PHÁT HIỆN ĐỐI TƯỢNG
1.1 Tổng quan
1.1.1 Các đặc trưng của bệnh viêm họng.
Viêm họng là bệnh lý Tai Mũi Họng rất thường gặp, có thể gặp phải ở mọi giới
tính, lứa tuổi, đặc biệt là ở những người có hệ miễn dịch kém, trẻ nhỏ, phụ nữ mang
thai, người cao tuổi, người suy dinh dưỡng.
Bệnh viêm họng xảy ra do nhiều nguyên nhân và nhiều yếu tố thuận lợi. 6080% bệnh viêm họng xảy ra do virus, còn lại là do vi khuẩn. Một số nguyên nhân gây
viêm họng chính là:
− Nhiễm trùng
− Viêm họng dị ứng
− Viêm họng đỏ
− Viêm họng trắng
− Viêm họng do virus liên cầu khuẩn
− Viêm họng hạt
− Viêm họng giả mạc (Viêm họng bạch hầu)
Triệu chứng bệnh viêm họng thường thấy là cảm giác đau ở vùng họng, tiếp
theo nói khó và khó nuốt.
Cơ thể bắt đầu sốt cao có thể 38 – 39 °C, có lúc lên đến 40°C, toàn thân nhức ở
các khớp, mệt mỏi, ớn lạnh nhức đầu, nếu nặng sẽ có biểu hiện nổi hạch ở dưới hàm…
Các triệu chứng phụ khi viêm họng nhiều ngày là đau nhói từng hồi ở tai, nghe
tiếng vo ve, chảy mũi, khàn tiếng, khó nuốt, ho có đờm, giọng nói thay đổi.
Với số lượng người mắc bệnh ngày càng đông, hệ thống y tế ngày càng quá tải
trong việc chẩn đoán và điều trị. Đề tài này sẻ hỗ trợ bác sĩ trong việc chẩn đoán và
2
hỗ trợ ra quyết định nhanh hơn. Tăng chất lượng khám và điều trị giảm phiền hà và
tăng chất lượng cuộc sống của bệnh nhân.
1.1.2 Các ứng dụng và nghiên cứu liên quan trong và ngoài nước.
Ở thời điểm hiện tại cùng với việc phát triển khoa học công nghệ, các cơng trình
tương tự có liên quan đến bài tốn phát hiện đối tượng và có khá nhiều trên thế giới.
Việc ứng dụng tin học và trong các lĩnh vực y tế, nông nghiệp, giáo dục đã trở nên
phổ biến. Một số cơng trình tiêu biểu trong và ngồi nước như sau:
Ở nước ngồi:
Carlos Santos và nhóm của ơng thực hiện cơng trình nghiên cứu. “A New
Approach for Detecting Fundus Lesions Using Image Processing and Deep Neural
Network Architecture Based on YOLO Model” [1]. Cơng trình này đề xuất một
phương pháp mới dựa trên các kỹ thuật xử lý hình ảnh, tăng cường dữ liệu.Phương
pháp đề xuất làsử dụng bộ dữ liệu công khai về bệnh võng mạc tiểu đường DDR và
IDRiD và được triển khai trên thư viện của PyTorch dựa trên mơ hình YOLO V5.
Bằng cách sử dụng kiến trúc mạng lưới thần kinh sâu này Carlos đã trích xuất một
lượng lớn các tổn thương được phục vụ cho công tác nghiên cứu và đào tạo .
Chenyang Liu1 và các cộng sự phát triển kỹ thuật “Automatic detection of
pulmonary nodules on CT images with Yolo V3: development and evaluation using
simulated and patient data “ [2] . Cơng trình này dùng YOLO v3 CNN để phát hiện
các nốt phổi. Dữ liệu Trong nghiên cứu bệnh nhân lấy từ cơ sở dữ hình ảnh (LIDC–
IDRI) nó có 1.018 ảnh qt CT lồng ngực. Các hình ảnh CT có độ dày lát cắt lớn hơn
2,5 mm đã bị loại trừ, để lại 888 hình ảnh CT để phân tích. Việc đánh dấu được bốn
bác sĩ X quang có kinh nghiệm thành một trong ba nhóm: (I) khơng có nốt, (II) nốt
<3mm và (III) nốt ≥3 mm. Trong nghiên cứu Này, Chenyang Liu1 và các cộng sự đã
tiếp cận vấn đề này bằng cách giảm quy mơ lấy mẫu xuống trong trình trích xuất đặc
trưng để tăng độ chính xác phát hiện cho các nốt nhỏ
[3] Halil Murat Ünver và các cộng sự thực hiện cơng trình nghiên cứu, “Skin
Lesion Segmentation in Dermoscopic Images
3
With Combination of YOLO and GrabCut Algorithm” [3]. Cơng trình này giúp
việc phát hiện khối u ác tính trong hình ảnh soi da. Halil Murat Ünver sử dụng Yolo
huấn luyện với với bộ dữ liệu ISBI 2017 để phát hiện tổn thương. Tập dữ liệu được
phân tách thành tập huấn luyện và test. Mơ hình đã đạt được tỷ lệ 90% IOU trong 194
hình ảnh. Mật độ chính xác của mơ hình trên bộ dữ liệu ISBI 2017 là 96,4% và nó
khơng thể phát hiện chỉ 22 hình ảnh trong số 600 hình ảnh. Tuy nhiên nó khơng phát
hiện tổn thương do sự giống nhau giữa tổn thương và mô xung quanh trong các hình
ảnh có độ tương phản thấp Vấn đề này có thể được khắc phục với nhiều dữ liệu đào
tạo hơn và tăng cường độ tương phản. Ngồi ra, thời gian xử lý phân đoạn của mơ
hình đường ống được trình bày là gần 7 giây, điều này cho thấy rằng phương pháp
này khả thi đối với các hoạt động y tế theo thời gian thực
Trong nước:
Nhóm nghiên cứu Đặng Hoàng Anh Tuấn và Nguyễn Minh Thắng. Với cơng
trình nghiên cứu. “Ứng dụng mơ hình học sâu trong xác định các giai đoạn sinh
trưởng của cây dưa lưới trồng trong nhà màng” [4]. Cơng trình sử dụng cơng nghệ AI
với việc áp dụng mơ hình DL tiên tiến, có tên là YOLO V5. Với các ảnh thu thập
được của hệ thống mạng camera lắp đặt trong nhà màng. Với dữ liệu được huấn luyện
với kiến trúc YOLO V5 này đã được thử nghiệm thành công trên các thiết bị Jetson
AGX Xavier Developer Kit và Jetson Nano, điều này cho thấy, mơ hình YOLO V5
khơng chỉ có thể duy trì tỷ lệ phát hiện cao, mà cịn đáp ứng được các yêu cầu phát
hiện trong thời gian thực chính xác và nhanh chóng.
Võ Trương Như Ngọc với cơng trình. “Nhận xét giá trị hỗ trợ chẩn đốn bệnh
răng khơn mọc lệch”[5]. Cơng trình nghiên cứu được thực hiện trên 100 phim XQ
chụp răng khôn mọc lệch để xác định khả năng hỗ trợ chẩn đoán của phương pháp
học máy. Theo phân loại, loại 1 có 42 răng (22,5%), loại 2 có 81 răng (43,3%) và loại
4 có 1 răng (0,5%). Khi sử dụng phần mềm để chẩn đoán: máy chẩn đoán được 187
răng (100%). Máy chẩn đoán giống bác sĩ ở 149 răng (79,68%). Khi sử dụng học
4
máy để hỗ trợ chẩn đốn bệnh lý răng khơn mọc lệch: độ nhạy, độ đặc hiệu tương
ứng lần lượt là 98,5%; 86% khi chẩn đốn có hay khơng có bệnh lý.
Nhóm nghiên cứu Bùi Mỹ Hạnh với cơng trình “Hệ hỗ trợ chẩn đốn x-quang
ung thư vú bằng trí tuệ nhân tạo”[6]. Hệ thống này được xây dựng dựa trên mạng nơ
ron tích chập CNN với kiến trúc nền tảng là ResNet50. Được huấn luyện trên bộ dữ
liệu ảnh X-quang ung thư vú của Đại học Y Hà Nội với 7.912 ảnh mammograms. Kết
quả cho thấy độ tin cậy chẩn đoán của hệ thống tương đương với “hội đồng” bác sĩ
chẩn đốn hình ảnh có kinh nghiệm và cao hơn một bác sĩ chẩn đốn hình ảnh được
chọn ngẫu nhiên. Như vậy hệ hỗ trợ có thể được coi như “bác sĩ chẩn đốn hình ảnh
thứ hai” hỗ trợ các bác sĩ chẩn đốn hình ảnh trong việc tầm soát ung thư vú ở Việt
Nam.
Mai Thị Giang Thanh và nhóm nghiên cứu của mình. “Xây dựng hệ dữ liệu hỗ
trợ máy học để chẩn đoán sàng lọc sâu răng giai đoạn sớm” [7].Với Nghiên cứu này
có thể chẩn đốn sàng lọc sâu răng giai đoạn sớm ở trẻ 3 - 6 tuổi trên một số cơ sở
thuộc địa bàn thành phố Hà Nội. Số lượng ảnh tổn thương sâu răng giai đoạn sớm
trong kho dữ liệu của nghiên cứu này là 478 ảnh. Các tổn thương sâu răng giai đoạn
sớm tập trung nhiều ở ảnh vùng mặt ngoài của răng với 994 tổn thương, mặt nhai là
65 tổn thương và mặt bên chỉ là 14 tổn thương.
Với các thông tin trình bày ở trên việc ứng dụng khoa học công nghệ vào trong
y tế đã và đang là điều tất yếu. Kết hợp các ứng dụng tin học nhằm điều khiển cơng
nghệ phục vụ chẩn đốn bệnh. Đặt biệt là cơng nghệ thị giác máy tính dùng để chẩn
đốn qua hình ảnh. Đề tài này nhằm hỗ trợ bác sĩ tai mũi họng giảm căng thẳng trong
quá trình đưa ra quyết định, chẩn đốn bệnh được nhanh chóng chính xác tăng hiệu
quả dựa trên các kết quả gợi ý được đưa ra trên màn hình, từ đó làm giảm thời gian
khám bệnh nhưng vẫn đảm bảo được chất lượng từ các chẩn đoán của bác sĩ.
1.2 Mục tiêu.
Nghiên cứu các phương pháp phát hiện đối tượng, dán nhãn đối tượng để từ đó
áp dụng xây dựng, thử nghiệm ứng dụng hỗ trợ chẩn đốn bệnh viêm họng bằng hình
5
ảnh nội soi từ camera nội soi.
1.3 Đối tượng, phạm vi nghiên cứu.
Đối tượng nghiên cứu: Chỉ nghiên cứu các ảnh từ camera nội soi tai mũi họng.
Phạm vi nghiên cứu: Để nhận diện có nhiều phương thức và ở phần đề tài này
giới hạn nhận diện bằng hình ảnh nhận được từ camera nội soi tai mũi họng dùng
trong y tế.
1.4 Nội dung nghiên cứu.
− Tìm hiểu tình hình trong và ngoài nước các ứng dụng CNTT trong việc hỗ
trợ chẩn đoán bệnh viêm họng.
− Nghiên cứu các phương giải quyết bài toán này, tập trung vào sử dụng deep
learning.
− Thu thập dữ liệu: Thu thập và xử lý một tập dữ liệu gồm hình ảnh của viêm
họng được chụp từ các bệnh viện tại Việt Nam.
− Xây dựng và đánh giá mơ hình: để đưa ra chẩn đốn của bệnh viêm họng.
Mơ hình được huấn luyện trên tập dữ liệu được gán nhãn.
− Tiến hành thử nghiệm và phân tích các kết quả đạt được
− Thiết kế, xây dựng chương trình nhận diện thơng qua ảnh chụp nội soi.
− Viết báo cáo
1.5 Phương pháp thực hiện ( Cách thực hiện )
Q trình nhận diện chẩn đốn như sau:
Lấy mẫu: Bằng các camera nội soi hay một thiết bị có cùng chức năng.
Phân tích và xử lý: Các dữ liệu (được nhắc tới ở trên) sẽ được trích xuất từ các
hình ảnh, các mẫu.
Xây dựng phương pháp huấn luyện và thử nghiệm, phân tích kết quả đạt được.
Kết quả: Hệ thống sau đó sẽ quyết định kết quả so sánh có phù hợp hay khơng.
6
1.6 Dự kiến kết quả và bố cục luận văn.
Kết quả phát hiện, và hiển thị được một số bệnh viêm họng thông qua ảnh chụp
từ camera nội soi .
Bố cục luận văn gồm 5 chương
Chương 1: Tổng quan bài tốn phát hiện đối tượng trong ảnh.
Mơ tả khái qt lý do chọn đề tài, tìm hiểu các bài tốn chuyên đề nhận diện
trong và ngoài nước nêu bật sự cần thiết của việc nghiên cứu nhận
diện, phát
hiện các đối tượng thơng qua các hình ảnh từ các camera nội soi trong y tế, nắm được
các vấn đề và những điều đóng góp được của luận văn.
Chương 2: Các lý thuyết liên quan.
Nêu lên các lý thuyết phục vụ cho việc nhận dạng hình ảnh nói chung và Yolo
nói riêng. Giới thiệu về các đặc trưng của Yolo.
Chương 3: Xây dựng dataset và demo ứng dụng phát hiện bệnh.
Rút trích, phân loại dán nhãn các hình ảnh và tạo nên bộ CSDL mới có mục
đích. Ứng dụng Deep Learning để thiết kế hệ thống hỗ trợ chẩn đốn bệnh thơng qua
camera nội soi y tế.
Chương 4: Thử nghiệm và đánh giá kết quả với bộ dữ liệu tự tạo.
Thực hiện thử nghiệm rút ra kết luận, từ đó đưa ra các ưu và khuyết điểm của
phương pháp được dùng trong luận văn.
Chương 5:Kết luận và hướng phát triển.
Thống kê đưa ra các kết luận, và phân tích các vấn đề của hệ thống. Suy ra
những điều học được và định hướng phát triển của hệ thống
7
CHƯƠNG 2
LÝ THUYẾT LIÊN QUAN
Với sự phát triển nhanh chóng về kiến thức và trí tuệ trong việc sử dụng và khai
thác công nghệ trong thời đại ngày nay. Các hệ thống máy móc và sản phẩm có trên
thị trường đã và đang phục vụ con người ngày càng tốt hơn. Các sản phẩm và dịch
vụ đang hiểu mọi người nhiều hơn mức họ nghĩ. Đó là nhờ sự phát triển khơng ngừng
của một thế hệ máy móc mới, mang trong mình những khái niệm kỹ thuật vượt bậc.
Đó là những hệ thống có tích hợp trí tuệ nhân tạo.
2.1 ANN
Mạng thần kinh nhân tạo là một công cụ hữu ích để giải quyết các bài tốn khó
trong nhiều lĩnh vực khác nhau. Một trong những ứng dụng quan trọng của mạng thần
kinh là trong lĩnh vực thị giác máy tính, nơi nó được sử dụng để phân loại và nhận
diện hình ảnh, như phát hiện khn mặt, nhận dạng biển số xe, hay phát hiện các vật
thể trong ảnh.
Trong mạng thần kinh, các thần kinh thường được tổ chức thành các lớp, với
mỗi lớp đại diện cho một cấp độ xử lý khác nhau. Lớp đầu tiên là lớp đầu vào, lớp
cuối cùng là lớp đầu ra, và các lớp ở giữa được gọi là lớp ẩn. Mỗi thần kinh trong
mạng tính tốn một giá trị đầu ra dựa trên các giá trị đầu vào của nó và các trọng số
liên kết với các thần kinh khác. Chúng được huấn luyện thơng qua một q trình tối
ưu hóa để tìm ra bộ trọng số tối ưu cho mạng. Quá trình huấn luyện này bao gồm việc
cung cấp cho mạng một tập dữ liệu đầu vào đã biết đầu ra đúng, và sử dụng các kỹ
thuật tối ưu hóa để cập nhật các trọng số liên kết giữa các thần kinh. Mục tiêu của
quá trình huấn luyện là để cải thiện độ chính xác của dự đốn đầu ra của mạng.
Mạng thần kinh nhân tạo được tổ chức thành các lớp liên kết với nhau qua các
trọng số. Kiến trúc cơ bản của mạng thần kinh gồm:
Lớp đầu vào (input layer): Lớp này chứa các thần kinh đại diện cho các đặc
trưng đầu vào của mạng. Số lượng thần kinh trong lớp này phụ thuộc vào số lượng
8
đặc trưng đầu vào của bài toán.
Các lớp ẩn (hidden layers): Đây là các lớp nằm giữa lớp đầu vào và lớp đầu ra.
Mỗi lớp ẩn chứa nhiều thần kinh, và mỗi thần kinh trong lớp này tính tốn giá trị đầu
ra của mình dựa trên giá trị đầu vào từ các thần kinh trong lớp trước đó, kết hợp với
trọng số tương ứng.
Lớp đầu ra (output layer): Lớp này chứa các thần kinh đại diện cho kết quả
dự đoán của mạng. Số lượng thần kinh trong lớp này phụ thuộc vào số lượng lớp đầu
ra của bài tốn.
Hình 2. 1Mơ tả mạng thần kinh nhân tạo
Q trình hoạt độngcủa mạng thần kinh nhân gồm các quá trình như khởi tạo,
truyền thuận, tính tốn lỗi, truyền ngược, cập nhật trọng số. Trước khi mạng bắt đầu
hoạt động, các trọng số giữa các thần kinh được khởi tạo với các giá trị ngẫu nhiên
nhỏ. Dữ liệu đầu vào được truyền qua các thần kinh ở lớp đầu vào, được nhân với các
trọng số và tổng hợp lại để tính tốn giá trị đầu ra của mỗi thần kinh trong lớp ẩn. Giá
trị đầu ra này được truyền qua các liên kết đến các thần kinh ở lớp tiếp theo cho đến
khi giá trị đầu ra cuối cùng của mạng được tính tốn. Sau khi tính tốn được giá trị
đầu ra của mạng, một hàm mất mát (loss function) được sử dụng để tính tốn sai số
giữa kết quả dự đốn và giá trị đầu ra thực tế. Hàm mất mát thường được thiết kế để
đo lường độ chính xác của mơ hình. Sau đó, q trình truyền ngược được sử dụng để
điều chỉnh trọng số của các liên kết giữa các thần kinh. Quá trình này đảm bảo rằng
sai số giữa dự đoán và giá trị đầu ra thực tế được giảm thiểu. Sau khi tính tốn được