Tải bản đầy đủ (.pdf) (90 trang)

(Luận văn thạc sĩ hcmute) phân loại bệnh da người sử dụng mạng nơron tích chập

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (7.95 MB, 90 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT
THÀNH PHỐ HỒ CHÍ MINH

LUẬN VĂN THẠC SĨ
HỒNG ĐÌNH PHƯƠNG

PHÂN LOẠI BỆNH DA NGƯỜI SỬ DỤNG MẠNG NƠRON
TÍCH CHẬP

NGÀNH: KỸ THUẬT ĐIỆN TỬ - 8520203

S K C0 0 6 5 8 9

Tp. Hồ Chí Minh, tháng 05/2020

Luan van


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT
THÀNH PHỐ HỒ CHÍ MINH

LUẬN VĂN THẠC SỸ

PHÂN LOẠI BỆNH DA NGƯỜI SỬ DỤNG MẠNG NƠRON
TÍCH CHẬP

NGÀNH: KỸ THUẬT ĐIỆN TỬ
MÃ SỐ: 8520203


HỌ VÀ TÊN HỌC VIÊN: HỒNG ĐÌNH PHƯƠNG
HỌ VÀ TÊN GIẢNG VIÊN HƯỚNG DẪN: PGS.TS NGUYỄN THANH HẢI

Tp. Hồ Chí Minh, tháng 05 năm 2020

Luan van


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT
THÀNH PHỐ HỒ CHÍ MINH

LUẬN VĂN THẠC SỸ

PHÂN LOẠI BỆNH DA NGƯỜI SỬ DỤNG MẠNG NƠRON
TÍCH CHẬP

NGÀNH: KỸ THUẬT ĐIỆN TỬ
MÃ SỐ: 8520203

HỌ VÀ TÊN HỌC VIÊN: HỒNG ĐÌNH PHƯƠNG
HỌ VÀ TÊN GIẢNG VIÊN HƯỚNG DẪN: PGS.TS NGUYỄN THANH HẢI

Tp. Hồ Chí Minh, tháng 05 năm 2020

Luan van


i


Luan van


ii

Luan van


iii

Luan van


iv

Luan van


v

Luan van


vi

Luan van


LÝ LỊCH KHOA HỌC
I. LÝ LỊCH SƠ LƯỢC:

Họ & tên: Hồng Đình Phương

Giới tính: Nam

Ngày, tháng, năm sinh: 27/11/1990

Nơi sinh: Bắc Ninh

Quê quán: Bắc Ninh

Dân tộc: Kinh

Địa chỉ liên hệ: 730 Nguyễn Văn Quá, Phường Đông Hưng Thuận, Quận 12, Tp.
Hồ Chí Minh.
Điện thoại cơ quan:

Điện thoại nhà riêng:

Fax:

E-mail:

II. QUÁ TRÌNH ĐÀO TẠO:
1. Trung học chuyên nghiệp:
Hệ đào tạo: Thời gian đào tạo từ 2005 đến 2008
Nơi học (trường, thành phố): Trường THPT Nguyễn Hữu Cảnh - Thành Phố Biên
Hòa – Đồng Nai
Ngành học:
2. Đại học:
Hệ đào tạo: Thời gian đào tạo từ 2008 đến 2012

Nơi học (trường, thành phố): Đại học Sư Phạm Kỹ Thuật Tp.HCM
Ngành học: Kỹ thuật Điện – Điện Tử
Tên đồ án, luận án hoặc môn thi tốt nghiệp:
Ngày & nơi bảo vệ đồ án, luận án hoặc thi tốt nghiệp:
Người hướng dẫn:
III. QUÁ TRÌNH CÔNG TÁC CHUYÊN MÔN KỂ TỪ KHI TỐT NGHIỆP
ĐẠI HỌC:
Thời gian

Nơi công tác

Công việc đảm nhiệm

2013 - 2015

Công ty Samsung Việt Nam

Nhân viên Kỹ thuật

2015 – 2019 Giáo viên trường ĐH PCCC
2019 – nay

Giáo viên

Đội CS PCCC Công an Quận 12 Cán bộ
vii

Luan van



LỜI CAM ĐOAN
Tơi cam đoan đây là cơng trình nghiên cứu của tôi.
Các số liệu, kết quả nêu trong luận văn là trung thực và chưa từng được ai
công bố trong bất kỳ cơng trình nào khác
Tp. Hồ Chí Minh, ngày … tháng 05 năm 2020
(Ký tên và ghi rõ họ tên)

Hồng Đình Phương

viii

Luan van


LỜI CÁM ƠN
Em xin gửi lời cám ơn chân thành đến Ban Giám Hiệu trường Đại Học Sư
Phạm Kỹ Thuật Thành Phố Hồ Chí Minh, q thầy/cơ trong Khoa Điện – Điện
Tử đã tận tình chỉ dạy, truyền đạt kiến thức và tạo điều kiện thuận lợi cho em
trong suốt quá trình học tập vừa qua.
Đặc biệt em xin chân thành gửi đến PGS.TS Nguyễn Thanh Hải lời cám ơn
sâu sắc. Trong suốt thời gian thực hiện luận văn Thầy đã tận tình quan tâm, hướng
dẫn và động viên để em hoàn thành tốt luận văn này.
Em xin gửi lời cảm ơn đến gia đình, người thân cùng tồn thể các bạn học
viên lớp Kỹ thuật điện tử khóa 2018B đã nhiệt tình hỗ trợ, góp ý, động viên để
em hồn thành luận văn.
TP. Hồ Chí Minh, tháng 05 năm 2020
Tác giả

Hồng Đình Phương


ix

Luan van


TĨM TẮT
Mạng nơron tích chập (CNN – Convolutional Neural Network) là một
trong những mơ hình mạng học sâu phổ biến nhất hiện nay được sử dụng cho
nhận dạng và phân loại hình ảnh với độ chính xác rất cao. Việc ứng dụng mạng
nơron tích chập trong việc phát hiện và phân loại bệnh da sẽ hỗ trợ rất nhiều
cho bác sỹ trong việc chuẩn đoán và điều trị bệnh sớm. Trong luận văn sử dụng
ảnh bệnh da được thu từ website dữ liệu cho nghiên cứu. Luận văn sử dụng
mạng CNN cho phân loại 05 loại bệnh, tổng cộng có khoảng 1000 bức ảnh
bệnh da. Để phân loại hiệu quả, ảnh đầu vào được tiền xử lý nhằm giảm kích
thước ảnh, chuẩn hóa ảnh và sau đó được đưa vào mạng CNN cho phân loại và
phát hiện bệnh. Trong mạng CNN các lớp tích chập với những kernel được
phân tích, lựa chọn để lấy thơng tin về trích đặc trưng và thực hiện tích chập.
Luận văn trình bày việc sử dụng mạng CNN cho phân loại từng nhóm bệnh 3
bệnh, 4 bệnh đến 5 bệnh da khác nhau và đánh giá hiệu suất phân loại của mạng
học sâu. Trong việc đánh giá, luận văn cịn trình bày thuật tốn ma trận nhầm
lẫn để thực hiện đánh giá với kết quả thu được.

x

Luan van


ABSTRACT
Convolutional Neural Network (CNN) is one of the most popular deep
learning network models currently used for image recognition and

classification with very high accuracy. The use of convolutional neural
networks in the detection and classification of skin diseases will greatly assist
doctors in the early diagnosis and treatment of skin diseases. In this thesis,
images of skin diseases are obtained from data websites for research. The thesis
represents CNN network used to classify 05 types of disease, in total there are
about 1000 images of skin diseases. For effective classification, the input image
is pre-processed to reduce image size, to normalize the image, and then the
image is posted to the CNN for classification of skin diseases. In the CNN
network, convolutional layers with kernels are analyzed and chosen to obtain
information for feature extraction and perform convolution. The thesis presents
the use of the CNN network to classify each group of 2 diseases, 3 diseases to
5 diseases and then evaluate the classification performance of the
corresponding networks. In the evaluation, the thesis also presents the
confusion matrix algorithm to perform the evaluation with the obtained results.

xi

Luan van


MỤC LỤC
CHƯƠNG 1 TỔNG QUAN ........................................................................................... 1
Đặt vấn đề ............................................................................................................ 1
Mục tiêu ............................................................................................................... 2
Nhiệm vụ và giới hạn .......................................................................................... 2
Nhiệm vụ ...................................................................................................... 2
Giới hạn ........................................................................................................ 2
Phương pháp nghiên cứu ..................................................................................... 2
Cấu trúc luận văn ................................................................................................. 3
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT ................................................................................ 4

Các bệnh ngồi da thường gặp ............................................................................ 4
Trích đặc trưng .................................................................................................... 4
Phương pháp phân tích thành phần chính .................................................... 4
Phương pháp phân tích GLCM .................................................................... 5
Phương pháp phân tích dựa trên màu sắc ..................................................... 5
Một số phương pháp phân loại bệnh da người .................................................... 6
Phương pháp máy Vector hỗ trợ .................................................................. 6
Phương pháp mạng Nơron (NN) .................................................................. 7
Phương pháp mạng neural tích chập ............................................................ 9
CHƯƠNG 3 MẠNG TÍCH CHẬP CHO NHẬN DẠNG BỆNH DA ......................... 13
3.1. Mạng CNN nhận dạng bệnh da ......................................................................... 13
3.1.1. Mạng CNN nhận dạng bệnh da với 03 lớp tích chập ................................. 14
3.1.2. Mạng CNN nhận dạng bệnh da với 04 lớp tích chập ................................. 14
3.2. Lớp tích chập tách rời theo chiều sâu ................................................................ 15
xii

Luan van


3.3. Xây dựng mạng CNN ........................................................................................ 18
3.3.1. Lớp tích chập .............................................................................................. 18
3.3.2. Bộ tuyến tính được tinh chỉnh .................................................................... 19
3.3.3. Lớp lấy mẫu lớn nhất .................................................................................. 21
3.3.4. Lớp kết nối đầy đủ ...................................................................................... 22
3.3.5. Hàm Softmax .............................................................................................. 23
3.4. Tập dữ liệu ......................................................................................................... 24
3.5. Tiền xử lý dữ liệu .............................................................................................. 24
3.5.1. Lọc ảnh ....................................................................................................... 24
3.5.2. Định lại kích cỡ ảnh.................................................................................... 25
3.5.3. Chuẩn hóa ảnh ............................................................................................ 26

3.6. Thuật tốn ma trận nhầm lẫn ............................................................................. 26
CHƯƠNG 4 KẾT QUẢ VÀ THẢO LUẬN ................................................................ 28
Ảnh sử dụng trong luận văn .............................................................................. 28
Kết quả huấn luyện ............................................................................................ 31
Mạng CNN nhận dạng bệnh da với 04 lớp tích chập ................................. 32
Mạng CNN nhận dạng bệnh da với 03 lớp tích chập ................................. 40
So sánh kết quả với các phương pháp khác ................................................ 46
Nhận xét ...................................................................................................... 46
CHƯƠNG 5 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN .............................................. 47
Kết luận.............................................................................................................. 47
Hướng phát triển ................................................................................................ 47

xiii

Luan van


DANH SÁCH CÁC HÌNH
Hình 2.1. Một số loại da bị bệnh .................................................................................... 4
Hình 2.2 Mơ tả phương pháp phân tích PCA ................................................................. 5
Hình 2.3 Hình phân tách các điểm dữ liệu theo SVM.................................................... 7
Hình 2.4 Kiến trúc một Nơron nhân tạo ......................................................................... 8
Hình 2.5 Mạng Nơron lan truyền thẳng ......................................................................... 8
Hình 2.6 Kiến trúc cơ bản của một mạng tích chập ....................................................... 9
Hình 2.7 Ví dụ bộ lọc tích chập được sử dụng trên ma trận điểm ảnh ......................... 10
Hình 2.8 Phương thức Avarage Pooling và Max Pooling ............................................ 12
Hình 3.1 Sơ đồ khối mạng tích chập cho nhận dạng bệnh da ...................................... 13
Hình 3.2 Cấu trúc mạng nơ-ron tích chập tách rời theo chiều sâu [27] ....................... 15
Hình 3.3. Tích chập theo chiều sâu sử dụng 3 kernel 5x5x1........................................ 16
Hình 3.4. Tích chập theo hướng sử dụng kernel 1x1x3 ............................................... 16

Hình 3.5 Ảnh đầu vào mạng CNN ............................................................................... 18
Hình 3.6. Tích chập lần 1 ảnh đầu vào với kernel ........................................................ 18
Hình 3.7 Tích chập lần 2 ảnh đầu vào với kernel 1 ...................................................... 19
Hình 3.8 Giá trị tích chập ảnh đầu vào với kernel 1 ..................................................... 19
Hình 3.9. Đồ thị hàm ReLu .......................................................................................... 20
Hình 3.10 Kết quả sau khi áp dụng hàm kích hoạt phi tuyến....................................... 21
Hình 3.11. Kết quả sau khi qua lớp lấy mẫu lớn nhất lần 1 ......................................... 22
Hình 3.12. Kết quả sau khi thực hiện lớp lấy mẫu lớn nhất ......................................... 22
Hình 3.13. Mơ hình Softmax Regression dưới dạng mạng nơ-ron .............................. 24
Hình 3.14. Tích chập ngõ vào và cửa sổ lọc ................................................................ 25
Hình 3.15. Ảnh sau khi định lại kích cỡ ảnh ................................................................ 26
xiv

Luan van


Hình 3.16. Thuật tốn ma trận nhầm lẫn ...................................................................... 27
Hình 4.1. Một số ảnh bệnh da sử dụng trong luận văn ................................................. 31
Hình 4.2 Kết quả huấn luyện nhận dạng 03 bệnh da với kernel (3,3) .......................... 32
Hình 4.3 Chạy chương trình với bệnh da ung thư tế bào ............................................. 32
Hình 4.4. Kết quả đánh giá phân loại 03 bệnh với kernel (3,3) ................................... 33
Hình 4.5 Kết quả huấn luyện nhận dạng 03 bệnh da với kernel (5,5) .......................... 33
Hình 4.6 Chạy chương trình với bệnh da viêm màng sừng.......................................... 34
Hình 4.7 Kết quả đánh giá phân loại 03 bệnh da với kernel (5,5)................................ 34
Hình 4.8 Kết quả huấn luyện nhận dạng 04 bệnh da với kernel (3,3) .......................... 35
Hình 4.9 Chạy chương trình với bệnh da u da lành tính .............................................. 35
Hình 4.10 Kết quả đánh giá phân loại 04 bệnh da với kernel (3,3).............................. 36
Hình 4.11 Kết quả huấn luyện nhận dạng 04 bệnh da với kernel (5,5) ........................ 36
Hình 4.12 Chạy chương trình với bệnh da hắc tố......................................................... 37
Hình 4.13 Kết quả đánh giá phân loại 04 bệnh da với kernel (5,5).............................. 37

Hình 4.14 Kết quả huấn luyện nhận dạng 05 bệnh da với kernel (3,3) ........................ 37
Hình 4.15 Chạy chương trình với bệnh ung thư tế bào hắc tố ..................................... 38
Hình 4.16 Kết quả đánh giá phân loại 05 bệnh da với kernel (3,3).............................. 38
Hình 4.17 Kết quả huấn luyện nhận dạng 05 bệnh da với kernel (5,5) ........................ 38
Hình 4.18 Chạy chương trình với bệnh ung thư tế bào ................................................ 39
Hình 4.19 Kết quả đánh giá phân loại 05 bệnh da với kernel (5,5).............................. 39
Hình 4.20 Kết quả huấn luyện nhận dạng 03 bệnh da với kernel (3,3) ........................ 40
Hình 4.21 Chạy chương trình với bệnh viêm màng sừng ............................................ 40
Hình 4.22 Kết quả đánh giá phân loại 03 bệnh da với kernel (3,3).............................. 40
Hình 4.23 Kết quả huấn luyện nhận dạng 03 bệnh da với kernel (5,5) ........................ 41

xv

Luan van


Hình 4.24 Chạy chương trình với bệnh u da lành tính ................................................. 41
Hình 4.25 Kết quả đánh giá phân loại 03 bệnh da với kernel (5,5).............................. 41
Hình 4.26 Kết quả huấn luyện nhận dạng 04 bệnh da với kernel (5,5) ........................ 42
Hình 4.27 Chạy chương trình với bệnh nốt ruồi hắc tố ................................................ 42
Hình 4.28 Kết quả đánh giá phân loại 04 bệnh da với kernel (3,3).............................. 43
Hình 4.29 Kết quả huấn luyện nhận dạng 04 bệnh da với kernel (5,5) ........................ 43
Hình 4.30 Chạy chương trình với bệnh ung thư tế bào ................................................ 43
Hình 4.31 Kết quả đánh giá phân loại 04 bệnh da với kernel (5,5).............................. 44
Hình 4.32 Kết quả huấn luyện nhận dạng 05 bệnh da với kernel (3,3) ........................ 44
Hình 4.33 Chạy chương trình với bệnh u da lành tính ................................................. 44
Hình 4.34 Kết quả đánh giá phân loại 05 bệnh da với kernel (3,3).............................. 45
Hình 4.35 Kết quả huấn luyện nhận dạng 05 bệnh da với kernel (5,5) ........................ 45
Hình 4.36 Chạy chương trình với bệnh ung thư tế bào hắc tố ..................................... 45
Hình 4.37 Kết quả đánh giá phân loại 05 bệnh da với kernel (5,5).............................. 46


xvi

Luan van


DANH SÁCH CÁC TỪ VIẾT TẮT
Tên đầy đủ

STT

Từ viết tắt

1

PCA

2

GLCM

3

SVM

4

NN

Neural Networks


5

MLP

Multi Layer Perceptron

6

CNN

Convolutional Neural Network

7

ReLu

Rectified Linear Unit

8

FC

Principal Component Analysis
Gray Level Cooccurrence matrix
Support Vector Machine

Fully Connected Layer

xvii


Luan van


TIẾNG VIỆT CỦA CÁC THUẬT NGỮ
STT

Tên tiếng anh

Tiếng việt

1

Principal Component Analysis

Phân tích thành phần chính

2

Gray Level Cooccurrence matrix

Ma trận đồng mức xám

3

Support Vector Machine

Phương pháp phân loại SVM

4


Neural Networks

Mạng nơ-ron

5

Multi Layer Perceptron

Lớp Perceptron

6

Convolutional Neural Network

Mạng nơ-ron tích chập

7

Rectified Linear Unit

Lớp kích hoạt phi tuyến ReLu

8

Fully Connected Layer

Lớp kết nối đầy đủ

9


Deep Learning

Học sâu

10

Pooling

Lớp lấy mẫu

11

Depthwise separable convolutional Lớp tích chập tách rời theo chiều
layer
sâu

12

Depthwise separable CNN

Mạng nơ-ron tích chập tách rời
theo chiều sâu

13

Feauture maps

Tính đặc trưng


14

Max-pooling layer

Lớp lấy mẫu lớn nhất

15

Softmax function

Hàm Softmax

xviii

Luan van


CHƯƠNG 1 TỔNG QUAN
Đặt vấn đề
Ngày nay, bệnh ngoài da có thể tìm thấy ở động vật, con người và cả thực
vật. Bệnh ngoài da là một loại bệnh đặc biệt, nguyên nhân gây bệnh do vi khuẩn
hoặc nhiễm trùng. Những bệnh như rụng tóc, giun đũa, nhiễm trùng nấm men,
đốm nâu, dị ứng có tác dụng nguy hiểm khác nhau trên da và lan rộng theo thời
gian. Việc xác định các bệnh này ở giai đoạn ban đầu để kiểm soát bệnh lây lan
là hết sức cần thiết. Bệnh ngoài da ở người là bệnh rất dễ gặp phải ở nước có điều
kiện khí hậu nóng ẩm như nước ta. Bệnh gây ảnh hưởng trực tiếp đến bề mặt da,
tuy khơng nguy hiểm đến tính mạng nhưng lại gây mất thẩm mỹ, mất tự tin khi
giao tiếp, khó khăn trong sinh hoạt và gây cảm giác khó chịu, đau rát. Hầu hết
các bệnh về da có xu hướng truyền từ người này sang người khác do đó điều quan
trọng là cần phải kiểm soát bệnh ở giai đoạn mới hình thành để ngăn chặn bệnh

lây lan, để làm được điều này địi hỏi phải có sự thăm khám, chuẩn đoán của các
đội ngũ y bác sỹ tại các cơ sở y tế. Tuy nhiên, để có thể đưa ra kết quả chính xác,
đội ngũ y bác sỹ phải thực hiện một số xét nghiệm, điều này mất rất nhiều thời
gian và đang dẫn đến hiện tượng quá tải tại một số bệnh viện tuyến trung ương.
Trong những năm gần đây, xử lý ảnh (image processing) đã đạt được nhiều
thành tựu và tiến bộ vượt bậc. Trong đó nhận dạng và phân loại hình ảnh [1-2] là
một trong những lĩnh vực được theo đuổi một các tích cực nhất. Ý tưởng cốt lõi
của việc nhận dạng và phân loại hình ảnh là phân tích ảnh từ các dữ liệu thu được
bởi các cảm biến như camera, webcam .Trong lĩnh vực y tế, khi thu thập được
các bức ảnh về da, qua các khâu xử lý thì dữ liệu thu được từ các bức ảnh chứa
đựng nhiều thông tin quan trọng vượt ra ngoài khả năng nhận dạng trực quan của
con người và được sử dụng hiệu quả cho các chuẩn đoán lâm sàng.
Với việc áp dụng kỹ thuật xử lý ảnh để phát hiện và phân loại một số bệnh
phổ biến trên da người sẽ hỗ trợ rất nhiều cho người sử dụng, giảm được một khối
lượng công việc đáng kể cũng như tăng sự chính xác trong việc đưa ra các kết
luận cuối cùng. Các nghiên cứu về nhận dạng bệnh ngồi da [3-5] dựa trên hình
ảnh kỹ thuật số đã nhận được sự quan tâm lớn của các nhà nghiên cứu gần đây
thời gian. Một khảo sát về các phương pháp chuẩn đốn các bệnh ngồi da dựa
vào các kỹ thuật xử lý ảnh được trình bày trong [6]. Trong [7] trình bày phương
pháp chuẩn đốn bênh ngồi da bằng cách đối chiếu các kết quả đặc biệt với ảnh
được phân tích bằng cách chuyển đổi thành mẫu dựa trên kết cấu và hình thái của
chúng.
1

Luan van


Mục tiêu
Mục tiêu của luận văn là xây dựng một hệ thống xử lý hình ảnh dùng mạng
Nơron tích chập để phát hiện và phân loại bệnh da người. Hệ thống này sẽ cho

kết quả trong thời gian ngắn hơn so với các phương pháp truyền thống.
Nhiệm vụ và giới hạn
Nhiệm vụ
- Thu thập tập ảnh mẫu về các loại bệnh da người.
- Tiền xử lý ảnh (lọc ảnh dùng tích chập, định lại kích cỡ ảnh, chuẩn hóa
ảnh)
- Trình bày cơ sở lý thuyết về các thuật toán phân loại bệnh da người.
- Thực hiện huấn luyện và phân loại bệnh da người sử dụng mạng Nơ-ron
tích chập.
- Viết code cho mơ phỏng thuật tốn trên phần mềm Visual Studio Code.
- Kiểm tra và hiệu chỉnh độ chính xác của phần mềm mô phỏng với ảnh mẫu.
- Viết luận văn, trình bày kết quả đạt được.
- Dựa trên kết quả đạt được đưa ra phương hướng phát triển tiếp theo cho
luận văn.
Giới hạn
- Hiện nay có rất nhiều loại bệnh da người nên luận văn chỉ giới hạn một số
loại bệnh da người như: ung thư tế bào (Basal cell carcinoma), viêm màng sừng
(Benign keratosis), u da lành tính (Dermatofibroma), nốt ruồi hắc tố (Melanocytic
nevus), ung thư tế bào hắc tố (Melanoma).
- Dữ liệu sử dụng trong luận văn là dữ liệu ảnh bệnh da lấy từ tập dữ liệu
ISIC 2018, chưa thu thập được tập dữ liệu từ mẫu ảnh bệnh da thực tế tại các bệnh
viện, cơ sở y tế hoặc ảnh chụp trực tiếp từ điện thoại, ảnh trên Internet.
Phương pháp nghiên cứu
Để thực hiện nghiên cứu luận văn này, cần phải kết hợp hai phương pháp
sau:
Phương pháp nghiên cứu lý thuyết: nghiên cứu, tham khảo các tài liệu về xử
lý ảnh, từ các tạp chí khoa học, các hội nghị chuyên môn, các bài báo của IEEE,
springer. Nghiên cứu các công cụ, các hàm, câu lệnh, ngôn ngữ python.
Phương pháp mô phỏng: xây dựng một cơng cụ chuẩn đốn dựa trên các kỹ
thuật xử lý hình ảnh. Lập trình ngơn ngữ Python trên giao diện ứng dụng Visual

Studio Code để thực hiện q trình mơ phỏng.
2

Luan van


Cấu trúc luận văn
Luận văn được trình bày thành 05 chương:
Chương 1: Tổng quan
Trình bày khái quát về lĩnh vực nghiên cứu, tầm quan trọng của lĩnh vực
nghiên cứu từ đó giúp người thực hiện đề tài đưa ra các mục tiêu và nhiệm vụ cụ
thể.
Chương 2: Cơ sở lý thuyết
Trình bày các bệnh ngồi da thường gặp, giới thiệu cơ sở lý thuyết của các
thuật toán, các phương pháp phân loại bệnh da người.
Chương 3: Mạng tích chập cho nhận dạng bệnh da
Giới thiệu mơ hình tổng qt phân loại bệnh da người sử dụng mạng Nơron
tích chập. Trình bày cách thu thập mẫu ảnh bệnh da, phương pháp phân loại bệnh
da người sử dụng Separable Convolutions.
Chương 4: Kết quả và thảo luận
Trình bày và đánh giá các kết quả thu được thông qua phần mềm Visual
Studio Code.
Chương 5: Kết luận và hướng phát triển
Trình bày những phương pháp, nội dung đã thực hiện được, nêu ra hướng
phát triển tiếp theo cho luận văn để đạt được hiệu quả tốt hơn.

3

Luan van



CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
Các bệnh ngoài da thường gặp
Hiện nay các bệnh ngoài da xảy ra rất phổ biến trong cuộc sống hàng ngày
đối với mỗi chúng ta. Có nhiều ngun nhân gây bệnh như làm sạch khơng đúng
cách, môi trường sống ẩm thấp, bụi bặm, nguồn nước sinh hoạt không đạt tiêu
chuẩn, ăn uống quá dư thừa dầu mỡ.
Với điều kiện khí hậu nóng ẩm như nước ta khiến da tiết ra nhiều mồ hôi,
bụi bẩn bám vào da dẫn đến hiện tượng bị nhiễm khuẩn, ngứa da, cộng với chế
độ ăn uống. Hằng ngày mỗi cơ thể chúng ta có nguy cơ phải tiếp thu nhiều hóa
chất độc hại thơng qua nguồn thực phẩm bẩn, khơng đảm bảo vệ sinh, do đó ngày
càng có nhiều bệnh về da như: ung thư tế bào, viêm màng sừng, ung thư tế bào
hắc tố.

a.

b.

c.

d.
Hình 2.1. Một số loại da bị bệnh

(a). Da bình thường; (b). Da mắc bệnh mụn rộp; (c). Da mắc bệnh viêm
da; (d). Da mắc bệnh vảy nến.
Trích đặc trưng
Phương pháp phân tích thành phần chính
Phân tích thành phần chính (PCA) là phương pháp sử dụng phổ biến hiện
nay trong việc phân tích dữ liệu. PCA sử dụng các phương pháp tốn để trích lấy
ra các đặc trưng cơ bản có thể đại diện cho bên trong của tập dữ liệu. Hay nói

cách khác, nếu mơ tả tập dữ liệu trong khơng gian n chiều thì PCA sẽ có thể cung
cấp một hình ảnh của cùng tập dữ liệu đó trong khơng gian k chiều (với kKhơng gian chuyển đổi từ phương trình có n vector sang không gian k vector,
4

Luan van


×