Tải bản đầy đủ (.pdf) (26 trang)

Ứng dụng kỹ thuật học sâu, xây dựng chương trình hỗ trợ chẩn đoán rối loạn phổ tự kỷ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (775.34 KB, 26 trang )

i

ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC BÁCH KHOA

PHẠM THỊ HOÀI

ỨNG DỤNG KỸ THUẬT HỌC SÂU, XÂY DỰNG
CHƯƠNG TRÌNH HỖ TRỢ CHẨN ĐOÁN RỐI LOẠN
PHỔ TỰ KỶ
Chuyên ngành: Khoa học máy tính
Mã số: 8480101

TÓM TẮT LUẬN VĂN THẠC SĨ

Đà Nẵng - Năm 2019


ii
Công trình được hoàn thành tại
TRƯỜNG ĐẠI HỌC BÁCH KHOA

Người hướng dẫn khoa học: TS Nguyễn Văn Hiệu
Phản biện 1: TS. Phạm Minh Tuấn
Phản biện 2: TS. Phạm Xuân Hậu
Luận văn sẽ được bảo vệ trước Hội đồng chấm
Luận văn tốt nghiệp thạc sĩ Khoa học máy tính họp tại Trường Đại học
Bách khoa vào ngày 25 tháng 8 năm 2019

Có thể tìm hiểu luận văn tại:
− Trung tâm Học liệu, Đại học Đà Nẵng tại Trường Đại học Bách


khoa
− Thư viện Khoa Công nghệ thông tin, Trường Đại học Bách khoa –
ĐHĐN


1
CHƯƠNG MỞ ĐẦU
1. Lý do chọn đề tài
Rối loạn phổ tự kỷ là một loại khuyết tật phát triển suốt đời được
thể hiện trong vòng 3 năm đầu đời. Tự kỷ là do rối loạn của hệ thần
kinh gây ảnh hưởng đến hoạt động của não bộ. Rối loạn phổ tự kỷ được
biểu hiện ra ngoài bằng những khiếm khuyết về tương tác xã hội, khó
khăn về giao tiếp ngôn ngữ và phi ngôn ngữ, và hành vi, sở thích và
hoạt động mang tính hạn hẹp và lặp đi lặp lại.
Với sự phát triển của khoa học công nghệ trong lĩnh vực khai
phá dữ liệu, việc áp dụng các thuật toán học máy đã tạo nên những cú
híc trong tiến trình chuẩn đoán bệnh.
Mặc dầu trên thế giới đã có nhiều công cụ chẩn đoán rối loạn
phổ tự kỷ hay tiền rối loạn phổ tự kỷ, tuy nhiên hai vấn đề sau chưa
được giải quyết:
1) Các công cụ chẩn đoán hiện tại xem như là một quá trình các
thông tin đầu vào (các triệu chứng, các đặc điểm, ….) để xác định
thông tin đầu ra (các bệnh dẫn đến bệnh tiền tự kỷ); Về mặt toán học
các công cụ tồn tại tương đương với việc giải phương trình nhiều ẩn
số. Tuy nhiên, khi số ấn quá lớn thì việc giải quyết là vấn đề khó khăn.
2) Tri thức, kinh nghiệm thực tế của các chuyên gia tâm lý về
vấn đề chẩn đoán và kết quả chẩn đoán trong thời gian qua, làm thế
nào để chúng ta tập hợp chúng thành các quy luật và để từ đó đưa vào
máy tính giúp chẩn đoán.
Vì thế đề tài “Ứng dụng kỹ thuật học sâu, xây dựng chương trình

hỗ trợ chẩn đoán rối loạn phổ tự kỷ” là đề tài được tôi chọn để nghiên
cứu.


2
2. Mục tiêu và nội dung nghiên cứu
2.1. Mục tiêu
Xây dựng chương trình hỗ trợ chẩn đoán rối loạn phổ tự kỷ.
2.2. Nội dung nghiên cứu
- Tìm hiểu tổng quan về rối loạn phổ tự kỷ.
- Nghiên cứu kỷ thuật học sâu để ứng dụng vào chẩn đoán rối
loạn phổ tự kỷ.
- Phân tích, thiết kế, xây dựng và triển khai hệ thống chẩn đoán
dựa vào phương pháp đề xuất.
3. Đối tượng và phạm vi nghiên cứu
3.1. Đối tượng nghiên cứu
- Bệnh rối loạn phổ tự kỷ.
- Lý thuyết Lôgic mờ và mạng Nơ-ron nhân tạo.
- Lý thuyết học sâu: Mô hình CNN, Mô hình RNN-LSTM, Mô
hình LSTM-CNN
3.2. Phạm vi nghiên cứu
- Hệ thống chẩn đoán rối loạn phổ tự kỷ.
- Phương pháp khai phá dữ liêu, kỹ thuật học sâu.
4. Phương pháp nghiên cứu
4.1. Phương pháp lý thuyết
- Nghiên cứu lý thuyết về khai phá dữ liệu.
- Nghiên cứu phương pháp chẩn đoán.
- Nghiên cứu phương pháp thống kê.
4.2. Phương pháp thực nghiệm
- Xây dựng cơ sở dữ liệu chẩn đoán rối loạn phổ tự kỷ.

- Xây dựng chương trình thử nghiệm.


3
5. Ý nghĩa khoa học và thực tiễn
5.1. Ý nghĩa khoa học
- Áp dụng được cơ sở lý thuyết liên quan vào chẩn đoán rối
loạn phổ tự kỷ.
5.2. Ý nghĩa thực tiễn
- Đưa ra mô hình giúp người dùng chẩn đoán được bệnh rối loạn
phổ tự kỷ.
6. Cấu trúc luận văn
Nội dung của luận văn gồm các nội dung chính sau đây:
Chương 1:
Trình bày những kiến thức cơ bản về bệnh tự kỷ ở trẻ em, khái
niệm, nguyên nhân gây bệnh, triệu chứng bệnh, tác hại và các mức độ
của bệnh tự kỷ.
Chương 2:
Giới thiệu tổng quan về học sâu, mạng nơ-ron, giới thiệu mô
hình, kiến trúc, và một số ứng dụng của mạng CNN, RNN-LSTM,
LSTM-CNN,
Chương 3:
Trình bày quy trình ứng dụng kỷ thuật khai phá dữ liệu, kỷ thuật
học sâu trong chẩn đoán bệnh tự kỷ, biến đổi các triệu chứng bệnh
thành các thuộc tính của dữ liệu vào và các kết luận bệnh thành thuộc
tính của dữ liệu ra của các kỷ thuật phân nhóm. Tập trung phân tích yêu
cầu của hệ thống, xác định các chức năng chính, xây dựng sơ đồ của các
hoạt động chính của ứng dụng, tiến hành cài đặt ứng dụng.



4
CHƯƠNG 1. TỔNG QUAN VỀ RỐI LOẠN PHỔ TỰ KỶ
1.1. Lịch sử về rối loạn phổ tự kỷ.
Thuật ngữ tự kỷ bắt đầu từ Kanner (1943) với tên gọi là “tự kỷ
nhủ nhi”. Năm 1980, DSM-3 ra đời thì tự kỷ được gọi “rối loạn phổ tự
kỷ” là một thể riêng biệt được đặt trong rối loạn phát triển lan tỏa. Đến
năm 2000 tổ chức Giám sát bệnh tự kỷ và rối loạn sự phát triển
(ADDM) đã sử dụng thuật ngữ “phổ” tự kỷ để chỉ đến rối loạn phổ tự
kỷ và các rối loạn khuyết tật có liên quan đến tự kỷ. Đến tháng 6 năm
2013, DSM-5 ra đời là phiên bản mới nhất được cộng đồng chuyên
ngành tâm thần học trên thế giới ứng dụng để chẩn đoán rối loạn phổ
tự kỷ, đã giúp cho việc phát hiện sớm hơn các trẻ tự kỷ. Trong phiên
bản này các chẩn đoán của rối loạn phát triển lan tỏa trước đó được sáp
nhập vào chẩn đoán duy nhất là rối loạn phổ tự kỷ, thuật ngữ “Rối loạn
phát triển lan tỏa” của DSM-4 đã không còn được sử dụng.
1.2. Khái niệm của rối loạn phổ tự kỷ
Tự kỷ và rối loạn phổ tự kỷ (ASD - Autism Spectrum Disorder)
là hai thuật ngữ được sử dụng để chỉ một nhóm các rối loạn phức tạp
của sự phát triển não bộ. Những rối loạn này gây ra những khó khăn
trong tương tác xã hội, giao tiếp, ngôn ngữ và hành vi lặp lại ở những
mức độ khác nhau.
1.3. Nguyên nhân của rối loạn phổ tự kỷ
1.3.1. Tổn thương não hoặc não bộ kém phát triển do
1.3.2. Yếu tố di truyền
1.3.3. Yếu tố môi trường
1.3.4. Yếu tố tâm lý thần kinh
1.3.5. Yếu tố hoá chất


5

1.4. Triệu chứng đặc trưng của rối loạn phổ tự kỷ
1.4.1. Tự kỷ và trầm cảm
- Bệnh tự kỷ: Bệnh tự kỷ thường xuất hiện ở độ tuổi từ 3 – 10
tuổi, liên quan đến sự rối loạn về nhận thức và hành vi thần kinh. Bệnh
thể hiện qua sự sút kém trong khả năng hòa nhập xã hội, sút kém trong
việc giao tiếp bằng ngôn ngữ cũng như phi ngôn ngữ.
- Bệnh trầm cảm: Trầm cảm là một dạng rối loạn tâm thần hay
gặp nhất trong các dạng rối loạn tâm thần. Thời đại bùng nổ thông tin,
do áp lực học tập lớn nên bệnh gặp khá nhiều ở lứa tuổi học sinh, sinh
viên. Triệu chứng rất đa dạng và phong phú như: Mất ngủ, mệt mỏi,
biếng ăn, cảm giác buồn, khó chịu, buông xuôi,…
1.4.2. Triệu chứng lâm sàng
a. Dấu hiệu cảnh báo dưới 1 tuổi
- Giai đoạn từ 0 – 6 tháng tuổi.
- Giai đoạn từ 6 – 12 tháng tuổi.
b. Dấu hiệu cảnh báo trên 1 tuổi:
- Khiếm khuyết về quan hệ xã hội, khả năng bắt chước, khả
năng đáp ứng tình cảm, các động tác cơ thể, sử dụng đồ vật, khả năng
thích nghi với sự thay đổi, phản ứng thị giác, về phản ứng thính giác,
phản ứng vị giác, khứu giác, xúc giác, cảm giác sợ hãi và hồi hộp, giao
tiếp bằng lời, giao tiếp không lời, mức độ hoạt động, đáp ứng trí tuệ.
1.5. Các mức độ
1.5.1. Theo thời điểm mắc tự kỷ:
− Tự kỷ điển hình - hay tự kỷ bẩm sinh: triệu trứng xuất hiện
trong 3 năm đầu.


6
− Tự kỷ không điển hình - hay tự kỷ mắc phải: trẻ phát triển về
ngôn ngữ và giao tiếp bình thường trong 3 năm đầu, sau đó triệu trứng

tự kỷ xuất hiện dần dần và có sự thoái triển về ngôn ngữ-giao tiếp.
1.5.2. Theo chỉ số thông minh:
− Tự kỷ có chỉ số thông minh cao và nói được
− Trẻ tự kỷ có chỉ số thông minh cao và không nói được
− Trẻ tự kỷ có chỉ số thông minh thấp và nói được
− Trẻ tự kỷ có chỉ số thông minh thấp và không nói được
1.5.3. Theo mức độ:
− Tự kỷ mức độ nhẹ
− Tự kỷ mức trung bình
− Tự kỷ mức độ nặng
1.6. Các hướng nghiên cứu đã có
Tác giả Nguyễn Thị Thanh Mai (2013) thực hiện nghiên cứu
“Tìm hiểu phát hiện của cha mẹ về các dấu hiệu phát triển bất thường
trước chẩn đoán ở trẻ tự kỷ” .
Tác giả Nguyễn Thị Hương Giang (2010) đã nghiên cứu về đề
tài “Nghiên cứu một số đặc điểm lâm sàng của trẻ tự kỷ từ 18 tháng
đến 36 tháng tuổi” .
Tác giả Nguyễn Thị Kim Hòa (2014) nghiên cứu “Biểu hiện lâm
sàng và các yếu tố liên quan ở trẻ rối loạn phổ tự kỷ tại Bệnh viện Tâm
thần Trung Ương 2 Biên Hòa”
Tác giả Nguyễn Lan Trang (2012) nghiên cứu “Thực trạng
tựrẻ em từ 18 - 60 tháng tuổi tại Thành phố Thái Nguyên”


7
CHƯƠNG 2. MÔ HÌNH HỌC SÂU
2.1. Deep Learing là gì?
Deep Learing là một kỹ thuật máy học (Machine Learning)
mạnh mẽ đang được nhiều người trong ngành biết đến và nghiên cứu.
Với khả năng biểu diễn thông tin (represent problem/feature

engineering) và học (learning). Bênh cạnh các lĩnh vực đã gặt hái được
nhiều thành công như xử lý ảnh số và video số, hay xử lí tiếng nói, và
được áp dụng vào trong xử lý ngôn ngữ tự nhiên.
2.2. Mạng nơ-ron nhân tạo
2.2.1. Khái niệm
Mạng Nơ-ron nhân tạo (Artificial Neural Network- ANN) là mô
hình xử lý thông tin được mô phỏng dựa trên hoạt động của hệ thống
thần kinh của sinh học, bao gồm số lượng lớn các Nơ-ron được gắn kết
để xử lý thông tin. ANN giống như bộ não con người, được học bởi
kinh nghiệm (thông qua huấn luyện), có khả năng lưu giữ những kinh
nghiệm hiểu biết (tri thức) và sử dụng những tri thức đó trong việc dự
đoán các dữ liệu chưa biết.
2.2.2. Kiến trúc mạng Nơ-ron nhân tạo
Kiến trúc ANN là tập hợp các nơ-ron được kết nối, các đầu ra
của một số nơ-ron có thể trở thành đầu vào của các nơ-ron khác.
Kiến trúc chung của một mạng Nơ-ron nhân tạo (ANN) gồm 3
lớp đó là: Input Layer, Hidden Layer và Output Layer.
Trong đó, lớp ẩn (Hidden Layer) gồm các Nơ-ron nhận dữ liệu
vào từ các Nơ-ron ở lớp (Layer) trước đó và chuyển đổi các input này
cho các lớp xử lý tiếp theo. Trong một ANN có thể có nhiều lớp ẩn
(Hidden Layer).


8

Hình 2.1. Kiến trúc tổng quát của một ANN
2.2.3. Mạng Nơ-ron mờ
Lấy nguồn cảm hứng từ nguyên lý hoạt động mạng Nơ-ron sinh
học của não bộ động vật, mạng Nơ-ron nhân tạo là một hàm ước tính
phi tuyến, với đầu vào là bộ dữ liệu chưa thể xác định được định dạng,

quy luật, hay chưa thể phân loại. Nhiệm vụ của mạng Nơ-ron là tìm ra
quy luật của bộ dữ liệu đó, từ đó giải bài toán phân lớp… cũng là những
bài toán cốt lõi trong ngành khai phá dữ liệu hay khoa học nhận dạng.
Mạng Nơ-ron mờ là mạng Nơ-ron sử dụng dữ liệu vào, ra, tham
số mờ hoặc các phép tính trên tập mờ. Có thể chia mạng Nơ-ron mờ
thành 4 loại:
• Loại 1: Tín hiệu vào là số thực, trọng số mờ
• Loại 2: Tín hiệu vào là tập mờ, trọng số là số thực
• Loại 3: Cả tín hiệu vào và trọng số đều là mờ
• Loại 4: Khai thác các phép toán t-chuẩn, t-đối chuẩn.


9
2.2.4. Mạng Nơ-ron truyền thẳng
Mô hình mạng Nơ-ron truyền thẳng nhiều lớp được cấu tạo từ 3
lớp chính: lớp đầu vào, lớp ẩn và lớp đầu ra. Với thành phần cơ sở là
các “tế bào Nơ-ron”, mỗi lớp sẽ chứa một số lượng các tế bào nhất
định, kết nối tín hiệu giữa các tế bào là các khớp thần kinh, hay
synapse.

Hình 2.5.Cấu trúc mạng Nơ-ron truyền thẳng
Để kiểm soát quá trình truyền tín hiệu giữa các tế bào, hàm kích
hoạt sẽ được sử dụng, nó cho biết khả năng kích hoạt của một tế bào
Nơ-ron. Với mỗi tín hiệu vào một tế bào, hàm kích hoạt sẽ quyết định
tín hiệu có được truyền tiếp hay không, nếu được thì truyền tiếp với
cường độ như thế nào.
Hàm kích hoạt thường được sử dụng là hàm Sigmoid:

f ( x) =


1
1 + e− x

2.2.5. Mạng Nơ-ron lan truyền ngược
2.2.5.1. Mô hình mạng nơ-ron lan truyền ngược.


10

Hình 2.6. Mô hình mạng nơ-ron lan truyền ngược
Mạng có 3 lớp:
- Lớp vào (Input Layer) – số node vào là số thuộc tính của đối
tượng cần phân lớp.
- Lớp ra (Output Layer) – Số node ra là số đặc điểm cần hướng
tới của đối tượng (giá trị ra cần hướng đến – học có giám sát).
- Lớp ẩn (Hidden Layer) – Số node ẩn thường là không xác định
trước, nó thường là do kinh nghiệm của người thiết kế mạng, nếu số
node ẩn quá nhiều mạng sẽ cồng kềnh, quá trình học sẽ chậm, còn nếu
số node ẩn quá ít làm mạng học không chính xác.
2.2.5.2. Thuật toán mạng nơ-ron lan truyền ngược
* Thuật toán:
Bước 1: Khởi tạo trọng số Vij, Wjk bởi các giá trị ngẫu nhiên nhỏ. Vij
= Random(-1,1), Wjk = Random(-1,1)
Bước 2: Lan truyền tiến tính toán đầu ra thực tế yk
+ Tại node vào thứ i (Input): IIi = xi , OIi = IIi
+ Tại node ẩn thứ p (Hidden): IHp = ΣOIiVip, OHp = f(IHp) = 1/(1 + e-IHp)
+ Tại node ra thứ q (Output): IOq = ΣOHiWiq , OOq = f(IOq) = 1/(1+ e-IOq)
Bước 3: Đánh giá lỗi học - lỗi trung bình bình phương:
E = 1/L*sqrt(Σ(dk - yk)2 ) Nếu E ≤ ԑ thì dừng học.



11
Bước 4: Lan truyền ngược điều chỉnh trọng số
+ Với mỗi nút q thuộc tầng ra, tính đạo hàm ngược sai số thành phần
δq theo công thức: δq = (dq – yq)yq(1 – yq)
+ Cập nhật các trọng số từ tầng ẩn tới tầng ra Wjk:
Δwpq = ηδqOHp ; Wpq(New) = wpq(Old) + Δwpq
+ Với mỗi nút p thuộc tầng ẩn, tính đạo hàm ngược sai số δp theo công
thức: δp = OHp(1-OHp)Σ(wpk(old).δk), k=1..L
+ Cập nhật các trọng số từ tầng vào tới tầng ẩn Vij:
Δvip = ηδpOIi ; vip(New) = vip(Old) + Δvip
Lặp lại bước 2 cho tới khi thỏa mãn điều kiện kết thúc ở bước
3. Kết quả thu được bộ trọng số chuẩn Vij, Wjk sao cho giá trị đầu ra
thực tế và giá trị đầu ra mong muốn là gần giống nhau nhất.
2.3. Mô hình mạng Nơ-ron tích chập (CNN)
2.3.1. Giới thiệu mạng Nơ-ron tích chập
Mạng Nơ-ron tích chập (Convolutionalal Neural NetworkCNN) là một mô hình mạng học sâu giúp cho chúng ta xây dựng được
những hệ thống thông minh với độ chính xác cao như hiện nay, sử
dụng phép tích chập để trích chọn các đặc trưng đầu vào (input layer)
kết hợp với các hàm kích hoạt phi tính (nonlinear activation function)
như ReLU để tạo ra thông tin trừu tượng hơn (abstract/higher-level)
cho các layer tiếp theo, quá trình này được lặp lại qua nhiều lớp ẩn (sử
dụng bộ lọc tích chập) để sau cùng có một số đặc trưng để nhận dạng
đối tượng. Mạng CNN thường áp dụng trong các bài toán về nhận dạng
hình ảnh, xử lý ngôn ngữ tự nhiên,…
CNN được phát triển dựa trên ba ý tưởng chính: tính kết nối cục
bộ, tính bất biến và tính bất biến đối với quá trình chuyển đổi cục bộ.


12

2.3.2. Kiến trúc mạng nơ-ron tích chập CNN

Hình 2.8. Kiến trúc của mạng nơ-ron tích chập
Cấu trúc cơ bản của CNN gồm:
+ Convolutional layer
+ Lớp chuyển đổi ReLU (Rectified Linear Unit)
+ Lớp Pooling
+ Lớp Fully Connected Layer (FC)
2.3.3. Phục vụ chẩn đoán
Mạng CNN được sử dụng trong các bài toán: Nhận dạng hình
ảnh, nhận dạng chữ viết, bài toán xử lí ngôn ngữ tự nhiên, phân loại
văn bản.
2.4. Mô hình mạng RNN – LSTM
2.4.1. Mạng nơ-ron hồi quy (RNN)
Mạng nơ-ron hồi quy (Recurrent Neural Network - RNN) ra đời
với ý tưởng chính là sử dụng một bộ nhớ để lưu lại thông tin từ những
bước tính toán xử lý trước để dựa vào nó có thể đưa ra dự đoán chính
xác nhất cho bước dự đoán hiện tại.
Mạng RNN chứa các vòng lặp bên trong cho
phép thông tin có thể lưu lại được. Hình 2.12 mô tả
một đoạn của mạng nơ-ron hồi quy Avới đầu vào
Hình 2.12. Mạng nơ-ron
hồi quy có vòng lặp


13

là xt và đầu ra là ht. Một vòng lặp cho phép thông tin có thể được truyền từ
bước này qua bước khác của mạng nơ-ron.
Một mạng nơ-ron hồi quy có

thể được coi là nhiều bản sao chép
của cùng một mạng, trong đó mỗi
đầu ra của mạng này là đầu vào của
một mạng sao chép khác.

Hình 2.13. Mô hình mạng RNN

2.4.2. Vấn đề phụ thuộc xa
RNN kết nối những thông tin
trước đó nhằm hỗ trợ cho các xử lý hiện
tại. Mạng RNN chỉ có thể học và sử
dụng các thông tin gần nhất trong quá
khứ để thực hiện tác vụ hiện tại.

Hình 2.14. RNN phụ thuộc
short-term.

Trong những trường hợp cần
nhiều thông tin hơn, RRN có thể phải
tìm những thông tin có liên quan và số
lượng các điểm đó trở nên rất lớn thì
RNN không thể học để kết nối các
thông tin lại với nhau.

Hình 2.15. RNN phụ thuộc
long-term.

2.4.3. Mạng LSTM
LSTM có kiến trúc dạng chuỗi và thay vì chỉ có 1 tầng mạng
nơ-ron như RNN chuẩn thì chúng có tới 4 tầng và tương tác với nhau

một cách đặc biệt. Cấu trúc của mô hình mạng nơ-ron LSTM được thể
hiện ở hình 2.20.


14

Hình 2.20. Cấu trúc của mô hình LSTM (Nguồn: Internet)
Quá trình hoạt động của LSTM được thông qua các bước sau:
Bước đầu tiên của mô hình LSTM được gọi là tầng cổng quên
(forget gate layer). Bước này sẽ quyết định xem thông tin nào cần bỏ
đi từ trạng thái tế bào.

ft= σ (Wf.[ht-1,xt]+bf) (2.1)
Hình 2.21. Cổng chặn ft (LSTM focus f)
Bước tiếp theo, cần quyết định thông tin nào cần được lưu lại tại
cell state.


15

it=σ(Wi.[ht-1, xt]+bi)

(2.2)

Ct ̃=tanh(WC .[ht-1 ,xt]+bC) (2.3)
Hình 2.22. Cổng vào it và tanh 𝐶𝑡 ̃ (LSTM focus i).
Ở bước tiếp theo, sẽ kết hợp hai thành phần này lại để cập nhật
vào cell state.
Ct=ft*Ct-1+it*Ct ̃ (2.4)


Hình 2.23. Giá trị state Ct (LSTM focus c)
Cuối cùng, cần quyết định xem thông tin output là gì. Output
này cần dựa trên cell state, nhưng sẽ được lọc bớt thông tin.
ot=σ(Wo.[ht-1,xt]+bo) (2.5)
ht=ot*tanh(Ct)

(2.6)

Hình 2.24. Giá trị cổng ra và vector
trạng thái ẩn ht (LSTM focus o).
Mạng LSTM theo các công thức kể trên mà được lặp lại qua
từng thời điểm t. Thông tin của cell state được điều khiển bởi cấu trúc
các cổng chặn ft, cổng vào it và cổng ra ot .
2.4.4. Phục vụ chẩn đoán
- Mô hình hóa ngôn ngữ và sinh văn bản, dịch máy, nhận dạng giọng
nói, mô tả hình ảnh


16
2.5. Mô hình LSTM-CNN
2.5.1. Giới thiệu mô hình LSTM-CNN
Kiến trúc LSTM - CNN liên quan đến việc sử dụng các lớp
Mạng nơron tích chập (CNN) để trích xuất tính năng trên dữ liệu đầu
vào kết hợp với LSTM để hỗ trợ dự đoán chuỗi.
Các LSTM - CNN được phát triển cho các vấn đề dự đoán chuỗi
thời gian trực quan và ứng dụng tạo mô tả văn bản từ các chuỗi hình
ảnh (ví dụ: video).
2.5.2. Cấu trúc mạng LSTM-CNN
Đưa ra một đầu vào, mô hình tạo ra một đại diện nhúng từ bằng
một lớp nhúng. Sau đó, biểu diễn nhúng này được đưa đến mô hình

LSTM để tạo vectơ đặc trưng LSTM và mô hình CNN để tạo vectơ
đặc trưng CNN. Các vectơ này như hai kênh thông tin được nối và đưa
vào mạng lưới thần kinh để phân loại.

Hình 2.27. Mô hình LSTM-CNN đa kênh
2.5.3. Ứng dụng Mô hình LSTM-CNN
- Dự báo giá cổ phiếu, mô hình LSTM-CNN đa kênh phân
tích tình cảm Việt nam, ứng dụng trong xử lí ngôn ngữ tự nhiên


17
CHƯƠNG 3. ỨNG DỤNG MÔ HÌNH VÀO CHẨN ĐOÁN
RỐI LOẠN PHỔ TỰ KỶ
3.1. Quy trình ứng dụng vào chẩn đoán bệnh tự kỷ
3.1.1. Thu thập dữ liệu
3.1.2. Phân tích dữ liệu
a. Dữ liệu vào
b. Quy trình phân tích
c. Dữ liệu ra
Sau khi người dùng hoàn thành các câu hỏi của hệ thống, hệ
thống đưa ra chẩn đoán trẻ có mắc bệnh ASD hay không, nếu mắc bệnh
ASD thì ở mức nào.
3.1.3. Mô hình chẩn đoán

Hình 3.3. Sơ đồ mô hình chẩn đoán rối loạn phổ tự kỷ ở trẻ.


18
3.1.4. Cấu trúc mạng
Trong luận văn, hệ thống mạng học sâu được trình bày cụ thể sau:


Hình 3.4. Cấu trúc mạng học sâu
3.1.5. Ứng dụng mô hình trong chẩn đoán bệnh
Dựa vào bộ trọng số thu được từ mô hình huấn luyện của mạng
học sâu với cấu trúc trên, khi người dùng cung cấp các thông tin liên
quan đến triệu chứng của trẻ, hệ thống sẽ đưa ra kết quả về nguy cơ
mắc rối loạn phổ tự kỷ với 4 cấp độ.


19
3.2. Phân tích thiết kế hệ thống
3.2.1. Xác định yêu cầu
Hệ thống chẩn đoán rối loạn phổ tự kỷ cho phép phu huynh đăng
nhập và cập nhật thông tin về triệu chứng của con hoặc người thân của
mình. Hệ thống nhận thông tin triệu chứng và hỗ trợ chẩn đoán rối loạn
phổ tự kỷ với 04 mức độ.
a. Yêu cầu chức năng
* Đối với quản trị viên:
- Đăng nhập
- Đăng xuất
- Quản lý thông tin cá nhân người dùng


Xem danh sách người dùng



Cập nhật danh sách người dùng

- Chẩn đoán bệnh

- Quản lý dữ liệu tập huấn
* Đối với người sử dụng:
- Đăng nhập
- Đăng xuất
- Cập nhật thông tin cá nhân
- Chẩn đoán bệnh
b. Yêu cầu phi chức năng
- Thiết kế giao diện thân thiện, dễ sử dụng.
- Quản lý dữ liệu hợp lý.
3.2.2. Biểu đồ ca sử dụng
Các ca sử dụng tương ứng với các yêu cầu chức năng đã trình
bày ở trên.


20

Hình 3.5. Biểu đồ ca sử dụng
Dưới đây là đặc tả một số ca sử dụng.
a. Ca sử dụng đăng nhập
b. Ca sử dụng chẩn đoán rối loạn phổ tự kỷ
3.2.3. Biểu đồ hoạt động
a. Hoạt động đăng nhập
b. Hoạt động chẩn đoán bệnh
3.2.4. Biểu đồ tuần tự
a. Đăng nhập
b. Chẩn đoán
3.2.5. Biểu đồ triển khai hệ thống

Hình 3.10. Biểu đồ triển khai hệ thống
3.3. Xây dựng chương trình

Tác giả đã phát triển ứng dụng theo hướng trở thành một
website.


21
Các bước tiến hành cài đặt chương trình:
- Cài đặt server tomcat cho host.
- Deloy trang web để tạo ra fiel .war.
- Upload file .war lên host để thực hiện cài đặt trang web trên
server tomcat.
Website bao gồm các chức năng chính sau:
- Quản lý thông tin người dùng. Người dùng được phân quyền:
+ Admin: quyền thực hiện tất cả các chức năng có trên website.
+ User: có quyền cập nhật thông người dùng và chẩn đoán rối
loạn phổ tự kỷ.
- Quản lý dữ liệu mẫu.
- Chẩn đoán bệnh.
Website có thể chạy được trên các trình duyệt hiện nay như
internet explorer, fire fox, chrome,…
* Màn hình chẩn đoán rối loạn phổ tự kỷ

Hình 3.12. Màn hình chẩn đoán bệnh


22
Sau khi đánh giá danh sách các triệu chứng mỗi triệu chứng có
một trong ba lựa chọn. Người dùng tiếp tục bấm vào “ SEND NOW”
kết quả sẽ được gửi lên máy chủ và trả về kết quả như màn hình dưới
(dưới đây chỉ 1 trong 4 khả năng xảy ra).


Hình 3.13. Màn hình kết quả
3. 4. Đánh giá mô hình
Mạng Nơ-ron là mạng với nhiều phần tử, các phần tử là các tế
bào, tín hiệu được truyền từ tế bào này sang tế bào kia thông qua hệ
thống synapse, tín hiệu yếu, mạnh ảnh hưởng trực tiếp đến kết quả, hay
đầu ra của mạng. Sự “chính xác”, hay “không chính xác” ở đầu vào sẽ
ảnh hưởng đến tín hiệu truyền đi.
Vì vậy, mô hình mạng học sâu đã sử dụng bộ trọng số vào quá
trình huấn luyện (Trọng số thực tế= trọng số lý thuyết x mức độ chắc
chắn của tín hiệu vào). Bên cạnh việc cung cấp thông tin về mức độ
của một triệu chứng bất kỳ, người trả lời cần cung cấp mức độ chắc
chắn của mình đối với câu trả lời đó theo mức độ từ không chắc lắm,
hơi chắc chắn, đến chắc chắn.
Dựa vào bộ trọng số thu được từ mô hình huấn luyện của mạng
học sâu, khi người dùng cung cấp các thông tin liên quan đến triệu
chứng của trẻ, hệ thống sẽ đưa ra kết quả về nguy cơ mắc rối loạn phổ
tự kỷ với độ chính xác cao, độ mất mát thấp.


23
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
1. Kết luận
Chẩn đoán để phát hiện sớm rối loạn phổ tự kỷ ở trẻ em là việc
làm rất cần thiết để có biện pháp điều trị kịp thời và phù hợp. Hiện nay,
việc hội chẩn hội chứng rối loạn phổ tự kỷ nên có sự tham gia của
chuyên gia ở nhiều lĩnh vực khác nhau: tâm lý, tâm thần, giáo dục, âm
ngữ trị liệu, vật lý trị liệu. Yếu tố đầu tiên của quá trình chẩn đoán là
tìm hiểu chung về quá trình phát triển của trẻ (ghi nhận mọi dấu hiệu
phụ huynh cho là "đáng ngại", khám lâm sàng về thể chất và trí tuệ).
Với mục tiêu cải tiến các mô hình mạng học sâu để vận dụng xây

dựng hệ thống hỗ trợ trong dự đoán bệnh rối loạn phổ tự kỷ ở trẻ em,
tác giả đã hoàn thiện luận văn với những kết quả đạt được như sau:
- Trình bày các kiến thức cơ bản về hội chứng tự kỷ ở trẻ em;
xây dựng được quy trình chẩn đoán.
- Giới thiệu tổng quan về mô hình học sâu. Trình bày cụ thể các
mô hình mạng nơ-ron, mô hình CNN, mô hình RNN-LSTM, mô hình
LSTM-CNN.
- Xây dựng trang Web hỗ trợ lưu trữ thông tin trẻ, lưu trữ dữ
liệu tập huấn, các luật ứng dụng trong chẩn đoán trẻ tự kỷ.
- Khi một ca bệnh được chẩn đoán thành công sẽ được thêm vào
nguồn dữ liệu tập huấn, làm tăng tính chính xác trong quá trình chẩn
đoán tiếp theo.
Tuy nhiên do hạn chế về mặt thời gian và kiến thức nên luận văn vẫn
còn tồn tại một số thiếu sót mà tác giả còn phải tiếp tục nghiên cứu, tìm hiểu
đó là:


×