BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT
THÀNH PHỐ HỒ CHÍ MINH
PHÂN TÍCH TÍN HIỆU ĐIỆN TIM CHO VIỆC CẢI THIỆN
TRONG CHẨN ĐOÁN BỆNH TIM
LUẬN ÁN TIẾN SĨ
NGÀNH: KỸ THUẬT ĐIỆN TỬ
Tp Hồ Chí Minh, tháng 06/2022
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT
THÀNH PHỐ HỒ CHÍ MINH
PHÂN TÍCH TÍN HIỆU ĐIỆN TIM CHO VIỆC CẢI THIỆN
TRONG CHẨN ĐOÁN BỆNH TIM
NGÀNH: KỸ THUẬT ĐIỆN TỬ - 9520203
Hướng dẫn khoa học:
Phản biện 1:
Phản biện 2:
Phản biện 3:
Tp Hồ Chí Minh, tháng 06/2022
QUYẾT ĐỊNH GIAO ĐỀ TÀI
QUYẾT ĐỊNH GIAO ĐỀ TÀI
Trang – iii –
LỜI CAM ĐOAN
LỜI CAM ĐOAN
Tôi cam đoan đây là công trình nghiên cứu của tơi
Các số liệu, kết quả nêu trong luận văn là trung thực và chưa từng được cơng
bố trong bất kỳ cơng trình nào khác
Tp Hồ Chí Minh, ngày 10 tháng 06 năm 2022
Trang – v –
LỜI CẢM TẠ
LỜI CẢM TẠ
Trước tiên, tôi xin g ử i l ời c ảm ơn chân thành và sâu sắc đế n Th ầ y PGS TS
, người Th ầ y ln r ấ t nhi ệ t tình và t ận tâm hướ ng d ẫ n tôi trong
thời gian th ự c hi ệ n luậ n án Hơn nữ a, trong su ốt quá trình th ự c hi ệ n t ừ lúc l ập đề
cương cho đế n khi thự c hi ệ n lu ậ n án, Th ầ y ln có nh ững góp ý và định hướng giúp
tơi đạt được nh ữ ng kế t qu ả tốt nh ấ t
Tôi xin g ử i lời c ảm ơn đế n Ban Giám Hi ệ u Trường Đạ i H ọc SPKT Tp HCM
Cảm ơn Ban Ch ủ Nhiệm Khoa Điệ n – Điệ n t ử , nh ữ ng Th ầy/Cô và đồng nghi ệ p c ủ a
tôi ở Khoa Điệ n – Điệ n t ử đã hỗ tr ợ trong quá trình th ự c hiệ n luậ n án này
Cuối cùng, tôi cũng xin được g ử i l ời bi ết ơn sâu sắc đến gia đình tơi, nhữ ng
người đã ln là chỗ d ự a tinh th ầ n, là ngu ồn động viên vô cùng to l ớn trong nh ữ ng
lúc khó khăn, giúp tơi có thể an tâm th ự c hi ệ n công vi ệ c h ọc t ậ p và nghiêm c ứ u c ủ a
mình trong su ố t th ời gian th ự c hiệ n lu ậ n án
Xin chân thành c ảm ơn!
Tp Hồ Chí Minh, ngày 10 tháng 06 năm 2022
Trang – vi –
TĨM TẮT
TĨM TẮT
Phân loại bệnh tim dựa vào tín hiệu điện tim với độ chính xác cao có thể giúp
đỡ các bác sĩ chẩn đoán sớm và đưa ra các quyết định chính xác hơn nhằm chữa trị
tốt nhất có thể cho bệnh nhân Cụ thể, để nâng cao hiệu suất phân loại thì hệ thống
phân loại có thể được xây dựng gồm tập dữ liệu, tiền xử lý và lọc nhiễu, trích đặc
trưng và phân loại bệnh đều cần được xem xét và cải thiện Luận án này sử dụng tập
dữ liệu điện tim có sẵn đã được cơng bố trên website và được các nhà khoa học sử
dụng để nghiên cứu Do đó, luận án tập trung vào nghiên cứu và đưa ra các giải pháp
mới trong công đoạn tiền xử lý và lọc nhiễu, trích đặc trưng và phân loại bệnh để
nâng cao hiệu suất phân loại bệnh tim
Trong những năm gần đây, đã có nhiều nghiên cứu liên quan đến hệ thống
phân loại bệnh tim được thực hiện bởi các nhà khoa học trên thế giới sử dụng tập dữ
liệu điện tim có sẵn trên webiste Hơn nữa, các nghiên cứu này tập trung vào các
phương pháp lọc nhiễu của tín hiệu điện tim, trích xuất những đặc trưng của tín hiệu
nhịp tim, kiến nghị và áp dụng các bộ phân loại thực hiện phân loại và nâng cao hiệu
xuất phân loại bệnh tim Những nghiên cứu này cũng đã thu được những hiệu quả
đáng kể và đóng góp đáng kể vào q trình ứng dụng phân loại bệnh tim Từ đó, luận
án này tiếp tục nghiên cứu, phát triển và đưa ra những phương pháp mới để nâng cao
hơn nữa độ chính xác của việc phân loại bệnh tim dựa vào tín hiệu điện tim ECG
Tín hiệu điện tim có biên độ nhỏ và tồn tại nhiều loại nhiễu như nhiễu của
đường dây điện từ nguồn cung cấp, nhiễu do lệch đường cơ và nhiều loại nhiễu khác
Do đó, luận án này kiến nghị giải thuật phân rã – lọc nhiễu – khôi phục (WDFR) để
loại bỏ những thành phần nhiễu của tín hiệu điện tim Cụ thể, trong giải thuật WDFR,
tín hiệu điện tim được phân rã thành các thành phần sóng con với các dãi tần số khác
nhau sử dụng biến đổi wavelet Sau đó, các thành phần sóng con đã được loại bỏ
nhiễu sẽ được khơi phục lại thành tín hiệu điện tim Tín hiệu điện tim sau khi được
lọc nhiễu sẽ được xác định vị trí của các đỉnh R dùng thuật tốn Pan-Tompskin để
tách ra từng nhịp tim cho trích đặc trưng và phân loại chính xác hơn
Trang – vii –
TĨM TẮT
Các đặc trưng trong tín hiệu nhịp tim cần được trích xuất tốt nhất để nâng
cao hiệu suất phân loại bệnh tim Luận án này đề xuất giải thuật trích đặc trưng tín
hiệu nhịp tim dựa vào phương pháp phân tích thành phần chính của tín hiệu nhịp tim
sau biến đổi wavelet và áp dụng kernel (wkPCA) nhằm nâng cao hiệu suất phân loại
bệnh tim Trong giải thuật wkPCA, tín hiệu nhịp tim sau khi phân rã sẽ được ánh xạ
sang miền không gian mới sử dụng kernel đồng thời trích được nhiều đặc trưng nhất
có thể Để đánh giá hiệu quả của phương pháp trích đặc trưng, một mạng truyền thẳng
bốn lớp được xây dựng để phân loại bệnh tim từ các đặc trưng thu được dùng wkPCA
Độ chính xác bộ phân loại bệnh tim sử dụng phương pháp wkPCA là khá tốt, chứng
tỏ phương pháp trích đặc trưng được đề xuất là phù hợp
Để nâng cao hơn nữa độ chính xác của hệ thống phân loại thì bộ phân loại
cũng cần được nghiên cứu và phát triển Luận án này cũng nghiên cứu và kiến nghị
để phát triển một mạng học sâu nhằm phân loại bệnh tim chính xác hơn Cụ thể, luận
án đề xuất phương pháp tính tham số kernel của các lớp tích chập trong mạng học sâu
dựa vào các thành phần sóng con trong tín hiệu nhịp tim Từ phương pháp tính kernel
trong các lớp tích chập được đề xuất, mơ hình mạng học sâu được cấu hình với những
lớp tích chập phù hợp cho việc phân loại đạt hiệu suất cao Cụ thể, với thuật tốn cho
xây dựng những kernel thì việc trích xuất gần như toàn bộ đặc trưng nhịp tim và điều
này sẽ nâng cao độ chính xác của bộ phân loại bệnh tim
Từ những kết quả này, bộ phân loại có thể được áp dụng để phân loại các loại
bệnh tim từ xa sử dụng máy tính chủ Bộ phân loại sẽ được cài đặt trên máy tính chủ
và bác sĩ có thể tải tín hiệu điện tim của bệnh nhân lên hệ thống để thu nhận kết quả
phân loại bệnh tim từ hệ thống Hiệu quả của các phương pháp đề xuất đã được chứng
minh qua các kết quả thực nghiệm Phương pháp nghiên cứu và kết quả thu được
trong luận án này đã được đăng trong các kỷ yếu hội thảo khoa học và tạp chí khoa
học Kết quả nghiên cứu có thể làm tiền đề để phát triển và xây dựng một thiết bị đo
và phân loại bệnh tim cầm tay hoặc một hệ thống máy tính chủ để phân loại bệnh tim
từ xa
Trang – viii –
TÓM TẮT
ABSTRACT
Classifying heart disease based on ECG signals with high accuracy can help
doctors to diagnose early and make more accurate decisions for effective treatment
In practice, for improving classification peroformance, a classification system can be
built with heart disease datasets and processing methods such as, preprocessing and
noise filtering, features extraction, and heart disease classification This thesis uses
ECG datasets with different heart diseases on the website for research In addition,
from these datasets, the thesis focuses on proposing new methods for the objective of
increasing the classification performance, particularly after preprocessing, the
optimal methods of noise filtering, features extraction, and heart disease classification
are proposed in this thesis
In recent years, there have been many studies related to heart disease
classification systems using ECG datasets with different heart diseases Furthermore,
these studies focus on methods of filtering noises, extracting features, proposing and
applying heart disease classifiers for the objective of improving the performance of
heart disease classification Therefore, there have been significant contributions for
applying heart disease classification In this thesis, we developed and proposed new
methods for further improving the accuracy of heart disease classification based on
ECG signals
ECG signal has a small amplitude with many types of different noise and
artifacts Therefore, this thesis proposed a WDFR algorithm to remove unwanted
components in the ECG signal In particular, the ECG signal is decomposed into
approximation and detail components with different frequency ranges using a wavelet
transform Thus, the approximation and detail components without noises are
restored to obtain the filtered ECG signal From the filtered ECG signal, the position
of the R peaks is determined using the Pan-Tompskin algorithm and then it is
segmented to produce heartbeats for feature extraction
Trang – ix –
TÓM TẮT
The best features of each heartbeat signal need to be extracted for improving
the performance of heart disease classifier In this thesis, a wavelet-based kernel
construction (wkPCA) algorithm is proposed for heartbeat signal feature extraction
In the wkPCA algorithm, the heartbeat signal after decomposition will be mapped to
the new spatial domain using a kernel and features of the kernel may be extracted as
many as possible To evaluate the effectiveness of this feature extraction method, a
four-layer perceptron network with 3 hidden layers and 1 output layer was
constructed for classifying heart diseases based on features obtained using the
wkPCA algorithm The accuracy of the heart disease classifier using the wkPCA
features extraction method is quite good compared to previous methods
With big datasets of heart diseases, this thesis proposed to develop a deep
learning network model, in which the optimal kernel for convolutional layer was
proposed In particular, kernels were built based on the sub-wave components in each
heartbeat signal and this allows to extract features From the proposed method of
calculating the kernels in convolutional layers, the deep learning network model is
configured with the suitable convolutional layers for the heart disease classification
with the higher performance
From these results, the classifier can be applied to classify various types of
heart disease remotely using a host computer The classifier can be installed on the
host computer and doctors can upload the patient's ECG signals to the system to get
the heart disease classification results The effectiveness of the proposed methods has
been proven through experimental results and the scientific contributions related to
the results have been published on conferences and journals The contributions could
be the premise for the development and application of heart disease classification
devices or a host computer system for remote classification of heart disease
Trang – x –
MỤC LỤC
MỤC LỤC
QUYẾT ĐỊNH GIAO ĐỀ TÀI
iii
LÝ LỊCH CÁ NHÂN
iv
LỜI CAM ĐOAN
v
LỜI CẢM TẠ
vi
TÓM TẮT
vii
ABSTRACT
ix
MỤC LỤC
xi
DANH SÁCH CÁC TỪ VIẾT TẮT
xv
DANH SÁCH CÁC HÌNH
xvi
DANH SÁCH CÁC BẢNG
xx
CHƯƠNG 1:
1
TỔNG QUAN
1
11
TÍNH CẤP THIẾT CỦA ĐỀ TÀI LUẬN ÁN
1
12
MỤC TIÊU NGHIÊN CỨU CỦA LUẬN ÁN
9
13
ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU
9
14
CÁCH TIẾP CẬN VÀ PHƯƠNG PHÁP NGHIÊN CỨU
10
15
ĐÓNG GÓP VỀ KHOA HỌC CỦA LUẬN ÁN
10
16
CẤU TRÚC CỦA LUẬN ÁN
12
CHƯƠNG 2:
14
CƠ SỞ LÝ THUYẾT
14
21
TỔNG QUAN VỀ TÍN HIỆU ĐIỆN TIM
14
22
TẬP DỮ LIỆU ĐIỆN TIM ECG
21
Trang – xi –
MỤC LỤC
23
TIỀN XỬ LÝ TÍN HIỆU ĐIỆN TIM
25
24
TRÍCH ĐẶC TRƯNG VÀ GIẢM CHIỀU TÍN HIỆU ĐIỆN TIM
28
241
Phương pháp biến đổi wavelet
29
242
Phương pháp phân tích thành phần chính
31
25
PHÂN LOẠI BỆNH TIM DÙNG TÍN HIỆU ĐIỆN TIM
33
251
Phương pháp phân loại bệnh tim dùng tín hiệu ECG
33
252
Phương pháp đánh giá hiệu suất phân loại bệnh tim
39
CHƯƠNG 3:
41
GIẢI THUẬT WDFR CHO LỌC NHIỄU CỦA TÍN HIỆU ĐIỆN TIM VÀ
TÁCH NHỊP TIM
31
41
NGUỒN NHIỄU CỦA TÍN HIỆU ĐIỆN TIM
41
311
Nhiễu do nguồn cung cấp
42
312
Nhiễu lệch đường cơ sở
42
313
Nhiễu điện cơ
43
314
Các nhiễu khác
44
32
GIẢI THUẬT WDFR CHO LỌC NHIỄU TÍN HIỆU ĐIỆN TIM
44
321
Giới thiệu các hàm wavelet sử dụng cho lọc nhiễu điện tim
44
322
Giải thuật WDFR được đề xuất để loại bỏ nhiễu
46
33
PHƯƠNG PHÁP ĐÁNH GIÁ BỘ LỌC
51
331
Tỉ số tín hiệu trên nhiễu
51
332
Sai số tồn phương trung bình
51
34
KẾT QUẢ LỌC NHIỄU TÍN HIỆU ECG
35
XÁC ĐỊNH VỊ TRÍ ĐỈNH R CỦA PHỨC HỢP QRS VÀ TÁCH TỪNG NHỊP
TIM TỪ TÍN HIỆU ĐIỆN TIM
351
52
63
Khái quát thuật toán Pan-Tompkin để xác định vị trí đỉnh R
Trang – xii –
63
MỤC LỤC
352
Kết quả phát hiện đỉnh R trên tín hiệu ECG
66
353
Tách từng nhịp tim từ tín hiệu điện tim
68
CHƯƠNG 4:
71
TRÍCH ĐẶC TRƯNG TÍN HIỆU ĐIỆN TIM DÙNG GIẢI THUẬT wkPCA
CHO PHÂN LOẠI BỆNH
71
41
GIỚI THIỆU PHƯƠNG PHÁP KERNEL
42
THUẬT TOÁN wkPCA ĐỂ TRÍCH ĐẶC TRƯNG TÍN HIỆU ĐIỆN TIM 74
43
PHÂN LOẠI BỆNH TIM DÙNG MẠNG NƠ-RON TRUYỀN THẲNG
NHIỀU LỚP
44
71
81
ĐÁNH GIÁ HIỆU SUẤT BỘ PHÂN LOẠI
84
441
Đánh giá hiệu suất phân loại dùng ma trận nhầm lẫn
84
442
Đánh giá hiệu suất phân loại dùng đường cong ROC
85
45
KẾT QUẢ TRÍCH ĐẶC TRƯNG CÁC LOẠI BỆNH TIM DÙNG THUẬT
TỐN wkPCA
86
451
Kết quả phân rã dùng thuật tốn WD
86
452
Kết quả trích đặc trưng dùng thuật tốn wKPCA
88
46
KẾT QUẢ PHÂN LOẠI BỆNH TIM DỰA VÀO PHƯƠNG PHÁP TRÍCH
ĐẶC TRƯNG wkPCA VÀ MẠNG MLP
90
461
Lưu đồ giải thuật của hệ thống nhận dạng
90
462
Mơ hình mạng MLP được đề xuất để phân loại bệnh
91
463
Kết quả phân loại bệnh tim dùng mạng nơ-ron truyền thẳng nhiều lớp
94
CHƯƠNG 5:
102
TÍNH TỐN KÍCH THƯỚC KERNEL CỦA CÁC LỚP TÍCH CHẬP TRONG
MẠNG HỌC SÂU CHO PHÂN LOẠI BỆNH TIM
Trang – xiii –
102
MỤC LỤC
51
TRÍCH ĐẶC TRƯNG DỰA VÀO CÁC LỚP TÍCH CHẬP TRONG MẠNG
HỌC SÂU
52
102
CẤU TRÚC MẠNG HỌC SÂU CHO PHÂN LOẠI BỆNH TIM
108
521
Hệ thống dùng mạng học sâu cho phân loại bệnh tim
108
522
Cấu trúc mạng học sâu cho phân loại bệnh tim
109
523
Tính kích thước kernel trong các lớp tích chập
110
53
KẾT QUẢ PHÂN LOẠI BỆNH DỰA VÀO MẠNG HỌC SÂU
114
531
Tác động của chiều dài một nhịp tim đến hiệu suất phân loại
118
532
Ảnh hưởng của hàm wavelet đến hiệu suất phân loại
120
533
Ảnh hưởng của số lớp mạng tích tập đến độ chính xác của bộ phân loại 121
CHƯƠNG 6:
127
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
127
61
KẾT LUẬN
127
62
HƯỚNG PHÁT TRIỂN
129
CÁC CƠNG TRÌNH ĐÃ CƠNG BỐ
130
CÁC CƠNG TRÌNH NGHIÊN CỨU KHÁC
131
TÀI LIỆU THAM KHẢO
132
Trang – xiv –
DANH SÁCH CÁC TỪ VIẾT TẮT
DANH SÁCH CÁC TỪ VIẾT TẮT
Từ viết tắt
Tiếng anh
Tiếng việt
BPM
Beats per minute
Nhịp tim trên phút
BNN
Backpropagation
Network
BWN
Baseline Wander Noise
Nhiễu do lệch đường cơ sở
CNN
Convolutional Neural Network
Mạng nơ-ron tích chập
DNN
Deep Neural Network
Mạng nơ-ron học sâu
DWT
Discrete Wavelet Transform
Biến đổi wavelet rời rạc
ECG
ElectroCardioGram
Điện tâm đồ
GA
Genetic Algorithm
Thuật toán di truyền
MLP
Multilayer perceptron
Perceptron nhiều lớp
MSE
Mean Square Error
Sai số tồn phương trung bình
PLI
Power Line Interference
Nhiễu do nguồn cung cấp
PCA
Principal Component Analysis
Phân tích thành phần chính
RF
Random Forest
Rừng ngẫu nhiên
ROC
Receiver
Operating
Characteristic
Đặc tuyến hoạt động của bộ nhận
STFT
Short-time Fourier transform
Biến đổi Fourier trong thời gian ngắn
SVM
Support Vector Machine
Máy véc tơ hỗ trợ
WD
Wavelet Decomposition
Phân rã dùng wavelet
WDFR
Wavelet Decomposition Filter - Reconstruction
Phân rã dùng wavelet – Lọc – Khôi
phục
WHO
World Health Organization
Tổ chức y tế thế giới
wkPCA
wavelet kernel Principal
Component Analysis
Phân tích thành phần chính dựa vào
kernel và wavelet
WPCs
Wavelet Packet Coefficients
Các hệ số gói wavelet
WPE
Wavelet Packet Entropy
Gói wavelet dùng entropy
WPD
Wavelet Packet Decomposition
Phân rã dạng gói wavelet
WR
Wavelet Reconstruction
Khơi phục dùng wavelet
Neural
Mạng nơ-ron lan truyền ngược
Trang – xv –
DANH SÁCH CÁC HÌNH
DANH SÁCH CÁC HÌNH
Hình 1 1 Sơ đồ xử lý cho việc phân loại bệnh tim từ tín hiệu điện tim ECG
Hình 2 1 Các thành phần cơ bản chứa đựng trong một nhịp tim
8
15
Hình 2 2 Các dạng sơ đồ mắc điện cực trong quá trình thu thập tín hiệu điện tim
dùng chuyển đạo gián tiếp
19
Hình 2 3 Giấy chia ơ dùng để ghi lại tín hiệu điện tim ECG
20
Hình 2 4 Cách xác định biên độ và số lượng nhịp tim trên một phút của tín hiệu điện
tim được in trên giấy chun dụng
20
Hình 2 5 Dạng sóng tín hiệu ECG của bệnh nhân được đánh số 117 thu thập từ tập
dữ liệu MIT-BIH
21
Hình 3 1 Ảnh hưởng của nhiễu nguồn cung cấp lên tín hiệu điện tim ECG
42
Hình 3 2 Ảnh hưởng của nhiễu lệch đường cơ sở lên tín hiệu điện tim ECG
43
Hình 3 3 Ảnh hưởng của nhiễu điện cơ lên tín hiệu điện tim ECG
44
Hình 3 4 Dạng sóng của các hàm wavelet gồm dmey, bior5 5, db4, sym1, bior1 3,
và db1 được sử dụng để khảo sát việc lọc nhiễu tín hiệu điện tim
45
Hình 3 5 Sơ đồ biểu diễn thuật toán phân rã dùng wavelet cho việc lọc nhiễu trên tín
hiệu ECG
47
Hình 3 6 Ngưỡng cứng và ngưỡng mềm được sử dụng để loại bỏ nhiễu của tín hiệu
điện tim
50
Hình 3 7 Lưu đồ giải thuật của giải thuật WDFR cho q trình lọc nhiễu
52
Hình 3 8 Tín hiệu điện tim ECG gốc và tín hiệu điện tim ECG được thêm nhiễu với
tỷ số nhiễu 5dB
53
Hình 3 9 Thành phần xấp xỉ và các thành phần chi tiết được vẽ ra sau khi áp dụng
phương pháp phân rã dùng wavelet ở mức 8 với hàm wavelet “dmey”
Trang – xvi –
55
DANH SÁCH CÁC HÌNH
Hình 3 10 Dạng sóng của các thành phần chi tiết và thành phần xấp xỉ sau khi đã áp
dụng lọc nhiễu theo ngưỡng cứng và ngưỡng mềm
56
Hình 3 11 Dạng sóng của các thành phần chi tiết và thành phần xấp xỉ sau khi đã áp
dụng lọc nhiễu theo ngưỡng cứng và ngưỡng mềm
56
Hình 3 12 Tín hiệu ECG gốc và tín hiệu ECG sau khi đã được lọc nhiễu với các hàm
wavelet là dmey, bior5 5, db4, sym1, bior1 3, và db1
57
Hình 3 13 Mật độ phổ cơng suất của tín hiệu trước và sau khi lọc nhiễu đối với tín
hiệu ECG từ tập dữ liệu MIT-BIH DB
58
Hình 3 14 Dạng sóng của tín hiệu ECG gốc và tín hiệu ECG sau khi đã lọc nhiễu
với các hàm wavelet được đề xuất và áp dụng trên dữ liệu ECG được thu thập tại
phịng thí nghiệm Kỹ Thuật Y Sinh
58
Hình 3 15 Mật độ phổ cơng suất của tín hiệu ECG gốc và tín hiệu ECG sau khi đã
lọc nhiễu với các hàm wavelet được đề xuất và áp dụng trên dữ liệu ECG được thu
thập tại phịng thí nghiệm Kỹ Thuật Y Sinh
60
Hình 3 16 Sơ đồ khối của thuật toán Pan-Tompkins được sử dụng để xác định phức
hợp QRS
63
Hình 3 17 Vị trí đỉnh R trong phức hợp QRS được xác định cho tín hiệu ECG từ tập
dữ iệu MIT-BIH DB
66
Hình 3 18 Vị trí đỉnh R của phức hợp QRS được xác định cho tín hiệu ECG tự thu
thập từ phịng thí nghiệm Kỹ Thuật Y Sinh
67
Hình 3 19 Tách từng nhịp tim từ tín hiệu điện tim ECG thu thập từ tập dữ liệu MITBIH DB và đã được lọc nhiễu và xác định vị trí đỉnh R
68
Hình 3 20 Kết quả tách từng nhịp tim của tín hiệu điện tim ECG thu được tại phịng
thí nghiệm
69
Hình 4 1 Mơ tả phương pháp kernel được thực hiện để chiếu dữ liệu từ miền không
gian gốc ( X ) sang miền không gian mới ( Z )
Trang – xvii –
72
DANH SÁCH CÁC HÌNH
Hình 4 2 Sơ đồ khối của phương pháp wkPCA được đề xuất để trích đặc trưng tín
hiệu ECG
75
Hình 4 3 Đồ thị tổng tích lũy của các thành phần đặc trưng trong thuật tốn phân
tích thành phần chính
77
Hình 4 4 Đơn vị xử lý trong mạng nơ-ron nhân tạo
82
Hình 4 5 Mơ tả đường cong ROC phục vụ cho việc đánh giá hiệu suất của hệ thống
phân loại bệnh tim
86
Hình 4 6 Dạng sóng nhịp tim của 5 loại bệnh tim (N, S, V, F, và Q) và dạng sóng
của các hệ số wavelet tương ứng
88
Hình 4 7 Phân bố các đặc trưng của các loại bệnh tim trên tín hiệu nhịp tim trong
miền khơng gian gốc
89
Hình 4 8 Phân bố các đặc trưng của tín hiệu nhịp tim trong miền không gian mới sau
khi áp dụng thuật tốn wkPCA
90
Hình 4 9 Lưu đồ giải thuật cho quá trình phân loại bệnh tim sử dụng giải thuật
wkPCA và mạng MLP
91
Hình 4 10 Sơ đồ khối được sử dụng để phân loại bệnh kết hợp thuật toán wkPCA và
mạng nơ-ron truyền thẳng nhiều lớp
91
Hình 4 11 Cấu trúc mạng nơ-ron truyền thẳng nhiều lớp được sử dụng để phân loại
bệnh tim
92
Hình 4 12 Trình bày kết quả ma trận nhầm lẫn trong trường hợp phân loại bệnh tim
sử dụng mạng nơ-ron truyền thẳng nhiều lớp
97
Hình 4 13 Trình bày kết quả ma trận nhầm lẫn trong trường hợp phân loại bệnh tim
sử dụng mạng nơ-ron truyền thẳng nhiều lớp
98
Hình 5 1 Cấu trúc của một nơ-ron với n ngõ vào, một ngõ ra và hàm kích hoạt tương
ứng
103
Hình 5 2 Mơ tả về cách tính tích chập cho tín hiệu 1 chiều được sử dụng trong mạng
nơ-ron tích chập
104
Trang – xviii –
DANH SÁCH CÁC HÌNH
Hình 5 3 Mơ tả về cách tính tích chập cho tín hiệu 1 chiều với trường hợp có thêm
zero padding vào tín hiệu gốc
105
Hình 5 4 Mơ tả sự kết nối và cách tính tốn của các lớp tích chập với các lớp truyền
thẳng trong mạng học sâu
106
Hình 5 5 Sơ đồ khối hệ thống ứng dụng mạng học sâu được đề xuất để phân loại
bệnh tim
108
Hình 5 6 Cấu trúc mạng học sâu được đề xuất sử dụng để trích đặc trưng và phân
loại bệnh tim
110
Hình 5 7 Lưu đồ giải thuật của hệ thống nhận dạng bệnh tim sử dụng cấu trúc mạng
học sâu
114
Hình 5 8 Kết quả độ chính xác của hệ thống phân loại bệnh tim trong quá trình huấn
luyện và giá trị của hàm mất mát tương ứng với các epoch
116
Hình 5 9 Ma trận nhầm lẫn trong trường hợp phân loại bệnh dùng mạng học sâu
117
Hình 5 10 So sánh hiệu suất phân loại với trường hợp số lớp tích chập thay đổi từ 1
đến 9 lớp
122
Trang – xix –
DANH SÁCH CÁC BẢNG
DANH SÁCH CÁC BẢNG
Bảng 2 1 Mô tả các ý nghĩa và thông tin thời gian của từng thành phần đặc trưng
trong một nhịp tim
18
Bảng 2 2 Bảng mô tả ý nghĩa của các kiểu định dạng dữ liệu tín hiệu điện tim theo
định dạng MIT-BIH
22
Bảng 2 3 Mô tả chi tiết các thông tin trên tập dữ liệu MIT-BIH DB
23
Bảng 2 4 Bảng tham chiếu của các loại bệnh tim theo chuẩn MIT-BIH và theo chuẩn
ANSI-AAMI EC57-2012
25
Bảng 2 5 Thống kê các hệ thống phân loại bệnh tim cùng với hiệu suất thu được
trong các nghiên cứu trước đây
34
Bảng 3 1 Các thành phần tần số của tín hiệu ECG sau khi áp dụng thuật tốn phân
rã WD
54
Bảng 3 2 Bảng giá trị các tham số đánh giá hiệu suất bộ lọc sau khi được áp dụng
trên tập dữ liệu nhịp tim MIT-BIH
61
Bảng 3 3 Bảng giá trị các tham số đánh giá hiệu suất bộ lọc sau khi được áp dụng
trên tập dữ liệu nhịp tim được tác giả tự thu thập
62
Bảng 4 1 Ma trận nhầm lẫn cho trường hợp nhiều loại bệnh
84
Bảng 4 2 Mô tả số lượng nhịp tim của các loại bệnh tim được sử dụng để kiểm tra
hiệu suất của hệ thống phân loại được đề xuất
93
Bảng 4 3 Phân bố dữ liệu huấn luyện và dữ liệu kiểm tra để đánh giá hiệu suất của
bộ phân loại
94
Bảng 4 4 Các tham số được sử dụng trong cấu trúc mạng nơ-ron cho việc phân loại
bệnh tim
95
Bảng 4 5 Giá trị của tham số kernel cho hàm kernel Gaussian được áp dụng để tính
tốn giá trị tốt nhất của bộ phân loại
96
Trang – xx –
DANH SÁCH CÁC BẢNG
Bảng 4 6 Hiệu suất của bộ phân loại cho 5 loại bệnh tim N, S, V, F và Q trong trường
hợp số lượng dữ liệu huấn luyện và kiểm tra khác nhau
97
Bảng 4 7 So sánh độ chính xác của phương pháp wkPCA được đề xuất với các
phương pháp nghiên cứu khác
99
Bảng 5 1 Số lượng nhịp tim cho từng loại bệnh và tổng số lượng nhịp tim được sử
dụng cho thí nghiệm với mạng nơ-ron học sâu
109
Bảng 5 2 Phân bố dữ liệu huấn luyện và dữ liệu kiểm tra để đánh giá hiệu suất của
bộ phân loại
109
Bảng 5 3 Số lượng nhịp tim cho từng loại bệnh và tổng số lượng nhịp tim được sử
dụng cho thí nghiệm với mạng nơ-ron học sâu
111
Bảng 5 4 Các tham số huấn luyện được cài đặt cho mạng học sâu
115
Bảng 5 5 Kết quả hiệu suất phân loại trong trường hợp dùng mạng học sâu
117
Bảng 5 6 Bảng thống kê độ chính xác của bộ phân loại bệnh tim của các cơng trình
nghiên cứu trước đây với dài của một nhịp tim khác nhau
118
Bảng 5 7 Kết quả so sánh hiệu suất phân loại bệnh tim trong trường hợp chiều dài
một nhịp tim khác nhau
120
Bảng 5 8 Kết quả so sánh hiệu suất phân loại bệnh tim trong trường hợp sử dụng các
hàm wavelet khác nhau
121
Bảng 5 9 So sánh độ chính xác phân loại bệnh tim sử dụng mạng học sâu đề xuất
với các cơng trình nghiên cứu khác
123
Trang – xxi –
Chương 1: Tổng quan
CHƯƠNG 1:
TỔNG QUAN
1 1 TÍNH CẤP THIẾT CỦA ĐỀ TÀI LUẬN ÁN
Tim là một bộ phân có liên quan đến sức khỏe của con người Tỷ lệ mắc bệnh
tim mạch đã tăng lên rất cao trong những năm gần đây ở trên thế giới nói chung và
Việt Nam nói riêng [1, 2] Hơn nữa, bệnh tim mạch là một trong những nguyên nhân
gây tử vong hàng đầu tại Việt Nam và trên thế giới Đặc biệt, số lượng bệnh nhân
sống tại các thành thị của Việt Nam mắc bệnh tim mạch đang ngày càng gia tăng
Bên cạnh các bệnh tim bẩm sinh, những bệnh tim do tác nhân bên ngoài như mỡ trong
máu, cholestoral tăng cao và nhiều bệnh tim khác đang dần trở thành mãn tính và đe
dọa tính mạng bệnh nhân Theo kết quả thống kê vào năm 2015 thì 20% dân số Việt
Nam bị bệnh tim mạch, tăng huyết áp, còn trên thế giới bệnh tim mạch làm cho 17,9
triệu người chết mỗi năm và dự kiến đến năm 2030 thì con số này lên đến 23,6 triệu
người [3], trong khi có 1/3 số người chết ở Việt Nam là do bị bệnh tim mạch được
thống kê vào năm 2018
Tín hiệu điện tim ECG ghi lại q trình thay đổi dịng điện của tim khi tim
hoạt động và dựa vào đó có thể chẩn đốn các loại bệnh tim mạch Tín hiệu điện tim
ECG có biên độ rất nhỏ và thời gian thay đổi cũng nhỏ Hơn nữa, một số đặc trưng
của các loại bệnh trong tín hiệu điện tim rất khó phát hiện bằng mắt thường Vì vậy,
một cơng cụ máy tính có cài đặt phần mềm xử tín hiệu điện tim và chẩn đốn bệnh
tim thì có thể giúp bác sĩ chẩn đoán dễ dàng hơn Các loại bệnh lý liên quan đến tim
mạch cũng rất đa dạng và phức tạp, gây rất nhiều khó khăn cho việc chẩn đốn, phân
loại và điều trị [4, 5] Vấn đề xây dựng một công cụ để phân loại chính xác các loại
bệnh tim dựa vào tín hiệu điện tim ECG là một yêu cầu rất cần thiết nhằm giúp các
Trang – 1 –
Chương 1: Tổng quan
bác sĩ có thể chẩn đốn sớm và tìm ra các bệnh tim khác nhau Với kết quả phân loại
bệnh bằng máy tính với độ chính xác cao có thể giúp cho bác sĩ dễ dàng hơn trong
việc đưa ra những chẩn đốn chính xác về tình trạng bệnh nhằm điều trị bệnh tốt hơn
Cơ sở dữ liệu của tín hiệu điện tim ECG hiện tại đã được công bố trên các
website và được nhiều nhà nghiên cứu sử dụng Tuy nhiên, cùng một loại bệnh, nhưng
với từng bệnh nhân khác nhau thì dữ liệu điện tim cũng rất khác nhau, điều đó làm
cho việc phân loại bệnh tim từ tín hiệu điện tim trở nên khó khăn hơn Hơn nữa, dữ
liệu điện tim của từng loại bệnh tim có sự chênh lệch, điều đó làm ảnh hưởng đến kết
quả nhận dạng các loại bệnh tim dựa vào tín hiệu điện tim Trong điều kiện cơ sở dữ
liệu như vậy, một thuật toán để tiền xử lý và chuẩn hóa dữ liệu nhằm nâng cao hiệu
suất phân loại bệnh tim là cần thiết
Tín hiệu ECG sau khi thu được, ngồi việc chứa đựng thơng tin cần thiết thì
cũng mang rất nhiều thành phần nhiễu, mà nguyên nhân có thể là do tâm lý người
bệnh lúc đo, do nguồn điện cung cấp, do kết nối đầu dị tín hiệu, do đường cơ sở tín
hiệu bị trơi, do thiết bị đo hoặc những yếu tố khác Vì vậy, tiền xử lý tín hiệu điện tim
để loại bỏ những thành phần nhiễu không mong muốn là công việc rất quan trọng
nhưng cũng rất khó khăn trong phân tích tín hiệu
Mặc dù có rất nhiều kỹ thuật đã được các nhà khoa học sử dụng cho việc xử
lý tín hiệu điện tim trước đây Tuy nhiên, vẫn còn rất nhiều thử thách trong xử lý tín
hiệu điện tim và phân loại bệnh tim dựa vào tín hiệu điện tim mà nguyên nhân gồm
nhiều yếu tố được mô tả như sau [6]:
1 - Tính biến đổi của đặc trưng tín hiệu ECG, nhịp tim của từng cá nhân khác
nhau thì mang những đặc trưng khác nhau mặc dù họ bị chung một loại bệnh, chưa
kể đến vấn đề nhịp tim của mỗi cá nhân cũng biến đổi theo từng thời điểm sinh lý và
tinh thần khác nhau
2 - Không tồn tại 1 quy luật phân loại tối ưu nào cho việc phân loại bệnh tim
dùng tín hiệu ECG, mặc dù đã có nhiều phương pháp được sử dụng nhưng hiện tại
chưa có một thuật toán nào là tối ưu cho việc phân loại bệnh
Trang – 2 –
Chương 1: Tổng quan
3 - Tính phức tạp trong tín hiệu ECG, một tín hiệu ECG thơng thường chỉ bao
gồm các đỉnh P, Q, R, S, T, và U, tuy nhiên trên thực tế thì một tín hiệu ECG thơng
thường có thể bao gồm hàng nghìn các đỉnh và các đỉnh này có thể có dạng khác nhau
là cho việc trích xuất đặc trưng sẽ khó khăn
4 - Xây dựng một bộ phân loại tín hiệu ECG theo thời gian thực là vấn đề rất
khó khăn bởi vì trên tín hiệu ECG tồn tại rất nhiều tham số
❖ CÁC KẾT QUẢ TRONG VÀ NGỒI NƯỚC ĐÃ ĐƯỢC CƠNG BỐ:
Với những hệ lụy rất lớn của bệnh tim mạch, đã có nhiều cơng trình nghiên
cứu trong và ngồi nước về phân tích tín hiệu điện tim cũng như xây dựng phương
pháp phân loại bệnh tim đã được công bố cả trong và ngồi nước Dưới đây trình bày
tóm lượt một số kết quả nghiên cứu đã được thực hiện trong ngoài nước
Trong luận án tiến sĩ với đề tài “Phân tích tín hiệu loạn nhịp tim” được
thực hiện năm 2014 bởi tác giả Chử Đức Hoàng [7], tác giả đã phân tích các đặc điểm
của tín hiệu loạn nhịp tim dùng tín hiệu điện tim ECG Cụ thể, tác giả đề xuất cải tiến
phương pháp xác định phức hợp QRS do Pan Hamilton và Tompkins đưa ra để xác
định phức hợp QRS Hơn nữa, tác giả cũng đề xuất xây dựng giải thuật phân tích khử
khuynh hướng động tín hiệu động đa trị Multi Detrended Fluctuation Analysis để
phát hiện các hiện tượng bất thường của bệnh nhân bị loạn nhịp tim Trong luận án
này, tác giả đã xây dựng véc tơ chuẩn hóa RR từ dữ liệu điện tim Véc tơ này được
kết hợp với giải thuật phân tích khử khuynh hướng động để xây dựng mơ hình thu
nhận, xử lý, phân tích và trợ giúp chẩn đốn sớm các triệu chứng về loạn nhịp tim
Kết quả độ chính xác của bộ phân loại trong nghiên cứu này đạt được 89%
Luận án tiến sĩ của tác giả Nguyễn Đức Thảo với tựa đề là “Nâng cao chất
lượng nhận dạng tín hiệu điện tim dựa trên giải pháp loại bỏ ảnh hưởng từ nhịp
thở của người bệnh” thực hiện năm 2016 tập trung vào nhận dạng tín hiệu điện tim
[8] Cụ thể, tác giả sử dụng các bộ lọc để loại bỏ thành phần nhịp thở trong tín hiệu
điện tim, tín hiệu sau khi đã lọc sẽ được đưa vào mạng nơ-ron logic mờ TSK (Takaga
– Sugeno – Kang) để nhận dạng các loại bệnh tim Trong luận án này, tác giả đề xuất
Trang – 3 –
Chương 1: Tổng quan
phương pháp bổ sung 2 thông tin từ nhịp thở vào tín hiệu điện tim để cải thiện độ
chính xác của q trình nhận dạng tín hiệu ECG Hơn nữa, tác giả cũng sử dụng mơ
hình mạng TSK để nhận dạng tín hiệu ECG với 4 kịch bản khác nhau Kết quả nhận
dạng tốt nhất thu được là 96 6% cho trường hợp nhận dạng 3 loại bệnh khác nhau
Luận án tiến sĩ của tác giả Phạm Văn Nam với đề tài “Xây dựng mơ hình
nhận dạng kết hợp nhằm nâng cao độ chính xác phân loại tín hiệu điện tim loạn
nhịp” được bảo vệ năm 2018 đã nghiên cứu xây dựng một bộ nhận dạng kết hợp
nhằm nâng cao độ chính xác của việc phân loại tín hiệu loạn nhịp tim Cụ thể, đề tài
này sử dụng thuật toán cây quyết định được kết hợp từ các bộ phân loại dùng phương
pháp mạng nơ-ron truyền thẳng nhiều lớp MLP, phương pháp máy véc tơ hỗ trợ SVM,
và phương pháp rừng ngẫu nhiên RF [9] để phân loại các loại bệnh tim Trong đó,
ngõ ra của các bộ phân loại MLP, SVM và RF sẽ được đưa vào bộ phân loại cây
quyết định để quyết định loại bệnh tim tương ứng với tín hiệu nhịp tim Kết quả độ
chính xác nhận dạng bệnh tim thu được của hệ thống được đề xuất là 98 76%
Mặc dù các nghiên cứu trong nước về tín hiệu điện tim cũng như phân loại
bệnh tim từ tín hiệu là tương đối hạn chế, các nghiên cứu ngoài nước về lĩnh vực phân
loại bệnh tim từ tín hiệu điện tim được thực hiện phong phú hơn Trong tài liệu tham
khảo [10], tác giả R Rodríguez và các cộng sự đã đề xuất phương pháp ngưỡng thích
nghi kết hợp với phương pháp phân tích thành phần chính PCA để trích đặc trưng của
tín hiệu điện tim ECG Trong đó, các tác giả tập trung vào việc trích thành phần đặc
trưng của phức hợp QRS như là một đặc trưng của tín hiệu điện tim ECG Cụ thể,
thành phần phức hợp QRS được trích sử dụng biến đổi Hilbert và kết hợp với thuật
toán PCA dựa trên kỹ thuật ngưỡng thích nghi để trích thành phần đặc trưng của tín
hiệu ECG Kết quả thu được của nghiên cứu này là xác định được phức hợp QRS
trong tín hiệu điện tim
Hơn nữa, trong [11], Saeed Mian Qaisar và các cộng sự đã thiết kế một hệ
thống phân loại bệnh tim sử dụng kết hợp phép biến đổi wavelet và thuật toán phân
loại rừng ngẫu nhiên RF Trong đó, thuật tốn biến đổi wavelet được áp dụng để phân
Trang – 4 –