Tải bản đầy đủ (.docx) (162 trang)

PHÂN TÍCH tín HIỆU điện TIM CHO VIỆC cải THIỆN TRONG CHẨN đoán BỆNH TIM

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.32 MB, 162 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT
THÀNH PHỐ HỒ CHÍ MINH

PHÂN TÍCH TÍN HIỆU ĐIỆN TIM CHO VIỆC CẢI THIỆN
TRONG CHẨN ĐOÁN BỆNH TIM

LUẬN ÁN TIẾN SĨ
NGÀNH: KỸ THUẬT ĐIỆN TỬ

Tp Hồ Chí Minh, tháng 06/2022


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT
THÀNH PHỐ HỒ CHÍ MINH

PHÂN TÍCH TÍN HIỆU ĐIỆN TIM CHO VIỆC CẢI THIỆN
TRONG CHẨN ĐOÁN BỆNH TIM
NGÀNH: KỸ THUẬT ĐIỆN TỬ - 9520203

Hướng dẫn khoa học:

Phản biện 1:
Phản biện 2:
Phản biện 3:

Tp Hồ Chí Minh, tháng 06/2022


QUYẾT ĐỊNH GIAO ĐỀ TÀI



QUYẾT ĐỊNH GIAO ĐỀ TÀI

Trang – iii –



LỜI CAM ĐOAN

LỜI CAM ĐOAN

Tôi cam đoan đây là công trình nghiên cứu của tơi
Các số liệu, kết quả nêu trong luận văn là trung thực và chưa từng được cơng
bố trong bất kỳ cơng trình nào khác
Tp Hồ Chí Minh, ngày 10 tháng 06 năm 2022

Trang – v –


LỜI CẢM TẠ

LỜI CẢM TẠ
Trước tiên, tôi xin g ử i l ời c ảm ơn chân thành và sâu sắc đế n Th ầ y PGS TS
, người Th ầ y ln r ấ t nhi ệ t tình và t ận tâm hướ ng d ẫ n tôi trong
thời gian th ự c hi ệ n luậ n án Hơn nữ a, trong su ốt quá trình th ự c hi ệ n t ừ lúc l ập đề
cương cho đế n khi thự c hi ệ n lu ậ n án, Th ầ y ln có nh ững góp ý và định hướng giúp
tơi đạt được nh ữ ng kế t qu ả tốt nh ấ t
Tôi xin g ử i lời c ảm ơn đế n Ban Giám Hi ệ u Trường Đạ i H ọc SPKT Tp HCM
Cảm ơn Ban Ch ủ Nhiệm Khoa Điệ n – Điệ n t ử , nh ữ ng Th ầy/Cô và đồng nghi ệ p c ủ a
tôi ở Khoa Điệ n – Điệ n t ử đã hỗ tr ợ trong quá trình th ự c hiệ n luậ n án này

Cuối cùng, tôi cũng xin được g ử i l ời bi ết ơn sâu sắc đến gia đình tơi, nhữ ng
người đã ln là chỗ d ự a tinh th ầ n, là ngu ồn động viên vô cùng to l ớn trong nh ữ ng
lúc khó khăn, giúp tơi có thể an tâm th ự c hi ệ n công vi ệ c h ọc t ậ p và nghiêm c ứ u c ủ a
mình trong su ố t th ời gian th ự c hiệ n lu ậ n án
Xin chân thành c ảm ơn!
Tp Hồ Chí Minh, ngày 10 tháng 06 năm 2022

Trang – vi –


TĨM TẮT

TĨM TẮT
Phân loại bệnh tim dựa vào tín hiệu điện tim với độ chính xác cao có thể giúp
đỡ các bác sĩ chẩn đoán sớm và đưa ra các quyết định chính xác hơn nhằm chữa trị
tốt nhất có thể cho bệnh nhân Cụ thể, để nâng cao hiệu suất phân loại thì hệ thống
phân loại có thể được xây dựng gồm tập dữ liệu, tiền xử lý và lọc nhiễu, trích đặc
trưng và phân loại bệnh đều cần được xem xét và cải thiện Luận án này sử dụng tập
dữ liệu điện tim có sẵn đã được cơng bố trên website và được các nhà khoa học sử
dụng để nghiên cứu Do đó, luận án tập trung vào nghiên cứu và đưa ra các giải pháp
mới trong công đoạn tiền xử lý và lọc nhiễu, trích đặc trưng và phân loại bệnh để
nâng cao hiệu suất phân loại bệnh tim
Trong những năm gần đây, đã có nhiều nghiên cứu liên quan đến hệ thống
phân loại bệnh tim được thực hiện bởi các nhà khoa học trên thế giới sử dụng tập dữ
liệu điện tim có sẵn trên webiste Hơn nữa, các nghiên cứu này tập trung vào các
phương pháp lọc nhiễu của tín hiệu điện tim, trích xuất những đặc trưng của tín hiệu
nhịp tim, kiến nghị và áp dụng các bộ phân loại thực hiện phân loại và nâng cao hiệu
xuất phân loại bệnh tim Những nghiên cứu này cũng đã thu được những hiệu quả
đáng kể và đóng góp đáng kể vào q trình ứng dụng phân loại bệnh tim Từ đó, luận
án này tiếp tục nghiên cứu, phát triển và đưa ra những phương pháp mới để nâng cao

hơn nữa độ chính xác của việc phân loại bệnh tim dựa vào tín hiệu điện tim ECG
Tín hiệu điện tim có biên độ nhỏ và tồn tại nhiều loại nhiễu như nhiễu của
đường dây điện từ nguồn cung cấp, nhiễu do lệch đường cơ và nhiều loại nhiễu khác
Do đó, luận án này kiến nghị giải thuật phân rã – lọc nhiễu – khôi phục (WDFR) để
loại bỏ những thành phần nhiễu của tín hiệu điện tim Cụ thể, trong giải thuật WDFR,
tín hiệu điện tim được phân rã thành các thành phần sóng con với các dãi tần số khác
nhau sử dụng biến đổi wavelet Sau đó, các thành phần sóng con đã được loại bỏ
nhiễu sẽ được khơi phục lại thành tín hiệu điện tim Tín hiệu điện tim sau khi được
lọc nhiễu sẽ được xác định vị trí của các đỉnh R dùng thuật tốn Pan-Tompskin để
tách ra từng nhịp tim cho trích đặc trưng và phân loại chính xác hơn

Trang – vii –


TĨM TẮT
Các đặc trưng trong tín hiệu nhịp tim cần được trích xuất tốt nhất để nâng
cao hiệu suất phân loại bệnh tim Luận án này đề xuất giải thuật trích đặc trưng tín
hiệu nhịp tim dựa vào phương pháp phân tích thành phần chính của tín hiệu nhịp tim
sau biến đổi wavelet và áp dụng kernel (wkPCA) nhằm nâng cao hiệu suất phân loại
bệnh tim Trong giải thuật wkPCA, tín hiệu nhịp tim sau khi phân rã sẽ được ánh xạ
sang miền không gian mới sử dụng kernel đồng thời trích được nhiều đặc trưng nhất
có thể Để đánh giá hiệu quả của phương pháp trích đặc trưng, một mạng truyền thẳng
bốn lớp được xây dựng để phân loại bệnh tim từ các đặc trưng thu được dùng wkPCA
Độ chính xác bộ phân loại bệnh tim sử dụng phương pháp wkPCA là khá tốt, chứng
tỏ phương pháp trích đặc trưng được đề xuất là phù hợp
Để nâng cao hơn nữa độ chính xác của hệ thống phân loại thì bộ phân loại
cũng cần được nghiên cứu và phát triển Luận án này cũng nghiên cứu và kiến nghị
để phát triển một mạng học sâu nhằm phân loại bệnh tim chính xác hơn Cụ thể, luận
án đề xuất phương pháp tính tham số kernel của các lớp tích chập trong mạng học sâu
dựa vào các thành phần sóng con trong tín hiệu nhịp tim Từ phương pháp tính kernel

trong các lớp tích chập được đề xuất, mơ hình mạng học sâu được cấu hình với những
lớp tích chập phù hợp cho việc phân loại đạt hiệu suất cao Cụ thể, với thuật tốn cho
xây dựng những kernel thì việc trích xuất gần như toàn bộ đặc trưng nhịp tim và điều
này sẽ nâng cao độ chính xác của bộ phân loại bệnh tim
Từ những kết quả này, bộ phân loại có thể được áp dụng để phân loại các loại
bệnh tim từ xa sử dụng máy tính chủ Bộ phân loại sẽ được cài đặt trên máy tính chủ
và bác sĩ có thể tải tín hiệu điện tim của bệnh nhân lên hệ thống để thu nhận kết quả
phân loại bệnh tim từ hệ thống Hiệu quả của các phương pháp đề xuất đã được chứng
minh qua các kết quả thực nghiệm Phương pháp nghiên cứu và kết quả thu được
trong luận án này đã được đăng trong các kỷ yếu hội thảo khoa học và tạp chí khoa
học Kết quả nghiên cứu có thể làm tiền đề để phát triển và xây dựng một thiết bị đo
và phân loại bệnh tim cầm tay hoặc một hệ thống máy tính chủ để phân loại bệnh tim
từ xa

Trang – viii –


TÓM TẮT

ABSTRACT
Classifying heart disease based on ECG signals with high accuracy can help
doctors to diagnose early and make more accurate decisions for effective treatment
In practice, for improving classification peroformance, a classification system can be
built with heart disease datasets and processing methods such as, preprocessing and
noise filtering, features extraction, and heart disease classification This thesis uses
ECG datasets with different heart diseases on the website for research In addition,
from these datasets, the thesis focuses on proposing new methods for the objective of
increasing the classification performance, particularly after preprocessing, the
optimal methods of noise filtering, features extraction, and heart disease classification
are proposed in this thesis

In recent years, there have been many studies related to heart disease
classification systems using ECG datasets with different heart diseases Furthermore,
these studies focus on methods of filtering noises, extracting features, proposing and
applying heart disease classifiers for the objective of improving the performance of
heart disease classification Therefore, there have been significant contributions for
applying heart disease classification In this thesis, we developed and proposed new
methods for further improving the accuracy of heart disease classification based on
ECG signals
ECG signal has a small amplitude with many types of different noise and
artifacts Therefore, this thesis proposed a WDFR algorithm to remove unwanted
components in the ECG signal In particular, the ECG signal is decomposed into
approximation and detail components with different frequency ranges using a wavelet
transform Thus, the approximation and detail components without noises are
restored to obtain the filtered ECG signal From the filtered ECG signal, the position
of the R peaks is determined using the Pan-Tompskin algorithm and then it is
segmented to produce heartbeats for feature extraction

Trang – ix –


TÓM TẮT
The best features of each heartbeat signal need to be extracted for improving
the performance of heart disease classifier In this thesis, a wavelet-based kernel
construction (wkPCA) algorithm is proposed for heartbeat signal feature extraction
In the wkPCA algorithm, the heartbeat signal after decomposition will be mapped to
the new spatial domain using a kernel and features of the kernel may be extracted as
many as possible To evaluate the effectiveness of this feature extraction method, a
four-layer perceptron network with 3 hidden layers and 1 output layer was
constructed for classifying heart diseases based on features obtained using the
wkPCA algorithm The accuracy of the heart disease classifier using the wkPCA

features extraction method is quite good compared to previous methods
With big datasets of heart diseases, this thesis proposed to develop a deep
learning network model, in which the optimal kernel for convolutional layer was
proposed In particular, kernels were built based on the sub-wave components in each
heartbeat signal and this allows to extract features From the proposed method of
calculating the kernels in convolutional layers, the deep learning network model is
configured with the suitable convolutional layers for the heart disease classification
with the higher performance
From these results, the classifier can be applied to classify various types of
heart disease remotely using a host computer The classifier can be installed on the
host computer and doctors can upload the patient's ECG signals to the system to get
the heart disease classification results The effectiveness of the proposed methods has
been proven through experimental results and the scientific contributions related to
the results have been published on conferences and journals The contributions could
be the premise for the development and application of heart disease classification
devices or a host computer system for remote classification of heart disease

Trang – x –


MỤC LỤC

MỤC LỤC
QUYẾT ĐỊNH GIAO ĐỀ TÀI

iii

LÝ LỊCH CÁ NHÂN

iv


LỜI CAM ĐOAN

v

LỜI CẢM TẠ

vi

TÓM TẮT

vii

ABSTRACT

ix

MỤC LỤC

xi

DANH SÁCH CÁC TỪ VIẾT TẮT

xv

DANH SÁCH CÁC HÌNH

xvi

DANH SÁCH CÁC BẢNG


xx

CHƯƠNG 1:

1

TỔNG QUAN

1

11

TÍNH CẤP THIẾT CỦA ĐỀ TÀI LUẬN ÁN

1

12

MỤC TIÊU NGHIÊN CỨU CỦA LUẬN ÁN

9

13

ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU

9

14


CÁCH TIẾP CẬN VÀ PHƯƠNG PHÁP NGHIÊN CỨU

10

15

ĐÓNG GÓP VỀ KHOA HỌC CỦA LUẬN ÁN

10

16

CẤU TRÚC CỦA LUẬN ÁN

12

CHƯƠNG 2:

14

CƠ SỞ LÝ THUYẾT

14

21

TỔNG QUAN VỀ TÍN HIỆU ĐIỆN TIM

14


22

TẬP DỮ LIỆU ĐIỆN TIM ECG

21

Trang – xi –


MỤC LỤC
23

TIỀN XỬ LÝ TÍN HIỆU ĐIỆN TIM

25

24

TRÍCH ĐẶC TRƯNG VÀ GIẢM CHIỀU TÍN HIỆU ĐIỆN TIM

28

241

Phương pháp biến đổi wavelet

29

242


Phương pháp phân tích thành phần chính

31

25

PHÂN LOẠI BỆNH TIM DÙNG TÍN HIỆU ĐIỆN TIM

33

251

Phương pháp phân loại bệnh tim dùng tín hiệu ECG

33

252

Phương pháp đánh giá hiệu suất phân loại bệnh tim

39

CHƯƠNG 3:

41

GIẢI THUẬT WDFR CHO LỌC NHIỄU CỦA TÍN HIỆU ĐIỆN TIM VÀ
TÁCH NHỊP TIM
31


41

NGUỒN NHIỄU CỦA TÍN HIỆU ĐIỆN TIM

41

311

Nhiễu do nguồn cung cấp

42

312

Nhiễu lệch đường cơ sở

42

313

Nhiễu điện cơ

43

314

Các nhiễu khác

44


32

GIẢI THUẬT WDFR CHO LỌC NHIỄU TÍN HIỆU ĐIỆN TIM

44

321

Giới thiệu các hàm wavelet sử dụng cho lọc nhiễu điện tim

44

322

Giải thuật WDFR được đề xuất để loại bỏ nhiễu

46

33

PHƯƠNG PHÁP ĐÁNH GIÁ BỘ LỌC

51

331

Tỉ số tín hiệu trên nhiễu

51


332

Sai số tồn phương trung bình

51

34

KẾT QUẢ LỌC NHIỄU TÍN HIỆU ECG

35

XÁC ĐỊNH VỊ TRÍ ĐỈNH R CỦA PHỨC HỢP QRS VÀ TÁCH TỪNG NHỊP

TIM TỪ TÍN HIỆU ĐIỆN TIM
351

52

63

Khái quát thuật toán Pan-Tompkin để xác định vị trí đỉnh R
Trang – xii –

63


MỤC LỤC
352


Kết quả phát hiện đỉnh R trên tín hiệu ECG

66

353

Tách từng nhịp tim từ tín hiệu điện tim

68

CHƯƠNG 4:

71

TRÍCH ĐẶC TRƯNG TÍN HIỆU ĐIỆN TIM DÙNG GIẢI THUẬT wkPCA
CHO PHÂN LOẠI BỆNH

71

41

GIỚI THIỆU PHƯƠNG PHÁP KERNEL

42

THUẬT TOÁN wkPCA ĐỂ TRÍCH ĐẶC TRƯNG TÍN HIỆU ĐIỆN TIM 74

43


PHÂN LOẠI BỆNH TIM DÙNG MẠNG NƠ-RON TRUYỀN THẲNG

NHIỀU LỚP
44

71

81

ĐÁNH GIÁ HIỆU SUẤT BỘ PHÂN LOẠI

84

441

Đánh giá hiệu suất phân loại dùng ma trận nhầm lẫn

84

442

Đánh giá hiệu suất phân loại dùng đường cong ROC

85

45

KẾT QUẢ TRÍCH ĐẶC TRƯNG CÁC LOẠI BỆNH TIM DÙNG THUẬT

TỐN wkPCA


86

451

Kết quả phân rã dùng thuật tốn WD

86

452

Kết quả trích đặc trưng dùng thuật tốn wKPCA

88

46

KẾT QUẢ PHÂN LOẠI BỆNH TIM DỰA VÀO PHƯƠNG PHÁP TRÍCH

ĐẶC TRƯNG wkPCA VÀ MẠNG MLP

90

461

Lưu đồ giải thuật của hệ thống nhận dạng

90

462


Mơ hình mạng MLP được đề xuất để phân loại bệnh

91

463

Kết quả phân loại bệnh tim dùng mạng nơ-ron truyền thẳng nhiều lớp

94

CHƯƠNG 5:

102

TÍNH TỐN KÍCH THƯỚC KERNEL CỦA CÁC LỚP TÍCH CHẬP TRONG
MẠNG HỌC SÂU CHO PHÂN LOẠI BỆNH TIM

Trang – xiii –

102


MỤC LỤC
51

TRÍCH ĐẶC TRƯNG DỰA VÀO CÁC LỚP TÍCH CHẬP TRONG MẠNG

HỌC SÂU
52


102

CẤU TRÚC MẠNG HỌC SÂU CHO PHÂN LOẠI BỆNH TIM

108

521

Hệ thống dùng mạng học sâu cho phân loại bệnh tim

108

522

Cấu trúc mạng học sâu cho phân loại bệnh tim

109

523

Tính kích thước kernel trong các lớp tích chập

110

53

KẾT QUẢ PHÂN LOẠI BỆNH DỰA VÀO MẠNG HỌC SÂU

114


531

Tác động của chiều dài một nhịp tim đến hiệu suất phân loại

118

532

Ảnh hưởng của hàm wavelet đến hiệu suất phân loại

120

533

Ảnh hưởng của số lớp mạng tích tập đến độ chính xác của bộ phân loại 121

CHƯƠNG 6:

127

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

127

61

KẾT LUẬN

127


62

HƯỚNG PHÁT TRIỂN

129

CÁC CƠNG TRÌNH ĐÃ CƠNG BỐ

130

CÁC CƠNG TRÌNH NGHIÊN CỨU KHÁC

131

TÀI LIỆU THAM KHẢO

132

Trang – xiv –


DANH SÁCH CÁC TỪ VIẾT TẮT

DANH SÁCH CÁC TỪ VIẾT TẮT
Từ viết tắt

Tiếng anh

Tiếng việt


BPM

Beats per minute

Nhịp tim trên phút

BNN

Backpropagation
Network

BWN

Baseline Wander Noise

Nhiễu do lệch đường cơ sở

CNN

Convolutional Neural Network

Mạng nơ-ron tích chập

DNN

Deep Neural Network

Mạng nơ-ron học sâu


DWT

Discrete Wavelet Transform

Biến đổi wavelet rời rạc

ECG

ElectroCardioGram

Điện tâm đồ

GA

Genetic Algorithm

Thuật toán di truyền

MLP

Multilayer perceptron

Perceptron nhiều lớp

MSE

Mean Square Error

Sai số tồn phương trung bình


PLI

Power Line Interference

Nhiễu do nguồn cung cấp

PCA

Principal Component Analysis

Phân tích thành phần chính

RF

Random Forest

Rừng ngẫu nhiên

ROC

Receiver
Operating
Characteristic

Đặc tuyến hoạt động của bộ nhận

STFT

Short-time Fourier transform


Biến đổi Fourier trong thời gian ngắn

SVM

Support Vector Machine

Máy véc tơ hỗ trợ

WD

Wavelet Decomposition

Phân rã dùng wavelet

WDFR

Wavelet Decomposition Filter - Reconstruction

Phân rã dùng wavelet – Lọc – Khôi
phục

WHO

World Health Organization

Tổ chức y tế thế giới

wkPCA

wavelet kernel Principal

Component Analysis

Phân tích thành phần chính dựa vào
kernel và wavelet

WPCs

Wavelet Packet Coefficients

Các hệ số gói wavelet

WPE

Wavelet Packet Entropy

Gói wavelet dùng entropy

WPD

Wavelet Packet Decomposition

Phân rã dạng gói wavelet

WR

Wavelet Reconstruction

Khơi phục dùng wavelet

Neural


Mạng nơ-ron lan truyền ngược

Trang – xv –


DANH SÁCH CÁC HÌNH

DANH SÁCH CÁC HÌNH
Hình 1 1 Sơ đồ xử lý cho việc phân loại bệnh tim từ tín hiệu điện tim ECG
Hình 2 1 Các thành phần cơ bản chứa đựng trong một nhịp tim

8
15

Hình 2 2 Các dạng sơ đồ mắc điện cực trong quá trình thu thập tín hiệu điện tim
dùng chuyển đạo gián tiếp

19

Hình 2 3 Giấy chia ơ dùng để ghi lại tín hiệu điện tim ECG

20

Hình 2 4 Cách xác định biên độ và số lượng nhịp tim trên một phút của tín hiệu điện
tim được in trên giấy chun dụng

20

Hình 2 5 Dạng sóng tín hiệu ECG của bệnh nhân được đánh số 117 thu thập từ tập

dữ liệu MIT-BIH

21

Hình 3 1 Ảnh hưởng của nhiễu nguồn cung cấp lên tín hiệu điện tim ECG

42

Hình 3 2 Ảnh hưởng của nhiễu lệch đường cơ sở lên tín hiệu điện tim ECG

43

Hình 3 3 Ảnh hưởng của nhiễu điện cơ lên tín hiệu điện tim ECG

44

Hình 3 4 Dạng sóng của các hàm wavelet gồm dmey, bior5 5, db4, sym1, bior1 3,
và db1 được sử dụng để khảo sát việc lọc nhiễu tín hiệu điện tim

45

Hình 3 5 Sơ đồ biểu diễn thuật toán phân rã dùng wavelet cho việc lọc nhiễu trên tín
hiệu ECG

47

Hình 3 6 Ngưỡng cứng và ngưỡng mềm được sử dụng để loại bỏ nhiễu của tín hiệu
điện tim

50


Hình 3 7 Lưu đồ giải thuật của giải thuật WDFR cho q trình lọc nhiễu

52

Hình 3 8 Tín hiệu điện tim ECG gốc và tín hiệu điện tim ECG được thêm nhiễu với
tỷ số nhiễu 5dB

53

Hình 3 9 Thành phần xấp xỉ và các thành phần chi tiết được vẽ ra sau khi áp dụng
phương pháp phân rã dùng wavelet ở mức 8 với hàm wavelet “dmey”

Trang – xvi –

55


DANH SÁCH CÁC HÌNH
Hình 3 10 Dạng sóng của các thành phần chi tiết và thành phần xấp xỉ sau khi đã áp
dụng lọc nhiễu theo ngưỡng cứng và ngưỡng mềm

56

Hình 3 11 Dạng sóng của các thành phần chi tiết và thành phần xấp xỉ sau khi đã áp
dụng lọc nhiễu theo ngưỡng cứng và ngưỡng mềm

56

Hình 3 12 Tín hiệu ECG gốc và tín hiệu ECG sau khi đã được lọc nhiễu với các hàm

wavelet là dmey, bior5 5, db4, sym1, bior1 3, và db1

57

Hình 3 13 Mật độ phổ cơng suất của tín hiệu trước và sau khi lọc nhiễu đối với tín
hiệu ECG từ tập dữ liệu MIT-BIH DB

58

Hình 3 14 Dạng sóng của tín hiệu ECG gốc và tín hiệu ECG sau khi đã lọc nhiễu
với các hàm wavelet được đề xuất và áp dụng trên dữ liệu ECG được thu thập tại
phịng thí nghiệm Kỹ Thuật Y Sinh

58

Hình 3 15 Mật độ phổ cơng suất của tín hiệu ECG gốc và tín hiệu ECG sau khi đã
lọc nhiễu với các hàm wavelet được đề xuất và áp dụng trên dữ liệu ECG được thu
thập tại phịng thí nghiệm Kỹ Thuật Y Sinh

60

Hình 3 16 Sơ đồ khối của thuật toán Pan-Tompkins được sử dụng để xác định phức
hợp QRS

63

Hình 3 17 Vị trí đỉnh R trong phức hợp QRS được xác định cho tín hiệu ECG từ tập
dữ iệu MIT-BIH DB

66


Hình 3 18 Vị trí đỉnh R của phức hợp QRS được xác định cho tín hiệu ECG tự thu
thập từ phịng thí nghiệm Kỹ Thuật Y Sinh

67

Hình 3 19 Tách từng nhịp tim từ tín hiệu điện tim ECG thu thập từ tập dữ liệu MITBIH DB và đã được lọc nhiễu và xác định vị trí đỉnh R

68

Hình 3 20 Kết quả tách từng nhịp tim của tín hiệu điện tim ECG thu được tại phịng
thí nghiệm

69

Hình 4 1 Mơ tả phương pháp kernel được thực hiện để chiếu dữ liệu từ miền không
gian gốc ( X ) sang miền không gian mới ( Z )

Trang – xvii –

72


DANH SÁCH CÁC HÌNH
Hình 4 2 Sơ đồ khối của phương pháp wkPCA được đề xuất để trích đặc trưng tín
hiệu ECG

75

Hình 4 3 Đồ thị tổng tích lũy của các thành phần đặc trưng trong thuật tốn phân

tích thành phần chính

77

Hình 4 4 Đơn vị xử lý trong mạng nơ-ron nhân tạo

82

Hình 4 5 Mơ tả đường cong ROC phục vụ cho việc đánh giá hiệu suất của hệ thống
phân loại bệnh tim

86

Hình 4 6 Dạng sóng nhịp tim của 5 loại bệnh tim (N, S, V, F, và Q) và dạng sóng
của các hệ số wavelet tương ứng

88

Hình 4 7 Phân bố các đặc trưng của các loại bệnh tim trên tín hiệu nhịp tim trong
miền khơng gian gốc

89

Hình 4 8 Phân bố các đặc trưng của tín hiệu nhịp tim trong miền không gian mới sau
khi áp dụng thuật tốn wkPCA

90

Hình 4 9 Lưu đồ giải thuật cho quá trình phân loại bệnh tim sử dụng giải thuật
wkPCA và mạng MLP


91

Hình 4 10 Sơ đồ khối được sử dụng để phân loại bệnh kết hợp thuật toán wkPCA và
mạng nơ-ron truyền thẳng nhiều lớp

91

Hình 4 11 Cấu trúc mạng nơ-ron truyền thẳng nhiều lớp được sử dụng để phân loại
bệnh tim

92

Hình 4 12 Trình bày kết quả ma trận nhầm lẫn trong trường hợp phân loại bệnh tim
sử dụng mạng nơ-ron truyền thẳng nhiều lớp

97

Hình 4 13 Trình bày kết quả ma trận nhầm lẫn trong trường hợp phân loại bệnh tim
sử dụng mạng nơ-ron truyền thẳng nhiều lớp

98

Hình 5 1 Cấu trúc của một nơ-ron với n ngõ vào, một ngõ ra và hàm kích hoạt tương
ứng

103

Hình 5 2 Mơ tả về cách tính tích chập cho tín hiệu 1 chiều được sử dụng trong mạng
nơ-ron tích chập


104
Trang – xviii –


DANH SÁCH CÁC HÌNH
Hình 5 3 Mơ tả về cách tính tích chập cho tín hiệu 1 chiều với trường hợp có thêm
zero padding vào tín hiệu gốc

105

Hình 5 4 Mơ tả sự kết nối và cách tính tốn của các lớp tích chập với các lớp truyền
thẳng trong mạng học sâu

106

Hình 5 5 Sơ đồ khối hệ thống ứng dụng mạng học sâu được đề xuất để phân loại
bệnh tim

108

Hình 5 6 Cấu trúc mạng học sâu được đề xuất sử dụng để trích đặc trưng và phân
loại bệnh tim

110

Hình 5 7 Lưu đồ giải thuật của hệ thống nhận dạng bệnh tim sử dụng cấu trúc mạng
học sâu

114


Hình 5 8 Kết quả độ chính xác của hệ thống phân loại bệnh tim trong quá trình huấn
luyện và giá trị của hàm mất mát tương ứng với các epoch

116

Hình 5 9 Ma trận nhầm lẫn trong trường hợp phân loại bệnh dùng mạng học sâu
117
Hình 5 10 So sánh hiệu suất phân loại với trường hợp số lớp tích chập thay đổi từ 1
đến 9 lớp

122

Trang – xix –


DANH SÁCH CÁC BẢNG

DANH SÁCH CÁC BẢNG
Bảng 2 1 Mô tả các ý nghĩa và thông tin thời gian của từng thành phần đặc trưng
trong một nhịp tim

18

Bảng 2 2 Bảng mô tả ý nghĩa của các kiểu định dạng dữ liệu tín hiệu điện tim theo
định dạng MIT-BIH

22

Bảng 2 3 Mô tả chi tiết các thông tin trên tập dữ liệu MIT-BIH DB


23

Bảng 2 4 Bảng tham chiếu của các loại bệnh tim theo chuẩn MIT-BIH và theo chuẩn
ANSI-AAMI EC57-2012

25

Bảng 2 5 Thống kê các hệ thống phân loại bệnh tim cùng với hiệu suất thu được
trong các nghiên cứu trước đây

34

Bảng 3 1 Các thành phần tần số của tín hiệu ECG sau khi áp dụng thuật tốn phân
rã WD

54

Bảng 3 2 Bảng giá trị các tham số đánh giá hiệu suất bộ lọc sau khi được áp dụng
trên tập dữ liệu nhịp tim MIT-BIH

61

Bảng 3 3 Bảng giá trị các tham số đánh giá hiệu suất bộ lọc sau khi được áp dụng
trên tập dữ liệu nhịp tim được tác giả tự thu thập

62

Bảng 4 1 Ma trận nhầm lẫn cho trường hợp nhiều loại bệnh


84

Bảng 4 2 Mô tả số lượng nhịp tim của các loại bệnh tim được sử dụng để kiểm tra
hiệu suất của hệ thống phân loại được đề xuất

93

Bảng 4 3 Phân bố dữ liệu huấn luyện và dữ liệu kiểm tra để đánh giá hiệu suất của
bộ phân loại

94

Bảng 4 4 Các tham số được sử dụng trong cấu trúc mạng nơ-ron cho việc phân loại
bệnh tim

95

Bảng 4 5 Giá trị của tham số kernel cho hàm kernel Gaussian được áp dụng để tính
tốn giá trị tốt nhất của bộ phân loại

96

Trang – xx –


DANH SÁCH CÁC BẢNG
Bảng 4 6 Hiệu suất của bộ phân loại cho 5 loại bệnh tim N, S, V, F và Q trong trường
hợp số lượng dữ liệu huấn luyện và kiểm tra khác nhau

97


Bảng 4 7 So sánh độ chính xác của phương pháp wkPCA được đề xuất với các
phương pháp nghiên cứu khác

99

Bảng 5 1 Số lượng nhịp tim cho từng loại bệnh và tổng số lượng nhịp tim được sử
dụng cho thí nghiệm với mạng nơ-ron học sâu

109

Bảng 5 2 Phân bố dữ liệu huấn luyện và dữ liệu kiểm tra để đánh giá hiệu suất của
bộ phân loại

109

Bảng 5 3 Số lượng nhịp tim cho từng loại bệnh và tổng số lượng nhịp tim được sử
dụng cho thí nghiệm với mạng nơ-ron học sâu

111

Bảng 5 4 Các tham số huấn luyện được cài đặt cho mạng học sâu

115

Bảng 5 5 Kết quả hiệu suất phân loại trong trường hợp dùng mạng học sâu

117

Bảng 5 6 Bảng thống kê độ chính xác của bộ phân loại bệnh tim của các cơng trình

nghiên cứu trước đây với dài của một nhịp tim khác nhau

118

Bảng 5 7 Kết quả so sánh hiệu suất phân loại bệnh tim trong trường hợp chiều dài
một nhịp tim khác nhau

120

Bảng 5 8 Kết quả so sánh hiệu suất phân loại bệnh tim trong trường hợp sử dụng các
hàm wavelet khác nhau

121

Bảng 5 9 So sánh độ chính xác phân loại bệnh tim sử dụng mạng học sâu đề xuất
với các cơng trình nghiên cứu khác

123

Trang – xxi –


Chương 1: Tổng quan

CHƯƠNG 1:
TỔNG QUAN

1 1 TÍNH CẤP THIẾT CỦA ĐỀ TÀI LUẬN ÁN
Tim là một bộ phân có liên quan đến sức khỏe của con người Tỷ lệ mắc bệnh
tim mạch đã tăng lên rất cao trong những năm gần đây ở trên thế giới nói chung và

Việt Nam nói riêng [1, 2] Hơn nữa, bệnh tim mạch là một trong những nguyên nhân
gây tử vong hàng đầu tại Việt Nam và trên thế giới Đặc biệt, số lượng bệnh nhân
sống tại các thành thị của Việt Nam mắc bệnh tim mạch đang ngày càng gia tăng
Bên cạnh các bệnh tim bẩm sinh, những bệnh tim do tác nhân bên ngoài như mỡ trong
máu, cholestoral tăng cao và nhiều bệnh tim khác đang dần trở thành mãn tính và đe
dọa tính mạng bệnh nhân Theo kết quả thống kê vào năm 2015 thì 20% dân số Việt
Nam bị bệnh tim mạch, tăng huyết áp, còn trên thế giới bệnh tim mạch làm cho 17,9
triệu người chết mỗi năm và dự kiến đến năm 2030 thì con số này lên đến 23,6 triệu
người [3], trong khi có 1/3 số người chết ở Việt Nam là do bị bệnh tim mạch được
thống kê vào năm 2018
Tín hiệu điện tim ECG ghi lại q trình thay đổi dịng điện của tim khi tim
hoạt động và dựa vào đó có thể chẩn đốn các loại bệnh tim mạch Tín hiệu điện tim
ECG có biên độ rất nhỏ và thời gian thay đổi cũng nhỏ Hơn nữa, một số đặc trưng
của các loại bệnh trong tín hiệu điện tim rất khó phát hiện bằng mắt thường Vì vậy,
một cơng cụ máy tính có cài đặt phần mềm xử tín hiệu điện tim và chẩn đốn bệnh
tim thì có thể giúp bác sĩ chẩn đoán dễ dàng hơn Các loại bệnh lý liên quan đến tim
mạch cũng rất đa dạng và phức tạp, gây rất nhiều khó khăn cho việc chẩn đốn, phân
loại và điều trị [4, 5] Vấn đề xây dựng một công cụ để phân loại chính xác các loại
bệnh tim dựa vào tín hiệu điện tim ECG là một yêu cầu rất cần thiết nhằm giúp các

Trang – 1 –


Chương 1: Tổng quan
bác sĩ có thể chẩn đốn sớm và tìm ra các bệnh tim khác nhau Với kết quả phân loại
bệnh bằng máy tính với độ chính xác cao có thể giúp cho bác sĩ dễ dàng hơn trong
việc đưa ra những chẩn đốn chính xác về tình trạng bệnh nhằm điều trị bệnh tốt hơn
Cơ sở dữ liệu của tín hiệu điện tim ECG hiện tại đã được công bố trên các
website và được nhiều nhà nghiên cứu sử dụng Tuy nhiên, cùng một loại bệnh, nhưng
với từng bệnh nhân khác nhau thì dữ liệu điện tim cũng rất khác nhau, điều đó làm

cho việc phân loại bệnh tim từ tín hiệu điện tim trở nên khó khăn hơn Hơn nữa, dữ
liệu điện tim của từng loại bệnh tim có sự chênh lệch, điều đó làm ảnh hưởng đến kết
quả nhận dạng các loại bệnh tim dựa vào tín hiệu điện tim Trong điều kiện cơ sở dữ
liệu như vậy, một thuật toán để tiền xử lý và chuẩn hóa dữ liệu nhằm nâng cao hiệu
suất phân loại bệnh tim là cần thiết
Tín hiệu ECG sau khi thu được, ngồi việc chứa đựng thơng tin cần thiết thì
cũng mang rất nhiều thành phần nhiễu, mà nguyên nhân có thể là do tâm lý người
bệnh lúc đo, do nguồn điện cung cấp, do kết nối đầu dị tín hiệu, do đường cơ sở tín
hiệu bị trơi, do thiết bị đo hoặc những yếu tố khác Vì vậy, tiền xử lý tín hiệu điện tim
để loại bỏ những thành phần nhiễu không mong muốn là công việc rất quan trọng
nhưng cũng rất khó khăn trong phân tích tín hiệu
Mặc dù có rất nhiều kỹ thuật đã được các nhà khoa học sử dụng cho việc xử
lý tín hiệu điện tim trước đây Tuy nhiên, vẫn còn rất nhiều thử thách trong xử lý tín
hiệu điện tim và phân loại bệnh tim dựa vào tín hiệu điện tim mà nguyên nhân gồm
nhiều yếu tố được mô tả như sau [6]:
1 - Tính biến đổi của đặc trưng tín hiệu ECG, nhịp tim của từng cá nhân khác
nhau thì mang những đặc trưng khác nhau mặc dù họ bị chung một loại bệnh, chưa
kể đến vấn đề nhịp tim của mỗi cá nhân cũng biến đổi theo từng thời điểm sinh lý và
tinh thần khác nhau
2 - Không tồn tại 1 quy luật phân loại tối ưu nào cho việc phân loại bệnh tim
dùng tín hiệu ECG, mặc dù đã có nhiều phương pháp được sử dụng nhưng hiện tại
chưa có một thuật toán nào là tối ưu cho việc phân loại bệnh

Trang – 2 –


Chương 1: Tổng quan
3 - Tính phức tạp trong tín hiệu ECG, một tín hiệu ECG thơng thường chỉ bao
gồm các đỉnh P, Q, R, S, T, và U, tuy nhiên trên thực tế thì một tín hiệu ECG thơng
thường có thể bao gồm hàng nghìn các đỉnh và các đỉnh này có thể có dạng khác nhau

là cho việc trích xuất đặc trưng sẽ khó khăn
4 - Xây dựng một bộ phân loại tín hiệu ECG theo thời gian thực là vấn đề rất
khó khăn bởi vì trên tín hiệu ECG tồn tại rất nhiều tham số
❖ CÁC KẾT QUẢ TRONG VÀ NGỒI NƯỚC ĐÃ ĐƯỢC CƠNG BỐ:
Với những hệ lụy rất lớn của bệnh tim mạch, đã có nhiều cơng trình nghiên
cứu trong và ngồi nước về phân tích tín hiệu điện tim cũng như xây dựng phương
pháp phân loại bệnh tim đã được công bố cả trong và ngồi nước Dưới đây trình bày
tóm lượt một số kết quả nghiên cứu đã được thực hiện trong ngoài nước
Trong luận án tiến sĩ với đề tài “Phân tích tín hiệu loạn nhịp tim” được
thực hiện năm 2014 bởi tác giả Chử Đức Hoàng [7], tác giả đã phân tích các đặc điểm
của tín hiệu loạn nhịp tim dùng tín hiệu điện tim ECG Cụ thể, tác giả đề xuất cải tiến
phương pháp xác định phức hợp QRS do Pan Hamilton và Tompkins đưa ra để xác
định phức hợp QRS Hơn nữa, tác giả cũng đề xuất xây dựng giải thuật phân tích khử
khuynh hướng động tín hiệu động đa trị Multi Detrended Fluctuation Analysis để
phát hiện các hiện tượng bất thường của bệnh nhân bị loạn nhịp tim Trong luận án
này, tác giả đã xây dựng véc tơ chuẩn hóa RR từ dữ liệu điện tim Véc tơ này được
kết hợp với giải thuật phân tích khử khuynh hướng động để xây dựng mơ hình thu
nhận, xử lý, phân tích và trợ giúp chẩn đốn sớm các triệu chứng về loạn nhịp tim
Kết quả độ chính xác của bộ phân loại trong nghiên cứu này đạt được 89%
Luận án tiến sĩ của tác giả Nguyễn Đức Thảo với tựa đề là “Nâng cao chất
lượng nhận dạng tín hiệu điện tim dựa trên giải pháp loại bỏ ảnh hưởng từ nhịp
thở của người bệnh” thực hiện năm 2016 tập trung vào nhận dạng tín hiệu điện tim
[8] Cụ thể, tác giả sử dụng các bộ lọc để loại bỏ thành phần nhịp thở trong tín hiệu
điện tim, tín hiệu sau khi đã lọc sẽ được đưa vào mạng nơ-ron logic mờ TSK (Takaga
– Sugeno – Kang) để nhận dạng các loại bệnh tim Trong luận án này, tác giả đề xuất

Trang – 3 –


Chương 1: Tổng quan

phương pháp bổ sung 2 thông tin từ nhịp thở vào tín hiệu điện tim để cải thiện độ
chính xác của q trình nhận dạng tín hiệu ECG Hơn nữa, tác giả cũng sử dụng mơ
hình mạng TSK để nhận dạng tín hiệu ECG với 4 kịch bản khác nhau Kết quả nhận
dạng tốt nhất thu được là 96 6% cho trường hợp nhận dạng 3 loại bệnh khác nhau
Luận án tiến sĩ của tác giả Phạm Văn Nam với đề tài “Xây dựng mơ hình
nhận dạng kết hợp nhằm nâng cao độ chính xác phân loại tín hiệu điện tim loạn
nhịp” được bảo vệ năm 2018 đã nghiên cứu xây dựng một bộ nhận dạng kết hợp
nhằm nâng cao độ chính xác của việc phân loại tín hiệu loạn nhịp tim Cụ thể, đề tài
này sử dụng thuật toán cây quyết định được kết hợp từ các bộ phân loại dùng phương
pháp mạng nơ-ron truyền thẳng nhiều lớp MLP, phương pháp máy véc tơ hỗ trợ SVM,
và phương pháp rừng ngẫu nhiên RF [9] để phân loại các loại bệnh tim Trong đó,
ngõ ra của các bộ phân loại MLP, SVM và RF sẽ được đưa vào bộ phân loại cây
quyết định để quyết định loại bệnh tim tương ứng với tín hiệu nhịp tim Kết quả độ
chính xác nhận dạng bệnh tim thu được của hệ thống được đề xuất là 98 76%
Mặc dù các nghiên cứu trong nước về tín hiệu điện tim cũng như phân loại
bệnh tim từ tín hiệu là tương đối hạn chế, các nghiên cứu ngoài nước về lĩnh vực phân
loại bệnh tim từ tín hiệu điện tim được thực hiện phong phú hơn Trong tài liệu tham
khảo [10], tác giả R Rodríguez và các cộng sự đã đề xuất phương pháp ngưỡng thích
nghi kết hợp với phương pháp phân tích thành phần chính PCA để trích đặc trưng của
tín hiệu điện tim ECG Trong đó, các tác giả tập trung vào việc trích thành phần đặc
trưng của phức hợp QRS như là một đặc trưng của tín hiệu điện tim ECG Cụ thể,
thành phần phức hợp QRS được trích sử dụng biến đổi Hilbert và kết hợp với thuật
toán PCA dựa trên kỹ thuật ngưỡng thích nghi để trích thành phần đặc trưng của tín
hiệu ECG Kết quả thu được của nghiên cứu này là xác định được phức hợp QRS
trong tín hiệu điện tim
Hơn nữa, trong [11], Saeed Mian Qaisar và các cộng sự đã thiết kế một hệ
thống phân loại bệnh tim sử dụng kết hợp phép biến đổi wavelet và thuật toán phân
loại rừng ngẫu nhiên RF Trong đó, thuật tốn biến đổi wavelet được áp dụng để phân

Trang – 4 –



×