Ứng dụng cây quyết định để xây dựng mô hình phối hợp nâng cao chất lượng nhận dạng tín hiệu điện tim

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (582.53 KB, 8 trang )

LIÊN NGÀNH ĐIỆN - ĐIỆN TỬ - TỰ ĐỘNG HÓA

Ứng dụng cây quyết định để xây dựng mơ hình phối hợp
nâng cao chất lượng nhận dạng tín hiệu điện tim
Decision tree application to build a coordinated model to improve the
quality of ECG signal recognition
Đỗ Văn Đỉnh, Phạm Văn Kiên
Email:
Trường Đại học Sao Đỏ
Ngày nhận bài: 9/10/2019
Ngày nhận bài sửa sau phản biện: 23/12/2019
Ngày chấp nhận đăng: 31/12/2019

Tóm tắt
Nội dung chính của bài báo này là đề xuất giải pháp nâng cao chất lượng (độ chính xác) nhận dạng
tín hiệu điện tim ECG (ElectroCardioGraphy), dựa trên việc sử dụng cây quyết định nhị phân (Binary
Decision Tree) để phối hợp nhiều mơ hình nhận dạng đơn là các mạng nơron kinh điển MLP (Multi
Layer Perceptron), mạng nơron logic mờ TSK (Takaga-Sugeno-Kang), máy học vectơ hỗ trợ SVM
(Support Vectơ Machines) và rừng ngẫu nhiên RF (Random Forest). Sử dụng các hàm cơ sở Hermite
(Hermite Basis Functions) để khai triển phức bộ QRS và hai đặc tính về thời gian là khoảng cách
giữa hai đỉnh R liên tiếp (R-R), giá trị trung bình của 10 khoảng cách R-R cuối cùng. Các thuật toán
đã được triển khai thử nghiệm trên các bộ mẫu số liệu kinh điển của quốc tế cơ sở dữ liệu MIT-BIH
(Massachusetts Institute of Technology, Boston’s Beth Israel Hospital) và cơ sở dữ liệu MGH từ trang
web .
Từ khóa: Mạng nơron; MLP; TSK; SVM; hệ thống tích hợp; cây quyết định; chức năng cơ sở Hermite;
tín hiệu điện tâm đồ (ECG); IC FPAA; IC ARM.

Abstract
The paper presents a solution to improve the accuracy of arrhythmia recognition based on the integration
of multiple classifiers using the binary decision tree. The solution uses as the single classifiers the classical
MLP (Multi Layer Perceptron), neuro-fuzzy TSK network (Takaga-Sugeno-Kang), SVM (Support Vectơ

Machines) and RF (Random Forest). The Hermite basis functions were used to generate the feature
vectơs together with 2 time-based features: the last R-R period and the average of last 10 R-R periods.
The proposed solution was tested with ECG signals taken from 2 databases MIT-BIH (Massachusetts
Institute of Technology, Boston’s Beth Israel Hospital) and MGH available at .
Keywords: Neural network; MLP; TSK; SVM; Integrated System; Decision Tree; Hermite Basis
Functions; Electrocardiogram (ECG) Signals; IC FPAA; IC ARM.
CÁC CHỮ VIẾT TẮT
ARM
DT
ECG
FN
FP
FPAA

Advanced RISC Machine
Decision Tree
ElectroCardioGram
False Negative
False Positive
Field Programable Analog Arrays

Người phản biện: 1. PGS.TS. Trần Vệ Quốc
2. PGS.TS. Bạch Long Giang

IC
MIT-BIH
MGH/MF
MLP
PC
QRS

RF
SD
SVD

Intergrated Circuit
MIT-BIH Arrhythmia Database
MGH/MF Waveform Database
Multi Layer Perceptron Network
Personal Computer
QRS Complex
Random Forest
Secure Digital
Singular Value Decomposition

SVM

Support Vectơ Machines

Tạp chí Nghiên cứu khoa học, Trường Đại học Sao Đỏ, ISSN 1859-4190 Số 4 (67).2019 27

NGHIÊN CỨU KHOA HỌC
1. ĐẶT VẤN ĐẾ
Tín hiệu điện tim ECG có độ biến đổi rất mạnh cả
về hình dáng, biên độ ở các trường hợp bệnh lý.
Tín hiệu cũng dễ bị ảnh hưởng bởi nhiễu từ bên
ngồi, tình trạng sức khỏe hay tâm lý của bệnh
nhân. Nên nhận dạng ECG là một trong những bài
tốn khó. Thực tế hiện nay có nhu cầu về thiết bị
đo điện tim thơng minh có chức năng nhận dạng

tự động các trường hợp bệnh lý, yêu cầu giải pháp
nhận dạng cần có độ chính xác cao và phân biệt
được nhiều loại bệnh để có thể áp dụng cho nhiều
đối tượng bệnh nhân,…
Xuất phát từ những nhu cầu thực tế trên, mục tiêu
đặt ra của bài báo này là đề xuất một giải pháp để
nâng cao chất lượng nhận dạng tín hiệu điện tim
(giảm số mẫu nhận dạng sai).
Hiện nay, đã có rất nhiều các giải pháp khác nhau
để nâng cao chất lượng nhận dạng tín hiệu điện
tim ECG được các tác giả trong nước và quốc tế
nghiên cứu và công bố, như từ khâu thu thập, tiền
xử lý, trích chọn đặc tính hay khối nhận dạng (phi
tuyến). Đa số các giải pháp đều ở dạng “mơ hình
đơn”, một số ít các giải pháp ở dạng “mơ hình phối
hợp”. Như trong nghiên cứu [1], tác giả kết hợp
hai mơ hình đơn là SVM và PSO (Particles Swarm
Optimization) kết quả thử nghiệm trên bộ cơ sở dữ
liệu L MIT-BIH có độ chính xác tăng khoảng 4% so
với khi sử dụng SVM đơn lẻ, hay như trong cơng
trình [4] tác giả kết hợp mạng logic mờ Fuzzy KNN
(Fuzzy K Nearest Neighbors) và mạng MLP cho
kết quả có độ chính xác được cải thiện từ 97,3%
lên 98%.
Xu thế đang phát triển hiện nay là sử dụng các
mô hình phối hợp để nhận dạng, nhất là các bài
tốn địi hỏi độ nhận dạng có chính xác cao như
nhận dạng tín hiệu điện tim ECG, mơ hình sử dụng
nhiều mơ hình nhận dạng đơn để đưa ra các kết
luận (có thể khác biệt) sau đó thêm một khâu xử

lý nữa để tổng hợp lại các kết quả từ các mơ hình
nhận dạng đơn để đưa ra kết luận cuối cùng, một
số ưu điểm của giải pháp “mơ hình phối hợp”:
- Mỗi “mơ hình đơn” được coi như một chun gia
độc lập, việc phối hợp nhiều chuyên gia sẽ cho kết
quả đáng tin cậy hơn.
- Sử dụng các đánh giá từ nhiều góc độ, từ nhiều
phương pháp khác nhau nên thơng tin có thể
phong phú hơn dẫn tới chất lượng quyết định sẽ
cao hơn.
Tuy nhiên, mơ hình này cũng có một số nhược
điểm như:
- Hệ thống sẽ cồng kềnh, phức tạp hơn.

- Cần xây dựng phương pháp tổng hợp phù hợp,
nếu phối hợp khơng tốt thì sẽ làm kết quả kém đi.

ECG

Mơ hình
nhận dạng đơn 1

y1

Mơ hình
nhận dạng đơn 2

y2

Hệ thống z

tổng hợp
kết quả

yM
Mơ hình
nhận dạng đơn M

Hình 1. Sơ đồ chung của mơ hình phối hợp
Sơ đồ khối tổng quát của giải pháp phối hợp được
trình bày như trên hình 1, trong đó các hệ thống
nhận dạng đơn sẽ xử lý cùng một tín hiệu đầu vào
từ đối tượng (nhưng theo các cách khác nhau) và
đầu ra của các hệ thống nhận dạng đơn sẽ tạo
thành đầu vào của khối tổng hợp, kết quả của khối
tổng hợp cũng sẽ là kết quả nhận dạng cuối cùng.
Từ mục đích đặt ra ở trên, qua tìm hiểu, phân tích
những ưu điểm của các giải pháp nâng cao chất
lượng nhận dạng tín hiệu điện tim ECG, bài báo
lựa chọn theo hướng nghiên cứu thứ hai, tức là sử
dụng mơ hình phối hợp song song nhiều mơ hình
nhận dạng đơn.
Một số phương pháp tổng hợp kết quả đã được
các tác giả khác áp dụng như [5, 6]:
- Biểu quyết theo đa số (Majority voting).
- Biểu quyết có trọng số (Weighted voting).
- Tổng hợp theo xác suất điều kiện Bayes,…
Bài báo này đã đề xuất sử dụng Cây quyết định
nhị phân (Binary Decision Tree) làm khối tổng
hợp kết quả và các mơ hình nhận dạng đơn được
sử dụng là: mạng nơron kinh điển MLP, mạng

nơron logic mờ TSK, máy vectơ hỗ trợ SVM và
rừng ngẫu nhiên RF. Các mơ hình đơn này được
lựa chọn do đây là các kết quả đã được công bố
trên các tạp chí và hội thảo quốc tế nên đảm bảo
được sự khách quan và tính chính xác [7], đồng
thời cũng là những kết quả đươc thực hiện trên
cùng một bộ số liệu đầu vào nên việc so sánh sẽ
thuận tiện và có tính thuyết phục, trong đó phương
pháp rừng ngẫu nhiên RF được nhóm tác giả xây
dựng thêm ở trong bài báo này.
Theo hình 2, giả thiết mỗi khối nhận dạng đơn Ci
sẽ tạo ra đầu ra kết quả tương ứng yi (i = 1,2,...,M)
nó là một giá trị chứa mã nhận dạng. Khi đó đầu
vào của cây quyết định sẽ là vectơ tổng hợp
x = [yi, yi,...yM]. Đầu ra của Cây quyết định z sẽ là
kết luận cuối cùng về nhịp tim đang xử lý.

28 Tạp chí Nghiên cứu khoa học,Trường Đại học Sao Đỏ, ISSN 1859-4190 Số 4 (67).2019

LIÊN NGÀNH ĐIỆN - ĐIỆN TỬ - TỰ ĐỘNG HÓA

Thu thập
và tiền
xử lý

Trích chọn
đặc tính

3. CÁC MƠ HÌNH NHẬN DẠNG ĐƠN

y1

C1

Tổng hợp
kết quả = z
Cây quyết
định

y2

C2

.
..

ECG

yM

CM

Hình 2. Mơ hình kết hợp sử dụng cây quyết định
2. CÂY QUYẾT ĐỊNH
Cây quyết định DT (Decision Tree) là một mơ hình
phân loại dữ liệu kinh điển đã được sử dụng rất
rộng rãi trong nhiều ứng dụng thực tế. Cây thường
được mô tả ở dạng cấu trúc phân tầng như trên
hình 3. Cây gồm một tập hợp các nút và nhánh với

các điều kiện sau:

3.1. Mạng nơron MLP
Mạng MLP là mạng nơron phổ biến, nó là một
mạng truyền thẳng với các phần tử cơ bản gọi là
nơron. Trong bài báo sử dụng mạng MLP với một
lớp ẩn có cấu trúc như hình 5. Nhiệm vụ đặt ra
là phải xác định cấu trúc cố định cho mạng MLP:
số lớp ẩn, hàm truyền đạt của mỗi lớp, số lượng
nơron trên mỗi lớp, trọng số ghép nối giữa nơron
trong mơ hình MLP có thể được điều chỉnh lại cho
phù hợp trong quá trình học để xuất các tín hiệu
đầu ra mong muốn. Thuật tốn của q trình học
được sử dụng cho mơ hình MLP trong bài báo này
đã được đề xuất bởi Levenberg và Marquardt [9].

- Tồn tại một nút được gọi là nút gốc.
- Nút chứa điều kiện phân nhánh.
- Ở nút lá (khơng có nhánh con) thì kết quả nhận
dạng sẽ là kết quả chung của lá.
Cây quyết định có các nút điều kiện đơn giản
nhưng do phối hợp nhiều nút nên ta có được hàm
phân chia có độ phi tuyến cao phù hợp với các bài
toán phân loại phức tạp, nhưng việc xây dựng các
điều kiện nút vẫn tương đối đơn giản (bài báo sử
dụng thuật tốn ID3 để xây dựng cây).
ĐốiĐối
tượng
dạng
tượng nhận

nhận dạng

Input
layer

X=?

Hình 5. Mạng MLP với một lớp ẩn

X=B

AA

3.2. Mạng nơron mờ TSK
CC

BB

Hình 3. Ví dụ về cấu trúc của cây quyết định
Trong bài báo sử dụng cây nhị phân (bậc 2) để
đơn giản hóa việc mơ tả các thuật tốn, điều này
khơng làm giảm tính tổng qt của cây do một cây
bậc bất kỳ đều có thể chuyển về một cây nhị phân
tương đương như trong hình 4.
Đối tượng nhận
dạng dạng
Đối tượng
nhận

Đối tượng

Đối tượng nhận
nhận dạng dạng

X=?

X=A
X=A

X=C

X≠ A

X=B

AA

BB

Output
layer

X=C

X=A

X=A

Hidden
layer

CC

X=B

AA
X=B

BB

X≠ B

CC

Hình 4. Phương pháp chuyển một nút bậc cao (hình
trái) thành một nút nhị phân (bậc 2) (hình phải)

Mơ hình nhận dạng đơn thứ hai được sử dụng
trong bài báo là mạng Takagi-Sugeno-Kang (TSK).
Mạng TSK đã được trình bày khá chi tiết trong [9]
nên trong bài báo này sẽ khơng trình bày lại nữa,
bài báo sử dụng mơ hình TSK có cấu trúc như
trong nghiên cứu [7, 8].
3.3. Mơ hình phân loại SVM
Mơ hình nhận dạng đơn thứ ba dùng trong bài
báo này là SVM (Support Vectơ Machine) hay còn
gọi là máy vectơ hỗ trợ. Mặc dù mơ hình SVM
chỉ phân chia dữ liệu thành hai lớp, tuy nhiên việc
phân loại đối với nhiều lớp hơn cũng khơng hề
phức tạp, có thể áp dụng phương pháp một chọi
một, hay một chọi tất cả như trong nghiên cứu [5].

Phương pháp hiệu quả hơn là phương pháp một
chọi một, ở phương pháp này nhiều mạng SVM
được xây dựng để phân loại trong tất cả các tổ
hợp của hai lớp dữ liệu. Với N lớp, chúng ta phải
xây dựng mạng SVM đơn lẻ.

Tạp chí Nghiên cứu khoa học, Trường Đại học Sao Đỏ, ISSN 1859-4190 Số 4 (67).2019 29

NGHIÊN CỨU KHOA HỌC
3.4. Rừng ngẫu nhiên RF
Mơ hình nhận dạng đơn cuối cùng dùng trong bài
báo này là mô hình rừng ngẫu nhiên RF (Random
Forest) được phát triển từ L. Breiman (2001) [3],
cấu trúc cơ bản của mơ hình RF là tập hợp số
lượng lớn N các cây quyết định không cắt tỉa, cấu
trúc của mỗi cây quyết định được huấn luyện ngẫu
nhiên từ một tập dữ liệu mẫu biết trước. Các bước
tạo cấu trúc của RF:

càng lớn, hay nói cách khác hàm sẽ chứa nhiều
thành phần bậc càng cao. Đồng thời dáng điệu
của các hàm cũng khá tương đồng với hình dạng
các thành phần cơ bản trong tín hiệu ECG. Đây
chính là cơ sở của việc sử dụng hàm Hermite để
phân tích tín hiệu điện tim ECG.

- Đầu vào là tập dữ liệu dùng để huấn luyện.
- Mỗi mơ hình RF là tập hợp N cây quyết định với
N được lựa chọn trước.

- Cấu trúc của mỗi cây quyết định được huấn
luyện bởi một tập mẫu lấy ngẫu nhiên trong bộ
mẫu chung.
- Các cây quyết định đơn không cần sử dụng các
thuật toán cắt tỉa để giảm nút lá hoặc để giảm số
tầng của cây.
- Khâu tổng hợp các kết quả nhận dạng từ N cây
quyết định phổ biến sử dụng phương pháp bỏ phiếu
theo đa số để đưa ra kết quả cuối cùng cho RF.
Như vậy đối với một mẫu dữ liệu mới đưa vào để
kiểm tra, trước tiên nó được đưa qua N cây quyết
định để phân loại, mỗi cây sẽ có 1 kết quả riêng
(có thể giống hoặc khác nhau) và N kết quả này
sẽ đưa vào khâu tổng hợp để xử lý và đưa ra kết
quả cuối cùng.
4. TRÍCH CHỌN ĐẶC TÍNH VÀ CƠ SỞ DỮ LIỆU
TÍN HIỆU ĐIỆN TIM ECG

Hình 6. Đồ thị của hàm Hermite bậc n:
a) n=0; b) n=1; c) n=3; d) n=10
Để biểu diễn tín hiệu điện tim s(t) theo N hàm
Hermite đầu tiên như trong công thức (3), ta sử
dụng phân tích theo các giá trị kỳ dị SVD (Singular
Value Decomposition) để tìm nghiệm tối ưu của hệ
phương trình bậc nhất có số phương trình nhiều
hơn số ẩn, chi tiết có thể tìm hiểu trong [7, 8].
N−1

s(t) ≈ ∑ ci ⋅ψi (t)

(3)

i=0

4.1. Trích chọn đặc tính tín hiệu điện tim
Bài báo sử dụng các hàm cơ sở Hermite (Hermite
Basis Functions) để khai triển các phức bộ QRS
nhằm lấy các hệ số khai triển làm vectơ đặc trưng
của tín hiệu. Ngồi ra ta cịn sử dụng thêm hai
đặc tính về thời gian: khoảng cách giữa hai đỉnh
R liên tiếp, giá trị trung bình của 10 khoảng cách
R-R cuối cùng.

(a)

(b)

Hàm Hermite có cơng thức như sau:
#

%!

𝜓𝜓! (𝑥𝑥) = (√𝜋𝜋 ⋅ 2! ⋅ 𝑛𝑛!)"$ 𝑒𝑒 " $ 𝐻𝐻! (𝑥𝑥)

(1)

𝐻𝐻!"# (𝑥𝑥) = 2𝑥𝑥 ⋅ 𝐻𝐻! (𝑥𝑥) − 2𝑛𝑛 ⋅ 𝐻𝐻!$# (𝑥𝑥)

(2)

Với H n ( x) là đa thức Hermite được định nghĩa ở
dạng đệ quy:

Cho n ≥ 1 với H 0 ( x) ∫ 1; H1 ( x) = 2 x.

Quan sát trên hình 6 ta có thể bậc của hàm
Hermite càng cao thì tốc độ biến thiên của hàm

(c)

(d)

Hình 7. Xấp xỉ tín hiệu ECG bằng N hàm Hermite
đầu tiên: a) N=5; b) N=10; c) N=12; d) N=16
Từ hình 7 ta có thể nhận thấy tín hiệu ECG và nhất
là đoạn phức bộ QRS đã được xấp xỉ rất tốt khi
sử dụng 16 hàm Hermite cơ sở đầu tiên, sai số tại
các đỉnh Q, R và S nhỏ, trong hình 8 ta thấy ngay
cả với các trường hợp bệnh lý, tín hiệu biến thiên

30 Tạp chí Nghiên cứu khoa học,Trường Đại học Sao Đỏ, ISSN 1859-4190 Số 4 (67).2019

LIÊN NGÀNH ĐIỆN - ĐIỆN TỬ - TỰ ĐỘNG HÓA
mạnh thì việc khai triển tới 16 hàm Hermite cơ sở
đầu tiên vẫn khá tốt.

Bảng 2. Bảng phân chia số lượng mẫu học và mẫu
kiểm tra của 2 loại nhịp
Loại nhịp

Tổng số
mẫu

Số mẫu
học

Số mẫu
kiểm tra

Normal
Abnormal
Tổng

2000
4643
6643

1065
2546
3611

935
2133
3068

b) Cơ sở dữ liệu MGH

Hình 8. Hình ảnh xấp xỉ tín hiệu ECG bằng 16 hàm
Hermite đầu tiên đối với một số loại nhịp tim khác

Tập hợp 16 các giá trị này được sử dụng để tạo
thành vectơ đặc tính của tín hiệu điện tim. Ngồi
ra sử dụng thêm hai đặc tính về thời gian: khoảng
cách giữa hai đỉnh R liên tiếp R-R, giá trị trung
bình của 10 khoảng cách R-R cuối cùng. Như vậy,
vectơ đặc tính có 18 giá trị.
4.2. Cơ sở dữ liệu của tín hiệu điện tim ECG
a) Cơ sở dữ liệu MIT-BIH
Bộ cơ sở dữ liệu tín hiệu điện tim ECG đầu tiên sử
dụng trong bài báo là bộ cơ sở dữ liệu về chứng
loạn nhịp tim nổi tiếng MITBIH [2], lựa chọn lấy
các bản ghi của 19 bệnh nhân (mã số trong cơ sở
dữ liệu là 100, 105, 106, 109, 111, 114, 116, 118,
119, 124, 200, 202, 207, 208, 209, 212, 214, 221
và 222), phân loại 6 kiểu rối loạn nhịp tim được
xem xét là: block nhánh trái (L), block nhánh phải
(R), ngoại tâm thu nhĩ (A), ngoại tâm thu thất (V),
rung thất (I) và tâm thất lỗi nhịp (E) và 1 kiểu nhịp
bình thường (N). Số lượng chi tiết mẫu lấy từ bản
ghi của 19 bệnh nhân được thống kê chi tiết trong
bảng 1 và bảng 2 dưới đây:
Bảng 1. Bảng phân chia số lượng mẫu học và
mẫu kiểm tra của 7 loại rối loạn nhịp tim từ CSDL
MIT-BIH
Loại
nhịp

Tổng số
mẫu

Số mẫu
học

Số mẫu
kiểm tra

N
L
R
A
V
I
E
Tổng

2000
1200
1000
902
964
472
105
6643

1065
639
515
504
549
271

68
3611

935
561
485
398
451
201
37
3068

Bộ cơ sở dữ liệu thứ hai là MGH [11], bộ CSDL
này gồm có 250 bản ghi của tín hiệu ECG, thu
thập từ 250 bệnh nhân tim mạch tại các phịng
chăm sóc đặc biệt, phịng mổ, phịng thí nghiệm
thông tim,... tại Bệnh viện Đa khoa Massachusetts.
Bài báo lựa chọn sử dụng các mẫu tín hiệu ECG
của 20 bản ghi có mã số là: 029, 030, 058, 105,
106, 107, 108, 110, 111, 114, 117, 119, 121, 123,
124, 125, 128, 131, 137, 142, lấy ra tổng 4500
mẫu với 3 loại nhịp: bình thường (N - Normal
sinus rhythm), nhịp ngoại tâm thu thất (V Premature ventricular contraction) và loạn nhịp
trên thất (S - Supraventricular premature beat). Số
lượng chi tiết số mẫu sử dụng được thống kê chi
tiết trong bảng 3 và bảng 4 dưới đây.
Bảng 3. Bảng phân chia số lượng mẫu học và mẫu
kiểm tra của 3 loại nhịp
Loại
nhịp

Tổng số
mẫu

Số mẫu
học

Số mẫu
kiểm tra

N
S
V
Tổng

3000
750
750
4500

1997
502
501
3000

1003
248
249
1500

Bảng 4. Bảng phân chia số lượng mẫu học và mẫu
kiểm tra của 2 loại nhịp
Loại nhịp

Tổng số
mẫu

Số mẫu
học

Số mẫu
kiểm tra

Normal
Abnormal
Tổng

3000
1500
4500

1997
1003
3000

1003
497
1500

5. KẾT QUẢ TÍNH TỐN

5.1. Kết quả thử nghiệm trên bộ cơ sở dữ liệu
MIT-BIH
a) Nhận dạng 7 loại nhịp tim
Với bốn mơ hình nhận dạng đơn MLP, SVM, TSK,
RF trong bài báo, các thông số của các mơ hình
này được huấn luyện độc lập trên cùng một bộ dữ
liệu học, có kết quả như sau:
- Đầu tiên, với cấu trúc của mơ hình MLP có 1
lớp ẩn, với 20 nơron, trong đó có 7 nơron đầu ra
(tương ứng với 7 loại rối loạn nhịp tim).

Tạp chí Nghiên cứu khoa học, Trường Đại học Sao Đỏ, ISSN 1859-4190 Số 4 (67).2019 31

NGHIÊN CỨU KHOA HỌC
- Cịn đối với các thơng số của mơ hình SVM: với
7 lớp và theo phương pháp 1 chọi 1 để tìm ra lớp
chiến thắng trong mơ hình SVM. Cho bộ mẫu có 7
lớp nên nhóm tác giả phải xây dựng 21 mạng SVM
đơn lẻ cho từng cặp tổ hợp 2 loại tín hiệu một lúc.

Số mẫu nhận dạng sai

- Cấu trúc của mạng TSK có 21 luật suy luận và 7
kết quả đầu ra.
- Cuối cùng mơ hình RF có 100 cây quyết định,
mỗi cây có tối đa 9 tầng, tổng hợp kết quả theo
phương pháp bỏ phiếu theo đám đông.
Tất cả kết quả đầu ra từ các mơ hình nhận dạng
đơn trên sẽ được đẩy vào đầu vào cho Cây quyết

định DT, và sẽ có thêm một q trình học nữa để
xây dựng các thơng số cho Cây quyết định DT, kết
quả cuối cùng của q trình nhận dạng tín hiệu
điện tim ECG là đầu ra của Cây quyết định DT.
Đối với 4 mơ hình nhận dạng đơn trên ta sẽ thử
nghiệm các trường hợp tổng hợp kết quả từ 3 mơ
hình (có 4 khả năng phối hợp là MLP-TSK-SVM;
MLP-TSK-RF; MLP-RF-SVM và RF-TSK-SVM) và
có 1 mơ hình phối hợp cả 4 mơ hình đơn MLPSVM-TSK-R. Sử dụng chung một bộ dữ liệu mẫu
để kiểm tra mơ hình nhận dạng. Kết quả kiểm tra
này sẽ được sử dụng để so sánh với kết quả của
các nghiên cứu trước. Trong bảng 5 và hình 9 thể
hiện kết quả sai số kiểm tra của 4 mơ hình nhận
dạng cơ sở MLP, TSK, SVM, RF và 4 mơ hình
phối hợp. Tất cả các mạng mơ hình phân loại đầu
tiên sẽ được huấn luyện trên cùng một bộ dữ liệu
học và sau đó được kiểm tra trên một bộ dữ liệu
kiểm tra khác.
Bảng 5. Kết quả nhận dạng 7 loại nhịp (CSDL
MIT-BIH) bằng các mơ hình đơn và các mơ hình
kết hợp
Hệ thống phân loại
MLP
TSK
SVM
RF
MLP-TSK-SVM
MLP-TSK-RF
MLP-RF-SVM
RF-TSK-SVM

MLP-TSK-SVM-RF

Sai số
110
100
60
70
38
43
40
39
37

Sai số (%)
3,59
3,26
1,96
2,28
1,24
1,40
1,30
1,27
1,21

Từ bảng 5 ta có thể thấy kết quả của các mơ hình
phối hợp sử dụng cây quyết định DT đã được cải
thiện hơn so với kết quả của các mơ hình nhận
dạng đơn. Chất lượng của mơ hình phối hợp phụ
thuộc vào chất lượng của từng mơ hình nhận dạng
đơn và số lượng mơ hình đơn, thơng thường số

lượng mơ hình nhận dạng đơn càng lớn thì cho ra
kết quả tổng hợp càng tin cậy hơn.

Hình 9. Đồ thị cột thể hiện số mẫu nhận dạng sai
của các mơ hình nhận dạng - bộ cơ sở dữ liệu
MIT-BIH - phân loại 7 loại nhịp tim
b) Nhận dạng hai loại nhịp tim bình thường và
bất thường
Thực hiện tương tự như đối với khi các mơ hình
nhận dạng 7 loại nhịp tim ở mục (a), ta xây 4 mơ
hình nhận dạng đơn MLP, SVM, TSK, RF và có kết
quả như sau:
- Đầu tiên, với cấu trúc của mơ hình MLP có 1
lớp ẩn, với 20 nơron, trong đó có 2 nơron đầu ra
(tương ứng với hai loại nhịp tim bình thường và
bất thường).
- Cịn đối với các thơng số của mơ hình SVM chỉ
cần xây dựng với 1 lớp và theo phương pháp 1
chọi 1 để phân loại hai loại nhịp tim bình thường
và bất thường.
- Cấu trúc của mạng TSK có 18 luật suy luận và 2
kết quả đầu ra.
- Cuối cùng mô hình RF có 100 cây quyết định,
mỗi cây có 9 tầng, tổng hợp kết quả theo phương
pháp bỏ phiếu theo đám đông.
Bảng 6. Kết quả nhận dạng hai loại nhịp (CSDL MITBIH) bằng các mơ hình đơn và các mơ hình kết hợp
Hệ thống phân loại

Sai số

Sai số (%)

MLP

39

1,27

TSK

41

1,34

SVM

26

0,85

RF

37

1,21

Tích hợp MLP-TSK-SVM

21

0,68

Tích hợp MLP-TSK-RF

22

0,72

Tích hợp MLP-RF-SVM

23

0,75

Tích hợp RF-TSK-SVM

16

0,52

Tích hợp MLP-TSK-SVM-RF

15

0,49

Từ bảng 6 ta có thể thấy đối với trường hợp phân
loại hai loại nhịp tim bình thường và bất thường, ta
cũng thu được kết quả của các mơ hình phối hợp
sử dụng cây quyết định DT cao hơn đáng kể so

với kết quả của các mơ hình nhận dạng đơn.

32 Tạp chí Nghiên cứu khoa học,Trường Đại học Sao Đỏ, ISSN 1859-4190 Số 4 (67).2019

LIÊN NGÀNH ĐIỆN - ĐIỆN TỬ - TỰ ĐỘNG HĨA
Tích hợp MLP-TSK-SVM
Tích hợp MLP-TSK-RF
Tích hợp MLP-RF-SVM
Tích hợp RF-TSK-SVM
Tích hợp MLP-TSK-SVM-RF

Số mẫu nhận dạng sai

17
20
19
18
15

1,13
1,33
1,27
1,20
1,00

Số mẫu nhận dạng sai

Hình 10. Đồ thị cột thể hiện số mẫu nhận dạng sai
của các mơ hình nhận dạng - bộ CSDL MIT-BIH phân loại hai loại nhịp tim bình thường và bất thường

5.2. Kết quả thử nghiệm trên bộ CSDL MGH
Để đánh giá thêm độ chính xác và tin cậy của mơ
hình nhận dạng phối hợp bằng Cây quyết định DT,
bài báo thử nghiệm thêm với bộ CSDL MGH, và
thu được các kết quả như trong bảng 7 và bảng 8.
Bảng 7. Kết quả nhận dạng ba loại nhịp (CSDL
MGH/MF) bằng các mơ hình đơn và các mơ hình
kết hợp
Hệ thống phân loại
MLP
TSK
SVM
RF
Tích hợp MLP-TSK-SVM
Tích hợp MLP-TSK-RF
Tích hợp MLP-RF-SVM
Tích hợp RF-TSK-SVM
Tích hợp MLP-TSK-SVM-RF

Sai số
66
73
32
96
25
30
25
25
21

Sai số (%)
4,40
4,87
2,13
6,40
1,67
2,00
1,67
1,67
1,40

Số mẫu nhận dạng sai

Hình 12. Đồ thị cột thể hiện số mẫu nhận dạng sai
của các mơ hình nhận dạng - bộ CSDL MGH - phân
loại hai loại nhịp tim bình thường và bất thường
5.3. Đánh giá kết quả
Từ các kết quả thử nghiệm trên, ta có một số đánh
giá như sau:
- Qua các kết quả thử nghiệm trên bộ cơ sở dữ liệu
MIT-BIH và MGH/MF (là được các nhóm nghiên
cứu quốc tế thường dùng để tham chiếu), bài báo
đã minh chứng được giải pháp kết hợp song song
nhiều mơ hình nhận dạng cơ sở bằng Cây quyết
định DT đã tiếp tục nâng cao chất lượng kết quả
nhận dạng tín hiệu điện tim ECG. Sai số kiểm tra
(số mẫu nhận dạng sai) của các mơ hình kết hợp
đều thấp hơn so với các mơ hình nhận dạng cơ sở.
- Riêng có một trường hợp bằng nhau - trong
bảng 8, sai số của mơ hình SVM và mơ hình kết

hợp MLP-TSK-RF có số mẫu nhận dạng sai là 20.
6. KẾT LUẬN

Hình 11. Đồ thị cột thế hiện số mẫu nhận dạng sai của
các mơ hình nhận dạng - bộ CSDL MGH - phân loại
ba loại nhịp tim

Bảng 8. Kết quả nhận dạng hai loại nhịp (CSDL
MGH/MF)
Hệ thống phân loại
MLP
TSK
SVM
RF

Sai số
37
62
20
78

Sai số (%)
2,47
4,13
1,33
5,20

Bài báo đã đề xuất được giải pháp nâng cao chất
lượng nhận dạng tín hiệu điện tim ECG dựa trên
việc sử dụng cây quyết định DT để phối hợp nhiều

mơ hình nhận dạng đơn. Các thuật tốn đã phần
nào được triển khai thử nghiệm trên các bộ mẫu
số liệu kinh điển của quốc tế là MIT-BIH và MGH/
MF đã được các nhóm nghiên cứu quốc tế thường
dùng để tham chiếu.

TÀI LIỆU THAM KHẢO
[1]

Bazi F. and Melgani Y. (2008), Classification of
electrocardiogram signals with support vectơ
machines and particle swarm optimization,
IEEE Transactions on Information Technology
in Biomedicine, vol. 12(5), pp. 667- 677.

Tạp chí Nghiên cứu khoa học, Trường Đại học Sao Đỏ, ISSN 1859-4190 Số 4 (67).2019 33

NGHIÊN CỨU KHOA HỌC
[2]

G. và R. Mark Moody, (2001), The impact of
the MIT-BIH Arrhythmia Database, IEEE Eng.
in Medicine and Biology 20(3): 45-50.

[3]

L. Breiman (2001), Random forests. Machine
Learning, Vol. 45, pp.5-32.

[4]

O. Castillo, E. Ramírez, J. Soria (2010), Hybrid
System for Cardiac Arrhythmia Classification
with Fuzzy K-Nearest Neighbors and MultiLayer Perceptrons combined by a Fuzzy
Inference System, 2010 International Joint
Conference on Neural Networks (IJCNN), pp.
1-6.

[5]

S.Osowski, L.Tran Hoai, T. Markiewicz (2006),
Ensemble of neural networks for improved
recognition and classification of arrhythmia.
Metrology for a Sustainable Development
September, Rio de Janeiro, Brazil, pp. 17-22.

[6]

S.Osowski, T. Markiewicz, L. Tran Hoai (2008),
Recognition and classification system of
arrhythmia using ensemble of neural networks,
Article in Measurement, Vol. 41, pp. 610-617.

[7]

Trần Hoài Linh, Phạm Văn Nam, Vương Hoàng
Nam (2014), Multiple neural network integration
using a binary decision tree to improve the
ECG signal recognition accuracy, International

Journal of Applied Mathematics and Computer
Science. Volume 24, Issue 3, pp. 647-655.

[8]

Trần Hoài Linh, Phạm Văn Nam, Nguyễn
Đức Thảo (2015), A hardware implementation
of intelligent ECG classifier, COMPEL: The
International Journal for Computation and
Mathematics in Electrical and Electronic
Engineering, vol. 34, Iss: 3, pp. 905-919.

[9]

Trần Hoài Linh (2014), Mạng nơron và ứng
dụng trong xử lý tín hiệu. Nhà xuất bản Bách
Khoa Hà Nội.

[10]

S.Osowski, T. Markiewicz, L. Tran Hoai (2008),
Recognition and classification system of
arrhythmia using ensemble of neural networks,
Article in Measurement, Vol. 41, pp. 610-617.

[11]

THÔNG TIN TÁC GIẢ

Đỗ Văn Đỉnh
- Tóm tắt q trình đào tạo, nghiên cứu (thời điểm tốt nghiệp và chương trình đào tạo,
nghiên cứu):
+ Năm 1998: Tốt nghiệp Đại học chuyên ngành Tự động hóa, Trường Đại học Bách khoa
Hà Nội
+ Năm 2005: Tốt nghiệp Thạc sĩ chuyên ngành Tự động hóa, Trường Đại học Bách khoa
Hà Nội
+ Năm 2018: Tốt nghiệp Tiến sĩ chuyên ngành Điều khiển và Tự động hóa, Trường Đại
học Bách khoa Hà Nội
- Công việc hiện tại: Giảng viên, cán bộ phịng Khoa học cơng nghệ và hợp tác quốc tế,
Trường Đại học Sao Đỏ
- Các nghiên cứu chính là ứng dụng trí tuệ nhân tạo trong các giải pháp đo lường, điều
khiển và tự động hóa, các thiết bị đo thông minh
- Email:
- Điện thoại: 0982586160

Phạm Văn Kiên
- Tóm tắt q trình đào tạo, nghiên cứu (thời điểm tốt nghiệp và chương trình đào tạo,
nghiên cứu):
+ Năm 2002: Tốt nghiệp Đại học chuyên ngành Sư phạm kỹ thuật Tin học, Trường Đại
học Bách khoa Hà Nội
+ Năm 2007: Tốt nghiệp Thạc sĩ chuyên ngành Giáo dục nghề nghiệp, Trường Đại học
Bách khoa Hà Nội liên kết với trường TU Dresden (Đức)
- Công việc hiện tại: Giảng viên, Phó Trưởng Khoa, Trưởng Bộ mơn Cơng nghệ thơng tin,
Khoa Điện tử - Tin học, Trường Đại học Sao Đỏ
- Các nghiên cứu chính: Giải pháp phần mềm, kỹ thuật nhận dạng, trí tuệ nhân tạo
- Điện thoại: 0986362233

34 Tạp chí Nghiên cứu khoa học,Trường Đại học Sao Đỏ, ISSN 1859-4190 Số 4 (67).2019

Ứng dụng cây quyết định để xây dựng mô hình phối hợp nâng cao chất lượng nhận dạng tín hiệu điện tim

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về