Tải bản đầy đủ (.pdf) (155 trang)

Hệ thống xử lý tín hiệu điện não tự động phát hiện gai động kinh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.9 MB, 155 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

NGUYỄN THỊ ANH ĐÀO

HỆ THỐNG XỬ LÝ TÍN HIỆU ĐIỆN NÃO
TỰ ĐỘNG PHÁT HIỆN GAI ĐỘNG KINH

LUẬN ÁN TIẾN SĨ CÔNG NGHỆ KỸ THUẬT ĐIỆN TỬ, TRUYỀN THÔNG

Hà Nội - 2019


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

NGUYỄN THỊ ANH ĐÀO

HỆ THỐNG XỬ LÝ TÍN HIỆU ĐIỆN NÃO
TỰ ĐỘNG PHÁT HIỆN GAI ĐỘNG KINH

Chuyên ngành: Kỹ thuật Viễn thông
Mã số: 9510302.02
LUẬN ÁN TIẾN SĨ CÔNG NGHỆ KỸ THUẬT ĐIỆN TỬ, TRUYỀN THÔNG

NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS. TS. NGUYỄN LINH TRUNG

Hà Nội - 2019
i



LỜI CAM ĐOAN

Tôi xin cam đoan luận án do tôi thực hiện. Những kết quả từ các công trình của
các tác giả khác mà tôi sử dụng trong luận án đều được trích dẫn rõ ràng, cụ thể. Các
kết quả tính toán, mô phỏng là trung thực.
Nếu có gì sai trái, tôi xin hoàn toàn chịu trách nhiệm.
Hà Nội, ngày 5 tháng 11 năm 2019
Nghiên cứu sinh

Nguyễn Thị Anh Đào

ii


LỜI CẢM ƠN

Trước tiên, tôi xin bày tỏ sự trân trọng, lòng biết ơn sâu sắc đến thầy giáo, PGS.
TS. Nguyễn Linh Trung, người đã tận tình hướng dẫn và định hướng cho tôi thực hiện
công trình nghiên cứu này. Trong quá trình thực hiện đề tài, thầy là người luôn động
viên, hỗ trợ và tận tình giúp đỡ những lúc tôi cảm thấy khó khăn và giúp tôi vượt qua
trở ngại.
Tôi xin gửi lời cảm ơn chân thành tới GS. TS. Karim Abed-Meraim, GS. TS
Boualem Boashash và PGS. TS. Trần Đức Tân, Ths. Lê Trung Thành, TS. Nguyễn
Việt Dũng, Ths. Nguyễn Văn Lý, TS. Lê Vũ Hà, Ths. Đinh Văn Việt, Ths. Nguyễn
Thế Hoàng Anh, Ths. Trương Minh Chính, TS. Trần Thị Thúy Quỳnh những người
đã góp phần hỗ trợ tôi về chuyên môn trong quá trình làm luận án. Tôi xin bày tỏ lòng
biết ơn sâu sắc đến Bác sĩ, TS. Hoàng Cẩm Tú, người đã tận tâm hỗ trợ tôi hoàn thành
bộ dữ liệu sử dụng trong luận án.
Tôi xin trân trọng cảm ơn Ban Giám hiệu Nhà trường, Khoa Điện tử-Viễn thông,

phòng Đào tạo Trường Đại học Công nghệ, Đại học Quốc Gia Hà Nội, đã giảng dạy,
hướng dẫn và tạo điều kiện giúp đỡ tôi; đặc biệt là sự quan tâm, động viên của TS.
Nguyễn Hồng Thịnh, người đã thực sự quan tâm và đối xử với tôi như một thành viên
của Trường Đại học Công nghệ.
Tôi xin bày tỏ sự trân trọng, lòng biết ơn sâu sắc tới Đảng ủy, Ban Giám hiệu
Nhà trường, Khoa Điện tử viễn thông, Phòng tổ chức cán bộ Trường Đại học Kỹ thuật
Hậu cần Công an Nhân dân; đặc biệt là sự quan tâm, tạo điều kiện của PGS. TS.
Nguyễn Đăng Tiến, TS. Nguyễn Văn Căn, TS. Đặng Việt Xô, TS. Đặng Văn Tuyên,
TS. Phạm Thị Thúy Hằng và Ths. Phạm Xuân Cảnh đã hết sức hỗ trợ, tạo mọi điều
kiện thuận lợi cho tôi trong quá trình thực hiện đề tài.
Tôi xin cảm ơn những người thân trong gia đình, đặc biệt là chồng tôi đã hỗ trợ
tôi rất nhiều cả về vật chất và tinh thần để tôi có thể học tập đạt kết quả tốt và thực
hiện thành công luận án này.

iii


Luận án này được hỗ trợ bởi:
- Đề tài nghiên cứu khoa học mã số 102.02-2015.32 và đề tài mã số 102.042019.14, Quỹ Phát triển khoa học và công nghệ Quốc gia (National Foundation for
Science and Technology Development - NAFOSTED)
- Dữ liệu điện não đồ sử dụng trong luận án được sử dụng từ kết quả của đề tài
nghiên cứu khoa học mã số QG.10.40, Đại học Quốc Gia Hà Nội
Tôi xin chân thành cảm ơn!
Hà Nội, ngày 5 tháng 11 năm 2019

Nguyễn Thị Anh Đào

iv



MỤC LỤC

Trang phụ bìa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

i

Lời cam đoan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

ii

Lời cảm ơn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

iii

Mục lục . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1

Danh mục ký hiệu và chữ viết tắt . . . . . . . . . . . . . . . . . . . . . . . . . .

4

Danh mục các bảng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

9

Danh mục hình vẽ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

11


MỞ ĐẦU . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

15

CHƯƠNG 1. CƠ SỞ VÀ TỔNG QUAN . . . . . . . . . . . . . . . . . . . . .

26

1.1. Giới thiệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

26

1.2. Điện não đồ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

26

1.3. Động kinh . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

27

1.4. Chuẩn đo quốc tế 10-20 . . . . . . . . . . . . . . . . . . . . . . . . . .

29

1.5. Cơ sở dữ liệu EEG sử dụng trong luận án . . . . . . . . . . . . . . . . .

30

1.5.1. Đo đạc và thu thập dữ liệu . . . . . . . . . . . . . . . . . . . . .


30

1.5.2. Tiền xử lý dữ liệu EEG . . . . . . . . . . . . . . . . . . . . . . .

32

1.5.3. Cơ sở dữ liệu EEG . . . . . . . . . . . . . . . . . . . . . . . . .

33

1.6. Ma trận đánh giá . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

33

1.7. Đường cong ROC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

36

1.8. Các khái niệm cơ bản về ten-xơ . . . . . . . . . . . . . . . . . . . . . .

38

1.9. Phân tích ten-xơ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

42

1.9.1. Phân tích CP . . . . . . . . . . . . . . . . . . . . . . . . . . . .

42


1.9.2. Phân tích Tucker . . . . . . . . . . . . . . . . . . . . . . . . . .

43

1.10.Xấp xỉ hạng thấp đa tuyến tính cho các ten-xơ . . . . . . . . . . . . . .

44

1.10.1. Phân tích CP . . . . . . . . . . . . . . . . . . . . . . . . . . . .

45

1.10.2. Phân tích Tucker . . . . . . . . . . . . . . . . . . . . . . . . . .

45

1.10.3. Phân tích ten-xơ với ràng buộc không âm . . . . . . . . . . . .

46

1.10.4. Phân tích CP với ràng buộc không âm . . . . . . . . . . . . . .

48

1.10.5. Phân tích Tucker với ràng buộc không âm . . . . . . . . . . . .

48

1



1.11.Kết luận chương 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

49

CHƯƠNG 2. HỆ THỐNG ĐA BƯỚC TỰ ĐỘNG PHÁT HIỆN GAI ĐỘNG
KINH ĐƠN KÊNH . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

51

2.1. Giới thiệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

51

2.2. Hệ thống đa bước tự động phát hiện gai động kinh đơn kênh . . . . . .

52

2.2.1. Tiền xử lý . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

53

2.2.2. Trích xuất đặc trưng . . . . . . . . . . . . . . . . . . . . . . . .

57

2.2.3. Phân loại . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

59


2.2.4. Hệ chuyên gia . . . . . . . . . . . . . . . . . . . . . . . . . . . .

61

2.3. Đường cong ROC tổng hợp cho hệ thống đa bước . . . . . . . . . . . .

62

2.3.1. Sự phụ thuộc của SEN và ♣1 ✁ SPE q vào ngưỡng quyết định . .

62

2.3.2. Ước lượng đường cong ROC tổng hợp cho hệ thống đa bước . .

66

2.4. Mô phỏng và thảo luận . . . . . . . . . . . . . . . . . . . . . . . . . . .

70

2.4.1. Dữ liệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

70

2.4.2. Ma trận đánh giá . . . . . . . . . . . . . . . . . . . . . . . . . .

70

2.4.3. Kết quả mô phỏng và thảo luận . . . . . . . . . . . . . . . . . .


73

2.5. Kết luận chương 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

77

CHƯƠNG 3. HỆ THỐNG ĐA BƯỚC TỰ ĐỘNG PHÁT HIỆN GAI ĐỘNG
KINH ĐA KÊNH DỰA TRÊN PHÂN TÍCH TEN-XƠ . . . . . . . . . . . .

80

3.1. Giới thiệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

80

3.2. Phương pháp xấp xỉ hạng thấp đa tuyến tính đồng thời mở rộng cho
các ten-xơ (SMLRAT) . . . . . . . . . . . . . . . . . . . . . . . . . . .

81

3.2.1. Mối liên hệ giữa SLRAM và phân tích ten-xơ . . . . . . . . . .

81

3.2.2. Xấp xỉ hạng thấp đa tuyến tính đồng thời mở rộng cho các ten-xơ 82
3.3. Hệ thống đa bước phát hiện gai động kinh đa kênh dựa trên phân tích
ten-xơ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

85


3.3.1. Biểu diễn dữ liệu . . . . . . . . . . . . . . . . . . . . . . . . . .

86

3.3.2. Trích xuất đặc trưng . . . . . . . . . . . . . . . . . . . . . . . .

87

3.3.3. Lựa chọn đặc trưng . . . . . . . . . . . . . . . . . . . . . . . . .

91

3.3.4. Phân loại . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

92

3.4. Kết quả mô phỏng và thảo luận . . . . . . . . . . . . . . . . . . . . . .

92

3.4.1. Biểu diễn dữ liệu . . . . . . . . . . . . . . . . . . . . . . . . . .

93

2


3.4.2. Trích xuất đặc trưng . . . . . . . . . . . . . . . . . . . . . . . .

93


3.4.3. Lựa chọn đặc trưng . . . . . . . . . . . . . . . . . . . . . . . . .

96

3.4.4. Phân loại . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

98

3.5. Phương pháp lựa chọn đặc trưng mới cho hệ thống đa bước phát hiện
gai động kinh đa kênh dựa trên phân tích ten-xơ . . . . . . . . . . . . . 119
3.5.1. Phương pháp . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
3.5.2. Mô phỏng và đánh giá . . . . . . . . . . . . . . . . . . . . . . . 122
3.6. Kết nối với các nghiên cứu liên quan . . . . . . . . . . . . . . . . . . . 123
3.6.1. Kết nối với phân tích thành phần đồng thời . . . . . . . . . . . . 125
3.6.2. Kết nối với phân tích không gian con đồng thời . . . . . . . . . 125
3.6.3. Kết nối với phân tích thành phần chính đa tuyến tính . . . . . . 126
3.7. Kết luận chương 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
KẾT LUẬN VÀ KIẾN NGHỊ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
DANH MỤC CÔNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN QUAN ĐẾN
LUẬN ÁN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
TÀI LIỆU THAM KHẢO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
PHỤ LỤC A. CHỨNG MINH ĐỊNH LÝ 3.1 . . . . . . . . . . . . . . . . . . . 146
PHỤ LỤC B. CHỨNG MINH HỆ QUẢ 3 . . . . . . . . . . . . . . . . . . . . . 147
PHỤ LỤC C. CHỨNG MINH HỆ QUẢ 5 . . . . . . . . . . . . . . . . . . . . . 148

3


DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT


Danh mục ký hiệu
STT

Ký hiệu

Giải thích

1

R

Tập số thực

2

RN

Không gian véc-tơ thực N chiều

3

chữ thường, chữ in nghiêng
hoặc chữ hoa in hoa, ví dụ a, N

Đại lượng vô hướng

4

chữ thường in đậm, ví dụ a


Đại lượng véc-tơ, các thành phần của véc-tơ a
được ký hiệu là ai

5

chữ in hoa in đậm, ví dụ U

Ma trận, các thành phần của ma trận U được ký
hiệu là uij

6

chữ in hoa nghiêng in đậm, ví
dụ X

Ten-xơ, các thành phần của ten-xơ X được ký
hiệu là xi1 i2 ...in

7



Tích ngoại

8



Tích Kronecker


9



Tích Khatri-Rao

10



Tích Hadamard

11



12

♣☎q

13

tr♣☎q

Trace của ma trận ♣☎q

14




A⑥

Chuẩn của ten-xơ A

15



X⑥F

Chuẩn Frobenius của ten-xơ X

16



A, B②

Tích nội của ten-xơ A và ten-xơ B có cùng kích
thước

17

A❵B

18

♣ q


X, Y②

k

#

Tích nội của ten-xơ X và ten-xơ Y
Giả nghịch đảo của ma trận ♣☎q

Xếp chồng của ten-xơ A với ten-xơ B
Mode (chế độ) của ma trận hoặc ten-xơ

4


↕n

19

A♣kq của ten-xơ A bậc n

Mode-k (chế độ k) của ten-xơ A, k

20

A ✂k U

Phép nhân k-mode của ten-xơ A với ma trận U

21


xi1 i2 ...iN

Phần tử của ten-xơ X P RI1 ✂I2 ...✂IN

22

λ

Ten-xơ đường chéo

23

rank ♣Uk q

Hạng của ma trận Uk

24

G

Ten-xơ lõi

25

tλi✉ri✏1

Các phần tử đường chéo của ten-xơ lõi G

26


Λ

Ma trận đường chéo

27

vec♣Uq

Véc tơ hóa ma trận U

28

σ

Độ lệch chuẩn

29

Σ

Ma trận hiệp phương sai

30

γ ♣f i q

Điểm Fisher của đặc trưng fi

31


θ

Ngưỡng quyết định

5


DANH MỤC CHỮ VIẾT TẮT
STT

Chữ
viết tắt

Giải thích tiếng Anh
Two-dimensional Linear
Discriminant Analysis

Giải thích tiếng Việt

1

2dLDA

2

CP/
Canonical Polydadic/
PARAFAC Parallel Factor Analysis


Phân tích phần tử song song

3

CSA

Concurrent Subspaces Analysis

Phân tích không gian con đồng
thời

4

CWT

Continuous Wavelet Transform

Biến đổi sóng con liên tục

5

EEG

Electroencephalogram

Điện não đồ

6

FHWA


First Half Wave Amplitude

Biên độ cạnh trước

7

FHWD

First Half Wave Duration

Thời gian tồn tại cạnh trước

8

FHWS

First Half Wave Slope

Độ dốc cạnh trước

9

GLRAM

Generalized Low Rank
Approximations Matrix

Xấp xỉ hạng thấp mở rộng của các
ma trận


10

GSLRAT

Generalized Simultaneous
Multilinear LRA of Tensors

Xấp xỉ hạng thấp đa tuyến tính mở
rộng cho các ten-xơ đồng thời

11

HODA

Higher Order Discriminant
Analysis

Phân tích phân biệt bậc cao

12

HOOI

Higher-order Orthogonal
Iteration

Lặp trực giao bậc cao

13


HOSVD

Higher-Order Singular Value
Decomposition

Phân tích giá trị riêng bậc cao

14

ILFS

Infinite Latent Feature Selection

Lựa chọn đặc trưng ẩn không giới
hạn

15

KMC

K-means Clustering

Phân cụm K-Means

16

LLCFS

Feature Selection For Local

Learning-based Clustering

Lựa chọn đặc trưng để phân cụm
dựa trên học địa phương

17

LMRTA

Low Multilinear Rank Tensor
Approximation

Xấp xỉ hạng thấp đa tuyến tính cho
ten-xơ

18

LRA

Low Rank Approximation

Xấp xỉ hạng thấp

19

LRAT

Low-rank Approximation Of
Tensor


Xấp xỉ hạng thấp cho các ten-xơ

6

Phân tích tuyến tính riêng biệt hai
chiều


20

LRMA

Low-rank Matrix
Approximation

Xấp xỉ hạng thấp cho các ma trận

21

M-PCA

Multilinear Principal
Component Analysis

Phân tích các thành phần chính đa
tuyến tính

22

MR-NTD


Manifold Regularization
Nonnegative Tucker
Decomposition

Phân tích Tucker chính tắc với
ràng buộc không âm

23

NCP

Nonnegative CP Decomposition

Phân tích CP với ràng buộc không
âm

24

NMF

Nonnegative Matrix
Factorization

Hệ số hóa ma trận với ràng buộc
không âm

25

NTD


Nonnegative Tucker
Decomposition

Phân tích Tucker với ràng buộc
không âm

26

NTF

Nonnegative Tensor
Decomposition

Phân tích tensor với ràng buộc
không âm

27

PCA

Principal Component Analysis

Phân tích các thành phần chính

28

PNES

Psychogenic Non-Epileptic

Seizure

Xung không động kinh tâm lý

29

ROC

Receiver Operating
Characteristic

Đường cong đặc trưng hoạt động
của bộ thu nhận

30

SCA

Simultaneous Component
Analysis

Phân tích thành phần đồng thời

31

SHWA

Second Half Wave Amplitude

Biên độ cạnh sau


32

SHWD

Second Half Wave Duration

Thời gian tồn tại cạnh sau

33

SHWS

Second Half Wave Slope

Độ dốc cạnh sau

34

SLMRA

Simultaneous Low Multilinear
Rank Approximation

Xấp xỉ hạng thấp đa tuyến tính
đồng thời

35

SLRAM


Simultaneous Low Rank
Approximation Of Multiple
Matrices

Xấp xỉ hạng thấp cho các ma trận
đồng thời

36

SLRAT

Simultaneous Low Rank
Approximation Of Multiple
Tensors

Xấp xỉ hạng thấp cho các ten-xơ
đồng thời

37

SM-PCA

Sparse Multilinear Principal
Component Analysis

Phân tích thành phần chính đa
tuyến tính thưa

7



38

SVD

Singular Value Decomposition

Phân tích giá trị riêng

39

SVM

Support Vector Machine

Máy vectơ hỗ trợ

40

UDFS

Unsupervised Discriminative
Feature Selection

Lựa chọn đặc trưng phân biệt
không giám sát

41


UM-PCA

Unconstrained Multilinear
Principal Component Analysis

Phân tích các thành phần chính đa
tuyến tính không ràng buộc

8


DANH MỤC CÁC BẢNG

Bảng 1.1: Tập dữ liệu EEG . . . . . . . . . . . . . . . . . . . . . . . . . . .

34

Bảng 1.2: Kết quả xét nghiệm và tình trạng của bệnh. . . . . . . . . . . . .

34

Bảng 2.1: Tập dữ liệu huấn luyện . . . . . . . . . . . . . . . . . . . . . . .

70

Bảng 2.2: Tập dữ liệu kiểm tra . . . . . . . . . . . . . . . . . . . . . . . . .

71

Bảng 2.3: Kết quả phát hiện gai động kinh của hệ thống theo từng bước . .


73

Bảng 2.4: Tỉ lệ dương tính thật (SEN) và tỉ lệ âm tính thật (SPE) . . . . . .

73

Bảng 2.5: Tỉ lệ dương tính thật trung bình (SENtb ) theo các phương pháp .

74

Bảng 2.6: Kết quả của hệ thống sau bộ phân loại ANN khi chưa sử dụng
hệ chuyên gia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

75

Bảng 2.7: Kết quả ước lượng ROC tổng hợp của hệ thống đa bước . . . . .

77

Bảng 3.1: Tập dữ liệu EEG . . . . . . . . . . . . . . . . . . . . . . . . . . .

94

Bảng 3.2: Hiệu suất phát hiện gai động kinh của mô hình CP-KNN sử
dụng xác thực chéo LOOC . . . . . . . . . . . . . . . . . . . . . . . . . 102
Bảng 3.3: Hiệu suất phát hiện gai động kinh của mô hình NCP-KNN sử
dụng xác thực chéo LOOC . . . . . . . . . . . . . . . . . . . . . . . . . 103
Bảng 3.4: Hiệu suất phát hiện gai động kinh của mô hình TD-KNN sử
dụng xác thực chéo LOOC


. . . . . . . . . . . . . . . . . . . . . . . . 103

Bảng 3.5: Hiệu suất phát hiện gai động kinh của mô hình NTD-KNN sử
dụng xác thực chéo LOOC . . . . . . . . . . . . . . . . . . . . . . . . . 104
Bảng 3.6: Hiệu suất phát hiện gai động kinh của mô hình CP-NB sử dụng
xác thực chéo LOOC . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
Bảng 3.7: Hiệu suất phát hiện gai động kinh của mô hình NCP-NB sử dụng
xác thực chéo LOOC . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
Bảng 3.8: Hiệu suất phát hiện gai động kinh của mô hình TD-NB sử dụng
xác thực chéo LOOC . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
Bảng 3.9: Hiệu suất phát hiện gai động kinh của mô hình NTD-NB sử
dụng xác thực chéo LOOC . . . . . . . . . . . . . . . . . . . . . . . . . 106
9


Bảng 3.10:Hiệu suất phát hiện gai động kinh của mô hình CP-DT sử dụng
xác thực chéo LOOC . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
Bảng 3.11:Hiệu suất phát hiện gai động kinh của mô hình NCP-DT sử dụng
xác thực chéo LOOC . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
Bảng 3.12:Hiệu suất phát hiện gai động kinh của mô hình TD-DT sử dụng
xác thực chéo LOOC . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
Bảng 3.13:Hiệu suất phát hiện gai động kinh của mô hình NTD-DT sử
dụng xác thực chéo LOOC . . . . . . . . . . . . . . . . . . . . . . . . . 109
Bảng 3.14:Hiệu suất phát hiện gai động kinh của mô hình NTD-SVM dựa
trên phương pháp đề xuất bởi Phan-Cichocki . . . . . . . . . . . . . . . 110
Bảng 3.15:Hiệu suất phát hiện gai động kinh của mô hình NTD-KNN dựa
trên phương pháp được đề xuất bởi Phan-Cichocki . . . . . . . . . . . 111
Bảng 3.16:Hiệu suất phát hiện gai động kinh của mô hình NTD-NB dựa
trên phương pháp được đề xuất bởi Phan-Cichocki . . . . . . . . . . . 111

Bảng 3.17:Hiệu suất phát hiện gai động kinh của mô hình NTD-DT dựa
trên phương pháp được đề xuất bởi Phan-Cichocki . . . . . . . . . . . 112
Bảng 3.18:Hiệu suất phát hiện gai động kinh của mô hình NTD-SVM sử
dụng xác thực chéo LOOCV

. . . . . . . . . . . . . . . . . . . . . . . 115

Bảng 3.19:Hiệu suất phát hiện gai động kinh sử dụng các mô hình học máy
khác nhau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
Bảng 3.20:Xếp chồng các ten-xơ, sử dụng các bộ phân loại SVM, KNN,
NB và DT với 500 đặc trưng có ý nghĩa nhất. . . . . . . . . . . . . . . . 117

10


DANH MỤC HÌNH VẼ

Hình 1.1 Dữ liệu điện não đồ một bệnh nhân trong tập dữ liệu luận án sử
dụng. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

27

Hình 1.2 Điện não đồ có chứa gai động kinh [114]. . . . . . . . . . . . . .

28

Hình 1.3 Hình thái của một số gai động kinh [114]. . . . . . . . . . . . . .

28


Hình 1.4 Vị trí các điện cực đo điện não theo chuẩn quốc tế 10 ✁ 20 [73]. .

29

Hình 1.5 Mặt bên của hộp sọ biểu diễn các điểm đo từ điểm hốc mũi
(nasion) đến mấu ngoài xương chẩm (inion) [73]. . . . . . . . . . . . .

29

Hình 1.6 Mặt phía trước của hộp sọ theo chuẩn đo quốc tế 10 ✁ 20 [73]. . .

30

Hình 1.7 Các điện cực [117]. . . . . . . . . . . . . . . . . . . . . . . . . .

31

Hình 1.8 Vị trí các điện cực (22, 23) để đo nhiễu mắt [117]. . . . . . . . .

31

Hình 1.9 Vị trí các điện cực (30, 31) để đo nhiễu cơ [117]. . . . . . . . . .

31

Hình 1.10 Đường cong ROC. . . . . . . . . . . . . . . . . . . . . . . . . . .

37

Hình 1.11 Cột, dòng và ống của các chế độ của ten-xơ bậc ba . . . . . . . .


38

Hình 1.12 Các lát nằm ngang, ở bên và mặt trước của ten-xơ bậc ba . . . . .

39

Hình 1.13 Ma trận hóa một ten-xơ bậc 3 . . . . . . . . . . . . . . . . . . . .

42

Hình 1.14 Phân tích CP của ten-xơ X bậc ba X
phần.

P RI ✂J ✂K thành R thành

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

43

Hình 1.15 Phân tích Tucker của ten-xơ bậc ba X P RI ✂J ✂K . . . . . . . . .

44

Hình 2.1 Sơ đồ khối của hệ thống đa bước tự động phát hiện gai động kinh
đơn kênh. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

52

Hình 2.2 Một số gai động kinh thực tế trong tập dữ liệu. Đường tròn màu

đỏ minh họa vị trí đỉnh gai động kinh và hình ngôi sao minh họa vị trí
đỉnh gai không động kinh. . . . . . . . . . . . . . . . . . . . . . . . . .

54

Hình 2.3 Sáu đặc trưng của một đỉnh gai động kinh [6]. . . . . . . . . . . .

55

Hình 2.4 Mạng nơ-ron gồm 3 perceptron. . . . . . . . . . . . . . . . . . . .

55

Hình 2.5 Bẩy đặc trưng của một gai động kinh trong một thang tỉ lệ biến
đổi sóng con [81]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11

57


Hình 2.6 a) Gai động kinh (b) hệ số biến đổi sóng con của 56 mẫu của một
gai động kinh trong 10 thang tỉ lệ. . . . . . . . . . . . . . . . . . . . .

59

Hình 2.7 Cấu trúc của mạng ANN được sử dụng trong hệ thống đa bước. .

60

Hình 2.8 Ngưỡng quyết định θ cho phép tách không gian đo thành hai

không gian con biểu diễn hai lớp trong tập dữ liệu. . . . . . . . . . . .

63

Hình 2.9 Hàm phân bố mật độ xác suất của phân bố Gauss và phân bố
Logistic. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

67

Hình 2.10 Hàm tích lũy đảo của phân bố Logistic (hàm probit) và phân bố
Gauss (hàm logit). . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

67

Hình 2.11 Kết quả của hệ thống tự động phát hiện gai động kinh theo từng
bước. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

72

Hình 2.12 Đường cong ROC của mạng ANN trên tập dữ liệu huấn luyện và
tập dữ liệu kiểm tra. . . . . . . . . . . . . . . . . . . . . . . . . . . . .

75

Hình 2.13 Đường cong ROC tổng hợp của hệ thống đa bước tự động phát
hiện gai động kinh. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

76

Hình 3.1 Hệ thống phát hiện gai động kinh đa kênh dựa trên phân tích ten-xơ. 86

Hình 3.2 Phổ giá trị riêng trong 3 chế độ của ten-xơ động kinh. Với mỗi
chế độ, hình bên trên (màu xanh) ứng với tập các giá trị riêng, hình
bên dưới (màu đỏ) ứng với phổ phương sai của chúng. . . . . . . . . .

95

56✂15
Hình 3.3 Ma trận thời gian chung A P R 
thu được từ phép phân tích
Tucker với ràng buộc không âm của ten-xơ động kinh và ten-xơ không

động kinh.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

97

20✂10
Hình 3.4 Ma trận thang tỉ lệ B P R 
thu được từ phép phân tích NTD.

Trục x biểu diễn số thành phần (các véc tơ cột), trục y biểu diễn 20

thang tỉ lệ trong dải thang tỉ lệ từ thang tỉ lệ 4 đến thang tỉ lệ 8. . . . . .
19✂19
Hình 3.5 Ma trận kênh chung C P R 
của ten-xơ gai động kinh thu

được từ phép phân tích NTD. . . . . . . . . . . . . . . . . . . . . . . .
12


98

99


Hình 3.6 Các ma trận A, B thu được sử dụng các phương pháp phân tích
ten-xơ (NTD, TD, NCP) của ten-xơ động kinh. Trục x biểu diễn số
thành phần (các véc tơ cột), trục y của ma trận thời gian chung A biểu
diễn 56 mẫu theo thời gian và trục y của ma trận thang tỉ lệ chung B
biểu diễn 20 thang tỉ lệ trong dải thang tỉ lệ từ thang tỉ lệ 4 đến thang tỉ
lệ 8. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
Hình 3.7 Điểm Fisher (dấu màu xanh) và trị số p (dấu màu đỏ) của các
đặc trưng. Các đặc trưng được xắp xếp dựa vào điểm fisher của chúng.
Mức có ý nghĩa p ✏ 0.05 được sử dụng để đưa ra quyết định loại bỏ giả

thiết đảo H0 , loại bỏ các đặc trưng có giá trị p → 0.05.

. . . . . . . . . 101

Hình 3.8 Véc tơ gồm 10 đặc trưng có ý nghĩa nhất được lựa chọn cho lớp
gai động kinh và lớp gai không động kinh. Các véc tơ đặc trưng của
hai gai động kinh là tương tự nhau, véc tơ của hai gai không động kinh
là khác nhau. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
Hình 3.9 Hiệu suất phân loại theo số lượng đặc trưng được lựa chọn . . . . 102
Hình 3.10 Hiệu suất phát hiện gai động kinh của mô hình KNN khi áp dụng
phương pháp trích xuất đặc trưng do luận án đề xuất so với các phương
pháp dựa trên phân tích ten-xơ khác (CP, NCP, TD và NTD). . . . . . . 104
Hình 3.11 Hiệu suất phát hiện gai động kinh của mô hình NB khi áp dụng
phương pháp trích xuất đặc trưng do luận án đề xuất so với các phương

pháp dựa trên phân tích ten-xơ khác (CP, NCP, TD và NTD). . . . . . 107
Hình 3.12 Hiệu suất phát hiện gai động kinh của mô hình DT khi áp dụng
phương pháp trích xuất đặc trưng do luận án đề xuất so với các phương
pháp dựa trên phân tích ten-xơ khác (CP, NCP, TD và NTD). . . . . . 109
Hình 3.13 Hiệu suất phát hiện gai động kinh của 4 bộ phân loại sử dụng các
đặc trưng được trích xuất bởi phương pháp của Phan-Cichocki. . . . . 113
Hình 3.14 Hiệu suất phát hiện gai động kinh của SVM với các đặc trưng sử
dụng các phương pháp phân tích ten-xơ: CP, NCP, TD và NTD. . . . . 114
Hình 3.15 Hiệu suất phát hiện gai động kinh với các đặc trưng được trích
xuất sử dụng NTD với bộ phân loại SVM, KNN, NB và DT. . . . . . . 116
13


Hình 3.16 Đường cong ROC của hệ thống phát hiện gai động kinh đa kênh
sử dụng (a) Phương pháp phát hiện gai động kinh dựa trên phân tích
ten-xơ và (b) Phương pháp xếp chồng các ten-xơ . . . . . . . . . . . . 118
Hình 3.17 Hệ thống phát hiện gai động kinh đa kênh sử dụng phương pháp
lựa chọn đặc trưng kết hợp 2 phương pháp lựa chọn đặc trưng là điểm
Fisher và trị số p. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
Hình 3.18 Trị số p là xác suất xảy ra một kết quả quan sát được với giả thiết
đảo H0 là đúng. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
Hình 3.19 Điểm Fisher (dấu màu xanh) và trị số p (dấu màu đỏ) của các
đặc trưng. Các đặc trưng được xắp xếp dựa vào điểm fisher của chúng.
Mức có ý nghĩa p ✏ 0.05 được sử dụng để đưa ra quyết định loại bỏ giả

thiết đảo H0 , loại bỏ các đặc trưng có giá trị p → 0.05.

. . . . . . . . . 123

Hình 3.20 Giá trị SEN, ACC và AUC của hệ thống theo số lượng các đặc

trưng được lựa chọn sử dụng các phương pháp lựa chọn đặc trưng sử
dụng bộ phân loại SVM. . . . . . . . . . . . . . . . . . . . . . . . . . . 124

14


MỞ ĐẦU

1. Bối cảnh nghiên cứu
Động kinh (epilepsy) là một rối loạn thần kinh và là một trong những rối loạn
nghiêm trọng phổ biến nhất của bộ não, được đặc trưng bởi sự xuất hiện xung động
kinh lặp đi lặp lại nhiều lần. Bệnh động kinh chiếm 1% trong số các bệnh tật trên toàn
cầu. Theo nghiên cứu [10] năm 2010, trên thế giới có khoảng 50 triệu người mắc bệnh
động kinh, gần 40 triệu người bị động kinh ở các nước phát triển, trong đó 80 ✁ 90%
người bị động kinh không được điều trị [17, 107]. Khoảng 4 tỷ người (50% dân số
toàn cầu) sống ở châu Á, trong đó khoảng 23 triệu người mắc bệnh động kinh [116].
Chẩn đoán bệnh tức là dựa vào triệu chứng của bệnh nhân và một số xét nghiệm
lâm sàng, cận lâm sàng để các bác sĩ xác định bệnh nhân có bị bệnh hay không. Trong
chẩn đoán bệnh động kinh, bác sĩ dựa vào nhận biết các triệu chứng đặc trưng của
từng cơn, dấu hiệu thần kinh và tâm thần, tuổi khởi phát và căn nguyên của các cơn
co giật lâm sàng. Một xét nghiệm lâm sàng quan trọng hay được sử dụng nhất để chẩn
đoán và theo dõi tiến triển của bệnh động kinh là đo điện não đồ của bệnh nhân. Điện
não đồ (EEG – Electroencephalogram) là cách sử dụng mũ điện cực ghi lại các hoạt
động điện của não bộ. Dựa vào quan sát dữ liệu điện não đồ, bác sĩ có thể chẩn đoán
bệnh động kinh, thể loại động kinh và khu vực não bị tổn thương, thông qua các dấu
ấn sinh học của động kinh được thể hiện trên điện não đồ. Dấu ấn sinh học của động
kinh gồm xung động kinh (epileptic seizure) và một số dạng sóng động kinh như gai
động kinh (epileptic spike), sóng sắc (sharp wave), phức hợp gai và sóng, đa gai. Với
các xét nghiệm lâm sàng, bác sĩ chỉ quan sát được gai động kinh trên điện não đồ của
bệnh nhân. Xung động kinh của bệnh nhân được ghi lại khi bệnh nhân được theo dõi

điện não đồ 24④24 giờ trong bệnh viện. Gai động kinh xuất hiện trên điện não đồ trước
hoặc sau cơn động kinh [60].
Tại Việt Nam, việc chẩn đoán nhầm bệnh động kinh ở tuyến huyện và tỉnh xảy
ra khá phổ biến do hai nguyên nhân như sau:
Thứ nhất, các bác sĩ chuyên khoa phân tích và chẩn đoán bệnh động kinh từ dữ
15


liệu thô (chưa được xử lý bậc cao) được đo trực tiếp từ máy đo điện não. Tín hiệu điện
não thô thông thường chứa nhiều loại nhiễu như nhiễu điện lưới, nhiễu mắt, nhiễu cơ
dẫn đến việc quan sát các gai động kinh khó khăn.
Thứ hai, theo chuẩn đo điện não quốc tế, tín hiệu điện não đo trong khoảng thời
gian ít nhất là 20 phút. Đối với một số trường hợp cụ thể, tín hiệu điện não phải được
giám sát 24④24. Tuy nhiên, ở Việt Nam, do số lượng bệnh nhân lớn, các bệnh viện
bị quá tải nên thông thường, các bệnh nhân được đo tín hiệu điện não để bác sĩ chẩn
đoán bệnh chỉ trong khoảng thời gian là 10 phút. Điều này dễ dẫn đến việc có thể
không phát hiện ra bệnh động kinh đối với bệnh nhân bị bệnh động kinh hoặc chẩn
đoán nhầm thể loại bệnh động kinh.
Việc chẩn đoán nhầm bệnh động kinh có thể dẫn đến nhiều hệ lụy. Ví dụ, có
những bệnh nhân bị động kinh nhưng thời gian đo ngắn, tín hiệu có nhiều nhiễu
không được xử lý lọc nhiễu nên bác sĩ không phát hiện ra bệnh, dẫn đến trường hợp
người bệnh bị bệnh động kinh nhưng không được điều trị. Bệnh động kinh có nhiều
loại động kinh khác nhau, việc chẩn đoán không chính xác dẫn đến việc cho thuốc
động kinh không đúng loại có thể gây ra những tác dụng phụ không mong muốn và
có trường hợp làm bệnh trở thành nặng hơn.
Trong gần 40 năm qua, đã có nhiều công trình nghiên cứu về nhận biết các dấu
ấn sinh học (biomarker) của bệnh động kinh như nhận biết xung động kinh (seizure)
kết hợp với lâm sàng và một số xét nghiệm khác để chẩn đoán các thể động kinh. Một
số công trình nghiên cứu về phát hiện xung động kinh được đề xuất trong [4, 44, 45,
67, 119, 120] và phát hiện gai động kinh trong [43, 45]. Xung động kinh thường khó

xuất hiện trong thời gian đo khi làm xét nghiệm lâm sàng. Xung động kinh đo được
khi bệnh nhân được đo giám sát 24④24 trong bệnh viện. Ở Việt Nam rất ít khi đo giám
sát 24④24, trừ khi bệnh nhân bị bệnh nặng và cần phẫu thuật bỏ phần não tổn thương
gây nên động kinh để điều trị. Vì vậy, rất khó khăn để có được dữ liệu điện não đồ có
chứa xung động kinh ở Việt Nam để nghiên cứu. Mặt khác, khi bệnh nhân xuất hiện
xung động kinh tức là trường hợp bệnh nhân đã bị bệnh nặng. Ngoài ra, các hoạt
động khác của não hoặc nhiễu (do điều kiện ghi điện não chưa theo chuẩn quốc tế)
có thể tạo ra các gai không động kinh (giả gai) trên tín hiệu EEG, dễ gây nhầm lẫn
cho bác sĩ dẫn đến hiện tượng chẩn đoán nhầm bệnh. Vì vậy, để hỗ trợ cho các bác
sĩ trong việc chẩn đoán, phát hiện bệnh động kinh ngay trong giai đoạn bệnh còn
16


nhẹ, tức là xuất hiện gai động kinh trong tín hiệu điện não đồ, luận án đặt ra vấn đề
nghiên cứu hệ thống xử lý tín hiệu điện não tự động nhận biết gai động kinh, sử dụng
các kỹ thuật xử lý tín hiệu tiên tiến nhằm tăng tính khách quan và độ chính xác trong
việc phát hiện gai động kinh.

2. Tổng quan về các vấn đề nghiên cứu
Do việc dò gai thủ công tốn rất nhiều thời gian của bác sĩ nên việc xây dựng
các hệ thống để phát hiện gai động kinh tự động là hướng nghiên cứu đang được quan
tâm ở Việt Nam cũng như trên thế giới. Việc tự động phát hiện gai động kinh có thể
cung cấp thông tin về mật độ gai và hội chứng của bệnh động kinh. Trong những năm
vừa qua, đã có nhiều công trình nghiên cứu về tự động phát hiện gai động kinh như
trong [5, 43, 52, 81, 94, 95, 97, 109, 127]. Tuy nhiên, việc nghiên cứu về tự động phát
hiện gai động kinh vẫn gặp khó khăn do một số nguyên nhân như sau
Khó khăn đầu tiên là định nghĩa về gai động kinh, không có định nghĩa chính
xác về gai động kinh [45]. Thực tế, số lượng gai động kinh trên điện não đồ là nhỏ
hơn rất nhiều so với số gai không phải là gai động kinh, vì vậy, có thể có những trường
hợp hai bác sĩ khác nhau có thể sẽ không đánh dấu cùng một sự kiện là gai động kinh.

Thứ hai, việc xây dựng và phát triển tập huấn luyện về gai rất tốn kém và mất
nhiều thời gian do có sự khác nhau về hình thái của gai động kinh đối với các bệnh
nhân khác nhau.
Ở Việt Nam, việc sử dụng các bản ghi EEG trong chẩn đoán và điều trị bệnh
động kinh vẫn còn ở giai đoạn sơ khai do một số lý do như sau: (i) sự khan hiếm của
các bác sĩ thần kinh có kinh nghiệm có thể đưa ra các phân tích chất lượng cao dựa
trên thông tin thần kinh điện, (ii) thời gian làm xét nghiệm lâm sàng là ghi điện não đồ
ngắn hơn (10 phút) so với thời gian ghi điện não đồ theo chuẩn quốc tế thông thường
(thời gian ghi điện não tối thiểu là 20 phút) và (iii) có nhiều nhiễu do môi trường ghi
điện não chưa chuẩn gây ra. Hai lý do là (ii) và (iii) làm cho công việc của các bác sĩ
thần kinh ở Việt Nam trở nên khó khăn hơn các đồng nghiệp quốc tế. Chính vì hai lý
do này đã dẫn đến tỷ lệ phát hiện nhầm bệnh động kinh cao. Vì vậy, để hỗ trợ các bác
sĩ cải thiện chất lượng và chẩn đoán bệnh động kinh đang là một trong những vấn đề
cấp thiết.
Trong nhiều thập kỷ qua, nhiều phương pháp khác nhau đã được đề xuất để giải
17


quyết vấn đề phát hiện gai động kinh. Một số phương pháp so sánh các tham số điện
của các dạng sóng EEG với các ngưỡng thực tế của gai động kinh [46, 77]. Trong
nghiên cứu [98] Pfurtscheller và đồng nghiệp đã đề xuất một số kỹ thuật lọc để phát
hiện gai động kinh. Trong [47], Gotman và đồng nghiệp đã phát triển một hệ thống
phát hiện gai động kinh, nhạy với các trạng thái khác nhau của tín hiệu EEG. Trong
một số nghiên cứu đánh giá gần đây, các phương pháp phát hiện tự động gai động kinh
được phân loại thành các nhóm khác nhau dựa trên các đặc điểm thần kinh học [60]
hoặc các kỹ thuật [120]. Để khái quát lại các nghiên cứu về các hệ thống tự động phát
hiện gai động kinh đã có, luận án chia các hệ thống phát hiện gai động kinh tự động
thành hai nhóm dựa vào cấu trúc của hệ thống là các hệ thống đơn giản và các hệ thống
đa bước. Các hệ thống phát hiện gai động kinh đơn giản thường có cấu trúc đơn giản,
sử dụng một hoặc hai phương pháp xử lý tín hiệu hoặc học máy để phát hiện gai động

kinh tự động. Các hệ thống phát hiện gai động kinh đa bước được xây dựng dựa trên
sự kết hợp nhiều phương pháp xử lý tín hiệu, kỹ thuật học máy, tận dụng lợi thế của
từng kỹ thuật để thu thập và trích chọn các đặc trưng phù hợp, xử lý và phân loại thông
tin. Một số hệ thống đơn giản được trình bày trong [43, 94, 95, 97, 109, 127] sử dụng
một số kỹ thuật như phân tích thành phần độc lập (Principal Component Analysis PCA), phân cụm K-means (K-Means clustering), máy vectơ hỗ trợ (Support Vector
Machine - SVM), mạng nơ-ron nhân tạo (Artificial Neural Network - ANN). Một số
hệ thống đa bước có thể kể đến như [6, 52, 81] kết hợp sử dụng nhiều phương pháp
xử lý tín hiệu như lọc nhiễu, biến đổi sóng con, mạng nơ-ron nhận tạo và hệ chuyên
gia. Trong các hệ thống đã đề xuất để phát hiện gai động kinh thì thông thường hệ
thống đa bước có hiệu suất cao hơn các hệ thống đơn giản. Tuy nhiên, hai hệ thống đa
bước đã được đề xuất bởi [6, 81] vẫn còn một số hạn chế. Thứ nhất, hai phương pháp
đa bước hiện hành chưa xử lý hiệu quả, việc sử dụng số lượng thang tỉ lệ của biến đổi
sóng con chưa tối ưu, quá nhiều thang tỉ lệ nên có thể dẫn đến tốc độ xử lý chậm [Hạn
chế 1]. Thứ hai, còn khá nhiều giả gai trong khi chưa khai thác được mối liên hệ theo
thời gian giữa các gai gần nhau [Hạn chế 2].
Hầu hết các hệ thống phát hiện gai động kinh đã trình bày trên tập trung vào
phân tích dữ liệu EEG trên một kênh tại một thời điểm, không xử lý các tín hiệu điện
não đồng thời trên nhiều kênh. Indiradevi trong [60] đã đề xuất một hệ thống phát
hiện dựa trên phân tích đa mức, đa phân giải nhằm kết hợp đồng thời các thông tin

18


EEG trong miền thời gian, tần số và không gian để tự động xác định các gai động
kinh.
Trong thực tế, dữ liệu EEG là không dừng, thay đổi theo thời gian và theo từng
bệnh nhân. Khi quan sát tín hiệu điện não đồ (EEG) của các bệnh nhân bị động kinh,
khả năng xuất hiện gai động kinh trên các kênh gần nhau trong cùng một thời điểm là
cao, nên các phương pháp xử lý đa kênh đồng thời có thể sẽ cho phép khai thác mối
liên hệ theo không gian của gai động kinh, tăng khả năng phát hiện gai động kinh.

Indiradevi là người duy nhất đề cập đến định vị khu vực não tổn thương gây nên các
gai động kinh sử dụng đồng thời thông tin từ nhiều kênh [60].
Dữ liệu EEG có thể được biểu diễn bằng một ma trận hai chiều với một chiều
là thời gian và chiều còn lại là không gian (các kênh hay các điện cực). Nếu chuyển
đổi dữ liệu EEG đa kênh sang miền tần số sử dụng biến đổi sóng con thì dữ liệu
EEG có thể được biểu diễn bằng các mảng 3 chiều hay ten-xơ 3 chiều là thời gian,
kênh (điện cực) và thang tỉ lệ [25]. Phân tích ten-xơ trở thành một công cụ hữu ích
để phân tích dữ liệu nhiều chiều. Với sự phát triển của các ứng dụng dữ liệu lớn,
phân tích ten-xơ trở thành một phương pháp dành được sự quan tâm của nhiều nhóm
nghiên cứu. Có thể thấy phân tích ten-xơ được áp dụng trong các ứng dụng về xử lý tín
hiệu [23]. Hai phương pháp phân tích ten-xơ phổ biến là i) phân tích các hệ số song
song (PARAFAC) hay còn gọi với tên khác là phân tích CP và ii) phân tích Tucker. Có
rất nhiều nghiên cứu sử dụng phân tích ten-xơ phân tích tín hiệu điện não nói chung
như [25, 58] và phát hiện xung động kinh nói riêng như [1, 3, 8, 32, 33, 93, 100, 111].
Trong [100], Evangelia Pippa và đồng nghiệp sử dụng phân tích ten-xơ để nhận biết
các sự kiện không động kinh (bao gồm: xung không động kinh tâm lý (Psychogenic
nonepileptic seizures - PNES), ngất xỉu phế vị mạch (Vasovagal Syncope - VVS) và
sự kiện động kinh là sóng động kinh toàn thể hóa (Generalized Spike Wave - GSW).
Trong năm 2006 và 2007 [1–3], Acar và đồng nghiệp sử dụng phân tích ten-xơ để loại
nhiễu, xác định vị trí tổn thương của não và nhận biết xung động kinh. M. De Vos và
đồng nghiệp cũng sử dụng phân tích ten-xơ để định vị vùng khởi phát động kinh [32].
Tuy nhiên, các nhóm nghiên cứu này [1, 3, 8, 25, 32, 33, 58, 93, 111] chưa nghiên cứu
nhận biết gai động kinh đa kênh, chưa khai thác được mối liên hệ về không gian giữa
các gai động kinh trên các kênh gần nhau tại một thời điểm [hạn chế 3].
Trong các ứng dụng khai phá dữ liệu nói chung và xử lý tín hiệu y sinh nói riêng
19


(ví dụ, tín hiệu EEG), xấp xỉ hạng thấp (Low Rank Approximation - LRA) là một bài
toán được sử dụng phổ biến [86]. Mục tiêu của xấp xỉ hạng thấp là tìm một không gian

con có số chiều nhỏ hơn chiều của dữ liệu ban đầu nhưng vẫn chứa được những thông
tin chính của dữ liệu. Trong những năm qua, có rất nhiều công trình nghiên cứu đề giải
bài toán xấp xỉ hạng thấp cho các ma trận hoặc ten-xơ đơn [22, 72]. Xấp xỉ hạng thấp
có không gian con thu được là 2 chiều có thể kể đến các đóng góp trong [27, 34, 61,
63, 82, 83, 112, 130, 132, 136], sử dụng các phương pháp như phân tích giá trị riêng 2
chiều (2dSVD), phân tích các thành phần chính 2 chiều (2dPCA), xấp xỉ hạng thấp mở
rộng của các ma trận (Generalized Low Rank Approximations Matrix - GLRAM). . .
Trường hợp, không gian con thu được có số chiều lớn hơn 2 trong [80, 96, 126, 129]
sử dụng các phương pháp như phân tích Tucker chính tắc với ràng buộc không âm
(Manifold Regularization Nonnegative Tucker Decomposition - MR-NTD), phân tích
các thành phần chính đa tuyến tính không ràng buộc (Unconstrained Multilinear PCA
- UMPCA), phân tích các thành phần chính đa tuyến tính thưa (Sparse Multilinear
Principal Component Analysis - SMPCA) . . . Tuy nhiên, trong các công trình trên
chưa có công trình nào nghiên cứu để giải bài toán xấp xỉ hạng thấp cho một chuỗi các
ten-xơ đồng thời (Generalized Simultaneous Multilinear LRA of Tensors - GSLRAT)
[hạn chế 4].
Để đánh giá chất lượng của thuật toán/hệ thống đề xuất trong việc phân loại
dữ liệu, hai công cụ thường được sử dụng là ma trận đánh giá (evaluation matrix) và
đường cong ROC (Receiver Operating Characteristic) [19]. Với ma trận đánh giá, hai
chỉ số dành được sự quan tâm lớn trong lĩnh vực y sinh là tỉ lệ dương tính thật (độ
nhạy - Sensitivity), tỉ lệ âm tính thật (độ đặc hiệu - Specificity) [19]. Đường cong
ROC được sử dụng trong rất nhiều lĩnh vực như nghiên cứu y sinh, khoa học dữ liệu
và học máy. Ưu điểm chính của đường cong ROC so với ma trận đánh giá là đường
cong ROC biểu diễn mối quan hệ, sự đánh đổi giữa tỉ lệ dương tính thật và tỉ lệ âm
tính thật dựa vào việc chọn ngưỡng quyết định [38]. Một tham số của đường cong
ROC là diện tích dưới đường cong ROC (Area Under Curve - AUC) biểu diễn hiệu
suất của các bộ phân loại nhị phân. Do đó, đường cong ROC thường được sử dụng để
đánh giá chất lượng của các bộ phân loại và so sánh chất lượng của các bộ phân loại
nhị phân trong nhiều lĩnh vực, bao gồm cả chẩn đoán y tế [50]. Trong những năm gần
đây, có nhiều công trình nghiên cứu sử dụng đường cong ROC để đánh giá chất lượng


20


×