Tải bản đầy đủ (.pdf) (10 trang)

Bài tiểu luận Trí tuệ nhân tạo nâng cao: Nhận dạng người từ điện não đồ bằng cách sử dụng các kỹ thuật học máy khác nhau với tỷ lệ biên độ giữa các bán cầu (IHAR)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (603.39 KB, 10 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ 

Lê Khánh Linh
MSSV: 21025011

Bài tiểu luận

Nhận dạng người từ điện não đồ bằng cách sử dụng các kỹ
thuật học máy khác nhau với tỷ lệ biên độ giữa các bán cầu
(IHAR)

Học phần: Trí tuệ nhân tạo nâng cao
Ngành: Khoa học máy tính


Hà Nội, ngày 14 tháng 05 năm 2022

1. Khái niệm chung
EEG - Electroencephalography (Electro + encephalography) hay điện não đồ
là 1 hệ thống có khả năng ghi lại các xung điện được phát ra từ các neuron thần
kinh, tiếp nhận qua vỏ não của con người. Tín hiệu này là phản hồi điện sinh
học được tiếp nhận ngay tức khắc của tế bào não thông qua vỏ não. Là 1 trong
những bộ phận phức tạp nhất trên cơ thể người, não người khi có các tác động
từ các giác quan như: thị giác, thính giác, xúc giác, .v.v. sẽ sản sinh ra các tín
hiệu điện rất nhỏ phản hồi lại và được trao đổi thông qua các neuron thần kinh.
Việc tiến hành đo đạc EEG thường được thực hiện bằng cách gắn nhiều điện
cực rải ráp xung quanh đầu, mỗi điện cực sẽ thu nhận được các xung điện tại
từng khu vực riêng biệt, mỗi điện cực được coi như là 1 kênh (channel).
Thường được thiết kế với mũ đội đầu gán điện cực như hình bên dưới:


Hình 1.1 Mũ đội đầu gán điện cực


Tín hiệu điện của sóng não khá bé nên trước khi tiến hành lưu trữ thường được qua
1 bộ phận khuếch đại tín hiệu. Về cơ bản, dải tần của sóng não EEG thường nằm
trong khoảng từ 0.5Hz - 40Hz và được chia nhỏ thành các loại sóng như sau:
● Sóng Delta (< 4Hz): là sóng với tần số thấp và biên độ cao, thường được
phát hiện khi con người chìm vào giấc ngủ sâu.
● Sóng Theta (4-7Hz): cũng là sóng với biên độ khá thấp, thường được phát
hiện khi con người ngủ.
● Sóng Alpha (8-15Hz): là loại sóng thường xuất hiện ở người trưởng thành,
xuất hiện nhiều hơn tại phía sau vỏ não người. Thường xuất hiện khi con
người thoải mái và nhắm mắt.
● Sóng Beta (16-31Hz): Xuất hiện đồng đều cả về độ tuổi và tần suất tại các
vùng vỏ não. Là sóng với biên độ thấp nhưng tần số khá lớn, thường xuất
hiện lúc con người đang tập trung suy nghĩ hay lo lắng cao độ.
● Sóng Gamma (> 32Hz): là sóng với tần số lớn nhất và biên độ thấp nhất, là
loại sóng liên quan mật thiết tới các tác vụ cấp cao của con người như những
chức năng của nhận thức. Sóng Gamma xuất hiện nhiều khi con người gặp
stress, căng thẳng và thường được tìm thấy ở các thiên tài về hội họa, thi ca,
.v.v.
● Vì các điện cực được đặt rải ráp xung quanh đầu nên để cụ thể, mỗi channel
đo tại 1 vùng riêng biệt sẽ có 1 quy ước đặt tên riêng. Trong thực tế, số
lượng điện cực gán trên vỏ mũ không cố định, thông thường sẽ là 32 hoặc
64 channel, mỗi bản thiết kế điện cực sẽ có 1 tên riêng quy chuẩn và số
lượng channel cũng khác nhau và được gọi chung là các montage. Ví dụ,
với montage Standard 1005:


Hình 1.2 montage Standard 1005


1 số ví dụ khác:

Hình 1.3 Ví dụ các montage khác

● Reference: mỗi điện cực đo xung điện đều dựa trên sự chênh lệch điện thế
với 1 điểm gọi là reference. Việc chọn điểm reference tại đâu trên đầu cũng
đều gây ảnh hưởng tới kết quả thu được của tín hiệu. Vậy nên, để thống nhất
và tạo ra 1 quy chuẩn nhất định, tại các vị trí sau thường được chọn làm
reference:


o 2 dái tai (earlobes)
o 2 xương chũm (mastoid bonds) - phần xương lồi lên ngay sau tai
o Đỉnh đầu (vertex)

● Epochs: dữ liệu EEG được đo đạc và thu thập trong 1 khoảng thời gian liên
tục và nhất định, tại mỗi điểm thời gian sẽ có tín hiệu điện não thu được tại
mỗi điện cực. 1 Epoch được định nghĩa là tín hiệu thu được trong 1 khoảng
thời gian nhất định. Ví dụ, tín hiệu với sampling rate là 100Hz đo trong 10s
thu được 1 epochs với 100 x 10 = 1000 samples.

Hình 1.4 Ví dụ epochs

● Evoked: đơn giản là trung bình giá trị của nhiều epoch trong 1 khoảng thời
gian nhất định ứng với nhiều channels.
● Đối với các bài tồn EEG classification sẽ có khá nhiều các cách tiếp cận để
xử lí bài tốn. Có thể xử lí bằng việc xây dựng các feature dạng
time-domain,
dạng

frequency-domain
hoặc
cả
2
như
time-frequency-domain, thậm chí dùng cả mạng CNN (với dữ liệu là ma
trận thu được khi biến đổi tín hiệu EEG), ..v.v. Các cơng đoạn chính bao
gồm:
o EDA & Data Preprocessing: khảo sát dữ liệu, visualize và tiền xử lí
dữ liệu (lọc giới hạn miền tần số, giảm thiểu nhiễu, giảm thiểu các tín


hiệu bên ngoài hay remove artifact như nhịp đập của tim, chớp mắt,
...)
o Feature Extraction: dữ liệu ban đầu gọi là raw data, sau khi được tiền
xử lí cần thực hiện 1 số các thao tác để có thể trích rút các feature cụ
thể, từ đó mơ hình sau này sẽ dựa vào đó để "học" từ dữ liệu. Có khá
nhiều các phương pháp về feature extraction với dữ liệu EEG nói
riêng và dữ liệu về tín hiệu (signal) nói chung. 1 số từ khóa mình sẽ
đề cập bên dưới như: time-domain, frequency-domain,
time-frequency-domain, DFT và FFT (Fast Fourier Transform),
Wavelet Transform, .v.v.
o Feature Selection: liên quan đến việc chọn lọc và giảm thiểu số lượng
feature, 1 số khái niệm sẽ đề cập như: PCA, ICA, ..
o Classification: mơ hình phân loại dựa trên các feature đã trích rút
được bên trên, bất kì mơ hình classification nào bạn cũng có thể thử
và áp dụng: SVM, Tree-based model, CNN, ...

2. Nhận dạng người từ điện não đồ bằng cách sử dụng các kỹ
thuật học máy khác nhau với tỷ lệ biên độ giữa các bán cầu

2.1

Tổng quan

Mối liên hệ giữa điện não đồ (EEG) và thông tin mỗi cá nhân đã và đang được
khám phá bởi cộng đồng khoa học. Mặc dù nhận dạng người bằng EEG là một
điểm thu hút các nhà nghiên cứu, nhưng sự phức tạp của các giới hạn nhận thức
bằng cách sử dụng các công nghệ như vậy trong các ứng dụng thế giới thực. Trong
nghiên cứu này, thách thức đã được giải quyết bằng cách giảm độ phức tạp của q
trình thu nhận và phân tích tín hiệu não. Điều này đạt được bằng cách giảm số
lượng điện cực, đơn giản hóa nhiệm vụ quan trọng mà khơng ảnh hưởng đến độ
chính xác.
Sau một khoảng thời gian thư giãn, mỗi đối tượng được gửi trước trực quan một số
ngẫu nhiên có bốn chữ số và sau đó được yêu cầu suy nghĩ về nó trong 10 giây.
Mười lăm thử nghiệm đã được thực hiện với mỗi đối tượng với các giai đoạn thư
giãn và kích thích thị giác trước mỗi phân đoạn nhớ lại tinh thần. Sử dụng một tính
năng có nguồn gốc mới lạ, được gọi là Tỷ lệ biên độ giữa các bán cầu (IHAR),
biểu thị tỷ số biên độ của các cặp điện cực tương ứng theo chiều.


2.2

Quá trình thực nghiệm

Mỗi thử nghiệm thực nghiệm bao gồm ba giai đoạn chính — thư giãn, kích thích
thị giác và nhớ lại con. Nhạc êm dịu được sử dụng để thư giãn cho mỗi đối tượng
nhắm mắt trong 10 giây. Sau đó, một số ngẫu nhiên gồm bốn chữ số (được hiển thị
trên màn hình . Cuối cùng, đối tượng được hướng dẫn tưởng tượng con số được
nhìn thấy trên màn hình trong 10 s khi nhắm mắt. Số bốn chữ số được sử dụng với
giả định nó giúp gợi lên các mẫu tín hiệu não đặc biệt hơn trong các giai đoạn nhớ

lại thị giác và tinh thần. Một thử nghiệm duy nhất bao gồm ba giai đoạn này và các
thử nghiệm được ghi lại liên tục với tốc độ lấy mẫu 128 Hz. Đối với mỗi đối
tượng, 15 thử nghiệm đã được thực hiện, tách các thử nghiệm bằng cách sử dụng
các điểm đánh dấu thời gian.

Hình 2.1 Quá trình thử nghiệm: Mỗi đối tượng trải qua 15 thử nghiệm và mỗi thử
nghiệm bao gồm ba giai đoạn.

2.3

Tăng cường dữ liệu

Tăng cường dữ liệu là một kỹ thuật nhằm tăng tính đa dạng của dữ liệu đào tạo để
cải thiện kết quả và tránh trang bị quá nhiều mà không thu thập dữ liệu mới. Do
thiếu thử nghiệm cho mỗi đối tượng trong chuyên môn của chúng tôi, các kỹ thuật
nâng cao dữ liệu đã được sử dụng để mở rộng tập dữ liệu. Các kỹ thuật này thường
dành riêng cho miền. Do đó, ba kỹ thuật tăng tín hiệu đã được sử dụng để cải thiện
hiệu suất phân loại của dữ liệu cảm biến đeo được đã được sử dụng .


• Jittering: Đây là một quá trình thêm nhiễu ngẫu nhiên vào tín hiệu. Nhiễu
ngẫu nhiên phân phối thơng thường được tạo ra với độ lệch chuẩn 0,05.
• Lấy mẫu ngẫu nhiên: Trong quá trình này, một số mẫu được loại bỏ ngẫu
nhiên, nội suy các mẫu cịn lại khơi phục độ dài ban đầu của tín hiệu.
• Hốn vị: Trong q trình này, vị trí tạm thời của các sự kiện trong cửa sổ
được xáo trộn ngẫu nhiên. 4 đoạn được chọn ngẫu nhiên với độ dài ngẫu
nhiên (tối thiểu 5 mẫu) được thay đổi ngẫu nhiên. Để cho phép thử nghiệm
đối xứng như IHAR, phải duy trì sự căn chỉnh theo thời gian, do đó, hốn vị
giống nhau đã được áp dụng cho tất cả 14 kênh điện cực.


2.4

Tỷ lệ biên độ giữa bán cầu (IHAR)

Có sự bất đối xứng giữa các bán cầu não. Trong giải phẫu thần kinh ở người, sự bất
đối xứng của não có thể được phân loại thành hai loại: (a) sự khác biệt về cơ chế
thần kinh như mật độ tế bào thần kinh, kích thước của các vùng, v.v., và (b) sự
khác biệt về chức năng. Sự bất đối xứng như vậy có thể được nhìn thấy trong sự
phân bố cơng suất của dữ liệu điện não đồ. Tất cả các hệ thống đặt điện cực tiêu
chuẩn (10-20, 10-10, 10-5) đều đối xứng song phương qua đường inion-nasion,
mặt phẳng trung tuyến hoặc mặt phẳng sagittal. Ngoài ra, hầu hết các kết quả thử
nghiệm đã chỉ ra rằng dữ liệu miền thời gian chứa các khía cạnh phân biệt như các
đặc trưng Tự động hồi quy (AR), các đỉnh phù hợp , và các đặc trưng thống kê.
IHAR cũng được tính trong miền thời gian, và các cặp điện cực đối xứng là cần
thiết. Phương pháp khai thác tính năng được đề xuất có hai giai đoạn: (1) làm mịn
và (2) tính toán tỷ lệ của các cặp kênh tương ứng. Thay vì sử dụng
frequency-domain low-pass filter- ing để làm mịn, bộ lọc trung bình động (MA) đã
được sử dụng để loại bỏ các tần số cao và nhiễu ngẫu nhiên. Bộ lọc MA, chỉ được
áp dụng trong phân tích của cho đặc trưng IHAR, là một cách hiệu quả để trích
xuất tín hiệu tần số thấp so với frequency-domain low-pass filters. Nó cũng có thể
được tính tốn nhanh chóng, do đó, thích hợp cho các hệ thống nhúng khiêm tốn,
chẳng hạn như triển khai thực tế dự kiến. Hơn nữa, nhiễu đường dây điện có thể dễ
dàng loại bỏ khỏi tín hiệu thô thu được.

2.5

Các kỹ thuật học máy dùng để phân loại


Không giống như xác thực, nhận dạng người là một vấn đề phân loại đơn giản, vì

vậy các thuật tốn ML truyền thống có thể được áp dụng :





Linear Discriminant Analysis (LDA).
Quadratic Discriminant Analysis (QDA)
Support Vector Machine (SVM)
k-Nearest Neighbor (kNN)

2.6

Kết quả

Sau khi chọn các thuật toán ML tốt nhất trong số các ứng viên được thử nghiệm,
độ chính xác đã được kiểm tra cho từng cặp điện cực. Kết quả có thể được nhìn
thấy trong Bảng 1. Độ chính xác thử nghiệm cao nhất, 94,7 ± 1,1%, là từ cặp điện
cực FC5-FC6 cho QDA với giai đoạn thư giãn. Theo kết quả, cặp điện cực
FC5-FC6 mang lại độ chính xác trên 90% cho hầu hết các thuật toán ML. Các cặp
điện cực fron-tal khác F7-F8 và AF3-AF4 là cao nhất tiếp theo. Điện cực chẩm
(O1-O2) cho thấy độ chính xác kém nhất, 43,5 ± 2,8% đối với SVM tuyến tính với
nhiệm vụ thư giãn.

Bảng 1 : Kết quả đo độ chính xác trên mỗi cặp điện cực


3. Tổng kết
Trong nghiên cứu này, đã triển khai thành cơng một tính năng mới, tỉ lệ biên độ
liên bán cầu (IHAR), để phát hiện thông tin đặc trưng của mỗi cá nhân và phân biệt

những người sử dụng tín hiệu EEG. Với tính năng được đề xuất, có thể đạt được độ
chính xác cao nhất với số lượng điện cực thấp cho một nhiệm vụ tương đối đơn
giản. Hơn nữa, cách tiếp cận này vượt trội hơn các cách tiếp cận tương tự với ít sức
mạnh tính tốn hơn, đề xuất triển khai trong các thiết bị di động có nhúng bộ vi xử
lý cơng suất thấp. Những kết quả đầy hứa hẹn này cho thấy rằng cách tiếp cận này
có các ứng dụng thực tế trong thế giới thực. Ngoài ra, cách tiếp cận này mang lại
sự thuận tiện hơn khi đào tạo hệ thống vì khơng cần thu thập số lượng lớn các thử
nghiệm để đào tạo. Trong cách tiếp cận được đề xuất, độ chính xác cao nhất đã đạt
được đối với hai cặp điện cực phía trước — FC5-FC6 và F7-F8. Là một q trình
thực hiện nhiệm vụ để thu thập dữ liệu điện não đồ, thư giãn là tốt nhất theo kết
quả.Các thuật toán ML phù hợp nhất để phân loại là QDA, linear SVM, quatratic
SVM, Gaussian SVM, and kNN. Hơn nữa, bố trí điện cực chọn lọc AF3, AF4, F7
và F8 có thể được sử dụng để phát triển thiết kế phần cứng chặt chẽ hơn với hiệu
suất cao. Tuy nhiên, độ chính xác sẽ bị ảnh hưởng nếu số lượng đối tượng tăng lên.
Ngồi ra, các mẫu tín hiệu não có thể thay đổi đáng kể theo thời gian, điều này sẽ
ảnh hưởng đến hiệu suất. Để tiếp tục nghiên cứu, phương pháp này có thể được
kiểm tra thêm bằng hệ thống điện não đồ cấp lâm sàng, và cần được nghiên cứu để
kiểm tra xem liệu số lượng điện cực có thể giảm hơn nữa hay không.

4. Tài liệu tham khảo
[1] />[2] />


×