Tải bản đầy đủ (.pdf) (117 trang)

ứng dụng phân tích thành phần độc lập trong phân tích tín hiệu não bộ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (4.62 MB, 117 trang )

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN


IHJK


HỒ THẾ KHƯƠNG





ỨNG DỤNG PHÂN TÍCH THÀNH PHẦN ĐỘC
LẬP TRONG PHÂN TÍCH TÍN HIỆU NÃO BỘ

CHUYÊN NGÀNH: VẬT LÝ VÔ TUYẾN VÀ ĐIỆN TỬ - KỸ THUẬT
MÃ SỐ: 60 44 03



LUẬN VĂN THẠC SĨ VẬT LÝ VÔ TUYẾN VÀ ĐIỆN TỬ - KỸ THUẬT





NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS NGUYỄN HỮU PHƯƠNG







TP. HỒ CHÍ MINH – NĂM 2009

LỜI CẢM ƠN

Trong thời gian gần ba năm học chương trình cao học với nhiều khó khăn thử
thách, bên cạnh tôi luôn có những lời quan tâm, động viên từ phía gia đình, quý thầy
cô, bạn bè để giúp tôi vượt qua và hoàn thành luận văn tốt nghiệp này.

Đầu tiên tôi chân thành cảm ơn đến thầy Nguyễn Hữu Phương, thầy đã đề
nghị tôi hướng nghiên cứu kỹ thuật ICA và đưa vào ứng dụng trong lĩnh vực y sinh.
Trong suố
t quá trình học tập cũng như làm luận văn, thầy đã tận tình giúp đỡ tôi về
chuyên môn, tạo mọi điều kiện thuận lợi trong học tập để tôi có thể hoàn thành chương
trình cao học và luận văn tốt nghiệp này.

Tôi xin chân thành cảm ơn quý thầy cô trong Khoa Điện Tử – Viễn Thông đã
giúp đỡ tôi trong quá trình học tập và thực hiện luận văn.

Tôi xin chân thành cảm ơn gia đình, bạn bè và đồng nghiệp đã động viên, tạo
điều kiện và hỗ trợ tôi trong suốt thời gian qua.

Mặc dù đã có nhiều cố gắng nhưng do kiến thức còn hạn chế và phạm vi đề tài
có giới hạn nên nội dung đề tài chỉ được thực hiện ở một mức độ nào đó và chắc rằng
sẽ còn nhiều thiếu sót. Kính mong quý thầy cô cùng các bạn góp ý để đề tài được tốt
h
ơn.






ỨNG DỤNG PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP TRONG PHÂN TÍCH TÍN HIỆU NÃO BỘ

GVHD: PGS.TS NGUYỄN HỮU PHƯƠNG
HVTH: HỒ THẾ KHƯƠNG
1
MỤC LỤC

MỤC LỤC 1

Danh mục các ký hiệu, các chữ viết tắt 3
Danh mục các hình vẽ, đồ thị 4
MỞ ĐẦU 6
Chương 1 – PHẦN GIỚI THIỆU 9
1.1. GIỚI THIỆU 9
1.2. BỐ CỤC CÁC CHƯƠNG 11
Chương 2 – PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP ICA 13
2.1. ĐỘNG LỰC THÚC ĐẨY SỰ PHÁT TRIỂN CỦA ICA 13
2.2. ĐỊNH NGHĨA ICA 19
2.2.1. ICA dưới dạng xấp xỉ của mô hình sản sinh 19
2.2.2. Các điều kiện cho ICA 21
2.2.3. Tính không xác định của ICA 22
2.2.4. Quy tâm các biến 23
2.3. MINH HỌA ICA 24
2.4. ICA VÀ TRẮNG HÓA 28
2.4.1. Phi tương quan và trắng hóa 28

2.4.2. Làm trắng hóa chỉ là một nửa của ICA 30
2.5. CÁC BIẾN GAUSS 32
2.6. TIỀN XỬ LÝ CHO ICA 34
2.6.1. Tính độc lập của các thành phần 34
2.6.2. Cơ bản về ước lượng ICA 38
2.6.3. Tiền xử lý cho ICA 46
Chương 3 – ỨNG DỤNG ICA TRONG PHÂN TÍCH TÍN HIỆU NÃO BỘ 50
3.1. CƠ BẢN VỀ ĐIỆN NÃO ĐỒ 50
ỨNG DỤNG PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP TRONG PHÂN TÍCH TÍN HIỆU NÃO BỘ

GVHD: PGS.TS NGUYỄN HỮU PHƯƠNG
HVTH: HỒ THẾ KHƯƠNG
2
3.1.1 Cách mắc điện cực và các kiểu đạo trình 52
3.1.2. Phân biệt các sóng 59
3.1.3. Xác định sóng dựa vào tần số 60
3.1.4. Xác định sóng dựa vào hình dạng 62
3.1.5. Các dạng sóng phức hợp 63
3.1.6. Nhiễu 65
3.1.7. Các biến thể bình thường 67
3.1.8. Khác biệt theo vùng trên bản ghi điện não 69
3.1.9 Các phương thức hoạt hóa 71
3.2. CÁC BƯỚC THỰC HIỆN CỦA CHƯƠNG TRÌNH 73
3.2.1. Nhập dữ liệu 73
3.2.2. Thiết lập thông số ICA 77
3.2.3. Phân tích dữ liệu 84
3.2.4. Mô phỏng kết quả qua giao diện ảnh 85
3.3. GIẢI THUẬT CỦA CHƯƠNG TRÌNH 89
3.3.1. Các bước thực hiện chính của chương trình 89
3.3.2. Giải thuật của chương trình 92

Chương 4 – MỘT SỐ KẾT QUẢ THỰC HIỆN 93
Chương 5 – KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 111
TÀI LIỆU THAM KHẢO 114







ỨNG DỤNG PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP TRONG PHÂN TÍCH TÍN HIỆU NÃO BỘ

GVHD: PGS.TS NGUYỄN HỮU PHƯƠNG
HVTH: HỒ THẾ KHƯƠNG
3
Danh mục các ký hiệu, các chữ viết tắt
1. BSS: Blind Source Separation – Tách nguồn mù.
2. Decorrelation – Giải tương quan.
3. EEG: Electroencephalogram – Điện não đồ.
4. EVD: Eigenvalue Decomposition – Phân tích trị riêng.
5. ICA: Independent Component Analysis – Phân tích thành phần độc lập.
6. Joint pdf: Joint probability density function – Hàm mật độ sác xuất kết hợp.
7. MEG: Magnetoencephalography - Phương pháp từ não đồ.
8. MRI: Magnetic Resonnance Imaging - Phương pháp chụp ảnh cộng hưởng từ hạt
nhân.
9. PCA: Principle Component Analysis – Phân tích thành phần chính.
10. Pdf: Probability density function – Hàm mật độ sác xuất.
11. PET: Positron Emission Topography - Phương pháp chụp ảnh cắt lớp phát xạ
12. Uncorrelatedness – Phi tương quan.
13. Whitening – Làm trắng.












ỨNG DỤNG PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP TRONG PHÂN TÍCH TÍN HIỆU NÃO BỘ

GVHD: PGS.TS NGUYỄN HỮU PHƯƠNG
HVTH: HỒ THẾ KHƯƠNG
4
Danh mục các hình vẽ, đồ thị
Hình 2.1 Các tín hiệu audio ban đầu s
i
(t)
Hình 2.2 Các trộn lẫn x
i
(t) của các tín hiệu ở hình 2.1
Hình 2.3 Các xấp xỉ
ˆ
()
i
st từ các tín hiệu ban đầu s
i
(t)

Hình 2.4 Các hàm cơ sở trong ICA của các ảnh tự nhiên
Hình 2.5 Phân bố kết hợp của các thành phần độc lập s
1
và s
2
có phân bố đồng nhất
Hình 2.6 Phân bố kết hợp của các trộn lẫn x
1
và x
2

Hình 2.7 Mật độ của một thành phần độc lập siêu gauss
Hình 2.8 Phân bố kết hợp của các trộn lẫn s
1
và s
2
Hình 2.9 Phân bố kết hợp của các trộn lẫn x
1
và x
2
, có được từ các thành phần độc lập
siêu gauss
Hình 2.10 Phân bố kết hợp của trộn lẫn được làm trắng của các thành phần độc lập có
phân bố đều
Hình 2.11 Phân bố đa biến của hai biến gauss độc lập
Hình 2.12 Phân bố đa biến của hai biến gauss độc lập
Hình 2.13 Phân bố kết hợp của sự trộn trắng hóa
Hình 3.1 Hệ thống đặt điện cực ghi 10-20 quốc tế (international 10-20 system)
Hình 3.2 Cách đặt điện cực theo kiểu 21 kênh
Hình 3.3 Cách đặt điện cực theo kiểu 36 kênh

Hình 3.4 Cách đặt điện cực theo kiểu 74 kênh
Hình 3.5 Giao diện chính
Hình 3.6 Chọn file EEG
Hình 3.7 Những tham số EEG
Hình 3.8 Chọn đường dẫn để lưu dữ liệu
Hình 3.9 Làm nhẵn những tín hiệu thu
Hình 3.10 Chọn đường dẫn ngõ ra
ỨNG DỤNG PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP TRONG PHÂN TÍCH TÍN HIỆU NÃO BỘ

GVHD: PGS.TS NGUYỄN HỮU PHƯƠNG
HVTH: HỒ THẾ KHƯƠNG
5
Hình 3.11 Cửa sổ chọn tham số ban đầu
Hình 3.12 Chọn cách thức lưu trữ dữ liệu
Hình 3.13 Chọn thư mục gốc
Hình 3.14 File mẫu và câu hỏi để chọn dữ liệu
Hình 3.15 Cửa sổ chọn tham số hoàn chỉnh
Hình 3.16 Những chọn lựa cho thuật toán ICA
Hình 3.17 Chọn file tham số
Hình 3.18 Chạy phân tích
Hình 3.19 Quá trình phân tích
Hình 3.20 EEG trình bày qua giao diện GUI
Hình 3.21 Chọn file vị trí kênh EEG
Hình 3.22 Thành phần trị trung bình của những bộ dữ liệu
Hình 3.23 Nhìn mở r
ộng hình vẽ thành phần 032
Hình 4.1 Kết quả hiển thị thành phần 001-002-003-004
Hình 4.2 Kết quả hiển thị thành phần 005-006-007-008
Hình 4.3 Kết quả hiển thị thành phần 009-010-011-012
Hình 4.4 Kết quả hiển thị thành phần 013-014-015-016

Hình 4.5 Kết quả hiển thị thành phần 017-018-019-020
Hình 4.6 Kết quả hiển thị thành phần 021-022-023-024
Hình 4.7 Kết quả hiển thị thành phần 025-026-027-028
Hình 4.8 Kết quả hiển thị thành phần 029-030-031-032






ỨNG DỤNG PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP TRONG PHÂN TÍCH TÍN HIỆU NÃO BỘ

GVHD: PGS.TS NGUYỄN HỮU PHƯƠNG
HVTH: HỒ THẾ KHƯƠNG
6
MỞ ĐẦU

Phân tích thành phần độc lập ICA (Independent Component Analysis) là một kỹ
thuật tính toán và thống kê để phát hiện những thừa số tìm ẩn tồn tại dưới những tập
hợp biến, phép đo hay tín hiệu ngẫu nhiên. ICA chỉ rõ tính chất một mô hình tổng quát
cho dữ liệu đa biến quan sát được, mà dạng đưa ra điển hình là một bộ cơ sở dữ liệu
mẫu rộng lớn. Trong một mô hình, những biế
n dữ liệu được cho rằng là những hỗn hợp
tuyến tính hay phi tuyến tính của một vài biến tìm ẩn chưa biết, và phương thức trộn
cũng chưa biết. Những biến tìm ẩn được cho rằng phi gauss và độc lập với nhau, và
chúng được gọi là những thành phần độc lập của dữ liệu quan sát được. Những thành
phần độc lập này cũng được gọi là những nguồn hay những thừa số có thể được tìm
thấy bằng ICA.

ICA có thể được xem là sự mở rộng của phân tích thành phần chính và phân tích

thừa số. ICA là một kỹ thuật mạnh hơn rất nhiều về khả năng tìm kiếm những thừa số
hay nguồn tìm ẩn mà những phương pháp cổ điển thất bại hoàn toàn.

Dữ liệu được phân tích bằng ICA có thể bắt nguồn từ nhi
ều lĩnh vực ứng dụng
khác nhau, bao gồm ảnh kỹ thuật số, cơ sở dữ liệu tài liệu, cũng như chỉ số kinh tế và
số đo thần kinh. Trong nhiều trường hợp, những số đo được đưa ra là một tập hợp
những tín hiệu tương tự hay chuỗi thời gian; phân chia nguồn mù sử dụng đặc tính của
vấn đề này. Một ví dụ
tiêu biểu là trộn lẫn những tín hiệu thoại cùng lúc được phát ra
từ một vài micro, những sóng não bộ thu từ những đầu dò, những tín hiệu vô tuyến đến
từ một điện thoại di động, hay những chuỗi thời gian song song nhận được từ một vài
quá trình kỹ nghệ.

ỨNG DỤNG PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP TRONG PHÂN TÍCH TÍN HIỆU NÃO BỘ

GVHD: PGS.TS NGUYỄN HỮU PHƯƠNG
HVTH: HỒ THẾ KHƯƠNG
7
Kỹ thuật ICA là một phát minh mới gần đây. Nó đã được giới thiệu lần đầu tiên
vào đầu thập niên 80 trong nội dung về mô hình mạng nơron. Vào giữa thập niên 90,
một vài thuật toán mới thành công lớn được giới thiệu bởi một vài nhóm nghiên cứu,
cùng với những chứng minh ấn tượng căn cứ vào những bài toán như buổi tiệc
cocktail, ở đó những dạng sóng hội thoại riêng biệt có thể được tìm thấy từ những trộn
lẫn của chúng. ICA trở thành một trong những chủ đề mới hấp dẫn, kể cả trong lĩnh
vực mạng nơron, nhất là nghiên cứu chưa được quan tâm, và tổng quát hơn trong ứng
dụng xử lý tín hiệu và thống kê. Báo cáo về những ứng dụng thực tế của ICA dựa trên
xử lý tín hiệu sinh học, tách tín hiệu âm thanh, viễn thông, chuẩn đoán sự hư hỏng,
trích đặc trưng, phân tích chuỗi thời gian tài chính và sự khai thác dữ liệu bắt đầu xuất
hiện.


Nhiều bài báo về ICA được công bố suốt hơn 30 năm qua trong rất nhiều tạp chí
và hội nghị bắt nguồn từ nhiều lĩnh vực như xử lý tín hiệu, mạng nơron nhân tạo, khoa
học thống kê, lý thuyết thông tin và nhiều lĩnh vực ứng dụng khác. Một vài hội th
ảo và
cuộc họp đặc biệt về ICA cũng được tổ chức gần đây. Tập hợp những bài báo cũng như
công trình nghiên cứu về ICA, phân chia nguồn mù và những chủ đề liên quan cũng đã
xuất hiện. Tuy nhiên, lợi ích đối với những đọc giả là những đề tài hiện nay tập trung
vào một vài khía cạnh chọn lựa của những phương pháp ICA. Trong những bài báo
khoa học ngắn và những ch
ương sách, toán học và cơ bản thống kê thường lại không
bao hàm, điều này làm rất khó để có một tiếp cận rộng rãi và am hiểu tường tận chủ đề
kỹ thuật này một cách rõ ràng.

Một trong những ứng dụng thực tế và cụ thể của ICA là ứng dụng ICA trong
phân tích tín hiệu não bộ. Tín hiệu não bộ được đo bằng một điện não đồ EEG
(Electroencephalogram) với các tần số
khác nhau. Điện cực được đặt ở vị trí thích hợp
trên da đầu để ghi các xung động xuất phát từ não. Tín hiệu thu được từ các điện cực là
ỨNG DỤNG PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP TRONG PHÂN TÍCH TÍN HIỆU NÃO BỘ

GVHD: PGS.TS NGUYỄN HỮU PHƯƠNG
HVTH: HỒ THẾ KHƯƠNG
8
tổng hợp từ nhiều tín hiệu não riêng biệt và bao gồm cả nhiễu. Có hai loại nhiễu chính:
nhiễu do bệnh nhân gây ra với các quá trình sinh lý của cơ thể, nhiễu do yếu tố bên
ngoài như dụng cụ, dòng điện, … Một số loại nhiễu thường gặp như: nháy mắt liên tục,
mắt vận động sang bên, vận động của lưỡi, nhiễu do co cơ, nhiễu do mạch, khịch mũi,
nhiễu mồ hôi, do điện cực tiếp xúc kém, nhiễu kim loại, nhiễu do chạm điện cực kim
loại, nhiễu do dòng tĩnh điện. Bài toán đặt ra là phải tìm ra các tín hiệu não bộ riêng

biệt ban đầu từ các tín hiệu thu được ở các điện cực. Phân tích thành phần độc lập đã
giải được bài toán trên bằng cách loại trừ các tín hiệu nhiễu và tách ra các tín hiệu não
cần tìm.

Một trong những công cụ mạnh mẽ
được sử dụng để thực hiện cho nhiệm vụ
trên đó là phần mềm GroupICA, GroupICA là một hộp công cụ và có giao diện hình
ảnh, chạy trên môi trường MATLAB cho những thu thập xử lý thử nghiệm riêng
và/hay dữ liệu EEG chuẩn của bất kỳ số kênh truyền. Những chức năng có thể dùng
được bao gồm dữ liệu EEG, nhập kênh truyền và thông tin sự kiện, sự hình dung dữ
liệu, xử lý (bao gồm loạ
i trừ nhiễu, lọc, chọn miền, và chuẩn hóa), phân tích thành
phần độc lập (ICA) và những phân tích thời gian/tần số bao gồm kênh truyền và thành
phần tạp giao với nhau hỗ trợ bởi những phương pháp thống kê bậc cao từ việc lấy mẫu
dữ liệu.








ỨNG DỤNG PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP TRONG PHÂN TÍCH TÍN HIỆU NÃO BỘ

GVHD: PGS.TS NGUYỄN HỮU PHƯƠNG
HVTH: HỒ THẾ KHƯƠNG
9
Chương 1 – PHẦN GIỚI THIỆU
1.1. GIỚI THIỆU

Điện não đồ là dụng cụ thử nghiệm y học ghi lại những xung điện từ các neuron
trong não có thể nhận được từ da đầu. Đa số thử nghiệm điện não đồ là để định dạng
chứng động kinh.
1875 Richard Caton, bác sĩ vùng Liverpool, viết trong báo y học Anh về phát
hiện điện trường trong não của thỏ và khỉ.
1890 Beck công bố thí nghiệm cho thấy điệ
n trong não của chó và thỏ dao động
khi có thay đổi ánh sáng.

1812 Vladimir Pravdich-Neminsky, bác sĩ Nga, trình bày điện não đồ đầu tiên
và ghi được xung điện neuron của não chó.
1914 Cybulsky và Jelenska-Macieszyna chụp ảnh được điện não đồ của cơn
động kinh thí nghiệm.
1920 Hans Berger, bác sĩ Đức dùng điện não đồ cho con người. Từ EEG do ông
đặt ra. Edgar Douglas Adrian sau đó tiếp nối công trình của ông.
1934 Bác sĩ Fisher và Lowenback ghi được sóng bất thường trên điện não đồ
của bệnh nhân bị động kinh.
1935 Các chuyên khoa Gibbs, Davis và Lennox nhận ra được các loạt sóng bất
th
ường của bệnh nhân bị động kinh - ngay cả lúc chưa lên cơn. Đây là bước ngoặc lớn
trong khoa nghiên cứu dùng điện não đồ để chuẩn đoán bệnh động kinh. Cùng năm,
nhà thương lớn tại Massachusetts bắt đầu sử dụng điện não đồ. Franklin Offner, giáo
sư lý sinh đại học Northwestern thiết kế điện não đồ với khả năng ghi nét mực của
sóng trên giấy cuộn.
1947 Hội Nghiên c
ứu điện não đồ Hoa Kỳ thành lập và mở hội nghị quốc tế về
điện não đồ.
ỨNG DỤNG PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP TRONG PHÂN TÍCH TÍN HIỆU NÃO BỘ

GVHD: PGS.TS NGUYỄN HỮU PHƯƠNG

HVTH: HỒ THẾ KHƯƠNG
10
1957 Aserinsky và Kleitmean trình bày sóng điện não đồ của não người đang
mơ ngủ (cấp độ ngủ với mắt di chuyển nhanh). [5]
Lịch sử phát triển của điện não đồ đã xuất hiện từ rất lâu vào giữa thập niên 80
của thế kỷ XIX và phát triển mạnh từ năm 1920. Tuy nhiên, việc ứng dụng phương
pháp phân tích thành phần độc lập cho lĩnh vực này chỉ được áp dụng trong thời gian
gần đây vào những năm 80 của thế kỷ XX, tức khoảng gần một thế kỷ sau khi điện não
đồ xuất hiện. Kỷ thuật ICA chỉ được giới thiệu lần đầu tiên trong một hội thảo về nội
dung mạng nơron và bài toán kinh điển là bài toán bữa tiệc nhằm tách tín hiệu âm
thanh từ những nguồn thu tín hiệu hỗn hợp. Phân tích thành phần độc lập ICA được
chính thức ứng dụng trong việc tách tín hiệu não bộ từ điện não đồ từ năm 1996.
Makeig đã áp dụng thuật toán Infomax cổ điển cho nguồn dữ liệu EEG và ERP chỉ ra
rằng thuật toán có thể trích những hoạt hóa EEG và tách nhiễu. Đến năm 1997 Jung đã
khẳng định thuật toán Infomax mở rộng có thể phân tích tuyến tính những tín hiệu
nhiễu EEG như nhiễu kim loại, cử động mắt và nhiễu do nhịp đập của tim vào trong
thành phần độc lập với những phân bố siêu Gauss. Cũng trong năm này, McKeown đã
dùng thuật toán ICA mở rộng để khám phá ra mối liên hệ giữa hoạt động não người
trong dữ liệu fMRI. [16]
Bên cạnh sử dụng điện não đồ để nghiên cứu về hoạt động của não bộ còn có
một số phương pháp khác cũng được ứng dụng phổ biến hiện nay như: MRI (Magnetic
Resonnance Imaging): Phương pháp chụp ảnh cộng hưởng từ hạt nhân; MEG
(Magnetoencephalography): Phương pháp từ não đồ; PET (Positron Emission
Topography): Phương pháp chụp ảnh cắt lớp phát xạ. Ở đây chúng ta chỉ tập trung ở
việc ứng dụng ICA cho EEG (Electroencephalography) là phương pháp đo dòng điện
chạy qua các điện cực đặt trên da đầu.
Hiện nay, những thành tựu nghiên cứu trong các lĩnh vực không chỉ dừng lại ở
việc phục vụ
riêng cho đối tượng mình nghiên cứu mà có sự hỗ trợ và phục vụ cho các
lĩnh vực khác với mục đích cuối cùng là phục vụ cho con người. Việc ứng dụng ICA

ỨNG DỤNG PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP TRONG PHÂN TÍCH TÍN HIỆU NÃO BỘ

GVHD: PGS.TS NGUYỄN HỮU PHƯƠNG
HVTH: HỒ THẾ KHƯƠNG
11
cho đối tượng EEG cũng nằm trong số đó. Đó là sự kết hợp giữa các ngành học khác
nhau như y sinh, tin học, toán học, vật lý, điện tử viễn thông … nhằm cùng nghiên cứu
đối tượng là bộ não người. Trên cơ sở biết được những hoạt động của bộ não người
cùng những dấu hiệu bất thường để có thể chuẩn đoán và điều trị bệnh.
Trong thời gian qua, nhiều nhóm trên thế giới đã tiến hành nghiên cứu lĩnh vực
mới mẽ này và đã thành công khi cho ra đời những phần mềm được viết trên ngôn ngữ
Mathlab. Từ đó, thực hiện việc ứng dụng kỹ thuật phân tích thành phần độc lập (ICA)
cho các tín hiệu EEG, MEG, MRI, Những công cụ này có thể chạy trên nhiều hệ
điều hành như Linux, Window và Mac OS…Với giao diện người dùng trực quan GUI,
các công cụ đã giúp người s
ử dụng xử lý tín hiệu EEG mật độ cao và dữ liệu não bộ
một cách linh hoạt và tương tác. Một số công cụ đã được sử dụng và phổ biển rộng rãi
đến cho mọi người hiện nay như: EEGLAB, MVAR-ICA, GroupICA , UDel ICA, …
Tại Việt Nam, lĩnh vực nghiên cứu mới này đã được xâm nhập trong thời gian
gần đây nhưng đối tượng nghiên về lĩnh vực này chưa được nhiều mặc dù tính thực tế
và hiệu quả của phương pháp là rất hay. Tuy là phương pháp mới nhưng để hiểu rõ và
thực hiện một cách hoàn chỉnh thì đòi hỏi phải có một thời gian dài nghiên cứu thực
hiện. Giới hạn trong một đề tài luận văn cao học, nội dung trình bày xin được phép giới
hạn theo hướng chỉ là tiếp cận vấn đề để làm tiền đề cho những nghiên sâu hơn về sau.
Cụ
thể, nội dung của luận văn được trình bày theo bố cục như sau:

1.2. BỐ CỤC CÁC CHƯƠNG

Chương 1: Giới thiệu.

Hệ thống lại các quá trình cũng như lịch sử nghiên cứu phương pháp phân tích
thành phần độc lập cũng như việc ứng dụng phương pháp này để phân tích tín hiệu não
bộ EEG. Những cơ sở và tính cần thiết để thực hiện luận văn này.

ỨNG DỤNG PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP TRONG PHÂN TÍCH TÍN HIỆU NÃO BỘ

GVHD: PGS.TS NGUYỄN HỮU PHƯƠNG
HVTH: HỒ THẾ KHƯƠNG
12
Chương 2: Phân tích thành phần độc lập ICA.
Đây là chương tập trung trình bày những cơ sở lý thuyết về toán học của
phương pháp phân tích thành phần độc lập ICA. Những định nghĩa một cách cụ thể về
ICA, trắng hóa, các biến Guass cũng như bước tiền xử lý cho ICA cũng sẽ được trình
bày trong chương này.

Chương 3: Ứng dụng ICA trong phân tích tín hiệu não bộ.
Chương này sẽ đưa ra một cái nhìn cơ bản và t
ổng thể về điện não đồ EEG. Lần
lượt trong chương các nội dung sau sẽ trình tự được trình bày: cách mắc các điện cực,
các dạng sóng và cách nhận dạng, các loại nhiễu thường gặp và các khác biệt theo vùng
trên bản ghi điện não.
Đặc biệt trong chương này sẽ đưa ra nội dung thực nghiệm về cách thức để giải
quyết vấn đề tách tín hiệu não bộ thông qua các bước thực hiện củ
a chương trình được
viết trên ngôn ngữ Mathlab.

Chương 4: Một số kết quả thực hiện.
Trình bày những kết quả mô phỏng được thực hiện của chương trình.

Chương 5: Kết luận và hướng phát triển.









ỨNG DỤNG PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP TRONG PHÂN TÍCH TÍN HIỆU NÃO BỘ

GVHD: PGS.TS NGUYỄN HỮU PHƯƠNG
HVTH: HỒ THẾ KHƯƠNG
13
Chương 2 – PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP ICA

Trong chương này sẽ trình bày các khái niệm cơ bản về ICA và một số ứng
dụng thực tế. Chúng đóng vai trò trình bày tốt nhất về lý thuyết toán học của ICA,
thường được cho dưới dạng một bài toán xấp xỉ thống kê. Sau đó, chúng ta sẽ xem xét
các điều kiện mà mô hình này có thể được xấp xỉ, và hơn nữa, và cái gì sẽ được xấp xỉ.

Sau các định nghĩa cơ bản này, ta thảo luậ
n về sự liên kết giữa ICA và các
phương pháp tương tự nổi tiếng khác như phân tích thành phần chính PCA (Principle
Component Analysis), giải tương quan (decorrelation), làm trắng (whitening), và xem
xét các mặt hạn chế và tích cực của các phương pháp này so với ICA.

2.1. ĐỘNG LỰC THÚC ĐẨY SỰ PHÁT TRIỂN CỦA ICA [8]

Bài toán cocktail party:


Hãy tưởng tượng rằng bạn ở trong một căn phòng có ba người đang nói cùng
một lúc. Căn phòng này có ba microphone được đặt ở ba vị trí khác nhau. Các
ỨNG DỤNG PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP TRONG PHÂN TÍCH TÍN HIỆU NÃO BỘ

GVHD: PGS.TS NGUYỄN HỮU PHƯƠNG
HVTH: HỒ THẾ KHƯƠNG
14
microphone cho ra ba tín hiệu theo thời gian được thu lại x
1
(t), x
2
(t) và x
3
(t). Mỗi tín
hiệu thu được này là tổng của các tín hiệu tiếng nói từ ba người đang nói, kí hiệu s
1
(t),
s
2
(t) và s
3
(t), và được biểu diễn dưới dạng:

1111122133
() () () ()
x
tastastast=++ (2.1)
2211222233
() () () ()
x

tastastast=++ (2.2)
3311322333
() () () ()
x
tastastast=++ (2.3)
Trong đó, a
ij
= 1,2,3 là các thông số phụ thuộc vào các khoảng cách từ
microphone đến người nói. Bài toán được đặt ra là chúng ta phải xấp xỉ các tín hiệu
tiếng nói ban đầu s
i
(t) mà chỉ sử dụng các tín hiệu được thu lại x
i
(t). Đây chính là bài
toán bữa tiệc (cocktail party problem). Để đơn giản mô hình bài toán, ta sẽ bỏ qua các
độ trễ về thời gian cũng như các yếu tố khác (nhiễu, … ).

Hình 2.1 Các tín hiệu audio ban đầu s
i
(t)
ỨNG DỤNG PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP TRONG PHÂN TÍCH TÍN HIỆU NÃO BỘ

GVHD: PGS.TS NGUYỄN HỮU PHƯƠNG
HVTH: HỒ THẾ KHƯƠNG
15

Để minh họa, hình 2.1 biểu diễn các tín hiệu tiếng nói ban đầu s
i
(t), hình 2.2 là
các tín hiệu trộn lẫn x

i
(t). Bài toán được đặt ra là phải khôi phục được các tín hiệu
nguồn s
i
(t) như ở hình 2.1 mà chỉ sử dụng dữ liệu x
i
(t) ở hình 2.2.

Thật ra, nếu biết được các thông số trộn lẫn a
ij
, ta có thể giải các phương trình
tuyến tính (2.1), (2.2) và (2.3) ở trên. Tuy nhiên, cần phải nhấn mạnh rằng chúng ta
hoàn toàn không biết a
ij
cũng như là s
i
(t), do đó bài toán sẽ phức tạp hơn.

Một cách tiếp cận để giải bài toán này là sử dụng các tính chất thống kê của các
tín hiệu s
i
(t) để xấp xỉ cả a
ij
lẫn s
i
(t). Thật ra, ta hoàn toàn có thể giả sử rằng s
1
(t), s
2
(t)

và s
3
(t) là độc lập thống kê ở mỗi thời điểm t. Hình 2.3 cho thấy ba tín hiệu được xấp xỉ
bởi các phương pháp ICA. Như chúng ta thấy, chúng (hình 2.3) rất giống với các tín
hiệu nguồn ban đầu (hình 2.1).

ỨNG DỤNG PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP TRONG PHÂN TÍCH TÍN HIỆU NÃO BỘ

GVHD: PGS.TS NGUYỄN HỮU PHƯƠNG
HVTH: HỒ THẾ KHƯƠNG
16

Hình 2.2 Các trộn lẫn x
i
(t) của các tín hiệu ở hình 2.1

ỨNG DỤNG PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP TRONG PHÂN TÍCH TÍN HIỆU NÃO BỘ

GVHD: PGS.TS NGUYỄN HỮU PHƯƠNG
HVTH: HỒ THẾ KHƯƠNG
17

Hình 2.3 Các xấp xỉ
ˆ
()
i
st từ các tín hiệu ban đầu s
i
(t)


ICA ban đầu được phát triển để giải quyết các bài toán tương tự như bài toán
bữa tiệc, tách riêng các tín hiệu từ đoàn hành quân (xe, người, chuyển động … ) trong
quân sự. Do sự quan tâm đến lý thuyết ICA ngày càng tăng, ICA ngày càng có những
ứng dụng trong nhiều lĩnh vực khác nhau.

Ví dụ, các tín hiệu điện não được cho bởi một điện tâm đồ EEG
(Electroencephalogram – EEG). Dữ liệu EEG bao gồm bản ghi các tín hiệu điện thế ở
nhiều vùng khác nhau trên da đầu. Các tín hiệu điện này là trộn lẫn của các tín hiệu
thành phần của não bộ và hoạt động của các cơ. Trường hợp này cũng tương tự như bài
toán bữa tiệc: chúng ta muốn tìm các thành phần ban đầu của các hoạt động của não bộ
nhưng chúng ta chỉ quan sát được các trộn lẫn của các thành phần đó. ICA có thể tìm
ỨNG DỤNG PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP TRONG PHÂN TÍCH TÍN HIỆU NÃO BỘ

GVHD: PGS.TS NGUYỄN HỮU PHƯƠNG
HVTH: HỒ THẾ KHƯƠNG
18
ra thông tin hữu ích về hoạt động não bộ bằng cách truy xuất vào các thành phần độc
lập của nó.

Một ứng dụng khác của ICA là rút trích đặc trưng. Một bài toán cơ sở trong xử
lý tín hiệu là tìm các sự biểu diễn phù hợp cho hình ảnh, audio, hay các loại dữ liệu
khác cho các công việc như nén hay lọc nhiễu. Các biểu diễn dữ liệu thường dựa trên
các biến đổi tuyến tính (rời rạc). Các biến đổi tuy
ến tính chuẩn được sử dụng nhiều
trong xử lý ảnh là Fourier, Haar và biến đổi cosin rời rạc (DCT). Mỗi phương pháp có
những ưu điểm riêng của nó.


Hình 2.4 Các hàm cơ sở trong ICA của các ảnh tự nhiên. Các hàm cơ sở này có thể
được xem như là các đặc trưng độc lập của các ảnh


ỨNG DỤNG PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP TRONG PHÂN TÍCH TÍN HIỆU NÃO BỘ

GVHD: PGS.TS NGUYỄN HỮU PHƯƠNG
HVTH: HỒ THẾ KHƯƠNG
19
Sẽ là hữu ích nhất khi xấp xỉ biến đổi tuyến tính từ chính bản thân dữ liệu. Khi
đó biến đổi có thể được thích nghi một cách lý tưởng với loại dữ liệu được xử lý. Hình
2.4 cho thấy các hàm cơ sở (basis function) có được bởi ICA từ các ảnh con (patch)
của ảnh tự nhiên. Mỗi cửa sổ ảnh trong tập các ảnh huấn luyện là chồng chập của các
hàm cơ bản này sao cho các hệ số trong sự chồng chập là độc lập.

2.2. ĐỊNH NGHĨA ICA [8]

2.2.1. ICA dưới dạng xấp xỉ của mô hình sản sinh

Để định nghĩa ICA, chúng ta có thể sử dụng mô hình các biến ẩn (latent
variables) thống kê. Chúng ta quan sát được n biến ngẫu nhiên x
1
, … , x
n
, là tổ hợp
tuyến tính của n biến ngẫu nhiên s
1
, … , s
n
dưới dạng:


11 2 2


ii i inn
x
as as as=+ ++, với i = 1, … , n (2.4)

Trong đó a
ij
(i, j = 1, … , n) là các hệ số thực. Theo định nghĩa, các s
i
là độc lập
thống kê với nhau.

Đây chính là mô hình ICA cơ bản. Mô hình này mang tính sinh sản (generative
model), nghĩa là nó mô tả cách thức mà dữ liệu quan sát được tạo ra bởi một quá trình
trộn lẫn các thành phần s
i
. Các thành phần độc lập s
i
là các biến ẩn, nghĩa là chúng
không được quan sát một cách trực tiếp. Các hệ số trộn lẫn cũng được giả sử là chưa
biết. Tất cả những gì ta có được là x
i
, và chúng ta phải xấp xỉ cả các hệ số trộn lẫn a
ij

lẫn các thành phần độc lập bằng cách sử dụng x
i
.

ỨNG DỤNG PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP TRONG PHÂN TÍCH TÍN HIỆU NÃO BỘ


GVHD: PGS.TS NGUYỄN HỮU PHƯƠNG
HVTH: HỒ THẾ KHƯƠNG
20
Cần lưu ý rằng ta đã bỏ qua chỉ số thời gian t dùng trong phần trước, đó là vì
trong mô hình ICA cơ bản chúng ta giả sử x
i
và s
i
là các biến ngẫu nhiên chứ không
phải là một tín hiệu thời gian hay chuỗi thời gian. Các giá trị quan sát x
i
(t) (như các tín
hiệu microphone trong bài toán bữa tiệc) lúc này là một mẫu của biến ngẫu nhiên này.
Ta cũng đã bỏ qua các độ trễ thời gian có thể xảy ra, do đó mô hình thường được gọi là
mô hình trộn lẫn tức thời (instantaneous mixing model).

Phương pháp ICA có liên hệ gần với phương pháp tách nguồn mù BSS (Blind
Source Separation). Một “nguồn” ở đây có nghĩa là một tín hiệu ban đầu, ví dụ như
một thành phần độc lập (như là người nói trong bài toán bữa tiệc). “Mù” có nghĩa là
chúng ta biết rất ít hoặc không biết gì về ma trận trộn lẫn. ICA có lẽ là một phương
pháp được sử dụng rộng rãi nhất cho việc tách nguồn mù.

Để thuận tiện, ta ký hiệu ma trận A là ma trận có các thành phần a
ij
, ma trận s có
các thành phần s
i
, và ma trận x có các thành phần x
i

. Do đó, mô hình trộn lẫn có thể
được biểu diễn dưới dạng ma trận:

x = As (2.5)

hay

1
n
ii
i
x
as
=
=

(2.6)

Vậy định nghĩa ICA như sau:

Định nghĩa 2.1: Cho s là các nguồn vào ban đầu, x là các hỗn hợp, A là ma trận
trộn lẫn với các hệ số a
ij
(i = 1, … , n; j = 1, … , m). Mô hình trộn lẫn của ICA có dạng
ỨNG DỤNG PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP TRONG PHÂN TÍCH TÍN HIỆU NÃO BỘ

GVHD: PGS.TS NGUYỄN HỮU PHƯƠNG
HVTH: HỒ THẾ KHƯƠNG
21
x = As hoặc

1
n
ii
i
x
as
=
=

. Các thành phần s có thể được tái tạo lại hoàn toàn khi chúng là
độc lập thống kê và có phân bố phi gauss.

2.2.2. Các điều kiện cho ICA

Để đảm bảo rằng mô hình ICA cơ bản trên có thể được xấp xỉ, chúng ta phải có
một số giả sử sau:

1. Các thành phần độc lập được giả sử là độc lập thống kê
“Các thành phần độc lập thống kê” là nguyên lý mà ICA đặt nền tảng. Thật ngạc
nhiên r
ằng trong nhiều trường hợp, chỉ cần giả sử các thành phần độc lập thống kê thì
mô hình có thể được xấp xỉ. Đó là lý do tại sao ICA là một phương pháp hiệu quả cho
các ứng dụng thuộc nhiều lĩnh vực khác nhau.

Về cơ bản, các biến ngẫu nhiên y
i
được gọi là độc lập khi hàm mật độ xác suất
kết hợp (joint) pdf (joint probability density function) bằng tích các hàm mật độ xác
suất riêng của chúng:



12 11 22
( , , , ) ( ) ( ) ( )
nnn
p
yy y pypy py= (2.7)

2. Các thành phần độc lập phải có phân bố phi gauss
Về cơ bản, ICA không thể thực hiện được, nếu các biến được quan sát có phân
bố gauss. Trường hợp các thành phần có phân bố gauss sẽ được bàn kỹ hơn ở mục 2.5.
Lưu ý rằng trong mô hình ICA cơ bản, ta không giả sử là biết được phân bố phi gauss
của các thành phần độc lập; Nếu chúng được biết, bài toán sẽ trở nên đơn giản rất
nhiều.
ỨNG DỤNG PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP TRONG PHÂN TÍCH TÍN HIỆU NÃO BỘ

GVHD: PGS.TS NGUYỄN HỮU PHƯƠNG
HVTH: HỒ THẾ KHƯƠNG
22

3. Để đơn giản, ta giả sử ma trận trộn lẫn chưa biết là ma trận vuông
“Ma trận là vuông” có nghĩa là số lượng thành phần độc lập bằng với số lượng
các trộn lẫn quan sát được. Giả sử này làm cho bài toán đơn giản hơn rất nhiều. Khi đó,
sau khi xấp xỉ được ma trận A, ta nghịch đảo nó (giả sử ở đây ma trận trộn lẫn là khả
đảo) và
được ma trận B, và có được các thành phần độc lập dưới dạng:

s = Bx (2.8)

Do vậy, với ba điều kiện trên (hay ít nhất là hai điều kiện đầu tiên), mô hình
ICA có thể được xấp xỉ, nghĩa là ta có thể xấp xỉ được ma trận trộn lẫn và các thành

phần độc lập.

2.2.3. Tính không xác định của ICA

Trong mô hình ICA cơ bản (2.5), ta có thể dễ dàng thấy được các tính không
xác định sau:

1. Không thể xác định đượ
c phương sai (năng lượng) của các thành phần độc
lập. Lý do là, cả s và A là chưa biết, ta có thể viết


1
()()
iii
i
i
x
asa
α
=

(2.9)

Với
i
α
là một đại lượng vô hướng bất kỳ.

ỨNG DỤNG PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP TRONG PHÂN TÍCH TÍN HIỆU NÃO BỘ


GVHD: PGS.TS NGUYỄN HỮU PHƯƠNG
HVTH: HỒ THẾ KHƯƠNG
23
Kết quả ta có thể điều chỉnh độ lớn của các thành phần độc lập. Do các thành
phần độc lập là các biến ngẫu nhiên, cách đơn giản nhất là giả sử chúng có phương sai
đơn vị: E{s
i
2
} = 1. Khi đó, ma trận trộn lẫn A có thể được điều chỉnh trong các phương
pháp ICA để tính đến điều kiện này.

2. Không thể xác định được thứ tự của các thành phần độc lập.
Vì chưa có s và A, nên có thể tự do thay đổi thứ tự các số hạng của tổng trong
(2.6), và có thể gọi bất kỳ thành phần độc lập nào là thành phần thứ nhất.

2.2.4. Quy tâm các biến

Vẫ
n không mất tính tổng quát, ta có thể giả sử rằng các biến trộn lẫn và các
thành phần độc lập có trung bình bằng không. Giả sử này làm đơn giản rất nhiều về lý
thuyết và các thuật giải. Nếu điều kiện này không được đáp ứng, ta có thể làm cho nó
thỏa mãn bằng cách quy tâm (center) các biến, nghĩa là trừ đi trị trung bình. Điều này
có nghĩa là các trộn lẫn ban đầu x

được thay thế bằng


''
{}

x
xEx=− (2.10)

Trước khi thực hiện ICA. Do đó, các thành phần độc lập cũng có trị trung bình
bằng không vì


1
{} {}Es A Ex

= (2.11)

Mặt khác, ma trận trộn lẫn vẫn không đổi sau khi thực hiện bước tiền xử lý này
(2.10), do đó chúng ta vẫn có thể thực hiện tiếp mà không làm ảnh hưởng đến sự xấp xỉ
của ma trận trộn lẫn. Sau khi xấp xỉ ma trận trộn lẫn và các thành phần độc lập cho dữ

×