Tải bản đầy đủ (.pdf) (146 trang)

ICA phức và ứng dụng vào tách sóng đa truy cập trong hệ thống mimo OFDM

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.98 MB, 146 trang )

Đại Học Quốc Gia Tp. Hồ Chí Minh
TRƯỜNG ĐẠI HỌC BÁCH KHOA
--------------------

LÊ ĐÌNH NGHI

ICA PHỨC VÀ ỨNG DỤNG VÀO TÁCH SÓNG ĐA TRUY
CẬP TRONG HỆ THỐNG MIMO-OFDM
Chuyên ngành : Kỹ thuật Điện tử

LUẬN VĂN THẠC SĨ

TP. HỒ CHÍ MINH, tháng 6 năm 2007


Xin chân thành cảm ơn quý thầy cô giảng dạy tại trường Đại Học Bách Khoa
thành phố Hồ Chí Minh đã tận tình chỉ bảo, cung cấp các kiến thức bổ ích trong suốt
thời gian em học cao học tại đây. Đặc biệt, xin cảm ơn thầy Vũ Đình Thành, đã tận tình
hướng dẫn và tạo điều kiện thuận lợi cho em về kiến thức cũng như tài liệu tham khảo,
giúp em hoàn thành luận văn Thạc sĩ này.
Cảm ơn TS. Tulay Adali, Đại học Maryland Baltimore County, USA, vì những
giúp đỡ về tài liệu tham khảo cũng như những lời khun bổ ích.
Cảm ơn tất cả các bạn, những người đã luôn bên cạnh, động viên và giúp đỡ tôi
trong quá trình thực hiện luận văn.
Xin cảm ơn ba mẹ và gia đình đã nuôi nấng, dạy dỗ, luôn quan tâm, theo sát tình
hình học tập và tạo mọi điều kiện tốt nhất cho con trong suốt cuộc đời.

TP. Hồ Chí Minh, tháng 6 năm 2007
Học viên thực hiện
Lê Ñình Nghi



Tóm tắt
Phân tích thành phần độc lập ICA (Independent Component Analysis) là một kỹ
thuật tính tốn thống kê để tìm các thành phần ngầm ẩn trong tập các biến hay tín hiệu
ngẫu nhiên. ICA định nghĩa mơ hình dữ liệu đa chiều, thường bao gồm số lượng lớn
các mẫu. Trong mơ hình này, các biến dữ liệu được giả sử là hỗn hợp tuyến tính của
các biến ngầm chưa biết, và hệ thống trộn cũng chưa biết. Các biến ngầm này giả sử có
phân bố phi Gauss và độc lập tương hỗ, gọi là các thành phần độc lập ICs (Independent
Components) của dữ liệu thu được. Các thành phần độc lập này có thể tìm được bằng
ICA. Bởi vì ICA có thể phân tách mù các hỗn hợp, nó có thể được ứng dụng vào xử lý
tín hiệu, kinh tế và viễn thơng…
Vấn đề phân tách các tín hiệu giá trị phức ngày càng được quan tâm trong lĩnh
vực xử lý tín hiệu bởi vì phân tích trong miền tần số bao gồm các tín hiệu phức có
nhiều thuận lợi so với phân tích trong miền thời gian. Đặc biệt là trong phân tách hỗn
hợp chập, liên quan đến biến đổi Fourier, sẽ tạo ra các tín hiệu phức. ICA phức sẽ giải
quyết vấn đề này. Nó có thể phân tách hỗn hợp phức mà các tín hiệu nguồn và ma trận
trộn đều là các biến giá trị phức. ICA phức cịn có một số ứng dụng quan trọng khác
như phân tích ảnh y tế, trong hệ thống radar và viễn thơng. Ta sẽ tìm hiểu chi tiết hơn
về ứng dụng của ICA phức trong tách sóng đa truy cập trong hệ thống MIMO-OFDM.
Để đáp ứng nhu cầu ngày càng gia tăng về dữ liệu tốc độ cao trong hệ thống
thông tin không dây, hệ thống MIMO (Multiple-Input Multiple-Output) ra đời, dùng
nhiều antenna truyền và nhận để sử dụng chiều không gian bằng cách chia dữ liệu
truyền thành các luồng dữ liệu song song. Các hệ thống ghép kênh không gian MIMO
này đã được chứng minh có tốc độ dữ liệu cao hơn hệ thống SISO (Single-Input
Single-Output) mà không cần tăng băng thông hay công suất truyền. Kỹ thuật ghép


kênh phân chia theo tần số trực giao OFDM (Orthogonal Frequency Division
Multiplexing) biến kênh chọn lọc tần số (tán xạ thời gian) thành các kênh fading phẳng
song song băng hẹp, vì thế loại bỏ được nhiễu ICI (Inter Carrier Interference) và ISI

(Inter Symbol Interference). Hệ thống MIMO-OFDM, kết hợp giữa MIMO và OFDM,
sẽ thừa hưởng những ưu điểm của hai kỹ thuật này như dung lượng lớn, loại bỏ được
ISI và ICI, và giảm độ phức tạp của bộ cân bằng khơng gian-thời gian.
Các phương pháp tách sóng đa truy cập trong hệ thống MIMO-OFDM địi hỏi
phải có thơng tin trạng thái kênh truyền CSI (Channel State Information) ở bộ thu, vì
vậy hệ thống phải gởi dữ liệu huấn luyện (training data) hay pilot tones đến bộ thu. Tuy
nhiên, dữ liệu huấn luyện này có thể làm tăng đáng kể băng thông tổng cộng. Để tiết
kiệm băng thông hữu dụng, người ta có thể sử dụng bộ cân bằng mù. Phương pháp mù
tránh sử dụng dữ liệu huấn luyện bằng cách sử dụng các thống kê của dữ liệu nguồn và
kênh MIMO để khôi phục dữ liệu. Một trong những phương pháp tách sóng mù trong
MIMO-OFDM là kỹ thuật dựa trên ICA. Thuận lợi chính của việc ứng dụng ICA trong
tách sóng đa truy cập là bộ thu hồn tồn khơng cần biết ma trận trộn, và từ đó khơng
cần chuỗi huấn luyện.
Luận văn này sẽ phân tích và mơ phỏng một số thuật toán giải quyết bài toán
ICA phức và ứng dụng vào tách sóng đa truy cập trong hệ thống MIMO- OFDM. Đồng
thời dựa vào kết quả mô phỏng, luận văn sẽ so sánh và đưa ra một số nhận xét về các
giải thuật này.


Abstract
Independent Component Analysis (ICA) is a statistical and computational
technique for revealing hidden factors that underlie sets of random variables,
measurements, or signals. ICA defines a generative model for the observed multivariate
(multidimensional) data, which is typically given as a large database of samples. In the
model, the data variables are assumed to be linear mixtures of some unknown latent
variables, and the mixing system is also unknown. The latent variables are assumed
nongaussian and mutually independent, and they are called the independent
components of the observed data. These independent components, also called sources
or factors, can be found by ICA. Because ICA can blindly separate mixtures, it can be
applied to signal processing, economics and telecommunications….

Separation of complex valued signals is a frequently arising problem in signal
processing: frequency-domain implementations involving complex valued signals have
advantages over time-domain implementations. Especially in the separation of
convolutive mixtures, it is a common practice to Fourier transform the signals, which
results in complex valued signals. Complex valued ICA can solve this problem. It can
separate complex mixtures whose source signals and mixing matrices are complexvalued variables. It has also been found of much interest within a number of other
practical applications in medical image analysis, radar and communications systems.
We’ll consider in more details its application to MUD (Multiuser Detection) in MIMOOFDM Systems.
In wireless communication systems, to meet the ever growing demand for
higher data rates, multiple transmit and receive antennas can be employed to make use
of the spatial dimension by transmitting data in parallel streams. Such spatial


multiplexing Multiple-Input Multiple-Output (MIMO) systems have been shown to
obtain signicantly higher data rates than Single-Input Single-Output (SISO) systems.
This increase in data rate can be achieved without the need of additional bandwidth or
transmit power, provided that sufficient multipath diversity is present. Orthogonal
Frequency Division Multiplexing (OFDM) transforms a frequency selective (time
dispersive) channel into parallel narrow band at fading channels, and it can cancel ISI
and ICI. MIMO-OFDM systems, including MIMO and OFDM techniques, can have
advantages of two above techniques: high data rates with low complexity space-time
equalization without ISI and ICI.
Traditional MUD methods in MIMO-OFDM systems require to acquire the
Channel State Information (CSI) at the receiver, so training data or pilot tones must be
sent. However, this training overhead can spend a considerable amount of the overall
bandwidth. To save the valuable bandwidth, blind equalization can be employed. Blind
methods avoid the use of training by exploiting the statistics of the source streams and
the MIMO-OFDM channel to recover the data. One of typical approaches for blind
detection in MIMO-OFDM systems is ICA based method. The avantage of this
technique is the fact that the system of mixture is completely unknown in the receiver

and, besides, training sequences are not needed.
In this thesis, we analyzed some recently-developed algorithms for Independent
Component Analysis based on complex-valued signals and applied to multiuser
detection in MIMO-OFDM systems. Some simulation results are obtained that
compare the performances of these algorithms.


Mục lục
Chương 1. GIỚI THIỆU VẤN VỀ VÀ TÌNH TRẠNG HIỆN NAY
1.1. Giới thiệu --------------------------------------------------------------------------- 1
1.2. Lịch sử và tình hình nghiên cứu ------------------------------------------------- 2
1.3. Nội dung và phạm vi nghiên cứu của luận văn -------------------------------- 4
1.3.1. Mục tiêu và phạm vi -------------------------------------------------------- 4
1.3.2. Nội dung---------------------------------------------------------------------- 4

Chương 2.

ICA VÀ MỘT SỐ VẤN ĐỀ LIÊN QUAN

2.1. Giới thiệu về ICA------------------------------------------------------------------ 5
2.2. Các quá trình tiền xử lý cho ICA ------------------------------------------------ 6
2.2.1. Quy tâm cho biến------------------------------------------------------------ 6
2.2.2. Phân tích thành phần chính ------------------------------------------------ 7
2.2.3. Trắng hóa--------------------------------------------------------------------- 10
2.2.4. Trực giao -------------------------------------------------------------------- 13
2.3. Một số giả thiết và giới hạn của mơ hình ICA--------------------------------- 16
2.3.1. Các ICs được xem là các thành phần độc lập thống kê ---------------- 16
2.3.2. Các thành phần độc lập phải có phân bố phi Gauss -------------------- 16
2.3.3. Ma trận lai trộn là ma trận vuông ----------------------------------------- 16
2.3.4. Hạn chế của ICA ------------------------------------------------------------ 17

2.4. Các phương pháp tiếp cận giải quyết bài toán ICA --------------------------- 18

Chương 3.

ICA VỚI CỰC ĐẠI TÍNH PHI GAUSS

3.1. Phi Gauss tức là độc lập ---------------------------------------------------------- 20
3.2. Đo lường tính phi Gauss bởi kurtosis------------------------------------------- 25
3.2.1. Cực trị của kurtosis sẽ cho các thành phần độc lập--------------------- 25


3.2.2. Giải thuật gradient sử dụng kurtosis-------------------------------------- 33
3.2.3. Giải thuật điểm cố định sử dụng kurtosis -------------------------------- 34
3.3. Đo lường tính phi Gauss bởi negentropy--------------------------------------- 36
3.3.1. Hạn chế của kurtosis -------------------------------------------------------- 36
3.3.2. Đo phi Gauss bằng negentropy-------------------------------------------- 36
3.3.3. Xấp xỉ negentropy----------------------------------------------------------- 38
3.3.4. Giải thuật gradient sử dụng negentropy---------------------------------- 41
3.3.5 Giải thuật lặp điểm cố định sử dụng negentropy ------------------------ 43
3.4. Ước lượng nhiều thành phần độc lập ------------------------------------------- 47
3.4.1. Ràng buộc của sự không tương quan ------------------------------------- 47
3.4.2. Trực giao hóa tuần tự ------------------------------------------------------- 48
3.4.3. Trực giao hóa đối xứng----------------------------------------------------- 49
3.5. Kết luận ----------------------------------------------------------------------------- 51

Chương 4.

ICA PHỨC

4.1. Giải thuật complexfastICA------------------------------------------------------- 52

4.1.1. Các nguyên lý cơ bản của biến ngẫu nhiên phức ----------------------- 52
4.1.2. Các thành phần không xác định được của các thành phần độc lập --- 54
4.1.3. Lựa chọn phép đo tính phi gauss------------------------------------------ 54
4.1.4. Độ ổn định của ước lượng ------------------------------------------------- 56
4.1.5. Giải thuật điểm cố định----------------------------------------------------- 57
4.2. Giải thuật SUT (strong uncorrelated transform) ------------------------------ 58
4.2.1. Thống kê bậc hai của các vector ngẫu nhiên phức --------------------- 58
4.2.2. SUT --------------------------------------------------------------------------- 59
4.2.3. Giải quyết bài toán ICA phức dùng SUT -------------------------------- 61
4.3. Giải thuật KM-G và KM-F------------------------------------------------------- 62
4.3.1. Gradient phức và kết quả của Branwood -------------------------------- 62
4.3.2. Hàm chi phí và cực đại kurtosis------------------------------------------- 65


4.3.3. Thuật toán KM-G ----------------------------------------------------------- 66
4.3.4. Thuật toán điểm cố định KM (KM-F)------------------------------------ 68
4.4. Thuật toán của Douglas----------------------------------------------------------- 69
4.4.1. Các biến ngẫu nhiên phức-------------------------------------------------- 70
4.4.2. Phân tách một nguồn độc lập giá trị phức ------------------------------- 72
4.4.3. Thuật toán điểm cố định tách một thành phần từ hỗn hợp phức------ 73

Chương 5.

MIMO-OFDM VÀ TÁCH SÓNG ĐA TRUY CẬP
TRONG MIMO-OFDM DÙNG ICA PHỨC

5.1. Hệ thống MIMO-OFDM --------------------------------------------------------- 79
5.1.1. Nguyên lý cơ bản của OFDM --------------------------------------------- 79
5.1.2. Hệ thống MIMO------------------------------------------------------------- 92
5.1.3. Hệ thống MIMO-OFDM --------------------------------------------------- 95

5.2. Tách sóng đa truy cập trong MIMO-OFDM dùng ICA phức --------------- 98
5.2.1. Giải thuật ICA-MMSE1---------------------------------------------------- 99
5.2.2. Giải thuật ICA-MMSE2---------------------------------------------------- 105
5.3. Kết luận về MUD trong MIMO-OFDM dùng ICA phức -------------------- 109

Chương 6. KẾT QUẢ MÔ PHỎNG VÀ HƯỚNG PHÁT TRIỂN ĐỀ TÀI
6.1. Chuẩn đánh giá các giải thuật ICA phức --------------------------------------- 110
6.2. Chương trình mơ phỏng ---------------------------------------------------------- 110
6.3. Các kết quả mô phỏng ------------------------------------------------------------ 112
6.3.1. Mô phỏng các giải thuật ICA phức --------------------------------------- 112
6.3.2. Mô phỏng MUD trong MIMO-OFDM dùng ICA phức --------------- 127
6.4. Kết luận và hướng phát triển đề tài --------------------------------------------- 131
6.4.1. Kết luận----------------------------------------------------------------------- 131
6.4.2. Hướng phát triển đề tài ----------------------------------------------------- 131


1

Chương 1.
GIỚI THIỆU VẤN ĐỀ VÀ TÌNH TRẠNG HIỆN NAY

1.1. Giới thiệu
Phân tích thành phần độc lập ICA (Independent Component Analysis) được ứng
dụng trong lĩnh vực xử lí tín hiệu để thực hiện phân tách nguồn mù BSS (Blind Source
Seperation). BSS là bài tốn tìm kiếm các thành phần tín hiệu ngầm từ những hỗn hợp
tuyến tính đã biết của chúng (các tín hiệu gốc và ma trận trộn là chưa biết). Điều này
nghe qua có vẻ cực kì khó bởi vì cả tín hiệu nguồn và việc lai trộn chúng ta đều không
được biết trước (nhưng nếu biết trước thì cơng việc lại trở nên cực kì đơn giản). Lời
giải cho bài tốn phân tách nguồn mù đã có những ứng dụng hết sức hữu dụng trong
nhiều lĩnh vực nghiên cứu, bao gồm cả hệ thống y sinh, viễn thơng và tài chính. ICA đã

giải quyết hồn tồn bài toán BSS với một số giả thiết về sự độc lập thống kê của các
thành phần nguồn, nhờ đó mơ hình ICA đã được dùng để xác định tín hiệu, loại bỏ
thành phần và giảm nhiễu.
Bài tốn ICA có thể mở rộng để phân tách hỗn hợp với các nguồn và ma trận
trộn đều bao gồm các số phức, khi đó ta có các giải thuật cho bài tốn ICA phức. Các
giải thuật ICA phức này đặc biệt hữu dụng trong xử lý tín hiệu trong miền tần số (xử lý
tín hiệu trong miền tần số có nhiều ưu điểm so với xử lý trong miền thời gian [2]) hay
phân tách các hỗn hợp chập (convolutive mixtures) vì phép biến đổi Fourier sẽ tạo ra
các tín hiệu phức.
Một trong những ứng dụng quan trọng của ICA trong các hệ thống viễn thơng là
tách sóng đa truy cập MUD (Multiuser Detection). Hệ thống MIMO-OFDM đang
ICA phức và ứng dụng vào tách sóng đa truy cập trong hệ thống MIMO-OFDM


2

chứng tỏ có nhiều ưu điểm và vấn đề MUD trong MIMO-OFDM đang được quan tâm
khá nhiều. ICA phức có thể áp dụng vào MUD trong hệ thống này. Các phương pháp
MUD cổ điển đòi hỏi bộ thu phải biết thơng tin trạng thái kênh truyền CSI (Channel
State Information). Vì vậy, hệ thống phải truyền dữ liệu huấn luyện (training data) hay
pilot tones đến bộ thu. Tuy nhiên, dữ liệu huấn luyện này có thể làm tăng đáng kể băng
thơng tổng cộng. Để tiết kiệm băng thông hữu dụng, người ta có thể sử dụng bộ tách
sóng mù. Phương pháp mù tránh sử dụng dữ liệu huấn luyện bằng cách sử dụng các
thống kê của dữ liệu nguồn và kênh MIMO-OFDM để khơi phục dữ liệu. Có nhiều
phương pháp tách sóng mù như CMA (constant modulus algorithm), phương pháp
khơng gian con (subspace methods), các phương pháp khác dùng thống kê bậc hai SOS
(second order statistics) và các phương pháp dựa trên ICA.. Trong đó bộ phân tách mù
dùng ICA chứng tỏ được có nhiều ưu điểm [8].
Vì vậy, luận văn sẽ trình bày một số giải thuật hiệu quả để phân tách mù các hỗn
hợp phức dùng ICA phức và so sánh chúng. Sau đó là nêu một ứng dụng của ICA phức

vào tách sóng đa truy cập trong MIMO-OFDM với giải thuật kết hợp ICA-MMSE.
1.2. Lịch sử và tình hình nghiên cứu
Kỹ thuật ICA, mặc dù chưa được đặt tên nhưng đã được giới thiệu rất sớm từ
những năm 1980 bởi J. Hérault, C. Jutten và B. Ans. Trong suốt thời gian này ICA đã
được biết đến bởi hầu hết những nhà nghiên cứu ở Pháp và đã phần nào có được những
ảnh hưởng ở tầm quốc tế.
Trong lĩnh vực phân tích phổ bậc cao, một hội thảo quốc tế đầu tiên được tổ chức
năm 1989. Trong hội thảo này thì những bài viết đầu tiên về ICA đã được công bố bởi
J.F. Cardoso và P. Comon. Cardoso đã sử dụng phương pháp đại số, đặc biệt là các
tensor thống kê bậc cao, và dẫn tới giải thuật JADE.

ICA phức và ứng dụng vào tách sóng đa truy cập trong hệ thống MIMO-OFDM


3

Trong lĩnh vực xử lí số, đã có một số ứng dụng liên quan tới vấn đề này từ rất
sớm, như là bài tốn giải tích chập với tín hiệu mù. Kết quả đạt được từ bài toán này
cũng tương tự với kĩ thuật ICA.
Công việc của các nhà khoa học ở những năm 80 tiếp tục được phát triển bởi
A.Cichocki, R.Unbehauen và nhiều nhà khoa học khác. Cho đến những năm 1990 có
thêm nhiều bài báo nói về kĩ thuật ICA, tuy nhiên cho đến giữa những năm 90 thì kĩ
thuật này vẫn chưa phát triển mạnh và hiệu quả của các nghiên cứu còn rất thấp, một số
giải thuật đã hoạt động tốt nhưng vẫn còn hạn chế trong phạm vi ứng dụng.
ICA chỉ đạt được sự chú ý và quan tâm rộng rãi sau khi A.J.Bell và T.J.Sejnowski
xuất bản phương thức tiếp cận của họ dựa trên ngun lí cực đại thơng tin. Sau đó giải
thuật FastICA xuất hiện đã làm cho ứng dụng của ICA rộng hơn nhờ vào hiệu quả tính
tốn của giải thuật này.
Đến cuối những năm 90 thì có rất nhiều bài báo và hội thảo bàn về vấn đề phát
triển ICA. Hội thảo quốc tế đầu tiên được tổ chức tại Pháp vào tháng 1 năm 1999, và

đến nay đã có khá nhiều hội thảo quốc tế về ICA tổ chức tại Phần Lan, Nhật…,với
hàng trăm nhà nghiên cứu trong lĩnh vực này.
Gần đây, rất nhiều bài báo ra đời đề cập đến vấn đề giải quyết bài tốn ICA phức.
Trong đó nổi bậc là các tác giả Ella Bingham, Tulay Adali, Cardoso, Hualiang Li,
Eriksson…với các cách tiếp cận khác nhau như cực đại kurtosis [2][9][18][24][32],
Maximum Likelihood [29], Infomax[31], JADE [6][13], SUT [14][15]…
Ứng dụng ICA vào tách sóng đa truy cập là vấn đề được quan tâm khá nhiều. Gần
đây, một số cơng trình ra đời nghiên cứu về tách sóng đa truy cập trong hệ thống
MIMO-OFDM dùng ICA. Các giải thuật này phân tích bài tốn trong miền tần số nên
địi hỏi dùng ICA phức. Đáng chú ý là một số tác giả như Daniel Iglesia, Luciano
ICA phức và ứng dụng vào tách sóng đa truy cập trong hệ thống MIMO-OFDM


4

Sarperi, Nandi… với các giải thuật chỉ dùng ICA [4], kết hợp ICA với các phương
pháp khác như ICA-MMSE [3][8], ICA-MMSE-SIC [8], ICA-V-BLAST [28][30].
1.3. Nội dung và phạm vi nghiên cứu của luận văn
1.3.1. Mục tiêu và phạm vi
Mục tiêu của luận văn là mở rộng các giải thuật ICA cho số phức và ứng dụng
vào tách sóng đa truy cập trong MIMO-OFDM. Các giải thuật ICA này có thể phân
tách hầu hết các hỗn hợp phức của các nguồn phức độc lập và có phân bố phi Gauss và
có thể ứng dụng vào tách sóng đa truy cập trong MIMO-OFDM.
1.3.2. Nội dung
Nội dung luận văn gồm 6 chương. Chương 1 sẽ giới thiệu tổng quan vấn đề và
tình hình nghiên cứu hiện nay. Chương 2 giới thiệu về ICA thực, các bước tiền xử lý và
các vấn đề liên quan như điều kiện, các tính chất cũng như một số cách tiếp cận để giải
quyết bài toán ICA. Chương 3 giải quyết bài tốn ICA bằng cực đại tính phi gauss. Đây
là hướng tiếp cận đơn giản và hiệu quả, từ đó dẫn đến giải thuật khá tốt là fastICA
[1][2]. Chương 4 mở rộng bài toán ICA thực cho các nguồn và ma trận trộn là các số

phức, đưa ra một số giải thuật hiệu quả cho ICA phức. Chương 5 giới thiệu sơ lược về
hệ thống MIMO-OFDM, các đặc điểm nổi bật của hệ thống này và ứng dụng ICA phức
vào tách sóng đa truy cập trong MIMO-OFDM. Cuối cùng, chương 6 sẽ nêu ra một số
kết quả mô phỏng đạt được gồm các giải thuật ICA phức, giải thuật tách sóng đa truy
cập trong MIMO-OFDM và so sánh các giải thuật này. Cuối chương này là nhận xét và
hướng phát triển đề tài.

ICA phức và ứng dụng vào tách sóng đa truy cập trong hệ thống MIMO-OFDM


5

Chương 2.
ICA VÀ MỘT SỐ VẤN ĐỀ LIÊN QUAN

2.1. Giới thiệu về ICA
Như đã giới thiệu ở chương trước, phân tích thành phần độc lập ICA
(Independent Component Analysis) được ứng dụng trong lĩnh vực xử lí tín hiệu để thực
hiện phân tách nguồn mù BSS (Blind Source Seperation). BSS là bài tốn tìm kiếm các
thành phần tín hiệu ban đầu từ những hỗn hợp đã biết của chúng (các tín hiệu gốc và
ma trận trộn là chưa biết). ICA giải quyết hồn tồn bài tốn BSS với một số giả thiết
về sự độc lập thống kê của các thành phần nguồn. Để hiểu rõ hơn về ICA, ta xét đến
mô hình tốn học của ICA.
Chúng ta hãy xem xét một tập hợp các biến ngẫu nhiên quan sát được là x1(t),
x2(t),..., xn(t), trong đó t là thời điểm lấy mẫu, giả sử rằng chúng là hỗn hợp tuyến tính
của các thành phần độc lập :
⎛ x1 (t ) ⎞


⎜ x 2 (t ) ⎟

⎜ M ⎟=


⎜ M ⎟
⎜x t ⎟
⎝ n ( )⎠

⎛ s1 (t ) ⎞


⎜ s 2 (t ) ⎟
A⎜ M ⎟


⎜ M ⎟


⎝ s n (t ) ⎠

(2.1)

trong đó A là một ma trận chưa được biết trước. Việc phân tích các thành phần độc lập
bây giờ là tìm ra cả ma trận A lẫn các tín hiệu si(t), khi mà thơng tin chúng ta có được
chỉ là các thành phần hỗn hợp xi(t). Chú ý là ở đây chúng ta giả sử rằng số thành phần

ICA phức và ứng dụng vào tách sóng đa truy cập trong hệ thống MIMO-OFDM


6


độc lập bằng với số tín hiệu quan sát được, điều này chỉ làm đơn giản bài tốn chứ
khơng nhất thiết phải thực hiện.
Như vậy chúng ta có thể định nghĩa ICA như là việc tìm một biến đổi tuyến tính
được xác định bởi ma trận W và các biến ngẫu nhiên yi, i = 1,..., n như sau :
⎛ x1 (t ) ⎞
⎛ y1 (t ) ⎞




⎜ x 2 (t ) ⎟
⎜ y 2 (t ) ⎟
⎜ M ⎟ = W⎜ M ⎟




⎜ M ⎟
⎜ M ⎟
⎜ x (t ) ⎟
⎜ y (t ) ⎟
⎝ n ⎠
⎝ n ⎠

(2.2)

trong đó các thành phần yi là độc lập nhiều nhất có thể. W càng gần với nghịch đảo của
A thì kết quả là càng tốt.
Bài tốn này có thể được mở rộng với các thành phần nguồn và ma trận trộn đều
bao gồm các số phức. Khi đó ta có các giải thuật cho ICA giá trị phức, sẽ được trình

bày chi tiết hơn trong chương 4.
Từ đó ta thấy rằng ICA có thể được ứng dụng trong các lĩnh vực như xử lý hình
ảnh, xử lý âm thanh hay ứng dụng trong các lĩnh vực viễn thông CDMA, mạng khơng
dây...
2.2. Các q trình tiền xử lý cho ICA
2.2.1. Quy tâm cho biến
Khơng mất tính tổng qt ta có thể giả thiết các biến hỗn hợp và các thành phần
độc lập có trung bình bằng khơng. Điều này sẽ đơn giản lý thuyết và giải thuật khá
nhiều và sẽ được sử dụng thường xuyên.

ICA phức và ứng dụng vào tách sóng đa truy cập trong hệ thống MIMO-OFDM


7

Nếu xảy ra trường hợp tín hiệu khơng thõa mãn điều kiện có trung bình bằng 0 thì
chúng ta có thể thực hiện tiền xử lí : quy tâm cho các biến khảo sát bằng cách trừ đi giá
trị trung bình của chúng. Gọi hỗn hợp ban đầu là x’ thì việc quy tâm được thực hiện
như sau :
x=x’- E{x’}

(2.3)

Như vậy hỗn hợp mới sẽ có trung bình bằng 0 và do đó các thành phần độc lập
cũng có trung bình bằng 0 bởi vì E{s}= A-1 E{x}.
Hơn nữa, ma trận lai trộn không bị thay đổi qua bước tiền xử lí này cho nên sau
khi thực hiện giải thuật phân tích các thành phần độc lập và ước lượng ma trận lai đối
với dữ liệu có trung bình là 0 thì chúng ta có thể khơi phục lại giá trị trung bình bằng
cách cộng thêm vào kết quả một lượng là A-1 E{x’}.
2.2.2. Phân tích thành phần chính

Phân tích thành phần chính là một kĩ thuật cổ điển trong việc phân tích thống kê
dữ liệu, tách đặc điểm (feature extraction), và trong các phương pháp nén dữ liệu. Với
một tập hợp các dữ liệu đo lường nhiều biến cho sẵn, mục đích của PCA là tìm ra một
tập hợp nhỏ hơn của các biến mà ở đó ít có sự dư thừa hơn, tức là tập các biến mới chỉ
bao gồm các biến có ý nghĩa nhiều nhất, là một đại diện tốt nhất có thể cho các thành
phần. Quan điểm này tương đối giống với quan điểm của ICA, tuy nhiên sự dư thừa
trong PCA chỉ được đo lường bởi tương quan giữa các phần tử trong dữ liệu trong khi
ICA sử dụng rất nhiều những khái niệm về khơng tương quan và độc lập. Vì chỉ sử
dụng các khái niệm liên quan tới tương quan cho nên PCA có thuận lợi là nó có thể
phân tích mà chỉ cần dựa trên các thống kê bậc 2. Bởi thế sẽ là rất tốt nếu như PCA là
bước tiền xử lí cho ICA.

ICA phức và ứng dụng vào tách sóng đa truy cập trong hệ thống MIMO-OFDM


8

Các thành phần chính
Điểm bắt đầu cho PCA là vector ngẫu nhiên x với n thành phần, với các thành
phần mẫu là x(1),..., x(T). Khơng có một sự giả định chính xác nào về hàm mật độ xác
xuất cho biến ngẫu nhiên x trong mơ hình PCA, các thống kê bậc nhất và bậc hai có thể
biết được hoặc có thể ước lượng từ các mẫu. Thơng thường thì các thành phần của
vector x được đo lường như là mức xám của các điểm hoặc là giá trị của tín hiệu tại các
thời điếm nhất định nào đó. Thật sự trong mơ hình PCA, khi có các thành phần có
tương quan, hoặc có sự dư thừa dữ liệu trong x thì có thể nén dữ liệu. Nếu các thành
phần trong vector là độc lập thì sẽ khơng đạt được gì từ các tính tốn của PCA.
Trong tính tốn PCA thì vector x trước tiên cũng được quy tâm bằng cách trừ đi
trị trung bình của nó:
x ← x − E{x}


(2.4)

Trong thực tế thì giá trị trung bình sẽ được ước lượng từ các mẫu có sẵn. Ở đây
chúng ta giả sử rằng việc quy tâm cho biến đã được thực hiện và chúng ta có thể xem
như tín hiệu có trung bình bằng 0. Sau đó ta thực hiện việc biến đổi vector x thành một
vector y với m thành phần, m < n , nhằm xóa bỏ đi sự dư thừa do tương quan gây ra.
Điều này được thực hiện bằng cách tìm kiếm một phép quay trực giao sao cho các
thành phần của x trong hệ thống trục mới là khơng tương quan với nhau. Cùng thời
điểm đó thì variance hình chiếu của x trên trục mới là cực đại, sao cho đáp ứng trên
trục thứ nhất là cực đại thì đáp ứng trên trục thứ hai là cực đại theo hướng vng góc
với hướng trên trục thứ nhất.
Các phương pháp biến đổi tuyến tính của PCA:
s = Wx

ICA phức và ứng dụng vào tách sóng đa truy cập trong hệ thống MIMO-OFDM

(2.5)


9

thông thường dựa trên các thống kê bậc hai, tức là chỉ sử dụng các thông tin về ma trận
hiệp phương sai của vector dữ liệu x. Các phương pháp thống kê bậc hai giả sử dữ liệu
quan sát có phân bố Gauss. Khi các biến ngẫu nhiên có phân bố Gauss, phân bố của nó
sẽ được xác định bởi các thơng tin thống kê bậc hai. Q trình biến đổi tuyến tính từ
vector x có thể tìm ra các thành phần chính:
si=wiTx

(2.6)


Để xác định được các giá trị wi chúng ta cần phải thực hiện việc khai triển trị
riêng của ma trận hiệp phương sai C=E{xxT}. Lúc này, giá trị wi là các vector riêng của
C tương ứng với m giá trị riêng lớn nhất của C. Bởi vậy có thể nói PCA là kỹ thuật
giảm số chiều khơng gian dữ liệu theo hướng cực đại variance, nghĩa là mỗi biến sẽ đạt
cực đại variance của mình trong khi đó tương quan của chúng sẽ tiến tới 0.
Tuy nhiên trong thực tế thì dữ liệu thường khơng tn theo phân bố Gauss, trong
các trường hợp này các điều kiện về các thống kê bậc hai đôi khi sẽ bằng 0 và như vậy
thì các thống kê bậc cao hơn sẽ được sử dụng. Điều này là một gợi ý cho giải thuật
ICA, một phương pháp thống kê bậc cao để tìm các thành phần độc lập với dữ liệu
tổng quát là phi Gauss.
Mặc dù không phải là phương pháp tối ưu cho việc phân tách dữ liệu nhưng PCA
lại là cơng cụ tiền xử lí rất hữu ích cho ICA, nó làm giảm số chiều của dữ liệu mà nhờ
đó mà ICA sẽ giải quyết được bài tốn là số thành phần độc lập nhỏ hơn số hỗn hợp
thu được. Bởi vì khi số thành phần độc lập n nhỏ hơn so với số hỗn hợp thu được m,
nếu chúng ta thực hiện mơ hình ICA một cách máy móc có thể gây lỗi nghiêm trọng.
Vì thế rất cần thiết việc sử dụng PCA để giảm số chiều dữ liệu xuống cịn n.
Vấn đề ở đây là PCA có khả năng tìm chính xác khơng gian mà từ đó chúng ta có
thể ước lượng được chính xác n thành phần độc lập. Tổng qt thì kết quả khơng đúng,
ICA phức và ứng dụng vào tách sóng đa truy cập trong hệ thống MIMO-OFDM


10

tuy nhiên với dữ liệu chỉ có n thành phần độc lập khơng nhiễu thì tồn bộ dữ liệu sẽ
thuộc vào khơng gian con n chiều. Chúng ta hồn tồn có thể sử dụng PCA để tìm
được khơng gian n chiều này, do các trị riêng thuộc không gian con này và chỉ các trị
riêng này khác 0.
Tuy vậy, thực tế thì dữ liệu sẽ khơng thuộc chính xác khơng gian con, do nhiễu và
các yếu tố khác, nhưng với mức nhiễu thấp, PCA vẫn có thể xác định gần đúng khơng
gian con cần tìm. Khách quan mà nói, thì sẽ có một số thành phần yếu hơn sẽ bị loại bỏ

do q trình tính tốn từ PCA nhưng nó vẫn là một cơng cụ tốt vì ít nhất chúng ta vẫn
còn giữ được những thành phần mạnh nhất của dữ liệu.
Một ưu điểm nổi bật nữa của PCA là giảm nhiễu bởi vì vơ hình chung khi giảm
số chiều thì số chiều bỏ đi thơng thường lại là nhiễu, điều này đặc biệt đúng khi số
thành phần nhỏ hơn số hỗn hợp.
2.2.3. Trắng hóa
Bài tốn ICA sẽ trở nên đơn giản lạ thường nếu trước đó nó đã được xử lí trắng
hóa hoặc cầu hóa. Một vector ngẫu nhiên có trung bình khơng z =(z1,z2,…,zn) được gọi
là trắng hóa nếu như các thành phần zi của nó là khơng tương quan và có variance là
đơn vị:
E{zizj} = δ ij

(2.7)

Trong trường hợp chúng ta xét cả cho ma trận covariance thì điều này có nghĩa là:
E{zzT} = I

(2.8)

trong đó I là ma trận đơn vị. Một ví dụ mà chúng ta quen thuộc nhất đó là nhiễu trắng,
các thành phần zi ở đây sẽ là cường độ nhiễu tại các thời điểm ứng với i=1,2,... và
ICA phức và ứng dụng vào tách sóng đa truy cập trong hệ thống MIMO-OFDM


11

khơng có sự tương quan thời gian nào trong q trình nhiễu. Từ ‘trắng’ ở đây được
xuất phát từ sự kiện phổ cơng suất của tín hiệu nhiễu trắng là hằng trên mọi tần số, một
điều tương tự như trong ánh sáng, ánh sáng trắng là tổng hợp của nhiều màu.
Bởi vì trắng hóa thực hiện giải tương quan bằng cách lập tỉ lệ cho nên kĩ thuật của

PCA cũng có thể được sử dụng ở đây, điều này có nghĩa là trắng hóa cũng có thể thực
hiện theo các phép biến đổi tuyến tính. Vấn đề của bài tốn trắng hóa bây giờ sẽ là :
cho một vector ngẫu nhiên x với n thành phần, tìm một phép biến đổi tuyến tính thơng
qua ma trận V, sao cho biến x thành vector z đã được trắng hóa:
z =Vx

(2.9)

Bài tốn này có thể giải được dựa vào bài tốn PCA Chúng ta hãy xem E
=(e1,...,en) là một ma trận mà các cột của nó là các vector riêng của ma trận covariance
C = E{xxT}. Việc tính tốn này có thể được thực hiện trực tiếp từ các mẫu của x hoặc
được tính từ một luật của PCA. Ta có D = diag(d1,...,dn) là ma trận chéo các trị riêng
của C. Khi đó, ta có thể xác định được một phép biến đổi tuyến tính để tạo ra một
vector trắng hóa như sau:
V=D-1/2.ET

(2.10)

Ma trận này sẽ luôn luôn tồn tại khi mà các trị riêng di là dương, trong thực tế thì
điều này chúng ta khơng cần phải quan tâm lắm bởi vì ma trận C là bán xác định
dương, vì vậy cho hầu hết các dữ liệu trong thực tế thì các trị riêng của nó sẽ ln ln
dương.
Thật dễ dàng để nhận thấy rằng, ma trận V được xác định ở trên là một biến đổi
trắng hóa. Chúng ta viết lại C theo một cách khác, biễu diễn nó theo ma trận trị riêng
và ma trận vector riêng của nó:

ICA phức và ứng dụng vào tách sóng đa truy cập trong hệ thống MIMO-OFDM


12


C = EDET

(2.11)

với E ở đây là một ma trận trực giao, tức là thõa mãn điều kiện EET= ETE = I, nhờ đó
chúng ta có :
E{zzT}= V.E{xxT}.VT = D-1/2.ET.E.D.ETE.D-1/2 = I

(2.12)

Covariance của z là một ma trận đơn vị, như vậy dữ liệu z coi như đã được trắng
hóa.
Phép biến đổi này khơng có nghĩa rằng ma trận trắng hóa là duy nhất, mà chúng
ta có thể dễ dàng nhận thấy rằng với bất kì một ma trận UV nào mà trong đó U là một
ma trận trực giao thì nó cũng là một ma trận trắng hóa. Ta có thể chứng minh được
điều này khá dễ dàng như sau :
Z =UVx

(2.13)

E{zzT} =UVE{xxT}VTUT =UIUT = I

(2.14)

Một trường hợp khá quan trọng là ma trận trắng hóa V= ED-1/2ET, đây là ma trận
đạt được sau khi đã nhân V với một ma trận trực giao là E. Ma trận này được gọi là
nghịch đảo căn bậc hai của ma trận C, và được kí hiệu là C-1/2 bởi được xuất phát từ
chuẩn mở rộng của các căn ma trận.
Chúng ta cũng có một cách khác để xác định ma trận trắng hóa, đó là thực hiện

các giải thuật trực tuyến tương tự như trong tính tốn PCA. Một trong những luật trực
tiếp đó là:
∆V = γ ( I − Vxx T V T )V = γ ( I − zz T )V

ICA phức và ứng dụng vào tách sóng đa truy cập trong hệ thống MIMO-OFDM

(2.15)


13

Có thể nhận thấy rằng ở một điểm tĩnh, khi mà sự thay đổi trên giá trị V có trung
bình là 0, thì khi đó chúng ta đạt được:
( I − E{zz T })V = 0

(2.16)

Giải phương trình này chúng ta sẽ nhận được một cặp z = Vx thõa mãn điều kiện
trắng hóa.
2.2.4. Trực giao
Trong một số giải thuật của PCA và ICA yêu cầu vector sau nhận được phải là
những vector trực giao. Tuy nhiên, các bước lặp trong các giải thuật khơng tự động
đảm bảo được tính trực giao. Vì thế, việc trực giao hóa các vector sau mỗi bước lặp
hoặc trong một khoảng thời gian nào đó là một điều hết sức cần thiết. Trong phần này,
chúng ta sẽ thảo luận về phương pháp trực giao cơ bản. Để đơn giản chúng ta hãy xét
bài toán sau đây:
Cho một tập hợp gồm m vector độc lập tuyến tính n chiều a1, a2,...am với m ≤
n, hãy tìm một tập hợp khác gồm m vector w1, w2,...wm trong đó các vector đã được
trực giao hóa hoặc trực giao hóa chuẩn (trực giao và có chuẩn đơn vị) và các
vector này phải ở trong cùng không gian với các vector gốc, tức là wi là tổ hợp

tuyến tính của các ai.
2.2.4.1. Trực giao tuần tự
Một phương pháp tiếp cận cổ điển là phương pháp trực giao hóa Gram-Schmidt:
w1= a1

ICA phức và ứng dụng vào tách sóng đa truy cập trong hệ thống MIMO-OFDM

(2.17)


14

wj = aj -

j −1

wiT a j

i =1

T
i

∑w

wi

(2.18)

wi


Kết quả từ phép trực giao là wiTwj = 0 , với mọi i ≠ j. Ta có thể giải thích điều này
đơn giản như sau: giả sử (j-1) vector đầu tiên đã được trực giao. Ta xét tích của wkTwj
áp dụng cơng thức trực giao như trên, ta có:
j −1

wiT a j

i =1

T
i

wkT w j = wkT a j − ∑

w wi

( wkT wi )

(2.19)

Ở trong tổng thì tất cả các tích wkTwi đều bằng 0, ngoại trừ trường hợp i = k, do
đó ta có thể viết lại như sau:
w wj = w a j −
T
k

T
k


wkT a j
T
k

w wk

( wkT wi )

= wkTaj - wkTaj =0
Do wkTwj = 0 cho nên vector wj cũng đã được trực giao.
Trong giải thuật trực giao này thì các vector wi đều được chia cho chuẩn của
chúng, cho nên kết quả nhận được sẽ là những vector trực giao chuẩn. Phương pháp
trực giao này được gọi là phương pháp trực giao tuần tự và trong các giải thuật của
ICA và PCA sử dụng các tiếp cận theo trực giao tuần tự.
2.2.4.2. Trực giao đối xứng
Phương pháp trực giao hóa đối xứng tìm kiếm một khơng gian trực giao cho
không gian ban đầu mà không cần bất kì sự ràng buộc nào các vector mới và do vậy lời

ICA phức và ứng dụng vào tách sóng đa truy cập trong hệ thống MIMO-OFDM


15

giải của bài tốn sẽ khơng phải là duy nhất. Ta có thể xét một giải thuật đơn giản như
sau:
Xét A = (a1....am) là ma trận mà các cột của nó là những vector sẽ được trực giao,
sau đó chúng ta tính ma trận W theo cơng thức sau:
W = A (ATA)-1/2

(2.20)


Điều chúng ta đạt được sẽ là WTW = I, và các cột của ma trận W có cùng khơng
gian như các cột của ma trận A. Bài tốn này sẽ khơng có kết quả duy nhất bởi vì với
bất kì ma trận trực giao U nào thì WU cũng thỏa mãn bài toán. Tuy nhiên trong tất cả
các lời giải này có một lời giải cho các vector trực giao đã được chuẩn hóa, ma trận này
sẽ được xem như là ma trận trực giao chuẩn của A. Phương pháp trực giao này thường
được áp dụng trong các giải thuật gradient. Việc tính tốn cho (ATA)-1/2 có thể thực
hiện bằng việc khai triển ma trận trị riêng như sau:
(ATA)-1/2 = E.diag(d1-1/2,…,dm-1/2).ET

(2.21)

Có một phương pháp lặp cho trực giao hóa đối xứng mà chúng ta có thể tránh
được việc khai triển ma trận trị riêng và tính ma trận nghịch đảo, chúng ta sẽ xem xét
dưới đây :
Chúng ta hãy bắt đầu bằng một ma trận không trực giao W(0):
Giải thuật lặp thực hiện như sau :
W (1) =

W ( 0)
W ( 0)

3
1
W (t + 1) = W (t ) − W (t )W (t ) T W (t )
2
2
ICA phức và ứng dụng vào tách sóng đa truy cập trong hệ thống MIMO-OFDM

(2.22)


(2.23)


16

Nếu như W(t)W(t)T = I thì chúng ta có thể dừng cịn nếu khơng thì tiếp tục lặp
cho đến khi đạt được sự hội tụ. Người ta đã chứng minh được đây là một giải thuật có
tính hội tụ rất tốt.
2.3. Một số giả thiết và giới hạn của mô hình ICA
Những điều kiện này nhằm đảm bảo cho mơ hình ICA ln ln có thể thực hiện
đúng u cầu đặt ra.
2.3.1. Các thành phần độc lập được xem là các thành phần độc lập thống kê
Đây là nguyên tắc cơ bản của mơ hình ICA. Về cơ bản, các biến y1, y2,...,yn được
gọi là độc lập khi mà thông tin của biến yi khơng chứa bất kì thơng tin nào về biến yj
với i ≠ j. Về mặt kỹ thuật, độc lập được định nghĩa thông qua hàm mật độ xác suất. Với
p(y1,y2,...,yn) là hàm mật độ xác suất của tổ hợp biến y1, y2,..., yn, và p(yi) là hàm mật độ
xác suất của từng biến yi, các biến yi được coi là độc lập khi mà hàm mật độ đồng thời
là tích của các hàm mật độ thành phần, tức là:
p(y1,y2,...,yn) = p(y1) p(y2)...p(yn)

(2.24)

2.3.2. Các thành phần độc lập phải có phân bố phi Gauss
Do các biến tuân theo phân bố Gauss được xem là quá đơn giản bởi vì hầu hết các
thống kê bậc cao của phân bố này đều bằng khơng trong khi mơ hình ICA lại rất cần
đến thông tin từ các thống kê bậc cao. Vì vậy, với các biến mang phân bố Gauss thì
ICA dường như là khơng thể. Chú ý là trong mơ hình ICA cơ bản chúng ta khơng đề
cập tới việc biết trước dạng phân bố phi Gauss của các tín hiệu bởi vì nếu chúng ta biết
trước điều này thì bài tốn trở nên q đơn giản.


ICA phức và ứng dụng vào tách sóng đa truy cập trong hệ thống MIMO-OFDM


×