HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
KHOA QUỐC TẾ VÀ ĐÀO TẠO SAU ĐẠI HỌC
*
TIỂU LUẬN XỬ LÝ TÍN HIỆU NÂNG CAO
SÓNG CON RỜI RẠC
Giảng viên hướng dẫn: TS Nguyễn Ngọc Minh
Nhóm thực hiện : Bùi Anh Tuấn
Nguyễn Ngọc Quân
Lê Thái Sơn
Lớp : M11CQDT01_B
HÀ NỘI – 12/2011
Sóng con rời rạc
MỤC LỤC
1. TÍN HIỆU VÀ BIẾN ĐỔI TÍN HIỆU 2
1.1 Tín hiệu 2
1.2 Biến đổi tín hiệu 3
1.3 Biến đổi trực giao 4
1.4 Khung trong không gian vectơ 7
1.5. Phân tích thời gian - tần số 10
2. NGUYÊN LÝ CỦA BIẾN ĐỔI WAVELET 17
2.1 Giới thiệu 17
2.2. Biến đổi wavelet liên tục 25
2.3. Biến đổi wavelet tham số rời rạc 26
2.4 Ứng dụng DWT trong việc xử lý số tín hiệu 29
2.4.1 Mô hình hệ thống ứng dụng DWT 29
2.4.2 Ứng dụng DWT trong việc triệt tín hiệu nhiễu 29
3. KẾT LUẬN 32
TÀI LIỆU THAM KHẢO 33
1
Sóng con rời rạc
1. TÍN HIỆU VÀ BIẾN ĐỔI TÍN HIỆU
1.1 Tín hiệu
Tín hiệu là biểu diễn vật lý của thông tin. Về mặt toán học, tín hiệu được
biểu diễn bởi hàm của một hay nhiều biến độc lập.
Nếu biến độc lập của sự biểu diễn toán học của một tín hiệu là liên tục thì tín
hiệu đó được gọi là tín hiệu liên tục. Liên tục ở đây được hiểu là liên tục theo biến
số. Nếu dựa vào hàm số thì ta có thể phân loại tín hiệu liên tục ra làm hai loại:
- Tín hiệu tương tự: là loại tín hiệu mà hàm của tín hiệu là liên tục.
- Tín hiệu lượng tử hoá: là loại tín hiệu mà hàm của tín hiệu là rời rạc.
Nếu biến độc lập của sự biểu diễn toán học của một tín hiệu là rời rạc thì tín
hiệu đó gọi là tín hiệu rời rạc. Rời rạc ở đây được hiểu là rời rạc theo biến số. Nếu
dựa vào biên độ thì chúng ta có thể phân tín hiệu rời rạc ra làm hai loại:
- Tín hiệu lấy mẫu: Nếu hàm của tín hiệu rời rạc là liên tục (không được
lượng tử hoá) thì tín hiệu đó được gọi là tín hiệu lấy mẫu.
- Tín hiệu số: Nếu hàm của tín hiệu rời rạc là rời rạc thì tín hiệu đó được gọi
là tín hiệu số. Như thế tín hiệu số là tín hiệu đã được rời rạc hoá cả về biến số và
biên độ.
Tín hiệu rời rạc được ký hiệu là s (nTs) trong đó Ts là chu kỳ lấy mẫu. Nừu
ta chuẩn hoá biến số độc lập nTs bởi chu kỳ lấy mẫu Ts thì tín hiệu rời rạc s(nTs)
sau khi đã chuẩn hoá trở thành s(n).
Để biểu diễn một tín hiệu s(n) ta có các cách sau:
- Biểu diễn dưới dạng toán học:
1 2
BiÓu thøc to¸n N n N
s(n)
0 n cßn l¹i
≤ ≤
=
- Biểu diễn dưới dạng đồ thị: Để tiện minh hoạ một cách trực quan trong
nhiều trường hợp người ta dùng biểu diễn đồ thị.
2
Sóng con rời rạc
- Biểu diễn bằng dãy số: Đây là cách liệt kê tất cả các giá trị của s(n) thành
một dãy số.
1.2 Biến đổi tín hiệu
Biến đổi một hàm hay một tín hiệu là biểu diễn tín hiệu theo dạng toán học
khác. Biến đổi Fourier cho ta phổ của tín hiệu trong khi biến đổi hai chiều của một
ảnh nhằm mục đích tập trung năng lượng ảnh vào một vùng nhỏ để thực hiện nén
ảnh. Một lăng kính sẽ hoạt động như một bộ biến đổi Fourier khi phân tích ánh sáng
tráng thành các phổ màu khác nhau (tần số). Như vậy biến đổi là việc phân tích tín
hiệu thành các khối cơ bản, hay các hàm cơ sở, của miền biến đổi. Trong miền
Fourier các hàm cơ sở là hàm sin. Mỗi tín hiệu đều có một các biểu điển duy nhất
trong miền Founer như là một tổng liên tục các hàm sin có biên độ, tần số và pha
khác nhau.
Cặp biến đổi Fourier của một tín hiệu liên tục là:
j t
S( ) s(t)e dt
∞
− ω
−∞
ω =
∫
(1.1)
j t
1
s(t) S( )e d
2
∞
ω
−∞
= ω ω
π
∫
(1.2)
Biến đổi Fourier thuận phân tích s(t) ra các thành phần hình sin có tần số ω,
biên độ Re[S(ω)] và pha Arg[S(ω)]. Biến đổi Fourier ngược tổng hợp s(t) từ các
hàm cơ sở ω
j
ω
t
có biên độ phức S(ω). Một cách khác để nhìn (1.1) là hàm trọng
S(ω) là “tổng” các ej
ω
t
mà s(t) chứa. Do đó tương quan chéo của s(t) với e
-j
ω
t
sẽ
bao S(ω).
Việc sử dụng các hàm cơ sở đơn giản nhìn chung sẽ làm đơn giản hoá việc
biến đổi và tính toán. Nhưng dù sao thì khối lượng tính toán cũng chỉ là một trong
số các nhân tố trong việc chọn loại hình biến đổi. Các nhân tố khác là tính chất của
biến đổi và và khả năng thích hợp của biến đổi đối với một ứng dụng nhất định.
3
Sóng con rời rạc
Có nhiều lý do để biến đổi hoặc phân tích một tín hiệu, nhưng tựu trung lại ta
có thể nêu ra hai mục đích cơ bản sau:
- Làm bộc lộ những đác tính quan trọng của tín hiệu mà rất khó hoặc không
thể nhận biết trong miền ban đầu.
- Làm đơn giản hoá các vấn đề kỹ thuật phức tạp để dễ giải quyết.
Ví dụ, xét biến đổi Laplace là sự tổng quát hoá biến đổi Fourier, nó biểu diễn
một hàm x(t) dưới dạng tổng liên tục của các hàm cơ sở e
st
. Do đó:
st
x(t) X(s)e ds
∞
−∞
=
∫
(1.3)
Trong đó X(s) là biến đổi Laplace của x(t) và s là đại lượng phức được gọi là
tần số phức. Khi đó ta có các phép toán học tương đương sau: tích phân hoặc vi
phân trong miền t sẽ tương đương với việc nhân X(s) với 1/s hoặc s trong miền
Laplace. Do đó biến đổi Laplace của một phương trình vi-tích phân tuyến tính sẽ
cho ta một phương trình đại số. Kết quả quan trọng này là cơ sở của việc phân tích
hệ thống tuyến tính bằng biến đổi Laplace.
1.3 Biến đổi trực giao
Tập hợp các vectơ {x}, i = 1, 2, , n gọi là trực giao nếu tích vô hướng:
< xi, xj > = cδ
ij
(1.4)
Trong đó:
ij
0 ,i j
1 ,i j
≠
δ =
=
và c là hằng số. Tập hợp này là trực chuẩn nếu c = 1. Khi hai véc tơ trực giao thì
chúng không có tương quan hay không có thành phần chung. Hình chiếu véctơ này
lên véc tơ kia bằng không và tích vô hướng của chúng bằng không. Do đó việc phân
tích một véc tơ ra các thành phần vectơ cơ sở trực chuẩn sẽ trở nên đơn giản hơn.
Gọi {xi} là tập hợp các vectơ trực chuẩn bao một không gian n chiều thì mọi vectơ
4
Sóng con rời rạc
g dạng nx1 thuộc không gian đó đều có thể được biểu diễn dưới dạng tổ hợp tuyến
tính của vectơ xi như sau:
g =
n
i i
i 1
g,x x
=
< >
∑
(1.5)
Nếu {x
i
} không trực chuẩn thì g vẫn có thể được biểu diễn như tổ hợp tuyến
tính của {xi} nhưng các hệ số của xi không còn đơn giản là tích vô hướng <g, xi>.
Gọi các hệ số này là h
1
, h
2
, , hn thì:
[ ]
1
2
1 2 n
n
h
h
g X , X x x x
h
= =
L
M
(1.6)
Để tính các hệ số thì ta phải tính X
-1
g.
Trong mã hoá ảnh, việc biến đổi một ảnh ra các thành phần trực giao của nó
là việc chia ảnh đó ra thành các thành phần không đồng dạng. Do tính độc lập của
nó nên việc lấy ra một số thành phần trực giao từ ảnh biến đổi sẽ không ảnh hưởng
đến thành phần khác. Đặc tính trực giao quan tọng này được tổng quát hoá bởi định
lý hình chiếu. Gọi {xi}, i = 1, 2, …, n là tập hợp các vectơ trực giao bao không gian
n chiều cao cho với với vectơ g ta đều có:
n
i i
i 1
g g,x x
=
= < >
∑
(1.7)
Gọi :
n
i i
i 1
ˆ
g g,x x
=
= < >
∑
, 1 < n (1.8)
Không mất tính tổng quát, ta giả sử rằng các vectơ bị bỏ qua trong (1.8) là xi,
i = l + 1, l + 2,…, n. Định lý hình chiếu phát biểu như sau [3]:
“Xấp xỉ tốt nhất của g là
ˆ
g
theo nghĩa sai số bình phương nhỏ nhất, cụ thể
là:
5
Sóng con rời rạc
2 2
ˆ
g g g g
− ≤ −
%
(1.9)
Trong đó
g
%
là mọi xấp xỉ khác của g theo tập rút gọn các vectơ xi, i = 1, 2,
…, l”.
Chứng minh: Ta viết:
n
i i
i 1
g x
=
= α
∑
%
(1.10)
Trong đó α
i
là các hằng số. Khi đó ta phải chứng minh rằng
2
g g
−
%
là nhỏ
nhất khi α
i
= < g, xi>. Sai số xấp xỉ là:
n n
2
i i i i
i 1 i 1
g,x x x
= =
ε = < > − α
∑ ∑
)1.11)
Do các xi là trực giao nên công thức trở thành:
Định lý Parseval phát biểu lằng năng lượng trong miền thời gian bằng năng
lượng trong miền tần số.
Tiếp theo chúng ta mở rộng việc khai triển trực giao đối với các hàm. Tập
hợp các hàm {fi(t)} là trực giao trên khoảng t
1
đến t
2
nếu:
2
1
t
*
i j ij
1 2
t
1
f (t)f (t)dt
t t
= δ
−
∫
(1.15)
Trong dó dấu * thể hiện là liên hợp phức. Ví dụ tập các hàm
{ }
u
jn t
e
ω
với n là
số tự nhiên và ω
0
là hằng số khác 0 là trực giao trên khoảng [-T/2, T/2], với T =
0
2π
ω
. Đặc tính xấp xỉ bình phương nhỏ nhất của các vectơ cũng được áp dụng với các
hàm. Do đó trong việc biểu diễn tín hiệu tuần hoàn bằng chuỗi Fourier thì tổng còn
lại sau khi đã bỏ đi một số phần tử của dãy cũng sẽ là xấp xỉ bình phương nhỏ nhất
của tín hiệu.
6
Sóng con rời rạc
Trong khi biểu diễn tín hiệu bỏi tập hợp trực giao {fi(t)}, ta chỉ có thể biểu
diễn được chính xác tín hiệu nếu đó là một tập hợp đầy đủ. Một tập hợp gọi là đầy
đủ nếu không tồn tại một hàm h(t) khác không, không thuộc tập hợp, thoả mãn:
1
t
*
i
t
h(t)f (t)dt 0=
∫
, i = 1, 2, …, n (1.16)
Nếu tồn tại hàm h(t) như thế thì nó sẽ trực giao với tập hợp đã cho và do đó
nó sẽ là một phần tử của tập hợp, nếu không tập hợp sẽ không đầy đủ. Với các
vectơ, tập hợp đầy đủ là tập hợp các vectơ cơ sở bao không gian vectơ.
1.4 Khung trong không gian vectơ
Việc phân tích một vectơ ra tập hợp trực chuẩn của các vectơ cơ sở đơn giản
chỉ là phép tính tích vô hướng. Bây giờ ta mong muốn vẫn giữ nguyên phép tính
đơn giản như thế khi các vectơ cơ sở không còn là trực chuẩn (hoặc trực giao) nữa.
Chú ý rằng các vectơ cơ sở không cần phải trực chuẩn, nó thậm chí có thể phụ
thuộc tuyến tính và do đó có thể là dư thừa. Chỉ có một yêu cầu là chúng bao không
gian vectơ sao cho mọi vectơ thuộc không gian vectơ đều có thể được biểu diễn
theo các vectơ đó. Lý thuyết khung là sự tổng quát hoá nguyên lý phân tích trực
chuẩn và cho ta cách biểu diễn một vectơ mx1 như sau [3]:
n
i i
i 1
g g,x x
=
= < >
∑
%
, n ≥ m (1.7)
Điều này, cũng tương tự như công thức (1.7) trừ tập hợp {xi} không nhất
thiết phải trục chuẩn và do n ≥ m nên các vectơ cơ sở xi, có thể phụ thuộc tuyến
tính. Tập hợp
{ }
i
x
%
gọi là tập đối ngẫu của tập hợp {xi}. Công thức (1.17) cho thấy
rằng khi phân tích ta vẫn tính tích vô hướng nhưng khi khôi phục ta phải đưa thêm
các đối ngẫu vào.
x
i
bây giờ được gọi là phần tử của một khung và
{ }
i
x
%
gọi là khung đối ngẫu
của {xi}. Để đơn giản ta giả sử xi là vectơ đơn vị. Một khung {xi} là tập hợp các
vectơ theo công thức sau với mọi vectơ m có dạng m x 1 khác không:
7
Sóng con rời rạc
n
2 2 2
i
i 1
A g g,x B g
=
≤ < > ≤
∑
n ≥ m (1.18)
Trong đó A và B là các hằng số chỉ phụ thuộc vào {xi} và gọi là các giới hạn
khung, với 0 < A ≤ B < ∞. Chúng là các giới hạn dưới cao nhất và giới hạn trên
thấp nhất của khung. Giới hạn dưới đảm bảo rằng tập hợp {xi} bao không gian
vectơ, cụ thể là {xi} là một khung đầy đủ, nếu không
n
2
i
i 1
g, x
=
< >
∑
, có thể bằng
không với một số giá tri của
g
khác không. Nếu {xi} là một khung thì (1.17) được
duy trì. Một khung là chặt nếu A = B và (1.17) thoả mãn với
i i
x x / A=
%
. Hơn nữa,
nếu bỏ một phần tử của một khung chặt thì sẽ vi phạm giới hạn dưới của (1.18), cụ
thể là khung sẽ trở nên không đầy đủ. Các phần tử của một khung chặt với A = B =
1 sẽ tạo thành một cơ sở trực chuẩn và (1.17) được duy trì với
i i
x x=
%
.
Tóm lại, lý thuyết khung cung cấp cách biểu diễn một vectơ theo tập hợp các
vectơ cơ sở mà các vectơ này không cần thiết phải trực chuẩn hay độc lập tuyến
tính. Các hệ số vẫn là tích vô hướng của vectơ với vectơ cơ sở. Việc khôi phục yêu
cầu các vectơ cơ sở mới gọi là đối ngẫu. Khi
{ }
i
x
%
thoả mãn (1.18) thì mọi vectơ g
đều có thể được tổng hợp theo (1.17). Nếu A = B = 1 thì
i
x
%
= xi, và {xi} tạo thành
một cơ sở trực chuẩn. Lý thuyết khung sau này được dùng để phân tích và khôi
phục một hàm bằng các wavelet.
Nếu {xi} là một khung chặt thì
i
x
%
= cxi, trong đó c là một hằng số. Để tìm
khung đối ngẫu {
i
x
%
} khi {xi} không chặt, gọi:
[ ]
[ ]
mxn 1 2 n
mxn 1 2 n
X x x x
X x x x
=
=
%
% % %
(1.19)
Giả sử {xi} tuân thủ (1.18), do đó từ (1.17) ta có:
G =
X
%
XTg (1.20)
8
Sóng con rời rạc
với mọi véc tơ có dạng m x l. Do đó
X
%
phải thoả mãn:
T
mxn mxn mxm
X X I=
%
(1.21)
Trong đó I là ma trận đơn vị, Trong công thức trên có m x n số không biết
trong
X
%
và ta có m
2
(n ≥ m) phương trình. Do vậy số nghiệm cho
X
%
là không duy
nhất.
Một trong các nghiệm dạng nghịch đảo là:
X
%
= (X XT)
-1
X (1.22)
Nghịch đảo trong công thức trên tồn tại do ta đã giả sử rằng {xi} là khung
đầy đủ. Thay thế trực tiếp (1.22) vào (1.21) tất nhiên sẽ cho kết quả là ma trận đơn
vị, Dù sao thì (1.22) cũng chỉ là nghiệm chuẩn nhỏ nhất. Ta sẽ có các nghiệm khác
là
X + X
%
với
X
là mọi vectơ thoả mãn
X 0≠
và
X
XT = 0. Do đó khung đối
ngẫu là không duy nhất như mong muốn, trừ phi chúng ta thêm điều kiện chuẩn hoá
nhỏ nhất.
Sau đây ta sẽ chứng minh rằng {xi} là trực chuẩn nếu và chỉ nếu A = B = 1
trong (1.18).
Giả sử {xi} là một tập hợp trực chuẩn, do đó với mọi vectơ g có dạng mxl ta
đều có:
n
2 2
T T
i
i 1
g, x g XX g g
=
< > = =
∑
(1.23)
Kết hợp công thức này với (1.18) cho ta A = B = 1.
Tiếp theo, giả sử A = B = 1. Gọi:
F = X.XT (1.24)
là một ma trận dương đối xứng do X có đầy đủ các hàng. Do đó tồn tại một ma trận
đơn vị P sao cho:
PTFP = Λ (1.25)
9
Sóng con rời rạc
là một ma trận đường chéo có các phần tử là các trị riêng của F. Do đó:
m
2
T T
i
i 1
g, x g P Pg
=
< > = Λ
∑
(1.26)
Do P là ma trận đơn vị nên
Pg g=
. Do đó:
m
2 2 2
min i max
i 1
g g,x g
=
λ ≤ ≤ λ
∑
(1.27)
Trong đó λmin và λ
max
là các trị riêng nhỏ nhất và lớn nhất của F (cả hai đều
dương). Nếu λ
min
= λ
max
= λ thì F phải là ma trận chéo với các phần tử là λ và
i i
x x /= λ
%
. Nhưng nếu λ = 1, tức là A = B = 1 thì
i
x
%
= xi và {xi} lỐ trực chuẩn.
Nếu một biến đổi có biến đổi ngược thì năng lượng tín hiệu trong miền ban
đầu phải bằng năng lượng trong miền biến đổi nhân với một hằng số. §ây gọi là tính
đồng nhất. Một ví dụ điển hình của tính đồng nhất là định lý Parseval. Do đó việc
khôi phục tín hiệu theo các hàm cơ sở chỉ khả thi nếu năng lượng được giữ trong
một hằng số. Khung nhìn chung không thoả mãn tính đồng nhất. Vì vậy khi khôi
phục ta phải đưa các đối ngẫu vào.
1.5. Phân tích thời gian - tần số
Rất nhiều tín hiệu là tín hiệu không đừng. Công suất và phổ của tín hiệu thay
đổi theo thời gian. Do đó việc mô tả đầy đủ tín hiệu không dừng trong miền tần số
phải chứa cả khía cạnh thời gian. Điều này dẫn đến việc phân tích thời gian - tần số
của một tín hiệu.
Nếu phổ của tín hiệu phụ thuộc thời gian thì ta phải sử dụng các phân đoạn
đủ ngắn của nó (với giả sử rằng phổ là hằng số trên mỗi phân đoạn) để tính toán
phổ. Việc lấy một đoạn của một hàm thời gian được gọi là lấy cửa sổ. Như thể hiện
trên hình 1.2, điều này tương đương với việc nhân tín hiệu với một hàm cửa sổ có
dạng:
1 víi t' t t' +T
w(t)
0 Víi t kh¸c
≤ ≤
=
(128)
10
Sóng con rời rạc
Cửa sổ sẽ dịch chuyển đọc theo trục thời gian, có thể chồng lên nhau nếu cần
thiết, để tạo ra các đoạn của tín hiệu s(t) để phân tích. Ví dụ, ta có thể có đồ thị 3
chiều của biên độ phổ theo thời gian và tần số, hoặc đồ thị 2 chiều của tần số theo
thời gian với độ lớn của phổ thể hiện bởi độ đậm nhạt của màu. Các đồ thị như thế
gọi là các phổ đồ (spectrogram) trong phân tích tiếng nói.
Một phân đoạn có chiều dài T của tín hiệu là:
s(t) s(t)w(t)=
%
(1.29)
Theo định lý nhân chập thì biến đổi Fourier của
s(t)
%
là:
S( ) S( ) * W( )ω = ω ω
%
(1.30)
Hình 1.2: Lấy cửa sổ
Trong đó S(ω) và W(ω) là biến đổi Fourier của s(t) và w(t). Giả sử tín hiệu
s(t) là dừng và là tín hiệu hình sin có chiều dài vô hạn tần số ω, khi đó các biến đổi
S( ) , W( ) vµ S( )
ω ω ω
%
được thể hiện trên hình sau:
11
Sóng con rời rạc
Hình 1.3: Cửa sổ phổ của: (a) một hình sin; (b) hai hình sin
Do việc lấy cửa sổ nên
S( )
ω
%
chính là
S( )ω
được trải ra bởi cửa sổ
W( )ω
. Bây giờ nếu s(t) chứa hai sóng sin có cùng biên độ và tần số là ω
1
và ω
2
thì
S( )
ω
%
được thể hiện trên hình 1.3b, trong đó hình dạng phổ phụ thuộc vào khoảng cách
2 1 2 1
.NÕu 2 / T th× S( )
ω − ω ω − ω ≥ π ω
%
có hai đỉnh phân biệt tại ω
1
và ω
2
. Khi
2 1
ω − ω
càng nhỏ thì hai đỉnh càng dịch lại gần nhau và đến một mức nào đó thì
chỉ xuất hiện một đỉnh. Qua đó ta thấy để phân biệt hai sóng sin thì thời gian quan
sát phải chứa ít nhất một chu kỳ của tần số lấy mẫu, cụ thể là:
12
Sóng con rời rạc
2 1
2π
ω − ω ≥
Τ
(1.31)
Do đó độ phân giải tần số có thể thực hiện được của một đoạn có chiều dài T
là:
2 1
1
f
2 T
ω − ω
∆ = =
π
(1.32)
Nhìn (1.31) theo một cách khác, bằng cách xem ∆f như là độ rộng băng tần
của tín hiệu thì tích thời gian - băng tần của một phân đoạn tín hiệu phải lớn hơn
đơn vị để có thể tạo ra độ phân giải ∆f. Từ khía cạnh nội dung thông tin thì tích thời
gian - băng tần lớn là một đặc tính mong muốn. Để có khả năng phân biệt sự có mặt
của hai hình sin trong một tín hiệu thì ta phải quan sát tín hiệu trong một thời gian
đủ lớn. Nếu chúng ta đánh giá tần số của một sóng sin từ phổ của đoạn đã lấy cửa
sổ thì sai số đánh giá sẽ lớn nếu đoạn chỉ chứa một phần nhỏ của một chu kỳ, đặc
biệt khi có mặt của nhiễu.
Trong phân tích thời gian - tần số của một tín hiệu không dừng, có hai yêu
cầu xung đột nhau. Độ rộng cửa sổ T phải đủ lớn để cho ta độ phân giải tần số
mong muốn nhưng cũng phải đủ ngắn để không làm mờ đi các biến cố phụ thuộc
thời gian. Nếu tín hiệu chứa hai xung cách nhau d giây thì T phải nhỏ hơn d giây để
có thể phân biệt hai xung. Độ phân giải tốt theo thời gian hay tần số biểu hiện sự
định vị tốt theo thời gian hay tần số. Một cửa sổ rất hẹp, lý tưởng là một xung, cho
ta độ phân giải (định vị) hoàn hảo theo thời gian nhưng độ phân giải (định vị) tồi
theo tần số do nó có băng tần vô hạn. Mặt khác. một bộ lọc băng hẹp sẽ cho ta định
vị tốt theo tần số nhưng định vị tồi theo thời gian do đáp ứng xung của nó không
giảm xuống đủ nhanh theo thời gian [3].
Các sóng sin là cục bộ trong miền tần số nhưng lại trải dài trong miền thời
gian. Chúng có chiều dài vô hạn. Được sử dụng như hàm cơ sở trong phân tích
Fourier, chúng dựa vào sự triệt tiêu để biểu diễn (tổ hợp) sự không liên tục theo thời
gian. Đây là nguyên nhân của hiệu ứng Gibb. Do đó trong việc biểu diễn các hàm
hữu hạn (các hàm khác không trong một khoảng thời gian hữu hạn), các hình sin
13
Sóng con rời rạc
không hiệu quả bằng các hàm cơ sở hữu hạn. Hiệu quả ở đây được đo bằng số các
hệ số cần thiết trong miền biến đổi để biểu diễn một hàm nhất định.
Trong khi thiết kế hình dạng cửa sổ để đạt được độ phân giải thời gian hay
tần số mong muốn, có một giới hạn cơ bản mà theo đó ta có thể đưa ra giá trị T.
Giới hạn này xuất phát từ nguyên lý bất định, trong đó phát biểu rằng mọi cặp biến
đổi s(t) và S(ω) đều phải thoả mãn:
t
1
2
ω
∆ ∆ ≥
(1.33)
Trong đó:
2
2
2
t
2
t s(t) dt
s(t) dt
∆ =
∫
∫
(1.34)
2
2
2
2
s( ) d
s( ) d
ω
ω ω ω
∆ =
ω ω
∫
∫
(1.35)
Chúng được đo bằng sự biến thiên hay phân bố của s(t) và S(ω). Coi
2
2
s(t)
s(t) dt
∫
như là hàm mật độ xác suất của biến ngẫu nhiên t thì theo (1.34),
2
t
∆
là
mô men bậc hai của t. Ta có thể làm rõ hơn công thức (1.33) với ∆
ω
là thời gian và
băng tần hiệu dụng của tín hiệu như sau: nếu một tín hiệu có băng tần ∆
ω
thì thời
gian tồn tại của nó phải lớn hơn 1/(2∆
ω
) và ngược lại. Sau này ta sẽ thấy rằng biến
đổi wavelet, thông qua việc sử dụng độ rộng cửa sổ khác nhau, có thể đạt được ∆
t
hay ∆
ω
nhỏ theo yêu cầu (ít nhất là về mặt lý thuyết), mặc dầu tất nhiên ta không thể
đồng thời đạt được cả hai [3].
Hàm thoả mãn dấu bằng trong (1.33) là hàm Gausian. Thật vậy, gọi:
s(t) =
2
2
t
t
2
t
1
e
2
−
δ
πδ
(1.36)
14
Sóng con rời rạc
Khi đó:
2
2
2
S( ) e
ω
ω
−
δ
ω =
(1.37)
Trong đó
2
2
t
1
ω
δ =
δ
. Đặt hai công thức trên vào (1.34) và (1.35) ta được
2
2
2 2
t
t
vµ
2
ω
ω
δ
δ
∆ = ∆
2
. Do đó:
t
t
1
.
2
2 2
ω
ω
δ
δ
∆ ∆ = =
(1.38)
Do vậy s(t) thoả mãn dấu bằng trong (1.33) [3].
Có một số phương pháp phân tích thời gian - tần số, đáng chú ý là biến đổi
Fourier thời gian ngắn (STFT) sử dụng để tạo ra phổ đồ trong phân tích tiếng nói và
phân bố Wigner - Ville.
Tất cả các phương pháp phân tích thời gian - tần số đều có thể được tổng
quát hoá bởi tích phân sau:
j j j u
2
u
1
P( , ) e ( , )s u u
2
4
− θτ− λω+ θ
λ θ
λ
τ ω = φ θ λ − λθ
÷
π
∫∫∫
(1.39)
Trong đó P(τ, ω) là cường độ của tín hiệu s(t) tại thời gian τ và tần số ω.
Bằng cách chọn φ(θ,) = 1 và tính tích phân trên theo θ ta được:
j
2
u
1
P( , ) s u - (u - ) dud
2
− λω
λ
λ λ
τ ω = σ υ + ε δ τ λ
÷ ÷
2
2π
∫∫
(1.40)
Đây chính là phân bố Wigner - Ville:
W(τ,ω) =
j
1
s s e d
2 2
− λω
λ
λ λ
τ − τ + λ
÷ ÷
π 2
∫
(1.41)
Tiếp theo, ta đặt:
15
Sóng con rời rạc
j l
l
1
( , ) w l w l e dl
2 2 2
− θ
λ λ
φ θ λ = − +
÷ ÷
π
∫
(1.42)
Thay vào công thức (1.39) và lấy tích phân theo θ ta được:
( )
j
2
u l
1
P , e s u s u
2 2
4
− λω
λ
λ λ
τ ω = − +
÷ ÷
π
∫∫∫
w u w u u dud dl
2 2 2
λ λ λ
− + δ − τ + λ
÷ ÷ ÷
(1.43)
Tiếp tục tính tích phân theo l ta được l = u - λ và:
( )
j u j u
2 2
2
u
1
P , e e s u s u
2 2
4
λ λ
− + ω − ω
÷ ÷
λ
λ λ
τ ω = − +
÷ ÷
π
∫∫
w u w u dud
2 2
λ λ
− τ − − τ + λ
÷ ÷
(1.44)
Đặt t = u +
2
λ
à t’ = u -
2
λ
ta sẽ được phổ đồ, tức là đồ thị bình phương biên
độ của STFT như sau:
( )
2
2
j t
t
1
STFT , e s(t)w(t )dt
2
− ω
τ ω = − τ
π
∫
(1.45)
Trong công thức trên, w(t - τ) là hàm số lấy dọc theo s(t) và STFT là biến đổi
Fourier của tích đó. Đo đó STFT ánh xạ một tín hiệu một chiều s(t) vào miền hai
chiều của thời gian và tần số. Khi w(t) là cửa sổ Gausian thì STFT được gọi là biến
đổi Gabor. Trong việc phân tích tiếng nói thì cửa sổ có thể là cửa sổ Hamming, nó
yêu cầu ít phép tính hơn cửa sổ Gausian [3].
16
Sóng con rời rạc
2. NGUYÊN LÝ CỦA BIẾN ĐỔI WAVELET
2.1 Giới thiệu
Biến đổi wavelet, tương tự như STFT, cũng ánh xạ một hàm thời gian vào
một hàm hai chiều a và τ (thay cho ω và τ). Tham số a gọi là tỷ lệ (scale), nó tỷ lệ
một hàm bằng cách nén hoặc dãn hàm đó. Tham số τ gọi là tham số dịch
(translation), nó dịch hàm wavelet dọc theo thời gian. Tín hiệu s(t) được giả sử là
khả tích bình phương, ký hiệu là s(t) = ∈ L
2
(R), có nghĩa là:
2
s (t)dt
∫
< ∞ (2.1)
Chú ý rằng tín hiệu một chiều và tín hiệu hình sin không phải là hàm L
2
(R).
Nhưng các hàm số có biên độ và thời gian tồn tại hữu hạn đều là hàm L
2
(R). Biến
đổi wavelet liên tục của tín hiệu s(t) là:
CWT (a, τ) =
1 t
s(t)
a
a
− τ
ψ
÷
∫
dt (2.2)
Trong đó ψ(t) là wavelet cơ sở (hay wevelet mẹ) còn hàm ψ((t - τ)/a)/
a
là
các hàm cơ sở wavelet gọi là các wavelet con. Bằng cách đổi biến at’ = t, công thức
trên trở thành:
CWT (a, τ) =
1
s(at') t'
a
a
τ
ψ −
÷
∫
dt’ (2.3)
Có một sự khác nhau cơ bản giữa STFT và biến đổi wavelet. Trong STFT,
tại tần số phân tích ω
0
, việc thay độ rộng cửa sổ sẽ tăng hoặc giảm số chu kỳ của ω
0
nằm trong cửa sổ. Trong biến đổi wavelet, tại tần số sóng mang ω
0
, do độ rộng cửa
sổ thay đổi có nghĩa là nén hoặc dãn nên tần số sóng mang sẽ trở thành ω
0
/a khi độ
rộng cửa sổ từ T lên aT. Nhưng số chu kỳ nằm trong cửa sổ vẫn giữ nguyên. Hình
2.1 minh hoạ sự khác nhau này. Độ phân giải tần số tỷ lệ thuận với độ rộng cửa sổ ở
cả STFT và biến đổi wavelet. Nhưng trong biến đổi wavelet, tần số trung tâm sẽ
dịch tương ứng với sự thay đổi độ rộng cửa sổ
17
Sóng con rời rạc
Hình 2.1: So sánh giữa biến đổi STFT và biến đổi Wavelet
Wavelet cơ sở ψ(t) có thể là thực hoặc phức, do vậy kết quả của biến đổi
cũng có thể là thực hoặc phức. Khi ψ(t) là phức thì liên hợp phức của nó được dùng
trong các công thức (2.2) và (2.3). Với một số ứn dụng, có một số tiện lợi khi sử
dụng wavelet phức do pha của biến đổi wavelet có thể chứa các thông tin hữu ích.
18
Sóng con rời rạc
Sau đây ta đưa một số ví dụ về các wavelet cơ sở ψ(t) và biến đổi Fourier
tương ứng của nó.
1. Gausian có điều chế (Morlet):
ψ(t) =
2
t
j t
2
e e
0
−
ω
ψ(ω) =
2
( )
2
2 e
0
ω−ω
−
π
(2.4)
2. Đạo hàm bậc hai của hàm Gausian:
ψ(t) =
2
t
2
2
(1 t )e
−
−
ψ(ω) =
2
2
2
2 e
ω
−
πω
(2.5)
3. Haar:
ψ(t) =
1
1 víi 0 t
2
1
-1 víi t 1
2
0 víi t kh¸c
≤ ≤
≤ ≤
(2.6)
ψ(t) =
( )
2
j
2
sin / 4
je
/ 4
ω
−
ω
ω
4. Shannon:
ψ(t) =
( )
2
sin t / 2
3 t
cos
t / 2 2
π
π
÷
π
ψ(t) =
1 víi 2
0 víi kh¸c
π ω ≤ π
ω
(2.7)
Chúng được vẽ trên hình 2.2 và các phiên bản dịch và tỷ lệ của chúng được
thể hiện trên hình 2.3.
Từ các hình vẽ trên chúng ta có thể rút ra một số đặc tính của wavelet như
sau:
19
Sóng con rời rạc
1. ψ(t) = 0 tại t = 0 hoặc tương ứng là
(t)dt = 0
ψ
∫
cụ thể là chúng không có
thành phần một chiều.
2. Chúng là các tín hiệu thông dải.
3. Chúng suy giảm nhanh về về 0 theo thời gian.
Tính chất 1 là kết quả của điều kiện chấp nhận được của một wavelet, điều
kiện này đảm bảo biến đổi wavelet có biến đổi ngược. Tính chất 2 được suy ra từ
tính chất 1. Điều kiện suy giảm nhanh là ko cần thiết về mặt lý thuyết để ψ(t) trở
thành một wavelet. Dù sao trong thực tế thì ψ(t) nên là hàm hữu hạn để có khả năng
định vị tốt trong miền thời gian.
20
Sóng con rời rạc
Hình 2.2: Một số loại wavelet và biến đổi Fourier của chúng
21
Sóng con rời rạc
Hình 2.3: Wavelet Haar và wavelet con của nã
Từ công thức (2.2) ta thấy có 4 cách tính CWT như sau:
1. Tính theo tích vô hướng tương quan chéo của s(t) và ψ(t/a)/
a
tại độ dịch
τ/a. Do đó nó tính độ “tương đồng” giữa s(t) và ψ(t/a)/
a
, đầu vào s(t) hoặc là các
thành phần của s(t) có chung với ψ(t/a)/
a
.
2. Nó là đầu ra của bộ lọc thông dải có áp xung à ψ(t/a)/
a
, đầu vào s(t) tại
thời điểm τ/a.
3. Do (2.3) tuơng tự như (2.2), ta cũng có thể tính theo tích vô hướng hay
tương quan chéo giữa một tín hiệu tỷ lệ s(at) với à
a
ψ(t) tại độ dịch τ/a.
4. Từ (2.3) ta cũng thấy rằng CWT cũng là đầu ra của bộ lọc thông dải có đá
ứng xung
a
ψ(- t), đầu vào s(at), tại thời điểm τ/a.
Các cách này tăng số phương án thực hiện biến đổi wavelet. Việc lựa chọn
phụ thuộc vào các thuật toán hiện có và phụ thuộc vào ứng dụng. Ví dụ, có thể thực
hiện biến đổi wavelet theo hai sơ đồ trên hình 2.4 và 2.5. [3].
22
Sóng con rời rạc
Hình 2.4: Thực hiện biến đổi Wavelet bằng băng lọc
Hình 2.5: Một sơ đồ thực hiện biến đổi wavelet nhanh
23
Sóng con rời rạc
Trong sơ đồ thứ nhất trên hình 2.4, việc tính tương ứng chéo s(t) và wavelet
con tương đương với việc tìm đầu ra các băng lọc thông giải có đáp ứng xung ψ(-
t/a)/
a
và đầu vào s(t). trong sơ đồ thứ hai trên hình 2.5, các phiên bản tỷ lệ của s(t)
được đưa qua các bộ lọc thông dải tương tự nhau để tìm biến đổi. Sơ đồ thứ hai cho
ta biến đổi giống sơ đồ thứ nhất nhưng có vẻ dễ thực hiện hơn nếu cách đơn giản để
tính tỷ lệ hàm s(t). Bằng cách rời rạc hoá s(t) và giới hạn tỷ lệ để đạt hệ số nén bằng
2, mỗi khối tính tỷ lệ trên hình 2.5 sẽ trở thành một bộ lọc thông thấp và tiếp theo là
bộ phân chia 2. Đây chính là cơ sở để của biến đổi wavelet nhanh sẽ được nghiên
cứu ở phần sau.
Người ta dựa vào tính chất của các tham số và biến số để chia ra thành 4 loại
biến đổi wavelet như sau:
1. Biến đổi wavelet liên tục:
CWT (a, τ) =
1 t
s(t)
a
a
− τ
ψ
÷
∫
dt (2.8)
2. Biến đổi wavelet tham số rời rạc:
DPWT (m, n) =
( )
m
m
2
0 0 0
a s(t) a t n
−
−
ψ − τ
∫
(2.9)
Trong đó các tham số a, τ được rời rạc hoá bởi a =
m
0
a
và τ = n
m
0
a
0
τ
với a
0
,
τ
0
là các khoảng lấy mẫu và m,n là số tự nhiên. Cả s(t) và ψ(
( )
m
0
a t
−
vẫn là các hàm
liên tục. Điều này tương đương với chuỗi Fourier, trong đó chỉ tần số là tham số rời
rạc. Để tính toán có hiệu quả người ta dùng a
0
= 2 và τ= 1 dẫn đến hệ số giãn 2
-m
va
hệ số 2 là 2
mn
.
3. Biến đổi wavelet thời gian rời rạc:
DtWT(m, n) =
m
m
2
0 0 0
k
a s(k) (a k n )
−
−
ψ − τ
∑
(2.10)
24