Tải bản đầy đủ (.pdf) (39 trang)

XỬ lý ẢNH CHƯƠNG 14

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (467 KB, 39 trang )

Ch­¬ng 14

BIẾN ĐỔI SÓNG CON
14.1. GIỚI THIỆU
Những quan tâm chính trong thời gian gần đây là việc phát triển các kỹ thuật biến
đổi mới. Nhận biết địa chỉ các vấn đề đối với việc nén ảnh, các cạnh và các đặc trưng
cần nhận biết khác, cũng như việc phân tích cấu trúc ảnh. Các kỹ thuật được biết đến
như phân tích đa giải pháp, phân tích phổ thời gian, thuật toán hình chóp, và biến đổi
sóng con (Wavelet).
Trong chương này, chúng ta sẽ xem lại một vài giới hạn trong biến đổi cổ điển
Fourier và biến đổi tương tự Fourier và định nghĩa ba loại biến đổi sóng con. biến đổi
sóng con mở ra một triển vọng cải thiện được cho các chương trình ứng dụng. Chúng
ta sẽ sơ qua lịch sử phát triển dẫn tới phép phân tích sóng con, nên nhớ biến đổi
tương tự có khuynh hướng thống nhất các cách tiếp cận khác nhau với mục đích
quan trọng là biến đổi sóng con. Phần sau trong chương này, chúng ta sẽ minh hoạ
một vài ứng dụng của biến đổi sóng con.
Chúng ta hạn chế biến đổi sóng con với các giá trị thực, tính toán được, các hàm
tính tích phân của một hoặc hai chiều, bao gồm các tín hiệu và các ảnh mà chúng ta
quan tâm. Như trước, để đơn giản chúng ta giới thiệu các khái niệm một chiều và sau
đó tổng quát hoá nó trong hai chiều cho các chương trình ứng dụng. Chúng ta bắt đầu
bằng cách giới thiệu ba loại biến đổi cơ sở của sóng con. Sau đó chúng ta minh hoạ
một vài trường hợp cụ thể của sóng con và một vài chương trình ứng dụng của sóng
con.
14.1.1. Sóng và sóng con
Trở lại biến đổi Fourier mà chúng ta đã sử dụng, các hàm cơ sở, sóng hình sin.
Chúng được gọi với tên như vậy vì nó giống như sóng của đại dương và được truyền
trong các phương tiện khác. Đối với biến đổi tích phân mà hai cận ở vô cùng. Các
vec tơ của biến đổi Fourier rời rạc cũng là các số khác 0 trên toàn miền xác định; tức
là, chúng không được hỗ trợ trọn gói.
Ngược lại, các thành phần tín hiệu tức thời chỉ khác 0 trong một khoảng thời gian
ngắn, nhiều đặc điểm quan trọng trong ảnh (các biên chẳng hạn) cũng được định vị


trong không gian. Các thành phần kể trên không giống các hàm cơ sở của biến đổi
Fourier và chúng không được thể hiện đầy đủ trong các hệ số biến đổi (chẳng hạn
như phổ tần số), sẽ đề cập đến sau này. Việc này làm cho biến đổi Fourier và các
biến đổi sóng khác, như đã đề cập trong phần trước của chương, ít các tuỳ chọn cho
phép nén và phân tích tín hiệu và ảnh trong các thành phần tạm thời hay cố định.
Tính chất khá tốt đó là, chúng ta chú ý biến đổi Fourier có thể đưa ra các hàm
phân tích chẵn của một tín hiệu tức thời hẹp như tổng của tín hiệu hình sin. Thực
hiện việc này, rất phức tạp cho việc huỷ bỏ các sóng hình sin để tạo ra các hàm có
giá trị 0 trong chủ yếu các khoảng thời gian. Một cách đúng đắn cho việc thực hiện
biến đổi ngược, nhưng bỏ đi các phổ hơn là việc làm rối tung các hàm.

244


Bạn có thể hiểu một cách không đầy đủ, các nhà toán học và các kỹ sư đã mở rộng
một vài cách tiếp cận sử dụng biến đổi với các hàm cơ sở với khoảng tồn tại giới hạn.
Các hàm cơ sở có nhiều loại như chẳng hạn như tần số. Chúng là sóng giới hạn bị
chặn và được biết đến với tên là sóng con (Wavelet). Biến đổi dựa trên chúng gọi là
biến đổi sóng con. Chúng cũng được gọi như việc thực hiện xoá trong một lượng
đáng quan tâm của ngôn ngữ tiếng pháp đối với các chủ thể.
Hình 14-1 minh hoạ sự khác biệt giữa sóng và sóng con. Hai sóng trên là sóng
cosin và sóng sin khác nhau về tần số, nhưng không bền. Hai sóng dưới là sóng con
khác nhau về tần số và vị trí theo trục.

HÌNH 14-1

Hình 14-1 Sóng và sóng con
Phép biến đổi Haar là ví dụ đơn giản nhất trong biến đổi sóng con. Nó khác các
biến đổi khác trong chương 13 cả vec tơ cơ sở sinh ra nó bởi phép chuyển đổi và lấy
tỷ lệ của một hàm đơn. Hàm Haar, nó là một cặp xung chữ nhật lẻ, là biến đổi cổ

điển nhất và đơn giản nhất của biến đổi sóng con.
14.1.2. Phân tích phổ thời gian.
Trong các tài liệu về xử lý tín hiệu bao gồm các công việc như nhận và phân tích
tín hiệu trong thuật ngữ của biến đổi hai chiều theo không gian tần số và thời gian.
Các tiếp cận thực sự trước biến đổi Sóng con, nhưng bây giờ phải cải tạo cho thích
hợp cùng công việc. Tuỳ thuộc vào nó, mỗi thành phần tức thì của bản đồ tín hiệu
được định vị trong miền tần số và thời gian mà đảm nhận cho các tính trội cho các
thành phần tần số và thời gian xảy ra (hình 14-2).

HÌNH 14-2

245


Hình 14-2 Không gian tần số- thời gian: (a) tín hiệu; (b) biểu diễn của nó
Trong phân tích ảnh, không gian là ba chiều và có thể được xem như một ngăn
xếp ảnh. Vị trí của thành phần sẽ xuất hiện chủ yếu tại mức cao của ngăn xếp sẽ đảm
nhận cho tính trội của thành phần tần số. Trong hình 14-3 chỉ ra một ảnh chứa hai
thành phần định vị được đưa ra cho hai bộ lọc thông. Trong trường hợp này hai bộ
lọc hoàn toàn cô lập hai thành phần.
Phương pháp tiếp cận này bắt đầu bằng với biến đổi Fourier cửa sổ Gabor, và dẫn
đến biến đổi Fourier thời gian ngắn và mã hoá băng con.
14.1.2.1. Sóng con và âm nhạc
Hãy chú ý các nốt nhạc trong hình 14-4, nó có thể được xem như việc mô tả
không gian hai chiều tần số và thời gian. Tần số tăng từ dưới lên, trong khi thời gian
tăng theo chiều trái sang phải. mỗi nốt trên khuôn nhạc đảm nhận cho thành phần của
sóng con (âm tần) mà nó sẽ xuất hiện trong khi thực hiện một bài hát. Độ bền của
mỗi sóng con là được mã hoá bằng loại nốt, chứ không theo độ rộng của nó.
Nếu ta phân tích việc thực hiện một bản nhạc và viết ra các điểm của nó, chúng ta
sẽ có một loại biến đổi sóng con. Tương tự, việc ghi một bài hát có thể xem như một

phép biển sóng con rời rạc, do nó xây dựng lại các tín hiệu từ việc đặt lại các tần số
và thời gian.

HÌNH 14-3

Hình14-3 Phân tích không gian-tần số ảnh.

HÌNH 14-4

Hình14-4 Nốt nhạc như một mặt tần số-thời gian.
246


14.1.3. Các biến đổi
Nhắc lại rằng mỗi hệ số trong một biến đổi được xác định bằng một tích giữa hàm
đầu vào và một trong những hàm cơ sở. Trong một vài trường hợp, giá trị này biểu
diễn mức độ giống nhau hàm đầu vào và hàm cơ sở đó. Nếu các hàm cơ sở là trực
giao (hay trực chuẩn), thì tích nhận được giữa hai hàm cơ sở bằng 0, nghĩa là chúng
hoàn toàn giống hệt nhau. Vì vậy, nếu tín hiệu hay ảnh được tạo thành từ các thành
phần tương tự với một hay một vài hàm cơ sở, thì tất cả trừ một hay một vài hệ số sẽ
nhỏ.
Tương tự, biến đổi ngược có thể xem như sự khôi phục lại các tín hiệu ban đầu
hay các ảnh bằng cách tính tổng các hàm cơ sở có biên độ lớn bằng biến đổi các hệ
số. Vì nếu tín hiệu hay ảnh được xây dựng từ các thành phần mà tương tự một hay
một vài hàm cơ sở, sau đó phép tính tổng cần thiết có chỉ một vài thuật ngữ của biên
độ tín hiệu. Rất nhiều thuật ngữ có thể sau đó bỏ qua và các tín hiệu hay ảnh có thể
đưa lại bằng chỉ một vài biến đổi hệ số.
Thêm vào đó, nếu các thành phần quan tâm trong tín hiệu hay ảnh tương tự như
một hay một vài hàm cơ sở, sau đó những thành phần này sẽ rõ ràng trong các hệ số
lớn đối với các hàm cơ sở. Do đó chúng sẽ dễ dàng tìm thấy trong biến đổi. Cuối

cùng nếu một thành phần không được nhận biết tương tự là một hay một vài biến đổi
cơ sở, sau đó nó cũng sẽ dễ dàng được tìm thấy. Nó sẽ dễ dàng bỏ đi, đơn giản bằng
cách giảm hệ số đối với đáp ứng của biến đổi.
Chúng ta bao gồm tất cả những giá trị tiềm ẩn trong sử dụng biến đổi với các hàm
cơ sở mà mở rộng các thành phần của tín hiệu hay ảnh được thực hiện việc biến đổi.
Chúng ta cũng nhớ đó là các thành phần tức thời không thể tương tự với các hàm cơ
sở của biến đổi Fourier hay các biến đổi sóng khác.
14.1.3.1. Các loại biến đổi.
Trở lại trong chương 10 có ba loại biến đổi khác nhau, nhưng đều có kỹ thuật liên
quan đến biến đổi Fourier. biến đổi tích phân Fourier, biến đổi chuỗi Fourier, biến
đổi Fourier rời rạc.
Phép biến đổi Fourier tích phân được thiết lập với hàm liên tục hai chiều (một tín
hiệu và phổ của nó). Nó và rời rạc của nó được đưa ra trong tích phân một chiều là:


F  x    f  x e  j 2  xs  dx vµ




f  x    F  x e j 2  xs  ds


(1)

Phép biến đổi chuỗi Fourier mở rộng đưa ra một hàm tuần hoàn (hay một hàm tức
thời có thể tính trong một chu kỳ của một hàm tuần hoàn) như một sự liên tục của hệ
số Fourier (hữu hạn hoặc vô hạn). nó và rời rạc của nó thông thường được tạo với s =
ns một biến rời rạc, vì vậy:
L


Fn  F ns    f  x e  j 2 nsx  dx vµ
0



f  x   s  Fn e j 2 nsx 

(2)

n 0

Trong đó L là quãng thời gian với s = 1/L.
Phép biến đổi Fourier rời rạc đưa ra một hàm mẫu bằng một phổ mẫu, và số các
mẫu độc lập trong cùng cả hai miền. Nó thông thường được tạo với x = ix một biến
rời rạc. nếu g(x) là giới hạn giải và mẫu như đòi hỏi bởi thuyết lấy mẫu, sau đó gi =
g(ix) và

247


Gk 

N 1

1
N

 gie
i 0


 j 2 πk

i
N

vµ g i 

1
N

N 1

 Gk e

j 2i

k
N

(3)

k 0

Trong tất cả ba kỹ thuật biến đổi, sin và cosin của các tần số khác nhau tạo thành
một tập các hàm cơ sở trực chuẩn. Hơn nữa, mỗi hệ số biến đổi được xác định bởi
tích của hàm biến đổi và một trong những hàm cơ sở. DFT sử dụng một tích rời rạc
và các hàm rời rạc cơ sở, trong khi các biến đổi khác sử dụng một tích nguyên và các
hàm cơ sở liên tục. Trong mỗi trường hợp, biến đổi ngược bao gồm tổng các hàm cơ
sở mà biên độ của nó thay đổi tuỳ thuộc vào hệ số biến đổi. Tổng này có thể trở

thành một số nguyên đối với biến đổi Fourier liên tục.
Biến đổi Fourier rời rạc trong chương trước cũng sử dụng các hàm rời rạc trực
chuẩn cơ sở. Vì thế, chúng thực hiện theo cách chung thông thường của biến đổi
Fourier rời rạc. Hầu hết trong các trường hợp, các hàm cơ sở là thực và biến đổi xuôi
và ngược đều giống nhau.
14.1.3.2. Các loại biến đổi sóng con.
Như với biến đổi Fourier, sóng con cũng có ba loại biến đổi: biến đổi sóng con
liên tục (CWT), khai triển chuỗi sóng con, và biến đổi sóng con rời rạc (DWT). Tuy
nhiên, nó hơi phức tạp hơn một chút, vì các hàm sóng con cơ sở có thể hoặc không
thể là các hàm trực chuẩn.
Tập các hàm cơ sở có thể hỗ trợ cho một biến đổi thậm chí khi các hàm không
trực chuẩn. Điều đó có nghĩa là, cho ví dụ, khai triển một chuỗi sóng con mở rộng
phải thể hiện một hàm bằng rất nhiều hệ số. Nếu dãy các hệ số bị cắt để có độ dài
hữu hạn, thì chúng ta có thể khôi phục chỉ một phần gần đúng các hàm ban đầu.
Cũng như thế, một biến đổi sóng con rời rạc có thể đòi hỏi nhiều hệ số các điểm mẫu
hơn hàm ban đầu để khôi phục lại nó một cách chính xác, hay mức gần giống có thể
chấp nhận.
14.1.3.3. Các ký hiệu và định nghĩa.
Tiếp theo chúng ta đưa ra một số định nghĩa để làm sáng tỏ các khái niệm về biến
đổi sóng con. Chúng ta giới hạn điểm quan tâm chính chỉ là các hàm biến đổi một
chiều.
Mục đích làm cho phù hợp với phần lớn tài liệu biến đổi sóng con chúng ta sử
dụng j như là một chỉ số nguyên trong chương này. Như một vài phần khác trong
cuốn sách, chúng ta cũng sử dụng j để biểu diễn đơn vị ảo  1 , phải lưu ý không sử
dụng trong cả hai phương pháp trong cùng một biểu thức. Điểm phân biệt này sẽ rõ
ràng hơn trong nội dung của nó.
Lớp các hàm chúng ta tìm kiếm để thể hiện bằng biến đổi sóng con đó là các tích
của hàm bình phương trên một trục thực (chẳng hạn là tập các số thực trên trục x).
Lớp này được ký hiệu là L2(R). Do đó ký hiệu f(x) L2(R) nghĩa là








2

f  x  dx  

(4)

Trong phân tích sóng con, chúng ta tạo ra một tập các hàm cơ sở bằng cách giãn
và tính tiến một hàm (x) đơn nguyên, gọi là một sóng con cơ sở. Đây là một hàm
dao động nào đó, thường tập trung vào ở giá trị ban đầu và tắt dần khi x   . Vì
thế, (x  L2(R).

248


14.2. BIẾN ĐỔI SÓNG CON LIÊN TỤC
Phép biến đổi sóng con liên tục (còn được gọi là biến đổi sóng con tích phân)
được đưa ra bởi hai ông Grossman và Morlet.
14.2.1. Định nghĩa
Nếu (x) là hàm thực của phổ Fourier,(x), thoả mãn tiêu chuẩn có thể chấp
nhận

C  

2


 (s)



ds  

s



(5)

và (x) được gọi là sóng con cơ sở. Chú ý rằng, vì s thuộc mẫu số của tích phân
nên cần có


 (0)  0    ( x)dx

(6)



Hơn nữa, vì () cũng bằng 0 nên chúng ta có thể nhận thấy phổ biên độ của
sóng con có thể chấp nhận tương tự hàm truyền đạt của bộ lọc thông dải. Thực tế,
đáp ứng xung của một bộ lọc thông dải bất kỳ với trung bình 0, suy giảm về 0 đủ
nhanh bằng với tốc độ tăng tần số, đều có thể thoả mãn như một sóng con cơ sở đối
với biến đổi này.
1
0.5

0
-0.5
x

0

2

4

6

Hình 14-5 Một sóng con
Tập các hàm sóng con cơ bản, {a,b(x)}, có thể được tạo ra bằng cách tịnh tiến và
lấy tỷ lệ sóng con cơ bản,

 a ,b ( x ) 

 xb


a  a 

1

(7)

trong đó a > 0 và b là các số thực. Biến a phản ảnh tỷ lệ hàm sóng con cơ bản,
còn b xác định rõ vị trí tịnh tiến của hàm theo trục x. Thông thường, sóng con cơ sở,
(x), được đặt tại gốc toạ độ sao cho a,b(x) đặt tại x = b.


 ( x) 

2

1  x e
2

x 2 / 2

(8)

3 

Biến đổi sóng con liên tục của f(x) liên quan đến sóng con (x) là

249




W f (a, b)  f , a,b   f ( x) a ,b ( x)dx

(9)



Grossman và Morlet đã chứng minh rằng biến đổi sóng con liên tục ngược là

f ( x) 


1
C





0



 

W f (a, b) a ,b ( x)db

da
a2

(10)

Hệ số tỷ lệ trước vế phải của biểu thức (7) bảo đảm các tiêu chuẩn của tất cả các
hàm sóng con cơ sở đều như nhau, vì
2

 xb
f
 
 a 








 x b
f
 dx  a f  x 
 a 

(11)

14.2.2. CWT hai chiều
Biến đổi sóng con liên tục W(a,b) của hàm f(x) một chiều là một hàm hai biến.
Đối với các hàm nhiều hơn một biến, biến đổi này cũng làm tăng số chiều thêm một.
Nếu f(x,y) là hàm hai chiều thì biến đổi sóng con của nó là
W f ( a, b x , b y )  







 

f ( x, y ) a ,bx ,by ( x, y )dxdy

(12)


trong đó bx và by xác định biến đổi theo hai chiều. Biến đổi sóng con ngược liên
tục hai chiều là

f ( x, y ) 

1
C





0

 

  



W f (a, bx , b y ) a,bx ,by ( x, y )db x db y

da
a3

(13)

trong đó


 a , bx , b y ( x , y ) 

1  x  bx x  b y

,
a  a
a





(14)

và (x,y) là sóng con cơ sở hai chiều. Tổng quát hoá mở rộng để kiểm soát các
hàm có nhiều hơn hai biến.
14.2.3. Giải thích khối lọc (Filter Bank)
Ví dụ minh hoạ tiếp theo là một cách để xem xét biến đổi sóng con liên tục.
Chúng ta đầu tiên định nghĩa các hàm cơ sở chung với tỷ lệ a là

 a x  

1

 x
 
a a

(15)


Đây là hàm sóng con cơ sở tỷ lệ a và thông thường là a-1/2. Nó định nghĩa một tập
các hàm trở nên rộng rãi với việc tăng a. Chúng ta cũng định nghĩa.
~

 a  x    a*  x  

1

 x
 * 
a  a

(16)

Nó là liên hợp phức được phản xạ của sóng con tỷ lệ. Nếu (x) là thực và chẵn,
như các trường hợp thông thường khác, thì phản xạ và liên hợp không có kết quả.
Bây giờ chúng ta có thể viết biến đổi sóng con [Biểu thức 9] như sau:
250




~

~

W f a, b    f  x  a b  x dx  f  a

(17)




Với phần không đổi a, sau đó Wf(a,b) là tích chập của f(x) với sóng con liên hợp
theo tỷ lệ a.
Hình 14-6 cho thấy biến đổi sóng con tích phân như một khối (bank) các bộ lọc
tuyến tính (tích chập) thực hiện trên f(x). mỗi giá trị của a định nghĩa một bộ lọc
thông dải khác nhau, và đầu ra của tất cả các bộ lọc, thực hiện đồng thời, bao gồm
biến đổi sóng con. Thêm vào đó biểu thức 10 trở thành
f x  

1
C



~
da
1


f


a  b  a b  x db 2 
 
C
a




 
0







0

~

 da
f


a  a   x  2

 a

(18)

Nó ngụ ý rằng các đầu ra bộ lọc, mỗi đầu ra lại được lọc bởi a(x) và lấy tỷ lệ hợp
lý, kết hợp với nhau để khôi phục f(x). Nó là phát biểu của Calderon, ra đời trước
Grossman và Morlet 20 năm.

HÌNH 14-6

Hình 14-6 Sự giống nhau của khối lọc đối với biến đổi sóng con tích phân của

một tín hiệu
Nhắc lại từ thuyết đồng dạng (Phần 10.2.5) đó là rằng
 f ax  

1 s
F 
a a

(19)

Có nghĩa là
a s    a  x   a  as 

(20)

Và các tần số trung tâm của các bộ lọc thông dải giảm khi các hàm truyền đạt trở
nên hẹp hơn với việc tăng a.
14.2.4. Các khối lọc hai chiều
Hình 14-7 minh hoạ tiếp cận khối lọctheo hai chiều. Ở đây, mỗi bộ lọc a(x,y) là
một đáp ứng xung hai chiều, và đầu ra của nó là một ảnh sao chép đã lọc thông dải.
Ngăn xếp các ảnh lọc bao gồm biến đổi sóng con.
Mặt khác, độ dư thừa là rất đáng quan tâm. Trong thực tế, nếu hàm truyền đạt
(u,v) của (x,y) khác 0, ngoại trừ tại gốc, thì theo lý thuyết, chúng ta có thể khôi
251


phục ảnh ban đầu từ bất kỳ một trong các đầu ra của bộ lọc bằng cách lọc ngược (giải
chập). Nếu ảnh bị giới hạn dải trong một khoảng mà trên đó tồn tại ít nhất một
a(u,v) khác 0, thì f(x,y) có thể được khôi phục từ đầu ra bộ lọc đơn lẻ đó. Phần cuối
là giá trị tiềm năng của biến đổi sóng con tích phân không cần trình bày đầy đủ, mà

để phân tích tín hiệu và ảnh.
Để minh hoạ việc này, giả sử lấy ảnh trong hình 14-7 làm ví dụ, các đối tượng
hình tròn có kích cỡ khác nhau và thành phần sóng con cơ sở được chọn chỉ tương
ứng với các đối tượng hình tròn có bán kính đơn vị. Xem xét ngăn xếp ảnh ra sẽ phát
hiện vị trí các đối tượng. Hơn nữa, mỗi đối tượng chỉ xuất hiện trong từng ảnh ra cụ
thể tương ứng với từng kích cỡ riêng biệt.

HÌNH 14-7

Hình 14-7 Sự giống nhau của khối lọc đối với biến đổi sóng con tích phân của
một ảnh

14.3. KHAI TRIỂN CHUỖI SÓNG CON
14.3.1. Cặp sóng con (Dyadic Wavelet)
Kiểu biến đổi sóng con thứ hai có một vài điểm hạn chế hơn so với kiểu thứ nhất.
Ngoài ra, một sóng con cơ sở được lấy tỷ lệ và tịnh tiến để tạo thành tập các hàm cơ
sở. Tuy nhiên, ở đây tỷ lệ và phép tịnh tiến được định rõ bởi các số nguyên chứ
không phải là các số thực.
Trong định nghĩa thứ hai này, chúng ta sẽ tự giới hạn để tạo các hàm cơ sở bằng
các tỷ lệ nhị phân và những cặp tịnh tiến của sóng con cơ sở, (x). Một cặp tịnh tiến
là một phép dịch đi một lượng k/2j, nó là một phép nhân số nguyên hệ số tỷ lệ nhị
phân và vì thế cũng là chiều rộng của sóng con. Phép lấy tỷ lệ nhị phân và cặp tịnh
tiến được minh hoạ trong hình 14-8.

HÌNH 14-8
252


Hình 14-8 Tỷ lệ nhị phân và cặp tịnh tiến của biến đổi sóng con
14.3.2. Định nghĩa

Hàm (x) là sóng con trực giao nếu tập {j,k(x)} của các hàm được định nghĩa bởi

 j , k  x   2 j / 2 2 j x  k 

(21)

Trong đó -nguyên j xác định độ giãn, trong khi k chỉ rõ sự tịnh tiến.
Tập sóng con đã đề cập tạo thành một cơ sở trực giao nếu, đầu tiên,

 j , k , l , m   j ,l  k ,m

(22)

Trong đó l và m là các số nguyên, j,k là hàm delta Kronecker, và .,. cho biết
tích; và thứ hai nếu hàm f(x)  L2(R) bất kỳ có thể viết lại như sau

f x  





 c

 j ,k  x 

(23)

j ,k


j   k  

Trong đó hệ số biến đổi được cho bởi các tích; tức là
c j , k  f  x , j , k  x   2 j / 2 









f  x  2 j x  k dx

(24)

Biểu thức (23) và (24) chỉ rõ khai triển chuỗi sóng con của f(x) có liên quan tới
sóng con (x).
Chú ý rằng ở đây một hàm liên tục được thể hiện bởi một chuỗi vô hạn gấp hai
lần, và nói chung, biến đổi lại được khắc phục. Do các hàm cơ sở thường mở rộng ra
vô hạn hạn theo cả hai hướng, nên việc khôi phục hoàn chỉnh phải được bao gồm tất
cả các số hạng.
Tuy nhiên, nếu chọn (x) thích hợp thì ta có thể cắt chuỗi mà không gặp sai số
xấp xỉ nghiêm trọng. Nếu f(x) bị chặn và sóng con cơ sở được định vị tốt, thì nhiều
hệ số với |k| lớn sẽ không đáng kể. Các hệ số với |j| lớn cũng sẽ nhỏ, vì các hàm sóng
con cơ sở sau đó trở thành cực kỳ rộng hay hẹp.
14.3.3. Cặp sóng con đầy đủ (Compact Dyadic Wavelet)
Nếu ta giới hạn f(x) và sóng con cơ sở hơn nữa thành các hàm có gái trị 0 bên

ngoài khoảng [0,1], thì họ các hàm cơ sở trực chuẩn thường được xác định bằng một
chỉ số đơn n; tức là,

 n  x   2 j / 2 2 j x  k 

(25)

Trong đó j và k là các hàm thực sự của n, như sau:
n  2j  k

víi j  0,1,... k  0,1,...,2 j  1

(26)

Đối với n, j bất kỳ là số nguyên lớn nhất ví dụ như 2 j  n và k = n - 2j.
Biến đổi ngược bây giờ sẽ l


f  x    c n n  x 

(27)

n 0

253


Trong đó giả sử rằng 0(x) = 1. Các hệ số biến đổi được cho bởi tích.







c n  f  x , n  x   2 j / 2  f  x  2 j x  k dx


(28)

Ở đây, một hàm liên tục được biểu diễn bởi một chuỗi vô hạn, giống như biểu
diễn của chuỗi Fourier. Sự dư thừa to lớn của biến đổi sóng con tích phân được loại
bỏ Trong thực tế, nếu một hay một vài n(x) tương đươg với f(x) (hay các thành phần
chủ yếu của nó) thì ta có thể cắt bớt chuỗi còn lại vài số hạng liên quan mà không
gặp sai số đáng kể nào.
Chúng ta cũng có các vấn đề cơ sở của biến đổi sóng con rời rạc (DWT). Nếu
f(it) là hàm rời rạc được lấy mẫu với N điểm, trong đó N là luỹ thừa của hai, và nếu
(x) là một cặp sóng con đầy đủ, thì chúng ta có thể tính một biến đổi sóng con rời
rạc sử dụng các phiên bản rời rạc của biểu thức (27) và (28). Cả hai biểu thức đều trở
thành tổng của N số hạng. Biến đổi Haar là một ví dụ minh hoạ cho điều này.
14.3.3.1. Ví dụ: Biến đổi Haar
Biến đổi Haar là một trong những ví dụ điển hình nhất của một biến đổi cặp sóng
con đầy đủ, trực chuẩn. Nó khác các biến đổi khác được đề cập tới trong chương 13
ở chỗ các hàm cơ sở của nó đều được sinh ra do phép tịnh tiến và phép giãn của sóng
con cơ sở. Hàm Haar là một cặp xung chữ nhật lẻ, là sóng con đơn giản và cổ điểm
nhất có có hỗ trợ cô đọng.
Sóng con cơ sở được thu hẹp dần theo luỹ thừa 2. Mỗi sóng con nhỏ hơn sau đó
được tịnh tiến bằng cách tăng tương ứng chiều rộng của nó, sao cho toàn bộ tập sóng
con tại mọi tỷ lệ kiểm soát hoàn toàn khoảng thời gian. Khi các sóng con cơ sở được
giảm tỷ lệ theo luỹ thừa 2, biên độ của nó được tăng tỷ lệ theo luỹ thừa 2 , để bảo
đảm tính trực chuẩn. Kết quả cuối cùng của điều này là tập các hàm cơ sở trực chuẩn

(Hình 14-9). Chỉ số hàm cơ sở, như định nghĩa trong biểu thức (26), hơi khác so với
chỉ số đã sử dụng trong phần 13.5.4.

14.4. BIẾN ĐỔI SÓNG CON RỜI RẠC
Biến đổi sóng con rời rạc chủ yếu gần giống biến đổi đơn vị đã đề cập đến trong
chương trước. Nó hứa hẹn sử dụng rộng rãi trong nén, xử lý và phân tích ảnh. Cho
một tập các hàm cơ sở trực chuẩn, ta có thể tính biến đổi sóng con rời rạc như đối với
biến đổi Haar.

HÌNH 14-9

Hình 14-9 Hàm cơ sở biến đổi Haar
254


Trong phần này, đầu tiên chúng ta sẽ đưa ra ba kỹ thuật dẫn tới việc phát triển của
biến đổi sóng con rời rạc: (1) lý thuyết khối lọc, (2) đa phân giải hay phân tích tỷ lệ
thời gian, cụ thể là biểu diễn hình chóp, và (3) mã hoá băng con. Những vấn đề này
sẽ đưa ra trong phần biến đổi sóng con rời rạc.
14.4.1. Lý thuyết khối lọc
Những người thực hiện công việc phân tích tiếng nói và xử lý tín hiệu âm thanh
sử dụng khái niệm về một khối các bộ lọc thông dải đối với việc phân tích tín hiệu
thành các thành phần tần số khác nhau. Thực chất phương pháp này là tiền thân của
phương pháp phân tích tần suất thời gian, trong đó các thành phần tín hiệu được hiển
thị trong không gian hai chiều, một chiều là thời gian xuất hiện và một chiều tần số
của dao động. Ở đây chúng ta xem lại các vấn đề cơ sở trong tiếp cận như một bước
tiến bộ trong thảo luận về biến đổi sóng con rời rạc.
Giả sử bạn có một thành phần tín hiệu được tổ hợp bởi hai âm tần (điều hoà trong
khoảng thời gian ngắn) bao lấy nhiễu ngẫu nhiên, như minh hoạ trong hình 14-10(a).
Giả sử thêm vào đó chúng ta muốn phân tích tín hiệu này để phát hiện số lượng, tần

số và vị trí âm tần.
Dĩ nhiên, biến đổi Fourier sẽ phản ảnh toàn bộ nội dung tín hiêu, nhưng thường
không theo cách giải thích dễ dàng. Ví dụ, thông tin về vị trí được mã hoá trong phổ
pha theo cách phức tạp. Trong khi phổ biên độ có thể đưa ra các đỉnh phân biệt cho
mỗi thành phần tín hiệu tạm thời, điều này chỉ xác thực đối với sự kiểm tra tạm thời
khi các thành phần đó có biếđộ và khoảng thời gian đủ lớn để chi phối phổ. Ví dụ,
hình 14-10b thực hiện các đỉnh phân biệt rõ rệt tại các tần số của hai âm tần. Tuy
nhiên, phổ pha đưa sự hiểu biết ít ỏi vào vị trí của các thành phần này theo thời gian.
Thông thường, các thành phần không quan tâm của tín hiệu (chẳng hạn là nhiễu) làm
phức tạp phổ ở các điểm phân tích tần số đơn giản không đủ giải quyết các thành
phần tín hiệu.

HÌNH 14-10

Hình 14-10 Tín hiệu tổng hợp chứa hai âm tần và nhiễu ngẫu nhiên:
(a) ba thành phần; (b) biên độ và phổ pha
14.4.1.1. Bộ lọc thông dải lý tưởng
Giả sử chúng ta phân chia chục tần số thành tập các khoảng phân tách rời (kế tiếp,
không chồng lên nhau) và sử dụng việc phân chia này để định nghĩa tập các hàm
truyền đạt thông dải lý tưởng, như minh hoạ trong hình 14-11b. Đáp ứng xung tương
ứng thể hiện trong hình 14-11a. Hình 14-12 trình bày sự thực hiện của một khối lọc
255


thông dải. Tín hiệu vào đưa đến từng bộ lọc thông dải mắc song song. Đầu ra tương
ứng là gi(x). Hi(x) được xây dựng sao cho tổng của chúng là 1 đối với tất cả các tần
số, và vì thế tổng các gi(x) sẽ bằng f(x). Tức là,





 H s   1   g  x   f  x 
i

i 1

i

(29)

i 1

Hình 14-13 cho thấy đầu ra của ba bộ lọc thông dải trong hình 14-12. Chú ý hai
tín hiệu âm tần nổi bật lên từ các bộ lọc riêng biệt. Thêm vào đó, vị trí các đầu ra của
chúng dọc theo trục thời gian là rõ rệt. Do đó, chúng ta có một phương pháp tiếp cận
để phân tích các tín hiệu tổng hợp và nhận biết các thành phần mà ta quan tâm.

HÌNH 14-11

Hình 14-11 Tạo chuỗi các bộ lọc thông dải bằng cách phân chia chục tần số:
(a) các đáp ứng xung; (b) các hàm truyền đạt

HÌNH 14-12

Hình 14-12 Sự thực hiện của một khối lọc thông dải

HÌNH 14-13
256



Hình 14-13 Đầu ra bộ lọc thông dải
Mỗi đầu ra của bộ lọc thông dải được tạo thành bởi tích chập
g j x   





f t hi t  x dt

(30)

Vì Hi(s) là thực và chẵn nên hi(x) cũng vậy. Sự phản ánh theo tích phân chập
không có tác động gì và đầu ra bộ lọc có thể viết như sau


g i  x    f t hi t  x dt  f t , hi t  x 


(31)

Do đó, mỗi điểm trên gi(x) là một tích bên trong của f(t) với một bảo sao của hi(t)
được dịch chuyển đến vị trí x. Chúng ta cũng có thể xem {gi(x)} như là một tập các
hệ số của biến đổi sóng con (hai chiều), trong đó {Hi(s)} là tập sóng con. Hơn nữa
{gi(x)} đủ để khôi phục f(x) một cách chính xác, theo quan điểm của biểu thức (29).
Thông điệp sinh ra bởi biểu thức (31) là điểm đáng chú ý. Sự tương tự giữa tích
chập, một mặt tạo ra tích bên trong bằng cách dịch các hàm cơ sở, mặt khác đưa các
phần khác nhau của biến đổi sóng con thành một khối thống nhất.
14.4.1.2. Bộ lọc thông dải trơn
Hàm hi(x) trong hình 14-11a thiếu một trong những đặc tính mà các hàm sóng con

cơ sở tốt phải có: Chúng không được định vị tốt. Tức là, chúng không suy giảm
nhanh trong phạm vi trung tâm của chúng. Nghĩa là hi(x-x0) sẽ đáp ứng với thành
phần lớn được định vị cách một khoảng x0. Đó là các cạnh sắc nét của Hi(s) mà nó
tạo ra độ rộng không thể chấp nhận của hi(x).
Thiết kế các hàm hi(s) có các cạnh trơn hơn sẽ làm giảm chiều rộng của hi(x). Vì
Hi(s) vẫn phải có tổng là 1 ở mọi nơi, các hàm truyền đạt thông dải kết quả sẽ chồng
chéo lên các cạnh của chúng. Một cấu trúc như vậy được trình bày trong hình 14-14.
Ở đây, mỗi một cạnh dải thông được tăng nửa chu kỳ hàm cosin. Rõ ràng, kết quả
mang lại là làm hẹp các đáp ứng xung.
Hình 14-15 cho thấy các đầu ra khối lọc với tín hiệu vào của hình 14-10a và các
bộ lọc thông dải trơn. Chú ý sự cải tiến trong quá trình định vị. Vì vậy chúng ta đã
thực hiện một bước tiến trong phân tích tần suất thời gian của tín hiệu tổng hợp. Tức
là, chúng ta có các giá trị trung bình về vị trí các thành phần tức thời của tín hiệu theo
cả thời gian (hay vị trí) lẫn tần số.

HÌNH 14-4

Hình 14-14 Bộ lọc thông dải trơn: (a) các đáp ứng xung; (b) các hàm truyền đạt
257


HÌNH 14-5

Hình 14-15 Đầu ra khối lọc thông dải trơn
14.4.2. Phân tích đa phân giải
Rất nhiều bước phát triển phân tích sóng con trước đây đã tiến đến một lĩnh vực
chung gọi là phân tích đa phân giải. Những phát triển này khuynh hướng chống lại
những hạn chế của biến đổi Fourier đã đề cập ở đầu chương. Bây giờ ta sẽ tổng kết
phương pháp tiếp cận này như một cơ sở để đi tới phân tích sóng con hiện nay.
Lý thuyết khối lọc đưa ra phương tiện thuận lợi biểu diễn các tín hiệu tổng hợp

của các thành phần dao động, ví dụ như các nốt nhạc và các âm tần. Các thành phần
này bao gồm một vài (hay nhiều) chu kỳ dao động trong khoảng giới hạn của nó. Tuy
nhiên, trong phân tích ảnh, các thành phần được định vị mà ta quan tâm thường
không dao động thực sự, trong đó chúng chỉ gồm thậm chí là một phần chu kỳ. Các
ví dụ bao gồm các đường, các cạnh và các điểm.
Các đối tượng trong một ảnh quan sát xuất hiện với các tỷ lệ kích thước khác
nhau. Ví dụ, một cạnh có thể là sự chuyển tiếp đột ngột từ đen sang trắng hay nó có
thể xuất hiện từ từ qua một khoảng cách đáng kể. Nói chung, một phương pháp tiếp
cận đa phân giải trong biểu diễn hay phân tích ảnh để tìm kiếm những ý tưởng thực
hiện.
Nghiên cứu bản đồ minh hoạ cách tiếp cận. Bản đồ thường được vẽ với các tỷ lệ
khác nhau. Tỷ lệ của một bản đồ là tỷ số kích thước vùng thực sự và kích thước mà
nó biểu diễn trên bản đồ. Với tỷ lệ lớn, như trên một quả địa cầu, có thể thấy rõ các
đặc trưng chính như lục địa và đại dương, trong khi các chi tiết khác như đường
trong thành phố nằm bên dưới độ phân giải của bản đồ. Với các tỷ lệ nhỏ hơn, các
chi tiết trở nên nhìn thấy và mất đi các chi tiết lớn. Vì thế, để có thể dò tìm một điểm
tại vị trí cách xa, người ta cần có một tập bản đồ được vẽ với các tỷ lệ khác nhau.
Biến đổi sóng con được phát triển theo các phương pháp đa phân giải này. Giống
như việc phân tích tần suất thời gian, một tín hiệu được biểu diến trong không gian
hai chiều, nhưng ở đây trục đứng là tỷ lệ chứ không phải là tần suất. Việc xác định tỷ
lệ được thực hiện nhờ việc mở rộng và thu hẹp các sóng con cơ sở để thiết lập một
tập các hàm cơ sở.
Sóng con cơ sở, (x), được tính tỷ lệ như (x/a) (được mở rộng nếu a > 1 và thu
hẹp nếu a < 1) để thiết lập tập các hàm cơ sở. Với tỷ lệ a lớn, các hàm cơ sở mở rộng
tìm kiếm đối với các đặc điểm lớn, trong khi đối với a nhỏ, chúng tìm kiếm những
chi tiết nhỏ.
14.4.2.1. Thuật giải hình chóp
Giả sử ta tạo ra được, từ một ảnh số 1024  1024 điểm ảnh, 10 ảnh thêm vào bằng
cách lấy trung bình liên tiếp các khối 2  2 điểm ảnh, mỗi một lần bỏ qua hàng và cột
thứ 2 của các điểm ảnh. Chúng ta sẽ bỏ đi các ảnh 512  512, 256  256, … cho đến

1  1. Ví dụ, nếu sau đó chúng ta thực hiện việc phát hiện biên, trên mỗi ảnh, bằng
258


cách sử dụng một trong các toán tử phát hiện biên 3  3 đề cập trong chương 18,
chúng ta sẽ tìm thấy các biên nhỏ trong ảnh gốc, đến mức độ nào đó các biên lớn hơn
trong các ảnh 512  512 và 256  256 và chỉ các biên rất lớn trong các ảnh 16  16
và các ảnh nhỏ hơn.
Biến đổi Haar đưa ra phương pháp tiếp cận này từ cách đây gần một thế kỷ. Trong
các ảnh cơ sở (hình 13-6) của nó, chúng ta nhận thấy khái niệm tìm kiếm ảnh với các
bộ phát hiện biên có tỷ lệ khác nhau. Nguyên tắc mở rộng nhị phân trong các ảnh cơ
sở cũng là hiển nhiên.
Ta phải có hứng thú quan sát tất cả các biên, lớn và nhỏ, xuất hiện trong ảnh gốc
1024 1024 và không thay đổi độ phân giải đã yêu cầu để định vị chúng. Vấn đề đối
với các biên lớn đó-những biên biểu thị sự chuyển tiếp mức xám qua một khoảng
cách đáng kể-khó phát hiện bằng các toán tử lân cận quy ước (nhỏ) như các toán tử
được đề cập đến trong chương 18. Ta có thể lấy tỷ lệ các toán tử lên để phát hiện các
biên lớn, nhưng việc giảm tỷ lệ ảnh xuống sẽ hiệu quả hơn. Sử dụng một toán tử lớn
để tìm kiếm ảnh có độ phân giải cao đối với các biên lớn là kỹ thuật tính toán.
Một vài dạng phân tích đa phân giải đã được nghiên cứu với những cái tên khác
qua nhiều năm. Tuy nhiên, chỉ sử trong những năm gần đây, cơ sở chung giữa đa
phân giải và tiếp cận khối lọc mới được công nhận, và chúng có những điểm tương
đồng với biến đổi sóng con.
14.4.2.2. Mã hoá hình chóp Laplace
Burt và Anderson đã đưa ra một sơ đồ mã hoá hình chóp dựa vào hàm Gauss. Ảnh
được lọc thông thấp với đáp ứng xung Gauss, và kết quả thu được là lấy ảnh ban đầu
trừ đi ảnh đã lọc. Chi tiết tần số cao trong ảnh được giữ lại trong ảnh kết quả. Ảnh đã
lọc thông thấp sau đó có thể lấy mẫu con mà không làm mất chi tiết. Quá trình được
minh hoạ như dưới đây.
Đặt f0(i,j) là ảnh gốc, và g(i,j) là đáp ứng xung bộ lọc thông thấp dạng Gauss. Sau

đó tại mỗi bước của quá trình mã hoá, ảnh được phân tích thành các thành phần tần
số thấp nửa độ phân giải và tần số cao cả độ phân giải, fi(i,j) và hi(i,j) tương ứng
trong bước đầu tiên, bởi
f1 i, j    f 0  g 2i,2 j  vµ h1 i, j   f 0 i, j    f 0  g i, j 

(32)

Quá trình này được lặp đi lặp lại mỗi khi ảnh được lấy mẫu con. Sau n lần lặp của
ảnh N  N. trong đó N = 2n, thì fn(i,j) là một điểm đơn. Việc mã hoá hình chóp ảnh
bao gồm hk(i,j) và ảnh tần số thấp cuối cùng fn(i,j). Và được cho trong hình 14-16.
Việc giải mã ảnh được thực hiện theo trình tự ngược lại. Trên lấy mẫu
(Upsamling) là quá trình chèn thêm các số 0 vào giữa các điểm mẫu. Mỗi ảnh được
lấy mẫu con, fk(i,j), bắt đầu từ mẫu cuối cùng, fn(i,j), được trên lấy mẫu và nội suy
bằng tích chập với g(i,j). Sau đó kết quả được thêm vào ảnh fk-1(i,j) tiếp theo (hay
trước đó) và quá trình được lặp lại trên ảnh kết quả. Điều này khôi phục lại ảnh ban
đầu mà không vấp phải sai số.
Mỗi hk(i,j) là độ chênh lệch của hai ảnh nhận được bởi tích chập một ảnh đơn với
hàm Gauss của chiều rộng đơn hay đôi. Điều này tương đương với việc nhân chập
ảnh với độ chênh lệch của hai hàm Gauss, tương đương với bộ lọc thông
cao“Laplace của Gauss”; vì lý do đó tên được chọn cho nó là thuật toán mã hoá hình
chóp.

259


HÌNH 14-16

Hình 14-16 Sơ đồ mã hoá hình chóp Laplace
Mặc dù việc mã hoá hình chóp Laplace làm tăng số điểm ảnh đòi hỏi để biểu diễn
33% ảnh, tuy nhiên nó có thể hoàn thành việc nén ảnh với mức độ đáng kể. Việc này

xảy ra vì các ảnh hk(i,j) giảm tương quan đáng kể và dải động do đó phải tuân theo
việc lượng tử hoá không mịn và chẵn để thiết lập một vài giá trị điểm ảnh về 0. Thêm
vào đó việc thiết kế các hình chóp Laplace cung cấp các khả năng dẫn tới biến đổi
sóng con rời rạc sau này.
14.4.3. Mã hoá băng con
Dựa vào nền tảng dẫn đến kỹ thuật biến đổi sóng con rời rạc, bây giờ chúng ta
miêu tả kỹ thuật tần suất thời gian gọi là mã hoá băng con. Khởi đầu cho việc mã
hoá đầy đủ các tín hiệu âm thanh số, mã hoá băng con phân tích một tín hiệu (hay
một ảnh) thành các thành phần dải băng hẹp (lọc thông dải) và biểu diễn chúng, mà
không dư thừa, theo cách có khả năng khôi phục các tín hiệu ban đầu mà không sai
sót.
Cho tín hiệu giới hạn dải f(t), tức là,
 f t   F s   0

v íi s  s max

(33)

Chúng ta có thể lấy mẫu tín hiệu với khoảng cách lấy mẫu đồng bộ t để tạo
thành
f it 

i  0,1,..., N  1

s max  s N 

1
2 t

(34)


(Hình 14-17a), trong đó sN là tần số Nyquist (cơ bản). (Xem lại chương 12, biểu
thức(22))
Chúng ta bắt đầu phân tích bằng cách phân chia trục tần số thành các khoảng con
rời nhau. Trong khi có thể sử dụng chiều dài các khoảng con bất kỳ, bây giờ chúng ta
chọn sN/2, như trong hình 14-17b, cho các lý do mà chúng ta sẽ thấy rõ trong phần
sau. Ở đây phổ F(s) tuần hoàn với chu kỳ 2sN.
14.4.3.1. Nửa thông thấp
Hình 14-17b trình bày một bộ lọc thông thấp nửa dải lý tưởng, h0(it), gọi như
vậy vì nó chỉ cho qua các dải tần số [-sN /2, sN /2], đó là nửa tần số thấp của toàn bộ
dải tần số [-sN ,sN]. Đáp ứng xung và hàm truyền đạt của h0 là
t 

h0 t   sinc 

 2 t 



 s
H 0 s    
 sN





(35)

Trong đó các xung chữ nhật là


260



1

1
x   
2

0


1
2
1
x 
2
1
x 
2

x

(36)


sin c x  


sin  x 
x

(37)

HÌNH 14-17

Hình 14-17 Mã hoá băng con, nửa dải băng thấp: (a) một tín hiệu lấy mẫu và phổ
giới hạn dải của nó; (b) bộ lọc thông thấp nửa dải lý tưởng; (c) tín hiệu thông thấp;
(d) hàm lấy mẫu con; (e) các điểm lấy mẫu lẻ thay thế các giá trị 0; (f) loại bỏ các
điểm lấy mẫu lẻ
Áp dụng bộ lọc này vào f(it) (Hình 14-17a) cho ta tín hiệu g0(it) (Hình 14-17c)
giới hạn dải tại s = sN/2. Đây là một bản sao của f(it) có độ phân giải thấp (bị mờ).
Nó giữ lại hình dạng cơ bản của f(it), nhưng mất đi các chi tiết.
Bởi vì g0(it) không có năng lượng bên trên sN/2, có thể lấy mẫu với khoảng cách
lấy mẫu rộng gấp 2t lần mà không gặp phải hiện tượng trùm phổ. Trong thực tế,
chúng ta có thể bỏ qua các mẫu thứ hai và chỉ biểu diễn g0 với N/2 mẫu còn lại. Quá
trình này gọi là lấy mẫu con hay chia mẫu.
Chúng ta có thể mô phỏng việc lấy mẫu con như việc nhân tín hiệu với các hàm
lấy mẫu con khiến cho các mẫu đánh số lẻ bằng 0 và sau đó loại bỏ đi các mẫu đánh
số lẻ. Ví dụ một hàm lấy mẫu con
f s it  

1
1  cos2s N it 
2

(38)

Trong đó phổ của nó là

Fs s  

1
 s    s  s N    s  s N 
2

(39)

Như trong hình 14-17d.
261


Khi chúng ta nhân tín hiệu g0(it) với fs(it), chúng ta có thể nhân chập phổ nó
với Fs(s). Kết quả được tạo ra phổ đối xứng theo cách giảm chu kỳ từ 2sN xuống sN,
như trong hình 14-17e. Biên độ của nó cũng bị cắt đi một nửa; chúng ta viết
Fs s   G0 s  

1
1
1
G0 s   G0 s  s N   G0 s  s N 
2
2
2

(40)

Rõ ràng, chúng ta có thể loại bỏ các điểm mẫu lẻ mà làm không mất thông tin
(Hình 14-17f). Điều này làm giảm tần số cơ bản xuống sN/2 và loại bỏ hoàn toàn tín
hiệu được lấy mẫu với khoảng cách lấy mẫu 2t.

Không thông tin nào bị mất trong quá trình lấy mẫu con g0(it). Để hiểu rõ điều
này, chú ý rằng chúng ta có thể khôi phục g0(it) từ tín hiệu lấy mẫu con trong hình
14-17f một cách đơn giản bằng (1) tính phổ rời rạc của nó (N/2 điểm),(2) thay các số
0 vào từ sN/2 đến sN để khôi phục G0(s) (hình 14-17c) và (3) thực hiện DFT ngược (N
điểm) của G0(s) để khôi phục g0 (it), tín hiệu cho trong hình 14-17c. Mặc dù đây
không phải là phương pháp hoàn hảo, nhưng nó chứng tỏ việc lấy mẫu con g0 (it)
không làm mất thông tin.
Một cách đơn giản hơn để khôi phục g0(it) cũng có thể nhìn thấy trong hình 1417. Đầu tiên chúng ta tiến hành trên lấy mẫu các tín hiệu dải thấp đã mã hoá (Hình
14-17f) bằng cách chèn các giá trị 0 vào các mẫu đánh số lẻ (để tạo thành hình 1417e). Sau đó chúng ta lọc tín hiệu bằng bộ lọc thông thấp nửa dải lý tưởng, 2h0(it)
(hình 14-17b). Việc này sẽ khôi phục phổ, và do đó tín hiệu, trong hình 14-17c, theo
cách đó mà khôi phục lại g0(it).
Trong miền tần số chúng ta viết
Fs s   G0 s   H 0  x  
 s
1
1
1

 2 G0 s   2 G0 s  s N   2 G0 s  s N    s


 N

 1
  G0 s 
 2

(41)

Chú ý rằng đáp ứng xung bộ lọc thông thấp, h0(it), là sinc(x/2t), có các chéo 0

tại các bội số chẵn của khoảng cách lấy mẫu, ngoại trừ tại điểm 0 (hình 14-17b). Vì
thế, nó nội suy các giá trị trung gian (đánh số lẻ) của g0(it), các giá trị 0 được định
vị tại đó, và để lại các mẫu chẵn.
14.4.3.2. Nửa dải băng cao
Bây giờ chúng ta trở lại với nửa dải băng cao của f(it) (hình 14-18a), chúng ta có
thể tách năng lượng ở đó bằng một bộ lọc thông dải nửa băng lý tưởng (hình 1418b). Đáp ứng xung và hàm truyền đạt của bộ lọc này là
t 

h1 t    t   sin c 

 2 t 



 s
H 1 s   1  
 sN





(42)

Trong đó (x) giống như trong biểu thức (36).
Bộ lọc tạo ra tín hiệu, gi(it), mà phổ của nó chỉ khác 0 trong phần nửa dải băng
cao (hình 14-18c). Tín hiệu này chứa thông tin tần số cao chính xác được ước lượng
từ f(it) bằng bộ lọc thông thấp trong hình 14-17b. Vì vậy, g0 (it) và gi(it) cùng
chứa thông tin được biểu diễn trong tín hiệu ban đầu, f(it), thực tế,
f it   g 0 it   g1 it   f it   h0 it   f it   h1 it 


(43)
262



H 0 s   H 1 s   1

(44)

Hình 14-18d cho thấy hàm lấy mẫu con fs(it) được sử dụng để phân tích trong
phần 14.4.3.1. Khi g1(it) (hình 14-18c) được lấy mẫu con bởi fs(it), phổ của nó
được nhân chập với Fs(s). Điều này điền một bản sao phổ của nó vào trong khoảng
[-sN/2,sN/2] và tạo ra phổ như trong hình 14-18e. Chúng ta có thể viết
Fs s   G1 s  

1
1
1
G1 s   G1 s  s N   G1 s  s N 
2
2
2

(45)

Bây giờ phổ này tuần hoàn theo chu kỳ sN/2 và có thể lấy mẫu với khoảng cách
2t mà không bị trùm phổ. Do đó, bây giờ chúng ta có một tín hiệu khác tiếp giáp
với nửa dải băng thấp hơn, và nó có thể được lấy mẫu con như trước (Hình 14-18f).
Việc này biến tín hiệu đẫ mã hoá f(it) N điểm thành hai tín hiệu N/2 điểm. Chúng

ta đã thấy rằng có thể khôi phục g0 (it) từ tín hiệu dải thấp đã mã hoá. Phần còn lại
chỉ để chứng tỏ rằng có thể khôi phục g1(it) từ tín hiệu dải cao đã mã hoá để thấy
rằng có thể khôi phục f(it) [và do đó f(t)] mà khôi gặp phải sai sót.
Hình 14-18e cho thấy tín hiệu dải cao trên lấy mẫu. Phổ của nó giống hệt như phổ
trong hình 14-18f sau khi trên lấy mẫu, tần số cơ bản lại là sN. Chúng ta có thể khôi
phục Gi(s), và do đó gi(it) (hình 14-18c), một cách đơn giản bằng cách lọc tín hiệu
trên lấy mẫu này với 2hi(it) (hình 14-18b) để ước lượng năng lượng tần số thấp.

Fs s   G1 s   H 1  x  
 s
1
1
1
 
 2 G1 s   2 G1 s  s N   2 G1 s  s N   1    s
 N


 1
  G1 s 
 2

(46)

Vì vậy, chúng ta có, theo phép mã hoá băng con kênh hai, một thể hiện có thể đảo
ngược của tín hiệu dưới dạng hai đầu ra bộ lọc rời rạc lấy mẫu con, và nó không dư
thừa (chẳng hạn không khắc phục được).
14.4.3.3. Trùm phổ nửa dải băng thông cao
Rõ ràng, lấy mẫu con gi(it) bằng cách loại bỏ từng điểm mẫu sẽ đưa đến hiện
tượng trùm phổ. Năng lượng tại các tần số trong khỏang sN/2 và sN sẽ bị trùm phổ

xuống tới khoảng [0, sN], như đã chỉ ra trong hình 14-19a. Tuy nhiên, quá trình này
sẽ không bị phá huỷ, do khoảng trên là rỗng. Nó tạo ra phổ trong hình 14-19b, bị giới
hạn dải tại sN/2 và chứa tất cả năng lượng của gi(it).

HÌNH 14-18

263


Hình 14-18 Mã hoá băng con, nửa băng cao: (a) tín hiệu lấy mẫu và phổ giới hạn
dải của nó; (b) bộ lọc thông cao nửa dải lý tưởng; (c) tín hiệu lọc thông cao; (d) hàm
lấy mẫu con; (e) thay các mẫu lẻ bởi các số 0; (f) loại bỏ các điểm mẫu lẻ

HÌNH 14-19

Hình 14-19 Trùm phổ nửa dải băng cao: (a) trùm phổ của phổ trong hình 14-18c;
(b) kết quả trùm phổ
Trớ trêu thay, trùm phổ, vấn đề lo lắng thường là mối đe doạ đến khả năng xử lý
số của chúng ta đối với tín hiệu và ảnh liên tục. Thực sự cần thiết phải lấy mẫu con
gi(it) để nhận được tín hiệu mã hoá dải băng con cao hơn. Thêm vào đó, việc trên
lấy mẫu theo sau phép lọc với 2hi(it) sẽ khôi phục gi(it).
14.4.3.4. Mã hoá và giải mã dải băng con
Mã hoá dải băng co kênh hai chỉ đòi hỏi lọc f(it) bằng h0(it) và hi(it), tiếp theo
quá trình lấy mẫu con tại từng đầu ra. Điều này mang lại hai tín hiệu dải băng con
chiều dài

g 0 kt    f it h0  i  2k t 

(47)


g1 kt    f it h1  i  2k t 

(48)

i


i

Sự khôi phục được tác động bằng cách trên lấy mẫu các tín hiệu dải băng con thấp
hơn và cao hơn, nội suy chúng bằng 2h0 (it) và2h1(it) và cộng chúng lại với nhau.
Điều này được cho bởi

f it   2 g 0 kt h0  i  2k t   g1 kt h1  i  2k t 

(49)

k

Và được minh hoạ trong hình 14-20.
Chúng ta có một vấn đề nhỏ tại điểm tần số giữa s = sN/2, do việc mã hoá và giải
mã đưa đến việc lọc f(it) hai lần, một lần với h0(it) và một lần với h1 (it) và bởi vì
H0(sN/2) = 1/2 và H1(sN/2) = 1/2. Vấn đề này có thể tránh được bằng việc sử dụng
1
(1/2) =
trong biểu thức (36). Trong phần tiếp theo, chúng ta sẽ sử dụng các bộ
2
lọc thông dải tổng quát hơn.
264



HÌNH 14-20

Hình 14-20 Mã hoá và khôi phục dải băng con hai dải
Có thể chúng ta đã chọn việc phân chia trục tần số thành M khoảng 2sN/M có
chiều dài ngắn hơn, tạo ra M tín hiệu dải băng con, mỗi tín hiệu N/M điểm, như
thường thực hiện trong mã hoá dải băng con. Các thành phần tần số khác nhau sau đó
sẽ được đưa ra trong các kênh băng con riêng biệt. Tuy nhiên, vì chúng ta tiếp tục với
biến đổi sóng con rời rạc, nên chúng ta bám vào sự chọn lựa của hai băng con
(M=2).
14.4.4. Thuật toán biến đổi sóng con nhanh
Mallat đã định nghĩa một thuật toán biến đổi sóng con rời rạc hiệu quả hơn việc
tính toán một tập đầy đủ các tích bên trong. Nó áp dụng việc mã hoá dải băng con
băng hai theo kiểu rập khuôn và xây dựng biến đổi sóng con từ dưới lên, tức là, tính
các hệ số tỷ lệ nhỏ trước tiên.
Sau bước đầu tiên của mã hoá dải băng con, như đã nói trong phần 14.4.3, tín hiệu
dải băng con thấp hơn, g0(it), lại được mã hoá dải băng con nửa dải. Việc này để lại
tín hiệu N/2 điểm nửa dải cao và hai tín hiệu N/4 điểm dải băng con tương ứng với
phần thứ nhất và hai của khoảng [0,sN].
Quá trình được tiếp tục, tại mỗi bước giữ lại tín hiệu nửa dải cao và xúc tiến việc
mã hoá tín hiệu nửa dải thấp, cho đến khi nhận được tín hiệu dải thấp một điểm. Các
hệ số biến đổi sau đó là điểm dải thấp và tập hợp các tín hiệu nửa dải cao đã mã hoá
băng con. Như trình bày trong hình 14-21. N/2 hệ số đầu tiên bắt đầu từ nửa dải cao
của F(s), N/4 điểm tiếp theo từ dải phần tư thứ hai, ...

HÌNH 14-21

Hình 14-21 Thuật toán biến đổi sóng con rời rạc
Đáp ứng xung, hj, có được nhân đôi mỗi lần lặp. Vì thế, chúng ta có biến đổi sóng
con trực chuẩn. Sóng con cơ sở là h(t) = (t) - sinc(at) và các hàm cơ sở là {2-j/2h(2jt265



n)}. Do đó, mã hoá băng con, là cơ sở cho kỹ thuật biến đổi tần suất thời gian đã
được dùng để định nghĩa cho biến đổi sóng con theo tỷ lệ thời gian.
Thuật toán đã đề cập ở trên đôi khi cũng được coi như biến đổi sóng con nhanh,
hay thuật giải hình chữ chi của Mallat, dựa vào lược đồ trong hình 14-21. Biến đổi
ngược đạt được bằng cách đảo ngược quá trình, như trình bày trong hình 14-22.

HÌNH 14-22

Hình 14-22 Biến đổi ngược sóng con rời rạc
14.4.4.1. Các hàm cơ sở
Chúng ta thấy rằng trong hình 14-21 mỗi tập các hệ số biến đổi nhận được bằng
tích chập f(it) lặp đi lặp lại với h0(it) và sau đó lặp lại một lần với h1 (it). Vì thế,
các hàm cơ sở của biến đổi sóng con này là h1 (it) và các hàm khác nhận được bằng
tích chập h1(it) lặp đi lặp lại với h0(it). Chúng ta sẽ xem xét chi tiết hơn trong phần
tiếp theo.
14.4.5. Thiết kế biến đổi sóng con rời rạc
Bây giờ chúng ta tiếp cận với thiết kế một sóng con cơ sở để sử dụng trong biến
đổi sóng con rời rạc. Như chúng ta đã thấy trong phần 14.4.1, các bộ lọc trong việc
thực hiện khối lọc thực sự không cần thiết phải là các bộ lọc thông dải và thông thấp
lý tưởng. Tương tự, đối với DWT, chúng ta có thể sử dụng một cặp bộ lọc mã hoá
băng con bất kỳ cho phép thực hiện biểu thức (49).
Viết biểu thức (49) trong miền tần số, ta có

1
1

F s   2  G0 s H 0 s   G1 s H 1 s 
2

2

1
1

 2  F s H 0 s H 0 s   F s H 1 s H 1 s 
2
2


(50)

Có nghĩa là





F s   F s  H 02 s   H 12 s 

(51)

Và hai hàm truyền đạt bộ lọc phải thoả mãn điều kiện
H 02 s   H 12 s   1

ví i 0  s  s N

(52)

266



Các hàm truyền đạt được bình phương lên vì f(t) được nhân chập hai lần với từng
bộ lọc, một lần trong quá trình mã hoá và một lần trong quá trình giải mã. Điều này
sẽ giải quyết vấn đề đã được đưa ra trong phần 14.4.3.4.
Giả sử H0(s) là hàm truyền đạt thông thấp trơn-sắc mà chúng ta muốn sử dụng
trong biến đổi sóng con. Rõ ràng, H1(s) tương ứng được cho bởi.
H 12 s   1  H 02 s 

(53)

Vì vậy, một bộ lọc thông thấp được chọn lựa kỹ lưỡng là bộ lọc được yêu cầu để
thiết kế biến đổi sóng con rời rạc.
14.4.5.1. Các bộ lọc gương
So sánh với hình 14-17b và 14-18b, chúng ta thấy rằng, đối với trường hợp bộ lọc
thông dải lý tưởng, có thể xem h1 (it) như là h0 (it) được dịch đi một lượng sN theo
trục tần số. Theo công thức dịch
 1 H s  a   e j 2at ht    1 H s  s N 
e

 1 
j 2 
 it
 2 t 

(54)
i

hit    1 hit 


Và nửa chu kỳ dịch của phổ như trên có thể bị tác động đơn giản bằng việc thay
đổi dấu của các mẫu tín hiệu đánh số lẻ. Chú ý đến đơn vị ảo trong biểu thức (54).
Chúng ta có thể sử dụng phương pháp tiếp cận này trong thiết kế các bộ lọc dải
băng con tổng quát hơn. Chọn h1(it) sao cho
i

h1  N  1  i t    1 h0 it 

(55)

Trong đó N là chiều dài của h0(it), ta có thể thu được bộ lọc thông cao tương
ứng. Bộ lọc h1(it) được gọi là bộ lọc gương (mirror) của h0(it), nếu h0(it) là tồn
tại trong khoảng ngắn, chúng ta có thể giả thiết là hi(it) cũng sẽ ngắn.
Thuộc tính đối xứng của H0 (s) phải có để thực hiện biểu thức (53) và toàn bộ tiếp
cận công việc này, là
s

s

H 02  N  s   1  H 02  N  s 
 2

 2


(56)

14.4.5.2. Vec tơ tỷ lệ
Để phát triển biến đổi sóng con rời rạc, chúng ta chỉ cần đáp ứng xung bộ lọc
thông thấp rời rạc h0(k) với một số điều kiện tất yếu. Đáp ứng xung này đôi khi còn

được gọi là vec tơ tỷ lệ.
Từ h0(k) chúng ta có thể tạo ra hàm liên quan (t), gọi là hàm tỷ lệ. Chúng ta cũng
có thể tạo ra h1(k) và, từ nó và (t), sóng con cơ sở (t). Nếu vec tơ tỷ lệ chỉ có một
số hữu hạn các số khác 0, thì (t), (t) và các sóng con kết quả sẽ được hỗ trợ đầy
đủ. Tức là, chúng sẽ bằng 0 bên ngoài một khoảng tương đối ngắn trên trục t.
Thực tế, nếu chúng ta có ho(k) hay (t), chúng ta có thể sử dụng nó để tạo ra các
thành phần khác. Thường rất dễ dàng với việc bắt đầu từ ho(k), nó phải thoả mãn biểu
thức (56). Xem vec tơ tỷ lệ như là một dãy như sau

 h s  
0

k

2



 h k h k  2l    l 
0

0

(57)

k

267



Do đó tồn tại một hàm tỷ lệ

 t    h0 k  2t  k 

(58)

k

có thể được xây dựng như tổng trọng số các bản sao nửa tỷ lệ của chính nó, sử
dụng h0(k) như là các trọng số. Từ nhận xét trong phần 14.4.4.1, (t) cũng có thể
được tính toán số học bằng cách lặp lại tích chập của h0(k) với các bạn tỷ lệ của các
hàm xung chữ nhật (Hình 14-23); đó là,

  x   lim  i  x 

(59)

 i  x   2  h0 n  i 1 2 x  n 

(60)

i 

Trong đó

Là hằng số xấp xỉ với (t) và

1

1

 0 x     x   
2

0


1
2
1
x 
2
1
x 
2

x

(61)

HÌNH 14-23

Hình 14-23 Xây dựng hàm tỷ lệ
Chú ý rằng sự lặp lại đầu tiên tạo ra một hàm hằng mang các giá trị h0(k). Thêm
vào đó, độ phân giải của các cặp xấp xỉ và xấp xỉ trở nên trơn hơn qua mỗi lần lặp.
Ví dụ, sau chín lần lặp sẽ biến một dãy bốn điểm thành một hàm lấy mẫu 1024 điểm,
và điều này đúng đối với hầu hết các phương pháp thực hiện số. Hàm tỷ lệ (t) là
một hàm liên tục có cùng hình dạng chung như đáp ứng xung h0(k) của bộ lọc thông
thấp rời rạc.
Nói cách khác, nếu chúng ta bắt đầu với hàm tỷ lệ (t), thì nó phải là trực chuẩn
dưới các dịch chuyển đổi đơn vị ; tức là,


 t  m ,  t  n    m ,n

(62)
268


Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×