Tải bản đầy đủ (.docx) (12 trang)

đề tài BIẾN ĐỔI WAVELET VÀ ỨNG DỤNG

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (319.49 KB, 12 trang )

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
KHOA KĨ THUẬT ĐIỆN TỬ TRUYỀN THÔNG
BIẾN ĐỔI WAVELET VÀ ỨNG DỤNG
Môn học: Xử lý Âm thanh Hình ảnh
Giảng viện hướng dẫn: Nguyễn Thu Hiên
Sinh viên thực hiện: 1. Trần Văn An (Nhóm trưởng)
2. Hoàng Tuấn Anh
3. Lưu Thế Anh
XỬ LÝ ÂM THANH, HÌNH ẢNH
Nhóm 1 - D11VT7 Trang
XỬ LÝ ÂM THANH, HÌNH ẢNH
1. Biến đổi wavelet:
Năm 1975, Morlet, J., phát triển phương pháp đa phân giải
(munltiresolution); trong đó, ông sử dụng một xung dao động, được hiểu là
một “Wavelet” (dịch theo từ gốc của nó là một sóng nhỏ) cho thay đổi kích
thước và so sánh với tín hiệu ở từng đoạn riêng biệt. Kỹ thuật này bắt đầu với
sóng nhỏ (Wavelet) chứa các dao động tần số khá thấp, sóng nhỏ này được so
sánh với tín hiệu phân tích để có một bức tranh toàn cục của tín hiệu ở độ
phân giải thô. Sau đó sóng nhỏ được nén lại để nâng cao dần dần tần số dao
động. Quá trình này gọi là làm thay đổi tỉ lệ (scale) phân tích; khi thực hiện
tiếp bước so sánh, tín hiệu sẽ được nghiên cứu chi tiết ở các độ phân giải cao
hơn, giúp phát hiện các thành phần biến thiên nhanh còn ẩn bên trong tín
hiệu. Đó là mục đích của phép biến đổi wavelet.
Biến đổi wavalet cho phép phân giải tín hiệu thành những thành phần
tần số khác nhau. Chúng thuận lợi hơn phép biến đổi Fourier truyền thống
trong việc phân tích những tín hiệu không liên tục và có đỉnh nhọn.
1.1 Cơ sở toán học:
1.1.1 Biến đổi wavelet liên tục:
1.1.1.1 Biến đổi wavelet liên tục 1 chiều (1-D):
Biến đổi wavelet liên tục (Continuous Wavelet Transform – CWT) của
một hàm f(t) được bắt đầu từ một hàm Wavelet mẹ (Mother wavelet) .


Hàm wavelet mẹ có thể là bất kỳ một hàm số thực hoặc phức liên tục
nào thỏa mãn các tính chất sau:
+) Tích phân suy rộng trên toàn bộ trục t của hàm bằng 0. Tức là:

+) Tích phân năng lượng của hàm trên toàn bộ trục t là một số hữu hạn,
tức là:
Nhóm 1 - D11VT7 Trang
XỬ LÝ ÂM THANH, HÌNH ẢNH
Điều kiện (2) có nghĩa là hàm phải là một hàm bình phương khả tích
nghĩa là hàm thuộc không gian các hàm bình phương khả tích.
Wavelet mẹ được lấy tỉ lệ bởi tham số a và dịch chuyển bởi tham số b
để trở thành một họ wavelet:
Biến đổi wavelet liên tục (CWT) của một hàm thời gian (tín hiệu) f(t)
như sau:
trong đó:
• là liên hợp phức của .
• là hệ số chuẩn hóa để đảm bảo rằng tích phân năng lượng của hàm
sẽ độc lập với a và b:
Với mỗi giá trị của a thì là một bản sao của được dịch đi b đơn vị trên
trục thời gian. Do đó, b được gọi là tham số dịch. Đặt tham số dịch b=0 ta thu
được:
điều đó cho thấy rằng a là tham số tỷ lệ.
Khi a >1 thì hàm wavelet sẽ được trải rộng còn khi 0 < a < 1 thì hàm sẽ
được co lại.
Phương trình (4) cho thấy, phép biến đổi wavelet là một ánh xạ chuyển
từ hàm một biến f(t) thành hàm W(a,b) phụ thuộc hai biến số là biến tỉ lệ a và
biến dịch chuyển b.
 Biến đổi ngược của biến đổi wavelet liên tục:
Gọi là biến đổi Fuorier của :
Nhóm 1 - D11VT7 Trang

XỬ LÝ ÂM THANH, HÌNH ẢNH
Nếu W(a,b) là biến đổi CWT của f(t) bằng hàm wavelet , thì biến đổi
ngược của biến đổi CWT sẽ được tính như sau:
với giá trị của C được định nghĩa là:
Biến đổi CWT chỉ tồn tại nếu C dương và hữu hạn. Do đó C được gọi
là điều kiện tồn tại của biến đổi wavelet. Cùng với hai điều kiện đã nêu ở trên,
đây là điều kiện thứ 3 mà một hàm cần phải thỏa mãn để có thể được lựa chọn
làm hàm wavelet.
1.1.1.2 Biến đổi wavelet liên tục 2 chiều (2-D) hoặc nhiều chiều (n-D):
Phép biến đổi wavelet 2-D được cho bởi phương trình:
trong đó:
• R(t1, t2) là vectơ tọa độ gồm hai thành phần là t1 và t2 thỏa mãn hệ
thức:
• B(b1, b2) là vectơ vị trí, có hai thành phần thỏa mãn hệ thức:
Hệ số để chuẩn hóa năng lượng của sóng wavelet 2-D, được suy ra từ
trường hợp 1-D. Tín hiệu f(R) là hàm theo hai biến không gian là t1 và t2.
Phép biến đổi wavelet nghịch 2-D được viết dưới dạng:
Phép biến đổi wavelet n chiều (n>2) có thể xây dựng đơn giản bằng
cách mở rộng số phần tử trong các vectơ R và B đến n giá trị theo cách biểu
diễn:
R(t1,t2, ,tn) và B(b1,b2, ,bn) (12)
Nhóm 1 - D11VT7 Trang
XỬ LÝ ÂM THANH, HÌNH ẢNH
Hàm wavelet trong không gian n-D được viết dưới dạng:
Nên phép biến đổi wavelet trong n-D được viết lại dưới dạng:
Và phép biến đổi wavelet nghịch của nó trong n-D có dạng:
1.1.2 Biến đổi wavelet rời rạc:
Biến đổi wavelet rời rạc (Discrete Wavelet Transfom – DWT). Việc
tính toán các hệ số wavelet tại tất cả các tỉ lệ là một công việc hết sức phức
tạp. Nếu tính toán như vậy sẽ tạo ra một lượng dữ liệu khổng lồ. Để giảm

công việc tính toán người ta chỉ chọn ra một tập nhỏ các giá trị tỉ lệ và các vị
trí để tiến hành tính toán. Hơn nữa nếu việc tính toán được tiến hành tại các tỉ
lệ và các vị trí trên cơ sở lũy thừa cơ số 2 thì kết quả thu được sẽ hiệu quả và
chính xác hơn rất nhiều. Quá trình chọn các tỷ lệ và các vị trí để tính toán như
trên tạo thành lưới nhị tố (dyadic). Một phân tích như trên hoàn toàn có thể
thực hiện nhờ biến đổi wavelet rời rạc (DWT). Do đó, việc tính toán biến đổi
DWT thực chất là sự rời rạc hóa biến đổi wavelet liên tục (CWT); việc rời rạc
hóa được thực hiện với sự lựa chọn các hệ số a và b như sau:
a = 2
m
; b = 2
m
n (16)
Trong biến đổi wavelet rời rạc, các tham số tỷ lệ và dịch chuyển được rời rạc
hóa. Lúc bấy giờ tín hiệu f(t) được phân tích như sau:
trong đó, c
j,k
là các hệ số cần được xác định. Trong phân tích đa phân
giải wavelet (MRA) còn gọi là phân ly băng con (SD), tín hiệu f(t) được phân
ly ra các thành phần tần số thấp biểu diễn bởi hàm tỉ lệ , và các thành phần tần
số cao biểu diễn bởi wavelet
Nhóm 1 - D11VT7 Trang
S
A1 D1
A2 D2
A3 D3
XỬ LÝ ÂM THANH, HÌNH ẢNH
trong đó, j=1,2, ,j
0
là các mức phân giải khác nhau. Hình 1 là phân

tích đa phân giải 3 mức, trong đó S là tín hiệu nguyên thủy, A
(approximation-xấp xỉ) là các thành phần tần số thấp, và D (detail-chi tiết) là
các thành phần tần số cao.
Tín hiệu thông thường f(t) chỉ có một chiều (chủ yếu là thời gian), còn
tín hiệu ảnh f(x,y) là hai chiều nên phân tích đa phân giải wavelet áp dụng cho
ảnh phức tạp hơn rất nhiều.
Hình 1: Phân tích wavelet đa phân giải 3 mức.
1.2 Giới thiệu một số họ Wavelet:
1.2.1 Biến đổi Wavelet Haar:
Biến đổi Haar Wavelet là biến đổi đơn giản nhất trong các phép biến
đổi Wavelet. Hình 2 cho thấy dạng của hàm với biến đổi Haar. Do tính chất
đơn giản của biến đổi Haar mà nó được ứng dụng tương đối nhiều trong nén
ảnh, khi áp dụng biến đổi này để nén ảnh thì thuật toán nén ảnh trên máy tính
có một số điểm khác với công thức toán học của biến đổi Haar.
Nhóm 1 - D11VT7 Trang
S = A
1
+ D
1
= A
2
+ D
2
+ D
1
= A
3
+ D
3
+ D

2
+ D
1
XỬ LÝ ÂM THANH, HÌNH ẢNH
Hình 2: Hàm của biến đổi Haar
1.2.2 Biến đổi Wavelet Meyer:
Yves Meyer là một trong những nhà khoa học đã đặt nền móng cho
phép biến đổi Wavelet. Phép biến đổi Wavelet mang tên Meyer cũng là một
phép biến đổi thông dụng, biến đổi này có khả năng phân tích tín hiệu tốt hơn
nhiều so với biến đổi Haar. Dạng của hàm với biến đổi Meyer cho ở hình vẽ:
Hình 3: Hàm của biến đổi Meyer
1.2.3 Biến đổi Wavelet Daubechies:
Giống như Meyer, Daubechies cũng là một nhà khoa học có công lao
to lớn trong việc nghiên cứu phát triển phép biến đổi Wavelet. Biến đổi
Daubechies là một trong những phép biến đổi phức tạp nhất trong biến đổi
Wavelet. Họ biến đổi này được áp dụng hết sức rộng rãi, biến đổi Wavelet áp
dụng trong JPEG2000 là một biến đổi trong họ biến đổi Wavelet Daubechies.
Dưới đây là một số hàm trong họ biến đổi Wavelet Daubechies.
Nhóm 1 - D11VT7 Trang
XỬ LÝ ÂM THANH, HÌNH ẢNH
Hình 4: Hàm của họ biến đổi Daubechies n với n=2, 3, 7, 8
1.3 Tính chất của biến đổi wavelet:
Chúng ta đều biết rằng biến đổi Fuorier là một biến đổi đã và đang
được áp dụng rộng rãi trong nhiều ngành khoa học và kỹ thuật khác nhau.
Biến đổi Fuorier chuyển một hàm tín hiệu từ miền thời gian sang miền tần số.
Sử dụng biến đổi Fuorier ta có thể biết được trong tín hiệu f(t) có các thành
phần tần số nào. Tuy nhiên biến đổi Fourier có một nhược điểm cơ bản là với
một tín hiệu f(t) ta không thể biết được rằng tại một thời điểm t thì tín hiệu có
các thành phần tần số nào. Một phép biến đổi tốt hơn biến đổi Fourier phải là
phép biến đổi có đầy đủ tính năng của biến đổi Fourier và có khả năng xác

định xem tại một thời điểm t bất kỳ trong tín hiệu f(t) có thành phần tần số
nào. Phép biến đổi wavelet ra đời đã khắc phục được các nhược điểm của
biến đổi Fourier trong phân tích tín hiệu. Biến đổi wavelet dù chỉ làm việc với
các tín hiệu một chiều (liên tục hoặc rời rạc) nhưng sau khi biến đổi xong ta
thu được một hàm số hai biến hoặc một tập các cặp giá trị W(a,b) minh họa
các thành phần tần số khác nhau của tín hiệu xảy ra tại thời điểm t. Các giá trị
Nhóm 1 - D11VT7 Trang
XỬ LÝ ÂM THANH, HÌNH ẢNH
W(a
i
,b) tạo thành một cột (i=1,2, ,n) cho biết một thành phần tần số có
trong những thời điểm t nào và các giá trị W(a,b
i
) tạo thành hàng cho biết tại
một thời điểm t của tín hiệu f(t) có các thành phần tần số nào.
Tham số b trong biến đổi wavelet cho biết khoảng dịch của hàm
wavelet mẹ và độ phân giải các tần số khác nhau của f(t) được minh họa bởi
hệ số tỷ lệ chính là a. Biến đổi wavelet ngày càng được áp dụng rộng rãi đặc
biệt là trong xử lý tiếng nói, xử lý ảnh số. Tín hiệu tiếng nói là một tín hiệu
một chiều nhưng do đặc điểm của tiếng nói là tín hiệu không dừng nên việc
sử dụng Fuorier là không đủ để phân tích một cách đầy đủ các đặc trưng của
tiếng nói. Khác với tín hiệu tiếng nói, xử lý tín hiệu ảnh số là xử lý tín hiệu
hai chiều và do đặc điểm của ảnh số là bao giờ cũng có tính định hướng và
tính định vị. Tính định hướng của một ảnh nghĩa là trong ảnh bao giờ cũng có
một số ít các thành phần tần số nhưng các thành phần tần số này trải rộng trên
toàn bộ không gian ảnh còn tính định vị của ảnh chính là tính chất biểu thị
rằng tại một vùng của ảnh có thể có rất nhiều thành phần tần số. Ảnh biểu thị
tính định vị rõ nhất chính là ảnh có nhiều biên vùng phân tách rõ rệt, tại các
đường biên bao giờ cũng có nhiều thành phần tần số khác nhau, còn hầu hết
các ảnh có tông liên tục đều là những ảnh có tính định hướng.

2. Ứng dụng biến đổi wavelet:
2.1 Nén tín hiệu:
Do đặc điểm của mình, wavelet đặc biệt tốt khi sử dụng để nén hay
phân tích các tín hiệu không dừng; đặc biệt là tín hiệu ảnh số và các ứng dụng
nén tiếng nói, nén dữ liệu. Việc sử dụng các phép mã hóa băng con, băng lọc
số nhiều nhịp và biến đổi wavelet rời rạc tương ứng với loại tín hiệu cần phân
tích có thể mang lại những hiệu quả rất rõ rệt trong nén tín hiệu. Do tính chất
chỉ tồn tại trong các khoảng thời gian rất ngắn (khi phân tích tín hiệu trong
miền thời gian tần số) mà các hệ số của biến đổi wavelet có khả năng tập
trung năng lượng rất tốt vào các hệ số biến đổi. Các hệ số mang thông tin chi
Nhóm 1 - D11VT7 Trang 10
XỬ LÝ ÂM THANH, HÌNH ẢNH
tiết của biến đổi wavelet thường rất nhỏ và có thể bỏ qua mà không ảnh
hưởng tới việc mã hóa dữ liệu (trong phương pháp mã hóa ảnh hay tiếng nói
là những tín hiệu cho phép mã hóa có tổn thất thông tin).
2.2 Khử nhiễu:
Tính chất của biến đổi wavelet mà chúng ta đã xét tới trong phần ứng
dụng cho nén tín hiệu được mở rộng bởi Iain Johnstone và David Donohos
trong các ứng dụng khử nhiễu cho tín hiệu. Phương pháp khử nhiễu này được
gọi là wavelet Shrinkage Denoising (WSD). Ý tưởng coe bản của WSD dựa
trên việc tín hiệu nhiễu sẽ lộ rõ khi phân tích bằng biến đổi wavelet ở các hệ
số biến đổi bậc cao. Việc áp dụng các ngưỡng loại bỏ tương ứng với các bậc
cao hơn của hệ số wavelet sẽ có thể dễ dàng loại bỏ nhiễu trong tín hiệu.
2.3 Mã hóa nguồn và mã hóa kênh:
Sở dĩ wavelet được ứng dụng trong mã hóa nguồn và mã hóa kênh vì
trong mã hóa nguồn thì chúng ta cần khả năng nén với tỷ lệ nén cao còn trong
mã hóa kênh thì cần khả năng chống nhiễu tốt. Biến đổi wavelet kết hợp với
một số phương pháp mã hóa như mã hóa Huffman hay mã hóa số học có thể
thực hiện được cả hai điều trên. Vì thế việc sử dụng biến đổi wavelet trong
mã hóa nguồn và mã hóa kênh là rất thích hợp.

2.4 Ứng dụng biến đổi wavelet trong xử lý ảnh:
2.4.1 Mô hình xử lý nhiễu cơ bản:
Mô hình nền tảng cho xử lý nhiễu cơ bản:
trong đó:
e(n) là nhiễu trắng hay nhiễu không trắng dao động trong khoảng
f(n) tín hiệu không có nhiễu.
 Quy trình khử nhiễu tiến hành theo 3 bước:
Nhóm 1 - D11VT7 Trang 11
XỬ LÝ ÂM THANH, HÌNH ẢNH
Bước 1: Phân tách tín hiệu. Chọn một wavelet thích hợp và chọn mức
phân tách N. Sử dụng DWT phân tích. Tính các hệ số phân tách wavelet của
tín hiệu ở mức N.
Bước 2: Đặt ngưỡng toàn cục hay đặt ngưỡng cục bộ các hệ số chi tiết
trên các mức, chọn một ngưỡng thích hợp cho kết quả thử tốt nhất.
Bước 3: Tái tạo tín hiệu ban đầu. Tính sự tái tạo wavelet dựa trên các
hệ số của xấp xỉ mức N và các hệ số chi tiết đã thay đổi từ mức 1 đến N.
2.4.2 Phương pháp đặt ngưỡng tín hiệu:
2.4.2.1 Lý thuyết ngưỡng:
- Đặt ngưỡng cứng: đặt các giá trị về 0 các phần tử mà giá trị tuyệt đối
thấp hơn ngưỡng.
- Đặt ngưỡng mềm: đầu tiên thiết lập về 0 các giá trị tuyệt đối thấp hơn
ngưỡng và sau đó hạ dần các hệ số khác về 0.
- Phương pháp wavelet shrinkage là quá trình khử nhiễu hình ảnh phi
tuyến để loại bỏ nhiễu bằng cách thu hẹp lại hệ số wavelet trong wavelet.
Hình 5: Ngưỡng cứng, ngưỡng mềm và Shrinkage
2.4.2.2 Khử nhiễu không tuyến tính bằng phương pháp đặt ngưỡng cứng
và ngưỡng mềm:
- Chọn một wavelet thích hợp để biến đổi sử dụng DWT, mức phân ly N
- Hệ số wavelet ngưỡng mềm:
- Hệ số wavelet ngưỡng cứng:

Nhóm 1 - D11VT7 Trang 12

×