Tải bản đầy đủ (.pdf) (75 trang)

tìm hiểu mô hình nén ảnh sử dụng biến đổi wavelet

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.09 MB, 75 trang )

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên


ĐẠI HỌC THÁI NGUYÊN
KHOA CÔNG NGHỆ THÔNG TIN





Phạm Nghĩa Luân





TÌM HIỂU MÔ HÌNH NÉN ẢNH SỬ DỤNG BIẾN ĐỔI
WAVELET

Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01






LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN


NGƯỜI HƯỚNG DẪN KHOA HỌC


PGS.TS NGÔ QUỐC TẠO







Thái Nguyên - 2010



Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên

LỜI CẢM ƠN

Em xin trân trọng cảm ơn các thầy giáo, cô giáo trong Viện Công nghệ
thông tin, Khoa Công nghệ thông tin Đại học Thái Nguyên đã nhiệt tình giảng
dạy và hết lòng giúp đỡ em trong quá trình học tập và nghiên cứu đề tài.
Luận văn được hoàn thành tại Khoa Công nghệ thông tin dưới sự hướng
dẫn của PGS.TS Ngô Quốc Tạo. Em xin bày tỏ lòng kính trọng và biết ơn sâu
sắc tới thầy.
Sự quan tâm, giúp đỡ của gia đình và bạn bè, đặc biệt lớp Cao học K7
Khoa Công nghệ thông tin đã cổ vũ, động viên em trong suốt thời gian học
tập và thực hiện đề tài.
Mặc dù có nhiều cố gắng song luận văn không thể tránh khỏi những thiếu
sót, em mong nhận được sự đóng góp ý kiến của các thầy cô và các bạn.
Xin chân thành cảm ơn!

Thái Nguyên, tháng 11 năm 2010

Học viên


Phạm Nghĩa Luân








Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên

LỜI CAM ĐOAN

Tôi xin cam đoan luận văn “Tìm hiểu mô hình nén ảnh sử dụng biến
đổi WAVELET” là do tôi tự tìm hiểu và đƣợc hoàn thành dƣới sự hƣớng dẫn
của thầy giáo PGS. TS Ngô Quốc Tạo.


i

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên

MỤC LỤC
Trang
Trang phụ bìa
Trang nhiệm vụ
Mục lục i

Danh mục các ký hiệu, các chữ viết tắt iii
Danh mục các bảng iv
Danh mục các hình vẽ, đồ thị v
MỞ ĐẦU 1
Chƣơng 1 3
TỔNG QUAN VỀ BIẾN ĐỔI WAVELET 3
1.1. Tại sao sử dụng biến đổi Wavelet ? 3
1.2. Mã hoá băng con (Subband coding) 4
1.3. Biến đổi Wavelet (Wavelet transform) 7
1.3.1. Biến đổi Wavelet rời rạc (Discrete Wavelet transform – DWT) 9
1.3.2. Biểu diễn đa phân giải (Multiresolution) 10
1.3.3. Biến đổi Wavelet và các bộ lọc 14
1.3.4. Hệ thống biến đổi Wavelet nhiều chiều 15
1.3.5. Thiết kế bộ lọc Wavelet 16
1.4. Tính chất của biến đổi Wavelet 21
1.5. Một số ứng dụng nổi bật của Wavelet 22
1.5.1. Nén tín hiệu 22
1.5.2. Lọc nhiễu 22
1.5.3. Phát hiện biên 22
Chƣơng 2 23
MỘT SỐ DẠNG CỦA BIẾN ĐỔI WAVELET 23
2.1. Biến đổi Wavelet Haar 23
2.2. Biến đổi Wavelet Meyer 24
2.3. Biến đổi Wavelet Daubechies 25
Chƣơng 3 27
BIẾN ĐỔI WAVELET TRONG NÉN ẢNH 27

ii



Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên

3.1. Tổng quan về nén ảnh 27
3.1.1. Giới thiệu chung về nén ảnh 27
3.1.2. Phân loại các kỹ thuật nén 28
3.1.3. Tiêu chuẩn đánh giá chất lƣợng mã hoá ảnh 29
3.2. Mã hóa của ảnh con Wavelet (Coding of the Wavelet subimages) 30
3.2.1. Lƣợng tử hóa xấp xỉ kế tiếp (Quantization by successive
approximation) 31
3.2.2. Những điểm giống nhau giữa các băng tần 32
3.3. Thuật toán EZW (Embedded zero tree Wavelet algorithm) 34
3.3.1. Thuật toán 34
3.3.2. Phân tích thuật toán 36
3.4. Phƣơng pháp mã hoá phân cấp theo vùng (Set partitioning in hierarchical
trees - SPIHT) 38
3.5. Mã hoá nhúng khối với cắt xén tối ƣu hóa (Embedded block coding with
optimised truncation - EBCOT) 44
3.5.1. Lƣợng tử hoá mặt phẳng bit (Bit plane quantisation) 47
3.5.2. Điều kiện số học mã hóa của mặt phẳng bit (mã hóa bậc 1) 48
3.5.3. Mã hóa phân đoạn mặt phẳng bit (Fractional bit plane coding) 50
3.5.4. Sự hình thành tầng (layer) và tổ chức dòng bit (mã hoá bậc 2) 59
3.5.5. Điều chỉnh tỷ lệ (Rate control) 60
Chƣơng 4 62
CHƢƠNG TRÌNH MINH HỌA 62
4.1. Nén ảnh sử dụng biến đổi Wavelet. 62
KẾT LUẬN 65
TÀI LIỆU THAM KHẢO 66





iii


Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT

DCT Biến đổi Cosine rời rạc (Discrete Cosine Transform)
DPCM Điều xung mã vi sai (Differized Pulse Code Modulation)
DWT Biến đổi Wavelet rời rạc (Discrete Wavelet Transform)
EBCOT Mã hoá nhúng khối với cắt xén tối ƣu hóa
(Embedded block coding with optimised truncation)
EZW Wavelet cây zero (Embedded Zerotree Wavelet)
IDWT Biến đổi Wavelet rời rạc ngƣợc
JPEG Chuẩn nén ảnh của ủy ban JPEG quốc tế
(Joint Photographic Experts Group)
JPEG2000 Chuẩn nén ảnh JPEG2000
MRA Phân tích đa phân giải (Multi Resolution Analysis)
MSE Sai số bình phƣơng trung bình (Mean Square Error)
PCM Điều xung mã (Pulse Code Modulation)
PCRD Tỷ lệ biến dạng nén (Post Compression Rate Distortion)
PSNR Tỷ số tín hiệu đỉnh trên nhiễu (Peak Signal to Noise Ratio)
QMF Lọc gƣơng cầu tứ phƣơng (Quardrature Mirror Filters)
RLC Mã hoá loạt dài (Run Length Coding)
ROI Kỹ thuật mã hóa ảnh theo vùng (Region Of Interest) –
Một tính năng mới nổi bật của JPEG2000
SOT Cây định hƣớng không gian (Spatial Orientation Tree)
STFT Biến đổi Fourier thời gian ngắn
(Short Time FourierTransform)

Wavelet Biến đổi băng con Wavelet

iv


Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên

DANH MỤC CÁC BẢNG

Bảng 1.1. Bộ lọc phân tích thông thấp và thông cao của bộ lọc song trực giao
số nguyên (5, 3) 18
Bảng 1.2. Bộ lọc phân tích thông thấp và thông cao của Daubechies (9, 3) lọc
song trực giao 19
Bảng 1.3. Bộ lọc phân tích thông thấp và thông cao của Daubechies (9, 7) lọc
song trực giao 19
Bảng 3.1. Phân công chín bối cảnh dựa trên ý nghĩa khu vực lân cận 53




















v


Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên

DANH MỤC CÁC HÌNH VẼ

Hình 1.1. Một dải của bộ lọc lấy dải 4
Hình 1.2. Hai dải của một bộ lọc phân tích 5
Hình 1.3. Hai dải của một bộ mã hoá / giải mã băng con 5
Hình 1.4a. Sự tạo thành và phục hồi băng con thông thấp 6
Hình 1.4b. Sự tạo thành và phục hồi băng con thông cao 7
Hình 1.5. Sự ảnh hƣởng của các tham số lên sóng mẹ. 8
Hình 1.6. Đa phân giải không gian 11
Hình 1.7. (a) Hàm tỷ lệ Haar (b) Wavelet Haar (c) Xấp xỉ của một hàm liên
tục x(t) ở độ phân giải thô A
0
x(t) (d) Độ phân giải xấp xỉ cao A
1
x(t). 13
Hình 1.8. Một trong những giai đoạn biến đổi Wavelet 15
Hình 1.9. Biến đổi Wavelet nhiều dải mã hóa bằng cách sử dụng lặp đi lặp
lại chia tách hai dải 16
Hình 1.10. (a) Bảy subimages tạo ra bởi các bộ mã hóa của hình 1.9 20
Hình 2.1. Hàm ψ (t ) của biến đổi Haar 23

Hình 2.2. Biến đổi Fourier của hàm tỉ lệ cho cở sở Meyer 24
Hình 2.3. Hàm ψ (t ) của biến đổi Meyer 25
Hình 2.4. Hàm ψ (t ) của họ biến đổi Daubechies n với n=2, 3, 7, 8. 26
Hình 3.1. Sơ đồ khối một hệ thống nén ảnh điển hình Error! Bookmark not
defined.
Hình 3.2. Nguyên tắc của xấp xỉ kế tiếp 31
Hình 3.3. Cây tứ phân biểu diễn của các băng tần cùng một hƣớng 33
Hình 3.4. Cây không gian định hƣớng và thiết lập phân vùng trong SPIHT . 40
Hình 3.5. Lƣợng tử hoá miền không thay đổi với kích thƣớc bƣớc Δ
b
47
Hình 3.6. Tám biểu tƣợng lân cận tức thời 49
Hình 3.7. Dải lấy mẫu thứ tự trong một khối mã 49

vi


Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên

Hình 3.8. Tác động của thứ tự mã hoá phân đoạn mặt phẳng bit trong giảm
biến dạng 51
Hình 3.9. Tỷ lệ biến dạng với phân đoạn tối ƣu 52
Hình 3.10. Một minh hoạ của mã hóa phân đoạn mặt phẳng bit 57
Hình 3.11. Hiệu suất nén của các thuật toán mã hóa Wavelet khác nhau 61
Hình 4.1. Lựa chọn file ảnh dạng bitmap 62
Hình 4.2. Kết quả sau khi nén sử dụng biến đổi Wavelet 63
Hình 4.3. Lựa chọn file giải nén 63
Hình 4.4. Kết quả sau khi giải nén. 64



1


Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên

MỞ ĐẦU
Sự phân tích biến đổi Wavalet bắt đầu từ giữa những năm 80, vào thời
điểm này chúng đƣợc phát triển để dò các tín hiệu địa chấn. Tầm quan trọng
của phép phân tích Wavelet duy trì trong phạm vi nhỏ, chủ yếu trong cộng
đồng toán học vào cuối những năm 80. Ứng dụng của sự phân tích phép biến
đổi Wavelet trong khoa học và trong các công trình thực sự bắt đầu từ những
năm đầu của thập niên 90.
Biến đổi Wavelet (Wavelet transform) đƣợc cung cấp để đặc biệt dùng
cho việc phân tích tín hiệu, nhất là những tín hiệu không theo chu kì, nhiễu,
gián đoạn, nhất thời, v.v Biến đổi Wavelet đƣợc dùng trong nhiều ứng dụng.
Trong xử lý ảnh, nó có thể đƣợc ứng dụng trong khử nhiễu, nén ảnh, phân tích
không gian tần của ảnh, v.v
Cùng với sự phát triển mạnh mẽ của máy tính và sự ra đời của Internet,
việc tìm một phƣơng pháp nén ảnh để giảm bớt không gian lƣu trữ thông tin
và truyền thông tin trên mạng nhanh chóng đang là một yêu cầu cần thiết.
Trong những năm gần đây, có rất nhiều phƣơng pháp đã và đang đƣợc nghiên
cứu rộng rãi để thực hiện nén ảnh. Tất cả đều với một mục đích chung là làm
thế nào để biểu diễn một ảnh với ít bit nhất để có thể tối thiểu hoá dung lƣợng
kênh truyền và không gian lƣu trữ trong khi vẫn giữ đƣợc tính trung thực của
ảnh. Điều này tƣơng đƣơng với việc biểu diễn ảnh có độ tin cậy cao nhất với
số bit nhỏ nhất.
Đề tài này trình bày kỹ thuật nén ảnh và khử nhiễu sử dụng biến đổi
Wavelet cho ảnh tĩnh. So với các kỹ thuật nén sử dụng phép biến đổi trƣớc
đây nhƣ biến đổi Fourier (FT), biến đổi cosine rời rạc (DCT), v.v., biến đổi
Wavelet rời rạc (DWT) có nhiều ƣu điểm không chỉ trong xử lý ảnh mà còn

nhiều ứng dụng khác. Bằng chứng là sự ra đời của chuẩn nén JPEG2000 (dựa
trên DWT) có tính năng vƣợt trội so với JPEG (dựa trên DCT).

2


Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên

Luận văn gồm có 4 chƣơng với các nội dung sau:
Chƣơng 1: Trình bày cơ sở toán học của phép biến đổi Wavelet, trong
đó đề cập đến mã hóa băng con, biến đổi Wavelet rời rạc với cách tiếp cận
phân tích đa phân giải. Đề cập đến cách thiết kế bộ lọc Wavelet, trình bày
những tích chất cơ bản của phép biến đổi Wavelet, đồng thời nêu ra một số
ứng dụng nổi bật của Wavelet nhƣ nén tín hiệu, lọc nhiễu…
Chƣơng 2: Chƣơng này đã giới thiệu một số họ của biến đổi Wavelet.
Đặc biệt họ Wavelet Daubechies - họ biến đổi Wavelet áp dụng trong
JPEG2000.
Chƣơng 3: Trình bày cụ thể biến đổi Wavelet trong nén ảnh. Trƣớc hết
trình bày tổng quan về nén ảnh và các kỹ thuật nén ảnh, mã hóa Wavelet ảnh
con. Giới thiệu các thuật toán nhƣ thuật toán EZW, SPIHT, mã hóa EBCOT.
Chƣơng 4: Chƣơng trình minh họa.
Luận văn đã đạt đƣợc một số kết quả nhƣng cũng không tránh khỏi những sai
sót. Rất mong nhận đƣợc sự đóng góp ý kiến của các thầy cô, bạn bè và các
bạn đồng nghiệp để đề tài đƣợc hoàn thiện hơn nữa.

3


Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên


Chƣơng 1
TỔNG QUAN VỀ BIẾN ĐỔI WAVELET
1.1. Tại sao sử dụng biến đổi Wavelet ?
Trƣớc khi giới thiệu về biến đổi Wavelet và ứng dụng của nó trong nén
ảnh, có thể đặt ra 2 câu hỏi:
- Có điểm gì chƣa hợp lý khi sử dụng DCT không? và tại sao sử dụng
biến đổi Wavelet?
- Nếu Wavelet là tốt hơn DCT, tại sao các phƣơng pháp nén ảnh trƣớc
đây (JPEG) không sử dụng?
Câu trả lời cho phần đầu tiên là nhƣ sau:
Biến đổi DCT và các biến đổi theo khối khác chia ảnh thành những
khối không chồng nhau và xử lý mỗi khối riêng rẽ. Để có đƣợc tỷ lệ bit thấp,
các hệ số của biến đổi đƣợc lƣợng tử hóa, nhƣ vậy sẽ có một lỗi đáng kể khi
khôi phục lại ảnh ban đầu. Lỗi khi khôi phục này thấy rõ hơn tại biên của mỗi
khối (vì các khối đƣợc biến đổi độc lập). Để khắc phục lỗi này, ngƣời ta còn
đề cập tới việc sử dụng khối chồng lên nhau (khối giả). Tuy nhiên, biến đổi
Wavelet là cách tiếp cận khác và đã dự kiến sẽ loại bỏ việc sử dụng khối giả.
Câu trả lời cho phần thứ hai liên quan đến công nghệ đƣợc dùng cho
nén ảnh ở thập niên 1980, thời điểm một số phƣơng pháp nén ảnh đƣợc giới
thiệu (JPEG). Tại thời điểm này, mặc dù biến đổi Wavelet và mã hoá băng
con đã đƣợc biết đến, tuy nhiên, chƣa có phƣơng pháp mã hóa hiệu quả của
biến đổi Wavelet. Trong thực tế, các kiến nghị về sử dụng biến đổi Wavelet
chƣa đƣợc đề cập tới, do đó, biến đổi DCT đƣợc sử dụng trong nén ảnh.
Tuy nhiên, sau sự ra đời của một số chuẩn nén JPEG, việc nghiên cứu
và sử dụng biến đổi Wavelet đƣợc đề cập tới. Đặc biệt, sau khi Jussef Shapiro
giới thiệu Embedded zero tree Wavelet - EZW. Trong chƣơng này, chúng tôi
đề cập tới biến đổi Wavelet và sự hiệu quả của biến đổi này trong nén ảnh.

4



Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên

1.2. Mã hoá băng con (Subband coding)
Trƣớc khi xem xét biến đổi Wavelet, chúng ta tìm hiểu về mã hóa băng
con. Về mặt hình dáng, biến đổi Wavelet và mã hóa băng con tƣơng tự nhau.
Tuy nhiên, mã hóa băng con là giải thuật, còn biến đổi Wavelet đƣợc giới
thiệu dạng toán học.
Mã hóa băng con lần đầu tiên đƣợc Crochiere giới thiệu vào năm 1976.
Đây là kỹ thuật tốt cho nén tiếng nói và ảnh. Nguyên tắc cơ bản của mã hóa
băng con là chia phổ tín hiệu thành nhiều đoạn, sau đó mã hóa và truyền mỗi
đoạn đó một cách độc lập. Nguyên tắc này phù hợp với mã hóa hình ảnh. Thứ
nhất, với ảnh số, phổ của chúng không đều, phần lớn năng lƣợng đƣợc tập
trung ở dải tần số thấp hơn. Thứ hai, con ngƣời cảm nhận về nhiễu có xu
hƣớng ở cả hai tần số cao và thấp và điều này cho phép các nhà thiết kế điều
chỉnh dạng nén theo tiêu chí thị giác. Thứ ba, có thể chia nhỏ ảnh thành khối,
cấu trúc khối không thay đổi, do đó có thể sử dụng bộ biến đổi sang không
gian tần nhƣ DCT.
Trong mã hoá băng con, dải tần đƣợc tách bằng bộ lọc dải, minh họa
trong hình 1.1. Bộ lọc đƣợc thiết kế dựa trên sự cảm nhận hình ảnh của mắt
ngƣời.

Hình 1.1. Một dải của bộ lọc lấy dải

5


Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên

Với cách tiếp cận này, ảnh đƣợc chia thành nhiều khối nhỏ. Các khối

này đƣợc lƣợng tử hóa, mã hóa và truyền đi. Quá trình khôi phục ảnh đƣợc
thực hiện khi nhận đƣợc các khối trên, thông qua bộ lọc tổng hợp. Hình 1.2 là
ví dụ về bộ lọc có 2 dải.

Hình 1.2. Hai dải của một bộ lọc phân tích
Nhƣ vậy, quá trình mã hóa / giải mã sử dụng 2 dải đƣợc minh họa trong
hình 1.3. Trong sơ đồ này, bộ lọc H
0
(z) và H
1
(z) của biến đổi z, tƣơng ứng
với bộ lọc thông thấp và thông cao. Bộ lọc G
0
(z) và G
1
(z) là các bộ lọc tổng
hợp tƣơng ứng.


Hình 1.3. Hai dải của một bộ mã hoá / giải mã băng con
Tại các bộ mã hóa, phép lấy mẫu giảm xuống 2 lần, phần còn lại đƣợc
sử dụng nhƣ trình tự ban đầu. Hiệu quả của việc lấy mẫu xuống/ nén trên

6


Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên

miền tần số tăng gấp đôi chiều rộng của tất cả các thành phần trong mẫu
quang phổ.

Tại các bộ giải mã, lấy mẫu lên là một thủ tục bổ sung, bằng cách chèn
một số số không vào giữa mỗi mẫu đầu vào, và coi nhƣ phần không gian mở
rộng của các chuỗi đầu vào.
Tuy nhiên, vấn đề khó khăn của phƣơng pháp là khó xây dựng bộ lọc lý
tƣởng phân tích vị trí cắt hợp lý. Điều này đƣợc thể hiện trong hình 1.4a. Một
tín hiệu cho thấy mẫu gốc đã đƣợc bộ lọc lấy thông thấp để năng lƣợng một
số vẫn còn ở trên F
s
/ 4, tần số cắt của bộ lọc lý tƣởng cho các nhiệm vụ đề ra.
Lấy mẫu xuống nén tín hiệu và mở rộng để cung cấp cho B, và C là hình ảnh
sau khi giãn nở hoặc lấy mẫu lên. Cũng nhƣ tại bội số của F
s
, quá trình này
tạo ra các thành phần phổ bổ sung tại bội số lẻ của F
s
/ 2. Những sai số lấy
mẫu gây ra khi việc phục hồi phân giải cuối cùng diễn ra tại D.

Hình 1.4a. Sự tạo thành và phục hồi băng con thông thấp

7


Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên

Trong trƣờng hợp thông cao, hình 1.4b, các hiện tƣợng tƣơng tự xảy ra,
để phục hồi năng lƣợng sai số lấy mẫu trong khu vực của F
s
/ 4. Những hình
ảnh đầu ra cuối cùng đƣợc tạo ra bằng cách thêm phần giải thông thấp hơn và

thông cao cho quá trình hình thành và phục hồi dữ liệu của bộ lọc có liên
quan. Năng lƣợng sai số lấy mẫu thƣờng đƣợc dự kiến sẽ gây nhiễu.

Hình 1.4b. Sự tạo thành và phục hồi băng con thông cao
1.3. Biến đổi Wavelet (Wavelet transform)
Biến đổi Wavelet là một trƣờng hợp đặc biệt của mã hoá băng con, biến
đổi này đƣợc sử dụng nhiều trong nén ảnh và video. Mã hóa băng con cho ảnh
đƣợc dựa trên phân tích tần số, còn các biến đổi Wavelet đƣợc dựa trên lý
thuyết xấp xỉ. Tuy nhiên, để làm trơn cục bộ có thể mô hình hóa nhƣ đa thức
trên từng khúc. Trong thực tế, Wavelet cung cấp một phƣơng pháp hiệu quả
để xấp xỉ các hàm với một số lƣợng nhỏ các hàm cơ sở. Về mặt toán học, một

8


Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên

biến đổi Wavelet của một hàm bình phƣơng khả tích x (t) là khai triển nó
thành một tập các hàm cơ sở, nhƣ sau:



 dtttxbaX
baw
)()(),(
,

(1.11)
Trong đó Ψ
a, b

(t) đƣợc gọi là hàm cơ sở, a là tham số co dãn, b là tham
số dịch. Ψ (t) đƣợc gọi là sóng mẹ (mother Wavelet ) và đƣợc định nghĩa:








a
bt
a
ba
1
,

(1.12)
Ảnh hƣởng của các tham số đƣợc thể hiện trong hình 1.5.

Hình 1.5. Sự ảnh hƣởng của các tham số lên sóng mẹ.
Trong hình 1.5: (a) Wavelet mẹ Ψ (t) = Ψ
1, 0
(t), a = 1, b = 0.
(b) Wavelet Ψ
1, b
(t), a = 1, b ≠ 0.
(c) Wavelet Ψ
2,0
(t) ở tỷ lệ a = 2, b = 0.

(d) Wavelet Ψ
0.5,0
(t) ở tỷ lệ a = 1 / 2, b = 0.
Với tham số a khác nhau, chiều rộng của các hàm cơ sở khác nhau. Với
a lớn sẽ mở rộng phạm vi của hàm cơ sở trong miền thời gian và vì thế hẹp
hơn trong miền tần số. Do đó nó cho phép thay đổi theo thời gian và độ phân

9


Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên

giải tần số (với sự cân bằng giữa cả hai) trong biến đổi Wavelet . Tham số a là
thuộc tính của biến đổi Wavelet làm cho nó thích hợp với việc phân tích các
tín hiệu có kích cỡ đƣờng biên khác nhau nhƣ trong hình ảnh tự nhiên.
1.3.1. Biến đổi Wavelet rời rạc (Discrete Wavelet transform – DWT)
Nhƣ định nghĩa biến đổi Wavelet trong (1.11) ánh xạ tín hiệu một chiều
x (t) vào một hàm hai chiều X
w
(a, b) và những tín hiệu ban đầu có thể đƣợc
phục hồi từ tính toán biến đổi Wavelet trên giá trị rời rạc của a và b. a có thể
đƣợc thực hiện rời rạc bằng cách chọn
m
aa
0

, với a
0
> 1 và m là một số
nguyên. Tăng a lên, băng thông của các hàm cơ sở (hoặc độ phân giải tần số)

giảm và vì thế độ phân giải các ô là cần thiết hơn để bao phủ khu vực. Tƣơng
tự nhƣ vậy, làm rời rạc b tƣơng ứng với mẫu trong thời gian (lấy mẫu tần số
phụ thuộc vào băng thông của tín hiệu đƣợc lấy mẫu đó lần lƣợt là tỷ lệ
nghịch với a), nó có thể đƣợc chọn
m
anbb
00

. Đối với a
0
= 2 và b
0
= 1 có
những sự lựa chọn của Ψ(t) sao cho hàm Ψ
m, n
(t) tạo thành một cơ sở trực
giao của không gian của các hàm bình phƣơng khả tích. Có nghĩa là bất kỳ
hàm bình phƣơng khả tích x (t) có thể đƣợc biểu diễn nhƣ là một sự kết hợp
tuyến tính của hàm cơ sở nhƣ:






n
nmnm
m
ttx )()(
,,



(1.13)
Trong đó α
m, n
đƣợc biết đến nhƣ là hệ số biến đổi Wavelet của x (t) và thu
đƣợc từ (1.11) bởi:



 )()(
,,
ttx
nmnm


(1.14)
Đáng lƣu ý là cho mỗi lần tăng m, giá trị của a gấp đôi. Tức là tăng gấp
đôi chiều rộng trong miền thời gian và giảm một nửa chiều rộng ở miền tần
số. Điều này tƣơng đƣơng cho phân tích tín hiệu với băng con bát phân và
tƣơng ứng với biến đổi Wavelet hai ngôi tƣơng tự nhƣ trong hình 1.1, dùng để

10


Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên

mô tả các nguyên tắc cơ bản của mã hóa băng con, và do đó biến đổi Wavelet
là một loại mã hóa băng con.
1.3.2. Biểu diễn đa phân giải (Multiresolution)

Áp dụng biến đổi Wavelet để mã hóa hình ảnh tốt hơn có thể đƣợc hiểu
với quan điểm của phân tích tín hiệu đa phân giải. Giả sử có một hàm Φ (t)
sao cho xác lập Φ (t - n), n

Z là trực giao. Cũng giả sử Φ (t) là lời giải của
hai quy mô phƣơng trình khác nhau:




n
n
ntct )2(2)(

(1.15)
với



 dtnttc
n
)2(2)(

(1.16)
Cho x (t) là một hàm bình phƣơng khả tích, mà có thể đƣợc biểu nhƣ là
một sự kết hợp tuyến tính của Φ (t - n) là:





n
n
ntctx )()(

(1.17)
Trong đó c
n
là hệ số giãn nở (expansion coefficient) và là hình chiếu
của x (t) vào Φ (t - n). Từ đó phép giãn của một hàm thay đổi độ phân giải của
nó, có thể biểu diễn cho x (t) tại các độ phân giải khác nhau bởi hệ số giãn nở
và hàm co Φ (t). Do đó x (t) tại bất kỳ độ phân giải m có thể đƣợc biểu nhƣ sau:
)2(2)(
2
ntctx
m
n
m
n
m
m





(1.18)
Nếu V
m
là không gian đƣợc tạo ra bởi 2
-m/2

Φ (2
-m
t - n), sau đó từ 1.15,
Φ (t) là nhƣ vậy với bất kỳ i > j, các hàm tạo ra không gian V
i
cũng nằm trong
V
j
, tức là V
i


V
j
(i> j). Vì vậy, không gian ở quy mô tiếp có thể đƣợc lồng
nhau, nhƣ vậy V
m
cho m tăng có thể đƣợc xem nhƣ là không gian của độ phân
giải giảm. Do đó, một không gian ở độ phân giải thô V
j-1
có thể đƣợc khai

11


Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên

triển thành hai không gian con (subspaces): một không gian ở độ phân giải tốt
hơn V
j

và một bù trực giao của V
j
, biểu diễn bởi W
j
sao cho V
j
+ W
j
= V
j-1

trong đó W
j

V
j
. Không gian W
j
là không gian của sự khác biệt giữa thô và tỷ
lệ độ phân giải tốt hơn, có thể đƣợc xem nhƣ là lƣợng chi tiết thêm vào khi đi
từ một độ phân giải V
j
nhỏ hơn đến có độ phân giải lớn hơn V
j-1
. Việc phân
cấp của không gian đƣợc mô tả trong hình 1.6.

Hình 1.6. Đa phân giải không gian
Mallat đã chỉ ra rằng trong các cơ sở nói chung cho W
j

bao gồm trong
dịch và phép giãn của một hàm mẫu nguyên đơn Ψ (t), gọi là một Wavelet .
Vì vậy, W
m
là không gian đƣợc tạo ra bởi Ψ
m, n
(t) = 2
-m/2
Ψ (2
-m
t - n). Wavelet
Ψ (t)

V
_1
có thể đƣợc lấy từ Φ (t) nhƣ sau:





n
n
n
ntct )2(2)1()(
1

(1.19)
Hàm Φ (t) đƣợc gọi là hàm tỷ lệ (scaling function) của biểu diễn đa
phân giải. Vì vậy, các hệ số của biến đổi Wavelet (1.14) tƣơng ứng với phép

chiếu của x (t) vào một không gian chi tiết của độ phân giải m, W
m
. Do đó,
một biến đổi Wavelet về cơ bản là phân tích một tín hiệu vào không gian của

12


Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên

các độ phân giải khác nhau. Dƣới đây là một ví dụ về tính toán Wavelet Haar
thông qua kỹ thuật này.
Ví dụ: Wavelet Haar
Hàm tỷ lệ của Wavelet Haar đƣợc biết đến là hàm hình chữ nhật (rect):





l¹i cßn 0
101
)(
t
t

Hàm rect thoả mãn (1.15) với c
n
tính từ (1.16) nhƣ sau:








l¹i cßn0
1,0
2
1
n
c
n

Vì vậy, bằng cách sử dụng (1.19), Wavelet Haar có thể tìm thấy nhƣ sau:










1
2
1
1
2
1

01
)(
t
t
t

Hàm tỷ lệ Φ (t) (một một hàm rect) và Wavelet Haar tƣơng ứng Ψ (t) ví
dụ này đƣợc thể hiện trong hình 1.7a và b. Về quan điểm xấp xỉ, sự phân tích
đa phân giải có thể đƣợc giải thích nhƣ sau: Cho x (t) có thể xấp xỉ ở độ phân
giải j bằng hàm A
j
x (t) qua loạt khai triển hàm trực giao cơ sở. Từ W
j
biểu
diễn cho không gian của sự khác biệt giữa một tỷ lệ thô V
j-1
và một tỷ lệ trơn
V
j
, sau đó D
j
x (t)

W
j
biểu diễn cho sự khác biệt của xấp xỉ của x (t) tại j-1
và độ phân giải j (tức là D
j
x (t) = A
j-1

x (t) - A
j
x (t)).

13


Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên


Hình 1.7. (a) Hàm tỷ lệ Haar (b) Wavelet Haar (c) Xấp xỉ của một hàm liên
tục x(t) ở độ phân giải thô A
0
x(t) (d) Độ phân giải xấp xỉ cao A
1
x(t).
Vì vậy, các tín hiệu x (t) có thể đƣợc chia ra nhƣ:
)()()()(
001
txDtxAtxAtx 


Hình 1.7c và d hiển thị xấp xỉ của một hàm liên tục tại hai độ phân giải
liên tiếp sử dụng một hàm tỷ lệ hình chữ nhật. Một khối thô A
0
x (t) đƣợc hiển
thị trong hình 1.7c và ở độ phân giải xấp xỉ cao A
1
x (t) trong hình 1.7d nơi mà
các hàm tỷ lệ là một phiên bản phóng rộng (giãn nở) của hàm hình chữ nhật.

Đối với một hàm trơn x (t), phần lớn các biến thể (tín hiệu năng lƣợng) đƣợc
chứa trong A
0
x (t), và D
0
x (t) là gần nhƣ bằng không. Bằng cách lặp lại thủ
tục này chia tách và phân vùng A
0
x (t) = A
1
x (t) + D
1
X (t), biến đổi Wavelet
của tín hiệu x (t) có thể đƣợc lấy và do đó hàm gốc x (t) có thể đƣợc biểu diễn
về Wavelet của nó nhƣ là:
)()( )()()()(
210
txAtxDtxDtxDtxDtx
nn


(1.20)
Trong đó n biểu diễn cho số phép khai triển. Từ đó dải động của các tín
hiệu chi tiết D
j
x (t) đều nhỏ hơn nhiều so với hàm ban đầu x (t), chúng đƣợc
dễ mã hơn hệ số trong dãy khai triển (1.13).

14



Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên

1.3.3. Biến đổi Wavelet và các bộ lọc
Đối với thủ tục chia tách lặp mô tả ở trên đƣợc thực hiện nên có một
thuật toán hiệu quả cho việc thu thập D
j
x (t) từ việc khai triển hệ số ban đầu
của x (t). Một trong những hậu quả của phân vùng không gian đa phân giải là
hàm tỷ lệ Φ (t) sở hữu một thuộc tính tƣơng tự. Nếu Φ (t) và
)(t
đƣợc phân
tích và tổng hợp các hàm tỷ lệ, và Ψ (t) và
)(t
đƣợc phân tích và tổng hợp
Wavelet, sau đó vì V
j


V
j-1
, các hàm này có thể đƣợc định nghĩa đệ quy:

















n
n
n
n
n
n
n
n
ntdt
ntdt
ntct
ntct
)2(2)(
)2(2)(
)2(2)(
)2(2)(

(1.21)
Những hệ thức truy hồi cung cấp cách tính toán các hệ số xấp xỉ của
x(t) ở độ phân giải j, A
j
x (t), và các hệ số của tín hiệu chi tiết D

j
x (t) từ các hệ
số xấp xỉ của x (t) tại một độ phân giải cao A
j-1
x (t). Trong thực tế, thao tác
toán học đơn giản có thể chỉ ra rằng cả hai hệ số xấp xỉ tại một độ phân giải
tốt hơn và hệ số chi tiết có thể đạt đƣợc bằng xoắn (convolving) các hệ số xấp
xỉ tại một độ phân giải thô với một bộ lọc và lấy mẫu xuống bởi hệ số 2. Đối
với một hệ số xấp xỉ độ phân giải thấp, bộ lọc là một bộ lọc thông thấp với
vòi (taps) h
k
=c
-k
, và cho các chi tiết lọc là một bộ lọc thông cao với vòi g
k
=d
-k
.
Ngƣợc lại, tín hiệu ở độ phân giải cao có thể đƣợc phục hồi từ xấp xỉ của nó
với độ phân giải thấp hơn và hệ số chi tiết của tín hiệu tƣơng ứng. Nó có thể
đƣợc thực hiện bởi lấy mẫu lên các hệ số của xấp xỉ với độ phân giải thấp hơn
và các hệ số chi tiết của một hệ số 2, xoắn (convolving) chúng với các bộ lọc

15


Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên

tổng hợp các vòi
kk

ch 

k
k
dg 
tƣơng ứng, và cộng chúng với nhau.
Một bƣớc của quá trình chia tách và nghịch đảo đƣợc thể hiện trong hình 1.8,
mà là trong thực tế, giống nhƣ hình 1.3 cho băng con. Vì vậy, quá trình lọc
chia tách các tín hiệu vào thành các thành phần thông thấp và thông cao và từ
đó làm tăng độ phân giải tần số của hệ số 2, nhƣng lấy mẫu xuống làm giảm
độ phân giải theo thời gian (temporal) do yếu tố tƣơng tự. Do đó, tại mỗi bƣớc
kế tiếp, tần số có độ phân giải tốt hơn ở độ phân giải theo thời gian là đạt đƣợc.

Hình 1.8. Một trong những giai đoạn biến đổi Wavelet
(a) phân tích (b) tổng hợp
1.3.4. Hệ thống biến đổi Wavelet nhiều chiều
Những biến đổi Wavelet đa chiều có thể thu đƣợc bằng cách mở rộng
khái niệm về cấu trúc bộ lọc hai băng hình 1.8 trong mỗi phân đoạn. Ví dụ,
phân tách một hình ảnh hai chiều có thể đƣợc thực hiện bằng cách thực hiện
phân tách một chiều theo hàng và sau đó theo cột.
Một biến đổi Wavelet bảy dải mã hóa của loại này đƣợc minh họa trong
hình 1.9, nơi chia tách dải đƣợc thực hiện luân phiên tại các hƣớng ngang và
dọc. Trong hình, L và H biểu diễn cho các bộ lọc phân tích thông thấp và
thông cao với một lấy mẫu xuống 2:1, tƣơng ứng. Ở giai đoạn đầu tiên của
phân tách nhị tố (dyadic), ba ảnh con (subimages) với nội dung tần số cao
đƣợc tạo ra. Subimage LH
1
thấp chủ yếu theo đƣờng ngang, nhƣng cao theo
đƣờng dọc tần số chi tiết hình ảnh. Đây là đảo ngƣợc trong subimage HL
1

.
Subimage HH
1
cao ngang và cao dọc chi tiết hình ảnh. Những chi tiết hình

16


Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên

ảnh ở một tần số thấp hơn đƣợc đại diện bởi các băng LH
2
, HL
2
và HH
2
tƣơng
ứng. Dải LL
2
là một hình ảnh lấy mẫu con thông thấp, là một bản sao của các
hình ảnh ban đầu, nhƣng ở một kích thƣớc nhỏ hơn.

Hình 1.9. Biến đổi Wavelet nhiều dải mã hóa bằng cách sử dụng lặp đi lặp lại
chia tách hai dải
1.3.5. Thiết kế bộ lọc Wavelet
Nhƣ chúng ta đã thấy trong phần 1.3.3, trong thực tế biến đổi Wavelet
có thể đƣợc thực hiện bởi một dãy các bộ lọc, tƣơng tự nhƣ các băng con.
Quan hệ giữa phân tích và tổng hợp của tỷ lệ và hàm Wavelet cũng làm theo
trong các bộ lọc tổng hợp và phân tích các băng con. Do đó ta có thể sử dụng
các khái niệm về các bộ lọc trong (1.7) để thiết kế bộ lọc Wavelet. Tuy nhiên,

nếu sử dụng bộ lọc sản phẩm nhƣ đã đƣợc sử dụng cho các băng con, ta
không đạt đƣợc bất cứ điều gì mới. Nhƣng, nếu chúng ta thêm một số ràng
buộc về bộ lọc sản phẩm, đó là thuộc tính của biến đổi Wavelet đƣợc duy trì,
sau đó một bộ lọc Wavelet có thể đƣợc thiết kế.

×