Tải bản đầy đủ (.pdf) (88 trang)

Nghiên cứu phân tích xử lý ảnh bằng phương pháp wavelet định hướng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (13.31 MB, 88 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
--------------------------------------MAI THỊ THU

NGHIÊN CỨU PHÂN TÍCH XỬ LÝ ẢNH
BẰNG PHƯƠNG PHÁP WAVELET ĐỊNH HƯỚNG

Chuyên ngành: Kỹ thuật truyền thông

LUẬN VĂN THẠC SĨ KỸ THUẬT
Kỹ thuật truyền thông

NGƯỜI HƯỚNG DẪN KHOA HỌC :
PGS.TS. Nguyễn Hữu Trung

Hà Nội – Năm 2013



Mục lục
Chương 1

Giới thiệu chung ...................................................................................................... 8

1.1 Giới thiệu về nén ảnh ........................................................................................................ 8
1.1.1 Sự cần thiết của công nghệ nén.................................................................................... 8
1.1.2 Nguyên lý nén ảnh ....................................................................................................... 8
1.1.3 Tiêu chuẩn đánh giá chất lượng mã hoá ảnh .............................................................. 11
1.2 Độ phân giải thời gian – tần số và nguyên lý bất định ....................................................12
1.3 Kỹ thuật mã hoá dựa trên phép biến đổi ......................................................................... 13
1.3.1 Phép biến đổi Fourier ................................................................................................. 13


1.3.2 Phép biến đổi Fourier thời gian ngắn .........................................................................14
1.3.3 Đa phân giải và Biến đổi Wavelet ..............................................................................15
1.4 Tổ chức luận văn .............................................................................................................16
Chương 2

Lý thuyết Wavelet .................................................................................................18

2.1 Giới thiệu chung về Wavelet ........................................................................................... 18
2.2 Biến đổi wavelet liên tục................................................................................................. 20
2.3 Biến đổi Wavelet rời rạc (Discrete wavelet transform)...................................................20
2.3.1 Phân tích đa phân giải ................................................................................................ 21
2.3.2 Biến đổi wavelet rời rạc ............................................................................................. 22
2.3.3 Phân tích đa phân giải sử dụng băng lọc .................................................................... 23
2.3.4 Biểu diễn ma trận DWT ............................................................................................. 27
2.4 Chuỗi Wavelet .................................................................................................................30
2.4.1 Tính chất .................................................................................................................... 30
2.4.2 Các tính chất của hàm tỷ lệ ........................................................................................32
2.4.3 Biến đổi chuỗi wavelet của tín hiệu ........................................................................... 32
2.5 Phân loại Wavelet ............................................................................................................ 33

1


2.6 Các họ Wavelet................................................................................................................ 34
2.7 Ứng dụng của Wavelet ....................................................................................................39
2.7.1 Nén tín hiệu................................................................................................................ 39
2.7.2 Khử nhiễu................................................................................................................... 40
2.7.3 Mã hố nguồn và mã hoá kênh ..................................................................................40
2.7.4 Wavelet trong các ứng dụng y sinh ............................................................................ 40
2.7.5 Ứng dụng trong an tồn thơng tin liên lạc .................................................................41

Chương 3

Ứng dụng Wavelet định hướng trong kỹ thuật nén ảnh.........................................42

3.1 Giới thiệu ........................................................................................................................ 42
3.2 Tính chất bất đẳng hướng của ảnh và dư thừa dự đoán .................................................. 43
3.3 Nguyên lý biến đổi định hướng....................................................................................... 44
3.4 Khái niệm lifting ............................................................................................................. 46
3.5 Biến đổi Wavelet trong xử lý nén ảnh .............................................................................52
3.5.1 Việc nén ảnh............................................................................................................... 57
3.5.2 Việc truyền hình ảnh tăng cấp chi tiết dần dần ..........................................................60
3.6 Biến đổi wavelet dựa trên cơ chế lifting ......................................................................... 61
3.7 Biến đổi wavelet ADL..................................................................................................... 62
3.7.1 Nội suy pixel con .......................................................................................................68
3.7.2 So sánh biến đổi wavelet ADL với biến đổi wavelet thẳng ....................................... 70
3.8 Biến đổi Wavelet 2-D dựa trên cơ chế Lifting kết hợp dự đoán định hướng (2D-dirDWT) 72
3.9 Biến đổi Wavelet 1-D dựa trên cơ chế lifting kết hợp dự đốn dư thừa(1D-dir-DWT) ..73
Chương 4

Mơ phỏng và thực nghiệm .................................................................................... 75

4.1 Mơ phỏng theo thuật tốn đề xuất ...................................................................................75
4.2 Nhận xét kết quả mô phỏng đã thu được.........................................................................78
4.3 Một số kết quả nghiên cứu thực nghiệm ......................................................................... 79
4.4 Tổng kết .......................................................................................................................... 82
2


Chương 5


Kết luận và đề xuất hướng nghiên cứu tiếp theo ...................................................83

5.1 Những kết luận chính của luận văn .................................................................................83
5.2 Hướng nghiên cứu tiếp theo ............................................................................................ 83
Các thuật ngữ viết tắt ................................................................................................................... 85
Tài liệu tham khảo .......................................................................................................................86

3


Mục lục hình
Hình 1-1Mơ hình bộ mã hố ảnh....................................................................................................... 9

Hình 2-1: Không gian và các không gian con trong đa phân giải. Khơng gian 󰇛󰇜2 biểu diễn tồn
bộ khơng gian.  biểu diễn một không gian con,  biểu diễn chi tiết.............................. 22

Hình 2-2 Thuật tốn hình chóp hay thuật tốn mã hố băng con ..................................................... 24

Hình 2-3 Băng lọc hai kênh ............................................................................................................. 27
Hình 2-4 Lấy mẫu đơi và tiling thời gian ......................................................................................... 31
Hình 2-5 Sơ đồ phân tích DWT ....................................................................................................... 33
Hình 2-6 Sơ đồ tổng hợp DWT........................................................................................................ 33

Hình 2-7 Hàm  của biến đổi Haar ................................................................................................ 35
Hình 2-8 Hàm 󰇛󰇜 của biến đổi Meyer .......................................................................................... 35
Hình 2-9 Hàm 󰇛󰇜 của họ biến đổi Daubechies  với       ............................................. 36

Hình 2-10 Một vài hàm 󰇛󰇜 của các cặp họ biến đổi Biorthogonal ............................................... 37
Hình 2-11 Hàm 󰇛󰇜 của họ biến đổi Coiflets ................................................................................ 37
Hình 2-12 Một vào hàm 󰇛󰇜 của họ biến đổi Symlets .................................................................. 38


Hình 2-13 Hàm 󰇛󰇜 của biến đổi Morlet ...................................................................................... 38

Hình 2-14 Hàm 󰇛󰇜 của biến đổi Mexican Hat............................................................................. 38
Hình 3-1 Ảnh gốc (có độ phân giải CIF), ảnh MC-residual và ảnh RE-residual ............................. 44

Hình 3-2 Mơ hình biến đổi lifting thuận .......................................................................................... 47
Hình 3-3 Bước dự đốn và Update trong Lifting ............................................................................. 47
Hình 3-4 Tính tốn các hệ số wavelet trong Lifting ........................................................................ 50
Hình 3-5 Rosa Parks (1955) và Nelson Mandela (1990) ................................................................. 53
Hình 3-6 Rosa Parks – Trích dẫn một vùng ảnh nhỏ để nghiên cứu ................................................ 54
Hình 3-7 Việc nén ảnh với các mức ngưỡng khác nhau................................................................... 59
Hình 3-8 Bức ảnh sau khi nén .......................................................................................................... 60
Hình 3-9 Quá trình truyền ảnh Nelson Mandela .............................................................................. 61

4


Hình 3-10 Biến đổi wavelet dựa trên cơ chế lifting ......................................................................... 62
Hình 3-11 Bước dự đốn và update theo góc dọc trong biến đổi ADL ............................................ 64
Hình 3-12 Ảnh gốc (a) và ảnh kết quả sau các băng con LL (b), LH (c), HL (d), HH (e) ............... 66
Hình 3-13 Phân vùng ảnh Barbara và hướng trong mỗi block......................................................... 67
Hình 3-14 So sánh ảnh xử lý theo JPEG2000 và biến đổi ADL 2D 1 mức ..................................... 68
Hình 3-15 So sánh ảnh giải mã ở tốc độ 0.3bpp dùng bộ lọc 5/3 .................................................... 71
Hình 3-16 Đồ thị PSNR của biến đổi wavelet thẳng và wavelet ADL ............................................ 72
Hình 3-17 Các lựa chọn dự đốn hướng .......................................................................................... 73
Hình 4-1 Ảnh gốc ban đầu ............................................................................................................... 75
Hình 4-2 Kết quả sau khi biến đổi Wavelet 1 chiều theo hàng. ....................................................... 76
Hình 4-3 Kết quả sau khi biến đổi Wavelet 2 chiều 1 mức .............................................................. 76
Hình 4-4 Kết quả sau khi biến đổi Wavelet 2 chiều 2 mức .............................................................. 77

Hình 4-5 Ảnh sau khi biến đổi wavelet dựa trên cơ chế lifting 1 mức ............................................ 77
Hình 4-6 Ảnh sau khi biến đổi wavelet dựa trên cơ chế lifting 2 mức ............................................ 78
Hình 4-7 Mức tiết kiệm hệ số của 2D-dir-DWT so với 2D-sep-DWT ............................................ 81
Hình 4-8 Mức tiết kiệm hệ số của 1D-dir-DWT+2D-sep-DWT so với 2D-sep-DWT .................... 81

5


Mục lục bảng
Bảng 1-1 Yêu cầu về không gian lưu trữ của các loại dữ liệu không nén ...................................................... 8
Bảng 3-1 Kết quả 3 bước biến đổi Wavelet tương ứng ................................................................................ 56
Bảng 3-2 Giá trị hệ số trung bình trong băng con LH, HL và HH ............................................................... 69
Bảng 4-1 So sánh kết quả giữa biến đổi DWT-2D và Lifting DWT ............................................................ 78

6


Lời mở đầu
Cuộc sống càng phát triển, nhu cầu thông tin của con người càng phong phú,
dẫn đến sự phát triển mạnh mẽ của khoa học kỹ thuật, các loại hình thơng tin vơ
tuyến, các hình thức xử lý tín hiệu, đặc biệt là công nghệ xử lý ảnh. Vấn đề này đặt
ra yêu cầu ngày càng cao trong việc xử lý tín hiệu để đảm bảo vừa có thể nén dữ
liệu, tiết kiệm dung lượng trên đường truyền tín hiệu, vừa đảm bảo loại trừ nhiễu tín
hiệu và có khả năng khơi phục lại được tín hiệu với chất lượng tốt.
Có rất nhiều phương pháp xử lý tín hiệu với rất nhiều thuật toán, biến đổi toán
học đã được nghiên cứu. Trong số đó, biến đổi Wavelet hiện nay đang được xem là
một phép biến đổi mới, có rất nhiều tiềm năng, đang phát triển khá mạnh mẽ với các
ưu điểm vượt trội so với các phép biến đổi truyền thống. Wavelet cho phép phân
tích tín hiệu cả trong miền thời gian và tần số. Do đó, hiện nay biến đổi Wavelet
đang được ứng dụng khá rộng rãi trong nhiều lĩnh vực, từ y sinh tới công nghệ xử lý

ảnh.
Trong khuôn khổ luận văn này, em xin phép được giới thiệu về Nghiên cứu
phân tích xử lý ảnh bằng phương pháp Wavelet định hướng.
Trong quá trình thực hiện luận văn khơng tránh khỏi những thiếu sót, em rất
mong nhận được nhiều ý kiến đóng góp của các thầy cơ giáo, các anh chị và các bạn
để luận văn được hoàn thiện hơn.
Qua lời mở đầu, em xin được gửi lời trân trọng cảm ơn PGS.TS. Nguyễn Hữu
Trung và TS. Nguyễn Thuý Anh đã tận tình giúp đỡ, hướng dẫn và tạo điều kiện cho
em hoàn thành tốt luận văn này.
Em xin chân thành cảm ơn!

7


Chương 1 Giới thiệu chung

Chương 1

Giới thiệu chung

1.1 Giới thiệu về nén ảnh
1.1.1 Sự cần thiết của công nghệ nén
Ngày nay, các ứng dụng truyền Video/Hình ảnh trên mơi trường Internet hay
Truyền hình đang trở nên rất phổ biến. Tuy nhiên, dữ liệu Video/Hình ảnh khơng
nén là rất lớn. Chúng ta có thể tham khảo một vài ví dụ về kích thước dữ liệu khơng
nén:
Dữ liệu Multi-

Kích thước/


Bits/pixel

Kích thước

Media

Khoảng

Bits/sample

khơng nén

Văn bản

11”x8.5”

Có độ phân giải 16-32 kbits
khác nhau

Tín hiệu thoại

1s

8 bps

64kbit

Ảnh xám

512x512


8 bpp

2mbits

Ảnh màu

512x512

24 bpp

6.26 mbits

24 bpp

2.21 gbits

Video đủ hoạt động 640x480.10s
(full motion)

Bảng 1-1 Yêu cầu về không gian lưu trữ của các loại dữ liệu khơng nén
Ví dụ nêu trên cho thấy ảnh số, dữ liệu audio và video đều cầu một không gian
lưu trữ lớn. Để giải quyết vấn đề này, người ta tiến hành nén các dự liệu này trước
khi lưu trữ hoặc truyền đi. Quá trình giải nén sẽ được thực hiện khi người dung
muốn sử dụng dữ liệu. Với tỷ lệ nén 16:1, không gian lưu trữ yêu cầu giảm 16 lần
so với dung lượng yêu cầu.
1.1.2 Ngun lý nén ảnh
Hình ảnh mang một lượng thơng tin rất lớn và do đó, u cầu về khơng gian lưu
trữ và băng thông truyền lớn. Việc thực hiện lưu trữ và truyền hình ảnh với kích
thước gốc như vậy rất tốn kém. Trong khi đó, một tính chất chung nhất của tất cả

8


Chương 1 Giới thiệu chung

các ảnh số đó là tương quan giữa các pixel ở cạnh nhau lớn, điều này dẫn đến dư
thừa thông tin để biểu diễn ảnh. Dư thừa thơng tin sẽ làm cho việc mã hố khơng tối
ưu. Do đó cơng việc cần làm để nén ảnh là phải tìm được các biểu diễn ảnh với
tương quan nhỏ nhất để giảm thiểu độ dư thừa thông tin của ảnh. Thực tế, có hai
kiểu dư thừa thơng tin được phân loại như sau:
- Dư thừa trong miền không gian: tương quan giữa các giá trị pixel của ảnh,
điều này có nghĩa rằng các pixel lân cận của ảnh có giá trị gần giống nhau
(trừ những pixel ở giáp đường biên ảnh).
- Dư thừa trong miền tần số: Tương quan giữa các mặt phẳng màu hoặc dải
phổ khác nhau.
Trọng tâm của các nghiên cứu về nén ảnh là tìm cách giảm số bit cần để biểu
diễn ảnh bằng việc loại bỏ dư thừa trong miền không gian và miền tần số càng
nhiều càng tốt mà vẫn đảm bảo khôi phục thông tin trong ảnh.
Tỷ số nén là tham số quan trọng đánh giá khả năng nén của hệ thống, cơng thức
được tính như sau:
Tỉ số nén = Kích thước dữ liệu gốc/Kích thước dữ liệu nén
Đối với ảnh tĩnh, kích thước chính là số bít để biểu diễn tồn bộ bức ảnh. Đối
với ảnh video, kích thước chính là số bít để biểu diễn một khung hình video (video
frame).
 Bộ mã hố đặc trưng

Hình 1-1Mơ hình bộ mã hố ảnh
9



Chương 1 Giới thiệu chung

Hình trên là một hệ thống nén ảnh có tổn hao đặc trưng, gồm: (a) Mã hố nguồn
hay Biến đổi tuyến tính, (b) Lượng tử hố và (c) Mã hoá entropy
Lượng tử hoá đơn giản giảm bớt các giá trị đầu vào sai khác. Có ba phương
pháp lượng tử hố:
-

Lượng tử hóa vơ hướng giống nhau (Uniform Scalar Quantization): Phân
chia vùng dữ liệu vào thành các khoảng đều nhau, ngoại trừ biên. Giá trị
của dữ liệu đầu ra được lấy tại điểm giữa của mỗi khoảng. Hai loại
Uniform Scalar Quantization là: midrise quantizer (có một số lẻ các mức
ra) và midtreat quantizer (có một số chẵn các mức ra).

-

Lượng tử hóa vơ hướng khác nhau (Nonuniform Scalar Quantization):
Phân chia vùng dữ liệu vào thành các khoảng khơng đều nhau. Các
khoảng cách có thể được lựa chọn để tối ưu hóa SNR cho một kiểu cụ thể
của tín hiệu. Một trong số các phương pháp lượng tử hóa của
Nonuniform Quantization là Companded quantizer

-

Vector Quantization (VQ): Lượng tử hố thực hiện trên một nhóm hệ số
đồng thời.

Bộ mã hố Entropy thực hiện nén có tổn hao, sẽ đạt được hiệu quả nén cao hơn.
Bộ mã hố entropy thơng dụng nhất là mã hoá Huffman và mã hoá Arithmetic. Tuy
nhiên, đối với các ứng dụng yêu cầu xử lý nhanh, mã hoá loạt dài (Run length

Encoding -RLE) đơn giản lại đạt hiệu quả tốt hơn.
Kỹ thuật mã hoá/nén ảnh có thể chia thành hai loại:
 Mã hố dự đốn
Đối với mã hoá dự đoán (predictive coding) các giá trị mang thơng tin đã được
gửi hay đang sẵn có sẽ được sử dụng để dự đoán các giá trị khác và chỉ mã hoá sự
sai lệch giữa chúng. Phương pháp này đơn giản và rất phù hợp với việc khai thác
các đặc tính cục bộ của bức ảnh.
Kỹ thuật DPCM chính là một ví dụ điển hình của phương pháp này.
10


Chương 1 Giới thiệu chung

Tuy nhiên, sai lệch giữa ảnh gốc và ảnh dự đốn vẫn có ý nghĩa (cịn sử dụng ở
bước tiếp theo) sau khi lượng tử hoá. Chính điều này làm cho phương pháp mã hố
dự đốn có nhiều dữ liệu được truyền đi hơn so với các phương pháp khác.
 Mã hoá dựa trên phép biến đổi
Mã hoá dựa trên phép biến đổi (transform based coding) thực hiện như sau:
Trước tiên thực hiện phép biến đổi với ảnh để chuyển sự biểu diễn ảnh từ miền
không gian sang một miền biểu diễn khác. Các phép biến đổi thường dùng là: DCT
- biến đổi Cosine rời rạc, DWT - biến đổi Wavelet rời rạc, LT - biến đổi trồng
(lapped). Sau đó, thực hiện mã hố đối với các hệ sộ biến đổi.
Phương pháp này có hiệu suất nén cao hơn rất nhiều so với phương pháp nén dự
đốn bởi vì chính các phép biến đổi (sử dụng các thuộc tính nén năng lượng của
mình) đã gói gọn toàn bộ năng lượng bức ảnh chỉ bằng một số ít các hệ số, số lớn
các hệ số còn lại ít có ý nghĩa hơn sẽ bị loại bỏ sau khi lượng tử hoá và như vậy
lượng dữ liệu phải truyền nhỏ đi rất nhiều.
 Mã hoá băng con
Bản chất của kỹ thuật mã hoá băng con (subband coding) là chia băng tần của tín
hiệu (ảnh) thành nhiều băng con (subband). Để mã hoá cho mỗi băng con, chúng ta

sử dụng một bộ mã hố và một tốc độ bít tương ứng với tính chất thống kê của băng
con.
1.1.3 Tiêu chuẩn đánh giá chất lượng mã hoá ảnh
Để đánh giá chất lượng ảnh ở đầu ra bộ mã hoá, người ta thường sử dụng hai
tham số: Sai số bình phương trung bình – MSE (Mean Square Error) và tỷ số tín
hiệu trên nhiễu đỉnh – PSNR (Peak to Signal to Noise Ratio).
 MSE (Mean Square Error)

MSE thường được gọi là phương sai lượng tử -  (Quantization Error

Variance). MSE giữa ảnh gốc và ảnh khơi phục được tính như sau:
11


Chương 1 Giới thiệu chung

       󰇛 󰇟 󰇠   󰇟  󰇠󰇜


(1.1)

Trong đó: Tổng lấy theo j và k tính là tổng tất cả các điểm ảnh trong ảnh và N là
số điểm ảnh.
 PSNR (Peak to Signal to Noise Ratio)

Cơng thức tính 󰇟 󰇠 giữa hai ảnh như sau:
  





Trong đó b là bít cho mỗi điểm ảnh, RMSE là căn bậc 2 của 

(1.2)

Thơng thường, nếu    thì mắt người gần như không phân biệt được

ảnh gốc và ảnh khôi phục.

Một tham số khác hay sử dụng trong các hệ thống viễn thong là tỷ số tín hiệu

trên nhiễu -  , tuy vậy  sử dụng cho một hệ thống né ảnh cũng có cơng thức
dB như sau:

  

 


(1.3)

1.2 Độ phân giải thời gian – tần số và nguyên lý bất định
Độ phân giải của tín hiệu có chiều dài hữu hạn là số mẫu tối thiểu cần có để
biểu diễn tín hiệu đó. Như vậy, độ phân giải của tín hiệu liên quan đến nội dung
thơng tin của tín hiệu. Với tín hiệu có chiều dài vơ hạn có năng lượng hữu hạn và
suy giảm ở vô cùng, ta định nghĩa chiều dài của tín hiệu là khoảng chứa hầu hết
thơng tin của tín hiệu (ví dụ chứa 90% năng lượng tín hiệu)
Ở tín hiệu liên tục, việc thay đổi tỷ lệ không làm thay đổi độ phân giải vì nó ảnh
hưởng đồng thời cả tốc độ lấy mẫu và chiều dài tín hiệu nên số mẫu để biểu diễn tín
hiệu là hằng số. Ở tín hiệu rời rạc, lấy mẫu lên và nội suy khơng ảnh hưởng độ phân


giải vì các mẫu nội suy dư. Lấy mẫu xuống bởi  làm độ phân giải giảm đi lần và
không thể khôi phục được.

12


Chương 1 Giới thiệu chung

Khi nhận tỷ lệ sẽ làm thay đổi độ nét theo thời gian hoặc theo tần số, tức là chỉ
đáp ứng một trong hai yêu cầu trên. Độ nét được gọi là độ phân giải trong thời gian
– tần số.

Năng lượng của tín hiệu được định nghĩa như sau:  󰇛󰇜  


(1.4)

Tín hiệu f(t) được gọi là tín hiệu có tâm năng lượng tại a nếu
 󰇛  󰇜󰇛  󰇜   


(1.5)

Xét một tín hiệu có năng lượng bằng 1 và có tâm năng lượng tại gốc toạ độ f(t)
với biến đổi Fourier F(w) thoả mãn:

   󰇛󰇜    và   󰇛󰇜   

(1.6)


Độ rộng thời gian  của f(t):      󰇛󰇜 


Độ rộng tần số  :       󰇛󰇜  


Định nghĩa về nguyên lý bất định: Nếu 󰇛󰇜 triệt tiêu nhanh hơn

thì   




(1.7)
(1.8)





khi  

Dấu “=” xảy ra khi  󰇛󰇜      gọi là tín hiệu Gauss.




Ngun lý bất định có vai trị quan trọng vì nó đặt ra chặn trên cho độ nét tối đa
cho cả thời gian và tần số. Như vậy, việc nhân tỷ lệ không làm thay đổi tích độ rộng

thời gian và tần số.
1.3 Kỹ thuật mã hoá dựa trên phép biến đổi
1.3.1 Phép biến đổi Fourier
Phép biến đổi Fourier được thực hiện dựa trên cơ sở phân tích một tín hiệu

thành tổng của các hàm sin với các tần số khác nhau         
   Nói cách khác, phép biến đổi Fourier (FT) là kỹ thuật biến đổi tín hiệu từ
13


Chương 1 Giới thiệu chung

miền thời gian sang miền tần số. Với nhiều tín hiệu, phân tích Fourier rất có ích vì
nội dung tần số của tín hiệu là rất quan trọng.
Biến đổi Fourier của tín hiệu x(t) và biến đổi Fourier ngược của nó được xác
định bởi biểu thức sau:

󰇛󰇜    󰇛󰇜  


(1.9)

 󰇛 󰇜    󰇛󰇜  


(1.10)

Trong đó x(t) và X(f) được gọi là cặp biến đổi Fourier.
Mặc dù có nhiều hiệu quả (như là phân tích các tín hiệu tuần hồn, thuận lợi cho
các phép chập tín hiệu) nhưng phép biến đổi Fourier có hạn chế. Khi biến đổi sang

miền tần số, thông tin thời gian đã bị mất. Đối với tín hiệu tĩnh (thuộc tính tín hiệu
khơng thay đổi nhiều theo thời gian) thì nhược điểm trên khơng có ảnh hưởng quan
trọng. Tuy nhiên, các tín hiệu thường gặp trong thực tế thường là tín hiệu khơng
dừng (ví dụ tín hiệu nhạc, tín hiệu nhiễu, …) chứa các thơng số động: trôi, nghiêng,
biến đổi đột ngột, khởi đầu và kết thúc của các sự kiện. Khi đó, phép biến đổi
Fourier hồn tồn khơng mang lại các thơng tin hữu ích.
1.3.2 Phép biến đổi Fourier thời gian ngắn
Để khắc phục những hạn chế của biến đổi FT, phép biến đổi FT thời gian ngắn
STFT (Short Term Fourier Transform) ra đời. Điểm khác biệt nhỏ giữa STFT và FT
là: trong biến đổi STFT, tín hiệu được chia thành các khoảng nhỏ và trong khoảng

đó, tín hiệu được giả định là tín hiệu ổn định. Bằng cách chọn một hàm cửa sổ  có
độ dài của cửa sổ đúng bằng khoảng tín hiệu đã phân chia, ta có thể thu được đáp
ứng tần số - thời gian của tín hiệu một cách đồng thời mà phép biến đổi FT không
thực hiện được.
Tuy nhiên, biến đổi STFT hạn chế ở sự chính xác của độ phân giải thời gian và
tần số bị giới hạn bởi nguyên lý bất định Heisenberg. Các phương trình cơ bản
khơng thể đưa ra biểu diễn thời gian-tần số chính xác của tín hiệu, ví dụ khơng thể
14


Chương 1 Giới thiệu chung

biết được các thành phần phổ tồn tại ở khoảng thời gian nào, và không thể biết chắc
chắn khoảng thời nào trong đó dải tần số chắc chắn tồn tại.
Do vậy, vấn đề là chọn hàm cửa sổ và sử dụng cửa sổ này cho toàn bộ phân tích,
tuy nhiên việc lựa chọn hàm cửa sổ phụ thuộc ứng dụng. Nếu như các thành phần
tần số tách biệt với nhau trong tín hiệu ngun bản, thì chúng ta có thể hy sinh độ
phân giải tần số và do vậy có độ phân giải thời gian tốt. Tuy nhiên, trong trường hợp
các thành phần phổ không tách biệt với nhau thì việc lựa chọn cửa sổ phù hợp là

khó khăn.
1.3.3 Đa phân giải và Biến đổi Wavelet
Trên cơ sở cách tiếp cận biến đổi STFT và những hạn chế của biến đổi STFT,
biến đổi Wavelet được phát triển và có được những ưu điểm hơn so với biến đổi
STFT và Fourier.
Sự dịch chuyển thời gian – tần số là tuyến tính trong STFT, cịn trong biến đổi

Wavelets có sự thay đổi thang độ/dịch thời gian tuyến tính của hàm 󰇛󰇜 Độ phân
giải thời gian và tần số trong STFT độc lập với tần số phân tích, cịn trong biến đổi
Wavelets độ phân giải thời gian tỷ lệ thuận với tần số phân tích, độ phân giải tần số
tỷ lệ nghịch với tần số phân tích.

Hàm cửa sổ 󰇛󰇜 của STFT là một hàm thơng thấp cịn hàm Wavelet mẹ 󰇛󰇜

là một hàm thông dải.

Biến đổi wavelets cho phép làm nổi bật tính cục bộ của tín hiệu. Trong
khi, biến đổi Fourier chỉ có thể nhận biết tính đều đặn tồn cục của tín hiệu hoặc
chỉ nhận biết tính đều đặn trong cửa sổ nào đó (trong trường hợp phép biến đổi
Fourier được cục bộ hóa). Ngược lại, phép biến đổi Wavelet sẽ cách ly điểm gián
đoạn này ra khỏi phần cịn lại của tín hiệu và đáp ứng của biến đổi Wavelet
tại lân cận điểm gián đoạn sẽ làm nổi bật điểm này

15


Chương 1 Giới thiệu chung

Sức mạng của biến đổi Wavelets nằm ở việc sử dụng đa phân giải
(Multiresolution) nghĩa là phân tích tín hiệu ở các tần số khác nhau và cho các độ

phân giải khác nhau.
Khi phân tích tín hiệu cho phép phân giải thời gian tốt và phân giải tần số kém ở
các tần số cao; phân giải tần số tốt và phân giải thời gian kém ở các tần số thấp.
Như vậy, biến đổi này rất thích hợp với những tín hiệu: có các thành phần tần số cao
xuất hiện trong khoảng thời gian ngắn, các thành phần tần số thấp xuất hiện trong
khoảng thời gian dài chẳng hạn như ảnh, khung ảnh video hay các tín hiệu điện não
đồ EEG (electroencephalogram), điện cơ đồ EMG (electromyogram), và điện tâm
đồ ECG (electrocardiogram).
Cơ sở toán học cũng như các tính chất của biến đổi Wavelet liên tục sẽ được
trình bầy chi tiết trong chương 2.
1.4 Tổ chức luận văn
Mục tiêu của luận văn là nghiên cứu về lý thuyết Wavelet, đưa ra các đặc điểm
chi tiết của Wavelet và ứng dụng của Wavelet, nhấn mạnh ứng dụng của Wavelet
định hướng trong xử lý ảnh.
Cụ thể, bài toán đặt ra là Sử dụng biến đổi Wavelet thông thường và biến đổi
Wavelet định hướng đối với ảnh tùy ý đầu vào để đánh giá hiệu quả xử lý ảnh của
biến đổi Wavelet, đặc biệt là Wavelet định hướng.
Dựa trên những yêu cầu đặt ra với đề tài Nghiên cứu phân tích xử lý ảnh bằng
phương pháp Wavelet định hướng, luận văn của em được cấu trúc như sau:
Chương 1: Giới thiệu chung
Giới thiệu chung một số khái niệm trong luận văn, trình bày mục đích, nội dung
và những u cầu đặt ra trong luận văn.

16


Chương 1 Giới thiệu chung

Chương 2: Lý thuyết Wavelet
Trình bày cơ sở của lý thuyết Wavelet, những đặc điểm quan trọng của các dạng

Wavelet khác nhau và ứng dụng của Wavelet.
Chương 3: Ứng dụng Wavelet định hướng trong xử lý ảnh
Chương ba trình bày kỹ thuật xử lý ảnh sử dụng biến đổi Wavelet nói chung và
đặc biệt đi sâu nghiên cứu, phân tích biến đổi Wavelet định hướng.
Chương 4: Mơ phỏng và kết luận
Chương bốn giới thiệu chương trình mô phỏng ứng dụng Wavelet và Wavelet
định hướng trong xử lý ảnh được viết bằng Matlab, đưa ra các kết quả mơ phỏng và
phân tích các kết quả thu được.

17


Chương 2 Lý thuyết Wavelet

Chương 2

Lý thuyết Wavelet

Wavelet là công c ụ toán h ọc để phân chia d ữ liệ u thành nh ữ ng thành
phầ n t ầ n s ố kh ác nhau, sau đó nghiên cứ u m ỗ i thành ph ần đó với độ phân
giải tương ứ ng v ớ i thang t ỷ l ệ c ủ a thành ph ầ n ph ổ đó.
Chương hai trình bày về s ự hình thành c ủ a bi ến đổ i Wavelet, các tính
chấ t và các khía c ạ nh k ỹ thu ậ t c ủ a bi ến đổ i Wavelet và giớ i thi ệ u m ộ t s ố
ứ ng d ụ ng c ủ a bi ế n đ ổ i Wavelet.
2.1 Giới thiệu chung về Wavelet
Ý tưởng cơ bản của Wavelet là phân tích theo tỷ lệ. Các hàm Wavelet thoả mãn
các yêu cầu về mặt toán học được sử dụng để biểu diễn dữ liệu hay các hàm khác.Ý
tưởng về phép xấp xỉ sử dụng các hàm xếp chồng đã tồn tại từ đầu thế kỉ 18 khi
Joseph Fourier phát hiện ra có thể xếp chồng các hàm sin và cosin với nhau để biểu
diễn một hàm khác.

Tuy nhiên, trong phân tích Wavelet, tỷ lệ được sử dụng để phân tích dữ liệu theo
một cách đặc biệt. Các thuật toán Wavelet xử lý dữ liệu theo các tỷ lệ khác nhau
hoặc các độ phân giải khác nhau. Khi quan sát tín hiệu với một cửa sổ lớn, chúng ta
sẽ nhận được các đặc điểm chung. Tương tự, nếu chúng ta quan sát dữ liệu với một
cửa sổ nhỏ hơn, chúng ta sẽ nhận ra những đặc điểm chi tiết hơn.
Quy trình phân tích wavelet là chọn một hàm Wavelet nguyên mẫu, được gọi là
Wavelet phân tích (analyzing wavelet) hay Wavelet mẹ (mother wavelet). Phân tích
thời gian được thực hiện với dạng (version) co lại, tần số cao của Wavelet mẹ, trong
khi phân tích tần số được thực hiện với dạng giãn ra, tần số thấp của cùng Wavelet
mẹ.
Vì tín hiệu ngun bản hay hàm có thể được biểu diễn dưới dạng một khai triển
Wavelet (sử dụng các hệ số trong tổ hợp tuyến tính của các hàm Wavelet), các tính
tốn dữ liệu có thể được thực hiện sử dụng các hệ số Wavelet tương ứng. Và nếu
18


Chương 2 Lý thuyết Wavelet

như chọn được Wavelet phù hợp với dữ liệu, hay bỏ bớt các hệ số dưới một ngưỡng
nào đó, chúng ta thu được dữ liệu được biểu diễn rời rạc. Mã hoá rời rạc (sparse
coding) làm cho Wavelet trở thành một công cụ tuyệt vời trong lĩnh vực nén dữ liệu.
Các lĩnh vực ứng dụng khác sử dụng Wavelet bao gồm thiên văn học, âm học,
kỹ thuật hạt nhân, mã hố băng con, xử lý tín hiệu và xử lý ảnh, bệnh học thần kinh,
âm nhạc, ảnh cộng hưởng từ (magnetic resonance imaging), quang học, fractals,
turbulence, dự báo động đất, radar, và các ứng dụng thuần t tốn học như giải
phương trình vi phân từng phần (partial differential equation).
 Khái niệm
Wavelet là một họ các hàm số có tính chất địa phương hố theo thời gian và

không gian. Ta thu được chúng từ một hàm đơn 󰇛󰇜 gọi là hàm Wavelet mẹ, bằng

các phép tịnh tiến và co giãn. Hàm Wavelet phải thoả mãn các điều kiện sau:
  󰇛󰇜  

(2.1)

  

(2.3)



   󰇛 󰇜   


  󰇛󰇜 


(2.2)

 thoả mãn     

Với  là biến đổi Fourier của : 󰇛 󰇜   󰇛 󰇜  


Với một hàm Wavelet mẹ cho trước,  󰇛   󰇜 , ta xây dựng được họ các

Wavelet bằng phép tịnh tiến và co giãn từ 󰇛󰇜 như sau:

 󰇛󰇜    󰇛






󰇜

(2.4)

Ví dụ, một số hàm wavelet mẹ thường dung:
Hàm nón Mexico:


󰇛󰇜 󰇛

󰇜




 󰇜  󰇛          

19

(2.5)


Chương 2 Lý thuyết Wavelet

Hàm Haar:
󰇛󰇜 󰇛




   
󰇜        
 󰉵

(2.6)

2.2 Biến đổi wavelet liên tục
Wavelet mẹ:

 󰇛󰇜    󰇛



󰇜


(2.7)

a: thông số dịch chuyển; b: thông số tỷ lệ

   󰇛  󰇜 và chuẩn 󰇼  󰇛󰇜󰇼  󰇛󰇜

:


yếu tố bình thường hố đảm bảo cho các wavelet có cùng mức năng lượng


Cho hàm wavelet mẹ 󰇛󰇜 có giá trị thực, một hàm bất kỳ 󰇛󰇜   󰇛󰇜:
Cơng thức phân tích: 󰇛󰇜     󰇟 󰇠  󰇛󰇜

Công thức tổng hợp: 󰇟 󰇠   󰇛 󰇜 󰇛󰇜    󰇛 󰇜 󰇛 󰇜; 󰇟 󰇠


được gọi là các hệ số khai triển chuỗi wavelet

2.3 Biến đổi Wavelet rời rạc (Discrete wavelet transform)

Vì những hàm Wavelet  󰇛 󰇜 được định nghĩa đối với mọi điểm trong không

gian (a, b) nên rõ ràng việc áp dụng những cơ sở Wavelet  󰇛 󰇜 rất dư thừa. Do
vậy, để giảm bớt sự dư thừa đó biến đổi Wavelet rời rạc (DWT) được giới thiệu.
Biến đổi DWT dựa trên cơ sở mã hố băng con, có thể được thực hiện dễ dàng,
giảm thời gian tính tốn và tài nguyên yêu cầu.
Cơ sở của DWT được xây dựng từ năm 1976, khi các kỹ thuật phân tích tín hiệu
rời rạc được phát triển. Các nghiên cứu về DWT cũng được thực hiện trong lĩnh vực
mã hóa tín hiệu tiếng nói cịn được gọi là mã hố băng con (sub-band coding). Năm
1983, các kỹ thuật tương tự kỹ thuật mã hoá băng con được phát triển được gọi là

20


Chương 2 Lý thuyết Wavelet

mã hố hình chóp (pyramidal coding) và dẫn đến sơ đồ phân tích đa phân giải
(MRA) [3].
Trong biến đổi Wavelet liên tục, tín hiệu được phân tích sử dụng một tập hợp
hàm cơ sở liên quan với nhau bởi hệ số tỷ lệ (a) và hệ số tịnh tiến (b). Trong biến

đổi Wavelet rời rạc, biểu diễn thời gian – tỷ lệ của tín hiệu số thu được nhờ sử dụng
các kỹ thuật lọc số. Tín hiệu được phân tích qua các bộ lọc với tần số cắt khác nhau
ở các tỷ lệ khác nhau.
2.3.1 Phân tích đa phân giải
 Định nghĩa:
Một tín hiệu sẽ chia thành các thành phần xấp xỉ thô và thành phần chi tiết.
Trong đó, khơng gian con thơ và khơng gian con chi tiết là trực giao với nhau. Nói
cách khác, tín hiệu chi tiết là hiệu của phiên bản thơ và phiên bản tinh của tín hiệu.
Bằng cách áp dụng một cách đệ quy các dãy xấp xỉ, chúng ta sẽ thấy khơng gian các

tín hiệu đầu vào   󰇛󰇜 có thể được sinh ra bởi các khong gian của dãp xấp xỉ tại tất
cả các độ phân giải. Khi độ phân giải chi tiết thiến đến vô cùng thì sai số xấp xỉ tiến
đến 0.
Độ phân giải được đưa ra bởi Mallat và Meyer, nó khơng chỉ là cơ sở cho
Wavelet mà cịn là cơng vụ tốn học rất mạnh để liên kết Wavelet và phân tích băng
con tín hiệu.
Định nghĩa: Một phân tích đa phân giải bao gồm một chuỗi của khối các khơng
gian con đóng

Sao cho:
-

          

Đầy đủ hợp: 
    󰇛󰇜
Đầy đủ giao:    󰇝 󰇞

Bất biến tỷ lệ: 󰇛󰇜    󰇛 󰇜  


Bất biến dịch: 󰇛󰇜     󰇛  󰇜      
21


Chương 2 Lý thuyết Wavelet

-

Tồn tại    sao cho 󰇝󰇛  󰇜  󰇞 là một cơ sở trực chuẩn  .

Hình 2-1: Khơng gian và các khơng gian con trong đa phân giải. Không gian  󰇛󰇜2
biểu diễn tồn bộ khơng gian.  biểu diễn một khơng gian con,  chi tiết
2.3.2 Biến đổi wavelet rời rạc

Một đặc điểm nổi bật của khai triển wavelet là dựa trên nền tảng cấu trúc đa
phân giải để đưa ra một giải thuật rời rạc thời gian hiệu quả, bẳng cách thực hiện
một dải lọc, giải thuật này được đưa ra bởi Mallat và được gọi là giải thuật Mallat.

Chọn các giá trị cố định:   
và     ,       

󰇛   󰇜    󰇛 󰇜  󰇛 󰇜   
  󰇛󰇜 󰇛 
    󰇜

(2.8)



 󰇛󰇜  

   󰇛󰇜 󰇛 󰇜    󰇛󰇜  󰇛󰇜

(2.9)





Sử dụng phân tích đa phân giải x(t) được phân tách thành nhiền mức khác nhau:
 󰇛󰇜 : wavelet rời rạc dung phân tích
 󰇛󰇜: hàm tỷ lệ rời rạc

 󰇛󰇜: tín hiệu chi tiết (hệ số wavelet) tại mức 
󰇛 󰇜: tín hiệu xấp xỉ (hệ số tỷ lệ) tại mức 





Cơ sở wavelet rời rạc gồm hai hàm cơ bản:
Trường hợp cơ sở trực chuẩn:
-

Cơ sở phân tích tín hiệu trùng với cơ sở tổng hợp tín hiệu
22


Chương 2 Lý thuyết Wavelet

-


Cơ sở gồm hai hàm cơ bản: 󰇟󰇠 và  󰇟󰇠

Trường hợp cặp cơ sở trực giao:
-

Cơ sở phân tích tín hiệu khác với cơ sở tổng hợp tín hiệu

Cơ sở phân tích tín hiệu gồm hai hàm cơ bản:  󰇟󰇠 và  󰇟󰇠

Cơ sở tổng hợp tín hiệu gồm hai hàm cơ bản:  󰇟󰇠 và  󰇟󰇠

Dãy bộ lọc hai kênh: Hai hàm cơ sở của wavelet rời rạc chính là những hệ số
của hai bộ lọc thông thấp và thông cao
󰇟 󰇠 

󰇟  󰇠 






 󰇛 󰇜  󰇛   󰇜



  󰇛 󰇜  󰇛   󰇜  󰇛󰇜󰇛  󰇜

(2.10)

(2.11)

2.3.3 Phân tích đa phân giải sử dụng băng lọc
Trong lĩnh vực xử lý tín hiệu các bộ lọc được sử dụng phổ biến. Wavelet có thể
được thực hiện bởi các bộ lọc lặp đi lặp lại với tỷ lệ thay đổi. Độ phân giải của tín
hiệu là tiêu chuẩn để đánh giá lượng thông tin chi tiết trong tín hiệu. Độ phân giải
của tín hiệu được xác định bởi các quá trình lọc, và tỷ lệ được xác định bởi sự phân
chia (upsampling) và nội suy (downsampling) cịn gọi là q trình lấy mẫu con
(subsampling).
Biến đổi Wavelet rời rạc được tính tốn bởi q trình lọc thơng thấp và thơng
cao liên tiếp của tín hiệu rời rạc theo thời gian, được gọi là thuật toán Mallat hay sự
phân tích cây Mallat (Mallat-tree decomposition). Ý nghĩa quan trọng của thuật
toán Mallat là thuật toán này đã kết nối sự đa phân giải liên tục theo thời gian với
các bộ lọc rời rạc.
Thuật tốn DWT:

Khởi đầu: Chiếu tín hiệu lên , với j được xác định bởi tần số lấy mẫu.

Trong thực tế, thực hiện thay thế các hệ số tỷ lệ với các giá trị mẫu.

23


×