Tải bản đầy đủ (.ppt) (29 trang)

TIỂU LUẬN MÔN: XỬ LÝ SỐ TÍN HIỆU - PHƯƠNG PHÁP PHÂN TÍCH ẢNH BẰNG WAVELET potx

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.28 MB, 29 trang )

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
KHOA QUỐC TẾ VÀ ĐÀO TẠO SAU ĐẠI HỌC
********** @ **********
TIỂU LUẬN MÔN: XỬ LÝ SỐ TÍN HIỆU
PHƯƠNG PHÁP
PHÂN TÍCH ẢNH BẰNG WAVELET
GVHD: TS NGUYỄN NGỌC MINH
NHÓM HỌC VIÊN:
NỘI DUNG

TỔNG QUAN KỸ THUẬT NÉN ẢNH

Giới thiệu chung về nén ảnh số.

Các kỹ thuật nén có tổn hao.

CƠ SỞ LÝ THUYẾT BIẾN ĐỔI WAVELET

Các phép biến đổi Wavelet.

Tính chất của biến đổi Wavelet.

NÉN ẢNH BẰNG WAVELET

Sơ đồ khối tổng quát.

Biến đổi Wavelet.

Tính toán năng lượng tiêu hao.

Thuật toán nén ảnh bằng Wavelet hiệu năng EEW.



CHUẨN NÉN ẢNH TĨNH DỰA TRÊN BIẾN ĐỔI WAVELET-
JPEG2000

Các bước thực hiện nén ảnh theo chuẩn JPEG2000.
TỔNG QUAN KỸ THUẬT NÉN ẢNH
1.1 Giới thiệu chung về nén ảnh số

Khái niệm nén ảnh số

Mục đích nén ảnh số

Các kỹ thuật nén ảnh số

Tóm tắt quá trình nén và giải nén ảnh số
QUÁ TRÌNH GIẢI NÉN
Dữ liệu gốc
Dữ liệu sau nén
QUÁ TRÌNH NÉN
{
}

- Phía phát: Dùng bộ mã hóa (Encoder) phân ly ảnh thành các băng con, lấy mẫu xuống theo
hệ số 2.
- Phía thu: Dùng bộ giải mã (Decoder),lấy mẫu lên hệ số 2 sau đó tổng hợp các băng con.
- Một trong các phương pháp mã hoá băng con đó là áp dụng sự phân ly cây bát phân để
phân ly dữ liệu ảnh thành các băng tần khác nhau.
TỔNG QUAN KỸ THUẬT NÉN ẢNH
1.2 Các kỹ thuật nén có tổn hao


Kỹ thuật mã hóa băng con (Subband coding)
+ Phép biến đổi cosine rời rạc – DCT : Biến đổi thông tin ảnh từ miền không gian sang miền
tần số để có thể biểu diễn dưới dạng gọn hơn.
-
Biến đổi Fourier – FT:
Biến đổi Fourier – FT (Fourier Transform) là một phép biến đổi thuận nghịch, nó cho phép sự
chuyển đổi thuận – nghịch giữa thông tin gốc (miền không gian hoặc thời gian)

( ) ( )
2 j ft
X f x t e dt
π


−∞
=

( ) ( )
2 j ft
x t X f e df
π


−∞
=

Hạn chế: Thông tin về thời gian xuất hiện của phổ trong tín hiệu là cần thiết, thì phép biến đổi
FT không có khả năng đáp ứng được yêu cầu này
TỔNG QUAN KỸ THUẬT NÉN ẢNH
1.2 Các kỹ thuật nén có tổn hao


Kỹ thuật mã hóa dựa trên phép biến đổi
- Nén và giải nén ảnh dựa theo phép biến đổi DCT trong JPEG
JPEG là chuẩn nén số quốc tế đầu tiên cho các ảnh tĩnh có tông màu liên tục gồm cả ảnh đơn sắc
và ảnh màu. Trong kỹ thuật này các khối ảnh kích thước 8x8 được áp dụng để thực hiện DCT,
sau đó lượng tử hoá các hệ số rồi mã hoá entropy sau lượng tử. Đối với những ảnh màu RGB, để
áp dụng kỹ thuật nén này, trước hết phải chuyển sang chế độ màu YUV (Y là thành phần chói, U
và V là 2 thành phần màu).
TỔNG QUAN KỸ THUẬT NÉN ẢNH
1.2 Các kỹ thuật nén có tổn hao

Kỹ thuật mã hóa dựa trên phép biến đổi
- Sơ đồ khối bộ nén ảnh dựa theo phép biến đổi DCT trong JPEG
Chuyển thứ tự
quét mành sang
các block 8*8
Giá trị điểm ảnh
trừ đi 128
Biến đổi
2D-DCT 8*8
Lượng tử hóa
tỉ lệ
Quét các hệ số AC
theo thứ tự Zigzag
Mã hóa DPCM các
hệ số DC
Mã hóa Entropy
Ảnh gốc
Dữ liệu ảnh dạng file
để truyền hoặc lưu trữ

Sắp xếp Zigzag các hệ số DCT ở bộ mã hoá
TỔNG QUAN KỸ THUẬT NÉN ẢNH
1.2 Các kỹ thuật nén có tổn hao

Kỹ thuật mã hóa dựa trên phép biến đổi
- Sơ đồ khối bộ giải nén ảnh dựa theo phép biến đổi DCT trong JPEG
Chuyển đổi các
khối 8*8 thành thứ
tự quét mành
Cộng giá trị mỗi
điểm ảnh thêm 128
Biến đổi
2D-IDCT 8*8
Giải
lượng tử hóa
Giải quét Zigzag
các hệ số AC
Giải lượng tử
DPCM hệ số DC
Giải mã Entropy
Ảnh khôi
phục
Dữ liệu ảnh nhận được
hoặc từ dạng lưu trữ
TỔNG QUAN KỸ THUẬT NÉN ẢNH
1.2 Các kỹ thuật nén có tổn hao

Kỹ thuật mã hóa dựa trên phép biến đổi
+ Biến đổi Fourier thời gian ngắn (STFS)
- Biến đổi Fourier chỉ thích hợp khi phân tích những tín hiệu ổn định (stationary), khi tín hiệu

không ổn định biến đổi Fourier không phân tích được. Để khắc phục những hạn chế của
biến đổi FT, người ta dùng phép biến đổi Fourier thời gian ngắn (STFT)
- Trong biến đổi STFT, tín hiệu được chia thành các khoảng nhỏ và trong khoảng đó tín hiệu
được giả định là tín hiệu ổn định.
- Để thực hiện kỹ thuật này cần chọn một hàm cửa sổ w sao cho độ dài của cửa sổ đúng bằng
các khoảng tín hiệu phân chia.
- Biến đổi STFT đối với tín hiệu liên tục thực được định nghĩa như sau:
(t-τ):độ dài thời gian của cửa sổ.
Chúng ta có thể dịch chuyển vị trí của cửa sổ bằng cách thay đổi giá trị t và để thu được các
đáp ứng tần số khác nhau của đoạn tín hiệu ta thay đổi giá trị τ .
( ) ( ) ( )
2
, w
j ft
X f t x t t e dt
π
τ


−∞
= − 
 

TỔNG QUAN KỸ THUẬT NÉN ẢNH
1.2 Các kỹ thuật nén có tổn hao

Kỹ thuật mã hóa dựa trên phép biến đổi
+ Biến đổi Fourier thời gian ngắn (STFS)
- Nguyên lý bất định Heissenber, nguyên lý này phát biểu là: Không thể biết được chính xác
được biểu diễn thời gian - tần số của một tín hiệu (hay không thể biết các thành phần phổ

của tín hiệu ở một thời điểm nhất định)
- Hay nói cách khác:
- Cửa sổ hẹp -> phân giải thời gian tốt, phân giải tần số kém
- Cửa sổ rộng -> phân giải tần số tốt, phân giải thời gian kém
TỔNG QUAN KỸ THUẬT NÉN ẢNH
1.2 Các kỹ thuật nén có tổn hao

Kỹ thuật mã hóa dựa trên phép biến đổi
Biến đổi Wavelet (DWT)
- Wavelet là phép biến đổi được sử dụng để phân tích các tín hiệu không ổn định (non-
stationary) – là những tín hiệu có đáp ứng tần số thay đổi theo thời gian.
- Bước này có thể hiểu phép biến đổi DWT như là áp dụng một tập các bộ lọc thông cao
và thông thấp. Thiết kế các bộ lọc này tương đương như kỹ thuật mã hoá băng con
(subband coding) nghĩa là: chỉ cần thiết kế các bộ lọc thông thấp, còn các bộ lọc thông
cao chính là các bộ lọc thông thấp dịch pha đi một góc 180 độ. Tuy nhiên khác với mã
hoá băng con, các bộ lọc trong DWT được thiết kế phải có đáp ứng phổ phẳng, trơn và
trực giao.

TỔNG QUAN KỸ THUẬT NÉN ẢNH
1.2 Các kỹ thuật nén có tổn hao

Kỹ thuật mã hóa dựa trên phép biến đổi
CƠ SỞ LÝ THUYẾT BIẾN ĐỔI WAVELET
- Biến đổi Wavelet liên tục của một hàm f (t ) được bắt đầu từ một hàm Wavelet mẹ
(mother Wavelet) ψ (t ) . Hàm Wavelet mẹ ψ (t ) có thể là bất kỳ một hàm số thực hoặc
phức liên tục nào thoả mãn các tính chất sau:
+ Tích phân suy rộng trên toàn bộ trục t của hàm ψ (t ) là bằng 0. Tức là:
+Tích phân năng lượng của hàm trên toàn bộ trục t là một số hữu hạn, tức là:
- Có nghĩa là hàm ψ (t ) phải là một hàm bình phương khả tích.
( )

0t dt
ψ

−∞
=

( )
2
t dt
ψ

−∞
< ∞

2.1 Các phép biến đổi Wavelet
2.1.1 Biến đổi Wavelet liên tục (Continuous Wavelet Transform-CWT)
CƠ SỞ LÝ THUYẾT BIẾN ĐỔI WAVELET
- Sau khi hàm Wavelet ψ (t ) được lựa chọn, biến đổi Wavelet liên tục của một hàm bình phương
khả tích f (t ) được tính theo công thức:
- Khi a >1 thì hàm Wavelet sẽ được trải rộng còn khi 0< a <1 thì hàm sẽ được co lại.
- Chúng ta có thể xem biến đổi CWT như là một ma trận hai chiều. Các hàng của ma trận tương
ứng với các giá trị của a và các cột tương ứng với các giá trị của b
( ) ( )
*
1
,
t b
W a b f t dt
a
a

ψ

−∞

 
=
 ÷
 

2.1 Các phép biến đổi Wavelet
2.1.1 Biến đổi Wavelet liên tục (Continuous Wavelet Transform-CWT)
CƠ SỞ LÝ THUYẾT BIẾN ĐỔI WAVELET
- Việc tính toán biến đổi DWT thực chất là sự rời rạc hoá biến đổi Wavelet liên tục (CWT);
việc rời rạc hoá được thực hiện với sự lựa chọn các hệ số a và b như sau:
- Việc tính toán hệ số của biến đổi Wavelet có thể dễ dàng thực hiện bằng các băng lọc
số nhiều nhịp đa kênh.
Minh hoạ lưới nhị tố dyadic với các giá trị của m và n
2 ; 2 ;
m m
a b n= =
,m n Z∈
2.1 Các phép biến đổi Wavelet
2.1.2 Biến đổi Wavelet rời rạc
NÉN ẢNH BẰNG WAVELET
3.1 Sơ đồ khối tổng quát
Sơ đồ khối quá trình nén ảnh bằng Wavelet
- Ảnh mẫu được đưa qua một phép biến đổi để tạo thành tập hệ số biến đổi. Các hệ
số này tiếp tục được lượng tử hoá (chia cho các giá trị cố định cho trước) để giảm
dung lượng dữ liệu. Đầu ra của bước này là một luồng các số nguyên mà mỗi một
trọng số đó tương ứng với một chỉ số nhị phân được lượng tử hoá.

- Bước cuối cùng là mã hoá: các luồng dữ liệu được chuyển thành chuỗi các từ mã
nhị phân (binary symbol) theo cách: các từ mã nhị phân có độ dài ngắn mã hoá
cho các số nguyên có xác suất xuất hiện cao. Điều này làm giảm số bít cần truyền.
Các nguyên lý mã hoá như vậy là: Huffman và RLC (mã chạy dài).
NÉN ẢNH BẰNG WAVELET
3. 2 Biến đổi Wavelet
- Phép biến đổi Wavelet thuận sử dụng sự phân ly 1D (một chiều) để chuyển tập các
mẫu 1D thành hai băng: băng con thông thấp (Li) và băng con thông cao (Hi).
Băng Li là phiên bản có độ phân giải thấp của ảnh gốc được lấy mẫu xuống.
Băng Hi biểu thị thông tin dư thừa của ảnh gốc
- Quá trình phân ly băng con 2D chỉ là sự mở rộng quá trình phân ly băng con 1D.

(a) Biến đổi Wavelet 2D mức 3 và (b) Minh hoạ bằng ảnh “CASTLE”

NÉN ẢNH BẰNG WAVELET
3.3 Tính toán năng lượng tiêu hao
Để thực hiện biến đổi Wavelet ta chọn bộ lọc có cặp Daubechies 5-tap / 3-tap do những ưu
điểm sau của nó như sau:
- Kết quả sau bộ lọc Wavelet có chứa thông tin điểm ảnh lân cận và như thế loại bỏ được hiệu
ứng khối mà biến đổi DCT gặp phải.
- Có tính chất đối xứng và định vị cho phép dễ dàng phát hiện đường viền, tính toán nhanh,
ảnh nén có chất lượng cao.
- Phương trình của bộ lọc Daubechies 5-tap/3-tap là:
- Trong phép phân ly Wavelet thuận sử dụng ở bộ lọc trên, cần 8 phép toán cộng - A(Add) và
dịch - S(Shift) để chuyển những điểm ảnh mẫu thành một hệ số thông thấp. Để phân ly
thông cao cần 2 phép toán dịch và 4 phép toán cộng.
NÉN ẢNH BẰNG WAVELET
3.3 Tính toán năng lượng tiêu hao
- Như vậy có 8*S (phép dịch) + 8*A (phép cộng) là tải tính toán cần cho một điểm ảnh trong
quá trình phân ly thông thấp và 2S + 4A phép toán cho thông cao.

- Tất cả các điểm ảnh ở vị trí chẵn được phân ly thành các hệ số thông thấp và các điểm ảnh ở
vị trí lẻ được phân ly thành các hệ số thông cao.
Do kích thước của ảnh giảm theo hệ số 4 sau mỗi mức biến đổi, tổng tải tính toán có thể
được biểu diễn bằng công thức sau:
Tại một mức biến đổi, mỗi điểm ảnh sẽ được đọc hai lần và được ghi hai lần. Do vậy, với
cùng một điều kiện cũng như cùng phương pháp đánh giá như trên, tổng tải truy nhập dữ
liệu rút ra bằng số các toán tử đọc và ghi.
*Tải truy nhập dữ liệu với biến đổi Wavelet thường
Năng lượng tính toán tổng được tính bằng tổng trọng số của tải tính toán và tải truy nhập dữ
liệu.
NÉN ẢNH BẰNG WAVELET
3.4 Thuật toán nén ảnh bằng Wavelet hiệu năng – EEW
EEW (Effective Energy Wavelet)
- Thuật toán này với mục đích là tiết kiệm năng lượng lớn nhất nhưng chất lượng ảnh tốt
nhất.
EEW phân bố số học của các hệ số thông cao để loại bỏ một số lượng lớn các mẫu trong
quá trình nén ảnh.
Phân bố số học các hệ số thông cao sau phép biến đổi Wavelet mức 2
NÉN ẢNH BẰNG WAVELET
3.4 Thuật toán nén ảnh bằng Wavelet hiệu năng – EEW
* Hiệu năng của các kỹ thuật loại bỏ
- Mỗi ảnh đầu vào được thực hiện phép biến đổi theo hàng rồi đến cột và phân ly ảnh thành
bốn băng con (LL, LH, HL, HH). Tuy nhiên, để thực hiện kỹ thuật loại bỏ HH, thì sau khi
thực hiện biến đổi theo hàng, các hệ số thông cao chỉ được đưa vào bộ lọc thông thấp mà
không được đưa vào bộ lọc thông cao trong bước biến đổi theo cột tiếp theo
- Bằng với thuật toán Wavelet chúng ta chỉ tiết kiệm được 1/4 các lần “ghi” (tiết kiệm 25%)

CHUẨN NÉN ẢNH TĨNH DỰA TRÊN BIẾN ĐỔI
WAVELET- JPEG2000
4.1 Các bước thực hiện nén ảnh theo chuẩn JPEG2000

Trình tự mã hoá (a) và giải mã JPEG2000 (b)
Bước 1: Xử lý trước biến đổi
Bước 2: Biến đổi liên thành phần
Bước 3: Biến đổi riêng thành phần (biến đổi Wavelet)
Bước 4: Lượng tử hoá - Giải lượng tử hoá
Bước 5: Mã hoá và kết hợp dòng dữ liệu sau mã hoá
CHUẨN NÉN ẢNH TĨNH DỰA TRÊN BIẾN ĐỔI
WAVELET- JPEG2000
4.1 Các bước thực hiện nén ảnh theo chuẩn JPEG2000
Trình tự mã hoá (a) và giải mã JPEG2000 (b)
Bước 1: Xử lý trước biến đổi
- Do sử dụng biến đổi Wavelet, JPEG2000 cần có dữ liệu ảnh đầu vào ở dạng đối xứng qua 0.
Xử lý trước biến đổi chính là giai đoạn đảm bảo dữ liệu đưa vào nén ảnh có dạng trên. Ở
phía giải mã, giai đoạn xử lý sau biến đổi sẽ trả lại giá trị gốc ban đầu cho dữ liệu ảnh.
CHUẨN NÉN ẢNH TĨNH DỰA TRÊN BIẾN ĐỔI
WAVELET- JPEG2000
4.1 Các bước thực hiện nén ảnh theo chuẩn JPEG2000
Bước 2: Biến đổi liên thành phần
Giai đoạn này sẽ loại bỏ tính tương quan giữa các thành phần của ảnh.
- JPEG2000 sử dụng hai loại biến đổi liên thành phần là:

Biến đổi màu thuận nghịch (RCT ):làm việc với các giá trị nguyên.

Biến đổi màu không thuận nghịch (ICT ): làm việc với các giá trị thực.
ICT và RCT chuyển dữ liệu ảnh từ không gian màu RGB sang YCrCb. RCT được áp dụng trong
cả hai dạng thức nén có tổn hao và không tổn hao, còn ICT chỉ áp dụng cho nén có tổn hao.
Các thành phần Cr, Cb có ảnh hưởng rất ít tới sự cảm nhận hình ảnh của mắt trong khi
thành phần độ chói Y có ảnh hưởng rất lớn tới ảnh.
Minh hoạ ảnh với RGB và YCrCb
CHUẨN NÉN ẢNH TĨNH DỰA TRÊN BIẾN ĐỔI

WAVELET- JPEG2000
Bước 3: Biến đổi riêng thành phần (biến đổi Wavelet)
- Biến đổi riêng thành phần được áp dụng trong JPEG2000 chính là biến đổi Wavelet.
- Do phép biến đổi Wavelet không phải là một phép biến đổi trực giao như biến đổi DCT mà
là một phép biến đổi băng con nên các thành phần sẽ được phân chia thành các băng tần số
khác nhau và mỗi băng sẽ được mã hóa riêng rẽ.
- Việc tính toán biến đổi trong JPEG2000 này sẽ được thực hiện theo phương pháp Lifting.
- Sơ đồ của phương pháp Lifting 1D áp dụng trong JPEG2000 trên hình vẽ
Phương pháp Lifting 1D dùng tính toán biến đổi Wavelet
CHUẨN NÉN ẢNH TĨNH DỰA TRÊN BIẾN ĐỔI
WAVELET- JPEG2000
Bước 4: Lượng tử hoá - Giải lượng tử hoá
- Các hệ số của phép biến đổi sẽ được tiến hành lượng tử hoá.
- Quá trình lượng tử hoá cho phép đạt tỷ lệ nén cao hơn bằng cách thể hiện các giá trị biến
đổi với độ chính xác tương ứng cần thiết với mức chi tiết của ảnh cần nén.
- Các hàm lượng tử hoá khác nhau sẽ được áp dụng cho các băng con khác nhau và được thực
theo biểu thức:
Với Δ là bước lượng tử, U(x,y) là giá trị băng con đầu vào; V(x,y) là giá trị sau lượng tử hoá.
- Trong dạng biến đổi nguyên, đặt bước lượng tử bằng 1.
- Với dạng biến đổi thực thì bước lượng tử sẽ được chọn tương ứng cho từng băng con riêng
rẽ. Bước lượng tử của mỗi băng do đó phải có ở trong dòng bít truyền đi để phía thu có thể
giải lượng tử cho ảnh. Công thức giải lượng tử hoá là:
- r là một tham số xác định dấu và làm tròn, các giá trị ( U x,y);V(x,y) tương ứng là các giá trị
khôi phục và giá trị lượng tử hoá nhận được. JPEG2000 không cho trước r tuy nhiên thường
chọn r = 1/2 .

×