Tải bản đầy đủ (.pdf) (139 trang)

Kỹ thuật nén ảnh số

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (18.38 MB, 139 trang )

bộ giáo dục và đào tạo
trờng đại học bách khoa hà nội
***************************

luận văn thạc sĩ khoa học
NGNH : K THUT ĐIỆN TỬ

KỸ THUẬT NÉN ẢNH SỐ

ĐỖ VĂN PHÚC

Hµ Néi 2008


bộ giáo dục và đào tạo
trờng đại học bách khoa hµ néi
*************************

LUẬN VĂN THẠC SỸ KHOA HỌC

KỸ THUẬT NÉN ẢNH SỐ
NGÀNH: KỸ THUẬT ĐIỆN TỬ
Mã số:

ĐỖ VĂN PHÚC
Người hướng dẫn khoa học: TS. NGUYỄN VŨ SƠN

Hà Nội 11-2008


THÔNG TIN CÁ NHÂN HỌC VIÊN


Họ và tên: ĐỖ VĂN PHÚC
Lớp:

Cao học Điện tử - Viễn Thơng khóa 2006-2008

Năm sinh: Ngày 09 tháng 12 năm 1982
Điện thoại: 0914.664664
Cơ quan:

0422144856

Phòng Truyền dẫn – Phát sóng, Trung tâm Kỹ thuật Truyền hình

Cáp Việt Nam, 43 Nguyễn Chí Thanh –Ba Đình – Hà Nội


ABSTRACTION
Digital image compression in particular and multimedia data compression
in general is a very essential part in this epoch of global communication. The
more meaningful information ones transmit, the better! But the prerequisite is
this sort of information doesn’t require so much bandwith as well as large
storage drives. In the last few years, so many effective compression algorithms
have been researched and recommended.
Compared with classical compression technique, such as JPEG using
discrete cosine transform (DCT), wavelet based image compression methods
have so many advantages. Some of them we can count here are high
compression ratio, robust fault-tolerance and progressive transmission
capability...
From this reality, the objective of my thesis is to take a deep research on
some typical wavelet based algorithms of still image compression. They are:

EZW (Embedded Zero Tree), SPIHT (Set Partitioning in Hierarchical Trees),
WDR (Wavelet Diffrence Reduction) and ASWDR (Adaptively Scanned
Wavelet Difference Deduction).
In addtion to that, the thesis also take a close look at JPEG2000 standard
compression. JPEG2000 (based on DWT) has many advantages over JPEG
(based on DCT). In the near future, JPEG will be inevitably replaced by
JPEG2000.
Based on theoretic analysis, the thesis also comprise an experiment part
to evaluate the performance of two main algorithm, which are SPIHT and
EZW. The experiments are carried out in Matlab 7.6 environment. From those
experiments, we prove again that wavelet based compression algorithms have
high compression ratio and don’t make much quality degradation.


TĨM TẮT LUẬN VĂN
Nén ảnh số nói riêng và nén dữ liệu đa phương tiện nói chung là một
lĩnh vực rất cấp thiết trong thời đại trao đổi thông tin tồn cầu. u cầu đặt ra
là truyền tải nhiều thơng tin trong khi yêu cầu băng thông cũng như dung
lượng lưu trữ càng nhỏ càng tốt. Trong những năm qua, đã có nhiều thuật
tốn nén hiệu quả cao được nghiên cứu và đề xuất.
So với các kỹ thuật nén ảnh truyền thống như kỹ thuật nén ảnh sử dụng
phép biến đổi cosine rời rạc (DCT), nén ảnh dựa trên biến đổi Wavelet
(DWT) có nhiều ưu điểm như tỷ lệ nén cao, khả năng chống lỗi tốt, phù hợp
với truyền dẫn lũy tiến…
Xuất phát từ nhu cầu đó, mục đích của luận văn là nghiên cứu một số
kỹ thuật nén ảnh tĩnh sử dụng biến đổi Wavelet tiêu biểu: mã hóa wavelet cây
zero EZW (Embedded Zero Tree), phân chia tập hợp trong cấu trúc cây phân
cấp SPIHT (Set Partitioning in Hierarchical Trees), rút gọn hiệu wavelet
WDR (Wavelet Diffrence Reduction) và rút gọn hiệu wavelet với quét thích
ứng ASWDR (Adaptively Scanned Wavelet Difference Deduction).

Bên cạnh đó, luận văn cũng nghiên cứu tiêu chuẩn nén ảnh tĩnh
JPEG2000. JPEG2000 (dựa trên phép biến đổi DWT) có nhiều tính năng vượt
trội và dần dần sẽ thay thế tiêu chuẩn JPEG (dựa trên phép biến đổi DCT).
Từ những phân tích lý thuyết, luận văn sẽ xây dựng phần đánh giá thực
nghiệm cho 2 thuật toán EZW và SPIHT trên phần mềm Matlab 7.6. Từ đó
cho thấy hiệu năng nén cao của thuật toán nén wavelet trong khi vẫn đảm bảo
chất lượng suy giảm khơng nhiều.
Từ khóa: wavelet, EZW, SPIHT, WDR, JPEG2000

Luận văn cao học: Kỹ thuật nén ảnh số


LỜI CẢM ƠN!

Luận văn Kỹ thuật nén ảnh số được hoàn thành đúng với nội dung dự
kiến ban đầu. Tuy nhiên, do trình độ và thời gian có hạn, luận văn chắc chắn
khơng tránh khỏi những sai sót. Kính mong các thầy cơ giáo và các bạn đọc
đóng góp ý kiến chỉnh sửa và định hướng nội dung cho hướng phát triển tiếp
theo.
Em xin bày tỏ lòng biết ơn chân thành nhất đối với Tiến sĩ Nguyễn Vũ
Sơn, khoa Điện tử - Viễn thông, Trường Đại học Bách Khoa Hà Nội, người
thầy đã tận tình hướng dẫn em trong quá trình học tập, nghiên cứu để hồn
thành luận văn này.
Em cũng xin chân thành cảm ơn sự ủng hộ về mọi mặt của các thầy các
cô khoa Điện tử - Viễn thông, Trường Đại học Bách Khoa Hà Nội, đã tạo mọi
điều kiện giúp đỡ em hoàn thành nhiệm vụ học tập của mình.
Cuối cùng con xin chân thành cảm ơn cha mẹ, cảm ơn các bạn trong
lớp cao học niên khóa 2006-2008 và những người thân trong gia đình đã giúp
đỡ, động viên con trong suốt thời gian học tập vừa qua.


Học viên Đỗ Văn Phúc

Luận văn cao học: Kỹ thuật nén ảnh số


LỜI CAM ĐOAN

Tôi xin cam đoan tất cả nội dung của luận văn là kết quả của quá trình
nghiên cứu và tìm hiểu của bản thân tơi, dưới sự chỉ bảo của giáo viên hướng
dẫn. Các kết quả thực nghiệm là kết quả của riêng cá nhân tôi, không sao chép
từ bất kỳ tài liệu nào.

Học viên Đỗ Văn Phúc

Luận văn cao học: Kỹ thuật nén ảnh số


Trang 1

MỤC LỤC
MỤC LỤC ...............................................................................................1
DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT .......................................5
DANH MỤC HÌNH VẼ ..........................................................................9
DANH MỤC BẢNG .............................................................................12
DANH MỤC BẢNG .............................................................................12
LỜI GIỚI THIỆU ..................................................................................13
U

CHƯƠNG 1: TỔNG QUAN VỀ NÉN ẢNH SỐ ................................15
1.1.Giới thiệu chung về nén ảnh số ..................................................... 15

1.2.Các kỹ thuật nén ảnh ..................................................................... 16
1.2.1.Tiêu chuẩn nén ảnh JPEG cơ sở ......................................................16
1.2.2.Nén ảnh sử dụng biến đổi wavelet...................................................17

1.3. Tiêu chuẩn đánh giá chất lượng mã hoá ảnh ................................ 19
1.3.1.Sai số trung bình bình phương MSE ...............................................19
1.3.2.Tỷ số tín hiệu trên nhiễu đỉnh ......................................................... 20

1.4.Kết luận chương 1......................................................................... 20
CHƯƠNG 2: CƠ SỞ BIẾN ĐỔI WAVELET RỜI RẠC ....................21
2.1.Phép biến đổi wavelet ................................................................... 21
2.1.1.Biến đổi wavelet rời rạc ..................................................................23
2.1.2.Khái niệm phân tích đa phân giải....................................................25

Luận văn cao học: Kỹ thuật nén ảnh số


Trang 2

2.1.3.Sử dụng bộ lọc và thuật tốn hình chóp ..........................................28

2.2.Biến đổi wavelet hai chiều............................................................ 31
2.2.1.Nguyên tắc biến đổi.........................................................................31
2.2.2.Ví dụ minh họa ................................................................................33

2.3.Kết luận chương 2 ........................................................................ 35
CHƯƠNG 3 : CÁC THUẬT TOÁN NÉN ẢNH CƠ SỞ WAVELET .36
3.1.Nguyên tắc nén cơ bản.................................................................. 36
3.2.Thuật tốn EZW ........................................................................... 37
3.2.1.Mã hóa mặt phẳng bit......................................................................38

3.2.2.Cấu trúc cây zero .............................................................................40
3.2.3.Thuật tốn mã hóa ...........................................................................43

3.3.Thuật toán SPIHT ......................................................................... 46
3.3.1.Thủ tục sắp xếp phân chia tập hợp ..................................................46
3.3.2.Cấu trúc cây hướng khơng gian ......................................................47
3.3.3.Thuật tốn mã hóa ...........................................................................49

3.4.Thuật tốn WDR........................................................................... 54
3.4.1.Ưu điểm của WDR ..........................................................................54
3.4.2.Thuật tốn mã hóa ...........................................................................55

3.4.Thuật tốn ASWDR...................................................................... 59
3.4.1.Ngun tắc dự đốn giá trị quan trọng ............................................59
3.4.2.Nội dung thuật toán .........................................................................61

Luận văn cao học: Kỹ thuật nén ảnh số


Trang 3

3.4.Ứng dụng của các thuật toán nén wavelet..................................... 64
3.5.Kết luận chương 3......................................................................... 65
CHƯƠNG 4: TIÊU CHUẨN NÉN ẢNH TĨNH JPEG2000..................69
4.1. Lịch sử ra đời và phát triển chuẩn JPEG2000.............................. 69
4.2. Các tính năng của JPEG2000....................................................... 69
4.3. Các bước thực hiện nén ảnh JPEG2000....................................... 71
4.3.1.Tiền xử lý ảnh..................................................................................71
4.3.2. Nén ảnh ..........................................................................................74
4.3.3.Mã hóa lớp 2 và tổ chức luồng bit...................................................82


4.4.Thuật tốn mã hóa trong JPEG 2000 ............................................ 82
4.4.1.Mã hóa lớp 1....................................................................................82
4.4.2.Mã hóa lớp 2 và tổ chức luồng bit...................................................90

4.5.Kết luận chương 4 ........................................................................ 99
CHƯƠNG 5: ĐÁNH GIÁ THỰC NGHIỆM CÁC THUẬT TỐN..100
5.1.Thuật tốn EZW.......................................................................... 100
5.1.1.Giới thiệu chương trình .................................................................100
5.1.2.Kết quả tính toán ...........................................................................102
5.1.3.Nhận xét ........................................................................................107

5.2.Thuật toán SPIHT ....................................................................... 107
5.2.1.Giới thiệu chương trình .................................................................107
2.2.Kết quả tính tốn ..............................................................................109

Luận văn cao học: Kỹ thuật nén ảnh số


Trang 4

5.2.3.Nhận xét ........................................................................................113

5.3.So sánh 2 thuật toán nén ............................................................. 114
5.5.Kết luận chương 5 ...................................................................... 116
KẾT LUẬN .........................................................................................117
TÀI LIỆU THAM KHẢO ...................................................................118
TÓM TẮT LUẬN VĂN ............................................................................

Luận văn cao học: Kỹ thuật nén ảnh số



Trang 5

DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT
ASWDR:

Thuật toán rút gọn hiệu wavelet với quét thích ứng
Adaptively Scanned Wavelet Difference Reduction

BPC:

Mã hóa mặt phẳng bit
Bit Plane Coding

CR:

Tỷ lệ nén
Compression Ratio

CWT:

Biến đổi Wavelet liên tục
Continuous Wavelet Transform

DCT:

Biến đổi Cosine rời rạc
Discrete Cosine Transform


DFT:

Biến đổi Fourier rời rạc
Discrete Fourier Transform

DPCM:

Điều xung mã vi sai
Differized Pulse Code Modulation

DWT:

Biến đổi Wavelet rời rạc
Discrete Wavelet Transform

EBCOT:

Mã hóa khối nhúng với điểm cắt tối ưu
Embedded Block Coding with Optimized Truncation

EZW:

Mã hóa Wavelet cây zero
Embedded Zerotree Wavelet

Luận văn cao học: Kỹ thuật nén ảnh số


Trang 6


HSS:

Đối xứng nửa mẫu
Half Sample Symmetric

HVS:

Hệ thống cảm nhận của mắt người
Human Visual System

ICT:

Biến đổi màu không thuận nghịch
Irreversible Color Transform

IDWT:

Biến đổi w avelet rời rạc ngược
Inverse Discrete Wavelet Transform

JPEG:

Tiêu chuẩn nén ảnh của ủy ban JPEG quốc tế
Joint Photographic Experts Group

JPEG2000: Tiêu chuẩn nén ảnh JPEG2000
Joint Photographic Experts Group 2000
LSB:

Mặt phẳng bit kém quan trọng nhất

Least Significant Bit plane

LIP:

Danh sách các pixel không quan trọng
List of Insignificance Pixels

LIS:

Danh sách các tập hợp không quan trọng
List of Insignificance Sets

LSP:

Danh sách các pixel quan trọng
List of Significance Pixels

MRA:

Phân tích đa phân giải
Multi Resolution Analysis

Luận văn cao học: Kỹ thuật nén ảnh số


Trang 7

MSB:

Mặt phẳng bit quan trọng nhất

Most Significant Bit plane

MSE:

Sai số bình phương trung bình
Mean Square Error

PCM:

Điều xung mã
Pulse Code Modulation

PSNR:

Tỷ số tín hiệu đỉnh trên nhiễu
Peak Signal to Noise Ratio

QMF:

Băng lọc gương cầu tứ phương
Quardrature Mirror Filters

RCT:

Biến đổi màu thuận nghịch
Reversible Color Transform

RLC :

Mã hoá độ dài chạy

Run Length Coding

RMSE:

Căn bậc 2 của MSE
Root Mean Square Error

ROI:

Vùng ảnh mã hóa đặc biệt
Region Of Interest

SNR:

Tỷ số tín hiệu trên tạp âm
Signal to Noise Ratio

SPIHT:

Thuật toán phân chia tập hợp trong cấu trúc cây phân cấp
Set P artitioning I n H ierarchical T ree

Luận văn cao học: Kỹ thuật nén ảnh số


Trang 8

WDR:

Thuật toán rút gọn hiệu wavelet

Wavelet Difference Reduction

WSS:

Đối xứng toàn mẫu
Whole Sample Symmetric

Luận văn cao học: Kỹ thuật nén ảnh số


Trang 9

DANH MỤC HÌNH VẼ
Hình 1.1: Sơ đồ nén ảnh chung....................................................................... 16
Hình 2.1 :Hàm wavelet và sự co dãn trong miền thời gian ............................ 22
Hình 2.2: Phân rã và tổng hợp wavelet 3 mức tín hiệu................................... 30
Hình 2.3: Tính tốn hàng và cột cho biến đổi DWT hai chiều ....................... 32
Hình 2.4: Mở rộng biến đổi DWT cho tín hiệu hai chiều............................... 33
Hình 2.5: Biến đổi wavelet 3 mức với một ảnh cụ thể ................................... 34
Hình 3.1: Quét zig-zag với LL,HH, quét cột với HL,quét hàng cho LH ........ 36
Hình 3.2:Minh họa cây tứ phân và sự phân mức ............................................ 41
Hình 3.3:Hai bước đầu tiên của EZW............................................................. 42
Hình 3.4: Lượng tử hóa:MSE=48,68755 (a). Làm trịn: MSE=39,6875 (b) .. 45
Hình 3.5: Đồ thị PSNR vs CR với SPIHT sử dụng Db7 ................................ 53
Hình 3.6: Chất lượng ảnh với nén SPIHT sử dụng Db7................................. 54
Hình 3.7: Nén SPIHT và WDR với tốc độ bit thấp ........................................ 58
Hình 3.8: Băng con thứ 2 (a) ngưỡng 16 và băng con thứ 1 (b) ngưỡng 8 .... 60
Hình 3.9: SPIHT, WDR, ASWDR với 0.0625 bpp (a->c), 0.125 bpp (d->f). 63
Hình 4.1: Sơ đồ hệ thống nén JPEG2000 ....................................................... 74
Hình 4.2: Lượng tử hóa................................................................................... 78

Hình 4.3: Ảnh tái tạo với vùng (a) và phần sai khác so với ảnh gốc (b) ........ 79
Hình 4.4: Mặt nạ ROI (a) và tỷ lệ các hệ số ROI (b)...................................... 79
Hình 4.5: MAXSHIFT .................................................................................... 80

Luận văn cao học: Kỹ thuật nén ảnh số


Trang 10

Hình 4.6: Sơ đồ mã hóa JPEG2000 Lớp 1...................................................... 82
Hình 4.7: Sơ đồ mã hóa Significance propagation ......................................... 85
Hình 4.8 : Sơ đồ mã hóa Magnitude Refinement ........................................... 86
Hình 4.9: Sơ đồ mã hóa Cleanup .................................................................... 87
Hình 4.10: Gán khoảng cách con trong MQ-coder......................................... 88
Hình 4.11: Cấu trúc lớp trong luồng bit .......................................................... 92
Hình 4.12:Tổ chức luồng bit với một lớp duy nhất ........................................ 93
Hình 4.13:Tổ chức luồng bit lũy tiến độ phân giải đa lớp .............................. 94
Hình 4.14:Tổ chức luồng bit lũy tiến SNR đa lớp .......................................... 94
Hình 4.15: Ví dụ về cấu trúc dữ liệu cây thẻ .................................................. 95
Hình 5.1: Giao diện chương trình nén EZW................................................. 100
Hình 5.2: Chất lượng ảnh với nén EZW sử dụng Haar................................. 103
Hình 5.3: Chất lượng ảnh với nén EZW sử dụng Db4 ................................. 104
Hình 5.4: Chất lượng ảnh với nén EZW sử dụng Db7 ................................. 105
Hình 5.5: Chất lượng ảnh với nén EZW sử dụng Bior6.8 ............................ 106
Hình 5.6: Đồ thị tổng hợp PSNR vs CR với thuật toán EZW ...................... 107
Hình 5.7: Giao diện chương trình nén SPIHT .............................................. 108
Hình 5.8: Chất lượng ảnh với nén SPIHT sử dụng Haar .............................. 110
Hình 5.9: Chất lượng ảnh với nén SPIHT sử dụng Db4............................... 111
Hình 5.10: Chất lượng ảnh với nén SPIHT sử dụng Db7............................. 112
Hình 5.11: Chất lượng ảnh với nén SPIHT sử dụng Bior6.8........................ 113

Hình 5.12: Đồ thị tổng hợp PSNR vs CR với thuật toán SPIHT.................. 114
Luận văn cao học: Kỹ thuật nén ảnh số


Trang 11

Hình 5.13: So sánh EZW và SPIHT với bộ lọc Haar ................................... 115
Hình 5.14: So sánh EZW và SPIHT với bộ lọc Bior6.8 ............................... 115

Luận văn cao học: Kỹ thuật nén ảnh số


Trang 12

DANH MỤC BẢNG
Bảng 3.1: Tính năng và hạn chế của các thuật toán nén ................................. 68
Bảng 4.1: Các hệ số của băng lọc cho q trình nén có tổn thất .................... 76
Bảng 4.2: Các hệ số của băng lọc cho q trình nén khơng tổn thất .............. 76
Bảng 4.3:Cấu trúc luồng bit mã hóa cây thẻ................................................... 97
Bảng 5.1:Thơng số nén EZW sử dụng bộ lọc Haar ...................................... 103
Bảng 5.2:Thông số nén EZW sử dụng bộ lọc Db4 ....................................... 104
Bảng 5.3:Thông số nén EZW sử dụng bộ lọc Db7 ....................................... 105
Bảng 5.4:Thông số nén EZW sử dụng bộ lọc Bior6.8.................................. 106
Bảng 5.5:Thông số nén SPIHT sử dụng bộ lọc Haar.................................... 110
Bảng 5.6:Thông số nén SPIHT sử dụng bộ lọc Db4..................................... 111
Bảng 5.7:Thông số nén SPIHT sử dụng bộ lọc Db7..................................... 112
Bảng 5.8:Thông số nén SPIHT sử dụng bộ lọc Bior6.8 ............................... 113

Luận văn cao học: Kỹ thuật nén ảnh số



Trang 13

LỜI GIỚI THIỆU
Trong những năm gần đây, nhu cầu trao đổi và lưu trữ dữ liệu nhất là
dữ liệu đa phương tiện rất lớn. Cùng với nhu cầu đó, vấn đề đặt ra là làm thế
nào tìm được một kỹ thuật mã hoá (nén) dữ liệu tối ưu, nhằm mục đích giảm
thiểu lượng thơng tin cần thiết, thuận lợi cho việc trao đổi và lưu trữ trên
mạng. Một trong những loại hình dữ liệu đa phương tiện được sử dụng nhiều
trong đời sống là ảnh tĩnh. Vì vậy, trong thời gian qua đã có nhiều kỹ thuật
nén ảnh được nghiên cứu và đề xuất.
So với các kỹ thuật nén sử dụng phép biến đổi như biến đổi cosine rời
rạc (DCT)…, biến đổi Wavelet (DWT) có nhiều ưu điểm khơng chỉ trong xử
lý ảnh mà còn nhiều ứng dụng khác. Xuất phát từ nhu cầu đó, mục đích của
luận văn là phân tích và đánh giá một số thuật tốn nén ảnh sử dụng biến đổi
Wavelet cho ảnh tĩnh tiêu biểu: mã hóa wavelet cây zero EZW (Embedded
Zero Tree), phân chia tập hợp trong cấu trúc cây phân cấp SPIHT (Set
Partitioning in Hierarchical Trees), rút gọn hiệu wavelet WDR (Wavelet
Diffrence Reduction) và rút gọn hiệu wavelet với quét thích ứng ASWDR
(Adaptively Scanned Wavelet Difference Deduction).
Bên cạnh đó, luận văn cũng đi sâu vào nghiên cứu tiêu chuẩn nén ảnh
JPEG2000 sử dụng thuật tốn mã hóa khối nhúng với điểm cắt tối ưu EBCOT
(Embedded Block Coding with Optimized Truncation). JPEG2000 (dựa trên
phép biến đổi DWT) có nhiều tính năng vượt trội và dần dần sẽ thay thế tiêu
chuẩn JPEG (dựa trên phép biến đổi DCT).
Dựa trên những phân tích lý thuyết, luận văn sẽ xây dựng phần đánh
giá thực nghiệm. Từ đó cho thấy khả năng nén với tỷ lệ nén rất cao của nén
ảnh trên cơ sở biến đổi wavelet.

Luận văn cao học: Kỹ thuật nén ảnh số



Trang 14

Nội dung đồ án được chia thành 5 chương:
1. Chương 1: Tổng quan về nén ảnh số. Chương này giới thiệu sơ lược
nhu cầu cần thiết cần thiết của việc nén dữ liệu ảnh và các kỹ thuật sử
dụng để nén ảnh, tiêu biểu là nén ảnh cơ sở wavelet.
2. Chương 2: Cơ sở biến đổi wavelet rời rạc. Chương này phân tích phép
biến đổi wavet và lý thuyết phân tích đa phân giải, từ đó áp dụng cho
tín hiệu ảnh 2 chiều.
3. Chương 3: Các thuật toán nén ảnh cơ sở wavelet. Chương này nghiên
cứu một số thuật toán nén wavelet tiêu biểu như EZW, SPIHT, WDR,
ASWDR và ứng dụng của chúng trong thực tế
4. Chương 4: Tiêu chuẩn nén ảnh tĩnh JPEG 2000. Chương này giới thiệu
tiêu chuẩn JPEG 2000 là tiêu chuẩn nén ảnh mới thay thế cho tiêu
chuẩn JPEG.
5. Chương 5: Đánh giá thực nghiệm các thuật toán nén: Chương này sử
dụng phần mềm Matlab để đánh giá hiệu năng nén của 2 thuật toán nén
wavelet tiêu biểu là EZW và SPIHT.
Do trình độ và thời gian có hạn, luận văn chắc chắn khơng tránh khỏi
những sai sót, kính mong các thầy cơ giáo và các bạn bạn đóng góp ý kiến và
định hướng nội dung cho hướng nghiên cứu tiếp theo.

Luận văn cao học: Kỹ thuật nén ảnh số


Trang 15

CHƯƠNG 1: TỔNG QUAN VỀ NÉN ẢNH SỐ

1.1.Giới thiệu chung về nén ảnh số
Ngày nay, yêu cầu trao đổi thông tin đa phương tiện (thoại, video, văn
bản…) qua mạng viễn thông đang phát triển một cách bùng nổ. Ảnh tĩnh và
video chiếm lượng băng thông vô cùng lớn trong tiến trình trao đổi thơng tin
đó. Để nâng cao hiệu quả truyền dẫn cũng như tiết kiệm không gian lưu trữ,
nhu cầu tất yếu là dữ liệu cần phải được nén với hệ số cao trong khi chất
lượng vẫn đảm bảo. Chính vì vậy các kỹ thuật nén ảnh, nén video… đóng vai
trị quan trọng và ngày càng được nghiên cứu phát triển.
Mục đích của nén ảnh số là làm thế nào để lưu trữ bức ảnh dưới dạng
có kích thước nhỏ hơn hay dưới dạng biểu diễn mà chỉ u cầu số bit mã hố
ít hơn so với bức ảnh gốc.
Phân tích thống kê một bức ảnh tiêu biểu cho thấy có sự tương quan
giữa các pixel lân cận nhau. Điều này dẫn đến sự dư thừa thông tin trong bức
ảnh. Sự dư thừa này có thể được loại bỏ bằng cách giải tương quan cùng với
một số cách tiền xử lý để đạt được hiệu quả nén.
Nhìn chung, kỹ thuật nén ảnh tĩnh dựa vào hai nguyên tắc giảm dư thừa
cơ bản: giảm dư thừa không gian và giảm dư thừa thống kê.
Độ dư thừa khơng gian chính là những đặc điểm giống nhau của các
pixel lân cận và chúng được giảm bằng các kỹ thuật giải tương quan như mã
hóa dự đốn (predictive coding), mã hóa biến đổi (transform coding), mã hóa
băng con (subband coding)…
Độ dư thừa thống kê thường được giảm bằng mã hóa entropy. Cụ thể
hơn, mã hóa entropy giảm độ dư thừa của dữ liệu tương quan bằng cách sử

Luận văn cao học: Kỹ thuật nén ảnh số


Trang 16

dụng kỹ thuật mã hóa độ dài biến đổi như mã hóa Huffman, mã hóa số học…

Các kỹ thuật mã hóa này phân bố các bit trong từ mã theo quy tắc các ký hiệu
có khả năng xuất hiện nhiều sẽ được biểu diễn bằng số bit ít hơn so với các
pixel ít xuất hiện, qua đó đạt được hiệu năng nén.
Hình 1.1 minh hoạ cơ chế nén ảnh chung.

Hình 1.1: Sơ đồ nén ảnh chung
Ảnh trước hết được tiền xử lý, có thể chia thành các khối nhỏ hơn nếu
cần thiết. Các khối này được xử lý bởi các phép biến đổi (như biến đổi cosin
rời rạc DCT, biến đổi wavelet DWT) để giúp tăng hiệu quả nén năng lượng,
năng lượng ảnh sẽ tập trung vào một số hệ số biến đổi, các hệ số cịn lại có
biên độ rất nhỏ có thể bỏ qua. Các hệ số này được lượng tử hóa rồi mã hóa
entropy để đạt được hiệu quả nén cao.
Phía giải mã sẽ thực hiện q trình ngược lại so với phía mã hóa để
khơi phục ảnh gốc.

1.2.Các kỹ thuật nén ảnh
1.2.1.Tiêu chuẩn nén ảnh JPEG cơ sở
Với phương pháp nén ảnh JPEG cơ sở (baseline JPEG), ảnh được chia
thành các khối 8x8 pixel, sau đó biến đổi cosin rời rạc cho từng khối. Bộ
lượng tử hóa sẽ làm trịn các hệ số DCT tương ứng với thang lượng tử hóa.
Bước này tạo ra tổn thất thông tin trong JPEG nhưng cho phép tạo ra hiệu
năng nén cao. Kỹ thuật JPEG sử dụng mã hóa độ dài biến đổi như mã độ dài
chạy RLC cho các hệ số biến đổi.

Luận văn cao học: Kỹ thuật nén ảnh số


Trang 17

Với tiến trình giải nén, JPEG sẽ tách các hệ số DCT đã lượng tử từ

luồng bit nén, biến đổi ngược và hiển thị ảnh.
Ý tưởng ẩn chứa trong sơ đồ mã hóa này đó là biến đổi cosin rời rạc
cung cấp thuộc tính nén năng lượng ảnh cao. Do đó, u cầu ít bit để lượng tử
hóa và để lưu trữ các hệ số này. Ngoài ra, các hệ số AC lượng tử hóa hầu như
đều mang giá trị 0, chỉ có duy nhất một hệ số DC trong khối – hệ số này
thường được mã hóa DPCM. Do đó áp dụng mã độ dài chạy cho phép nén
hiệu quả.
1.2.2.Nén ảnh sử dụng biến đổi wavelet
Các kỹ thuật dựa trên cơ sở wavelet đã được sử dụng rộng rãi cho nén
ảnh. Wavelet sử dụng mã hóa băng con để tách chọn lọc các băng con từ ảnh
cho trước. Các bộ lọc wavelet được thiết kế sao cho các hệ số trong mỗi băng
con hầu như không tương quan với các hệ số trong băng con khác.
Biến đổi wavelet cho phép nén năng lượng cao hơn biến đổi DCT và do
đó giúp tăng hiệu quả nén xét với cùng tỷ lệ tín hiệu trên tạp âm đỉnh PSNR.
Nén ảnh cơ sở wavelet thể hiện tính ưu việt trong truyền dẫn lũy tiến và
giải mã chống sai lỗi. Truyền dẫn lũy tiến đề cập đến vấn đề truyền dẫn thông
tin theo thứ tự giảm dần nội dung thơng tin đó. Nói cách khác, các hệ số với
biên độ cao nhất được truyền đi trước. Do tất cả các sơ đồ mã hóa đều thực
hiện truyền dẫn bit theo thứ tự mặt phẳng bit giảm dần, quá trình truyền dẫn
đảm bảo là lũy tiến. Những sơ đồ mã truyền dẫn kiểu này giúp luồng bit có
tính chất nhúng (embedded), nghĩa là có thể giải mã ảnh ở nhiều tốc độ bit
khác nhau.
Hơn nữa, nén ảnh cơ sở wavelet lại rất phù hợp với các đặc trưng của
hệ thống thị giác người HVS (Human Visual System). Nhờ bản chất đa phân

Luận văn cao học: Kỹ thuật nén ảnh số


Trang 18


giải, các sơ đồ nén ảnh wavelet đặc biệt phù hợp với những ứng dụng yêu cầu
cao về khả năng mềm dẻo với mức suy giảm chất lượng thấp.
Trong những năm qua, rất nhiều thuật toán nén ảnh cơ sở wavelet hiệu
quả đã được đề xuất và phát triển. Trong số đó, có thể kể đến: mã hóa wavelet
cây zero EZW (Embedded Zero Tree), phân chia tập hợp trong cấu trúc cây
phân cấp SPIHT (Set Partitioning in Hierarchical Trees), rút gọn hiệu wavelet
WDR (Wavelet Diffrence Reduction) và rút gọn hiệu wavelet với quét thích
ứng ASWDR (Adaptively Scanned Wavelet Difference Deduction), mã hóa
khối nhúng với điểm cắt tối ưu EBCOT (Embedded Block Coding with
Optimized Truncation)…
EZW là một thuật toán nén wavelet được phát triển bởi Shapiro. Tác
giả đã đề xuất thuật tốn mã hóa trên cơ sở đa phân giải của biến đổi wavelet.
EZW mở ra một bước phát triển mới trong lĩnh vực mã hóa wavelet và thúc
đẩy nhiều nghiên cứu trong lĩnh vực này. Hai chức năng nổi bật của mã hóa
EZW là mã hóa ánh xạ phần quan trọng (significance map encoding) và
lượng tử hóa xấp xỉ liên tiếp (successive approximation quantization). Thuật
toán đã khai thác tốt đặc tính nén năng lượng cũng như đặc điểm phân cấp và
giống nhau của biến đổi wavelet. Tính phân cấp giúp sơ đồ mã hóa thực hiện
theo cấu trúc cây. Khả năng tương đồng giữa các băng được sử dụng để mã
hóa vị trí các hệ số quan trọng. Trong thực tế EZW khơng mã hóa vị trí quan
trọng đó, thay vào đó là mã hóa các vị trí khơng.
Thuật toán EZW được mở rộng bởi Amir Et.Al, tạo ra một sơ đồ mã
hoá mới gọi là SPIHT (Set Partitioning In Hierachical Trees). SPIHT mang
lại hiệu năng cao hơn EZW mà khơng cần thiết phải sử dụng bộ mã hóa số
học (arthmetic encoder) và thuật tốn cũng tính tốn hiệu quả hơn.

Luận văn cao học: Kỹ thuật nén ảnh số



Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×