PHƯƠNG PHÁP nén dựa TRÊN PHÉP BIẾN đổi và ỨNG DỤNG

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (954 KB, 22 trang )

Hà Nội, 5/2015

1

LỜI MỞ ĐẦU
Hiện nay, mạng Internet nói riêng và những thành tựu trong lĩnh vực công nghệ
thông tin – truyền thông nói chung đã và đang tiếp tục mở rộng phát triển nhanh
chóng, đạt được những dấu mốc quan trọng. Song hành cùng với sự phát triển đó,
những khái niệm, những quy chuẩn, những đối tượng tài nguyên mới cũng được ra
đời nhằm phục vụ tốt nhất cho nhu cầu của con người.
Cùng với sự phát triển đó thì kèm theo nhu cầu của người dùng về tốc độ truyền
của càng dữ liệu ngày càng tăng để đáp ứng nhanh,kịp thời, chính xác nhu cầu của
người dùng. Qua đó đòi hỏi phải nén dữ liệu xuống giúp cho giảm độ dư thừa
trong giữ liệu gốc xuống nhưng vẫn cung cấp gần như đầy đủ thông tin. Với nhiều
phương pháp nén khác nhau ra đời trong đó có phương phán nén dựa trên phép
biến đổi là một hình thức phổ biến hiện nay, nên bọn em đã chọn đề tài “ Phương
pháp nén dựa trên phép biến đổi và ứng dụng “ để tìm hiểu trong quá trình học
dưới sự hướng dẫn của cô Nguyễn Thị Hoàng Lan, bài báo cáo sẽ khó tránh khỏi
những sai sót, chúng em rất mong nhận được những ý kiến đóng góp bổ ích từ cô
để bài báo cáo được hoàn thiện hơn.
Chúng em xin chân thành cảm ơn!

2

MỤC LỤC

A. Tìm hiểu chung về phương pháp nén dựa trên phép biến đổi
1. Tìm hiểu chung về phương pháp nén dựa trên phép biến đổi
Nén ảnh là một kỹ thuật mã hóa các ảnh số hóa nhằm giảm số lượng các bit

dữ liệu cần thiết để biểu diễn ảnh. Mục đích là giảm đi những chi phí trong việc
lưu trữ ảnh và chi phí thời gian để truyền ảnh đi xa trong truyền thông nhưng vẫn
đảm bảo được chất lượng của ảnh. Nén ảnh thực hiện được là do một thực tế:
thông tin trong bức ảnh không phải là ngẫu nhiên mà có trật tự, tổ chức. Vì thế nếu
bóc tách được tính trật tự, cấu trúc đó sẽ biết được phần thông tin nào quan trọng
nhất trong bức ảnh để biểu diễn và truyền đi với số lượng ít bit hơn so với ảnh gốc
mà vẫn đảm bảo đầy đủ tính năng của thông tin. Ở bên nhận quá trình giải mã sẽ
tổ chức, sắp xếp lại bức ảnh xấp xỉ gần chính xác so với ảnh gốc nhưng vẫn thỏa
mãn chất lượng yêu cầu
2. Phương pháp nén ảnh dựa vào phép biến đổi( Transform Coding)
2.1 Tổng quan
Một phép biến đổi là một hàm toán học được sử dụng để biến đổi một tập
các giá trị này thành một tập các giá trị khác và tạo ra một cách biểu diễn mới cho
cùng một nguồn tin, với sự chính xác của phép toán số học thì các phép biến đổi
vẫn bảo tồn được độ chính xác ở mức độ nào đó nhưng hầu hết các kỹ thuật mã
hóa đều có tổn hao ở bước lượng tử hóa do có sự làm tròn. Tức là gồm các phương
pháp tác động lên sự biến đổi của ảnh gốc chứ không tác động trực tiếp, khi muốn
giải mã thì dùng biến đổi ngược để đưa về miền xác định ban đầu.
2.2 Sơ đồ chung

3

Khối T: biến đổi thuận, khối Q: lượng tử hóa, khối E: mã hóa
 Khối T ( Transform ):
−

Biến đổi từ miền không gian dữ liệu ban đầu quan sát được
sang miền không gian dữ liệu của phép chiếu hay không gian
đặc trưng mà ở đó ta quan sát được những đặc trưng của dữ

liệu.

−

Phép biến đổi có thể tồn tại tồn tại hoặc không tồn tại phép
biến đổi ngược.

−

Thường yêu cầu áp dụng phép biến đổi tuyến tính và tồn tại
biến đổi ngược.

−

Công thức :
: biến đổi thuận trong đó đầu
vào là không gian vecto dữ liệu x(n) ,mỗi phần tử là một
vecto dữ liệu gồm nhiều thành phần.

 Khối Q (Quantization ):
−

Lượng tử hóa giá trị: ánh xạ có tổn hao từ khoảng biểu diễn
các giá trị liên tục biên độ tín hiệu thành khoảng biểu diễn bởi
các giá trị rời rạc – các mức giá trị hay từ mã

−

Nhằm mục đích chuyển đổi tập thông tin đầu vào là các số
liên tục thành số nguyên với dung lượng nhỏ hơn.

−

Nếu tập thông tin đầu vào là các vecto thì gọi là lượng tử hóa
vecto.
4

 Khối E ( encode ):
−

Mã hóa có độ dài cố định : mã ASCII ( American Standard
Code for Information Interchange), UPC ( Universal Product
Code ) => quá trình giải mã đơn giản,không có hiệu quá nén

−

Mã hóa có độ dài thay đổi : mã shannon, huffman, RLE…

−

Ví dụ mã RLE: trong tập tin xuất hiện các ký tự lặp lại, như
chuỗi sau: AAACCAACCCCBBB. Chuỗi này được mã hóa
bằng cách thay thế chuỗi ký tự lặp lại bằng một thể hiện gồm
biến đếm số ký tự lặp lại và ký tự lặp lại. Chuỗi trên được mã
hóa thành: 3ACCAA4C3B

B. Phép biến đổi DCT và DWT
1. Phép biến đổi DCT
1.1 Kỹ thuật mã hóa dựa trên phép biến đổi DCT

Phép biến đổi cosin rời rạc-DCT( discrete cosine transform) biến đổi thông tin
ảnh từ miền thời gian sang miền tần số. Tính chất của nó tương tự như biến đổi
Fourier, coi tín hiệu đầu vào là các tín hiệu ổn định bất biến theo thời gian.
1.2 Định nghĩa và các tính chất của phép biến đổi DCT
Biến đổi DCT thuận và nghịch một chiều gồm N mẫu được định nghĩa như
sau:
DCT= X[m]= cos ,
IDCT = x(n) = cos;
m,n = 0,1,2,….,M-1
=
Cả DCT và IDCT đều là biến đổi trực giao, tách biệt và thực. Tính chất phân
tách ở đây nghĩa là biến đổi nhiều chiều của nó có thể phân tách thành các biến đổi
một chiều. Tính chất trực giao ở đây nghĩa là nếu các ma trận của DCT và IDCT là
không bất thường và thực thì biến đổi nghịch của chúng có thể đạt được bằng cách
áp dụng toán tử hoán vị. DCT coi dữ liệu đầu vào là tín hiệu ổn định ( bất biến).

5

Trong các chuẩn nén ảnh tĩnh và video, người ta thường sử dụng DCT và
IDCT có kích thước 8 mẫu. Bức ảnh hoặc khung ảnh video kích thước MxN được
chia thành các khối không chồng chéo lên nhau hai chiều gọi là các ảnh con kích
thước 8x8 rồi áp dụng biến đổi DCT hai chiều ở bộ mã hóa và áp dụng biến đổi
IDCT ở bộ giải mã.
Phép biến đổi Cosin rời rạc DCT 2 chiều:
2D DCT= X[u,v] = cos cos
Với x(k,l) là tín hiệu 2D, ma trận dữ liệu kích thước MN. X(u,v): ma trận kết quả
DCT trên miền tần số, là phân tích khai triển x(k,l) theo hàm sóng cơ sở Cosin.
Phép biến đổi cosin cho tín hiệu hai chiều được thực hiện lần lượt theo hàng
sau đó theo cột, gồm các phép biến đổi một chiều. công thức DCT một chiều:

X(u) = cos
Với
Thuật toán để tính DCT và IDCT là thực hiến phép biến đổi 1-D lần lượt cho
hàng rồi đến cột của ma trận.
1.3 Đăc điểm của phép biến đổi DCT
Đặc điểm của phép biến đổi DCT là tín hiệu hình ảnh trong miền không gian
chuyển sang miền tần số thì các thành phần DC và các thành phần AC mang hầu
hết các thông tin chứa trong ảnh gốc. Trong đó, DC là thành phần quan trọng nhất
mang độ chói trung bình của ảnh, thành phần AC chứa các thông tin về chi tiết của
ảnh. Sau đó khi qua khối lượng tử hóa, các hệ số ít quan trọng sẽ bị loại bỏ bớt và
chỉ giữ lại một số hệ số đầu tiên gọi là hệ số DCT.
2. Phép biến đổi DWT
2.1 Phép biến đổi DWT
Không giống như biến đổi Fourier chỉ thích hợp khi phân tích những tín hiệu
ổn định, Wavelet là phép biến đổi được sử dụng để phân tích các tín hiệu không ổn
định-là những tín hiệu có đáp ứng tần số thay đổi theo thời gian.
Phép biến đổi DWT như là áp dụng một băng lọc: thông cao và thông thấp.
Thiết kế các bộ lọc này tương đương như kỹ thuật mã hóa băng con, nghĩa là: chỉ
cần thiết kế các bộ lọc thông thấp, còn các bộ lọc thông cao chính là các bộ lọc

6

thông thấp dịch đi một góc 180 độ. Tuy nhiên khác với mã hóa băng con, các bộ
lọc trong DWT được thiết kế phải có đáp ứng phổ phẳng, trơn và trực giao.

Hình 2.1: Minh họa dạng tổng quát của biến đổi DWT một chiều
Theo đó, tín hiệu được cho đi qua các bộ lọc thông cao H và thông thấp G rồi
được lấy mẫu xuống hệ số 2 tạo thành biến đổi DWT mức 1. Biến đổi ngược thì
thực hiện ngược lại: lấy mẫu lên hệ số 2 rồi sử dụng các bộ lọc khôi phục H’,

G’( lý tưởng là H’ và G’ chính là H, G).
Từ biến đổi DWT một chiều có thể mở rộng định nghĩa biến đổi DWT hai
chiều theo cách: sử dụng bộ lọc riêng biệt, thực hiện biến đổi DWT một chiều dữ
liệu vào( ảnh) theo hàng rồi thực hiện theo cột. Theo cách này nếu thực hiện biến
dổi DWT ở mức 1, sẽ tạo ra 4 nhóm hệ số biến đổi. quá trình biến đổi DWT hai
chiều có thể minh họa như hình… trong đó 4 nhóm hệ số là LL, HL, LH, HH

Hình 2.2: minh họa DWT hai chiều cho ảnh
2.2 Hai thuật toán nén sử dụng DWT điển hình
So với phép biến đổi DCT sử dụng chuẩn nén JPEG ra đời năm 1992, nén ảnh
dựa trên biến đổi DWT đã có những cải tiến đáng kể. Tuy nhiên cải tiến mang tính

7

đột phá sử dụng DWT để nén ảnh bắt đầu là kỹ thuật mã hóa-EZW(embedded
zero-tree wavelet).
Thuật toán EZW dựa trên khả năng khai thác các thuộc tính đa phân giải của
biến đổi wavelet để đưa ra một thuật toán ít phức tạp trong tính toán mà vẫn cho
hiệu quả nén cao. Những cải tiến và nâng cấp của EZW về sau đã ra đời một số
thuật toán tương tự như: SPIHT(set partitationing in hierarchical tree-cây phân cấp
phân tập) và ZTE.
Gần đây còn có thêm một thuật toán nữa được đề xuất đó là LS(lifting scheme)
sử dụng để tạo các biến đổi wavelet số nguyên. Kỹ thuật này sử dụng các bộ lọc
wavelet trực giao đem lại hiệu quả rất cao cho các ứng dụng nén ảnh có tổn hao.
2.3 Biến đổi wavelet liên tục
Biến đổi wavelet liên tục(CWT) của một hàm f(t) được bắt đầu từ một hàm
wavelet mẹ (t) có thể là bất kỳ một hàm số thực hoặc phức liên tục nào thỏa mãn
tính chất sau:
Tích phân suy rộng trên toàn bộ trục t của hàm (t) là bằng 0, tức là:

=0
Tích phân năng lượng của hàm trên toàn bộ trục t là một số hữu hạn, tức là
dt = 0. Có nghĩa là hàm (t) phải là một hàm bình phương khả tích nghĩa là hàm (t)
thuộc không gian (R) các hàm bình phương khả tích.
Sau khi hàm wavelet (t) được lựa chọn, biến đổi wavelet liên tục của một hàm
bình phương khả tích f(t) được tính theo công thức:
W(a,b) = () dt
Biến đổi này là một hàm của hai tham số thực a và b. Dấu * ký hiệu là liên hiệp
phức của (t). Nếu chúng ta định nghĩa một hàm theo biểu thức
= ()
Chúng ta có thể viết được:
=
Với giá trị là hệ số chuẩn hóa để đảm bảo rằng tích phân năng lượng của hàm sẽ
độc lập với a và b:
8

dt = dt
Với mỗi giá trị của a thì là một bản sao của được dịch đi b đơn vị trên trục thời
gian. Do đó b được gọi là tham số dịch. Đặt tham số dịch b = 0 ta thu được:
= điều đó cho thấy rằng a là tham số tỷ lệ.
Khi a > 1 thì hàm wavelet sẽ được trải rộng còn khi 0 < a < 1 thì hàm sẽ được co
lại. Sau đây ta sẽ định nghĩa phép biến đổi ngược của biến dổi wavelet liên tục.
Gọi là biến đổi Fourier của :
= dt
Nếu là biến đổi CWT của f(t) bằng hàm wavelet , thì biến đổi ngược của biến đổi
CWT sẽ được tính như sau:
f(t)=dadb
với giá trị của C được định nghĩa là: C = d
biến đổi CWT chỉ tồn tại nếu C dương và hữu hạn. Do đó C được gọi là điều kiện

tồn tại của biến đổi wavelet. Cùng với hai điều kiện đã nêu ở trên, đây là điều kiện
thứ 3 mà một hàm cần phải thỏa mãn để có thể được lựa chọn làm hàm wavelet.
Chúng ta có thể xem biến đổi CWT như là một ma trận hai chiều các kết quả của
phép tính tích vô hướng giữa hai hàm f(t) và . Các hàng của ma trận tương ứng với
các giá trị của a và các cột tương ứng với các giá trị của b do cách tính biến đổi
wavelet theo tích vô hướng đã trình bày ở trên:
= => =
2.4 Biến đổi wavelet rời rạc
Việc tính toán các hệ số wavelet tại tất cả các tỉ lệ là một công việc hết sức
phức tạp. Nếu tính toán như vậy sẽ tạo ra một lượng dữ liệu khổng lồ. Để giảm
thiểu công việc tính toán người ta chỉ chọn ra một tập nhỏ các giá trị tỉ lệ và các vị
trí để tiến hành tính toán. Hơn nữa nếu việc tính toán được tiến hành tại các tỉ lệ và
các vị trí trên cơ sở lũy thừa cơ số 2 thì kết quả thu được sẽ hiệu quả và chính xác
hơn rất nhiều. Quá trình chọn các tỷ lệ và các vị trí để tính toán như trên tạo thành
lưới nhị tố(dyadic). Một phân tích như trên hoàn toàn có thể thực hiện được nhờ
biến đổi wavelet rời rạc-DWT. Do đó, việc tính toán biến đổi DWT thực chất là sự
rời rạc hóa biến đổi wavelet liên tục-CWT. Việc rời rạc hóa được thực hiện với sự
lựa chọn các hệ số a và b: a= n; m,n Z. Ta có tập sóng con:
9

= (t - n), m,n .
Các hệ số wavelet: =
= (t - n)dt
Hàm f(t) được khôi phục: f(t)=
Việc tính toán hệ số của biến đổi wavelet có thể dễ dàng thực hiện bằng các băng
lọc số nhiều nhịp đa kênh.

Hình 2.3: Minh họa lưới nhị tố dyadic với các giá trị của m và n
2.5 Đặc điểm của phép biến đổi DWT

Biến đổi Wavelet dù chỉ làm việc với các tín hiệu một chiều nhưng sau khi
biến đổi xong ta thu được một hàm số hai biến hoặc một tập các cặp giá trị minh
họa các thành phần tần số khác nhau của tín hiệu xảy ra tại thời điểm t. Các giá trị
tạo thành một cột cho biết một thành phần tần số b có trong những thời điểm t nào
và các giá trị tạo thành hàng cho biết tại một thời điểm t của tín hiệu f(t) có các
thành phần tần số nào.

C. Phân tích vai trò của phép biến đổi Wavelet trong nén ảnh JPEG
2000
Vai trò của phép biến đổi Wavelet trong nén ảnh JPEG-2000. Đặc điểm của JPEG2000 liên quan đến Wavelet.
1.1 Vai trò của phép biến đổi Wavelet trong nén ảnh JPEG-2000
Tập trung năng lượng giúp nén dữ liệu : Qua phép biến đổi DWT, năng lượng của
tín hiệu được tập trung vào các hệ số. Phần lớn năng lượng (phần mang thông tin

10

của tín hiệu) chỉ tập trung vào một vài hệ số nhất định. Thông qua việc loại bỏ một
vài hệ số không trọng yếu, khả năng nén dữ liệu được tăng cao.
Không có hiệu ứng blocking: DWT có thể thực hiện trên toàn bộ ảnh hay chia
khối theo vùng ROI (Region of Interesting). Do đó không gây ra hiệu ứng
blocking như ở DCT.
Đa phân giải: DWT có chức năng đa phân giải. Việc thực hiện DWT theo các tầng
giúp tạo ra chức năng đa phân giải này. Chính nhờ khả năng đa phân giải của
DWT mới có tính năng đa phân giải của JPEG-2000.
1.2 Đặc điểm của JPEG-2000 có liên quan đến biến đổi Wavelet
Tốc độ dòng bit thấp, hiệu quả tỷ số nén tăng 30% so với ảnh JPEG nén dựa trên
DCT:
Dựa trên phép phân tích đa phân giải cho phép chia dải tần số của ảnh thành nhiều
dải tần con và mã hóa ở mỗi dải tần một số lượng bit khác nhau phù hợp tăng hiệu

quả tỷ số nén và đảm bảo chất lượng ảnh nén.
Chất lượng ảnh JPEG-2000 tốt hơn JPEG vì tránh được nhược điểm gây lỗi khối
của kỹ thuật chia các khối đều 8x8 trong nén phương pháp ảnh JPEG
Nén với tỷ lệ bit thấp: tiêu chuẩn JPEG-2000 đưa ra khả năng nén với tốc độ bit
thấp hơn so với tiêu chuẩn nén hiện tại (ví dụ dưới 0.25bpp cho ảnh xám chi tiết
cao). Ý nghĩa của đặc điểm này là đạt được tốc độ bit thấp mà không làm méo
ảnh.
Nén tổn hao và nén không tổn hao:
JPEG-2000 có khả năng nén không tổn hao và nén tổn hao.Ví dụ ứng dụng sử
dụng đặc tính nén không tổn hao: ảnh y tế, các ứng dụng mạng. Nó cũng yêu cầu
tiêu chuẩn có đặc tính tạo ra dòng bit nhúng và cho phép cải thiện chất lượng ảnh.
Các loại bộ lọc mà DWT sử dụng: Daubechies(9,7): bộ lọc số thực, dùng cho nén
có tổn hao. Daubechies(5,3): bộ lọc số nguyên, dùng cho nén không tổn hao.
Mã hóa vùng quan tâm ROI: thông thường trong một ảnh người ta chỉ quan tâm
đến một số vùng của ảnh. Đặc điểm này cho phép người sử dụng xác định chính
xác vùng quan tâm trong ảnh để mã hóa và truyền đi với chất lượng tốt hơn và ít
méo hơn so với các vùng còn lại. Phương pháp này có 2 phương pháp thực hiện là
MAXSHIFT và Scale.
11

Xử lý và truy nhập ngẫu nhiên: đặc điểm này cho phép người sử dụng xác định
vùng quan tâm của ảnh để truy nhập ngẫu nhiên và/hoặc giải nén ít méo hơn so
với các vùng ảnh còn lại. Xử lý dòng mã ngẫu nhiên này cũng cho phép ta quay
ảnh, dịch ảnh, lọc ảnh, khai triển các đặc điểm và tỷ lệ ảnh.
Giảm khả năng lỗi bit: giảm khả năng lỗi bit trong khi thiết kế dòng mã hóa. Một
trong những ứng dụng là truyền kênh viễn thông không dây. Tỷ lệ của dòng mã
hóa quan trọng hơn các dòng mã khác trong xác định chất lượng ảnh giải mã.
Dòng bit thiết kế đúng quy tắc có thể trợ giúp hệ thống chỉnh sửa lỗi đến sau trong
lỗi giải mã.

Kiến trúc mở: đặc điểm này cho phép kiến trúc mở để tối ưu hệ thống cho các ứng
dụng và loại ảnh khác nhau. Với đặc tính này, giải mã chỉ thực hiện bộ công cụ lõi
và phân tích để hiểu dòng mã. Nếu cần thiết, không xác định được công cụ có thể
yêu cầu từ bộ giải mã để bên nguồn gửi sang.
Miêu tả nội dung: ảnh lưu giữ, index và tìm kiếm đặc điểm quan trọng trong xử lý
ảnh. Miêu tả nội dung của ảnh là một thành phần của hệ thống nén ảnh (ví dụ
thông tin dữ liệu phụ metadata).
Bảo mật ảnh: bảo vệ ảnh số có nhận được nhờ watermarking, label, tem và mã mật
hóa (Encryption). Nhãn được thực hiện trong SPIFF và phải dễ truyền đi truyền lại
tới file ảnh JPEG-2000.
Nén hai mức và nhiều mức: đưa ra tiêu chuẩn mã hóa có khả năng mã hóa cả ảnh
hai mức, nhiều mức. Nếu thực hiện, tiêu chuẩn này cố gắng đạt được với nguồn hệ
thống tương tự nhau. Hệ thống này phải nén và giải nén với dải thông thay đổi (ví
dụ 1 bit tới 16 bit) cho mỗi thành phần màu. Ví dụ sử dụng đặc tính này là: ảnh y
học với một lớp chú thích, ảnh đồ họa và ảnh máy tính tạo ra với nhị phân và gần
vùng nhị phân, mặt phẳng alpha và trong suốt.

D. Thử nghiệm ứng dụng, đo lường hiệu năng giải pháp nén với
chuẩn JPEG2000 và so sánh với hiệu năng chuẩn JPEG.
1. Chuẩn bị
Phần mềm Apollo Compression Demo: là phần mềm mã nguồn mở, có thể
download về từ trang chủ: />
12

Phần mềm Advanced JPEG Compressor 2011: phần mềm mã nguồn đóng
muốn sử dụng phải đăng kí key bản quyền, được download về từ địa chỉ:
/>Phần mềm Matlab 2013a.
Ảnh Uyen Nhi.bmp với kích thước 460x689, dung lượng 950,874 bytes
(928 KB)

2. Kịch bản và tiến hành thử nghiệm
2.1 Các thông số cần đo trong chuẩn nén ảnh JPEG2000
PSNR – Tỉ số tín hiệu cực đại trên nhiễu: là tỉ lệ giữa giá trị năng lượng tối
đa của một tín hiệu gốc và năng lượng nhiễu (các lỗi khi nén có mất mát dữ liệu).
PSNR được tính thông qua MSE:dung cho ảnh kích thước mxn trong đó I là ảnh
gốc, K là ảnh khôi phục:

13

Khi đó:

MAXI là giá trị tối đa của pixel trên ảnh. khi tín hiệu được biểu diễn bởi B bits
trên một đơn vị lấy mẫu, MAXI = 2^B−1. Với ảnh màu RGB, MSE là tổng của 3
giá trị màu đó chia cho kích thước của ảnh và chia cho 3.
Trong nén ảnh có mất mát, PSNR trong khoảng 30-50dB, giá trị càng cao càng tốt.
Giá trị có thể chấp nhận được khi truyền tín hiệu không dây có tổn thất khoảng từ
20 dB đến 25 dB.
2.2 Thử nghiệm hiệu quả nén ảnh JPEG2000.
Đầu tiên chúng ta dùng phần mềm Apollo Compression Demo để nén ảnh
Uyen Nhi.png ở trên, dùng phím Save rồi chọn định dạng để lưu.

14

Kết quả:

(JPEG 2000 lossless: 330KB)

15

JPEG2000 lossy: tỉ số nén 20:1(46,3KB) JPEG2000 tỉ số nén 65:1 (14,2KB)
Tiếp đến ta sử dụng lập trình Matlab để tính xem các chỉ số MSE, PNSR
của các ảnh sau nén.
Đoạn code này nhập ảnh gốc và ảnh sau nén:

Kết quả đối với ảnh nén lossless: MSE=0 nên PSNR không xác định. Điều này rất
đúng vì là nén không mất mát thông tin.
16

Đối với ảnh nén lossy:

Ảnh nén với tỉ số 20:1
Mse=1,1433.10^-4, PSNR=87,6

Ảnh nén với tỉ số 40:1
Mse=0,0034, PSNR=72,8

2.3 So sánh ảnh nén JPEG2000 và ảnh nén JPEG.
Ta so sánh giữa 2 chuẩn nén JPEG2000 và JPEG trong các tình huống:
cùng tỉ số nén, tỉ số nén tối đa tối thiểu. Cách làm là dùng phần mềm Advanced
JPEG Compressor 2011. Sau khi load ảnh, ta lựa chọn tỉ số nén ở phần Set Target
như trên hình sau:

17

Với cùng tỉ số nén lossy 65:1

JPEG 2000 (14,2 KB)

JPEG (13,8 KB)

Với cùng tỉ số nén 100:1
18

JPEG 2000 (9,29KB)

JPEG (9,08KB)

Nén với tỉ số nén tối đa:

19

JPEG 2000 (2,3KB)

JPEG (3,38KB)

Nhận xét: Bằng mắt thường ta có thể nhận ra chuẩn nén JPEG-2000 có hiệu
quả nén cao hơn nhiều so với chuẩn nén JPEG. Các đường nét của ảnh vẫn còn
được giữ lại rất tốt
Ngoài ra chúng ta còn 1 cách khác để so sánh giữa 2 chuẩn nén ảnh này là
truy cập vào trang: Ở
đây cùng 1 tấm ảnh cho trước, kết quả hiển thị của ảnh nén với cùng tỉ số từ 20:1
đến 100:1 được hiển thị cùng chỉ số PNSR. Như vậy ta có thể nhận ra ngay điểm

khác biệt của 2 chuẩn nén ảnh này.

20

2.4 Giải thích kết quả liên quan đến DCT và DWT.
Phép biến đổi Wavelet không chia khối như phép biến đổi DCT mà là phép
biến đổi mã hóa băng con nên các thành phần sẽ được chia thành các băng tần số
khác nhau và mỗi băng sẽ được mã hóa riêng rẽ như vậy ảnh sẽ được nén với tỉ số
cao mà không làm giảm nhiều chất lượng ảnh. DWT còn cung cấp thông tin phổ
tần số của tín hiệu và cho biết thành phần này xuất hiện khi nào.

21

TÀI LIỆU THAM KHẢO
Slide bài giảng xử lý dữ liệu đa phương tiện – PGS.TS Nguyễn Thị
Hoàng Lan
• JPEG-JPEG2000 Image Coding_EE3414: Yao Bang
• Still image and Video compression with MATLAB: K.S Thyagarajan
• A study of the JPEG2000 image compression standard: Clifford Lui
•

22

PHƯƠNG PHÁP nén dựa TRÊN PHÉP BIẾN đổi và ỨNG DỤNG

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về