Tải bản đầy đủ (.pdf) (53 trang)

Nghiên cứu một số kỹ thuật nén dữ liệu dựa trên phép biến đổi sóng nhỏ rời rạc và ứng dụng trong máy ảnh kỹ thuật số

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (727.27 KB, 53 trang )

..

=-=.LỜI CẢM ƠN

ĐẠI HỌC THÁI NGUN

Tơi xin bày tỏ lịng biết ơn sâu sắc đến TS. Bùi Thế Hồng đã tận tình
KHOA CƠNG NGHỆ THƠNG TIN

hƣớng dẫn, chỉ bảo và hết lịng giúp đỡ để tơi có thể hồn thành luận văn của
mình.
Xin cảm ơn Khoa Cơng nghệ thơng tin – Đại học Thái Nguyên đã tạo
điều kiện giúp đỡ tơi trong suốt q trình làm luận văn nghiên cứu.
NGUYỄNC HỒNG NGỌC

NGHIÊN CỨU MỘT SỐ KỸ THUẬT
NÉN
DỮtháng
LIỆUnăm
DỰA
Thái Nguyên,
ngày
2009
TRÊN PHÉP BIẾN ĐỔI SÓNG NHỎ RỜI
RẠC
VÀ văn
ỨNG
Tác
giả luận
DỤNG TRONG MÁY ẢNH KỸ THUẬT SỐ


NGUYỀN HỒNG NGỌC

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

THÁI NGUYÊN - 2009

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên




ĐẠI HỌC THÁI NGUYÊN
KHOA CÔNG NGHỆ THÔNG TIN

NGUYỄN HỒNGN NGỌC

NGHIÊN CỨU MỘT SỐ KỸ THUẬT NÉN DỮ LIỆU DỰA
TRÊN PHÉP BIẾN ĐỔI SÓNG NHỎ RỜI RẠC VÀ ỨNG
DỤNG TRONG MÁY ẢNH KỸ THUẬT SỐ
Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

NGƢỜI HƢỚNG DẪN KHOA HỌC
TS. BÙI THẾ HỒNG

THÁI NGUYÊN - 2009

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên





LỜI CẢM ƠN
Tơi xin bày tỏ lịng biết ơn sâu sắc đến thày giáo TS. Bùi Thế Hồng Viện Công nghệ Thông tin thuộc Viện Khoa học và Công nghệ Việt Nam là
ngƣời đã trực tiếp hƣớng dẫn, chỉ bảo tận tình và hết lịng giúp đỡ tơi trong
suốt thời gian làm luận văn này.
Xin cảm ơn các thày giáo, cơ giáo, cơng tác tại Phịng Cơ sở dữ liệu –
Viện Công nghệ thông tin, các thầy cô giáo công tác tại Khoa công nghệ
thông tin – ĐHTN, cùng tập thể các bạn học viên lớp cao học Khóa 6 đã ln
giúp đỡ, động viên và nhiệt tình chia sẻ với tôi những kinh nghiệm học tập,
nghiên cứu trong suốt khoá học.
Xin đƣợc cảm ơn Ban lãnh đạo Trƣờng CĐCN Việt đức, cùng toàn thể
các bạn đồng nghiệp trong Khoa CNTT đã nhiệt tình tạo điều kiện giúp đỡ cả
về thời gian, vật chất và tinh thần để tơi hồn thành đƣợc khóa học của mình.

Thái Ngun, ngày 10 tháng 11 năm 2009
Học viên

Nguyễn Hồng Ngọc

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên




LỜI CAM ĐOAN
Tơi xin cam đoan tồn bộ nội dung bản luận văn này là do tôi tự sƣu tầm,
tra cứu và sắp xếp cho phù hợp với nội dung yêu cầu của đề tài.

Nội dung luận văn này chƣa từng đƣợc cơng bố hay xuất bản dƣới bất kỳ
hình thức nào và cũng không đƣợc sao chép từ bất kỳ một cơng trình nghiên
cứu nào.
Tất cả phần mã nguồn của chƣơng trình đều do tơi tự thiết kế và xây
dựng, trong đó có sử dụng một số thƣ viện chuẩn và các thuật toán đƣợc các
tác giả xuất bản cơng khai và miễn phí trên mạng Internet.
Nếu sai tơi xin tơi xin hồn tồn chịu trách nhiệm.

Thái Ngun, ngày 10 tháng 11 năm 2009
Ngƣời cam đoan

Nguyễn Hồng Ngọc

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên




i

MỤC LỤC
CHƢƠNG 1 .................................................................................................................. 4
TỔNG QUAN VỀ CÁC KỸ THUẬT NÉN ẢNH ......................................................... 4
1.1. Giới thiệu chung về nén ảnh số ............................................................................... 4
1.2. Phân loại các kỹ thuật nén ....................................................................................... 6
1.2.1. Nén tổn hao và không tổn hao ......................................................................... 6
1.2.2. Mã hoá dự đoán và mã hoá dựa trên phép biến đổi ........................................... 6
1.2.3. Mã hoá băng con .............................................................................................. 7
1.3. Tiêu chuẩn đánh giá chất lƣợng mã hoá ảnh ........................................................... 7
1.4. Các kỹ thuật nén có tổn hao .................................................................................... 7

1.4.1. Kỹ thuật mã hoá băng con ............................................................................... 7
1.4.2. Kỹ thuật mã hóa dựa trên phép biến đổi ........................................................... 9
1.4.2.1. Kỹ thuật mã hóa dựa trên phép biến đổi DCT ................................................ 9
1.4.2.2. Kỹ thuật mã hoá dựa trên phép biến đổi DWT. Mối quan hệ giữa biến đổi
Wavelet và Fourier .................................................................................................. 10
CHƢƠNG 2 CƠ SỞ LÝ THUYẾT CỦA BIẾN ĐỔI WAVELET ............................... 13
2.1. Cơ sở toán học. ..................................................................................................... 13
2.1.1. Biến đổi Wavelet liên tục. .............................................................................. 13
2.1.2. Biến đổi Wavelet rời rạc................................................................................. 13
2.1.3. Tính chất của biến đổi Wavelet. ..................................................................... 14
2.2. Giới thiệu một số họ Wavelet. ............................................................................... 15
2.2.1. Biến đổi Wavelet Haar. .................................................................................. 15
2.2.2. Biến đổi Wavelet Meyer................................................................................. 15
2.2.3. Biến đổi Wavelet Daubechies. ........................................................................ 16
2.3. Một số ứng dụng nổi bật của Wavelet. .................................................................. 16
2.3.1. Nén tín hiệu. .................................................................................................. 16
2.3.2. Khử nhiễu. ..................................................................................................... 17

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên




ii

2.3.3. Mã hoá nguồn và mã hoá kênh. ...................................................................... 17
CHƢƠNG 3 CHUẨN NÉN ẢNH TĨNH DỰA TRÊN BIẾN ĐỔI WAVELET
JPEG2000 ................................................................................................................... 18
3.1. Lịch sử ra đời và phát triển chuẩn JPEG2000. ...................................................... 18
3.2. Các tính năng của JPEG2000 ............................................................................... 18

3.3. Các bƣớc thực hiện nén ảnh theo chuẩn JPEG2000. ............................................. 19
3.3.1. Xử lý trƣớc biến đổi. ...................................................................................... 19
3.3.2. Biến đổi liên thành phần. ................................................................................ 19
3.3.3. Biến đổi riêng thành phần (biến đổi Wavelet). ................................................ 20
3.3.4. Lƣợng tử hoá - Giải lƣợng tử hoá. .................................................................. 20
3.3.5. Mã hoá và kết hợp dịng dữ liệu sau mã hố. .................................................. 21
3.3.6. Phƣơng pháp mã hoá SPIHT. ......................................................................... 21
3.3.7. Phƣơng pháp mã hoá EZW. ............................................................................ 23
3.4. So sánh chuẩn JPEG2000 với JPEG và các chuẩn nén ảnh tĩnh khác. ............ 24
CHƢƠNG 4 ỨNG DỤNG THỦY VÂN TRONG MÁY ẢNH KỸ THUẬT SỐ .................. 27
4.1. Giới thiệu về máy ảnh kỹ thuật số. ........................................................................ 27
4.2. Kỹ thuật thuỷ vân sử dụng phép biến đổi DWT. .................................................... 28
4.3. Đề xuất qui trình nén và thủy vân ảnh trong máy ảnh số........................................ 42

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên




iii

CÁC HÌNH VẼ, BẢNG BIỂU TRONG LUẬN VĂN
Hình 1.1 Sơ đồ bộ khái quát hệ thống nén ảnh

5

Hình 1.2. Sơ đồ minh hoạ kỹ thuật mã hoá băng con – M băng con

8


Hình 1.3. Sơ đồ bộ mã hố theo chuẩn JPEG

10

Hình 2.1. Minh hoạ lƣới nhị tố dyadic với các giá trị của m và n

14

Hình 3.1: Trình tự mã hoá (a) và giải mã JPEG2000 (b)

19

Bảng 3.1: So sánh JPEG và JPEG2000

25

Hình 4.1. Lƣợc đồ chung cho quá trình giấu tin

28

Hình 4.2. Lƣợc đồ chung cho quá trình giải mã.

29

Hình 4.3. Sơ đồ nhúng thuỷ vân.

32

Hình 4.4. Sơ đồ tách thuỷ vân.


33

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên




iv

THUẬT NGỮ TIẾNG ANH
CWT

Biến đổi Wavelet liên tục (Continuous

DCT

Wavelet Transform)
Biến đổi Cosine rời rạc (Discrete Cosine

DPCM

Transform)
Điều xung mã vi sai (Differized Pulse Code

DWT

Modulation)
Biến đổi Wavelet rời rạc (Discrete Wavelet

EZW


Transform)
Wavelet cây

IDWT

Wavelet)
Biến đổi Wavelet rời rạc ngƣợc

zero

(Embedded

Zerotree

JPEG

Chuẩn nén ảnh của ủy ban JPEG quốc tế
(Joint Photographic Experts Group)

JPEG2000
MRA

Chuẩn nén ảnh JPEG2000
Phân tích đa phân giải (Multi Resolution

MSE

Analysis)
Sai số bình phƣơng trung bình (Mean Square


PCM

Error)
Điều xung mã (Pulse Code Modulation)

PSNR

Tỷ số tín hiệu đỉnh trên nhiễu (Peak Signal to
Noise Ratio)

RLC
SPIHT

Mã hoá loạt dài (Run Length Coding)
Phƣơng pháp mã hoá phân cấp theo vùng

STFT

(Set partitioning in hierarchical trees)
Biến đổi Fourier thời gian ngắn (Short
Time Fourier Transform)

Wavelet
Wavelet Decomposition Tree

Biến đổi băng con Wavelet
Cây phân giải Wavelet

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên





1

MỞ ĐẦU
Trong thời đại của Internet, thông tin ngày càng đƣợc sử dụng rộng rãi
và lƣợng thông tin đƣợc trao đổi qua mạng càng lớn mạnh. Tuy nhiên, với
lƣợng thông tin lớn nhƣ vậy thì nguy cơ truy cập dữ liệu trái phép cũng tăng
lên. Vì thế, nhu cầu đảm bảo an toàn và bảo vệ bản quyền và sở hữu trí tuệ
sản phẩm đang là một nhu cầu cấp thiết. Một trong những giải pháp hữu hiệu
cho vấn đề này là giấu thông điệp vào những phƣơng tiện chứa. Phƣơng tiện
chứa đƣợc dùng phổ biến là các bức ảnh.
Ngày nay, hầu hết các bức ảnh đều đƣợc chụp bằng các máy ảnh kỹ
thuật số. Để thu gọn độ lớn của các files ảnh, ngƣời ta đã sử dụng các kỹ
thuật nén dữ liệu khác nhau và phát sinh ra các định dạng ảnh tƣơng ứng.
Các kỹ thuật này có thể đƣợc nhúng trực tiếp vào trong ảnh và là một khâu
trong qui trình tạo ảnh.
Luận văn này nghiên cứu và đề xuất một kỹ thuật thủy vân các bức ảnh
số ngay trong qui trình tạo ảnh đƣợc nén bằng kỹ thuật sóng nhỏ rời rạc
DWT nhƣ là một minh chứng cho bản quyền tác giả khi cần thiết. So với các
kỹ thuật nén sử dụng phép biến đổi nhƣ biến đổi Fourier (FT), biến đổi
cosine rời rạc (DCT), biến đổi xếp chồng (LT),.., biến đổi Wavelet (DWT)
có nhiều ƣu điểm khơng chỉ trong xử lý ảnh mà cịn nhiều ứng dụng khác.
Bằng chứng là sự ra đời của chuẩn nén JPEG2000 (dựa trên DWT) có tính
năng vƣợt trội so với JPEG (DCT). Tuy nhiên chuẩn JPEG, MPEG hay ngay
cả JPEG2000 cũng chỉ tập trung vào hiệu quả nén (tỉ số nén) và chất lƣợng.
Trong luận văn trình bầy một kỹ thuật nén ảnh sử dụng biến đổi Wavelet
hiệu năng đem lại hiệu quả nén, chất lƣợng hình ảnh.


Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên




2

 Cơ sở nghiên cứu và mục đích của luận văn
Để có thể sử dụng các dịch vụ Internet và các thơng tin số rộng rãi cần
có một kỹ thuật, một công nghệ mang lại nhiều hứa hẹn trong ứng dụng bảo
vệ bản quyền, không bị biến dạng, điều khiển truy cập đối với các dữ liệu đa
phƣơng tiện. Phƣơng pháp giảm kích thƣớc dữ liệu bằng các kỹ thuật nén là
một cách tiếp cận hiệu quả giải quyết các khó khăn trên.
Mặc dù cho đến nay có rất nhiều kỹ thuật nén dữ liệu đa phƣơng tiện
nhƣ: chuẩn JPEG (dựa trên biến đổi DCT), chuẩn JPEG2000 (dựa trên
biến đổi Wavelet) và chuẩn MPEG, tuy nhiên những kỹ thuật này chỉ tập
trung vào hiệu quả nén và cố gắng đánh mất chất lƣợng ảnh ít vì thế chúng
bỏ qua vấn đề tiêu hao năng lượng trong quá trình nén và truyền. Luận văn
này trình bầy một kỹ thuật hiệu quả để khắc phục những khó khăn trên cho
dữ liệu đa phƣơng tiện. Đó là kỹ thuật nén ảnh sử dụng biến đổi Wavelet
thích nghi, hiệu năng cho dữ liệu đa phƣơng tiện trong thông tin và kỹ
thuật nhúng thủy vân vào sản phẩm mà không ảnh hƣởng đến chất lƣợng và
bảo vệ bản quyền tác giả, đây là ứng dụng cơ bản bản nhất của kỹ thuật thủy
vân số. Một thơng tin nào đó mang ý nghĩa quyền sở hữu tác giả gọi là thủy
vân sẽ đƣợc nhúng vào trong các sản phẩm, thủy vân đó chỉ một mình ngƣời
chủ sở hữu hợp pháp các sản phẩm đó có và đƣợc dùng làm minh chứng cho
bản quyền sản phẩm.
 Tổ chức luận văn
Luận văn đƣợc trình bầy thành 4 chƣơng và 1 phụ lục.

Chƣơng 1 trình bầy khái quát các kỹ thuật nén ảnh, phân loại các
nguyên lý nén và định nghĩa một số thuật ngữ đƣợc sử dụng rộng rãi nhƣ
MSE, PSNR và SNR. Chƣơng này cũng trình bầy cơ sở lý thuyết của các

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên




3

ngun lý nén có tổn hao điển hình nhƣ: mã hoá băng con; mã hoá dựa
trên biến đổi cosine rời rạc (DCT), biến đổi xếp chồng (LT), biến đổi
Wavelet rời rạc (DWT).
Chƣơng 2, trình bầy cơ sở tốn học, tính chất của biến đổi Wavelet.
Nội dung của chƣơng này là lý thuyết nền tảng cho các ứng dụng Wavelet.
Chƣơng 3, giới thiệu tổng quan về chuẩn nén JPEG2000 dựa trên
biến đổi Wavelet. Và trong chƣơng này, trình bầy tóm tắt các bƣớc thực
hiện nén ảnh theo JPEG200 và so sánh nó với chuẩn JPEG và các chuẩn nén
ảnh tĩnh khác.
Chƣơng 4, t rình bày ứng dụng thủy vân trong máy ảnh kỹ thuật số.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên




4

CHƢƠNG 1

TỔNG QUAN VỀ CÁC KỸ THUẬT NÉN ẢNH
1.1. Giới thiệu chung về nén ảnh số
Nén ảnh số là một đề tài nghiên cứu rất phổ biến trong lĩnh vực xử lý
dữ liệu đa phƣơng tiện. Mục đích là làm thế nào để lƣu trữ bức ảnh dƣới
dạng có kích thƣớc nhỏ hơn hay dƣới dạng biểu diễn mà chỉ u cầu số bít
mã hố ít hơn so với bức ảnh gốc. Nén ảnh thực hiện đƣợc là do một thực
tế: thông tin trong bức ảnh không phải là ngẫu nhiên mà có trật tự, có tổ
chức. Vì thế nếu bóc tách đƣợc tính trật tự, cấu trúc đó thì sẽ biết đƣợc phần
thông tin nào quan trọng nhất trong bức ảnh để biểu diễn và truyền đi với
số lƣợng bít ít hơn so với ảnh gốc mà vẫn đảm bảo tính đầy đủ thơng tin. Ở
phía thu, q trình giải mã sẽ tổ chức, sắp xếp lại đƣợc bức ảnh xấp xỉ gần
chính xác so với ảnh gốc nhƣng vẫn thoả mãn chất lƣợng yêu cầu, đảm bảo
đủ thông tin cần thiết.
Tóm lại, tín hiệu ảnh, video hay audio đều có thể nén lại bởi chúng có
những tính chất nhƣ sau:
 Có sự tƣơng quan (dƣ thừa) thơng tin về không gian: Trong phạm vi
một bức ảnh hay một khung video tồn tại sự tƣơng quan đáng kể (dƣ
thừa) giữa các điểm ảnh lân cận.
 Có sự tƣơng quan (dƣ thừa) thông tin về phổ: Các dữ liệu thu đƣợc từ
các bộ cảm biến của thiết bị thu nhận ảnh tồn tại sự tƣơng quan đáng
kể giữa các mẫu thu, đây chính là sự tƣơng quan về phổ.
 Có sự tƣơng quan (dƣ thừa) thông tin về thời gian: Trong một
chuỗi ảnh video, tồn tại sự tƣơng quan giữa các điểm ảnh của các

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên




5


khung video (frame).
Sơ đồ của một hệ thống nén dữ liệu tổng quát nhƣ sau:

Hình 1.1 Sơ đồ bộ khái qt hệ thống nén ảnh

Trong hình1.1, bộ mã hố dữ liệu thực hiện q trình nén bằng cách
giảm kích thƣớc dữ liệu ảnh gốc đến một mức phù hợp với việc lƣu trữ và
truyền dẫn trên kênh. Tốc độ bít đầu ra của bộ mã hố đƣợc tính là số bít
cho một mẫu (điểm ảnh). Bộ mã hố kênh thực hiện việc chuyển đổi luồng
bít đã đƣợc nén thành dạng tín hiệu phù hợp cả cho việc lƣu trữ và truyền
dẫn, thƣờng bộ mã hoá kênh sử dụng các kỹ thuật: mã hố có độ dài thay
đổi – RLC (Run Length Coding)[4], mã hoá Huffman[4], mã hoá số học
[4]. Bộ giải mã thực hiện quá trình ngƣợc lại so với bộ mã hoá.
Trong các hệ thống nén, tỉ số nén chính là tham số quan trọng đánh giá
khả năng nén của hệ thống, cơng thức đƣợc tính nhƣ sau:
Tỉ số nén = Kích thước dữ liệu gốc / Kích thước dữ liệu nén
Đối với ảnh tĩnh, kích thước chính là số bít để biểu diễn tồn bộ bức
ảnh. Đối với ảnh video, kích thước chính là số bít để biểu diễn một
khung hình video (video frame).
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên




6

1.2. Phân loại các kỹ thuật nén
Các kỹ thuật nén chủ yếu đƣợc phân loại nhƣ sau:
1.2.1. Nén tổn hao và không tổn hao

Trong các kỹ thuật nén không tổn hao (losses compression), ảnh
khơi phục giống hồn tồn so với ảnh gốc. Tuy nhiên, nén không tổn hao
chỉ đạt đƣợc hiệu quả nén rất nhỏ. Trái lại, các kỹ thuật nén có tổn hao (lossy
compression) có thể đạt đƣợc hiệu quả nén cao hơn rất nhiều mà ở điều
kiện cảm nhận hình ảnh thơng thƣờng sự mất mát thơng tin khơng cảm
nhận đƣợc và vì thế vẫn đảm bảo chất lƣợng ảnh. Một số kỹ thuật nén có tổn
hao gồm: điều xung mã vi sai – DPCM, điều xung mã – PCM, lƣợng tử hoá
véctơ – VQ, mã hoá biến đổi và băng con. Ảnh khôi phục trong hệ thống nén
có tổn hao ln có sự suy giảm thơng tin so với ảnh gốc bởi vì: phƣơng pháp
nén này đã loại bỏ những thông tin dƣ thừa không cần thiết.
1.2.2. Mã hoá dự đoán và mã hoá dựa trên phép biến đổi
Đối với mã hoá dự đoán (predictive coding) các giá trị mang thông tin
đã đƣợc gửi hay đang sẵn có sẽ đƣợc sử dụng để dự đốn các giá trị khác, và
chỉ mã hoá sự sai lệch giữa chúng. Phƣơng pháp này đơn giản và rất phù
hợp với việc khai thác các đặc tính cục bộ của bức ảnh. Kỹ thuật DPCM
chính là một ví dụ điển hình của phƣơng pháp này. Trong khi đó, mã hố
dựa trên phép biến đổi (transform based coding) thì lại thực hiện nhƣ sau:
trƣớc tiên thực hiện phép biến đổi với ảnh để chuyển sự biểu diễn ảnh từ
miền không gian sang một miền biểu diễn khác. Các phép biến đổi
thƣờng dùng là: DCT - biến đổi Cosine rời rạc, DWT - biến đổi Wavelet rời
rạc, LT - biến đổi trồng (lapped) , tiếp đó thực hiện mã hố đối với các hệ số
biến đổi. Phƣơng pháp này có hiệu suất nén cao hơn rất nhiều so với
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên




7

phƣơng pháp nén dự đốn bởi vì chính các phép biến đổi (sử dụng các

thuộc tính nén năng lƣợng của mình) đã gói gọn tồn bộ năng lƣợng bức
ảnh chỉ bằng một số ít các hệ số, số lớn các hệ số cịn lại ít có ý nghĩa hơn sẽ
bị loại bỏ sau khi lƣợng tử hoá.
1.2.3. Mã hoá băng con
Bản chất của kỹ thuật mã hoá băng con (subband coding) là chia băng
tần của tín hiệu (ảnh) thành nhiều băng con (subband). Để mã hoá cho mỗi
băng con, chúng ta sử dụng một bộ mã hoá và một tốc độ bít tƣơng ứng với
tính chất thống kê của băng con.

1.3. Tiêu chuẩn đánh giá chất lƣợng mã hoá ảnh
Để đánh giá chất lƣợng của bức ảnh (hay khung ảnh video) ở đầu ra của
bộ mã hoá, ngƣời ta thƣờng sử dụng hai tham số: Sai số bình phƣơng trung
bình – MSE (mean square error) và tỉ số tín hiệu trên nhiễu đỉnh – PSNR
(peak to signal to noise ratio). MSE thƣờng đƣợc gọi là phƣơng sai lƣợng tử.
Một tham số khác hay sử dụng trong các hệ thông viễn thơng đó là tỉ số
tín hiệu trên nhiễu - SNR.

1.4. Các kỹ thuật nén có tổn hao
Trong phần này, trình bày hai kỹ thuật nén tổn hao cho nén ảnh tĩnh và
ảnh động đó là: mã hố băng con (subband coding) và mã hoá sử dụng phép
biến đổi (transform coding). Đây là hai kỹ thuật nén điển hình và cho hiệu quả
nén cũng nhƣ chất lƣợng ảnh cao.
1.4.1. Kỹ thuật mã hố băng con
Tƣ tƣởng chính của kỹ thuật mã hoá băng con là: các ảnh đƣợc lấy mẫu
ở đầu vào đƣợc phân ly thành các băng tần khác nhau (gọi là các tín hiệu băng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên





8

con). Yêu cầu của kỹ thuật này là làm thế nào các băng con không bị chồng
chéo lên nhau. Để có thể phân ly tín hiệu ở bộ mã hố (encoder) thành các
băng con, ảnh đƣợc cho qua một bank lọc (filter bank) gọi là bank lọc phân
tích và mỗi đầu ra của bank lọc băng con đƣợc lấy mẫu xuống hệ số 2. Các
đầu ra băng con tần số đƣợc lẫy mẫu xuống sẽ lần lƣợt đƣợc: lƣợng tử hố độc
lập bằng các bộ lọc vơ hƣớng khác nhau, mã hố entropy, lƣu trữ và truyền đi.
Ở phía bộ giải mã (decoder), quá trình đƣợc thực hiện ngƣợc lại: giải lƣợng tử
băng con tần số, lấy mẫu lên với hệ số 2, cho đi qua bank lọc băng con tổng
hợp rồi cộng tất cả các đầu ra của bộ lọc để khơi phục lại ảnh.
Hình 1.2 dƣới đây là sơ đồ tổng qt giải thích kỹ thuật mã hố băng
con.

Hình 1.2. Sơ đồ minh hoạ kỹ thuật mã hố băng con – M băng con

Trong các hệ thống mã hóa băng con hai chiều thực tế, ngƣời ta chia
miền tần số - không gian hai chiều của ảnh gốc thành các băng khác nhau ở
bất kỳ mức nào.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên




9

1.4.2. Kỹ thuật mã hóa dựa trên phép biến đổi
Một phép biến đổi là một hàm toán học đƣợc sử dụng để biến đổi một
tập các giá trị này thành một tập giá trị khác và tạo ra một cách biểu diễn mới

cho cùng một nguồn tin. Tất cả các phép biến đổi trình bầy dƣới đây đều là
khơng tổn hao (lossless); với sự chính xác của các phép tốn số học thì các
phép biến đổi vẫn bảo tồn đƣợc độ chính xác ở bất kỳ mức độ nào. Nhƣng hầu
hết các kỹ thuật mã hố đều có tổn hao ở bƣớc lƣợng tử hóa do có sự làm trịn
giá trị cho các hệ số phép biến đổi.
1.4.2.1. Kỹ thuật mã hóa dựa trên phép biến đổi DCT
Phép biến đổi cosine rời rạc – DCT (Discrete Cosine Transform) biến
đổi thông tin ảnh từ miền không gian sang miền tần số để có thể biểu diễn
dƣới dạng gọn hơn. Để hiểu rõ kỹ thuật này trƣớc hết ta cần tìm hiểu biến đổi
Fourier.
* Biến đổi Fourier – FT
Biến đổi Fourier – FT (Fourier Transform) là một phép biến đổi thuận
nghịch, nó cho phép sự chuyển đổi thuận – nghịch giữa thông tin và tín hiệu
đƣợc xử lý. Phép biến đổi FT cũng có thể đƣợc áp dụng cho tín hiệu khơng ổn
định (non-stationary) nếu chỉ quan tâm đến thành phần phổ nào có trong tín
hiệu mà khơng quan tâm đến khi nào xuất hiện trong tín hiệu. Tuy nhiên, nếu
thơng tin về thời gian xuất hiện của phổ trong tín hiệu là cần thiết, thì phép
biến đổi FT khơng có khả năng đáp ứng đƣợc yêu cầu này, đây là hạn chế của
phép biến đổi này.
* Nén và giải nén ảnh dựa theo phép biến đổi DCT trong JPEG
JPEG là chuẩn nén số quốc tế đầu tiên cho các ảnh tĩnh có tơng màu
liên tục gồm cả ảnh đơn sắc và ảnh màu. Trong kỹ thuật này các khối ảnh kích

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên




10


thƣớc 8x8 đƣợc áp dụng để thực hiện DCT, sau đó lƣợng tử hố các hệ số rồi
mã hố entropy sau lƣợng tử.
Đối với những ảnh màu RGB, để áp dụng kỹ thuật nén này, trƣớc hết
phải chuyển sang chế độ màu YUV (Y là thành phần chói, U và V là 2 thành
phần màu). Thành phần độ chói là ảnh đơn sắc xám. Hai thành phần màu còn
lại chứa thơng tin về màu. Sơ đồ khối bộ mã hố và giải mã của JPEG nhƣ
sau:

Hình 1.3. Sơ đồ bộ mã hoá theo chuẩn JPEG

1.4.2.2. Kỹ thuật mã hoá dựa trên phép biến đổi DWT. Mối quan hệ giữa
biến đổi Wavelet và Fourier
Wavelet là phép biến đổi đƣợc sử dụng để phân tích các tín hiệu khơng
ổn định (non-stationary) – là những tín hiệu có đáp ứng tần số thay đổi theo
thời gian.
Để khắc phục những hạn chế của biến đổi FT, phép biến đổi Fourier
thời gian ngắn – STFT đƣợc đề xuất.
Trên cơ sở cách tiếp cận biến đổi STFT, biến đổi Wavelet đƣợc phát
triển để giải quyết vấn đề về độ phân giải tín hiệu mà STFT vẫn cịn hạn chế.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên




11

Biến đổi Wavelet đƣợc thực hiện theo cách: tín hiệu đƣợc nhân với hàm
Wavelet rồi thực hiện biến đổi riêng rẽ cho các khoảng tín hiệu khác nhau
trong miền thời gian tại các tần số khác nhau. Cách tiếp cận nhƣ vậy cịn

đƣợc gọi là: phân tích đa phân giải – MRA (Multi Resolution Analysis): phân
tích tín hiệu ở các tần số khác nhau và cho các độ phân giải khác nhau.
MRA khi phân tích tín hiệu cho phép: phân giải thời gian tốt và phân giải
tần số kém ở các tần số cao; phân giải tần số tốt và phân giải thời gian kém ở các
tần số thấp.
* Biến đổi Wavelet rời rạc – DWT
Bƣớc này có thể hiểu phép biến đổi DWT nhƣ là áp dụng một tập các
bộ lọc: thông cao và thông thấp. Thiết kế các bộ lọc này tƣơng đƣơng nhƣ kỹ
thuật mã hoá băng con (subband coding). Tuy nhiên khác với mã hoá băng
con, các bộ lọc trong DWT đƣợc thiết kế phải có đáp ứng phổ phẳng,
trơn và trực giao.
Từ biến đổi DWT một chiều có thể mở rộng định nghĩa biến đổi DWT
hai chiều theo cách: Sử dụng các bộ lọc riêng biệt, thực hiện biến đổi
DWT một chiều dữ liệu vào (ảnh) theo hàng rồi thực hiện theo cột. Theo
cách này nếu thực hiện biến đổi DWT ở mức 1, sẽ tạo ra 4 nhóm hệ số
biến đổi.
* Hai thuật tốn nén sử dụng DWT điển hình.
Nén ảnh dựa trên biến đổi DWT đã có những cải tiến đáng kể, đó là
bƣớc đột phá sử dụng DWT để nén ảnh bắt đầu là kỹ thuật mã hoá – EZW
(embedded zero-tree wavelet).
Thuật toán EZW dựa trên khả năng khai thác các thuộc tính đa
phân giải của biến đổi Wavelet để đƣa ra một thuật tốn ít phức tạp trong

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên




12


tính tốn mà vẫn cho hiệu quả nén cao. Những cải tiến và nâng cấp của
EZW về sau đã ra đời một số thuật toán tƣơng tự

nhƣ: SPIHT

(set

partitationing in hierarchical tree – cây phân cấp phân tập) và ZTE
(zero-tree entropy coding – mã hố entropy cây zero).
Gần đây cịn có thêm một thuật tốn nữa đƣợc đề xuất đó là LS
(lifting scheme) sử dụng để tạo các biến đổi Wavelet số nguyên. Kỹ thuật
này sử dụng các bộ lọc Wavelet trực giao đem lại hiệu quả rất cao cho các
ứng dụng nén ảnh có tổn hao.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên




13

CHƢƠNG 2
CƠ SỞ LÝ THUYẾT CỦA BIẾN ĐỔI WAVELET
2.1. Cơ sở toán học.
2.1.1. Biến đổi Wavelet liên tục.
Biến đổi Wavelet liên tục (Continuous Wavelet Transform - CWT) của một
hàm

f tđƣợc bắt đầu từ một hàm Wavelet mẹ (mother Wavelet) t  . Hàm


Wavelet mẹ tcó thể là bất kỳ một hàm số thực hoặc phức liên tục nào thoả mãn
các tính chất sau đây:
- Tích phân suy rộng trên tồn bộ trục t của hàmt là bằng 0.
- Tích phân năng lƣợng của hàm trên toàn bộ trục t là một số hữu
hạn.
2.1.2. Biến đổi Wavelet rời rạc.
Việc tính tốn các hệ số Wavelet tại tất cả các tỉ lệ là một công việc hết
sức phức tạp. Để giảm thiểu cơng việc tính tốn ngƣời ta chỉ chọn ra một
tập nhỏ các giá trị tỉ lệ và các vị trí để tiến hành tính tốn. Q trình chọn
các tỷ lệ và các vị trí để tính tốn nhƣ trên tạo thành lƣới nhị tố
(dyadic). Một phân tích nhƣ trên hồn tồn có thể thực hiện đƣợc nhờ
biến đổi Wavelet rời rạc (DWT). Do đó, việc tính tốn biến đổi DWT thực
chất là sự rời rạc hoá biến đổi Wavelet liên tục (CWT); việc rời rạc hoá
đƣợc thực hiện với sự lựa chọn các hệ số a và b nhƣ sau:

a  2m ; b  2m n; m, n Z

(2.1)

Việc tính tốn hệ số của biến đổi Wavelet có thể dễ dàng thực hiện bằng
các băng lọc số nhiều nhịp đa kênh, một lý thuyết rất quen thuộc trong xử lý tín
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên




14

hiệu.
m = -2

m = -2










   

m = -2
m = -2





m = -2






Hình 2.1. Minh hoạ lƣới nhị tố dyadic với các giá trị của m và n

2.1.3. Tính chất của biến đổi Wavelet.

Biến đổi Fourier là một biến đổi đã và đang đƣợc áp dụng rộng rãi
trong nhiều ngành khoa học và kỹ thuật khác nhau. Biến đổi Fourier
chuyển một hàm tín hiệu từ miền thời gian sang miền tần số. Sử dụng biến
đổi Fourier ta có thể biết đƣợc trong tín hiệu f(t)có các thành phần tần số
nào. Tuy nhiên biến đổi Fourier có một nhƣợc điểm cơ bản là với một tín
hiệu f(t) ta khơng thể biết đƣợc rằng tại một thời điểm t thì tín hiệu có các
thành phần tần số nào. Một phép biến đổi tốt hơn biến đổi Fourier phải là
phép biến đổi có đầy đủ tính năng của biến đổi Fourier và có khả năng xác
định xem tại một thời điểm t bất kỳ trong tín hiệu f(t) có thành phần tần số
nào. Phép biến đổi Wavelet ra đời đã khắc phục đƣợc các nhƣợc điểm của
biến đổi Fourier trong phân tích tín hiệu. Biến đổi Wavelet dù chỉ làm việc
với các tín hiệu một chiều (liên tục hoặc rời rạc) nhƣng sau khi biến đổi
xong ta thu đƣợc một hàm số hai biến hoặc một tập các cặp giá trị W  a, b
minh họa các thành phần tần số khác nhau của tín hiệu xảy ra tại thời
điểm t . Các giá trị W  ai , b  tạo thành một cột (i=1, 2,...., n) cho biết một
thành phần tần số có trong những thời điểm t nào và các giá trị W  a, bi tạo
thành hàng cho biết tại một thời điểm t của tín hiệu f(t) có các thành phần
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên




15

tần số nào.
Tham số b trong biến đổi Wavelet cho biết khoảng dịch của hàm
Wavelet mẹ và độ phân giải các tần số khác nhau của f t đƣợc minh họa bởi hệ
tỷ lệ chính là a. Biến đổi Wavelet ngày càng đƣợc áp dụng rộng rãi đặc biệt là
trong xử lý tiếng nói, xử lý ảnh số. Xử lý tín hiệu ảnh số là xử lý tín hiệu hai
chiều và do đặc điểm của ảnh số là bao giờ cũng có tính định hƣớng và tính

định vị. Tính định hƣớng của một ảnh nghĩa là trong ảnh bao giờ cũng có một
số ít các thành phần tần số nhƣng các thành phần tần số này trải rộng trên toàn
bộ khơng gian ảnh cịn tính định vị của ảnh chính là tính chất biểu thị rằng tại
một vùng của ảnh có thể có rất nhiều thành phần tần số. Ảnh biểu thị tính định
vị rõ nhất chính là ảnh có nhiều biên vùng phân tách rõ rệt, tại các đƣờng biên
bao giờ cũng có nhiều thành phần tần số khác nhau, cịn hầu hết các ảnh có
tơng liên tục đều là những ảnh có tính định hƣớng.

2.2. Giới thiệu một số họ Wavelet.
2.2.1. Biến đổi Wavelet Haar.
Biến đổi Haar Wavelet là biến đổi đơn giản nhất trong các phép
biến đổi Wavelet. Hình vẽ 2.3 cho thấy dạng của hàm  t với biến đổi
Haar. Do tính chất đơn giản của biến đổi Haar mà nó đƣợc ứng dụng
tƣơng đối nhiều trong nén ảnh, khi áp dụng biến đổi này để nén ảnh thì
thuật tốn nén ảnh trên máy tính có một số điểm khác với cơng thức tốn
học của biến đổi Haar.
2.2.2. Biến đổi Wavelet Meyer.
Yves Meyer là một trong những nhà khoa học đã đặt nền móng cho
phép biến đổi Wavelet. Phép biến đổi Wavelet mang tên Meyer cũng là
một phép biến đổi thơng dụng, biến đổi này có khả năng phân tích tín
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên




16

hiệu tốt hơn nhiều so với biến đổi Haar.
2.2.3. Biến đổi Wavelet Daubechies.
Giống nhƣ Meyer, Daubechies cũng là một nhà khoa học có cơng

lao to lớn trong việc nghiên cứu phát triển phép biến đổi Wavelet. Biến
đổi Daubechies là một trong những phép biến đổi phức tạp nhất trong
biến đổi Wavelet. Họ biến đổi này đƣợc ứng dụng hết sức rộng rãi, biến
đổi Wavelet áp dụng trong JPEG2000 là một biến đổi trong họ biến đổi
Wavelet Daubechies.

2.3. Một số ứng dụng nổi bật của Wavelet.
Phần này chỉ nêu ra các lĩnh vực mang tính chất tổng quát các ứng
dụng của Wavelet với tính chất giới thiệu và gợi mở.
2.3.1. Nén tín hiệu.
Do đặc điểm của mình, Wavelet đặc biệt tốt khi sử dụng để nén hay
phân tích các tín hiệu khơng dừng; đặc biệt là tín hiệu ảnh số và các ứng
dụng nén tiếng nói, nén dữ liệu. Việc sử dụng các phép mã hoá băng con,
băng lọc số nhiều nhịp và biến đổi Wavelet rời rạc tƣơng ứng với loại tín
hiệu cần phân tích có thể mang lại những hiệu quả rất rõ rệt trong nén tín
hiệu. Do tính chất chỉ tồn tại trong các khoảng thời gian rất ngắn (khi
phân tích tín hiệu trong miền thời gian tần số) mà các hệ số của biến đổi
Wavelet có khả năng tập trung năng lƣợng rất tốt vào các hệ số biến đổi.
Các hệ số mang thông tin chi tiết của biến đổi Wavelet thƣờng rất nhỏ và có
thể bỏ qua mà khơng ảnh hƣởng tới việc mã hố dữ liệu (trong phƣơng pháp
mã hố ảnh hay tiếng nói là những tín hiệu cho phép mã hố có tổn thất
thơng tin).

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên




17


2.3.2. Khử nhiễu.
Tính chất của biến đổi Wavelet mà chúng ta đã xét tới trong phần ứng
dụng cho nén tín hiệu đƣợc mở rộng bởi Iain Johnstone và David
Donohos trong các ứng dụng khủ nhiễu cho tín hiệu. Phƣơng pháp khử
nhiễu này đƣợc gọi là Wavelet Shrinkage Denoising (WSD). Ý tƣởng cơ
bản của WSD dựa trên việc tín hiệu nhiễu sẽ lộ rõ khi phân tích bằng biến đổi
Wavelet ở các hệ số biến đổi bậc cao. Việc áp dụng các ngƣỡng loại bỏ
tƣơng ứng với các bậc cao hơn của hệ số Wavelet sẽ có thể dễ dàng loại
bỏ nhiễu trong tín hiệu.
2.3.3. Mã hố nguồn và mã hố kênh.
Sở dĩ Wavelet đƣợc ứng dụng trong mã hoá nguồn và mã hố kênh vì
trong mã hố nguồn thì chúng ta cần khả năng nén với tỷ lệ nén cao cịn
trong mã hố kênh thì cần khả năng chống nhiễu tốt. Biến đổi Wavelet
kết hợp với một số phƣơng pháp mã hoá nhƣ mã hoá Huffman hay mã hoá
số học có thể thực hiện đƣợc cả hai điều trên.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên




×