Tải bản đầy đủ (.docx) (26 trang)

BTL xử lý âm thanh hình ảnh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (385.06 KB, 26 trang )

BTL Xử lý âm thanh & hình ảnh
LỜI MỞ ĐẦU
Ngày nay, hầu hết các bức ảnh đều được chụp bằng các máy ảnh kỹ thuật số để
thu gọn độ lớn cảu các files ảnh, người ta sử dụng các kỹ thuật nén dữ liệu khác nhau và
phát sinh ra các định dạng ảnh tương ứng. Các kỹ thuật này có thể được nhúng trực tiếp
vào trong ảnh và là một khâu trong quy trình tạo ảnh.
Lớp KTTT&TT K52 Trang: 1
BTL Xử lý âm thanh & hình ảnh
Trong bài tập lớn này nhóm chúng em tập trung tìm hiều về kỹ thuật nén ảnh
JPEG2000. Là một kỹ thuật xử lý các bức ảnh bằng kỹ thuật sóng nhỏ rời rạc. So với các
kỹ thuật nén sử dụng phép biến đổi như phép biển đổi Fourier (FT), biến đổi cosine rời
rạc (DCT), biến đổi xếp chồng (LT),…., biến đổi Wavelet (DWT) có nhiều ưu điểm
không chỉ trong xử lý ảnh mà còn nhiều ứng dụng khác. Bằng chứng là sự ra đời của
chuẩn nén JPEG2000 (dựa trên DWT) có tính năng vượt trội so với JPEG (DCT). Tuy
nhiên chẩu nén JPEG (DCT), MPEG hay ngay cả JPEG2000 cũng chỉ tạp trung và hiệu
quả nén (tỉ số nén) và chất lượng. Nhóm đi tìm hiểu về kỹ thuật nén ảnh sử dụng biến đổi
Wavelet hiệu năng đem lại hiệu quả nén, chất lượng hình ảnh tốt.
Nội dung bài tập lớn:
Chương 1: Lý thuyết phép biến đổi Wavelet.
Chương 2: Trình bày cở sở toán học, tính chất của biến đổi Wavelet. Nội dung của
chương này là lý thuyết cho nền tảng cho các ứng dụng Wavelet. Giới thiệu tổng quan về
chuẩn nén JPEG2000 dựa trên biến đổi Wavelet. Và trong chương này, trình bày tóm tắt
các bước thực hiện nén ảnh theo JPEG2000 và so sánh nó với chuẩn JPEG và các chuẩn
nén tĩnh khác.
Chương 3: Ứng dụng của JPEG2000 vào kỹ thuật thủy vân trong máy ảnh kỹ thuật
số.
Thông qua đây nhóm chúng em cũng xin được trân trọng cám ơn cô: Nguyễn Thị
Hồng Nhung đã giúp đỡ nhóm chúng em hoàn thành bài tập lớn này. Vì chưa có nhiều
kiến thức cũng như bài còn có nhiều sai sót rất mong cô sẽ đóng góp ý kiến để nhóm có
thể hoàn thành tốt nhất nhiệm vụ của mình.
HÀ NỘI, ngày…tháng ….năm 2014


NHÓM SINH VIÊN THỰC HIỆN
Lớp KTTT&TT K52 Trang: 2
BTL Xử lý âm thanh & hình ảnh
Chương 1
Lý thuyết biến đổi WAVELET
1.1Biến đổi Wavelet liên tục
Biến đổi Wavelet liên tục (Continuous Wavelet Transform - CWT) của một hàm
f(t) được bắt đầu từ một hàm Wavelet mẹ ψ(t). Hàm Wavelet mẹ ψ(t) có thể là bất kỳ
một hàm số thực hoặc phức liên tục nào thoả mãn các tính chất sau đây:
Tích phân suy rộng trên toàn bộ trục t của hàm ψ(t) là bằng 0. Tức là:
(1)
Tích phân năng lượng của hàm trên toàn bộ trục t là một số hữu hạn, tức là:
(2)
Điều kiện (2) có nghĩa là hàm ψ(t) phải là một hàm bình phương khả tích nghĩa là
hàm ψ(t) thuộc không gian L
2
(R) các hàm bình phương khả tích.
Sau khi hàm Wavelet ψ(t) được lựa chọn, biến đổi Wavelet liên tục của một hàm
bình phương khả tích f (t) được tính theo công thức:
W(a, b) = (3)
Biến đổi này là một hàm của hai tham số thực a và b. Dấu * ký hiệu là liên hiệp
phức của ψ(t). Nếu chúng ta định nghĩa một hàm ψ
a,b
(t) theo biểu thức:
ψ
a,b
(t) = (4)
chúng ta có thể viết được:
W(a, b) = (5)
Theo toán học ta gọi đây là tích vô hướng của hai hàm f (t) và ψ

a,b
(t). Giá trị là hệ
số chuẩn hoá để đảm bảo rằng tích phân năng lượng của hàm ψ
a,b
(t) sẽ độc lập với a và
b :
(6)
Lớp KTTT&TT K52 Trang: 3
BTL Xử lý âm thanh & hình ảnh
Với mỗi giá trị của a thì ψ
a,b
(t) là một bản sao của ψ
a,0
(t) được dịch đi b đơn vị
trên trục thời gian. Do đó b được gọi là tham số dịch. Đặt tham số dịch b = 0 ta thu được:
ψ
a,b
(t) = (7)
điều đó cho thấy rằng a là tham số tỷ lệ.
Khi a > 1 thì hàm Wavelet sẽ được trải rộng còn khi 0 < a < 1 thì hàm sẽ được co
lại. Sau đây chúng ta sẽ định nghĩa phép biến đổi ngược của biến đổi Wavelet liên tục.
Gọi Ψ(ω) là biến đổi Fourier của ψ(t):
Ψ(ω) = (8)
Nếu W(a,b) là biến đổi CWT của f (t) bằng hàm Wavelet ψ(t), thì biến đổi ngược
của biến đổi CWT sẽ được tính như sau:
f(t) = W(a,b)ψ
(a,b)
(t)dadb (9)
với giá trị của C được định nghĩa là:
C = (10)

Biến đổi CWT chỉ tồn tại nếu C dương và hữu hạn. Do đó C được gọi là điều kiện
tồn tại của biến đổi Wavelet. Chúng ta có thể xem biến đổi CWT như là một ma trận hai
chiều các kết quả của phép tính tích vô hướng giữa hai hàm f (t) và ψ
a,b
(t). Các hàng của
ma trận tương ứng với các giá trị của a và các cột tương ứng với các giá trị của b do cách
tính biến đổi Wavelet theo tích vô hướng đã trình bày ở trên:
[f(t), g(t)] = (t)dt =>[f(t), ψ
a,b
(t)] = ψ
a,b
(t)dt (11)
1.2. Biến đổi Wavelet rời rạc
Việc tính toán các hệ số Wavelet tại tất cả các tỉ lệ là một công việc hết sức phức tạp.
Nếu tính toán như vậy sẽ tạo ra một lượng dữ liệu khổng lồ. Để giảm thiểu công việc tính
toán người ta chỉ chọn ra một tập nhỏ các giá trị tỉ lệ và các vị trí để tiến hành tính toán.
Hơn nữa nếu việc tính toán được tiến hành tại các tỷ lệ và các vị trí trên cơ sở luỹ thừa cơ
số 2 thì kết quả thu được sẽ hiệu quả và chính xác hơn rất nhiều. Quá trình chọn các tỷ lệ
và các vị trí để tính toán như trên tạo thành lưới nhị tố (dyadic). Một phân tích như trên
hoàn toàn có thể thực hiện được nhờ biến đổi Wavelet rời rạc (DWT). Do đó, việc tính
toán biến đổi DWT thực chất là sự rời rạc hoá biến đổi Wavelet liên tục (CWT);
việc rời rạc hoá được thực hiện với sự lựa chọn các hệ số a và b như sau:
Lớp KTTT&TT K52 Trang: 4
BTL Xử lý âm thanh & hình ảnh
a = 2
m
; b = 2
m
n; m, n ϵ Z (12)
Việc tính toán hệ số của biến đổi Wavelet có thể dễ dàng thực hiện bằng các băng

lọc số nhiều nhịp đa kênh, một lý thuyết rất quen thuộc trong xử lý tín hiệu.
1.3. Tính chất của biến đổi Wavelet
Tất cả chúng ta đều biết rằng biến đổi Fourier là một biến đổi đã và đang được áp
dụng rộng rãi trong nhiều ngành khoa học và kỹ thuật khác nhau. Biến đổi Fourier
chuyển một hàm tín hiệu từ miền thời gian sang miền tần số. Sử dụng biến đổi Fourier ta
có thể biết được trong tín hiệu f(t) có các thành phần tần số nào. Tuy nhiên biến đổi
Fourier có một nhược điểm cơ bản là với một tín hiệu f (t) ta không thể biết được rằng tại
một thời điểm t thì tín hiệu có các thành phần tần số nào. Một phép biến đổi tốt hơn biến
đổi Fourier phải là phép biến đổi có đầy đủ tính năng của biến đổi Fourier và có khả năng
xác định xem tại một thời điểm t bất kỳ trong tín hiệu f(t) có thành phần tần số nào. Phép
biến đổi Wavelet ra đời đã khắc phục được các nhược điểm của biến đổi Fourier trong
phân tích tín hiệu. Biến đổi Wavelet dù chỉ làm việc với các tín hiệu một chiều (liên tục
hoặc rời rạc) nhưng sau khi biến đổi xong ta thu được một hàm số hai biến hoặc một tập
các cặp giá trị W(a,b) minh họa các thành phần tần số khác nhau của tín hiệu xảy ra tại
thời điểm t. Các giá trị W(a,b) tạo thành một cột (i=1, 2, , n) cho biết một thành phần
tần số có trong những thời điểm t nào và các giá trị W(a,b) tạo thành hàng cho biết tại
một thời điểm t của tín hiệu f(t) có các thành phần tần số nào. Được nghiên cứu từ trước
những năm 80 của thế kỷ trước và cũng đã được ứng dụng trong một số ngành khoa học
và công nghệ khác nhau nhưng biến đổi Wavelet vẫn là một lĩnh vực đang và sẽ tiếp tục
được nghiên cứu và phát triển cũng như ứng dụng rộng rãi hơn nữa. Tham số b trong biến
đổi Wavelet cho biết khoảng dịch của hàm Wavelet mẹ và độ phân giải các tần số khác
nhau của f(t) được minh họa bởi hệ số tỷ lệ chính là a. Biến đổi Wavelet ngày càng được
áp dụng rộng rãi đặc biệt là trong xử lý tiếng nói, xử lý ảnh số. Tín hiệu tiếng nói là tín
hiệu một chiều nhưng do đặc điểm của tiếng nói là tín hiệu không dừng nên việc sử dụng
Fourier là không đủ để phân tích một cách đầy đủ các đặc trưng của tiếng nói. Khác với
tín hiệu tiếng nói, xử lý tín hiệu ảnh số là xử lý tín hiệu hai chiều và do đặc điểm của ảnh
số là bao giờ cũng có tính định hướng và tính định vị. Tính định hướng của một ảnh
nghĩa là trong ảnh bao giờ cũng có một số ít các thành phần tần số nhưng các thành phần
tần số này trải rộng trên toàn bộ không gian ảnh còn tính định vị của ảnh chính là tính
chất biểu thị rằng tại một vùng của ảnh có thể có rất nhiều thành phần tần số. Ảnh biểu

thị tính định vị rõ nhất chính là ảnh có nhiều biên vùng phân tách rõ rệt, tại các đường
biên bao giờ cũng có nhiều thành phần tần số khác nhau, còn hầu hết các ảnh có tông liên
tục đều là những ảnh có tính định hướng.
Lớp KTTT&TT K52 Trang: 5
BTL Xử lý âm thanh & hình ảnh
Ngoài ra người ta thường áp dụng một cách kết hợp biến đổi Wavelet với các hàm
Wavelet thích hợp với dạng tín hiệu cần khảo sát và phép phân tích đa phân giải để việc
xử lý tín hiệu tiếng nói và hình ảnh đạt hiệu quả cao hơn. Trước khi xem xét ứng dụng
của phân tích đa phân giải trong nén ảnh, chúng ta xem xét lý thuyết về đa phân giải
trong phân tích tín hiệu. Giả sử chúng ta cần xấp xỉ hoá một tín hiệu liên tục có dạng một
hàm bình phương khả tích f(x) bằng một tập các giá trị rời rạc (ví dụ hàm f(x) là hàm
cường độ sáng của ảnh). Phép xấp xỉ đơn giản thực hiện dựa trên lý thuyết phép lấy trung
bình và dựa vào hàm xấp xỉ là hàm φ(x) có dạng:
φ(x) = (13)
Việc tính toán các giá trị xấp xỉ của hàm f(x) theo hàm φ(x) sẽ được viết như sau:
A[f(x)] = φ(x-n) (14)
với f
n
là chính là giá trị xấp xỉ của hàm f(x) trong khoảng [n; n+1). Đây chính là giá trị
trung bình của hàm f(x) trong khoảng [n; n+1) được cho bởi biểu thức:
f
n
=
Như vậy chúng ta có thể xấp xỉ hoá hàm f(x) bằng một tập các hàm tương tự như
hàm φ(x) và phép xấp xỉ hoá hàm f(x) cho bởi:
A[f(x)] = φ(x-n)
Ở đây φ(x) được gọi là hàm trọng và φ(x) là hàm nội suy, để xấp xỉ φ(x) thoả mãn:
[φ(x), φ(x-n)] = δ[n]
Trong thực tế, hàm f(x) thường được giả thiết là có chu kỳ nguyên và chúng ta chỉ
cần một số hữu hạn các tổ hợp tuyến tính để xấp xỉ hoá hàm f(x). Chúng ta có thể thay

đổi độ phân giải của phép xấp xỉ bằng cách thay đổi hệ số tỷ lệ của các hàm φ(x) và φ(x).
Cho (x) = φ() và (x) = φ(), chúng ta có xấp xỉ:
[f(x)] = ()
của hàm f(x) là các phép chiếu trực giao của hàm f(x) lên không gian lấy {()} làm cơ sở.
Việc thay đổi giá trị của j sẽ làm thay đổi mức độ chính xác của phép xấp xỉ hàm f(x).
Hàm φ(x) được gọi là hàm tỷ lệ và chúng ta thấy hàm này có một tính chất đặc
biệt là các hàm ứng với độ phân giải thứ j (tức là có chiều rộng ) là trường hợp đặc biệt
của các hàm có độ phân giải thứ j + 1 (chiều rộng ) bởi vì các hàm có độ phân giải j có
thể dễ dàng biểu diễn từ các hàm có độ phân giải j + 1. Điều đó dẫn tới:
Lớp KTTT&TT K52 Trang: 6
BTL Xử lý âm thanh & hình ảnh

Vì vậy chúng ta có thể biểu diễn hàm f(x) theo các mức phân giải khác nhau dựa
trên các phép chiếu trực giao của hàm f(x) lên các không gian V
j
. Chính vì thế người ta
định nghĩa một phép phân tích đa phân giải như sau:
Một phân tích đa phân giải bao gồm một chuỗi không gian bao hàm nhau:
V
2
⊂ V
1
⊂ V
0
⊂ V
-1
⊂ V
-2

thoả mãn:

= L
2
(R)
= {0}
Tính bất biến tỷ lệ:
f(x) ϵ <=> f(2
j
x) ϵ V
0
Tính bất biến dịch:
f(x) ϵ <=> f(x-n) ϵ V
0
Tính tồn tại của cơ sở:
Tồn tại φ ∈ V
0
với {φ(x-n)|n ∈ Z } là một cơ sở trực chuẩn của V
0
Nếu chúng ta gọi A[f(x)] = proj[f(x)] là hình chiếu trực giao của f(x) lên V
m
, thì ta
có: [f(x)] = f(x)
Trên đây là cơ sở lý thuyết của phép phân tích đa phân giải với tín hiệu 1D tổng
quát. Việc áp dụng trong tín hiệu ảnh (tín hiệu 2D) có thể dễ dàng mở rộng từ việc phân
tích đa phân giải 1D.
1.4. Một số ứng dụng nổi bật của Wavelet
1.4.1. Nén tín hiệu
Do đặc điểm của mình, Wavelet đặc biệt tốt khi sử dụng để nén hay phân tích các
tín hiệu không dừng; đặc biệt là tín hiệu ảnh số và các ứng dụng nén tiếng nói, nén dữ
liệu. Việc sử dụng các phép mã hoá băng con, băng lọc số nhiều nhịp và biến đổi Wavelet
rời rạc tương ứng với loại tín hiệu cần phân tích có thể mang lại những hiệu quả rất rõ rệt

trong nén tín hiệu. Do tính chất chỉ tồn tại trong các khoảng thời gian rất ngắn (khi phân
tích tín hiệu trong miền thời gian tần số) mà các hệ số của biến đổi Wavelet có khả năng
Lớp KTTT&TT K52 Trang: 7
BTL Xử lý âm thanh & hình ảnh
tập trung năng lượng rất tốt vào các hệ số biến đổi. Các hệ số mang thông tin chi tiết của
biến đổi Wavelet thường rất nhỏ và có thể bỏ qua mà không ảnh hưởng tới việc mã hoá
dữ liệu.
1.4.2. Khử nhiễu
Tính chất của biến đổi Wavelet mà chúng ta đã xét tới trong phần ứng dụng cho
nén tín hiệu được mở rộng bởi Iain Johnstone và David Donohos trong các ứng dụng khủ
nhiễu cho tín hiệu. Phương pháp khử nhiễu này được gọi là Wavelet Shrinkage Denoising
(WSD). Ý tưởng cơ bản của WSD dựa trên việc tín hiệu nhiễu sẽ lộ rõ khi phân tích bằng
biến đổi Wavelet ở các hệ số biến đổi bậc cao. Việc áp dụng các ngưỡng loại bỏ tương
ứng với các bậc cao hơn của hệ số Wavelet sẽ có thể dễ dàng loại bỏ nhiễu trong tín hiệu.
1.4.3. Mã hóa nguồn và mã hóa kênh
Sở dĩ Wavelet được ứng dụng trong mã hoá nguồn và mã hoá kênh vì trong mã
hoá nguồn thì chúng ta cần khả năng nén với tỷ lệ nén cao còn trong mã hoá kênh thì cần
khả năng chống nhiễu tốt. Biến đổi Wavelet kết hợp với một số phương pháp mã hoá như
mã hoá Huffman hay mã hoá số học có thể thực hiện được cả hai điều trên. Vì thế sự sử
dụng biến đổi Wavelet trong mã hoá nguồn và mã hoá kênh là rất thích hợp.
Chương 2
Chuẩn nén ảnh tĩnh dựa trên biến đổi WAVELET –
JPEG2000
1.1. Lịch sử ra đời và phát triển chuẩn JPEG2000
Như chúng ta đã biết, sự ra đời của JPEG mang lại nhiều lợi ích to lớn về nhiều
mặt. JPEG có thể giảm nhỏ kích thước ảnh, giảm thời gian truyền và làm giảm chi phí xử
lý ảnh trong khi chất lượng ảnh là khá tốt. Tuy nhiên cho đến nay người ta mới chỉ ứng
dụng dạng thức nén có tổn thất thông tin của JPEG vì mã hoá không tổn thất của JPEG là
khá phức tạp. Để việc nén ảnh có hiệu quả hơn, Ủy ban JPEG đã đưa ra một chuẩn nén
ảnh mới là JPEG2000. JPEG2000 sử dụng biến đổi Wavelet và các phương pháp mã hoá

đặc biệt để có được ảnh nén ưu việt hơn hẳn JPEG. JPEG2000 hiện vẫn đang tiếp tục
được phát triển, nhưng phần I đã được tổ chức ISO chấp nhận là chuẩn nén ảnh quốc tế
Lớp KTTT&TT K52 Trang: 8
BTL Xử lý âm thanh & hình ảnh
áp dụng cho ảnh tĩnh. Chuẩn nén ảnh JPEG2000 mà xương sống là biến đổi Wavelet với
tính năng vượt trội so với JPEG chắc chắn sẽ được sử dụng trong các server nội dung để
chuyển đổi định dạng ảnh trong mạng di động. Chính vì thế, mục đích của chương này
không chỉ giới thiệu một chuẩn nén ảnh dựa trên biến đổi Wavelet phổ biến mà còn đưa
ra một lựa chọn nhằm giải quyết toàn cục bài toán đặt ra ơ phần mở đầu.
1.2. Các tính năng của JPEG2000
JPEG2000 có nhiều chức năng đặc biệt hơn mọi chuẩn nén ảnh tĩnh khác như
JPEG hay GIF. Dưới đây là các chức năng ưu việt của JPEG2000 so với các chuẩn nén
ảnh tĩnh khác
• Cho chất lượng ảnh tốt nhất khi áp dụng nén ảnh tĩnh có tổn thất.
• Sử dụng được với truyền dẫn và hiển thị luỹ tiến về chất lượng, độ phân
giải, các thành phần màu và có tính định vị không gian.
• Sử dụng cùng một cơ chế nén ảnh cho cả hai dạng thức nén.
• Truy nhập và giải nén tại mọi thời điểm trong khi nhận dữ liệu.
• Giải nén từng vùng trong ảnh mà không cần giải nén toàn bộ ảnh.
• Có khả năng mã hoá ảnh với tỷ lệ nén theo từng vùng khác nhau.
• Nén một lần nhưng có thể giải nén với nhiều cấp chất lượng tuỳ theo yêu
cầu của người sử dụng
Hiện tại, ISO và uỷ ban JPEG đã đưa ra khuyến nghị thay thế JPEG bằng
JPEG2000.
1.3. Các bước thực hiện nén ảnh theo chuẩn JPEG2000
Hình 1: Trình tự mã hoá (a) và giải mã JPEG2000 (b)
Lớp KTTT&TT K52 Trang: 9
BTL Xử lý âm thanh & hình ảnh
1.3.1. Xử lý trước biến đổi
Do sử dụng biến đổi Wavelet, JPEG2000 cần có dữ liệu ảnh đầu vào ở dạng đối

xứng qua 0. Xử lý trước biến đổi chính là giai đoạn đảm bảo dữ liệu đưa vào nén ảnh có
dạng trên. Ở phía giải mã, giai đoạn xử lý sau biến đổi sẽ trả lại giá trị gốc ban đầu cho
dữ liệu ảnh.
1.3.2. Biến đổi liên thành phần
Giai đoạn này sẽ loại bỏ tính tương quan giữa các thành phần của ảnh. JPEG2000
sử dụng hai loại biến đổi liên thành phần là biến đổi màu thuận nghịch (Reversible Color
Transform - RCT) và biến đổi màu không thuận nghịch (Irreversible Color Transform -
ICT) trong đó biến đổi thuận nghịch làm việc với các giá trị nguyên, còn biến đổi không
thuận nghịch làm việc với các giá trị thực. ICT và RCT chuyển dữ liệu ảnh từ không gian
màu RGB sang YCrCb. RCT được áp dụng trong cả hai dạng thức nén có tổn thất và
không tổn thất, còn ICT chỉ áp dụng cho nén có tổn thất. Công thức của biến đổi thuận và
ngược của hai phép biến đổi ICT và RCT cho ở phần phụ lục. Việc áp dụng các biến đổi
này trước khi nén ảnh không nằm ngoài mục đích làm tăng hiệu quả nén. Các thành phần
Cr, Cb có ảnh hưởng rất ít tới sự cảm nhận hình ảnh của mắt trong khi thành phần độ
chói Y có ảnh hưởng rất lớn tới ảnh.
1.3.3. Biến đổi riêng thành phần (biến đổi Wavelet)
Biến đổi riêng thành phần được áp dụng trong JPEG2000 chính là biến đổi
Wavelet. Để đảm bảo tính toàn vẹn thông tin cũng phải áp dụng các phép biến đổi thuận
nghịch hoặc không thuận nghịch. Do phép biến đổi Wavelet không phải là một phép biến
đổi trực giao như biến đổi DCT mà là một phép biến đổi băng con nên các thành phần sẽ
được phân chia thành các băng tần số khác nhau và mỗi băng sẽ được mã hóa riêng rẽ.
JPEG2000 áp dụng biến đổi Wavelet nguyên thuận nghịch 5/3 (IWT) và biến đổi thực
không thuận nghịch Daubechies 9/7. Việc tính toán biến đổi trong JPEG2000 này sẽ được
thực hiện theo phương pháp Lifting (Công thức cụ thể của phương pháp Lifting và biến
đổi Wavelet trong JPEG2000 cho ở phần phụ lục). Sơ đồ của phương pháp Lifting 1D áp
dụng trong JPEG2000 trên hình 4.3.Việc tính toán biến đổi Wavelet 2D suy ra từ biến
đổi Wavelet 1D theo các phương pháp phân giải ảnh tuỳ chọn. Trong JPEG2000 có 3
phương pháp phân giải ảnh nhưng phương pháp được sử dụng nhiều nhất chính là
phương pháp kim tự tháp.
Lớp KTTT&TT K52 Trang: 10

BTL Xử lý âm thanh & hình ảnh
Hình 3:Phương pháp Lifting 1D dùng tính toán biến đổi Wavelet
Do biến đổi Wavelet 5/3 là biến đổi thuận nghịch nên có thể áp dụng cho
nén ảnh theo cả hai phương pháp, có tổn thất và không tổn thất trong khi biến đổi
9/7 chỉ áp dụng cho nén ảnh theo phương pháp có tổn thất thông tin.
1.3.4. Lượng tử hóa – Giải lượng tử hóa
Các hệ số của phép biến đổi sẽ được tiến hành lượng tử hoá. Quá trình lượng tử
hoá cho phép đạt tỷ lệ nén cao hơn bằng cách thể hiện các giá trị biến đổi với độ chính
xác tương ứng cần thiết với mức chi tiết của ảnh cần nén. Các hệ số biến đổi sẽ được
lượng tử hoá theo phép lượng tử hoá vô hướng. Các hàm lượng tử hoá khác nhau sẽ được
áp dụng cho các băng con khác nhau và được thực theo biểu thức:
V(x,y) = []sgnU(x,y)
với ∆ là bước lượng tử, U(x,y) là giá trị băng con đầu vào; V(x,y) là giá trị sau lượng tử
hoá. Trong dạng biến đổi nguyên, đặt bước lượng tử bằng 1.Với dạng biến đổi thực thì
bước lượng tử sẽ được chọn tương ứng cho từng băng con riêng rẽ. Bước lượng tử của
mỗi băng do đó phải có ở trong dòng bít truyền đi để phía thu có thể giải lượng tử cho
ảnh. Công thức giải lượng tử hoá là:
U(x,y) = [V(x,y)+rsgnV(x,y)] ∆
Lớp KTTT&TT K52 Trang: 11
BTL Xử lý âm thanh & hình ảnh
r là một tham số xác định dấu và làm tròn, các giá trị U(x,y); V(x,y) tương ứng là các
giá trị khôi phục và giá trị lượng tử hoá nhận được. JPEG2000 không cho trước r tuy
nhiên thường chọn r =
1.3.5. Mã hoá và kết hợp dòng dữ liệu sau mã hoá
JPEG2000 theo khuyến nghị của uỷ ban JPEG quốc tế có thể sử dụng nhiều
phương pháp mã hoá khác nhau cũng như nhiều cách biến đổi Wavelet khác nhau để có
thể thu được chất lượng ảnh tương ứng với ứng dụng cần xử lý. Điều này giúp cho
JPEG2000 mềm dẻo hơn nhiều so với JPEG. Việc áp dụng các phương pháp mã hoá khác
nhau cũng được mở rộng sang lĩnh vực nén ảnh động bằng biến đổi Wavelet. Trong thực
tế các phương pháp mã hoá ảnh được áp dụng khi nén ảnh bằng biến đổi Wavelet cũng

như JPEG2000 thì có hai phương pháp được coi là cơ sở và được áp dụng nhiều nhất:
phương pháp SPIHT và phương pháp EZW. Hiện nay JPEG2000 vẫn được áp dụng mã
hoá bằng hai phương pháp này và một phương pháp phát triển từ hai phương pháp này là
phương pháp mã hoá mặt phẳng bít. Vì thế ở đây chúng ta sẽ xem xét hai phương pháp
này. Việc kết hợp dòng dữ liệu sau mã hoá của JPEG2000 thực chất là để thực hiện các
tính năng đặc biệt của JPEG2000 như tính năng ROI v.v
1.3.6. Phương pháp mã hoá SPIHT
Có thể thấy rằng dù áp dụng biến đổi Wavelet nào hay cùng với nó là một phép
phân giải ảnh nào thì trong các băng con có số thứ tự thấp cũng là những thành phần tần
số cao (mang thông tin chi tiết của ảnh) trong khi những băng con có số thứ tự cao hơn
thì sẽ chứa những thành phần tần số thấp (mang thông tin chính về ảnh). Điều đó nghĩa là
các hệ số chi tiết sẽ giảm dần từ băng con mức thấp (HH1 chẳng hạn) (ứng với thành
phần tần số cao) xuống băng con mức cao (ứng với thành phần tần số thấp) và có tính
tương tự về không gian giữa các băng con, ví dụ như một đường biên của hình vẽ trong
ảnh sẽ tồn tại ở cùng một vị trí trên các băng con đó (tương ứng với mức độ phân giải của
băng con ấy). Điều này đã dẫn tới sự ra đời của phương pháp SPIHT (Set partitioning in
hierarchical trees - phương pháp mã hoá phân cấp theo phân vùng). Phương pháp SPIHT
được thiết kế tối ưu cho truyền dẫn luỹ tiến. Điều này có nghĩa là tại mọi thời điểm trong
quá trình giải nén ảnh theo phương pháp mã hoá này thì chất lượng ảnh hiển thị tại thời
điểm ấy là tốt nhất có thể đạt được với một số lượng bít đưa vào giải mã tính cho tới thời
điểm ấy. Ngoài ra, phương pháp này sử dụng kỹ thuật embedded coding; điều đó có
nghĩa là một ảnh sau nén với kích cỡ (lưu trữ) lớn (tỷ lệ nén thấp) sẽ chứa chính dữ liệu
sau nén của ảnh có kích cỡ (lưu trữ) nhỏ (tỷ lệ nén cao). Bộ mã hoá chỉ cần nén một lần
nhưng có thể giải nén ra nhiều mức chất lượng khác nhau. Giả sử gọi các pixel trong một
ảnh p cần mã hoá là pi, j. Áp dụng một phép biến đổi Wavelet T nào đó cho các pixel
Lớp KTTT&TT K52 Trang: 12
BTL Xử lý âm thanh & hình ảnh
trong ảnh để tạo ra các hệ số của phép biến đổi Wavelet là ci, j. Các hệ số này tạo ra một
ảnh biến đổi là C. Phép biến đổi này được viết dưới dạng toán tử như sau: C=T(p). Trong
phương pháp truyền dẫn luỹ tiến với ảnh thì bộ mã hoá sẽ bắt đầu quá trình khôi phục

(giải nén) ảnh bằng cách đặt các giá trị của ảnh khôi phục từ các hệ số biến đổi là . Sử
dụng các giá trị giải mã của các hệ số biến đổi để tạo ra một ảnh khôi phục (vẫn chưa áp
dụng biến đổi ngược Wavelet) là và sau đó áp dụng biến đổi ngược Wavelet để tạo ra
ảnh cuối cùng là . Chúng ta có thể viết dưới dạng toán tử như sau: = T
-1
(). Nguyên tắc
quan trọng của phương pháp truyền dẫn ảnh theo kiểu luỹ tiến chính là phương pháp này
luôn truyền đi các giá trị mang thông tin quan trọng hơn của ảnh đi trước. Sở dĩ làm như
vậy là do các thông tin đó chính là các thông tin sẽ làm giảm thiểu nhiều nhất độ méo
dạng của ảnh (sự sai khác giữa ảnh gốc và ảnh khôi phục). Đây chính là lý do tại sao
phương pháp SPIHT luôn truyền đi các hệ số lớn trước và cũng là một nguyên tắc quan
trọng của phương pháp này. Một nguyên tắc nữa là các bít có trọng số lớn bao giờ cũng
mang thông tin quan trọng nhất trong dữ liệu nhị phân. Phương pháp SPIHT sử dụng cả
hai nguyên tắc này; nó sắp xếp các hệ số biến đổi và truyền đi các bít có trọng số lớn
nhất. Quá trình giải mã có thể dừng lại ở bất kỳ một bước nào ứng với giá trị ảnh cần mã
hoá yêu cầu. Đây chính là cách mà phương pháp mã hoá SPIHT làm tổn thất thông tin.
1.3.7. Phương pháp mã hoá EZW
Phương pháp mã hoá EZW (Embedded Zerotree Wavelet Encoder) cũng dựa trên
cơ sở phép mã hoá luỹ tiến (progressive coding) giống như phương pháp mã hoá SPIHT.
Phương pháp này chủ yếu dựa trên khái niệm về cây zero (zerotree). Về cơ bản, thuật
toán này dựa trên hai nguyên tắc như đã trình bày ở phần phương pháp mã hoá SPIHT.
Sau đây chúng ta sẽ xem xét các khái niệm cơ bản của thuật toán:
Cây tứ phân: Sau khi áp dụng biến đổi Wavelet ứng với các mức phân giải khác
nhau chúng ta có thể biểu diễn các hệ số biến đổi dưới dạng một cây. Ta thấy rằng với
cây biểu diễn này cứ mỗi nút cha thì có 4 nút con. Sở dĩ có được điều này là do quá trình
biến đổi Wavelet ở các tỷ lệ khác nhau. Ta gọi đây là các cây tứ phân (quadtree). Sơ đồ
cây tứ phân được minh hoạ ở hình 4:
Lớp KTTT&TT K52 Trang: 13
BTL Xử lý âm thanh & hình ảnh
Hình 4: Minh hoạ cây tứ phân (a) và sự phân mức (b)

Cây zero (zerotree): Cây zero là một cây tứ phân, trong đó tất cả các nút của nó
đều nhỏ hơn nút gốc. Một cây như vậy khi mã hoá sẽ được mã hoá bằng một đối tượng
duy nhất và khi giải mã thì chúng ta cho tất cả các giá trị bằng không. Ngoài ra để có thể
mã hoá được các hệ số Wavelet trong trường hợp này, giá trị của nút gốc phải nhỏ hơn
giá trị ngưỡng đang được xem xét ứng với hệ số Wavelet đó.
Sau khi có đủ các khái niệm cần thiết về cây tứ phân và cây zero, chúng ta có thể
trình bày nguyên lý hoạt động của thuật toán. Thuật toán sẽ mã hoá các hệ số theo thứ tự
giảm dần. Chúng ta sẽ dùng một giá trị gọi là ngưỡng (threshold) và sử dụng ngưỡng này
để tiến hành mã hoá các hệ số biến đổi. Các hệ số được mã hoá theo thứ tự từ vùng tần số
thấp đến vùng tần số cao. Và chỉ những hệ số có giá trị tuyệt đối lớn hơn hoặc bằng
ngưỡng thì mới được mã hoá. Tiếp theo giảm ngưỡng và tiếp tục làm như vậy cho tới khi
ngưỡng đạt tới một giá trị nhỏ hơn giá trị của hệ số nhỏ nhất. Cách giảm giá trị ngưỡng ở
đây thực hiện tương đối đặc biệt, giá trị của ngưỡng giảm xuống một nửa so với trước đó.
Bộ giải mã phải biết các mức ngưỡng này thì mới có thể giải mã ảnh thành công. Nhưng
khi ta đi từ nút cha đến nút con trong cây tứ phân thì nó vẫn có 3 nút con. Vậy ta phải đi
theo nhánh có nút con nào trước. Hay nói một cách đầy đủ hơn ta di chuyển từ hệ số này
đến hệ số khác theo thứ tự như thế nào. Có nhiều cách di chuyển khác nhau, tuy nhiên hai
cách di chuyển trên hình 5 được sử dụng nhiều nhất:
Lớp KTTT&TT K52 Trang: 14
BTL Xử lý âm thanh & hình ảnh
Hình 5: Hai cách sắp xếp thứ tự các hệ số biến đổi
Việc sắp xếp này còn phải được quy ước thống nhất giữa quá trình mã hoá và quá
trình giải mã để việc giải mã ảnh được thành công. Trên đây chỉ là nguyên lý cơ bản của
phương pháp mã hoá EZW. Chi tiết về thuật toán mã hoá có thể xem ở phần chương
trình. Hiện nay phương pháp mã hoá này được áp dụng ngày càng nhiều nén ảnh động.
Phương pháp này cho tỉ lệ nén và độ tin cậy giải mã cao. Ngoài ra phương pháp EZW rất
dễ triển khai trên máy tính bởi phương pháp này không yêu cầu việc lập trình quá phức
tạp.
2.4. So sánh chuẩn JPEG2000 với JPEG và các chuẩn nén ảnh tĩnh khác
Một tính năng quan trọng và là ưu điểm rõ nét nhất của JPEG2000 so với JPEG

cũng như các chuẩn nén ảnh khác như MPEG 4 VTC hay JPEG - LS v. v là JPEG2000
đưa ra cả hai kỹ thuật nén có tổn thất và không tổn thất theo cùng một cơ chế mã hoá
nghĩa là JPEG2000 thực hiện tất cả các dạng thức của JPEG chỉ bằng một cơ chế mã hoá
duy nhất. Nếu xét về sự tồn tại của hai kỹ thuật này thì JPEG cũng có khả năng nén ảnh
có tổn thất và không tổn thất thông tin. Tuy nhiên với JPEG thì cơ chế mã hoá với hai
dạng này là khác nhau và rất khó để sử dụng cả hai dạng này cùng lúc cho cùng một ứng
dụng. Do đó, có thể thấy rằng JPEG có tính mềm dẻo hơn bất kỳ chuẩn nén ảnh tĩnh nào
trước đây. Hơn thế, chúng ta đã thấy rằng tất cả các phương pháp thiết kế cho chuẩn
JPEG2000 đều ưu việt và có nhiều tính năng hơn so với JPEG; ngoài ra những thống kê
về thực tế cho thấy với cùng một tỷ lệ nén và một loại ảnh thì ảnh được nén bởi
JPEG2000 hầu như luôn có chất lượng tốt hơn so với JPEG. Chúng ta xem xét trên hình 6
Lớp KTTT&TT K52 Trang: 15
BTL Xử lý âm thanh & hình ảnh
để thấy rõ điều này, ảnh bên trái là ảnh ban đầu, ảnh ở giữa được nén theo JPEG2000 còn
ảnh bên phải được nén theo JPEG với tỉ lệ nén là 1:20
Hình 6: So sánh JPEG2000 và JPEG
Tính năng ưu việt thứ hai của JPEG2000 so với JPEG chính là trong dạng thức
nén có tổn thất thông tin, JPEG2000 có thể đưa ra tỷ lệ nén cao hơn nhiều so với JPEG.
Các phần mềm nén ảnh JPEG hiện tại (kể cả Photoshop) cũng chỉ thiết kế để có thể nén
được tới tỷ lệ 40:1 nhưng với JPEG2000 thì tỷ lệ nén có thể lên tới 200:1. Theo công
thức tính PSNR trong đơn vị dB, chúng ta có: (b là số bít dùng biểu diễn một pixel trên
ảnh gốc)
PSNR(dB) = -20log()
Tính năng ưu việt thứ 3 của JPEG2000 so với JPEG là chuẩn nén ảnh này có thể
hiển thị được các ảnh với độ phân giải và kích thước khác nhau từ cùng một ảnh nén. Với
JPEG thì điều này là không thể thực hiện được. Sở dĩ có điều này là do JPEG2000 sử
dụng kỹ thuật phân giải ảnh và mã hoá đính kèm mà chúng ta đã nói tới ở phần mã hoá
ảnh theo JPEG2000.
Tính năng này là một lợi thế đặc biệt quan trọng của JPEG2000, trong khi JPEG
cũng như các chuẩn nén ảnh tĩnh trước đây phải nén nhiều lần để thu được chất lượng với

Lớp KTTT&TT K52 Trang: 16
BTL Xử lý âm thanh & hình ảnh
từng lần nén khác nhau thì với JPEG2000 ta chỉ cần nén một lần còn chất lượng ảnh thì
sẽ được quyết định tuỳ theo người sử dụng trong quá trình giải nén ảnh theo JPEG2000.
Một tính năng ưu việt nữa của JPEG2000 là tính năng mã hoá ảnh quan trọng theo vùng
(ROI - Region of Interest) mà chúng ta đã đề cập trong phần mã hoá ảnh theo JPEG2000.
JPEG2000 còn có một khả năng đặc biệt ưu việt hơn so với JPEG, đó chính là khả
năng vượt trội trong khôi phục lỗi. Đó là khi một ảnh được truyền trên mạng viễn thông
thì thông tin có thể bị nhiễu; với các chuẩn nén ảnh như JPEG thì nhiễu này sẽ được thu
vào và hiển thị, tuy nhiên với JPEG2000, do đặc trưng của phép mã hoá có thể chống lỗi,
JPEG2000 có thể giảm thiểu các lỗi này tới mức hầu như không có.
Sau khi xem xét các tính năng vượt trội của JPEG2000 so với JPEG (chuẩn nén
ảnh thông dụng nhất hiện nay) chúng ta so sánh chức năng của JPEG2000 với một số
chuẩn nén ảnh như là JPEG - LS; PNG; MPEG 4 VTC qua bảng 4.2 (Dấu + biểu thị
chuẩn đó có chức năng tương ứng, số dấu + càng nhiều thì chuẩn đó thực hiện chức năng
tương ứng càng tốt) dấu - biểu thị chuẩn tương ứng không hỗ trợ tính năng đó)
Hình 7: So sánh tính năng của JPEG2000 với các chuẩn nén ảnh tĩnh khác
Lớp KTTT&TT K52 Trang: 17
BTL Xử lý âm thanh & hình ảnh
Từ bảng trên chúng ta có thể thấy các tính năng vượt trội và khả năng ưu việt của
JPEG2000 so với các chuẩn nén ảnh tĩnh trước đây.
Chương 3
Ứng dụng của JPEG2000 vào kỹ thuật thủy vân trong
máy ảnh kỹ thuật số.
Cuộc cách mạng thông tin kỹ thuật số đã đem lại những thay đổi sâu sắc trong
xã hội và cuộc sống của chúng ta. Những thuận lợi mà thông tin kỹ thuật số mang lại
cũng sinh ra những thách thức và cơ hội mới cho đổi mới. sự ra đời những phần mềm
có tính năng rất mạnh mẽ, các thiết bị mới như máy ảnh kỹ thuật số, máy quét chất
lượng cao, máy in, máy ghi âm kỹ thuật số, …đã tới với thế giới người tiêu dùng rộng
lớn để sáng tạo, xử lý và thưởng thức các dữ liệu đa phương tiện. Mạng Internet đã trở

thành một xã hội thông số nơi diễn ra các quá trình tráo đổi thông tin trong mọi lĩnh
vực chính trị, quân sự, quốc phòng, kinh tế,…Và chính trong môi trường mở và tiện
nghi như vậy xuất hiện những vấn nạn, tiêu cực đang rất cần đến các giải pháp hữu
hiệu cho vấn đề an toàn thông tin như nạn ăn cắp bản quyền, nạn xuyên tạc thông tin,
truy cập thông tin trái phép, …Đi tìm giải pháp cho những vấn đề này không chỉ giúp
hiểu thêm về công nghệ phức tạp đang phăt triển rất nhanh mà còn đưa ra những cơ
hội kinh tế mới. Trong nội dung chương này đi sâu vào ứng dụng của thủy vân vào
máy ảnh kỹ thuật số.
3.1. Giới thiệu về máy ảnh kỹ thuật số
Máy ảnh số là một máy điện tử dùng để thu và lưu giữ hình ảnh mọt cách tự
động thay vì phải dùng phim ảnh giống như máy chụp ảnh thường. Máy ảnh kỹ thuật
số được thiết kế dựa trên 2 nền tảng là nhiếp ảnh và tin học. Chơ tới nay thiết bị điện
tích kép “Charged- Couple Device gọi tắt là CCD” và “Complement Metal Oxide gọi
Lớp KTTT&TT K52 Trang: 18
BTL Xử lý âm thanh & hình ảnh
tắt là CMOS” được gọi chung là bộ phận cảm biến hình ảnh, đây có thể nói chính là
linh hồn của máy ảnh kỹ thuật sô.
Còn ảnh số là ảnh được hợp thành bởi các phần tử ảnh (pixels), các phần tử
ảnh này rất nhỏ.
Với máy ảnh kỹ thuật số thì ta có thể xem trực tiếp khi vừa chụp xong, thể hiện
qua màn hình LCD nhỏ nhắn nằm ở phía sau máy hoặc có thể nối máy với màn hình
tivi, máy tình, máy phóng, …
Hình ảnh chụp từ máy ảnh KTS được lưu trữ theo một định dạng ngày càng
phổ thông (lưu trữ trên các thẻ nhớ hoặc bộ nhớ trong của máy), khiến cho người
dùng có thể dễ dàng thuyên chuyển các hình ảnh giữa các loại thiết bị và các phần
mềm ứng dụng khác nhau. Ví dụ chèn trực tiếp vào văn bản (báo, bài học,…), gửi
hình bằng thư diện tử, đưa hình lên Web, …
Chính vì vậy những yếu tố này mà ảnh số ngày càng được sử dụng rộng rãi,
phổ biến.
3.2. Kỹ thuật thủy vân sử dụng phép biến đổi DWT

Giấu thông tin là một kỹ thuật nhúng (giấu) một lượng thông tin số nào đo vào
trong một đối tượng dữ liệu khác.
Dưới đây là mô hình của kỹ thuật giấu cơ bản được mô tả theo 2 hình vẽ sau:
Hình 3.1: Sơ lược đồ chung cho quá trình giấu tin.
Lớp KTTT&TT K52 Trang: 19
BTL Xử lý âm thanh & hình ảnh
Hình vẽ trên biểu diễn quá trình giấu tin cơ bản. Phương tiện chứa bao gồm các
đối tượng được dùng làm môi trường để giấu tin ảnh, thông tin giấu là một lượng
thông tin mang một ý nghĩa nào đó như ảnh, logo, đoạn văn bản,…tùy thuộc vào mục
đích của người sử dụng . Thông tin sẽ được giấu vào trong phương tiện chứa nhờ một
bộ nhúng, bộ nhúng là những chương trình triển khai các thuật toán để giấu tin và
được thực hiện với một khóa bí mật giống như các hệ mât mã cổ điển. Sau khi giấu tin
ta thu được phương tiện chứa bản tin đã giấu và phân phối sử dụng trên mạng.
Hình 3.2: Lược đồ chung cho quá trình giải mã
Hình vẽ chỉ ra các công việc giải mã thông tin đã giấu. Sau khi nhận được đối
tượng phương tiện chứa có giấu thông tin, quá trình giải mã được thực hiện thông qua
một bộ giải mã tương ứng với bộ nhúng thông tin cùng với khóa của quá trình nhúng,
Kết quả thu được gồm phương tiện chứa gốc và thông tin đã giấu. Bước tiếp theo
thông tin giấu sẽ được xử lý kiểm định so sánh với thông tin giấu ban đầu.
Kỹ thuật giấu thông tin nhằm mục đích đảm bảo tính an toàn và bảo mật thông
tin rõ rang ở hai khía cạnh. Một là bảo mật cho giữ liệu được đem giấu, hai là bảo mật
cho chính đối tượng được dùng để giấu tin. Hai khía cạnh khác nhau này dẫn đến hai
khuynh hướng kỹ thuật chủ yếu của kỹ thuật giấu tin. Khuynh hướng thứ nhất là giấu
tin mật. Khuynh hướng này tập trung vào các ký thuật giấu tin sao cho thông tin giấu
Lớp KTTT&TT K52 Trang: 20
BTL Xử lý âm thanh & hình ảnh
được nhiều và quan trọng là người khác khó phát hiện được một đối tượng có bị giấu
tin bên trong hay không. Khuynh hướng thứ hai là thủy vân số. Khuynh hướng thủy vân
số đánh dấu vào đối tượng nhằm khẳng định bản quyền sở hữu hay phát hiện xuyên tạc
thông tin. Thủy vân số có miền ứng dụng lớn hơn nên được quan tâm nghiên cứu nhiều

hơn và thực tế đã có nhiều những kỹ thuật dành cho khuynh hướng này. Mỗi ứng dụng
của thủy vân có yêu cầu riêng, do đó các kỹ thuật thủy vân cũng có những tính năng khác
biệt tương ứng.
Trong kỹ thuật giấu tin, thì thủy vân số đang được quan tâm nhiều. Khi thực hiện
thủy vân ảnh số thì cần phải có một số tính chất để đánh giá chất lượng của giải thuật.
Các tính chất đó như sau:
Tính vô hình (Imperceptibility): Khi nhúng thủy vân vào trong ảnh, thì phải đưa
theo giải thuật thích hợp để người dung không nhận thấy sự thay đổi đó. Thủy vân phải
không ảnh hưởng nhiều đến chất lượng của ảnh. Thông thường các bit ít nhạy cảm dẽ
được ưu tiên dùng để chứa thủy vân.
Tính bền vững (Robustness): Tùy vào từng loại ứng dụng mà có thể xem tính
bền vững này bằng nhiều điểm khác nhau, nếu như đối với các ứng dụng dung để bảo vệ
quyền sở hữu thì thủy vân cần phải bền vững qua một số các tác động ảnh. Nếu như đối
với ứng dụng để chống làm giả hoặc chống lại sự thay đổi trên phương tiện kỹ thuật số
thì đòi hỏi thủy vân phải hủy bỏ khi xảy ra các thao tác này.
Tính không phân chia (Inseparbility): Sau khi ảnh chứa thủy vân thì rất khó
hoặc không thể phân chia thành hai phần riêng biệ như lúc đầu.
Bảo mật (Security): Sau khi đã đưa thủy vân ảnh, thì yêu cầu là chỉ cho phép
những người có quyền sử dụng được chỉnh sửa và phát hiện được thủy vân điều này được
thực hiện nhờ vào khóa mã dung làm khóa trong giải thuật đưa thủy vân vào ảnh số và
giải thuật phát hiện ra thủy vân trong ảnh số.
Thủy vân số có ứng dụng rất rộng trong nhiều lĩnh vực, dưới đây sẽ liệt kê một số ứng
dụng chính của thủy vân.
Bảo vệ quyền sở hữu (Copyright Protection): đây là ứng dụng cơ bản nhất của
kỹ thuật thủy vân. Một thông tin nào đó mang ý nghĩa quyền sở hữu tác giả sẽ được
nhúng vào trong các sản phẩm, thủy vân đó chỉ một mình người chủ sở hữu hợp pháp các
sản phẩm đó có và được dung làm minh chứng cho bản quyền sản phẩm. Để bảo vệ các
sản phẩm chống lại các hành vi lấy cắp hoặc làm nhái cần phải có một kỹ thuật để “dán
tem bản quyền” vào sản phẩm này. Việc dán tem hay chính là việc nhúng thủy vân cần
Lớp KTTT&TT K52 Trang: 21

BTL Xử lý âm thanh & hình ảnh
phải đảm bảo không để lại một ảnh hưởng lớn nào đến việc cảm nhận sản phẩm. Yêu cầu
kỹ thuật đối với ứng dụng này là thủy vân pahir tồn tại bền vững cùng với sản phẩm,
muốn bỏ thủy vân này mà không được phép của người chủ sở hữu thì chỉ còn cachs phá
hủy sản phẩm.
Chống nhân bản bất hợp pháp (Copy Protection): Các sản phẩm có chứa thủy
vân số biểu hiện cho việc sản phẩm này không được nhân bản, vì nếu nhân bản sẽ vi
phamj luật. Nhà sản xuất sẽ trang bị cho các phương tiện dung để nhân bản (như CD
writer….) khả năng phát hiện xem ảnh có chứa thủy vân hay không, nếu có thì sẽ từ chối
không nhân bản.
Theo dõi quá trình sở dụng (Tracking): Thủy vân số có thể được dùng để theo
dõi quá trình sử dụng của ảnh số. Mỗi bản sao của sản phẩm được chứa bằng một thủy
vân duy nhất dùng để xác định người có quyền sử dụng là ai. Nếu có sự nhân bản bất hợp
pháp, thì có thể truy ra người vi phạm nhờ vào thủy vân được chứa bên trong ảnh số.
Chống giả mạo (Tamper Proofing): Thủy vân số có thể được dùng để chống sự
giả mạo. Nếu có bất cứ sự thay đổi nào về nội dung của các ảnh số thì thủy vân này sẽ bị
hủy đi. Do đó rất khó làm giả các ảnh số có chứa thủy vân.
Theo dõi truyền thông (Broadcast Monitoring): Các công ty truyền thông và
quảng cáo có thể dùng kỹ thuật thủy vân để quản lý xem có bao nhiêu khác hang đã dùng
dịch vụ cung cấp.
Truyền tin bí mật (Concealed Communication): Bởi vì thủy vân số là một dạng
đặc biệt của việc ẩn dữ liệu nên người ta dùng để truyền các thông tin bí mật.
Thủy vân số là một trong những kỹ thuật giấu dữ liệu hiện đại. Nó được định
nghĩa như là quá trình chèn thông tin vào dữ liệu đa phương tiện nhưng đảm bảo không
cảm thụ được, nghĩa là chỉ làm thay đổi nhỏ dữ liệu gốc.
Tất cả các phương pháp thủy vân đều có chung các khối sau: một hệ thông nhúng
thủy vân và một hệ thống khôi phục thủy vân.
Có nhiều phép biến đổi cho nhúng thủy vân, một trong các phép biến đổi đó là
phép biến đổi sóng nhỏ rời rạc (DWT).
Do đặc tính đa phân giải, sơ đồ mã hóa Wavelet đặc biệt thích hợp cho các ứng

dụng mà tính vô hướng và suy biến đóng vai trò quan trọng. Minh chứng cho điều này là
phép biến đổi DTW đã được dùng như một tiêu chuẩn trong nén JPEG2000. Ngoài ra,
tính đa phân giải của Wevelet còn hữu ích trong việc phân phối thông điệp vào đối tượng
Lớp KTTT&TT K52 Trang: 22
BTL Xử lý âm thanh & hình ảnh
bao phủ trong khi vẫn đảm bảo tính bền vững và chất lượng hiển thị. Do đó, kỹ thuật thủy
vân ảnh số dùng DWT làm dự báo sự sống còn của thủy vân sau tác động nén có tổn hao
JPEG2000 trong khi vẫn đảm bảo sự suy giảm chất lượng ảnh cho phép. Nói một cách
tổng quát, biến đổi sóng nhỏ thực hiện khai triển tần số - không gian đa tỉ lệ của một ảnh.
Khai triển này tạo ra các hệ số xấp xỉ sau cùng chứa thông tin về băng tần thấp nhất trong
khi các hệ số chi tiết chứa thông tin về băng tần cao hơn.
Kỹ thuật thủy vân ảnh số được tạo ra từ bộ giả ngẫu nhiên với một khóa bí mật.
Chiều dài của thủy vân xác định mức độ của thủy vân vào ảnh. Trong phần lớn trường
hợp, chiều dài thủy vân càng lớn thì đọ mạnh thủy vân đòi hỏi càng nhẹ. Nhưng nói
chung, không có chiều dài thủy vân thích hợp cho tất cả các bức ảnh.
Trong quá trình nhúng thủy vân, chúng ta thwucj hiện DWT cho ảnh. Một tập các
hệ số lớn nhất (có chiều dài bằng chiều dài thủy vân) trong băng tần thích hợp được tách
ra và cộng với thủy vân. Từ đó có thể thấy rằng các hệ số gôc rất cần thiết cho quá trình
tách.
Sau đây là một thuật toán thủy vân sử dụng phép biến đổi DWT. Thuật toán này
thủy van một chuỗi bit nhị phân vào một bức ảnh chủ đa cấp xám. Tuy nhiên có thể dễ
dàng mở rộng cho các ảnh màu bằng cách nhúng thủy vân vào một trong các lớp màu của
ảnh.
*Mô tả thuật toán
• Input:
- Một ảnh nhỏ hoặc một dãy các bit nhị phân được sử dụng làm thủy
vân.
- Một ảnh F cần nhúng thủy vân để bảo vệ bản quyền
- Một khóa bí mật để nhúng thủy vân và giải thủy vân
• Output

- Một ảnh sau khi thủy vân, F”
• Quy trình nhúng thủy vân
Lớp KTTT&TT K52 Trang: 23
Đọc ảnh chủ, thủy vân và khóa bí mật K
Dùng DWT, phân tích ảnh chủ thành 4 băng A1, H1, V1, D1
BTL Xử lý âm thanh & hình ảnh
Hình 3.3 Sơ đồ nhúng thủy vân
Hình 3.3 trình bày quá trình nhúng thủy vân tổng quát. Dữ liệu đầu vào là thủy
vân, dữ liệu cần nhúng và mã cá nhân hay công cộng, vân có thể được dùng ở bất kì dạng
nào như chữ số văn bản hay hình ảnhKhóa có thể được dùng để tang cường tính bảo mật,
nghĩa là ngăn chặn ngxker không có bản quyền khôi phục hay phá hủy thủy vân. Các hệ
thống tế dùng ít nhất là khóa, thậm chí kết hợp nhiều khóa. Dữ liệu đầu ra là dữ liệu đã
được thủy vân.
Lớp KTTT&TT K52 Trang: 24
Thủy vân
Dữ liệu
gốc
Dữ liệu
nhúng
Mã cá nhân/công cộng
Thủy vân
Đặt khóa K làm giống và sinh 2 chuỗi giả ngẫu nhiên
Tại những điểm thủy vân bằng 0, cộng thêm cho giá trị tương ứng
băng H1 và V1 một số giả ngẫu nhiên tương ứng trong hai chuổi
Tổng hợp ảnh chủ bằng IDWT từ băng A1, D1 và các băng đã nhúng thủy
vân H1 và H2
BTL Xử lý âm thanh & hình ảnh
Hình 3.4. Sơ đồ tách thủy vân
Qúa trình khôi phục thủy vân tổng quát được cho ở hình 3.4. Các dữ liệu đầu vào
là dữ liệu đã thủy vân, khóa và dữ liệu gốc. Dữ liệu đầu ra hoặc là thủy vân khôi phục

được hoặc đại lượng nào đó chỉ ra mối tương quan giữa nó và thủy vân cho trước ở đầu
vào.
Trong kỹ thuật thủy vân thì thông tin nhúng có thể là một chuỗi các ký tự, hay một
hình ảnh nào đó. Với kiểu thủy vân dùng chuỗi các ký tự nhúng trược tiếp lên ảnh mang
một số thông tin thường là những thông tin có liên quan đến sản phẩm. Tuy nhiên, kiểu
này có một hạn chế đó là một bit bị lỗi thì sẽ làm sai cả ký tự và chỉ cần một phép biến
đổi đơn giản cũng có thể làm cho thủy vân bị sai lệch rất nhiều. Ngoài kiểu thủy vân
dùng chuỗi các ký tự nhúng trực tiếp, thì kiểu sử dụng ảnh để nhúng sẽ cho ảnh trong
ảnh. Khi giải tin thì một số điểm ảnh bị sai nhưng hình tổng thể sẽ được giữ nguyên.

Lớp KTTT&TT K52 Trang: 25
Dữ liệu
nhúng
Khôi phục
thủy vân
Mã cá nhân/công cộng

×