Tải bản đầy đủ (.docx) (25 trang)

BÁO CÁO KỸ THUẬT GIẤU TIN Đề tài: THUẬT TOÁN KỸ THUẬT THỦY VÂN ÂM THANH ĐA NĂNG DỰA TRÊN LƯỢNG TỬ HÓA VECTƠ TRONG MIỀN DCT

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (437.91 KB, 25 trang )

HỌC VIỆN KỸ THUẬT MẬT MÃ

KHOA AN TỒN THƠNG TIN

BÁO CÁO

KỸ THUẬT GIẤU TIN

Đề tài:
THUẬT TOÁN KỸ THUẬT THỦY VÂN ÂM THANH
ĐA NĂNG DỰA TRÊN LƯỢNG TỬ HÓA VECTƠ
TRONG MIỀN DCT

Sinh viên thực hiện:

TRẦN THỊ NGỌC ANH AT150503
CHU VĂN HIẾU AT150517
NGUYỄN THỊ HUYỀN MY AT150539
NGUYỄN THỊ PHƯƠNG THẢO AT150553


LỜI NÓI ĐẦU

Ngày nay, với sự phát triển mạnh mẽ của các mạng máy tính tốc độ cao, đặc
biệt là Internet, các phương tiện kỹ thuật số như phương tiện lưu trữ, phương tiện
truyền thông, đã mở ra một kỷ nguyên mới – kỷ nguyên thông tin số. Hầu hết các
thông tin ngày nay đều được lưu trữ dưới dạng số hóa. Đồng thời, q trình tồn cầu
hóa mạng Internet đã biến xã hội ảo là nơi diễn ra trao đổi thơng tin trong mọi lĩnh vực
chính trị, qn sự, quốc phịng, kinh tế, thương mại. Tuy nhiên, cơng nghệ số cũng tạo
ra khả năng sao chép hồn hảo, khơng có bất kỳ khuyết điểm và phân phối lại những
sản phẩm này trên tồn thế giới, có hoặc khơng sự cho phép của người sở hữu. Việc


trao đổi, phân bố, sao chép và xử lý các sản phẩm số này ngày càng nhanh chóng, đơn
giản, nằm ngồi tầm kiểm sốt của các tổ chức. Vấn đề đặt ra cho tất cả các phương
thức kinh doanh, phân phối tài nguyên số trên mạng là tuân thủ các nguyên tắc về
quyền sở hữu trí tuệ, và khơng cản trở q trình phân phối, trao đổi tài nguyên số. Nhu
cầu được bảo vệ bản quyền và sở hữu trí tuệ các sản phẩm số đã trở thành một vấn đề
quan trọng và đang được quan tâm.

Trong bài báo cáo này, một thuật toán thủy vân âm thanh đa năng mới lạ
được đề xuất dựa trên lượng tử hóa vectơ (VQ) trong miền biến đổi Cosin rời
rạc (DCT) sử dụng nhãn từ mã và phương thức ràng buộc chỉ số-bit. Bằng cách
sử dụng thuật tốn này, nó có thể đáp ứng u cầu của cả bảo vệ bản quyền và
tính tồn vẹn của nội dung đồng thời xác thực cho các tác phẩm nghệ thuật đa
phương tiện. Các thủy vân (hình khắc chìm) bền vững được nhúng trong hệ số
tần số trung bình của biến đổi DCT trong q trình lượng tử hóa vectơ từ mã
được gắn nhãn thủ tục. Thủy vân dễ vỡ được nhúng vào các chỉ số của hệ số tần
số cao của biến đổi DCT bằng cách sử dụng phương pháp lượng tử hóa vectơ
chỉ số bị ràng buộc nhằm mục đích xác thực tính tồn vẹn của tín hiệu âm thanh
gốc. Cả hai thủy vân bền vững và thủy vân dễ vỡ có thể được trích xuất mà
khơng có âm thanh gốc tín hiệu và kết quả mơ phỏng cho thấy rằng thuật tốn
của chúng ta có hiệu quả liên quan đến tính minh bạch, mạnh mẽ và xác thực
các yêu cầu.


Nội dung bài báo cáo có cấu trúc sau:
CHƯƠNG I: Giới thiệu
CHƯƠNG II: Phép lượng tử vectơ và phép giải mã lượng tử vectơ gán nhãn
CHƯƠNG III: Thuật toán thủy vân số được đề xuất
CHƯƠNG IV: Kết quả thực nghiệm và thảo luận
KẾT LUẬN
Chúng em xin gửi lời cảm ơn sâu sắc tới cơ Hồng Thu Phương, người định

hướng, hướng dẫn và hỗ trợ chúng em rất nhiều trong quá trình hồn thành báo cáo.
Mặc dù chúng em đã cố gắng hoàn thành báo cáo này, các mục tiêu về cơ bản đã đạt
được. Tuy nhiên thuật toán kỹ thuật thủy vân âm thanh là một vấn đề khó và phức tạp
nên chắc chắn khơng tránh khỏi thiếu sót. Chúng em rất mong sẽ nhận được sự nhận
xét, góp ý và tận tình chỉ bảo từ cơ.
Một lần nữa chúng em xin chân thành cảm ơn.


MỤC LỤC

DANH MỤC HÌNH VẼ................................................................................................................5
DANH MỤC BẢNG BIỂU..........................................................................................................6
CHƯƠNG 1. GIỚI THIỆU..........................................................................................................7
CHƯƠNG 2. PHÉP LƯỢNG TỬ VECTƠ VÀ PHÉP GIẢI MÃ LƯỢNG TỬ VECTƠ
GÁN NHÃN.................................................................................................................................10
2.1 Lượng tử hóa vectơ.......................................................................................................10
2.2 Lượng tử hóa vectơ từ mã được gắn nhãn..................................................................10
CHƯƠNG 3. THUẬT TỐN THỦY VÂN SỐ.......................................................................12
3.1 Quy trình nhúng thủy vân bền vững............................................................................12
3.2 Quá trình nhúng thủy vân dễ vỡ..................................................................................12
3.3 Quy trình giải nén thủy vân.........................................................................................14
CHƯƠNG 4. KẾT QUẢ THỰC NGHIỆM VÀ THẢO LUẬN............................................17
KẾT LUẬN..................................................................................................................................22
TÀI LIỆU THAM KHẢO..........................................................................................................23


DANH MỤC HÌNH

Hình 2. 1 Quy trình lượng tử hóa vectơ chỉ số bị ràng buộc........................................11
Y

Hình 3. 1 Quy trình lượng tử hóa vectơ chỉ số bị ràng buộc........................................13
Hình 3. 2 Quy trình nhúng thủy vân............................................................................14
Hình 3. 3 Quy trình giải nén thủy vân..........................................................................15

Hình 4. 1 Tín hiệu âm thanh gốc và thủy vân bền vững...............................................18
Hình 4. 2 Tín hiệu âm thanh thủy vân và thủy vân bền vững được trích xuất mà khơng
bị tấn cơng. SNR = 21,87 dB, NC = 1,00.....................................................................18


DANH MỤC BẢNG BIỂU

Bảng 4. 1 Hiệu xuất bền vững được đề xuất dưới mặt kỹ thuật trong Stirmark
Benchmark cho audio trong V0.2................................................................................21
Bảng 4. 2 Tỷ lệ phần trăm mẫu âm thanh xáo trộn......................................................21


CHƯƠNG 1. GIỚI THIỆU

Sự phát triển nhanh chóng và bùng nổ của máy tính mạng và cơng nghệ đa
phương tiện giới thiệu một loạt các những vấn đề thách thức cả về bảo vệ trí tuệ và xác
minh tính tồn vẹn của nội dung cho đa phương tiện kỹ thuật số. Thủy vân số - Digital
watermarks gần đây đã được giới thiệu như một công cụ cung cấp bảo vệ bản quyền
cho đa phương tiện chất lượng cao tác phẩm nghệ thuật. Đó là một kỹ thuật để nhúng
dữ liệu vào âm thanh kỹ thuật số, hình ảnh hoặc video, đồng thời giới thiệu biến dạng
đối với đa phương tiện ban đầu, để nó cho phép quyền sở hữu được xác lập hoặc chủ
sở hữu hợp pháp được xác định. Các thủy vân được nhúng sau đó có thể được phát
hiện hoặc trích xuất từ mơi trường thủy vân để xác thực hoặc nhận dạng [1]. Với một
thập kỷ phát triển, thủy vân số như một phương pháp hiệu quả để bảo vệ bản quyền và
xác thực toàn vẹn nội dung của dữ liệu đa phương tiện đã được được khám phá một
cách sâu sắc và rộng rãi. Theo đó, kỹ thuật thủy vân số có thể được phân loại thành

thủy vân bền vững và thủy vân dễ vỡ cho các mục tiêu khác nhau. Nói chung, chỉ có
một thủy vân được nhúng vào một số dữ liệu đa phương tiện cần bảo vệ bản quyền
hoặc xác thực toàn vẹn nội dung. Nhưng trong một số hoàn cảnh đặc biệt, cả hai thủy
vân sẽ cần phải được nhúng vào cùng một dữ liệu đa phương tiện để tạo ra thuật tốn
thực hiện các mục đích khác nhau. Ví dụ: chủ sở hữu của các tác phẩm nghệ thuật đa
phương tiện mong muốn: sử dụng một thủy vân để xác nhận quyền sở hữu, sử dụng
thủy vân thứ hai để xác minh nội dung tính tồn vẹn và sử dụng thủy vân thứ ba để
truyền đạt tiêu đề phụ đề [2]. Tuy nhiên, chỉ có một số thuật tốn thủy vân đa năng khả
dụng, chủ yếu tập trung vào tín hiệu hình ảnh để thực hiện các yêu cầu của ứng dụng
[3], [4]. Trong [3], ba kỹ thuật tạo thủy vân ảo để nhúng thủy vân vào không gian thủy
vân được đề xuất, đó là Nhúng thủy vân đơn (SWE), Nhúng thủy vân nhiều lớp
(MWE) và Nhúng thủy vân lặp lại (IWE). SWE sử dụng hai khóa bí mật để nhúng một
hình ảnh biểu trưng nhị phân có ý nghĩa vào không gian thủy vân, bằng cách sử dụng
kỹ thuật trải phổ và một số tính năng mới. SWE sử dụng hai khóa bí mật để nhúng một
hình ảnh biểu trưng nhị phân có ý nghĩa vào khơng gian thủy vân, bằng cách sử dụng
kỹ thuật trải phổ và một số tính năng mới. Nó khơng u cầu thủy vân phải trực giao
với dữ liệu gốc, do đó cho phép chuỗi bit nhúng ngay cả trong các hình ảnh nhỏ. Dựa


trên SWE, kỹ thuật thứ hai được đề xuất trong [3], được gọi là Nhúng thủy vân nhiều
lớp (MWE), được phát triển để nhúng nhiều thủy vân đồng thời trong cùng một khơng
gian thủy vân . Các khóa bí mật khác nhau được sử dụng cho các thủy vân khác nhau.
Trong [4], một phương pháp khắc chìm hình ảnh đa năng dựa trên lượng tử hóa vectơ
nhiều tầng được trình bày, trong đó thủy vân bán dễ vỡ (để xác thực nội dung) và thủy
vân mạnh mẽ (để bảo vệ bản quyền) được nhúng vào các giai đoạn VQ khác nhau
bằng cách sử dụng các phương pháp khác nhau và cả hai chúng có thể được trích xuất
mà khơng cần hình ảnh gốc. Kể từ khi Hệ thống thính giác của con người (HAS) nhạy
cảm hơn Hệ thống trực quan (HVS) với thông tin pha tuyệt đối, kỹ thuật thủy vân âm
thanh đa năng khó thiết kế và triển khai hơn so với kỹ thuật thủy vân hình ảnh đa
năng [5]. Cho đến nay, rất ít sơ đồ kỹ thuật thủy vân âm thanh đa năng đã được trình

bày. Một lược đồ “cocktail” thủy vân âm thanh được giới thiệu trong [6], nơi mà thủy
vân bền vững và bán dễ vỡ được phát hiện bởi sử dụng các quy trình phát hiện khác
nhau và sự xáo trộn vị trí cũng đạt được. Tuy nhiên, sự bền vững của nó chống lại các
thao tác xử lý tín hiệu âm thanh thơng thường không được chấp thuận. Trong [7], thủy
vân bền vững được nhúng vào phần thấp dải tần số sử dụng lượng tử hóa trung bình,
trong khi thủy vân bán dễ vỡ được nhúng vào tần số cao phạm vi bằng cách lượng tử
hóa hệ số đơn. Cả thủy vân bền vững và thủy vân bán dễ vỡ có thể được trích xuất
khơng có âm thanh máy chủ. Nhưng sơ đồ thủy vân bán dễ vỡ không thể đạt được sự
xáo trộn vị trí. Trong [8], một hỗn loạn ánh xạ dựa trên thủy vân bán dễ vỡ (cho nội
dung xác thực với sự xáo trộn vị trí) được nhúng trong hệ số wavelet chi tiết dựa trên
mơ hình xáo trộn tức thời của Phân tích thành phần độc lập (ICA), trong khi thủy vân
bền vững (để bảo vệ bản quyền) là được nhúng dựa trên ý tưởng zero-watermarking.
Trong [12], một sơ đồ thủy vân nhiều lớp cho tín hiệu giọng nói được đề xuất bởi sự
kết hợp mã hóa dự đốn tuyến tính (LPC) và phương pháp VQ, thủy vân bền vững
khơng thực sự được nhúng trong tín hiệu giọng nói gốc nhưng được trích xuất bằng
cách sử dụng phương pháp zero-watermarking. Và thủy vân còn lại là thủy vân bán dễ
vỡ, chỉ chống lại các cuộc tấn công của VQ. Những nhược điểm này hạn chế lĩnh vực
ứng dụng của chúng. Những thách thức và yêu cầu kỹ thuật hiện có trong thiết kế các
sơ đồ thủy vân âm thanh đa năng bao gồm [8]:


1) Làm thế nào để giảm ảnh hưởng của việc nhúng thủy vân sau lên trên thủy vân
được nhúng trước hoặc cách giảm tác động lẫn nhau giữa các thủy vân được
nhúng?
2) Làm thế nào để giải quyết mâu thuẫn giữa tính bền vững và yêu cầu minh bạch?
3) Làm thế nào để đảm bảo việc trích xuất độc lập và không thấy được của từng
thủy vân?
4) Cách làm cho tồn bộ chương trình chống lại các thao tác xử lý tín hiệu âm
thanh thơng thường?
Theo các u cầu trên, một học thuyết về sơ đồ thủy vân âm thanh đa năng

được trình bày trong bài báo này. bên trong sơ đồ được đề xuất, một thủy vân WF dễ
vỡ (cho nội dung xác thực) được nhúng vào các chỉ số dựa trên lược đồ lượng tử hóa
vectơ bị ràng buộc, trong khi một thủy vân WR (để bảo vệ bản quyền) được nhúng dựa
trên lược đồ lượng tử hóa vectơ được gắn nhãn trong âm thanh máy chủ tín hiệu AO.
Chúng đều được nhận dạng trong miền biến đổi Cosine rời rạc, và lý do tại sao chúng
sử dụng miền này là vì các tính năng của Hệ thống âm thanh con người (HAS) có thể
được kết hợp với thủy vân trong miền chuyển đổi một cách hiệu quả hơn, và điều đó
có lợi cho việc khơng nghe được năng lượng của thông tin nhúng trong miền biến đổi
sẽ trải rộng trên tất cả các phần tần số. Bài báo cáo này được chia thành các phần như
sau: đầu tiên, sự ra đời của lượng tử hóa vectơ và lượng tử hóa vectơ từ mã có nhãn;
sau đó đề xuất sơ đồ thủy vân đa năng được mô tả chi tiết, bao gồm cả quy trình nhúng
và chiết xuất; cuối cùng, kết quả mô phỏng được mô tả và thảo luận ngắn gọn về thuật
toán đề xuất được thực hiện.


CHƯƠNG 2. PHÉP LƯỢNG TỬ VECTƠ VÀ PHÉP GIẢI MÃ
LƯỢNG TỬ VECTƠ GÁN NHÃN

2.1 Lượng tử hóa vectơ
VQ là một phương pháp nén tổn hao hiệu quả với tỷ lệ nén và một bộ giải mã
tra cứu bảng đơn giản. Bộ định lượng vectơ k-chiều Q có kích thước N là ánh xạ từ
không gian Euclide R chiều k hành một tập hữu hạn (hoặc sách mã) C = {c , c ,…, c }
k

0

1

N-1


trong đó Ci ∈ R được gọi là từ mã và N là kích thước sổ mã.
k

Trong đó k ci ∈ R được gọi là một từ mã và N là kích thước bảng mã. Bảng mã
thường được tạo ngoại tuyến bởi thuật toán LBG đến từ một tập dữ liệu. Tín hiệu được
mã hóa trước tiên được chia thành các vectơ và sau đó được mã hóa bởi bảng mã đào
tạo. Đối với mỗi đầu vào k-dimensional (k-chiều) vectơ x, chúng ta có thể tìm thấy từ
mã gần nhất Ci dưới một số chỉ số như trong cơng thức sau:

d( x, cj) =
Trong đó, d (x, cj ) là độ lệch giữa vectơ đầu vào x và từ mã c j, và nó có thể
được tính như sau:

d( x, cj) =
Sau đó, chỉ số i tương ứng được truyền qua kênh tới bộ giải mã. Bộ giải mã giữ
một bản sao chính xác của cùng một bộ mã. Với mỗi chỉ số i, bộ giả mã chỉ thực hiện
một thao tác tra cứu bảng đơn giản để lấy i và sau đó sử dụng nó để tái hiện lại vectơ
đầu vào x. Vì vậy, sự đơn giản hóa này đạt được bằng cách thay thế một từ mã cho
vectơ đầu vào và chỉ được truyền hoặc lưu trữ chỉ số của từ mã đó chứ khơng phải
chính từ mã đó.

2.2 Lượng tử hóa vectơ từ mã được gắn nhãn
Ý tưởng chính của thuật tốn thủy vân bền vững là để gán từng tần số trung
bình Vectơ hệ số DCT đến từ mã gần nhất được gán nhãn bởi bit thủy vân tương ứng


và phương pháp thủy vân dễ vỡ được đề xuất là điều chỉnh bit chỉ định của các chỉ số
của Vectơ hệ số DCT tần số cao bằng cách sử dụng các bit thủy vân dễ vỡ. Để đạt
được điều này, hai bộ mã nên được tạo bằng cách sử dụng thuật toán LBG. Bộ mã
dành cho thủy vân dễ vỡ được tạo bằng cách sử dụng phương pháp LBG tiêu chuẩn.

Giả sử bộ mã cho thủy vân bền vững đã được tạo bởi thuật tốn LBG thơng thường, để
nhận ra các bit thủy vân trong q trình mà khơng có tín hiệu âm thanh gốc, chúng ta
có thể chỉ định một nhãn là ‘0’ hoặc ‘1’ cho mỗi từ mã. Để thỏa mãn điều kiện là xung
quanh mỗi cụm, phải có ít nhất một cụm được gắn nhãn khác nhau, chúng ta sử dụng
phương pháp gắn nhãn được đề xuất trong tài liệu [10] như sau, có thể gắn nhãn các từ
mã trong quá trình tạo sổ mã:


Bước 1: Tạo bộ mã C0 với kích thước N/2 từ tồn bộ tập dữ liệu bằng cách sử



dụng thuật toán LBG thơng thường.
Bước 2: Phân chia tồn bộ tập dữ liệu thành N/2 cụm dựa trên điều kiện gần



nhất với bộ mã C0
Bước 3: Tạo 2 từ mã cho mỗi cụm, tức là phân chia mỗi cụm thành hai cụm
con, bằng cách sử dụng thuật tốn LBG thơng thường. Một được gắn nhãn ‘0’



và khác được gắn nhãn ‘1’, bằng một cách ngẫu nhiên.
Bước 4: Thu nhập tất cả các từ mã để tạo thành bộ mã cuối cùng được dán nhãn
C có kích thước N. Ghi lại tất cả các nhãn từ mã để tạo thành khóa ghi nhãn
Keyi .
Sau khi tạo bảng mã được gắn nhãn C cho robust thủy vân bền vững và bộ mã

CF cho thủy vẫn dễ vỡ, chúng ta có thể sử dụng chúng để thực hiện quá trình nhúng và

giải nén thủy vân.

Hình 2. 1 Quy trình lượng tử hóa vectơ chỉ số bị ràng buộc


CHƯƠNG 3. THUẬT TỐN THỦY VÂN SỐ

3.1 Quy trình nhúng thủy vân bền vững


Bước 1: Thủy vân bền vững nhị phân W đầu tiên được hốn vị bằng khóa
R

Key

để tạo thành chuỗi thủy vân W

WR

PR

được nhúng và W

đại diện cho tất cả

PR

các bit thủy vân trong W
Bước 2: Tín hiệu âm thanh gốc A được phân đoạn thành các khung có độ dài
PR




O

gấp 4 lần kích thước từ mã được gắn nhãn và phép biến đổi DCT được thực
hiện trên mỗi khung, sau đó các hệ số trung tần của mỗi khung được chọn để
tạo thành một vectơ. Tất cả các vectơ tạo thành một tập vectơ V .
Bước 3: Với mỗi vectơ v ∈V , tìm từ mã gần nhất c và so sánh nhãn tương
R



i

R

i

ứng L với bit w . Nếu L = w , thì từ mã được sử dụng để tái tạo lại V . Ngược
i

PR

i

PR

i


lại, Hãy chọn từ mã gần nhất c trong số tất cả các từ mã có nhãn w
j

PR

để tái tạo

v
Bước 4: Lặp lại Bước 3 cho đến khi tất cả các bit mờ được nhúng. Để tăng
i



cường độ mạnh mẽ của thuật toán mờ chúng ta liên tục nhúng thủy vân WPR
vào tín hiệu âm thanh ban đầu cho thời gian T, trong đó
T=⎣ Chiều dài (Ao)/( Kích thước khung × Chiều dài (W ))⎦.
PR

3.2 Quá trình nhúng thủy vân dễ vỡ


Bước 1: Thủy vân dễ vỡ nhị phân W là lần đầu tiên chuyển đổi thành 1-Chiều
F

để tạo thành một chuỗi thủy vân W và nó được nhân rộng T lần theo độ dài
PF

của tín hiệu âm thanh gốc A , trong đó T giống như đã đề cập ở trên .
Bước 2: Tín hiệu âm thanh gốc A được phân đoạn thành các khung với độ dài
0




0

gấp 4 lần kích thước từ mã được gắn nhãn và phép biến đổi DCT được thực
hiện trên mỗi khung, sau đó các hệ số DCT tần số cao của mỗi khung được
chọn để tạo thành một vectơ. Kích thước của nó cũng giống như kích thước của
cuốn sách mã được tạo trước để nhúng thủy vân dễ vỡ và hiệu quả của việc lựa
chọn kích thước đối với với chất lượng của tín hiệu thủy vân âm thanh cũng sẽ
được thảo luận. Tất cả các vectơ này tạo thành một tập vectơ V .
Bước 3: Đối với mỗi vectơ hệ số DCT tần số cao v ∈ V nó được lượng tử
F



Fj

F

hóa bởi phương pháp lượng tử hóa vectơ chỉ số ràng buộc. Bit đã chỉ định, được


chọn bởi chìa khóa Key của chỉ mục được cố định giống như bit thủy vân dễ
WF

vỡ w . Trong điều kiện này, chọn từ mã gần nhất c trong sách mã C tái tạo lại
PF

Fj


F

v . Chúng ta có thể được hiểu rõ hơn bởi Hình 3.1
Fj

Hình 3. 1 Quy trình lượng tử hóa vectơ chỉ số bị ràng buộc

vectơ đầu vào V nên được lượng tử hóa dưới dạng C nếu khơng có các bit thủy vân
Fj

1

được nhúng, nhưng sử dụng phương pháp lượng tử hóa vectơ chỉ số bị ràng buộc, thì
vectơ đầu vào có thể được lượng tử hóa dưới dạng C ,C ,C ,C vân vân. Liên quan đến
2

3

4

5

việc với từ mã nào sẽ được chọn phụ thuộc vào bit chỉ mục được chỉ định được xác
định bằng khóa Key .
WF





Bước 4 : Lặp lại bước 3 đến khi tất cả các bit thủy vân được nhúng.
Bước 5 : Thay thế tất cả các hệ số DCT trung tần bằng các từ mã được gắn nhãn
tương ứng và hệ số DCT tần số cao với các từ mã tương ứng, sau đó thực hiện
biến đổi IDCT trên mỗi khung hình để thu được tín hiệu âm thanh thủy vân A

w

Hình 3.2 cho thấy sơ đồ khối của việc nhúng thủy vân W và W thành tín hiệu âm
R

thanh gốc A

0.

F


Hình 3. 2 Quy trình nhúng thủy vân

3.3 Quy trình giải nén thủy vân
Hình 3.3 cho thấy sơ đồ khối của việc giải nén thủy vân W và W từ tín hiệu âm
R

F

thanh đáng ngờ A’ . Phân đoạn tín hiệu âm thanh đáng ngờ A’ vào các khung có độ dài
gấp 4 lần kích thước từ mã và thực hiện phép biến đổi DCT trên mỗi khung, đồng thời
các hệ số tần số trung bình và tần số cao được trích xuất và nhóm thành vectơ. Sau đó,
các vectơ này được xử lý riêng biệt.



Hình 3. 3 Quy trình giải nén thủy vân

Đối với thủy vân bền vững W’ , quá trình khai thác là rất đơn giản và thuật tốn
R

trích xuất mù chỉ với sổ mã V được gắn nhãn từ mã C, chìa khóa ghi nhãn Key , và
Q

phím hốn vị thủy vân khóa Key . Q trình giải nén như sau :
WR



Bước 1 : Lấy vectơ hệ số DCT trung tần bộ V’ . Thiết lập 2 mảng đếm :



Count0[m] và Count 1[m] trong đó m = Chiều dài (W ).
Bước 2 : Đối với mỗi vectơ v’ ∈ V’ tìm từ mã gần nhất của nó trong C và ghi






nhãn tương ứng theo khóa ghi nhãn Key
Bước 3 : Lặp lại Bước 2 cho đến khi thủy vân được giải nén cho T lần
Bước 4: Đánh giá bit thủy vân được trích xuất w′ dựa theo Count0 và Count1.
IF Count0 [i]≥ Count1 [i] , Then w′ =0 Else w′ = 1

Bước 5 : Lặp lại Bước 4 m lần cho đến khi tất cả các bit thủy vân thu được, sau

R

PR

i

R

l

PR

PR

PR

đó hốn vị nghịch được thực hiện trên W′ ( bao gồm tất cả các bit được trích
PR

xuất w′ ) để có được thủy vân trích xuất cuối cùng W’
PR

R

Đối với thủy vân dễ vỡ W′ , trước tiên chúng ta có thể tìm thấy gần nhất từ mã theo
F

phương pháp tìm kiếm đầy đủ trong sổ mã VQ sách mã C ,và sau đó áp dụng phân

F

tách bit cho chỉ mục của nó, có bit thứ k chỉ là bit thủy vân (k được chọn bởi phím


nhúng thủy vân dễ vỡ Key ). Cuối cùng chúng ta tập hợp các bit một cách có trật tự
WF

và lấy thủy vân được trích xuất W′

F


CHƯƠNG 4. KẾT QUẢ THỰC NGHIỆM VÀ THẢO LUẬN

Để kiểm tra các đặc điểm về độ nhạy và độ mạnh của thuật toán thủy vân âm
thanh được đề xuất, một tập hợp các tín hiệu âm thanh bao gồm pop, light, rock và
piano được áp dụng. Tỷ lệ tín hiệu trên tiếng ồn (SNR) và tỷ lệ tín hiệu trên tiếng ồn
trung bình của tiểu mục (SNRseg) được sử dụng để đánh giá sự giống nhau khách
quan giữa tín hiệu âm thanh gốc và tín hiệu âm thanh đã nhúng thủy vân. Tương quan
chuẩn hóa (NC) được sử dụng để xác minh chất lượng của thủy vân bền vững được
trích xuất. Chúng có thể được tính bằng:

Đầu tiên, chúng ta kiểm tra tính hiệu quả của thuật tốn mà khơng bị tấn công.
Một clip ở định dạng WAVE (21 giây, đơn âm, 16 bit/mẫu, 44,1 kHz) từ bản
nhạc có tiêu đề “I'm Gonna Be Around” được chọn và thủy vân bền vững là hình
ảnh “con ếch” 64 × 64 nhị phân, thủy vân dễ vỡ là hình ảnh “chim” 64 * 64 nhị
phân. Quá trình nhúng được thực hiện bằng cách sử dụng sổ mã được gắn nhãn
có kích thước 4096, mỗi từ mã có 8 kích thước và sổ mã dễ vỡ có kích thước
1024, mỗi từ mã cũng có 8 kích thước. SNR của tín hiệu âm thanh thủy vân là

21,87dB, vượt quá 20 dB mà IFPI yêu cầu. Thử nghiệm nghe chủ quan cho thấy
âm thanh đã nhúng thủy vân rất giống với bản gốc. Và thủy vân bền vững có thể
được trích xuất hồn hảo với NC = 1,0, được hiển thị trong Hình 4.



Hình 4. 1 Tín hiệu âm thanh gốc và thủy vân bền vững

Hình 4. 2 Tín hiệu âm thanh thủy vân và thủy vân bền vững được trích xuất mà không
bị tấn công. SNR = 21,87 dB, NC = 1,00

Để đánh giá ảnh hưởng của các kích thước từ mã và kích thước sổ mã khác
nhau lên chất lượng, một bộ sách mã được gắn nhãn được tạo và chất lượng âm thanh
đã nhúng thủy vân đối với các kích thước từ mã và kích thước sổ mã khác nhau sẽ
được thảo luận. Chúng ta có thể kết luận rằng với sách mã có nhãn kích thước là 4 và
8, chất lượng tín hiệu âm thanh đã nhúng thủy vân tăng lên ổn định với kích thước
sách mã và chất lượng chủ quan rất giống với kích thước bản gốc. Mặc dù tỷ lệ SNR
cao hơn có thể đạt được với kích thước cao hơn, chất lượng chủ quan của âm thanh đã
nhúng thủy vân thấp hơn và chúng ta có thể nghe thấy tiếng ồn hơi khó chịu. Tuy
nhiên, đối với các tín hiệu âm thanh khác nhau, chất lượng giảm rõ rệt khác nhau. Vì
vậy, chúng ta chọn kích thước sổ mã được gắn nhãn 4, 8 và 16 để đánh giá mức độ
mạnh mẽ của chương trình được đề xuất. Do việc nhúng thủy vân dễ vỡ ảnh hưởng
một chút đến chất lượng của tín hiệu âm thanh nhúng thủy vân cuối cùng, nên chúng ta
chỉ liệt kê kết quả thử nghiệm độ bền như trong Bảng 4.1.
Trong các thử nghiệm để đánh giá mức độ mạnh mẽ, các tín hiệu âm thanh
được tạo thủy vân phải chịu nhiều loại tấn công khác nhau và NC được áp dụng để
đánh giá mức độ mạnh mẽ của thuật toán. Stirmark Benchmark for Audio v0.2 [11] và
Audacity 1.3 Beta được sử dụng làm công cụ chỉnh sửa và tấn công trong các thử
nghiệm của chúng ta. Stirmark Benchmark for Audio là một công cụ đánh giá mức độ
mạnh mẽ phổ biến cho các kỹ thuật thủy vân âm thanh. Tất cả các hoạt động trên được

liệt kê trong Bảng 4.1 được thực hiện bằng cách sử dụng các tham số mặc định trong


hệ thống. Từ Bảng 4.1, có thể thấy rằng thủy vân có thể sống sót qua hầu hết các cuộc
tấn công thông thường.
Trong các thử nghiệm xác thực nội dung, các mẫu tín hiệu âm thanh đã nhúng
thủy vân được chọn ngẫu nhiên được thay thế bằng các mẫu ngẫu nhiên. Tỷ lệ phần
trăm được phát hiện được thể hiện trong Bảng 4.2. Trong bảng này, bất kỳ số phần
trăm nào dưới 100% đều cho biết rằng một số phần của âm thanh đã nhúng thủy vân
đã được thay thế. Và sau khi tìm thấy các bit xác thực khơng chính xác, nội dung đã
sửa đổi sẽ được xác định bằng cách so sánh thủy vân dễ vỡ được chiết xuất tuần tự và
thủy vân dễ vỡ ban đầu.

Hiệu suất mạnh
(NC)
Loại tấn cơng

Kích thước 4 Khổ
sách 4096

Kích thước 8 Khổ Kích thước 16 Khổ
sách 4096
sách 4096

AddBrumm_100

1.000

1.000


0.991

AddBrumm_9100

1.000

1.000

0.991

AddNoise_900

0.897

0.901

0.991

AddSinus

1.000

1.000

0.921

Compressor

1.000


1.000

0.987

DynNoise

0.925

0.990

0.932

FFT_RealReverse

1.000

1.000

0.961

FlippSample

0.986

0.943

0.992


LSBZero


1.000

1.000

0.871

Normalize

1.000

1.000

0.982

ExtraStereo_30

1.000

1.000

0.974

ExtraStereo_70

1.000

1.000

0.983


RC_HighPass

1.000

1.000

0.980

RC_LowPass

0.924

0.879

0.994

Smooth2

0.801

0.868

0.963

Smooth

0.813

0.859


0.856

ZeroCross

0.991

0.980

0.831

Echo

0.505

0.512

0.932

Invert

0.506

0.532

0.543

FFT_Stat1

0.622


0.598

0.521

Exchange

0.479

0.543

0.743

FFT_HLPass

0.500

0.586

0.581

FFT_Invert

0.525

0.543

0.583

CopySample


0.472

0.462

0.585

CutSample

0.584

0.567

0.432


Stat2

0.643

0.699

0.984

ZeroRemove

0.601

0.543


0.501

Amplify

0.465

0.479

0.498

Bảng 4. 1 Hiệu xuất bền vững được đề xuất dưới mặt kỹ thuật trong Stirmark
Benchmark cho audio trong V0.2

Điểm bắt
đầu

Phần âm thanh Phần âm thanh Phần âm thanh Phần âm thanh
1
2
3
4

200

100%

100%

98%


100%

10000

100%

95%

100%

97%

500000

97%

98%

100%

100%

Bảng 4. 2 Tỷ lệ phần trăm mẫu âm thanh xáo trộn


KẾT LUẬN

Một thuật toán thủy vân âm thanh đa năng mới lạ được đề xuất dựa trên lượng
tử hóa vectơ (VQ) trong miền Biến đổi Cosine rời rạc (DCT). Bằng cách sử dụng
phương pháp này, chúng ta có thể thực hiện cả việc bảo vệ bản quyền và xác thực tính

tồn vẹn của nội dung cùng một lúc. Cả thủy vân bền vững và dễ vỡ đều có thể được
trích xuất một cách mù quáng và kết quả mô phỏng đã chứng minh rằng thuật tốn
được trình bày có hiệu quả đối với việc bảo vệ quyền sở hữu trí tuệ và xác thực tính
tồn vẹn. Tuy nhiên, vẫn cịn một số vấn đề đáng được tiếp tục nghiên cứu. Ví dụ: khả
năng xáo trộn vị trí và phân biệt các loại sai lệch do xáo trộn của phương pháp thủy
vân dễ vỡ và mơ hình âm học cũng có thể được kết hợp vào sơ đồ này để cải thiện độ
chắc chắn và tính khơng nhạy cảm.


TÀI LIỆU THAM KHẢO

[1] Jana Dittmann, Martin Steinebach, Thomas Kunkelmann and Ludwig Stoffels,

“H204M-Watermarking for media: classification, quality evaluation, design
improvements,” in Proc. ACM Multimedia 2000, Marina Del Rey, USA, 2000,
pp. 107-110.
[2] Mintzer, F., Braudaway, G.W., “If one watermark is good, are more better?” In
Proc. IEEE Int. Conf. Acoustics, Speech, and Signal Processing, USA, 1999,
pp. 2067-2069.
[3] Peter H. W. Wong, Oscar C. Au,Y. M. Yeung, “A novel blind multiple
watermarking technique for images,” IEEE Trans. Circuits and Systems for
Video Technology,vol.13, no. 4, pp. 813-830, August 2003.
[4] Lu, Z.M., Xu, D.G., Sun, S.H., “Multipurpose image watermarking algorithm
based on multistage vector quantization,” IEEE Trans. Image Processing, vol.
14, no. 6, pp. 822-831, June 2005.
[5] Wang, X.Y., Cui, Y.R., Yang, H.Y., Zhao, H., “A new content-based digital
audio watermarking algorithm for copyright protection,” In Proc. IEEE Int.
Conf. Information Security, China, 2004. pp. 62-68.
[6] Lu, C.S., Mark Liao, H.Y., Chen, L.H., “Multipurpose audio watermarking,” In
Proc. IEEE Int. Conf. Pattern Recognition, Spain, 2000, pp. 282-285.

[7] Wang, R.D., Xu, D.W., Li, Q., “Multiple audio watermarks based on lifting
wavelet transform,” In Proc. IEEE Int. Conf. Machine Learning and
Cybernetics, China, 2005, vol.4, pp. 1959-1964.
[8] Ning Chen, Jie Zhu, “Multipurpose audio watermarking algorithm,” Journal of
Zhejiang University SCIENCE A, vol. 9, no. 4, pp. 517-523.
[9] Y. Linde,A. Buzo, and R.M. Gray, “An algorithm for vector quantizer design,”
IEEE Trans. Communications, vol. 28, no.1, pp. 84-95, January 1980.
[10] Zhe-Ming LU, Wen XING, Dian-Guo XU and Sheng-He SUN, “Digital image
watermarking method based on vector quantization with labeled codewords,”
IEICE Trans. Information and Systems. E86-D(12), pp. 2786-2789, 2003.
[11] Martin Steinebach, Fabien A. P. Petitcolas, Frederic Rayna, Jana Dittmann,
“StirMark benchmark: audio watermarking attacks,” In Proc. IEEE Int. Conf.
Information Technology: Coding and Computing, USA, 2001, pp. 49-54.


[12] Ning Chen and Jie Zhu, “Multipurpose speech watermarking based on multistage

vector quantization of linear prediction coefficients,” The Journal of China
Universities of Posts and Telecommunications, vol. 14, no. 4, pp. 64-69, December
2007.


×