Tải bản đầy đủ (.pdf) (71 trang)

Nghiên cứu kỹ thuật thủy vân bền vững trong Audio (Luận văn thạc sĩ)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.83 MB, 71 trang )

3
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
---------------------------

BỒ THANH LONG

NGHIÊN CỨU KỸ THUẬT THỦY VÂN BỀN VỮNG
TRONG AUDIO

LUẬN VĂN THẠC SỸ KỸ THUẬT

( Theo định hướng ứng dụng )

TP.HCM – 2018


HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
---------------------------

BỒ THANH LONG

NGHIÊN CỨU KỸ THUẬT THỦY VÂN BỀN VỮNG TRONG
AUDIO

Chuyên nghành: KỸ THUẬT VIỄN THÔNG
Mã số: 8520208

LUẬN VĂN THẠC SỸ KỸ THUẬT
( Theo định hướng ứng dụng )

NGƯỜI HƯỚNG DẪN KHOA HỌC: TS. NGUYỄN LƯƠNG NHẬT



TP.HCM - 2018


i

LỜI CAM ĐOAN
Tôi cam đoan đây là công trình nghiên cứu của riêng tôi.
Các số liệu, kết quả nêu trong luận văn là trung thực và chưa từng được ai
công bố trong bất kỳ công trình nào khác.
TP. Hồ Chí Minh, ngày 10 tháng 11 năm 2017.
Học viên thực hiện

Bồ Thanh Long


ii

LỜI CẢM ƠN
Lời đầu tiên, cho phép tôi gửi lời cảm ơn chân thành, những lời chúc tốt đẹp
nhất đến các Thầy, Cô giáo thuộc Học viện Công nghệ Bưu chính Viễn thông và các
đơn vị khác đã tận tình giảng dạy, truyền đạt nhiều kiến thức quý báu cho tôi trong
thời gian học tập tại Học viện.
Với lòng kính trọng và sự biết ơn sâu sắc, tôi xin chân thành cảm ơn Thầy giáo
hướng dẫn khoa học TS Nguyễn Lương Nhật - Trưởng khoa Kỹ thuật điện tử 2, Học
viện Công nghệ Bưu chính Viễn thông cơ sở TP. HCM đã dành nhiều thời gian hướng
dẫn, giúp đỡ tôi trong quá trình nghiên cứu và thực hiện luận văn này. Trong thời
gian qua, những lời động viên, góp ý của TS Nguyễn Lương Nhật đã giúp tôi có
được nhiều ý tưởng hơn để hoàn thiện luận văn này.
Cuối cùng, tôi xin chân thành cảm ơn gia đình, lãnh đạo cơ quan và các bạn

đồng nghiệp đã luôn động viên, tạo điều kiện và dành cho tôi những góp ý chân thành
để tôi hoàn thành khóa học và luận văn này.
Em xin chân thành cảm ơn!
TP. Hồ Chí Minh, ngày 10 tháng 11 năm 2017.
Học viên thực hiện

Bồ Thanh Long


iii

MỤC LỤC
LỜI CAM ĐOAN ....................................................................................................... i
LỜI CẢM ƠN ............................................................................................................ ii
MỤC LỤC ................................................................................................................. iii
DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT .............................................. vi
DANH MỤC CÁC BẢNG....................................................................................... vii
DANH MỤC CÁC ĐỒ THỊ, HÌNH VẼ ................................................................. viii
MỞ ĐẦU .....................................................................................................................1
Chương 1- TỔNG QUAN VỀ KỸ THUẬT THỦY VÂN VÀ AUDIO SỐ ..............4
1.1 Tổng quan về kỹ thuật thủy vân .......................................................................4
1.1.1 Giới thiệu ...............................................................................................4
1.1.2 Phân loại ................................................................................................5
1.1.3 Ứng dụng ...............................................................................................7
1.2 Hàm băm ..........................................................................................................9
1.2.1 Hàm băm là gì .......................................................................................9
1.2.2 Hàm băm MD5 ....................................................................................10
1.3 Tổng quan về âm thanh số..............................................................................12
1.3.1 Sơ lược về âm thanh số .......................................................................12
1.3.2 Xử lý âm thanh số ...............................................................................14

1.4 Mô hình hệ thống thủy vân trên Audio số......................................................18
1.4.1 Khái niệm Thủy vân audio số .............................................................18
1.4.2 Quá trình nhúng/ trích xuất thủy vân trên Audio số............................18
1.4.3 Đánh giá chất lượng hệ thống thủy vân Audio ...................................19
1.5 Kết luận chương .............................................................................................20
Chương 2- KỸ THUẬT THỦY VÂN BỀN VỮNG TRONG AUDIO ....................21
2.1 Thuật toán nhúng thủy vân trên miền không gian..........................................21
2.1.1 Phương pháp thay thế bit có trọng số thấp - LSB ...............................21
2.1.2 Thuật toán nhúng, trích thủy vân dùng phép biến đổi LSB ................22
2.1.3 Ưu khuyết điểm của thuật toán LSB ...................................................23


iv

2.2 Thuật toán thủy vân Audio số dùng biến đổi Cosin rời rạc ..........................23
2.2.1 Phép biến đổi cosin rời rạc ( DCT ) ....................................................23
2.2.2 Thuật toán nhúng và trích xuất thủy vân dùng DCT ...........................26
2.2.3 Ưu nhược điểm của thuật toán: ...........................................................27
2.3 Thuật toán thủy vân Audio số dùng biến đổi Cosin rời rạc có điều chỉnh.....28
2.3.1 Phép biến đổi Cosin rời rạc có điều chỉnh (mDCT) ............................28
2.3.2 Thuật toán nhúng và trích xuất thủy vân dùng mDCT........................31
2.3.3 Ưu khuyết điểm của thuật toán ...........................................................32
2.4 Thuật toán thủy vân Audio số dùng biến đổi Wavelet rời rạc .......................32
2.4.1 Phép biến đổi Wavelet liên tục ............................................................32
2.4.2 Phép biến đổi wavelet rời rạc ..............................................................34
2.4.3 Thuật toán nhúng và trích xuất thủy vân dùng biến đổi DWT ...........37
2.4.4 Ưu nhược điểm của thuật toán ............................................................39
2.5 Thuật toán đề xuất ( sDWT) ...........................................................................39
2.5.1 Thuật toán nhúng và trích xuất thủy vân sDWT .................................39
2.5.2 Ưu khuyết điểm của thuật toán ...........................................................40

2.6 Kết luận chương .............................................................................................40
Chương 3- CHƯƠNG TRÌNH MÔ PHỎNG............................................................42
3.1 Công cụ mô phỏng và mục đích của chương trình mô phỏng .......................42
3.2 Mô hình và giải thuật mô phỏng ....................................................................42
3.3 Giao diện chương trình và các bước thực hiện mô phỏng .............................43
3.3.1 Giao diện chương trình ........................................................................43
3.3.2 Các bước thực hiện mô phỏng.............................................................44
3.4 Kết quả mô phỏng - đánh giá .........................................................................45
3.4.1 Thời gian thực hiện .............................................................................45
3.4.2 Tỉ số tín hiệu trên nhiễu (SNR) ...........................................................46
3.4.3 Sai số bình phương trung bình (MSE) ................................................47
3.5 Kết quả mô phỏng tấn công ...........................................................................48
3.5.1 Tấn công lấy mẫu lại giảm-tăng ..........................................................48


v

3.5.2 Tấn công lấy mẫu lại tăng - giảm ........................................................49
3.5.3 Tấn công bằng thêm nhiễu ..................................................................51
3.5.4 Tấn công bằng nén DCT .....................................................................52
3.5.5 Tấn công lọc thông thấp ......................................................................53
3.5.6 Tấn công nén mp3 ...............................................................................54
3.6 Kết luận chương .............................................................................................55
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN CỦA ĐỀ TÀI .........................................57
DANH MỤC CÁC TÀI LIỆU THAM KHẢO .........................................................58


vi

DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT

Viết tắt Tiếng Anh

Tiếng Việt

1D

1- Dimension

1 chiều

2D

2- Dimension

2 chiều

CSS

Content Scrambling System

Hệ thống mã hoá văn bản

DCT

Discrete Cosine Transform

Biến đổi cosin rời rạc

DWT


Discrete Wavelet Transform

Biến đổi Wavelet rời rạc

IDCT

Inverse discrete cosine transform

DCT ngược

IDWT

Inverse Discrete Wavelet Transform

DWT ngược

IIPA

International Intellectual Property Alliance Hiệp hội bảo vệ tác quyền
thế giới

IMDCT Inverse Modified discrete cosine transform MDCT ngược
HAS

Human Auditory System

Hệ thống thính giác

HVS


Human Visual System

Hệ thống thị giác

LSB

Least significant bit

Bít có trọng số thấp

MDCT

Modified Discrete Cosine Transform

Biến đổi Cosin rời rạc có
điều chỉnh

MD5

Message-Digest algorithm 5

Thuật toán băm MD5

MSE

Mean Squared Error

Sai số bình phương trung
bình


National Institute of Standards and

Viện tiêu chuẩn và công nghệ

Technology

Quốc gia (Hoa kỳ)

PCM

Pulse Code Modulation

Điều chế xung mã

PN

Pseudo Noise

chuỗi giả ngẫu nhiên

PSNR

Peak signal to noise ratio

Tỉ số tín hiệu đỉnh trên nhiễu

sDWT

stereo DWT


Thuật toán đề xuất của tác

NIST

giả
SNR

Signal to noise ratio

Tỉ số tín hiệu trên nhiễu


vii

DANH SÁCH BẢNG
Bảng 1.1 Các tiêu chuẩn lấy mẫu Audio điển hình........................................17
Bảng 3.1 Thời gian nhúng/ tách của các thuật toán .......................................46
Bảng 3.2 Tỉ số SNR và phổ tín hiệu âm thanh trước nhúng/ sau nhúng .......46
Bảng 3.3 Tỉ số MSE và thủy vân sau khi tách ...............................................47
Bảng 3.4 Kết quả tấn công lấy mẫu lại giảm - tăng .......................................48
Bảng 3.5 Kết quả tấn công lấy mẫu lại tăng – giảm ......................................49
Bảng 3.6 Kết quả tấn công thêm nhiễu ..........................................................51
Bảng 3.7 Kết quả tấn công nén DCT .............................................................52
Bảng 3.8 Kết quả tấn công lọc thông thấp .....................................................53
Bảng 3.9 Kết quả tấn công nén mp3 ..............................................................54


viii

DANH SÁCH HÌNH VẼ

Hình 1. 1 Mô hình nhúng tin cơ bản ................................................................4
Hình 1. 2 Ví dụ về hàm băm ............................................................................9
Hình 1. 3 Sơ đồ thực hiện MD5 .....................................................................10
Hình 1. 4 Một tác vụ trong một vòng của MD5.............................................11
Hình 1. 5 Biểu diễn dạng sóng âm thanh tần số 10 kHz ................................14
Hình 1. 6 Các dạng biễu diễn âm thanh .........................................................15
Hình 1. 7 Các bước số hóa tín hiệu tương tự .................................................16
Hình 1. 8 Ví dụ về quá trình số hóa ...............................................................16
Hình 1. 9 Quá trình chuyển đổi tín hiệu số sang tín hiệu tương tự ................17
Hình 1. 10 Dữ liệu file 1.wav.........................................................................17
Hình 1. 11 Hệ thống thủy vân Audio đơn giản ..............................................18
Hình 2. 1 Giá trị 8 bit của tín hiệu A = 218 ...................................................21
Hình 2. 2 Giá trị 8 bit của tín hiệu B=219 sau khi nhúng bit 1 vào LSB của A
........................................................................................................................22
Hình 2. 3 Giá trị 8 bit của tín hiệu C=218 sau khi nhúng bit 0 vào LSB của A
........................................................................................................................22
Hình 2. 4 a)Tín hiệu gốc

b) Tín hiệu sau biến đổi DCT .26

Hình 2. 5 Các hàm cửa số mDCT ..................................................................30
Hình 2. 6 a) Tín hiệu gốc

b) Tín hiệu sau biến đổi mDCT

........................................................................................................................30
Hình 2. 7 Phân tích wavelet đa phân giải mức 1............................................35
Hình 2. 8 Quá trình phân tích và tổng hợp dùng DWT .................................36
Hình 2. 9 a) Tín hiệu gốc


b) Tín hiệu sau biến đổi DWT họ

Haar ................................................................................................................36
Hình 2. 10 Phân tích wavelet 2 chiều ............................................................37
Hình 2. 11 Biến đổi DWT2 họ Haar ..............................................................37
Hình 3. 1 Mô hình nhúng thủy vân ................................................................42
Hình 3. 2 Mô hình trích xuất thủy vân ...........................................................43


ix

Hình 3. 3 Giao diện chương trình ..................................................................43
Hình 3. 4 Các bước thực hiện mô phỏng .......................................................44
Hình 3. 5 Ảnh thủy vân vnpt và âm thanh chứa “1.wav” ..............................45


1

MỞ ĐẦU
Sự phát triển nhanh chóng của khoa học kỹ thuật trên nhiều lĩnh vực đặc biệt
là trong lĩnh vực đa phương tiện đã đem lại những bước phát triển vượt bậc trong xã
hội. Truyền thông băng rộng cùng với các định dạng dữ liệu số phong phú đã mở ra
nhiều cơ hội và không ít thách thức. Với sự phát triển của internet, các ấn phẩm số,
sản phẩm đa phương tiện như âm thanh, hình ảnh, video…có thể được thu nhận, sao
chép và phân phối một cách dễ dàng bởi một cái click chuột do các sản phẩm đa
phương tiện đa số đều không được bảo mật.
Bên cạnh những mặt tích cực, lại nảy sinh những vấn nạn như: giả mạo, ăn
cắp bản quyền, sao chép trái phép..., những thao tác này thực hiện rất dễ dàng trong
xã hội chúng ta hiện nay. Theo kết quả thống kê của Hiệp hội bảo vệ tác quyền thế
giới (International Intellectual Property Alliance - gọi tắt là IIPA), mỗi năm ngành

công nghiệp giải trí nói chung và âm nhạc nói riêng thất thoát hàng ngàn tỉ đô-la.
Làm thế nào để xác nhận bản quyền tác giả, phát hiện sự xuyên tạc thông tin
là một nhu cầu thiết yếu nhằm bảo vệ bản quyền cho các phương tiện dữ liệu số. Bắt
đầu bằng các giải thuật mật mã (cryptography) làm cho dữ liệu không thể đọc được
đối với những người không có khóa giải mã. Tuy nhiên, các hệ thống mật mã không
hoàn toàn giải quyết được vấn đề này, bởi vì một khi mật mã đã bị tháo bỏ thì việc
sử dụng và phổ biến dữ liệu bất hợp pháp cũng không thể kiểm soát được nữa, đối
với trình độ các hacker hiện nay điều đó không mấy khó khăn. Khái niệm về digital
watermarking (thủy vân số) xuất hiện trong quá trình cố gắng tìm ra các giải pháp
liên quan đến bản quyền của các tài sản tri thức trên các phương tiện truyền thông số.
Nó được sử dụng như một biện pháp để nhận dạng tác giả hay nhà phân phối của dữ
liệu số. Khuynh hướng nghiên cứu hiện tại đang hướng về các phương thức khai thác
tính không hoàn hảo của hệ thị giác (HVS – Human Visual System) và thính giác
(HAS – Human Auditory System) của con người để tạo các watemark trong suốt và
bền vững hơn cho ảnh, video hay âm thanh số. Kỹ thuật thủy vân (Watermarking) là


2

một trong những giải pháp để bảo vệ quyền sở hữu, là một công nghệ đầy hứa hẹn
cho việc bảo mật thông tin.
Nhiều thuật toán thủy vân đã được nghiên cứu. Hầu hết trong số đó đã được
phát triển cho các dữ liệu hình ảnh kỹ thuật số và video. Sự quan tâm và nghiên cứu
trong thủy vân âm thanh bắt đầu ít lâu sau đó. So với thủy vân video số và thủy vân
ảnh, các thuật toán thủy vân âm thanh không dễ phát triển vì hệ thống thính giác của
con người (HAS) cực kỳ nhạy cảm hơn so với hệ thống thị giác của con người (HVS).
HAS cũng rất nhạy với một dải động học của các biên độ và tần số. Ngay cả một
lượng nhỏ nhiễu cũng có thể được phát hiện bằng tai người thường. Cuối cùng, các
đoạn âm thanh thường khá ngắn so với các clip video về thời gian và kích thước tập
tin. Do đó, số lượng thông tin ẩn trong các đoạn âm thanh tương đối lớn so với hình

ảnh hoặc video. Như vậy, thông tin này có xu hướng làm suy giảm chất lượng âm
thanh. Chính vì thế, luôn có mâu thuẫn giữa tính không thể đọc và tính bền vững
trong các phương pháp thủy vân âm thanh hiện tại. Việc tìm ra một sự cân bằng thỏa
đáng giữa hai khía cạnh này trở thành một chỉ số quan trọng để đánh giá kỹ thuật thủy
vân âm thanh số. Một số kỹ thuật hiện đang tồn tại cho việc nhúng thủy vân âm thanh,
chúng có thể được phân thành nhiều loại, trong miền thời gian, miền chuyển đổi, hoặc
miền kép.
Với mục đích bảo vệ quyền tác giả của các ấn phẩm audio số, em xin chọn đề
tài “Nghiên cứu kỹ thuật thủy vân bền vững trong audio” để làm luận văn tốt nghiệp
của mình.
Kỹ thuật thủy vân trong audio số là các phương thức nhúng thông tin thủy vân
(Watermark) vào trong các sản phẩm audio số, mà người nghe không cảm nhận được
chất lượng của sản phẩm audio đó thay đổi. Thông tin thủy vân có thể là các ký tự,
logo hay thậm chí là các đặc điểm sinh trắc của chủ sở hữu như: vân tay, mống
mắt…sau khi nhúng vào sản phẩm audio, sẽ được trích xuất lại để chứng minh quyền
sở hữu của sản phẩm đó khi cần.
Kỹ thuật nhúng thông tin thủy vân vào audio số có thể thực hiện trực tiếp trên
miền không gian như LSB, hay trên các miền biến đổi như: Fourier rời rạc (DFT),


3

Cosin rời rạc (DCT), Wavelet rời rạc (DWT). Tùy theo tính trong suốt hay tính bền
vững của sản phẩm mà có thể chọn các phương thức để nhúng trực tiếp trên miền
không gian hay trên các miền biến đổi, nếu nhúng trên miền không gian thì tính trong
suốt tốt hơn, còn nhúng trên miền biến đổi thì tính bền vững cao hơn.
Trong nội dung luận văn, tác giả tập trung nghiên cứu các phương thức nhúng
và trích xuất thông tin thủy vân trên miền không gian và miền biến đổi, đánh giá các
phương pháp nhúng và quan trọng hơn hết là so sánh tính bền vững giữa phương thức
nhúng trong miền không gian (LSB) với các phương thức nhúng trong miền biến đổi

(DCT, mDCT, DWT, sDWT). Luận văn được trình bày với bố cục và các nội dung
chính như sau:
▪ Mở đầu.
▪ Chương 1: Tổng quan về kỹ thuật thủy vân và audio số. Chương này giới
thiệu một cách tổng quan về thủy vân và audio số. Giới thiệu đôi nét về kỹ
thuật thủy vân âm thanh số . Giới thiệu về hàm băm MD5.
▪ Chương 2: Giới thiệu kỹ thuật nhúng, trích xuất thủy vân âm thanh trong
miển không gian ( LSB ) và một số kỹ thuật nhúng, trích xuất thủy vân âm
thanh trong miền biến đổi (DCT, mDCT, DWT và sDWT).
▪ Chương 3: Chương trình mô phỏng nhúng và trích xuất thủy vân. Chương
này trình bày giải thuật và chương trình mô nhúng, trích xuất thủy vân bằng
phần mềm Matlab cũng như đưa ra kết quả thực nghiệm khi mô phỏng một
số tấn công như lấy mẫu lại, nén DCT, thêm nhiễu, lọc thông thấp, nén
mp3.
▪ Kết luận và hướng phát triển.
Với thời gian ngắn, tác giả đã rất cố gắng để nghiên cứu và hoàn thành luận
văn, xong cũng không tránh được những thiếu sót. Kính mong Quí Thầy, Cô và các
bạn đồng nghiệp góp ý thêm.


4

Chương 1- TỔNG QUAN VỀ KỸ THUẬT THỦY VÂN
VÀ AUDIO SỐ
1.1 Tổng quan về kỹ thuật thủy vân
1.1.1 Giới thiệu
Thủy vân là kỹ thuật nhúng thông tin vào trong một nguồn đa phương tiện nào
đó (ví dụ như ảnh số, tín hiệu audio, video…) mà người dùng không thể nhận biết về
sự tồn tại của thông tin đem nhúng.
Kỹ thuật thủy vân trong tín hiệu âm thanh mới chỉ được chú ý vài năm gần

đây do gặp rất nhiều khó khăn khi tiếp cận với hệ thống thính giác con người (HAS).
Bởi vì HAS rất nhạy cảm và phức tạp hơn so với hệ thống thị giác (HVS). Nhưng bù
lại, tiềm năng của lĩnh vực này là rất lớn, cả trong thương mại lẫn quân sự…
Do lĩnh vực giấu thông tin trong multimedia còn khá mới nên hiện nay đang
tồn tại nhiều mô hình giấu tin khác nhau. Tùy theo hướng nghiên cứu và phạm vi áp
dụng mà người ta chọn một mô hình thích hợp. Sau đây là mô hình nhúng tin cơ bản
Tín hiệu đánh dấu

Tín hiệu gốc
Tin mật
Nhúng tin

Khoá mật
Bộ nghe nhạc tuỳ chọn
Tin mật

Bộ ghi/ Nghe nhạc...
Chiết rút
Khoá mật

Hình 1. 1: Mô hình nhúng tin cơ bản

Xử lý/
Tấn
công


5

Dựa vào mô hình trên, ta thấy có 4 đối tượng chính trong một bài toán nhúng

thông tin:
• Thông tin mật: Là thông tin nhúng vào đối tượng chứa, và cũng là thông tin
cần được bảo vệ. Tuỳ theo từng phương pháp cụ thể, thông tin này sẽ được bảo vệ
với các mức độ khác nhau. Thông tin mật không giới hạn về kiểu định dạng. Còn
kích thước phụ thuộc vào yêu cầu bảo mật và lĩnh vực ứng dụng.
• Đối tượng chứa: Là đối tượng dùng để chứa thông tin mật. Còn được gọi là
môi trường, tín hiệu gốc, hoặc tín hiệu chủ. Do các phương pháp nhúng tin ngày nay
hầu hết đều hỗ trợ định dạng dữ liệu số, nên đối tượng chứa có chung đặc điểm là
“số”. Kích thước của đối tượng chứa thường đòi hỏi lớn hơn nhiều kích thước thông
tin mật.
• Đối tượng đã nhúng: Là đối tượng chứa sau khi nhúng thông tin mật, hay
còn gọi là đối tượng đã thủy vân. Khi xét đối tượng nhúng, ta chỉ quan tâm đến chất
lượng và kích thước của nó. Nhìn chung, chất lượng bị thay đổi so với đối tượng gốc.
Tuy nhiên, mức độ thay đổi phụ thuộc vào yêu cầu và phương pháp tiến hành. Kích
thước của đối tượng đã nhúng bằng kích thước của đối tượng chứa.
• Khoá mật: Là khoá tham gia vào quá trình nhúng, tuỳ theo từng thuật toán
mà khoá này có tham gia hay không. Chiều dài của khoá phụ thuộc vào thuật toán tạo
khoá. Nhưng nhìn chung, khoá càng dài thì mức độ an toàn, bí mật càng cao. Khoá
mật này hoặc chỉ được dùng trong giai đoạn mã hoá, hoặc có thể dùng trong cả hai
giai đoạn mã hoá và giải mã.

1.1.2 Phân loại
Dựa vào các tính chất khác nhau, lĩnh vực áp dụng, ta có thể phân loại thủy
vân thành các nhóm như sau:
Phân loại theo khả năng cảm nhận:
Dựa vào khả năng cảm nhận của con người trước các thay đổi trên đối tượng
chứa sau khi nhúng thông tin. Nhóm này phân thành hai loại chính là: thủy vân hữu
hình và thủy vân vô hình.



6

- Thủy vân hữu hình, người dùng cuối có khả năng “nhìn” thấy thông tin mật
đem nhúng. Thông thường các ứng dụng loại này sử dụng một logo làm thông tin mật
để chống việc giả mạo, ăn cắp thông tin. Ví dụ như nhúng logo vào giấy, hoặc nhúng
vào tiền...
- Thủy vân vô hình, người dùng không thể biết được bất cứ thông tin nào về
đối tượng nhúng. Các ứng dụng loại này thường dùng để bảo vệ quyền sở hữu trí tuệ.
Thông tin được nhúng thường là ảnh hay đoạn văn bản xác thực quyền tác giả.
Cần lưu ý: Đối với đối tượng chứa là ảnh số hay video, ta sử dụng thuật ngữ
thủy vân hữu hình/ vô hình. Còn đối với âm thanh thì sử dụng thuật ngữ thủy vân cảm
thụ/ không cảm thụ.
Phân loại theo tính bền vững:
Dựa vào khả năng chống lại các kiểu tấn công của kỹ thuật thủy vân, có thể
chia hệ thống thủy vân thành ba loại: Robust, Fragile và Semi - fragila.
- Robust- Thủy vân được dùng trong trường hợp thông tin mật rất quan trọng
không thể tiết lộ, chỉ có tác giả mới biết chính xác thông tin gì đang được nhúng vào
đối tượng chứa. Thủy vân được nhúng theo phương thức bền vững rất khó bị phá hủy.
Dạng ứng dụng này thường thấy trong các trường hợp bảo vệ quyền tác giả.
-Fragile- Thủy vân thường được sử dụng trong các ứng dụng bảo vệ nội dung.
Bất cứ sự thay đổi nào cũng dẫn tới sự phá huỷ hoàn toàn thông tin đem giấu. Ngoài
ra còn dùng để phát hiện lỗi trong quá trình truyền dẫn nhằm đánh giá hiệu quả truyền
tải dữ liệu.
- Semi-fragile: thông tin sẽ không bị ảnh hưởng trước các thao tác thay đổi
phù hợp, nhưng sẽ bị phá huỷ nếu đấy là các thao tác không hợp lệ.
Phân loại theo thuộc tính trích xuất:
Dựa vào các đặc tính trích xuất thông tin mật của phần thu mà ta có thể phân
loại thủy vân như sau:
- Nonblind Watermarking: sử dụng thông tin đối tượng chứa và thông tin mật
trong quá trình trích xuất. Ứng dụng này được dùng trong các trường hợp xác thực

một đối tượng có chứa thông tin mật xác định nào đó hay không.


7

- Semiblind Watermarking: chỉ sử dụng thông tin về đối tượng chứa để trích
xuất. Ứng dụng này dùng được dùng trong trường hợp muốn lấy thông tin về thông
điệp mật. Tuy nhiên, kỹ thuật thủy vân theo hướng này rất ít gặp trong thực tế.
- Blind Watermarking: Đây là kỹ thuật thường gặp trong thực tế. Quá trình
trích xuất không cần sử dụng bất cứ thông tin gì về các đối tượng chứa hay thông điệp
mật.
Phân loại theo đặc tính của khoá mật:
Căn cứ vào tính chất các loại khoá mà ta chia thành hai loại như sau:
- Khóa công khai: Để mã hoá dữ liệu cả bên gửi lẫn bên nhận đều dùng chung
một khóa chia sẻ phổ biến, nhưng mỗi bên sẽ có một khoá riêng để giải mã bản tin.
- Khóa bí mật: Quá trình mã hoá và giải mã đều dùng chung một khoá.

1.1.3 Ứng dụng
Theo dõi phát sóng
Trong thực tế, việc phát sóng các đoạn phim hay âm thanh qua các phương
tiện thông tin đại chúng có những nhu cầu như: các nhà quảng cáo muốn chắc chắn
rằng đoạn chương trình quảng cáo của họ được phát đủ thời gian mà họ đã mua từ
các nhà đài, hoặc các diễn viên tham gia đoạn chương trình quảng cáo đó muốn bảo
đảm họ được trả tiền bản quyền tương ứng với thời lượng phát sóng từ các công ty
quảng cáo, hay những người sở hữu một đoạn nhạc hay phim không muốn tác phẩm
của mình bị xâm phạm tác quyền qua việc thu và phát sóng lại.
Một cách để giải quyết điều này là sử dụng hệ thống theo dõi tự động thụ động
và chủ động.
Nhận ra người chủ sở hữu/ bằng chứng về quyền sở hữu
Thông báo tác quyền chúng ta thường thấy trên có các tài liệu khả kiến là

“Copyright ngày người sở hữu”, “© ngày người sở hữu” hay “Corp. ngày người sở
hữu”. Việc đánh dấu tác quyền như trên rất dễ bị người khác loại bỏ, do đó chúng ta
sử dụng thủy vân để nâng mức bảo mật và an toàn của đánh dấu tác quyền.


8

Do các thủy vân có thể vừa không thể nhận thấy vừa không thể tách rời đối
tượng chứa nó nên chúng là giải pháp tốt đối với việc nhận ra người sở hữu nếu người
dùng tác phẩm được cung cấp bộ dò thủy vân.
Lưu vết giao dịch hay dấu vân tay
Trong ứng dụng này, thủy vân lưu lại một hay nhiều giao dịch đã xảy ra trong
những lần sao chép tác phẩm đã có nhúng thủy vân. Ví dụ, thủy vân có thể lưu tên
người mua trong mỗi lần mua bán hợp pháp hay phân phối. Người sở hữu và người
tạo ra tác phẩm có thể dùng những thủy vân khác nhau trong mỗi bản sao. Nếu tài
liệu bị dùng sai mục đích (phát hành hay phân phối trái phép), người sở hữu có thể
tìm ra người có trách nhiệm liên quan.
Xác nhận nội dung
Các tác phẩm kỹ thuật số ngày nay đứng trước nguy cơ bị làm giả nhiều hơn,
dễ dàng hơn và tinh vi hơn. Bài toán xác nhận thông điệp đã được nghiên cứu rộng
rãi trong lĩnh vực mã hóa (crytography). Thông thường là tạo ra một chữ kí điện tử,
chỉ có tác giả thông điệp mới biết khoá cần để tạo ra các chữ ký. Do vậy, kẻ trộm cố
thay đổi thông điệp thì sẽ không tạo ra được một chữ ký mới. Nếu khi tiến hành so
sánh, thông điệp được sửa đổi khác với chữ ký gốc, ta có thể khẳng định thông điệp
đã bị sửa.
Chữ ký dạng như vậy chung qui là một dạng dữ liệu data được đi kèm với tài
liệu mà chúng xác nhận. Điều này cho thấy rất dễ làm mất các chữ ký. Nếu ảnh được
chuyển sang dạng khác, chữ ký sẽ bị mất và dĩ nhiên tài liệu không còn được chứng
thực nữa.
Một giải pháp hay là những chữ ký nhúng trực tiếp vào tài liệu dùng kỹ thuật

thủy vân. Epson đề ra một hệ thống như vậy trên nhiều máy ảnh kỹ thuật số của hãng.
Ta gọi chữ ký này là chữ kí xác thực (authentication mark). Chữ kí xác thực được
thiết kế sao cho nó bị sai lệch dù chỉ gặp sự chỉnh sửa nhỏ nhất được gọi là các thủy
vân dễ vỡ (fragile watermark).


9

Kiểm soát sao chép
Các ứng dụng đã đề cập ở trên hầu hết có tác dụng sau khi có ai đó làm sai.
Các kỹ thuật này có thể nói là chữa bệnh chứ không phòng bệnh. Rõ ràng là sẽ tốt
hơn nếu ngăn ngay từ đầu những hành vi bất hợp pháp, như vậy một ứng dụng kiểm
soát sao chép ngăn không cho tạo các bản sao bất hợp pháp từ nội dung đã có bản
quyền.

1.2 Hàm băm
1.2.1 Hàm băm là gì
Hàm băm là hàm chuyển đổi một thông điệp có độ dài bất kỳ thành một dãy
bit có độ dài cố định. Theo [2], các hàm băm nhận một chuỗi bit có chiều dài tùy ý
(hữu hạn) làm dữ liệu đầu vào và tạo ra một chuỗi bit mới có chiều dài cố định n bit
(n > 0), được gọi là giá trị băm hay mã băm. Giá trị của hàm băm là duy nhất, và
không thể suy ngược lại được nội dung thông điệp từ giá trị băm này.

Hình 1. 2: Ví dụ về hàm băm

Các tính chất của hàm băm:


Tính kháng tiền ảnh: Với mọi đầu ra y cho trước không thể tính toán


để tìm được bất kỳ một dữ liệu đầu vào x’ nào sao cho giá trị băm h(x’) bằng giá
trị đầu ra y đã cho.


10



Tính kháng tiền ảnh thứ hai: Với mọi dữ liệu đầu vào x1 cho trước,

không thể tính toán để tìm ra được bất kỳ một đầu vào x2 nào (x1 ≠ x2) sao cho giá
trị băm h(x2 ) = h(x1 ).


Tính kháng xung đột: Không thể tính toán để tìm được hai dữ liệu đầu

vào x1 ≠ x2 sao cho chúng có cùng giá trị băm.

1.2.2 Hàm băm MD5
MD5 (Message-Digest algorithm 5) là một hàm băm mật mã được sử dụng
phổ biến với giá trị băm dài 128-bit. Là một chuẩn Internet (RFC 1321), MD5 đã
được dùng trong nhiều ứng dụng bảo mật, và cũng được dùng phổ biến để kiểm tra
tính toàn vẹn của tập tin.
N x 512 bit
64 bit
Message

512 bit

12 M

2

512

128

F

128

H1

F

128



H2

MN bit

…..

….
.

512




Length

512 bit

512bit

12 M
1

IV (H0)

100…00

N block

512

HN-1

….
.

F

128



HN

Hash value

Hình 1. 3: Sơ đồ thực hiện MD5

MD5 chuyển một đoạn thông tin chiều dài thay đổi thành một kết quả chiều
dài không đổi 128 bit. Mẫu tin đầu vào hàm băm được chia thành từng đoạn 512 bit;
mẫu tin sau đó được chèn vào một số bit sao cho chiều dài của nó chia chẵn cho 512.
Việc thực hiện chèn vào như sau: đầu tiên một bit 1 được chèn vào cuối mẫu tin, tiếp
theo là một dãy các bit 0 sao cho chiều dài của mẫu tin lên tới 64 bit ít hơn so với bội
số của 512. Những bit còn lại được lấp đầy bằng một số nguyên 64-bit đại diện cho
chiều dài của mẫu tin gốc.


11

Quá trình tính giá trị băm của mẫu tin là quá trình lũy tiến. Trước tiên block
M1 kết hợp với giá trị khởi tạo H0 thông qua hàm F để tính giá trị hash H1. Sau đó
block M2 được kết hợp với H1 để cho ra giá trị hash là H2. Block M3 kết hợp với H2
cho ra giá trị H3. Cứ như vậy cho đến block MN thì ta có giá trị băm của toàn bộ mẫu
tin là HN.
Giải thuật MD5 chính hoạt động trên trạng thái 128-bit, được chia thành 4 từ
32-bit, với ký hiệu A, B, C và D. Chúng được khởi tạo với những hằng số cố định.
Giải thuật chính sau đó sẽ xử lý các khối tin 512-bit, mỗi khối xác định một trạng
thái. Quá trình xử lý khối tin bao gồm bốn giai đoạn giống nhau (bốn vòng); Mỗi
vòng gồm có 16 tác vụ giống nhau dựa trên hàm phi tuyến, phép cộng moddulo 232,
và dịch trái. Hình 1.4 mô tả một tác vụ trong một vòng.

Hình 1. 4: Một tác vụ trong một vòng của MD5

Trong đó:

F: là một hàm phi tuyến; một hàm được dùng trong mỗi vòng.
Mi: là một khối tin nhập vào 32-bit.
Ki: một hằng số 32-bit, khác nhau cho mỗi tác vụ.
s

:chỉ sự xoay bit về bên trái s đơn vị; s thay đổi tùy theo từng tác vụ.

: chỉ cộng thêm với modulo 232.
Có 4 khả năng cho hàm F; mỗi cái được dùng khác nhau cho mỗi vòng:


12



F(B,C, D) = (B C)  (B  D)

(1.1)



G(B,C,D) = (B C)  (C D)

(1.2)



H(B,C, D) = B C D

(1.3)




I(B,C,D) = C (B D)

(1.4)

Một bảng băm MD5 128 bit thường được diễn tả bằng một chuỗi 32 số hệ
thập lục phân. Sau đây các ví dụ ngõ vào mã ASCII và bảng băm MD5 tương ứng:
▪ MD5(“”) = “d41d8cd98f00b204e9800998ecf8427e”
▪ MD5(“Well Come to PTIT”) = “3fa94d49ff3e858f0a905bdbdcbda963”
▪ MD5(“WellCome to PTIT”) = “0f27329b43cd3d59ad2df2f47ad6bfaf”

Ta thấy chỉ khác khoảng trống, nội dung giống nhau cũng cho giá trị Hash
khác nhau.

1.3 Tổng quan về âm thanh số
1.3.1 Sơ lược về âm thanh số
Âm thanh là những dao động cơ học lan truyền trong không khí hay trong các
môi trường khác như nước, gỗ, cao su… Khi đến tai người, những dao động này làm
cho màng nhĩ rung động, sau đó được phản ánh lên não qua các dây thần kinh và cuối
cùng âm thanh được não cảm nhận, đồng thời con người có khả năng phân biệt các
âm thanh khác nhau dựa vào một số đặc tính như tần số, nhịp điệu, mức áp lực [ 1]…
Âm thanh đóng một vai trò quan trọng trong đời sống con người với vai trò là công
cụ liên lạc, giao tiếp cũng như cảm nhận thiết yếu nhất. Âm học là ngành chuyên
nghiên cứu về âm thanh. Âm học khảo sát thuộc tính của âm thanh và nhất là những
hiểu biết sâu sắc sinh lý tai nghe con người. Điều này rất có ích trong việc tìm kiếm
và thực hiện các phép xử lý tín hiệu âm thanh số. Do vận tốc giới hạn (khoảng 300
m/s trong môi trường không khí) nên âm thanh từ một nguồn sẽ được hai tai ghi nhận
khác nhau và cho phép phân biệt được vị trí của nguồn. Sự khác biệt này làm tai

người nghe được âm thanh nổi. Một âm thanh bất kỳ được đặc trưng bởi ba đại lượng
cơ bản là: cường độ âm thanh, cao độ (tần số) và âm sắc.


13



Cường độ âm thanh: Là đại lượng phản ánh biên độ dao động của âm

thanh, được biểu diễn bằng năng lượng âm thanh sinh ra ở một khoảng cách L nào đó
so với nguồn âm, trong một đơn vị thời gian (giây), trên một đơn vị diện tích ( m 2 )
của mặt phẳng đặt vuông góc với chiều truyền âm. Cường độ âm thanh phụ thuộc vào
biên độ, tần số và môi trường truyền âm. Trong thực tế, để so sánh cường độ hai âm
thanh người ta dùng đơn vị decibel (dB)
A= log(P1/ P2)
Trong đó:
P1: cường độ âm thanh thứ nhất.
P2: cường độ âm thanh thứ hai.


Cao độ âm thanh: chia chia làm hai loại:

Cao độ tuyệt đối được biểu thị bằng giá trị của tần số f. Âm thanh càng cao thì
tần số càng lớn.
Cao độ tương đối là tỷ số giữa âm thanh cần xác định cao độ và âm thanh gốc.
Những tần số cao hơn âm thanh gốc được gọi là bội âm.
Nếu tín hiệu âm thanh tuần hoàn thì số lần lặp lại lớn nhất trong một giây là
số đo tần số của âm thanh đó. Và chu kỳ là thời gian kéo dài cho một lần lặp.



Âm sắc: biểu diễn sự phong phú về tần số do nguồn âm phát ra. Trong

thực tế không có nguồn đơn âm mà tồn tại những nguồn âm phức tạp. Chúng được
biểu diễn theo công thức sau:


P (t )   Pk sin(kt   k )

(1.5)

k 1

Trong mỗi nguồn âm đều tồn tại một thành phần tần số cơ bản:
P(t ) coban  P1 sin(t   k )

(1.6)

Biên độ của âm cơ bản là lớn nhất. Các thành phần còn lại là các hài, hài càng
cao thì năng lượng càng nhỏ. Năng lượng của âm thanh tập trung chủ yếu ở âm cơ
bản và lân cận của nó. Khi đó, nguồn âm có thể biểu diễn gần đúng bằng phương
trình:


14

P (t ) 

N


P
k 1

k

sin(kt   k )

(1.7)

Tiếng nói là một dạng đặc biệt của âm thanh. Con người dùng tiếng nói để trao
đổi thông tin với nhau. Cũng như âm thanh nói chung, tiếng nói cũng có âm sắc. Nhờ
âm sắc, ta có thể phân biệt được giọng nói của người đối thoại. Tai người nhận âm
thanh ở dải tần số từ 16 Hz đến 20000 Hz. Nhưng để hiểu nội dung của lời nói, ta chỉ
cần dải tần từ 300 Hz đến 2400 Hz. Tiếng nói có một số đặc trưng cơ bản sau:


Hàm xác suất phân bố biên độ của tiếng nói không đồng đều. Âm có

biên độ nhỏ xuất hiện nhiều, biên độ lớn xuất hiện ít.


Mật độ phổ công suất của tiếng nói không bằng phẳng.



Tồn tại âm hữu thanh, âm vô thanh trong tiếng nói.



Tương quan giữa các mẫu tiếng nói liên tiếp khác 0.




Phổ tần tiếng nói là hữu hạn



Âm hữu thanh có tính chất giả tuần hoàn.

Hình dưới đây mô tả một dạng sóng âm thanh phức tạp:

Âm lượng
Thời gian

1 chu kỳ

f = 10 kHz

Hình 1. 5: Biểu diễn dạng sóng âm thanh tần số 10 kHz

1.3.2 Xử lý âm thanh số
Ở dạng gốc, tín hiệu âm thanh là tín hiệu tương tự liên tục theo biến số thời
gian và biên độ. Tín hiệu âm thanh có thể biểu diễn ở dạng tương tự hoặc ở dạng số


×