Tải bản đầy đủ (.doc) (65 trang)

Kỹ thuật bảo vệ bản quyền nhạc số bằng thủy vân

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.08 MB, 65 trang )

1

ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CNTT VÀ TRUYỀN THÔNG

Trần Thị Thành

KỸ THUẬT BẢO VỆ BẢN QUYỀN NHẠC SỐ BẰNG
THỦY VÂN

LUẬN VĂN THẠC SĨ: KHOA HỌC MÁY TÍNH

Thái Nguyên, tháng 9 năm 2015

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

2

ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CNTT VÀ TRUYỀN THÔNG
Trần Thị Thành

KỸ THUẬT BẢO VỆ BẢN QUYỀN NHẠC SỐ BẰNG
THỦY VÂN

Chuyên ngành: Khoa học máy tính
Mã số : 60 48 01

LUẬN VĂN THẠC SĨ: KHOA HỌC MÁY TÍNH



NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS Đặng Văn Đức

Thái Nguyên, tháng 9 năm 2015

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

3

LỜI CAM ĐOAN
Tôi xin cam đoan luận văn “Kỹ thuật bảo vệ bản quyền bản nhạc số
bằng thủy vân” là sản phẩm của riêng cá nhân, không sao chép lại của người
khác. Trong toàn bộ nội dung của luận văn, những điều được trình bày hoặc là
của cá nhân hoặc là được tổng hợp, nghiên cứu từ nhiều nguồn tài liệu. Tất cả
các tài liệu tham khảo đều có xuất xứ và trích dẫn rõ ràng.
Tôi xin hoàn toàn chịu trách nhiệm và chịu mọi hình thức kỷ luật theo
quy định cho lời cam đoan của mình.
Thái Nguyên, ngày 20 tháng 07 năm 2015
Học viên

Trần Thị Thành

Số hóa bởi Trung tâm Học liệu ĐHTN

tnu.edu.vn/



4

LỜI CẢM ƠN
Lời đầu tiên, tôi xin bày tỏ lòng biết ơn đến thầy Đặng Văn Đức - Viện
Công nghệ thông tin, người đã tận tình hướng dẫn, chỉ bảo và giúp đỡ tôi
trong suốt quá trình nghiên cứu và hoàn thành luận văn này.
Tôi xin chân thành cảm ơn các thầy cô giáo trường Đại học Công nghệ
Thông tin và Truyền thông - Đại học Thái Nguyên đã giảng dạy và cung cấp
cho chúng tôi những kiến thức rất bổ ích trong thời gian học cao học, giúp tôi
có nền tảng tri thức để phục vụ nghiên cứu khoa học sau này.
Tôi cũng xin cảm ơn Lãnh đạo và đồng nghiệp tại đơn vị đã tạo điều kiện
và giúp đỡ tôi trong suốt quá trình nghiên cứu và hoàn thành luận văn. Tôi
cũng xin bày tỏ lòng cảm ơn đến gia đình và bạn bè, những người luôn quan
tâm, động viên và khuyến khích tôi trong quá trình học tập.
Thái Nguyên, ngày 20 tháng 07 năm 2015
Trần Thị Thành

Số hóa bởi Trung tâm Học liệu ĐHTN

tnu.edu.vn/


5

MỤC LỤC
LỜI CẢM ƠN .................................................................................................. 4
MỤC LỤC ........................................................................................................ 5
DANH MỤC CÁC TỪ VIẾT TẮT TRONG LUẬN VĂN .......................... 7
DANH MỤC CÁC HÌNH ẢNH ..................................................................... 8
DANH MỤC CÁC BẢNG BIỂU ................................................................... 9

MỞ ĐẦU ........................................................................................................ 10
1. Đặt vấn đề .................................................................................................. 10
2. Đối tượng và phạm vi nghiên cứu............................................................ 11
3. Hướng nghiên cứu của đề tài ................................................................... 11
4. Nội dung của luận văn .............................................................................. 11
5. Phương pháp nghiên cứu.......................................................................... 12
CHƯƠNG 1: TỔNG QUAN VỀ THỦY VÂN DỮ LIỆU ÂM THANH .. 13
1.1 Thủy vân số và thủy vân dữ liệu âm thanh .......................................... 13
1.1.1 Vài nét về lịch sử giấu tin .................................................................. 13
1.1.2 Định nghĩa .......................................................................................... 14
1.1.3 Mô hình kỹ thuật giấu tin ................................................................... 14
1.2 Phân loại kỹ thuật giấu tin ..................................................................... 15
1.3 Thủy vân và yêu cầu cơ bản của thủy vân âm thanh .......................... 17
1.3.1 Phân loại thủy vân số ......................................................................... 17
1.3.2 Mô hình hệ thống thủy vân âm thanh ................................................ 19
1.3.3 Các đặc tính của thủy vân âm thanh .................................................. 21
1.4 Một số ứng dụng đang được triển khai................................................. 21
1.5 Âm thanh số ............................................................................................. 23
1.5.1 Khái niệm về âm thanh và âm thanh số ............................................. 23
1.5.2 Một số định dạng file âm thanh trên máy tính ................................... 24

Số hóa bởi Trung tâm Học liệu ĐHTN

tnu.edu.vn/


6

CHƯƠNG 2. THUẬT TOÁN THỦY VÂN ÂM THANH TRÊN MIỀN
THỜI GIAN VÀ MIỀN TẦN SỐ ................................................................ 28

2.1 Thuật toán thủy vân âm thanh sử dụng biến đổi Cosine rời rạc ....... 28
2.1.1 Biến đổi Cosine rời rạc ...................................................................... 28
2.1.2 Thuật toán thủy vân âm thanh sử dụng biến đổi Cosine rời rạc ........ 30
2.2 Thuật toán thủy vân âm thanh sử dụng biến đổi DCT trên đoạn tín
hiệu có năng lượng cao ................................................................................. 33
2.3 Thuật toán thủy vân âm thanh sử dụng DCT và biến đổi Arnold ..... 38
2.3.1 Biến đổi Arnold .................................................................................. 38
2.3.2 Thuật toán thủy vân âm thanh sử dụng DCT và biến đổi Arnold...... 42
2.4 Thuật toán thủy vân âm thanh sử dụng kỹ thuật thay thế LSB......... 46
2.4.1 Thuật toán LSB cơ bản ...................................................................... 46
2.4.2 Thuật toán thủy vân âm thanhsử dụng kỹ thuật thay thế LSB........... 50
2.5 Kỹ thuật đánh giá hiệu quả của hệ thống thủy vân âm thanh ........... 53
2.5.1 Tỷ lệ lỗi bit (Bit Error Rate – BER)................................................... 53
2.5.2 Hệ số tương quan chuẩn hóa (Normalized Correlation Coefficient –
NCC) ........................................................................................................... 53
2.5.3 Chất lượng cảm nhận (Perceptual Quality)........................................ 53
CHƯƠNG 3. XÂY DỰNG CHƯƠNG TRÌNH THỬ NGHIỆM .............. 55
3.1 Mô hình hệ thống thử nghiệm................................................................ 55
3.2 Công nghệ sử dụng phát triển chương trình thử nghiệm ................... 57
3.3 Đánh giá kết quả thử nghiệm ................................................................. 57
KẾT LUẬN .................................................................................................... 60
TÀI LIỆU THAM KHẢO ............................................................................ 61
PHỤ LỤC 1. Cấu trúc file âm thanh dạng WAV....................................... 63

Số hóa bởi Trung tâm Học liệu ĐHTN

tnu.edu.vn/


7


DANH MỤC CÁC TỪ VIẾT TẮT TRONG LUẬN VĂN
AAC - Định dạng âm thanh chuẩn (Advanced Audio Coding)
AIFF - Định dạng không mất thông tin (Audio Interchange File Format)
DCT - Phép biến đổi Cosin rời rạc (Discrete Cosine Tranform).
FLAC - Nén âm thanh không mất dữ liệu (Free Lossless Audio Codec),
FT - Biến đổi Fourier (Fourier Transform)
LSB - Bít ít quan trọng nhất (Least Significant Bít)
MP3 - Định dạng nén âm thanh (Movie Picture Experts Group-Layer 3)
PCM - Điều biến mã xung (Pulse Code Modulation)
WAV - Định dạng âm thanh dạng sóng (Waveform Audio Format)
WMA - Định dạng âm thanh của Microsoft (Windows Media Audio)

Số hóa bởi Trung tâm Học liệu ĐHTN

tnu.edu.vn/


8

DANH MỤC CÁC HÌNH ẢNH
Hình 1.1: Lược đồ chung cho quá trình giấu tin ............................................. 14
Hình 1.2: Lược đồ chung cho quá trình tách tin ............................................. 15
Hình 1.3: Phân loại kỹ thuật giấu tin .............................................................. 16
Hình 1.4: Phân loại thủy vân số ...................................................................... 18
Hình 1.5: Mô hình thủy vân âm thanh ............................................................ 19
Hình 1.6: Mô hình tách thủy vân âm thanh..................................................... 20
Hình 1.7: Tín hiệu âm thanh ........................................................................... 23
Hình 1.8: Số hóa tín hiệu âm thanh................................................................. 24
Hình 2.1: Sơ đồ quy trình nhúng thủy vân biến đổi Cosine rời rạc ................ 31

Hình 2.2: Sơ đồ quy trình tách thủy vân biến đổi Cosine rời rạc ................... 32
Hình 2.4: Sơ đồ quy trình tách thủy vân trên đoạn tín hiệu có năng lượng cao
trong miền biến đổi ........................................................................................ 37
Hình 2.5: Phân phối các tọa độ ảnh ................................................................ 39
Hình 2.7: Sơ đồ quy trình nhúng thủy vân sử dụng DCT và biến đổi Arnold 44
Hình 2.8: Sơ đồ quy trình tách thủy vân sử dụng DCT và biến đổi Arnold ... 46
Hình 2.9:Sơ đồ quy trình nhúng thủy vân bằng phương pháp thay thế LSB . 51
Hình 2.10: Sơ đồ quy trình tách thủy vân bằng phương pháp thay thế LSB .. 52
Hình 3.1: Mô hình thử nghiệm thủy vân tệp âm thanh ................................... 56
Hình 3.2: Mô hình thử nghiệm tách thủy vân ................................................. 56
Hình 3.3: Giao diện nhúng thủy vân ............................................................... 57
Hình 3.4: Giao diện hoàn thành nhúng thủy vân ............................................ 58
Hình 3.5: Giao diện tách thủy vân .................................................................. 58
Hình 3.6: Giao diện khi hoàn thành tách thủy vân và so sánh ảnh ................. 59

Số hóa bởi Trung tâm Học liệu ĐHTN

tnu.edu.vn/


9

DANH MỤC CÁC BẢNG BIỂU
Bảng 1.1: So sánh giấu thông tin mật và giấu thông tin thủy vân .................. 17
Bảng 1.2: Một số định dạng file âm thanh trên máy tính ............................... 27
Bảng 2.1: Thuật toán chu kỳ xáo trộn Arnold ............................................... 39

Số hóa bởi Trung tâm Học liệu ĐHTN

tnu.edu.vn/



10

MỞ ĐẦU
1. Đặt vấn đề
Cuộc cách mạng thông tin dữ liệu số đã đem lại những thay đổi sâu sắc
trong xã hội và trong cuộc sống. Những thuận lợi thông tin dữ liệu số mang
lại cũng đề ra những thách thức và cơ hội mới cho quá trình đổi mới. Sự ra
đời những phần mềm có tính năng mạnh, các thiết bị mới như máy ảnh kỹ
thuật số, máy quét chất lượng cao, máy in, máy ghi âm kỹ thuật số,… đã với
tới thế giới tiêu dùng rộng lớn để sáng tạo, xử lý và thưởng thức các dữ liệu
số. Mạng Internet toàn cầu đã biến thành một xã hội ảo nơi diễn ra quá trình
trao đổi thông tin trong mọi lĩnh vực chính trị, quân sự, quốc phòng, kinh tế,
thương mại… Đồng thời trong môi trường mở và tiện nghi như thế xuất hiện
nhiều những vấn nạn, tiêu cực đang rất cần đến các giải pháp hữu hiệu cho
vấn đề an toàn thông tin như nạn ăn cắp bản quyền, nạn xuyên tạc thông tin,
truy nhập thông tin trái phép... Trong bối cảnh như vậy, việc thực thi quyền sở
hữu dữ liệu và đảm bảo sự toàn vẹn dữ liệu là một yêu cầu quan trọng đòi hỏi
các giải pháp đồng bộ, bao gồm các khía cạnh về kỹ thuật, về tổ chức và cả
luật pháp. Tháng 3/1998 ở Hồng Kông, chính quyền đã tịch thu một số lượng
đĩa CD âm nhạc lậu trị giá 85 triệu đôla, và vào 6/1998, ở Đức cũng đã tịch
thu các sản phẩm phần mềm và kĩ thuật số lậu trị giá 1,9 triệu đô la. Quốc hội
Mỹ thông qua dự luật về “Hành động bảo vệ bản quyền kỷ nguyên kĩ thuật
số” (Digital Millenium Copyright Act) để bảo vệ quyền sở hữu trí tuệ với các
sản phẩm kĩ thuật số [6]. Tất cả các việc đó nói nên sự cần thiết phải có một
cách để bảo vệ các sản phẩm kĩ thuật số khỏi các thao tác sao chép, xử lý trái
phép và ngăn chặn các hoạt động này xảy ra. Một phương pháp chống sao
chép trái phép và bảo vệ bản quyền cho các sản phẩm số - thuỷ vân số (digital
watermarking) đã ra đời trong hoàn cảnh này. Thuỷ vân số là một phương

pháp dùng để bảo vệ các sản phẩm số. Nó có thể được dùng trong các lĩnh

Số hóa bởi Trung tâm Học liệu ĐHTN

tnu.edu.vn/


vực bảo vệ bản quyền, chống sao chép, phân biệt giả mạo, …Các sản phẩm số
này có thể là văn bản, audio, video, phần mềm, ảnh,... Thuỷ vân số là một
phương pháp mới dựa trên lý thuyết tổng hợp của nhiều lĩnh vực khác nhau
như mật mã học, lý thuyết thông tin, lý thuyết truyền thông và xử lý tín hiệu
số, xử lý ảnh. Mục đích của phương pháp này là dấu thêm một lượng thông
tin có ích vào sản phẩm số và lượng thông tin này được gọi là thuỷ vân.
Chính vì tính khoa học và tính hữu ích trong ứng dụng thực tiễn của
thủy vân số trong việc bảo vệ bản quyền, đặc biệt với các tác phẩm âm nhạc
như trình bày trên đây, nên em quyết định lựa chọn đề tài là: “Kỹ thuật bảo
vệ bản quyền bản nhạc số bằng thủy vân”
2. Đối tượng và phạm vi nghiên cứu
Tìm hiểu tổng quan về các hướng tiếp cận chính cho việc bảo vệ bản
nhạc số bằng phương pháp thủy vân. Tập trung vào các thuật toán tách nhúng thủy vân
3. Hướng nghiên cứu của đề tài
a. Về lý thuyết:
Thu thập và phân tích các tài liệu và thông tin liên quan đến:
- Cấu trúc dữ liệu âm thanh
- Mô hình hệ thống thủy vân và tách thủy vân với các tệp dữ liệu âm
thanh
- Các thuật toán nhúng - tách thủy vân tệp âm thanh
- Phương pháp đánh giá chất lượng thủy vân
b. Về thực nghiệm:
- Áp dụng thử nghiệm thuật toán.

- Kiểm tra, thử nghiệm và đánh giá kết quả.
4. Nội dung của luận văn
Ngoài phần mở đầu trình bày lý do chọn đề tài và tình hình nghiên cứu


trong và ngoài nước về các kỹ thuật (thuật toán) thủy vân dữ liệu âm thanh,
phần kết luận tóm tắt các kết quả chính đã đạt được và hướng nghiên cứu tiếp
theo của luận văn, các kết quả chính của luận văn được trình bày trong 3
chương như sau đây:
Chương 1:Trình bày tổng quan về thủy vân dữ liệu đa phương tiện, trong
đó có dữ liệu âm thanh và tổng quan về cấu trúc dữ liệu âm thanh.
Chương 2:Trình bày về một số thuật toán thủy vân âm thanh trong miền
biến đổi và miền thời gian. Trước khi trình bày cụ thể về các thuật toán, một
số kiến thức cơ bản liên quan được trình bày như mô hình tổng quát thủy vân
âm thanh, các phép biến DCT và Arnold và phương pháp đánh giá hiệu quả
của hệ thống thủy vân âm thanh.
Chương 3: Trình bày thử nghiệm một thuật toán thủy vân âm thanh bằng
MatLab, kèm theo đánh giá và nhận xét.
5. Phương pháp nghiên cứu
- Nghiên cứu các tài liệu viết về dữ liệu âm thanh, thủy vân số, nhúng tách thủy vân và các vấn đề liên quan.
- Tổng hợp, so sánh, phân tích.
- Xây dựng chương trình thử nghiệm.


CHƯƠNG 1: TỔNG QUAN VỀ THỦY VÂN DỮ LIỆU ÂM THANH
1.1 Thủy vân số và thủy vân dữ liệu âm thanh
1.1.1 Vài nét về lịch sử giấu tin
Từ Steganography bắt nguồn từ tiếng Hi Lạp và được sử dụng cho tới
ngày nay, nó có nghĩa là tài liệu được phủ (covered writing). Các câu chuyện
kể về kỹ thuật giấu thông tin được truyền qua nhiều thế hệ. Có lẽ những ghi

chép sớm nhất về kỹ thuật giấu thông tin (thông tin được hiểu theo nghĩa
nguyên thủy của nó) thuộc về sử gia Herodotus người Hy lạp. Khi bạo chúa
Hy lạp Histiaeus bị vua Darius bắt giữ ở Susa vào thế kỷ thứ năm trước Công
nguyên, ông đã gửi một thông báo bí mật cho con rể của mình là Aristagoras
ở Miletus. Histiaeus đã cạo trọc đầu của một nô lệ tin cậy và xăm một thông
báo trên da đầu của người nô lệ ấy. Khi tóc của người nô lệ này mọc đủ dài,
anh ta đã được gửi tới Miletus [2][6].
Một câu chuyện khác ở thời Hy-Lạp cổ đại cũng do Herodotus ghi lại.
Môi trường để ghi văn bản chính là các viên thuốc được bọc trong sáp ong.
Demeratus, một người Hy lạp, cần thông báo cho Sparta rằng Xerxes định
xâm chiếm Hy lạp. Để tránh bị phát hiện, anh ta đã bóc lớp sáp ra khỏi các
viên thuốc và khắc thông báo lên bề mặt các viên thuốc này, sau đó bọc lại
các viên thuốc bằng một lớp sáp mới. Những viên thuốc được để ngỏ và lọt
qua mọi sự kiểm tra một cách dễ dàng.
Một cách giấu tin phổ biến là sử dụng mực không màu. Đây là một
phương tiện hữu hiệu cho bảo mật thông tin trong một thời gian dài. Người
Romans cổ đã biết sử dụng những chất sẵn có như nước quả, nước tiểu và sữa
để viết các thông báo bí mật giữa những hàng văn tự thông thường. Khi bị hơ
nóng, những loại mực không nhìn thấy này sẽ trở nên sẫm màu và có thể đọc
được một cách dễ dàng. Mực không màu cũng được sử dụng rất gần đây, như


trong thời gian chiến tranh Thế giới lần thứ II.
Ý tưởng che giấu thông tin đã có từ hàng nghìn năm về trước nhưng kỹ
thuật này được dùng chủ yếu trong quân đội và trong các cơ quan tình báo.
Mãi cho tới vài thập niên gần đây, giấu thông tin mới được các nhà nghiên
cứu và các viện công nghệ thông tin quan tâm và đã có rất nhiều các công
trình nghiên cứu về vấn đề này. Cuộc cách mạng số hoá thông tin và sự phát
triển nhanh chóng của mạng truyền thông là nguyên nhân chính dẫn đến sự
thay đổi này. Những phiên bản sao chép hoàn hảo, các kỹ thuật thay thế, sửa

đổi tinh vi, cộng với sự lưu thông phân phối trên mạng của các dữ liệu đa
phương tiện đã sinh ra rất nhiều vấn đề nhức nhối về nạn ăn cắp bản quyền,
phân phối bất hợp pháp, xuyên tạc trái phép...
1.1.2 Định nghĩa
Giấu thông tin (Steganography) là một kỹ thuật nhúng thông tin
(embeding) vào trong một nguồn đa phương tiện gọi là các phương tiện
chứa(host data) mà không gây ra sự nhận biết về sự tồn tại của thông tin giấu
(invisible).
1.1.3 Mô hình kỹ thuật giấu tin
Mô hình của kỹ thuật giấu tin cơ bản được mô tả trong Hình 1.1 và Hình
1.2. Trong đó Hình 1.1 Biểu diễn quá trình giấu tin cơ bản [6].
Thông tin cần giấu
Phương tiện chứa

Bộ nhúng
thông tin

Phương tiện chứa đã
được giấu tin

Hình 1.1: Lược đồ chung cho quá trình giấu tin
Phương tiện chứa: bao gồm các đối tượng được dùng làm môi trường để
giấu tin như text, audio, video, image …


Thông tin cần giấu: là một lượng thông tin mang một ý nghĩa nào đó tuỳ
thuộc vào mục đích của người sử dụng. Thông tin sẽ được giấu vào trong một
phương tiện chứa nhờ một bộ nhúng.
Bộ nhúng là những chương trình, thuật toán giấu tin và được thực hiện
với một khoá bí mật giống như các hệ mã mật cổ điển. Sau khi giấu tin, các

phương tiện chứa có giấu tin sẽ được gửi đi hoặc được phân phối sử dụng trên
mạng.
Khóa K
Phương tiện chứa đã
được giấu tin

Bộ lọc
thông tin

Phương tiện chứa

Thông tin giấu
Kiểm định
Hình 1.2: Lược đồ chung cho quá trình tách tin
Hình 1.2 chỉ ra các công việc giải mã thông tin đã giấu [6]. Quá trình
giải mã được thực hiện thông qua một bộ giải mã tương ứng với bộ nhúng
thông tin cùng với khoá của quá trình nhúng. Kết quả thu được gồm phương
tiện chứa gốc và thông tin đã giấu. Bước tiếp theo, thông tin giấu sẽ được xử
lý, kiểm định so sánh với thông tin giấu ban đầu.
1.2 Phân loại kỹ thuật giấu tin
Có nhiều cách để tiến hành phân loại các phương pháp giấu thông tin
thông qua các tiêu chí khác nhau: như theo phương tiện chứa tin, các phương
pháp tác động lên phương tiện chứa tin, hay phân loại dựa theo các mục đích
sử dụng....
Theo mục đích sử dụng, giấu thông tin có hai loại như hình 1.3:


Giấu thông tin

Giấu tin mật


Thủy vân số

Hình 1.3: Phân loại kỹ thuật giấu tin
Giấu thông tin mật
Đây là ứng dụng phổ biến nhất từ trước tới nay. Đối với giấu thông tin
mật người ta quan tâm chủ yếu tới các mục tiêu sau:
- Độ an toàn của tin giấu (khả năng không bị phát hiện của tin giấu).
- Lượng thông tin tối đa có thể giấu trong một phương tiện chứa cụ thể
mà vẫn có thể đảm bảo an toàn.
- Độ bảo mật của thông tin trong trường hợp giấu tin bị phát hiện.
Giấu thông tin mật không quan tâm nhiều tới các yêu cầu về khả năng
bền vững của phương tiện chứa. Việc giải mã để nhận được thông tin cũng
không cần phương tiện chứa gốc ban đầu. Các yêu cầu về khả năng chống tấn
công không được quan tâm lắm, thay vào đó là thông tin giấu phải được bảo
mật. Đối với các thuật toán giấu thông tin mật, người ta không chú trọng đến
việc bảo vệ thông tin mật trước sự tấn công của các đối thủ. Mà thay vào đó
quan tâm đến tính ẩn và tính an toàn đối với dữ liệu cần giấu.
Giấu thông tin thủy vân
Khác với kỹ thuật giấu thông tin để giữ bí mật thông tin, giấu thông tin
thủy vân có mục tiêu là bảo vệ bản quyền và xác thực thông tin. Vì vậy, kỹ
thuật này không chống lại việc khai thác thông tin, mà quan trọng nhất đối với
nó là đảm bảo tuyệt đối tính bền vững. Nghĩa là: không thể hủy bỏ được
thông tin giấu trừ khi hủy sản phẩm chứa. Ngoài ra các thông tin nhúng cần
có ảnh hưởng tối thiểu đối với phương tiện chứa. Vì vậy, thông tin cần giấu
càng nhỏ càng tốt.


Bảng so sánh giấu thông tin mật và giấu thông tin thủy vân [2]
Steganography


Watermarking

Giấu tin mật

Thủy vân số

- Tàng hình các phiên liên lạc để - Chủ yếu phục vụ cho mục
bảo mật thông tin
đích bảo vệ bản quyền

Mục
tiêu

- Dùng trong các liên lạc xác
định

Cách
thực
hiện

- Dùng trong các hoạt động
xuất bản

Không làm thay đổi phương tiện Có thể tác động nhỏ về cảm
chứa thông tin
nhận tới phương tiện chứa
- Giấu được nhiều thông tin nhất - Chỉ cần nhúng ít dữ liệu

Cách

thực
hiện

- Dữ liệu nhúng cần phải bền
vững đảm bảo trước các
- Không quan sát được việc giấu phương pháp nén dữ liệu.
thông tin
- Dữ liệu nhúng có thể nhận
thấy hay không nhận thấy
- Không kiểm tra được nếu
- Không quan tâm đến độ bền
của phương tiện chứa

không có khóa thích hợp

- Không kiểm tra được nếu

Bảng 1.1: So sánh giấu thông tin mật và giấu thông tin thủy vân
1.3 Thủy vân và yêu cầu cơ bản của thủy vân âm thanh
1.3.1 Phân loại thủy vân số
Nói đến thuỷ vân số là nói đến kỹ thuật giấu tin hướng đến những ứng
dụng bảo đảm an toàn dữ liệu cho đối tượng được sử dụng để giấu tin như:
bảo vệ bản quyền, phát hiện xuyên tạc, nhận thực thông tin, điều khiển sao
chép v.v… Có thể thấy rõ là phần ứng dụng của thủy vân rất lớn, mỗi ứng
dụng lại có những yêu cầu riêng và tính chất riêng, do đó các kỹ thuật thuỷ
vân cũng có những tính năng khác biệt tương ứng:


Thủy vân số


Thủy vân bền vững

Thủy vân ẩn

Thủy vân hiện

Thủy vân dễ vỡ

Thủy vân ẩn

Thủy vân hiện

Hình 1.4: Phân loại thủy vân số
Các kỹ thuật thuỷ vân trên hình 1.4[6] được phân biệt bởi những đặc
trưng, tính chất của từng kỹ thuật và ứng dụng những kỹ thuật đó. Thuỷ vân
“dễ vỡ” (fragile) là kỹ thuật nhúng thuỷ vân vào trong đối tượng đa phương
tiện (ảnh, âm thanh…) sao cho khi phân phối sản phẩm trong môi trường mở
nếu có bất cứ một phép biến đổi nào làm thay đổi đối tượng sản phẩm gốc thì
thuỷ vân đã được giấu trong đối tượng sẽ không còn nguyên vẹn như trước
khi giấu nữa (dễ vỡ). Các kỹ thuật thuỷ vân có tính chất này được sử dụng
trong các ứng dụng nhận thực thông tin (authentication) và phát hiện xuyên
tạc thông tin (tamper detection). Rất dễ hiểu vì sao những ứng dụng này cần
đến kỹ thuật thuỷ vân dễ vỡ. Ví dụ như để bảo vệ chống xuyên tạc một đối
tượng đa phương tiện nào đó ta nhúng một thuỷ vân vào đối tượng và sau đó
phân phối, quảng bá đối tượng đa phương tiện đó. Khi cần kiểm tra lại ta sử
dụng hệ thống đọc thủy vân. Nếu không đọc được thuỷ vân hoặc thuỷ vân đã
bị sai lệch nhiều so với thuỷ vân ban đầu đã nhúng vào thì có nghĩa là có thể
đối tượng đa phương tiện đó đã bị thay đổi. Cái khó ở đây là ta phải phân biệt
giữa sai lệch thuỷ vân do xuyên tạc và sai lệch do lỗi đường truyền. Ngược
lại, với kỹ thuật thuỷ vân dễ vỡ là kỹ thuật thuỷ vân bền vững (robust). Các

kỹ thuật thuỷ vân bền vững thường được ứng dụng trong các ứng dụng bảo vệ
bản quyền. Trong những ứng dụng đó, thuỷ vân đóng vai trò là thông tin sở
hữu của người chủ hợp pháp. Thuỷ vân được nhúng trong sản phẩm như một


hình thức dán tem bản quyền. Trong trường hợp như thế, thuỷ vân phải tồn tại
bền vững cùng với sản phẩm nhằm chống việc tẩy xoá, làm giả hay biến đổi
phá huỷ thuỷ vân. Một yêu cầu lí tưởng đối với thuỷ vân bền vững là nếu
muốn loại bỏ thuỷ vân thì chỉ có một cách duy nhất là phá huỷ sản phẩm.
Thuỷ vân bền vững lại được chia thành hai loại là thuỷ vân ẩn và thuỷ
vân hiện. Thuỷ vân hiện là loại thuỷ vân được hiện ngay trên sản phẩm và
người dùng có thể nhìn thấy được giống như các biểu tượng kênh chương
trình vô tuyến mà chúng ta thường thấy VTV3, CCTV, TV5…Các thuỷ vân
hiện trên ảnh thường dưới dạng chìm, mờ hoặc trong suốt để không gây ảnh
hưởng đến chất lượng ảnh gốc. Đối với thuỷ vân hiện, thông tin bản quyền
hiển thị ngay trên sản phẩm.
1.3.2 Mô hình hệ thống thủy vân âm thanh
Mô hình tổng quát của hệ thống thủy vân âm thanh được mô tả trên hình
1.5. Đầu vào hệ thống là tệp âm thanh, có thể là tệp âm nhạc nào đó cần bảo
vệ bản quyền và một ảnh thủy vân để nhúng vào tệp âm thanh. Bộ nhúng
thông tin là mô đun chương trình cài đặt thuật toán nhúng ảnh thủy vân vào
âm thanh. Trong luận văn này ảnh thủy vân được xác trộn trước khi nhúng
vào tệp âm thanh. Có nhiều kỹ thuật xáo trộn ảnh. Luận văn sử dụng phép
biến đổi Arnold để xáo trộn ảnh thủy vân. Sau khi biến đổi Arnold, ảnh được
biến đổi sang miền tần số. Các hệ số sau khi biến đổi DCT của ảnh được
nhúng vào tệp âm thanh.
Ảnh thủy vân
Tệp âm thanh

Bộ nhúng

thông tin

Tệp âm thanh đã
thủy vân

Hình 1.5: Mô hình thủy vân âm thanh


Như đã trình bày trong chương 1 và theo [9], có nhiều kỹ thuật thủy vân
âm thanh. Trong phạm vi luận văn này, hai kỹ thuật thủy vân âm thanh được
nghiên cứu, đó là:
- Thủy vân âm thanh trong miền thời gian với kỹ thuật nhúng thủy vân
vào LSB.
- Thủy vân âm thanh trong miền biến đổi với kỹ thuật nhúng thủy vân
vào các hệ số tập trung năng lượng cao của phép biến đổi cosine rời rạc DCT.
Việc tách thủy vân được thực hiện theo mô hình 1.6. Đầu vào của hệ
thống là tệp âm thanh đã nhúng thủy vân với một khóa K. Bộ lọc thông tin là
mô đun chương trình cài đặt thuật toán tách ảnh thủy vân khỏi dữ liệu âm
thanh. Đầu ra của hệ thống là tệp ảnh thủy vân và tệp âm thanh gốc. Trong
luận văn này, các thuật toán tách ảnh thủy vân được nghiên cứu tương ứng
với các thuật toán nhúng ảnh thủy vân vào âm thanh như trình bày trên đây.
Khóa K
Tệp âm thanh có
thủy vân

Bộ lọc
thông tin

Tệp âm thanh gốc


Ảnh thủy vân
Hình 1.6: Mô hình tách thủy vân âm thanh
Để cài đặt được mô hình nhúng ảnh thủy vân vào tệp âm thanh và tách
ảnh thủy vân khỏi tệp âm thanh, một số kiến thức cơ sở được trình bày trong
mục sau. Các kiến thức cơ sở bao gồm phép biến đổi cosine rời rạc
(thuận/nghịch), phép biến đổi Arnold (thuận/nghịch) để áp dụng trên các tín
hiệu âm thanh và tín hiệu ảnh. Ngoài ra một số độ đo đánh giá hiệu năng hệ
thống nhúng và ảnh thủy vân khỏi tệp âm thanh được trình bày.


1.3.3 Các đặc tính của thủy vân âm thanh
- Tính không thấy được: nghĩa không thể nhận thấy được sự xuất hiện
của thủy vân. Chúng ta không thể cảm nhận sự thay đổi của âm thanh sau khi
được nhúng thủy vân vào.
- Tính bền vững: nghĩa là thủy vân không thể phá hủy giá trị của âm
thanh gốc.
- Tính an toàn: có nghĩa là thủy vân không thể bị xóa một cách dễ dàng,
và có thể cung cấp đầy đủ bằng chứng về bản quyền.
- Tính vững mạnh: có nghĩa là có thể chống lại các cuộc tấn công thủy
vân của các tín hiệu âm thanh. Chúng ta vẫn còn có thể trích xuất hình mờ
ngay cả khi âm thanh bị tấn công.
- Khả năng chứa thủy vân: là số lượng dữ liệu tối đa có thể được nhúng
vào các hệ thống âm thanh.
1.4 Một số ứng dụng đang được triển khai
Thủy vân có rất nhiều ứng dụng trong đời sống nổi bật nhất [6]:
Bảo vệ bản quyền tác giả: Đây là ứng dụng cơbản nhất của kỹ thuật
thuỷ vân số (digital watermarking) - một dạng của phương pháp giấu tin. Một
thông tin nào đó mang ý nghĩa quyền sở hữu tác giả (người ta gọi nó là thuỷ
vân - watermark) sẽ được nhúng vào trong các sản phẩm, thuỷ vân đó chỉ một
mình người chủ sở hữu hợp pháp các sản phẩm đó có và được dùng làm minh

chứng cho bản quyền sản phẩm. Giả sử có một thành phẩm dữ liệu dạng đa
phương tiện như ảnh, âm thanh, video và cần được lưu thông trên mạng. Để
bảo vệ các sản phẩm chống lại các hành vi lấy cắp hoặc làm nhái cần phải có
một kỹ thuật để “dán tem bản quyền” vào sản phẩm này. Việc dán tem hay
chính là việc nhúng thuỷ vân cần phải đảm bảo không để lại một ảnh hưởng
lớn nào đến việc cảm nhận sản phẩm. Yêu cầu kỹ thuật đối với ứng dụng này
là thuỷ vân phải tồn tại bền vững cùng với sản phẩm, muốn bỏ thuỷ vân này


mà không được phép của người chủ sở hữu thì chỉ còn cách là phá huỷ sản
phẩm.
Nhận thực thông tin hay phát hiện xuyên tạc thông tin: Một tập các
thông tin sẽ được giấutrong phương tiện chứa sau đó được sử dụng để nhận
biết xem dữ liệu trên phương tiện gốc đó có bị thay đổi hay không. Các thuỷ
vân nên được ẩn để tránh được sự tò mò của kẻ thù, hơn nữa việc làm giả các
thuỷ vân hợp lệ hay xuyên tạc thông tin nguồn cũng cần được xem xét. Trong
các ứng dụng thực tế, người ta mong muốn tìm được vị trí bị xuyên tạc cũng
như phân biệt được các thay đổi (ví dụ như phân biệt xem một đối tượng đa
phương tiện chứa thông tin giấu đã bị thay đổi, xuyên tạc nội dung hay là chỉ
bị nén mất dữ liệu). Yêu cầu chung đối với ứng dụng này là khả năng giấu
thông tin cao và thuỷ vân không cần bền vững.
Giấu vân tay hay dán nhãn: Thuỷvântrong những ứng dụng này được
sử dụng để nhận diện người gửi hay người nhận của một thông tin nào đó. Ví
dụ như các vân khác nhau sẽ được nhúng vào các bản copy khác nhau của
thông tin gốc trước khi chuyển cho nhiều người. Với những ứng dụng này thì
yêu cầu là đảm bảo độ an toàn cao cho các thuỷ vân tránh sự xoá giấu vết
trong khi phân phối.
Điều khiển truy cập: Các thuỷvân trong những trườnghợp này được sử
dụng để điều khiển truy cập đối với các thông tin. Các thiết bị phát hiện ra
thuỷ vân thường được gắn sẵn vào trong các hệ thống đọc ghi. Ví dụ như hệ

thống quản lí sao chép DVD đã được ứng dụng ở Nhật. Các ứng dụng loại
này cũng yêu cầu thuỷ vân phải được bảo đảm an toàn và cũng sử dụng
phương pháp phát hiện thuỷ vân đã giấu mà không cần thông tin gốc.
Chú giải: Các thông tin giấu được trong những trường hợp này
càngnhiều càng tốt, việc giải mã để nhận được thông tin cũng không cần
phương tiện chứa gốc ban đầu. Các yêu cầu mạnh về chống tấn công của kẻ


thù không cần thiết lắm thay vào đó là thông tin giấu phải được giấu kín (có
thể sử dụng trong truyền thông tin mật).
1.5 Âm thanh số
1.5.1 Khái niệm về âm thanh và âm thanh số
Trong phần này một số đặc trưng âm thanh sẽ được trình bày [1]
Âm thanh: Là các dao động cơ học (biến đổi vị trí qua lại) của các
phân tử, nguyên tử hay các hạt làm nênvật chất và lan truyền trong vật chất
như các sóng. Âm thanh, giống như nhiều sóng, được đặc trưng bởi tần số,

Amplitute

bướcsóng, chu kỳ, biên độ và vận tốc lan truyền (tốc độ âm thanh)

A
m
p
li
t

Time
Hình 1.7: Tín hiệu âm thanh
Một đặc tính của âm thanh đây là một sóng dọc, tức là nó là sự lan

truyền dao động của đại lượng vô hướng là áp suất, là sự lan truyền dao động
của đại lượng có hướng là vận tốc và vị trí của các phân tử hay nguyên tử
trong môi trường, trong đó phương dao động luôn trùng với phương chuyển
động của sóng.
Cũng như các sóng cơ học khác, sóng âm mang năng lượng tỉ lệ với bình
phương biên độ sóng. Năng lượng đó truyền đi từ nguồn âm đến tai ta. Cường
độ âm thanh là lượng năng lượng được sóng âm truyền đi trong một đơn vị
thời gian qua một đơn vị diện tích đặt vuông góc với phương truyền âm.


Ngoài ra trường độ cũng góp phần ảnh hưởng đến chất lượng âm thanh.
Âm thanh số: Là các mẫu được lấy theo phương pháp lượng tử hóa,
chuyển đổi giá trị mẫu (âm lượng) liên tục thành giá trị rời rạc. Thông thường
các mẫu này đã được lọc để loại bỏ những tần số không mong muốn (giữ lại
tiếng nói từ 50 Hz đến 10 KHz, âm nhạc từ 20 Hz đến 20 kHz).

(a) Tín hiệu gốc dạng tương
tự
(b) Lấy mẫu
(c) Giá trị lấy mẫu và lượng
tử hóa
(d) Dãy số sau khi số hóa

Hình 1.8: Số hóa tín hiệu âm thanh
1.5.2 Một số định dạng file âm thanh trên máy tính
Với sự phát triển của âm thanh số trong thời gian gần đây rất nhiều các
loại định dạng âm thanh đã ra đời, mỗi loại định dạng âm thanh lại có những
đặc trưng, cấu trúc khác nhau.
Có ba nhóm định dạng file âm thanh, gồm:
- Các loại định dạng không nén: WAV, AIFF và AU

Cả WAV và AIFF đều đựợc coi là các định dạng âm thanh “không thể
mất”. Chúng được tạo ra dựa trên nền tảng PCM “điều biến mã xung” (Pulse
Code Modulation) với một vài thay dổi nhỏ trong bộ dữ liệu lưu trữ, bên cạnh
đó hai loại định dạng này có thể chuyển đổi được cho nhau mà không hề bị
giảm chất lượng âm thanh.
Chúng cũng được coi là “không mất dữ liệu” - không bị nén - và một


file âm thanh PCM stereo, chẳng hạn có tần số là 44.1kHz và độ nén là 16 bít
(chất lượng đĩa CD) thì chất lựợng âm thanh có thể lên đến 10MB một phút
sau khi được chuyển đổi (convert).
- Các loại định dạng: FLAC, ALAC, APE
FLAC (Free Lossless Audio Codec), ALAC (Apple Lossless Audio
Codec) và APE (Monkey’s Audio) là các loại định dạng nén âm thanh, chúng
sử dụng các thuật toán nén dữ liệu. Sự khác nhau giữa các file nén và các file
FLAC đó là FLAC được thiết kế chuyên cho âm thanh thế nên tỉ lệ nén của nó
tốt hơn và không bị mất dữ liệu. Thông thường thì file FLAC bằng khoảng
một nửa kích cỡ file WAV. Một file FLAC cho âm thanh stereo với chất
lượng CD chạy khoảng 5MB mỗi phút.
Hầu hết các định dạng ta sử dụng hàng ngày được xếp vào loại “dễ mất
dữ liệu” (lossy); bởi lẽ đôi khi người ta phải giảm chất lượng âm thanh của
file xuống để tăng “diện tích sử dụng” của file đó lên.
- Các loại định dạng “dễ mất dữ liệu”: MP3, AAC, WMA, Vorbis
Một file MP3 với “chất lượng CD” trung bình chỉ chạy khoảng 1MB mỗi
phút. Đây là một file đã được nén tuy nhiên không giống như các định dạng
“không mất dữ liệu”, ta không thể chuyển đổi lại các file định dạng “dễ mất
dữ liệu” để chúng trở lại chất lượng âm thanh tốt được.
Những định dạng “dễ mất dữ liệu” khác nhau sử dụng những thuật toán
khác nhau để lưu trữ thông tin, và vì thế chúng thường có chênh lệch về tỷ lệ
giữa kích cỡ file và chất lượng âm thanh. Những định dạng “dễ mất dữ liệu”

cũng sử dụng số bít để chỉ chất lượng âm thanh, thường vào khoảng
“192kbít/s” hay “192kbps”.
- Một số định dạng âm thanh trên máy tính[2]


×