Tải bản đầy đủ (.pdf) (98 trang)

Nghiên cứu kỹ thuật giấu tin trong dữ liệu đa phương tiện

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.77 MB, 98 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
------------------------------------------

Nguyễn Thị Mỹ Hạnh

NGHIÊN CỨU KỸ THUẬT
GIẤU TIN TRONG DỮ LIỆU ĐA PHƯƠNG TIỆN

Chuyên ngành: Công Nghệ Thông Tin

LUẬN VĂN THẠC SỸ KỸ THUẬT
………………………..

Người hướng dẫn: GS.TS. Nguyễn Thanh Thủy

Hà Nội - 2012


LỜI CAM ĐOAN
Tôi xin cam đoan: Luận văn thạc sĩ này là công trình nghiên cứu thực sự của
cá nhân, được thực hiện trên cơ sở nghiên cứu, tổng hợp lý thuyết dưới sự hướng
dẫn của GS.TS Nguyễn Thanh Thủy. Các số liệu và những kết quả trong luận văn là
trung thực, khách quan và chưa từng được công bố trong bất kỳ một công trình nào
khác.

Hà nội, ngày tháng năm 2012
Nguyễn Thị Mỹ Hạnh


LỜI CẢM ƠN


Tôi xin gửi lời cảm ơn sâu sắc đến GS.TS. Nguyễn Thanh Thủy đã trực tiếp
hướng dẫn, giúp đỡ định hướng để tôi có thể thực hiện và hoàn thành đề tài luận văn
này.
Tôi xin bày tỏ lòng biết ơn các thầy cô giáo trong Viện Công Nghệ Thông
Tin và Truyền Thông – Trường Đại Học Bách Khoa Hà Nội đã trang bị cho tôi
những kiến thức quý báu trong suốt quá trình hai năm học tại trường.
Cuối cùng, tôi xin cảm ơn gia đình, bạn bè đồng nghiệp trong Khoa Công
Nghệ Thông Tin, trường Cao Đẳng Kinh Tế Công Nghiệp Hà Nội nơi tôi đang công
tác đã luôn động viên khích lệ tôi trong suốt quá trình nghiên cứu và hoàn thành
luận văn.
Hà Nội, ngày tháng năm 2012

Nguyễn Thị Mỹ Hạnh


MỤC LỤC
CÁC THUẬT NGỮ VIẾT TẮT .........................................................................................................4
DANH MỤC CÁC BẢNG .................................................................................................................5
DANH MỤC HÌNH VẼ, ĐỒ THỊ ......................................................................................................6
MỞ ĐẦU ............................................................................................................................................8
CHƯƠNG 1: TỔNG QUAN VỀ CÁC KỸ THUẬT GIẤU TIN .....................................................10
1.1

Các khái niệm cơ bản về giấu tin ..................................................................................10

1.1.1.

Định nghĩa .............................................................................................................10

1.1.2.


Mục đích giấu tin ..................................................................................................10

1.1.3.

Mô hình kỹ thuật giấu tin cơ bản ..........................................................................10

1.2

Giấu tin trong dữ liệu đa phương tiện (multimedia) .....................................................12

1.2.1.

Giấu tin trong ảnh .................................................................................................12

1.2.2.

Giấu tin trong audio ..............................................................................................13

1.2.3.

Giấu tin trong video ..............................................................................................13

1.2.4.

Giấu thông tin trong văn bản dạng Text................................................................14

1.3

Các yêu cầu trong một mô hình giấu tin .......................................................................14


1.3.1.

Tính bền vững .......................................................................................................14

1.3.2.

Khả năng không bị phát hiện ................................................................................15

1.3.3.

Khả năng lưu trữ ...................................................................................................15

1.3.4.

Tính bảo mật .........................................................................................................16

1.3.5.

Khả năng vô hình ..................................................................................................16

1.3.6.

Tính trong suốt ......................................................................................................16

1.4

Các ứng dụng của lĩnh vực giấu tin...............................................................................16

1.4.1.


Bảo vệ bản quyền, sở hữu trí tuệ ...........................................................................16

1.4.2.

Xác thực thông tin hay phát hiện giả mạo thông tin .............................................17

1.4.3.

Giấu vân tay hay dán nhãn ....................................................................................17

1


1.4.4.

Kiểm soát sao chép ...............................................................................................17

1.4.5.

Giấu tin mật...........................................................................................................18

1.5

Giới thiệu một số kỹ thuật giấu tin trong âm thanh.......................................................18

1.5.1

Mã hóa LSB (Least Significant Bit)......................................................................18


1.5.2

Mã hóa Parity (Parity Coding) ..............................................................................19

1.5.3

Mã hóa Phase (Phase Coding)...............................................................................19

1.5.4

Kỹ thuật trải phổ ...................................................................................................20

1.5.5

Kỹ thuật giấu dựa vào tiếng vang (Echo)..............................................................20

1.5.6

Kỹ thuật mã hóa (Echo) ........................................................................................21

CHƯƠNG 2: GIẤU DỮ LIỆU TRÊN ÂM THANH .......................................................................22
2.1.

Mô hình phân loại Watermarking trên âm thanh ..........................................................22

2.1.1.

Nhóm các phương pháp giao thoa tín hiệu gốc. ....................................................22

2.1.2.


Nhóm các phương pháp không giao thoa tín hiệu gốc. .........................................24

2.2.

Xử lý tín hiệu số ............................................................................................................32

2.2.1.

Đại cương về tín hiệu và nhiễu .............................................................................32

2.2.2.

Lấy mẫu và khôi phục tín hiệu ..............................................................................37

2.2.3.

Phân tích Fourier ...................................................................................................42

2.3.

Kỹ thuật LSB (LeastSignificant Bit) .............................................................................50

2.4.

Kỹ thuật trải phổ ...........................................................................................................53

2.4.1.

Mật độ phổ công suất ............................................................................................55


2.4.2.

Chuỗi giả ngẫu nhiên ............................................................................................57

2.4.3.

Điều chế số dịch pha BPSK ..................................................................................60

2.4.4.

Ảnh hưởng của nhiễu trắng trong truyền thông ....................................................64

2.4.5.

Ảnh hưởng của nhiễu Jammer trong truyền thông ................................................64

2.4.6.

Các hệ thống trải chuỗi trực tiếp ...........................................................................67

2


CHƯƠNG 3: GIẤU DỮ LIỆU TRÊN AUDIO BẰNG PHƯƠNG PHÁP LSB (Least Significant
Bit) ....................................................................................................................................................79
3.1.

Tổng quan về WAV file ................................................................................................79


3.2.

Xây dựng chương trình Demo.......................................................................................81

3.3.

Giao diện của chương trình ...........................................................................................83

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ........................................................................................86
TÀI LIỆU THAM KHẢO.................................................................................................................87
PHỤ LỤC..........................................................................................................................................88

3


CÁC THUẬT NGỮ VIẾT TẮT
Từ
viết tắt

Nghĩa tiếng Anh

Giải thích

HSV

Human Vision System

Hệ thị giác của con người

HAS


Human Auditory System

Hệ thính giác của con người

DVD

Digital Versatile Disc

LSB

Least Significant Bit

Bít ít quan trọng nhất

DFT

Discrete Fourier Transform

Biến đổi Fourier rời rạc

FFT

Fast Fourier Transform

Biến đổi Fourier nhanh

DCT

Discrete Cosine Transform


Biến đổi cô sin rời rạc

DWT

Discrete wavelets Transform

Biến đổi sóng con rời rạc

PSD

Probability Spectral Denscity

Mật độ phổ xác suất

PDF

Probability Denscity Function

Hàm mật độ xác suất

CDMA

Code Divesison Multiple

Đa thâm nhập phân chia theo mã

DS

Direct Sequence


Chuỗi trực tiếp

SS

Spread Spectrum

Trải phổ

PN

Pseudo Noise

Giả tạp âm

BPSK

Binary Phase Shift Keying

Điều chế khóa chuyển pha cơ số hai

QPSK

Quandrature Phase Shift Keying

Điều chế khóa chuyển pha vuông góc

4



DANH MỤC CÁC BẢNG
Bảng 2.1: Các thành phần phổ đối xứng nhau qua điểm k=3.5.
Bảng 2.2: Phân tích các đoạn chạy của tín hiệu PN

5


DANH MỤC HÌNH VẼ, ĐỒ THỊ
Hình 1.1: Lược đồ chung cho quá trình giấu tin
Hình 1.2: Lược đồ quá trình giải mã tin mật
Hình 1.3: Mối tương quan đến ba tiêu chí
Hình 1.4: Minh họa kỹ thuật giấu LSB
Hình 1.5: Kỹ thuật mã hóa pha
Hình 1.6: Kỹ thuật giấu điều chỉnh echo
Hình 2.1: Phân loại Watermarking trên Audio
Hình 2.2: Ý tưởng của phương pháp trải phổ truyền thống
Hình 2.3: Tiền xử lý tín hiệu âm thanh Watermark
Hình 2.4: Ẩn dữ liệu theo phương pháp echo
Hình 2.5: Điều chỉnh tỉ lệ thời gian trong Watermarking
Hình 2.6: Hình vẽ minh họa cho sóng của một tín hiệu
Hình 2.7: Nhiễu phân bố đều
Hình 2.8: Nhiễu phân bố Gaussian
Hình 2.9: Các loại sóng của tín hiệu
Hình 2.10: Biểu diễn tín hiệu theo tọa độ cực
Hình 2.11: Liên hợp phức của tín hiệu x(t)
Hình 2.12: Mô hình lấy mẫu
Hình 2.13: Lấy mẫu tín hiệu với các chu kỳ khác nhau
Hình 2.14: Sự trùng lặp phổ
Hình 2.15: Mạch lấy mẫu lý tưởng ở tần số fs
Hình 2.16: Phổ của tín hiệu khi dùng tiền lọc lý tưởng

Hình 2.17: Tiền lọc chống biệt danh thực tế
Hình 2.18: Hệ thống lấy mẫu quá mức và tiêu hủy
Hình 2.19: Tần phổ biên độ của tín hiệu
Hình 2.20: Thành phần thực, thành phần ảo và tần phổ của tín hiệu
Hình 2.21: Phổ của sóng vuông
Hình 2.22: Mô hình hệ thống thông tin trải phổ

6


Hình 2.23:Tín hiệu x(t) và tín hiệu tự tương quan
Hình 2.24: Mật độ công suất phổ của tín hiệu
Hình 2.25: Mạch thanh ghi dịch cơ số 2
Hình 2.26: Hàm tương quan của chuỗi PN
Hình 2.27: Phổ tín hiệu BPSK
Hình 2.28: Tín hiệu trải phổ
Hình 2.29: Mạch giải điều chế BPSK
Hình 2.30: Hệ thống truyền thông trải phổ cơ bản
Hình 2.31: Một jammer toàn phần băng thông
Hình 2.32: Một jammer một phần băng thông
Hình 2.33: Phổ của tín hiệu BPSK
Hình 2.34: Phổ của tín hiệu BPSK sau khi trải
Hình 2.35: Bộ điều biến BPSK truyền thống
Hình 2.36: Bộ điều biến BPSK cải tiến
Hình 2.37: DS/BPSK không mã hóa với tấn công của nhiễu Jammer
Hình 2.38: So sánh giá trị của xác suất lỗi Pb với Eb/Nj
Hình 2.39: Các tín hiệu trước khi trải
Hình 2.40: Các tín hiệu sau khi trải
Hình 2.41: Hệ thống lặp mã DS/BPSK


7


MỞ ĐẦU
1. Lý do chọn đề tài
Sự phát triển mạnh mẽ các hệ thống đa phương tiện dưới kết nối mạng
Internet dẫn đến nhu cầu bảo vệ bản quyền cho các phương tiện dữ liệu số như: các
bức ảnh, file âm thanh, video clip v.v…Việc bảo vệ bản quyền bao gồm xác nhận
bản quyền tác giả và nhận biết sao chép bất hợp pháp các dữ liệu số này.
Sau khi nghiên cứu một số tài liệu liên quan đến lĩnh vực giấu tin và các kỹ
thuật giấu tin trong môi trường đa phương tiện, được sự đồng ý, động viên của thầy
hướng dẫn. tôi đã chọn đề tài “Nghiên cứu kỹ thuật giấu tin trong dữ liệu đa
phương tiện” làm đề tài nghiên cứu cho luận văn cao học của mình.
2. Lịch sử nghiên cứu
Về mặt lý thuyết đề tài tiếp cận một hướng nghiên cứu mới trong lĩnh vực an
toàn và bảo mật thông tin, đặc biệt là các thông tin được truyền trên các kênh truyền
thông công cộng cần bảo vệ bản quyền. Đề tài trình bày lý thuyết về các kỹ thuật
giấu tin trong môi trường âm thanh theo hai hướng phát triển là Steganography và
Watermarking
Về mặt thực tiễn: với việc triển khai thực hiện chương trình, đề tài này có thể
ứng dụng trong việc bảo vệ bản quyền của một đĩa nhạc chống các sai lệch thông tin
trong âm thanh.
3. Mục đích nghiên cứu của luận văn ( đối tượng và phạm vi nghiên cứu)
Mục đích của luận văn là nghiên cứu hệ thống lý thuyết liên quan đến việc
giấu tin. Tìm hiểu các kỹ thuật giấu tin thuộc hai hướng phát triển là Steganography
và Watermarking. Luận văn tập trung nghiên cứu hai kỹ thuật giấu tin trong âm
thanh là kỹ thuật LSB (Least Significant Bit) và kỹ thuật trải phổ. Trên cơ sở nghiên
cứu lý thuyết đó, tác giả sẽ triển khai cài đặt chương trình ứng dụng giấu tin trong
file âm thanh bằng kỹ thuật LSB.
4. Tóm tắt

Luận văn được phân làm ba chương. Chương một trình bày tổng quan về kỹ
thuật giấu tin cơ bản, giới thiệu một số kỹ thuật giấu tin trong môi trường đa

8


phương tiện, ứng dụng của lĩnh vực giấu tin và một số yêu cầu trong một mô hình
giấu tin.
Chương hai trình bày phương pháp giấu dữ liệu cụ thể là kỹ thuật mã hóa
LSB và kỹ thuật trải phổ. Bên cạnh đó tìm hiểu mô hình phân loại Watermarking
trên âm thanh.
Chương ba xây dựng chương trình giấu tin trên âm thanh bằng kỹ thuật mã
hóa LSB.
5. Phương pháp nghiên cứu
Trong quá trình nghiên cứu tác giả đã phân tích, tổng hợp lý thuyết từ đó xây
dựng ứng dụng giấu tin trong âm thanh bằng kỹ thuật mã hóa LSB.

9


CHƯƠNG 1: TỔNG QUAN VỀ CÁC KỸ THUẬT GIẤU TIN
1.1 Các khái niệm cơ bản về giấu tin
1.1.1. Định nghĩa
Giấu tin là một kỹ thuật giấu hoặc nhúng một lượng thông tin số nào đó vào
trong một đối tượng dữ liệu số [1].
Nhìn chung một bài toán ẩn dữ liệu gồm 2 quá trình:
-Nhúng dữ liệu (hay còn gọi là mã hóa)
-Rút trích dữ liệu (hay còn gọi là giải mã)
1.1.2. Mục đích giấu tin
- Bảo mật cho những dữ liệu được giấu.

- Bảo đảm an toàn (bảo vệ bản quyền) cho chính các đối tượng chứa dữ liệu
giấu trong đó.
Có thể thấy hai mục đích này hoàn toàn trái ngược nhau và dần phát triển thành
hai lĩnh vực với những yêu cầu và tính chất khác nhau.
Hai lĩnh vực chính của kỹ thuật giấu thông tin:
- Giấu tin mật(Steganography).
- Thuỷ vân số(Watermarking) .
Kỹ thuật giấu thông tin bí mật (Steganography): với mục đích đảm bảo an toàn
và bảo mật thông tin, tập trung vào các kỹ thuật giấu tin để có thể giấu được nhiều
thông tin nhất. Thông tin mật được giấu kỹ trong một đối tượng khác sao cho người
khác không phát hiện được.
Kỹ thuật giấu thông tin theo kiểu đánh giấu (watermarking) để bảo vệ bản
quyền của đối tượng chứa thông tin, tập trung đảm bảo một số các yêu cầu như tính
bền vững… đây là ứng dụng cơ bản nhất của kỹ thuật thuỷ vân số.
1.1.3. Mô hình kỹ thuật giấu tin cơ bản
Giấu thông tin vào phương tiện chứa và tách lấy thông tin là hai quá trình trái
ngược nhau và có thể mô tả qua sơ đồ khối của hệ thống như hình1.1.

10


Bản tin mật

Phương tiện chứa
(audio, ảnh, video)

Phương tiện
chứa tin được giấu

Bộ nhúng

thông tin

Phân phối

Khóa

Hình 1.1 Lược đồ chung cho quá trình giấu tin
Trong đó phương tiện chứa tin bao gồm: văn bản, hình ảnh, âm thanh,
video…Thông tin cần giấu tùy theo mục đích của người sử dụng. Thông tin được
giấu vào trong phương tiện chứa tin nhờ một bộ nhúng. Bộ nhúng là những chương
trình thực hiện theo những thuật toán để giấu tin và được thực hiện với một khóa bí
mật giống như trong một số hệ mật mã. Đầu ra của quá trình nhúng tin là phương
tiện chứa đã được giấu tin. Các phương tiện chứa này có thể phân phối trên mạng.

Phân phối

Phương tiện
chứa tin giấu

Bản tin mật

Kiểm định
mã tin

Bộ giải
mã tin

Phương tiện đa
phương tiên
(audio, ảnh, video)


Khóa

Hình 1.2 Lược đồ quá trình giải mã tin mật

11


Hình 1.2 mô tả quá trình giải mã thông tin đã được giấu trước đó. Đầu vào là
phương tiện chứa tin giấu, qua một bộ giải mã tin (tương ứng với bộ nhúng tin)
cùng với khóa sẽ được thực hiện việc giải mã thông tin. Đầu ra của quá trình là
phương tiện chứa tin và thông tin mật đã giấu trước đó. Trong trường hợp cần thiết ,
thông tin lấy ra có thể được xử lý, kiểm định và so sánh với thông tin đã giấu ban
đầu.
1.2 Giấu tin trong dữ liệu đa phương tiện (multimedia)
Kỹ thuật dữ liệu ẩn đã có lịch sử lâu đời và đã từng được thực hiện với nhiều
phương thức từ loại mực đặc biệt không thấy được. Loại mực đặc biệt sau khi viết
trên giấy và để khô thì không thể đọc được bằng mắt thường, thông tin ẩn chỉ hiện
ra khi hơ nóng hoặc bôi hóa chất đặc biệt lên giấy.
Kỹ thuật nhúng dữ liệu ẩn khác với kỹ thuật mật mã, tuy trong nhiều tình
huống chúng c ng mục đích (chỉ cho những người có quyền truy cập được phép
xem dữ liệu). Một trong những vấn đề của hệ thống mật mã là nó có thể bị tấn công
để bẻ khóa. Trong khi đó, kỹ thuật nhúng dữ liệu ẩn tăng cường tính bảo mật nhờ
che giấu thông tin truyền tải. Vì vậy, kỹ thuật nhúng dữ liệu ẩn thường được d ng
bổ sung với kỹ thuật mật mã. Nó có thể d ng để nhúng dữ liệu ẩn vào bất kỳ dạng
dữ liệu số nào, đặc biệt là các dạng có mức dư thừa thông tin cao như dữ liệu ảnh
màu tĩnh và động, dữ liệu âm thanh và thậm chí cả dữ liệu văn bản. Dữ liệu ẩn có
thể có nhiều định dạng, nó có thể là một chuỗi ký tự đơn giản hoặc một tập tin
Word hoặc Excel
1.2.1. Giấu tin trong ảnh

Hiện nay giấu thông tin trong ảnh chiếm tỷ lệ lớn nhất trong các chương trình
ứng dụng, các phần mềm, hệ thống giấu tin trong đa phương tiện bởi lượng thông
tin được trao đổi bằng ảnh là rất lớn và hơn nữa, giấu thông tin trong ảnh cũng đóng
vai trò hết sức quan trọng trong hầu hết các ứng dụng bảo vệ an toàn thông tin như:
xác thực thông tin, xác định xuyên tạc thông tin, bảo vệ bản quyền tác giả…Thông
tin sẽ được giấu cùng với dữ liệu ảnh nhưng chất lượng ảnh ít thay đổi và chẳng ai
biết được đằng sau ảnh đó mang những thông tin có ý nghĩa. Ngày nay khi ảnh số

12


đã được sử dụng rất phổ biến, giấu thông tin trong ảnh đã đem lại nhiều những ứng
dụng quan trọng trên các lĩnh vực trong đời sống xã hội. Ví dụ như ở các nước phát
triển chữ ký tay đã được số hoá và lưu trữ sử dụng như là hồ sơ cá nhân của các
dịch vụ ngân hàng tài chính.
Phần mềm WinWord của Microsoft cũng cho phép người d ng lưu trữ chữ ký
trong ảnh nhị phân rồi gắn vào vị trí nào đó trong file văn bản để đảm bảo tính an
toàn của thông tin.
1.2.2. Giấu tin trong audio
Giấu thông tin trong audio mang những đặc điểm riêng khác với giấu thông tin
trong các đối tượng đa phương tiện khác. Một trong những yêu cầu cơ bản của giấu
tin là đảm bảo tính chất ẩn của thông tin được giấu đồng thời không làm ảnh hưởng
đến chất lượng của dữ liệu. Để đảm bảo yêu cầu này ta lưu ý rằng kỹ thuật giấu
thông tin trong ảnh phụ thuộc vào hệ thống thị giác của con người – HSV (Human
Vision System) còn kỹ thuật giấu thông tin trong audio lại phụ thuộc vào hệ thống
thính giác HAS (Human Auditory System).
Một vấn đề khó khăn ở đây là hệ thống thính giác của con người nghe được các
tín hiệu ở các giải tần rộng và công suất lớn nên đã gây khó dễ đối với các phương
pháp giấu tin trong audio. Nhưng tai con người lại kém trong việc phát hiện sự khác
biệt của các giải tần và công suất, có nghĩa là các âm thanh to, cao tần có thể che

giấu được các âm thanh nhỏ thấp một cách dễ dàng.
Vấn đề khó khăn thứ hai đối với giấu tin trong audio là kênh truyền tin, kênh
truyền hay băng thông chậm sẽ ảnh hưởng đến chất lượng thông tin sau khi giấu.
Giấu thông tin trong audio đòi hỏi yêu cầu rất cao về tính đồng bộ và tính an toàn
của thông tin. Các phương pháp giấu thông tin trong audio đều lợi dụng điểm yếu
trong hệ thống thính giác của con người.
1.2.3. Giấu tin trong video
Cũng giống như giấu thông tin trong ảnh hay trong audio, giấu tin trong video
cũng được quan tâm và được phát triển mạnh mẽ cho nhiều ứng dụng như điều
khiển truy cập thông tin, nhận thức thông tin, bản quyền tác giả…

13


Một phương pháp giấu tin trong video được đưa ra bởi Cox là phương pháp
phân bố đều. Ý tưởng cơ bản của phương pháp là phân phối thông tin giấu dàn trải
theo tần số của dữ liệu gốc. Nhiều nhà nghiên cứu đã d ng những hàm cosin riêng
và các hệ số truyền sóng riêng để giấu tin. Trong các thuật toán khởi nguồn thì
thường các kỹ thuật cho phép giấu các ảnh vào trong video nhưng thời gian gần đây
các kỹ thuật cho phép giấu cả âm thanh và hình ảnh vào video.
1.2.4. Giấu thông tin trong văn bản dạng Text
Giấu tin trong văn bản dạng text khó thực hiện hơn do có ít các thông tin dư
thừa, để làm được điều này người ta phải khéo léo khai thác các dư thừa tự nhiên
của ngôn ngữ. Một cách khác là tận dụng các định dạng văn bản (mã hoá thông tin
vào khoảng cách giữa các từ hay các dòng văn bản).
Kỹ thuật giấu tin đang được áp dụng cho nhiều loại đối tượng chứ không riêng
gì dữ liệu đa phương tiện như ảnh, audio, video. Gần đây đã có một số nghiên cứu
giấu tin trong cơ sở dữ liệu quan hệ, các gói IP truyền trên mạng, chắc chắn sau này
còn tiếp tục phát triển tiếp cho các môi trường dữ liệu số khác.
1.3 Các yêu cầu trong một mô hình giấu tin

1.3.1. Tính bền vững
Thể hiện ở khả năng ít thay đổi trước các tấn công bên ngoài như: thay đổi
tính chất (thay đổi tần số lấy mẫu, số bit lấy mẫu, thay đổi độ lớn biên độ…) đối với
tín hiệu âm thanh, các phép biến đổi affine (dịch, quay, tỉ lệ…), thay đổi chất lượng
ảnh (thay đổi hệ màu) đối với tín hiệu ảnh, chuyển đổi định dạng dữ liệu
(JPGBMP, GIF  PCX, WAV  PM3, MPG  AVI….). Hiện nay chưa có
phương pháp nào có thể đảm bảo được tính chất này một cách tuyệt đối. Với từng
ứng dụng cụ thể, mức độ yêu cầu của tính chất này thể hiện khác nhau. Ví dụ;trong
watermarking dễ vỡ chỉ cần thay đổi nhỏ trên đối tượng chứa cũng có thể làm cho
đối tượng thông tin mật bị hủy. Thông thường thì mức độ yêu cầu tính chất này
trong các ứng dụng Watermarking cao hơn các ứng dụng ẩn dữ liệu khác.

14


1.3.2. Khả năng không bị phát hiện
Tính chất này thể hiện ở khả năng khó bị phát hiện, nghĩa là khó xác định một
đối tượng có chứa thông tin mật hay không. Để nâng cao khả năng này, hầu hết các
phương pháp ẩn dữ liệu dựa trên đặc điểm của hai hệ tri giác của con người: hệ tri
giác (HVS) và hệ thính giác (HAS). Đây là hai cơ quan chủ yếu được d ng để đánh
giá chất lượng của một tín hiệu. Khả năng khó bị phát hiện tín hiệu mật phụ thuộc
vào hai yếu tố sau:
Kỹ thuật nhúng: Dữ liệu được nhúng phải phù hợp với đối tượng chứa và thuật
toán nhúng. Để thực hiện tốt yêu cầu này, ngoài những kinh nghiệm có trong lĩnh
vực ẩn dữ liệu, người thực hiện phải có kiến thức về các loại định dạng tập tin. Vì
có thể cùng với một thông tin mật nhưng nó sẽ rất khó bị phát trên đối tượng A
nhưng lại quá dễ thấy khi nhúng vào đối tượng B.
Kinh nghiệm của kẻ tấn công: Nếu như kẻ tấn công có nhiều kinh nghiệm thì
khả năng phát hiện ra một đối tượng chứa có chứa thông tin mật là không quá khó.
1.3.3. Khả năng lưu trữ

Khả năng này thể hiện ở lượng thông tin của thông điệp mật có thể nhúng
trong đối tượng chứa. Do tính bảo mật nên khả năng lưu trữ luôn bị hạn chế. Do đó,
trong trường hợp muốn ẩn một thông tin có kích thước tương đối lớn ta thường chia
nhỏ ra thành nhiều phần và thực hiện nhúng từng phần.
Trong thực tế, khi quyết định chọn phương pháp nhúng nào ta thường lấy ba
tiêu chí trên làm cơ sở. Tùy thuộc vào từng ứng dụng mà người ta sẽ ưu tiên cho
tiêu chuẩn nào hơn. Có thể minh họa tiêu chí trên như sau:

15


Khả năng lưu trữ

Steganogr
aphy thô

Steganograp
hy bảo mật

Bản
quyền

Khả năng không bị
phát hiện

Tính bền vững

Hình 1.3 Mối tương quan giữa ba tiêu chí
Để nâng cao hiệu quả người ta còn xem xét một số yêu cầu khác:
1.3.4. Tính bảo mật

Có nhiều cấp độ bảo mật khác nhau nhưng nhìn chung có hai cấp độ chính:
 Người dùng hoàn toàn không biết sự tồn tại của thông tin mật.
 Người dùng biết có thông tin mật nhưng phải có khóa khi truy cập.
1.3.5. Khả năng vô hình
Tùy theo mục đích sử dụng, mức độ yêu cầu về tính chất này khác nhau:
 Ứng dụng steganography: Thông tin mật được dấu phải tuyệt đối bí
mật, khi đó tiêu chí này được chú ý nhiều.
 Ứng dụng Watermarking: Trong một số ứng dụng, người dùng có thể
đọc (thấy) thông tin Watermark nhưng không chỉnh sửa được hoặc có
những ứng dụng thông tin Watermark được giữ bí mật.
1.3.6. Tính trong suốt
Khả năng che đậy sự tồn tại của tín hiệu được nhúng (Watermark) trên tín hiệu
gốc trước sự cảm nhận của người d ng thông qua 2 cơ quan thính giác (đối với âm
thanh) hoặc thị giác (đối với ảnh).
1.4 Các ứng dụng của lĩnh vực giấu tin
1.4.1. Bảo vệ bản quyền, sở hữu trí tuệ
Đây là ứng dụng cơ bản nhất của kỹ thuật thủy vân số. Một thông tin nào đó
mang ý nghĩa quyền sở hữu tác giả gọi là thủy vân sẽ được nhúng vào trong các sản

16


phẩm, thủy vân đó chỉ một mình chủ sở hữu hợp pháp các sản phẩm đó và được
d ng làm minh chứng cho bản quyền sản phẩm. Giả sử có một sản phẩm dữ liệu
dạng đa phương tiện như: ảnh, âm thanh, video và cần được lưu thông trên mạng.
Để bảo vệ các sản phẩm chống lại các hành vi lấy cắp hoặc làm nhái cần phải có
một kỹ thuật để “dán tem bản quyền” vào sản phẩm này. Việc dán tem hay chính là
việc nhúng thủy vân cần phải đảm bảo không để lại một ảnh hưởng đáng kể nào đến
việc cảm nhận sản phẩm. Yêu cầu kỹ thuật đối với ứng dụng này là thủy vân phải
tồn tại bền vững c ng với sản phẩm, muốn bỏ thủy vân này mà không được phép

của người chủ sở hữu thì chỉ có cách là phá hủy sản phẩm[2].
1.4.2. Xác thực thông tin hay phát hiện giả mạo thông tin
Một tập các thông tin sẽ được giấu trong phương tiện chứa sau đó được sử dụng
để nhận biết dữ liệu trên phương tiện gốc đó có bị thay đổi không. Các thủy vân nên
được ẩn để tránh được sự tò mò của kẻ th , hơn nữa việc làm giả các thủy vân hợp
lệ hay xuyên tạc thông tin nguồn cũng cần được xem xét. Trong các ứng dụng thực
tế, người ta mong muốn tìm được vị trí bị xuyên tạc cũng như phân biệt được các
thay đổi. Yêu cầu chung đối với ứng dụng này là khả năng giấu thông tin cao và
thủy vân không cần bền vững.
1.4.3. Giấu vân tay hay dán nhãn
Thủy vân trong những ứng dụng này được sử dụng để nhận diện người gửi hay
người nhận của một thông tin nào đó. Ví dụ như: các vân khác nhau sẽ được nhúng
vào các bản sao khác nhau của thông tin gốc trước khi chuyển cho nhiều người. Với
những ứng dụng này thì yêu cầu đảm bảo độ an toàn cao cho các thủy vân tránh sự
xóa dấu vết trong khi phân phối.
1.4.4. Kiểm soát sao chép
Các thủy vân trong những trường hợp này được sử dụng để kiểm soát sao chép
đối với các thông tin. Các thiết bị phát hiện ra thủy vân thường được gắn sẵn vào
trong các hệ thống đọc/ghi. Ví dụ như: hệ thống quản lí sao chép DVD đã được ứng
dụng ở Nhật. Các ứng dụng loại này cũng yêu cầu thủy vân phải được bảo đảm an

17


toàn và cũng sử dụng phương pháp phát hiện thủy vân đã giấu mà không cần thông
tin gốc.
1.4.5. Giấu tin mật
Các thông tin giấu được trong những trường hợp này càng nhiều càng tốt, việc
giải mã để nhận được thông tin cũng không cần phương tiện chứa ban đầu. Các yêu
cầu mạnh về chống tấn công của kẻ thù không cần thiết lắm, thay vào đó là thông

tin giấu phải đảm bảo tính ẩn.
1.5 Giới thiệu một số kỹ thuật giấu tin trong âm thanh
1.5.1 Mã hóa LSB (Least Significant Bit)
Phương pháp mã hóa LSB là cách đơn giản nhất để nhúng thông tin vào
trong dữ liệu audio. Phương pháp này sẽ thay thế bít ít quan trọng nhất (thường là
bít cuối) của mỗi mẫu dữ liệu bằng bít thông tin giấu[3]. Ví dụ mẫu 8 bít như sau:
0

1

0

1

1

1

1

0

1

1

Sau khi giấu bít 1 sẽ như sau:
0

1


0

1

1

1

Hình 1.4 Minh họa kỹ thuật giấu LSB
Ưu điểm của phương pháp này là dễ cài đặt và cho phép giấu dữ liệu nhiều.
Có thể tăng thêm dữ liệu giấu bằng cách dùng hai bít LSB. Tuy nhiên cách này
cũng làm tăng nhiễu trên đối tượng chứa dẫn đến đối phương dễ phát hiện và thực
hiện các tấn công. Vì vậy dữ liệu chứa cần phải được chọn trước khi giấu sử dụng
phương pháp mã hóa LSB.
Để tăng độ an toàn cho kỹ thuật này, ta sử dụng bộ sinh số nguyên ngẫu
nhiên để sinh ra vị trí các mẫu được chọn giấu chứ không phải các mẫu liên tục. Bộ
sinh số này sử dụng một khóa bí mật như là phần tử khởi tạo của bộ sinh số. Khóa
này được sử dụng trong cả quá trình giấu tin và giải tin. Lưu ý là bộ sinh số không
tạo ra các giá trị tr ng nhau để tránh trường hợp một vị trí được giấu hai lần.

18


1.5.2 Mã hóa Parity (Parity Coding)
Thay vì chia dữ liệu thành các mẫu riêng lẻ, phương pháp mã hóa chẵn lẻ
chia dữ liệu thành các nhóm mẫu và giấu từng bit thông tin vào trong các nhóm mẫu
này. Nếu parity bit của nhóm mẫu này không trùng với bit thông tin giấu thì ta tiến
hành điều chỉnh một bit nào đó trong nhóm mẫu này. Phương pháp này cho ta nhiều
sự lựa chọn hơn khi thay đổi 1 bit và có phần kín đáo hơn so với phương pháp điều

chỉnh LSB.
Cả hai phương pháp LSB và Parity đều có những hạn chế. Do tai người khá
nhạy cảm nên những thay đổi trên dữ liệu chứa sẽ sinh nhiễu và người nghe rất dễ
nhận ra. Một điểm nữa là hai phương pháp này không bền vững và thông tin sẽ bị
mất sau khi thực hiện việc lấy mẫu lại. Một trong những cách khắc phục là thực
hiện việc giấu nhiều lần. Tuy nhiên cách này cũng có hạn chế là nó làm tăng thời
gian xử lý.
1.5.3 Mã hóa Phase (Phase Coding)
Phương pháp mã hóa pha giải quyết được các hạn chế do sinh ra nhiễu của
hai phương pháp giấu dữ liệu trên. Phương pháp mã hóa pha dựa vào tính chất là
các thành phần của pha không gây ảnh hưởng đến hệ thống thính giác của con
người như nhiễu. Việc giấu tin được thực hiện bằng cách điều chỉnh pha trong phổ
pha của dữ liệu số.

t

t

Original signal

Encoded signal
Dữ liệu sau khi giấu

Dữ liệu gốc

Hình 1.5 Kỹ thuật mã hóa pha
Quá trình mã hóa pha được chia thành các bước sau:
a. Dữ liệu âm thanh gốc được chia thành các segment nhỏ hơn có độ dài
bằng chiều dài với thông tin cần giấu.


19


b. Thực hiện biến đổi Fourier rời rạc DFT trên mỗi đoạn
c. Tính độ lệch pha giữa các đoạn kề nhau.
d. Giá trị chính xác: các pha của các đoạn có thể thay đổi nhưng mối liên
hệkhác nhau về pha giữa các segment liên tiếp phải được đảm bảo, vì vậy thông tin
giấu chỉ được phép giấu trong vector pha của đoạn đầu tiên. Việc điều chỉnh pha
của đoạn đầu được áp dụng dựa trên công thức sau:

e. Ghép các segment lại và tiến hành DFT ngược để tạo lại dữ liệu âm thanh.
Để nhận được tin giấu bằng kỹ thuật này, người nhận phải biết độ dài của
segment, sau đó thực hiện DFT để nhận tin.
Một yếu điểm của phương pháp này là tỉ lệ dữ liệu thấp do thông tin chỉ
được giấu vào các segment đầu tiên. Có thể cải thiện bằng cách tăng độ dài segment
sẽ làm cho tin giấu dễphát hiện. Có thể cải thiện bằng cách tăng độ dài segment.
Phương pháp mã hóa pha chỉ thích hợp cho việc giấu lượng nhỏ thông tin.
1.5.4 Kỹ thuật trải phổ
Thông thường các file audio được truyền qua các kênh truyền thông, các
kênh truyền thông này sẽ tập trung dữ liệu audio trong vùng hẹp của phổ tần số để
duy trì năng lượng và tiết kiệm băng thông. Các kỹ thuật trải phổ cố gắng trải thông
tin mật vào trong phổ tần số của dữ liệu audio càng nhiều càng tốt. Nó cũng tương
tự như kỹ thuật LSB là trải ngẫu nhiên thông tin giấu trên toàn bộ file audio. Lợi
điểm của phương pháp trải phổ là nó bền vững trước một số tấn công. Tuy nhiên nó
cũng có hạn chế là sinh nhiễu và dễ nhận ra. Hai phương pháp trải phổ sử dụng
trong giấu tin audio là DSSS (Direct Sequency Spread Spectrum) và FHSS
(Frenquency Hopped Spectrum).
1.5.5 Kỹ thuật giấu dựa vào tiếng vang (Echo)
Kỹ thuật giấu dựa vào tiếng vang thực hiện giấu tin bằng cách thêm vào
tiếng vang trong tín hiệu gốc. Dữ liệu nhúng được giấu bằng cách thay đổi 3 tham

số của tiếng vang: Biên độ ban đầu, tỉ lệ phân rã và độ trễ. Khi thời gian giữa tín

20


hiệu gốc và tiếng vang giảm xuống, hai tín hiệu có thể trộn lẫn và người nghe khó
có thể phân biệt giữa hai tín hiệu. Số lượng tin giấu có liên quan đến thời gian trễ
của tiếng vang và biên độ của nó.

Sample
Sample
echo Sample
echo

Độ lệch giấu bit 0
Độ lệch giấu bit 1

Hình 1.6: Kỹ thuật giấu điều chỉnh echo
1.5.6 Kỹ thuật mã hóa (Echo)
Bằng cách dùng thời gian trễ khác nhau giữa tín hiệu gốc và tiếng vang để
thể hiện tương ứng giá trị nhị phân 1 hoặc 0, theo cách đó dữ liệu được giấu vào file
audio. Để giấu nhiều hơn một bít, tín hiệu gốc được chia thành các đoạn ngắn hơn
và mỗi đoạn sau đó có thể được tạo tiếng vang để giấu số bit mong muốn. Dữ liệu
chứa cuối cùng bao gồm các đoạn được mã hóa độc lập nối lại theo thứ tự chia ban
đầu. Kỹ thuật giấu tin dựa vào tiếng vang rất hiệu quả trong các file audio chất
lượng cao. Các file âm thanh chưa làm giảm chất lượng và không có quá nhiều đoạn
yên lặng thường dùng kỹ thuật này để giấu tin.
Một cách tiếp cận khác là tiến hành mã hóa chuỗi bít theo một cách nào đó
giúp ta phát hiện ra lỗi. Thay vì giấu trực tiếp L bit vào đối tượng chứa, ta biến đổi
chuỗi bit bằng cách bổ sung một số bit vào S nhằm mục đích kiểm tra lỗi.


21


CHƯƠNG 2: GIẤU DỮ LIỆU TRÊN ÂM THANH
Giấu tin trong audio mang những đặc điểm riêng khác với giấu thông tin trong
các đối tượng đa phương tiện khác. Các thuật toán Watermarking hầu hết chỉ tập
trung nghiên cứu nhiều trên lĩnh vực ảnh. Điểm chung của hướng nghiên cứu
Watermarking trên âm thanhlà tập trung khai thác khả năng cảm nhận của hệ thính
giác người (HAS). Có rất nhiều cách phân loại các kỹ thuật Watermarking trên âm
thanh khác nhau dựa trên những tiêu chí, quan điểm khác nhau. Theo các nhà
nghiên cứu về Watermarking trên âm thanh người ta chia các kỹ thuật
Watermarking trên âm thanh thành hai nhóm chính:
-Nhóm có sử dụng tín hiệu gốc trong quá trình rút trích.
-Nhóm không cần đến tín hiệu gốc trong quá trình rút trích thông tin.
2.1. Mô hình phân loại Watermarking trên âm thanh
Mã hóa pha
Giao thoa tín
hiệu gốc
Điều biến pha

Nhóm các phương
pháp trải phổ
Watermarking
trên âm thanh

Nhóm phương pháp
tập đôi

Không giao thoa

tín hiệu gốc

Nhóm phương pháp
sử dụng bản sao
Nhóm phương pháp
tự đánh dấu

Hình 2.1 Phân loại Watermarking trên âm thanh
2.1.1. Nhóm các phương pháp giao thoa tín hiệu gốc.
Nhóm phương pháp này còn được gọi là nhóm các phương pháp cần sử dụng
tín hiệu gốc trong quá trình rút trích thông tin hay nhóm Nonblind Watermarking.
Các phương pháp thuộc nhóm này đều cần đến thông tin gốc khi muốn rút trích

22


×