Tải bản đầy đủ (.pdf) (29 trang)

Tìm hiểu kỹ thuật watermarking đối với audio số

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (32.65 MB, 29 trang )

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG
–˜ & ™—

Báo Cáo:

XỬ LÝ DỮ LIỆU ĐA PHƯƠNG TIỆN
Đề tài:

“Tìm hiểu kỹ thuật Watermarking đối với audio số”
GVHD: PGS.TS Nguyễn Thị Hoàng Lan
Thực hiện: Nhóm 22
Nguyễn Tất Thành

20122420

Trần Trọng Giáp

20121610

Phạm Minh Hiếu

20121693



Hà nội, 05 / 2016







MỤC LỤC
LỜINÓIĐẦU. .................................................................................................................... 3
I. TÌMHIỂUCHUNG. ....................................................................................................... 5
1.

Watermarking. ................................................................................................................ 5
a. Tổng quan. .................................................................................................................. 5
b. Lịch sử. ........................................................................................................................ 6
c. Phân loại. ..................................................................................................................... 7
d. Ứng dụng. ................................................................................................................. 10
2. Watermarking trên âm thanh số. ................................................................................ 12
a. Giới thiệu chung. ....................................................................................................... 12
b. Một số kỹ thuật giấu tin trong Audio. ......................................................................... 13

II. SƠĐỒAUDIOWATERMARKING. ............................................................................... 17
1.

Dựa trên quan điểm Watermark như một dạng truyền thông. ................................ 17
a. Mô hình cơ bản. ........................................................................................................ 17
b. Mô hình Watermarking truyền thông với thông tin phụ ở bộ trung chuyển......................... 18
c. Mô hình Watermarking theo quan niệm truyền thông đa công. ......................................... 19
2. Dựa trên quan điểm hình học. .................................................................................... 20
a. Các phân phối và miền trong không gian đa phương tiện.................................................. 20
b. Mô hình Watermarking trong không gian nhúng. ............................................................ 21

III. THUẬTTOÁNXỬLÝDỮLIỆU. ................................................................................... 24
1.
2.


Ý tưởng thuật toán. ..................................................................................................... 24
Quá trình tạo Watermark. ............................................................................................ 24
a. Mô hình. ..................................................................................................................... 24
b. Thuật toán ................................................................................................................. 25
3. Quá trình nhúng Watermark. ...................................................................................... 25
4. Quá trình rút trích Watermark..................................................................................... 26

IV. CÀIĐẶTTHỬNGHIỆM. ............................................................................................ 28
TÀI LIỆU THAM KHẢO. ............................................................................................... 29





2


LỜINÓIĐẦU.
Ngày nay, bên cạnh những ích lợi to lớn, thiết thực mà mạng máy tính
đem lại, chúng ta cũng đang đối đầu với những thử thách liên quan đến các
vấn đề truyền thông bảo mật và đặc biệt là vấn đề phân phối các tài liệu đa
phương tiện sao cho bảo đảm quyền sở hữu trí tuệ. Tình trạng sao chép bất hợp
pháp, giả mạo các tác phẩm số hóa gây bức xúc không chỉ riêng các tác giả mà
còn cho cả những người làm pháp luật. Những hành vi xâm phạm bản quyền
như giả mạo, ăn cắp tác phẩm, sử dụng các tác phẩm không có bản quyền…
đang trở nên phổ biến và ngày càng tinh vi.
Tuy nhiên với các phương pháp bảo vệ dữ liệu truyền thống như mã hoá,
sử dụng khóa đều không đem lại hiệu quả cao trong tình hình hiện nay.
Các loại truyền thông đa phương tiện như âm thanh số, ảnh số , video là

những dạng dữ liệu rất khó bảo vệ. Trong bối cảnh đó, kỹ thuật Watermarking
ra đời như một cứu cánh. Watermarking là một kỹ thuật mới cho phép nhúng
thông tin tác giả, gọi là một Watermark, vào các tài liệu số hóa sao cho chất
lượng trực quan của tài liệu không bị ảnh hưởng và khi cần có thể dò lại được
Watermark đã nhúng nhằm xác nhận bản quyền.
Bài tiểu luận tiến hành nghiên cứu một số vấn đề lý thuyết tổng quan về
Watermarking và các ứng dụng của nó trong công nghệ truyền thông đa phương
tiện, đồng thời tìm hiểu và phân tích sơ bộ về một số kỹ thuật Watermarking
trong môi trường ảnh màu kỹ thuật số.
Bài tiểu luận được trình bày thành 4 phần:
Phần 1: Tìm hiểu chung kĩ thuật Watermarking
Phần 2: Tìm hiểu và phân tích sơ đồ audio watermarking trên miền
thời gian hoặc miền tần số
Phần 3: Tìm hiểu sơ đồ thuật toán xử lí dữ liệu
Phần 4: Cài đặt thử nghiệm thuật toán

Do thời gian thực hiện và kiến thức còn nhều hạn chế nên chắc chắn không

3


tránh khỏi những sai lầm, thiếu sót, kính mong nhận được sự đóng góp ý kiến,
bổ sung, sửa đổi của quý thầy cô giáo, các bạn đồng nghiệp, đồng môn để bài
tiểu luận hoàn chỉnh hơn, thiết thực hơn.
Xin chân thành cảm ơn !




4



I.

TÌMHIỂUCHUNG.
1. Watermarking.

a. Tổng quan.
Watermarking là một trong những kỹ thuật giấu dữ liệu hiện đại. Nó được
định nghĩa như là quá trình chèn thông tin vào dữ liệu đa phương tiện nhưng bảo
đảm không cảm thụ được, nghĩa là chỉ làm thay đổi nhỏ dữ liệu gốc. Thông
thường người ta chỉ đề cập đến Watermarking số. Đó là một tập các dữ liệu số thứ
cấp - gọi là Watermark (mã đánh dấu bản quyền) - được nhúng vào dữ liệu số sơ
cấp - gọi là dữ liệu bao phủ (ví dụ như văn bản, hình ảnh, video và audio số,...).
Dữ liệu sau quá trình nhúng được gọi là dữ liệu nhúng. Tanaka (1990), Caronni và
Tirkel (1993) lần lượt đưa ra những ấn bản đầu tiên về Watermarking nhưng chưa
nhận được sự quan tâm đúng mức. Mãi đến năm 1995, chủ đề này mới bắt đầu
được quan tâm và kể từ đó, Watermarking số đã phát triển rất nhanh với nhiều
hướng nghiên cứu và phương pháp thực hiện khác nhau.
Watermarking được ứng dụng trong nhiều lĩnh vực như bảo vệ quyền sở hữu, điều
khiển việc sao chép, xác nhận giấy tờ hay truyền đạt thông tin khác… trong đó
ứng dụng phổ biến của nó là cung cấp bằng chứng về bản quyền tác giả của các dữ
liệu số bằng cách nhúng các thông tin bản quyền. Rõ ràng trong ứng dụng này,
thông tin nhúng cần phải bền vững trước các thao tác nhằm loại bỏ chúng.

5


a) Sơ đồ nhúng Watermark


b) Sơ đồ khôi phục Watermark

Tất cả các phương pháp Watermarking đều có chung các khối sau: một hệ
thống nhúng Watermark và một hệ thống khôi phục Watermark. Ngõ vào là
Watermark, dữ liệu cần nhúng và mã cá nhân hay công cộng. Watermark có
thể ở bất kì dạng nào như chữ số, văn bản hay hình ảnh. Khoá có thể được
dùng để tăng cường tính bảo mật, nghĩa là ngăn chặn những kẻ không có bản
quyền khôi phục hay phá hủy Watermark. Các hệ thống thực tế dùng ít nhất
là một khoá, thậm chí kết hợp nhiều khoá. Ngõ ra là dữ liệu đã được
Watermark. Quá trình khôi phục Watermark tổng quát. Các ngõ vào là dữ liệu
đã Watermark, khoá và dữ liệu gốc (có thể có hoặc không tuỳ thuộc vào
phương pháp). Ngõ ra hoặc là Watermark khôi phục được hoặc đại lượng
nào đó chỉ ra mối tương quan giữa nó và Watermark cho trước ở ngõ vào.

b. Lịch sử.
Nghệ thuật làm giấy đã được phát minh ở Trung Quốc cách đây trên một
ngàn năm nhưng mãi đến khoảng năm 1282, các công nghệ Watermark trên
giấy mới xuất hiện đầu tiên dưới hình thức một số vị trí khuôn giấy là các
mẫu dây mỏng hơn, khi đó giấy sẽ mỏng và trong suốt hơn ở những vị trí
dây mỏng. Các Watermark giấy nguyên thủy giúp xác nhận xưởng sản xuất
hay đơn giản chỉ là để trang trí. Vào thế kỉ thứ 18, ở châu Âu và Mỹ,
Watermark trên giấy đã đem lại những lợi ích thiết thực trong việc xác định
nhãn hiệu thương mại, ghi nhận ngày sản xuất, chống làm tiền giả. Thuật
ngữ Watermark bắt nguồn từ một loại mực vô hình được viết lên giấy và chỉ
hiển thị khi nhúng giấy đó vào nước. Thuật ngữ digital Watermarking được
cộng đồng thế giới chấp nhận rộng rãi vào đầu thập niên 1990. Khoảng năm
1995, sự quan tâm đến Watermarking bắt đầu phát triển nhanh. Năm 1996,
hội thảo về che dấu thông lần đầu tiên đưa Watermarking vào phần trình nội
6



dung chính. Đến năm 1999, SPIE đã tổ chức hội nghị đặc biệt về Bảo mật và
Watermarking trên các nội dung đa phương tiện.
Cũng trong khoảng thời gian này, một số tổ chức đã quan tâm đến kỹ thuật
Watermarking với những mức độ khác nhau. Chẳng hạn CPTWG thử nghiệm
hệ thống Watermarking bảo vệ phim trên DVD. SDMI sử dụng Watermarking
trong việc bảo vệ các đoạn nhạc. Hai dự án khác được liên minh Châu Âu ủng
hộ, VIVA và Talisman đã thử nghiệm sử dụng Watermarking để theo dõi phát
sóng. Vào cuối thập niên 1990, một số công ty đưa Watermarking vào thương
trường, chẳng hạn các nhà phân phối nhạc trên internet sử dụng Liqid Audio áp
dụng công nghệ của Verance Corporation. Trong lĩnh vực Watermarking ảnh,
Photoshop đã tích hợp một bộ nhúng và bộ dò Watermark tên là Digimarc.
c. Phân loại.
Có nhiều cách phân loại kỹ thuật watermarking khác nhau, có thể phân
loại như sau:

Phân loại watermarking theo miền nhúng
• Miền không gian
• Miền tần số
− Miền DFT
7


− Miền DCT
− Miền DWT.

• Kỹ thuật watermarking có thể chia thành 4 loại theo đúng loại tài liệu
nhúng watermark bao gồm:
− Ảnh.
− Video.

− Văn bản.
− Âm thanh.
− Định dạng đa phương tiện đặc biệt (ví dụ như hoạt hình)

• Theo hệ thống nhìn của con người kỹ thuật watermarking số có thể chia
thành các loại sau:
− Watermark có thể nhìn thấy (Visible Watermark)
− Watermark bền vững không nhìn thấy (Invisible-Robust Watermark)
8


− Watermark yếu không nhìn thấy (Invisible-Fragile Watermark).
− Watermark kép (Dual Watermark).

• Phương pháp thay đổi dữ liệu chủ.
− Cộng tuyến tính của tín hiệu trải phổ.
− Tổng hợp ảnh (nhúng một logo).
− Thay thế và lượng tử hóa không tuyến tính.



Phân loại kỹ thuật watermarking dựa vào các ứng dụng

• Ngoài ra, kỹ thuật watermarking có thể được chia làm 3 loại khác nhau
như sau:
− Watermark rõ rang.
− Watermark bền vững không rõ rang.
− Watermark dễ hư không rõ ràng.

9



• Độ khả dụng của tham chiếu dữ liệu (ví dụ như ảnh gốc) cho quá trình
trích watermark.
− Oblivious (blind): mù
− Semi – obilious: bán mù
− Non – obilious (non – blind) : không mù

d. Ứng dụng.
Trong lĩnh vực watermarking, các điều kiện một hệ thống watermarking cần
phải thỏa luôn tùy thuộc vào ứng dụng của nó. Vì vậy, trước khi xét đến các
điều kiện, cũng như cách thiết kế hệ thống watermarking cần xét đến các ứng
dụng của kỹ thuật watermarking. Ngoài ra ta còn thấy rằng hiện không có một
giải thuật watermarking nào là hoàn hảo cả và mọi giải thuật watermarking đều
phải chú trọng đến mức độ bền vững của dữ liệu sao cho phù hợp với từng ứng
dụng cụ thể.
• Bảo vệ quyền sở hữu (Copyright Protection).
Đây là ứng dụng cơ bản nhất của kỹ thuật digital watermarking. Mục đích
của watermarking cho bảo vệ quyền tác giả là nhúng thông tin xác nhận bản
quyền (watermark) vào dữ liệu ảnh số để có thể nhận biết người chủ bản quyền.
Ngoài mục đích xác nhận người chủ bản quyền còn để kiểm tra kín công việc
của người mua (truy xét các bản sao không hợp lệ). Dữ liệu nhúng có thể là một
số đăng ký (giống như UPC trên đĩa), một đoạn thông điệp, logo hình hoặc là
một mẫu duy nhất (như ADN: Acid deoxyribonucleic). Ví dụ như hệ thống
quản lí sao chép DVD đã được ứng dụng ở Nhật. Watermark mang các giá trị
chỉ trạng thái cho phép sao chép dữ liệu như “copy never” - không được phép
sao chép hay “copy once” - chỉ được copy một lần sau khi copy xong, bộ đọc,
ghi watermark sẽ ghi watermark mới, chỉ trạng thái mới lên DVD. Các ứng
dụng loại này yêu cầu watermark phải được bảo đảm an toàn và sử dụng
phương pháp phát hiện watermark đã giấu mà không cần thông tin gốc.

Watermark số có thể nhận thấy được hoặc không nhìn thấy được. Watermark
ảnh nhìn thấy được thường là logo của người bản quyền, có thể dễ dàng đặt vào
ảnh nhưng khó gở bỏ. Tuy nhiên nhiều ứng dụng cần watermark không nhận
thấy. Trong luận văn chỉ đề cập đến “invisible watermark” trong ảnh số.
Invisible watermark đòi hỏi phải có tính bền vững cao trước các quá trình xử lý
10


ảnh như nén ảnh (ví dụ JPEG, JPEG2000), lọc ảnh, biến đổi hình học (xoay, cắt
ảnh, co dãn ảnh...). Muốn loại bỏ watermark này mà không được phép của
người chủ sở hữu thì chỉ có cách là phá huỷ sản phẩm. Để thiết lập quyền sở
hữu hợp pháp, sơ đồ watermark phải an toàn để chống lại những tấn công cố ý.
• Xác nhận thông tin ảnh và tình trạng nguyên vẹn dữ liệu (Image
Athentication and Data Integrity).
Một ứng dụng khác của watermarking là xác nhận đúng ảnh và xác nhận sự
giả mạo. Ảnh số ngày càng được sử dụng như một chứng cứ buộc tội ngày nay.
Watermark được sử dụng để phát hiện nó có bị sửa đổi hay không và có thể
định vị được vị trí sửa đó. Ảnh số dễ bị sửa đổi từ ứng dụng xử lý ảnh phức tạp.
Watermark được sử dụng để xác nhận tính xác thực của ảnh. Đối với ứng dụng
loại này watermark cần phải yếu (fragile) không cần bền vững trước các phép
xử lý trên ảnh đã được giấu tin để bất cứ sự sửa đổi nào trên ảnh sẽ phá hủy
watermark (phát hiện sự sửa đổi).
• Lấy dấu vân tay hay dán nhãn (Fingerprinting and Labeling).
Nhãn ảnh là một ứng dụng mà thông tin về nội dung ảnh được mã hóa thành
watermark và được chèn vào ảnh. Mục tiêu của ứng dụng này tập trung vào vấn
đề truyền thông tin, về tính hợp pháp của người nhận hơn là tính hợp pháp của
nguồn dữ liệu số, nhằm xác định các bản sao của dữ liệu được phân phối chỉ có
một. Việc này rất hữu dụng trong việc giám sát và theo dõi các bản sao được
sản xuất bất hợp pháp. Nó tương tự như số seri trong sản phẩm phần mềm, mỗi
một sản phẩm sẽ mang một watermark riêng, loại ứng dụng này được gọi là

“fingerpringting” và nó liên quan đến việc gắn những watermark khác nhau
thực hiện dễ dàng và độ phức tạp thấp. Watermark được sử dụng trong lĩnh vực
này cũng đòi hỏi tính bền vững cao trước những tấn công cố ý.
• Theo dõi quá trình sử dụng (Tracking).
Digital watermarking có thể được dùng để theo dõi quá trình sử dụng của các
digital media. Mỗi bản sao của sản phẩm được chứa một watermark duy nhất
dùng để xác định người được phép sử dụng là ai. Nếu có sự nhân bản bất hợp
pháp, ta có thể truy ra người vi phạm nhờ vào watermark được chứa bên trong
digital media.
• Kiểm tra giả mạo (Tamper Proofing).

11


Digital watermarking có thể được dùng để chống sự giả mạo. Nếu có bất cứ
sự thay đổi nào về nội dung của các digital media thì watermark này sẽ bị huỷ
đi. Do đó rất khó làm giả các digital media có chứa watermark.
• Kiểm tra truyền thông (Broadcast Monitoring).
Nhiều chương trình rất tốn kém chi phí để sản xuất và phát trên mạng lưới
truyền hình như: tin tức, phim ảnh, các sự kiện thể thao, quảng cáo ... Bảo vệ tài
sản trí tuệ và ngăn chặn các hoạt động phát sóng lại một cách bất hợp pháp là vô
cùng quan trọng. Các công ty truyền thông và quảng cáo có thể dùng kỹ thuật
digital watermarking để quản lý xem có bao nhiêu khách hàng đã dùng dịch vụ
cung cấp.
• Truyền tin bí mật (Concealed Communication) .
Vì digital watermarking là một dạng đặc biệt của kỹ thuật che giấu dữ liệu
(steganography) nên người ta có thể dùng để truyền các thông tin bí mật.

2. Watermarking trên âm thanh số.
a. Giới thiệu chung.

Các kỹ thuật Watermarking trên âm thanh số hiện nay chủ yếu khai thác
khuyết điểm của hệ chính giác ( HAS- Human Auditory System) đó là đặc tính
ít nhạy cảm với những thay đổi nhỏ trên miền thời gian và miền tần số. Tewfik
và Hamdy[3] đã phân tích các phương pháp ẩn dữ liệu trong tín hiệu âm thanh
số tiêu biểu là: mã hoá LSB, mã hoá pha , trải phổ, ẩn echo. Các kĩ thuật LSB
tuy không bền vững nhưng khả năng lưu trữ lớn. Mã hoá pha bền vững trước
các thao tác lấy mẫu lại, khả năng lưu trữ thấp. Bằng cách chèn các echo có biên
độ nhỏ vào miền thời gian , phương pháp ẩn echo được đánh giá cao về khả
năng bền vững và tỉ lệ nhúng, tuy nhiên khả năng trong suốt kém. Được đánh
giá cao hơn cả là kỹ thuật chuyển đổi thông tin với hai hướng tiếp cận chính là
kỹ thuật trải phổ và điều biến chỉ mục lượng tử.
Ưu điểm quan trọng đem lại thành công cho hướng phát triển này là không sử
dụng tín hiệu gốc trong quá trình rút trích và khó có thể dò tìm watermark bằng
các phương pháp phân tích thông kê. Tuy nhiên lượng tử hoá không đem lại
hiệu quả cao do khả năng chống tấn công thấp. Hiện nay trải phổ đang là kỹ
thuật được đánh giá cao, được nghiên cứu tập trung phát triển, cải tiến.

12


b. Một số kỹ thuật giấu tin trong Audio.
Các kỹ thuật giấu tin trong audio dựa vào hệ thống thính giác của con người
[1-3]. Việc giấu tin trong audio thường là khó hơn trong các dữ liệu media khác
do hệ thống thính giác của con người khá nhạy với các nhiễu. Sau đây là một số
phương pháp giấu:
• Mã hóa LSB (Least Significant Bit).
Phương pháp mã hóa LSB là cách đơn giản nhất để nhúng thông tin vào
trong dữ liệu audio. Phương pháp này sẽ thay thế bít ít quan trọng nhất (thường
là bít cuối) của mỗi mẫu dữ liệu bằng bít thông tin giấu. Ví dụ mẫu 8 bít như
sau:


Sau khi giấu bít 1 sẽ như sau:

Ưu điểm của phương pháp này là dễ cài đặt và cho phép giấu dữ liệu
nhiều. Có thể tăng thêm dữ liệu giấu bằng cách dùng hai bít LSB. Tuy nhiên
cách này làm cũng làm tăng nhiễu trên đối tượng chứa dẫn đến đối phương dễ
phát hiện và thực hiện các tấn công. Vì vậy dữ liệu chứa cần phải được chọn
trước khi giấu sử dụng phương pháp mã hóa LSB.
ðể tăng độ an toàn cho kỹ thuật này, ta sử dụng bộ sinh số nguyên ngẫu nhiên để
sinh ra các vị trí các mẫu được chọn giấu chứ không phải các mẫu liên tục. Bộ
sinh số này sử dụng một khóa bí mật key như là phần tử khởi tạo của bộ sinh số.
Khóa key này được sử dụng trong cả quá trình giấu tin và giải tin. Lưu ý là bộ
sinh số không tạo ra các giá trị trùng nhau để tránh trường hợp một vị trí được
giấu hai lần.
• Mã hóa Parity (Parity Coding).

13


Thay vì chia dữ liệu thành các mẫu riêng lẻ, phương pháp mã hóa chẵn lẻ
chia dữ liệu thành các nhóm mẫu và giấu từng bit thông tin vào trong các nhóm
mẫu này. Nếu parity bít của nhóm mẫu này không trùng với bit thông tin giấu
thì ta tiến hành điều chỉnh một bít nào đó trong nhóm mẫu này. Phương pháp
này cho ta nhiều sự lựa chọn hơn khi thay đổi 1 bít và có vẻ “kín đáo” hơn so
với phương pháp điều chỉnh LSB.
Cả hai phương pháp LSB và Parity đều có những hạn chế. Do tai người khá
nhạy nên những thay đổi trên dữ liệu chứa sẽ sinh nhiễu và người nghe rất dễ
nhận ra. Một điểm nữa là hai phương pháp này không bền vững và thông tin sẽ
bị mất sau khi thực hiện việc lấy mẫu lại. Một trong những cách khắc phục là
thực hiện việc giấu nhiều lần. Tuy nhiên cách này cũng có hạn chế là nó làm

tăng thời gian xử lý.
• Mã hóa Phase (Phase Coding).
Phương pháp mã hóa pha giải quyết được các hạn chế do sinh ra nhiễu của
hai phương pháp giấu dữ liệu trên. Phương pháp mã hóa pha dựa vào tính chất
là các thành phần của pha không gây ảnh hưởng đến hệ thống thính giác của con
người như nhiễu. Việc giấu tin được thực hiện bằng cách điều chỉnh pha trong
phổ pha của dữ liệu số.

Dữ liệu sau khi giấu Quá trình mã hóa pha được chia thành các bước sau:
− Dữ liệu âm thanh gốc được chia thành các segment nhỏ hơn có dài bằng
chiều dài chiều dài bằng với thông tin cần giấu.
− Thực hiện biến đổi Fourier rời rạc DFT trên mỗi đoạn.

14


− Tính độ lệch pha giữa các đoạn kề nhau.
− Giá trị chính xác các pha của các đoạn có thể thay đổi nhưng mối liên hệ
về sự khác nhau về pha giữa các segment liên tiếp phải được đảm bảo, vì
vậy thông tin giấu chỉ được phép giấu trong vector pha của đoạn đầu tiên.
Việc điều chỉnh pha của đoạn đầu được áp dụng dựa trên công thức sau:

− Ghép các segment lại và tiến hành DFT ngược để tạo lại dữ liệu âm
thanh.
Để nhận được tin giấu bằng kỹ thuật này, người nhận phải biết độ dài của
segment, sau đó thực hiện DFT để nhận tin. Một yếu điểm của phương pháp này
là tỉ lệ dữ liệu thấp do thông tin chỉ được giấu vào segment đầu tiên. Có thể cải
thiện bằng cách tăng độ dài segment. Tuy nhiên cách này sẽ làm cho tin giấu dễ
phát hiện. Phương pháp mã hóa pha chỉ thích hợp cho việc giấu lượng nhỏ
thông tin.

• Kỹ thuật trải phổ.
Thông thường các file audio được truyền qua các kênh truyền thông, các
kênh truyền thông này sẽ tập trung dữ liệu audio trong vùng hẹp của phổ tần số
để duy trì năng lượng và tiết kiệm băng thông. Các kỹ thuật trải phổ cố gắng trải
thông tin mật vào trong phổ tần số của dữ liệu audio càng nhiều càng tốt. Nó
cũng tương tự như kỹ thuật LSB là trải ngẫu nhiên thông tin giấu trên toàn bộ
file audio. Lợi điểm của phương pháp trải phổ là nó bền vững trước một số tấn
công. Tuy nhiên nó cũng có hạn chế là sinh nhiễu và dễ nhận ra. Hai phương
pháp trải phổ sử dụng trong giấu tin audio là DSSS (Direct Sequency Spread
Spectrum) và FHSS (Frenquency Hopped Spread Spectrum).
• Kỹ thuật giấu dựa vào tiếng vang (Echo).
Kỹ thuật giấu dựa vào tiếng vang thực hiện giấu tin bằng cách thêm vào
tiếng vang trong tín hiệu gốc. Dữ liệu nhúng được giấu bằng cách thay đổi 3
tham số của tiếng vang : Biên độ ban đầu, tỉ lệ phân rã và độ trễ. Khi thời gian
giữa tín hiệu gốc và tiếng vang giảm xuống, hai tín hiệu có thể trộn lẫn và người
nghe khó có thể phân biệt giữa hai tín hiệu. Số lượng tin giấu có liên quan đến
thời gian trễ của tiếng vang và biên độ của nó.

15


Bằng cách dùng thời gian trễ khác nhau giữa tín hiệu gốc và tiếng vang để thể
hiện tương ứng giá trị nhị phân 1 hoặc 0, theo cách đó dữ liệu được giấu vào file
audio. để giấu nhiều hơn một bit, tín hiệu gốc được chia thành các đoạn ngắn
hơn và mỗi đoạn sau đó có thể được tạo tiếng vang để giấu số bit mong muốn.
Dữ liệu chứa cuối cùng bao gồm các đoạn được mã độc lập nối lại theo thứ tự
chia ban đầu. Kỹ thuật giấu tin dựa vào tiếng vang rất hiệu quả trong các file
audio chất lượng cao. Các file âm thanh chưa làm giảm chất lượng và không có
quá nhiều đoạn yên lặng thường dùng kỹ thuật này để giấu tin.
Một cách tiếp cận khác là tiến hành mã hóa chuỗi bit theo một cách nào đó giúp

ta phát hiện ra lỗi. Thay vì giấu trực tiếp L bit vào đối tượng chứa, ta biến đổi
chuỗi bit bằng cách bổ sung một số bit vào S nhằm mục đích kiểm tra lỗi.





16


II.

SƠĐỒAUDIOWATERMARKING.
1. Dựa trên quan điểm Watermark như một dạng truyền thông.

a. Mô hình cơ bản.
Trong mô hình này, tài liệu chủ được xem như nhiễu được thêm vào trong
suốt quá trình truyền tín hiệu Watermark.

Hình - 1: Bộ dò không cần ảnh gốc

Hình- 2:Bộ dò cần ảnh gốc

Không quan tâm bộ dò ở đây là blind hay non-blind, qui trình nhúng bao gồm
hai bước:

17


Trước hết, thông điệp được ánh xạ thành một mẫu thêm (added pattern) wa có

cùng kiểu và kích thước với ảnh chủ c0. Ví dụ, trong Watermarking ảnh, bộ
nhúng tạo ra một mẫu các pixel hai chiều cùng kích thước với ảnh chủ gốc. Sự
ánh xạ này được thực hiện với một khóa Watermark. Các mẫu thêm thường
được tính qua nhiều bước. Với các mẫu định nghĩa sẵn và có thể phụ thuộc vào
khóa, gọi là mẫu tham khảo (reference pattern) wr0, wr1, wr2, chúng ta liên kết
chúng lại để tạo ra một mẫu mã hóa, ta gọi là mẫu thông điệp (message pattern),
wm. Mẫu thông điệp này sau đó được chỉnh sửa hay thay đổi tỉ lệ để thu được
mẫu thêm.
Sau đó, wa được thêm vào tài liệu chủ, c0, để tạo tài liệu được Watermark
(Watermarked Work), cw.
Sau khi mẫu thêm được nhúng, giả sử tài liệu được Watermark cw bị thay đổi vì
một xử lý nào đó, ta mô hình hóa hiệu ứng xử lý này bằng một nhiễu cộng. Các
kiểu xử lý có thể gồm: Nén, giải nén, phát sóng qua các kênh tuần tự, cải thiện
ảnh hay âm thanh... hay một xử lý bất kì của kẻ trộm nhằm gỡ bỏ Watermark...

b. Mô hình Watermarking truyền thông với thông tin phụ ở bộ trung
chuyển.
Tài liệu chủ vẫn được xem là một nhiễu, nhưng qui trình nhúng Watermark
cần được cung cấp thêm ảnh chủ đó với vai trò là thông tin phụ. Thông tin phụ
(side information) là thông tin được cung cấp cho bộ trung chuyển hoặc bộ nhận
trong một hệ thống truyền thông, khác với thông điệp được chuyển hay tín hiệu
nhận được cần giải mã. Trong mô hình Watermarking này, chúng ta xem ảnh
chủ là một thông tin phụ đối với bộ nhúng.

18


Trong mô hình trước, giới hạn của nó là vết Watermark được mã hóa độc lập
với tài liệu chủ co, điều này không tận dụng triệt để ảnh gốc. Nếu ta cho phép
bộ mã hóa Watermark kiểm tra co trước khi mã hóa mẫu thêm thì ta sẽ có thuật

toán nhúng hiệu quả hơn.

Hình - 3: Mô hình Watermarking theo quan niệm truyền thông với thong tin phụ ở bộ trung chuyển

c. Mô hình Watermarking theo quan niệm truyền thông đa công.
Ở sơ đồ này, ảnh chủ không còn được xem là một phần của kênh truyền mà
là thông điệp thứ hai được truyền đi cùng với thông điệp Watermark trong cùng
tìn hiệu cw. Hai thông điệp co và m sẽ được dò và giải mã bởi 2 nguồn nhận rất
khác nhau: con người và bộ dò Watermark. Bộ nhúng Watermark liên kết m và
co trong một tín hiệu đơn, cw , tương tự như việc truyền nhiều thông điệp trên 1
đường dây trong truyền thông truyền thống như chia thời gian (time - division) ,
chia tần (frequency - division) hay chia mã (code - division) đa công (code
division multiplexing là truyền nhiều thông điệp trên 1 kênh đơn bằng cách thay
chúng bằng các tín hiệu trực giao chồng lên nhau theo thời gian, không gian, tần
số.

19


Tuy nhiên, điểm khác biệt là: Trong truyền thông truyền thống, kỹ thuật cơ bản
dùng cho các thông điệp khác nhau thì giống nhau, các thông điệp được phân
biệt nhau nhờ một tham số đơn (thời gian, tần số, dãy mã). Trong
Watermarking: 2 thông điệp được phân biệt bằng hai kỹ thuật khác nhau: dò
Watermark và cảm nhận của con người. Tương ứng ta nói là: một thông điệp
được chia tần và một thông điệp được mã hóa phổ rộng (frequency division spread spectrum coding). Khi xem cwn, con người nhận được một thứ gì đó gần
với ảnh chủ không dính dáng gì vào Watermark. Khi dò 1 Watermark trong
cwn, bộ dò cần lầy thông điệp Watermark, không dính dáng gì đến ảnh chủ.
Riêng đối với bộ dò informed, ảnh chủ gốc được cần đến nhưng với vai trò là
một tham số thứ 2.


2. Dựa trên quan điểm hình học.
Quan điểm Watermarking hình học xem các tài liệu là các điểm trong không
gian đa phương tiện (media space) nhiều chiều. Khi phân tích các thuật toán
phức tạp hơn, ta cần chiếu hay làm biến dạng không gian đó thành không gian
nhúng.
a. Các phân phối và miền trong không gian đa phương tiện.
Trong không gian đa phương tiện có những phân phối xác suất và vùng sau:
Phân phối các tài liệu chưa được nhúng Watermark (distribution of
unWatermarked works) tượng trưng cho mỗi tài liệu.Vùng tương tự cảm nhận
được giữa ảnh gốc và ảnh qua xử lý có thể chấp nhận (Region of acceptable
fidelity) là vùng trong đó tất cả các tài liệu đều là ứng viên tiềm năng của một
tài liệu cho trước. Vùng dò (Detection region) tượng trưng cho cách làm việc
20


của thuật toán dò. Phân phối nhúng hay vùng nhúng (Embedding
distribution/embedding region) thể hiện hiệu quả của một thuật toán nhúng.
Phân phối biến dạng (Distortion distribution) thể hiện cách mà tài liệu bị làm
biến dạng trong quá trình sử dụng.
b. Mô hình Watermarking trong không gian nhúng.
Phần lớn các bộ dò Watermark thường được thiết kế để áp dụng được trên
không gian nhúng (marking space), đó là một không gian thu hẹp của không
gian đa phương tiện qua phép chiếu hoặc phép biến hình.

Như hình trên, bộ dò như vậy chứa một qui trình gồm 2 bước:
− Bước 1: Trích Watermark Áp dụng một hay nhiều tiền xử lý cho tài liệu
gốc chẳng hạn biến đổi tần số (frequency transform), lọc (filtering), trung
bình khối (block averaging), căn mép tạm hay hình học (geomatric or
temporal registration) và trích đặc trưng (feature extraction). Kết quả thu
được một vec tơ (một điểm trong không gian nhúng) có chiều nhỏ hơn

chiều của vec tơ ban đầu. Chúng ta gọi vec tơ này là vết trích. (extracted
mark).

21


− Bước 2: Xác định xem vết trích có chứa Watermark không và nếu có thì
giải mã thông điệp được nhúng. Điều này đòi hỏi phải đi so sánh vết trích
với một hay nhiều vết tham khảo được định nghĩa trước (reference mark).
Bước 2 có thể là một bộ dò Watermark đơn giản thực hiện trên các vec tơ
trong không gian nhúng. Đối với các bộ nhúng Watermark thường thì
chúng không được thiết kế để dùng trong không gian nhúng nhưng trên
thực tế vẫn có thể thực hiện được.

Một bộ dò nhúng như vậy chứa một quy trình 3 bước như hình:
− Bước 1: Tương tự bước trích trong bộ dò Watermark ở trên.
− Bước 2: Chọn 1 vec tơ mới trong không gian nhúng gần với vết trích và
hy vọng rằng vec tơ này được dò có chứa Watermark. Vec tơ mới này ta
gọi là vết thêm (added mark). Bước 2 này có thể xem như bộ nhúng
Watermark đơn giản thực hiện trong không gian nhúng.
− Bước 3: Đảo ngược quy trình trích, chiếu vec tơ mới trở lại không gian đa
phương tiện để thu được tài liệu được Watermark. Nếu không gian nhúng
có cùng chiều với không gian đa phương tiện, phép chiếu có thể được
thực hiện theo cách ánh xạ 1:1. Tuy nhiên, nếu không gian nhúng có
chiều nhỏ hơn không gian đa phương tiện, mỗi điểm trong không gian
nhúng phải tương ứng với không gian đa phương tiện. Do vậy, việc tìm
một tài liệu sẽ nhận vec tơ mới như một vết trích cho ta nhiều tài liệu
khác nhau thỏa như vậy. Nói một cách lý tưởng là, ta tìm một tài liệu mà
được cảm nhận là gần với tài liệu gốc nhất. Trong thực tế, ta dùng một
thuật toán xấp xỉ, tức là không cho ta tài liệu gần nhất mà cho tài liệu phải

22


chăng nhất.
Trong 2 sơ đồ trên, mục tiêu của hàm extraction là nhằm giảm chi phí nhúng và
dò. Thêm nữa là nhằm đơn giản hóa phân phối của những tài liệu không có
Watermark, vùng tương tự cảm nhận được giữa ảnh gốc và ảnh qua xử lý có thể
chấp nhận, và phân phối biến dạng để cho các thuật toán Watermarking được
thực hiện tốt.





23


III.

THUẬTTOÁNXỬLÝDỮLIỆU.

1. Ý tưởng thuật toán.
Trái ngược với các phương pháp Watermarking truyền thống, trong thuật
toán này âm thanh sẽ đóng vai trò nhiễu Jammer 1 và Watermark đóng vai trò
tín hiệu truyền giả âm thanh.Thành phần của tín hiệu sau khi Watermark như
hình 2.

Trong mô hình này:
− Phần âm thanh tai người cảm nhận được là nhiễu Jammer.
− Do các thao tác xử lý của người dùng (như thay đổi tần số, thay đổi số

điểm mẫu, thay đổi độ cao, chuyển đổi định dạng ...) chỉ được thực hiện
trên tín hiệu âm thanh – tín hiệu nhiễu Jammer. Đặc biệt thuật toán có khả
năng chống tốt trước tấn công dạng chuyển đổi kiểu file (wav, mp3, wma,
mov, ...)

2. Quá trình tạo Watermark.
a. Mô hình.


Watermark x(t) được tạo ra thông qua hệ thống mã hóa DS/BPSK như hình 3.
Trong đó:
− s(t): chuỗi bit Watermark biểu diễn theo miền thời gian.
24


− w: chuỗi bit Watermark ở dạng cực.
− m: hệ số lặp.
− header: chuỗi header.
− f0 : tần số sóng mang dùng trong bộ điều biến BPSK.
− I, H: chiều dài và chiều rộng của ma trận Interleaver.
b. Thuật toán
− Bước 1: Chuyển chuỗi tín hiệu Watermark sang dạng cực và lặp dãy bit
w m lần.
− Bước 2: Cho chuỗi bit wR sau khi lặp đi qua ma trận Interleaver (H dòng
và I cột) với đầu vào lấy theo cột và đầu ra lấy theo dòng.
− Bước 3: Thêm header vào đầu dãy wI.
d = header + wI.
− Bước 4: Chuyển biểu diễn chuỗi bit d sang miền thời gian.
− Bước 5: Điều chế BPSK tín hiệu d(t). − Bước 6: Trải chuỗi tín hiệu sau
khi điều chế s(t).
x(t) = s(t).*c(t),c(t): chuỗi PN trên miền thời gian.


3. Quá trình nhúng Watermark.
• Mô hình quá trình nhúng như hình 4. x(t): thông tin Watermark được tạo
thành ở 5.1. T: là ngưỡng ngụy trang được tạo thành trong 4. Fz: tần số
sóng mang.
• Thuật toán:
− Bước 1: Chia dãy tín hiệu x(t) thành N frame, với mỗi frame có kích
thước là nBlock.
− Bước 2: Áp dụng phép biết đổi FFT cho từng frame đã cho qua cửa sổ
Hamming.
Xw = fft(frame[i].*hamming(nBlock))

25


×