Tải bản đầy đủ (.pdf) (36 trang)

tìm hiểu về kỹ thuật watermarking trong truyền thông đa phương tiện

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1013.52 KB, 36 trang )

TRƢỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN ĐÀO TẠO SAU ĐẠI HỌC




BÁO CÁO ĐỀ TÀI TIỂU LUẬN
MÔN HỌC: TRUYỀN THÔNG ĐA PHƢƠNG TIỆN

Đề tài:
“Tìm hiểu về kỹ thuật Watermarking trong truyền thông đa phương tiện”


Giảng viên: PGS.TS. Nguyễn Hoàng Lan – Viện CNTT&TT
Học viên:
MSHV:
Lớp:
Ngành: Kỹ thuật máy tính và truyền thông




Hà Nội, 05/2012
2


LỜI MỞ ĐẦU

Ngày nay, bên cạnh những ích lợi to lớn,
thiết thực mà mạng máy tính đem lại,
chúng ta cũng đang đối đầu với những thử thách liên quan đến các vấn đề truyền thông


bảo mật và đặc biệt là vấn đề phân phối các tài liệu đa phƣơng tiện sao cho bảo đảm quyền
sở hữu trí tuệ. Tình trạng sao chép bất hợp pháp, giả mạo các tác phẩm số hóa gây búc xúc
không chỉ riêng các tác giả mà còn cho cả những ngƣời làm pháp luật.
Những hành vi xâm
phạm bản quyền
nhƣ
giả mạo, ăn cắp tác phẩm, sử dụng các tác
phẩm
không có bản
quyền,… đang trở nên phổ biến và
ngày
càng tinh vi.

Tuy nhiên với các phƣơng pháp bảo vệ dữ
liệu
truyền thống nhƣ mã hoá, sử
dụng khóa đều
không
đem lại hiệu quả cao trong tình hình hiện nay. Các loại truyền
t hông đa phƣơng tiện nhƣ âm th anh số , ả nh số , video là những dạng dữ liệu
rất khó bảo vệ. Trong bối cảnh đó, kỹ
thuật
Watermarking ra đời nhƣ một cứu
cánh.
Watermarking là một kỹ thuật mới cho phép nhúng thông tin tác giả, gọi là một
Watermark, vào các tài liệu số hóa sao cho chất lƣợng trực quan của tài liệu không bị ảnh
hƣởng và khi cần có thể dò lại đƣợc Watermark đã nhúng nhằm xác nhận bản quyền.
Bài tiểu luận tiến hành nghiên cứu một số vấn đề lý thuyết tổng quan về
Watermarking và các ứng dụng của nó trong công nghệ truyền thông đa phƣơng tiện, đồng
thời tìm hiểu và phân tích sơ bộ về một số kỹ thuật Watermarking trong môi trƣờng ảnh

màu kỹ thuật số.
Bài tiểu luận đƣợc trình bày thành 4 phần:
Phần 1: Tổng quan về Watermarking
Phần 2: Các mô hình Watermarking, các thuật toán và phân loại
Phần 3: Watermarking trong môi trường ảnh màu
Phần 4: Độ an toàn Watermarking và tấn công Watermark
Do thời gian thực hiện và kiến thức bản thân còn nhều hạn chế nên chắc chắn
không tránh khỏi những sai lầm, thiếu sót, kính mong nhận đƣợc sự đóng góp ý kiến, bổ
sung, sửa đổi của quý thầy cô giáo, các bạn đồng nghiệp, đồng môn để bài tiểu luận hoàn
chỉnh hơn, thiết thực hơn.
Xin chân thành cảm ơn.


Học viên
Nguyễn Văn Tánh

3


MỤC LỤC

LỜI MỞ ĐẦU 2
MỤC LỤC 3
CHƢƠNG 1. TỔNG QUAN VỀ WATERMARKING 5
1.1 Lịch sử Watermarking 5
1.2 Các tiêu chí cần có của một thuật toán Watermarking mạnh mẽ 7
1.2.1 Tính bảo mật 7
1.2.2 Tính vô hình 7
1.2.3 Tính vô hình đối với thống kê 7
1.2.4 Tỉ lệ bit 8

1.2.5 Quá trình dò đáng tin cậy 8
1.2.6 Tính bền vững 8
1.2.7 Nhúng nhiều Watermark 8
1.2.8 Blind/non-blind, public/private Watermarking 9
1.2.9 Watermarking đọc đƣợc và dò đƣợc 9
1.2.10 Tính khả đảo và tính thuận nghịch của Watermark 10
1.2.11 Tính có thể thay đổi tỉ lệ (scalability) 10
1.3 Các ứng dụng của Watermarking 11
1.3.1 Theo dõi phát sóng 11
1.3.2 Nhận ra ngƣời chủ sở hữu 12
1.3.3 Bằng chứng về quyền sở hữu 13
1.3.4 Lƣu vết giao tác hay dấu vân tay 14
1.3.5 Xác nhận nội dung 15
1.3.6 Kiểm soát sao chép 16
CHƢƠNG 2. CÁC MÔ HÌNH WATERMARKING, CÁC THUẬT TOÁN 19
2.1 Mô hình trên quan điểm Watermarking nhƣ một dạng truyền thông 19
2.1.1 Mô hình cơ bản 19
4

2.1.2 Mô hình Watermarking truyền thông với thông tin phụ ở bộ trung chuyển 20
2.1.3 Mô hình Watermarking theo quan niệm truyền thông đa công 21
2.2 Mô hình dựa trên quan điểm hình học 22
2.2.1 Các phân phối và miền trong không gian đa phƣơng tiện 22
2.2.2 Mô hình Watermarking trong không gian nhúng 22
2.3. Các thuật toán Watermarking và phân loại 24
CHƢƠNG 3: WATERMARKING TRÊN ẢNH MÀU 26
3.1 Tổng quan về các thuật toán nhúng Watermark trên ảnh màu 26
3.2 Các thuật toán ví dụ 27
3.2.1 Thuật toán nhúng Watermark trên kênh xanh da trời (blue) 27
3.2.2 Thuật toán nhúng Watermark trên nhiều kênh 29

CHƢƠNG 4. ĐỘ AN TOÀN, TẤN CÔNG WATERMARK 30
4.1 Các phƣơng pháp tiếp cận nhằm tạo Watermark có độ an toàn cao 30
4.1.1 Nhúng thừa, nhúng lặp 31
4.1.2 Mã hóa tán phổ 31
4.1.3 Nhúng trong các hệ số quan trọng cảm nhận đƣợc 31
4.1.4 Nhúng trong các hệ số đƣợc cho là mạnh mẽ 32
4.1.5 Đảo nhiễu trong bộ dò 32
4.2 Một kiểu tấn công 32
4.2.1 Đặt vấn đề 32
4.2.2 Các cách giải quyết bài toán tác quyền khác nhau của các hệ thống Watermarking
khác nhau. 33
TỔNG KẾT, HƢỚNG PHÁT TRIỂN ĐỀ TÀI 35
1. Kết luận 35
2. Hƣớng phát triển 35
TÀI LIỆU THAM KHẢO 36

5


CHƢƠNG 1. TỔNG QUAN VỀ WATERMARKING
Watermarking là một trong những kỹ thuật giấu dữ liệu hiện đại. Nó đƣợc định
nghĩa nhƣ là quá trình chèn thông tin vào dữ liệu đa phƣơng tiện nhƣng bảo đảm không cảm
thụ đƣợc, nghĩa là chỉ làm thay đổi nhỏ dữ liệu gốc. Thông thƣờng ngƣời ta chỉ đề cập đến
Watermarking số. Đó là một tập các dữ liệu số thứ cấp - gọi là Watermark (mã đánh dấu
bản quyền) - đƣợc nhúng vào dữ liệu số sơ cấp - gọi là dữ liệu bao phủ (ví dụ nhƣ văn bản,
hình ảnh, video và audio số, ). Dữ liệu sau quá trình nhúng đƣợc gọi là dữ liệu nhúng.
Tanaka (1990), Caronni và Tirkel (1993) lần lƣợt đƣa ra những ấn bản đầu tiên về
Watermarking nhƣng chƣa nhận đƣợc sự quan tâm đúng mức. Mãi đến năm 1995, chủ đề
này mới bắt đầu đƣợc quan tâm và kể từ đó, Watermarking số đã phát triển rất nhanh với
nhiều hƣớng nghiên cứu và phƣơng pháp thực hiện khác nhau.

Watermarking đƣợc ứng dụng trong nhiều lĩnh vực nhƣ bảo vệ quyền sở hữu, điều
khiển việc sao chép, xác nhận giấy tờ, hay truyền đạt thông tin khác, … trong đó ứng dụng
phổ biến của nó là cung cấp bằng chứng về bản quyền tác giả của các dữ liệu số bằng cách
nhúng các thông tin bản quyền. Rõ ràng trong ứng dụng này, thông tin nhúng cần phải
bền vững trƣớc các thao tác nhằm loại bỏ chúng.

a) Sơ đồ nhúng Watermark b) Sơ đồ khôi phục Watermark
Tất cả các phƣơng pháp Watermarking đều có chung các khối sau: một hệ thống
nhúng Watermark và một hệ thống khôi phục Watermark. Ngõ vào là Watermark, dữ liệu
cần nhúng và mã cá nhân hay công cộng. Watermark có thể ở bất kì dạng nào nhƣ chữ số, văn
bản hay hình ảnh. Khoá có thể đƣợc dùng để tang cƣờng tính bảo mật, nghĩa là ngăn chặn
những kẻ không có bản quyền khôi phục hay phá hủy Watermark. Các hệ thống
thực tế dùng ít nhất là một khoá, thậm chí kết hợp nhiều khoá. Ngõ ra là dữ liệu đã đƣợc
Watermark. Quá trình khôi phục Watermark tổng quát. Các ngõ vào là dữ liệu đã Watermark,
khoá và dữ liệu gốc (có thể có hoặc không tuỳ thuộc vào phƣơng pháp). Ngõ ra hoặc là
Watermark khôi phục đƣợc hoặc đại lƣợng nào đó chỉ ra mối tƣơng quan giữa nó và
Watermark cho trƣớc ở ngõ vào.
1.1 Lịch sử Watermarking
6

Nghệ thuật làm giấy đã đƣợc phát minh ở Trung Quốc cách đây trên một ngàn năm
nhƣng mãi đến khoảng năm 1282, các công nghệ Watermark trên giấy mới xuất hiện đầu tiên
dƣới hình thức một số vị trí khuôn giấy là các mẫu dây mỏng hơn, khi đó giấy sẽ mỏng và
trong suốt hơn ở những vị trí dây mỏng. Các Watermark giấy nguyên thủy giúp xác nhận
xƣởng sản xuất hay đơn giản chỉ là để trang trí. Vào thế kỉ thứ 18, ở châu Âu và Mỹ,
Watermark trên giấy đã đem lại những lợi ích thiết thực trong việc xác định nhãn hiệu thƣơng
mại, ghi nhận ngày sản xuất, chống làm tiền giả. Thuật ngữ Watermark bắt nguồn từ một loại
mực vô hình đƣợc viết lên giấy và chỉ hiển thị khi nhúng giấy đó vào nƣớc. Thuật ngữ digital
Watermarking đƣợc cộng đồng thế giới chấp nhận rộng rãi vào đầu thập niên 1990. Khoảng
năm 1995, sự quan tâm đến Watermarking bắt đầu phát triển nhanh. Năm 1996, hội thảo về

che dấu thông lần đầu tiên đƣa Watermarking vào phần trình nội dung chính. Đến năm 1999,
SPIE đã tổ chức hội nghị đặc biệt về Bảo mật và Watermarking trên các nội dung đa phƣơng
tiện.
Cũng trong khoảng thời gian này, một số tổ chức đã quan tâm đến kỹ thuật
Watermarking với những mức độ khác nhau. Chẳng hạn CPTWG thử nghiệm hệ thống
Watermarking bảo vệ phim trên DVD. SDMI sử dụng Watermarking trong việc bảo vệ các
đoạn nhạc. Hai dự án khác đƣợc liên minh châu Âu ủng hộ, VIVA và Talisman đã thử nghiệm
sử dụng Watermarking để theo dõi phát sóng. Vào cuối thập niên 1990, một số công ty đƣa
Watermarking vào thƣơng trƣờng, chẳng hạn các nhà phân phối nhạc trên internet sử dụng
Liqid Audio áp dụng công nghệ của Verance Corporation. Trong lĩnh vực Watermarking
ảnh, Photoshop đã tích hợp một bộ nhúng và bộ dò Watermark tên là Digimarc.
Ngày nay, các công ty chuyên kinh doanh các hệ thống Watermarking đã tăng đáng
kể, dƣới đây là một số ví dụ về các công ty và sản phẩm trong lĩnh vực Watermarking:
Các hệ thống Watermarking âm thanh
Blue Spike, Inc.
Công nghệ Watermarking của Giovanni, Blue Spike có
thể đƣợc dùng để nhận dang, xác nhận và kiểm tra các tài
liệu âm thanh.
Verance Corporation
Verance Corporation - đƣợc sát nhập từ ARIS Technologies,
Inc. (Cambridge, Mass) và Solana Technology
Development Corporation - sở hữu công nghệ
Watermarking đã có bằng sáng chế Musicode® và
Electronic DNA®.
Các hệ thống Watermarking trên ảnh
Signum
Technologies
Một công ty Anh phát triển hệ thống Watermarking
'SureSign' dùng cho bảo vệ bản quyền và hệ thống
'VeriData' dùng để xác thự tính toàn vẹn của các ảnh số.

7

Digimarc
Các công nghệ có bằng sáng chế của Digimarc cho phép dữ
liệu kĩ thuật số đƣợc nhúng trong các tài liệu có giá trị
nhƣ giấy tờ tài chính, thị thực, giúp ngăn chặn giả mạo,
trộm và sử dụng không đƣợc phép khác.
Các hệ thống Watermarking trên phim
Alpha Tec. Ltd. -
AudioMark
Alpha Tec. Ltd. là một công ty Hy Lạp phát triển
AudioMark, gói phần mềm thiết kế cho việc nhúng các
Watermark vào tài liệu âm thanh và phim
MediaSec
Technologies
Cung cấp công cụ SysCoP (System for Copyright Protection)
để nhúng nhãn hiệu tác quyền vào ảnh và phim (MPEG )
Bảng - 1: Các công ty và sản phẩm trong lĩnh vực Watermarking
1.2 Các tiêu chí cần có của một thuật toán Watermarking mạnh mẽ
Tùy thuộc vào từng ứng dụng, kỹ thuật Watermarking có những đòi hỏi khác nhau.
Tuy nhiên có một số yêu cầu chung mà mà hầu hết các ứng dụng thực tế phải đạt đƣợc.
1.2.1 Tính bảo mật
Giống nhƣ trong lĩnh vực mã hóa, tính hiệu quả của một thuật toán không thể dựa vào
giả định là các kẻ tấn công không biết cách mà Watermark đƣợc nhúng vào tài liệu đa phƣơng
tiện. Tuy nhiên, giả định đó lại đƣợc dùng để đánh giá độ an toàn của các sản phẩm thƣơng
mại sử dụng Watermarking có giá trị trên thị trƣờng. Vì vậy với một ứng dụng Watermarking,
một khi biết đƣợc cách làm việc của bộ nhúng và bộ dò, việc làm cho Watermark không đọc
đƣợc thƣờng rất dễ dàng. Hơn nữa một số kỹ thuật sử dụng dữ liệu gốc trong quy trình dò và
thƣờng thì các giải pháp loại này không khả thi trong thực tế.
1.2.2 Tính vô hình

Những nhà nghiên cứu gần đây đã cố nhúng những Watermark bằng cách sao cho nó
không thể đƣợc nhận ra. Tuy nhiên yêu cầu này mâu thuẫn với các yêu cầu khác chẳng hạn
sức chịu đựng và độ an toàn chống sự bền vững chống đƣợc giả mạo đặc biệt là các thuật toán
nén có mất thông tin. Vì mục đích này chúng ta phải khảo sát các tính chất của HVS và
HAS trong quy trình dò Watermark. Các thuật toán nén đƣợc dùng hiện nay cho phép đạt
đƣợc mục tiêu đó, tuy nhiên điều này sẽ không khả thi trong tƣơng lai là do thế hệ của thuật
toán nén tiếp theo có thể thay đổi, cần phải cho các ngƣời quan sát đã qua huấn luyện (ngƣời
đƣợc yêu cầu so sánh phiên bản của tài liệu gốc và tài liệu đƣợc ấn dấu) thấy đƣợc
Watermark. Dĩ nhiên đây không phải là khó khăn trong thực tế vì ngƣời dùng thông thƣờng
không có khả năng so sánh đó.
1.2.3 Tính vô hình đối với thống kê
Watermark không thể dò đƣợc bằng phƣơng pháp thống kê bởi một ngƣởi không
đƣợc phép. Ví dụ nhiều tác phẩm kỹ thuật số đã đƣợc nhúng cùng một Watermark sao cho khi
8

thực hiện tấn công dựa trên thống kê thì không tài nào trích đƣợc Watermark. Một giải pháp
khả thi là sử dụng Watermark phụ thuộc nội dung.
1.2.4 Tỉ lệ bit
Tùy thuộc vào ứng dụng, thuật toán Watermark có thể cho phép một số lƣợng bit cần
ẩn đƣợc định nghĩa trƣớc. Không tồn tại các quy tắc chung, tuy nhiên đối với ảnh thì tối thiểu
300 - 400 bit. Trong bất kỳ trƣờng hợp nào thì nhà thiết kế hệ thống phải nhớ rằng tốt nhất là
không nên giới hạn số lƣợng bit đƣợc nhúng vào dữ liệu.
1.2.5 Quá trình dò đáng tin cậy
Thậm chí khi không có các tấn công cũng nhƣ các biến dạng tín hiệu, khả năng không
dò đƣợc Watermark đã nhúng hoặc dò sai Watermark phải rất nhỏ. Thông thƣờng các thuật
toán dựa trên thống kê dễ dàng thỏa đƣợc các yêu này. Tuy nhiên một khả năng nhƣ vậy phải
đƣợc đƣa lên hàng đầu nếu ứng dụng Watermarking liên quan đến luật pháp vì có nhƣ vây
mới tạo sự tin cậy chắc chắn trong các phán quyết cuối cùng.
1.2.6 Tính bền vững
Việc sử dụng các tín hiệu âm nhạc, hình ảnh và phim dƣới dạng kỹ thuật số thông

thƣờng có liên quan tới nhiều kiểu biến dạng, chẳng hạn nhƣ nén có mất thông tin, hay trong
trƣờng hợp ảnh là các phép lọc, định lại kích thƣớc, cải tiến độ tƣơng phản, phép quay, v.v.
Để Watermarking hữu ích, Watermark phải dò đƣợc ngay khi cả các biến dạng xảy ra. Quan
điểm chung để đạt đƣợc tính mạnh mẽ chống đƣợc các biến dạng tính hiệu là đặt Watermark
vào các phần quan trọng của tín hiệu. Điều này phụ thuộc vào cách xử lý của các thuật toán
nén có mất thông tin (bỏ qua các phần dữ liệu không quan trọng mà không làm ảnh hƣởng đến
chất lƣợng của dữ liệu đƣợc nén. Điều này dẫn đến một Watermark đƣợc ẩn trong các dữ liệu
không quan trọng khó tồn tại khi bị nén. Trong trƣờng hợp Watermarking trên ảnh, sức chịu
đựng với các xử lý hình học (dịch chuyển, định lại kích thƣớc, quay, xén ) thì vẫn là một vấn
đề mở, những thao tác nhƣ vậy rất thông thƣờng và một giải pháp đề ra cần giải quyết đƣợc
trƣớc khi áp dụng Watermark cho bảo vệ tác quyền ảnh.
1.2.7 Nhúng nhiều Watermark
Cần phải cho phép nhúng một tập hợp các Watermark khác nhau trong cùng ảnh bằng
cách sao cho mỗi Watermark có thể dò đƣợc bởi ngƣời dùng đƣợc cấp quyền. Đặc trƣng này
thì hữu dụng trong các ứng dụng dấu vân tay, trong đó thuộc tính tác quyền đƣợc truyền từ
ngƣời sở hữu tác phẩm đến các tác phẩm khác. Hơn nữa chúng ta có thể ngăn ngƣời khác thực
hiện Watermarking cho một tác phẩm đã đƣợc đóng dấu. Trong một số trƣờng hợp việc sửa
một Watermark sau khi nhúng là cần thiết chẳng hạn trong trƣờng hợp của các đĩa DVD, một
con dấu có thể đƣợc dùng để chỉ số lƣợng các bản sao chép đƣợc phép. Mỗi lần một bản sao
chép đƣợc thực hiện con dấu sẽ đƣợc sửa đổi để giảm số. Sự chỉnh sửa có thể thực hiện đƣợc
9

bằng cách xoá bỏ dấu cũ và nhúng dấu mới hoặc là nhúng một dấu mới chồng lên dấu cũ. Khả
năng thứ hai đƣợc chọn lựa nhiều hơn bởi vì một Watermark mà có thể xoá đƣợc thì yếu và
không chịu đựng đƣợc các tấn công giả mạo.
1.2.8 Blind/non-blind, public/private Watermarking
Mối quan tâm đặc biệt là cơ chế sử dụng để khôi phục vết ấn từ ảnh. Trong một số
trƣờng hợp để phát triển một thuật toán mạnh mẽ, Watermark đƣợc trích bằng cách so sánh
các phiên bản đã đƣợc đóng dấu vả chƣa đóng dấu. Trong đó nhiều phƣơng pháp đƣợc đề
xuất chịu đựng đƣợc nhiều kỹ thuật xử lý ảnh và các tấn công có thể nhằm vào việc gỡ

Watermark hay làm cho nó không thể đọc đƣợc. Tuy nhiên thông thƣờng trong thế giới thực,
sự có mặt của ảnh gốc trong quá trình dò không đƣợc bảo đảm, do vậy thuật toán cần ảnh gốc
để hồi phục vết ấn không thích hợp cho nhiều ứng dụng thực tế. Ngoài ra loại thuật toán này
không thể đƣợc dùng cho việc chứng minh quyền sở hữu hoàn toàn trừ khi thỏa một số yêu
cầu phụ khác nhƣ không tựa khả đảo (non-quasi-invertibility) của Watermark, vốn rất khó đạt
đƣợc và hầu nhƣ không thể chứng minh. Các kỹ thuật khôi phục Watermark không cần so
sánh các tín hiệu đƣợc mark và không đƣợc mark thƣờng gọi là oblivious hay blind. Trong
các trƣờng hợp khác thuật ngữ public Watermarking đƣợc dùng để đối lại với private
Watermarking . Thực sự, thuật ngữ public/private Watermarking để chỉ một khái niệm khác:
một kỹ thuật đƣợc gọi là private nếu chỉ có ngƣời sở hữu tài liệu hay ngƣời đƣợc cấp quyền
mới trích Watermark bởi vì anh ta mới là ngƣời có thể truy xuất vào ảnh gốc hoặc anh ta mới
là ngƣời biết khoá chính xác đúng để trích Watermark từ dữ liệu chủ. Trái lại các kỹ thuật mà
cho phép bất kỳ ngƣời nào cũng đọc đƣợc Watermark đƣợc gọi là public. Hầu hết mọi ngƣời
cho rằng các cơ chế private dƣờng nhƣ mạnh mẽ hơn public ở chỗ là mỗi khi Watermark
đƣợc đọc, kỹ thuật public làm cho các kẻ tấn công dễ xóa Watermark hay làm cho Watermark
không đọc đƣợc chẳng hạn bằng cách đảo quy trình nhúng hay bằng cách nhúng một
Watermark đảo (Watermark reversibility). Nói một cách tổng quát trong số các kỹ thuật
Watermarking ảnh đƣợc đề xuất gần đây, các sản phẩm thƣơng mại thƣờng áp dụng các hệ
thống public trong khi các nghiên cứu lại tập trung vào tiếp cận private.
1.2.9 Watermarking đọc đƣợc và dò đƣợc
Một Watermark mà có thể dò đƣợc chỉ nếu nội dung của nó đƣợc biết trƣớc gọi là một
Watermark dò đƣợc. Ngƣợc lại các kỹ thuật cho phép Watermark đọc đƣợc ngay khi nội dung
của nó bỏ qua thì gọi là Watermark đọc đƣợc. Nói cách khác, theo hƣớng tiếp cận dò đƣợc,
ngƣời ta có thể chỉ cần biết một Watermark có tồn tại trong dữ liệu hay không. Nếu một ngƣời
không biết Watermark là gì thì không thể phân tích tài liệu đa phƣơng tiện để tìm ra
Watermark. Điều này không giống với các kỹ thuật đọc đƣợc, trong đó cơ chế nhúng và trích
Watermark đƣợc thực hiện sao cho bất kỳ ai cũng có thể đọc đƣợc Watermark. Dĩ nhiên tính
10

chất đọc đƣợc/ dò đƣợc của Watermark ảnh hƣởng nhiều đến cách mà nó đƣợc sử dụng trong

các ứng dụng thực tế. Ví dụ giả sử có một tình huống trong đó ngƣời ta muốn biết ai là ngƣời
sở hữu của một ảnh mà anh ta đã tìm đã tìm thấy đâu đó trên Internet. Ngoài ra giả sử rằng
Watermark chỉ ra ngƣời sở hữu đã đƣợc nhúng trong ảnh sử dụng kỹ thuật Watermarking dò
đƣợc. Không có cách nào để đọc đƣợc Watermark nếu không thực hiện các giả định về ngƣời
sở hữu có thể, bởi vì nhờ tính chất dò đƣợc của Watermark chỉ có thể xác định ảnh có thuộc
một tác giả cụ thể nào đó (Watermark của anh ta đƣợc biết ) không.
1.2.10 Tính khả đảo và tính thuận nghịch của Watermark
Mặc dù tính mạnh mẽ thƣờng đƣợc chỉ ra nhƣ một yêu cầu chính đƣợc thỏa mãn, mối
quan tâm lớn lại tập trung vào tính khả đảo của Watermark. Thuật ngữ khả đảo đƣợc dùng với
những ý nghĩa khác nhau, nghĩa tự nhiên nhất định nghĩa một Watermark là khả đảo nếu các
ngƣời dùng đƣợc cấp quyền có thể xoá nó khỏi tài liệu. Trong nhiều ứng dụng tính khả đảo
này có thể là một đặc trƣng mong đợi, bởi vì nó có thể cho phép thay đổi tình trạng của một
tài liệu cho trƣớc theo lịch sử của nó mà không cần phải ẩn quá nhiều bit thông tin trong nó.
Tính khả đảo của Watermark còn đƣợc định nghĩa theo cách khác: đó là khả năng làm mất
hiệu lực thừa nhận quyền sở hữu đƣợc hỗ trợ bởi Watermarking bằng cách sử dụng kỹ thuật
công nghệ đảo để đảo lại quy trình Watermarking. Một mô hình Watermarking để đƣợc sử
dụng thành công trong ứng dụng bảo vệ quyền sở hữu, tính không khả đảo của Watermark
phải đƣợc thỏa mãn. Hơn nữa đây chỉ là một điều kiện cần thiết phải thỏa mãn bởi vì tổng
quát hơn tính ngƣời ta cần tính không tựa khả đảo của Watermark hơn. Ở đây thuật ngữ khả
đảo và tựa khả đảo đƣợc hiểu theo nghĩa tự nhiên nhƣ đã nói trên. Không cần đi vào chi tiết,
chúng ta có thể nói rằng một Watermark là khả đảo nếu nó có thể tạo ra một Watermark
ngƣợc (false Watermark) và một tài liệu giả mạo tài liệu gốc mà giống nhƣ tài liệu gốc sao
cho bằng cách nhúng false Watermark vào nó, ta có thể thu đƣợc một tài liệu mà giống hay
gần giống với tài liệu gốc thực sự đã đƣợc đóng dấu. Để tránh việc dùng nhập nhằng thuật
ngữ invertibility, thuật ngữ reversibility đƣợc đề xuất để chỉ rằng một Watermark có thể xóa
khỏi ảnh chủ mỗi khi nội dung của nó đƣợc biết.
1.2.11 Tính có thể thay đổi tỉ lệ (scalability)
Trong các ứng dụng thƣơng mại, chi phí tính toán cho việc nhúng và trích là rất quan
trọng. Trong một số ứng dụng việc chèn vào chỉ có thể thực hiện một lần. Do đó, chi phí
nhúng có thể ít quan trọng hơn là chi phí dò, vốn thƣờng phải xảy ra theo thời gian thực, ví

dụ nhƣ tốc độ giải mã của các frame video. Các yêu cầu tính toán ràng buột một
Watermark phải đơn giản, nhƣng sự đơn giản này có thể giảm trầm trọng tính chịu đựng giả
mạo. Hơn nữa, ngƣời ta biết rằng tốc độ máy vi tính thì cứ tăng xấp xỉ gấp đôi sau 18 tháng,
để mà những gì đƣợc tính toán không thỏa đáng ngày hôm nay có thể nhanh chóng trở thành
11

hiện thực. Do đó ngƣời ta rất mong đợi thiết kế một Watermark mà bộ dò tƣơng thích với mỗi
thế hệ máy vi tính. Ví dụ thế hệ thứ nhất của bộ dò có thể có chi phí tính toán rẻ nhƣng có thể
không đáng tin cậy bằng bộ dò ở thế hệ tiếp theo mà có thể cấp cho nhiều tính toán hơn để xử
lý với các vấn đề chẳng hạn nhƣ các biến dạng hình học.
1.3 Các ứng dụng của Watermarking
Phần này trình bày tất cả các ứng dụng của Watermarking trên hầu hết các tài liệu đa
phƣơng tiện (ảnh, âm thanh, phim), bao gồm:
 ƒ Theo dõi phát sóng (broadcast Watermarking )
 ƒ Nhận ra ngƣời chủ sở hữu (owner identification )
 ƒ Bằng chứng của quyền sở hữu (proof of owner ship )
 ƒ Lƣu vết giao tác hay dấu vân tay (transaction tracking/fingerprinting )
 ƒ Sự xác nhận nội dung (content authentication )
 ƒ Kiểm soát sao chép (copy control )
1.3.1 Theo dõi phát sóng
Trong thực tế, việc phát sóng các đoạn phim hay âm thanh qua các phƣơng tiện thông
tin đại chúng có những nhu cầu nhƣ:
Các nhà quảng cáo muốn chắc chắn rằng đoạn chƣơng trình quảng cáo của họ đƣợc
phát đủ thời gian mà họ đã mua từ các nhà phát sóng.
Các diễn viên tham gia đoạn chƣơng trình quảng cáo đó muốn bảo đảm họ đƣợc trả
tiền bản quyền ứng với thời lƣơng phát sóng từ các công ty quảng cáo.
Những ngƣời sở hữu một đoạn nhạc hay phim không muốn tác phẩm của mình bị xâm
phạm tác quyền qua việc thu và phát sóng lại.
Một cách để giải quyết điều này là sử dụng hệ thống theo dõi tự động thụ động và chủ
động. Hệ thống theo dõi thụ động mô phỏng nhƣ một quan sát viên, nó chứa một máy tính

chuyên theo dõi nội dung phát sóng và so sánh tín hiệu nhận đƣợc với một cơ sở dữ liệu các
tác phẩm biết trƣớc. Lợi điểm của nó là không cần bất kỳ thông tin liên kết vào quá trình phát
sóng, và nhƣ vậy không đòi hỏi bất kỳ sự hợp tác nào với các nhà quảng cáo hay các nhà phát
sóng. Nhƣ vậy có thể áp dụng nó trong các dịch vụ điều tra thị trƣờng nhằm mục đích cạnh
tranh. Khó khăn của hệ thống này là:
+ Thứ nhất, việc so sánh tín hiệu nhận đƣợc với cơ sở dữ liệu không phải chuyện tầm
thƣờng. Về nguyên tắc, cần chia tín hiệu nhận đƣợc thành các đơn vị có thể phân tích đƣợc và
tìm chúng trong cơ sở dữ liệu. Tuy nhiên mỗi frame của video chứa hàng ngàn bit thông tin và
không thực tế chút nào cho quá trình tìm kiếm. Nhƣ vậy hệ thống trƣớc hết phải xử lý tín hiệu
thành những chữ ký nhỏ hơn sao cho vừa đủ để phân biệt với tài liệu khác và phải đủ nhỏ để
lƣu đƣợc trong cơ sở dữ liệu.
12

+ Thứ hai, sự giảm tín hiệu trong quá trình phát sóng là điều không tránh khỏi, nó thay
đổi theo thời gian, tức là sự thu tín hiệu của cùng một nội dung ở các thởi điểm khác nhau có
thể dẫn đến những tín hiệu khác nhau. Vì thế, hệ thống không thể tìm nó chính xác trong cơ
sở dữ liệu mà chỉ có thể tìm dƣới dạng ngƣời láng giềng gần nhất, thực tế phức tạp hơn nhiều.
+ Thứ ba, ngay cả khi vấn đề tìm kiếm đƣợc giải quyết thì việc lƣu trữ và quản lý cơ
sở dữ liệu cũng là vấn đề lớn. Hơn nữa hệ thống phải theo dõi nhiều vị trí địa lý khác nhau
đồng thời, phải truy xuất và giao tiếp cơ sở dữ liệu trung tâm hoặc là lƣu cơ sở dữ liệu cục bộ.
Hệ thống theo dõi chủ động đơn giản hơn về mặt kỹ thuật hơn vì thông tin nhận dạng
đƣợc giải mã trực tiếp, không cần cơ sở dữ liệu để thông dịch nghĩa của nó. Một cài đặt của
hệ thống này là lƣu các mã nhận dạng ở phần đầu file. Khó khăn là ngƣời xử lý trung gian và
ngƣời phân phối cuối cùng không bảo đảm phân phát thông tin đầu file nguyên vẹn. Hơn nữa
dữ liệu khó sống sót với sự chuyển đổi định dạng.
Watermarking là một phƣơng pháp mã hoá thông tin nhận dạng cho theo dõi chủ
động. Nó có thuận lợi là Watermark tồn tại bên trong nội dung tín hiệu phát sóng chứ không
phải chỉ trong một đoạn đặc biệt của tín hiệu và vì thế hoàn toàn thƣơng thích với nền tảng
thiết bị phát sóng đã đƣợc cài đặt bao gồm cả bộ truyền tải digital và analog. Tuy nhiên, qui
trình nhúng dò Watermark phức tạp hơn việc thêm dữ liệu vào đầu file và tìm đƣợc một thuật

toán sao cho chất lƣợng trực quan của nội dung giảm không đáng kể nhƣng lại có độ an toàn
cao cũng là một bài toán thu hút nhiều sự quan tâm nghiên cứu. Nhƣ vậy, bằng cách nhận
dạng những Watermark đƣợc nhúng trong nội dung số, có thể chỉ ra khi nào và ở đâu nội
dung đó đƣợc phát song.
1.3.2 Nhận ra ngƣời chủ sở hữu
Trong thực tế có trƣờng hợp một tác phẩm đã có tác quyền bị sử dụng sai mục đích và
phán quyết của cơ quan luật pháp rất cần thông báo tác quyền trên một hình thức hay vị trí
nào xem đƣợc trên tài liệu đƣợc phân phối. Thông báo tác quyền chúng ta thƣờng thấy trên có
các tài liệu khả kiến là “Copyright ngày ngƣời sở hữu”, “© ngày ngƣời sở hữu” hay “Corp.
ngày ngƣời sở hữu”. Trên các tác phẩm âm thanh các thông báo đó phải đƣợc đặt lên bề mặt
của đĩa vật lý, tên nhãn hay trên bao bì. Dễ thấy rằng, giới hạn của nó là việc nhận dạng ngƣời
sở hữu tác quyền của một tác phẩm không bảo đảm do ngƣời ta không quá khó để loại bỏ nó
ra khỏi một tài liệu khi tiến hành sao chụp lại thậm chí không cần quan tâm rằng đó là một
việc làm sai: Chẳng hạn, một giáo viên chụp một số trang từ quyển sách mà quên chụp luôn
thông báo tác quyền ở trang tiêu đề, một họa sĩ sử dụng một bức hình hợp pháp trong mục
quảng cáo của báo có thể xén đi phần có chứa thông tin tác quyền. Rồi sau đó các công dân
tôn trọng luật pháp muốn dùng tác phẩm có thể không tài nào xác định đƣợc tác phẩm có
đƣợc bảo vệ tác quyền hay chƣa. Một trƣờng hợp khá nổi tiếng là Lena Sjooblom. Đây là ảnh
13

thử thông thƣờng nhất trong lĩnh vực nghiên cứu xử lý ảnh và đã xuất hiện không biết bao
nhiêu mà kể ở các bào báo hội nghị nhƣng không ai tham khảo tên ngƣời sở hữu hợp pháp của
nó, đó là hãng Playboy. Ban đầu nó là một ảnh phóng to lồng giữa các trang của tạp chí
Playboy (Tháng 11- 1972 ). Khi ảnh đƣợc Scan và dùng cho mục đích kiểm thử, hầu hết ảnh
đã bị xén chỉ còn khuôn mặt và vai của Lena. Không may là dòng chữ ghi Playboy là ngƣời
sở hữu cũng bị xén mất. Từ đó ảnh đƣợc phân phối toàn cầu và hầu hết các nhà nghiên cứu
dùng nó trong các bào báo đã không biết rằng chúng là tác quyền của Playboy.
Thứ hai là vấn đề thẩm mỹ, dù chỉ đặt ở một phần của ảnh nhƣng một dòng chữ thông
tin tác quyền có thể làm giảm bớt vẻ đẹp của nó. Với các tài liệu âm thanh hay phim, vì thông
báo tác quyền nằm trên băng đĩa vật lý và bao bì nên sẽ không có thông báo nào đƣợc sao

chép cùng với nội dung của nó.
Do các Watermark có thể vừa không thể nhận thấy vừa không thể tách rời tác phẩm
chứa nó nên chúng là giải pháp tốt hơn dòng chữ đối với việc nhận ra ngƣời sở hữu nếu
ngƣời dùng tác phẩm đƣợc cung cấp bộ dò Watermark. Digimarc cho ảnh là ứng dụng
mà ta đang đề cập. Nó đƣợc tích hợp vào Photoshop. Khi bộ dò của Digimarc nhận ra một
Watermark, nó liên lạc với cơ sở dữ liệu trung tâm trên Internet và dùng thông điệp
Watermark nhƣ một khóa để tìm thông tin liên lạc cho ngƣời sở hữu ảnh. Tính hợp pháp của
một ứng dụng nhƣ vậy chƣa đƣợc thừa nhận bởi cơ quan pháp luật nhƣng nó giúp những
ngƣời lƣơng thiện dễ dàng tìm ra ngƣời họ muốn liên lạc để dùng ảnh. Nhƣ vậy, nhúng thông
tin của ngƣời giữ tác quyền của một tác phẩm nhƣ là một Watermark.
1.3.3 Bằng chứng về quyền sở hữu
Watermark không chỉ đƣợc dùng để chỉ ra thông tin tác quyền mà còn đƣợc dùng để
chứng minh tác quyền. Thông tin tác quyền có thể dễ bị giả. Chẳng hạn, giả sử A tạo một ảnh
và post lên mạng với thông tin tác quyền “© 2003 A”. Một tên trộm (B) lấy ảnh đó, dùng
chƣơng trình xử lý ảnh để thay thông tin tác quyền đó bằng “© 2003 B” và sau đó tự cho là
anh ta là ngƣời sở hữu. Vậy giải quyết tranh luận ra sao. Nếu A đã đăng ký bản quyền tác
phẩm của mình với một cơ quan pháp luật và gửi cho họ ảnh gốc khi vừa mới tạo ra nó thì
không có vấn đề gì. Tuy nhiên nếu A không làm việc đó vì chi phí tốn kém thì A phải đƣa ra
bằng chứng chứng tỏ mình đã tạo ra ảnh. Chẳng hạn, là một tấm phim nếu ảnh đƣợc chụp, là
một bản phát thảo nếu đó là một bức họa. Vấn đề là B cũng có thể ngụy tạo bằng chứng. Tệ
hơn nữa là nếu ảnh đƣợc chụp bằng kỹ thuật số thì chẳng có phim âm bản cũng nhƣ bản phát
thảo.
A có thể nào bảo vệ quyền lợi của mình mà không phải tốn phí đăng ký bằng cách áp
dụng Watermark vào ảnh của mình? Nếu A dùng Digimarc, vấn đề không đƣợc giải quyết vì
bộ dò cũng đƣợc kẻ trộm biết. Về lý thuyết, ai dò đƣợc Watermark đều có thể xoá bỏ nó. Do
14

đó B có thể dùng bộ dò Digimarc, gỡ Watermark của A và thay vào đó Watermark của mình.
Để đạt đƣợc mức bảo mật trong bằng chứng tác quyền, cần giới hạn tính khả dụng của bộ dò.
Đối với kẻ trộm không có một bộ dò, việc bỏ Watermark thì rất khó khăn phức tạp. Nhƣ thế

khi A và B ra tòa, A dùng ảnh gốc và ảnh tranh cãi đƣa vào bộ dò và bộ dò sẽ cho ra
Watermark của A. Tuy nhiên cũng có một dạng hệ thống Watermarking mà B có thể dùng và
làm nhƣ thể Watermark của B nằm trong bản gốc ảnh của A. Tấn công đƣợc gọi là tấn công
đảo (inversion attack) hay tấn công khóa chết (dead lock attack). Không có cách gì để giải
quyết quyền sở hữu bản quyền trong trƣờng hợp này và tòa cũng không thể biết A hay B có
ảnh gốc thực sự. Điều này cho thấy rằng chỉ với một mình Watermark mà không có một nghi
thức khác hỗ trợ nó thì sẽ không đủ để giải quyết tình huống bản quyền này.
Bài toán có thể đƣợc giải quyết nếu ta thay đổi phần phát biểu nó: Thay vì cố chứng
minh trực tiếp quyền sở hữu bằng cách nhúng một Watermark “A sở hữu ảnh này”, ta nên cố
chứng minh một ảnh bắt nguồn từ ảnh khác. Một hệ thống nhƣ vậy cung cấp một bằng chứng
gián tiếp rằng khả năng ảnh tranh cãi là của A cao hơn B, trong đó A là ngƣời có phiên bản
mà từ đó hai ảnh khác tạo ra.
1.3.4 Lƣu vết giao tác hay dấu vân tay
Trong ứng dụng này, Watermark lƣu lại một hay nhiều giao dịch đã xảy ra trong
những lần sao chép tác phẩm đã có nhúng Watermark. Ví dụ, Watermark có thể lƣu tên ngƣời
mua trong mỗi lần mua bán hợp pháp hay phân phối. Ngƣời sở hữu và ngƣời tạo ra tác phẩm
có thể dùng những Watermark khác nhau trong mỗi bản sao. Nếu tài liệu bị dùng sai mục đích
(phát hành hay phân phối trái phép ) ngƣời sở hữu có thể tìm ra ngƣời có trách nhiệm.
Một giải pháp thông thƣờng cho Watermarking áp dụng cho lƣu vết giao tác là dùng
các Watermark hữu hình, chẳng hạn các tài liệu thƣơng mại đƣợc in có background có chứa
các số lớn hơn màu xám, với mỗi bản sao sẽ chứa một số khác.
Một ví dụ khác có sử dụng Watermarking cho việc theo dõi giao tác đã đƣợc cài đặt
bởi DiVX Corporation. DiVX bán một DVD player triển khai theo mô hình kinh doanh pay-
per-view. Họ cài đăt nhiều kỹ thuật để ngăn giả mạo đĩa của họ, một trong số đó là
Watermark đƣợc thiết kế cho lƣu vết giao tác. Mỗi DVD player phải đặt một Watermark duy
nhất vào mỗi video mà nó chiếu. Nếu ai đó thu lại đoạn video và bán các bản sao, DiVX có
thể lấy đƣợc bản copy đó và tìm ra kẻ phản bội bằng cách giải mã Watermark.
Một ví dụ khác là trong phân phối các nhật báo phim. Suốt quá trình thực hiện một
phim, kết quả các bức hình mỗi ngày đƣợc phân phối cho nhiều ngƣời có tham gia vào phim.
Nhƣng những nhật báo này đƣợc yêu cầu giấu bí mật, không muốn bị lộ ra ngoài. Gặp trƣờng

hợp này, trƣờng quay nhanh chónh xác định đƣợc ngƣời đã làm rò rỉ thông tinh. Trƣờng quay
15

có thể dùng đoạn văn hữu hình ở góc màn hình để xác định mỗi bản sao của ảnh. Tuy nhiên,
các Watermark đƣợc chuộng hơn vì đoạn văn bản dễ bị xóa đi.
1.3.5 Xác nhận nội dung
Các tác phẩm kỹ thuật số ngày nay đứng trƣớc nguy cơ bị làm giả nhiều hơn, dễ dàng
hơn và tinh vi hơn. Nếu ảnh là một bằng chứng quan trọng trong điều tra của cảnh sát, sự giả
mạo có thể gây ra nhiều vấn đề nghiêm trọng.
Bài toán xác nhận thông điệp đã đƣợc nghiên cứu rộng rãi trong lĩnh vực mã hóa
(crytography). Một tiếp cận mã hóa thông thƣờng cho bài toán này là tạo ra một chữ kí điện
tử. Thuật toán đƣợc dùng là mã hóa khoá bất đối xứng. Chỉ có tác giả thông điệp mới biết
khoá cần để tạo ra các chữ ký. Do vậy, kẻ trộm cố thay đổi thông điệp thì sẽ không tạo ra
đƣợc một chữ ký mới. Nếu khi tiến hành so sánh, thông điệp đƣợc sửa đổi khác với chữ ký
gốc, ta có thể khẳng định thông điệp đã bị sửa. Chữ ký điện tử đã đƣợc áp dụng cho các
camera kỹ thuật số bởi Fredman, ngƣời gợi ý tạo ra một máy ảnh có chữ ký bên trong. Khóa
để tạo chữ kí chỉ có trong máy ảnh mà thôi.
Chữ ký dạng nhƣ vậy chung qui là một dạng dữ liệu meta đƣợc đi kèm với tài liệu mà
chúng xác nhận. Điều này cho thấy rất dễ làm mất các chữ ký. Chẳng hạn một hệ thống xác
nhận ảnh lƣu dữ liệu meta vào phần vào phần đầu (header) của ảnh JPEG. Nếu ảnh đƣợc
chuyển sang dạng khác, chữ ký sẽ bị mất và dĩ nhiên tài liệu không còn đƣợc chứng thực nữa.
Một giải pháp hay là những chữ ký trực tiếp vào tài liệu dùng kỹ thuật Watermarking.
Epson đề ra một hệ thống nhƣ vậy trên nhiều máy ảnh kỹ thuật số của hãng. Ta gọi chữ ký
này là chữ kí xác nhận (authentication mark). Chữ kí xác nhận đƣợc thiết kế sao cho trở nên
sai lệch dù chỉ gặp sự chỉnh sửa nhỏ nhất đƣợc gọi là các Watermark dễ vỡ (fragile
Watermark).
Mối lo ngại về việc các chữ ký có trong tài liệu hay không giờ đây đã bị loại trừ. Điều
quan tâm lúc này là việc nhúng Watermark cần bào đảm không thay đổi tài liệu nhiều quá để
nó còn đúng khi so sánh với chữ ký. Điều này có thể thực hiện đƣợc bằng cách xem tài liệu
thành hai phần : Một dùng cho việc tính toán bằng chữ ký, một dùng cho việc nhúng chữ ký.

Ví dụ, nhiều tác giả đề xuất tính toán một chữ ký từ các bit cao của ảnh và nhúng chữ ký vào
các bit thấp của ảnh.
Nếu một tài liệu có chứa chữ kí xác nhận bị thay đổi, chữ kí xác nhận cũng thay đổi
theo. Điều này mở ra một hƣớng nghiên cứu mới là tìm hiểu tài liệu đã bị giả mạo nhƣ thế
nào. Chẳng hạn nếu một ảnh đƣợc chia làm nhiều khối, mỗi khối có một chữ kí xác nhận,
chúng ta dễ phát thảo ra phần nào của ảnh nguyên trạng và phần nào bị chỉnh sửa.
Một ví dụ rất hay đƣợc áp dụng trong điều tra tội phạm của cảnh sát, sử dụng chữ kí
xác nhận khoanh vùng (localized authentication). Cảnh sát nhận đƣợc một đoạn phim theo dõi
16

đã bị giả mạo. Nếu đoạn phim này dùng các chứng thực chữ ký truyền thống, dễ thấy rằng họ
biết phim bị giả mạo và không tin bất cứ điều gì trong phim. Tuy nhiên nếu dùng một
Watermark theo kiểu xác nhận khoanh vùng , họ có thể khám phá rằng trong các khung
(frame) của phim vẫn có chỗ tin cậy. Nhƣ vậy kẻ có liên quan đến tội ác đã bị gỡ bớt các
frame có dấu vết của hắn.
Khi kiểm tra một chữ kí xác nhận đã bị sửa đổi ta cũng có đƣợc thông tin “Liệu nén có
mất có đƣợc áp dụng vào tài liệu hay không”. Hầu hết các thuật toán nén ảnh có mất đều áp
dụng sự lƣợng tử hóa, chính điều này đã để lại các thay đổi thống kê trong một Watermark và
có thể nhận diện đƣợc.
1.3.6 Kiểm soát sao chép
Các ứng dụng đã đề cập ở trên hầu hết có tác dụng sau khi có ai đó làm sai. Chẳng hạn
theo dõi phát sóng giúp phát hiện nhà phát sóng bất lƣơng đã ăn chặn tiền sau khi biết họ đã
phát sóng không đúng thời lƣợng. Còn lƣu vết giao tác chỉ ra kẻ phản bội sau khi họ đã làm lộ
và phân phối các bản sao bất hợp pháp. Các kỹ thuật này có tể nói là chữa bệnh chứ không
phòng bệnh. Rõ ràng là sẽ tốt hơn nếu ngăn ngay từ đầu những hành vi bất hợp pháp, nhƣ vậy
một ứng dụng kiểm soát sao chép ngăn không cho tạo các bản sao bất hợp pháp từ nội dung
đã có bản quyền.
Mã hóa cũng có thể dùng để cài đặt cho ứng dụng dạng này. Tài liệu đƣợc mã hóa với
một khóa duy nhất, nếu không có khóa thì không dùng đƣợc. Tuy nhiên khóa này đƣợc cung
cấp theo kiểu khó mà sao chép hay phân phối lại (nhằm hạn chế thếp nhất khả năng khách

hàng cho khóa của họ cho ngƣời khác xài miễn phí). Ví dụ, nhiều sóng TV đƣợc mã hóa, khóa
giải mã đƣợc tích hợp vào một thẻ thông minh (smart card) cho các khách hàng nào trả tiền.
Thẻ thông tin đƣợc giấu vào hộp antene của TV. Nếu ai đó cố tình xem hay thu sóng mà
không có thẻ thông minh card chắc chắn chỉ thấy hình nhiễu. Điều đáng quan tâm là mã hóa
không thực sự giải quyết tốt ứng dụng này, vì chúng dễ bị phá bằng ba cách sau: Thứ nhất, cố
giải mã tín hiệu với hàng triệu trƣờng hợp khóa có thể. Tuy nhiên nếu khóa ≥ 50 bit thì điều
này không thực hiện đƣợc. Thứ hai, dùng công nghệ đảo phần mềm hay phần cứng chứa
khóa. (Giống nhƣ crack phần mềm). Ví dụ nhƣ chƣơng trình DeCSS của Jon Johanasen và
hai cộng sự ngƣời Đức. CSS (Content Scrambling System ) là hệ thống mã hoá dùng để
chống ghi DVD bất hợp pháp. Jon đã dùng công nghệ đảo áp dụng cho một đầu đọc DVD và
tìm khóa giải mã của nó. Sau đó bất kỳ video nào đã đƣợc mã hóa cũng có thể đƣợc giải mã.
Cách thứ ba là trả tiền để có một khóa rồi sao chép nội dung đã đƣợc giải mã. Một kẻ trộm
muốn thu và phát lại sóng vệ tinh chỉ cần đăng ký là khách hàng, mua một thẻ thông minh,
nối đầu đọc với đầu thu, cứ thể thu lại nội dung đã đƣợc giải mã. Ví dụ này chỉ ra yếu kém
17

chính của bảo vệ nội dung sử dụng mã hóa: Một nội dung muốn dùng đƣợc cần phải giải mã,
khi đã đƣợc giải mã rồi, tất cả các bảo vệ coi nhƣ không còn.
Điều chúng ta cần là làm sao cho dữ liệu media xem đƣợc nhƣng vẫn ngăn không cho
thu lại. Một kỹ thuật làm đƣợc điều này, trong trƣờng hợp video NTSC đó là quy trình chống
sao chép videocassette của Marovision. Quy trình này sửa tín hiệu video sao cho làm rối loạn
điều khiển trên VCRs. Tín hiệu thu đƣợc có thể xem tốt trên TV nhƣng với VCR nó sẽ tạo ra
những thứ kông thể xem đƣợc. Tuy nhiên, kỹ thuật này chỉ áp dụng cho tím hiệu TV tuần tự ,
không đƣợc cho audio và các kiểu tín hiệu số khác. Do vậy mặc dù hệ thống của Macrovision
thích hợp để chống thu video bất hợp pháp bằng VCRs, nó lại không dùng đƣợc cho đầu
DVDs, VCRs số, hay các kỹ thuật thu video số khác.
Do các Watermark đƣợc nhúng trong nội dung nên chúng có mặt khi có nội dung và
nhƣ vậy nó cung cấp một phƣơng pháp tốt hơn để cài đặt các ứng dụng kiểm soát sao chép.
Nếu mọi thiết bị thu đƣợc gắn bộ dò Watermark , việc thu có thể bị các thiết bị thu ngăn cản
khi chúng dò ra một Watermark dạng nhƣ “không đƣợc chép”. Một hệ thống nhƣ vậy đã

đƣợc “Copy protection Technical Working Group” (CPTWG) dùng cho đầu video DVD và
SDMI dùng cho audio.
Vấn đề đặt ra là làm sao bảo đảm rằng mọi đầu thu chứa bộ dò Watermark. Chẳng có
động lực tự nhiên nào để các nhà sản xuất đầu thu lại bỏ thêm chi phí để tích hợp bộ dò vào
sản phẩm của họ. Trong thực tế, theo cách nhìn của khách hàng thì bộ dò Watermark chỉ làm
chỉ làm giảm giá trị của đầu thu vì dĩ nhiên họ muốn thiết bị của mình có thể sao chép đƣợc
bất kì tài liệu nào họ muốn (Cho dù điều đó là không hợp pháp).
Giải pháp trực tiếp cho vấn đề này đòi hỏi luật quy định các đầu thu phải có bộ dò
Watermark. Tuy nhiên, cho đến bây giờ thì chƣa có luật nào nhƣ vậy, và thỏa yêu cầu đó là cả
một vấn đề vì nó cần sự tham gia tất cả các quốc gia. Vì lẽ này, CPTWG và SDMI đều không
phụ thuộc luật nói trên. CPTWG và SDMI đƣa ra yêu cầu vào cam kết tác quyền là “Nhà sản
xuất đầu thu nào sử dụng kỹ thuật của họ phải có bộ dò”. Cách tiếp cận này phù hợp ở chỗ nó
dƣa trên những luật đã có sẵn trên hầu hết các nƣớc. Bất lợi của nó là nó cho phép nhà sản
xuất tạo ra bộ thu không chứa bộ dò Watermark khi họ không dùng kỹ thuật có đề cập yêu
cầu đó. Một giải pháp dung hòa là cho phép lƣu hành cả hai hai loại thiết bị (có và không cài
Watermarking): Chẳng hạn, đầu đọc không cài Watermarking chỉ đọc đƣợc các bản sao chép
đƣợc đã đƣợc giải mã mà không đọc đƣợc các bản sao chép chƣa đƣợc giải mã, và khi đã đọc
đƣợc thì nó có thể đƣợc thu tiếp bằng đầu thu không cài Watermarking.Đầu đọc có
Watermarking đọc đƣợc các bản sao chép có mã hóa, không đọc đƣợc bản sao đã qua giải mã,
và khi đã đọc đƣợc thì nó có thể đƣợc thu tiếp bằng đầu thu không cài Watermarking. Nhƣ
vậy lợi và hại của mỗi thiết bị có thể để khách hàng cân nhắc lựa chọn và hy vọng những công
18

dân có ý thức pháp luật và tôn trọng quyền sở hữu trí tuệ sẽ sử dụng loại có cài Watermarking
nhiều hơn.
Từ các phân tích ở trên, có thể thấy rằng Watermarking giải quyết các bài toán về ẩn
giấu thông tin linh hoạt hơn những phƣơng pháp truyền thống khác chẳng hạn nhƣ mã hóa
nhờ lợi thế thông tin nhúng nằm kèm theo trong tài liệu chủ. Đó là các ứng dụng chung của
Watermarking trên các tài liệu đa phƣơng tiện, riêng đối với ảnh số, bảo vệ bản quyền và xác
nhận nội dung là hai ứng dụng khả thi nhất, quan trọng nhất mà ảnh số có thể áp dụng đƣợc

và sẽ đƣợc nghiên cứu và phân tích sâu trong các chƣơng sau.
19

CHƢƠNG 2. CÁC MÔ HÌNH WATERMARKING, CÁC THUẬT TOÁN
Các mô hình Watermarking hiện nay chia làm hai nhóm: thứ nhất là các mô hình dựa
trên quan điểm xem Watermarking nhƣ một phƣơng thức truyền thông, và các mô hình dựa
trên quan điểm hình học.
2.1 Mô hình trên quan điểm Watermarking nhƣ một dạng truyền thông
Có 3 loại và chúng khác nhau ở cách tích hợp của tài liệu chủ vào trong hệ thống.
2.1.1 Mô hình cơ bản
Trong mô hình này, tài liệu chủ đƣợc xem nhƣ nhiễu đƣợc thêm vào trong suốt quá
trình truyền tín hiệu Watermark.

Hình - 1: Bộ dò không cần ảnh gốc


Hình - 2: Bộ dò cần ảnh gốc
20

Không quan tâm bộ dò ở đây là blind hay non-blind, qui trình nhúng bao gồm hai
bƣớc:
Trƣớc hết, thông điệp đƣợc ánh xạ thành một mẫu thêm (added pattern) wa có cùng
kiểu và kích thƣớc với ảnh chủ c0. Ví dụ, trong Watermarking ảnh, bộ nhúng tạo ra một mẫu
các pixel hai chiều cùng kích thƣớc với ảnh chủ gốc. Sự ánh xạ này đƣợc thực hiện với một
khóa Watermark. Các mẫu thêm thƣờng đƣợc tính qua nhiều bƣớc. Với các mẫu định nghĩa
sẵn và có thể phụ thuộc vào khóa, gọi là mẫu tham khảo (reference pattern) wr0, wr1, wr2,
chúng ta liên kết chúng lại để tạo ra một mẫu mã hóa, ta gọi là mẫu thông điệp (message
pattern), wm. Mẫu thông điệp này sau đó đƣợc chỉnh sửa hay thay đổi tỉ lệ để thu đƣợc mẫu
thêm.Sau đó, wa đƣợc thêm vào tài liệu chủ, c0, để tạo tài liệu đƣợc Watermark
(Watermarked Work), cw.

Sau khi mẫu thêm đƣợc nhúng, giả sử tài liệu đƣợc Watermark cw bị thay đổi vì một
xử lý nào đó, ta mô hình hóa hiệu ứng xử lý này bằng một nhiễu cộng. Các kiểu xử lý có thể
gồm: Nén, giải nén, phát sóng qua các kênh tuần tự, cải thiện ảnh hay âm thanh… hay một xử
lý bất kì của kẻ trộm nhằm gỡ bỏ Watermark…
2.1.2 Mô hình Watermarking truyền thông với thông tin phụ ở bộ trung chuyển
Tài liệu chủ vẫn đƣợc xem là một nhiễu, nhƣng qui trình nhúng Watermark cần đƣợc
cung cấp thêm ảnh chủ đó với vai trò là thông tin phụ. Thông tin phụ (side information) là
thông tin đƣợc cung cấp cho bộ trung chuyển hoặc bộ nhận trong một hệ thống truyền thông,
khác với thông điệp đƣợc chuyển hay tín hiệu nhận đƣợc cần giải mã. Trong mô hình
Watermarking này, chúng ta xem ảnh chủ là một thông tin phụ đối với bộ nhúng.
Trong mô hình trƣớc, giới hạn của nó là vết Watermark đƣợc mã hóa độc lập với tài
liệu chủ co, điều này không tận dụng triệt để ảnh gốc. Nếu ta cho phép bộ mã hóa Watermark
kiểm tra co trƣớc khi mã hóa mẫu thêm thì ta sẽ có thuật toán nhúng hiệu quả hơn.
21


Hình - 3: Mô hình Watermarking theo quan niệm truyền thông với thông tin phụ ở bộ trung
chuyển
2.1.3 Mô hình Watermarking theo quan niệm truyền thông đa công
Ở sơ đồ này, ảnh chủ không còn đƣợc xem là một phần của kênh truyền mà là thông
điệp thứ hai đƣợc truyền đi cùng với thông điệp Watermark trong cùng tìn hiệu cw. Hai thông
điệp co và m sẽ đƣợc dò và giải mã bởi 2 nguồn nhận rất khác nhau: con ngƣời và bộ dò
Watermark. Bộ nhúng Watermark liên kết m và co trong một tín hiệu đơn, cw , tƣơng tự nhƣ
việc truyền nhiều thông điệp trên 1 đƣờng dây trong truyền thông truyền thống nhƣ chia thời
gian (time - division) , chia tần (frequency - division) hay chia mã (code - division) đa công
(code division multiplexing là truyền nhiều thông điệp trên 1 kênh đơn bằng cách thay chúng
bằng các tín hiệu trực giao chồng lên nhau theo thời gian, không gian, tần số.

Hình - 4: Mô hình Watermarking theo quan niệm truyền thông đa công
22


Tuy nhiên, điểm khác biệt là: Trong truyền thông truyền thống, kỹ thuật cơ bản dùng
cho các thông điệp khác nhau thì giống nhau, các thông điệp đƣợc phân biệt nhau nhờ một
tham số đơn (thời gian, tần số, dãy mã).Trong Watermarking: 2 thông điệp đƣợc phân biệt
bằng hai kỹ thuật khác nhau: dò Watermark và cảm nhận của con ngƣời. Tƣơng ứng ta nói là:
một thông điệp đƣợc chia tần và một thông điệp đƣợc mã hóa phổ rộng (frequency division -
spread spectrum coding). Khi xem cwn, con ngƣời nhận đƣợc một thứ gì đó gần với ảnh chủ
không dính dáng gì vào Watermark. Khi dò 1 Watermark trong cwn , bộ dò cần lầy thông
điệp Watermark, không dính dáng gì đến ảnh chủ. Riêng đối với bộ dò informed, ảnh chủ gốc
đƣợc cần đến nhƣng với vai trò là một tham số thứ 2.
2.2 Mô hình dựa trên quan điểm hình học
Quan điểm Watermarking hình học xem các tài liệu là các điểm trong không gian đa
phƣơng tiện (media space) nhiều chiều. Khi phân tích các thuật toán phức tạp hơn, ta cần
chiếu hay làm biến dạng không gian đó thành không gian nhúng.
2.2.1 Các phân phối và miền trong không gian đa phƣơng tiện
Trong không gian đa phƣơng tiện có những phân phối xác suất và vùng sau: Phân phối
các tài liệu chƣa đƣợc nhúng Watermark (distribution of unWatermarked works) tƣợng trƣng
cho mỗi tài liệu.Vùng tƣơng tự cảm nhận đƣợc giữa ảnh gốc và ảnh qua xử lý có thể chấp
nhận (Region of acceptable fidelity) là vùng trong đó tất cả các tài liệu đều là ứng viên tiềm
năng của một tài liệu cho trƣớc. Vùng dò (Detection region) tƣợng trƣng cho cách làm việc
của thuật toán dò. Phân phối nhúng hay vùng nhúng (Embedding distribution/embedding
region) thể hiện hiệu quả của một thuật toán nhúng. Phân phối biến dạng (Distortion
distribution) thể hiện cách mà tài liệu bị làm biến dạng trong quá trình sử dụng.
2.2.2 Mô hình Watermarking trong không gian nhúng
Phần lớn các bộ dò Watermark thƣờng đƣợc thiết kế để áp dụng đƣợc trên không gian
nhúng (marking space), đó là một không gian thu hẹp của không gian đa phƣơng tiện qua
phép chiếu hoặc phép biến hình.

Hình - 5: Bộ dò trong mô hình Watermarking theo quan niệm hình học trên không gian nhúng
23


Nhƣ hình trên, bộ dò nhƣ vậy chứa một qui trình gồm 2 bƣớc:
+ Bƣớc 1: Trích Watermark
Áp dụng một hay nhiều tiền xử lý cho tài liệu gốc chẳng hạn biến đổi tần số
(frequency transform), lọc (filtering) , trung bình khối (block averaging) , căn mép tạm hay
hình học (geomatric or temporal registration) và trích đặc trƣng (feature extraction). Kết quả
thu đƣợc một vec tơ (một điểm trong không gian nhúng) có chiều nhỏ hơn chiều của vec tơ
ban đầu. Chúng ta gọi vec tơ này là vết trích. (extracted mark)
+ Bƣớc 2 : Xác định xem vết trích có chứa Watermark không và nếu có thì giải mã
thông điệp đƣợc nhúng. Điều này đòi hỏi phải đi so sánh vết trích với một hay nhiều vết tham
khảo đƣợc định nghĩa trƣớc (reference mark) . Bƣớc 2 có thể là một bộ dò Watermark đơn
giản thực hiện trên các vec tơ trong không gian nhúng. Đối với các bộ nhúng Watermark
thƣờng thì chúng không đƣợc thiết kế để dùng trong không gian nhúng nhƣng trên thực tế vẫn
có thể thực hiện đƣợc.

Hình - 6: Bộ nhúng trong mô hình Watermarking theo quan niệm hình học trên không gian
nhúng
Một bộ dò nhúng nhƣ vậy chứa một quy trình 3 bƣớc nhƣ hình:
+ Bƣớc 1: Tƣơng tự bƣớc trích trong bộ dò Watermark ở trên.
+ Bƣớc 2: Chọn 1 vec tơ mới trong không gian nhúng gần với vết trích và hy vọng
rằng vec tơ này đƣợc dò có chứa Watermark. Vec tơ mới này ta gọi là vết thêm (added mark).
Bƣớc 2 này có thể xem nhƣ bộ nhúng Watermark đơn giản thực hiện trong không gian nhúng.
+ Bƣớc 3: Đảo ngƣợc quy trình trích, chiếu vec tơ mới trở lại không gian đa phƣơng
tiện để thu đƣợc tài liệu đƣợc Watermark. Nếu không gian nhúng có cùng chiều với không
gian đa phƣơng tiện, phép chiếu có thể đƣợc thực hiện theo cách ánh xạ 1:1. Tuy nhiên, nếu
24

không gian nhúng có chiều nhỏ hơn không gian đa phƣơng tiện, mỗi điểm trong không gian
nhúng phải tƣơng ứng với không gian đa phƣơng tiện. Do vậy, việc tìm một tài liệu sẽ nhận
vec tơ mới nhƣ một vết trích cho ta nhiều tài liệu khác nhau thỏa nhƣ vậy. Nói một cách lý

tƣởng là, ta tìm một tài liệu mà đƣợc cảm nhận là gần với tài liệu gốc nhất. Trong thực tế, ta
dùng một thuật toán xấp xỉ , tức là không cho ta tài liệu gần nhất mà cho tài liệu phải chăng
nhất.
Trong 2 sơ đồ trên, mục tiêu của hàm extraction là nhằm giảm chi phí nhúng và dò.
Thêm nữa là nhằm đơn giản hóa phân phối của những tài liệu không có Watermark, vùng
tƣơng tự cảm nhận đƣợc giữa ảnh gốc và ảnh qua xử lý có thể chấp nhận, và phân phối biến
dạng để cho các thuật toán Watermarking đƣợc thực hiện tốt.
2.3. Các thuật toán Watermarking và phân loại
Gần đây, một số thuật toán Watermarking đã đƣợc triển khai để hỗ trợ việc bảo vệ bản
quyền ảnh số và xác minh tính toàn vẹn của dữ liệu đa phƣơng tiện. Hầu hết các thuật toán
Watermarking biến đổi ảnh chủ thành một miền nào đó thuận tiện cho việc nhúng thông tin
của Watermark, làm sao để nó vừa có độ an toàn cao, vừa vô hình. Các biến đổi thƣờng dùng
để làm việc này là DFT, DCT và mới đây là DWT.
Phân loại: Nhìn chung, các thuật toán Watermarking có thể đƣợc phân loại nhƣ sau:
 Theo miền nhúng/trích:
o Miền không gian
o Miền biến đổi cosine rời rạc (DCT)
o Miền biến đổi Fourier rời rạc (DFT)
o Miền biến đổi wavelet rời rạc (DWT)
o Các miền hỗn hợp khác, ví dụ: miền fractal, miền Fourier-Mellin, đặc tả
Histogram, miền biến đổi wavelet phức (CWT), …
 Theo dữ liệu cần tham chiếu (thƣờng là ảnh gốc) khi trích Watermark:
o Không tham chiếu dữ liệu (blind)
o Tham chiếu dữ liệu tƣơng đối (semi-blind)
o Tham chiếu dữ liệu hoàn toàn (non-blind)
 Theo cách sửa đổi dữ liệu ảnh chủ:
o Cộng tuyến tính tín hiệu tán phổ
o Hợp nhất ảnh (ví dụ nhúng một logo)
o Lƣợng tử và thay thế phi tuyến
 Theo mô hình cảm quan

o Không có mô hình
o Mô hình ẩn qua các thuộc tính miền biến đổi
25

o Mô hình HVS tƣờng minh
 Theo mục đích của ứng dụng Watermarking
o Bảo vệ bản quyền, theo dõi việc phát hành
o Xác minh dữ liệu ảnh, xác nhận và phát hiện giả mạo
o Ẩn dữ liệu và gắn nhãn ảnh
ƒ …
 Theo kiểu dữ liệu đa phƣơng tiện chủ:
o Ảnh tĩnh
o Video
o Các định dạng đa phƣơng tiện khác nhƣ: ảnh hoạt họa, ảnh bản đồ, …
Trong các cách phân loại đó, một trong những cách đƣợc quan tâm nhất là cách bổ
sung dữ liệu Watermark vào ảnh chủ. Có 2 loại nhúng chủ yếu hay đƣợc đề nghị:
1. Nhúng cộng tuyến tính
 Chuỗi Gauss
 Hợp nhất ảnh
2. Nhúng lượng tử phi tuyến
 Lƣợng tử vô hƣớng
 Lƣợng tử hữu hƣớng (vector)
Đặc điểm của nhúng cộng là việc sửa đổi tuyến tính ảnh chủ và xử lý tƣơng quan
trong lúc dò, còn nhúng lƣợng tử thực hiện các sửa đổi phi tuyến và dò tìm thông điệp nhúng
bằng cách lƣợng tử hóa các mẫu thu đƣợc để ánh xạ chúng vào trong điểm tái tạo gần nhất.

×