Tải bản đầy đủ (.doc) (40 trang)

Tìm hiểu về kỹ thuật Watermarking trong truyền thông đa phương tiện

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (663.23 KB, 40 trang )

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN ĐÀO TẠO SAU ĐẠI HỌC
  
BÁO CÁO ĐỀ TÀI TIỂU LUẬN
MÔN HỌC: TRUYỀN THÔNG ĐA PHƯƠNG TIỆN
Đề tài:
“Tìm hiểu về kỹ thuật Watermarking trong truyền thông đa phương tiện”
Giảng viên: PGS.TS. Nguyễn Hoàng Lan – Viện CNTT&TT
Học viên: Nguyễn Văn Tánh
MSHV: CB110416
Lớp: 11BMTTT.KH
Ngành: Kỹ thuật máy tính và truyền thông
Hà Nội, 05/2012
LỜI MỞ ĐẦU
Ngày nay, bên cạnh những ích lợi to lớn,
thiết thực mà mạng máy tính đem
lại, chúng ta cũng đang đối đầu với những thử thách liên quan đến các vấn đề
truyền thông bảo mật và đặc biệt là vấn đề phân phối các tài liệu đa phương tiện sao
cho bảo đảm quyền sở hữu trí tuệ. Tình trạng sao chép bất hợp pháp, giả mạo các
tác phẩm số hóa gây bức xúc không chỉ riêng các tác giả mà còn cho cả những
người làm pháp luật.
Những hành vi xâm phạm bản quyền
như
giả mạo, ăn cắp tác
phẩm, sử dụng các tác
phẩm
không có bản quyền… đang trở nên phổ biến và
ngày
càng tinh vi.
Tuy nhiên với các phương pháp bảo vệ dữ
liệu


truyền thống như mã
hoá, sử dụng khóa đều
không
đem lại hiệu quả cao trong tình hình hiện nay. Các
loại truyền t hông đa phương tiện như âm th a n h số , ả nh số, video là
nh ững dạng dữ liệu rất khó bảo vệ. Trong bối cảnh đó, kỹ
thuật
Watermarking
ra đời như một cứu
cánh. Watermarking là một kỹ thuật mới cho phép nhúng thông
tin tác giả, gọi là một Watermark, vào các tài liệu số hóa sao cho chất lượng trực
quan của tài liệu không bị ảnh hưởng và khi cần có thể dò lại được Watermark đã
nhúng nhằm xác nhận bản quyền.
Bài tiểu luận tiến hành nghiên cứu một số vấn đề lý thuyết tổng quan về
Watermarking và các ứng dụng của nó trong công nghệ truyền thông đa phương
tiện, đồng thời tìm hiểu và phân tích sơ bộ về một số kỹ thuật Watermarking trong
môi trường ảnh màu kỹ thuật số.
Bài tiểu luận được trình bày thành 4 phần:
Phần 1: Tổng quan về Watermarking
Phần 2: Các mô hình Watermarking, các thuật toán và phân loại
Phần 3: Watermarking trong môi trường ảnh màu
Phần 4: Độ an toàn Watermarking và tấn công Watermark
Do thời gian thực hiện và kiến thức bản thân còn nhều hạn chế nên chắc chắn
không tránh khỏi những sai lầm, thiếu sót, kính mong nhận được sự đóng góp ý
kiến, bổ sung, sửa đổi của quý thầy cô giáo, các bạn đồng nghiệp, đồng môn để bài
tiểu luận hoàn chỉnh hơn, thiết thực hơn.
Xin chân thành cảm ơn.
2
Học viên
Nguyễn Văn Tánh

3
MỤC LỤC
4
CHƯƠNG 1. TỔNG QUAN VỀ WATERMARKING
Watermarking là một trong những kỹ thuật giấu dữ liệu hiện đại. Nó được định
nghĩa như là quá trình chèn thông tin vào dữ liệu đa phương tiện nhưng bảo đảm
không cảm thụ được, nghĩa là chỉ làm thay đổi nhỏ dữ liệu gốc. Thông thường người
ta chỉ đề cập đến Watermarking số. Đó là một tập các dữ liệu số thứ cấp - gọi là
Watermark (mã đánh dấu bản quyền) - được nhúng vào dữ liệu số sơ cấp - gọi là dữ
liệu bao phủ (ví dụ như văn bản, hình ảnh, video và audio số, ). Dữ liệu sau quá trình
nhúng được gọi là dữ liệu nhúng. Tanaka (1990), Caronni và Tirkel (1993) lần lượt
đưa ra những ấn bản đầu tiên về Watermarking nhưng chưa nhận được sự quan tâm
đúng mức. Mãi đến năm 1995, chủ đề này mới bắt đầu được quan tâm và kể từ đó,
Watermarking số đã phát triển rất nhanh với nhiều hướng nghiên cứu và phương
pháp thực hiện khác nhau.
Watermarking được ứng dụng trong nhiều lĩnh vực như bảo vệ quyền sở hữu,
điều khiển việc sao chép, xác nhận giấy tờ hay truyền đạt thông tin khác… trong đó
ứng dụng phổ biến của nó là cung cấp bằng chứng về bản quyền tác giả của các dữ liệu
số bằng cách nhúng các thông tin bản quyền. Rõ ràng trong ứng dụng này, thông tin
nhúng cần phải bền vững trước các thao tác nhằm loại bỏ chúng.
a) Sơ đồ nhúng Watermark b) Sơ đồ khôi phục Watermark
Tất cả các phương pháp Watermarking đều có chung các khối sau: một hệ
thống nhúng Watermark và một hệ thống khôi phục Watermark. Ngõ vào là
Watermark, dữ liệu cần nhúng và mã cá nhân hay công cộng. Watermark có thể ở bất
kì dạng nào như chữ số, văn bản hay hình ảnh. Khoá có thể được dùng để tăng cường
tính bảo mật, nghĩa là ngăn chặn những kẻ không có bản quyền khôi phục hay phá
hủy Watermark. Các hệ thống thực tế dùng ít nhất là một khoá, thậm chí kết hợp nhiều
khoá. Ngõ ra là dữ liệu đã được Watermark. Quá trình khôi phục Watermark tổng
quát. Các ngõ vào là dữ liệu đã Watermark, khoá và dữ liệu gốc (có thể có hoặc không
tuỳ thuộc vào phương pháp). Ngõ ra hoặc là Watermark khôi phục được hoặc đại

lượng nào đó chỉ ra mối tương quan giữa nó và Watermark cho trước ở ngõ vào.
5
1.1 Lịch sử Watermarking
Nghệ thuật làm giấy đã được phát minh ở Trung Quốc cách đây trên một ngàn
năm nhưng mãi đến khoảng năm 1282, các công nghệ Watermark trên giấy mới xuất
hiện đầu tiên dưới hình thức một số vị trí khuôn giấy là các mẫu dây mỏng hơn, khi đó
giấy sẽ mỏng và trong suốt hơn ở những vị trí dây mỏng. Các Watermark giấy nguyên
thủy giúp xác nhận xưởng sản xuất hay đơn giản chỉ là để trang trí. Vào thế kỉ thứ 18,
ở châu Âu và Mỹ, Watermark trên giấy đã đem lại những lợi ích thiết thực trong việc
xác định nhãn hiệu thương mại, ghi nhận ngày sản xuất, chống làm tiền giả. Thuật ngữ
Watermark bắt nguồn từ một loại mực vô hình được viết lên giấy và chỉ hiển thị khi
nhúng giấy đó vào nước. Thuật ngữ digital Watermarking được cộng đồng thế giới
chấp nhận rộng rãi vào đầu thập niên 1990. Khoảng năm 1995, sự quan tâm đến
Watermarking bắt đầu phát triển nhanh. Năm 1996, hội thảo về che dấu thông lần đầu
tiên đưa Watermarking vào phần trình nội dung chính. Đến năm 1999, SPIE đã tổ
chức hội nghị đặc biệt về Bảo mật và Watermarking trên các nội dung đa phương tiện.
Cũng trong khoảng thời gian này, một số tổ chức đã quan tâm đến kỹ thuật
Watermarking với những mức độ khác nhau. Chẳng hạn CPTWG thử nghiệm hệ thống
Watermarking bảo vệ phim trên DVD. SDMI sử dụng Watermarking trong việc bảo vệ
các đoạn nhạc. Hai dự án khác được liên minh Châu Âu ủng hộ, VIVA và Talisman đã
thử nghiệm sử dụng Watermarking để theo dõi phát sóng. Vào cuối thập niên 1990,
một số công ty đưa Watermarking vào thương trường, chẳng hạn các nhà phân phối
nhạc trên internet sử dụng Liqid Audio áp dụng công nghệ của Verance Corporation.
Trong lĩnh vực Watermarking ảnh, Photoshop đã tích hợp một bộ nhúng và bộ dò
Watermark tên là Digimarc.
Ngày nay, các công ty chuyên kinh doanh các hệ thống Watermarking đã tăng
đáng kể, dưới đây là một số ví dụ về các công ty và sản phẩm trong lĩnh vực
Watermarking:
Các hệ thống Watermarking âm thanh
Blue Spike, Inc. Công nghệ Watermarking của Giovanni,

Blue
Spike
có thể được dùng để nhận dang, xác nhận

kiểm tra
các tài liệu âm thanh.
Verance Corporation Verance Corporation - được sát nhập từ ARIS
Technologies, Inc. (Cambridge, Mass)và
Solana
Technology Development Corporatio - sở hữu công
nghệ Watermarking đã có bằng sáng chế
Musicode®

6
Electronic DNA®.
Các hệ thống Watermarking trên ảnh
Signum
Technologies
Một công ty Anh phát triển hệ
th
ống Watermarking
'SureSign' dùng cho bảo vệ bản quyền và hệ thống
'VeriData' dùng để xác thự tính toàn vẹn của các ảnh
số.
Digimarc
Các công nghệ có bằng sáng chế của
Digimarc
cho
phép dữ liệu kĩ thuật số được nhúng trong
các

tài liệu
có giá trị như giấy tờ tài chính, thị thực, g
i
úp ngăn chặn
giả mạo, trộm và sử dụng không đượ
c
phép
khác.
Các hệ thống Watermarking trên phim
Alpha Tec. Ltd. -
AudioMark
Alpha Tec. Ltd. là một công ty Hy Lạp phát triển
AudioMark, gói phần mềm thiết kế cho việc nhúng các
Watermark vào tài liệu âm thanh và phim
MediaSec
Technologies
Cung cấp công cụ SysCoP (System for Copyright
Protection) để nhúng nhãn hiệu tác quyền vào ảnh và
phim (MPEG )
Bảng - 1: Các công ty và sản phẩm trong lĩnh vực Watermarking
1.2 Các tiêu chí cần có của một thuật toán Watermarking mạnh mẽ
Tùy thuộc vào từng ứng dụng, kỹ thuật Watermarking có những đòi hỏi khác
nhau. Tuy nhiên có một số yêu cầu chung mà mà hầu hết các ứng dụng thực tế
phải đạt được.
1.2.1 Tính bảo mật
Giống như trong lĩnh vực mã hóa, tính hiệu quả của một thuật toán không thể
dựa vào giả định là các kẻ tấn công không biết cách mà Watermark được nhúng vào tài
liệu đa phương tiện. Tuy nhiên, giả định đó lại được dùng để đánh giá độ an toàn của
các sản phẩm thương mại sử dụng Watermarking có giá trị trên thị trường. Vì vậy với
một ứng dụng Watermarking, một khi biết được cách làm việc của bộ nhúng và bộ dò,

việc làm cho Watermark không đọc được thường rất dễ dàng. Hơn nữa một số kỹ
thuật sử dụng dữ liệu gốc trong quy trình dò và thường thì các giải pháp loại này
không khả thi trong thực tế.
1.2.2 Tính vô hình
Những nhà nghiên cứu gần đây đã cố nhúng những Watermark bằng cách sao
cho nó không thể được nhận ra. Tuy nhiên yêu cầu này mâu thuẫn với các yêu cầu
khác chẳng hạn sức chịu đựng và độ an toàn chống sự bền vững chống được giả mạo
đặc biệt là các thuật toán nén có mất thông tin. Vì mục đích này chúng ta phải khảo sát
7
các tính chất của HVS và HAS trong quy trình dò Watermark. Các thuật toán nén
được dùng hiện nay cho phép đạt được mục tiêu đó, tuy nhiên điều này sẽ không khả
thi trong tương lai là do thế hệ của thuật toán nén tiếp theo có thể thay đổi, cần phải
cho các người quan sát đã qua huấn luyện (người được yêu cầu so sánh phiên bản của
tài liệu gốc và tài liệu được ấn dấu) thấy được Watermark. Dĩ nhiên đây không phải là
khó khăn trong thực tế vì người dùng thông thường không có khả năng so sánh đó.
1.2.3 Tính vô hình đối với thống kê
Watermark không thể dò được bằng phương pháp thống kê bởi một ngưởi
không được phép. Ví dụ nhiều tác phẩm kỹ thuật số đã được nhúng cùng một
Watermark sao cho khi thực hiện tấn công dựa trên thống kê thì không tài nào trích
được Watermark. Một giải pháp khả thi là sử dụng Watermark phụ thuộc nội dung.
1.2.4 Tỉ lệ bit
Tùy thuộc vào ứng dụng, thuật toán Watermark có thể cho phép một số lượng
bit cần ẩn được định nghĩa trước. Không tồn tại các quy tắc chung, tuy nhiên đối với
ảnh thì tối thiểu 300 - 400 bit. Trong bất kỳ trường hợp nào thì nhà thiết kế hệ thống
phải nhớ rằng tốt nhất là không nên giới hạn số lượng bit được nhúng vào dữ liệu.
1.2.5 Quá trình dò đáng tin cậy
Thậm chí khi không có các tấn công cũng như các biến dạng tín hiệu, khả năng
không dò được Watermark đã nhúng hoặc dò sai Watermark phải rất nhỏ. Thông
thường các thuật toán dựa trên thống kê dễ dàng thỏa được các yêu này. Tuy nhiên
một khả năng như vậy phải được đưa lên hàng đầu nếu ứng dụng Watermarking liên

quan đến luật pháp vì có như vây mới tạo sự tin cậy chắc chắn trong các phán quyết
cuối cùng.
1.2.6 Tính bền vững
Việc sử dụng các tín hiệu âm nhạc, hình ảnh và phim dưới dạng kỹ thuật số
thông thường có liên quan tới nhiều kiểu biến dạng, chẳng hạn như nén có mất thông
tin, hay trong trường hợp ảnh là các phép lọc, định lại kích thước, cải tiến độ tương
phản, phép quay, v.v. Để Watermarking hữu ích, Watermark phải dò được ngay khi
cả các biến dạng xảy ra. Quan điểm chung để đạt được tính mạnh mẽ chống được các
biến dạng tính hiệu là đặt Watermark vào các phần quan trọng của tín hiệu. Điều này
phụ thuộc vào cách xử lý của các thuật toán nén có mất thông tin (bỏ qua các phần dữ
liệu không quan trọng mà không làm ảnh hưởng đến chất lượng của dữ liệu được nén.
Điều này dẫn đến một Watermark được ẩn trong các dữ liệu không quan trọng khó tồn
tại khi bị nén. Trong trường hợp Watermarking trên ảnh, sức chịu đựng với các xử lý
hình học (dịch chuyển, định lại kích thước, quay, xén ) thì vẫn là một vấn đề mở,
8
những thao tác như vậy rất thông thường và một giải pháp đề ra cần giải quyết được
trước khi áp dụng Watermark cho bảo vệ tác quyền ảnh.
1.2.7 Nhúng nhiều Watermark
Cần phải cho phép nhúng một tập hợp các Watermark khác nhau trong cùng
ảnh bằng cách sao cho mỗi Watermark có thể dò được bởi người dùng được cấp
quyền. Đặc trưng này thì hữu dụng trong các ứng dụng dấu vân tay, trong đó thuộc
tính tác quyền được truyền từ người sở hữu tác phẩm đến các tác phẩm khác. Hơn nữa
chúng ta có thể ngăn người khác thực hiện Watermarking cho một tác phẩm đã được
đóng dấu. Trong một số trường hợp việc sửa một Watermark sau khi nhúng là cần
thiết chẳng hạn trong trường hợp của các đĩa DVD, một con dấu có thể được dùng để
chỉ số lượng các bản sao chép được phép. Mỗi lần một bản sao chép được thực hiện
con dấu sẽ được sửa đổi để giảm số. Sự chỉnh sửa có thể thực hiện được bằng cách xoá
bỏ dấu cũ và nhúng dấu mới hoặc là nhúng một dấu mới chồng lên dấu cũ. Khả năng
thứ hai được chọn lựa nhiều hơn bởi vì một Watermark mà có thể xoá được thì yếu và
không chịu đựng được các tấn công giả mạo.

1.2.8 Blind/non-blind, public/private Watermarking
Mối quan tâm đặc biệt là cơ chế sử dụng để khôi phục vết ấn từ ảnh. Trong một
số trường hợp để phát triển một thuật toán mạnh mẽ, Watermark được trích bằng cách
so sánh các phiên bản đã được đóng dấu vả chưa đóng dấu. Trong đó nhiều phương
pháp được đề xuất chịu đựng được nhiều kỹ thuật xử lý ảnh và các tấn công có thể
nhằm vào việc gỡ Watermark hay làm cho nó không thể đọc được. Tuy nhiên thông
thường trong thế giới thực, sự có mặt của ảnh gốc trong quá trình dò không được bảo
đảm, do vậy thuật toán cần ảnh gốc để hồi phục vết ấn không thích hợp cho nhiều ứng
dụng thực tế. Ngoài ra loại thuật toán này không thể được dùng cho việc chứng minh
quyền sở hữu hoàn toàn trừ khi thỏa một số yêu cầu phụ khác như không tựa khả đảo
(non-quasi-invertibility) của Watermark, vốn rất khó đạt được và hầu như không thể
chứng minh. Các kỹ thuật khôi phục Watermark không cần so sánh các tín hiệu được
mark và không được mark thường gọi là oblivious hay blind. Trong các trường hợp
khác thuật ngữ public Watermarking được dùng để đối lại với private Watermarking .
Thực sự, thuật ngữ public/private Watermarking để chỉ một khái niệm khác: một kỹ
thuật được gọi là private nếu chỉ có người sở hữu tài liệu hay người được cấp quyền
mới trích Watermark bởi vì anh ta mới là người có thể truy xuất vào ảnh gốc hoặc anh
ta mới là người biết khoá chính xác đúng để trích Watermark từ dữ liệu chủ. Trái lại
các kỹ thuật mà cho phép bất kỳ người nào cũng đọc được Watermark được gọi là
9
public. Hầu hết mọi người cho rằng các cơ chế private dường như mạnh mẽ hơn public
ở chỗ là mỗi khi Watermark được đọc, kỹ thuật public làm cho các kẻ tấn công dễ xóa
Watermark hay làm cho Watermark không đọc được chẳng hạn bằng cách đảo quy
trình nhúng hay bằng cách nhúng một Watermark đảo (Watermark reversibility). Nói
một cách tổng quát trong số các kỹ thuật Watermarking ảnh được đề xuất gần đây, các
sản phẩm thương mại thường áp dụng các hệ thống public trong khi các nghiên cứu lại
tập trung vào tiếp cận private.
1.2.9 Watermarking đọc được và dò được
Một Watermark mà có thể dò được chỉ nếu nội dung của nó được biết trước gọi
là một Watermark dò được. Ngược lại các kỹ thuật cho phép Watermark đọc được

ngay khi nội dung của nó bỏ qua thì gọi là Watermark đọc được. Nói cách khác, theo
hướng tiếp cận dò được, người ta có thể chỉ cần biết một Watermark có tồn tại trong
dữ liệu hay không. Nếu một người không biết Watermark là gì thì không thể phân tích
tài liệu đa phương tiện để tìm ra Watermark. Điều này không giống với các kỹ thuật
đọc được, trong đó cơ chế nhúng và trích Watermark được thực hiện sao cho bất kỳ ai
cũng có thể đọc được Watermark. Dĩ nhiên tính chất đọc được/ dò được của
Watermark ảnh hưởng nhiều đến cách mà nó được sử dụng trong các ứng dụng thực
tế. Ví dụ giả sử có một tình huống trong đó người ta muốn biết ai là người sở hữu của
một ảnh mà anh ta đã tìm đã tìm thấy đâu đó trên Internet. Ngoài ra giả sử rằng
Watermark chỉ ra người sở hữu đã được nhúng trong ảnh sử dụng kỹ thuật
Watermarking dò được. Không có cách nào để đọc được Watermark nếu không thực
hiện các giả định về người sở hữu có thể, bởi vì nhờ tính chất dò được của Watermark
chỉ có thể xác định ảnh có thuộc một tác giả cụ thể nào đó (Watermark của anh ta được
biết ) không.
1.2.10 Tính khả đảo và tính thuận nghịch của Watermark
Mặc dù tính mạnh mẽ thường được chỉ ra như một yêu cầu chính được thỏa
mãn, mối quan tâm lớn lại tập trung vào tính khả đảo của Watermark. Thuật ngữ khả
đảo được dùng với những ý nghĩa khác nhau, nghĩa tự nhiên nhất định nghĩa một
Watermark là khả đảo nếu các người dùng được cấp quyền có thể xoá nó khỏi tài liệu.
Trong nhiều ứng dụng tính khả đảo này có thể là một đặc trưng mong đợi, bởi vì nó có
thể cho phép thay đổi tình trạng của một tài liệu cho trước theo lịch sử của nó mà
không cần phải ẩn quá nhiều bit thông tin trong nó. Tính khả đảo của Watermark còn
được định nghĩa theo cách khác: đó là khả năng làm mất hiệu lực thừa nhận quyền sở
hữu được hỗ trợ bởi Watermarking bằng cách sử dụng kỹ thuật công nghệ đảo để đảo
10
lại quy trình Watermarking. Một mô hình Watermarking để được sử dụng thành công
trong ứng dụng bảo vệ quyền sở hữu, tính không khả đảo của Watermark phải được
thỏa mãn. Hơn nữa đây chỉ là một điều kiện cần thiết phải thỏa mãn bởi vì tổng quát
hơn tính người ta cần tính không tựa khả đảo của Watermark hơn. Ở đây thuật ngữ khả
đảo và tựa khả đảo được hiểu theo nghĩa tự nhiên như đã nói trên. Không cần đi vào

chi tiết, chúng ta có thể nói rằng một Watermark là khả đảo nếu nó có thể tạo ra một
Watermark ngược (false Watermark) và một tài liệu giả mạo tài liệu gốc mà giống như
tài liệu gốc sao cho bằng cách nhúng false Watermark vào nó, ta có thể thu được một
tài liệu mà giống hay gần giống với tài liệu gốc thực sự đã được đóng dấu. Để tránh
việc dùng nhập nhằng thuật ngữ invertibility, thuật ngữ reversibility được đề xuất
để chỉ rằng một Watermark có thể xóa khỏi ảnh chủ mỗi khi nội dung của nó được
biết.
1.2.11 Tính có thể thay đổi tỉ lệ (scalability)
Trong các ứng dụng thương mại, chi phí tính toán cho việc nhúng và trích là rất
quan trọng. Trong một số ứng dụng việc chèn vào chỉ có thể thực hiện một lần. Do đó,
chi phí nhúng có thể ít quan trọng hơn là chi phí dò, vốn thường phải xảy ra theo thời
gian thực, ví dụ như tốc độ giải mã của các frame video. Các yêu cầu tính toán
ràng buột một Watermark phải đơn giản, nhưng sự đơn giản này có thể giảm trầm
trọng tính chịu đựng giả mạo. Hơn nữa, người ta biết rằng tốc độ máy vi tính thì cứ
tăng xấp xỉ gấp đôi sau 18 tháng, để mà những gì được tính toán không thỏa đáng ngày
hôm nay có thể nhanh chóng trở thành hiện thực. Do đó người ta rất mong đợi thiết kế
một Watermark mà bộ dò tương thích với mỗi thế hệ máy vi tính. Ví dụ thế hệ thứ
nhất của bộ dò có thể có chi phí tính toán rẻ nhưng có thể không đáng tin cậy bằng bộ
dò ở thế hệ tiếp theo mà có thể cấp cho nhiều tính toán hơn để xử lý với các vấn đề
chẳng hạn như các biến dạng hình học.
1.3 Các ứng dụng của Watermarking
Phần này trình bày tất cả các ứng dụng của Watermarking trên hầu hết các tài
liệu đa phương tiện (ảnh, âm thanh, phim), bao gồm:
• Theo dõi phát sóng (broadcast Watermarking )
• Nhận ra người chủ sở hữu (owner identification )
• Bằng chứng của quyền sở hữu (proof of owner ship )
• Lưu vết giao tác hay dấu vân tay (transaction tracking/fingerprinting )
• Sự xác nhận nội dung (content authentication )
• Kiểm soát sao chép (copy control)
1.3.1 Theo dõi phát sóng

11
Trong thực tế, việc phát sóng các đoạn phim hay âm thanh qua các phương tiện
thông tin đại chúng có những nhu cầu như:
Các nhà quảng cáo muốn chắc chắn rằng đoạn chương trình quảng cáo của họ
được phát đủ thời gian mà họ đã mua từ các nhà phát sóng.
Các diễn viên tham gia đoạn chương trình quảng cáo đó muốn bảo đảm họ
được trả tiền bản quyền ứng với thời lương phát sóng từ các công ty quảng cáo.
Những người sở hữu một đoạn nhạc hay phim không muốn tác phẩm của mình
bị xâm phạm tác quyền qua việc thu và phát sóng lại.
Một cách để giải quyết điều này là sử dụng hệ thống theo dõi tự động thụ động
và chủ động. Hệ thống theo dõi thụ động mô phỏng như một quan sát viên, nó chứa
một máy tính chuyên theo dõi nội dung phát sóng và so sánh tín hiệu nhận được với
một cơ sở dữ liệu các tác phẩm biết trước. Lợi điểm của nó là không cần bất kỳ thông
tin liên kết vào quá trình phát sóng và như vậy không đòi hỏi bất kỳ sự hợp tác nào với
các nhà quảng cáo hay các nhà phát sóng. Như vậy có thể áp dụng nó trong các dịch
vụ điều tra thị trường nhằm mục đích cạnh tranh. Khó khăn của hệ thống này là:
+ Thứ nhất, việc so sánh tín hiệu nhận được với cơ sở dữ liệu không phải
chuyện tầm thường. Về nguyên tắc, cần chia tín hiệu nhận được thành các đơn vị có
thể phân tích được và tìm chúng trong cơ sở dữ liệu. Tuy nhiên mỗi frame của video
chứa hàng ngàn bit thông tin và không thực tế chút nào cho quá trình tìm kiếm. Như
vậy hệ thống trước hết phải xử lý tín hiệu thành những chữ ký nhỏ hơn sao cho vừa đủ
để phân biệt với tài liệu khác và phải đủ nhỏ để lưu được trong cơ sở dữ liệu.
+ Thứ hai, sự giảm tín hiệu trong quá trình phát sóng là điều không tránh khỏi,
nó thay đổi theo thời gian, tức là sự thu tín hiệu của cùng một nội dung ở các thởi điểm
khác nhau có thể dẫn đến những tín hiệu khác nhau. Vì thế, hệ thống không thể tìm nó
chính xác trong cơ sở dữ liệu mà chỉ có thể tìm dưới dạng người láng giềng gần nhất,
thực tế phức tạp hơn nhiều.
+ Thứ ba, ngay cả khi vấn đề tìm kiếm được giải quyết thì việc lưu trữ và quản
lý cơ sở dữ liệu cũng là vấn đề lớn. Hơn nữa hệ thống phải theo dõi nhiều vị trí địa lý
khác nhau đồng thời, phải truy xuất và giao tiếp cơ sở dữ liệu trung tâm hoặc là lưu cơ

sở dữ liệu cục bộ.
Hệ thống theo dõi chủ động đơn giản hơn về mặt kỹ thuật hơn vì thông tin nhận
dạng được giải mã trực tiếp, không cần cơ sở dữ liệu để thông dịch nghĩa của nó. Một
cài đặt của hệ thống này là lưu các mã nhận dạng ở phần đầu file. Khó khăn là người
xử lý trung gian và người phân phối cuối cùng không bảo đảm phân phát thông tin đầu
file nguyên vẹn. Hơn nữa dữ liệu khó sống sót với sự chuyển đổi định dạng.
12
Watermarking là một phương pháp mã hoá thông tin nhận dạng cho theo dõi
chủ động. Nó có thuận lợi là Watermark tồn tại bên trong nội dung tín hiệu phát sóng
chứ không phải chỉ trong một đoạn đặc biệt của tín hiệu và vì thế hoàn toàn thương
thích với nền tảng thiết bị phát sóng đã được cài đặt bao gồm cả bộ truyền tải digital
và analog. Tuy nhiên, qui trình nhúng dò Watermark phức tạp hơn việc thêm dữ liệu
vào đầu file và tìm được một thuật toán sao cho chất lượng trực quan của nội dung
giảm không đáng kể nhưng lại có độ an toàn cao cũng là một bài toán thu hút nhiều sự
quan tâm nghiên cứu. Như vậy, bằng cách nhận dạng những Watermark được nhúng
trong nội dung số, có thể chỉ ra khi nào và ở đâu nội dung đó được phát song.
1.3.2 Nhận ra người chủ sở hữu
Trong thực tế có trường hợp một tác phẩm đã có tác quyền bị sử dụng sai mục
đích và phán quyết của cơ quan luật pháp rất cần thông báo tác quyền trên một hình
thức hay vị trí nào xem được trên tài liệu được phân phối. Thông báo tác quyền chúng
ta thường thấy trên có các tài liệu khả kiến là “Copyright ngày người sở hữu”, “ ngày
người sở hữu” hay “Corp. ngày người sở hữu”. Trên các tác phẩm âm thanh các thông
báo đó phải được đặt lên bề mặt của đĩa vật lý, tên nhãn hay trên bao bì. Dễ thấy rằng,
giới hạn của nó là việc nhận dạng người sở hữu tác quyền của một tác phẩm không
bảo đảm do người ta không quá khó để loại bỏ nó ra khỏi một tài liệu khi tiến hành sao
chụp lại thậm chí không cần quan tâm rằng đó là một việc làm sai: Chẳng hạn, một
giáo viên chụp một số trang từ quyển sách mà quên chụp luôn thông báo tác quyền ở
trang tiêu đề, một họa sĩ sử dụng một bức hình hợp pháp trong mục quảng cáo của báo
có thể xén đi phần có chứa thông tin tác quyền. Rồi sau đó các công dân tôn trọng luật
pháp muốn dùng tác phẩm có thể không tài nào xác định được tác phẩm có được bảo

vệ tác quyền hay chưa. Một trường hợp khá nổi tiếng là Lena Sjooblom. Đây là ảnh
thử thông thường nhất trong lĩnh vực nghiên cứu xử lý ảnh và đã xuất hiện không biết
bao nhiêu mà kể ở các bào báo hội nghị nhưng không ai tham khảo tên người sở hữu
hợp pháp của nó, đó là hãng Playboy. Ban đầu nó là một ảnh phóng to lồng giữa các
trang của tạp chí Playboy (Tháng 11- 1972 ). Khi ảnh được Scan và dùng cho mục
đích kiểm thử, hầu hết ảnh đã bị xén chỉ còn khuôn mặt và vai của Lena. Không may
là dòng chữ ghi Playboy là người sở hữu cũng bị xén mất. Từ đó ảnh được phân phối
toàn cầu và hầu hết các nhà nghiên cứu dùng nó trong các bào báo đã không biết rằng
chúng là tác quyền của Playboy.
Thứ hai là vấn đề thẩm mỹ, dù chỉ đặt ở một phần của ảnh nhưng một dòng chữ
13
thông tin tác quyền có thể làm giảm bớt vẻ đẹp của nó. Với các tài liệu âm thanh hay
phim, vì thông báo tác quyền nằm trên băng đĩa vật lý và bao bì nên sẽ không có thông
báo nào được sao chép cùng với nội dung của nó.
Do các Watermark có thể vừa không thể nhận thấy vừa không thể tách rời tác
phẩm chứa nó nên chúng là giải pháp tốt hơn dòng chữ đối với việc nhận ra người sở
hữu nếu người dùng tác phẩm được cung cấp bộ dò Watermark. Digimarc cho
ảnh là ứng dụng mà ta đang đề cập. Nó được tích hợp vào Photoshop. Khi bộ dò của
Digimarc nhận ra một Watermark, nó liên lạc với cơ sở dữ liệu trung tâm trên Internet
và dùng thông điệp Watermark như một khóa để tìm thông tin liên lạc cho người sở
hữu ảnh. Tính hợp pháp của một ứng dụng như vậy chưa được thừa nhận bởi cơ quan
pháp luật nhưng nó giúp những người lương thiện dễ dàng tìm ra người họ muốn liên
lạc để dùng ảnh. Như vậy, nhúng thông tin của người giữ tác quyền của một tác phẩm
như là một Watermark.
1.3.3 Bằng chứng về quyền sở hữu
Watermark không chỉ được dùng để chỉ ra thông tin tác quyền mà còn được
dùng để chứng minh tác quyền. Thông tin tác quyền có thể dễ bị giả. Chẳng hạn, giả
sử A tạo một ảnh và post lên mạng với thông tin tác quyền “© 2003 A”. Một tên trộm
(B) lấy ảnh đó, dùng chương trình xử lý ảnh để thay thông tin tác quyền đó bằng “©
2003 B” và sau đó tự cho là anh ta là người sở hữu. Vậy giải quyết tranh luận ra sao.

Nếu A đã đăng ký bản quyền tác phẩm của mình với một cơ quan pháp luật và gửi cho
họ ảnh gốc khi vừa mới tạo ra nó thì không có vấn đề gì. Tuy nhiên nếu A không làm
việc đó vì chi phí tốn kém thì A phải đưa ra bằng chứng chứng tỏ mình đã tạo ra ảnh.
Chẳng hạn, là một tấm phim nếu ảnh được chụp, là một bản phát thảo nếu đó là một
bức họa. Vấn đề là B cũng có thể ngụy tạo bằng chứng. Tệ hơn nữa là nếu ảnh được
chụp bằng kỹ thuật số thì chẳng có phim âm bản cũng như bản phát thảo.
A có thể nào bảo vệ quyền lợi của mình mà không phải tốn phí đăng ký bằng
cách áp dụng Watermark vào ảnh của mình? Nếu A dùng Digimarc, vấn đề không
được giải quyết vì bộ dò cũng được kẻ trộm biết. Về lý thuyết, ai dò được Watermark
đều có thể xoá bỏ nó. Do đó B có thể dùng bộ dò Digimarc, gỡ Watermark của A và
thay vào đó Watermark của mình. Để đạt được mức bảo mật trong bằng chứng tác
quyền, cần giới hạn tính khả dụng của bộ dò. Đối với kẻ trộm không có một bộ dò,
việc bỏ Watermark thì rất khó khăn phức tạp. Như thế khi A và B ra tòa, A dùng ảnh
gốc và ảnh tranh cãi đưa vào bộ dò và bộ dò sẽ cho ra Watermark của A. Tuy nhiên
cũng có một dạng hệ thống Watermarking mà B có thể dùng và làm như thể
14
Watermark của B nằm trong bản gốc ảnh của A. Tấn công được gọi là tấn công đảo
(inversion attack) hay tấn công khóa chết (dead lock attack). Không có cách gì để giải
quyết quyền sở hữu bản quyền trong trường hợp này và tòa cũng không thể biết A hay
B có ảnh gốc thực sự. Điều này cho thấy rằng chỉ với một mình Watermark mà không
có một nghi thức khác hỗ trợ nó thì sẽ không đủ để giải quyết tình huống bản quyền
này.
Bài toán có thể được giải quyết nếu ta thay đổi phần phát biểu nó: Thay vì cố
chứng minh trực tiếp quyền sở hữu bằng cách nhúng một Watermark “A sở hữu ảnh
này”, ta nên cố chứng minh một ảnh bắt nguồn từ ảnh khác. Một hệ thống như vậy
cung cấp một bằng chứng gián tiếp rằng khả năng ảnh tranh cãi là của A cao hơn B,
trong đó A là người có phiên bản mà từ đó hai ảnh khác tạo ra.
1.3.4 Lưu vết giao tác hay dấu vân tay
Trong ứng dụng này, Watermark lưu lại một hay nhiều giao dịch đã xảy ra
trong những lần sao chép tác phẩm đã có nhúng Watermark. Ví dụ, Watermark có thể

lưu tên người mua trong mỗi lần mua bán hợp pháp hay phân phối. Người sở hữu và
người tạo ra tác phẩm có thể dùng những Watermark khác nhau trong mỗi bản sao.
Nếu tài liệu bị dùng sai mục đích (phát hành hay phân phối trái phép ) người sở hữu có
thể tìm ra người có trách nhiệm.
Một giải pháp thông thường cho Watermarking áp dụng cho lưu vết giao tác là
dùng các Watermark hữu hình, chẳng hạn các tài liệu thương mại được in có
background có chứa các số lớn hơn màu xám, với mỗi bản sao sẽ chứa một số khác.
Một ví dụ khác có sử dụng Watermarking cho việc theo dõi giao tác đã được cài
đặt bởi DiVX Corporation. DiVX bán một DVD player triển khai theo mô hình kinh
doanh pay-per-view. Họ cài đăt nhiều kỹ thuật để ngăn giả mạo đĩa của họ, một trong
số đó là Watermark được thiết kế cho lưu vết giao tác. Mỗi DVD player phải đặt một
Watermark duy nhất vào mỗi video mà nó chiếu. Nếu ai đó thu lại đoạn video và bán
các bản sao, DiVX có thể lấy được bản copy đó và tìm ra kẻ phản bội bằng cách giải
mã Watermark.
Một ví dụ khác là trong phân phối các nhật báo phim. Suốt quá trình thực hiện
một phim, kết quả các bức hình mỗi ngày được phân phối cho nhiều người có tham gia
vào phim. Nhưng những nhật báo này được yêu cầu giấu bí mật, không muốn bị lộ ra
ngoài. Gặp trường hợp này, trường quay nhanh chónh xác định được người đã làm rò
rỉ thông tinh. Trường quay có thể dùng đoạn văn hữu hình ở góc màn hình để xác định
mỗi bản sao của ảnh. Tuy nhiên, các Watermark được chuộng hơn vì đoạn văn bản dễ
15
bị xóa đi.
1.3.5 Xác nhận nội dung
Các tác phẩm kỹ thuật số ngày nay đứng trước nguy cơ bị làm giả nhiều hơn, dễ
dàng hơn và tinh vi hơn. Nếu ảnh là một bằng chứng quan trọng trong điều tra của
cảnh sát, sự giả mạo có thể gây ra nhiều vấn đề nghiêm trọng.
Bài toán xác nhận thông điệp đã được nghiên cứu rộng rãi trong lĩnh vực mã
hóa (crytography). Một tiếp cận mã hóa thông thường cho bài toán này là tạo ra một
chữ kí điện tử. Thuật toán được dùng là mã hóa khoá bất đối xứng. Chỉ có tác giả
thông điệp mới biết khoá cần để tạo ra các chữ ký. Do vậy, kẻ trộm cố thay đổi thông

điệp thì sẽ không tạo ra được một chữ ký mới. Nếu khi tiến hành so sánh, thông điệp
được sửa đổi khác với chữ ký gốc, ta có thể khẳng định thông điệp đã bị sửa. Chữ ký
điện tử đã được áp dụng cho các camera kỹ thuật số bởi Fredman, người gợi ý tạo ra
một máy ảnh có chữ ký bên trong. Khóa để tạo chữ kí chỉ có trong máy ảnh mà thôi.
Chữ ký dạng như vậy chung qui là một dạng dữ liệu meta được đi kèm với tài
liệu mà chúng xác nhận. Điều này cho thấy rất dễ làm mất các chữ ký. Chẳng hạn một
hệ thống xác nhận ảnh lưu dữ liệu meta vào phần vào phần đầu (header) của ảnh
JPEG. Nếu ảnh được chuyển sang dạng khác, chữ ký sẽ bị mất và dĩ nhiên tài liệu
không còn được chứng thực nữa.
Một giải pháp hay là những chữ ký trực tiếp vào tài liệu dùng kỹ thuật
Watermarking. Epson đề ra một hệ thống như vậy trên nhiều máy ảnh kỹ thuật số của
hãng. Ta gọi chữ ký này là chữ kí xác nhận (authentication mark). Chữ kí xác nhận
được thiết kế sao cho trở nên sai lệch dù chỉ gặp sự chỉnh sửa nhỏ nhất được gọi là các
Watermark dễ vỡ (fragile Watermark).
Mối lo ngại về việc các chữ ký có trong tài liệu hay không giờ đây đã bị loại
trừ. Điều quan tâm lúc này là việc nhúng Watermark cần bào đảm không thay đổi tài
liệu nhiều quá để nó còn đúng khi so sánh với chữ ký. Điều này có thể thực hiện được
bằng cách xem tài liệu thành hai phần: Một dùng cho việc tính toán bằng chữ ký, một
dùng cho việc nhúng chữ ký. Ví dụ, nhiều tác giả đề xuất tính toán một chữ ký từ các
bit cao của ảnh và nhúng chữ ký vào các bit thấp của ảnh.
Nếu một tài liệu có chứa chữ kí xác nhận bị thay đổi, chữ kí xác nhận cũng thay
đổi theo. Điều này mở ra một hướng nghiên cứu mới là tìm hiểu tài liệu đã bị giả mạo
như thế nào. Chẳng hạn nếu một ảnh được chia làm nhiều khối, mỗi khối có một chữ
kí xác nhận, chúng ta dễ phát thảo ra phần nào của ảnh nguyên trạng và phần nào bị
chỉnh sửa.
Một ví dụ rất hay được áp dụng trong điều tra tội phạm của cảnh sát, sử dụng
16
chữ kí xác nhận khoanh vùng (localized authentication). Cảnh sát nhận được một đoạn
phim theo dõi đã bị giả mạo. Nếu đoạn phim này dùng các chứng thực chữ ký truyền
thống, dễ thấy rằng họ biết phim bị giả mạo và không tin bất cứ điều gì trong phim.

Tuy nhiên nếu dùng một Watermark theo kiểu xác nhận khoanh vùng, họ có thể khám
phá rằng trong các khung (frame) của phim vẫn có chỗ tin cậy. Như vậy kẻ có liên
quan đến tội ác đã bị gỡ bớt các frame có dấu vết của hắn.
Khi kiểm tra một chữ kí xác nhận đã bị sửa đổi ta cũng có được thông tin “Liệu
nén có mất có được áp dụng vào tài liệu hay không”. Hầu hết các thuật toán nén ảnh
có mất đều áp dụng sự lượng tử hóa, chính điều này đã để lại các thay đổi thống kê
trong một Watermark và có thể nhận diện được.
1.3.6 Kiểm soát sao chép
Các ứng dụng đã đề cập ở trên hầu hết có tác dụng sau khi có ai đó làm sai.
Chẳng hạn theo dõi phát sóng giúp phát hiện nhà phát sóng bất lương đã ăn chặn tiền
sau khi biết họ đã phát sóng không đúng thời lượng. Còn lưu vết giao tác chỉ ra kẻ
phản bội sau khi họ đã làm lộ và phân phối các bản sao bất hợp pháp. Các kỹ thuật này
có tể nói là chữa bệnh chứ không phòng bệnh. Rõ ràng là sẽ tốt hơn nếu ngăn ngay từ
đầu những hành vi bất hợp pháp, như vậy một ứng dụng kiểm soát sao chép ngăn
không cho tạo các bản sao bất hợp pháp từ nội dung đã có bản quyền.
Mã hóa cũng có thể dùng để cài đặt cho ứng dụng dạng này. Tài liệu được mã
hóa với một khóa duy nhất, nếu không có khóa thì không dùng được. Tuy nhiên khóa
này được cung cấp theo kiểu khó mà sao chép hay phân phối lại (nhằm hạn chế thếp
nhất khả năng khách hàng cho khóa của họ cho người khác xài miễn phí). Ví dụ, nhiều
sóng TV được mã hóa, khóa giải mã được tích hợp vào một thẻ thông minh (smart
card) cho các khách hàng nào trả tiền. Thẻ thông tin được giấu vào hộp antene của TV.
Nếu ai đó cố tình xem hay thu sóng mà không có thẻ thông minh card chắc chắn chỉ
thấy hình nhiễu. Điều đáng quan tâm là mã hóa không thực sự giải quyết tốt ứng dụng
này, vì chúng dễ bị phá bằng ba cách sau: Thứ nhất, cố giải mã tín hiệu với hàng triệu
trường hợp khóa có thể. Tuy nhiên nếu khóa ≥ 50 bit thì điều này không thực hiện
được. Thứ hai, dùng công nghệ đảo phần mềm hay phần cứng chứa khóa. (Giống như
crack phần mềm). Ví dụ như chương trình DeCSS của Jon Johanasen và hai cộng sự
người Đức. CSS (Content Scrambling System ) là hệ thống mã hoá dùng để chống ghi
DVD bất hợp pháp. Jon đã dùng công nghệ đảo áp dụng cho một đầu đọc DVD và tìm
khóa giải mã của nó. Sau đó bất kỳ video nào đã được mã hóa cũng có thể được giải

mã. Cách thứ ba là trả tiền để có một khóa rồi sao chép nội dung đã được giải mã. Một
17
kẻ trộm muốn thu và phát lại sóng vệ tinh chỉ cần đăng ký là khách hàng, mua một thẻ
thông minh, nối đầu đọc với đầu thu, cứ thể thu lại nội dung đã được giải mã. Ví dụ
này chỉ ra yếu kém chính của bảo vệ nội dung sử dụng mã hóa: Một nội dung muốn
dùng được cần phải giải mã, khi đã được giải mã rồi, tất cả các bảo vệ coi như không
còn.
Điều chúng ta cần là làm sao cho dữ liệu media xem được nhưng vẫn ngăn
không cho thu lại. Một kỹ thuật làm được điều này, trong trường hợp video NTSC đó
là quy trình chống sao chép videocassette của Marovision. Quy trình này sửa tín hiệu
video sao cho làm rối loạn điều khiển trên VCRs. Tín hiệu thu được có thể xem tốt
trên TV nhưng với VCR nó sẽ tạo ra những thứ kông thể xem được. Tuy nhiên, kỹ
thuật này chỉ áp dụng cho tím hiệu TV tuần tự , không được cho audio và các kiểu tín
hiệu số khác. Do vậy mặc dù hệ thống của Macrovision thích hợp để chống thu video
bất hợp pháp bằng VCRs, nó lại không dùng được cho đầu DVDs, VCRs số, hay các
kỹ thuật thu video số khác.
Do các Watermark được nhúng trong nội dung nên chúng có mặt khi có nội
dung và như vậy nó cung cấp một phương pháp tốt hơn để cài đặt các ứng dụng kiểm
soát sao chép. Nếu mọi thiết bị thu được gắn bộ dò Watermark , việc thu có thể bị các
thiết bị thu ngăn cản khi chúng dò ra một Watermark dạng như “không được chép”.
Một hệ thống như vậy đã được “Copy protection Technical Working Group”
(CPTWG) dùng cho đầu video DVD và SDMI dùng cho audio.
Vấn đề đặt ra là làm sao bảo đảm rằng mọi đầu thu chứa bộ dò Watermark.
Chẳng có động lực tự nhiên nào để các nhà sản xuất đầu thu lại bỏ thêm chi phí để tích
hợp bộ dò vào sản phẩm của họ. Trong thực tế, theo cách nhìn của khách hàng thì bộ
dò Watermark chỉ làm chỉ làm giảm giá trị của đầu thu vì dĩ nhiên họ muốn thiết bị
của mình có thể sao chép được bất kì tài liệu nào họ muốn (Cho dù điều đó là không
hợp pháp).
Giải pháp trực tiếp cho vấn đề này đòi hỏi luật quy định các đầu thu phải có bộ
dò Watermark. Tuy nhiên, cho đến bây giờ thì chưa có luật nào như vậy, và thỏa yêu

cầu đó là cả một vấn đề vì nó cần sự tham gia tất cả các quốc gia. Vì lẽ này, CPTWG
và SDMI đều không phụ thuộc luật nói trên. CPTWG và SDMI đưa ra yêu cầu vào
cam kết tác quyền là “Nhà sản xuất đầu thu nào sử dụng kỹ thuật của họ phải có bộ
dò”. Cách tiếp cận này phù hợp ở chỗ nó dưa trên những luật đã có sẵn trên hầu hết
các nước. Bất lợi của nó là nó cho phép nhà sản xuất tạo ra bộ thu không chứa bộ dò
Watermark khi họ không dùng kỹ thuật có đề cập yêu cầu đó. Một giải pháp dung hòa
18
là cho phép lưu hành cả hai hai loại thiết bị (có và không cài Watermarking): Chẳng
hạn, đầu đọc không cài Watermarking chỉ đọc được các bản sao chép được đã được
giải mã mà không đọc được các bản sao chép chưa được giải mã, và khi đã đọc được
thì nó có thể được thu tiếp bằng đầu thu không cài Watermarking.Đầu đọc có
Watermarking đọc được các bản sao chép có mã hóa, không đọc được bản sao đã qua
giải mã, và khi đã đọc được thì nó có thể được thu tiếp bằng đầu thu không cài
Watermarking. Như vậy lợi và hại của mỗi thiết bị có thể để khách hàng cân nhắc lựa
chọn và hy vọng những công dân có ý thức pháp luật và tôn trọng quyền sở hữu trí tuệ
sẽ sử dụng loại có cài Watermarking nhiều hơn.
Từ các phân tích ở trên, có thể thấy rằng Watermarking giải quyết các bài toán
về ẩn giấu thông tin linh hoạt hơn những phương pháp truyền thống khác chẳng hạn
như mã hóa nhờ lợi thế thông tin nhúng nằm kèm theo trong tài liệu chủ. Đó là các
ứng dụng chung của Watermarking trên các tài liệu đa phương tiện, riêng đối với ảnh
số, bảo vệ bản quyền và xác nhận nội dung là hai ứng dụng khả thi nhất, quan trọng
nhất mà ảnh số có thể áp dụng được và sẽ được nghiên cứu và phân tích sâu trong các
chương sau.
19
CHƯƠNG 2. CÁC MÔ HÌNH WATERMARKING, CÁC THUẬT TOÁN
Các mô hình Watermarking hiện nay chia làm hai nhóm: thứ nhất là các mô
hình dựa trên quan điểm xem Watermarking như một phương thức truyền thông, và
các mô hình dựa trên quan điểm hình học.
2.1 Mô hình trên quan điểm Watermarking như một dạng truyền thông
Có 3 loại và chúng khác nhau ở cách tích hợp của tài liệu chủ vào trong hệ

thống.
2.1.1 Mô hình cơ bản
Trong mô hình này, tài liệu chủ được xem như nhiễu được thêm vào trong suốt
quá trình truyền tín hiệu Watermark.
Hình - 1: Bộ dò không cần ảnh gốc
20
Hình - 2: Bộ dò cần ảnh gốc
Không quan tâm bộ dò ở đây là blind hay non-blind, qui trình nhúng bao gồm
hai bước:
Trước hết, thông điệp được ánh xạ thành một mẫu thêm (added pattern) wa có
cùng kiểu và kích thước với ảnh chủ c0. Ví dụ, trong Watermarking ảnh, bộ nhúng tạo
ra một mẫu các pixel hai chiều cùng kích thước với ảnh chủ gốc. Sự ánh xạ này được
thực hiện với một khóa Watermark. Các mẫu thêm thường được tính qua nhiều bước.
Với các mẫu định nghĩa sẵn và có thể phụ thuộc vào khóa, gọi là mẫu tham khảo
(reference pattern) wr0, wr1, wr2, chúng ta liên kết chúng lại để tạo ra một mẫu mã
hóa, ta gọi là mẫu thông điệp (message pattern), wm. Mẫu thông điệp này sau đó được
chỉnh sửa hay thay đổi tỉ lệ để thu được mẫu thêm.Sau đó, wa được thêm vào tài
liệu chủ, c0, để tạo tài liệu được Watermark (Watermarked Work), cw.
Sau khi mẫu thêm được nhúng, giả sử tài liệu được Watermark cw bị thay đổi
vì một xử lý nào đó, ta mô hình hóa hiệu ứng xử lý này bằng một nhiễu cộng. Các kiểu
xử lý có thể gồm: Nén, giải nén, phát sóng qua các kênh tuần tự, cải thiện ảnh hay âm
thanh… hay một xử lý bất kì của kẻ trộm nhằm gỡ bỏ Watermark…
2.1.2 Mô hình Watermarking truyền thông với thông tin phụ ở bộ trung
chuyển
Tài liệu chủ vẫn được xem là một nhiễu, nhưng qui trình nhúng Watermark cần
được cung cấp thêm ảnh chủ đó với vai trò là thông tin phụ. Thông tin phụ (side
information) là thông tin được cung cấp cho bộ trung chuyển hoặc bộ nhận trong một
21
hệ thống truyền thông, khác với thông điệp được chuyển hay tín hiệu nhận được cần
giải mã. Trong mô hình Watermarking này, chúng ta xem ảnh chủ là một thông tin phụ

đối với bộ nhúng.
Trong mô hình trước, giới hạn của nó là vết Watermark được mã hóa độc lập
với tài liệu chủ co, điều này không tận dụng triệt để ảnh gốc. Nếu ta cho phép bộ mã
hóa Watermark kiểm tra co trước khi mã hóa mẫu thêm thì ta sẽ có thuật toán nhúng
hiệu quả hơn.
Hình - 3: Mô hình Watermarking theo quan niệm truyền thông với thông tin phụ ở bộ
trung chuyển
2.1.3 Mô hình Watermarking theo quan niệm truyền thông đa công
Ở sơ đồ này, ảnh chủ không còn được xem là một phần của kênh truyền mà là
thông điệp thứ hai được truyền đi cùng với thông điệp Watermark trong cùng tìn hiệu
cw. Hai thông điệp co và m sẽ được dò và giải mã bởi 2 nguồn nhận rất khác nhau:
con người và bộ dò Watermark. Bộ nhúng Watermark liên kết m và co trong một tín
hiệu đơn, cw , tương tự như việc truyền nhiều thông điệp trên 1 đường dây trong
truyền thông truyền thống như chia thời gian (time - division) , chia tần (frequency -
division) hay chia mã (code - division) đa công (code division multiplexing là truyền
nhiều thông điệp trên 1 kênh đơn bằng cách thay chúng bằng các tín hiệu trực giao
chồng lên nhau theo thời gian, không gian, tần số.
22
Hình - 4: Mô hình Watermarking theo quan niệm truyền thông đa công
Tuy nhiên, điểm khác biệt là: Trong truyền thông truyền thống, kỹ thuật cơ bản
dùng cho các thông điệp khác nhau thì giống nhau, các thông điệp được phân biệt nhau
nhờ một tham số đơn (thời gian, tần số, dãy mã). Trong Watermarking: 2 thông điệp
được phân biệt bằng hai kỹ thuật khác nhau: dò Watermark và cảm nhận của con
người. Tương ứng ta nói là: một thông điệp được chia tần và một thông điệp được mã
hóa phổ rộng (frequency division - spread spectrum coding). Khi xem cwn, con người
nhận được một thứ gì đó gần với ảnh chủ không dính dáng gì vào Watermark. Khi dò
1 Watermark trong cwn , bộ dò cần lầy thông điệp Watermark, không dính dáng gì đến
ảnh chủ. Riêng đối với bộ dò informed, ảnh chủ gốc được cần đến nhưng với vai trò là
một tham số thứ 2.
2.2 Mô hình dựa trên quan điểm hình học

Quan điểm Watermarking hình học xem các tài liệu là các điểm trong không
gian đa phương tiện (media space) nhiều chiều. Khi phân tích các thuật toán phức tạp
hơn, ta cần chiếu hay làm biến dạng không gian đó thành không gian nhúng.
2.2.1 Các phân phối và miền trong không gian đa phương tiện
Trong không gian đa phương tiện có những phân phối xác suất và vùng sau:
Phân phối các tài liệu chưa được nhúng Watermark (distribution of unWatermarked
works) tượng trưng cho mỗi tài liệu.Vùng tương tự cảm nhận được giữa ảnh gốc và
ảnh qua xử lý có thể chấp nhận (Region of acceptable fidelity) là vùng trong đó tất cả
các tài liệu đều là ứng viên tiềm năng của một tài liệu cho trước. Vùng dò (Detection
region) tượng trưng cho cách làm việc của thuật toán dò. Phân phối nhúng hay vùng
nhúng (Embedding distribution/embedding region) thể hiện hiệu quả của một thuật
23
toán nhúng. Phân phối biến dạng (Distortion distribution) thể hiện cách mà tài liệu bị
làm biến dạng trong quá trình sử dụng.
2.2.2 Mô hình Watermarking trong không gian nhúng
Phần lớn các bộ dò Watermark thường được thiết kế để áp dụng được trên
không gian nhúng (marking space), đó là một không gian thu hẹp của không gian đa
phương tiện qua phép chiếu hoặc phép biến hình.
Hình - 5: Bộ dò trong mô hình Watermarking theo quan niệm hình học trên không gian
nhúng
Như hình trên, bộ dò như vậy chứa một qui trình gồm 2 bước:
+ Bước 1: Trích Watermark
Áp dụng một hay nhiều tiền xử lý cho tài liệu gốc chẳng hạn biến đổi tần số
(frequency transform), lọc (filtering), trung bình khối (block averaging), căn mép tạm
hay hình học (geomatric or temporal registration) và trích đặc trưng (feature
extraction). Kết quả thu được một vec tơ (một điểm trong không gian nhúng) có chiều
nhỏ hơn chiều của vec tơ ban đầu. Chúng ta gọi vec tơ này là vết trích. (extracted
mark)
+ Bước 2: Xác định xem vết trích có chứa Watermark không và nếu có thì giải
mã thông điệp được nhúng. Điều này đòi hỏi phải đi so sánh vết trích với một hay

nhiều vết tham khảo được định nghĩa trước (reference mark). Bước 2 có thể là một bộ
dò Watermark đơn giản thực hiện trên các vec tơ trong không gian nhúng. Đối với các
bộ nhúng Watermark thường thì chúng không được thiết kế để dùng trong không gian
nhúng nhưng trên thực tế vẫn có thể thực hiện được.
24
Hình - 6: Bộ nhúng trong mô hình Watermarking theo quan niệm hình học trên không
gian nhúng
Một bộ dò nhúng như vậy chứa một quy trình 3 bước như hình:
+ Bước 1: Tương tự bước trích trong bộ dò Watermark ở trên.
+ Bước 2: Chọn 1 vec tơ mới trong không gian nhúng gần với vết trích và hy
vọng rằng vec tơ này được dò có chứa Watermark. Vec tơ mới này ta gọi là vết thêm
(added mark). Bước 2 này có thể xem như bộ nhúng Watermark đơn giản thực hiện
trong không gian nhúng.
+ Bước 3: Đảo ngược quy trình trích, chiếu vec tơ mới trở lại không gian đa
phương tiện để thu được tài liệu được Watermark. Nếu không gian nhúng có cùng
chiều với không gian đa phương tiện, phép chiếu có thể được thực hiện theo cách ánh
xạ 1:1. Tuy nhiên, nếu không gian nhúng có chiều nhỏ hơn không gian đa phương tiện,
mỗi điểm trong không gian nhúng phải tương ứng với không gian đa phương tiện. Do
vậy, việc tìm một tài liệu sẽ nhận vec tơ mới như một vết trích cho ta nhiều tài liệu
khác nhau thỏa như vậy. Nói một cách lý tưởng là, ta tìm một tài liệu mà được cảm
nhận là gần với tài liệu gốc nhất. Trong thực tế, ta dùng một thuật toán xấp xỉ, tức là
không cho ta tài liệu gần nhất mà cho tài liệu phải chăng nhất.
Trong 2 sơ đồ trên, mục tiêu của hàm extraction là nhằm giảm chi phí nhúng và
dò. Thêm nữa là nhằm đơn giản hóa phân phối của những tài liệu không có
Watermark, vùng tương tự cảm nhận được giữa ảnh gốc và ảnh qua xử lý có thể chấp
nhận, và phân phối biến dạng để cho các thuật toán Watermarking được thực hiện tốt.
2.3. Các thuật toán Watermarking và phân loại
25

×