Tải bản đầy đủ (.pdf) (84 trang)

Nghiên cứu thuật toán và ứng dụng phương pháp nhúng thông tin vào ảnh số dựa trên ICA (Independent component analysis)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.28 MB, 84 trang )


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ










NGUYỄN XUÂN TÙNG








Nghiên cứu thuật toán và ứng dụng phương pháp
nhúng thông tin vào ảnh số dựa trên ICA
(Independent Component Analysis)









LUẬN VĂN THẠC SĨ













Hà Nội - 2011


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ







NGUYỄN XUÂN TÙNG








Nghiên cứu thuật toán và ứng dụng phương pháp
nhúng thông tin vào ảnh số dựa trên ICA
(Independent Component Analysis)





Ngành: Công nghệ thông tin
Chuyên ngành: Truyền dữ liệu và Mạng máy tính
Mã số: 48 60 15



LUẬN VĂN THẠC SĨ




NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS BÙI THẾ DUY







Hà Nội - 2011

2

MỤC LỤC

LỜI CAM ĐOAN 1
MỤC LỤC 2
DANH SÁCH CÁC TỪ VIẾT TẮT 4
DANH SÁCH BẢNG BIỂU, HÌNH VẼ 5
MỞ ĐẦU 8
Chương 1. Giới thiệu 11
1.1. Giới thiệu bài toán 11
1.2. Lược đồ phân phối đa phương tiện thông qua thủy vân số 12
1.3. Hạn chế của các lược đồ thủy vân hiện hữu và giải pháp 16
Chương 2. Tổng quan về Thủy vân 19
2.1. Lịch sử của Thủy vân 19
2.2. Tầm quan trọng của thủy vân số 20
2.3. Các đặc tính và ứng dụng của thủy vân 21
2.3.1. Các ứng dụng của thủy vân 22
2.3.1.1. Giám sát truyền thông 22
2.3.1.2. Xác minh người sở hữu và bằng chứng về quyền sở hữu 24
2.3.1.3. Giám sát giao dịch 27
2.3.1.4. Xác thực nội dung 28
2.3.1.5. Điều khiển sự sao chép 30
2.3.1.6. Điều khiển thiết bị 33
2.3.1.7. Sự nâng cấp tài sản 33
2.3.2. Các đặc tính của hệ thống thủy vân 34

2.3.2.1. Hiệu ứng nhúng 34
3

2.3.2.2. Độ chính xác 35
2.3.2.3. Lượng dữ liệu 36
2.3.2.4. Bộ tách sóng mù hay bộ tách sóng thông báo 37
2.3.2.5. Tỉ lệ ảnh thực lỗi 38
2.3.2.6. Sự làm mạnh 39
2.3.2.7. Bảo mật 40
Chương 3. Thủy vân ảnh đối với giám sát giao dịch trong truyền thông đa phương
tiện 42
3.1. Lược đồ đính kèm thủy vân chỉ định 42
3.2. Cơ chế phân tách thủy vân đề xuất sử dụng phương pháp ICA 48
3.2.1. Phân tích các thành phần độc lập 48
3.2.2. Cơ chế phân tách thủy vân bị làm mù 50
3.3. Đánh giá về việc thực hiện 53
3.3.1. Các dữ liệu thực hiện 53
3.3.2. Sự tăng cường giữa phương pháp nén và phương pháp lượng tử hóa . 53
3.3.3. Sự tăng cường giữa phương pháp cắt chỉnh và làm biến dạng hình học
56
Chương 4. Một vài thử nghiệm 60
4.1. Thử nghiệm quá trình nhúng thông tin vào ảnh số dựa trên ICA 60
4.2. So sánh kết quả phương pháp thủy vân dựa trên ICA và và phương pháp thủy
vân dựa trên miền sóng lược đồ 62
Chương 5. Tổng kết và đề xuất xu hướng phát triển trong tương lai của cơ chế thủy
vân 73
TÀI LIỆU THAM KHẢO 76
PHỤ LỤC 78
4


DANH SÁCH CÁC TỪ VIẾT TẮT

ICA - Independent Component Analysis
DB - Decibens
EZW - Embedded Zerotree Wavelet
Bpp - Bit per pixel
NVF - Noise Visibility Function
BSS - Blind Source Separation






5

DANH SÁCH BẢNG BIỂU, HÌNH VẼ

Bảng 1
PSNR của hình ảnh được thủy vân với các thông số α
x.

Bảng 2
So sánh, đánh giá chất lượng hình ảnh dựa trên PSNR

Hình 1.1
Hệ thống phân phối nội dung đa phương tiện
Hình 1.2
Lược đồ phân phối đa phương tiện bằng cách thêm thủy vân của
chủ sở hữu nhằm xác định quyền sở hữu đối với sản phẩm và thủy

vân riêng biệt của người sử dụng nhằm xác định người dùng hợp
pháp
Hình 2.1
Hình ảnh Lena được thường xuyên sử dụng trong các nghiên cứu
về xử lý hình ảnh
Hình 2.2
Ví dụ về bộ mã xác định riêng biệt được in chìm làm nền văn bản
ký tự.
Hình 2.3
Ví dụ về thay đổi hình ảnh
Hình 2.4
Mối quan hệ giữa mã hóa và thủy vân dựa trên điều khiển sao chép
Hình 3.1
Hệ thống vân sóng hai lớp trong hình ảnh của Lena
Hình 3.2
Quá trình biến đổi trong hình ảnh Lena
Hình 3.3
Thuật toán thủy vân đính kèm bắt buộc (dành cho việc phân tách
sóng ngắn 2 lớp)
Hình 3.4
Bức ảnh sao chép của người sở hữu
Hình 3.5
Cơ chế phân tách thủy vân bị làm mờ (sử dụng hàm số 2 tầng phân
ly)
Hình 3.6
Kết quả phân tách từ hình ảnh thủy vân của người dùng
Hình 3.7
Kết quả so sánh về mặt số liệu thực hiện của việc nén JPEG
6


Hình 3.8
So sánh việc phân tách giữa các phương pháp nén JPEG2000 khác
nhau
Hình 3.9
Kết quả nén đối với việc lượng tử hóa từ mức xám 256 tới mức
xám 4
Hình 3.10
(a) Hình ảnh Lena bị cắt chỉnh, (b) thủy vân được phân tách (r =
0.2706) và (c) thủy vân được phân tách sau khi tăng cường sự
tương phản của (b) (r = 0,9036)
Hình 3.11
(a) Hình Lena bị xoay 10
0
, và (b) thủy vân phân tách tương ứng (r
= 0,5847); (c) hình Lena bị thu nhỏ lại bằng cách giảm số lượng
dòng và cột xuống ¼, và (d) thủy vân được phân tách ( r =
0.4970); (e) hình của Lena bị điều chỉnh sang bên trái 10 cột và
xuống dưới 36 hàng, và (f) thủy vân phân tách tương ứng
(r=0.5356)
Hình 4.1
Kết quả hình ảnh Lena sử dụng phương pháp ICA
Hình 4.2
So sánh kết quả hình ảnh thu được sau khi sử dụng phương pháp
ICA
Hình 4.3
Đồ thị kết quả chất lượng hình ảnh (dựa trên PSNR)


8


MỞ ĐẦU
Ngày nay, với sự ra đời và phát triển của mạng Internet mọi người đều có thể
tìm kiếm thông tin một cách dễ dàng thông qua nhà cung cấp dịch vụ mạng.

Sự phát triển nhanh chóng của khoa học kỹ thuật trên nhiều lĩnh vực đặc biệt
là trong lĩnh vực đa phương tiện (multimedia) làm cho việc sản xuất, quản lý và
phân phối các sản phẩm (hình ảnh, âm thanh, tài liệu điện tử…) trở nên rất dễ dàng.
Tuy nhiên, việc phân phối phổ biến các tài nguyên trên mạng hiện nay luôn gặp
phải vấn nạn sao chép và sử dụng bất hợp pháp như: xâm phạm bản quyền, truy cập
trái phép, xuyên tạc, giả mạo thông tin… Đi đôi với sự phát triển của công nghệ
máy tính, tình trạng sử dụng bất hợp pháp các sản phẩm số ngày càng tăng, do các
tệp tin số có thể sao chép dễ dàng giữa các máy tính. Do đó, tình trạng vi phạm bản
quyền đang xảy ra hàng ngày, hàng giờ trên khắp thế giới. Nhằm bảo vệ các sản
phẩm số không bị sử dụng trái phép, song song với việc kêu gọi ý thức tự giác thực
thi luật bản quyền, các công ty công nghệ lớn trên thế giới đã và đang thực hiện các
giải pháp kỹ thuật kiểm soát bản quyền số. Một trong những vấn đề được đặt ra là
làm sao bảo vệ quyền sở hữu đối với các sản phẩm đa phương tiện này.

Đứng trước tình hình đó, vấn đề về bảo mật thông tin hiện nay luôn nhận
được sự quan tâm đặc biệt trong nhiều lĩnh vực. Từ xa xưa đã có nhiều cách để bảo
mật thông tin, một trong những phương pháp dùng rất sớm để bảo vệ quyền sở hữu
đối với nội dung của các sản phẩm đa phương tiện là mã hoá. Tuy nhiên, phương
pháp mã hoá chỉ hiệu quả trong việc truyền thông tin nhưng không hiệu quả trong
việc bảo vệ quyền sở hữu. Ngày nay, phương pháp thủy vân trong các sản phẩm đa
phương tiện được dùng phổ biến vì ngoài vấn đề bảo mật còn bảo vệ bản quyền,
chống nhân bản bất hợp pháp, chống truy cập trái phép, chống xuyên tạc, chống giả
mạo thông tin…

Thủy vân là một lĩnh vực rộng lớn. Trong luận văn này, chúng tôi chỉ tập
trung giới thiệu về thủy vân ảnh và ứng dụng trong giám sát các trao đổi thông tin

đa phương tiện. Kỹ thuật thủy vân ảnh dựa trên phân tích từng cấu trúc độc lập
(Independent Component Analysis – ICA) là kỹ thuật được lựa chọn để nghiên cứu
sâu trong luận văn này. Kỹ thuật thủy vân ảnh dựa trên phân tích từng cấu trúc độc
lập được ứng dụng hiệu quả trong việc phân tích thủy vân nhằm xác định các thành
9

phần của cấu trúc và vì thế cho phép dò tìm các trao đổi trái phép các sản phẩm đã
được bảo vệ.

Luận văn được trình bày thành năm chương, với các nội dung như sau:
Chương 1: Giới thiệu
Nội dung chương đưa ra bài toán được nghiên cứu để giúp người đọc có cách
tiếp cận chính xác nhất đối với vấn đề chính mà luận văn sẽ trình bày. Đồng thời
trong chương này chúng tôi cũng đưa ra khái niệm lược đồ thủy vân hiện hữu cùng
với các hạn chế của lược đồ này.
Chương 2: Tổng quan về Thủy vân
Trong chương này, các đặc tính và ứng dụng của thủy vân được trình bày
bên cạnh lịch sử hình thành và khái niệm vể thủy vân. Dựa trên các khái niệm và
nội dung được đưa ra trong Chương 2 sẽ giúp người đọc xây dựng các khái niệm cơ
bản từ đó tạo tiền đề cho việc trình bày sâu về phương pháp thủy vân ảnh đối với
giám sát giao dịch trong truyền thông đa phương tiện được trình bày chi tiết trong
Chương 3.
Chương 3: Thủy vân ảnh đối với giám sát giao dịch trong truyền thông đa
phương tiện
Nội dung chương 3 đi sâu vào phân tích và miêu tả cụ thể kỹ thuật thủy vân
ảnh dựa trên phân tích từng cấu trúc độc lập (Independent Component Analysis –
ICA). Đồng thời chúng tôi cũng đưa ra các đánh giá so sánh kết quả ứng dụng kỹ
thuật này khi thực hiện các biến đổi trên hình ảnh được sử dụng để thủy vân ảnh,
như ảnh đã bị biến đổi qua phương pháp nén, phương pháp lượng tử hóa, phương
pháp cắt chỉnh và làm biến dạng hình học.

Chương 4: Một vài thử nghiệm
Trong chương này, chúng tôi tiến hành một vài thử nghiệm đơn giản để đánh
giá phương pháp thủy vân ảnh dựa trên các thành phần độc lập so với phương pháp
thủy vân dựa trên miền sóng lược đồ. Qua đó cũng chỉ ra một vài ưu điểm, nhược
điểm mà phương pháp này mang lại.

10

Chương 5: Tổng kết, đề xuất hướng nghiên cứu
Đây là chương cuối cùng trong luận văn. Trong chương này chúng tôi đã
tổng kết đánh giá các kết quả nghiên cứu cũng như các kết quả thực nghiệm, qua đó
đưa ra các đề xuất nghiên cứu sâu hơn trong tương lai đối với kỹ thuật thủy vân ảnh
dựa trên phân tích từng cấu trúc độc lập (ICA) nói rêng và các kỹ thuật thủy vân
ảnh nói chung.



















11

Chương 1. Giới thiệu
1.1. Giới thiệu bài toán
Chúng ta đang sống trong kỷ nguyên kỹ thuật số, các công nghệ thông tin kỹ
thuật số đã và đang thay đổi xã hội cũng như cuộc sống của chúng ta.
Cuộc cách mạng thông tin đang diễn ra dưới hai hình thức:
 Truy tìm, phục hồi dữ liệu/thông tin
 Sự phổ biến/giao tiếp thông tin/dữ liệu
Sự trình bày kỹ thuật số của dữ liệu cho phép các thông tin được lưu giữ
dưới dạng kỹ thuật số và vì vậy nó dễ dàng cho phép tạo lập và sao chép thông tin.
Đồng thời nó cũng cho phép dễ dàng cung cấp tính khác biệt trong giai đoạn hiện
tại của cuộc cách mạng thông tin. Kỹ thuật số trước tiên cho phép sử dụng với các
phương tiện thông tin hữu hình mới, chẳng hạn như vệ tinh và truyền dẫn cáp
quang. Vì vậy, máy tính cá nhân, email, MPC, LAN, WAN, MAN, mạng nội bộ và
mạng quốc tế đã và đang được cải tiến liên tục từ những thập niên 80 nhằm đáp
ứng nhu cầu hiện tại. Mạng quốc tế có tầm ảnh hưởng truyền thông toàn cầu, là một
cơ chế phân phối thông tin, và là vật trung gian của sự cộng tác và tương tác giữa
các cá nhân và máy tính của họ mà không bị chi phối bởi vị trí địa lý. Điều này cho
phép các nhà nghiên cứu và giáo sư chia sẻ các dữ liệu và thông tin liên quan đến
nhau.
Khi hình ảnh, âm thanh, và các sản phẩm khác đã trở nên sẵn có dưới dạng
kỹ thuật số thì các bản sao chép hoàn chỉnh sẽ được dễ dàng thực hiện. Việc sử
dụng rộng rãi của mạng máy tính và việc toàn cầu hóa đã góp phần quan trọng tạo
thêm sự sẵn có của thông tin dưới dạng kỹ thuật số cũng như cung cấp các cách
thức truy cập dễ dàng đối với những hình thức kỹ thuật này. Việc tạo lập, sản xuất
phân phối sử dụng và tái sử dụng thông tin đã trở nên dễ dàng và nhanh hơn rất
nhiều lần so với các thập kỷ trước. Mặt tốt của vấn đề là sự phong phú mà việc phát

triển thông tin như vũ bão đã mang lại cho xã hội nói chung. Còn mặt không tốt là
việc phát triển này đồng thời cũng mang lại cho tất cả những người được hưởng lợi
từ nguồn thông tin kỹ thuật số khả năng sao chép, phân phối và sử dụng thông tin
một cách bất hợp pháp. Các trang Web là nguồn thông tin với kích cỡ và độ sâu đặc
12

biệt, đồng thời cũng là điều kiện thuận lợi để tái sản xuất và phổ biến thông tin phù
hợp với nhu cầu và năng lực. Vì vậy, cần thiết phải có các nghiên cứu kịp thời về
các biện pháp bảo vệ quyền sở hữu liên quan tới các nội dung thông tin được phân
phối qua mạng quốc tế.
Do đó, luận văn này giới thiệu về thủy vân ảnh và ứng dụng trong giám sát
các trao đổi thông tin đa phương tiện. Kỹ thuật thủy vân ảnh dựa trên phân tích
từng cấu trúc độc lập (Independent Component Analysis – ICA) là kỹ thuật được
lựa chọn để nghiên cứu sâu trong luận văn này. Kỹ thuật thủy vân ảnh dựa trên
phân tích từng cấu trúc độc lập được ứng dụng hiệu quả trong việc phân tích thủy
vân nhằm xác định các thành phần của cấu trúc và vì thế cho phép dò tìm các trao
đổi trái phép các sản phẩm đã được bảo vệ.
1.2. Lược đồ phân phối đa phương tiện thông qua thủy vân số
Tốc độ phát triển nhanh của các hệ thống đa phương tiện đã làm tăng nhu
cầu bảo vệ và thúc đẩy việc thực thi bảo vệ quyền tác giả đối với các sản phẩm
truyền thông số. Bảo vệ quyền tác giả đã trở nên ngày càng quan trọng. Các nhiệm
vụ để thực hiện việc bảo vệ quyền tác giả đối với việc phân phối sản phẩm đa
phương tiện qua Internet có thể phân thành các loại như sau:
 Xác định quyền sở hữu: chủ sở hữu của sản phẩm gốc có thể cung cấp
các bằng chứng đáng tin cậy để chứng mình mình có toàn quyền đối
với nội dung sản phẩm.
 Giám sát trao đổi: Người chủ có thể giám sát việc phân phối sản phẩm,
từ đó họ có thể tìm ra người chịu trách nhiệm đối với việc sao chép và
phân phối bất hợp pháp.
 Xác minh nội dung: Người chủ sở hữu có thể bảo vệ trước bất kì hành

vi nào xâm phạm tới sản phẩm.
Luận văn này tập trung vào nhiệm vụ giám sát trao đổi đối với các ứng dụng
phân phối truyền thông đa phương tiện. Giả định người chủ sở hữu muốn bán hoặc
phân phối sản phẩm chỉ cho những người dùng hợp pháp. Để thực hiện quyền sở
hữu, các vấn đề cơ bản sau cần giải quyết: Thứ nhất, người chủ sở hữu phải có khả
năng chứng minh rằng họ là người chủ hợp pháp của nội dung được phân phối. Thứ
hai, nếu dữ liệu thường xuyên bị sao chép và tái phân phối bất hợp pháp, người chủ
13

phải có khả năng tìm ra người chịu trách nhiệm việc sao chép và phân phối dữ liệu
một cách bất hợp pháp này.

Hình 1.1. Hệ thống phân phối nội dung đa phương tiện.
Kỹ thuật đầu tiên được sử dụng để bảo vệ các quyền sở hữu là mã hóa. Kỹ
thuật mã hóa (Schneiner, 1995) cung cấp công cụ hiệu quả để bảo mật quy trình
phân phối và kiểm soát việc sử dụng hợp pháp các nội dung đã được nhận bởi
người sử dụng. Các nội dung được chuyển qua mạng quốc tế đã được mã hóa, và
chỉ người sở hữu hợp pháp nắm bộ mã khóa mới có thể sử dụng các thông tin được
mã hóa, nhưng ngược lại nguồn thông tin có thể vô dụng với kẻ vi phạm bản quyền
nếu như không có bộ khóa mã. Dầu vậy, nếu xảy ra một truyền dẫn “error-free” qua
mạng, nội dung sau khi mã hóa có thể hoàn toàn giống như các dữ liệu gốc. Các nội
dung dữ liệu có thể bị sao chép hoàn chỉnh nhiều lần và người sử dụng có thể thao
túng nội dung này.
Các nhà khoa học và nhà nghiên cứu sau đó đã chuyển sang tìm kiếm các
công nghệ khác để ngăn chặn việc sao chép bất hợp pháp mà không có quyền tác
giả qua các mạng toàn cầu và việc sao chép trái phép này không được ngăn chặn
bởi phương pháp mật mã. Trong những năm gần đây, các kỹ thuật thủy vân ảnh đã
thu hút được khá nhiều sự chú ý. Trong thủy vân ảnh, các thông tin được nhúng
14


trong suốt vào sản phẩm, thay vì một dạng dữ liệu cụ thể. Kỹ thuật thủy vân ảnh vì
thế cũng hiệu quả cho việc truy tìm các trao đổi bản sao bất hợp pháp cũng như tái
phân phối các thông tin đa phương tiện. Đối với một ứng dụng truy tìm trao đổi
điển hình, các thủy vân phát hiện ra các chi tiết hợp pháp đầu tiên của sản phẩm.
Nếu như sau đó sản phẩm được xác định là bị phân phối bất hợp pháp, thì thủy vân
có thể giúp xác định người có trách nhiệm với sản phẩm.
Hình dưới giới thiệu mô hình phân phối thông tin đa phương tiện cho phép
các quyền sở hữu thực hiện thông qua một kỹ thuật tạo đa thủy vân. Đa thủy vân
ám chỉ việc gắn các loại thủy vân khác nhau vào một nội dung đa phương tiện đơn
để đạt được các mục tiêu khác nhau. Chẳng hạn, một trong số các thủy vân có thể
xác định được quyền sở hữu, thủy vân thứ hai dùng để xác định người nhận và thủy
vân thứ ba dùng để xác nhận tính nguyên vẹn của nội dung.
Đối với ứng dụng phân phối qua mạng quốc tế, những người sử dụng đầu
tiên gửi một yêu cầu tới người cung cấp nội dụng bất cứ khi nào họ quan tâm tới
các nội dung đa phương tiện. Người chủ sở hữu sau đó có thể phân phối sản phẩm
bằng cách ký nhận một thủy vân tới người sử dụng đã đăng ký nhằm xác định tính
duy nhất của người nhận sản phẩm. Tất cả các dữ liệu gửi tới người sử dụng đã
đăng ký sẽ được gắn vào một thủy vân chỉ định cùng với thủy vân của người chủ sở
hữu, cùng lúc duy trì chất lượng hình ảnh ở mức tốt đối với nội dung đã được đánh
dấu.

15


Hình 1.2. Lược đồ phân phối đa phương tiện bằng cách thêm thủy vân của chủ sở
hữu nhằm xác định quyền sở hữu đối với sản phẩm và thủy vân riêng biệt của
người sử dụng nhằm xác định người dùng hợp pháp.
 Mọi sao chép của sản phẩm có chứa thủy vân của người chủ sở hữu để xác
định quyền sở hữu đầy đủ đối với sản phẩm.
 Người chủ hoặc người đại diện hợp pháp có thể xác định đơn nhất người

nhận hoặc người sử dụng hợp pháp của một sao chép cụ thể của nội dung đa
phương tiện dựa trên thủy vân duy nhất của người sử dụng được đính kèm.
Xét tới trường hợp khi người chủ sở hữu cần chứng minh quyền sở hữu hợp
pháp của nội dung. Người chủ sở hữu có thể xuất trình dữ liệu gốc cũng như các
thủy vân của họ như bằng chứng. Hai loại thủy vân được đính kèm, bao gồm thủy
vân của chủ sở hữu và thủy vân của người sử dụng, có thể được tách bằng phương
pháp trừ đơn giản. Một thủy vân được tách ra, ví dụ như thủy vân của người chủ sở
hữu, phải phù hợp với thủy vân chủ sở hữu đã được trình bày trước đó. Quyền sở
hữu hợp pháp đối với nội dung vì thế được xác định. Điều này là điều kiện tiên
quyết để đảm bảo cho việc bảo vệ quyền sở hữu đối với thủy vân đã được đính kèm
vào mọi bản sao của sản phẩm đã được phân phối qua mạng quốc tế. Nhiệm vụ khó
khăn và thử thách hơn được đưa ra là xác định hiệu quả chủ sở hữu hợp pháp trong
16

điều kiện vắng mặt dữ liệu gốc, dẫn đến việc tra soát được các giao dịch của một
bản sao cụ thể đối với nội dung đa phương tiện. Để đảm bảo an toàn, dữ liệu gốc
thường được giữ bí mật và không nên được tiết lộ rộng rãi trong suốt quá trình tách
thủy vân ảnh. Trong một vài ứng dụng thực tế, người chủ sở hữu cần các đại diện
được phép hoặc các nhà cung cấp dịch vụ thực hiện các nhiệm vụ giám sát trao đổi.
Người chủ sở hữu không thể đồng thời cung cấp các dữ liệu gốc cho các đại diện.
Bởi thế, xuất hiện một vấn đề là làm sao để tách thủy vân của người chủ sở hữu
trong khi vẫn giữ bí mật dữ liệu gốc. Đây là vấn đề chính trong việc giám sát trao
đổi thông qua phương pháp thủy vân.
1.3. Hạn chế của các lược đồ thủy vân hiện hữu và giải pháp
Một chuỗi các thuật toán của phương pháp thủy vân đã được đề xuất. Dưới
dạng các ứng dụng đa dạng, kỹ thuật thủy vân ảnh có thể được phân thành hai loại
sau:
 Thủy vân quyền sao chép mạnh: nhằm cung cấp các bằng chứng về quyền sở
hữu đối với các truyền thông số đã được bảo vệ.
 Thủy vân xác nhận việc tạo lập: nhằm xác nhận bất cứ sự biến đổi nào trong

các truyền thông số được bảo vệ.
Các dấu hiệu mạnh (thủy vân mạnh) có thể xác định quyền sở hữu đối với
các dữ liệu số, trong khi các dấu hiệu xác nhận việc tạo lập được sử dụng để chứng
minh xem một đối tượng có thể được “chạm vào” hoặc chế tác. Thủy vân mạnh,
ngược lại với thủy vân xác nhận việc tạo lập, yêu cầu các thủy vân được đính kèm
phải được làm mạnh để chống lại các tấn công nhằm duy trì chất lượng hình ảnh
thủy vân.
Trên quan điểm sự hiệu hữu của một thủy vân cho sẵn tại giai đoạn phân
tách, có hai hệ thống thủy vân khác nhau được đề cập. Loại thứ nhất là gắn một
thủy vân xác định hoặc thông tin. Hầu hết kỹ thuật thủy vân dành cho việc bảo vệ
bản quyền liên quan tới hệ thống thủy vân này. Mục đích của cơ chế thủy vân này
là xác định sự hiện hữu của thủy vân đã biết trước đây có hoặc không có sự giúp đỡ
của thủy vân. Loại thứ hai liên quan tới các thông tin bất kỳ được đính kèm có ích
với việc dò tìm bản sao chép của người nhận duy nhất đối với thông tin được phân
phối. Trong hoàn cảnh đó, thủy vân được đính kèm vào một bản sao của hình ảnh
đã được biết trước đó, vì thế không thông tin nào trước đó liên quan tới thủy vân
17

được đính kèm có sẵn cho việc phân tách thủy vân. Điều này làm cho việc phân
tách trao đổi trở nên khó khăn hơn.
Các giả định cũng như các hạn chế đối với hầu hết các cơ chế thủy vân hiện
hữu có thể tạo ra những khó khăn và sự không hiệu quả khi ứng dụng vào các trao
đổi, giám sát liên quan tới đa phương tiện đã được tổng kết như sau:
(a) Trong một số hàm thủy vân, việc dò tìm và phân tách thủy vân đòi hỏi sự
hiện hữu của nội dung gốc. Điều này không cần thiết vì các dữ liệu nguồn
thường xuyên được bảo mật và không thể công bố rộng rãi, thậm chí dữ liệu
gốc không có sẵn. Vì thế các kỹ thuật thủy vân mờ được quan tâm và thu hút
sự chú ý.
(b) Hầu hết các cơ chế thủy vân hiện hữu được xây dựng trên một vài giả thuyết
về việc dò tìm và phân tách thủy vân, chẳng hạn như các kiến thức trước đó

về vị trí thủy vân, độ mạnh và ngưỡng. Dầu vậy, nhằm chắc chắn sự tăng
mạnh và tính ẩn của thủy vân các vị trí đính kèm được chọn trước cũng như
độ mạnh đính kèm thường khác nhau ở các hình ảnh khác nhau. Đối với cơ
sở dữ liệu hình ảnh lớn, đây có thể là hạn chế nếu nó yêu cầu về vị trí và độ
mạnh của các thông tin được dò tìm và phân tách của thủy vân. Kết quả là
một lượng lớn các thông tin bên lề cần phải được lưu trữ.
(c) Hình 1.2 đưa ra một sơ đồ nhằm ngăn chặn việc tái phân phối bất hợp pháp
dữ liệu bởi người dùng hợp pháp. Trong tình huống như vậy, hàm dò tìm và
phân tách thủy vân yêu cầu về vị trí và độ mạnh hoặc thậm chí thủy vân gốc
có thể thất bại vì không ai biết được thủy vân nào sẽ tồn tại trong bản sao của
sản phẩm.
(d) Thêm vào đó, hàm truy tìm thủy vân nói chung được dựa trên bộ lọc phù hợp
sẽ tìm ra tương quan lớn nhất giữa thủy vân phục hồi với các thủy vân lưu
trữ trong cơ sở dữ liệu chứa các thuỷ vân, được sử dụng để xác định người
dùng. Đây là một quá trình tốn thời gian và không hiệu quả đặc biệt là đối
với cơ sở dữ liệu lớn cần phân phối giữa số lượng lớn người dùng.
Vì những lý do trên, chúng tôi đã lựa chọn kỹ thuật thủy vân dựa trên phân
tích thành phần độc lập ICA (Independent Component Analysis). Phương pháp
ICA này dựa trên cơ chế thuỷ vân mờ có thể vượt qua các vấn đề của cơ chế tạo
thủy vân hiện tại nêu ở trên. Hàm thủy vân này rất hiệu quả trong việc ứng dụng
truy tìm các dữ liệu hợp pháp. Vì thế bằng cách sử dụng phương pháp thủy vân dựa
18

trên ICA này, cơ chế phân phối đa phương tiện rất hiệu quả đối với việc bảo vệ bản
quyền có thể được áp dụng.



















19

Chương 2. Tổng quan về Thủy vân
2.1. Lịch sử của Thủy vân
Mặc dù cách làm giấy được phát minh ở Trung Quốc hàng ngàn năm trước,
nhưng thủy vân trên giấy chỉ xuất hiện vào khoảng năm 1282 tại Italia. Những nhãn
hàng hóa được làm bằng cách thêm một dây kim loại nhỏ vào đường gờ của tờ
giấy. Tờ giấy sẽ trở nên nhẹ, mảnh hơn ở nơi có dây kim loại tồn tại và do vậy rõ
ràng hơn.
Ý nghĩa của thủy vân vào thời điểm đó là không rõ ràng. Chúng có thể được
sử dụng với mục đích có ích như tạo ra những đường gờ trên những mảng của tờ
giấy đã được làm, hay xác định một nhà sản xuất giấy. Ở một khía cạnh khác,
chúng có thể miêu tả những dấu hiệu bí ẩn hoặc chỉ đơn giản được dùng để trang
trí.
Vào khoảng thế kỉ 18, thủy vân trên giấy ở Châu Âu và Mỹ đã trở nên rất
thiết thực. Chúng được sử dụng như thương hiệu của giấy để ghi lại thời gian tờ
giấy được sản xuất và cho biết kích thước của những khổ giấy. Đó cũng là lúc

thương hiệu bắt đầu được sử dụng như là một tiêu chuẩn chống giả mạo trên tiền và
những tài liệu khác.
Thuật ngữ thủy vân dường như được ra đời vào gần cuối thế kỷ 18 và có lẽ
bắt nguồn từ thuật ngữ thủy vân của người Đức. Thuật ngữ này thực tế là một sự
nhầm lẫn về từ ngữ, trong đó nước không phải là một cái gì đặc biệt quan trọng
trong việc tạo ra nhãn hiệu. Cũng có lẽ nó được gọi là thủy vân bởi vì nhãn hiệu
cũng tương tự như tác động của nước trên giấy.
Khoảng thời gian thuật ngữ thủy vân ra đời, những kẻ làm tiền giả đã bắt đầu
phát triển các phương pháp để giả mạo thủy vân được sử dụng nhằm bảo vệ tiền
giấy. Năm 1779, tạp chí Quý ông đã đưa tin một người đàn ông tên là John
Mathison đã khám phá ra một phương pháp làm giả thủy vân những giấy tờ ngân
hàng, điều mà trước đó tất cả đều cho rằng đó là phương pháp an ninh đảm bảo
nhất chống lại sự gian lận.
Trong những năm sau đó, những kẻ gian lận đã liên tục cải tiển công nghệ
thuỷ vân. William Congreve, một người Anh, sau đó đã khám phá ra một công
20

nghệ thủy vân màu bằng việc cho thêm thuốc nhuộm tự nhiên vào giữa tờ giấy
trong quá trình làm giấy. Với cách làm này, các nhãn hiệu sẽ trở nên rất khó để làm
giả.
2.2. Tầm quan trọng của thủy vân số
Sự quan tâm về thủy vân tăng lên một cách đột ngột bởi sự lo lắng về việc
bảo vệ bản quyền của nội dung. Internet đã trở nên thân thiện và nhanh chóng trở
thành một ứng dụng to lớn mà tại đó con người dễ dàng tải hình ảnh, âm thanh hay
những đoạn video về máy của mình. Internet là một hệ thống phân phối thông minh
đối với truyền thông số bởi nó khá rẻ, không phải chờ đợi và phân phát hầu như
ngay lập tức. Tuy nhiên, nội dung của người sở hữu cũng sẽ chịu những rủi ro lớn
đối với việc sao chép bất hợp pháp.
Sự rủi ro của việc sao chép bất hợp pháp tăng thêm bởi sự gia tăng nhanh
chóng của những thiết bị thu kỹ thuật số dung lượng cao. Trước kia, cách duy nhất

để khách hàng có thể thu âm một bài hát hay một bộ phim là qua một băng từ. Khi
đó, những bản sao chép thường có chất lượng thấp hơn bản gốc, và chất lượng của
bản sao chép tiếp theo (sao chép lại của bản sao chép) sẽ rất tồi. Tuy nhiên, với
những thiết bị thu kỹ thuật số, những bài hát hay bộ phim có thể được thu lại với rất
ít, thậm chí không có sự giảm sút nào về chất lượng. Việc sử dụng những thiết bị
thu này và sử dụng Internet cho việc phân phối, người vi phạm quyền tác giả có thể
dễ dàng thu lại và phát tán những sản phẩm đã được bảo vệ bản quyền mà không
phải trả bất cứ khoản phí nào cho tác giả thực sự của nó. Do vậy, sở hữu nội dung
là những kỹ thuật được nghiên cứu và phát triển nhiều nhất, hứa hẹn sẽ bảo vệ
được những tác phẩm của họ.
Mã hóa là phương pháp đầu tiên và phổ biến nhất để bảo vệ nội dung số. Nội
dung được trải qua giai đoạn mã hóa để phát tán, và một khóa giải mã sẽ chỉ được
cung cấp cho những người mua bản sao nội dung đó. Những file mã hóa có thể rất
sẵn trên Internet, nhưng sẽ không thể sử dụng được nếu không có khóa chấp thuận.
Không may, việc mã hóa này không thể giúp người bán hàng giám sát làm cách
nào một khách hàng hợp pháp sẽ truyền tay những nội dung đó sau khi đã giải mã.
Một kẻ xâm phạm quyền tác giả có thể mua một sản phẩm, sử dụng khóa để giải
mã để xem nội dung, và phân tán những bản sao bất hợp pháp đó.Việc mã hóa có
21

thể bảo vệ nội dung đó trong suốt quá trình vận chuyển, tuy nhiên chỉ một lần bị
giải mã, nội dung này sẽ không được tiếp tục bảo vệ trong tương lai.
Do vậy, điều cần thiết nhất nhằm bổ sung việc mã hóa là: một kỹ thuật có thể
bảo vệ nội dung, thậm chí sau khi chúng được giải mã. Thủy vân có những khả
năng để giải quyết vấn đề này bởi nó thay thế thông tin bên trong nội dung và nó sẽ
không bao giờ bị tẩy xóa hay dời đi trong quá trình sử dụng thông thường. Việc
giải mã, mã hóa, nén, chuyển đổi từ kỹ thuật số sang anolog, và thay đổi định dạng
file thủy vân có thể được thiết kế để làm được tất cả các quá trình trên mà không
làm ảnh hưởng đến nội dung.
Thủy vân có thể được xem như là kỹ thuật nhằm ngăn ngừa việc sao chép

trái phép và cung cấp những ứng dụng bảo vệ bản quyền. Trong ngăn ngừa sao
chép, thủy vân được sử dụng dưới dạng phần mềm hoặc thiết bị phần cứng nhằm
giới hạn sự sao chép. Đối với những ứng dụng bảo vệ bản quyền, thủy vân được sử
dụng để chỉ rõ tác giả của sản phẩm và chắc chắn rằng tiền trả cho tác giả đó là
đúng theo luật pháp.
Ngoài ra, có một số lượng ứng dụng khác mà kỹ thuật thủy vân cũng có thể
được áp dụng. Những ứng dụng đó bao gồm: giám sát truyền thông, theo dõi giao
dịch, sự xác thực, điều khiển sao chép và điều khiển thiết bị
2.3. Các đặc tính và ứng dụng của thủy vân
Như đã nói ở trên, thủy vân có thể được sử dụng trong rất nhiều các ứng
dụng khác nhau. Nhìn chung, nó khá hữu dụng nhằm kết hợp một số thông tin được
thêm vào một sản phẩm cụ thể, những siêu dữ liệu này có thể được nhúng vào như
một quá trình thủy vân. Dĩ nhiên, có nhiều cách khác nhau để kết hợp thông tin với
sản phẩm, chẳng hạn như thay thế chúng vào header của một file số, mã hóa chúng
thành mã vạch trên một bức ảnh Câu hỏi được đặt ra là: Khi nào thủy vân trở
thành một lựa chọn tốt? Thủy vân có thể làm những điều mà các kỹ thuật đơn giản
hơn không làm được hay không?
Có ba điều quan trọng khác biệt giữa thủy vân và các kỹ thuật khác. Thứ
nhất, thủy vân không thể nhận thấy hay cảm nhận thấy được trong điều kiện thông
thường. Thứ hai, thủy vân không thể tách rời với sản phẩm bởi chúng được nhúng
vào sản phẩm. Thủy vân không thể bị xóa bỏ khi sản phẩm được trưng bày hay
22

được chuyển đổi sang dạng khác. Cuối cùng, thủy vân trải qua những quá trình biến
đổi giống như sản phẩm. Điều này có nghĩa là, thỉnh thoảng có thể học được điều gì
đó về những quá trình biến đổi của sản phẩm thông qua kết quả của việc thủy vân.
Đây là ba thuộc tính đã làm thủy vân trở nên vô giá đối với một vài ứng dụng nào
đó.
Trong phần này, chúng ta sẽ mô tả một vài ứng dụng được thực hiện với thủy
vân và nghiên cứu những lợi thế của các phương pháp này nhằm thay thế những kỹ

thuật khác. Sau đó, chúng ta sẽ mô tả một vài thuộc tính của thủy vân, thảo luận về
những vấn đề quan trọng có liên quan đến chúng và giải thích sự thay đổi do chúng
tạo nên đối với ứng dụng.
2.3.1. Các ứng dụng của thủy vân
Chúng ta sẽ khảo sát và nghiên cứu tám ứng dụng thực tế của thủy vân, bao
gồm: giám sát truyền thông; xác minh người sở hữu; bằng chứng về quyền sở hữu;
theo dõi giao dịch; xác thực nội dung; điều khiển sao chép; điều khiển thiết bị, và
sự gia tăng tài sản. Với mỗi ứng dụng, chúng ta sẽ cố gắng xác minh xem những
đặc điểm nào của thủy vân có thể ảnh hưởng, nhằm đưa ra một giải pháp phù hợp
cho thủy vân. Để làm được điều này, chúng ta phải xem xét hết sức cẩn thận yêu
cầu của ứng dụng và nghiên cứu những giới hạn của những giải pháp thay thế.
2.3.1.1. Giám sát truyền thông
Một phương pháp giám sát truyền thông thô sơ là luôn có người theo dõi trực
tiếp sau đó ghi lại những gì họ nghe và nhìn thấy. Phương pháp này rất tốn kém và
dễ xảy ra lỗi. Chính vì lẽ đó mà nó đã được thay thế bởi việc giám sát tự động. Kỹ
thuật này có thể được tách ra làm hai loại là hệ thống giám sát bị động và hệ thống
giám sát chủ động. Hệ thống giám sát bị động được sử dụng nhằm nhận ra ngay lập
tức nội dung đang được phát, hiệu quả của nó tương đương với việc con người
giám sát (có thể đáng tin hơn và giá thành thấp hơn). Hệ thống giám sát chủ động
dựa vào những thông tin đã được liên kết, những thông tin đã được phát đi với nội
dung có sẵn.
Hệ thống giám sát bị động bao gồm một máy tính giám sát quá trình truyền
thông và so sánh những tín hiệu nhận được với cơ sở dữ liệu sẵn có. Đây là phương
pháp trực tiếp và ít xâm phạm nhất của việc giám sát truyền thông tự động. Nó
không đòi hỏi sự giới thiệu của bất cứ thông tin liên quan nào trong truyền thông,
23

và vì thế không cần bất cứ sự thay đổi nào tới quy trình của người đăng quảng cáo.
Nói tóm lại, nó không yêu cầu bất cứ sự hợp tác nào với người đăng quảng cáo hay
phát thanh viên.

Tuy nhiên, có một vài vấn đề tiềm ẩn trong sự thực thi của hệ thống giám sát
bị động. Đầu tiên, việc so sánh những tín hiệu nhận được đối với một cơ sở dữ liệu
là không hề dễ dàng. Theo lý thuyết, chúng ta sẽ chia các tín hiệu thành các đơn vị
có thể nhận biết chẳng hạn như hình ảnh riêng lẻ trong video và tìm kiếm chúng
trong cơ sở dữ liệu. Tuy nhiên, mỗi hình ảnh trong video lại bao gồm hàng triệu bit
thông tin và chúng trở nên không thực tế khi sử dụng một chuỗi bit lớn như thế khi
tìm kiếm trong cơ sở dữ liệu. Vì vậy, hệ thống phải xử lý những tín hiệu nhận được
thành những chữ ký nhỏ hơn mà những chữ ký này đủ lớn để phân biệt với những
tác phẩm khác đồng thời cũng đủ nhỏ để có thể sử dụng như một chỉ mục trong cơ
sở dữ liệu tìm kiếm. Định nghĩa những chữ ký này là rất khó. Hơn nữa, việc phát
truyền hình hay truyền thanh thường làm giảm sút tín hiệu, và sự giảm sút này cũng
thay đổi theo thời gian. Kết quả thu nhận được trong những khoảng thời gian khác
nhau của cùng một tác phẩm có thể dẫn tới những chữ ký khác hoàn toàn. Điều này
có nghĩa là hệ thống giám sát không thể tìm kiếm chính xác một sự thích hợp trong
chính cơ sở dữ liệu của nó. Để thay thế, nó phải thực hiện một tìm kiếm gần nhất
bên cạnh, điều này có lẽ phức tạp hơn bởi sự khác nhau nhận được từ nững chữ ký
đầy ý nghĩa và việc tìm kiếm đối với những láng giềng gần nhất trong một cơ sở dữ
liệu rộng lớn, điều đó rất khó để thiết kế một hệ thống giám sát bị động tin cậy
100%.
Thứ hai, thậm chí nếu vấn đề tìm kiếm cơ sở dữ liệu được giải quyết, việc
lưu trữ và quản lý cơ sở dữ liệu có thể rất tốn kém bởi cơ sở dữ liệu rất lớn. Hơn
nữa, hệ thống nên giám sát đồng thời tại một vài vị trí khác nhau. Bởi vậy, mỗi vị
trí phải truy vấn đến cơ sở dữ liệu trung tâm, lưu trữ cục bộ (với khả năng cập nhật
liên tục) hoặc truyền những chữ ký trở lại về quá trình xử lý trung tâm một cách dễ
dàng.
Hiện nay, đã có những sự tiến bộ đáng kể đối với hệ thống giám sát truyền
thông bị động. Tuy nhiên, để đạt được sự chính xác đối với một hệ thống xác thực
có lẽ cần một hệ thống giám sát chủ động. Hệ thống này sẽ giúp những thông tin
được xác thực sẽ được phát đi cùng với nội dung. Giám sát chủ động là một kỹ
thuật thực hiện đơn giản hơn so với giám sát bị động. Những thông tin xác thực rất

24

dễ hiểu để giải mã một cách chính xác, và vì thế không cần yêu cầu một cơ sở dữ
liệu nào để phiên dịch nghĩa của nó.
Một cách để thi hành hệ thống giám sát chủ động là đặt những thông tin xác
thực vào một vùng riêng biệt của vùng truyền tín hiệu. Ví dụ, việc truyền tín hiệu
anolog vô tuyến cho phép thông tin số được mã hóa thành những đường dọc xen kẽ
giữa những khoảng trắng (VBI) của tín hiệu video. Phần này sẽ được gửi tới giữa
các hình mà không có bất cứ hiệu ứng nào tác động lên trên hình.
Đối với các sản phẩm công nghệ số, có một vài kỹ thuật chủ động tương tự
nhau lưu trữ những mã được nhận dạng trên những header của file. Những kỹ thuật
này phải trải qua những vấn đề gần giống như phương pháp VBI, trong đó người
điều khiển trung gian và người phân phối cuối cùng phải đảm bảo việc phân phối
header không bị thay đổi. Một lần nữa, những dữ liệu không chắc chắn để tồn tại
với sự thay đổi định dạng mà không cần một hệ thống được sửa đổi.
Thủy vân rõ ràng là một phương pháp có thể sử dụng để thay cho việc mã
hóa những thông tin đã bị nhận dạng trong việc giám sát chủ động. Nó có những lợi
thế đối với sự tồn tại trong phạm vị nội dung của nó hơn là việc khai thác một phần
cụ thể của tín hiệu phát đi, và do vậy hoàn toàn tương thích với nền tảng thiết bị
truyền thông được lắp đặt bao gồm cả việc truyền tín hiệu số và analog. Bất lợi
chính của thủy vân là quá trình nhúng phức tạp hơn việc đặt dữ liệu vào VBI hay
vào header của file. Đây cũng là một rắc rối, nhất là trên phần nội dung được tạo
ra, thủy vân sẽ làm giảm đi chất lượng âm thanh và hình ảnh của sản phẩm.
2.3.1.2. Xác minh người sở hữu và bằng chứng về quyền sở hữu
Một ví dụ nổi tiếng là bức tranh Lena. Đây có lẽ là bức tranh được sử dụng
để kiểm chứng phổ biến nhất trong quá trình nghiên cứu hình ảnh và bức tranh này
xuất hiện trên vô số các bài báo và những cuộc hội thảo.

25



Hình 2.1. Hình ảnh Lena được thường xuyên sử dụng trong các nghiên cứu về xử
lý hình ảnh.
Việc sử dụng thủy vân không chỉ để xác định quyền sở hữu bản quyền mà
thực tế còn để chứng minh quyền sở hữu đó. Đây chính là điều mà một thông báo
bằng văn bản không thể thực hiện được bởi vì nó có thể dễ dàng bị giả mạo. Ví dụ,
một nghệ sĩ (Alice) sáng tạo ra một hình ảnh và đưa nó lên trang web của mình với
một dòng thông báo về quyền sở hữu là “ © Alice”. Sau đó một người làm quảng
cáo (Bob) ăn cắp hình ảnh đó, sử dụng một chương trình xử lý hình ảnh để thay
dòng chữ thông báo đó bằng “ © Bob” và sau đó đòi hỏi quyền sở hữu hình ảnh đó
cho anh ta. Như vậy tranh chấp này sẽ được giải quyết như thế nào?
Một cách để giải quyết việc tranh chấp này là nhờ tới các cơ quan có thẩm
quyền. Trước khi đưa hình ảnh của cô lên trang web, Alice có thể đăng ký hình đó
với Cục Bản quyền liên bang bằng cách gửi cho họ một bản sao. Họ sẽ lưu giữ hình
ảnh đó cùng với thông tin của người sở hữu ban đầu. Sau đó nếu có sự tranh chấp,
cô ấy có thể liên hệ với Cục Bản quyền liên bang để chứng minh rằng cô ta là
người có đầy đủ quyền với bức ảnh đó. Tuy nhiên, Alice có thể từ chối đăng ký
hình ảnh đó vì chi phí khá tốn kém (có thể lên tới 45 USD đối với mỗi tài liệu).

×