Tải bản đầy đủ (.docx) (50 trang)

Nghiên cứu thử nghiệm kỹ thuật nhúng thủy vân dựa trên DCT

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.14 MB, 50 trang )

1

MỤC LỤC


2

DANH MỤC HÌNH VẼ


3

DANH MỤC BẢNG BIỂU


4

LỜI NÓI ĐẦU
• Lý do chọn đề tài
Ngày nay, hầu hết thông tin đều được lưu trữ dưới dạng số hóa. Việc
trao đổi, phân phối sao chép và sử lý các sản phẩm số ngày càng nhanh, đơn
giản và nằm ngoài sự kiểm soát của các cơ quan, tổ chức. Việc trao đổi thông
tin xuất bản thông tin trên Internet có nguy cơ mất an toàn do thông tin có thể
bị lộ, bị sửa đổi, hay vi phạm bản quyền.
Bởi vậy, nhu cầu đảm bảo an toàn thông tin, bảo vệ bản quyền và sử
hữu trí tuệ các sản phẩm số đang là một nhu cầu cấp thiết hiện nay. Nói chung
việc đảm bảo an toàn thông tin khỏi sự truy cập, sử dụng trái phép cần phải
được kiểm soát được những việc chính sau: Thông tin được tạo ra, lưu trữ ở
đâu và truy cập như thế nào. Như vậy việc bảo vệ bản quyền số đang là một
bài toán không dễ dàng. Một trong những giải pháp cho vấn đề này là đánh
giấu vào các sản phẩm này để bảo vệ bản quyền cũng như đảm bảo sự toàn


vẹn cho chúng. Một trong những kỹ thuật đó là kỹ thuật thủy vân số. Hiện tại
đã có đã có một kỹ thuật thủy vân dùng để bảo vệ bản quyền bằng cách tác
động trực tiếp lên miền giá trị của sản phẩm. các kỹ thuật thường không đảm
bảo chất lượng của sản phẩm, không được bền vững trước các tấn công thông
thường lên sản phẩm.
Phương pháp nhúng thủy vân số hứa hẹn hiệu quả bởi nó cho phép chủ
sở hữu nội dung số có thể nhúng, giấu những bằng chứng về bản quyền của
mình từ đó có thể xác minh được quyền sở hữu, phát hiện ra việc việc sử dụng
trái pháp mà không làm ảnh hưởng đến nội dung số. Với các tính chất đặc thù
của mình thì thủy vân số rất thích hợp với việc bảo vệ bản quyên số.
Xuất phát từ yêu cầu thực tế, nhằm mục đích hướng tới một phần
nhiệm vụ bảo vệ bản quyền thông tin lên em chọn đề tài: Nghiên cứu thử
nghiệm kỹ thuật nhúng thủy vân dựa trên DCT.


5
• Mục đích nghiên cứu
Mục đích của nghiên cứu là nghiên cứu kỹ thuật nhúng thủy vân dựa
trên DCT qua đó phân tích đánh giá, đưa ra các bài toán áp dụng kỹ thuật
nhúng thủy vân dựa trên DCT ứng dụng rộng dãi trong thực tiễn.


Nhiệm vụ nghiên cứu

-

Tìm hiểu về giấu tin.

-


Tìm hiểu kỹ thuật nhúng thủy vân dựa trên DCT.

-

Nghiên cứu thử nghiệm kỹ thuật nhúng thủy vân dựa trên DCT.


-

Đối tượng và phạm vi nghiên cứu

Nghiên cứu đánh giá kỹ thuật nhúng thủy vân dựa trên DCT qua đó
phát triển, cải tiến kỹ thuật nhúng thủy vân dựa vào phương pháp biến
đổi DCT.

-

Các công cụ lập trình và phần mềm dùng để cài đặt lược đồ nhúng và
trích xuất thủy vân dựa vào kỹ thuật thủy vân số.

-

Cài đặt và thử nghiệm kỹ thuật nhúng thủy vân dựa trên DCT.
• Bố cục đồ án
Ngoài những phần mở đầu, kết luận, tài liệu tham khảo, đồ án gồm 3

chương:
Chương 1: Tổng quan về kỹ thuật giấu tin.
Chương 2: Tổng quan về thủy vân số.
Chương 3: Thủy vân dựa trên DCT.

Sinh viên


6

1 CHƯƠNG 1
TỔNG QUAN VỀ KỸ THUẬT GIẤU TIN
1.1 Khái niệm về giấu tin
1.1.1 Định nghĩa giấu tin
Giấu tin có nguồn gốc từ tiếng Hy Lạp và được sử dụng tới ngày nay,
nó có nghĩa là “tài liệu được phủ”. Các câu chuyện kể về kỹ thuật giấu thông
tin đã có từ rất lâu. Những tài liệu tìm thấy ghi chép về kỹ thuật giấu thông tin
sớm nhất thuộc về sử gia Hy Lạp Herodotus (khoảng năm 440 trước Công
nguyên). Khi bạo chúa Hy Lạp Histiaeus bị vua Darius bắt giữ ở Susa vào thế
kỷ thứ 5 trước Công nguyên, ông ta đã cố gửi thông báo bí mật cho con rể của
mình là Aristagoras ở Miletus. Histiaeus đã cạo trọc đầu của một nô lệ tin cậy
và xăm một thông báo trên da đầu của người nô lệ đó. Khi tóc của người nô lệ
mọc đủ dài, anh ta được gửi tới Miletus.
Giấu thông tin là một kỹ thuật nhúng (giấu) một lượng thông tin số nào
đó vào một đối tượng dữ liệu số khác.
Kỹ thuật giấu thông tin nhằm mục đích đảm bảo an toàn và bảo mật
mật thông tin ở cả hai khía cạnh. Một là bảo mật cho dữ liệu được đem giấu,
hai là bảo mật cho chính đối tượng được dùng để giấu tin. Điều này dẫn đến
hai khuynh hướng chủ yếu của giấu tin:
Khuynh hướng thứ nhất là ẩn tin. Khuynh hướng này tập trung vào các
kỹ thuật giấu tin sao cho thông tin giấu được nhiều và quan trọng là người
khác khó phát hiện được một đối tượng có bị giấu tin bên trong hay không.
Khuynh hướng thứ hai là thủy vân số. Khuynh hướng thủy vân số đánh giấu
vào đối tượng nhằm khẳng định bản quyền quyền sở hữu hay phát hiện sự
xuyên tạc thông tin.



7
1.1.2 Mục đích của giấu tin
Có hai mục đích chính của giấu tin:
-

Bảo mật cho dữ liệu được giấu trong đối tượng mang.

-

Bảo đảm an toàn cho chính các đối tượng chứa dữ liệu giấu.
Dựa vào mục đích giấu tin mà giấu tin được chia thành hai lĩnh vực

chính với những yêu cầu và tính chất khác nhau.

Hình 1.1 Hai lĩnh vực chính của giấu tin
• Ẩn tin
Đây là lĩnh vực phổ biến nhất từ trước đến nay. Đối với ẩn tin người ta
quan tâm chủ yếu tới các yếu tố sau:
-

Độ an toàn của ẩn tin (Khả năng không bị phát hiện ẩn tin).

-

Lượng thông tin tối đa có thể che giấu trong một phương tiện chứa cụ
thể mà vẫn có thể đảm bảo an toàn.

-


Độ bảo mật của thông tin trong trường hợp bị phát hiện.
Ẩn tin không quan tâm nhiều tới các yếu tố khả năng bền vững của

phương tiện chứa. Việc giải mã để nhận được thông tin cũng không cần các
phương tiện chứa gốc ban đầu. Các yêu cầu về khả năng chống tấn công
không được quan tâm lắm, thay vào đó thông tin giấu được bảo mật. Đối với
các thuật toán ẩn tin, người ta không chú trọng tới việc bảo vệ thông tin mật


8
trước sự tấn công của đối thủ mà thay vào đó quan tâm đến tính ẩn và tính an
toàn với dữ liệu cần giấu.
• Thủy vân số
Khác với kỹ thuật ẩn tin để giữ bí mật thông tin, thủy vân số có mục
tiêu là bảo vệ bản quyền và xác thực thông tin. Vì vậy, kỹ thuật này không
chống lại việc khai thác thông tin. Mà quan trọng nhất đối với nó là đảm bảo
tuyệt đối tính bền vững, nghĩa là không thể hủy bỏ được thông tin giấu trừ khi
hủy chính sản phẩm chứa. Ngoài ra các thông tin nhúng cần có ảnh hưởng tối
thiểu đối với phương tiện chứa, vì vậy thông tin chứa càng nhỏ càng tốt.

1.2 Mô hình kỹ thuật giấu tin cơ bản
Mô hình giấu tin cơ bản bao gồm hai quá trinh đó là: Quá trình giấu tin
và Quá trình trích xuất tin.


Quá trình giấu tin:

Quá trình giấu tin và trích xuất tin là hai quá trình trái ngược nhau và có
thể mô tả qua sơ đồ khối như sau:

Thông tin giấu

Phương

tiện

chứa tin

Bộ nhúng thông tin

Phương tiện chứa

vào phương tiện chứa

đã được giấu tin

Khóa

Hình 1.2 Lược đồ chung cho quá trình giấu tin.
-

Phương tiện chứa: Các file ảnh, text, audio, . . . . là môi trường để
nhúng tin.


9
-

Thông tin cần giấu tùy theo mục đích người sử dụng, nó có thể là thông
điệp (Với các tin bí mật) hay logo, hình ảnh, bản quyền, . . . .


-

Bộ nhúng thông tin vào phương tiện chứa: Là chương trình thực hiện
việc giấu tin.

-

Khóa: Là khóa tham gia vào quá trình giấu tin nhằm tăng tính bảo mật.
• Trích xuất tin:
Trích xuất tin từ các phương tiện chứa diễn ra theo quy trình ngược lại

cho ra là thông tin đã được giấu vào phương tiện chứa. Phương tiện chứa sau
khi tách thông tin có thể sử dụng, quản lý theo những yêu cầu khác nhau.
Hình 1.3 chỉ ra việc trích xuất thông tin đã được giấu vào vật mang tin.
Sau khi nhận được phương tiện chứa có giấu tin, quá trình trích xuất được
thực hiện thông qua bộ trích xuất tin ứng với bộ nhúng thông tin. Kết quả thu
được là thông tin đã được giấu.
Thông tin đã được giấu có thể sẽ được xử lý kiểm định so sánh với
thông tin ban đầu tùy thuộc vào mục đích của hệ thống giấu tin.

Khóa

Phương tiện chứa
đã được giấu tin

Bộ trích xuất tin

Thông tin giấu
Hình 1.3 Lược đồ chung cho quá trình giả mã.


Phương tiện chứa

Kiểm định


10

1.3 Phân loại giấu tin
1.3.1 Phân loại theo môi trường giấu tin
Môi trường giấu tin ở đây có thể là các file ảnh, video, âm thanh, trong
đoạn văn bản text. . .


Giấu tin trong ảnh

Giấu tin trong ảnh hiện nay rất được quan tâm. nó đóng vai trò hết sức
quan trọng trong hấu hết các ứng dụng bảo vệ an toàn thông tin như: Nhận
thực thông tin, xác thực xuyên tạc thông tin, bảo vệ quyền tác giả. . . Thông tin
sẽ được giấu cùng với những dữ liệu ảnh nhưng chất lượng ảnh ít thay đổi và
không ai biết được đằng sau ảnh đó mang những thông tin gì, có ý nghĩa gì.
Ngày nay, khi ảnh số đã được sử dụng rất phổ biến thì giấu tin trong ảnh đã
đem lại nhiều những ứng dụng quan trọng trên các lĩnh vực của đời sống xã
hội.
Phần mềm WinWord của microsoft cho phép người dùng lưu chữ ký
trong ảnh nhị phân, rồi gắn vào vị trí nào đó trong file văn bản để đảm bảo
tính an toàn của thông tin.
Thông tin được giấu một cách vô hình, nó như một cách truyền thông
tin mật cho nhau mà người khác không thể biết được. Bởi vậy, sau khi đã được
giấu thông tin chất lượng ảnh gần như không có sự thay đổi đặc biệt đối với

ảnh màu hay ảnh xám.


Giấu tin trong audio

Khác với kỹ thuật giấu tin trong ảnh: Phụ thuộc vào hệ thống thị giác
của người – HSV (Human Vision System), Kỹ thuật giấu thông tin trong audio
lại phụ thuộc vào hệ thống thính giác HAS (Human Auditory System). Bởi
vậy tai con người rất kém trong việc phát hiện sự khác biệt của dải tần và công
suất, có nghĩa là các âm thanh to, cao tần có thể che giấu đi được các âm thanh
nhỏ, thấp một cách dễ dàng.
Vấn đề khó khăn đối với giấu thông tin trong audio là kênh truyền tin.
Kênh truyền hay băng thông chậm sẽ ảnh hưởng đến chất lượng thông tin sau


11
khi đã được giấu. Giấu thông tin trong audio đòi hỏi cao về tính đồng bộ và
tính an toàn của thông tin được giấu. Các phương pháp giấu tin trong audio
thường lợi dụng những điểm yếu trong hệ thống thính giác của con người để
giấu tin.
• Giấu tin trong video
Cũng như giấu thông tin trong ảnh hay audio, giấu tin trong video cũng
nhận được nhiều quan tâm và được phát triển mạnh mẽ cho nhiều ứng dụng
như điều khiển truy cập thông tin, nhận thức thông tin, bản quyền tác giả. . .
Một số phương pháp giấu tin trong video đã được đưa ra bởi Ingemar J.
Cox (Tác giả cuốn Kỹ thuật Digital Watermarking năm 1999 và 2008) là
phương pháp phân bổ đều. Ý tưởng cơ bản của phương pháp là phân phối tin
giấu dàn trải đều theo tần số của dữ liệu gốc. Nhiều nhà nghiên cứu đã dùng
hàm cosin riêng và những hệ số truyền sóng riêng để thực hiện việc giấu tin.
Trong các kỹ thuật khởi nguồn, thường thì các kỹ thuật cho phép giấu

ảnh vào trong video nhưng thời gian gần đây các kỹ thuật cho phép giấu cả âm
thanh và hình ảnh vào trong video.


Giấu thông tin trong văn bản

Giấu thông tin trong văn bản thì khó thực hiện hơn do có ít thông tin dư
thừa, để làm được điều này người ta phải khéo léo khai thác các dư thừa tự
nhiên của ngôn ngữ hoặc là tận dụng các định dạng văn bản (Mã hóa thông tin
vào khoảng cách giữa các từ hay các dòng văn bản).
Ngoài ra kỹ thuật giấu tin còn đang được áp dụng cho nhiều loại đối
tượng chứ không riêng gì dữ liệu đa phương tiện như ảnh, audio, video hay
văn bản. Gần đây đã có một số nghiên cứu giấu tin trong cơ sở dữ liệu quan
hệ, các gói IP truyền trên mạng chắc chắn sau này còn tiếp tục phát triển mạnh
hơn nữa.


12
1.3.2

Phân loại theo mục đích sử dụng
Mục đích sử dụng ở đây bao gồm ẩn tin và thủy vân số.


Ẩn tin:

Đây là ứng dụng phổ biến nhất từ trước đến nay, đối với ẩn tin người ta
thường quan tâm chủ yếu đến các mục tiêu sau:
-


Độ an toàn của ẩn tin.

-

Khả năng không bị phát hiện của ẩn tin.

-

Lượng thông tin tối đa có thể che giấu được trong một phương tiện
chứa cụ thể mà vẫn có thể đảm bảo an toàn.

-

Độ bí mật của thông tin trong trường hợp giấu tin bị phát hiện.
Ẩn tin không quan tâm tới nhiều các yêu cầu bền vững của phương tiện

chứa tin, đơn giản là bởi vì người ta có thể thực hiện việc gửi và nhận nhiều
lần một phương tiện chứa đã được giấu tin.
• Thủy vân số:
Do yêu cầu bảo vệ bản quyền, xác thực. . . nên việc giấu tin thủy vân có
nhưng yêu cầu khác so với ẩn tin. Yêu cầu đầu tiên là các dấu hiệu thủy vân
phải đủ bền vững trước các tấn công vô tình hay cố ý gỡ bỏ nó. Thêm vào đó
các dấu hiệu của thủy vân phải có ảnh hưởng tối thiểu (Về mặt cảm nhận) đối
với các phương tiện chứa. Như vậy các thông tin cần giấu càng nhỏ càng tốt.
Tùy theo các mục đích sử dụng khác nhau của thủy vân thì cũng có
những yêu cầu khác nhau.

Hình 1.4 Phân loại theo mục đích sử dụng



13
• So sánh ẩn tin và thủy vân số:
Bảng 1.1 So sánh ẩn tin và thủy vân số
Mục đích
Yêu cầu
Tấn công thành công
1.3.3

Phân loại theo cách thức tác động lên phương tiện
• Phương pháp chèn dữ liệu:
Phương pháp này tìm những vị trí trong file dễ bị bỏ qua và chèn dữ

liệu cần che giấu vào đó, cách giấu tin này không làm ảnh hưởng gì tới sự thể
hiện của các file dữ liệu.
• Phương pháp tạo các phương tiện chứa:
Từ các thông điệp cần chuyển tạo ra các phương tiện chứa để phục vụ
cho việc truyền thông tin đó, phía người nhận dựa trên các phương tiện chứa
này sẽ tái tạo lại các thông điệp được giấu.


14

2 CHƯƠNG 2
TỔNG QUAN VỀ THỦY VÂN SỐ
2.1 Khái niệm thủy vân số
2.1.1 Khái niệm
Thủy vân số là kỹ thuật nhúng thông tin vào trong vật chứa tin để xác
định bản quyền sở hữu đối với vật chứa tin, chống lại sự giả mạo và xuyên tạc
thông tin. Kích thước của thông tin thường nhỏ (Từ vài bit tới vài nghìn bit).
Có nhiều kỹ thuật thủy vân khác nhau trong đó có: Thủy vân bền vững,

thủy vân dễ vỡ, thủy vân ẩn và thủy vân hiện.
• Thủy vân bền vững
Thủy vân bền vững thường được ứng dụng trong việc bảo vệ bản
quyền. Thủy vân được nhúng trong sản phẩm nhờ một hình thức dán tem bản
quyền. Thủy vân phải tồn tại bền vững cùng với sản phẩm nhằm chống lại việc
tẩy xóa, làm giả hay biến đổi phá hủy thủy vân.
Thủy vân bền vững quan tâm đến nhúng mẩu tin đòi hỏi độ bền cao của
thông tin được giấu trước các biến đổi thông thường trên dữ liệu chứa.
Trong lĩnh vực bảo vệ bản quyền thủy vân đóng vai trò là thông tin sở hữu của
người chủ hợp pháp
• Thủy vân dễ vỡ
Thủy vân dễ vỡ là kỹ thuật nhúng thủy vân vào trong một đối tượng
(sản phẩm) và nếu có bất kỳ phép biến đổi nào làm thay đổi sản phẩm gốc thì
thủy vân đã được giấu vào trong đối tượng sẽ không còn nguyên vẹn như
trước khi giấu.
Thủy vân dễ vỡ yêu cầu thông tin che giấu sẽ bị sai lệch nếu có bất kỹ
sự thay đổi nào trên đối tượng chứa. Các kỹ thuật thủy vân có tính chất này
được sử dụng trong các ứng dụng nhận thực thông tin và phát hiện xuyên tạc
thông tin.


15
Ví dụ như để đảm bảo chống xuyên tạc của các bức ảnh trên các trang
báo, ta nhúng thủy vân vào trong ảnh đó và sau đó phát hành trên các bài báo.
Để kiểm tra ảnh có bị xuyên tạc hay không ta sử dụng hệ thông đọc thủy vân
nếu không đọc dược thủy vân hoặc bị sai lệch nhiều so với thủy vân ban đầu
nhúng vào ảnh đó thì có thể ảnh đã bị thay đổi. Cái khó ở đây chính là ta phải
phân biệt được thủy vân do xuyên tạc hay sai lệch do lỗi đường truyền.
• Thủy vân ẩn
Thủy vân ẩn cũng giống như ẩn tin, bằng mắt thường không thể phát hiện

được thủy vân ẩn trong đối tượng (sản phẩm).
• Thủy vân hiện
Thủy vân hiện là loại thủy vân hiện ngay trên đối tượng (sản phẩm) và
có thể phát hiện được sự tồn tại của thủy vân trên đối tượng (sản phẩm).
2.1.2 Nguồn gốc của thủy vân số
Phương pháp thủy vân đầu tiền được thực hiện là thủy vân trên giấy.
Đó là một thông tin nhỏ được nhúng chìm trong giấy để thể hiện bản gốc hoặc
bản chính thức. Theo Hartung và Kutter, thủy vân trên giấy đã bắt đầu được sử
dụng vào năm 1292 ở Fabriano, Italy – nơi được coi là nơi sinh của thủy vân.
Sau đó, thủy vân đã nhanh chóng lan rộng trên toàn Italy và rồi trên các nước
châu Âu và Mỹ. Ban đầu, thủy vân giấy được dùng với mục đích xác định
nhãn hàng và nhà máy sản xuất. Sau này được sử dụng để xác định định dạng,
chất lượng và độ dài, ngày tháng của sản phẩm.
Đến thế kỷ thứ 18, nó bắt đầu được dùng cho tiền tệ và cho đến nay
thủy vân vẫn là một công cụ được dùng rộng rãi với mục đích bảo mật cho
tiền tệ, chống làm tiền giả. Thuật ngữ “thủy vân” được đưa ra vào cuối thế 18,
nó bắt nguồn từ một loại mực vô hình khi viết lên giấy và chỉ hiển thị khi
nhúng giấy đó vào nước. Năm 1988, Komatsu và Tominaga đã đưa ra thuật
ngữ “thủy vân số”.


16

2.2 Mô hình của hệ thống thủy vân số
2.2.1 Mô hình của hệ thống thủy vân số

Khóa thủy vân

Dữ liệu số


Bộ nhúng thủy vân

Dữ liệu số chứa thủy
vân

Thủy vân
Gửi dữ liệu số chứa thủy
Tấn công

Thủy vân

vân

Bộ trích xuất thủy

Dữ liệu số chứa thủy

vân

vân

Khóa thủy vân

Hình 2.5 Mô hình hệ thống thủy vân số
Hệ thống thủy vấn số là quá trình sử dụng một thủy vân nhúng vào một
dữ liệu số để được một dữ liệu số có chứa thủy vân hay có thể gọi là dữ liệu có
bản quyền. Dữ liệu có bản quyền này sẽ được gửi đi, trong quá trình gửi đi dữ
liệu bản quyền có thể bị tấn công trái phép. Nếu dữ liệu bản quyền bị nghi ngờ
sao chép hoặc chỉnh sửa thông tin thì có thể xác minh nhờ quá trình trích xuất
thủy vân đã nhúng. Như vậy hệ thống thủy vân nói chung bao gồm hai quá

trình chính là quá trình nhúng thủy vân và trích xuất thủy vân.


17
Thủy vân mang thông tin bản quyền hoặc thông tin bảo mật. Khóa thủy
vân được dùng chung cho cả phiên nhúng thủy vân và trích xuất thủy vân.
Khóa thủy vân là duy nhất đối với mỗi thủy vân. Khóa đó là khóa bí mật, chỉ
người nhúng mới biết. Tùy từng bộ nhúng thủy vân mà khóa thủy vân có yêu
cầu khác nhau.
• Quá trình nhúng thủy vân
Giai đoạn này gồm thông tin khóa thủy vân, thủy vân, dữ liệu chứa và
bộ nhúng thủy vân.
Dữ liệu chứa bao gồm các đối tượng như văn bản, audio, video, ảnh…
dạng số, được dùng làm môi trường để giấu tin.
Bộ nhúng thủy vân là chương trình được cài đặt những thuật toán thủy
vân và được thực hiện với một khóa bí mật.
Thủy vân sẽ được nhúng vào trong dữ liệu chứa nhờ một bộ nhúng thủy
vân. Kết quả quá trình này là được dữ liệu chứa đã nhúng thủy vân gọi là dữ
liệu có bản quyền và được phân phối trên các môi trường khác nhau. Trên
đường phân phối có nhiễu và sự tấn công từ bên ngoài. Do đó yêu cầu các kỹ
thuật thủy vân số phải bền vững với cả nhiễu và sự tấn công trên.
• Quá trình trích thủy vân
Quá trình trích thủy vân được thực hiện thông qua một bộ trích xuất
thủy vân tương ứng với bộ nhúng thủy vân cùng với khóa của quá trình nhúng.
Kết quả thu được là một thủy vân. Thủy vân thu được có thể giống với thủy
vân ban đầu hoặc khác do sự tấn công trên đường truyền.
2.2.2 Phân loại hệ thống thủy vân
Quan hệ giữa mã hóa và thủy vân số xuất phát từ sự chia sẻ thuật ngữ
chung: Hệ thống mã hóa cá nhân và hệ thống mã hóa công khai với hệ thông
thủy vân cá nhân và hệ thống thủy vân công khai. Trong hệ thống mã hóa cá

nhân, một khóa được dùng chung cho cả việc mã hóa và giải mã còn trong hệ
thống mã hóa công khai, khóa để mã hóa và giả mã khác nhau.


18
• Hệ thống thủy vân công khai
Trong hệ thống thủy vân công khai, một đối tượng được thủy vân hóa
với một khóa cá nhân nhưng sự tồn tại của thủy vân có thể kiểm tra bằng cách
sử dụng khóa công khai. Tất nhiên là có sự tính toán để dò tìm khóa cá nhân là
không thể thực hiện được, mặc dù đã biết khóa công khai và thuật toán dùng
trong hệ thống thủy vân. Khóa công khai chỉ cho phép đọc thủy vân nhưng
không cho phép xóa thủy vân. Hệ thống thủy vân công khai thường không đòi
hỏi dữ liệu số gốc phải có mặt trong quá trình dò tìm và tách thủy vân.
Hệ thống thủy vân công khai cho phép thủy vân có thể được xác nhận
một cách an toàn bởi một tổ chức thứ ba. Nhưng cho đến nay, chưa có một hệ
thống thủy vân công khai nào tồn tại vì cách tiếp cận hiện thời không chịu
được các thiết bị tấn công dò tìm công khai được mô tả bởi Kalker và Linartz.
Hệ thống thủy vân không đối xứng là một dạng khác của hệ thống thủy
vân công khai. Hệ thống này không sử dụng dữ liệu số gốc và dùng một tham
số khác với tham số được dùng trong quá trình nhúng. Hai thuật ngữ trên được
dùng trong một văn cảnh. Còn nếu để thấy sự khác biệt thì đối với hệ thống
thủy vân không đối xứng thì khóa để tách thủy vân khác với khóa dùng để
nhúng thủy vân, còn với hệ thống thủy vân công khai thì khóa tách thủy vân
được công khai. Điều này cho phép mọi người, kể cả các kẻ tấn công có thể
biết được thủy vân.
Thiết bị tấn công dò tìm công khai của Kalker và Limartz không làm
việc trên hệ thống thủy vân không đối xứng.
• Hệ thống thủy vân cá nhân
Hệ thống thủy vân cá nhân là hệ thống thủy vân cổ điển sử dụng khóa
cá nhân, đối xứng gần như luôn cho phép xóa hoặc thêm thủy vân giả. Do đó

việc dảm bảo lưu dữ bí mật khóa dùng trong phép nhúng là điều rất cần thiết.


19

2.3 Một số tính chất của thủy vân số
Như đã đề cập, kỹ thuật thủy vân số rất hữu dụng khi ta muốn nhúng
siêu dữ liệu vào trong nội dung số. Có một số cơ chế như sử dụng phần đầu
của file dữ liệu gốc để lưu trữ dữ liệu.
Tuy nhiên khi muốn chèn các thủy vân hiện vào ảnh, video hoặc thêm
thông tin về audio trong audio thì kỹ thuật thủy vân khá phức tạp vì nó có
những đặc trưng chính sau đây:
• Tính vô hình
Khi nội dung số được nhúng thủy vân ta có thể không nhìn thấy được
nội dung đã được nhúng vì gần như việc nhúng thủy vân vào nội dung đa
phương tiện sẽ không thay đổi nhiều nội dung của đa phương tiện đó so với
nguyên bản của chính nó. có nhiều phương pháp khác nhau để đạt được điều
đó. Chẳng hạn, phương pháp nén mất dữ liệu nhằm làm giảm sự tồn tại của dữ
liệu đến mức chỉ còn dòng tín hiệu nhỏ nhất. Các nghiên cứu về thủy vân gần
đây (chẳng hạn như kỹ thuật trái phổ) lại chèn thủy vân vào vùng quan trọng
về mặt cảm nhận. Thực nghiệm cho thấy, các kỹ thuật này không những đảm
bảo tính ẩn của thủy vân mà cón nâng cao tính bền vững của thủy vân chống
lại các tấn công của dữ liệu.
• Tính bền vững
Thủy vân tạo ra phải bền vững với bất kỳ thao tác chỉnh sửa nào lên dữ
liệu gốc. Thủy vân sẽ không bị thay đổi hay phá hủy trước những hành vi có
chủ đích hoặc các hành vi làm thay đổi hình dạng hình học của dữ liệu gốc. Ví
dụ như: Chuyển đổi từ tín hiệu tương tự tín hiệu số, từ tín hiệu số sang tín hiệu
tương tự, cắt xén, lấy mẫu, quay, co dãn tỷ lệ và nén. Tính bền vững của thủy
vân bao gồm hai yêu cầu: Thủy vân còn tồn tại trong dữ liệu sau khi biến đổi

dữ liệu và có thể tách được thủy vân nhờ bộ tách thủy vân. Để đạt được tính
bền vững, một giải pháp đặt ra là đặt thủy vân trong vùng tín hiệu quan trọng
về mặt cảm nhận. Vì khi dữ liệu bị thay đổi, độ trung thực của dữ liệu chỉ


20
được đảm bảo khi vùng tín hiệu quan trọng về mặt cảm nhận còn tồn tại
nguyên vẹn trong khi vùng không quan trọng có thể bị thay đổi rất nhiều.
• Tính dễ vỡ
Tính dễ vỡ là đặc tính đối ngược hoàn toàn với tính bền vững. Thủy
vân sẽ bị phá hủy bởi bất cứ phương thức chỉnh sửa nào trên dữ liệu, vì vậy
bất kỳ thao tác nào tác động vào dữ liệu cũng sẽ bị phát hiện.
• Tính không tách rời
Tính không tách rời là khi nội dung số đã được nhúng thủy vân thì
không thể tách thủy vân ra khỏi nội dung số để lấy lại được nội dung gốc.

2.4 Một số kỹ thuật thủy vân số
Thủy vân số là kỹ thuật nhúng một lượng thông tin số vào dữ liệu số và
thông tin được gắn liền với dữ liệu số chứa thông tin được nhúng. Từ “gắn
liền” ở đây ý nghĩa là thông tin khi được nhúng vào trong dữ liệu là một thành
phần của dữ liệu đó. Nó có thể được trải khắp trên dữ liệu hoặc nằm trong một
vùng tấn số nào đó của dữ liệu, nhờ đó mà dung lượng dữ liệu chứa không bị
tăng lên. Có thể chia kỹ thuật thủy vân thành hai hướng tiếp cận chính:
• Hướng thứ nhất dựa trên miền không gian
Tức là khảo sát tín hiệu và hệ thống rời rạc một cách trực tiếp trên miền
giá trị rời rạc của dữ liệu trên miền biến đổi số độc lập tự nhiên. Sau đó tìm
cách nhúng thông tin vào bằng cách thay đổi các giá trị trên miến số dữ liệu
độc lập sao cho không làm ảnh hưởng nhiều đến dữ liệu và đảm bảo sự bền
vững của thông tin nhúng trước các tấn công có thể đối với dữ liệu đã nhứng
thủy vân. Điển hình cho cách tiếp cận của phương pháp này là phương pháp

tách bit ít quan trọng nhất – LSB (Least Singnificant Bit).
• Hướng thứ hai là sử dụng các phương pháp thủy vân trên miền
biến đổi tần số sóng:
Các kỹ thuật biến đổi này làm nhiệm vụ chuyển miền biến đổi số độc
lập sang miền mới với những biến số mới. Sau đó tìm cách nhúng thủy vân
vào dữ liệu bằng cách thay đổi các hệ số biến đổi trong những miền thích hợp


21
để đảm bảo chất lượng của dữ liệu và sự bền vững của thủy vân sau khi
nhúng. Các phép biến đổi được sử dụng là DTF (Biến đổi Furie rời rạc), DCT
(Biến đổi cosine rời rạc) và DWT (Biến đổi sóng nhỏ rời rạc).
Kỹ thuật nhứng thủy vân sử dụng phép biến đổi DCT thường chia dữ
liệu gốc thành các khối, thực hiện biến đổi DCT với từng khối dữ liệu gốc để
được miền tần số thấp, miền tần số giữa và miền tần số cao. Đa số kỹ thuật
nhúng thủy vân ẩn bền vững sẽ chọn miền tần số giữa của mỗi khối để nhúng
bit thủy vân theo một hệ số k nào đó gọi là hệ số tương quan giữa chất lượng
dữ liệu khi nhúng thủy vân (Tính ẩn của thủy vân) và độ bền của thủy vân. Kỹ
thuật thủy vân sử dụng biến đổi DWT thường phân tích ảnh gốc thành các
miền tần số LL (Low-Low), LH (Low-High), HL (High-Low) và HH (HighHigh) sau đó nhúng thông tin thủy vân vào một hoặc một số miền với hệ số
tương quan khác nhau. Dữ liệu chứa thủy vân sau đó được thử qua một phép
biến đổi.
2.4.1 Kỹ thuật thủy vân dựa trên miền không gian
Kỹ thuật này sử dụng nhiều trong giấu tin, sử dụng các bit it quan trọng
nhất –LBS. Kỹ thuật LBS là kỹ thuật sử dụng các bit ít quan trọng về thị giác
trong các bit mang ít giá trị điểm ảnh về giấu tin khi sử dụng giấu tin trong dữ
liệu. ví dụ với ảnh 256 màu thì bít cuối cùng 8 bit biểu diễn một điểm ảnh
được coi là bit ít quan trọng nhất theo định nghĩa là nếu thay đổi bit này thì
ảnh hưởng ít nhất đến cảm nhận của mắt người về điểm ảnh, bởi vì bit này
thay đổi từ 0 sang 1 hoặc ngược lại thì giá trị của điểm ảnh cũng chỉ thay đổi

một đơn vị, Sự sai khác này là không đáng kể, mắt người không thể nhận ra.
Như vậy, kỹ thuật tách bit trong sử lý dữ liệu được sử dụng nhiều trong quá
trình giấu tin, sau đây ta sẽ khảo sát một số kỹ thuật tách bit ít quan trọng trên
một số loại ảnh phổ biến hiện nay:


22
Tách bít cuối cùng trong 8 bít biểu diễn mỗi điểm ảnh trong ảnh đa cấp
xám (256 mầu):
10011100

10010101

1100010

Hình 2.6 Bít LSB trong mỗi điểm ảnh của ảnh đa cấp xám
Trong phép tách này bít cuối cùng là bít ít quan trọng nhất, thay đổi giá
trị của bit này sẽ làm thay đổi giá trị của điểm dữ liệu lên hoặc xuống đúng
một đơn vị. Ví dụ, giá trị của điểm ảnh là 234 thì khi thay đổi bit cuối cùng nó
có thể mang giá trị mới là 235 nếu giá trị bít cuối thay đổi từ 0 sang 1. Với sự
thay đổi nhỏ đó, cấp độ màu của dữ liệu số sẽ không bị thay đổi nhiều. Khi
giấu một ảnh trong các bít có giá trị thấp nhất (LSB) của mỗi byte dữ liệu số
24 bit, ta có thể giấu được 3 bit. Ví dụ, chữ A có thể giấu trong 3 pixel. Giả sử
dữ liệu gốc của 3 pixel là:
(00100111 11101001 11001000)
(00100111 11001000 11101001)
(11001000 00100111 11101001)
Giá trị nhị phân của A là 10000011, chèn mỗi bit của A vào 3 pixel ta
thu được kết quả:
(00100111 11101000 11001000)

(00100110 11001000 11101000)
(11001001 00100111 11101001)
Trong đó, các bít gạch chân là các bít thực sự bị thay đổi trong 8 byte
đã sử dụng. Nói chung kỹ thuật LSB yêu cầu chỉ một nửa số bít trong số các vị
trí bit cần thay đổi trong dữ liệu số bị thay đổi. Do đó hiệu suất giấu rất cao.


23

2.4.2 Kỹ thuật thủy vân dựa trên miền tần số sử dụng biến đổi DCT
Ưu điểm của các kỹ thuật thủy vân số trên miền không gian dữ liệu số ở
trên là có thể dễ dàng nhúng thông tin thủy vân vào bất kỳ dữ liệu số nào mà
không cần quan tâm đến quá trình sử lý tiếp sau đối với dữ liệu số, dung lượng
thủy vân đạt được khá lớn. Chính vì thế đây là phương pháp đơn giản, dễ triển
khai. Tuy nhiên, mặt bất lợi đối với các phương pháp sử lý ảnh nói chung và
các kỹ thuật thủy vân nói riêng trên miền không gian là chúng không cho phép
ta có thể dự đoán được ảnh hưởng của các quá trình xử lý sau đó với ảnh đã
nhúng thủy vân (cắt, nén dữ liệu), chính vì thế làm giảm độ bền vững của thủy
vân. Để tránh được nhúng nhược điểm đó, người ta thường tiến hành thủy vân
trên miền tần số, thông thường biến đổi cosine rời rạc (DCT) hay được sử
dụng vì tính hiệu quả của nó.
2.4.3 Thủy vân số sử dụng biến đổi DWT
Một miền khác có thể dùng để nhúng thủy vân đó là miền Wavelet.
Biến đổi Wavelet rời rạc sẽ chia tín hiệu hình ảnh thành hai phần, phần tần số
cao và tần số thấp. Thành phần tần số thấp lại được chia tiếp thành hai phần có
tần số cao và tần số thấp. Với các bài toán nén và thủy vân thường áp dụng
không quá năm lần bước phân chia trên. Ngoài ra, từ các hệ số DWT, ta có thể
tạo lại ảnh ban đầu bằng quá trình DWT ngược hay IDWT
Một trong nhiều những ưu điểm của việc nhúng thủy vân trên miền
Wavelet là nó tăng độ bện vững của thủy vân trước các tấn công trong khi

đánh lừa được hệ thống thị giác người. Mắt thường không nhìn ra được sự
khác biệt nào giữa ảnh trước và sau nhúng thủy vân. Cho phép sử dụng những
Thủy vân có năng lượng cao hơn.


24

2.5 Một số ứng dụng của thủy vân số
2.5.1 Bảo vệ bản quyền tác giả
Đây là ứng dụng cơ bản nhất của kỹ thuật thủy vân. Trong thực tế,
nhiều tác phẩm đã có tác quyền nhưng vẫn bị sử dụng sai mục đích. Các thông
báo tác quyền này thường được đặt ở một vị trí nào đó trên tác phẩm được
phân phối. Chẳng hạn, ta thường thấy trên các tài liệu văn bản là “copyright
ngày. . . . người sở hữu. . . ” hay trên các tác phẩm âm thanh thì được đặt trên
băng đĩa vật lý hoặc trên bao bì, . . . Vấn đề bảo vệ bản quyền này không được
đảm bảo vì không quá khó để loại bỏ nó ra khỏi một tài liệu khi cần sao chép.
Ví dụ, một giáo viên sao chép một số trang từ quyển sách mà quên sao
chép thông báo tác quyền ở trang tiêu đề. Một ví dụ khác nữa là ảnh của người
mẫu Lenamột ảnh thử thông thường nhất trong lĩnh vực xử lý ảnh. Ban đầu nó
là một ảnh phóng to lồng giữa trang tạp chí của Playboy. Khi ảnh được scan và
dùng cho mục đích kiểm thử, ảnh đã bị cắt xén chỉ còn khuôn mặt và vai của
Lena, dòng chữ Playboy đánh dấu tác quyền cũng bị cắt. Ngoài ra, những
dòng chữ thông tin về tác quyền này cũng làm giảm bớt vẻ đẹp của bức ảnh.
Do các dấu thủy vân có thể vừa không thể nhìn thấy vừa không thể tách rời tác
phẩm chứa nó nên sẽ là giải pháp tốt cho việc bảo vệ bản quyền tác giả. Dấu
thủy vân (một thông tin nào đó mang ý nghĩa quyền sở hữu tác giả) sẽ được
nhúng vào trong các sản phẩm, dấu thủy vân đó chỉ người chủ sở hữu hợp
pháp các sản phẩm đó có và được dùng làm minh chứng cho bản quyền sản
phẩm. Giả sử có một dữ liệu dạng đa phương tiện như ảnh, âm thanh, video
cần được lưu thông trên mạng. Để bảo vệ các sản phẩm chống lại hành vi lấy

cắp hoặc làm nhái cần phải có một kỹ thuật để “dán tem bản quyền” vào sản
phẩm này. Việc dán tem hay chính là việc nhúng thủy vân cần phải đảm bảo
không để lại một ảnh hưởng lớn nào đến việc cảm nhận sản phẩm. Yêu cầu kỹ
thuật đối với ứng dụng này là thủy vân phải tồn tại bền vững cùng với sản
phẩm, muốn bỏ thủy vân này mà không được phép của người chủ sở hữu thì
chỉ có một cách duy nhất là phá hủy sản phẩm.


25

2.5.2 Xác thực thông tin và phát hiện xuyên tạc thông tin
Dấu thủy vân không chỉ được dùng để chỉ ra thông tin bản quyền tác
giả mà còn được dùng để xác thực thông tin và phát hiện xuyên tạc thông tin.
Dấu thủy vân sẽ được nhúng trong một tác phẩm sau đó được lấy ra và so sánh
với dấu thủy vân ban đầu. Nếu có sự sai lệch chứng tỏ tác phẩm gốc đã bị tấn
công và xuyên tạc. Các thủy vân nên được ẩn để tránh sự tò mò của đối
phương, hơn nữa việc làm giả các thủy vân hợp lệ hay xuyên tạc thông tin
nguồn cũng cần xét đến. Trong các ứng dụng thực tế, người ta mong muốn tìm
được vị trí bị xuyên tạc cũng như phân biệt được các thay đổi (ví dụ như phân
biệt một đối tượng đa phương tiện chứa thông tin giấu đã bị thay đổi, xuyên
tạc nội dung hay chỉ bị nén mất dữ liệu). Yêu cầu chung đối với ứng dụng này
là khả năng giấu thông tin cao và thủy vân không bền vững.
2.5.3 Dấu vân tay hay dán nhãn
Thủy vân trong những ứng dụng này được sử dụng để nhận diện người
gửi hay người nhận một thông tin nào đó. Ví dụ các vân khác nhau sẽ được
nhúng vào các bản copy khác nhau của thông tin gốc trước khi chuyển cho
nhiều người. Với những ứng dụng này, yêu cầu là đảm bảo độ an toàn cao cho
các thủy vân, tránh khả năng xóa dấu vết trong khi phân phối.
2.5.4 Điều khiển truy nhập
Các thiết bị phát hiện thủy vân (ở đây sử dụng phương pháp phát hiện

thủy vân đã giấu mà không cần thông tin gốc) được gắn sẵn vào trong các hệ
thống đọc ghi, tùy thuộc vào việc có thủy vân hay không để điều khiển (cho
phép/cấm) truy cập. Ví dụ hệ thống quản lý sao chép DVD đã được ứng dụng
ở Nhật.


×