Tải bản đầy đủ (.doc) (61 trang)

Thủy vân ảnh số dựa vào phép biến đổi cosine rời rạc

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.36 MB, 61 trang )

1

LỜI NÓI ĐẦU
1. Giới thiệu tổng quan về đề tài.
Trong kỷ nguyên số, thông tin số được sử dụng rộng rãi trong một môi
trường mở, tài nguyên được phân phối cho nhiều người sử dụng, nhu cầu
được bảo vệ bản quyền và sở hữu trí tuệ các sản phẩm số đã trở thành một
vấn đề quan trọng và được nhiều cơ sở nghiên cứu quan tâm.
Thuỷ vân ảnh được đánh giá mang lại nhiều hứa hẹn trong ứng dụng
bảo vệ bản quyền, phát hiện xuyên tạc. Việc thuỷ vân có thể thực hiện trực
tiếp trên miền không gian ảnh hoặc trên miền biến đổi ảnh. Hiện tại, người ta
đã sử dụng các phép biến đổi rời rạc như phép biến đổi Fourier (DFT), phép
biến đổi Cosine (DCT) và phép biến đổi sóng nhỏ (DWT).
Phép biến đổi cosine rời rạc viết tắt là DCT (Discrete Cosine
Transform) được sử dụng rất phổ biến trong kỹ thuật xử lí ảnh số nói riêng và
xử lí tín hiệu số nói chung. Trong các kỹ thuật thuỷ vân ảnh dựa trên phép
biến đổi dữ liệu ảnh sang miền tần số thì phép biến đổi DCT được sử dụng
nhiều nhất. Lý do ở đây là phép biến đổi DCT đã được dùng trong dạng chuẩn
ảnh JPEG. Nếu áp dụng DCT thì cũng theo chuẩn của JPEG và do đó sẽ tránh
được mất thuỷ vân do phép nén JPEG.
2. Lý do chọn đề tài
- Đề tài mang tính ứng dụng và thực tiễn
- Đáp ứng yêu cầu bảo vệ bản quyền các sản phẩm đa phương tiện
trong môi trường phân phối lưu thông Internet.
- Phù hợp với chuyên ngành của học viên
3. Mục tiêu nghiên cứu và tính cấp thiết của đề tài


2

- Nghiên cứu tìm hiểu các kỹ thuật thủy vân số để bảo vệ bản quyền


hoặc chứng minh quyền sở hữu của bức ảnh số
- Nghiên cứu tìm cách cải tiến, mở rộng đối với một vài kỹ thuật thuỷ
vân dựa vào phép biến đổi DCT nhằm đảm bảo chất lượng của ảnh, đồng thời
nâng cao độ bền vững của thuỷ vân trước những tấn công thông thường.
- Cài đặt thử nghiệm lược đồ thuỷ vân dựa vào phép biến đổi DCT trên
ảnh tĩnh
4. Phạm vi nghiên cứu và ứng dụng
- Nghiên cứu, đánh giá kỹ thuật thuỷ vân trên ảnh tĩnh
- Công cụ lập trình và phần mềm dùng để cài đặt các ứng dụng của
thuỷ vân trên ảnh.
5. Ý nghĩa khoa học
- Nghiên cứu, đánh giá kỹ thuật thuỷ vân trên ảnh tĩnh
- Thủy vân phải tồn tại bền vững không bị xoá bởi các tấn công khác.
6. Phương pháp nghiên cứu
- Nghiên cứu các tài liệu liên quan
- Tìm hiểu và phát hiện các vấn đề trong thực tế
- So sánh đánh giá và đưa ra các giải pháp
- Cài đặt thử nghiệm trên những cải tiến được đưa ra.
7. Bố cục của luận văn
Luận văn gồm 3 chương:
Chương 1: Tổng quan về thuỷ vân ảnh số
1. Cấu trúc một số loại ảnh thông dụng
2. Giấu tin trong ảnh
3. Giới thiệu về thủy vân
4. Thuỷ vân ảnh số


3

5. Thuỷ vân trên đa phương tiện(video, audio)

6. Những tấn công trên hệ thuỷ vân
7. Những khuynh hướng tiếp cận của kỹ thuật thuỷ vân
Chương 2: Thuỷ vân ảnh số dựa vào phép biến đổi Cosine rời rạc(DCT)
1. Phép biến đổi Cosine rời rạc
2. Các thuật toán thuỷ vân ảnh dựa vào phép biến đổi Cosine rời rạc
3. Một số cải tiến, mở rộng đối với các thuật toán thuỷ vân dựa vào
phép biến đổi cosine rời rạc
Chương 3: Thiết kế và phát triển chương trình thử nghiệm
1. Cài đặt một số thuật toán thủy vân dựa vào phép biến đổi Cosine rời
rạc
2. Đánh giá so sánh các kết quả đạt được


4

NỘI DUNG NGHIÊN CỨU
CHƯƠNG I: TỔNG QUAN VỀ THUỶ VÂN ẢNH SỐ
1.1. Cấu trúc một số loại ảnh thông dụng
1.1.1. Khái niệm về ảnh số
Ảnh trong thực tế là ảnh liên tục về không gian và về giá trị độ sáng,
một ảnh có thể được định nghĩa là một hàm hai chiều f(x,y) trong đó x và y là
toạ độ trong không gian và biên độ của hàm f tại bất kỳ cặp toạ độ (x,y) nào
cũng gọi là cường độ của ảnh tại điểm đó. Khái niệm cấp xám thường được
dùng để đề cập đến cường độ của ảnh đơn sắc. Ảnh màu được tạo thành từ sự
kết hợp của các ảnh 2D riêng biệt. Ví dụ, trong hệ thống màu RGB, một ảnh
màu là sự phối hợp của ba thành phần màu (đỏ, xanh lá cây, xanh ra trời)
riêng biệt. Chính vì lý do này, rất nhiều kỹ năng áp dụng với ảnh đơn sắc
cũng có thể áp dụng với ảnh màu bằng cách xử lý ba thành phần ảnh riêng
biệt.
Chuyển đổi một ảnh thông thường sang dạng số yêu cầu toạ độ không

gian cũng như biên độ của ảnh đó phải được số hoá, nghĩa là các tín hiệu liên
tục được biến đổi thành các tín hiệu rời rạc thông qua quá trình lấy mẫu
(sampling - rời rạc hoá về không gian) và lượng tử hoá (quantization - chuyển
đối tín hiệu tương tự dạng tín hiệu số) các thành phần của ảnh mà về nguyên
tắc bằng mắt thường không thể phân biệt được hai điểm kề nhau. Do đó, khi
các giá trị x, y và biên độ của hàm f là xác định, mang giá trị rời rạc, ta gọi
một ảnh là ảnh số
Sau quá trình lấy mẫu và lượng tử hoá, ta thu được một ma trận số thực
gồm M hàng và N cột. Một giá trị (x,y) của ma trận được gọi là một điểm ảnh


5

(pixel hay pel), mỗi điểm ảnh được xác định bởi toạ độ và màu. Như vậy, một
ảnh số là tập hợp nhiều điểm ảnh, ta nói ảnh gồm M x N điểm
1.1.2. Ảnh bitmap (BMP)
Ảnh bitmap (hay Windows bitmap) được phát triển bởi microsoft
Corporation, được lưu trữ dưới dạng độc lập thiết bị cho phép Windows hiển
thị dữ liệu không phụ thuộc vào khung chỉ định màu trên bất kỳ phần cứng
nào. Các ảnh bitmap thường được lưu trữ với phần mở rộng phổ biến .bmp
(hoặc dạng ít hơn gặp hơn là .dib – device independent bitmap).
Cấu trúc một ảnh bitmap gồm bốn phần
- Bitmap Header (14byte): lưu các thông tin: Kiểu tệp, kích thước tệp,
địa chỉ offset của vùng dữ liệu
- Bitmap Information (40 byte): Lưu một số thông tin chi tiết giúp hiển
thị ảnh như kích thước ảnh (chiều rộng, chiều cao), số mặt phẳng màu
(thường cố định là 1), số bit trên một điểm ảnh (quyết định chất lượng ảnh),
độ phân giải ảnh, số màu sử dụng
- Bảng Palette màu: Định nghĩa các màu sẽ được sử dụng trong ảnh
- Bitmap data: Nằm ngay sau phần palette màu, chứa giá trị màu của

các điểm ảnh. Các điểm ảnh được lưu theo các dòng từ trái sang phải, các
dòng ảnh được lưu từ dưới lên trên. Giá trị mỗi điểm ảnh là một chỉ số trỏ tới
phần tử màu tương ứng của bảng màu
Người ta ký hiệu số bit trên một điểm ảnh (bit per pixel) là n. Một ảnh
bitmap n – bit có 2n màu, giá trị n càng lớn thì ảnh càng có nhiều màu và càng
rõ nét. Các giá trị thường gặp của n là 1 (ảnh đen trắng), 4 (ảnh 16 màu), 8
(ảnh 256 màu), 16 (ảnh high color – 65536 màu) và 24 (ảnh true color – 16
triệu màu). Ảnh 24 bit cho chất lượng ảnh trung thực nhất.


6

Đặc điểm nổi bật của ảnh bitmap là ảnh không được nén bởi bất kỳ
thuật toán nào. Khi lưu ảnh, các điểm ảnh được ghi trực tiếp vào tập tin - một
điểm ảnh sẽ được mô tả bởi một hay nhiều byte tuỳ thuộc vào giá trị n của
ảnh. Do đó, một hình ảnh lưu dưới dạng BMP thường có kích cỡ rất lớn, gấp
nhiều lần so với ảnh được nén (chẳng hạn GIF, JPEG hay PNG).
1.1.3. Ảnh JPEG (Joint Photographic Expert Group)
Ảnh JPEG là ảnh có tỉ lệ nén dữ liệu rất cao, thường dụng cho ảnh
chụp. Đây là một định dạng ảnh rất thông dụng hiện nay, phần mở rộng hay
gặp nhất của ảnh JPEG là .jpg ngoài ra còn có .jpeg, .jpe phương pháp nén
ảnh JPEG là một trong những phương pháp nén ảnh hiệu quả, có tỉ lệ nén ảnh
tới vài chục lần. Tuy nhiên ảnh sau khi giải nén sẽ khác với ảnh ban đầu. Chất
lượng ảnh bị suy giảm sau khi giải nén. Sự suy giảm này tăng dần theo hệ số
nén. Tuy nhiên sự mất mát thông tin này có thể chấp nhận được và việc loại
bỏ những thông tin không cần thiết được dựa trên những nghiên cứu về hệ
thống thị giác người.
Quá trình nén ảnh JPEG thường trải qua các giai đoạn:
- Chuyển đổi hệ thống màu RGB sang hệ thống màu YCbCr (Y:
Intensity, Cb: Blue/Yellow, Cr: Red/Green)/

- Loại bỏ các thông tin thừa trong ảnh gốc, các thông tin được chọn để
loại bỏ thường có đặc điểm ít gây chú ý với mắt người, có mặt chúng hay
không con người cũng khó nhận thấy.
- Biến đổi Cosine rời rạc ảnh ban đầu được chia thành các khối 8*8 và
thực hiện phép biến đổi Cosine rời rạc trên các khối này.
- Lượng tử hoá: Dựa vào ma trận lượng tử và công thức để lượng tử
hoá các hệ số DCT (DCT Coefficients).


7

Sắp xếp theo hình zig-zag: Các hệ số DCT sau khi được lượng tử hoá
phần lớn đều mang giá trị 0, ta sắp xếp theo hình zig – zag, sẽ được các hệ số
DCT khác 0 nằm phía trên bên trái của ma trận lượng tử.
- Nén không mất dữ liệu: Thuật toán Huffman thường được sủ dụng để
nén, tạo ảnh JPEG.
Với các ưu điểm có được, ảnh JPEG được công nhận là chuẩn để lưu
trữ ảnh màu thực tế (theo chuẩn ISO 10918 - 1).
1.2. Giấu tin trong ảnh
1.2.1. Khái niệm giấu tin
Giấu tin là kỹ thuật nhúng một lượng thông tin số nào đó vào trong một
đối tượng dữ liệu số khác. Một trong những yêu cầu cơ bản của giấu tin là
đảm bảo tính chất ẩn của thông tin được giấu đồng thời không làm ảnh hưởng
đến chất lượng của dữ liệu gốc.
1.2.2. Mục đích của việc giấu tin
Tính năng an toàn và bảo mật thông tin của kỹ thuật giấu tin được thể
hiện ở hai khía cạnh:
Một là bảo vệ cho dữ liệu đem giấu (embedded), thông tin mật được giấu kỹ
trong đối tượng khác sao cho người khác không phát hiện được.
Hai là bảo vệ chính đối tượng được dùng để giấu tin (hot data), như ứng dụng

bảo vệ bản quyền, phát hiện xuyên tạc thông tin (watermarking),…
1.3. Giới thiệu về thuỷ vân
1.3.1. Thuỷ vân là gì?
“Thuỷ vân” có xuất xứ từ thời xưa. Đây là kỹ thuật đánh dấu chìm một
hình ảnh, một lôgô, hay một dữ liệu nào đó trên giấy nhằm mục đích trang trí


8

và phân biệt được xuất xứ của sản phẩm giấy. Như vậy, thông tin cần giấu
được gọi là “ thuỷ vân”
Nói đến kỹ thuật thuỷ vân số là nói đến kỹ thuật giấu tin nhằm đếm
những ứng dụng bảo đảm an toàn dữ liệu cho đối tượng được sử dụng để giấu
tin như: bảo vệ bản quyền chống xuyên tạc, nhận thực thông tin, điều khiển
truy cập,… Có thể thấy rõ phần ứng dụng của thủy vân là rất lớn, mỗi ứng
dụng lại có những yêu cầu riêng và tính chất riêng, do đó các kỹ thuật thuỷ
vân cũng có những tính năng khác biệt tương ứng.
1.3.2. Phân loại thuỷ vân
Dựa và các tính chất , đặc trưng, ứng dụng của từng kỹ thuật mà người
ta phân làm hai: Thuỷ vân bền vững và thuỷ vân dễ vỡ


9

Watermarking
Thuỷ vân số

Robust Copyright
marking
Thuỷ vân bền vững

Imperceptible
Watermarking
Thuỷ vân ẩn

Fragile Watermarking
Thuỷ vân dễ vỡ

Visible
Watermarking
Thuỷ vân hiển

Hình 1.1: Phân loại các kỹ thuật thuỷ vân
Thuỷ vân bền vững (Robust Copyright Marking) là thuỷ vân tồn tại bền
vững cùng với dữ liệu, không dễ dàng bị phá huỷ trước những biến đổi, tấn
công lên dữ liệu. Các kỹ thuật này thường được dùng trong các ứng dụng bảo
vệ bản quyền, chứng minh quyền sở hữu.Trong những ứng dụng đó, thuỷ vân
đóng vai trò là thông tin sở hữu của người chủ hợp pháp. Thuỷ vân được
nhúng trong sản phẩm như một hình thức dán tem bản quyền. Trong trương
hợp như thế, thuỷ vân phải tồn tại bền vững cùng với sản phẩm chống việc
tẩy xoá, làm giả hay biến đổi phá huỷ thuỷ vân. Một yêu cầu lí tưởng là nếu
muốn loại bỏ thuỷ vân chỉ còn cách phá huỷ sản phẩm.
Thuỷ vân bền vững lại được chia làm hai loại là thuỷ vân ẩn và thuỷ
vân hiển. Thuỷ vân hiển là loại thuỷ vân được hiện ngay trên sản phẩm và
người dùng có thể nhìn thấy được. Các thuỷ vân hiển trên ảnh thường dưới
dạng chìm, mờ để không gây ảnh hưởng đến chất lượng ảnh gốc. Đối với thuỷ
vân hiển thông tin bản quyền hiển thị ngay trên sản phẩm ví dụ như các logo,
biểu tượng hay giống như tên kênh trên chương trình ti vi ta thường thấy


10


VTV1, VTV3,…các thuỷ vân hiển trên ảnh thường dưới dạng chìm, mờ hoặc
trong suốt không gây ảnh hưởng đến chất lượng ảnh gốc.
Đối với thuỷ vân hiển thông tin bản quyền hiển thị ngay trên sản phẩm

Hình 1.2: Ví dụ về thuỷ vân hiện (Trên trang Web thư viện số của Liên
Bang Mỹ)

Hình 1.3: Ảnh Lena đã nhúng thuỷ vân là logo ở hình bên phải
Còn đối với thuỷ vân ẩn thì cũng giống như giấu tin, thuỷ vân phải đảm
bảo tính chất ẩn trên ảnh, bằng mắt thường không thể nhìn thấy được. Tính
chất ẩn sẽ làm cho sản phẩm không bị ảnh hưởng cảm nhận bằng mắt thường
như đối với thuỷ vân hiển. Đây là một tính chất ưu việt hơn của thuỷ vân ẩn
do đó người ta tập trung vào nghiên cứu các kỹ thuật thuỷ vân ẩn. Còn trong
vấn đề bảo vệ bản quyền, thuỷ vân ẩn mang tính “bất ngờ” hơn. Khi người
nào đó định sử dụng sản phẩm của người khác, người ta sẽ không nhìn thấy
và không biết rằng sản phẩm đó đã bị đánh dấu bản quyền, nếu sử dụng trái
phép thì người chủ sở hữu hợp pháp sẽ kiện với bằng chứng là thuỷ vân đã
được nhúng trong đó.


11

Thuỷ vân dễ vỡ (Fragile Watermarking) là thuỷ vân dễ bị biến đổi
trước những biến đổi hay tấn công lên dữ liệu. Các kỹ thuật này thường được
dùng trong các ứng dụng nhận thực thông tin, đảm bảo tính toàn vẹn dữ liệu
1.3.3. Mục đích của việc “Thuỷ vân”
Tính năng an toàn và bảo mật thông tin của kỹ thuật giấu tin được thể
hiện ở các khía cạnh sau:
Thứ nhất là bảo vệ cho dữ liệu đem giấu (embedded), thông tin mật

được giấu trong đối tượng khác sao cho người khác không phát hiện được.
Thứ hai là bảo vệ cho chính đối tượng được dùng để giấu tin (host
data), như ứng dụng của bảo vệ bản quyền, phát hiện xuyên tạc thông tin,…
Tưng ứng với hai khía cạnh đó chúng ta có hai khuynh hướng kỹ thuật
rõ ràng đó là giấu tin mật (Steganography) và thuỷ vân số (Watermarking).
Trong kỹ thuật giấu tin mật, thông tin cần giấu gọi là thông điệp (thuỷ
vân), trong kỹ thuật thuỷ vân số thì gọi là thủy vân (Watermark). Thuỷ vân có
thể là một chuỗi các ký tự hay một hình ảnh logo nào đó.
1.3.3.1. Bảo vệ bản quyền tác giả (copyright protection):
Đây là ứng dụng cơ bản nhất của kỹ thuật thuỷ vân số, một dạng của
phương pháp giấu tin. Một thông tin nào đó mang ý nghĩa quyền sở hữu tác
giả sẽ được nhúng vào trong các sản phẩm kỹ thuật số trước khi đưa vào lưu
thông, phân phối. Thuỷ vân này chỉ một mình người chủ sở hữu hợp pháp các
sản phẩm đó có và được dùng làm minh chứng cho bản quyền sản phẩm. Giả
sử có một thành phẩm dữ liệu dạng đa phương tiện như ảnh, âm thanh, video
và cần được lưu thông trên mạng. Để bảo vệ các sản phẩm chống lại các hành
vi lấy cắp hoặc làm nhái cần phải có một kỹ thuật để “dán tem bản quyền”
vào sản phẩm này. Việc dán tem hay chính là việc nhúng thuỷ vân cần phải


12

đảm bảo không để lại một ảnh hưởng lớn nào đến chất lượng cảm nhận của
sản phẩm. Yêu cầu kỹ thuật đối với ứng dụng này là thuỷ vân phải tồn tại bền
vững cùng với sản phẩm, muốn bỏ thuỷ vân này mà không được phép của
người chủ sở hữu thì chỉ còn cách là phá huỷ sản phẩm.

Hình 1.4: Hai ảnh trước và sau khi giấu tin giống hệt nhau
1.3.3.2. Nhận thực thông tin và phát hiện xuyên tạc thông tin
(authentication and tamper detection):

Một tập các thông tin sẽ được giấu trong sản phẩm. Sau đó, các thông
tin này sẽ được sử dụng để nhận biết xem sản phẩm gốc có bị thay đổi hay
không. Trong trường hợp này, các thuỷ vân thường có dạng ẩn để không bị
phát hiện và nếu có bị lộ thì cũng khó làm giả và cũng dễ nhận ra những chỗ
đã bị xuyên tạc. Trong các ứng dụng thực tế, người ta mong muốn tìm được
vị trí bị xuyên tạc cũng như phân biệt được các thay đổi (ví dụ như phân biệt
xem một đối tượng đa phương tiện chứa thông tin giấu đã bị thay đổi, xuyên
tạc nội dung hay là chỉ bị nén mất dữ liệu). Yêu cầu chung đối với ứng dụng
này là khả năng giấu thông tin cao và thuỷ vân không cần bền vững.

Hình 1.5: Thực chất bên trong ảnh có chứa thông tin người chủ sở hữu


13

1.3.3.3. Lăn tay hoặc dán nhãn (fingerprinting or labeling):
Thuỷ vân trong những ứng dụng này đựơc sử dụng để nhận diện người
gửi hay người nhận của một thông tin nào đó. Ví dụ như các vân khác nhau sẽ
được nhúng vào các bản copy khác nhau của thông tin gốc trước khi chuyển
cho nhiều người. Với những ứng dụng loại này thì yêu cầu cơ bản chính là
đảm bảo độ an toàn cao cho các thuỷ vân không bị xoá hoặc thay đổi trong
quá trình phân phối.
1.3.3.4. Kiểm soát sao chép (copy control):
Các thuỷ vân trong những trường hợp này được sử dụng để kiểm soát
sao chép không hợp lệ đối với các sản phẩm kỹ thuật số. Các thiết bị phát
hiện ra thuỷ vân thường được gắn sẵn vào trong các hệ thống đọc/ghi. Ví dụ
như hệ thống quản lí sao chép DVD đã được ứng dụng ở Nhật. Các ứng dụng
loại này cũng yêu cầu thuỷ vân phải được bảo đảm an toàn và cũng sử dụng
phương pháp phát hiện thuỷ vân đã giấu mà không cần thông tin gốc.
1.3.4. Truyền thông tin mật (Steganography)

Các thông tin được giấu trong các trường hơp này càng nhiều càng tốt.
Việc giải mã để nhận được thông tin cũng không cần phương tiện chứa thông
tin gốc


14

Một mẫu cơ bản về quy trình thủy vân và tìm lại thuỷ vân:
Ảnh chủ

Ảnh sau
thuỷ vân

Thuỷ vân

Chữ ký,
hình
ảnh,
text

Tấn công

Khoá
Xuyên tạc
(tấn công )
Chữ

tìm
được


Quyết định
(so sánh,
hiệu chỉnh)

Tìm lại
Ảnh chủ

Hình 1.6: Sơ đồ nhúng thuỷ vân và tìm lại thuỷ vân
1.3.4.1. Quy trình thuỷ vân:
Dữ liệu đưa vào là ảnh chủ và đối tượng dùng để nhúng vào ảnh
(watermark), watermark có thể ở bất kỳ dạng nào như chữ số, văn bản hay
hình ảnh. Khoá có thể được dùng để tăng cường tính bảo mật, ngăn chặn
những kẻ không có bản quyền khôi phục hay phá huỷ watermark. Sau đó
bằng cách sử dụng kỹ thuật thuỷ vân để nhúng watermark vào ảnh chủ ta thu
được ảnh sau khi nhúng. Ảnh sau khi nhúng có thể nhìn thấy watermark (thuỷ
vân hiện) hoặc không nhìn thấy watermark (thuỷ vân ẩn). Ảnh sau khi thuỷ
vân có thể bị những tấn công bên ngoài có chủ đích hoặc không có chủ đích
như nén ảnh, xuyên tạc ảnh,……
1.3.4.2. Quy trình tìm lại thủy vân:


15

Dữ liệu vào là ảnh đã được thuỷ vân, khoá và dữ liệu gốc (có thể có
hoặc không tuỳ thuộc vào phương pháp tìm thuỷ vân). Dữ liệu ra là
watermark khôi phục được hoặc đại lượng nào đó chỉ ra mối tương quan giữa
watermark thu đựơc và watermark cho trước ở dữ liệu vào. Ta so sánh giữa
watermark trước khi nhúng và watermark khôi phục để chứng thực bản quyền
của sản phẩm.
1.4. Thuỷ vân ảnh số

Hệ thuỷ vân số trên ảnh cũng là một hệ giấu tin nên cũng có một số đặc
điểm và tính chất giống như giấu tin trong ảnh như:
Phương tiện chứa có dữ liệu tri giác tĩnh.
Thuỷ vân trên ảnh tác động lên dữ liệu ảnh nhưng không làm thay đổi
kích thước ảnh
Kỹ thuật giấu phụ thuộc vào tính chất của hệ thống thị giác con người.
Khi giải tin có cần phương tiện chứa gốc(ảnh gốc)
Ngoài một số đặc điểm chung ra, kỹ thuật thuỷ vân số được phân biệt
với kỹ thuật giấu tin mật ở những đặc trưng sau đây:
1.4.1. Thông tin trong ảnh có bị biến đổi nếu có bất cứ một biến đổi nào
trên ảnh?
Tính chất này có trong kỹ thuật giấu tin mật nhưng đối với kỹ thuật
thuỷ vân thì chỉ có trong trong loại thuỷ vân dễ vỡ. Còn đối với loại thuỷ vân
bền vững thì lại yêu cầu chống lại được những phép biến đổi thông thường
trên ảnh.


16

1.4.2. Thuỷ vẩn ẩn hay thuỷ vân hiển?
Không giống như giấu tin mật với yêu cầu bắt buộc là thông điệp giấu
phải ẩn bên trong ảnh sao cho mắt thường không nhìn thấy được thì kỹ thuật
thuỷ vân số lại có hai loại là thuỷ vân ẩn và thủy vân hiển. Nghĩa là thuỷ vân
ẩn thì mắt thường không nhìn thấy được nó được dùng mục đích gài bí mật
các thông tin trong ảnh để xác nhận chủ quyền của bức ảnh. Thuỷ vân hiển
cho phép nhìn thấy được thông tin đem nhúng vào, nó được sử dụng cho mục
đích công bố công khai về chủ quyền sở hữu(trong trường hợp này ta dùng từ
nhúng thay cho từ giấu thích hợp hơn).
1.4.3. Tính chất bền vững
Tính chất này là tính chất quan trọng nhất của một hệ thuỷ vân bền

vững. Nghĩa là hệ thuỷ vân phải chống lai được các phép biến đổi, hay các tấn
công có chủ đích hoặc không có chủ đích lên thuỷ vân.
1.4.4. Thuỷ vân cái gì?
Một câu hỏi đầu tiên đối với hệ thuỷ vân là thông tin gì sẽ được giấu
vào bên trong ảnh? Kiểu thuỷ vân hay dùng nhất là một chuỗi các kỹ tự mã
ASCII, chuỗi kí tự được nhúng trực tiếp lên ảnh mang những thông tin như
tác giả, tiêu đề hay ngày tháng…Tuy nhiên, chuỗi kí tự mã ASCII lại bị một
hạn chế đó là mỗi ký tự biểu diễn bằng nhiều bít nếu như vì một lí do nào đó
một bít bị lỗi thì sẽ làm sai cả kí tự và do đó chỉ cần một phép biến đổi đơn
giản như phép biến đổi JPEG cũng có thể làm cho thuỷ vân bị sai lệch rất
nhiều.


17

Ví dụ thuỷ vân dòng chữ “IBM” vào bức ảnh

Hình 1.7.1: Ảnh chủ

Hình 1.7.2: Text thuỷ
vân (watermark)

Hình 1.7: Thuỷ vân dòng Text vào ảnh chủ
Kết quả thu được:

Hình 1.8: Kết quả thu được khi thực hiện thuỷ vân
Chúng ta cũng có thể dùng ảnh để giấu, khi đó ta sẽ có ảnh trong ảnh.
Khi giải tin thì một số điểm ảnh có thể sai nhưng hình tổng thể sẽ được giữ
nguyên. Do đó khi lựa chọn ảnh làm thuỷ vân phải lựa chọn những bức ảnh
đơn giản, dễ nhận dạng như logo,..



18

Ví dụ về thuỷ vân một bức ảnh nhỏ vào ảnh chủ

Hình 1.9: Kết quả thu được khi thuỷ vân bức ảnh nhỏ vào ảnh chủ
Trong những kỹ thuật gần đây, người ta sử dụng thuỷ vân là một chuỗi
bít sinh ngẫu nhiên theo một luật phân phối xác suất nào đó. Và sau đó áp
dụng các lí thuyết xác suất thống kê để chứng thực thuỷ vân. Kỹ thuật này
chúng ta sẽ tìm hiểu ở phần sau.
Trong các loại kỹ thuật thuỷ vân thì kỹ thuật thuỷ vân ẩn, bền vững là
loại kỹ thuật được quan tâm nghiên cứu nhiều nhất vì ý nghĩa ứng dụng lớn
của nó như đã nói ở phần trên. Do vậy, hai tính chất quan trọng nhất của hệ
thuỷ vân mà các nhà nghiên cứu đang cố gắng đạt được là thuộc tính ẩn và
thuộc tính bền vững. Nhưng đây lại là mấu chốt của sự phức tạp vì hai thuộc
tính mâu thuẫn nhau này. Nếu như để đảm bảo thuộc tính ẩn thì thuỷ vân phải
được giấu trong những vị trí mà ít có ý nghĩa tri giác nhất, ít bị chú ý nhất
nhưng để đảm bảo được thuộc tính bền vững thì thuỷ vân phải chịu được
những phép xử lí ảnh phổ biến như dịch chuyển ảnh hay nén JPEG. Ví dụ như
phép nén JPEG loại bỏ ở ảnh những thông tin ít có tính tri giác nhất để làm
giảm kích thước của ảnh mà vẫn đảm bảo được chất lượng ảnh. Khi đó thì
những dữ liệu của thuỷ vân nằm trong vùng này sẽ bị mất đi hoặc bị biến đổi


19

sai lệch hoàn toàn. Với tính phức tạp của yêu cầu cho một hệ thuỷ vân, phần
sau đây chúng ta sẽ đi tìm hiểu những giải pháp kỹ thuật đã được đưa ra của
các nhà khoa học trên thế giới.

1.5. Thuỷ vân trên đa phương tiện(video, audio,…)
Kỹ thuật giấu thông tin trong audio phụ thuộc vào hệ thống thính giác
của con người (HAS - Human Auditory System). HAS cảm nhận được các tín
hiệu ở dải tần rộng và công suất thay đổi lớn, nhưng lại kém trong việc phát
hiện sự khác biệt nhỏ giữa các dải tần và công suất. Điều này có nghĩa là, các
âm thanh to, cao tần có thể che giấu được các âm thanh nhỏ thấp một cách dễ
dàng. Kênh truyền tin cũng là một vấn đề. Kênh truyền hay băng thông chậm
sẽ ảnh hưởng đến chất lượng thông tin sau khi giấu. Giấu thông tin trong
audio yêu cầu rất cao về tính đồng bộ và tính an toàn của thông tin.
Giấu tin trong video cũng được quan tâm và được phát triển mạnh mẽ
cho nhiều ứng dụng như điều khiển truy cập thông tin, nhận thực thông tin và
bảo vệ bản quyền tác giả. Ta có thể lấy một ví dụ là các hệ thống chương trình
trả tiền xem theo video clip (pay per view application). Các thuật toán trước
đây thường cho phép giấu ảnh vào trong video, nhưng gần đây kỹ thuật cho
phép giấu cả âm thanh và hình ảnh vào video.
1.6. Những tấn công trên hệ thuỷ vân
Phương pháp thuỷ vân nên chống lại được một số phép xử lý ảnh thông
thường và một số tấn công có chủ đích. Cho đến nay vẫn chưa có một hệ
thống thuỷ vân hoàn hảo và cũng không rõ ràng việc liệu có tồn tại hay không
một hệ thống thuỷ vân an toàn tuyệt đối. Vì vậy, trong thực tế thì thuỷ vân
phải cân đối giữa bền vững với các thuộc tính khác như lượng thông tin giấu,
tính ẩn…Dựa trên các yêu cầu của ứng dụng, người ta sẽ lựa chọn một
phương pháp thuỷ vân thích hợp nhất. Từ những biến đổi có chủ đích hay
không có chủ đích đã biết đối với hệ thuỷ vân mà ta có thể phân biệt thành hai


20

nhóm xuyên tạc sau: một là các biến đổi được xem như là các nhiễu đối với
dữ liệu hai là làm mất tính đồng bộ để không thể lấy tin ra được. Hãy xem

một vài phép thay đổi sau đây:
-

Biến đổi tín hiệu: làm sắc nét, thay đổi độ tương phản, màu, gamma…
Nhiễu cộng, nhiễu nhân…
Lọc tuyến tính
Nén mất thông tin
Biến đổi affine cục bộ hoặc toàn cục
Giảm dữ liệu:cropping, sửa histogram
Chuyển mã (gif → Jpeg)
Chuyển đổi tương tự - số
Thuỷ vân nhiều lần

Nguyên tắc cơ bản của phương pháp thuỷ vân là đảm bảo đủ tính bền
vững sao cho các tấn công sẽ làm cho giá trị thương mại của ảnh gốc sẽ bị ảnh
hưởng.
1.7. Những khuynh hướng tiếp cận của kỹ thuật thuỷ vân
1.7.1 Hướng tiếp cận dựa trên miền không gian ảnh
Đây là hướng tiếp cận cơ bản và tự nhiên của các kỹ thuật thuỷ vân.
Miền không gian ảnh (spatial domain) là miền dữ liệu ảnh gốc, tác động lên
miền không gian ảnh chính là tác động lên các điểm ảnh, thay đổi giá trị trực
tiếp của điểm ảnh. Đây là hướng tiếp cận tự nhiên bới lẽ khi nghĩ đến việc
giấu tin trong ảnh người ta nghĩ ngay đến việc thay đổi giá trị các điểm ảnh để
giấu. Một phương pháp phổ biến sử dụng hướng tiếp cận này đó là phương
pháp thay thể bít ít quan trọng nhất của mỗi điểm ảnh mà ta đã tìm hiểu trong
các kỹ thuật giấu tin mật.
Ý tưởng cơ bản của phương pháp thay thế bít ít quan trọng nhất LSB
(Least Significant Bit) là chọn ra từ mỗi điểm ảnh các bít có ít ý nghĩa nhất về
mặt tri giác để sử dụng cho việc giấu tin. Bít nào được coi là ít tri giác nhất và



21

bao nhiêu bít có thể được lấy ra để thay thế thì phụ thuộc vào tính chất hệ
thống thị giác cuả con người và tuỳ từng ứng dụng cần chất lượng ảnh sau khi
giấu cao hay thấp. Ví dụ, trong ảnh 24 bít mau, mỗi bít được biểu diễn bởi 24
bít tương ứng với ba màu RGB, mỗi màu chiếm 1 byte. Người ta sử dụng một
tính chất của mắt người là sự cảm nhận về màu B (Blue) kém hơn so với hai
màu RG, chính vì thế mà người ta thường chọn bít cuối cùng trong 8 bít biểu
diễn màu B của mỗi điểm ảnh để giấu tin. Thay đổi bít cuối cùng trong 8 bít
biểu diễn màu B chỉ làm cho giá trị biểu diễn màu B tăng hoặc giảm đi 1 đơn
vị. Do vậy, các bít ít quan trọng nhất trong trường hợp này là bít thứ 24 của
mỗi điểm ảnh. Một số thuật toán muốn giấu nhiều hơn và chất lượng ảnh thấp
hơn một chút có thể sử dụng bít cuối cùng của mỗi byte biểu diễn mỗi màu
RGB làm bít ít quan trọng nhất. Trong trường hợp này thì mỗi điểm ảnh sẽ
chọn ra được 3 bít LSB.
Tuy nhiên, phương pháp này cũng có nhiều hạn chế như không đảm
bảo được tính bền vững của thuỷ vân. Điều này rất dễ hiểu phương pháp dựa
vào trực tiếp giá trị của điểm ảnh để giấu. Khi giá trị điểm ảnh bị thay đổi do
các biến đổi ảnh hay do một phép xử lí ảnh thông thường nào đó như quay
ảnh, nén Jpeg thì thông tin giấu sẽ bị sai. Một hạn chế nữa là nếu thuật toán bị
lộ ra thì thông tin nhúng dễ dàng được lấy ra và có thể bị sửa đi theo nghĩa
khác.
1.7.2 Hướng tiếp cận dựa trên miền tần số của ảnh
Hướng tiếp cận dựa trên miền không gian ảnh như đã trình bày ở trên là
cách tiến hành khảo sát tín hiệu và hệ thống rời rạc một cách trực tiếp trên
miền giá trị rời rạc của các điểm ảnh người ta gọi là trên miền biến số độc lập
tự nhiên. Nhưng trong nhiều trường hợp cách khảo sát trực tiếp này gặp phải
những khó khăn nhất định hoặc rất phức tạp và hiệu quả không cao.



22

Ngoài phương pháp khảo sát trực tiếp này chúng ta có thể dùng nhiều
phương pháp khảo sát gián tiếp khác thông qua các kĩ thuật biến đổi. Các biến
đổi này làm nhiệm vụ chuyển miền biến số độc lập sang các miền khác và
như vậy tín hiệu và hệ thống rời rạc sẽ được biểu diễn trong các miền mới này
với các biến số mới. Phương pháp biến đổi này cũng giống như phương pháp
đổi biến trong tính tích phân hay phương pháp đổi hệ toạ độ trong toán giải
tích của toán phổ thông quen thuộc.
Mỗi một cách biến đổi sẽ có những thuật lợi riêng của nó, tuỳ từng
trường hợp mà chúng ta dùng biến đổi nào. Sau khi khảo sát xong các tín hiệu
và hệ thống rời rạc trong miền các biến số mới này nếu cần thiết chúng ta sẽ
dùng các biến đổi ngược để đưa chúng về miền biến số độc lập cũ.
Phương pháp khảo sát gián tiếp này sẽ làm đơn giản rất nhiều các công
việc mà chúng ta gặp phải khi dùng phương pháp khảo sát trực tiếp trong
miền biến số độc lập tự nhiên. Đối với chúng ta hệ thống rời rạc cần khảo sát
chính là miền không gian các điểm ảnh, có nhiều phép biến đổi cho dữ liệu
ảnh trong đó có một số phương pháp biến đổi được sử dụng rất phổ biến như
Fourier, biến đổi Cosine rời rạc, Wavelet…Các phép biến đổi này được sử
dụng rất nhiều trong các kỹ thuật xử lí ảnh.
Trong phần một số kỹ thuật bổ trợ cho các phương pháp thuỷ vân ở
phần sau sẽ trình bày một số phép biến đổi này đang được ứng dụng rất nhiều
trong kỹ thuật thuỷ vân.
1.8. Một số kỹ thuật bổ trợ cho các kỹ thuật thuỷ vân số trên ảnh
Phương pháp thuỷ vân số là một phương pháp mới và rất phức tạp, có
thể nói việc nghiên cứu vẫn đang diễn ra và đang được các nhà nghiên cứu
hình thành dần khung lý thuyết cho nó. Nhưng cho đến nay những kỹ thuật
đưa ra cũng chỉ là những thử nghiệm, lúc thì người ta dùng các công cụ lý



23

thuyết mật mã học, lúc thì kỹ thuật truyền thông, khi lại sử dụng lý thuyết
thông tin,.. cho nên những kỹ thuật thuỷ vân cũng hết sức phong phú và như
vậy khi làm về thuỷ vân ta phải biết nhiều kỹ thuật và nhiều lĩnh vực lý thuyết
khác nhau. Tuy nhiên qua khảo sát gần đây của giáo sư Deepa Kunder của
Trường đại học Toronto thì có 2 khuynh hướng chủ yếu đã được hình thành
đó là khuynh hướng sử dụng lý thuyết thông tin và lý thuyết truyền thông.
Theo giáo sư, khuynh hướng lý thuyết truyền thông thực tế hơn so với
lý thuyết thông tin và có thể sử dụng dễ dàng hơn trong thiết kế thuật toán. Có
một vài sự khác biệt đặc trưng giữa hai khuynh hướng này. Kỹ thuật thuỷ vân
dựa trên lý thuyết truyền thông thường sử dụng những cơ sở lý thuyết trong
truyền thông để thiết kế như việc dùng lý thuyết phân tích thống kê để tạo
thuỷ vân và kiểm định thuỷ vân lấy ra so với thuỷ vân được nhúng vào. Kỹ
thuật trải phổ tín hiệu để truyền tin hay kỹ thuật tạo nhiễu cộng và lọc nhiễu.
Trong khi đó, khuynh hướng dùng lý thuyết thông tin lại sử dụng những cơ sở
phân tích chung để phân tích chung để làm sao thu được hiệu suất cao nhất,
chiến lược tốt nhất cho một thuật toán cụ thể hay khả năng chịu tấn công đối
với một kỹ thuật thuỷ vân. Một sự khác biệt nữa giữa hai khuynh hướng kỹ
thuật thuỷ vân này là sự đánh giá hệ thống thuỷ vân. Đối với khuynh hướng
sử dụng lý thuyết truyền thông thì thường nhận biết thuỷ vân và đánh giá hệ
thống thuỷ vân thông qua độ bền vững của thuỷ vân trước và sau khi giấu
bằng phép đo hệ số lấy ra tỉ lệ bít lỗi (BER-Bit Error Rate). Còn những kỹ
thuật theo khuynh hướng lý thuyết thông tin thì chủ yếu hệ thống được đánh
giá thông qua khả năng giấu. Nghĩa là tổng số bít có thể được nhúng và được
lấy ra một cách đáng tin cậy.


24


CHƯƠNG II: THUỶ VÂN ẢNH SỐ DỰA VÀO PHÉP
BIẾN ĐỔI COSINE RỜI RẠC (DCT)
2.1. Phép biến đổi Cosine rời rạc
Biến đổi cosin rời rạc viết tắt là DCT - Discrete Cosine Transform được
đưa ra bởi Ahmed và các đồng nghiệp của ông vào năm 1974. Từ đó cho đến
nay, nó được sử dụng rất phổ biến trong nhiều các kỹ thuật xử lí ảnh số nói
riêng và các kỹ thuật xử lí tín hiệu số nói chung. Trong các kỹ thuật thuỷ vân
ảnh dựa trên phép biến đổi dữ liệu ảnh sang miền tần số thì phép biến đổi
DCT cũng được sử dụng nhiều nhất. Lí do ở đây là phép biến đổi DCT đã
được dùng trong dạng chuẩn ảnh JPEG. Nếu áp dụng DCT thì cũng theo
chuẩn của JPEG và do đó sẽ tránh được mất thuỷ vân do phép nén JPEG.
2.1.1.Định nghĩa biến đổi cosine rời rạc hai chiều
Biến đổi DCT hai chiều tổng quát là biến đổi trên khối hai chiều bất kì M*N,
trong đó các khối kích thước 8*8, 16*16 được sử dụng nhiều nhất. Tuy nhiên,
chúng ta sẽ chỉ tìm hiểu phép biến đổi DCT trên khối 8*8 được sử dụng trong
chuẩn nén ảnh JPEG. Vì tiêu chuẩn chọn khối phổ biến nhất vẫn là 8×8, có
thể giải thích vấn đề này trên phương diện khả năng xử lý của phần cứng: Bởi
vì, khối 8×8 trùng khớp với kích thước dữ liệu cực đại mà công nghệ vi mạch
điện tử hiện thời có thể xử lý tại một thời điểm.
Phép biến đổi thuận DCT 8*8 được định nghĩa như sau:

ζ (u )ζ (v) 7 7
(2k + 1)uπ
(2l + 1)vπ
I (u , v ) =
X (k , l ) cos(
) cos(
)



4 k= 0 l= 0
16
16
Còn biến đổi ngược IDCT được định nghĩa như sau:


25

ζ (u )ζ (v)
(2k + 1)uπ
(2l + 1)vπ
I (u, v) cos(
) cos(
)
4
16
16
k=0 l=0
7

7

X (k , l ) = ∑ ∑
Trong đó:

I(u,v) được gọi là hệ số DCT và là số thực
X(k,l) là các mẫu gốc trong khối ma trận 8x8
u: Tần số ngang chuẩn hoá 0≤u≤7
v: Tần số đứng (mặt) chuẩn hoá 0≤v≤7


 1

0 ≤ k, l, u, v ≤ 7 và ξ(u) =  2
1

 1

ξ(v) =  2
1


u>0
u=0
v>0
v=0

2.1.2. Đặc điểm của phép biến đổi DCT trên ảnh hai chiều:
Thể hiện đặc tính nội dung về tần số của thông tin ảnh. Hệ số bên góc
trái (0,0) lớn đặc trưng cho giá trị trung bình thành phần một chiều gọi là hệ
số DC, còn các hệ số khác có giá trị nhỏ hơn biểu diễn cho các thành phần tần
số cao theo hướng ngang và theo hướng thẳng đứng gọi là các hệ số AC.


×