Tải bản đầy đủ (.pdf) (72 trang)

Bảo vệ bản quyền ảnh số bằng kỹ thuật thủy vân dựa vào các phép biến đổi rời rạc (LV01403)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.79 MB, 72 trang )



BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2



HÀ THỊ LAN HƯƠNG


BẢO VỆ BẢN QUYỀN ẢNH SỐ BẰNG KỸ THUẬT
THỦY VÂN DỰA VÀO CÁC PHÉP BIẾN ĐỔI RỜI RẠC





LUẬN VĂN THẠC SĨ MÁY TÍNH






HÀ NỘI, 2014


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2




HÀ THỊ LAN HƯƠNG


BẢO VỆ BẢN QUYỀN ẢNH SỐ BẰNG KỸ THUẬT
THỦY VÂN DỰA VÀO CÁC PHÉP BIẾN ĐỔI RỜI RẠC

Chuyên ngành: Khoa học máy tính
Mã số: 60 48 01 01

LUẬN VĂN THẠC SĨ MÁY TÍNH


Người hướng dẫn khoa học: PGS. TS Bùi Thế Hồng



HÀ NỘI, 2014


LỜI CẢM ƠN

Để hoàn thành luận văn này tôi đã nhận được sự giúp đỡ tận tình của
thầy hướng dẫn khoa học, của các thầy cô trường Đại học Sư phạm Hà Nội 2.
Tôi xin chân thành cảm ơn các thầy cô trường Đại học Sư phạm Hà Nội 2 đã
tạo điều kiện học tập, nghiên cứu và giúp đỡ tôi rất nhiều trong quá trình làm
luận văn. Đặc biệt tôi xin cảm ơn PGS.TS Bùi Thế Hồng đã tận tình hướng
dẫn, chỉ bảo tôi trong suốt quá trình học tập, nghiên cứu đề tài và giúp tôi
hoàn thành bản luận văn này.


Vĩnh Phúc, ngày 12 tháng 12 năm 2014
Học viên


Hà Thị Lan Hương

LỜI CAM ĐOAN

Tôi xin cam đoan đây là kết quả nghiên cứu của tôi dưới sự hướng dẫn
khoa học của PGS. TS Bùi Thế Hồng.
Các số liệu, kết quả nêu trong luận văn là trung thực và chưa từng được
ai công bố trong bất kỳ công trình nào khác.

Học viên


Hà Thị Lan Hương


MỤC LỤC

MỞ ĐẦU 1

1. Lý do chọn đề tài 1

2. Mục đích nghiên cứu 1

3. Nhiệm vụ nghiên cứu 2

4. Đối tượng và phạm vi nghiên cứu 2


5. Những đóng góp mới của đề tài 2

6. Phương pháp nghiên cứu 2

7. Bố cục của luận văn 3

CHƯƠNG 1.

TỔNG QUAN VỀ KỸ THUẬT GIẤU TIN

VÀ THỦY VÂN
TRÊN ẢNH SỐ 4

1.1. Bảo vệ bản quyền ảnh số 4

1.2. Tổng quan về kỹ thuật giấu tin 4

1.3. Tổng quan về ảnh 8

1.3.1. Ảnh 8

1.3.2. Các định dạng ảnh thông dụng 10

1.4. Những yêu cầu cơ bản của hệ thủy vân trên ảnh số 12

1.4.1. Yêu cầu chung 12

1.4.2. Yêu cầu riêng 13


1.5. Những tấn công trên hệ thủy vân 14

1.6. Các ứng dụng của hệ thủy vân 15

1.7. Những khuynh hướng tiếp cận của kỹ thuật thủy vân 17

1.7.1. Hướng tiếp cận dựa trên miền không gian ảnh 17

1.7.2. Hướng tiếp cận sử dụng các phương pháp khảo sát gián tiếp 18

CHƯƠNG 2
.
KỸ THUẬT THỦY VÂN TRÊN ẢNH SỐ

DỰA VÀO CÁC
PHÉP BIẾN ĐỔI RỜI RẠC 20

2.1. Một số kỹ thuật bổ trợ cho các kỹ thuật thủy vân số trên ảnh tĩnh 20



2.1.1. Các phép biến đổi miền không gian ảnh sang miền tần số 20

2.1.2. Kỹ thuật sinh chuỗi giả ngẫu nhiên 24

2.1.3. Các kỹ thuật trải phổ trong truyền thông 25

2.1.4. Các thuật toán kiểm định thủy vân 26

2.2. Các thuật toán thủy vân ảnh số dựa vào các phép biến đổi rời rạc 27


2.2.1. Thủy vân ảnh số dựa vào phép biến đổi Cosine rời rạc 27

2.2.2. Thủy vân ảnh số dựa vào phép biến đổi sóng nhỏ rời rạc 32

2.2.3. Thủy vân ảnh số dựa vào phép biến đổi Fourier rời rạc 36

2.3. Kỹ thuật thủy vân ảnh tĩnh sử dụng kết hợp các phép biến đổi rời rạc 39

2.3.1. Đôi nét về phương pháp kết hợp các phép biến đổi rời rạc 39

2.3.2. Kỹ thuật thủy vân sử dụng phép kết hợp DWT với DCT và hai ma trận số giả
ngẫu nhiên vào băng HL 41

CHƯƠNG 3
.
CÀI ĐẶT CHƯƠNG TRÌNH THỬ NGHIỆM 43

3.1. Các độ đo đánh giá hiệu quả của thủy vân 43

3.1.1. Đánh giá chất lượng của ảnh chủ đã thủy vân 43

3.1.2. Kiểm định chất lượng thủy vân 43

3.2. Kết quả thử nghiệm kỹ thuật thủy vân sử dụng một phép biến đổi 45

3.2.1. Kết quả thử nghiệm kỹ thuật thủy vân sử dụng phép biến đổi DWT 45

3.2.2. Kết quả thử nghiệm kỹ thuật thủy vân sử dụng phép biến đổi DCT 48


3.2.3. So sánh kết quả thử nghiệm kỹ thuật thủy vân sử dụng một phép biến đổi 53

3.3. Kết quả thử nghiệm kỹ thuật thủy vân sử dụng phép kết hợp nhiều phép biến đổi
rời rạc 54

3.4. Đánh giá kết quả thử nghiệm 60

KẾT LUẬN VÀ KIẾN NGHỊ 62

TÀI LIỆU THAM KHẢO 63





DANH MỤC CÁC CHỮ VIẾT TẮT

DCT
Discrete Cosin Transform

DWT
Discrete Wavelet Transform

DFT
Discrete Fourier Transform

GIF
Graphics Interchanger Format
IMG
Image

BMP
Bitmap

JPEG
Joint Photographic Expert Group

LSB
Least Significant Bit

RGB
Red, Green, Blue
PCX
Personal Computer Exchange

LZW

Lampel Ziv Welch




DANH MỤC CÁC HÌNH

Hình Tên hình Trang
Hình 1.1 Phân loại các kỹ thuật thuỷ vân 6
Hình 1.2
Ví dụ về thuỷ vân hiện (Trên trang Web thư viện số
của Mỹ)
7
Hình 1.3

Ảnh Lena đã được nhúng thuỷ vân là logo ở hình bên
phải
8
Hình1.4
Ảnh màu sau khi nhúng tin rất khó phát hiện sự thay
đổi
9
Hình 1.5
Ảnh đen trắng sau khi nhúng cùng một lượng thông tin
như ảnh màu, cho chất lượng ảnh kém hơn (xuất hiện
nhiều chấm đen lạ)
9
Hình 2.1
Ảnh gốc và năng lượng phân bố của ảnh qua phép biến
đổi DCT
23
Hình 2.2 Phân chia 3 miền tần số ảnh của phép biến đổi DCT 24
Hình 2.3 Ảnh thuỷ vân trong kỹ thuật thuỷ vân DWT 32
Hình 2.4 Ảnh chủ trong kỹ thuật thuỷ vân DWT 32
Hình 2.5 Ảnh sau khi thuỷ vân bằng kỹ thuật thuỷ vân DWT 35
Hình 2.6 Nhúng 1 thủy vân hình vòng trong miền DFT 38
Hình 3.1 Kết quả sử dụng phép biến đổi DWT để thủy vân 48
Hình 3.2 Kết quả sử dụng phép biến đổi DCT để thủy vân 53
Hình 3.3
Kết quả sử dụng phép biến đổi DWT kết hợp DCT để
thủy vân
59

1


MỞ ĐẦU

1. Lý do chọn đề tài
Ngày nay, hầu hết thông tin đều được lưu trữ dưới dạng số hoá trước
khi trở thành một vật phẩm thông thường như sách báo, tạp chí. Việc trao đổi,
phân phối, sao chép và xử lý các sản phẩm số ngày càng nhanh chóng, đơn
giản và nằm ngoài tầm kiểm soát của các tổ chức. Do đó, tình trạng xâm
phạm bản quyền, sao chép lậu các sản phẩm kĩ thuật số đã xảy ra ở nhiều nơi.
Bởi vậy, nhu cầu đảm bảo an toàn và bảo vệ bản quyền và sở hữu trí tuệ các
sản phẩm số đang là một nhu cầu cấp thiết hiện nay. Một trong những giải
pháp hữu hiệu cho vấn đề này là đánh dấu vào các sản phẩm này để bảo vệ
bản quyền cũng như bảo đảm sự sự toàn vẹn cho chúng. Một trong những kỹ
thuật đó là kỹ thuật thủy vân số. Hiện tại đã có một số kỹ thuật thủy vân dùng
để bảo vệ bản quyền cho các bức ảnh số bằng cách tác động trực tiếp lên miền
giá trị của các điểm ảnh. Các kỹ thuật này thường không đảm bảo được chất
lượng của ảnh và không được bền vững trước các tấn công thông thường lên
ảnh. Chính vì vậy, tác giả chọn đề tài nghiên cứu “Bảo vệ bản quyền ảnh số
bằng kỹ thuật thủy vân dựa vào các phép biến đổi rời rạc”.
Trong luận văn này, tác giả nghiên cứu và đề xuất các kỹ thuật thủy
vân bảo vệ bản quyền ảnh số dựa vào các phép biến đổi rời rạc để tăng cường
độ bền vững của thủy vân cũng như đảm bảo được chất lượng của ảnh.
2. Mục đích nghiên cứu
Mục tiêu của luận văn là nghiên cứu kỹ thuật thủy vân dựa trên các
phép biến đổi rời rạc qua đó phân tích và đánh giá các phương pháp, đưa ra
được bài toán áp dụng kỹ thuật thuỷ vân dựa vào các phép biến đổi rời rạc
ứng dụng rộng rãi trong thực tiễn.



2


3. Nhiệm vụ nghiên cứu
- Tìm hiểu một số kỹ thuật thuỷ vân bảo vệ bản quyền cho các bức
ảnh số.
- Nghiên cứu và thử nghiệm các kỹ thuật thuỷ vân ảnh số dựa vào một
số phép biến đổi rời rạc.
4. Đối tượng và phạm vi nghiên cứu
- Nghiên cứu, đánh giá kỹ thuật thuỷ vân ảnh số dựa vào các phép biến
đổi rời rạc qua đó phát triển và cải tiến các kỹ thuật thủy vân dựa vào phép
biến đổi rời rạc.
- Các công cụ lập trình và phần mềm dùng để cài đặt các lược đồ
nhúng và giải thuỷ vân trên ảnh số.
5. Những đóng góp mới của đề tài
- Phát hiện những yêu cầu và thách thức trong thực tế đối với vấn đề kỹ
thuật thuỷ vân ảnh số.
- Phát triển và cải tiến các kỹ thuật thuỷ vân ảnh số nhằm nâng cao
độ bền vững của thuỷ vân trong ảnh và giảm mức độ ảnh hưởng của thuỷ vân
đối với chất lượng của ảnh.
- Cài đặt chương trình thử nghiệm thuỷ vân ảnh số dựa vào các phép
biến đổi rời rạc.
6. Phương pháp nghiên cứu
- Nghiên cứu tổng quan, đánh giá các kỹ thuật thuỷ vân ảnh.
- Tìm hiểu và phát hiện các vấn đề trong thực tế, từ đó đưa ra so sánh,
đánh giá và các giải pháp khắc phục.
- Cài đặt thử nghiệm dựa trên những cải tiến được đưa ra.


3

7. Bố cục của luận văn

Ngoài phần Mở đầu, kết luận và tài liệu tham khảo luận văn gồm 3
chương:
Chương 1: Tổng quan về kỹ thuật giấu tin và thủy vân trên ảnh số
Chương 2: Kỹ thuật thủy vân trên ảnh số dựa vào các phép biến đổi rời
rạc
Chương 3: Cài đặt chương trình thử nghiệm


4

CHƯƠNG 1
TỔNG QUAN VỀ KỸ THUẬT GIẤU TIN
VÀ THỦY VÂN TRÊN ẢNH SỐ

1.1. Bảo vệ bản quyền ảnh số
Ngày nay, với sự phát triển của truyền thông và các công cụ hỗ trợ liên
quan dẫn đến việc các sản phẩm công nghệ trong đó có ảnh số được truyền tải
một cách nhanh chóng và tiện lợi. Tuy nhiên, bên cạnh những ưu điểm còn
tồn tại những nhược điểm về sự tấn công trên các sản phẩm nhằm thay đổi
giá trị sử dụng của chúng. Đặc biệt, với các ảnh sự sao chép ngày càng trở nên
dễ dàng thì sự cần thiết của chứng thực bản quyền sở hữu trở thành một vấn
đề cấp thiết. Những chủ sở hữu dữ liệu là ảnh số đặt ra yêu cầu cần có một cơ
chế xác định cũng như những công cụ hữu ích giúp cho họ có thể bảo vệ tốt
quyền sở hữu của mình đối với dữ liệu.
Với những yêu cầu trên thì rất nhiều phương pháp đã được đưa ra nhằm
giải quyết bài toán. Trong đó, thông thường người ta thường chèn thêm các
thông tin mang bản quyền tác giả vào trong các ảnh số. Nếu có kẻ tấn công sẽ
làm hỏng đi ảnh đó hoặc làm thay đổi giá trị của thông tin được nhúng vào.
Thông thường, để bảo vệ bản quyền của các dữ liệu thì người chủ sở
hữu sẽ đăng ký dữ liệu đó với một cơ quan có thẩm quyền và có khả năng

chứng thực quyền sở hữu của họ đối với dữ liệu trên.
1.2. Tổng quan về kỹ thuật giấu tin
Steganography có nguồn gốc từ tiếng Hy Lạp và được sử dụng tới ngày
nay, nó có nghĩa là “tài liệu được phủ” (covered writing). Các câu chuyện kể
về kỹ thuật giấu thông tin đã có từ rất lâu. Những tài liệu tìm thấy ghi chép về
kỹ thuật giấu thông tin sớm nhất thuộc về sử gia Hy Lạp Herodotus (khoảng
năm 440 trước Công nguyên). Khi bạo chúa Hy Lạp Histiaeus bị vua Darius

5

bắt giữ ở Susa vào thế kỷ thứ 5 trước Công nguyên, ông ta đã cố gửi thông
báo bí mật cho con rể của mình là Aristagoras ở Miletus. Histiaeus đã cạo trọc
đầu của một nô lệ tin cậy và xăm một thông báo trên da đầu của người nô lệ
đó. Khi tóc của người nô lệ mọc đủ dài, anh ta được gửi tới Miletus.
Giấu thông tin là một kỹ thuật nhúng (giấu) một lượng thông tin số nào
đó vào một đối tượng dữ liệu số khác. Kỹ thuật giấu thông tin nhằm mục đích
đảm bảo an toàn và bảo mật thông tin ở cả hai khía cạnh. Một là bảo mật cho
dữ liệu được đem giấu, hai là bảo mật cho chính đối tượng được dùng để giấu
tin. Điều này dẫn đến hai khuynh hướng chủ yếu của giấu tin:
 Khuynh hướng thứ nhất là giấu tin mật (steganography). Khuynh
hướng này tập trung vào các kỹ thuật giấu tin sao cho thông tin giấu được
nhiều và quan trọng là người khác khó phát hiện dược một đối tượng có bị
giấu tin bên trong hay không.
 Khuynh hướng thứ hai là thủy vân số (watermarking). Khuynh hướng
thủy vân số đánh giấu vào đối tượng nhằm khẳng định bản quyền quyền sở
hữu hay phát hiện sự xuyên tạc thông tin.
Watermarking (thuỷ vân, thuỷ ấn) là kỹ thuật nhúng một biểu tượng
vào trong ảnh môi trường để xác định quyền sở hữu ảnh môi trường, chống sự
giả mạo và xuyên tạc thông tin.
Trong kỹ thuật giấu tin mật, thông tin cần giấu được gọi là thông điệp

(message) còn trong kỹ thuật thuỷ vân số thì được gọi là thuỷ vân
(watermark). Thuỷ vân có thể là một chuỗi các kí tự, hay một hình ảnh, logo
nào đó.
Nói đến thuỷ vân số là nói đến kỹ thuật giấu tin nhắm đến những ứng
dụng bảo đảm an toàn dữ liệu cho đối tượng được sử dụng để giấu tin như:
bảo vệ bản quyền, chống xuyên tạc, nhận thực thông tin, điều khiển sao chép
v.v… Có thể thấy rõ là phần ứng dụng của thủy vân rất lớn, mỗi ứng dụng lại

6

có những yêu cầu riêng và tính chất riêng, do đó các kỹ thuật thuỷ vân cũng
có những tính năng khác biệt tương ứng:










Hình 1.1 Phân loại các kỹ thuật thuỷ vân
Các kỹ thuật thuỷ vân trên Hình 1.1 được phân biệt nhau bởi những đặc
trưng, tính chất của từng kỹ thuật và ứng dụng những kỹ thuật đó.
Thuỷ vân “dễ vỡ” (fragile) là kỹ thuật nhúng thuỷ vân vào trong ảnh
sao cho khi phân bố sản phẩm trong môi trường mở nếu có bất cứ một phép
biến đổi nào làm thay đổi đối tượng sản phẩm gốc thì thuỷ vân đã được giấu
trong đối tượng sẽ không còn nguyên vẹn như trước khi giấu nữa (dễ vỡ).
Thủy vân dễ vỡ yêu cầu thông tin giấu sẽ bị sai lệch nếu có bất kỳ sự thay đổi

nào trên dữ liệu chứa. Các kỹ thuật thuỷ vân có tính chất này được sử dụng
trong các ứng dụng nhận thực thông tin (authentication) và phát hiện xuyên
tạc thông tin (tamper detection). Ví dụ như để bảo vệ chống xuyên tạc một
ảnh nào đó ta nhúng một thuỷ vân vào trong ảnh và sau đó phân phối, quảng
bá ảnh đó. Khi cần kiểm tra lại ảnh ta sử dụng hệ thống đọc thủy vân. Nếu
không đọc được thuỷ vân hoặc thuỷ vân đã bị sai lệch nhiều so với thuỷ vân
ban đầu đã nhúng vào ảnh thì có nghĩa là có thể ảnh đó đã bị thay đổi. Cái khó
Robust
Copyright marking
Thuỷ vân bền vững
Imperceptible
Watermarking
Thuỷ vân ẩn
Watermarking
Thuỷ vân số
Fragile
Watermarking
Thuỷ vân “dễ vỡ”
Visible
Watermarking
Thuỷ vân hiện

7

ở đây là ta phải phân biệt giữa sai lệch thuỷ vân do xuyên tạc và sai lệch do
lỗi đường truyền.
Ngược lại, với kỹ thuật thuỷ vân dễ vỡ là kỹ thuật thuỷ vân bền vững
(robust). Thủy vân bền vững quan tâm nhiều đến việc nhúng những mẩu tin
đòi hỏi độ bền vững cao của thông tin được giấu trước các biến đổi thông
thường trên dữ liệu chứa. Các kỹ thuật thuỷ vân bền vững thường được ứng

dụng trong các ứng dụng bảo vệ bản quyền. Trong những ứng dụng đó, thuỷ
vân đóng vai trò là thông tin sở hữu của người chủ hợp pháp. Thuỷ vân được
nhúng trong sản phẩm như một hình thức dán tem bản quyền. Trong trường
hợp như thế, thuỷ vân phải tồn tại bền vững cùng với sản phẩm nhằm chống
việc tẩy xoá, làm giả hay biến đổi phá huỷ thuỷ vân. Một yêu cầu lí tưởng đối
với thuỷ vân bền vững là nếu muốn loại bỏ thuỷ vân thì chỉ có một cách duy
nhất là phá huỷ sản phẩm.
Thuỷ vân bền vững lại được chia thành hai loại là thuỷ vân ẩn và thuỷ
vân hiện. Thuỷ vân hiện là loại thuỷ vân được hiện ngay trên sản phẩm và
người dùng có thể nhìn thấy được giống như các biểu tượng kênh chương
trình vô tuyến mà ta thường thấy VTV3, CCTV, TV5… Các thuỷ vân hiện
trên ảnh thường dưới dạng chìm, mờ hoặc trong suốt để không gây ảnh hưởng
đến chất lượng ảnh gốc. Đối với thuỷ vân hiện, thông tin bản quyền hiển thị
ngay trên sản phẩm.

Hình 1.2 Ví dụ về thuỷ vân hiện (Trên trang Web thư viện số của Mỹ)

8



Hình 1.3 Ảnh Lena đã được nhúng thuỷ vân là logo ở hình bên phải
Còn đối với thuỷ vân ẩn thì cũng giống như giấu tin, bằng mắt thường
không thể nhìn thấy thuỷ vân. Đây cũng là nội dung chính được trình bày
trong luận văn này. Trong vấn đề bảo vệ bản quyền, thuỷ vân ẩn mang tính
“bất ngờ” hơn trong việc phát hiện sản phẩm bị đánh cắp. Trong trường hợp
này, người chủ sở hữu hợp pháp sẽ chỉ ra bằng chứng là thuỷ vân đã được
nhúng trong sản phẩm bị đánh cắp.
1.3. Tổng quan về ảnh
Trong các phần đã trình bày ở trên có nhắc đến thủy vân, để có thể xác

định thủy vân ảnh được chính xác ta cần tìm hiểu kỹ hơn về các vấn đề liên
quan đến ảnh. Trong phần này, trình bày một số vấn đề cơ bản của ảnh.
1.3.1. Ảnh
Là một tập hợp hữu hạn các điểm ảnh kề nhau. Ảnh thường được biểu
diễn bằng một ma trận hai chiều, mỗi phần tử của ma trận tương ứng với một
điểm ảnh.
Ảnh nhị phân (đen trắng): là ảnh có giá trị mức xám của các điểm
ảnh được biểu diễn bằng 1 bit (giá trị 0 hoặc 1).
Ảnh xám: giá trị mức xám của các điểm ảnh được biểu diễn bằng 8 bit
(giá trị từ 0 đến 255).
Ảnh màu: thông thường, ảnh màu được tạo nên từ 3 ảnh xám đối với
màu nền đỏ (RED), xanh lá cây (GREEN), xanh lam (BLUE). Tất cả các màu
trong tự nhiêu đều có thể được tổng hợp từ 3 thành phần màu trên theo các tỷ
lệ khác nhau. Sự khác nhau giữa giấu thông tin trong ảnh đen trắng và ảnh
màu được thể hiện qua bảng sau:

9

Ảnh đen trắng Ảnh màu hoặc ảnh xám
Thông tin nhúng ít hơn so với ảnh
màu có cùng kích cỡ.
Thông tin nhúng nhiều hơn.
Khả năng bị phát hiện trong ảnh có
nhúng thông tin cao hơn ảnh màu.
Khả năng bị phát hiện thấp.
Độ an toàn thông tin thấp do dễ bị
phát hiện có thông tin chứa bên trong.

Độ an toàn cao.
Các thuật toán thường phức tạp và

không nhiều.
Nhiều thuật toán và có nhiều hướng
mở rộng phát triển (như áp dụng
giải thuật di truyền).


a) Ảnh 256 màu gốc 227 x 149 b) Ảnh sau khi giấu 100 bit tin
Hình1.4 Ảnh màu sau khi nhúng tin rất khó phát hiện sự thay đổi


a) Ảnh đen trắng gốc 480 x 480 b) Ảnh sau khi nhúng 100 bit tin
Hình 1.5 Ảnh đen trắng sau khi nhúng cùng một lượng thông tin như ảnh
màu, cho chất lượng ảnh kém hơn (xuất hiện nhiều chấm đen lạ)



10

1.3.2. Các định dạng ảnh thông dụng
Ảnh thu được sau quá trình số hóa có nhiều loại khác nhau, phụ thuộc
vào kỹ thuật số hóa ảnh. Sau đây là một số định dạng ảnh thông dụng.
* Định dạng ảnh: IMG (Image)
Ảnh IMG là ảnh đen trắng, mỗi điểm ảnh được thể hiện bởi 1 bit. Toàn
bộ ảnh chỉ gồm các điểm sáng và tối tương ứng với giá trị 1 hoặc 0.
Tỉ lệ nén của kiểu định dạng này là khá cao. Ảnh IMG được nén theo
từng dòng. Mỗi dòng bao gồm các gói (Pack). Các dòng giống nhau được nén
thành một gói.
* Định dạng ảnh: PCX (Personal Computer Exchange)
Định dạng ảnh PCX là một trong những định dạng loại cổ điển nhất.
Nó sử dụng phương pháp mã hóa loạt dài RLC để nén dữ liệu ảnh. Quá trình

nén và giải nén được thực hiện trên từng dòng ảnh. Thực tế, phương pháp giải
nén PCX kém hiệu quả hơn so với kiểu IMG.
Định dạng ảnh PCX thường được dùng để lưu trữ ảnh vì thao tác đơn
giản, cho phép nén và giải nén nhanh. Tuy nhiên vì cấu trúc của nó cố định,
nên trong một số trường hợp nó làm tăng kích thước lưu trữ.
* Định dạng ảnh: GIF (Graphics Interchanger Format)
Định dạng ảnh GIF do hãng Computer Incorporated (Mỹ) đề xuất lần
đầu tiên vào năm 1990. Với định dạng GIF, khi số màu trong ảnh càng tăng,
thì ưu thế của định dạng GIF càng nổi trội. Những ưu thế này có được là do
GIF tiếp cận các thuật toán LZW (Lampel Ziv Welch) (dựa vào sự lặp lại của
một nhóm điểm, người ta xây dựng từ điển lưu các chuỗi ký tự có tần suất lặp
lại cao và thay thế bằng từ mã tương ứng mỗi khi gặp lại chúng). Dạng ảnh
GIF cho chất lượng cao, độ phân giải đồ họa tốt, cho phép hiển thị trên hầu
hết các phần cứng đồ họa.

11

* Định dạng ảnh: BMP (Bitmap)
Ảnh BMP (Bitmap) được phát triển bởi Microsoft Corporation, được
lưu trữ dưới dạng độc lập thiết bị cho phép Windows hiển thị dữ liệu không
phụ thuộc vào khung chỉ định màu trên bất kỳ phần cứng nào. Tên file mở
rộng mặc định của một file ảnh Bitmap là BMP, nét vẽ được thể hiện là các
điểm ảnh. Qui ước màu đen, trắng tương ứng với các giá trị 0, 1. Ảnh BMP
được sử dụng trên Microsoft Windows và các ứng dụng chạy trên Windows
từ version 3.0 trở lên. BMP thuộc loại ảnh mảnh.
Có rất nhiều định dạng ảnh thuộc kiểu bitmap như BMP, PCX, TIFF,
GIF, JPEG, TGA, PNG, PCD…Mỗi file ảnh BMP gồm bốn phần:
Bitmap Header (14 bytes): giúp nhận dạng tập tin bitmap.
Bitmap Information (40 bytes): chứa một số thông tin chi tiết giúp hiển thị
ảnh.

Palette màu (4*x bytes), x là số màu của ảnh: định nghĩa các màu sẽ
được sử dụng trong ảnh.
Bitmap Data: Chứa dữ liệu ảnh.
Đặc điểm nổi bật nhất của định dạng BMP là tập tin ảnh thường không
được nén bằng bất kỳ thuật toán nào. Khi lưu ảnh, các điểm ảnh được ghi trực
tiếp vào tập tin - một điểm ảnh sẽ được mô tả bởi một hay nhiều byte tùy
thuộc vào giá trị n của ảnh. Do đó, một hình ảnh lưu dưới dạng BMP thường
có kích cỡ rất lớn, gấp nhiều lần so với các ảnh được nén (chẳng hạn GIF,
JPEG hay PNG).
* Định dạng ảnh: JPEG (Joint Photographic Expert Group)
Một nhóm các nhà nghiên cứu đã phát minh ra định dạng này, để hiển
thị các hình ảnh đầy đủ màu hơn (full-colour) cho định dạng di động, mà kích
thước file lại nhỏ hơn. Giống như ảnh GIF, JPEG cũng được sử dụng nhiều
trên Web.

12

Lợi ích của JPEG hơn GIF là nó có thể hiển thị hình ảnh với màu chính
xác (true-colour) (có thể lên đến 16 triệu màu).
Nhược điểm chính của định dạng JPEG là chúng được nén bằng thuật
toán lossy (mất dữ liệu).
Nói cách khác, định dạng JPEG thực hiện bảo quản tất cả thông tin
màu trong hình ảnh đó. Tuy nhiên với các hình ảnh chất lượng màu cao (high-
colour) như hình ảnh chụp, thì điều này sẽ không ảnh hưởng gì.
Ảnh JPEG không thể làm trong suốt hoặc chuyển động, trong trường
hợp này ta sẽ sử dụng định dạng GIF (hoặc định dạng PNG để tạo trong suốt).
Tạo ảnh JPEG Fast-Loading:
Giống như với các ảnh GIF, để tạo hình JPEG nhỏ đến mức có thể (tính
theo bytes) để website tải nhanh hơn. Điều chỉnh chính để thay đổi kích thước
file JPEG được gọi là quality, và thường có giá trị từ 0 tới 100%, khi 0% thì

chất lượng là thấp nhất (nhưng kích thước file là nhỏ nhất), và 100% thì chất
lượng cao nhất (nhưng kích thước file là lớn nhất). 0% chất lượng JPEG sẽ
nhìn rất mờ khi so sánh với ảnh gốc. Còn 100% chất lượng JPEG thường
không phân biệt được so với ảnh gốc.
1.4. Những yêu cầu cơ bản của hệ thủy vân trên ảnh số
1.4.1. Yêu cầu chung
Hệ thuỷ vân số trên ảnh số cũng là một hệ giấu tin nên cũng có một số
đặc điểm và tính chất giống như giấu tin trong ảnh như:
- Phương tiện chứa là ảnh hai chiều tĩnh.
- Thuỷ vân trên ảnh tác động lên dữ liệu ảnh nhưng không làm thay đổi
kích thước ảnh.
- Kỹ thuật giấu phụ thuộc vào tính chất của hệ thống thị giác con người.
- Khi giải tin có thể cần ảnh gốc.


13

1.4.2. Yêu cầu riêng
Kỹ thuật thuỷ vân số còn có một số đặc trưng phân biệt với kỹ thuật
giấu tin mật như sau:
* Thông tin trong ảnh có thể bị biến đổi nếu có bất cứ một biến đổi nào trên
ảnh?
Tính chất này có trong kỹ thuật giấu tin mật nhưng đối với kỹ thuật
thuỷ vân thì tính chất này chỉ có trong loại thuỷ vân “dễ vỡ”. Còn đối với loại
thuỷ vân “bền vững” thì lại yêu cầu thông tin trong ảnh chống lại được những
phép biến đổi thông thường trên ảnh.
* Thuỷ vân ẩn hay thuỷ vân hiện?
Đối với giấu tin mật thì yêu cầu thông điệp đem giấu phải ẩn bên trong
ảnh sao cho mắt thường không nhìn thấy được, còn thuỷ vân số thì lại có hai
loại là thuỷ vân ẩn và thuỷ vân hiện. Thuỷ vân ẩn thì mắt thường không nhìn

thấy được, nó được sử dụng với mục đích gài bí mật các thông tin trong ảnh
để xác nhận chủ quyền của bức ảnh. Thuỷ vân hiện thì cho phép nhìn thấy
thông tin đem nhúng vào, nó được sử dụng cho mục đích công bố công khai
về chủ quyền sở hữu.
* Tính chất bền vững
Đây là tính chất quan trọng nhất của hệ thuỷ vân bền vững. Nghĩa là hệ
thuỷ vân phải chống lại được các phép biến đổi, hay tấn công có chủ đích
hoặc không có chủ đích lên thuỷ vân.
* Thuỷ vân cái gì?
Thông tin gì được giấu bên trong ảnh?
Thông thường để bảo vệ bản quyền tác giả thì người ta hay nhúng vào
trong ảnh một chuỗi ký tự mang những thông tin về tác giả như tên tác giả,
tiêu đề, ngày tháng năm,… Tuy nhiên chuỗi ký tự lại bị một hạn chế là mỗi
ký tự được biểu diễn bằng nhiều bit, nếu một bit bị lỗi thì sẽ làm sai cả chuỗi

14

ký tự và chỉ cần một phép biến đổi đơn giản như phép biến đổi JPEG cũng có
thể làm cho thuỷ vân bị sai lệch rất nhiều.
Thông tin nhúng trong ảnh có thể lại là một bức ảnh nhỏ, khi giải tin thì
một số điểm ảnh có thể bị sai nhưng hình tổng thể sẽ đựơc giữ nguyên. Do đó
khi lựa chọn ảnh làm thuỷ vân phải lựa chọn những bức ảnh đơn giản, dễ
nhận dạng, ví dụ như logo,…
Thông tin nhúng trong ảnh có thể là một chuỗi bit sinh ngẫu nhiên theo
một luật phân phối xác suất nào đó, sau đó áp dụng các lí thuyết xác suất
thống kê để chứng thực thuỷ vân.
Trong các loại thuỷ vân thì thuỷ vân ẩn và bền vững được quan tâm
nghiên cứu nhiều hơn vì nó có nhiều ứng dụng lớn. Đây cũng là tính chất
quan trọng đang được nghiên cứu nhưng đây cũng lại là mấu chốt của sự phức
tạp vì hai thuộc tính này mâu thuẫn với nhau. Sự mâu thuẫn này được thể hiện

ở chỗ:
+ Để đảm bảo tính chất ẩn thì thủy vân phải được giấu ở những vị trí ít
có ý nghĩa tri giác nhất, ít bị chú ý nhất.
+ Để đảm bảo tính chất bền vững thì thuỷ vân phải chịu được những
phép xử lý ảnh phổ biến như dịch chuyển ảnh hay nén JPEG. Ví dụ, trong
phép nén JPEG sẽ loại bỏ ở ảnh những thông tin ít có tính tri giác nhất để làm
giảm kích thước của ảnh nhưng vẫn đảm bảo được chất lượng ảnh. Khi đó
những dữ liệu thuỷ vân nằm trong vùng này sẽ bị mất đi hoặc bị biến đổi sai
lệch hoàn toàn. Với tính chất phức tạp của yêu cầu cho một hệ thuỷ vân, ta sẽ
tìm hiểu những giải pháp kỹ thuật thuỷ vân đã được đưa ra của các nhà khoa
học trên thế giới.
1.5. Những tấn công trên hệ thủy vân
Phương pháp thủy vân phải chống lại một số phép xử lý ảnh thông
thường (ví dụ như lỗi khi ảnh truyền đi, nén ảnh, ) và một số tấn công có chủ

15

đích nhằm xuyên tác, phá hoại bức ảnh. Trong thực tế thì thủy vân phải cân
đối giữa tính bền vững với các tính chất khác như lượng thông tin dấu, tính
ẩn… Dựa trên yêu cầu thực tế của ứng dụng, người ta sẽ lựa chọn phương
pháp thủy vân thích hợp nhất.
Từ những biến đổi có chủ đích hay không có chủ đích đã biết với hệ
thủy vân mà ta có thể phân biệt thành hai nhóm xuyên tạc sau: Một là các
biến đổi xem như là nhiễu với dữ liệu, hai là làm mất tính đồng bộ để không
thể lấy tin ra được. Một vài phép biến đổi thường gặp:
- Biến đổi tín hiệu: Làm sắc nét, thay đổi độ tương phản, màu,
- Nhiễu cộng, nhiễu nhân,….
- Lọc tuyến tính.
- Nén mất thông tin.
- Biến đổi affine cục bộ hoặc toàn cục.

- Giảm dữ liệu: Cropping, sửa histogram.
- Chuyển mã (gif → Jpeg).
- Chuyển đổi tương tự - số.
- Thuỷ vân nhiều lần.
Nguyên tắc cơ bản của phương pháp thuỷ vân là đảm bảo đủ tính bền
vững sao cho các tấn công không làm cho giá trị thương mại của ảnh gốc bị
ảnh hưởng.
1.6. Các ứng dụng của hệ thủy vân
* Bảo vệ bản quyền tác giả (Copyright protection)
Đây là ứng dụng cơ bản nhất của kỹ thuật thuỷ vân số, một dạng của
phương pháp giấu tin. Một thông tin nào đó mang ý nghĩa quyền sở hữu tác
giả được nhúng vào trong sản phẩm (ảnh, âm thanh, video ), thuỷ vân đó chỉ
có một mình người chủ sở hữu hợp pháp các sản phẩm đó có và được làm
minh chứng cho bản quyền sản phẩm. Để bảo vệ các sản phẩm chống lại hành

16

vi lấy cắp hoặc làm nhái cần phải có có một kỹ thuật để “dán tem bản quyền”
vào sản phẩm này. Việc dán tem hay chính là việc nhúng thuỷ vân cần phải
đảm bảo không để lại một ảnh hưởng lớn nào đến việc cảm nhận sản phẩm.
Yêu cầu kỹ thuật đối với ứng dụng này là thuỷ vân phải tồn tại bền
vững cùng với sản phẩm, muốn huỷ bỏ thuỷ vân mà không được phép của
người chủ sở hữu thì chỉ còn cách là phá huỷ sản phẩm.
* Nhận thực và phát hiện xuyên tạc thông tin (authentication and tamper
detection)
Một tập thông tin sẽ được giấu trong sản phẩm, sau đó các thông tin
này sẽ được tách ra khỏi sản phẩm và so sánh với thông tin ban đầu. Nếu
thông tin ban đầu và thông tin thu được sau khi tách có sự khác biệt thì chứng
tỏ sản phẩm đó đã bị thay đổi, xuyên tạc. Trong trường hợp này các thuỷ vân
thường có dạng ẩn để trách sự tò mò, phát hiện của đối phương, nếu có bị lộ

thì khó làm giả hay xuyên tạc thông tin.
* Lấy dấu vân tay hay dán nhãn (fingerprinting or labeling)
Thuỷ vân trong những ứng dụng này được sử dụng để nhận diện người
gửi hay nhận một thông tin nào đó. Ví dụ như các vân khác nhau sẽ được
nhúng vào các bản copy khác nhau của thông tin gốc trước khi chuyển cho
nhiều người. Với những ứng dụng này thì yêu cầu là đảm bảo độ an toàn cao
cho các thuỷ vân, tránh bị xoá hoặc thay đổi trong quá trình phân phối.
* Kiểm soát sao chép (copy control)
Các thuỷ vân trong các trường hợp này được sử dụng để kiểm soát sao
chép không hợp lệ đối với các sản phẩm kỹ thuật số. Các thiết bị phát hiện
thuỷ vân (ở đây sử dụng phương pháp phát hiện thuỷ vân đã giấu mà không
cần thông tin gốc) được gắn sẵn vào trong các hệ thống đọc ghi, tuỳ thuộc vào
việc có thuỷ vân hay không để điều khiển (cho phép/cấm) truy cập.Ví dụ như
hệ thống quản lý sao chép DVD đã được ứng dụng ở Nhật. Các ứng dụng loại
này yêu cầu thuỷ vân phải được bảo đảm an toàn.

17

* Điều khiển thiết bị (Device control)
Các thiết bị phát hiện thuỷ vân (ở đây sử dụng phương pháp phát hiện
thuỷ vân đã giấu mà không cần thông tin gốc) được gắn sẵn vào trong các hệ
thống đọc ghi, tùy thuộc vào việc có thủy vân hay không để điều khiển (cho
phép/cấm) truy cập. Ví dụ như hệ thống quản lí sao chép DVD đã được ứng
dụng ở Nhật. Nhà sản xuất sẽ trang bị cho các phương tiện dùng để nhân bản
(như CD writer…) khả năng phát hiện xem digital media có chứa thủy vân
hay không, nếu có thì sẽ từ chối không nhân bản.
* Theo dõi quá trình sử dụng (Tracking)
Thủy vân số có thể được dùng để theo dõi quá trình sử dụng của các
digital media. Mỗi bản sao của sản phẩm được chứa bằng một thủy vân duy nhất
dùng để xác định user là ai. Nếu có sự nhân bản bất hợp pháp, ta có thể truy ra

người vi phạm nhờ vào thủy vân được chứa bên trong các phương tiện này.
* Theo dõi truyền thông (Broadcast Monitoring)
Các công ty truyền thông và quảng cáo có thể dùng kỹ thuật thủy vân
số để quản lý xem có bao nhiêu khách hàng đã dùng dịch vụ mà họ cung cấp.
* Truyền tin bí mật (Concealed Communication)
Bởi vì thủy vân số là một dạng đặc biệt của việc che dấu dữ liệu
(steganography) nên người ta có thể dùng để truyền các thông tin bí mật.
1.7. Những khuynh hướng tiếp cận của kỹ thuật thủy vân
Có thể chia các kỹ thuật thuỷ vân theo hai hướng tiếp cận chính:

1.7.1. Hướng tiếp cận dựa trên miền không gian ảnh
Đây là hướng tiếp cận cơ bản và tự nhiên trong số các kỹ thuật thuỷ
vân. Miền không gian ảnh là miền dữ liệu ảnh gốc. Tác động lên miền không
gian ảnh chính là tác động lên các điểm ảnh, thay đổi giá trị trực tiếp của điểm
ảnh. Đây là hướng tiếp cận tự nhiên bởi vì khi nói đến việc giấu tin trong ảnh
người ta thường nghĩ ngay đến việc thay đổi giá trị các điểm ảnh nguồn.

×