Tải bản đầy đủ (.pdf) (78 trang)

bảo vệ bản quyền ảnh số bằng kỹ thuật thủy vân dựa vào các phép biến đổi rời rạc

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.23 MB, 78 trang )

ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG
PHẠM THỊ THỦY
BẢO VỆ BẢN QUYỀN ẢNH SỐ BẰNG
KỸ THUẬT THỦY VÂN DỰA VÀO
CÁC PHÉP BIẾN ĐỔI RỜI RẠC
Chuyên ngành: Khoa học máy tính
Mã số: 60 48 01
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS. BÙI THẾ HỒNG
Thái Nguyên – 2013
LỜI CAM ĐOAN
Tôi xin cam đoan:
Những nội dung trong luận văn này là do tôi thực hiện dưới sự
hướng dẫn trực tiếp của thầy giáo hướng dẫn PGS.TS Bùi Thế Hồng.
Mọi tham khảo dùng trong luận văn đều được trích dẫn rõ ràng tác giả,
tên công trình, thời gian, địa điểm công bố.
Mọi sao chép không hợp lệ, vi phạm quy chế đào tạo, hay gian lận tôi
xin chịu hoàn toàn trách nhiệm.
Thái Nguyên, tháng 11 năm 2013
Tác giả luận văn
Phạm Thị Thủy
LỜI CẢM ƠN
Trước hết, tôi xin bày tỏ lòng biết ơn sâu sắc tới PGS.TS Bùi Thế Hồng
đã tận tình hướng dẫn, chỉ bảo và cung cấp những tài liệu rất hữu ích để tôi có
thể hoàn thành luận văn.
Xin cảm ơn lãnh đạo Trường Đại học Công nghệ Thông tin và Truyền
thông - Đại học Thái Nguyên, Trường Đại học Công nghiệp Việt Trì đã tạo
điều kiện giúp đỡ tôi về mọi mặt trong suốt quá trình thực hiện luận văn.
Tôi xin bày tỏ sự biết ơn sâu sắc đến gia đình, người thân, bạn bè đồng
nghiệp, những người luôn động viên, khuyến khích và giúp đỡ về mọi mặt để


tôi có thể hoàn thành công việc nghiên cứu.
Thái Nguyên, tháng 11 năm 2013
Tác giả luận văn
Phạm Thị Thủy
i
MỤC LỤC
Trang phụ bìa
Lời cam đoan
Mục lục i
Danh mục các ký hiệu, các chữ viết tắt ii
Danh mục các bảng iii
Danh mục các hình iv
MỞ DẦU 1
1. Tính cấp thiết của đề tài 1
2. Mục tiêu nghiên cứu của đề tài 2
3. Đối tượng và phạm vi nghiên cứu 2
4. Ý nghĩa khoa học của đề tài 2
5. Bố cục của luận văn 2
Chương 1: Giới thiệu chung về kỹ thuật giấu tin và thủy vân trên ảnh số 4
1.1 Tổng quan về kỹ thuật giấu tin 4
1.1.1 Định nghĩa 4
1.1.2 Vài nét về lịch sử giấu tin 4
1.1.3 Một số thuật ngữ cơ bản 5
1.1.4 Sự khác biệt giữa mã hóa và giấu tin 5
1.2 Giới thiệu về ảnh 6
1.2.1 Ảnh 6
1.2.2 Một số cấu trúc ảnh 8
1.2.3 Giấu tin trong ảnh 11
1.3. Những yêu cầu cơ bản của hệ thủy vân trên ảnh số 14
1.4 Những tấn công trên hệ thủy vân 16

1.5 Những ứng dụng chủ yếu của hệ thủy vân 17
1.5.1 Bảo vệ bản quyền tác giả 17
1.5.2 Nhận thực thông tin và phát hiện xuyên tạc thông tin 18
1.5.3 Lăn tay hoặc dán nhãn 18
1.5.4 Kiểm soát sao chép 18
1.6 Những khuynh hướng tiếp cận của kỹ thuật thủy vân 19
1.6.1 Hướng tiếp cận dựa trên miền không gian ảnh 19
1.6.2 Hướng tiếp cận dựa trên miền tần số của ảnh 20
Chương 2: Kỹ thuật thủy vân ảnh số dựa vào các phép biến đổi rời rạc 21
2.1. Các phép biến đổi rời rạc 21
2.1.1. Phép biến đổi Cosine rời rạc 21
2.1.2. Phép biến đổi sóng nhỏ rời rạc 22
2.1.3. Phép biến đổi Fourier rời rạc. 25
2.2. Các thuật toán thủy vân ảnh số dựa vào các phép biến đổi rời rạc 26
2.2.1. Thủy vân ảnh số dựa vào phép biến đổi Cosine rời rạc 26
2.2.2. Thủy vân ảnh số dựa vào phép biến đổi sóng nhỏ rời rạc 31
2.2.3. Thủy vân ảnh số dựa vào phép biến đổi Fourier rời rạc 39
2.3. Kỹ thuật thủy vân ảnh tĩnh sử dụng kết hợp các phép biến đổi rời rạc 44
2.3.1. Giới thiệu 44
2.3.2. Kỹ thuật thủy vân sử dụng DWT kết hợp với DCT và hai ma trận số giả
ngẫu nhiên cùng nhúng vào băng HL. 46
2.3.3. Kỹ thuật thủy vân sử dụng DWT kết hợp với DCT và hai ma trận số giả
ngẫu nhiên cùng nhúng vào hai băng HL, LH. 48
2.3.4. Kỹ thuật thủy vân sử dụng DWT kết hợp với DCT và hai ma trận số giả
ngẫu nhiên nhúng riêng biệt vào hai băng HL, LH 50
2.3.5. Kỹ thuật thủy vân sử dụng DWT kết hợp với DCT và hai ma trận số giả
ngẫu nhiên cùng nhúng vào các băng tần chi tiết 52
Chương 3: Thiết kế và phát triển chương trình thử nghiệm 54
3.1 Các độ đo đánh giá hiệu quả 54
3.1.1 Độ cảm nhận của thủy vân 54

3.1.2 Độ bền vững của thủy vân 55
3.2 Kết quả thử nghiệm kỹ thuật thủy vân sử dụng phép biến đổi DCT 56
3.2.1 Kỹ thuật thủy vân của Shoemarker 547
3.2.2 Kỹ thuật thủy vân sử dụng phép biến đổi DCT kết hợp với hai ma trận số
giả ngẫu nhiên 58
3.3 Kết quả thử nghiệm kỹ thuật thủy vân sử dụng phép biến đổi DWT và ma trận
số giả ngẫu nhiên 59
3.4 Kết quả thử nghiệm kỹ thuật thủy vân sử dụng phép biến đổi DWT kết hợp
với phép biến đổi DCT 62
KẾT LUẬN 66
ĐỀ XUẤT HƯỚNG NGHIÊN CỨU TIẾP THEO 67
TÀI LIỆU THAM KHẢO 68
ii
NHỮNG CHỮ VIẾT TẮT
BMP
Bitmap
JPEG
Joint Photographic Experts Group
GIF
Graphics Interchange Format
PNG
Portable Network Graphics
DCT
Discrete cosine transform
DWT
Discrete wavelet transform
MSE
Mean squared error
PSNR
Peak signal-to-noise ratio

SR
Similarity ratio
SF
Similarity factor
iii
DANH MỤC BẢNG TRONG LUẬN VĂN
Bảng
Tên các bảng trong luận văn
Trang
3.1
Chất lượng ảnh nhúng thủy vân và thủy vân tìm lại được.
Sử dụng phép biến đổi DWT và hai ma trận số giả nhúng
riêng biệt vào băng HL, LH
61
3.2
Tính bền vững của thuỷ vân theo kỹ thuật thuỷ vân sử dụng
DWT và ma trận số giả ngẫu nhiên trước một số tấn công
61
3.3
Chất lượng ảnh chứa thủy vân và thủy vân tìm lại được sử
dụng DWT kết hợp với DCT và ma trận số giả ngẫu nhiên
64
3.4
Tính bền vững của thuỷ vân theo kỹ thuật thuỷ vân sử dụng
DWT kết hợp với DCT và ma trận số giả ngẫu nhiên trước
một số tấn công
64
iv
DANH MỤC HÌNH TRONG LUẬN VĂN
Hình

Tên các hình trong luận văn
Trang
1.1
Sự khác nhau giữa mã hóa và giấu tin
6
2.1
Lọc theo tần số thấp và tần số cao
23
2.2
Cấu trúc phân tích và ảnh phân tích được qua phép biến đổi
DWT hai chiều mức 2
25
2.3
Ảnh gốc và năng lượng phân bố của ảnh qua phép biến đổi DCT
26
2.4
Phân chia 3 miền tần số ảnh của phép biến đổi DCT
27
2.5
Nhúng một thủy vân hình vòng trong miền DFT
41
2.6
Nhúng thủy vân trong miền DFT
43
2.7
Các hệ số biến đổi DFT
43
2.8
Lược đồ nhúng thủy vân sử dụng DWT kết hợp với DCT
45

2.9
Lược đồ trích thủy vân sử dụng DWT kết hợp với DCT
45
3.1
Nhúng thủy vân và giải nhúng theo Shoemarker
57
3.2
Nhúng thủy vân và giải nhúng sử dụng phép biến đổi DCT và
hai ma trận số giả ngẫu nhiên
58
3.3
Nhúng thủy vân và giải nhúng sử dụng phép biến đổi DWT
và ma trận số giả ngẫu nhiên
60
3.4
Nhúng thủy vân và giải nhúng sử dụng phép biến đổi DWT
kết hợp với phép biến đổi DCT và ma trận số giả ngẫu nhiên
63
1
Mở đầu
1. Tính cấp thiết của đề tài
Ngày nay thông tin số được sử dụng rộng rãi trong một môi trường mở,
tài nguyên được phân phối đa người dùng, đa truy cập đã mang lại nhiều
thuận lợi cho người sử dụng; bên cạnh đó vấn đề vi phạm bản quyền, xuyên
tạc thông tin, truy cập thông tin trái phép cũng gia tăng do đó nhu cầu bảo vệ
bản quyền đối với các sản phẩm số sau khi chuyển giao là rất cần thiết và
được nhiều cơ sở nghiên cứu quan tâm. Đây là một vấn đề nghiên cứu mới và
phức tạp, trong một vài năm gần đây đã có nhiều hội nghị quốc tế về vấn đề
này, một trong những giải pháp hữu hiệu được đưa ra là phương pháp thủy
vân số (digital watermarking).

Thủy vân trên ảnh số là một trong những kỹ thuật được phát triển sớm
trong các kỹ thuật thủy vân nói chung. Hiện tại trên ảnh tĩnh người ta đã sử
dụng một trong các kỹ thuật thủy vân: kỹ thuật thủy vân thay thế các bít ít ý
nghĩa nhất (cách tiếp cận này khá đơn giản tuy nhiên độ bền vững của thủy
vân không đảm bảo đối với các phép biến đổi ảnh). Bên cạnh đó có các kỹ
thuật thủy vân khá bền vững trước những tấn công thông thường, đó là kỹ
thuật thủy vân dựa vào các phép biến đổi rời rạc như phép biến đổi sóng nhỏ
rời rạc, phép biến đổi Cosine rời rạc, phép biến đổi Fourier rời rạc; tuy nhiên
tính ẩn của thủy vân trong từng kỹ thuật đó chưa cao.
Với mong muốn nghiên cứu, tìm hiểu các kỹ thuật thủy vân đảm bảo
được tính ẩn và tính bền vững của thủy vân, trong kỳ làm luận văn tốt nghiệp
cao học, tôi chọn đề tài “Bảo vệ bản quyền ảnh số bằng kỹ thuật thủy vân dựa
vào các phép biến đổi rời rạc”.
2
2. Mục tiêu nghiên cứu của đề tài
Đề tài “Bảo vệ bản quyền ảnh số bằng kỹ thuật thủy vân dựa vào các
phép biến đổi rời rạc” nghiên cứu, đánh giá các kỹ thuật thủy vân trên miền
tần số của ảnh hai chiều tĩnh dựa vào các phép biến đổi rời rạc, từ đó đề xuất
kỹ thuật thủy vân sử dụng kết hợp phép biến đổi sóng nhỏ rời rạc và phép
biến đổi Cosine rời rạc.
3. Đối tượng và phạm vi nghiên cứu
Định dạng file ảnh
Kỹ thuật thủy vân trên miền tần số của ảnh
Kỹ thuật thủy vân ảnh số dựa vào các phép biến đổi rời rạc.
Các công cụ lập trình .
4. Ý nghĩa khoa học của đề tài
Về mặt lý thuyết: kết quả của đề tài là nghiên cứu, đánh giá kỹ thuật
thủy vân dựa vào các phép biến đổi rời rạc. Phát triển và cải tiến các kỹ thuật
thủy vân trên ảnh tĩnh sử dụng phép biến đổi sóng nhỏ rời rạc kết hợp phép
biến đổi Cosine rời rạc.

Về mặt thực nghiệm: kết quả của đề tài làm phong phú thêm nguồn dữ
liệu trong so sánh, đánh giá các kết quả của nhóm các kỹ thuật thủy vân bền
vững cho ảnh số, bước đầu đề xuất kỹ thuật bảo vệ bản quyền ảnh số sử dụng
kết hợp phép biến đổi sóng nhỏ rời rạc và phép biến đổi Cosine rời rạc.
5. Bố cục của luận văn
Luận văn gồm 3 chương và phần kết luận với các nội dung chính sau:
1. Chương 1: Giới thiệu chung về kỹ thuật giấu tin và thủy vân trên ảnh
số. Chương này trình bày tổng quan tình hình nghiên cứu về giấu tin,
3
những khái niệm liên quan, những kỹ thuật phổ biến và các hướng
nghiên cứu triển khai về giấu tin.
2. Chương 2. Kỹ thuật thủy vân ảnh số dựa vào các phép biến đổi rời
rạc. Chương này trình bày một số kỹ thuật thuỷ vân ẩn bền vững
trong ảnh, phân tích, đánh giá từng kỹ thuật thông qua chất lượng ảnh
sau khi nhúng thuỷ vân và tính bền vững của thuỷ vân trước các tấn
công lên ảnh chứa.
3. Chương 3. Thiết kế và phát triển chương trình thử nghiệm. Chương
này thực hiện nhúng – tách thủy vân; một số kết quả thực nghiệm và
đánh giá.
4. Phần kết luận.
4
Chương 1: Giới thiệu chung về kỹ thuật giấu tin và
thủy vân trên ảnh số
1.1 Tổng quan về kỹ thuật giấu tin
1.1.1. Định nghĩa
Giấu thông tin (Steganography) là một kỹ thuật nhúng thông tin
(embeding) vào trong một nguồn đa phương tiện gọi là các phương tiện chứa
(host data) mà không nhận biết được sự tồn tại của thông tin giấu (invisible).
Ta cũng có thể định nghĩa tổng quát như sau: Giấu tin là kỹ thuật nhúng
một lượng thông tin số nào đó vào trong một đối tượng dữ liệu số khác.

1.1.2. Vài nét về lịch sử giấu tin
Từ Steganography bắt nguồn từ tiếng Hi Lạp và được sử dụng cho tới
ngày nay, nó có nghĩa là tài liệu được phủ (covered writing). Các câu chuyện
kể về kỹ thuật giấu thông tin được truyền qua nhiều thế hệ. Có lẽ những ghi
chép sớm nhất về kỹ thuật giấu thông tin thuộc về sử gia Herodotus người Hy
lạp. Khi bạo chúa Hy lạp Histiaeus bị vua Darius bắt giữ ở Susa vào thế kỷ
thứ năm trước Công nguyên, ông đã gửi một thông báo bí mật cho con rể của
mình là Aristagoras ở Miletus. Histiaeus đã cạo trọc đầu của một nô lệ tin cậy
và xăm một thông báo trên da đầu của người nô lệ ấy. Khi tóc của người nô lệ
này mọc đủ dài, anh ta được gửi tới Miletus.
Một cách giấu tin phổ biến là sử dụng mực không màu. Đây là một
phương tiện hữu hiệu cho bảo mật thông tin. Người Romans cổ đã biết sử
dụng những chất sẵn có như nước quả, sữa để viết các thông báo bí mật giữa
những hàng văn tự thông thường. Khi bị hơ nóng, những loại mực không nhìn
thấy này sẽ trở nên sẫm màu và có thể đọc được một cách dễ dàng.
5
Ý tưởng che giấu thông tin đã có từ hàng nghìn năm về trước nhưng kỹ
thuật này được dùng chủ yếu trong quân đội và trong các cơ quan tình báo.
Gần đây, giấu thông tin mới được các nhà nghiên cứu và các viện công nghệ
thông tin quan tâm. Cuộc cách mạng số hoá thông tin và sự phát triển nhanh
chóng của mạng truyền thông là nguyên nhân chính dẫn đến sự thay đổi này.
Những phiên bản sao chép hoàn hảo, các kỹ thuật thay thế tinh vi, và sự lưu
thông trên mạng của các dữ liệu đa phương tiện đã sinh ra nhiều vấn đề nhức
nhối về nạn ăn cắp bản quyền, truy cập bất hợp pháp, xuyên tạc trái phép
1.1.3. Một số thuật ngữ cơ bản
Giấu tin (datahiding): là thuật ngữ chỉ kỹ thuật giấu tin nói chung bao
gồm cả giấu tin mật và thuỷ vân số.
Giấu tin mật (steganography): chỉ những kỹ thuật giấu tin mà thông tin
mật được giấu kỹ trong một đối tượng khác sao cho không bị phát hiện.
Thuỷ vân số (watermarking): chỉ những kỹ thuật giấu tin dùng để bảo

vệ đối tượng chứa thông tin giấu.
Phương tiện chứa (host signal): là phương tiện gốc được dùng để chứa
thông tin cần giấu. Nếu giấu tin trong ảnh thì bức ảnh này được gọi là ảnh
chứa, còn giấu trong audio thì gọi là audio chứa v.v
Thông tin cần giấu (embeded data): là thông tin được nhúng vào trong
phương tiện chứa. Trong giấu tin mật, thông tin cần giấu là các thông điệp
(message), còn trong kỹ thuật thuỷ vân số thì thông tin cần giấu chính là các
thuỷ vân (các dấu hiệu công khai hoặc bí mật).
1.1.4. Sự khác biệt giữa mã hóa và giấu tin
Sự khác biệt chủ yếu giữa mã hoá thông tin và giấu thông tin là phương
pháp mã hoá làm cho các thông tin hiện rõ là nó có được mã hoá hay không
6
còn đối với phương pháp giấu thông tin thì người ta sẽ khó biết được là có
thông tin giấu bên trong do tính chất ẩn của thông tin được giấu. Một khi
những thông tin mã hoá bị phát hiện thì tin tặc sẽ tìm mọi cách để triệt phá.
Hình 1.1 Sự khác nhau giữa mã hóa và giấu tin
1.2. Giới thiệu về ảnh
1.2.1. Ảnh
Là một tập hợp hữu hạn các điểm ảnh kề nhau. Ảnh thường được biểu
diễn bằng một ma trận hai chiều, mỗi phần tử của ma trận tương ứng với một
điểm ảnh.
Ảnh nhị phân (đen trắng): là ảnh có giá trị mức xám của các điểm
ảnh được biểu diễn bằng 1 bit (giá trị 0 hoặc 1).
Ví dụ về biểu diễn ảnh nhị phân:
0
1
1
0
1
1

1
0
0
0
1
1
0
1
1
1
7
Ảnh xám: giá trị mức xám của các điểm ảnh được biểu diễn bằng 8 bit
(giá trị từ 0 đến 255).
Ví dụ về biểu diễn ảnh xám:
0
5
12
0
15
94
21
0
0
0
156
9
0
11
245
12

Ảnh màu: thông thường, ảnh màu được tạo nên từ 3 ảnh xám đối với
màu nền đỏ (RED), xanh lá cây (GREEN), xanh lam (BLUE). Tất cả các màu
trong tự nhiêu đều có thể được tổng hợp từ 3 thành phần màu trên theo các tỷ
lệ khác nhau.
Ví dụ về biểu diễn ảnh màu:
Ma trận biểu diễn mức xám của thành phần RED:
0
7
11
0
115
94
20
0
0
0
15
16
0
11
225
0
Ma trận biểu diễn mức xám của thành phần GREEN:
0
1
121
0
14
9
210

0
0
0
115
16
0
11
22
2
Ma trận biểu diễn mức xám của thành phần BLUE:
0
17
21
0
135
93
50
0
0
0
15
67
0
11
25
19
8
1.2.2. Một số cấu trúc ảnh
1.2.2.1. Ảnh BMP (Bitmap)
Trong đồ họa máy tính, BMP là một định dạng tập tin hình ảnh khá phổ

biến, thường có đuôi là .BMP hoặc .DIB
Các thuộc tính tiêu biểu của một tập tin ảnh BMP là
• số bit trên mỗi điểm ảnh (bit per pixel), thường được ký hiệu bởi n.
Một ảnh BMP n-bit có 2
n
màu. Giá trị n càng lớn thì ảnh càng có nhiều
màu, và càng rõ nét hơn. Giá trị tiêu biểu của n là 1 (ảnh đen trắng), 4
(ảnh 16 màu), 8 (ảnh 256 màu), 16 (ảnh 65536 màu) và 24 (ảnh 16 triệu
màu). Ảnh BMP 24-bit có chất lượng hình ảnh trung thực nhất.
• chiều cao của ảnh (height), cho bởi điểm ảnh (pixel).
• chiều rộng của ảnh (width), cho bởi điểm ảnh.
Cấu trúc tập tin ảnh BMP bao gồm 4 phần
• Bitmap Header (14 bytes): giúp nhận dạng tập tin bitmap.
• Bitmap Information (40 bytes): lưu một số thông tin giúp hiển thị ảnh.
• Color Palette (4×x bytes), x là số màu của ảnh: định nghĩa các màu sẽ
được sử dụng trong ảnh.
• Bitmap Data: lưu dữ liệu ảnh.
Đặc điểm nổi bật nhất của định dạng BMP là tốc độ vẽ và tốc độ xử lý
nhanh, tập tin hình ảnh thường không được nén bằng bất kỳ thuật toán nào.
Do đó, một hình ảnh lưu dưới dạng BMP thường có kích cỡ rất lớn, gấp nhiều
lần so với các ảnh được nén (chẳng hạn GIF, JPEG, hay PNG).
Định dạng BMP được hỗ trợ bởi hầu hết các phần mềm đồ họa chạy
trên Windows, và cả một số ứng dụng chạy trên MS-DOS. Tuy nhiên, do kích
9
thước tập tin ảnh BMP quá lớn, định dạng BMP không phù hợp để trao đổi
hình ảnh qua mạng Internet (do hạn chế về tốc độ truyền dữ liệu).
1.2.2.2. Ảnh JPEG (Joint Photographic Experts Group)
JPEG là một trong những phương pháp nén ảnh hiệu quả, có tỷ lệ nén
ảnh tới vài chục lần. Chất lượng ảnh bị suy giảm sau khi giải nén. Sự suy
giảm này tăng dần theo hệ số nén. Tuy nhiên sự mất mát thông tin này là có

thể chấp nhận được và việc loại bỏ những thông tin không cần thiết được dựa
trên những nghiên cứu về hệ nhãn thị của mắt người.
Phần mở rộng của các file JPEG thường có dạng .jpeg, .jfif, .jpg. Hiện
nay dạng nén ảnh JPEG rất được phổ biến trong điện thoại di động cũng như
những trang thiết bị lưu giữ có dung lượng nhỏ.
Trong không gian màu YUV, nhãn thị của con người rất nhạy cảm với
thành phần Y và kém nhạy cảm với hai loại U và V. Phương pháp nén JPEG
đã nắm bắt phát hiện này để tách những thông tin thừa của ảnh. Hệ thống nén
thành phần Y của ảnh với mức độ suy giảm ít hơn so với U, V.
JPEG cũng được sử dụng rất nhiều trên web. Lợi ích chính của chúng
là có thể hiển thị các hình ảnh với các màu chính xác (true-colour) chúng có
thể lên đến 16 triệu màu. Điều đó cho phép chúng được sử dụng tốt nhất cho
các hình ảnh chụp và hình ảnh minh hoạ với lượng màu lớn.
Nhược điểm lớn nhất của JPEG là chất lượng ảnh đã bị nén mất đi, một
số đường bao giữa các khối màu sẽ xuất hiện điểm mờ, các vùng sẽ mất đi sự
rõ nét. JPEG làm giảm chất lượng cho các bức vẽ ít màu, tạo nên những chỗ
nhòe thay cho các đường sắc nét, đồng thời độ nén cũng thấp cho các hình vẽ
ít màu. Giống như định dạng mp3, JPEG sẽ không thể phục hồi giống như
hình ảnh ban đầu dù dung lượng được tăng lên giống dung lượng ảnh thật.
Các ảnh JPEG không thể làm trong suốt hoặc chuyển động.
10
1.2.2.3. Ảnh GIF (Graphics Interchange Format)
GIF là một định dạng tập tin hình ảnh bitmap cho hình ảnh dùng ít hơn
256 màu sắc khác nhau và hoạt hình dùng ít hơn 256 màu cho mỗi khung
hình. GIF là định dạng nén dữ liệu đặc biệt hữu ích cho việc truyền hình ảnh
qua đường truyền lưu lượng nhỏ. Định dạng này được CompuServe cho ra
đời vào năm 1987 và nhanh chóng được dùng rộng rãi trên World Wide Web.
Tập tin GIF dùng nén dữ liệu bảo toàn trong đó kích thước tập tin có
thể được giảm mà không làm giảm chất lượng hình ảnh. Số lượng tối đa 256
màu làm cho định dạng này không phù hợp cho các hình chụp (thường có

nhiều màu sắc). GIF được phát triển dành cho những ảnh có tính chất thay
đổi. Nó được sử dụng tốt nhất cho đồ họa có ít màu, ví dụ như là ảnh hoạt
hình hoặc là sơ đồ, hình vẽ nút bấm.
Định dạng GIF dựa vào các bảng màu: một bảng chứa tối đa 256 màu
khác nhau cho biết các màu được dùng trong hình. Một trong số các màu
trong bảng màu có thể được đặt là trong suốt.
Có hai sự khác nhau cơ bản giữa ảnh GIF và ảnh JPEG:
+ Ảnh GIF nén lại theo cách giữ nguyên toàn bộ dữ liệu ảnh trong khi
ảnh JPEG nén lại nhưng làm mất một số dữ liệu trong ảnh.
+ Ảnh GIF bị giới hạn bởi số màu nhiều nhất là 256 trong khi ảnh
JPEG không giới hạn số màu mà chúng sử dụng
1.2.2.4. Ảnh PNG (Portable Network Graphics)
PNG là một dạng hình ảnh sử dụng phương pháp nén dữ liệu mới -
không làm mất đi dữ liệu gốc. PNG được tạo ra nhằm cải thiện và thay thế
định dạng ảnh GIF với một định dạng hình ảnh không đòi hỏi phải có giấy
phép sáng chế khi sử dụng (bắt đầu vào khoảng năm 1995, sau khi Unisys
11
công bố họ sẽ áp dụng bằng sáng chế vào thuật toán nén dữ liệu LZW sử dụng
trong định dạng GIF). PNG nén tốt hơn và có nhiều tính năng kỹ thuật hay
hơn GIF. Tất cả tính năng của GIF, trừ nén hoạt hình, đều được hỗ trợ bởi
PNG. Các trình duyệt mạng hiện đại đều hỗ trợ PNG.
PNG được hỗ trợ bởi thư viện tham chiếu libpng, một thư viện nền
tảng độc lập bao gồm các hàm của C để quản lý các hình ảnh PNG.
PNG là cấu trúc như một chuỗi các thành phần, mỗi thành phần chứa
kích thước, kiểu, dữ liệu, và mã sửa lỗi ngay trong nó có thể tương thích với
các phiên bản cũ khi sử dụng.
PNG không hỗ trợ ảnh động
Tổng kết
PNG, GIF và JPEG là 3 định dạng ảnh phổ biến nhất trên Internet hiện
nay và tùy thuộc vào nhu cầu của mỗi người mà chúng ta sẽ sử dụng chúng.

PNG hỗ trợ màu trong suốt tốt, giữ được chất lượng ảnh tốt. GIF hỗ trợ tốt
các ảnh động và ảnh 8-bit. JPEG được áp dụng rộng rãi trong nghề nhiếp ảnh
và các bức hình trên Internet, tuy nhiên hãy cẩn thận vì định dạng này sẽ làm
giảm chất lượng bức ảnh sau mỗi lần lưu trữ.
1.2.3. Giấu tin trong ảnh
Giấu tin trong ảnh chiếm vị trí chủ yếu trong các kỹ thuật giấu tin, vì vậy
các kỹ thuật giấu tin phần lớn cũng tập trung vào các kỹ thuật giấu tin trong
ảnh. Các phương tiện chứa khác nhau thì cũng sẽ có các kỹ thuật giấu khác
nhau. Đối tượng ảnh là một đối tượng dữ liệu tĩnh, dữ liệu tri giác không biến
đổi theo thời gian. Dữ liệu ảnh có nhiều định dạng, mỗi định dạng có những
tính chất khác nhau nên các kỹ thuật giấu tin trong ảnh thường chú ý những
đặc trưng và các tính chất cơ bản sau đây:
12
1. Phương tiện chứa có dữ liệu tri giác tĩnh. Dữ liệu gốc ở đây là dữ liệu
của ảnh tĩnh, dù đã giấu thông tin vào trong ảnh hay chưa thì khi ta xem ảnh
bằng thị giác, dữ liệu ảnh không thay đổi theo thời gian, điều này khác với dữ
liệu audio hay là video vì khi ta nghe hay xem thì dữ liệu gốc sẽ thay đổi liên
tục với tri giác của con người theo các đoạn hay các bài, các cảnh Sự khác
biệt này ảnh hưởng lớn đối với các kỹ thuật giấu thông tin trong ảnh với giấu
thông tin trong audio hay video.
2. Kỹ thuật giấu phụ thuộc ảnh. Kỹ thuật giấu tin phụ thuộc vào các loại
ảnh khác nhau. Chẳng hạn đối với ảnh đen trắng, ảnh đa mức xám hay ảnh
màu ta có những kỹ thuật riêng do các loại ảnh có những đặc trưng khác nhau.
3. Kỹ thuật giấu tin lợi dụng tính chất hệ thống thị giác của con người.
Giấu tin trong ảnh ít nhiều cũng gây ra những thay đổi trên dữ liệu ảnh gốc.
Dữ liệu ảnh được quan sát bằng hệ thống thị giác của con người nên các kỹ
thuật giấu tin phải đảm bảo một yêu cầu cơ bản là những thay đổi trên ảnh
phải rất nhỏ sao cho bằng mắt thường khó nhận ra được sự thay đổi đó vì có
như thế thì mới đảm bảo được độ an toàn cho thông tin giấu. Nhiều kỹ thuật
đã lợi dụng các tính chất của hệ thống thị giác để giấu tin chẳng hạn như mắt

người cảm nhận về sự biến đổi độ chói kém hơn sự biến đổi màu, cảm nhận
của mắt về màu xanh da trời là kém nhất trong ba màu cơ bản.
4. Giấu thông tin trong ảnh tác động lên dữ liệu ảnh nhưng không thay
đổi kích thước ảnh. Các thuật toán thực hiện công việc giấu thông tin sẽ được
thực hiện trên dữ liệu của ảnh. Dữ liệu ảnh bao gồm cả phần header, bảng
màu và dữ liệu ảnh. Khi giấu thông tin, các phương pháp giấu đều nhằm mục
đích biến đổi các giá trị của các bit trong dữ liệu ảnh chứ không thêm vào hay
bớt đi dữ liệu ảnh. Do vậy mà kích thước của ảnh trước hay sau khi giấu
thông tin là như nhau.
13
5. Đảm bảo chất lượng ảnh sau khi giấu tin. Đây là một yêu cầu quan
trọng đối với giấu tin trong ảnh. Sau khi giấu tin bên trong, ảnh phải đảm bảo
được yêu cầu không bị biến đổi lớn để không thể bị phát hiện dễ dàng so với
ảnh gốc. Yêu cầu này khá đơn giản đối với ảnh màu hoặc ảnh đa mức xám
bởi mỗi một điểm ảnh được biểu diễn bởi nhiều bit, và khi ta thay đổi một giá
trị nhỏ nào đó thì chất lượng ảnh thay đổi không đáng kể, thông tin giấu khó
bị phát hiện. Đối với ảnh đen trắng thì việc giấu thông tin phức tạp hơn nhiều,
vì mỗi điểm ảnh chỉ là trắng hoặc đen, và nếu ta biến đổi một bit từ đen thành
trắng mà không khéo thì sẽ rất dễ bị phát hiện. Do đó, yêu cầu đối với các
thuật toán giấu thông tin trong ảnh màu hay ảnh đa mức xám và giấu thông tin
trong ảnh đen trắng là khác nhau. Trong khi đối với ảnh màu thì các thuật
toán chú trọng vào việc làm sao giấu được càng nhiều thông tin càng tốt thì
các thuật toán áp dụng cho ảnh đen trắng lại tập trung vào việc làm thế nào để
thông tin giấu khó bị phát hiện nhất.
6. Thông tin giấu trong ảnh sẽ bị biến đổi nếu có bất cứ biến đổi nào trên
ảnh. Vì phương pháp giấu tin trong ảnh dựa trên việc điều chỉnh các giá trị
của các bit theo một qui tắc nào đó và khi giải mã sẽ theo các giá trị đó để tìm
được thông tin giấu. Theo đó, nếu một phép biến đổi nào đó trên ảnh làm thay
đổi giá trị của các bit thì sẽ làm cho thông tin giấu bị sai lệch. Nhờ đặc điểm
này mà giấu thông tin trong ảnh có tác dụng nhận thực và phát hiện xuyên tạc

thông tin.
7. Vai trò của ảnh gốc khi giải tin. Các kỹ thuật giấu tin phải xác định rõ
ràng quá trình lọc ảnh để lấy thông tin giấu cần đến ảnh gốc hay không. Đa số
các kỹ thuật giấu tin mật thường không cần ảnh gốc khi lọc tìm thông tin đã
giấu. Thông tin được giấu trong ảnh sẽ được mang cùng với dữ liệu ảnh, khi
tách tin chỉ cần ảnh đã mang thông tin giấu mà không cần dùng đến ảnh gốc
để so sánh đối chiếu.
14
1.3. Những yêu cầu cơ bản của hệ thuỷ vân trên ảnh số
Hệ thuỷ vân số trên ảnh có một số đặc điểm và tính chất giống như giấu
tin trong ảnh, đó là:
− Phương tiện chứa là ảnh hai chiều tĩnh,
− Thuỷ vân trên ảnh tác động lên dữ liệu ảnh nhưng không làm thay đổi
kích thước ảnh,
− Kỹ thuật thủy vân phụ thuộc vào tính chất hệ thống thị giác con người,
− Khi giải tin có thể cần ảnh gốc.
Ngoài một số đặc điểm chung, kỹ thuật thuỷ vân số được phân biệt với
kỹ thuật giấu tin mật ở những đặc trưng sau đây:
Thông tin trong ảnh có bị biến đổi nếu có bất cứ một biến đổi nào trên ảnh ?
Tính chất này có trong kỹ thuật giấu tin mật nhưng đối với kỹ thuật thuỷ
vân thì chỉ có trong loại thuỷ vân “dễ vỡ”. Còn đối với loại thuỷ vân bền vững
thì lại yêu cầu chống lại được những phép biến đổi thông thường trên ảnh.
Thuỷ vẩn ẩn hay thuỷ vân hiện ?
Kỹ thuật thuỷ vân số có hai loại là thuỷ vân ẩn và thủy vân hiển. Nghĩa
là có loại thuỷ vân cho phép nhìn thấy được thông tin đem nhúng vào và có
loại không nhìn thấy. Loại thuỷ vân hiện được sử dụng cho mục đích công bố
công khai về chủ quyền sở hữu, ngược lại loại thuỷ vân ẩn được sử dụng với
mục đích gài bí mật các thông tin xác nhận chủ quyền sở hữu.
Tính chất bền vững
Tính chất này là tính chất quan trọng nhất của một hệ thuỷ vân bền vững.

Nghĩa là hệ thuỷ vân phải chống lại được các phép biến đổi, hay các tấn công
có chủ đích hoặc không có chủ đích lên thuỷ vân.
15
Thuỷ vân cái gì?
Một câu hỏi đầu tiên đối với hệ thuỷ vân là thông tin gì sẽ được giấu
vào bên trong ảnh? Kiểu thuỷ vân hay dùng nhất là một chuỗi các kỹ tự, chuỗi
kí tự được nhúng trực tiếp lên ảnh mang những thông tin như tác giả, tiêu đề
hay ngày tháng, hay thông tin bản quyền…Tuy nhiên, sử dụng chuỗi kí tự lại
bị một hạn chế. Đó là mỗi ký tự biểu diễn bằng nhiều bit, do vậy nếu như vì
một lí do nào đó một bit bị lỗi thì sẽ làm sai cả kí tự và chỉ cần một phép biến
đổi đơn giản như phép biến đổi JPEG cũng có thể làm cho thuỷ vân bị sai lệch
rất nhiều. Chúng ta cũng có thể thuỷ vân một bức ảnh nhỏ, khi đó sẽ là ảnh
trong ảnh. Khi giải tin thì một số điểm ảnh có thể sai nhưng hình tổng thể sẽ
được giữ nguyên. Trong những kỹ thuật gần đây, người ta sử dụng thuỷ vân là
một chuỗi bit sinh ngẫu nhiên theo một luật phân phối xác suất nào đó. Sau
đó, áp dụng các lí thuyết xác suất thống kê để chứng thực thuỷ vân.
Trong các loại thuỷ vân thì thuỷ vân ẩn và bền vững được quan tâm
nghiên cứu nhiều hơn vì ý nghĩa ứng dụng lớn của nó như đã nói ở phần trên.
Do vậy, hai tính chất quan trọng nhất của hệ thuỷ vân mà các nhà nghiên cứu
đang cố gắng đạt được là thuộc tính ẩn và thuộc tính bền vững. Nhưng đây lại
là mấu chốt của sự phức tạp vì hai thuộc tính này mâu thuẫn nhau. Nếu như
để đảm bảo thuộc tính ẩn, thuỷ vân phải được giấu trong những vị trí ít có ý
nghĩa tri giác nhất, ít bị chú ý nhất thì để đảm bảo được thuộc tính bền vững,
thuỷ vân phải chịu được những phép xử lí ảnh phổ biến như dịch chuyển ảnh
hay nén JPEG. Ví dụ như phép nén JPEG loại bỏ ở ảnh những thông tin ít có
tính tri giác nhất để làm giảm kích thước của ảnh mà vẫn đảm bảo được chất
lượng ảnh. Khi đó thì những dữ liệu của thuỷ vân nằm trong vùng này sẽ bị
mất đi hoặc bị biến đổi sai lệch hoàn toàn. Với tính phức tạp của yêu cầu cho
một hệ thuỷ vân, phần sau đây chúng ta sẽ tìm hiểu những giải pháp kỹ thuật
đã được đưa ra của các nhà khoa học trên thế giới.

16
1.4. Những tấn công trên hệ thuỷ vân
Phương pháp thuỷ vân nên chống lại được một số phép xử lý ảnh thông
thường và một số tấn công có chủ đích. Cho đến nay chưa có một hệ thống
thuỷ vân hoàn hảo và cũng không rõ liệu có tồn tại hay không một hệ thống
thuỷ vân an toàn tuyệt đối. Vì vậy, trong thực tế thì thuỷ vân phải cân đối
giữa bền vững với các thuộc tính khác như lượng thông tin giấu, tính ẩn…
Dựa trên các yêu cầu của ứng dụng, người ta sẽ lựa chọn một phương pháp
thuỷ vân thích hợp nhất. Từ những biến đổi có chủ đích hay không có chủ
đích đã biết đối với hệ thuỷ vân mà ta có thể phân biệt thành các nhóm sau:
Tấn công đơn giản: là dạng tấn công cố gắng làm hỏng thủy vân đã
được nhúng bằng cách thao tác lên toàn bộ dữ liệu đã được nhúng thủy vân
mà không có ý định nhận dạng để tách lấy thủy vân
Tấn công phát hiện: là sự tấn công với mục đích loại bỏ đi mối quan hệ
và vô hiệu hóa khả năng khôi phục thủy vân, làm cho bộ phát hiện không thể
xác định được thủy vân. Điều này được thực hiện chủ yếu bằng các phép biến
đổi hình học: phóng to, thu nhỏ, xoay lật, cắt xén,
Tấn công nhập nhằng: là sự tấn công với mục đích gây nhầm lẫn bằng
cách tạo ra dữ liệu gốc giả hoặc dữ liệu đã được nhúng thủy vân giả. Ví dụ: kẻ
tấn công có thể làm giảm tính xác thực của thủy vân bằng cách nhúng một
hoặc nhiều thủy vân bổ sung sao cho thủy vân mới không thể phân biệt được
với thủy vân ban đầu.
Tấn công loại bỏ: nhằm mục đích phân tích để xác định thủy vân hoặc
dữ liệu gốc, tách dữ liệu đã nhúng thủy vân thành dữ liệu gốc và thủy vân.
Tuy nhiên sự phân biệt trên nhiều khi không rõ ràng, nhiều khả năng
tấn công không thể xếp vào một nhóm cụ thể nào.
17
Dưới đây là một số phép thay đổi:
- Biến đổi tín hiệu: làm sắc nét, thay đổi độ tương phản, màu, gamma…
- Nhiễu cộng, nhiễu nhân…

- Lọc tuyến tính
- Nén mất thông tin
- Giảm dữ liệu: cropping, sửa histogram
- Chuyển mã gif

jpeg
- Chuyển đổi tương tự sang số
- Thủy vân nhiều lần
Nguyên tắc cơ bản của phương pháp thuỷ vân là đảm bảo đủ tính bền vững
sao cho các tấn công sẽ làm cho giá trị thương mại của ảnh gốc bị ảnh hưởng.
1.5. Những ứng dụng chủ yếu của hệ thuỷ vân
1.5.1. Bảo vệ bản quyền tác giả (copyright protection):
Đây là ứng dụng cơ bản nhất của kỹ thuật thuỷ vân số, một dạng của
phương pháp giấu tin. Một thông tin nào đó mang ý nghĩa quyền sở hữu tác
giả sẽ được nhúng vào trong các sản phẩm kỹ thuật số trước khi đưa vào lưu
thông, phân phối. Thuỷ vân này chỉ một mình người chủ sở hữu hợp pháp sản
phẩm đó có và được dùng để chứng minh cho bản quyền sản phẩm. Giả sử có
một sản phẩm dữ liệu đa phương tiện như ảnh, âm thanh, video cần được lưu
thông trên mạng. Để bảo vệ sản phẩm, chống lại các hành vi lấy cắp hoặc làm
nhái cần phải có một kỹ thuật để “dán tem bản quyền” vào sản phẩm này.
Việc dán tem hay chính là việc nhúng thuỷ vân cần phải đảm bảo không để lại
một ảnh hưởng lớn nào đến chất lượng cảm nhận của sản phẩm. Yêu cầu kỹ
thuật đối với ứng dụng này là thuỷ vân phải tồn tại bền vững cùng với sản
phẩm, muốn bỏ thuỷ vân này mà không được phép của người chủ sở hữu thì
chỉ còn cách là phá huỷ sản phẩm.

×