Tải bản đầy đủ (.pdf) (69 trang)

Thủy vân thuận nghịch sử dụng phép biến đổi mở rộng hiệu Phạm Quốc Kim.

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.85 MB, 69 trang )

1

Số hóa bởi Trung tâm Học liệu

ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG












PHẠM QUỐC KIM






THỦY VÂN THUẬN NGHỊCH SỬ DỤNG
PHÉP BIẾN ĐỔI MỞ RỘNG HIỆU







LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH




Thái Nguyên - 2014
2

Số hóa bởi Trung tâm Học liệu


ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG








PHẠM QUỐC KIM

THỦY VÂN THUẬN NGHỊCH SỬ DỤNG
PHÉP BIẾN ĐỔI MỞ RỘNG HIỆU




Chuyên ngành : Khoa học máy tính
Mã số : 60 48 01





LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH


NGƯỜI HƯỚNG DẪN KHOA HỌC
PGS.TS. Phạm Văn Ất






Thái Nguyên - 2014
3

Số hóa bởi Trung tâm Học liệu


LỜI CAM ĐOAN

Tôi xin cam đoan Những nội dung trong luận văn “Thủy vân thuận
nghịch sử dụng phép biến đổi mở rộng hiệu” là do tôi thực hiện dưới sự
hướng dẫn trực tiếp của Thầy PGS.TS. Phạm Văn Ất.
Mọi tham khảo dùng trong luận văn đều được trích dẫn rõ ràng tên

tác giả, tên công trình, thời gian, địa điểm công bố.
Mọi sao chép không hợp lệ, vi phạm quy chế đào tạo, hay gian trá,
tôi xin chịu trách nhiệm hoàn toàn.

Thái Nguyên, tháng 09 năm 2014
Phạm Quốc Kim












4

Số hóa bởi Trung tâm Học liệu


LỜI CẢM ƠN
Tôi xin gửi lời cảm ơn chân thành nhất tới PGS.TS.Phạm văn Ất,
Thầy đã cho tôi những định hướng, tận tình chỉ bảo giúp đỡ tôi những ý
kiến rất quý báu để tôi hoàn thành luận văn tốt nghiệp này.
Tôi xin cảm ơn Trường Đại Học Công Nghệ Thông tin và Truyền
thông - Đại Học Thái Nguyên đã hết sức tạo điều kiện cho tôi trong quá
trình học, làm và hoàn thành khóa luận này.

Xin chân thành cảm ơn quý Thầy Cô trong khoa Sau đại học Trường
Đại học Công nghệ Thông tin và Truyền thông – ĐH Thái Nguyên đã nhiệt
tình giảng dạy, trang bị cho tôi những kiến thức quý báu trong suốt thời
gian học tập tại trường.
Tôi xin tỏ lòng biết ơn sâu sắc tới các thầy cô, bạn bè đã dìu dắt,
giúp đỡ tôi tiến bộ trong suốt quá trình làm khóa luận tốt nghiệp.
Xin gửi lời cảm ơn tới gia đình, những người bạn của tôi đã động
viên, giúp đỡ tôi trong suốt quá trình học tập và hoàn thành luận văn.


5

Số hóa bởi Trung tâm Học liệu


MỤC LỤC

LỜI CAM ĐOAN i
LỜI CẢM ƠN ii
MỤC LỤC iii
DANH MỤC CHỮ VIẾT TẮT v
DANH MỤC BẢNG, HÌNH VẼ vi
LỜI NÓI ĐẦU 9
CHƢƠNG 1TỔNG QUAN VỀ KỸ THUẬT GIẤU TIN VÀ THỦY VÂN 11
1.1. Một số vấn đề cơ bản về giấu tin 11
1.1.1. Khái niệm giấu tin 11
1.1.2. Phân loại các kỹ thuật giấu tin và ứng dụng 11
1.1.3. Mô hình kỹ thuật giấu tin 12
1.2. Một số vấn đề cơ bản về thủy vân 15
1.2.1. Khái niệm về thủy vân 15

1.2.2. Phân loại thủy vân 15
1.2.3. Các ứng dụng của thuỷ vân với ảnh số 16
1.2.4. Một số tính chất của sơ đồ thủy vân 17
1.3. Ảnh số 19
1.3.1. Phân loại ảnh 19
1.3.2. Histogram của ảnh 20
1.3.3. Chất lượng ảnh 21
1.4. Một số lược đồ giấu tin trên ảnh nhị phân 21
1.4.1. Lược đồ giấu tin Wu-Lee 21
1.4.2. Lược đồ giấu tin THA 27
CHƢƠNG 2MỘT SỐ LƢỢC ĐỒ GIẤU TIN VÀ THỦY VÂN THUẬN
NGHỊCH 30
2.1. Tổng quan về thủy vân thuận nghịch 30
2.2. Bài toán overflow-underflow trong thủy vân thuận nghịch 31
6

Số hóa bởi Trung tâm Học liệu


2.3. Một số hướng tiếp cận trong thủy vân thuận nghịch 31
2.3.1. Dịch chuyển histogram 31
2.3.2. Sử dụng đặc trưng nén JPEG 37
2.3.3. Sử dụng nén bảo toàn 43
2.3.4. Sử dụng phép biến đổi mở rộng hiệu 44
2.3.5 Lược đồ thủy vân thuận nghịch Tian 48
2.3.6 Một số cải tiến của phương pháp mở rộng hiệu 50
CHƢƠNG 3CHƢƠNG TRÌNH THỬ NGHIỆM 55
3.1. Thuật toán nhúng dấu thủy vân 55
3.2. Thuật toán trích dấu thủy vân 56
3.3. Kết quả thực nghiệm 56

3.4. Mã nguồn chương trình 59
KẾT LUẬN 67
TÀI LIỆU THAM KHẢO 68















7

Số hóa bởi Trung tâm Học liệu


DANH MỤC CHỮ VIẾT TẮT, TIẾNG ANH

Chữ viết tắt
Diễn giải
Ý nghĩa

Watermarking

Thủy vân số

Fragile
Dễ vỡ

Robust
bền vững
PSNR
Peak Signal to Noise Ratio
Tỷ số tín hiệu đỉnh trên nhiễu.

perceptual insignificant
Trực giác
JPEG
Joint Photographic Experts
Group
Phương pháp nén ảnh
DCT
Discrete Cosine Transform
Phép biến đổi cosine rời rạc
IMG
Image
Ảnh IMG.

Run – Length
Nén loạt dài
















8

Số hóa bởi Trung tâm Học liệu


DANH MỤCHÌNHVẼ

Tênhình
Ýnghĩa
Hình1.1
Phân loại các kỹ thuật giấu tin
Hình1.2
Mô hình thuật toán nhúng tin
Hình1.3
Mô hình trích tin
Hình1.4
Phân loại thủy vân theo mục đích ứng dụng
Hình1.5
Biểu đồ histogram của ảnh màu Pepper

Hình2.1
Điểm Peak và Zero
Hình2.2
Các đường chéo của khối DCTLT
Hình 2.3
Xét một khối DCT lượng tử
Hình2.4
Lược đồ nhúng tinLS
Hình3.1
Các ảnh gốc và dấu thủy vân sử dụng trong thử nghiệm
Hình3.2
Các ảnh gốc và dấu thủy vân tương ứng với ảnh gốc Hình 3.1
Hình3.3
Ảnh dấu thuỷ vân trích được và khôi phục các ảnh gốc từ ảnh
thuỷ vân trên Hình 3.2.


DANH MỤC BẢNG BIỂU

Tên bảng
Ý nghĩa
Bảng1
Kết quả tiền xử lý và nhúng tin
Bảng2
Kết quả trích tin và khôi phục ảnh gốc




9


Số hóa bởi Trung tâm Học liệu


LỜI NÓI ĐẦU
Một trong những thành tựu quan trọng của những thập niên cuối thế kỷ
20, đầu thế kỷ 21 là sự ra đời phát triển của mạng Internet. Mọi người đều
có thể kết nối vào Internet để tìm kiếm thông tin một cách dễ dàng thông
qua nhà cung cấp dịch vụ Internet. Người dùng có thể đọc các thông tin
mới nhất, tra cứu các thư viện số, tìm thông tin lĩnh vực mình quan tâm.
Bên cạnh đó các nhà cung cấp sản phẩm cũng sẵn sàng cung cấp dữ liệu
của mình cho người dùng thông qua mạng.
Tuy nhiên việc phân phối một cách phổ biến các tài nguyên trên mạng
hiện nay luôn gặp phải vấn nạn sao chép và sử dụng không hợp pháp.Kỹ
thuật thuỷ vân đang được xem là một trong những giải pháp quan trọng
trong việc bảo vệ bản quyền và xác thực tính toàn vẹn của dữ liệu số.
Trong nhiều ứng dụng ngoài việc trích thủy vân người ta còn muốn khôi
phục lại ảnh gốc. Vì vậy những năm gần đây xuất hiện một hướng nghiên
cứu mới là thủy vân thuận nghịch. Trong giấu tin và thủy vân thuận nghịch
thường sử dụng các phép biến đổi nguyên khả nghịch như dịch chuyển
Histogram, Wavelet nguyên, phép biến đổi tương phản, phép biến đổi mở
rộng hiệu, ….Trong số đó kỹ thuật giấu tin và thủy vân dựa trên phép biến
đổi mở rộng hiệu đạt được hiệu quả cao nên đang được nhiều người quan
tâm.Chính vì vậy em chọn đề tài “Thủy vân thuận nghịch sử dụng phép
biến đổi mở rộng hiệu”làm luận văn tốt nghiệp của mình.
Bố cục của Luận văn gồm 3 chương như sau:
Chương 1: Tổng quan về kỹ thuật giấu tin và thuỷ vân.
Chương 2: Một số lược đồ giấu tin và thuỷ vân thuận nghịch.
Chương 3: Chương trình thử nghiệm.
10


Số hóa bởi Trung tâm Học liệu


Trong quá trình thực hiện luận văn, em đã nhận được nhiều sự quan
tâm, giúp đỡ của các thầy cô giáo Trường Đại học Công nghệ thông tin và
Truyền thông-Thái Nguyên, đặc biệt sự hướng dẫn tận tình của PGS.TS.
Phạm Văn Ất. Mặc dù đã rất cố gắng, nhưng luận văn không tránh khỏi
những thiếu sót, em rất mong nhận được sự góp ý của các thầy cô để luận
văn được hoàn thiện hơn. Em xin chân thành cảm ơn!

11

Số hóa bởi Trung tâm Học liệu


CHƢƠNG 1
TỔNG QUAN VỀ KỸ THUẬT GIẤU TIN VÀ THỦY VÂN
Chương này tập trung trình bày một số khái niệm liên quan đến ảnh số,
kỹ thuật giấu tin, thủy vân số và ứng dụng.Ngoài ra, trong chương còn
trình bày hai thuật toán giấu tin trên ảnh nhị phân gồm Thuật toán Wu-Lee
[5] và thuật toán THA [6].
1.1. Một số vấn đề cơ bản về giấu tin
1.1.1. Khái niệm giấu tin
Giấu tin là một kỹ thuật giấu một lượng thông tin nào đó vào một đối
tượng dữ liệu khác nhằm hai mục đích đó là: Một là bảo vệ cho chính đối
tượng được giấu tin bên trong. Đây chính là thủy vân số, đây là lĩnh vực rất
đa dạng, có nhiều mục đích và đang được quan tâm, nghiên cứu rất nhiều;
tính ứng dụng của nó trong hiện tại rất lớn và đã có nhiều kỹ thuật được đề
xuất. Hai là bảo mật cho dữ liệu được đem giấu. Chính là giấu tin mật, tập

trung vào các kỹ thuật giấu tin sao cho người khác rất vất vả, khó khăn mới
phát hiện được đối tượng có chứa thông tin mật bên trong.
1.1.2. Phân loại các kỹ thuật giấu tin và ứng dụng
Dựa theo mục đích sử dụng, ta có chia các lược đồ giấu tin thành hai
nhóm chính giấu tin và thủy vân:
- Thủy vân số: Là nhúng một lượng thông tin có ích vào các sản phẩm số.
Có thể chia thành hai loại thủy vân như sau: Thủy vân bền vững và
thủy vân dễ vỡ. Thủy vân bền vững nghiên cứu đến việc nhúng những mẩu
tin với yêu cầu độ bền vững cao của thông tin được giấu trước những biến
đổi của môi trường dữ liệu. Còn thủy vân dễ vỡ quan tâm đến thông tin
giấu sẽ bị sai lệch nếu có bất kỳ sự thay đổi nào trên dữ liệu chứa thông tin giấu.
12

Số hóa bởi Trung tâm Học liệu


- Giấu tin mật: Với kỹ thuật giấu tin mật này luôn quan tâm đến tính
che giấu thông tin, với mục đích nhằm làm sao cho việc phát hiện được đối
tượng có chứa thông tin mật ở bên trong hay không; nếu phát hiện có giấu
tin thì việc giải mã thông tin mật cũng sẽ mất rất nhiều thời gian và rất khó
thực hiện được. Các kỹ thuật giấu tin cũng rất quan tâm đến lượng tin có
thể giấu được.
Như vậy, kỹ thuật giấu tin có thể được phân loại như hình sau:
Giấu tin
Giấu tin mật Thủy vân số

Hình 1.1. Phân loại các kỹ thuật giấu tin
1.1.3. Mô hình kỹ thuật giấu tin
Giống như các lược đồ mã hóa thông tin, một kỹ thuật giấu tin gồm
thuật toán nhúng tin và thuật toán trích tin. Theo [5], sơ đồ của thuật toán

nhúng tin tổng quá có mô hình như sau :

13

Số hóa bởi Trung tâm Học liệu



Hình 1.2 Mô hình thuật toán nhúng tin
Trong Hình 1.2, môi trường giấu tin là những dữ liệu dùng để chứa
thông tin mật, dữ liệu môi trường thường là những dữ liệu được dùng phổ
biến trên Internet như : tệp ảnh, tệp âm thanh, tệp video, tệp text…Thông
tin cần giấu là một lượng thông tin mang ý nghĩa và mục đích nào đó tùy
thuộc vào mục đích và yêu cầu của người sử dụng (tin mật). Tin mật được
nhúng vào trong môi trường chứa thông tin nhờ một bộ nhúng thông tin.
Trong quá trình nhúng tin, thuật toán có thể sử dụng hệ thống khóa làm
tăng tính an toàn cho hệ thống. Sau khi nhúng tin mật vào dữ liệu môi
trường tanhận được dữ liệu môi trường có chưa tin. Dữ liệu này được
truyền tải trên các môi trường truyền thông khác nhau.
Khi nhận được dữ liệu có chưa tin, người nhận thực hiện thuật toán
trích tin tương ứng để trích rút tin mật từ dữ liệu môi trường. Trong một số
trường hợp, người dùng có thể khôi phục lại dữ liệu môi trường từ dữ liệu
chứa tin. Theo [5], thuật toán trích tin có mô hình thực hiện như :
14

Số hóa bởi Trung tâm Học liệu



Hình 1.3 Mô hình trích tin

Trong hình 1.3 đã chỉ ra các nhiệm vụ của quá trình giải mã thông tin
đã được giấu.Quá trình giải mã này phải được thực hiện thông qua một bộ
giải mã tương ứng với bộ nhúng thông tin và kết hợp với khóa để giải mã
tin. Khóa để giải mã tin này có thể giống hay khác với khóa đã nhúng tin.
Kết quả thu được bao gồm môi trường gốc và thông tin đã được che giấu.
Tùy theo các trường hợp cụ thể, thông tin tách được ra có thể phải cần xử
lý, kiểm định và so sánh với thông tin đem giấu ban đầu. Thông qua dữ liệu
được tách ra từ môi trường chứa thông tingiấu, người ta có thể biết được
trong quá trình truyền tải, phân phát dữ liệu có bị xâm phạm, tấn công hay không.
Đối với các hệ thống giấu thông tin mật này rất quan tâm đến tính an
toàn và bảo mật thông tin của dữ liệu cần giấu. Hệ thống giấu tin mật có độ
bảo mật cao nếu có độ phức tạp của các thuật toán thám mã khó có thể thực
hiện được trên máy tính. Tuy nhiên, cũng có các hệ thống chỉ quan tâm đến
số lượng thông tin có thể được che giấu, hay quan tâm đến sự ảnh hưởng
của thông tin mật đến các môi trường chứa dữ liệu.
15

Số hóa bởi Trung tâm Học liệu


1.2. Một số vấn đề cơ bản về thủy vân
1.2.1.Khái niệm về thủy vân
Thuỷ vân (Watermarking) là kỹ thuật nhúng thông tin vào dữ liệu môi
trường (đa phương tiện) như: tệp ảnh, tệp video, tệp âm thanh… nhằm bảo
vệ dữ liệu đa phương tiện trong quá trình trao đổi không an toàn. Thông tin
nhúng (dấu thủy vân) được dùng để xác định tính toàn vẹn, phát hiện vị trí
bị thay đổi hoặc chứng minh quyền tác giả đối với dữ liệu chứa dấu thủy vân.
1.2.2.Phân loại thủy vân
Dựa vào mục đích sử dụng, thủy vân số có thể được phân loại như hình sau :



Đối với các lược đồ thủy vân dễ vỡ (Fragile), dấu thủy vân sẽ bị thay
đổi trước sự biến đổi của dữ liệu đã thủy vân dù chỉ vài bít. Vì vậy, thủy
vân dễ vỡ thường được ứng dụng trong bài toán xác thực tính toàn vẹn của
dữ liệu thủy vân.Trong một số trường hợp, thủy vân dễ vỡ có thể khoanh
vùng được dữ liệu thay đổi.
Trái với thủy vân dễ vỡ, thủy vân bền vững (Robust) yêu cầu dấu thủy
vân phải tồn tại trước sự tấn công vô tình hay có chủ định nhằm loại bỏ dấu
thủy vân.Theo [10], đối với thủy vân bền vững, dấu thủy vân phải luôn tồn
tại trước mọi sự tấn công trừ khi dữ liệu thủy vân không còn giá trị sử
Dễ vỡ
Bền vững
Bán dễ vỡ
Thủy vân
Hình 1.4. Phân loại thủy vân theo mục đích ứng dụng
16

Số hóa bởi Trung tâm Học liệu


dụng. Một số phép tấn công thường được sử dụng như: nén, cắt, xoay, lọc,
làm mờ, cân bằng sáng…Do dấu thủy vân bền vững (tồn tại) trước các sự
tấn công nên nhóm các lược đồ này thường được sử dụng trong bài toán
bảo vệ bản quyền hay xác định chủ sở hữu.
Theo [10], ngoài thủy vân dễ vỡ và thủy vân bền vững, các lược đồ
thủy vân có khả năng bền vững trước các phép tấn công nén, nhiễu, print,
cân bằng sáng nhưng lại dễ vỡ với các phép tấn công copy/paste, co dãn thì
được gọi là thủy vân bán dễ vỡ. Một cách tổng quát, dấu thủy vân của lược
đồ thủy vân bán dễ vỡ cần phải dễ thay đổi trước các phép tấn công nhằm
thay đổi nội dung hay ý nghĩa của dữ liệu nhưng lại bền vững trước sự thay

đổi định dạng dữ liệu hoặc các lỗi đường truyền. Các lược đồ thủy vân bán
dễ vỡ thường sử dụng trong bài toán phát hiện sự giả mạo nội dung, xuyên
tạc thông tin.
1.2.3. Các ứng dụng của thuỷ vân với ảnh số
Các ứng dụng của thuỷ vân đối với ảnh số bao gồm các lĩnh vực như
bảo vệ bản quyền, xác thực ảnh và bảo toàn dữ liệu, giấu dữ liệu và gán
nhãn ảnh, ta sẽ lần lượt đề cập từng ứng dụng.
a) Bảo vệ bản quyền
Mục đích của thuỷ vân với bảo vệ bản quyền là gắn một “dấu hiệu” vào
dữ liệu ảnh mà có thể xác định được người nắm giữ bản quyền. Và ta cũng
có thể gắn thêm một dấu hiệu khác gọi là vân tay để xác định người dùng
của sản phẩm. Dấu hiệu có thể là một dãy số như mã hàng hoá quốc tế, một
message hoặc một logo… Thuật ngữ thuỷ vân xuất phát từ phương thức
đánh dấu giấy tờ với một logo từ thời xa xưa với mục đích tương tự.
b) Xác thực ảnh và bảo toàn dữ liệu
Một ứng dụng khác của thuỷ vân là xác thực ảnh và phát hiện giả mạo.
Ảnh số ngày càng được sử dụng như các bằng chứng trước pháp luật ngày
nay. Vấn đề là cần xác thực được tính hợp pháp của ảnh này. Thuỷ vân
17

Số hóa bởi Trung tâm Học liệu


được sử dụng ở đây để xác định xem ảnh là nguyên bản hay đã chịu tác
động của con người, bằng các ứng dụng xử lý ảnh. Thuỷ vân được dấu lúc
đầu phải mang tính chất không bền vững, để bất kỳ sự thay đổi nhỏ nào tới
ảnh cũng có thể làm hỏng thuỷ vân hoặc phát hiện được thay đổi đối với
thuỷ vân này. Tuy vậy, thuỷ vân vẫn phải tồn tại với các phép biến đổi ảnh
thông thường như chuyển đổi định dạng, lấy mẫu, nén…
c) Giấu dữ liệu và gán nhãn ảnh

Giấu dữ liệu là nhằm trao đổi dữ liệu bí mật thông qua một bức ảnh.
Điều này cho phép trao đổi thông tin mà không gây chú ý đối với người
ngoài. Khối lượng dữ liệu dấu được là quan trọng nhất đối với mục đích này.
Còn gán nhãn ảnh là ứng dụng dùng để cung cấp thêm thông tin cho
người dùng hoặc để phục hồi ảnh từ cơ sở dữ liệu.
1.2.4. Một số tính chất của sơ đồ thủy vân
Tuỳ thuộc vào từng loại thuỷ vân số và ứng dụng của nó mà ta có các
yêu cầu khác nhau đối với các phương pháp tạo thuỷ vân. Ở đây chỉ đề cập
đến yêu cầu đối với thuỷ vân số ẩn.
Đối với loại thuỷ vân này, ba yêu cầu sau đây là cơ bản và cần thiết đối
với các ứng dụng bảo vệ bản quyền:
Tính ẩn: Thứ nhất, thuỷ vân phải ẩn đối với trực giác của con người
(imperceptibility hay perceptual tranperancy), tức là con người phải không
nhận biết được sự có mặt của thuỷ vân trong ảnh. Điều này cũng có nghĩa
là việc dấu thuỷ vân chỉ gây ra sự thay đổi rất nhỏ đối với ảnh, không ảnh
hưởng đến chất lượng ảnh.
Tính bền vững: Yêu cầu thứ hai là thuỷ vân phải bền vững (robustness),
thuỷ vân phải có khả năng tồn tại cao với các tấn công có chủ đích và
không có chủ đích. Các tấn công không có chủ đích đối với ảnh số bao gồm
18

Số hóa bởi Trung tâm Học liệu


như nén ảnh, lấy mẫu, lọc, chuyển đổi A/D và D/A … còn các tấn công có
chủ đích có thể là việc xoá, thay đổi hoặc làm nhiễu thuỷ vân trong ảnh. Để
thực hiện được điều này, thuỷ vân phải được dấu trong các vùng quan trọng
đối với trực giác (perceptual significant). Phương pháp thuỷ vân số phải
đảm bảo sao cho việc không thể lấy lại thuỷ vân tương đương với việc ảnh
đã bị biến đổi quá nhiều, không còn giá trị về thương mại.

Khả năng mang tin cao: Với yêu cầu này, lượng tin cần thêm vào ảnh phải
đủ dùng trong ứng dụng mà không làm thay đổi quá nhiều chất lượng ảnh.
Tuy vậy, việc làm tốt cả ba yêu cầu trên là một điều rất khó. Để dấu
thuỷ vân trong ảnh thì ta bắt buộc phải thay đổi dữ liệu ảnh. Ta có thể tăng
tính bền vững cho thuỷ vân bằng cách tăng lượng thay đổi ảnh cho mỗi đơn
vị tin cần dấu. Nhưng, nếu thay đổi quá nhiều thì tính ẩn không còn được
đảm bảo nữa. Còn nếu thay đổi ảnh quá ít thì các yếu tố dùng để xác định
thuỷ vân trong ảnh sau các phép tấn công có thể không đủ để xác định thuỷ
vân. Nếu thông tin được dấu quá nhiều thì cũng dễ làm thay đổi chất lượng
ảnh, và làm giảm tính bền vững. Vì vậy, lượng thay đổi ảnh lớn nhất có thể
chấp nhận và tính bền vững là hai nhân tố quyết định cho khối lượng tin
được dấu trong ảnh.
Còn đối với các ứng dụng để phát hiện giả mạo ảnh gốc thì thuỷ vân
nhúng vào phải có tính giòn (fragile) nghĩa là sẽ bị vỡ nếu chịu sự biến đổi
mất thông tin. Một cách thực hiện điều này mà vẫn đảm bảo tính ẩn của
thuỷ vân là dấu nó vào các phần dữ liệu ít đáng chú ý về mặt trực giác
(perceptual insignificant). Đối với ảnh, đó có thể là các bít thấp của các
điểm ảnh (LSB).
Loại thuỷ vân nửa giòn (semi-fragile) được dùng trong việc phân biệt
các loại biến đổi mất thông tin đã được sử dụng: Biến đổi mất thông tin
nhưng không thay đổi nội dung và biến đổi mất thông tin gây thay đổi nội
19

Số hóa bởi Trung tâm Học liệu


dung. Ví dụ, với các ứng dụng xác thực thì cần có loại thuỷ vân phân biệt
giữa các biến đổi mất thông tin như nén nhưng vẫn đảm bảo tính nguyên
vẹn dữ liệu và biến đổi làm thay đổi tính toàn vẹn dữ liệu như các việc xử
lý ảnh có mục đích. Và yêu cầu đối với loại ứng dụng này là phải chỉ ra

được vùng ảnh đã chịu các biến đổi đó.
1.3. Ảnh số
Như đã biết, ảnh số thường được lượng tử từ ảnh liên tục (ảnh tự
nhiên). Do vậy, dữ liệu của ảnh số có sự tương quan cao. Nói cách khác,
các điểm ảnh lân cận (liền kề) thường có giá trị xấp xỉ nhau.
1.3.1. Phân loại ảnh
Trên phương diện toán học, ảnh số được xem như là một ma trận
nguyên dương có hàng và cột, mỗi phần tử của ma trận đại diện cho
một điểm ảnh. Dựa theo màu sắc ta có thể chia ảnh số thành 3 dạng cơ bản
như: ảnh nhi phân, ảnh đa cấp xám và ảnh màu (true color).
- Ảnh nhị phân là ảnh chỉ có hai màu, một màu đại diện cho màu nền và
màu còn lại cho đối tượng của ảnh. Nếu hai màu là đen và trắng thì gọi là
ảnh đen trắng. Như vậy, ảnh nhị phân được xem như một ma trận nhị phân.
- Ảnh đa cấp xám là ảnh có thể nhận tối đa 256 mức sáng khác nhau
trong khoảng màu đen – màu trắng. Như vậy, ảnh đa cấp xám xem như là
ma trận không âm có giá trị tối đa 255.
- Ảnh màu hay còn gọi là ảnh true color, mỗi điểm ảnh được biểu diễn
bởi một số byte (thường 3 byte) đại diện cho 3 thành phần màu và .
Như vậy, ảnh màu có thể xem như 3 ma trận nguyên ứng với 3 thành phần
màu của các điểm ảnh.
Trong lĩnh vực giấu tin, mỗi dạng ảnh có những thuận lợi, khó khăn và
cách tiếp cận riêng. Tuy nhiên, một lược đồ giấu tin trên ảnh nhị phân ta có
20

Số hóa bởi Trung tâm Học liệu


thể dễ dàng áp dụng cho ảnh đa cấp xám, hoặc ảnh màu thông qua tính
chẵn lẻ của giá trị điểm ảnh. Nhưng từ lược đồ giấu tin trên ảnh màu hoặc
ảnh đa cấp xám khó có thể áp dụng đối với ảnh nhị phân.

1.3.2. Histogram của ảnh
Histogram là khái niệm cơ bản trong xử lý ảnh. Histogram là bảng
thống kê tần số giá trị cường độ sáng của các điểm ảnh. Đối với ảnh màu,
cường độ sáng của một điểm ảnh được xác định theo công thức:

trong đó: là giá trị các thành phần màu và là cường độ sáng của
điểm ảnh.
Ví dụ: từ ảnh màu pepper ta có thể dễ dàng xác định được biểu đồ
histogram tương ứng như hình 1.5.


(a) ảnh pepper.bmp
(b) Biểu đồ histogram
Hình 1.5. Biểu đồ histogram của ảnh màu Pepper
21

Số hóa bởi Trung tâm Học liệu


1.3.3. Chất lƣợng ảnh
Như đã đề cập ở trên, chất lượng ảnh chứa tin là một trong những yếu
tố quan trọng trong giấu tin mật, đặc biệt là thủy vân số. Chất lượng ảnh
chứa tin có thể được đánh giá bằng hệ số (Peak Signal-to-Noise
Ratio). Lược đồ có hệ số càng lớn thì chất lượng ảnh chứa tin càng
cao. Hệ số của ảnh chứa tin so với ảnh gốc kích thước
được tính theo công thức:

trong đó, là giá trị cực đại của điểm ảnh và (Mean Square
Error) được xác định theo công thức:


đối với ảnh màu, giá trị có thể chấp nhận được nếu thuộc khoảng từ
30 dB đến 50 dB.
1.4. Một số lƣợc đồ giấu tin trên ảnh nhị phân
Các lược đồ giấu tin trên ảnh nhị phân có vai trò quan trọng.Bởi, một
thuật toán sử dụng ảnh nhị phân tốt thì áp dụng trên các loại dữ liệu khác
sẽ tốt. Theo các tài liệu nghiên cứu, lược đồ giấu tin Wu-Lee là phương
pháp tiếp cận theo khối và là một trong những phương pháp đầu tiên áp
dụng trên ảnh nhị phân. Dựa trên tư tưởng Wu-Lee [5], các tác giả trong
[6] (THA) đề xuất lược đồ giấu tin có khả năng nhúng cao. Nội dung phần
này trình bày tóm tắt hai phương pháp trên.
1.4.1. Lƣợc đồ giấu tin Wu-Lee
Thuật toán này của 2 tác giả M.Y. Wu và J.H.Lee đưa ra bằng việc
đưa thêm khóa K sử dụng trong quá trình nhúng và tách thủy vân đồng
22

Số hóa bởi Trung tâm Học liệu


thời đưa thêm các điều kiện đảo bit trong mỗi khối. Với thuật toán này, có
thể nhúng một bít vào mỗi khối bằng cách hiệu chỉnh nhiều nhất 1 bít của
khối. Kỹ thuật này có khả năng làm tăng dữ liệu có thể nhúng.
Xét ảnh gốc F, khóa bí mật K và một số dữ liệu được nhúng vào F.
Khóa bí mật K là một ma trận ảnh có kích thước . Để đơn giản ta
giả sử kích thước của ảnh gốc F là bội số của . Quá trình nhúng thu
được ảnh F có một số bit đã bị hiệu chỉnh. Thuật toán thực hiện như sau:
Ký hiệu B
m*n
là ma trận nhị phân
Input
- m,n là kích thước của ma trận gồm m hàng và n cột, giá trị m,n được

giữ bí mật
- F B
m*n
và là ma trận môi trường để giấu tin
- F B
m*n
là ma trận khóa và giá trị của ma trận K phải được giữ bí mật
- b là bít nhị phân cần giấu ( b=0 hoặc b=1)
Output
Nếu thuật toán thực hiện thành công, thì kết quả thu được là ma trận G
( G B
m*n
) được biến đổi tối đa một phần tử từ ma trận F và G thỏa mãn
hai bất biến sau:
+ 0<SUM(G K) < SUM(K) (1.1)
+ SUM(G K) mod 2 = b (1.2)
Theo đầu ra của thuật toán, khi nhận được G để kiểm tra ma trận G có
giấu thông tin hay không chúng ta sẽ cần phải kiểm tra G có thỏa mãn bất
biết (1.1) hay không. Với bất biến (1.2) thì quá trình giải mã thông tin trong
ma trận G có thể dễ dàng xác định được G chứa giá trị bit đã giấu bằng 0
hay bằng 1 theo (1.3)
23

Số hóa bởi Trung tâm Học liệu


B = SUM(G K) mod 2 (1.3)
Nội dung thuật toán:

Bƣớc 1: Đặt s = SUM(F K)

Xét các trường hợp sau:
Trường hợp 1
Nếu s = 0 hoặc s =SUM(K) thì
- Đặt G = F
- Kết thúc thuật toán
Trường hợp 2
Nếu 0 < s <SUM(K) đến Bước 2
Bƣớc 2: Xét các trường hợp sau.
Trường hợp 1:
Nếu s mod 2 = b thì
- G = F
- Kết thúc thuật toán
Trường hợp 2
Nếu s mod 2 b thì đến Bước 3.
Bƣớc 3: Xét các trƣờng hợp
Trường hợp 1
Nếu s = SUM(K) -1 thì
- Chọn ngẫu nhiên phần tử (i,j) thỏa mãn =1 và
-
- G = F

24

Số hóa bởi Trung tâm Học liệu


Trường hợp 2:
Nếu s = 1 thì
- Chọn ngẫu nhiên phần tử (i,j) thỏa mãn =1 và
-

- G = F
Trường hợp 3:
Nếu và thì
- Chọn ngẫu nhiên phần tử (i,j) thỏa mãn =1
-
- G = F
Dựa vào thuật toán nhúng tin của Wu-Lee, ta dễ dàng nhận thấy, kết
thúc thuật toán nhúng tin, nếu khối ảnh G thỏa mãn điều kiện:

Thì khối ảnh G có chứa một bít tin mật. Và việc khôi phục bít tin mật
khi biết ma trận khóa bí mật K được thực biện theo công thức:

Như vậy, theo thuật toán Wu-Lee, mỗi khối gồm điểm ảnh, thuật
toán có thể nhúng 1 bít bằng cách thay đổi tối đa một phần tử của khối.
Tính bảo mật của thuật toán Wu-Lee là . Dựa trên ý tưởng này, trong
[6] trình bày lược đồ giấu tin trên ảnh nhị phân (THA) có khả năng nhúng
và tính bảo mật cao hơn so với lược đồ Wu-Lee.
Ví dụ minh hoạ:
Giả sử ta cần giấu dãy bit b
1
b
2
b
3
= 011 vào một ảnh kích thước 6x6
với ma trận khóa K có kích thước 3 như trong hình vẽ. Ta chia ảnh F
thành 4 khối ảnh nhỏ với mỗi khối kích thước là 3 ta thu được F1, F2,
F3, F4.

25


Số hóa bởi Trung tâm Học liệu




F1


F2











G1


G2

0
1
0
1

0
1
Dữ liệu cần giấu: b
1
b
2
b
3
=011
0
0
0
1
0
1

1
0
1
1
0
0












1
0
1
1
0
0

0
0
1
0
1
0











0
0
1

0
1
0

0
1
0
1
1
0



0
1
0





0
1
0
1
1
0

1
1

1
0
1
1



0
1
1





1
1
1
0
1
1

0
0
0
0
1
1




1
0
1





0
0
0
0
1
0

F3


F4



K





G3



G4

- Với F1, 0<SUM(F1 K) = 3 < SUM(K) nên thuật toán sẽ giấu b
1

(b
1
=0) vào F1 bằng cách biến đổi F1 thành G1 sao cho SUM(G1 K) mod
2 = b
1
. Trong trường hợp này, SUM(F1 K) thoả trường hợp 2 tại Bước 2
trong thuật toán, do vậy chúng ta sẽ đảo giá trị tại phần tử (i,j) của F1 ứng
với K
i,j
= 1. Giả sử ta chọn phần tử (1,2) kết quả sẽ thu được như G1.
- Vì SUM(F2 K) = 0 nên khối F2 sẽ không được dùng để giấu dữ
liệu do vậy G2 = F2.
- Với F3, do F3 thoả mãn điều kiện 0<SUM(F3 K) = 3 < SUM(K),
nên thuật toán sẽ thực hiện giấu b
2
vào F3. Trong trường hợp này, ta thấy
SUM(F3 K) mod 2 = 1 = b
2
nên không cần biến đổi F3 và G3 bằng F3.
- Với F4, 0<SUM(F4 K) = 4 <SUM(K) nên thuật toán sẽ thực hiện
giấu bit b
3
= 1 vào khối F4 bằng cách biến đổi F4 thành G4 thoả mãn tính

chất (2) và (3). Do SUM(F4 K) = SUM(K) -1 nên chúng ta chọn ngẫu
nhiên phần tử (i,j) mà F4
(i,j)
= 1 mà K
i,j
= 1 và thay đổi F4
(i,j)
= 0. Giả sử ta
chọn phần tử (3,3) kết quả sẽ thu được như G4.

×