Tải bản đầy đủ (.doc) (64 trang)

Nghiên cứu thuật toán ẩn thông tin trên ảnh số bằng kỹ thuật hoán vị hệ số và ứng dụng trong bảo mật dữ liệu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.77 MB, 64 trang )

LỜI CẢM ƠN

Em xin được bày tỏ lòng biết ơn sâu sắc đến thầy TS. Nguyễn Ngọc
Cương - Học viện An Ninh Nhân dân đã tận tình hướng dẫn, chỉ bảo và dành
rất nhiều thời gian cho em trong suốt quá trình làm luận văn.
Em xin gửi lời cảm ơn chân thành đến các thầy cô giáo Trường Đại học
Công nghệ Thông tin và Truyền Thông - Đại học Thái Nguyên, đã giảng dạy
cung cấp, trang bị cho chúng em những kiến thức, chuyên ngành, chuyên môn
chuyên sâu trong quá trình học tập tại trường cũng như quá trình làm luận văn
này.
Cuối cùng em xin gửi lời cảm ơn sâu sắc nhất gia đình, bạn bè và các
đồng nghiệp đã động viên, cổ vũ, tạo điều kiện cho em trong quá trình học tập
cũng như thời gian làm luận văn; giúp em hoàn thành khóa học, luận văn theo
qui định.


LỜI CAM ĐOAN

Tôi xin cam đoan luận văn là kết quả nghiên cứu của tôi, không sao
chép của ai. Nội dung luận văn có tham khảo và sử dụng các tài liệu liên
quan, các thông tin trong tài liệu được đăng tải trên các tạp chí và các trang
website theo danh mục tài liệu của luận văn.

Tác giả luận văn

Nguyễn Thị Thanh Xuân


DANH MỤC CÁC HÌNH VẼ
LỜI CẢM ƠN 1
LỜI CAM ĐOAN 2


DANH MỤC CÁC HÌNH VẼ 3
DANH MỤC CÁC TỪ VIẾT TẮT 4
MỤC LỤC 5
MỞ ĐẦU 1
CHƯƠNG 1 5
TỔNG QUAN VỀ GIẤU TIN TRONG ẢNH 5
CHƯƠNG 2 15
KỸ THUẬT GIẤU TIN TRONG ẢNH SỐ 15
CHƯƠNG 3 47
XÂY DỰNG CHƯƠNG TRÌNH VÀ THỬ NGHIỆM 47
TÀI LIỆU THAM KHẢO 57


DANH MỤC CÁC TỪ VIẾT TẮT

HVS

Hệ thống thị giác của con người

HAS

Hệ thống thính giác của con người

LSB

Kỹ thuật gài vào các bit có trọng số thấp

DCT

Biến đổi cosine rời rạc


DFT

Biến đổi Fourier rời rạc

DWT

Biến đổi wavelet

AES

Tiêu chuẩn mã hóa tiên tiến

DES

Tiêu chuẩn mã hóa dữ liệu


MỤC LỤC
LỜI CẢM ƠN 1
LỜI CAM ĐOAN 2
DANH MỤC CÁC HÌNH VẼ 3
DANH MỤC CÁC TỪ VIẾT TẮT 4
MỤC LỤC 5
MỞ ĐẦU 1
CHƯƠNG 1 5
TỔNG QUAN VỀ GIẤU TIN TRONG ẢNH 5
CHƯƠNG 2 15
KỸ THUẬT GIẤU TIN TRONG ẢNH SỐ 15
CHƯƠNG 3 47

XÂY DỰNG CHƯƠNG TRÌNH VÀ THỬ NGHIỆM 47
TÀI LIỆU THAM KHẢO 57


1

MỞ ĐẦU
1. Đặt vấn đề
Cùng với sự bùng nổ của Internet và các phương tiện multimedia, những
vấn nạn như ăn cắp bản quyền, xuyên tạc thông tin, truy nhập thông tin trái
phép... cũng gia tăng, đòi hỏi phải không ngừng tìm các giải pháp mới, hữu
hiệu cho an toàn và bảo mật thông tin. Một trong các giải pháp nhiều triển
vọng là giấu tin (DataHiding), được nghiên cứu phát triển trong khoảng 10
năm gần đây.
Hiện nay nhiều ngành, nhiều đơn vị trên toàn quốc đã có hệ thống
mạng nội bộ thông suốt các tỉnh thành trong cả nước. Hệ thống đảm bảo được
các thông tin truyền đi trong mạng không bị lọt ra ngoài nhưng điểm yếu của
hệ thống hiện tại chưa đạt được đó là tính cơ động. Việc sử dụng mạng
internet dễ dàng hơn nhiều so với mạng nội bộ để truyền tin. Tuy nhiên
internet có thể phát tán thông tin đi bất kỳ đâu trên thế giới. Đi kèm với việc
truyền tin qua internet là những rủi ro về mất mát và sai lệch thông tin. Do đó
bảo mật thông tin khi truyền trên internet là một vấn đề cấp thiết trong thực
tế.
Bản chất của bảo mật thông tin là tìm cách để che giấu thông tin, có
thể là mã hóa thông tin hoặc giấu thông tin trong các dữ liệu số khác. Mục
đích đặt ra là thông tin được bảo mật chỉ có thể đọc được bởi đối tượng có
quyền đọc thông tin đó. Một trong cách tiếp cận trong bảo mật thông tin đó là
giấu tin có nghĩa là những thông tin số cần được bảo mật sẽ được người dùng
giấu vào trong một đối tượng dữ liệu số khác (môi trường giấu tin) sao cho sự
biến đổi của môi trường sau khi giấu tin là khó nhận biết, đồng thời người

dùng có thể lấy lại được các thông tin đã giấu khi cần.


2

2. Lý do chọn đề tài
Giấu thông tin trong ảnh hiện nay chiếm tỉ lệ lớn nhất trong các chương
trình ứng dụng, các phần mềm, hệ thống giấu tin trong đa phương tiện bởi
lượng thông tin được trao đổi bằng ảnh là rất lớn, hơn nữa giấu thông tin
trong ảnh cũng đóng vai trò hết sức quan trọng đối với hầu hết các ứng dụng
bảo vệ an toàn thông tin như: nhận thực thông tin, xác định xuyên tạc thông
tin, bảo vệ bản quyền tác giả, điều khiển truy cập, giấu thông tin mật...
Thông tin sẽ được giấu cùng với dữ liệu ảnh nhưng chất lượng ảnh ít
thay đổi và chẳng ai biết được đằng sau ảnh đó mang những thông tin có ý
nghĩa. Ngày nay, khi ảnh số đã được sử dụng rất phổ biến thì giấu thông tin
trong ảnh đem lại rất nhiều ứng dụng quan trọng trên nhiều lĩnh vực đời sống
xã hội. Ví dụ, trong các dịch vụ ngân hàng và tài chính ở một số nước phát
triển, thuỷ vân số được sử dụng để nhận diện khách hàng trong các thẻ tín
dụng. Mỗi khách hàng có một chữ kí viết tay, sau đó chữ kí này được số hoá
và lưu trữ trong hồ sơ của khách hàng. Chữ kí này sẽ được sử dụng như là
thuỷ vân để nhận thực thông tin khách hàng. Trong các thẻ tín dụng, chữ kí
tay được giấu trong ảnh của khách hàng trên thẻ. Khi sử dụng thẻ, người dùng
đưa thẻ vào một hệ thống, hệ thống có gắn thiết bị đọc thuỷ vân trên ảnh và
lấy được chữ kí số đã nhúng trong ảnh. Thuỷ vân được lấy ra sẽ so sánh với
chữ kí số đã lưu trữ xem có trùng hợp không, từ đó xác định nhận thực khách
hàng.
Kỹ thuật ẩn thông tin được đề cập đến như một giải pháp nhằm giải
quyết bài toán truyền nhận thông điệp mật, tăng cường tính bảo mật và an
toàn trong các giao dịch thương mại điện tử trên mạng Internet cũng như bảo
vệ quyền sở hữu trí tuệ đối với các thông tin số có giá trị như phim, ảnh, âm

thanh… Kỹ thuật ẩn thông tin kết hợp mã hóa được đánh giá như là giải pháp


3

hữu hiệu và thích hợp nhất cho vấn đề bảo vệ bản quyền trên Internet cũng
như các dịch vụ truyền thông đa phương tiện.
Hiện nay, đã có nhiều công trình nghiên cứu trong nước và trên thế
giới để giấu tin vào ảnh gốc. Các kỹ thuật và chương trình này đều có những
đặc điểm nhất định dựa trên phương pháp biến đổi hình học (như phép quay,
dịch chuyển cắt xén… ), điều này có thể dẫn đến quá trình kiểm tra xác định
sự tồn tại của thông điệp nhúng trong ảnh không chính xác.
Người ta đã đưa ra kỹ thuật ẩn thông tin kết hợp với các kỹ thuật mã
hóa và nén dữ liệu sẽ giúp cho quá trình ẩn thông tin được an toàn hơn, tăng
cường độ bảo mật và dung lượng của thông tin ẩn. Kỹ thuật này cho phép
chống lại các tấn công bằng các phép biến đổi hình học.
Để ứng dụng trên thực tế kỹ thuật này cần phải xây dựng chương trình
trên cơ sở lý thuyết nêu trên và thử nghiệm trên thực tế nhằm đánh giá hiệu
quả của kỹ thuật, chính vì thế chúng tôi lựa chọn đề tài có tên: "Nghiên cứu
thuật toán ẩn thông tin trên ảnh số bằng kỹ thuật hoán vị hệ số và ứng
dụng trong bảo mật dữ liệu"
3. Đối tượng và phạm vi nghiên cứu
Giấu tin trong ảnh là một chủ đề khá mới mẻ được quan tâm nhiều
hiện nay, đặc biệt trong các ứng dụng trên mạng internet. Đây là một lĩnh vực
nghiên cứu có liên quan đến nhiều lĩnh vực bảo mật, an toàn dữ liệu và xử lý
ảnh. Đã có nhiều công trình nghiên cứu về lĩnh vực này và đến nay cũng đã
có khá nhiều phương pháp, kỹ thuật được đề xuất. Tuy nhiên trong khuôn khổ
của luận văn, tác giả chỉ tập trung tìm hiểu và nghiên cứu:
- Các kiểu dữ liệu: ảnh, file audio, video, text;
- Kỹ thuật ẩn thông tin kết hợp với các kỹ thuật mã hóa và nén dữ liệu;

- Xây dựng thuật toán hoán vị hệ số và giải pháp nâng cao hiệu quả ẩn
thông tin trong ảnh số;


4

- Phương pháp chữ ký số, xác thực thông tin;
- Các phương pháp, kỹ thuật giấu tin trong ảnh số;
- Thiết lập mô hình và thử nghiệm chương trình.
4. Ý nghĩa khoa học và thực tiễn của đề tài
Data Hiding là phương pháp đã và đang được nghiên cứu và ứng dụng
rất mạnh mẽ ở nhiều nước trên thế giới đó là phương pháp nhúng tin trong các
phương tiện khác. Đây là phương pháp mới và phức tạp nó đang được xem
như một công nghệ chìa khoá cho vấn đề bảo vệ bản quyền, nhận thức thông
tin và điều khiển truy cập ứng dụng trong an toàn và bảo mật thông tin.
Trong hình ảnh viễn thám và quân sự thì độ chính xác cao là cần thiết,
trong một số nghiên cứu khoa học dữ liệu thử nghiệm rất đắt phải đảm bảo
được, còn trong ứng dụng như thực thi pháp luật, hệ thống hình ảnh y tế …
mong muốn phải đúng với dữ liệu gốc để xem xét về mặt pháp lý tránh những
lệch lạc thông tin. Do vậy mà việc phục hồi dữ liệu sau khi giấu tin để đảm
bảo tính chính xác là rất có ý nghĩa khoa học và thực tiễn.
Việc kết hợp giữa giấu tin và chứng thực cho phép bảo vệ nhãn
thương hiệu chứng minh sự hợp pháp của sản phẩm bảo vệ bản quyền nhất là
trong thương mại điện tử. Đây là ý nghĩa thực tiễn của đề tài.
5. Phương pháp nghiên cứu
Trong luận văn sử dụng phương pháp nghiên cứu lý thuyết, các phương
pháp chứng thực, các kỹ thuật giấu tin, phương pháp mô hình hóa và thử
nghiệm thực tế.



5

CHƯƠNG 1
TỔNG QUAN VỀ GIẤU TIN TRONG ẢNH
1.1 Một số khái niệm cơ bản về giấu tin
1.1.1 Lịch sử kỹ thuật giấu tin
Từ Stenography bắt nguồn từ Hi Lạp và được sử dụng cho tới ngày
nay, nó có nghĩa là tài liệu được phủ (covered writing). Mục đích cơ bản của
giấu tin là nhúng mẩu tin mật vào một môi trường truyền tin bình thường sao
cho người khác không thể phát hiện ra mẩu tin mật đó. Trong lịch sử, những
câu chuyện về giấu tin được lan truyền từ đời qua đời khác. Ví dụ, vào thế kỷ
thứ 5 trước Công Nguyên, Histaiacus đã cạo trọc đầu một nô lệ, xăm lên đó
một thông điệp sau đó khi đầu nô lệ này mọc tóc trở lại, ông ta phái nô lệ đó
mang thông điệp đã được giấu trên đầu đi. Ở các tiểu vương quốc Ả Rập tại
thành phố về khoa học và công nghệ của vua Abdulaziz, một dự án đã được
khởi xướng để dịch thành tiếng anh các văn bản tiếng Ả Rập cổ về các dòng
chữ bí mật được cho là đã viết cách đây 1200 năm. Một vài văn bản này được
tìm thấy ở Thổ Nhĩ Kỳ và Đức. Khoảng 500 năm trước, một nhà toán học
người Ý tên là Jerome Cardan đã sáng tạo lại một phương thức văn bản bí mật
cổ xưa của người Trung Quốc. Văn bản được làm như sau: một tờ giấy làm
mặt nạ có nhiều lỗ thủng mà người gửi và người nhận đều biết, mặt nạ này sẽ
được đặt trên một tờ giấy trắng và người gửi sẽ viết thông điệp bí mật qua các
lỗ thủng trên mặt nạ sau đó vứt mặt nạ đó đi và điền phần còn lại vào tờ giấy
trắng như thể tờ giấy này toàn các thông tin vô thưởng vô phạt.
Ý tưởng về che giấu thông tin đã có từ hàng nghìn năm về trước nhưng
kỹ thuật này được dùng chủ yếu trong quân đội và trong các cơ quan tình báo.
Mãi cho tới vài thập niên gần đây, giấu thông tin mới nhận được sự quan tâm
của các nhà nghiên cứu và các viện công nghệ thông tin với hàng loạt công



6

trình nghiên cứu giá trị. Cuộc cách mạng số hóa thông tin và sự phát triển
nhanh chóng của mạng truyền thông là nguyên nhân dẫn đến sự thay đổi này.
Ngày nay nghệ thuật giấu tin được nghiên cứu để phục vụ các mục đích
tích cực như bảo vệ bản quyền, thủy vân số, hay phục vụ giấu các thông tin bí
mật về quân sự và kinh tế. Sự phát triển của công nghệ thông tin đã tạo ra
những môi trường giấu tin mới vô cùng tiện lợi và phong phú. Người ta có thể
giấu tin trong các tệp ảnh, trong các tệp âm thanh, tệp văn bản. Cũng có thể
giấu tin ngay trong các khoảng trống hay các phân vùng ẩn của môi trường
lưu trữ như đĩa cứng, đĩa mềm. Các gói tin truyền đi trên mạng cũng là môi
trường giấu tin quan trọng và ngay cả các tiện ích phần mềm cũng là môi
trường lý tưởng để gài các thông tin quan trọng để xác nhận bản quyền.
1.1.2 Khái niệm giấu tin
“ Giấu tin” là một kỹ thuật nhúng (giấu) một lượng thông tin số nào đó
vào trong một đối tượng dữ liệu số khác. Giấu tin trong ảnh số là giấu các
mẩu tin cũng là dạng số trong máy tính vào các tệp ảnh nhị phân sao cho
không bị người ngoài phát hiện.
Kỹ thuật giấu thông tin nhằm mục đích đảm bảo an toàn và bảo mật
thông tin rõ ràng ở hai khía cạnh. Một là bảo mật cho dữ liệu được đem giấu,
hai là bảo mật cho chính đối tượng được dùng để giấu tin. Hai mục đích khác
nhau này dẫn đến hai khuynh hướng kỹ thuật chủ yếu của giấu tin. Khuynh
hướng thứ nhất là giấu tin mật (steganography). Khuynh hướng này tập trung
vào các kỹ thuật giấu tin sao cho thông tin giấu được nhiều và quan trọng là
người khác khó phát hiện được một đối tượng có bị giấu tin bên trong hay
không. Khuynh hướng thứ hai là thủy vân số (watermarking). Khuynh hướng
thủy vân số đánh giấu vào đối tượng nhằm khẳng định bản quyền sở hữu hay
phát hiện xuyên tạc thông tin. Thủy vân số có miền ứng dụng lớn hơn nên



7

được quan tâm nghiên cứu nhiều hơn và thực tế đã có nhiều những kỹ thuật
dành cho khuynh hướng này. Nói chung giấu tin trong đa phương tiện là tận
dụng “độ dư thừa” của phương tiện giấu để thực hiện việc giấu tin mà người
ngoài cuộc “khó” cảm nhận được có thông tin giấu trong đó.
1.1.3 Môi trường giấu tin
1.1.3.1 Giấu tin trong ảnh
Hiện nay, giấu tin trong ảnh chiếm tỷ lệ lớn nhất hệ thống giấu tin trong
các chương trình ứng dụng, các phần mềm, hệ thống giấu tin trong đa phương
tiện. Bởi lẽ lượng thông tin được trao đổi bằng hình ảnh là rất lớn, hơn nữa
chúng còn đóng vai trò quan trọng trong các ứng dụng an toàn thông tin như:
xác thực thông tin, bảo vệ quyền tác giả, điều khiển truy cập, phát hiện xuyên
tạc thông tin. Từ việc nghiên cứu kỹ thuật giấu tin trong ảnh số chuyển sang
kỹ thuật giấu tin trong các phương tiện khác như audio, video, trong văn bản,
… không có gì khó khăn về nguyên tắc. Chính vì lẽ đó, giấu tin trong ảnh đã
và đang được nhiều tổ chức, các trường đại học, các viện nghiên cứu, các cá
nhân quan tâm và đầu tư nghiên cứu.
Thông tin được giấu cùng với dữ liệu ảnh nhưng chất lượng ảnh rất ít
thay đổi mà người ta khó có thể nhận thấy sự thay đổi đó bằng mắt thường.
Sau vụ khủng bố ngày 11 tháng 9 năm 2001 gây chấn động không chỉ nước
Mĩ mà cả thế giới, Hãng AFP (2004) có đưa tin: chính trùm khủng bố quốc tế
Osama Binladen đã dùng cách thức giấu thông tin trong ảnh để liên lạc với
đồng bọn và chúng đã qua mặt được Cục tình báo Trung ương Mĩ và các cơ
quan an ninh quốc tế. Sự việc này càng cho thấy việc nghiên cứu các vấn đề
liên quan đến giấu tin trong ảnh càng trở nên quan trọng.
Ngày nay, khi ảnh số đã được sử dụng rất phổ biến thì giấu thông tin
trong ảnh đã đem lại nhiều những ứng dụng quan trọng trên các lĩnh vực trong



8

đời sống xã hội. Ví dụ như đối với các nước phát triển, chữ ký tay đã được số
hóa và lưu trữ sử dụng như là hồ sơ cá nhân của các dịch vụ ngân hàng và tài
chính. Nó được dùng để nhận thực trong các thẻ tín dụng của người tiêu dùng.
Hay trong một số những ứng dụng về nhận diện như thẻ chứng minh, thẻ căn
cước, hộ chiếu… người ta có thể giấu thông tin trên các ảnh thẻ để xác định
thông tin thực.
1.1.3.2 Giấu tin trong audio
Giấu tin trong audio mang những đặc điểm riêng khác với giấu tin
trong các đối tượng đa phương tiện khác. Một trong những yêu cầu cơ bản
của giấu tin là đảm bảo tính chất ẩn của thông tin được giấu đồng thời không
làm ảnh hưởng đến chất lượng của dữ liệu. Kỹ thuật giấu tin trong ảnh phụ
thuộc vào hệ thống thị giác của con người (HVS - Human Vision System) còn
kỹ thuật giấu tin trong audio phụ thuộc vào hệ thống thính giác của con người
(HAS - Human Auditory System). Vấn đề khó khăn ở đây là hệ thống tính
giác của con người nghe được các tín hiệu ở các giải tần rộng và công suất
lớn nên đã gây khó dễ đối với các phương pháp giấu tin trong audio. HAS
cảm nhận được các tín hiệu ở dài tần rộng và công suất. Điều này có nghĩa là
các âm thanh to, cao tần có thể che giấu được các âm thanh nhỏ, thấp tần một
cách dễ dàng. Kênh truyền tin cũng là một vấn đề khó khăn với giấu tin trong
audio. Kênh truyền hay băng thông chậm sẽ ảnh hưởng đến chất lượng thông
tin sau khi giấu. Giấu thông tin trong audio yêu cầu rất cao về tính đồng bộ và
tính an toàn của thông tin.
1.1.3.3 Giấu tin trong video
Cũng giống như giấu thông tin trong ảnh hay trong audio, giấu tin
trong video cũng được quan tâm và được phát triển mạnh mẽ cho nhiều ứng
dụng như điều khiển truy cập thông tin, nhận thức thông tin, bản quyền tác
giả…Ta có thể lấy một ví dụ là các hệ thống chương trình trả tiền xem theo



9

video clip (pay per view application). Các kỹ thuật giấu tin trong video cũng
được phát triển mạnh mẽ và cũng theo hai khuynh hướng là thủy vân số và
data hiding. Một phương pháp giấu tin trong video được đưa ra bởi Cox là
phương pháp phân bố đều. Ý tưởng cơ bản của phương pháp là phân phối
thông tin giấu dàn trải theo tần số của dữ liệu chứa gốc. Nhiều nhà nghiên cứu
đã dùng những hàm cosin riêng và các hệ số truyền sóng riêng để giấu tin.
Trong các thuật toán khởi nguồn thì thường các kỹ thuật cho phép giấu các
ảnh vào trong video nhưng thời gian gần đây các kỹ thuật cho phép giấu cả
âm thanh và hình ảnh vào video. Như phương pháp của Swanson đã sử dụng
để giấu theo khối, phương pháp này đã giấu được hai bít vào khối 8*8, hay
gần đây nhất là phương pháp của Mukherjee là kỹ thuật giấu audio vào video
sử dụng cấu trúc lưới đa chiều… Kỹ thuật giấu thông tin áp dụng cả đặc điểm
thị giác và thính giác của con người. Kỹ thuật giấu tin đang được áp dụng cho
nhiều loại đối tượng chứ không riêng gì dữ liệu đa phương tiện như hình ảnh,
audio hay video. Gần đây đã có một số nghiên cứu giấu tin trong cơ sở dữ liệu
quan hệ. Chính vì thế sau này chắc chắn kỹ thuật giấu tin còn phát triển tiếp.
1.1.3.4. Giấu tin trong văn bản
Trong trao đổi thông tin qua hệ thống máy tính, văn bản chiếm một tỷ
lệ rất lớn so với các loại phương tiện chứa khác. Tuy vậy, giấu tin trong văn
bản lại chưa được quan tâm nghiên cứu nhiều. Các nghiên cứu về giấu tin
trong văn bản được chia theo hai hướng, thứ nhất văn bản được sử dụng để
giấu tin là những văn bản được chụp lại và lưu trên máy như một bức ảnh nhị
phân. Theo hướng này, các kỹ thuật giấu tin được thực hiện như kỹ thuật giấu
tin trong ảnh. Hướng thứ hai, phương tiện chứa sử dụng cho quá trình giấu tin
được lưu dưới dạng văn bản. Theo hướng này, các kỹ thuật giấu tin cũng tiến
hành như giấu tin trong ảnh bằng cách thay đổi một số ký tự tại một số vị trí
trên văn bản mà không làm ảnh hưởng nhiều đến nội dung văn bản gốc.



10

1.2 Phân loại các kỹ thuật giấu tin
Khái niệm "Cái bạn nhìn thấy là cái bạn có được" ngày nay không còn
chính xác nữa. Ảnh có thể làm được nhiều thứ hơn là cái mà con người nhìn
thấy bằng mắt thường, chúng có thể chứa đựng tới hơn 1000 từ ẩn giấu bên
trong. Hàng thập kỷ qua, con người đã phát triển đáng kể các phương pháp
sáng tạo trong giao tiếp bí mật. Trong đó có 3 kỹ thuật có mối tương quan với
nhau là giấu tin, thủy vân số và mật mã.
Có nhiều cách phân loại giấu tin khác nhau dựa trên những tiêu chí khác
nhau. Theo Fabien A.P. Petitcolas đề xuất năm 1999, có thể chia lĩnh vực giấu
tin thành hai hướng lớn, đó là giấu tin mật và thủy vân số [5].
Giấu tin mật với mục đích đảm bảo an toàn và bảo mật thông tin tập
trung vào các kỹ thuật giấu thông tin sao cho người khác khó phát hiện nhất
việc có tin được giấu, hơn nữa nếu phát hiện có tin giấu thì giải tin cũng khó
thực hiện. Bên cạnh đó cũng đặt ra vấn đề về lượng tin được giấu càng nhiều
càng tốt, ngoài ra tốc độ giấu cũng được yêu cầu mặc dù đây là vấn đề thứ
yếu [4].
Thủy vân số là lĩnh vực nghiên cứu việc nhúng các thông tin phục vụ
xác thực, ví dụ như xác nhận bản quyền. Nếu thông tin giấu là một định danh
duy nhất, ví dụ định danh người dùng thì khi đó người ta gọi là Fingerprinting
(nhận dạng vân tay, điểm chỉ). Thủy vân số lại được chia thành hai hướng nhỏ
là thủy vân dễ vỡ và thủy vân bền vững. Trong đó thủy vân dễ vỡ yêu cầu
thông tin giấu sẽ bị sai lệch nếu có bất kỳ sự thay đổi nào trên dữ liệu chứa
tin. Thủy vân bền vững quan tâm nhiều đến việc nhúng các mẩu tin đòi hỏi độ
bền cao của thông tin được giấu trước các biến đổi thông thường trên dữ liệu
chứa tin [5].



11

Xét về tính chất thuỷ vân số giống giấu tin ở chỗ tìm cách nhúng thông
tin mật vào một môi trường. Tuy nhiên, xét về bản chất thì thuỷ vân số có
khác ở một số điểm:
- Giấu tin sau đó cần tách lại tin còn thuỷ vân số tìm cách biến tin giấu
thành một thuộc tính của vật mang.
- Mục tiêu của thuỷ vân số là nhúng thông tin không lớn thường là biểu
tượng, chữ ký hay các đánh dấu khác vào môi trường phủ nhằm phục vụ
việc xác nhận bản quyền.
Chỉ tiêu quan trọng nhất của giấu tin là dung lượng còn của thuỷ vân số
là tính bền vững.
Thuỷ vân số có thể vô hình hoặc hữu hình trên ảnh mang.

Hình 1.1: Phân loại các kỹ thuật giấu tin


12

1.3 Nhu cầu, ứng dụng của giấu tin trong ảnh số
1.3.1 Nhu cầu của giấu tin trong ảnh số
Ngày nay, kỹ thuật giấu tin được triển khai trong nhiều ứng dụng khác
nhau nhằm bảo vệ tính bí mật của thông tin, phục vụ các mục đích tích cực
như bảo vệ bản quyền, thủy vân số, hay phục vụ giấu các thông tin bí mật về
quân sự và kinh tế. Trong đó giấu tin trong ảnh chiếm tỉ lệ lớn nhất ở hệ thống
giấu tin trong đa phương tiện. Bởi lẽ lượng thông tin được trao đổi bằng hình
ảnh là rất lớn qua đó các thông tin cá nhân có thể được nhúng vào trong thẻ
chứng minh với những thông tin mang tính duy nhất của một người,… Giấu
tin có thể được sử dụng như một phần của quá trình in ấn bình thường.

1.3.2 Ứng dụng của giấu tin trong ảnh số
- Bảo vệ quyền tác giả(copyright protection): Đây là ứng dụng cơ bản
nhất của kỹ thuật thủy vân số (digital watermarking) - một dạng của phương
pháp giấu tin. Một thông tin nào đó mang ý nghĩa quyền sở hữu tác giả gọi là
thủy vân sẽ được nhúng vào trong các sản phẩm, thủy vân đó chỉ một mình
người chủ sở hữu hợp pháp các sản phẩm đó có và được dùng làm minh
chứng cho bản quyền sản phẩm. Giả sử có một thành phẩm dữ liệu đa phương
tiện như ảnh, âm thanh, video cần được lưu thông trên mạng. Để bảo vệ các
sản phẩm chống lại các hành vi lấy cắp hoặc làm nhái cần phải có một kỹ
thuật để “dán tem bản quyền” vào sản phẩm này. Việc dán tem này chính là
việc nhúng thủy vân cần phải đảm bảo không để lại một ảnh hưởng lớn nào
đến việc cảm nhận sản phẩm. Yêu cầu kỹ thuật đối với ứng dụng này là thủy
vân phải tồn tại bền vững cùng với sản phẩm, muốn bỏ thủy vân này mà
không được phép của người chủ sở hữu thì chỉ có cách là phá hủy sản phẩm.
- Xác thực thông tin hay phát hiện xuyên tạc thông tin (authentication
and tamper detection): Một tập các thông tin sẽ được giấu trong các phương


13

tiện chứa sau đó sử dụng để nhận biết xem trên các phương tiện gốc đó có bị
thay đổi hay không. Các thủy vân nên được ẩn để tránh sự tò mò của kẻ thù
hơn nữa việc làm giả các thủy vân hợp lệ hay xuyên tạc thông tin nguồn cũng
cần được xem xét. Trong các ứng dụng thực tế người ta mong muốn tìm được
vị trí bị xuyên tạc cũng như phân biệt được các thay đổi (ví dụ như phân biệt
xem một đối tượng đa phương tiện chứa thông tin giấu đã bị thay đổi, xuyên
tạc nội dung hay là chỉ bị nén mất dữ liệu). Yêu cầu chung đối với ứng dụng
này là khả năng giấu thông tin nhiều và thủy vân không cần bền vững trước
các phép xử lý trên đối tượng đã được giấu tin.
- Giấu vân tay hay dán nhãn (fingerprinting and labeling): Thủy vân

trong các ứng dụng này được sử dụng để nhận diện người gửi hay người nhận
của một thông tin nào đó trong ứng dụng phân phối sản phẩm. Thủy vân
trong trường hợp này cũng tương tự như số serial của sản phẩm phần mềm.
Mỗi một sản phẩm sẽ mang một thủy vân riêng. Ví dụ các vân khác nhau sẽ
được nhúng vào các bản copy khác nhau của thông tin gốc trước khi chuyển
cho nhiều người. Với những ứng dụng này thì yêu cầu là đảm bảo độ an toàn
cao cho các thủy vân, tránh sự xóa dấu vết trong khi phân phối.
- Điều khiển sao chép (copy control): Điều mong muốn đối với các hệ
thống phân phối dữ liệu đa phương tiện là tồn tại một kỹ thuật chống sao chép
trái phép dữ liệu. Có thể sử dụng thủy vân để chỉ trạng thái sao chép của dữ
liệu. Các thủy vân trong những trường hợp này được sử dụng để điều khiển,
sao chép đối với các thông tin. Các thiết bị phát hiện ra thủy vân thường được
gắn sẵn vào trong các hệ thống đọc ghi. Ví dụ như hệ thống quản lý sao chép
DVD đã được ứng dụng ở Nhật. Thủy vân mang các giá trị chỉ trạng thái cho
phép sao chép dữ liệu như “copy never” - không được sao chép hay “copy
once” - chỉ được copy một lần, sau khi copy xong bộ đọc ghi thủy vân sẽ ghi
thủy vân mới chỉ trạng thái mới lên DVD. Các ứng dụng loại này cũng yêu


14

cầu thủy vân phải được đẩm bảo an toàn và cũng sử dụng phương pháp phát
hiện thủy vân đã giấu mà không cần thông tin gốc.
- Giấu tin mật(steganography): Các thông tin giấu được trong những
trường hợp này càng nhiều càng tốt, việc giải mã để nhận được thông tin cũng
không cần phương tiện chứa gốc ban đầu. Các yêu cầu mạnh về chống tấn
công của kẻ thù không cần thiết lắm thay vào đó là thông tin giấu phải được
bảo mật.
Tổng kết chương 1
Trong chương này đã trình bày khái quát về lĩnh vực giấu tin, giới thiệu

một số khái niệm cơ bản trong lĩnh vực giấu tin. Chương đã tóm tắt một số kỹ
thuật giấu tin cơ bản nhất và trình bày về nhu cầu và các ứng dụng giấu tin
trong ảnh số. Trong các kỹ thuật giấu tin, giấu tin trong ảnh số chiếm tỷ lệ lớn
nhất do khả năng giấu thông tin trong lượng thông tin của hình ảnh khá lớn và
khả năng ứng dụng rất cao. Các kỹ thuật giấu tin được triển khai trong nhiều
ứng dụng khác nhau nhằm bảo vệ tính bí mật của thông tin, có thể phục vụ
cho nhiều ứng dụng trong đời sống ví dụ như bảo vệ bản quyền số.


15

CHƯƠNG 2
KỸ THUẬT GIẤU TIN TRONG ẢNH SỐ
2.1 Mô hình và các phương pháp giấu tin cơ bản
2.1.1 Mô hình giấu tin cơ bản
Với sự phát triển không ngừng của công nghệ thông tin, cùng với sự
quan tâm rất lớn của các nhà khoa học, các tổ chức, các quốc gia về lĩnh vực
an toàn và bảo vệ thông tin, hiện nay đã có rất nhiều các kỹ thuật giấu tin
được nghiên cứu và phát triển. Tuy nhiên có thể thấy, tất cả đều xuất phát từ
mô hình giấu tin cơ bản cũng như từ những kỹ thuật giấu tin cơ bản nhất.

Thông tin cần giấu

Phương
tiện chứa
tin (audio,
ảnh,
video...)

Bộ nhúng

thông tin

Phương
tiện chứa
đã được
giấu tin

Phân
phối

Khóa

Hình 2.1: Mô hình quá trình giấu tin

Trong mô hình này, phương tiện chứa tin bao gồm các đối tượng được
dùng làm môi trường để giấu tin như văn bản, ảnh, audio, video… thông tin


16

cần giấu tùy theo mục đích của người sử dụng, nó có thể là các thông điệp,
các logo, hình ảnh bản quyền… Thông tin được giấu vào trong phương tiện
chứa tin nhờ bộ nhúng. Bộ nhúng là những chương trình thực hiện theo những
thuật toán để giấu tin và được thực hiện với một khóa bí mật giống như trong
một số hệ mật mã. Đầu ra của quá trình giấu tin là phương tiện chứa đã được
giấu. Các phương tiện này có thể được phân phối trên mạng.
Hình 2.2 mô tả quá trình giải mã thông tin đã giấu. Với đầu vào là
phương tiện đã chứa tin giấu, một bộ phận giải mã tin ( tương ứng với bộ
nhúng) cùng với khóa sẽ thực hiện việc giải mã thông tin. Đầu ra của quá
trình là phương tiện chứa tin và các thông tin đã giấu. Trong trường hợp cần

thiết, thông tin giấu lấy ra có thể được xử lý, kiểm định và so sánh với thông
tin đã giấu ban đầu.
Khóa

Phân
phối

Phương
tiện chứa
đã được
giấu tin

Bộ giải
mã tin

Thông tin cần giấu

Hình 2.2: Mô hình quá trình giải tin

Phương
tiện chứa
tin (audio,
ảnh,
video...)

Kiểm
định


17


2.1.2 Các phương pháp giấu tin cơ bản
2.1.2.1 Giấu tin trong khuôn dạng ảnh
Các khuôn dạng ảnh phổ biến nhất hiện nay là graphics interchange
format (GIF), Joint Photographic Experts Group (JPEG), đến portable
network graphics (PNG) [5].
Giấu tin có thể được thực hiện bằng cách nhồi vào một cửa sổ lệnh của
hệ điều hành Windows (như Windows XP) các mã sau đây: C:>Copy
Cover.jpg /b + Message.txt /b Stego.jpg. Ý tưởng chính là lợi dụng việc nhận
biết EOF (End of file). Nói cách khác, tin nhắn được đóng gói và chèn vào
sau thẻ EOF của tệp ảnh.
Khi đó Stego.jpg được xem bằng cách sử dụng bất kỳ ứng dụng chỉnh
sửa ảnh nào cũng sẽ chỉ hiển thị hình ảnh và bỏ qua bất cứ điều gì tới sau thẻ
EOF. Tuy nhiên, giả sử khi mở trong Notepad thông điệp của chúng ta cài vào
sẽ cho thấy chính nó sau khi hiển thị một số dữ liệu như trong hình 2.3.

Hình 2.3: Thông điệp được hiển thị khi bức ảnh giấu tin mở bằng Notepad

Thông điệp khi được nhúng không làm giảm chất lượng hình ảnh gốc.
Cả biểu đồ hình ảnh (histogram) cũng như nhận thức thị giác đều không thể
phát hiện bất kỳ sự khác biệt giữa hai hình ảnh gốc và hình ảnh có các tin
nhắn bí mật được ẩn sau thẻ EOF.
Cài đặt giấu tin trong ảnh theo phương pháp Naive là thêm dữ liệu ẩn
vào thông tin file mở rộng của hình ảnh (EXIF) [87]. Đó là một chuẩn được
các nhà sản xuất máy ảnh kỹ thuật số sử dụng để lưu trữ thông tin trong tập
tin ảnh, như tạo dựng mô hình của một máy ảnh, thời gian hình ảnh được


18


chụp và số hóa, độ phân giải của hình ảnh, thời gian phơi sáng, và độ dài tiêu
cự. Đây là thông tin dữ liệu về hình ảnh và nguồn của nó nằm ở phần đầu
header của tập tin. Hình 2.4 mô tả một số văn bản chèn vào các phần chú
thích của một header ảnh GIF. Phương pháp này không đáng tin cậy lắm vì nó
bị hạn chế giống như của phương pháp EOF. Không phải lúc nào cũng nên
giấu dữ liệu một cách trực tiếp mà không mã hóa nó như ở ví dụ này.

Hình 2.4: Chuỗi văn bản được chèn vào tiêu đề EXIF được đánh dấu

2.1.2.2 Giấu tin trong miền không gian của ảnh
Trong các phương pháp miền không gian, một người giấu tin sẽ biên
tập dữ liệu bí mật che phủ trong miền không gian, trong đó bao gồm mã hóa ở
cấp độ của LSBs [4]. Phương pháp này mặc dù đơn giản, nhưng nó lại có tác
động rộng lớn. Một framework thông thường chỉ ra khái niệm nằm bên trong
được đánh dấu trong hình 2.5, hình 2.6 minh họa một ví dụ thực hiện nhúng
vào trong LSB đầu tiên tới LSB thứ 4. Có thể thấy là nhúng trong LSB thứ 4
sinh ra nhiều méo mó hình ảnh của ảnh che phủ (cover image) khi thông tin
ẩn được cho là "không tự nhiên".


19

Hình 2.5: Giấu tin trong miền không gian

Sẽ thấy rõ ràng hơn khi hình 2.6 kết luận một điều là phải có một sự
cân bằng giữa tải và độ méo ảnh che phủ, tuy nhiên tải (nhúng có thể lên tới
LSB thứ 1, thứ 2, thứ 3 hoặc thứ 4), tương tự với ảnh nhúng được lấy lại. Ví
dụ, Hình. 2.6(k) (được lấy lại từ việc nhúng vào LSB thứ 4) thì ảnh được giấu
có ước lượng tốt (Hình 2.6c) nhưng dễ nhận thấy là có sự can thiệp của con
người (Hình 2.6f). Mặt khác Hình 2.6j (được lấy lại từ việc nhúng vào LSB

đầu tiên) chất lượng cân bằng kém với hầu hết vật mang đồng nhất với ảnh
gốc ( So sánh hình 2.6d với 2.6a).
Potdar và các cộng sự đã sử dụng kỹ thuật miền không gian khi tạo ra
một kỹ thuật giấu tin chia sẻ bí mật dấu vân tay để tạo thế mạnh chống lại các
tấn công cắt xén ảnh [109]. Kỹ thuật của họ thiên về cung cấp các hiệu ứng
cắt xén ảnh hơn là đề xuất một kỹ thuật nhúng. Phần logic nằm dưới công
việc được họ đề xuất là chia ảnh thành các ảnh con sau đó nén và mã hóa
những dữ liệu bí mật. Dữ liệu có được sau đó cũng lần lượt được chia và
nhúng vào các ảnh con nói trên. Để lấy lại được dữ liệu, một đa thức nội suy
Lagrange được áp dụng cùng với một thuật toán mã hóa. Độ phức tạp tính
toán lớn, các tham số của thuật toán cụ thể là số lượng hình ảnh (n) và giá trị


20

ngưỡng (k) không được thiết lập giá trị tối ưu, để người đọc phải đoán giá trị.
Giả sử rằng nếu n=32, có nghĩa là có 32 khóa công khai cần để cấp cho 32
người và 32 ảnh con, chúng lần lượt đều không thực tế. Hơn nữa, độ dư thừa
dữ liệu mà họ định bỏ qua sẽ tìm thấy trong ảnh-stego.

Hình 2.6: Ví dụ kỹ thuật giấu tin trong miền không gian ảnh.


×