Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀ N THÔNG
NGUYỄN THỊ THANH XUÂN
NGHIÊN CỨU THUẬT TOÁN ẨN THÔNG TIN
TRÊN ẢNH SỐ BẰNG KỸ THUẬT HOÁN VỊ HỆ SỐ
VÀ ỨNG DỤNG TRONG BẢO MẬT DỮ LIỆU
LUẬN VĂN THẠC SĨ KHOA HỌ C MÁ Y TÍ NH
Thái Nguyên – 2013
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀ N THÔNG
Nguyễn Thị Thanh Xuân
NGHIÊN CỨU THUẬT TOÁN ẨN THÔNG TIN
TRÊN ẢNH SỐ BẰNG KỸ THUẬT HOÁN VỊ HỆ SỐ
VÀ ỨNG DỤNG TRONG BẢO MẬT DỮ LIỆU
Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01
LUẬN VĂN THẠC SĨ KHOA HỌ C MÁ Y TÍ NH
NGƢỜ I HƢỚ NG DẪ N KHOA HỌ C
TS. NGUYỄN NGỌC CƢƠNG
Thái Nguyên – 2013
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
LỜI CẢM ƠN
Em xin đƣợc bày tỏ lòng biết ơn sâu sắc đến thầy TS. Nguyễn Ngọc
Cƣơng - Học viện An Ninh Nhân dân đã tận tình hƣớng dẫn, chỉ bảo và dành
rất nhiều thời gian cho em trong suốt quá trình làm luận văn.
Em xin gửi lời cảm ơn chân thành đến các thầy cô giáo Trƣờng Đại học
Công nghệ Thông tin và Truyền Thông - Đại học Thái Nguyên, đã giảng dạy
cung cấp, trang bị cho chúng em những kiến thức, chuyên ngành, chuyên môn
chuyên sâu trong quá trình học tập tại trƣờng cũng nhƣ quá trình làm luận văn
này.
Cuối cùng em xin gửi lời cảm ơn sâu sắc nhất gia đình, bạn bè và các
đồng nghiệp đã động viên, cổ vũ, tạo điều kiện cho em trong quá trình học tập
cũng nhƣ thời gian làm luận văn; giúp em hoàn thành khóa học, luận văn theo
qui định.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
LỜI CAM ĐOAN
Tôi xin cam đoan luận văn là kết quả nghiên cứu của tôi, không sao
chép của ai. Nội dung luận văn có tham khảo và sử dụng các tài liệu liên
quan, các thông tin trong tài liệu đƣợc đăng tải trên các tạp chí và các trang
website theo danh mục tài liệu của luận văn.
Tác giả luận văn
Nguyễn Thị Thanh Xuân
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
DANH MỤC CÁC HÌNH VẼ
Hình 1.1: Phân loại các kỹ thuật giấu tin 11
Hình 2.1: Mô hình quá trình giấu tin 15
Hình 2.2: Mô hình quá trình giải tin 16
Hình 2.3: Thông điệp đƣợc hiển thị khi bức ảnh giấu tin mở bằng Notepad 17
Hình 2.4: Chuỗi văn bản đƣợc chèn vào tiêu đề EXIF đƣợc đánh dấu 18
Hình 2.5: Giấu tin trong miền không gian 19
Hình 2.6: Ví dụ kỹ thuật giấu tin trong miền không gian ảnh. 20
Hình 2.7: Hệ thống báo cáo của Jung va Yoo [8] 22
Hình 2.8: Cấu trúc phân tích và ảnh nhận đƣợc qua phép biến đổi wavelet 2
chiều 27
Hình 2.9: Năng lƣợng phân bố của ảnh Lena qua phép biến đổi DCT 29
Hình 2.10: Phân chia 3 miền tần số của phép biến đổi DCT 30
Hình 2.11: Quá trình AddRoundKey 46
Hình 2.12: Quy trình SubBytes 46
Hình 2.13: Bƣớc ShiftRows 47
Hình 2.14: Mô tả quá trình trộn 47
Hình 3.1: Mô tả kỹ thuật hoán vị hệ số 50
Hình 3.2: Sơ đồ quy trình nhúng cải tiến 53
Hình 3.3: Giao diện giấu tin 54
Hình 3.4: Giao diện tiền xử lý để giấu tin 54
Hình 3.5: Giao diện giải tin 55
Hình 3.6: Giao diện giải mã tin sau khi tách 55
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
Hình 3.7: So sánh kết quả 57
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
DANH MỤC CÁC TỪ VIẾT TẮT
HVS
Hệ thống thị giác của con ngƣời
HAS
Hệ thống thính giác của con ngƣời
LSB
Kỹ thuật gài vào các bit có trọng số thấp
DCT
Biến đổi cosine rời rạc
DFT
Biến đổi Fourier rời rạc
DWT
Biến đổi wavelet
AES
Tiêu chuẩn mã hóa tiên tiến
DES
Tiêu chuẩn mã hóa dữ liệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
MỤC LỤC
LỜI CẢM ƠN
LỜI CAM ĐOAN
DANH MỤC CÁC HÌNH VẼ
DANH MỤC CÁC TỪ VIẾT TẮT
MỤC LỤC
MỞ ĐẦU 1
1. Đặt vấn đề 1
2. Lý do chọn đề tài 2
3. Đối tƣợng và phạm vi nghiên cứu 3
4. Ý nghĩa khoa học và thực tiễn của đề tài 4
5. Phƣơng pháp nghiên cứu 4
CHƢƠNG 1: TỔNG QUAN VỀ GIẤU TIN TRONG ẢNH 5
1.1 Một số khái niệm cơ bản về giấu tin 5
1.1.1 Lịch sử kỹ thuật giấu tin 5
1.1.2 Khái niệm giấu tin 6
1.1.3 Môi trƣờng giấu tin 7
1.1.3.1 Giấu tin trong ảnh 7
1.1.3.2 Giấu tin trong audio 8
1.1.3.3 Giấu tin trong video 8
1.1.3.4. Giấu tin trong văn bản 9
1.2 Phân loại các kỹ thuật giấu tin 10
1.3 Nhu cầu, ứng dụng của giấu tin trong ảnh số 12
1.3.1 Nhu cầu của giấu tin trong ảnh số 12
1.3.2 Ứng dụng của giấu tin trong ảnh số 12
Tổng kết chƣơng 1 14
CHƢƠNG 2: KỸ THUẬT GIẤU TIN TRONG ẢNH SỐ 15
2.1 Mô hình và các phƣơng pháp giấu tin cơ bản 15
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
2.1.1 Mô hình giấu tin cơ bản 15
2.1.2 Các phƣơng pháp giấu tin cơ bản 17
2.1.2.1 Giấu tin trong khuôn dạng ảnh 17
2.1.2.2 Giấu tin trong miền không gian của ảnh 18
2.1.2.3 Giấu tin trong miền tần số ảnh 23
2.2 Các phép biến đổi từ miền không gian ảnh sang miền tần số 25
2.2.1 Phép biến đổi wavelet - Descrete Wavelet Transform (DWT) 25
2.2.2 Phép biến đổi Fourier rời rạc 27
2.3.3 Phép biến đổi Cosin rời rạc 28
2.3 Một số kỹ thuật giấu tin trong ảnh 30
2.3.1 Kỹ thuật giấu tin WU- LEE 30
2.3.2 Kỹ thuật giấu tin YUAN _ PAN _ TSENG 33
2.3.3 Kỹ thuật giấu tin sử dụng lý thuyết đại số hiện đại 37
2.4 Giấu tin dựa trên kỹ thuật hoán vị hệ số kết hợp với nén và mã hoá dữ
liệu 43
2.4.1 Giấu tin bằng kỹ thuật hoán vị hệ số 43
2.4.2 Kỹ thuật nén dữ liệu Huffman 43
2.4.3 Mã hóa dữ liệu AES 44
Tổng kết chƣơng 2 47
CHƢƠNG 3: XÂY DỰNG CHƢƠNG TRÌNH VÀ THỬ NGHIỆM 49
3.1 Thuật toán giấu thông tin bằng kỹ thuật hoán vị hệ số 49
3.2 Giải pháp nâng cao hiệu quả ẩn thông tin 51
3.3 Chƣơng trình thực nghiệm 53
3.3.1 Quá trình giấu tin 54
3.3.2 Quá trình giải tin 55
3.4 Kết quả thực nghiệm 56
3.5 Kết luận và hƣớng phát triển 57
TÀI LIỆU THAM KHẢO 59
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
1
MỞ ĐẦU
1. Đặt vấn đề
Cùng với sự bùng nổ của Internet và các phƣơng tiện multimedia, những
vấn nạn nhƣ ăn cắp bản quyền, xuyên tạc thông tin, truy nhập thông tin trái
phép cũng gia tăng, đòi hỏi phải không ngừng tìm các giải pháp mới, hữu
hiệu cho an toàn và bảo mật thông tin. Một trong các giải pháp nhiều triển
vọng là giấu tin (DataHiding), đƣợc nghiên cứu phát triển trong khoảng 10
năm gần đây.
Hiện nay nhiều ngành, nhiều đơn vị trên toàn quốc đã có hệ thống
mạng nội bộ thông suốt các tỉnh thành trong cả nƣớc. Hệ thống đảm bảo đƣợc
các thông tin truyền đi trong mạng không bị lọt ra ngoài nhƣng điểm yếu của
hệ thống hiện tại chƣa đạt đƣợc đó là tính cơ động. Việc sử dụng mạng
internet dễ dàng hơn nhiều so với mạng nội bộ để truyền tin. Tuy nhiên
internet có thể phát tán thông tin đi bất kỳ đâu trên thế giới. Đi kèm với việc
truyền tin qua internet là những rủi ro về mất mát và sai lệch thông tin. Do đó
bảo mật thông tin khi truyền trên internet là một vấn đề cấp thiết trong thực
tế.
Bản chất của bảo mật thông tin là tìm cách để che giấu thông tin, có
thể là mã hóa thông tin hoặc giấu thông tin trong các dữ liệu số khác. Mục
đích đặt ra là thông tin đƣợc bảo mật chỉ có thể đọc đƣợc bởi đối tƣợng có
quyền đọc thông tin đó. Một trong cách tiếp cận trong bảo mật thông tin đó là
giấu tin có nghĩa là những thông tin số cần đƣợc bảo mật sẽ đƣợc ngƣời dùng
giấu vào trong một đối tƣợng dữ liệu số khác (môi trƣờng giấu tin) sao cho sự
biến đổi của môi trƣờng sau khi giấu tin là khó nhận biết, đồng thời ngƣời
dùng có thể lấy lại đƣợc các thông tin đã giấu khi cần.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
2
2. Lý do chọn đề tài
Giấu thông tin trong ảnh hiện nay chiếm tỉ lệ lớn nhất trong các chƣơng
trình ứng dụng, các phần mềm, hệ thống giấu tin trong đa phƣơng tiện bởi
lƣợng thông tin đƣợc trao đổi bằng ảnh là rất lớn, hơn nữa giấu thông tin
trong ảnh cũng đóng vai trò hết sức quan trọng đối với hầu hết các ứng dụng
bảo vệ an toàn thông tin nhƣ: nhận thực thông tin, xác định xuyên tạc thông
tin, bảo vệ bản quyền tác giả, điều khiển truy cập, giấu thông tin mật
Thông tin sẽ đƣợc giấu cùng với dữ liệu ảnh nhƣng chất lƣợng ảnh ít
thay đổi và chẳng ai biết đƣợc đằng sau ảnh đó mang những thông tin có ý
nghĩa. Ngày nay, khi ảnh số đã đƣợc sử dụng rất phổ biến thì giấu thông tin
trong ảnh đem lại rất nhiều ứng dụng quan trọng trên nhiều lĩnh vực đời sống
xã hội. Ví dụ, trong các dịch vụ ngân hàng và tài chính ở một số nƣớc phát
triển, thuỷ vân số đƣợc sử dụng để nhận diện khách hàng trong các thẻ tín
dụng. Mỗi khách hàng có một chữ kí viết tay, sau đó chữ kí này đƣợc số hoá
và lƣu trữ trong hồ sơ của khách hàng. Chữ kí này sẽ đƣợc sử dụng nhƣ là
thuỷ vân để nhận thực thông tin khách hàng. Trong các thẻ tín dụng, chữ kí
tay đƣợc giấu trong ảnh của khách hàng trên thẻ. Khi sử dụng thẻ, ngƣời dùng
đƣa thẻ vào một hệ thống, hệ thống có gắn thiết bị đọc thuỷ vân trên ảnh và
lấy đƣợc chữ kí số đã nhúng trong ảnh. Thuỷ vân đƣợc lấy ra sẽ so sánh với
chữ kí số đã lƣu trữ xem có trùng hợp không, từ đó xác định nhận thực khách
hàng.
Kỹ thuật ẩn thông tin đƣợc đề cập đến nhƣ một giải pháp nhằm giải
quyết bài toán truyền nhận thông điệp mật, tăng cƣờng tính bảo mật và an
toàn trong các giao dịch thƣơng mại điện tử trên mạng Internet cũng nhƣ bảo
vệ quyền sở hữu trí tuệ đối với các thông tin số có giá trị nhƣ phim, ảnh, âm
thanh… Kỹ thuật ẩn thông tin kết hợp mã hóa đƣợc đánh giá nhƣ là giải pháp
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
3
hữu hiệu và thích hợp nhất cho vấn đề bảo vệ bản quyền trên Internet cũng
nhƣ các dịch vụ truyền thông đa phƣơng tiện.
Hiện nay, đã có nhiều công trình nghiên cứu trong nƣớc và trên thế
giới để giấu tin vào ảnh gốc. Các kỹ thuật và chƣơng trình này đều có những
đặc điểm nhất định dựa trên phƣơng pháp biến đổi hình học (nhƣ phép quay,
dịch chuyển cắt xén… ), điều này có thể dẫn đến quá trình kiểm tra xác định
sự tồn tại của thông điệp nhúng trong ảnh không chính xác.
Ngƣời ta đã đƣa ra kỹ thuật ẩn thông tin kết hợp với các kỹ thuật mã
hóa và nén dữ liệu sẽ giúp cho quá trình ẩn thông tin đƣợc an toàn hơn, tăng
cƣờng độ bảo mật và dung lƣợng của thông tin ẩn. Kỹ thuật này cho phép
chống lại các tấn công bằng các phép biến đổi hình học.
Để ứng dụng trên thực tế kỹ thuật này cần phải xây dựng chƣơng trình
trên cơ sở lý thuyết nêu trên và thử nghiệm trên thực tế nhằm đánh giá hiệu
quả của kỹ thuật, chính vì thế chúng tôi lựa chọn đề tài có tên: "Nghiên cứu
thuật toán ẩn thông tin trên ảnh số bằng kỹ thuật hoán vị hệ số và ứng
dụng trong bảo mật dữ liệu"
3. Đối tƣợng và phạm vi nghiên cứu
Giấu tin trong ảnh là một chủ đề khá mới mẻ đƣợc quan tâm nhiều
hiện nay, đặc biệt trong các ứng dụng trên mạng internet. Đây là một lĩnh vực
nghiên cứu có liên quan đến nhiều lĩnh vực bảo mật, an toàn dữ liệu và xử lý
ảnh. Đã có nhiều công trình nghiên cứu về lĩnh vực này và đến nay cũng đã
có khá nhiều phƣơng pháp, kỹ thuật đƣợc đề xuất. Tuy nhiên trong khuôn khổ
của luận văn, tác giả chỉ tập trung tìm hiểu và nghiên cứu:
- Các kiểu dữ liệu: ảnh, file audio, video, text;
- Kỹ thuật ẩn thông tin kết hợp với các kỹ thuật mã hóa và nén dữ liệu;
- Xây dựng thuật toán hoán vị hệ số và giải pháp nâng cao hiệu quả ẩn
thông tin trong ảnh số;
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
4
- Phƣơng pháp chữ ký số, xác thực thông tin;
- Các phƣơng pháp, kỹ thuật giấu tin trong ảnh số;
- Thiết lập mô hình và thử nghiệm chƣơng trình.
4. Ý nghĩa khoa học và thực tiễn của đề tài
Data Hiding là phƣơng pháp đã và đang đƣợc nghiên cứu và ứng dụng
rất mạnh mẽ ở nhiều nƣớc trên thế giới đó là phƣơng pháp nhúng tin trong các
phƣơng tiện khác. Đây là phƣơng pháp mới và phức tạp nó đang đƣợc xem
nhƣ một công nghệ chìa khoá cho vấn đề bảo vệ bản quyền, nhận thức thông
tin và điều khiển truy cập ứng dụng trong an toàn và bảo mật thông tin.
Trong hình ảnh viễn thám và quân sự thì độ chính xác cao là cần thiết,
trong một số nghiên cứu khoa học dữ liệu thử nghiệm rất đắt phải đảm bảo
đƣợc, còn trong ứng dụng nhƣ thực thi pháp luật, hệ thống hình ảnh y tế …
mong muốn phải đúng với dữ liệu gốc để xem xét về mặt pháp lý tránh những
lệch lạc thông tin. Do vậy mà việc phục hồi dữ liệu sau khi giấu tin để đảm
bảo tính chính xác là rất có ý nghĩa khoa học và thực tiễn.
Việc kết hợp giữa giấu tin và chứng thực cho phép bảo vệ nhãn
thƣơng hiệu chứng minh sự hợp pháp của sản phẩm bảo vệ bản quyền nhất là
trong thƣơng mại điện tử. Đây là ý nghĩa thực tiễn của đề tài.
5. Phƣơng pháp nghiên cứu
Trong luận văn sử dụng phƣơng pháp nghiên cứu lý thuyết, các phƣơng
pháp chứng thực, các kỹ thuật giấu tin, phƣơng pháp mô hình hóa và thử
nghiệm thực tế.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
5
CHƢƠNG 1
TỔNG QUAN VỀ GIẤU TIN TRONG ẢNH
1.1 Một số khái niệm cơ bản về giấu tin
1.1.1 Lịch sử kỹ thuật giấu tin
Từ Stenography bắt nguồn từ Hi Lạp và đƣợc sử dụng cho tới ngày
nay, nó có nghĩa là tài liệu đƣợc phủ (covered writing). Mục đích cơ bản của
giấu tin là nhúng mẩu tin mật vào một môi trƣờng truyền tin bình thƣờng sao
cho ngƣời khác không thể phát hiện ra mẩu tin mật đó. Trong lịch sử, những
câu chuyện về giấu tin đƣợc lan truyền từ đời qua đời khác. Ví dụ, vào thế kỷ
thứ 5 trƣớc Công Nguyên, Histaiacus đã cạo trọc đầu một nô lệ, xăm lên đó
một thông điệp sau đó khi đầu nô lệ này mọc tóc trở lại, ông ta phái nô lệ đó
mang thông điệp đã đƣợc giấu trên đầu đi. Ở các tiểu vƣơng quốc Ả Rập tại
thành phố về khoa học và công nghệ của vua Abdulaziz, một dự án đã đƣợc
khởi xƣớng để dịch thành tiếng anh các văn bản tiếng Ả Rập cổ về các dòng
chữ bí mật đƣợc cho là đã viết cách đây 1200 năm. Một vài văn bản này đƣợc
tìm thấy ở Thổ Nhĩ Kỳ và Đức. Khoảng 500 năm trƣớc, một nhà toán học
ngƣời Ý tên là Jerome Cardan đã sáng tạo lại một phƣơng thức văn bản bí mật
cổ xƣa của ngƣời Trung Quốc. Văn bản đƣợc làm nhƣ sau: một tờ giấy làm
mặt nạ có nhiều lỗ thủng mà ngƣời gửi và ngƣời nhận đều biết, mặt nạ này sẽ
đƣợc đặt trên một tờ giấy trắng và ngƣời gửi sẽ viết thông điệp bí mật qua các
lỗ thủng trên mặt nạ sau đó vứt mặt nạ đó đi và điền phần còn lại vào tờ giấy
trắng nhƣ thể tờ giấy này toàn các thông tin vô thƣởng vô phạt.
Ý tƣởng về che giấu thông tin đã có từ hàng nghìn năm về trƣớc nhƣng
kỹ thuật này đƣợc dùng chủ yếu trong quân đội và trong các cơ quan tình báo.
Mãi cho tới vài thập niên gần đây, giấu thông tin mới nhận đƣợc sự quan tâm
của các nhà nghiên cứu và các viện công nghệ thông tin với hàng loạt công
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
6
trình nghiên cứu giá trị. Cuộc cách mạng số hóa thông tin và sự phát triển
nhanh chóng của mạng truyền thông là nguyên nhân dẫn đến sự thay đổi này.
Ngày nay nghệ thuật giấu tin đƣợc nghiên cứu để phục vụ các mục đích
tích cực nhƣ bảo vệ bản quyền, thủy vân số, hay phục vụ giấu các thông tin bí
mật về quân sự và kinh tế. Sự phát triển của công nghệ thông tin đã tạo ra
những môi trƣờng giấu tin mới vô cùng tiện lợi và phong phú. Ngƣời ta có thể
giấu tin trong các tệp ảnh, trong các tệp âm thanh, tệp văn bản. Cũng có thể
giấu tin ngay trong các khoảng trống hay các phân vùng ẩn của môi trƣờng
lƣu trữ nhƣ đĩa cứng, đĩa mềm. Các gói tin truyền đi trên mạng cũng là môi
trƣờng giấu tin quan trọng và ngay cả các tiện ích phần mềm cũng là môi
trƣờng lý tƣởng để gài các thông tin quan trọng để xác nhận bản quyền.
1.1.2 Khái niệm giấu tin
“ Giấu tin” là một kỹ thuật nhúng (giấu) một lƣợng thông tin số nào đó
vào trong một đối tƣợng dữ liệu số khác. Giấu tin trong ảnh số là giấu các
mẩu tin cũng là dạng số trong máy tính vào các tệp ảnh nhị phân sao cho
không bị ngƣời ngoài phát hiện.
Kỹ thuật giấu thông tin nhằm mục đích đảm bảo an toàn và bảo mật
thông tin rõ ràng ở hai khía cạnh. Một là bảo mật cho dữ liệu đƣợc đem giấu,
hai là bảo mật cho chính đối tƣợng đƣợc dùng để giấu tin. Hai mục đích khác
nhau này dẫn đến hai khuynh hƣớng kỹ thuật chủ yếu của giấu tin. Khuynh
hƣớng thứ nhất là giấu tin mật (steganography). Khuynh hƣớng này tập trung
vào các kỹ thuật giấu tin sao cho thông tin giấu đƣợc nhiều và quan trọng là
ngƣời khác khó phát hiện đƣợc một đối tƣợng có bị giấu tin bên trong hay
không. Khuynh hƣớng thứ hai là thủy vân số (watermarking). Khuynh hƣớng
thủy vân số đánh giấu vào đối tƣợng nhằm khẳng định bản quyền sở hữu hay
phát hiện xuyên tạc thông tin. Thủy vân số có miền ứng dụng lớn hơn nên
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
7
đƣợc quan tâm nghiên cứu nhiều hơn và thực tế đã có nhiều những kỹ thuật
dành cho khuynh hƣớng này. Nói chung giấu tin trong đa phƣơng tiện là tận
dụng “độ dƣ thừa” của phƣơng tiện giấu để thực hiện việc giấu tin mà ngƣời
ngoài cuộc “khó” cảm nhận đƣợc có thông tin giấu trong đó.
1.1.3 Môi trường giấu tin
1.1.3.1 Giấu tin trong ảnh
Hiện nay, giấu tin trong ảnh chiếm tỷ lệ lớn nhất hệ thống giấu tin trong
các chƣơng trình ứng dụng, các phần mềm, hệ thống giấu tin trong đa phƣơng
tiện. Bởi lẽ lƣợng thông tin đƣợc trao đổi bằng hình ảnh là rất lớn, hơn nữa
chúng còn đóng vai trò quan trọng trong các ứng dụng an toàn thông tin nhƣ:
xác thực thông tin, bảo vệ quyền tác giả, điều khiển truy cập, phát hiện xuyên
tạc thông tin. Từ việc nghiên cứu kỹ thuật giấu tin trong ảnh số chuyển sang
kỹ thuật giấu tin trong các phƣơng tiện khác nhƣ audio, video, trong văn
bản,… không có gì khó khăn về nguyên tắc. Chính vì lẽ đó, giấu tin trong ảnh
đã và đang đƣợc nhiều tổ chức, các trƣờng đại học, các viện nghiên cứu, các
cá nhân quan tâm và đầu tƣ nghiên cứu.
Thông tin đƣợc giấu cùng với dữ liệu ảnh nhƣng chất lƣợng ảnh rất ít
thay đổi mà ngƣời ta khó có thể nhận thấy sự thay đổi đó bằng mắt thƣờng.
Sau vụ khủng bố ngày 11 tháng 9 năm 2001 gây chấn động không chỉ nƣớc
Mĩ mà cả thế giới, Hãng AFP (2004) có đƣa tin: chính trùm khủng bố quốc tế
Osama Binladen đã dùng cách thức giấu thông tin trong ảnh để liên lạc với
đồng bọn và chúng đã qua mặt đƣợc Cục tình báo Trung ƣơng Mĩ và các cơ
quan an ninh quốc tế. Sự việc này càng cho thấy việc nghiên cứu các vấn đề
liên quan đến giấu tin trong ảnh càng trở nên quan trọng.
Ngày nay, khi ảnh số đã đƣợc sử dụng rất phổ biến thì giấu thông tin
trong ảnh đã đem lại nhiều những ứng dụng quan trọng trên các lĩnh vực trong
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
8
đời sống xã hội. Ví dụ nhƣ đối với các nƣớc phát triển, chữ ký tay đã đƣợc số
hóa và lƣu trữ sử dụng nhƣ là hồ sơ cá nhân của các dịch vụ ngân hàng và tài
chính. Nó đƣợc dùng để nhận thực trong các thẻ tín dụng của ngƣời tiêu dùng.
Hay trong một số những ứng dụng về nhận diện nhƣ thẻ chứng minh, thẻ căn
cƣớc, hộ chiếu… ngƣời ta có thể giấu thông tin trên các ảnh thẻ để xác định
thông tin thực.
1.1.3.2 Giấu tin trong audio
Giấu tin trong audio mang những đặc điểm riêng khác với giấu tin
trong các đối tƣợng đa phƣơng tiện khác. Một trong những yêu cầu cơ bản
của giấu tin là đảm bảo tính chất ẩn của thông tin đƣợc giấu đồng thời không
làm ảnh hƣởng đến chất lƣợng của dữ liệu. Kỹ thuật giấu tin trong ảnh phụ
thuộc vào hệ thống thị giác của con ngƣời (HVS - Human Vision System) còn
kỹ thuật giấu tin trong audio phụ thuộc vào hệ thống thính giác của con ngƣời
(HAS - Human Auditory System). Vấn đề khó khăn ở đây là hệ thống tính
giác của con ngƣời nghe đƣợc các tín hiệu ở các giải tần rộng và công suất lớn
nên đã gây khó dễ đối với các phƣơng pháp giấu tin trong audio. HAS cảm
nhận đƣợc các tín hiệu ở dài tần rộng và công suất. Điều này có nghĩa là các
âm thanh to, cao tần có thể che giấu đƣợc các âm thanh nhỏ, thấp tần một
cách dễ dàng. Kênh truyền tin cũng là một vấn đề khó khăn với giấu tin trong
audio. Kênh truyền hay băng thông chậm sẽ ảnh hƣởng đến chất lƣợng thông
tin sau khi giấu. Giấu thông tin trong audio yêu cầu rất cao về tính đồng bộ và
tính an toàn của thông tin.
1.1.3.3 Giấu tin trong video
Cũng giống nhƣ giấu thông tin trong ảnh hay trong audio, giấu tin
trong video cũng đƣợc quan tâm và đƣợc phát triển mạnh mẽ cho nhiều ứng
dụng nhƣ điều khiển truy cập thông tin, nhận thức thông tin, bản quyền tác
giả…Ta có thể lấy một ví dụ là các hệ thống chƣơng trình trả tiền xem theo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
9
video clip (pay per view application). Các kỹ thuật giấu tin trong video cũng
đƣợc phát triển mạnh mẽ và cũng theo hai khuynh hƣớng là thủy vân số và
data hiding. Một phƣơng pháp giấu tin trong video đƣợc đƣa ra bởi Cox là
phƣơng pháp phân bố đều. Ý tƣởng cơ bản của phƣơng pháp là phân phối
thông tin giấu dàn trải theo tần số của dữ liệu chứa gốc. Nhiều nhà nghiên cứu
đã dùng những hàm cosin riêng và các hệ số truyền sóng riêng để giấu tin.
Trong các thuật toán khởi nguồn thì thƣờng các kỹ thuật cho phép giấu các
ảnh vào trong video nhƣng thời gian gần đây các kỹ thuật cho phép giấu cả
âm thanh và hình ảnh vào video. Nhƣ phƣơng pháp của Swanson đã sử dụng
để giấu theo khối, phƣơng pháp này đã giấu đƣợc hai bít vào khối 8*8, hay
gần đây nhất là phƣơng pháp của Mukherjee là kỹ thuật giấu audio vào video
sử dụng cấu trúc lƣới đa chiều… Kỹ thuật giấu thông tin áp dụng cả đặc điểm
thị giác và thính giác của con ngƣời. Kỹ thuật giấu tin đang đƣợc áp dụng cho
nhiều loại đối tƣợng chứ không riêng gì dữ liệu đa phƣơng tiện nhƣ hình ảnh,
audio hay video. Gần đây đã có một số nghiên cứu giấu tin trong cơ sở dữ liệu
quan hệ. Chính vì thế sau này chắc chắn kỹ thuật giấu tin còn phát triển tiếp.
1.1.3.4. Giấu tin trong văn bản
Trong trao đổi thông tin qua hệ thống máy tính, văn bản chiếm một tỷ
lệ rất lớn so với các loại phƣơng tiện chứa khác. Tuy vậy, giấu tin trong văn
bản lại chƣa đƣợc quan tâm nghiên cứu nhiều. Các nghiên cứu về giấu tin
trong văn bản đƣợc chia theo hai hƣớng, thứ nhất văn bản đƣợc sử dụng để
giấu tin là những văn bản đƣợc chụp lại và lƣu trên máy nhƣ một bức ảnh nhị
phân. Theo hƣớng này, các kỹ thuật giấu tin đƣợc thực hiện nhƣ kỹ thuật giấu
tin trong ảnh. Hƣớng thứ hai, phƣơng tiện chứa sử dụng cho quá trình giấu tin
đƣợc lƣu dƣới dạng văn bản. Theo hƣớng này, các kỹ thuật giấu tin cũng tiến
hành nhƣ giấu tin trong ảnh bằng cách thay đổi một số ký tự tại một số vị trí
trên văn bản mà không làm ảnh hƣởng nhiều đến nội dung văn bản gốc.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
10
1.2 Phân loại các kỹ thuật giấu tin
Khái niệm "Cái bạn nhìn thấy là cái bạn có được" ngày nay không còn
chính xác nữa. Ảnh có thể làm đƣợc nhiều thứ hơn là cái mà con ngƣời nhìn
thấy bằng mắt thƣờng, chúng có thể chứa đựng tới hơn 1000 từ ẩn giấu bên
trong. Hàng thập kỷ qua, con ngƣời đã phát triển đáng kể các phƣơng pháp
sáng tạo trong giao tiếp bí mật. Trong đó có 3 kỹ thuật có mối tƣơng quan với
nhau là giấu tin, thủy vân số và mật mã.
Có nhiều cách phân loại giấu tin khác nhau dựa trên những tiêu chí khác
nhau. Theo Fabien A.P. Petitcolas đề xuất năm 1999, có thể chia lĩnh vực giấu
tin thành hai hƣớng lớn, đó là giấu tin mật và thủy vân số [5].
Giấu tin mật với mục đích đảm bảo an toàn và bảo mật thông tin tập
trung vào các kỹ thuật giấu thông tin sao cho ngƣời khác khó phát hiện nhất
việc có tin đƣợc giấu, hơn nữa nếu phát hiện có tin giấu thì giải tin cũng khó
thực hiện. Bên cạnh đó cũng đặt ra vấn đề về lƣợng tin đƣợc giấu càng nhiều
càng tốt, ngoài ra tốc độ giấu cũng đƣợc yêu cầu mặc dù đây là vấn đề thứ
yếu [4].
Thủy vân số là lĩnh vực nghiên cứu việc nhúng các thông tin phục vụ
xác thực, ví dụ nhƣ xác nhận bản quyền. Nếu thông tin giấu là một định danh
duy nhất, ví dụ định danh ngƣời dùng thì khi đó ngƣời ta gọi là Fingerprinting
(nhận dạng vân tay, điểm chỉ). Thủy vân số lại đƣợc chia thành hai hƣớng nhỏ
là thủy vân dễ vỡ và thủy vân bền vững. Trong đó thủy vân dễ vỡ yêu cầu
thông tin giấu sẽ bị sai lệch nếu có bất kỳ sự thay đổi nào trên dữ liệu chứa
tin. Thủy vân bền vững quan tâm nhiều đến việc nhúng các mẩu tin đòi hỏi độ
bền cao của thông tin đƣợc giấu trƣớc các biến đổi thông thƣờng trên dữ liệu
chứa tin [5].
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
11
Xét về tính chất thuỷ vân số giống giấu tin ở chỗ tìm cách nhúng thông
tin mật vào một môi trƣờng. Tuy nhiên, xét về bản chất thì thuỷ vân số có
khác ở một số điểm:
- Giấu tin sau đó cần tách lại tin còn thuỷ vân số tìm cách biến tin giấu
thành một thuộc tính của vật mang.
- Mục tiêu của thuỷ vân số là nhúng thông tin không lớn thƣờng là biểu
tƣợng, chữ ký hay các đánh dấu khác vào môi trƣờng phủ nhằm phục vụ
việc xác nhận bản quyền.
Chỉ tiêu quan trọng nhất của giấu tin là dung lƣợng còn của thuỷ vân số
là tính bền vững.
Thuỷ vân số có thể vô hình hoặc hữu hình trên ảnh mang.
Hình 1.1: Phân loại các kỹ thuật giấu tin
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
12
1.3 Nhu cầu, ứng dụng của giấu tin trong ảnh số
1.3.1 Nhu cầu của giấu tin trong ảnh số
Ngày nay, kỹ thuật giấu tin đƣợc triển khai trong nhiều ứng dụng khác
nhau nhằm bảo vệ tính bí mật của thông tin, phục vụ các mục đích tích cực
nhƣ bảo vệ bản quyền, thủy vân số, hay phục vụ giấu các thông tin bí mật về
quân sự và kinh tế. Trong đó giấu tin trong ảnh chiếm tỉ lệ lớn nhất ở hệ thống
giấu tin trong đa phƣơng tiện. Bởi lẽ lƣợng thông tin đƣợc trao đổi bằng hình
ảnh là rất lớn qua đó các thông tin cá nhân có thể đƣợc nhúng vào trong thẻ
chứng minh với những thông tin mang tính duy nhất của một ngƣời,… Giấu
tin có thể đƣợc sử dụng nhƣ một phần của quá trình in ấn bình thƣờng.
1.3.2 Ứng dụng của giấu tin trong ảnh số
- Bảo vệ quyền tác giả(copyright protection): Đây là ứng dụng cơ bản
nhất của kỹ thuật thủy vân số (digital watermarking) - một dạng của phƣơng
pháp giấu tin. Một thông tin nào đó mang ý nghĩa quyền sở hữu tác giả gọi là
thủy vân sẽ đƣợc nhúng vào trong các sản phẩm, thủy vân đó chỉ một mình
ngƣời chủ sở hữu hợp pháp các sản phẩm đó có và đƣợc dùng làm minh
chứng cho bản quyền sản phẩm. Giả sử có một thành phẩm dữ liệu đa phƣơng
tiện nhƣ ảnh, âm thanh, video cần đƣợc lƣu thông trên mạng. Để bảo vệ các
sản phẩm chống lại các hành vi lấy cắp hoặc làm nhái cần phải có một kỹ
thuật để “dán tem bản quyền” vào sản phẩm này. Việc dán tem này chính là
việc nhúng thủy vân cần phải đảm bảo không để lại một ảnh hƣởng lớn nào
đến việc cảm nhận sản phẩm. Yêu cầu kỹ thuật đối với ứng dụng này là thủy
vân phải tồn tại bền vững cùng với sản phẩm, muốn bỏ thủy vân này mà
không đƣợc phép của ngƣời chủ sở hữu thì chỉ có cách là phá hủy sản phẩm.
- Xác thực thông tin hay phát hiện xuyên tạc thông tin (authentication
and tamper detection): Một tập các thông tin sẽ đƣợc giấu trong các phƣơng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
13
tiện chứa sau đó sử dụng để nhận biết xem trên các phƣơng tiện gốc đó có bị
thay đổi hay không. Các thủy vân nên đƣợc ẩn để tránh sự tò mò của kẻ thù
hơn nữa việc làm giả các thủy vân hợp lệ hay xuyên tạc thông tin nguồn cũng
cần đƣợc xem xét. Trong các ứng dụng thực tế ngƣời ta mong muốn tìm đƣợc
vị trí bị xuyên tạc cũng nhƣ phân biệt đƣợc các thay đổi (ví dụ nhƣ phân biệt
xem một đối tƣợng đa phƣơng tiện chứa thông tin giấu đã bị thay đổi, xuyên
tạc nội dung hay là chỉ bị nén mất dữ liệu). Yêu cầu chung đối với ứng dụng
này là khả năng giấu thông tin nhiều và thủy vân không cần bền vững trƣớc
các phép xử lý trên đối tƣợng đã đƣợc giấu tin.
- Giấu vân tay hay dán nhãn (fingerprinting and labeling): Thủy vân
trong các ứng dụng này đƣợc sử dụng để nhận diện ngƣời gửi hay ngƣời nhận
của một thông tin nào đó trong ứng dụng phân phối sản phẩm. Thủy vân
trong trƣờng hợp này cũng tƣơng tự nhƣ số serial của sản phẩm phần mềm.
Mỗi một sản phẩm sẽ mang một thủy vân riêng. Ví dụ các vân khác nhau sẽ
đƣợc nhúng vào các bản copy khác nhau của thông tin gốc trƣớc khi chuyển
cho nhiều ngƣời. Với những ứng dụng này thì yêu cầu là đảm bảo độ an toàn
cao cho các thủy vân, tránh sự xóa dấu vết trong khi phân phối.
- Điều khiển sao chép (copy control): Điều mong muốn đối với các hệ
thống phân phối dữ liệu đa phƣơng tiện là tồn tại một kỹ thuật chống sao chép
trái phép dữ liệu. Có thể sử dụng thủy vân để chỉ trạng thái sao chép của dữ
liệu. Các thủy vân trong những trƣờng hợp này đƣợc sử dụng để điều khiển,
sao chép đối với các thông tin. Các thiết bị phát hiện ra thủy vân thƣờng đƣợc
gắn sẵn vào trong các hệ thống đọc ghi. Ví dụ nhƣ hệ thống quản lý sao chép
DVD đã đƣợc ứng dụng ở Nhật. Thủy vân mang các giá trị chỉ trạng thái cho
phép sao chép dữ liệu nhƣ “copy never” - không đƣợc sao chép hay “copy
once” - chỉ đƣợc copy một lần, sau khi copy xong bộ đọc ghi thủy vân sẽ ghi
thủy vân mới chỉ trạng thái mới lên DVD. Các ứng dụng loại này cũng yêu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
14
cầu thủy vân phải đƣợc đẩm bảo an toàn và cũng sử dụng phƣơng pháp phát
hiện thủy vân đã giấu mà không cần thông tin gốc.
- Giấu tin mật(steganography): Các thông tin giấu đƣợc trong những
trƣờng hợp này càng nhiều càng tốt, việc giải mã để nhận đƣợc thông tin cũng
không cần phƣơng tiện chứa gốc ban đầu. Các yêu cầu mạnh về chống tấn
công của kẻ thù không cần thiết lắm thay vào đó là thông tin giấu phải đƣợc
bảo mật.
Tổng kết chƣơng 1
Trong chƣơng này đã trình bày khái quát về lĩnh vực giấu tin, giới thiệu
một số khái niệm cơ bản trong lĩnh vực giấu tin. Chƣơng đã tóm tắt một số kỹ
thuật giấu tin cơ bản nhất và trình bày về nhu cầu và các ứng dụng giấu tin
trong ảnh số. Trong các kỹ thuật giấu tin, giấu tin trong ảnh số chiếm tỷ lệ lớn
nhất do khả năng giấu thông tin trong lƣợng thông tin của hình ảnh khá lớn và
khả năng ứng dụng rất cao. Các kỹ thuật giấu tin đƣợc triển khai trong nhiều
ứng dụng khác nhau nhằm bảo vệ tính bí mật của thông tin, có thể phục vụ
cho nhiều ứng dụng trong đời sống ví dụ nhƣ bảo vệ bản quyền số.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
15
CHƢƠNG 2
KỸ THUẬT GIẤU TIN TRONG ẢNH SỐ
2.1 Mô hình và các phƣơng pháp giấu tin cơ bản
2.1.1 Mô hình giấu tin cơ bản
Với sự phát triển không ngừng của công nghệ thông tin, cùng với sự
quan tâm rất lớn của các nhà khoa học, các tổ chức, các quốc gia về lĩnh vực
an toàn và bảo vệ thông tin, hiện nay đã có rất nhiều các kỹ thuật giấu tin
đƣợc nghiên cứu và phát triển. Tuy nhiên có thể thấy, tất cả đều xuất phát từ
mô hình giấu tin cơ bản cũng nhƣ từ những kỹ thuật giấu tin cơ bản nhất.
Hình 2.1: Mô hình quá trình giấu tin
Trong mô hình này, phƣơng tiện chứa tin bao gồm các đối tƣợng đƣợc
dùng làm môi trƣờng để giấu tin nhƣ văn bản, ảnh, audio, video… thông tin
Thông tin cần giấu
Phƣơng
tiện chứa
tin (audio,
ảnh,
video )
Khóa
Bộ nhúng
thông tin
Phƣơng
tiện chứa
đã đƣợc
giấu tin
Phân
phối
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
16
cần giấu tùy theo mục đích của ngƣời sử dụng, nó có thể là các thông điệp,
các logo, hình ảnh bản quyền… Thông tin đƣợc giấu vào trong phƣơng tiện
chứa tin nhờ bộ nhúng. Bộ nhúng là những chƣơng trình thực hiện theo những
thuật toán để giấu tin và đƣợc thực hiện với một khóa bí mật giống nhƣ trong
một số hệ mật mã. Đầu ra của quá trình giấu tin là phƣơng tiện chứa đã đƣợc
giấu. Các phƣơng tiện này có thể đƣợc phân phối trên mạng.
Hình 2.2 mô tả quá trình giải mã thông tin đã giấu. Với đầu vào là
phƣơng tiện đã chứa tin giấu, một bộ phận giải mã tin ( tƣơng ứng với bộ
nhúng) cùng với khóa sẽ thực hiện việc giải mã thông tin. Đầu ra của quá
trình là phƣơng tiện chứa tin và các thông tin đã giấu. Trong trƣờng hợp cần
thiết, thông tin giấu lấy ra có thể đƣợc xử lý, kiểm định và so sánh với thông
tin đã giấu ban đầu.
Hình 2.2: Mô hình quá trình giải tin
Thông tin cần giấu
Phƣơng
tiện chứa
tin (audio,
ảnh,
video )
Khóa
Bộ giải mã
tin
Phƣơng
tiện chứa
đã đƣợc
giấu tin
Phân
phối
Kiểm
định