Tải bản đầy đủ (.pdf) (87 trang)

Bảo mật thông tin trên cơ sở giấu tin trong ảnh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (26.72 MB, 87 trang )

ĐẠI H Ọ C Q U Ố C G IA H À N Ộ I
K H O A C Ô N G N G H Ệ
T R Ầ N C ÔNG H O À
B Ả O M Ậ T T H Õ N G T IN T R Ê N c ơ s ở
G IẤ U T IN T R O N G Ả N H
CHUYÊN NGÀNH: CÔNG NGHỆ THÔNG TIN
MÃ SỐ: 1.01.10
LUẬN V ĂN THẠC s ĩ
■ ■
NGƯÒI HUỐNG DẪN KHOA HỌC:
PGS. TSKH. NGUYỄN XUÂN HUY
CHƯƠNG 1 : TỔNG QUAN VỀ CÁC PHƯƠNG PHÁP BẢO MẬT THÔNG TIN 9
1.1 Bảo mật thông tin dùng phương pháp mã hoá dữ liệu

9
1.1.1 Thuật toán mã hoá sử dụng khoá bí m ật

10
1.1.2 Các thuật toán mã hoá sử dụng khoá công khai

12
1.2 Giấu tin trong môi trường Multimedia

14
1.2.1 Lịch sử giấu thông tin 15
1.2.2 Bài toán giấu thông tin trong môi trường multimedia

16
1.2.3 Phân loại phương pháp giấu tin, một số khái niệm và tính chất 17
CHƯƠNG 2: KỸ THUẬT GIẤU TIN TRONG ẢNH
2.1 Một số vấn đề liên quan tới ảnh môi trường



27
2.1.1 Mô hình mầu 27
2.1.2 Nguyên tắc lưu trữ ảnh trong môi trường số 31
2.1.3 Cấu trúc của một số kiểu ảnh cơ bản

33
2.2 Mô hình của quá trình giấu thông tin 41
2.3 Giới thiệu các phương pháp giấu tin trong ảnh
42
2.3.1 Phương pháp sử dụng kỹ thuật LSB 43
2.3.2 Phương pháp sử dụng các kỹ thuật xử lý ảnh 44
2.3.3 Phương pháp sử dụng kỹ thuật "mặt nạ giác quan" 46
CHƯƠNG 3: THUẬT TOÁN GIẤU TIN TRONG ẢNH 47
3.1 Thuật toán giấu thông tin trong khối b ít 47
3.1.1 Thuật toán chuẩn 47
3.1.2 Thuật toán cải tiến CPT 49
3.1.3 Thuật toán cải tiến có tính đến vấn đề về chất lượng ảnh 52
3.2 Thuật toán giấu thông tin sử dụng kỹ thuật LSB 56
3.2.1 Ảnh 24 bít màu và ảnh đa cấp xám 56
3.2.2 Ảnh nhỏ hơn hay bằng 256 mầu 58
3.3 Phân tích phương pháp giấu tin trong ảnh sử dụng kỹ thuật LSB 61
MỤC LỤC
Tran g
MỞ ĐẦU 6
3.3.1 Giới thiệu kỹ thuật giấu tin qua "bài toán của người tù"

61
3.3.2 Mô hình thống kê của kỹ thuật LSB


63
3.3.3 Khả năng giấu tin của kỹ thuật LSB

65
3.4 Các hạn chế của kỹ thuật giấu tin

68
3.5 Các tấn công và biện pháp khắc phục của kỹ thuật giấu tin

68
PHỤ LỤC 73
KẾT LUẬN CHUNG
87
TÀI LIỆU THAM KHẢO 88
6
MỞ ĐẦU
Ngày nay, con người đã đạt được những thành tựu to lớn trong mọi lĩnh vực
của đời sống như lĩnh vực khoa học - kỹ thuật, văn hoá - nghệ thuật, kinh doanh, kỹ
thuật quân sự và các lĩnh vực khác. Nhiều phát minh, sáng kiến đã được ra đời nhằm
phục vụ một đối tượng quan trọng, đó là con người. Có một thực trạng nảy sinh là đi
đôi với các phát minh, sáng kiến, các thành tựu khoa học tiên tiến thì vấn đề về sao
chép bản quyền, giả mạo thông tin, khai thác, phá hoại thông tin một cách bất hợp
pháp cũng phát triển mạnh. Chính vì vậy trong mọi lĩnh vực lại phát sinh nhu cầu
giữ bí mật thông tin của mình: trong hoạt động kinh doanh do tính cạnh tranh của
thị trường dẫn tới nhu cầu về bí mật thông tin kinh doanh; trong lĩnh vực quân sự để
có một tiềm năng quân sự mạnh thì việc giữ bí mật kỹ thuật quân sự là tối quan
trọng; trong hoạt động văn hoá - nghệ thuật việc bảo vệ bản quyền các tác phẩm văn
hoá, nghệ thuật được đặt ra; trong lĩnh vực khoa học - kỹ thuật vấn đề giữ bản quyền
về các phát minh, sáng kiến cũng được quan tâm một cách nghiêm túc
Tất cả các nhu cầu nêu trên đã đặt ra cho chúng ta một nhiệm vụ cấp bách về

việc bảo vệ các thông tin quan trọng trước các tấn công từ bên ngoài. Để thực hiện
nhiệm vụ đó, chúng ta cần giải quyết các yêu cầu về an toàn thông tin và bí mật
thông tin.
Lịch sử đã có các kỹ thuật được đưa ra nhằm đáp ứng các yêu cầu trên, đó là
kỹ thuật mật mã (Cryptography) về sau phát triển thành bộ môn khoa học mật mã
(Cryptology). Đây là kỹ thuật được sử dụng để mã hoá dữ liệu nhằm biến đổi các dữ
liệu có nghĩa ban đầu thành các thông tin vô nghĩa đối với các đối tượng truy nhập
trái phép. Kỹ thuật này đã giải quyết được yêu cầu về an toàn dữ liệu. Cùng với lịch
sử phát triển của kỹ thuật mật mã, có một hướng tiếp cận khác tới vấn đề bảo vệ
thông tin, đó là kỹ thuật giấu tin (Steganography). Thay vì biến đổi nội dung, kỹ
thuật giấu tin tìm cách để "nhúng" thông tin vào một môi trường mang với mục đích
che giấu, làm cho đối phương không nhận biết được về sự có mật của thông tin này,
nói cách khác, đối phương không thể đưa ra một quyết định chắc chắn rằng trong
môi trường mang có giấu các thông tin. Để tăng thêm độ phức tạp đối với các truy
nhập thông tin trái phép, một xu hướng là kết hợp hai kỹ thuật mã hoá và giấu tin.
Trong trường hợp này, thông tin ban đầu ở dạng bản rõ sẽ được mã hoá bằng kỹ
thuật mật mã sau đó bản mã sẽ được "nhúng" vào môi trường mang nhờ kỹ thuật
giấu tin.
Các nghiên cứu [1,5,11,13,151 đã đề xuất nhiều loại môi trường mang tin khác
nhau, từ môi trường đơn giản như các file văn bản cho tới môi trường phức tạp hơn
là các file âm thanh, hình ảnh, video gọi chung là môi trường multimedia thậm chí
môi trường có thể là phần header của các gói tin TCP/IP Trong đó các file hình
ảnh (images) là môi trường được đề cập tới nhiều nhất, điều đó chứng tỏ đây sẽ là
một môi trường lý tưởng cho việc giấu các thông tin.
Giấu tin có một vai trò quan trọng trong việc bảo vệ thông tin, nó đảm bảo yếu
tố bí mật của thông tin. Để có thể tiếp thu và phát triển một lĩnh vực khoa học bổ ích
và mới mẻ này, vấn đề nghiên cứu về kỹ thuật giấu tin là một yêu cầu được đặt ra.
Xuất phát từ tính cấp thiết nêu trên, luận văn tốt nghiệp đã được thực hiện với
đề tài "Bảo mật thông tin trên cơ sở giấu tin trong ảnh". Đề tài nhằm thực hiện
nghiên cứu một số vấn đề liên quan tới kỹ thuật giấu tin và trình bày các kết quả

chính sau:
> Tim hiểu yêu cầu của bài toán bảo mật thông tin, từ đó trình bày hai hướng
tiếp cận chính tới bài toán này, đó là hướng tiếp cận theo cách mã hoá dữ
liệu, một số thuật toán mã hoá quan trọng; hướng tiếp cận thứ hai theo cách
giấu thông tin, các vấn đề quan trọng liên quan tới việc giấu thông tin.
> Từ cách tiếp cận thứ hai nêu trên, đề tài trình bày về kỹ thuật giấu tin trong
ảnh, các phương pháp chính hay được sử dụng của kỹ thuật giấu tin.
> Đưa ra các thuật toán giấu tin trong đó trọng tâm thuật toán xử lý trên ảnh
đen trắng và ảnh đa cấp xám là các loại ảnh hay được sử dụng để giấu tin vì
các lý do kích thước nhỏ, dung lượng giấu ở mức có thể chấp nhận, thích
hợp cho việc truyền trên mạng thông tin. Phân tích một thuật toán giấu tin
điển hình, đó là thuật toán giấu tin vào miền bit LSB.
> Đưa ra chương trình mô phỏng một kỹ thuật giấu tin trên ảnh đa cấp xám.
Bô cục của luận văn: ngoài các phần mở đầu, phụ lục, tài liệu tham khảo luận
văn được trình bày trong ba chương:
Chương 1: Tổng quan về bài toán bảo mật thông tin
7
Chương 2: Kỹ thuật giấu tin trong ảnh
Các chương có nội dung cụ thể như sau:
Chương 1: Tìm hiểu các phương pháp mã hoá dữ liệu, các thuật toán gồm hai
loại chính là: các thuật toán mã hoá dùng khoá bí mật và các thuật toán mã hoá
dùng khoá công khai. Việc giấu tin trong môi trường multimedia, lịch sử của quá
trình giấu thông tin. Phát biểu bài toán giấu thông tin trong môi trường multimedia.
Phân loại phương pháp giấu tin, tìm hiểu một số khái niệm và tính chất của kỹ thuật
giấu tin.
Chương 2: một số vấn đề liên quan tới ảnh môi trường: các mô hình mầu,
nguyên tắc lưu trữ ảnh trong môi trường số và cấu trúc của một số kiểu ảnh cơ bản.
Một mô hình tổng quát của quá trình giấu thông tin sẽ được trình bày. Giới thiệu
một số phương pháp giấu tin trong ảnh, gồm phương pháp sử dụng kỹ thuật LSB
(Least Significant Bít), phương pháp sử dụng các kỹ thuật xử lý ảnh (transform

techniques), phương pháp sử dụng kỹ thuật "mặt nạ giác quan" (perceptual
masking).
Chương 3: trình bày các thuật toán giấu thông tin, gồm: thuật toán giấu tin
trong khối bít, thuật toán giấu tin sử dụng kỹ thuật LSB. Phân tích kỹ thuật giấu tin
vào miền bit LSB, một kỹ thuật đơn giản hay được sử dụng, gồm các phần cụ thể:
giới thiệu kỹ thuật LSB thông qua "bài toán của người tù" (prisoner's problem), mô
lùnh thống kê của kỹ thuật LSB, tính toán khả năng giấu tin của kỹ thuật LSB.
Chương 3 cũng trình bày các hạn chế của kỹ thuật giấu tin và các tấn công đối với
kỹ thuật giấu tin và biện pháp khắc phục tấn công.
Phần phụ lục của luận văn trình bày cách cài đặt thuật toán giấu tin thông qua
chương trình mô phỏng kỹ thuật giấu tin trong ảnh.
Trong quá trình thực hiện đề tài, tác giả đã nhận được sự trợ giúp động viên
của nhiều người trong đó phải kể đến công sức đào tạo của các Thầy Cô giáo thuộc
Khoa Công nghệ -Đại học Quốc Gia Hà nội và Viện Công nghệ thông tin, sự động
viên tinh thần của các đồng nghiệp, bạn bè và gia đình. Đặc biệt tác giả xin được
bày tỏ sự cảm ơn sâu sắc tới PGS. TSKH Nguyễn Xuân Huy, người Thầy đã trực
tiếp hướng dẫn để mang lại kết quả của cuốn luận văn này.
8
Chương 3: Thuật toán giấu thông tin trong ảnh
TỔNG QUAN VỂ CÁC PHƯƠNG PHÁP BẢO MẬT THÔNG TIN
Từ khi phát sinh ra nhu cầu về bảo mật thông tin, loài người đã đưa ra nhiều
giải pháp khác nhau để phục vụ cho nhu cầu của mình. Với một cái nhìn hết sức
khái quát, cho tới nay có hai cách tiếp cận tới bài toán về bảo mật thông tin. ở cách
tiếp cận thứ nhất: chúng ta cố gắng biến đổi các thông tin của mình sao cho đối với
người muốn khai thác thì các thông tin bị biến đổi này hoàn toàn không có ý nghĩa.
Cách tiếp cận thứ hai là các thông tin nên được giấu vào môi trường sao cho dựa vào
hệ thống giác quan của mình con người không thể nhận thấy sự tổn tại của các
thông tin đồng thời cũng không cảm thấy sự biến đổi nhỏ của môi trường mang
thông tin.
Các nghiên cứu theo hướng tiếp cận thứ nhất hình thành nên phương pháp mã

hoá dữ liệu (Cryptology), con người đã tận dụng khả năng tính toán của máy tính và
đưa ra các thuật toán mã hoá để biến đổi dữ liệu về dạng vô nghĩa. Việc giải mã bất
hợp pháp nhằm lấy lại thông tin ban đầu (bản rõ) là hết sức khó khăn bởi các thuật
toán mã hoá được xây dựng dựa trên các bài toán có độ phức tạp cao. Trong khi đó,
các nghiên cứu theo cách tiếp cận thứ hai đi sâu vào việc tìm hiểu các kiểu môi
trường có thể sử dụng để giấu thông tin vào đó. Hướng tiếp cận này hình thành nên
kỹ thuật giấu tin (Steganography hay Data Hiding). Qua quá trình nghiên cứu, con
người đã tìm ra nhiều kiểu môi trường có thể sử dụng để giấu thông tin, chẳng hạn:
các file hình ảnh, âm thanh hay video [1,2], thậm chí có thể giấu thông tin vào tiêu
đề của các gói tin theo chuẩn TCP/IP truyền trên mạng [5].
Chương này sẽ trình bày khái quát về các phương pháp mã hoá dữ liệu và khái
niệm về giấu tin trong môi trường multimedia.
1.1. BẢO M ẬT THÔNG T IN DÙNG PHUƠNG PHÁP M Ã HOÁ DỮ LIỆU
Mã hoá dữ liệu là một giải pháp được sử dụng rất nhiều trong lịch sử về bảo
mật thông tin. Nhờ có mã hoá dữ liệu, các thông tin quan trọng được truyền trên
kênh truyền thông một cách an toàn, chống được các truy nhập không hợp lệ vào dữ
liệu. Trong lịch sử về mã hoá dữ liệu nhiều thuật toán mã hoá đã được giới thiệu và
được coi là chuẩn mực về mã hoá.
CHƯƠNG 1
Xét về phương thức phân phối khoá có thể phân chia các thuật toán mã hoá
thành hai loại: các thuật toán mã hoá sử dụng khoá bí mật và các thuật toán mã hoá
sử dụng khoá công khai. Chúng ta sẽ lần lượt tìm hiểu một cách khái quát vể các
thuật toán trên.
1.1.1. Thuật toán mã hoá sử dụng khoá bí mật
1.1.1.1. MãhoáDES
Một đại diện tiêu biểu cho phương pháp mã hoá dữ liệu sử dụng khoá bí mật là
phương pháp mã hoá dữ liệu cổ điển: mã DES
Để có thể mã hoá và giải mã, cả hai người lập mã và giải mã sử dụng chung
một khoá bí mật.
Giả sử X là thông tin cần mã hoá; y là kết quả của phép mã hoá; K là khoá bí

mật, ta có:
• Phép lập mã: E(x,K) => y
• Phép giải mã: D(y,K) = D(E(x,K),K) => X
Thuật toán DES sử dụng khoá có độ dài 56 bit (H 1.1), được mô tả như sau:
• Thông tin được chia thành từng khối 64 bit, thuật toán DES sẽ áp dụng
cho mỗi khối 64 bít này.
• Khối dữ liệu 64 bít được cho qua bộ hoán vị IP thứ nhất và cho kết quả
ở dạng bản rõ có độ dài 64 bít
• Kết quả của phép hoán vị được chia thành hai nửa LO và RO, mỗi nửa 32
bít được chạy qua 16 vòng lặp những phép toán giống nhau, trong đó dữ
liệu được kết hợp với khoá. Đến vòng cuối cùng ta đảo được R15, L15
10
• Thực hiện phép hoán vị ngược IP 1 cho kết quả của vòng lặp ta thu được
bản mã.
11
K,
U=R*
R1s=L1.ffitfinlK1á)
-&
U=R«
( jgĩ )
Bản mà
(H 1.1 Sơ đồ thuật toán mã hoá dữ liệu DES)
Độ bảo mật của thuật toán: do ở mỗi vòng lặp đều thực hiện xen kẽ liên tiếp
nhau các phép dịch bít và phép thay thế nên độ bảo mật của s được tâng thêm. Yếu
tô' phi tuyến duy nhất trong các phép toán của s là các hộp s (S1,S2, ,S8). Người ta
không biết các hộp đó được lựa chọn theo tiêu chuẩn nào, có cài các hàm “ cửa sập”
hay không?
1.1.12. Các cách dùng DES
Dựa trên tư tưởng của thuật toán DES chuẩn, tuỳ vào mục đích và đối tượng sử

dụng người ta có nhiều cách tuỳ biến để triển khai DES một cách phù hợp và có hiệu
quả. Dưới đây là một số phương pháp đã được đề xuất:
❖ Phương pháp ECB (Electronic Codebook Mode): ở phương pháp này,
bản rõ được chia thành từng khối x!x2 xn sau đó sử dụng khoá K để mã
hoá các khối đó. Kết quả cho bản mã yiy2 yn, với y^eKXXị).
❖ Phương pháp CFB (Cipher Feedback Mode): bản rõ được chia thành
từng khối x!x2 xn sau đó sử dụng khoá K để mã hoá các khối đó. Kết
quả cho bản mã yiy2 yn, với Yi = eKCXi©)',,!) V i>l.
• Phương pháp CBC (Cipher Block Chaining Mode) và OFB(Output
Feedback Mode): dùng DES để tạo ra một dòng từ khoá Zj sau đó lập
mã y = Xj®Zi (Í>1). Dòng khoá ZjZ2 trong CBC được xác định bởi:
Z()=IV (một véctơ khởi đầu 64 bít được chọn trước); Zi=eK(zM) (i>l).
Trong phương pháp OFB, dòng khoá ZịZ2 và dòng mã yiy2 được xác
định bởi: Z0=IV (một véctơ khỏfi đầu 64 bít chọn trước); zi=eK(yi.1)
(i>l); yi=Xj®Zi
Các phương pháp ECB và CBC được nhiều Ngân hàng sử dụng làm chuẩn mật
mã của mình trong khi các phương pháp CFB và OFB thường được sử dụng với mục
đích xác nhận.
1.1.2. Các thuật toán mã hoá sử dụng khoá công khai
1.1.2.1. Hệ RSA - Rivest Shamir Adleman
RSA được thiết kế dựa trên độ phức tạp của bài toán phân tích một số nguyên
tô' lớn ra các thừa số nguyên tố. RSA là hệ mật mã sử dụng khoá công khai, trong đó
người lập mã sử dụng khoá công khai để lập mã, khi nhận được bản mã, người giải
mã sẽ sử dụng khoá bí mật của mình để giải mã. Một đặc điểm của phương pháp
này là ngay bản thân người lập mã cũng không thể giải lại được bản mã do chính
bản thân mình lập vì không có khoá giải mã.
Mô tả hệ RSA: chọn p và q là 2 số nguyên tố lớn, tất nhiên phải giữ bí mật cặp
số này
Tính n = p*q
p = c = z n

K = Ị(n, b, a): ab = lmod<ĩ>(n)}
trong đó (n, b) là khoá công khai sử dụng để lập mã, a là khoá bí mật sử dụng
để giải mã.
Với K = (K \K ” ), K ’=(n,b), K” =a, ta có các phép lập mã và giải mã như sau:
• Phép lập mã: eK. (x) = xb mod n
• Phép giải mã: dK" (y) = ya mod n
12
13
Khi lựa chọn a và b, ta cần chú ý mối quan hệ giữa chúng:
ab = 1 mod <£>(n), hay:
b = a'1 mod O(n)
Nếu chọn a không nguyên tố cùng nhau với O(n) thì phương trình:
b = a 1 modO(n) vô nghiệm, mặt khác việc lựa chọn phải thoả mãn mối quan
hộ trên thì khi giải mã mới có thể thu được bản gốc.
Độ bảo mật của thuật toán RSA: chúng ta dễ thấy độ an toàn của thuật toán
chính là việc giữ bí mật được khoá a khẳng định rằng việc tìm a khi biết (n,b) tương
đương với bài toán phân tích một số nguyên tố lớn n ra các thừa số nguyên tố p*q
1.1.2.2. Hệ mật mã công khai Rabin
Hệ mật mã Rabin được tác giả đề xuất năm 1979, hệ được mô tả như sau:
Chọn p và q là 2 số nguyên tố lớn
Tính n = p*q
p = c = z n
Khoá K = Ị(n, B, p, q): o <B< n-1}
K gồm 2 phần: khoá cổng khai k' = (n,B) và khoá bí mật k"=(p,q)
Ta định nghĩa các phép lập mã và giải mã:
• Phép lập mã: ek'(x) = x(x+B) mod n
Khi chọn p và q chúng ta cần chú ý điều kiện ràng buộc: p,q = 3 (mod4). Sở dĩ
chọn như vậy để bảo đảm cho p+1, q+1 = 0 mod 4, điều này cho phép ta giải mã
được rễ ràng.
1.1.2.3. H ệ m ật m ã EỈGam a l

Hệ mật ElGamal được thiết kế dựa trên độ khó của bài toán tính logarit rời rạc
của một số nguyên tố lớn.
Cho p là 1 số nguyên tố, a là 1 phần tử nguyên thuỷ của z*p
Đặt:
P = z*p
c = z*p X z \
K = Ị(p, a, ß, a): ß = aa mod p}
Với K = (p, a, ß, a) e k, khoá công khai là K ’ = (p, a, ß); khoá bí mật là a
• Phép lập mã:
> Chọn ngẫu nhiên một số k, k e Z*P_1 và giữ bí mật k
> Tính: eK.(x,k) = (yb y2) trong đó:
> yj = ak mod p
> y2 = xßk mod p
• Phép giải mã: dK (y) = y2(yia)'1 mod p
Phép giải mã được thực hiện như sau:
dK(eK(x)) = y iíy iT ' = xßK[(cxK)a] ‘ = xßK(aaV (*)
Với ß = aa ta có (* ) = xaaK(aaK) ' = X mod p
Việc chọn các KeZp.! khác nhau sẽ cho ta các bản mã khác nhau.
1.2. GIẤU TIN TRONG M Ô I TRƯỜNG M U LTIM E D IA
Như đã giới thiệu, giấu thông tin là một hướng mới trong lĩnh vực bảo mật
thông tin. Khác với mã hoá dữ liệu, kỹ thuật giấu tin không làm thay đổi cấu trúc
của dữ liệu cần giấu mà chỉ tìm cách "nhúng” chúng vào môi trường sao cho không
làm biến đổi chất ỉượng của môi trường, hơn nữa bằng tri giác của mình, con người
không cảm nhận được sự tổn tại của các thông tin giấu. Nghiên cứu một kiểu môi
trường giấu tin là công việc hết sức quan trọng, chỉ khi chúng ta hiểu một cách toàn
diện về các đặc điểm của môi trường từ đó tìm ra các vị trí giấu tin hợp lý thì kỹ
thuật giấu tin mới có thể thực hiện có hiệu quả.
14
Để có một cái nhìn tổng quát về kỹ thuật giấu tin, chúng ta sẽ lần lượt nghiên
cứu các vấn đề về lịch sử giấu thông tin, các khái niệm liên quan tới phương pháp

giấu tin trong môi trường multimedia, phân loại các kỹ thuật giấu tin.
1.2.1. Lịch sử giấu thông tin
Trong lịch sử về giấu thông tin có nhiều kỹ thuật giấu tin đã được giới thiệu, có
những phương pháp đơn giản và cũng có những phương pháp phức tạp. Có thể tóm
tắt một số trong các kỹ thuật đó như sau:
1.2.1.1. Kỹ thuật "Lựa chọn từ thông minh" (Cleverly-Chosen Words) ÍỊ_,6J
Thông tin bí mật được cài vào trong đoạn văn bản sao cho đoạn văn đó vẫn có
ý nghĩa. Bằng cách lấy ra các từ trong văn bản đó theo một quy tắc nhất định và
ghép chúng lại với nhau ta thu được thông tin bí mật ban đầu, ví dụ từ đoạn văn bản:
"To human eyes, data usually contains known forms, like images, e-mail,
sounds, and text. Most Internet data naturally includes gratuitours headers, too.
These are media exploited using new controversial logical encoding: steganography
and marking” ¡221
Bằng cách lấy ra các ký tự thứ nhất trong mỗi từ, ghép chúng lại và thêm một
số dấu cách thích hợp chúng ta được một thông tin: "The duck flies at midnight.
Tame uncle sam".
Một ví dụ khác:
"News Eight Weather: Tonight increasing snow. Unexpected precipitation
smothers eastern towns. Be extremely cautious and use snowtires especially heading
east. The highways are knowingly slippery. Highway evacuation is suspected.
Police report emergency situations in downtown ending near Tuesday" [6]
Bằng cách lấy ra các ký tự thứ 1 trong mỗi từ và ghép chúng lại, chúng ta được
câu: "Newt is upset because he thinks he is President".
15
1.2.1.2. Kỹ thuật sử dụng mực không màu ịInvisible Ink) iU
Từ xa xưa con người đã biết tận dụng những chất có sẵn trong tự nhiên (chẳng
hạn nước quả, nước tiểu hay sữa ) để làm ra loại mực đặc biệt. Người ta đã sử dụng
loại mực đặc biệt này để viết xen các thông báo bí mật vào giữa những hàng chữ của
một văn bản bình thường. Dưới điều kiện bình thường bằng mắt thường không thể
nhìn thấy các dòng chữ được viết bằng loại mực này nhưng khi bị tác động dưới một

môi trường khác như bị hơ nóng (điều kiện nhiệt độ) hay bị nhúng nước (điều kiện
độ ẩm) thì loại mực này trở nên có màu và có thể đọc được các thông tin ẩn trong
văn bản.
Trong thời gian chiến tranh Thế giới II, mực không màu được sử dụng một
cách rất có hiệu quả cho việc bảo mật thông tin.
1.2.1.3. Kỹ thuật điều chỉnh khoảng cách văn bản (Modulation of Lines or
Word Spacing) iU
Kỹ thuật giấu thông tin được thực hiện thông qua việc điều chỉnh khoảng cách
và vị trí các dòng hay các từ trong văn bản. Qua việc điều chỉnh này, các thông tin
được gắn vào hay lấy ra từ văn bản.
Ngày nay với sự phát triển mạnh của lĩnh vực kỹ thuật số, có nhiều kỹ thuật
giấu tin hiện đại đã được nghiên cứu và áp dụng rộng rãi trong các lĩnh vực của đời
sống. Môi trường để giấu thông tin cũng không còn đơn giản như các phương pháp
truyền thống nữa, ngày nay người ta đã có thể giấu thông tin vào các môi trường
hình ảnh, âm thanh hay video gọi chung là môi trường multimedia. Điều đó đã mở
ra một hướng phát triển mới cho lĩnh vực nghiên cứu về các kỹ thuật giấu thông tin.
1.2.2. Bài toán giấu thông tin trong môi trường multimedia
Bài toán giấu tin có thể được phát biểu như sau:
Nhúng một dữ liệu (gọi là dữ liệu giấu) vào một môi trường (gọi là dữ liệu môi
trường hay dữ liệu mang) sao cho bâng các giác quan của mình con người không
nhận biết được sự tồn tại của dữ liệu giấu và mà không làm thay đổi định dạng, tính
16
chất của môi trường. Việc lấy lại một cách chính xác các dữ liệu giấu có thể thực
hiện nhờ các công cụ.
1.2.3. Phân loại phương pháp giấu tin, một sô khái niệm và tính chất
Có nhiều cách để phân loại các phương pháp giấu tin, nhìn chung mỗi cách
phân loại này cũng chỉ mang tính tương đối. Theo mỗi thời điểm, mỗi tác giả có một
cách phân loại riêng.
Năm 1999, Fabien A. p. Petitcolas [8] đã đưa ra một sơ đổ phân loại một cách
khái quát kỹ thuật giấu tin (H 1.2).

17
H 1.2 Phân loại lĩnh vực giấu thông tin
Theo sơ đồ của Fabien A. p. Petitcolas, kỹ thuật giấu dữ liệu bao gồm hai
hướng chính là watermark và steganograph: kỹ thuật watermark được phát triển với
yêu cầu giải quyết vấn đề về độ bền vững của thông tin cần giấu khi môi trường bị
các biến đổi tác động lên. Kỹ thuật steganograph tập chung giải quyết vấn đề về
dung lượng giấu. Đối với từng hướng lớn này, quá trình phân loại theo các tiêu chí
khác có thể tiếp tục được thực hiện, ví dụ dựa theo ảnh hưởng các tác động từ bên
ngoài có thể chia watermark thành hai loại, một loại bền vững với các tác động sao
trước các tác động nói trên. Cũng có thể chia watermark theo đặc tính, một loại cần
được che dấu để chỉ có một số những người tiếp xúc với nó có thể thấy được thông
tin, loại thứ hai đối lập, cần được mọi người nhìn thấy (H 1.3).
18
H 1.3 Các phương pháp thuỷ vân khác nhau
1.2.3.1. Th uỷ vân (Watermark)
Cùng với sự phát triển của kỹ thuật máy tính và mạng máy tính, thế giới số đưa
lại cho con người một tiềm năng và lợi ích vô cùng to lớn. Tuy nhiên, kỹ thuật sao
chép bất hợp pháp cũng được phát triển ỉà một sự đe dọa nghiêm túc tới quyền lợi
của những chủ nhân nội dung hợp pháp. Cho đến thời gian gần đây, mã hóa là công
cụ duy nhất có thể giúp đỡ việc bảo vệ bản quyền chính. Mã hóa cho phép bảo vệ
nội dung trên đường truyền dữ liệu từ người gửi đến người nhận. Tuy nhiên, sau khi
được giải mã thì thông tin về bản quyền của nội dung không còn được bảo vệ và
không ít sự vi phạm thậm chí tranh chấp bản quyền cũng bắt đầu từ đây.
Thuỷ vân số (Data watermark) là kỹ thuật giấu một thông tin trực tiếp vào nội
dung một thông tin khác, theo một cách nào đó để người quan sát bình thường
không cảm nhận được, nhưng dễ dàng được phát hiện ra bởi các chương trình máy
tính. Lợi thế thiết yếu của điều này là nội dung thông tin được giấu không thể tách
rời ra khỏi môi trường. Điều này giúp cho watermark có ứng dụng rộng rãi trong các
hướng chủ yếu như:
1) "Chữ ký số" của chủ nhân nội dung. Thông tin này được sử dụng bởi

chủ nhân hợp pháp để sao chép hoặc xuất bản lại nội dung. Trong tương lai, nó có
thể còn được sử dụng để giúp đỡ giải quyết tranh chấp bản quyền.
2) "Điểm chỉ số" của chủ nhân hợp pháp. Watermark có thể cũng sử
dụng để xác định những người mua nội dung hợp pháp. Các thông tin về chủ nhân
hợp pháp được cấy trong dữ liệu và được các thiết bị tự động phát hiện ra vào lúc
cần thiết.
3) Phát hành và quảng bá: Watermark xác định chủ nhân của nội dung,
nhưng ở đây thông tin này được phát hiện một cách tự động bởi hệ thống thiết bị
truyền hình, radio quảng bá, mạng máy tính và những kênh phân phối khác. Dưới sự
trợ giúp của thiết bị, nội dung thông tin giấu sẽ được xuất hiện đúng chỗ và đúng
lúc. Điều này giúp cho chủ nhân nội dung khẳng định rằng sản phẩm của họ không
bị phân tán bất hợp pháp, hoặc theo dõi sự phân tán của sản phẩm Nó cũng được
sử dụng trong quảng cáo: người thuê quảng cáo được đảm bảo nội dung quảng cáo
của họ sẽ được xuất hiện đúng lúc và đúng chỗ.
4) Xác thực: ở đây watermark mã hóa và giấu thông tin để khẳng định
rằng nội dung thông tin môi trường là xác thực. Nó phải được thiết kế sao cho nội
dung thông tin giấu tồn tại trước bất kỳ sự thay đổi hợp lệ nào của nội dung thông
tin môi trường, hoặc dễ dàng phát hiện ra các ý đồ cố tình phá huỷ nội dung thông
tin. Nếu watermark có mặt, và đúng mức phù hợp với nội dung, thì người dùng nội
dung là hợp pháp hoặc có bảo hiểm.
5) Thông tin về quyền sử dụng và sao chép hợp lệ: Watermark chứa đựng
thông tin về những phương pháp sử dụng, phân phối, các quy tắc sao chép hợp lệ do
chủ nhân nội dung quy ước.
Các tính chất của watermark
Một trong những đặc trưng quan trọng của watermark là khả năng tồn tại sau
các biến dạng thông thường của môi trường, khả năng chống lại sự tấn công, có thể
cùng tồn tại với những watermark khác, và yêu cầu một thuật toán tốt theo nghĩa độ
phức tạp tính toán nhỏ, nhất là giai đoạn hồi phục thông tin. Sự quan trọng tương đối
của những đặc trưng này nói chung phụ thuộc vào các ứng dụng cụ thể. Dưới đây là
các tính chất chung của watermark:

Tính Trung thực (Fidelity): Watermark phải không gây ra bất kỳ sự chú ý
không mong muốn nào cũng như không làm giảm chất lượng của tệp dữ liệu mồi
trường. Đặc biệt, dữ liệu watermark trước và sau quá trình nén và giải nén phải
không được khác nhau.
19
Những công trình đầu tiên nghiên cứu về watermark thường chỉ tập trung vào
việc thiết kế những watermark có tính "không cảm nhận được" và bởi vậy thường
đật watermark vào những vùng "không quan trọng" như những vùng tần số cao trong
các tệp âm thanh hoặc các bít có trọng số thấp trong các tệp ảnh. Những mâu thuẫn
đã nói đến trên đây đặt tính "không cảm nhận được" trước mâu thuẫn với các tính
chất khác, đặc biệt là "tính bền vững'' sẽ được trình bày dưới đây.
Tính bền vững: (Robust) Những tệp âm nhạc, hình ảnh và video đều có thể
trải qua nhiều kiểu biến dạng khác nhau. Có rất nhiều nguyên nhân dẫn tới khả năng
tổn hao thông tin mà việc nén có tiêu hao đã đề cập chỉ là một. Có thể lấy các ví dụ
như việc thay đổi độ tương phản của các tệp video, việc điều chỉnh âm sắc cho các
tệp âm thanh v.v Một watermark phải đủ bển vững trước những biến đổi thông
thường như vậy. Tính bền vững được thể hiện: watermark vẫn còn hiện hữu trong dữ
liệu sau các biến dạng thông thường và các công cụ đọc watermark có thể phát hiện
ra nó một cách dễ dàng.
Tính dễ vỡ (Fragility): Trong một số ứng dụng mặt đối diện của tính bền vững
đã đề cập ở trên lại được quan tâm. Ví dụ các watermark trong cổ phiếu, tiền hay
hoá đơn và các giấy tờ quan trọng phải được phá hủy trong mọi bản sao bất hợp lệ.
Thuộc tính này của watermark được gọi là tính "dễ vỡ".
Một watermark cần được phá hủy bởi một số phương pháp sao chép nhưng lại
cần bền vững trong một số phương pháp khác. Lấy ví dụ, một watermark đật trong
một văn bản hợp pháp cần phải tổn tại trước bất kỳ một sự sao chép nào đó mà
không thay đổi nội dung và hình thức của văn bản, nhưng được phá hủy ngay, cho
dù chỉ một dấu chấm câu của văn bản bị di chuyển.
Khả năng chống giả mạo (Tamper-resistance): Yêu cầu này được hiểu là khả
năng kháng cự trước mọi dự định nhằm loại bỏ và thay thế chúng, ngoài nghĩa bền

vững chống lại những sự biến dạng tín hiệu trong các xử lý bình thường. Tuy nhiên,
đây là một yêu cầu vô cùng khó khăn. Một tấn công đạt hiệu quả trên một
watermark là phải loại bỏ watermark mà không thay đổi chất lượng của dữ liệu vỏ.
Phụ thuộc khóa (Key restrictions): Một tính chất quan trọng của watermark là
sự phân biệt theo giới hạn khả năng truy cập. Các giải thích, thông báo mô tả trong
watermark phải sẵn sàng được phát hiện bởi càng nhiều cơ chế dò tìm watermark
càng tốt. Ngược lại, những watermark phục vụ mục đích riêng tư như chữ ký số,
20
đánh dấu bản quyền v.v. lại cần được che đậy ở một mức nhất định nào đó. Người ta
phân biệt sự khác nhau đó bởi mức độ giới hạn của khóa và phân chia watermark
thành watermark khóa không giới hạn và watermark khóa hạn chế. Dĩ nhiên một
giải thuật khóa không giới hạn phải kháng cự trước một sự tấn công quyết liệt hơn
một giải thuật khóa hạn chế.
Biên thể và watermark kép (Modification and multiple watermark): Trong
đa số các ứng dụng cần thiết phải có sự phân biệt giữa dữ liệu có chứa watermark và
dữ liệu không chứa watermark. Lỗi phát hiện sai của hệ thống dò tìm watermark là
xác suất mà nó xác định nhầm một mảnh dữ liệu không chứa watermark thành có
chứa một watermark. Mức độ nghiêm trọng của một lỗi như vậy phụ thuộc vào các
ứng dụng cụ thể. Trong một số ứng dụng, lỗi này có thể là thảm họa, ví dụ trong
việc điều khiển chống sao chép cho đĩa DVD; thiết bị sẽ từ chối chơi video từ một
đĩa nó tìm thấy một watermark nói rằng dữ liệu không được phép sao chép. Những
lỗi như vậy hiếm khi xảy ra, tuy nhiên nếu có, nó sẽ để lại một ảnh hưởng nghiêm
trọng tới thị trường của các nhà sản xuất và phát hành. Những dự chi ngân sách hàng
triệu đô la đang được dành cho các công ty thiết kế phương pháp watermark có xác
suất sai nhầm nhỏ.
Sự chiếm chỗ (Data payload): về căn bản, dữ liệu chiếm chỗ của watermark
là số lượng của thông tin mà nó chứa đựng. Cũng như bất kỳ phương pháp lưu giữ
dữ liệu nhị phân khác, để có được 2N thông báo khác nhau cần phải có N bit. So N
càng nhỏ càng ít chiếm chỗ trong tệp dữ liệu vỏ và hiển nhiên càng ít ảnh hưởng tới
chất lượng tệp dữ liệu vỏ. Điều này có vẻ đơn giản, nhất là đối với các ứng dụng

watermark mang tính riêng tư, tuy nhiên rất phức tạp trên quy mô watermark công
cộng, khi mà số lượng các hãng phát hành ngày càng tăng, việc đưa ra các chuẩn
hợp lý và có khả năng tồn tại lâu dài là rất khó khăn.
Chi phí tính toán (Computational cost): Chi phí này xảy ra cả trong quá trình
chèn và phát hiện watermark. Tuy nhiên chi phí của phát hiện watermark thường
quan trọng hơn, đặc biệt là việc phát hiện ra watermark trong các ứng dụng video
thời gian thực hoặc âm thanh.
Tính tiêu chuẩn (Standards): Trong công nghệ watermark có những ứng dụng
cần được tiêu chuẩn hóa để sử dụng được trong phạm vi toàn cầu, ví dụ tiêu chuẩn
21
cho watermark DVD. Hệ thống bảo vệ chống sao chép dựa vào watermark được tích
hợp ngay vào thiết bị đọc đĩa.
Độ tin cậy (Reliability): Thiết bị cứng hoặc phần mềm có khả năng phát hiện
thông tin che giấu được gọi là bộ dò tìm. Gọi "lỗi phát hiện sai" là xác suất phát hiện
sai nhầm các thông tin che dấu. Thống kê cho thấy các bộ dò tìm thường mắc phải
lỗi sau:
> Bộ dò tìm phát hiện thấy tín hiệu watermark trong một môi trường không
giấu thông tin. Người ta nói bộ dò tìm có lỗi sai dương tính (false positive
error).
> Ngược lại với trường hợp nói trên, nếu bộ dò tìm không phát hiện được tín
hiệu watermark trong một môi trường có giấu thông tin người ta nói bộ dò
tìm có lỗi sai âm tính (false negative error).
> Trường hợp phát hiện được tín hiệu watermark nhưng sai nội dung người ta
nói bộ dò tìm có lỗi sai bit.
Một bộ dò tìm được gọi là có độ tin cậy cao nếu như nó ít mắc phải các lỗi
trên đây.
ỉ.2.3.2. Giấu tin (Steganugraph)
Steganograph - giấu một thông tin vào một thông tin khác. Đó là một phương
pháp phần nào tương tự với truyền thông qua kênh thông tin bí mật, truyền thông an
toàn bằng kỹ thuật trải phổ Một thông báo bị mã hoá có thể khơi dậy sự hoài nghi

trong khi một thông tin bị che đậy thì tránh được điều đó.
Định nghĩa
Từ steganograph nghĩa ỉà “ viết bí mật” , bắt nguồn từ tiếng Hy-Lạp. Nó bao
gổm cả một lĩnh vực rộng của những phương pháp truyền thông bí mật mà thông tin
được giấu chính trong sự tồn tại của một thông tin khác. Có thể liệt kê ra các phương
pháp cổ điển, như sử dụng mực không mầu, lựa chọn từ thông minh, xắp xếp lại ký
tự (khác với hoán vị và thay thế trong kỹ thuật mật mã), dàn trang, kênh truyền
thông bí mật, kỹ thuật thông tin trải phổ
22
Steganograph là nghệ thuật và khoa học của truyền thông bên trong một truyền
thông. Khác với mật mã, nơi mà người mã thám có được bản mã và có thể giải mã,
mục đích của steganograph là che giấu những thông báo bên trong những thông báo
khác mà không làm ảnh hưởng đáng kể đến thông báo này; và, bằng một cách thức
nào đó sao cho người không có thẩm quyền không thể phát hiện hoặc phá huỷ
chúng.
Các đặc điểm của kỹ thuật giấu thông tin
Khả năng (dung lượng) giấu (Hiding Capacity): Khả năng giấu tin được đánh
giá theo mối liên quan giữa lượng thông tin có thể giấu được với kích thước của môi
trường. Một khả năng giấu cao cho phép sử dụng một môi trường với kích thước nhỏ
để giấu một lượng thông tin nhất định. Điều này cho phép giảm được dung lượng
của đường truyền khi truyền ảnh kết quả trên mạng.
Tính trong suốt đối với tri giác (Perceptual Transparency): Việc giấu thông
tin vào ảnh nguồn đòi hỏi phải có một số nhiễu hoặc méo của ảnh nguồn. Điều này
có thể giải thích như sau: việc giấu thông tin được thực hiện bằng cách thay đổi giá
trị một số các bít không quan trọng, điều này có thể gây ra một chút nhiễu cho ảnh
môi trường. Nếu môi trường ban đầu hoàn toàn không có nhiễu thì việc giấu tin coi
như thất bại, ngược lại các nhiễu được tạo ra sau khi giấu thông tin sẽ không phân
biệt được với các nhiễu vốn có sẩn của môi trường, chính tính trong suốt được thể
hiện ở điểm này.
Tính bền vững (Robustness): Tính bền vững thể hiện qua việc các thông tin

giấu không bị thay đổi khi ảnh môi trường bị tác động bởi các phép xử lý ảnh như:
> Các phép lọc tuyến tính, lọc phi tuyến
> Phép cộng nhiễu
> Các phép làm sắc nét hoặc làm mờ
> Phép biến đổi tỷ lệ
> Phép quay ảnh
> Phép nén có mất thông tin
23
> Các phép chuyển đổi từ ảnh số sang ảnh tương tự và ngược lại (chẳng hạn
việc in một ảnh có giấu thông tin sau đó dùng máy quét ảnh để quét lại ảnh
đó)
Tính bền vững rất quan trọng trong việc bảo vệ bản quyền dùng watermark vì
người vi phạm bản quyền sẽ tìm cách lọc và huỷ bỏ các watermark được nhúng
trong ảnh. Hiện đã có các phần mềm chống lại watermark thực hiện việc loại bỏ các
watermark một cách có hiệu quả [10,11], thậm chí kỹ thuật này còn có thể loại bỏ
được cả những thông tin nhúng trong ảnh rS l,S2Ị.
Khả năng chống giả mạo (Tamper-resistance): khả năng chống giả mạo nói
tới sự khó khăn khi đối phương định thay thể hoặc làm giả mạo một thông tin nhúng
trong ảnh, chẳng hạn khi người vi phạm bản quyền thay thế một dấu bản quyền của
người khác bằng một quyền sở hữu hợp lệ của mình. Một ứng dụng đòi hỏi có tính
bền vững cao thường cũng đòi hỏi khả năng mạnh chống giả mạo.
Một sô đặc điểm khác: Kỹ thuật giấu tin còn một số đặc điểm khác nữa,
chẳng hạn việc mã hoá và giải mã đòi hỏi tính toán phức tạp. Ngoài ra một số đặc
điểm còn tuỳ theo các yêu cầu đối với từng ứng dụng độc lập.
David Kahn đã so sánh về những phương pháp tấn công được sử dụng giữa
steganograph và mật mã (B 1.1), ở đây Signal Security được định nghĩa như những
phương pháp bảo vệ thông tin, còn Signal Intelligence được định nghĩa như những
phương pháp khôi phục thông tin [9]:
24
Signal Security

Bảo mât tín hiêu
Signal Intelligence
Khôi phục tín hiệu
Communication Security
Bảo mật thông tin
Communication Intelligence
Khôi phục thông tin
Steganography (invisible inks, open codes,
messages in hollow heels) and Transmission
Security (spurt radio and spread spectrum
systems)
Giấu thông tin và truyền thông bí mật
Interception and direction-
finding
Khám phá phát hiện
Cryptography (codes and ciphers)
Mật mã (mã hoá và mật mã)
Cryptanalysis
Mã thám
Traffic security (call-sign changes, dummy
messages, radio silence)
Truyền thông an toàn
Traffic analysis (direction-
finding, message-flow studies,
radio finger printing)
Phân tích thông tin truyền thông
Electronic Security
Bảo mât điên tử
Electronic Intelligence
25

Emission Security (shifting of radar
frequencies, spread spectrum)
Phát sóng bí mật
Electronic Reconnaissance
(eaves-dropping on radar
emissions)
Nhận dạng sóng bí mật
Counter-Countermeasures "looking through"
(jammed radar)
Gây nhiễu
Countermeasures (jamming
radar and false radar echoes)
Biện pháp đối phó
(B 1.1 Bảo vệ và khôi phục thông tin)
Một sô'phần mềm thương mại cung cấp dịch vụ steganograph
Những phần mềm sau đã được thử nghiệm cho việc giấu dữ liệu trong ảnh:
Hide and Seek v4.1, StegoDos v0.90a, White Noise Storm, và S-Tools for Windows.
Gần như tất cả các tác giả đều mã hóa thông tin trước khi giấu chúng trong ảnh như
một lớp bổ sung của sự bảo vệ và xem lại những ảnh gốc sau khi chúng được nhúng
dữ liệu. Thậm chí với phần mềm đáng tin cậy nhất qua kiểm tra cũng có một số kết
quả bất ngờ.
Hide and Seek v4.1
Hide and Seek v4.1 (và 5.0) được viết bởi Colin Maroney chạy trên DOS giới
hạn chỉ sử dụng những ảnh kích thước nhỏ (320 X 480). Trong phiên bản 1.0 cho
Windows 95 vấn đề kích thước đã giải quyết và có thêm nhiều công cụ steganograph
cải tiến.
Hide and Seek 4.1 là phần mềm miễn phí (kèm cả mã nguồn) dùng để nhúng
thông tin vào dữ liệu ảnh GIF. Phần mềm này sử dụng các bít trọng số nhỏ (LSB)
làm nơi chứa dữ liệu. Dữ liệu trước khi giấu được mã hóa và vị trí giấu được chọn
theo quy luật giả ngẫu nhiên.

StegoDos
StegoDos v0.90a được viết bởi một nhóm người giấu tên (bí danh Black Wolf),
nó chạy trên DOS, khó và phức tạp khi sử dụng. StegoDos chỉ làm việc với ảnh
320x200x256 màu.
White Noise Storm
White Noise Storm được viết bởi Arachelian (Arsen) là một ứng dụng
steganograph rất linh hoạt. Công việc nhúng được thực hiện đơn giản và hầu như
không có sự giảm phẩm chất nào có thể được phát hiện bằng mắt thường.
Jpeg-Jsteg v4
Phần mềm này chỉ được áp dụng cho các loại tệp chỉ chịu nén không tổn hao
thông tin, với các loại ảnh nén có tổn hao thông tin chẳng hạn các tệp ảnh JPG thì
dường như không thể thực hiện steganograph. Phần mềm Jpeg - Jsteg với mã nguồn
và những chỉ dẫn để biên tập các ứng dụng giấu thông tin dựa trên nhiều nền tảng
khác nhau.
Stealth v ỉ. 1
Stealth được viết bởi Henry Hastur là một công cụ giúp tước bỏ các thông tin
đầu mục (header) và chỉ để lại bản dữ liệu đã mã hóa. Stealth cung cấp khả năng
giấu header vào chính nội dung bản mã.
Giấu thông tin có vị trí quan trọng trong lĩnh vực an toàn và bảo mật thông tin.
Nó không và không bao giờ thay thế mật mã nhưng hỗ trợ rất tốt cho mật mã. Việc
che giấu một thông báo với những phương pháp của steganography giảm bớt cơ hội
cho việc phát hiện ra một thông báo. Tuy nhiên, nếu thông báo đó cũng đã được mã
hóa, nếu được khám phá, thì đây mới là thời điểm bắt đầu của quá trình phá mã. Có
rất nhiều ứng dụng và phương thức của steganography: dữ liệu được giấu có thể là
bất kỳ dạng số hóa nào: ảnh, âm thanh số, văn bản Môi trường dùng để giấu cũng
phong phú: ảnh, video số, âm thanh số và ngày càng tìm ra nhiều môi trường mới
hơn.
26
27
CHƯƠNG 2

KỸ THUẬT GIẤU TIN TRONG ẢNH
Như đã giới thiệu ở chương 1, môi trường để có thể giấu thông tin rất phong
phú. Chúng ta có thể giấu thông tin vào các tệp hình ảnh, âm thanh hay video và các
loại môi trường khác nữa chẳng hạn ta có thể giấu thông tin vào phần header của các
gói tin theo chuẩn TCP/IP truyền trên mạng [5], Chương này sẽ nghiên cứu một số
vấn đề về kỹ thuật giấu tin trong ảnh, một loại môi trường điển hình hay được sử
dụng để giấu thông tin.
Các nội dung sau sẽ được nghiên cứu ở chương 2: một số kiến thức liên quan
tới ảnh môi trường, mô hình tổng quát của quá trình giấu thông tin; giới thiệu khái
quát về các phương pháp giấu tin trong ảnh.
2.1 M Ộ T SỐ VẤN ĐÊ LIÊN Q UAN TỚI ẢNH M ÔI TRƯỜNG
Một yêu cầu quan trọng trong kỹ thuật giấu tin là cần có những kiến thức nhất
định về môi trường sẽ được sử dụng để giấu thông tin bởi vì bản chất của quá trình
giấu tin chính là công việc phân tích môi trường để tìm ra các phương thức và vị trí
để nhúng thông tin vào một cách có hiệu quả [JJ. Với môi trường đang được xét là
ảnh số, chúng ta cần có những kiến thức nhất định về các vấn đề sau: thứ nhất là
kiến thức về màu sắc, độ sáng thể hiện trong ảnh, thứ hai là cấu trúc của ảnh môi
trường. Lý do cho vấn đề thứ nhất thật đơn giản: ảnh là đối tượng mà con người cảm
nhận được thông qua hệ thống thị giác, các yếu tố màu sắc và độ sáng tác động trực
tiếp tới thị giác của chúng ta trong quá trình cảm nhận. Đối với vấn đề thứ hai, các
thuật toán cần tìm được miền ảnh thích hợp cho việc giấu tin, đối với mỗi loại ảnh
có một cấu trúc khác nhau, việc hiểu biết về các kiểu cấu trúc ảnh sẽ giúp chúng ta
thiết kế được những thuật toán tối ưu.
2.1.1 Mô hình mầu
Như chúng ta đã biết, mầu sắc có một số các yếu tố cơ bản sau:
• Hue : là yếu tố để phân biệt các màu với nhau chẳng hạn: màu đỏ khác
với màu xanh

×