Tải bản đầy đủ (.pdf) (77 trang)

nghiên cứu kỹ thuật dấu tín dùng data hiding kết hợp với hệ mã aes

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.95 MB, 77 trang )



MỞ ĐẦU
Công nghệ Data hiding và mã hóa, với công nghệ này chúng có thể truyền tin
cho mọi ngƣời trên các phƣơng tiện đại chúng mà không bị phát hiện. Cuộc cách mạng
thông tin kỹ thuật số đã đem lại những thay đổi sâu sắc trong xã hội và trong cuộc
sống của chúng ta. Những thuận lợi mà thông tin kỹ thuật số mang lại cũng sinh ra
những thách thức và cơ hội mới cho quá trình đổi mới. Mạng internet toàn cầu đã biến
thành một xã hội ảo nơi diễn ra quá trình trao đổi thông tin trong mọi lĩnh vực chính
trị, quân sự, quốc phòng, kinh tế, thƣơng mại…Và chính trong môi trƣờng mở và tiện
nghi nhƣ thế xuất hiện những vấn nạn, tiêu cực đang rất cần đến các giải pháp hữu
hiệu cho vấn đề an toàn thông tin nhƣ nạn xuyên tạc thông tin, truy nhập thông tin trái
phép, v.v Đi tìm giải pháp cho những vấn đề này không chỉ giúp ta hiểu thêm về công
nghệ phức tạp đang phát triển rất nhanh này mà còn đƣa ra những cơ hội kinh tế mới
cần khám phá.
Trải qua một loạt giai đoạn phát triển , data hiding và mã hóa ngày này càng trở lên
tinh vi hơn cùng với sự phát triển của computer. Với môi trƣờng mạng mở, có rất
nhiều loại thông tin, trong đó có các thông tin quí giá mà bạn không thể để ngƣời khác
biết đƣợc. Hiện nay cuộc chiến với các cracker vẫn chƣa ngã ngũ, và có lẽ sẽ chẳng
bao giờ ngã ngũ thì việc dùng các phƣơng pháp mã hóa sẽ khiến cho những tên
cracker sẽ để ý đến thông tin của bạn, và tất nhiên chúng sẽ tìm mọi cách để crack, vì
vậy sẽ chẳng có gì là đảm bảo thông tin của bạn sẽ đƣợc an toàn. Với công nghệ data
hiding bạn có thể dấu một bài thơ tình vào một bức ảnh nhƣ bác anaconda mà không
làm thay đổi bức ảnh (đối với cảm nhận của con ngƣời), nhƣ vậy chúng ta đã đánh lạc
hƣớng đƣợc những tên cracker, thêm vào đó việc thực hiện crack trên mutimedia sẽ
khó khăn hơn nhiều so với crack với các văn bản text. Hiện này công nghệ data hiding
đã và đang phát triển ở mức độ cao hơn, đó là vấn đề bảo vệ bản quyền , công nghệ sử

Kỹ thuật ẩn dữ liệu kết hợp ASE
Trang 1


dụng trong lĩnh vực này là water marking digital (thủy vân kĩ thuật số) trong đề tài
này chúng em sẽ trình bày về công nghệ Data Hiding sử dụng mã hóa AES và một ứng
dụng sử dụng công nghệ này.

MỤC LỤC

CHƢƠNG I: GIỚI THIỆU ĐỀ TÀI 6
1.1 Giới thiệu về data hiding 7
1.2 Giới thiệu về mã hóa AES 10
CHƢƠNG 2: DATA HIDING VÀ MÃ HÓA AES 11
2.1Mô tả hệ thống ẩn dữ liệu 11
2.1.1 Khái niệm 11
2.1.2 Mô tả hệ thống ẩn dữ liệu: 12
2.2 Các yếu tố ảnh hƣởng đến quá trình ẩn dữ liệu 13
2.2.1 Sự thay đổi trên đối tƣợng chứa là tối thiểu 13
2.2.2 Mức độ tránh các thao tác biến đổi trên đối tƣợng chứa 14
2.2.3 Số lƣợng dữ liệu nhúng: 14
2.2.4 Sự khó phát hiện bởi tri giác của con ngƣời – sự vô hình: 15
2.2.5 Không thể giải mã dữ liệu nhúng từ đối tƣợng chứa – Tính bảo mật: 15
2.3 Phân loại các kỹ thuật ẩn dữ liệu 15
2.3.1 Ẩn dữ liệu trên văn bản 16
2.3.1.1 Các kỹ thuật của Brassil 16
2.3.1.1.1 Nhúng dữ liệu bằng cách dịch chuyển dòng 16
2.3.1.1.2 Nhúng dữ liệu bằng cách dịch chuyển từ 17
2.3.1.1.3 Nhúng dữ liệu đặc trƣng 17
2.3.1.2 Các kỹ thuật của Bender 18
2.3.1.2.1 Phƣơng pháp khoảng trắng mở 18
Kỹ thuật ẩn dữ liệu kết hợp ASE
Trang 2


2.3.1.2.2 Phƣơng pháp cú pháp 20
2.3.1.2.3 Phƣơng pháp ngữ nghĩa 20
2.3.2 Các kỹ thuật ẩn dữ liệu trên ảnh tĩnh: 20
2.3.2.1 Các hƣớng tiếp cận của các kỹ thuật ẩn dữ liệu trên ảnh tĩnh: 21
2.3.2.1.1 Hƣớng tiếp cận chèn vào bit LSB: 21
2.3.2.1.2 Phƣơng pháp ngụy trang và lọc: 22
2.3.2.1.3 Các thuật toán và phép biến đổi: 22
2.3.2.2 Các kỹ thuật ẩn dữ liệu trên ảnh tĩnh: 23
2.3.2.2.1 Ẩn dữ liệu với tỉ lệ bit thấp: 23
2.3.2.2.1.1 Patchwork- cách tiếp cận thống kê: 23
2.3.2.2.1.2 Mã hóa kết cấu khối (texture block coding)-Cách tiếp cận trực
quan: 27
2.3.2.2.2 Mã hóa với dữ liệu bit cao – Mã hóa affine: 28
2.3.2.2.2.1 Phƣơng pháp nhúng dữ liệu vào các khối, chứa tối đa một bit
dữ liệu: 29
2.3.2.2.2.2 Phƣơng pháp nhúng dữ liệu vào các khối, mỗi khối chứa tối
đa hai 33
2.3.2.2.2.3 Phân tích khả năng che dấu và kết quả thực nghiệm: 38
2.4 Thuật toán mã hóa AES 40
2.4.1 Quá trình mã hóa 40
2.4.1.1 Tham số, ký hiệu, thuật ngữ và hàm 40
2.4.1.2 Các bƣớc thực hiện 40
2.4.1.3Kiến trúc của thuật toán Rijndael 41
2.4.1.4 Phép biến đổi SubBytes 42
2.4.1.5 Phép biến đổi ShiftRows 44
2.4.1.6 Phép biến đổi MixColumns 45
2.4.1.7 Thao tác AddRoundKey 47
2.4.1.8 Ví dụ về quà trình mã hóa: 49
2.4.2. Quá trình tạo khóa 56
Kỹ thuật ẩn dữ liệu kết hợp ASE

Trang 3

2.4.2.1Chiều dài yêu cầu của khóa 56
2.4.2.2 Sự hạn chế của khóa 56
2.4.2.3 Các tham số của khóa: chiều dài khóa, kích thƣớc block và số vòng 56
2.4.2.4 Gợi ý việc thực hiện dựa trên các nền tảng khác nhau 57
2.4.2.5 Mảng của các byte 57
2.4.3 GIẢI MÃ AES Error! Bookmark not defined.
2.4.3.1 Giải mã: 63
24.3.2 InvShiftrows 64
2.4.3.3 InvSubBytes 64
2.4.3.4 InvMixColumns 64
2.4.3.5 Ví dụ mã hóa AES 65
Chƣơng III.ƢNG DỤNG DATA HIDING KẾP HỢP VỚI MÃ HÓA 72
3.1 Mã hóa 72
3.2 Giải mã 72
3.3Ví dụ minh họa 73
KẾT LUẬN 75
1. Đánh giá: 75
2. Phát triển và hạn chế của đề tài: 75
TÀI LIỆU THAM KHẢO 76

Kỹ thuật ẩn dữ liệu kết hợp ASE
Trang 4

DANH SACH CÁC HÌNH
Hình 1. Quá trình nhúng dữ liệu 3
Hình 2. Quá trình rút trích dữ liệu 13
Hình 3. Quá trình nhúng và rút trích dử liệu 14
Hình 4. Vòng lặp đơn trong thuật giải Patchwork 25

HÌnh 5. Hình dáng các mảnh 27
Hình 6. Sự sắp xếp các mảnh 27
Hình 7. Một ví dụ về phƣơng pháp mã hóa kết cấu khối 28
Hình 8. Nhúng 3 bit vào ảnh 6 x 6 33
Hình 9. Ảnh F, ma trận khóa K vàma trận trọng lƣợngW 38
Hình 10. Ảnh F sau khi thực hiện toán tử XOR và ảnh chứa bị thay đổi dữ liệu 38
Hình 11. Mô tả Một chu kỳ mã hóa của phƣơng pháp Rijndael (với Nb=4) 42
Hình 12. Sơ đồ mã hóa 71
Hình 13. Sơ đồ giải mã 72
Hình 14. Thể hiện sự thay đổi ảnh của quá trình ẩn dử liệu dung mà hóaAES 72
Hình 15. Thể hiện sự thay đổi ảnh a: quá trình rút trích dử liệu và giải mã.b Ảnh sau
khi giải mã và xóa dữ liệu ẩn trên ảnh 73




Kỹ thuật ẩn dữ liệu kết hợp ASE
Trang 5


DANH SÁCH CÁC BẢNG

Bảng 1 Mối quan hệ giữa n và độ tin cậy 26
Bảng 2 Thể hiện bảng thay thế S-box đƣợc sử dụng trong phép biến đổi
SubBytes ở dạng thập lục phân 43
Bảng 3 Thể hiện bảng thay thế S-box đƣợc sử dụng trong phép biến đổi 44
Bảng 4 Giá trị di số shift(r,
Nb) 44
Bảng 5 Thao tác MixColumns tác động lên mỗi cột của trạng thái 46
Bảng 6 Thao tác AddRoundKey tác động lên mỗi cột của trạng thái 48

Bảng 7 Bảng S-BOX có định dang mã hexa 50
Bảng 8 Minh họa các thông số của khóa 56
Bảng 9 Minh họa việc sắp xếp các bit trong mỗi byte 57
Bảng 10 Minh họa mảng của các trạng thái 58
Bảng 11: Thể hiện bảng thay thế S-box đƣợc sử dụng trong phép biến đổi
InvShiftrows 63





Kỹ thuật ẩn dữ liệu kết hợp ASE
Trang 6

CHƢƠNG I: GIỚI THIỆU ĐỀ TÀI
Mật mã và dấu tin (Cryptography) là ngành khoa học là ngành nghiên cứu các
kỹ thuật toán học nhằm cung cấp các dịch vụ bảo vệ thông tin [44]. Đây là ngành
khoa học quan trọng, có nhiều ứng dụng trong đời sống – xã hội.
Khoa học mật mã đã ra đời từ hàng nghìn năm. Tuy nhiên, trong suốt nhiều thế
kỷ, các kết quả của lĩnh vực này hầu nhƣ không đƣợc ứng dụng trong các lĩnh vực dân
sự thông thƣờng của đời sống – xã hội mà chủ yếu đƣợc sử dụng trong lĩnh vực quân
sự, chính trị, ngoại giao Ngày nay, các ứng dụng mã hóa và bảo mật thông tin đang
đƣợc sử dụng ngày càng phổ biến trong các lĩnh vực khác nhau trên thế giới, từ các
lĩnh vực an ninh, quân sự, quốc phòng…, cho đến các lĩnh vực dân sự nhƣ thƣơng mại
điện tử, ngân hàng…Với sự phát triển ngày càng nhanh chóng của Internet và các ứng
dụng giao dịch điện tử trên mạng, nhu cầu bảo vệ thông tin trong các hệ thống và ứng
dụng điện tử ngày càng đƣợc quan tâm và có ý nghĩa hết sức quan trọng. Các kết quả
của khoa học mật mã ngày càng đƣợc triển khai trong nhiều lĩnhvực khác nhau của
đời sống – xã hội, trong đó phải kể đến rất nhiều những ứng dụng đa dạng trong lĩnh
vực dân sự, thƣơng mại Các ứng dụng mã hóa thông tin cá nhân, trao đổi thông tin

kinh doanh, thực hiện các giao dịch điện tử qua mạng đã trở nên gần gũi và quen
thuộc với mọi ngƣời.
Cùng với sự phát triển của khoa học máy tính và Internet, các nghiên cứu và
ứng dụng của mật mã học ngày càng trở nên đa dạng hơn, mở ra nhiều hƣớng nghiên
cứu chuyên sâu vào từng lĩnh vực ứng dụng đặc thù với những đặc trƣng riêng. Ứng
dụng của khoa học mật mã không chỉ đơn thuần là mã hóa và giải mã thông tin mà còn
bao gồm nhiều vấn đề khác nhau cần đƣợc nghiên cứu và giải quyết, ví dụ nhƣ chứng
thực nguồn gốc nội dung thông tin (kỹ thuật chữ ký điện tử), chứng nhận tính xác thực
về ngƣời sở hữu mã khóa (chứng nhận khóa công cộng), các quy trình giúp trao đổi
thông tin và thực hiện giao dịch điện tử an toàn trên mạng
Các ứng dụng của mật mã học và dấu tín để bảo vệ thông tin rất đa dạng và phong
phú; tùy vào tính đặc thù của mỗi hệ thống bảo vệ thông tin mà ứng dụng sẽ có các
Kỹ thuật ẩn dữ liệu kết hợp ASE
Trang 7

tính năng với đặc trƣng riêng. Trong đó, chúng ta có thể kể ra một số tính năng chính
của hệ thống bảo vệ thông tin:
- Tính bảo mật thông tin: hệ thống đảm bảo thông tin đƣợc giữ bí mật. Thông
tin có thể bị phát hiện, ví dụ nhƣ trong quá trình truyền nhận, nhƣng ngƣời tấn
công không thể hiểu đƣợc nội dung thông tin bị đánh cắp này.
- Tính toàn vẹn thông tin: hệ thống bảo đảm tính toàn vẹn thông tin trong liên
lạc hoặc giúp phát hiện rằng thông tin đã bị sửa đổi.
- Xác thực các đối tác trong liên lạc và xác thực nội dung thông tin trong liên
lạc.
- Chống lại sự thoái thác trách nhiệm: hệ thống đảm
- bảo một đối tác bất kỳ trong hệ thống không thể từ chối trách nhiệm về hành
động mà mình đã thực hiện
- Những kết quả nghiên cứu về mật mã cũng đã đƣợc đƣa vào trong các hệ thống
phức tạp hơn, kết hợp với những kỹ thuật khác để đáp ứng yêu cầu đa dạng của
các hệ thống ứng dụng khác nhau trong thực tế, ví dụ nhƣ hệ thống bỏ phiếu

bầu cử qua mạng, hệ thống đào tạo từ xa, hệ thống quản lý an ninh của các
đơn vị với hƣớng tiếp cận sinh trắc học, hệ thống cung cấp dịch vụ đa phƣơng
tiện trên mạng với yêu cầu cung cấp dịch vụ và bảo vệ bản quyền sở hữu trí
tuệ đối với thông tin số
1.1 Giới thiệu về data hiding
Cuộc cách mạng thông tin kỹ thuật số đã đem lại những thay đổi sâu sắc
trong xã hội và trong cuộc sống của chúng ta. Những thuận lợi mà thông tin kỹ thuật
số mang lại cũng sinh ra những thách thức và cơ hội mới cho quá trình đổi mới. Sự ra
đời những phần mềm có tính năng rất mạnh, các thiết bị mới nhƣ máy ảnh kỹ thuật số,
máy quét chất lƣợng cao, máy in, máy ghi âm kỹ thuật số, v.v…, đã với tới thế giới
tiêu dùng rộng lớn để sáng tạo, xử lý và thƣởng thức các dữ liệu đa phƣơng tiện
(multimedia data). Mạng Internet toàn cầu đã biến thành một xã hội ảo nơi diễn ra quá
trình trao đổi thông tin trong mọi lĩnh vực chính trị, quân sự, quốc phòng, kinh tế,
Kỹ thuật ẩn dữ liệu kết hợp ASE
Trang 8

thƣơng mại… Và chính trong môi trƣờng mở và tiện nghi nhƣ thế xuất hiện những vấn
nạn, tiêu cực đang rất cần đến các giải pháp hữu hiệu cho vấn đề an toàn thông tin nhƣ
nạn ăn cắp bản quyền, nạn xuyên tạc thông tin, truy nhập thông tin trái phép v.v Đi
tìm giải pháp cho những vấn đề này không chỉ giúp ta hiểu thêm về công nghệ phức
tạp đang phát triển rất nhanh này mà còn đƣa ra những cơ hội kinh tế mới cần khám
phá.
Yêu cầu của đề tài:
Data hiding là phƣơng pháp đã và đang đƣợc nghiên cứu và ứng dụng rất mạnh mẽ
ở nhiều nƣớc trên thế giới đó là phƣơng pháp nhúng tin(che dấu thông tin) trong các
phƣơng tiện khác. Đây là phƣơng pháp mới và phức tạp nó đang đƣợc xem nhƣ một
công nghệ chìa khoá cho vấn đề bảo vệ bản quyền, nhận thực thông tin và điều khiển
truy cập ứng dụng trong an toàn và bảo mật thông tin.
Giấu thông tin (Steganography) là một kỹ thuật nhúng thông tin vào trong một nguồn
đa phƣơng tiện gọi là các phƣơng tiện chứa mà không gây ra sự nhận biết về sự tồn tại

của thông tin giấu.
Từ Steganography bắt nguồn từ Hi Lạp và đƣợc sử dụng cho tới ngày nay, nó có
nghĩa là tài liệu đƣợc phủ (covered writing). Các câu chuyện kể về kỹ thuật giấu thông
tin đƣợc truyền qua nhiều thế hệ, ý tƣởng về che giấu thông tin đã có từ hàng nghìn
năm về trƣớc nhƣng kỹ thuật này đƣợc dùng chủ yếu trong quân đội và trong các cơ
quan tình báo. Mãi cho tới vài thập niên gần đây, giấu thông tin mới nhận đƣợc sự
quan tâm của các nhà nghiên cứu và các viện công nghệ thông tin với rất nhiều các
công trình nghiên cứu. Cuộc cách mạng số hoá thông tin và sự phát triển nhanh chóng
của mạng truyền thông là nguyên nhân chính dẫn đến sự thay đổi này. Những phiên
bản sao chép hoàn hảo, các kỹ thuật thay thế, sửa đổi tinh vi, cộng với sự lƣu thông
phân phối trên mạng của các dữ liệu đa phƣơng tiện đã sinh ra rất nhiều những vấn đề
nhức nhối về nạn ăn cắp bản quyền, phân phối bất hợp pháp, xuyên tạc trái phép
Kỹ thuật ẩn dữ liệu kết hợp ASE
Trang 9

Sự khác biệt chủ yếu giữa mã hoá thông tin và giấu thông tin là phƣơng pháp mã
hoá làm cho các thông tin hiện rõ là nó có đƣợc mã hoá hay không còn đối với phƣơng
pháp giấu thông tin thì ngƣời ta sẽ khó biết đƣợc là có thông tin giấu bên trong do tính
chất ẩn (invisible) của thông tin đƣợc giấu. Một khi những thông tin mã hoá bị phát
hiện thì những tên tin tặc sẽ tìm mọi cách để triệt phá. Và cuộc chạy đua giữa những
ngƣời bảo vệ thông tin và bọn tin tặc vẫn chƣa kết thúc tuyệt đối về bên nào. Trong
hoàn cảnh đó thì giấu thông tin trở thành một phƣơng pháp hữu hiệu để che giấu thông
tin mà các hacker không thể phát hiện ra.
Giấu tin trong ảnh có hai khía cạnh: Một là bảo mật cho dữ liệu đem giấu
(embedded data), thông tin mật đƣợc giấu kỹ trong một đối tƣợng khác sao cho ngƣời
khác không phát hiện đƣợc. Hai là bảo mật chính đối tƣợng đƣợc dùng để giấu dữ liệu
vào (host data), chẳng hạn nhƣ ứng dụng bảo vệ bản quyền, phát hiện xuyên tạc thông
tin (watermarking) Đây là ứng dụng cơ bản nhất của kỹ thuật giấu tin trong ảnh.
Một thông tin nào đó sẽ đƣợc nhúng vào trong một ảnh, giả sử hình ảnh cần đƣợc lƣu
thông trên mạng. Để bảo vệ các sản phẩm chống lại hành vi lấy cắp hoặc làm nhái cần

phải có một kỹ thuật để “dán tem bản quyền” vào sản phẩm này. Việc dán tem hay
chính là việc nhúng thuỷ vân cần phải đảm bảo không để lại một ảnh hƣởng lớn nào
đến việc cảm nhận sản phẩm. Yêu cầu kỹ thuật đối với ứng dụng này là thuỷ vân phải
tồn tại bền vững cùng với sản phẩm, muốn bỏ thuỷ vân này mà không đƣợc phép của
ngƣời chủ sở hữu thì chỉ còn cách là phá huỷ sản phẩm.
Để tìm hiểu sâu hơn về công nghệ giầu tin trong ảnh đề tài của chúng em đã tiến
hành tìm hiểu các phƣơng pháp để giấu tin, cách thức giấu tin và giấu các loại tin khác
nhau nhƣ thế nào. Ở đề tài này chúng em đã nghiên cứu cách thức giấu tin trong ảnh
Bitmap, ảnh JPEG, ảnh Tif các loại tin đƣợc giấu nhƣ một đoạn văn bản, một tệp
Word thậm chí là giấu ảnh trong ảnh…tuy nhiên do đây là một công nghệ hoàn toàn
mới đối với nƣớc ta nên trong quá trình tìm hiểu và phát triển đề tài chúng em còn gặp
rất nhiều vấn đề khó khăn nhƣ tài liệu về đề tài không nhiều, các công cụ cũng nhƣ
thuật toán để dùng cho công nghệ Data Hiding quá phức tạp …chính vì vậy đề tài của
Kỹ thuật ẩn dữ liệu kết hợp ASE
Trang 10

chúng em còn nhiều vấn đề chƣa thể hoàn thành đƣợc. Chúng em mong đƣợc sự giúp
đỡ của các thầy cô trong khoa để đề tài này sẽ đƣợc hoàn thiện ở mức độ cao hơn nhƣ
có thể giấu đƣợc nhiều kiểu thông tin khác nhau và giấu trong nhiều loại dữ liệu khác
nhau.
1.2 Giới thiệu về mã hóa AES
Với tốc độ và khả năng xử lý ngày càng đƣợc nâng cao của các bộ vi xử lý hiện
nay, phƣơng pháp mã hóa chuẩn (Data Encryption Standard – DES) trở nên không
an toàn trong bảo mật thông tin. Do đó, Viện Tiêu chuẩn và Công nghệ Hoa Kỳ
(National Institute of Standards and Technology – NIST) đã quyết định chọn một
chuẩn mã hóa mới với độ an toàn cao nhằm phục vụ nhu cầu bảo mật thông tin liên
lạc của Chính phủ Hoa Kỳ cũng nhƣ trong các ứng dụng dân sự. Thuật toán Rijndael
do Vincent Rijmen và Joan Daeman đã đƣợc chính thức chọn trở thành chuẩn mã hóa
nâng cao AES (Advanced Encryption Standard) từ ngày
02 tháng 10 năm 2000.

Phƣơng pháp mã hóa Rijndael là phƣơng pháp mã hóa theo khối (block cipher)
có kích thƣớc khối và mã khóa thay đổi linh hoạt với các giá trị 128, 192 hay 256 bit.
Phƣơng pháp này thích hợp ứng dụng trên nhiều hệ thống khác nhau từ các thẻ thông
minh cho đến các máy tính cá nhân.






Kỹ thuật ẩn dữ liệu kết hợp ASE
Trang 11

CHƢƠNG 2: DATA HIDING VÀ MÃ HÓA AES
2.1 Mô tả hệ thống ẩn dữ liệu
2.1.1 Khái niệm
a) Ẩn dữ liệu (data hiding) là thao tác nhúng dữ liệu vào các dạng lƣu trữ
số hóa nhƣ tập tin văn bản, tập tin ảnh nhị phân, các tập tin âm thanh…, nhằm mục
đích nhận diện, chú thích, bảo vệ bản quyền tác giả và truyền thông mật.
b) Ẩn dữ liệu gồm hai quá trình: Nhúng dữ liệ (embedding) vào đối tƣợng
nhúng và rút trích dữ liệu (extracting) từ đối tƣợng chứa. Hay còn gọi là quá trình mã
hóa và giải mã.
c) Đối tƣợng nhúng là đối tƣợng đƣợc chọn để nhúng dữ liệ vào, đối tƣợng
nhúng có ký hiệu: Cover<data type>, trong đó data type là loại đối tƣợng (văn bản,
ảnh tĩnh, âm thanh, )
d) Đối tƣợng chứa là đối tƣợng sau khi đã đƣợc nhúng vào một lƣợng dữ
liệu, đối tƣợng chứ có ký hiệu là Stego<data type>
e) Dữ liệu đƣợc nhúng vào đối tƣợng chứa có thể là các ký hiệu, thông điệp
hay các mẫu (pattern), dữ liệu này đƣợc gọi là dữ liệu nhúng.
f) Các kỹ thuật ẩn dữ liệu nói chung còn có một hay nhiều khóa gọi là

stego-key, stego-key là tham số điều khiển quá trình nhúng dữ liệu nhằm hạn chế khả
năng dữ liệu núng bị phát hiện, hay nhằm lấy lại dữ liệu nhúng từ đối tƣợng chứa.
g) Mỗi ứng dụng cụ thể có các rang buộc riêng trên các yếu tố tác động đến
quá trình nhúng dữ liệu. Các yếu tố đó có thể là số lƣợng dữ liệu nhúng, mức độ bất
biến của dữ liệu nhúng khi đối tƣợng chứa bị thao tác bởi các phép biến đổi, mức độ
bảo toàn dữ liệu nhúng trong các chuẩn nén mất dữ liệu.
h) Các dữ liệu nhúng thƣờng là thông tin về bản quyền, đƣợc nhúng vào
các dạng truyền thông nhƣ văn bản, ảnh, âm thanh với số lƣợng tín hiệu bị suy biến tối
thiểu để không ảnh hƣởng nhiều đến đối tƣợng chứa.
i) Bất cứ vị trí nào trong tín hiệu chứa (tín hiệu chứa là tín hiệu, dữ liệu của
đối tƣợng chứa) đều có thể là mục tiêu của sự di chuyển hay phá hủy trong các chuẩn
Kỹ thuật ẩn dữ liệu kết hợp ASE
Trang 12

nén mất dữ liệu. Để có hiệu quả lớn, các kỹ thuật ẩn dữ liệu phải nhúng dữ liệu vào
các vị trí mà không bị thuật toán nén xén mất.
2.1.2 Mô tả hệ thống ẩn dữ liệu:
Quá trình nhúng dữ liệu của một hệ thống ẩn dữ liệu thông thƣờng có các đầu
vào là đối tƣợng chứa (giả sử là ảnh) I, một dấu hiệu M và một khóa K (thƣờng đƣợc
phát sinh từ dãy số giả ngẫu nhiên). Quá trình nhúng dữ liệu là một ánh xạ có dạng
nhƣ sau:
I´ K´ M®I ¢
Và đầu ra là một đối tƣợng chứa (ảnh chứa).
Cấu trúc một quá trình ẩn dữ liệu thông thƣờng:

Hình 1: Quá trình nhúng dữ liệu
Khi đó Stego Image (I’) là dữ liệu đƣợc truyền trên môi trƣờng truyền.
Cấu trúc một quá trình rút trích dữ liệu

Hình 2: Quá trình rút trích dữ liệu

Kỹ thuật ẩn dữ liệu kết hợp ASE
Trang 13

Quá trình từ nhúng dữ liệu sang rút trích dữ liệu ẩn từ đối tƣợng chứa đƣợc mô
tả bằng sơ đồ sau:

Hình 3 Quá trình nhúng và rút trích dử liệu
2.2 Các yếu tố ảnh hƣởng đến quá trình ẩn dữ liệu
Các kỹ thuật ẩn dữ liệu nói chung đều phải đáp ứng một số các yếu tố, các yếu
tố này thay đổi tùy theo từng ứng dụng cụ thể. Sau đây là các yếu tố chung cho các kỹ
thuật ẩn dữ liệu
2.2.1 Sự thay đổi trên đối tượng chứa là tối thiểu
Mục đích của ẩn dữ liệu là nhúng dữ liệu vào đối tƣợng chứa nhằm các mục
đích riêng cho từng ứng dụng. Tuy nhiên, ẩn dữ liệu không thể làm thay đổi giá trị sử
dụng của đối tƣợng chứa vì:
Nếu ứng dụng của ẩn dữ liệu là bảo vệ quyền sở hữu trí tuệ thì đối tƣợng chứa –
tác phẩm của tác giả không thể bị suy biến vì nhƣ thế thì tác phẩm đó mất đi giá trị và
không cần bảo vệ bản quyền nữa.
Kỹ thuật ẩn dữ liệu kết hợp ASE
Trang 14

Nếu ứng dụng của ẩn dữ liệu là thêm thông tin chú thích thì đối tƣợng chứa
quan trọng hơn, thông tin chú thích chỉ là phần chú thích thêm, vì vậy đối tƣợng chứa
phải đảm bảo đƣợc chất lƣợng.
Nếu ứng dụng ẩn dữ liệu là truyền thông mật, thì sự khác nhau giữa đối tƣợng
gốc và đối tƣợng chứa phải rất nhỏ để tránh đƣợc sự nghi ngờ của ngƣời khác.
2.2.2 Mức độ tránh các thao tác biến đổi trên đối tượng chứa
Còn gọi là tính bền vững của dữ liệu nhúng, đây là mức độ của dữ liệu nhúng
không bị mất đi khi đối tƣợng chứa bị biến đổi bởi các thao tác. Tính năng này là bắt
buộc với tất cả các ứng dụng của ẩn dữ liệu. Tuy nhiên, không có kỹ thuật nào có thể

bất biến với tất cả các thao tác, mỗi kỹ thuật chỉ hỗ trợ cho tính bất biến đối với một số
thao tác mà thôi. Các thao tác trên đối tƣợng chứa có thể liệt kê nhƣ sau:
+ Văn bản: dịch chuyển từ, chi lại khoảng cách giữa các từ,…
+ Ảnh tĩnh: các phép biến đổi affine, nhiễu, các phép biến đổi phi hình
học, lọc nhiễu,
+ Mô hình ba chiều: các phép biến đổi affine, biến đổi hình học, biến đổi
phi hình học, sắp xếp lại lƣới đa giác,…
2.2.3 Số lượng dữ liệu nhúng:
Tùy thuộc vào từng ứng dụng cụ thể mà yêu cầu về số lƣợng dữ liệu nhúng là
nhiều hay ít. Một số ứng dụng chỉ cần nhúng một bit đơn vào đối tƣợng chứa (ví dụ
nhƣ ứng dụng đánh dấu đối tƣợng), một số ứng dụng lại yêu cầu số lƣợng dữ liệu
nhúng phải lớn (các đoạn chú thích).
Tính năng này luôn tỉ lệ nghịch với tính bền vững của dữ liệu nhúng. Một kỹ
thuật nếu hỗ trợ tính năng bền vững của dữ liệu nhúng cao thì số lƣợng dữ liệu nhúng
lại giảm đi đáng kể, và ngƣợc lại nếu nâng cao số lƣợng dữ liệu nhúng thì dữ liệu
nhúng đó lại ít khả năng tránh đƣợc các thao tác trên đối tƣợng chứa, tín hiệu chứa
Kỹ thuật ẩn dữ liệu kết hợp ASE
Trang 15

càng bị nhiễu. Các kỹ thuật hiện đại đều quan tâm đến hai tính năng này và muốn đồng
thời nâng cao cả hai tính năng này.
2.2.4 Sự khó phát hiện bởi tri giác của con người – sự vô hình:
Tính năng này gần giống với tính năng thay đổi tối thiểu trên đối tƣợng chứa,
tuy nhiên lại có sự khác nhau rõ ràng: một đối tƣợng chứa có thể thay đổi ít nhƣng dữ
liệu nhúng lại trực quan, ngƣợc lại dữ liệu nhúng có thể khó bị phát hiện trong khi thay
đổi trên đối tƣợng chứ khá nhiều.
Một số ứng dụng không cần tính năng này (ví dụ ứng dụng nhúng các lời chú
thích, các logo vào đối tƣợng chứa), tuy nhiên đối với ứng dụng truyền thông mật thì
đây là một trong số các tính năng quan trọng nhất. Steganography phải bảo đảm không
để cho một ngƣời trung gian phát hiện, nghi ngờ đối tƣợng chứa chó chứa thông tin

thêm vào. Đối với Steganophy, việc phát hiện có dữ liệu nhúng trong đối tƣợng chứa
gây ra một sự thất bại hoàn toàn: ngƣời trung gian có thể giải mã thông điệp, làm suy
biến thông điệp hay chỉ đơn giản là hủy thông điệp đi.
Trong Steganography, tính năng này cùng với hai tính năng số lƣợng dữ liệu
nhúng và tính bền vững của dữ liệu nhúng, cả ba luôn tỉ lệ nghịch với nhau. Nếu ứng
dụng quá nhiều dữ liệu, thì khả năng bị phát hiện tăng cao và ngƣợc lại, số lƣợng dữ
liệu nhúng ít thì khả năng bị phát hiện giảm xuống.
2.2.5 Không thể giải mã dữ liệu nhúng từ đối tượng chứa – Tính bảo mật:
Tính năng này đặc biệt quan trọng đối với ứng dụng Steganophy, vì mục đích
chính của Steganophy là không để ngƣời thứ ba giải mã đƣợc thông điệp truyền đi.
Tóm lại: không phải bất kỳ một ứng dụng của ẩn dữ liệu nào cũng phải tuyệt
đối tuân theo tất cả các tính năng trên. Mỗi ứng dụng chỉ quan tâm đặc biệt đến một số
tính năng phù hợp với mục đích của ứng dụng đó.
2.3 Phân loại các kỹ thuật ẩn dữ liệu
Kỹ thuật ẩn dữ liệu kết hợp ASE
Trang 16

2.3.1 Ẩn dữ liệu trên văn bản
2.3.1.1 Các kỹ thuật của Brassil
Brassil và một số nhà nghiên cứu khác đã xác định một vấn đề cần giải quyết là
sự phân phối bất hợp pháp các văn bản qua các phƣơng tiện điện tử hiện đại, ví dụ nhƣ
thƣ điện tử. Các phƣơng tiện nhƣ trên cho phép các xâm phạm trên các bản sao chép
văn bản mà chƣa có sự đồng ý của tác giả hay không trảtiền bản quyền. Để chống lại
sự xâm phạm bản quyền này, Brassil đã đƣa ra mộtphƣơng pháp đánh dấu trên các văn
bản với một từ mã duy nhất mà ngƣời đọckhông thể phát hiện, nhƣng có thể sử dụng
để xác định ngƣời nhận hợp lệ vănbản đó chỉ bằng cách thao tác trên văn bản đó.
Kỹ thuật của Brassil là sử dụng một từ mã (có thể là một số nhị phân) đƣợc
nhúng vào văn bản bằng cách thay đổi các đặc trƣng riêng của văn bản.
Bằng cách gắn mỗi bit của từ mã vào các đặc trƣng của văn bản, ta có thể mã
hóatừ mã đó. Dạng đặc trƣng xác định một phƣơng pháp mã hóa riêng. Brassil đƣa ra

ba đặc trƣng trong văn bản sau:
2.3.1.1.1 Nhúng dữ liệu bằng cách dịch chuyển dòng
Trong phƣơng pháp này, các dòng trong văn bản sẽ đƣợc dịch chuyển để nhúng
dữ liệu. Phƣơng pháp này đƣợc áp dụng cho dạng tập tin văn bản hay hìnhảnh của
trang văn bản.
Phƣơng pháp này di chuyển mỗi hai dòng của văn bản hoặc lên hoặc xuống
1/300 inch. Brassil thấy rằng phƣơng pháp này làm việc đặc biệt tốt, và dữ liệu nhúng
trong văn bản vẫn đƣợc rút trích hoàn chỉnh đƣợc, ngay cả sau khivăn bản đã bị sao
chép ra 10 lần.
Tuy nhiên, phƣơng pháp này là kỹ thuật ẩn dữ liệu trên văn bản dễ thấy nhất đối
với ngƣời đọc. Hơn nữa, phƣơng pháp có thể bị đánh bại sau khi văn bản đƣợc đo
khoảng cách giữa hai dòng, việc chia khoảng cách giữa hai dòng ngẫu nhiên hay đồng
Kỹ thuật ẩn dữ liệu kết hợp ASE
Trang 17

nhất đều có thể gây ra nguy hiểm, mất từ mã. Tuy nhiên, nếu một văn bản đƣợc đánh
dấu với phƣơng pháp ẩn dữ liệu này, văn bản khó bị mất từ mã nếu nó ở trên giấy hay
ở dạng hình ảnh.
2.3.1.1.2 Nhúng dữ liệu bằng cách dịch chuyển từ
Từ mã đƣợc nhúng vào một văn bản bằng cách dịch chuyển vị trí của các từ
trong các dòng văn bản, trong khi vẫn giữ nguyên khoảng cách các dòng. Phƣơng pháp
này cũng đƣợc áp dụng cả trên tập tin văn bản và ảnh bitmap của trang văn bản.
Phƣơng pháp này chỉ hữu dụng cho các văn bản có sự biến động về khoảng cách giữa
hai từ cạnh nhau, ví dụ nhƣ một văn bản có sắp chữ. Quátrình rút trích cần phải có một
văn bản gốc, hay ít nhất cũng biết đƣợc giá trị khoảng cách giữa các từ.
Phƣơng pháp thực hiện nhƣ sau: với mỗi dòng văn bản, tìm ra các khoảng cách
lớn nhất và bé nhất, khoảng cách lớn nhất đƣợc giảm xuống một lƣợng, vàkhoảng cách
bé nhất cũng đƣợc tăng thêm một lƣợng nhƣ trên, nhƣ vậy sẽ giữ nguyên chiều dài của
dòng văn bản và gây ra ít thay đổi nhận thấy đƣợc trên văn bản. Nhúng dữ liệu bằng
cách dịch chuyển từ ít bị ngƣời đọc nhận biết hơn phƣơng pháp dịch chuyển dòng, vì

khoảng cách giữa hai từ kế nhau trong một dòng thƣờng bị dịch chuyển để hỗ trợ cho
sự sắp chữ trong văn bản.Tuy nhiên, phƣơng pháp dịch chuyển từ có thể bị phát hiện
và bị đánh bại bằng hai phƣơng pháp sau:
Nếu một ngƣời biết đƣợc thuật toán sử dụng trong định dạng sắp xếp chữ văn
bản, khoảng cách thật sự giữa hai từ có thể đƣợc đo và so sánh với khoảng cách trong
văn bản gốc. Sự khác biệt trong khoảng cách sẽ chứa dữ liệunhúng.
Bằng cách chia lại khoảng cách giữa các từ đƣợc dịch chuyển, hay dịch chuyển
ngẫu nhiên các từ trong văn bản, một ngƣời khác có thể làm mất đi từ mã.
2.3.1.1.3 Nhúng dữ liệu đặc trưng
Đây là phƣơng pháp thứ ba của Brassil. Giống nhƣ hai phƣơng pháp trên,
phƣơng pháp này cũng hỗ trợ cả trên ảnh nhị phân của văn bản hay trên tập tin định
Kỹ thuật ẩn dữ liệu kết hợp ASE
Trang 18

dạng văn bản. Đặc trƣng của văn bản có thể bị thay đổi hay không bị thay đổi phụ
thuộc vào từ mã. Việc nhúng các bit vào văn bản có thể bằng cách kéo dài hay cắt
ngắn các nét trên cùng của các kí tự nhƣ b, d, h, Trƣớc khi mã hóa, các dòng trên của
các kí tự đƣợc kéo dài hay cắt ngắn, sau đó sẽ bị thay đổi một lần nữa để mã hóa dữ
liệu đặc biệt. Điều này tránh đƣợc sự rút trích dữ liệu công khai, vì chiều cao các kí tự
trong văn bản gốc không đƣợc biết. Và dĩ nhiên, quá trình giải mã cần phải có các ảnh
gốc. Phƣơng pháp mã hóa đặc trƣng có thể thực hiện trên một lƣợng dữ liệu nhúng
lớn, vì một văn bản có nhiều đặc trƣng. Phƣơng pháp này có thể bị đánh bại bằng cách
điều chỉnh lại chiều dài các kí tự theo một giá trị cố định
2.3.1.2 Các kỹ thuật của Bender
Các văn bản ở dạng số rất khó chứa dữ liệu ẩn (trong khi văn bản trên giấy thì
dễ hơn). Các văn bản ở dạng số ít có các thao tác biến đổi nhƣ trên ảnh, nhƣng nếu văn
bản xuất hiện một từ hay một câu lạ thì dễ dàng bị ngƣời đọc phát hiện. Bender đƣa ra
ba phƣơng pháp chính sử dụng cho ẩn dữ liệu trên vănbản:
Phƣơng pháp khoảng trắng mở sử dụng các khoảng trắng không đƣợc sử dụng
trong các trang in

Phƣơng pháp cú pháp sử dụng các dấu câu
Phƣơng pháp ngữ nghĩa thao tác dựa trên nghĩa của các từ
2.3.1.2.1 Phương pháp khoảng trắng mở
Bender đƣa ra hai lý do của việc sử dụng khoảng trắng để mã hóa.
Thứ nhất, khi thay đổi số lƣợng các khoảng trắng thì nghĩa của câu ít bị ảnh
hƣởng.
Thứ hai, ngƣời đọc tình cờ sẽ không chú ý đến sự thay đổi của các khoảng
trắng.
Kỹ thuật ẩn dữ liệu kết hợp ASE
Trang 19

Trong phƣơng pháp này lại có ba phƣơng pháp nhỏ: phƣơng pháp khai thác
khoảng trắng giữa các câu, giữa các từ và giữa các dòng trong các văn bản đƣợc sắp
chữ.
Phƣơng pháp khai thác khoảng trắng giữa các câu:mã hóa một chuỗi nhị phân
vào văn bản bằng cách đặt một hay hai khoảng trắng sau mỗi kí tự kết thúc, ví dụ nhƣ
một câu trong văn xuôi, một dấu chấm phẩy (;) trong ngôn ngữ C, Một khoảng trắng
mã hóa 0, hai khoảng trắng mã hóa 1. Phƣơng pháp này không hiệu quả, nó cần phải
có một văn bản lớn để mã hóa một lƣợng bit nhỏ (một bit trên một câu tƣơng ứng với
tỉ lệ dữ liệu là 1bit/160 byte với giả thuyết một câu trung bình có 80 kí tự). Phƣơng
pháp này cũng phụ thuộc vào cấu trúc của văn bản. Hầu hết các trình xử lý văn bản
đều xử lý khoảng trắng sau mỗi câu.
Phƣơng pháp khai thác khoảng trắng sau mỗi dòng: dữ liệu mã hóa cho phép
xác định số khoảng trắng sau mỗi dòng. Hai khoảng trắng mã hóa một bit, bốn khoảng
trắng mã hóa hai bit, tám khoảng trắng mã hóa ba bit, Phƣơng pháp này có thể thực
hiện trên mọi loại văn bản, vì nó không bị ngƣời đọc phát hiện do những khoảng trắng
thêm vào nằm ngoài phạm vi của văn bản. Nó còn mã hóa đƣợc số lƣợng bit nhiều hơn
phƣơng pháp trên. Trong phƣơng pháp khai thác khoảng trắng sau mỗi câu, văn bản
sau khi đã nhúng dữ liệu, qua các chƣơng trình nhƣ thƣ điện tử có khả năng bị cắt mất
khoảng trắng. Vấn đề duy nhất của phƣơng pháp khai thác khoảng trắng sau mỗi dòng

là không thể lấy lại dữ liệu nhúng đƣợc sau khi văn bản chứa đã qua các thao tác sao
chép trên giấy.
Phƣơng pháp khai thác các khoảng trắng ngay sau các từ: một khoảng trắng mã
hóa bit 0, hai khoảng trắng mã hóa bit 1. Phƣơng pháp này cho kết quả vài bit trên một
dòng. Để xác định khoảng trắng nào là của dữ liệu nhúng, khoảng trắng nào là của văn
bản, Bender sử dụng phƣơng pháp mã hóa giống nhƣ phƣơng pháp của Manchester.
Manchester sử dụng một nhóm bit để đại diện cho một bit. “01” đƣợc giải mã thành 1,
“10” là 0, “00” và “11” là rỗng.
Kỹ thuật ẩn dữ liệu kết hợp ASE
Trang 20

Ví dụ: chuỗi đƣợc mã hóa là “1000101101” thì đƣợc giải mã thành “001”, trong
khi chuỗi “110011” là rỗng.
Phƣơng pháp khoảng trắng hiệu quả trong các văn bản định dạng ASCII.Một số
dữ liệu có khả năng bị mất khi văn bản đƣợc in ra.
2.3.1.2.2 Phương pháp cú pháp
Hai phƣơng pháp cú pháp và ngữ nghĩa có thể kết hợp song song. Trong nhiều
tình huống sau khi mã hoá, văn bản có số lƣợng dấu câu nhiều hay có dấu câu sai,
nhƣng lại không ảnh hƣởng lớn đến ngữ nghĩa trong văn bản. Ví dụ cụm từ “bread,
butter, and milk” và “bread, butter and milk” cả hai đều dùng dấu phẩy đúng. Bất cứ
khi nào trong câu sử dụng dạng thứ nhất thì mã hóa 1, dạng thứ hai thì mã hóa 0.
Trong một số ví dụ còn sử dụng các từ viết tắt, viết gọn. Phƣơng pháp này chỉ mã hóa
đƣợc vài bit trên 1Kb văn bản. Phƣơng pháp cú pháp còn bao gồm cả cách thay đổi
trong cách thức diễn đạt và cấu trúc văn bản mà không làm thay đổi ngữ nghĩa.
Phƣơng pháp này rõ ràng có hiệu quả hơn phƣơng pháp khoảng trắng, nhƣng khả năng
khai thác của nó bị giới hạn.
2.3.1.2.3 Phương pháp ngữ nghĩa
Phƣơng pháp này cũng tƣơng tự nhƣ phƣơng pháp cú pháp. Phƣơng pháp ngữ
nghĩa dùng giá trị chính hay phụ đồng nghĩa. Ví dụ từ “big” có thể thay bằng“large”
(Hình 8). Khi giải mã, từ có ý nghĩa chính sẽ đại diện cho giá trị 1, từ có ý nghĩa phụ

sẽ đại diện cho giá trị 0.Tuy nhiên phƣơng pháp này có thể làm thay đổi ngữ nghĩa của
câu, mặc dù từ thay thế cùng nghĩa, nhƣng sắc thái của câu đã bị thay đổi (các từ đƣợc
dùng thích hợp trong từng ngữ cảnh).
2.3.2 Các kỹ thuật ẩn dữ liệu trên ảnh tĩnh:
Ảnh tĩnh là một đối tƣợng rất thích hợp cho ẩn dữ liệu, nhất là trong
Steganography vì các yếu tố sau đây:
Kỹ thuật ẩn dữ liệu kết hợp ASE
Trang 21

Một ảnh chứa rất nhiều dữ liệu, giả sử một ảnh có kích thƣớc 600 × 400 đƣợc
mỗi pixel đƣợc biểu diễn bởi 3 byte RGB thì có dung lƣợng là 720000 byte.
Một ảnh có chứa dữ liệu nhúng sẽ ít gây chú ý hơn là một văn bản. Sự khác biệt
giữa ảnh gốc và ảnh sau khi nhúng rất khó nhận ra đƣợc bằng mắt thƣờng.
Thông tin có thể đƣợc ẩn trong ảnh tĩnh bằng nhiều cách. Thông điệp đƣợc mã
hóa từng bit vào ảnh. Các kỹ thuật mã hóa phức tạp hơn là kỹ thuật ẩn thông điệp vào
những vùng nhiễu của ảnh, nhƣ vậy sẽ ít gây sự chú ý hơn. Thông điệp cũng có thể
đƣợc rải ngẫu nhiên trên ảnh chứa.
2.3.2.1 Các hƣớng tiếp cận của các kỹ thuật ẩn dữ liệu trên ảnh tĩnh:
 Chèn vào bit thấp nhất LSB (Least Significant Bit).
 Các kỹ thuật lọc và mặt nạ.
 Các thuật toán và các phép biến đổi
2.3.2.1.1 Hướng tiếp cận chèn vào bit LSB:
Phƣơng pháp chèn bit vào LSB là phƣơng pháp đƣợc biết nhiều nhất trong kỹ
thuật ẩn dữ liệu. Đây là một hƣớng tiếp cận thông dụng, đơn giản để nhúng thông tin
vào ảnh. Nhƣng phƣơng pháp này có nhƣợc điểm là dễ bị tấn công bởi các thao tác
trên ảnh. Một sự chuyển đổi từ dạng GIF hay BMP sang dạng nén mất dữ liệu (ví dụ
nhƣ JPEG) có thể hủy hết thông tin ẩn trong ảnh.
Khi sử dụng kỹ thuật LSB cho ảnh 24 bit màu, mỗi pixel có 3 bit đƣợc dùng để
mã hóa dữ liệu (vì mỗi pixel đƣợc biểu diễn bằng 3 byte). Sự thay đổi trên pixel khó bị
mắt ngƣời nhận ra. Ví dụ, kí tự A có thể đƣợc ẩn trong 3 pixel.

Giả sử 3 pixel của ảnh gốc có giá trị nhị phân nhƣ sau:
( 00100111 11101001 11001000 )
( 00100111 11001000 11101001 )
( 11001000 00100111 11101001 )
Kỹ thuật ẩn dữ liệu kết hợp ASE
Trang 22

Giá trị nhị phân của kí tự A là (10000011). Sau đây là kết quả sau khi nhúng giá
trị nhị phân của A vào 3 pixel trên, bắt đầu từ byte đầu tiên bên trái trên cùng:
( 00100111 11101000 11001000 )
( 00100110 11001000 11101000 )
( 11001000 00100111 11101001 )
Chỉ có các bit LSB in đậm bị thay đổi. Các kỹ thuật chèn vào bit LSB cải tiến là
dữ liệu có thể đƣợc ẩn trong bit thấp nhất và bit thấp thứ hai trong byte mà mắt ngƣời
vẫn không thể nhận ra sự thay đổi.
Sử dụng kỹ thuật LSB trong ảnh 8 bit màu phải cẩn thận hơn đối với ảnh 24 bit
màu vì sự thay đổi màu sắc rõ hơn.
2.3.2.1.2 Phương pháp ngụy trang và lọc:
Kỹ thuật ngụy trang và lọc ẩn thông tin bằng cách đánh dấu một ảnh bằng một
ký hiệu mờ. Các kỹ thuật nhúng dấu hiệu thích hợp với ảnh hơn, các kỹ thuật đó có thể
đƣợc áp dụng trên ảnh tĩnh mà không sợ ảnh hƣởng của định dạng ảnh nén mất dữ
liệu. Bằng cách che phủ, hoặc ngụy trang một tín hiệu mờ, hệ thống thị giác của ngƣời
HVS không thể nhận biết đƣợc sự thay đổi trên ảnh.
Về mặt kỹ thuật, nhúng dấu hiệu không phải là một dạng của Steganography.
Trong khi Steganography dấu dữ liệu trong ảnh, nhúng dấu hiệu mở rộng thông tin của
ảnh và trở thành một thuộc tính của ảnh chứa, cung cấp các chi tiết về bản quyền, giấy
phép, quyền sỡ hữu.
Các kỹ thuật ngụy trang thích hợp hơn cho các ảnh nén dạng JPEG hơn là các
kỹ thuật LSB vì chúng có thể miễn dịch trƣớc các thao tác nén hay xén ảnh.
2.3.2.1.3 Các thuật toán và phép biến đổi:

Hiện nay trên Internet, ảnh JPEG đã trở nên phong phú vì là chuẩn nén tốt, chất
lƣợng cao và tỉ lệ nén cao. Nguyên lý cơ bản trong chuẩn nén JPEG là phép biến đổi
cosin rời rạc DCT (Discrete Cosine Transform). DCT là phép biến đổi nén mất dữ liệu,
vì giá trị cosin không thể tính toán chính xác đƣợc và các lỗi trong tính toán có thể
Kỹ thuật ẩn dữ liệu kết hợp ASE
Trang 23

xuất hiện. Sự khác biệt giữa dữ liệu của ảnh gốc và dữ liệu của ảnh sau khi nén phụ
thuộc vào các giá trị và các phƣơng pháp sử dụng trong tính toán DCT.
Các ảnh cũng có thể tiến hành bằng các phép biến đổi Fast Fourier và biến đổi
Wavelet. Hệ HVS có độ nhạy rất thấp với các thay đổi nhỏ trên độ chói.
Các hệ thống hiện đại sử dụng truyền thông phổ rộng để truyền một tín hiệu dãy
tần số thấp trên một băng thông lớn hơn, vì thế mật độ của tín hiệu trên kênh truyền
chỉ giống nhƣ nhiễu.
Hai kỹ thuật phổ rộng khác nhau đƣợc gọi là dãy trực tiếp và nhảy tần số. Kỹ
thuật dãy trực tiếp dấu thông tin bằng cách thay đổi pha của tín hiệu dữ liệu với một
chuỗi số giả ngẫu nhiên mà cả ngƣời gửi và ngƣời nhận đều biết. Kỹ thuật nhảy tần số
phân chia băng thông có sẵn thành nhiều kênh truyền và nhảy giữa các kênh truyền đó
(cũng đƣợc chèn bằng một dãy số giả ngẫu nhiên).
2.3.2.2 Các kỹ thuật ẩn dữ liệu trên ảnh tĩnh:
Các kỹ thuật ẩn dữ liệu trên ảnh tĩnh đƣợc chia thành hai loại theo kích thƣớc
dữ liệu nhúng:
 Ẩn dữ liệu với tỉ lệ bit thấp, lƣợng dữ liệu đƣợc nhúng trong ảnh rất ít,
có kỹ thuật chỉ nhúng một bit vào ảnh vì thế tính bền vững của dữ liệu nhúng cao.
 Ẩn dữ liệu với tỉ lệ bit cao, lƣợng dữ liệu đƣợc nhúng cao hơn nhiều và
do đó tính bền vững cũng thấp hơn.
2.3.2.2.1 Ẩn dữ liệu với tỉ lệ bit thấp:
Hai kỹ thuật điển hình là Patchwork và mã hóa kết cấu khối. Patchwork nhúng
một bit đơn vào ảnh với một giá trị tin cậy cao dựa trên phân phối Gaussian. Mã hóa
kết cấu khối dựa trên các vùng đồng nhất trên ảnh.

2.3.2.2.1.1 Patchwork- cách tiếp cận thống kê:
Kỹ thuật ẩn dữ liệu kết hợp ASE
Trang 24

Patchwork là một hƣớng tiếp cận theo phƣơng pháp thống kê, dựa trên các dãy
số giả ngẫu nhiên[15]. Patchwork nhúng vào ảnh chứa một số thống kê đặc thù, chứa
một hàm phân phối Gaussian sao cho mắt ngƣời không thể nhận ra.
Hình 3.1 mô tả một phƣơng pháp Patchwork dùng một vòng lặp đơn. Hai mảnh
A, B đƣợc chọn ngẫu nhiên, mảnh A có màu sáng trong khi mảnh B có màu tối.
Một số liệu thống kê duy nhất sẽ cho biết dấu hiệu có xuất hiện hay không.
Patchwork có đặc điểm là không phụ thuộc vào nội dung của ảnh chứa và kỹ thuật này
có khả năng tránh đƣợc các biến đổi phi hình học.
Để minh họa, ảnh chứa trong ví dụ này có mức sáng 256, hệ thống lƣợng
tử tuyến tính sẽ bắt đầu từ 0 và tất cả các mẫu không phụ thuộc vào các mẫu
khác, hay nói chính xác hơn là các mẫu độc lập với nhau.

Hình 4. Vòng lặp đơn trong thuật giải Patchwork
Nguyên lý thuật giải:
 Sử dụng lý thuyết thống kê, hàm phân phối Gaussian để mã hóa.
 Chọn một khóa để tạo một dãy số ngẫu nhiên.
 Dựa vào các số trên dãy số ngẫu nhiên, chọn ra mỗi lần hai mảnh trên

×