Tải bản đầy đủ (.pdf) (78 trang)

Một số kỹ thuật giấu dữ liệu trong ảnh tĩnh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (34.75 MB, 78 trang )

U ơb.K
VO' í|
¿ tó
ĐẠI HỌC QUỐC G IA HÀ N Ộ I
KHOA CÔNG NGHỆ
VÕ THANH HẢI
M Ô T S Ố K Ỹ T H U Â T G I Ấ U D Ữ L I Ê U
• • •
T R O N G Ả N H T Ĩ N H
Chuyên ngành: Công nghệ Thông tin
Mã số : 1.01.10
LUẬN VĂN THẠC s ĩ
NGƯỜI HƯỚNG DẪN KHOA HỌC
PGS TSKH NGUYỄN XUÂN HUY
ĐA- hcrcu;:-c GiA HÀ NỘ!
TRÚNCTÂM TliỒHGTtN.Tl iư VIỆN
No V L 0 /Z 0 5
-
___
_
, ■ —
Hà Nội - 2003
M ụ c lụ c
Trang phụ bìa
Mục luc
Danh mục hình vẽ, ản h 1
Từ viết tắt và thuật ngữ 2
Mở đầu 3
Chương 1: Tổng quan giấu dữ liệu trong môi trường ảnh tĩnh 7
1.1. Lịch sử về giấu dữ liệu trong môi trường ảnh
7


1.2. Bài toán giấu dữ liệu trong dữ liệu khác 10
1.3. Phân loại lược đồ giấu dữ liệu trong môi trường ản h

11
1.3.1. Giấu không bền vững 12
1.3.2. Giấu bền vững 14
1.4. Thuộc tính của các lược đồ giấu dữ liệu trong ảnh

14
1.4.1. Tính vô hình của dữ liệu giấu 15
1.4.2. Dung lượng dữ liệu giấu
15
1.4.3. Tính bảo mật của dữ liệu giấu 16
1.4.4. Tính chống phát hiện 16
1.4.5. Chất lượng ảnh sau khi giấu tin 17
1.4.6. Tính bền vững

;
17
1.4.7. Tính đúng của thuật toán 17
1.5. Một số lĩnh vực ứng dụng giấu dữ liệu 18
1.5.1. Che giấu việc truyền thông bằng các ảnh

18
1.5.2. Bảo vệ bản quyền của các ảnh s ố

18
1.5.3. Điểm chỉ số 19
Chương 2: Kỹ thuật giấu dữ liệu trong ảnh tĩnh 20
2.1. Cấu trúc ảnh BMP

20
2.2. Kỹ thuật giấu bí mật (steganography) 23
Trang
2.2.1. Yêu cầu chung 23
2.2.2. Phương pháp giấu bí mật đối với ảnh tĩnh 24
2.2.3. Nguyên lý chung giấu dữ liệu bí mật vào trong ả n h

27
2.2.4. Một số thuật toán giấu thông tin trong khối bit

28
2.2.5. Kỹ thuật giấu dữ liệu đối với các loại ảnh dạng BMP

36
2.2.6. Nhận xét chung
42
2.3. Kỹ thuật nhúng thuỷ vân (watermark)

43
2.3.1. Yêu cầu và chiến lược nhúng thuỷ vân
43
2.3.2. Kỹ thuật nhúng thuỷ vân 46
Chương 3: Thiết kế ứng dụng giấu dữ liệu trong ảnh 54
3.1. Môi trường làm việc, ngôn ngữ sử dụng

54
3.2. Tổ chức thực hiện và cài đặt chương trình

54
3.2.1. Giấu dữ liệu bí mật trong ảnh

55
3.2.2. Nhúng thuỷ vân trong ảnh 58
3.3. Đánh giá các kết quả thực hiện

.
65
Kết luận và đề nghị 66
Tài liệu tham khảo 69
Phụ lụ c 72
Hình 1: Sơ đồ giấu dữ liệu tổng quát 10
Hình 2: Sự mâu thuẫn giữa các yêu cầu trong kỹ thuật giấu dữ liệu 18
Hình 3: Sơ đồ giấu dữ liệu trong ảnh 28
Hình 4: Ví dụ giấu 3 bit trong khối (4 X 4) b it

34
Hình 5: Xây dựng ảnh M* để nhúng thuỷ vân
50
Hình 6: Thuỷ vân tách được từ ảnh true - color kích thước 800 X 600
với p = 0.5772
.
52
Hình 7 : Giấu 4 bit dữ liệu vào khối 4 x 4 trên ảnh 256 m àu 56
Hình 8 : Áp dụng phương pháp xếp lại bảng m àu 57
Hình 9 : Giấu 4 bit dữ liệu vào khối 4 x 4 trên ảnh 24 bit m àu 58
Hình 10 : Ảnh kết quả, sử dụng 5 LSB trên 1 byte màu để giấu
dữ liệu 60
Hình 11: Ảnh nhúng thuỷ vân bằng lược đồ NEC cuờng độ 0,1

63
Hình 12: Ảnh gốc và ảnh đã nhúng thuỷ vân, p = 0,6826

63
Hình 13: Thuỷ vân gốc và thuỷ vân tách từ ảnh 12b, p = 0,6826

63
Hình 14: Thuỷ vân tách ra từ ảnh kết quả với các giá trị p

63
Hình 15: Thuỷ vân tách ra từ ảnh kết quả qua phép cắt ả n h

64
Hình 16 : Thuỷ vân tách ra từ ảnh kết quả bị quay và giảm
cường độ sáng
64
Danh mục hình vẽ, ảnh
2
T ừ v iế t t ắ t v à t h u ậ t n g ữ
Từ viết tắt và thuật ngữ:
DCT
Data hiding in Images
LSB (Least Significant Bit)
Pixel
Steganography
Watermark
Watermarking
Từ khoá:
Phép biến đổi Cosin rời rạc
Giấu dữ liệu trong ảnh
Bit có trọng số thấp
Điểm ảnh
Giấu bí mật

Nhúng thuỷ vân
Thuỷ vân
Ảnh môi trường, ảnh kết quả, dữ liệu giấu, dữ liệu tách, giai đoạn
nhúng, giai đoạn tách.
3
M ở đ ầ u
Sự phát triển mạnh mẽ của công nghệ thông tin và sự giao lưu thông tin
ngày càng trở nên phổ biến trên các mạng truyền thông máy tính. Đặc biệt là
sự phát triển của mạng Internet. Việc trao đổi thông tin trở thành nhu cầu
không thể thiếu được trong quá trình hiện đại hoá và toàn cầu hoá các lĩnh
vực kinh tế, xã hội, giao tiếp Tuy nhiên việc trao đổi thông tin qua mạng có
nguy cơ dữ liệu bị truy cập trái phép, xuyên tạc trước những vi phạm cố ý của
con người. Hơn nữa, với sự phát triển của công nghệ kỹ thuật số đã làm cho
việc lun trữ, sửa đổi và sao chép dữ liệu ngày càng đơn giản, nhưng việc bảo
vệ bản quyền, chống xâm phạm trái phép dữ liệu trên đường truyền cũng gặp
không ít khó khăn. Yêu cầu bảo mật và xác nhận chủ nhân của thông tin đã
trở thành vấn đề cấp thiết trong thời đại công nghệ thông tin phát triển cao.
Phương pháp truyền thống bảo mật thông tin là mã hoá thông tin theo
một qui tắc nào đó đã thỏa thuận giữa người gửi và người nhận. Thông tin
được mã hoá thành bản mã vô nghĩa, sau đó gửi đi. Khi nhận được bản mã,
người nhận tiến hành giải mã thu được bản gốc. Đã có nhiều công trình
nghiên cứu, xây dựng thành công các thuật toán mã hoá và giải mã khá tốt
với độ an toàn bảo mật cao như: DES, RSA, NASACH Chữ ký điện tử
dùng để xác nhận chủ nhân của thông tin. Những phương pháp này chỉ
chuyển thông tin sang một dạng khác, nó vẫn tồn tại trên máy tính hoặc trên
đường truyền dưới dạng tệp tin. Đôi khi người ta lại muốn che giấu việc liên
lạc vì một mục đích nào đó hoặc muốn bảo vệ bản quyền trên các ảnh số.
Nếu dùng chữ ký điện tử xác nhận chủ nhân bức ảnh, sẽ làm ảnh biến dạng,
mất hết tính mỹ thuật. Để khắc phục những vấn đề này giải pháp đưa ra là
giấu thông tin trong một dạng dữ liệu khác sao cho không phát hiện được.

Trong khi mã hóa là làm cho thông tin trở nên vô nghĩa không hiểu được thì
giấu thông tin làm cho nó vô hình không nhìn thấy được.
4
Dạng số của tín hiệu có nhiều ưu điểm so với dạng tương tự như: không
bị giảm chất lượng khi sao chép, phân phối dễ dàng thông qua mạng, dễ soạn
thảo, sửa đổi, lưu trữ và tìm kiếm. Tuy nhiên với những ưu điểm này lại nảy
sinh một số vấn đề như: vi phạm bản quyền trong phạm vi rộng, sao chép và
phân phát bất hợp pháp, khó xác thực, dễ giả mạo. Đặc trưng của các loại dữ
liệu đa phương tiện là có thể thay đổi một số thành phần trong nội thân dữ
liệu của chúng mà chất lượng âm thanh, hình ảnh dường như không thay đổi
hoặc độ thay đổi không đáng kể, dưới mức cảm nhận của con người. Từ đó
đã xuất hiện một hướng nghiên cứu mới, giấu thông tin vào các nguồn dữ liệu
đa phương tiện (âm thanh, hình ảnh, phim) sau đó cho lưu thông trên mạng.
Giấu thông tin trong các dữ liệu số cung cấp một phương pháp để vượt qua
các vấn đề: bảo mật, hạn chế xâm nhập trái phép, xác nhận bản quyền Dữ
liệu trước khi giấu có thể mã hoá, nén, bởi vậy nó thừa kế toàn bộ thành quả
của mã hoá.
Ảnh là loại dữ liệu có đặc tính đặc biệt, nếu thay đổi độ sáng tối, cường
độ màu, độ tương phản trong một ngưỡng nhỏ cho phép thì thị giác con người
không nhận thấy sự khác biệt của ảnh do đó dùng ảnh màu làm môi trường
để giấu thông tin rất tốt. Muốn xác nhận chủ nhàn của bức ảnh hãy nhúng
các dấu hiệu, thông điệp vào bức ảnh, tạo ra các bức ảnh “thông minh”. Các
íhông điệp ẩn này có thể là các thông tin về nội dung bức ảnh, tác giả bức
ảnh, hoặc các dữ liệu liên quan đến bức ảnh. Cũng có thể thực hiện việc
truyền thông hoàn toàn bí mật bằng cách nhúng thông tin vào các thành phần
của bức ảnh nhưng không làm cho ảnh thay đổi, phương pháp này sẽ che giấu
sự hiện diện của việc liên lạc.
Vì các lý do đã nêu trên tôi chọn đề tài "Một số kỹ thuật giấu dữ liệu
trong ảnh tĩnh".
Hướng nghiên cứu này được hình thành và phát triển trong khoảng mười

năm gần đây, đã được nhiều nhà khoa học, giới công nghiệp và người sử
5
dụng quan tâm. Nó có tính thực tiễn cao và còn rất nhiều thách thức. Luận
văn này nhằm mục đích trình bày cơ sở lý thuyết, nguyên tắc và kỹ thuật giấu
dữ liệu vào các loại ảnh tĩnh sao cho sự biến đổi của ảnh ít nhất, không phát
hiện được. Việc lấy thông tin đã giấu phải chính xác, đầy đủ theo đúng mục
đích sử dụng. Nếu không cung cấp kỹ thuật (cụ thể là khoá) thì việc lấy
thông tin đầy đủ, chính xác sẽ khó thực hiện.
Luận văn tập trung tìm hiểu cấu trúc ảnh sử dụng làm môi trường giấu
tin, cải tiến thuật toán giấu tin trên ảnh 2 mức (ảnh trắng, đen) để giấu các
thông tin trên ảnh màu dạng: 16 màu, 256 màu, 16 bit màu, 24 bit màu theo
hướng: tăng lượng thông tin giấu, tăng tính bền vững của thông tin giấu, nâng
cao chất lượng ảnh đã mang tin. Phần thực hành đã xây dựng các ứng dụng
cho phép giấu trực tiếp dữ liệu vào không gian ảnh theo một khoá người
dùng.
Kết quả chính của luận văn:
+ Đưa ra kỹ thuật giấu trực tiếp một lượng dữ liệu vào trong ảnh theo
mật khẩu của người dùng.
+ Đưa ra kỹ thuật giấu thông tin vào ảnh, thông tin này bền vững với
các phép xử lý ảnh thông dụng.
+ Giảm nhiễu tối đa ảnh mang tin.
+ Chương trình đã kiểm tra lại các kỹ thuật lý thuyết đề nghị đều khả
thi, khó có thể phân biệt giữa ảnh gốc và ảnh đã mang tin. Thu nhận dữ liệu
đã giấu chính xác. Hạn chế độ phức tạp tính toán của thuật toán nhúng và
thuật toán giải mã.
+ Những kỹ thuật giấu thông tin này có thể mở rộng sang các kiểu dữ
liệu số khác như âm thanh, video
Luận văn được tổ chức thành ba chương:
6
Chương 2: Kỹ thuật giấu dữ liệu trong ảnh tĩnh.

Chương 3: Cài đặt chương trình và phân tích kết quả thử nghiệm
Phần kết luận và đề nghị: tổng kết lại nội dung luận văn, những kết quả
đạt được và hướng nghiên cứu trong tương lai.
Phần phụ lục: Hướng dẫn sử dụng chương trình đã cài đặt.
Trong luận văn trình bày một số kỹ thuật giấu tin trong ảnh tĩnh, các
thuật toán và phương pháp đề nghị dễ cài đặt, hiệu quả cao. Chương trình thử
nghiệm sử dụng thuận tiện. Tuỳ thuộc vào mục đích sử dụng, tính chất nội
dung dữ liệu cần bảo mật và loại ảnh dùng làm môi trường giấu thông tin,
người sử dụng có thể chọn lựa kỹ thuật thích hợp đã trình bày.
Chương 1: Tổng quan về giấu dữ liệu trong môi trường ảnh tĩnh.
7
T ổ n g q u a n g iấ u d ữ liệ u t r o n g m ô i tr ư ờ n g ả n h tĩn h
1.1. Lịch sử về giấu dữ liệu trong môi trường ảnh
Các kỹ thuật giấu dữ liệu trong ảnh (data hiding in images), thực chất là
một quá trình nhúng dữ liệu vào một nguồn dữ liệu khác gọi là môi trường.
Mục đích của mã mật là tạo ra các thông tin khó hiểu để những người không
có khoá bí mật không thể hiểu được các thông tin này. Đôi khi người ta lại
muốn hoàn toàn bí mật như che giấu việc liên lạc thay vì trao đổi các thông
điệp đã được mã hoá. Bài toán này được lĩnh vực giấu dữ liệu quan tâm.
Từ thời xa xưa, con người đã biết sử dụng phương pháp giấu thông tin.
Mực không màu là phương tiện hữu hiệu cho bảo mật thông tin trong một
thời gian dài. Người Romans cổ đã biết sử dụng những chất có sẩn như: nước
hoa quả, nước tiểu và sữa để viết các bận thông báo bí mật, khi hơ nóng,
những thứ mực không nhìn thấy này trở nên sẫm màu và có thể đọc được.
Một người Đức tên là Johannes Trithemius (1462-1526) đã quan tâm
nghiên cứu giấu thông tin và mật mã. Công trình đầu tiên nghiên cứu về kỹ
thuật giấu thông tin có tên là “Steganographia”. Các kỹ thuật giấu thông tin
tiếp tục phát triển mạnh vào thế kỷ XV-XVI. Tuy nhiên do bị cấm đoán của
chính quyền đương thời các tác giả thường phải giấu tên tuổi và công việc
của họ.

Luận văn của John Wilkins đã trình bày hệ thống các vấn đề: giấu các
thông tin trong nốt nhạc, mực không màu, mô tả những nguyên lý của việc
mã và giải mã các thông tin che giấu theo phương pháp thay đổi vị trí ký tự.
Ông thuyết phục chính quyền cho công khai hóa nghiên cứu và công bố các
công trình kiểu này.
Chương 1
8
Cuốn sách Les Filigranes do Charle Briquet viết vào năm 1907 được
xem như một từ điển lịch sử của các phương pháp steganography (giấu thông
tin) và watermark (thủy ấn).
Đến thế kỷ XX kỹ thuật giấu thông tin mới thực sự phát triển. Đặc biệt
thời chiến tranh thế giới thứ hai đánh dấu một thời kỳ quan trọng của ứng
dụng này. Công nghệ giấu thông tin bằng mực không màu được phát triển
gần như hoàn hảo.
Về sau này có sử dụng phương pháp giấu thông tin vào các bản tin
thông thường để không gây ra bất kỳ sự hoài nghi nào, dễ dàng lọt qua mọi
sự kiểm soát, sau đó ghép các chữ cái đầu một từ hay một đoạn của văn bản
như đã thoả thuận trước sẽ thu được thông tin ngắn chính xác [8].
Với kỷ nguyên mới của cồng nghệ máy tính và mạng truyền thông, các
phương pháp giấu tin truyền thống không còn ý nghĩa nữa. Tuy nhiên những
ý tưởng từ thời xưa cũng là một gợi ý đáng giá cho việc nghiên cứu và phát
triển các kỹ thuật giấu dữ liệu sau này.
Giấu dữ liệu trong một dữ liệu khác được bắt đầu nghiên cứu cách đây
không lâu. Năm 1992 có 2 bài viết công bố, năm 1996 có 29 bài, năm 1998
có 103 bài [7]. Năm 2000 các công trình nghiên cứu đã công bố lên đến
hàng ngàn. Cho đến nay đã có 5 hội nghị quốc tế về giấu dữ liệu. Lĩnh vực
này còn mới và đang phát triển với tốc độ cao, hơn 90% các thành tựu đạt
được trong vòng 6 năm qua.
Đã có nhiều thuật toán công bố dùng để giấu dữ liệu trong ảnh hai mức
được đánh giá tốt [18]. Việc giấu dữ liệu dùng khá phổ biến trên Internet với

nhiều mục đích khác nhau. Khai thác dữ liệu multimedia: ảnh, âm thanh,
phim dùng làm môi trường giấu tin có nhiều thuận lợi. Đặc biệt là các ảnh có
số màu cao cho phép giấu một lượng lớn thông tin mà chất lượng ảnh thay
đổi không đáng kể, kỹ thuật giấu đơn giản, độ bảo mật và an toàn cao. Mặt
9
khác để bảo vệ bản quyền các ảnh số nếu sử dụng mã hoá hoặc chữ ký điện
tử sẽ làm biến dạng ảnh, giấu dữ liệu để xác định bản quyền các bức ảnh
cũng là vấn đề đang được quan tâm.
Có nhiều hướng tiếp cận lĩnh vực này:
- Hướng lý thuyết nghiên cứu xây dựng mô hình toán học giấu dữ liệu,
tính toán giá trị giới hạn dung lượng giấu thông tin trong các môi trường
khác nhau [ 13, 14].
- Nghiên cứu phương pháp phát hiện tệp dữ liệu có mang thông tin đã
giấu [10, 11].
- Hướng thực nghiệm nghiên cứu lược đồ, thuật toán nhằm tăng độ mật
[7, 12], tăng dung lượng [18], hoặc tăng độ bền vững của thông tin được giấu
[9, 15, 16]. Xây dựng các thuật toán giấu và phục hổi thông tin đầy đủ, khả
năng tấn công của đối phương để lấy các thông tin bị giấu là phức tạp, không
thể thực hiện được trong thời gian đa thức.
Tại Việt Nam thời gian qua có một vài tác giả đã nghiên cứu về lĩnh vực
này và thu được một số kết quả. Tuy nhiên các kết quả thu được mới chỉ là
bước đầu, giúp làm cơ sở nền tảng nghiên cứu tiếp.
Vương Mai Phương trong khoá luận tốt nghiệp cử nhân [4] đã sử dụng
thuật toán của Y.Y. Chen, Y. Tseng và H.K Pan [18] để giấu thông tin vào
ảnh màu, tác giả đưa ra một số kết quả có tính thực tiễn.
Nguyễn Anh Quân trong luận văn tốt nghiệp thạc sỹ [5] đã so sánh một
số thuật toán giấu tin, cải tiến kỹ thuật giấu để tăng lượng thông tin giấu.
Tuy nhiên các tác giả giải quyết chưa trọn vẹn, vẫn còn nhiều hướng
phát triển. Giải quyết chủ yếu tập trung theo hướng tăng dung lượng và tính
vô hình của dữ liệu được giấu, chưa đề cập đến tính bền vững của dữ liệu

được giấu.
1 0
Luận văn này phát triến tiếp các kết quả và tìm hiểu kỹ thuật giấu dữ
liệu theo hướng bền vững.
1.2. Bài toán giấu dữ liệu trong dữ liệu khác
Bài toán: Nhúng (ẩn) một dữ liệu (gọi là dữ liệu giấu) vào một dữ liệu
khác (gọi môi trường hay vật mang) mà không làm thay đổi định dạng, tính
chất, nội dung, dung lượng của dữ liệu môi trường. Dữ liệu được giấu phải có
khả năng hồi phục lại chính xác và đầy đủ khi cần bởi một công cụ riêng.
Môi trường không bị thay đổi hoặc thay đổi dưới mức cảm nhận bằng giác
quan của con người.
Dữ liệu giấu không có quan hệ gì với môi trường, đôi khi là các thông
điệp cung cấp thông tin quan trọng về môi trường như: thông tin về nội dung,
quyền truy nhập, tác giả
Mỗi kỹ thuật giấu dữ liệu bao gồm:
• Thuật toán nhúng ( Embedding algorithm)
• Hàm xác định (Detector function)
Sơ đồ tổng quát của việc giấu dữ liệu
Dữ liêu Dữ liêu
cần giấu đã giấu
Khoá
Môi
Khoá
trường
Hình 1: Sơ đồ giấu dữ liệu tổng quát
11
Thuật toán nhúng dùng để giấu các dữ liệu cần bí mật vào trong môi
trường. Quá trình nhúng được bảo vệ bởi khoá vì vậy chỉ có những người có
khoá (bí mật) mới có thể truy nhập dữ liệu đã giấu.
Hàm xác định được áp vào vật mang, cùng với khoá được cung cấp sẽ

tách đầy đủ dữ liệu giấu.
Cần phải chọn dữ liệu môi trường như thế nào để thoả mãn các điều
kiện bài toán đưa ra. Cảm nhận ảnh bằng thị giác phụ thuộc vào nhiều yếu tố:
độ sáng, tối, đậm, nhạt, độ tương phản màu. Nếu thay đổi màu sắc ở một vài
điểm ảnh trong một ngưỡng cho phép thì thị giác không phát hiện được, dung
lượng tệp ảnh không thay đổi. Đó là lý do tại sao lại chọn ảnh làm môi
trường giấu tin.
Giấu dữ liệu trong ảnh là lĩnh vực kết hợp chặt chẽ giữa xử lý tín hiệu và
xử lý hình ảnh dựa trên các kỹ thuật mã mật, nguyên lý truyền tin, nguyên lý
mã hoá, nén tín hiệu và nguyên lý cảm nhận thị giác (theory of visual
perception).
Luận văn tập trung tìm hiểu các kỹ thuật giấu dữ liệu trên môi trường
ảnh tĩnh , dạng file ảnh *.bmp.
1.3. Phân loại lược đồ giấu dữ liệu trong m ôi trường ảnh
Phụ thuộc vào dạng dữ liệu cần giấu và các lĩnh vực ứng dụng có thể
chia lược đồ giấu dữ liệu thành 2 loại:
+ Giấu không bền vững ( non robust).
+ Giấu bền vững (robust).
1 2
Sở dĩ gọi là giấu không bền vì dữ liệu sau khi nhúng vào ảnh có thể bị
mất nếu ảnh mang tin bị tác động bởi các phép xử lý ảnh thông thường như:
nén mất mát thông tin, lọc, quay,
Lược đồ này thường được sử dụng trong truyền thông bí mât gọi là
“steganography”.
Đặc điểm của lược đồ giấu không bền vững:
+ Không thể nhìn thấy dữ liệu ẩn trong ảnh, có nghĩa là hệ thống cảm
nhận bằng thị giác không phát hiện được sự khác biệt giữa ảnh gốc và ảnh đã
được nhúng
dữ liệu.
+ Có thể kết hợp một số kỹ thuật: thay đổi điểm ảnh, kiến thức về

nhiễu ảnh để tăng độ mật đồng thời tăng dung lượng dữ liệu cần giấu.
+ Có khả năng trả lại nguyên vẹn dữ liệu đã giấu trong quá trình phục
hồi mà không cần ảnh gốc.
Steganography được ứng dụng nhiều trong thực tế, dữ liệu giấu có thể
là dạng số hóa bất kỳ: ảnh, âm thanh, văn bản Môi trường dùng để giấu
cũng phong phú: ảnh, video số, âm thanh số và ngày càng tìm ra nhiều môi
trường mới. Tuy nhiên dữ liệu trước khi giấu có thể được mã hóa, nếu bị phát
hiện thì đây mới là thời điểm bắt đầu của quá trình thám mã.
Các phần mềm thương mại cung cấp dịch vụ steganography
Những gói phần mềm sau đã được thử nghiệm cho việc giấu dữ liệu
trong ảnh: Hide and Seek v4.1, StegoDos v0.90a, White Noise Storm và S-
Tools for Windows. Gần như tất cả các tác giả đều mã hóa dữ liệu trước khi
giấu chúng trong ảnh và xem lại ảnh kết quả (ảnh đã được nhúng dữ liệu).
Hide and Seek v4.1
1.3.1. Giấu không bền vững
13
Hide and Seek v4.1 (và 5.0) được viết bởi Colin Maroney, chạy trên
DOS, sử dụng những ảnh kích thước nhỏ (320 X 480). Trong phiên bản 1.0
dùng cho Windows 95 vấn đề kích thước ảnh đã giải quyết.
Hide and Seek 4.1 là phần mềm miễn phí dùng để nhúng dữ liệu vào
ảnh GIF. Phần mềm này sử dụng các bit trọng số nhỏ (LSB) làm nơi chứa dữ
liệu. Dữ liệu trước khi giấu được mã hóa và vị trí nhúng được chọn theo quy
luật giả ngẫu nhiên.
StegoDos
StegoDos v0.90a được viết bởi một nhóm người giấu tên (bí danh Black
Wolf), chạy trên DOS, khó và phức tạp khi sử dụng. Phần mềm này chỉ làm
việc với ảnh 320x200x256 màu.
Jpeg-Jsteg v4
Có thể xem đây là ý tưởng của tập đoàn Independent JPEG (IJPG).
Cũng giống như mật mã, steganography phải có khả năng trả lại nguyên vẹn

dữ liệu giấu trong quá trình hồi phục. Phải chăng nó chỉ được áp dụng cho
các loại tệp chỉ chịu nén không tổn hao thông tin? Chẳng hạn, các tệp ảnh
JPG sử dụng mã hóa có tổn hao thông tin thì dường như không thể thực hiện
steganography với những hình ảnh như vậy. Định dạng JFIF của tập đoàn
IJPG cho phép sửa đổi 1 bit trong quá trình mã. Phần mềm Jpeg - Jsteg với
mã nguồn và những chỉ dẫn để biên tập các ứng dụng giấu thông tin dựa trên
nhiều nền tảng khác nhau.
Theo IJPG, khuôn dạng JFIF được biên soạn để việc mã hoá tập tin được
thực hiện qua hai giai đoạn: giai đoạn tổn hao và giai đoạn không tổn hao
thông tin. Thông tin giấu có thể được chèn vào giữa hai giai đoạn này mà
không làm tổn hao hình ảnh. JPG có một lợi thế lớn mà những hình ảnh
khuôn dạng khác không thể có được, đặc biệt là việc sử dụng chúng trên
Internet, đó là dung lượng. Một ảnh kích thước 1073*790, 16 triệu màu có
14
thé được lưu trong một tệp kích thước chỉ 170 kilobyte. Cũng hình ảnh đó
nếu lưu trong ảnh kiểu bitmap phải cần tới khoảng 2 megabyte.
1.3.2. Giấu bền vững
Thường sử dụng trong các kỹ thuật nhúng thuỷ vân (watermark).
Nhúng một hình mờ (watermarking) hay còn gọi là thuỷ vân vào bức ảnh
dưới dạng bền vững. Bền vững được hiểu theo nghĩa khi ảnh chứa thuỷ vân bị
biến đổi thông qua các thao tác: nén mất mát dữ liệu, lọc, các phép biến đổi
hình học thì thuỷ vân vẫn còn nguyên vẹn theo một nghĩa nào đó. Như vậy
kỹ thuật watermark dùng để xác nhận bản quyền của bức ảnh.
Đặc điểm của các lược đồ giấu bền vững
+ Thuỷ vân phải bền vững và trong suốt khi được nhúng vào ảnh hoặc
sự hiện diện của nó không làm thay đổi chất lượng ảnh. Chí phát hiện được
sự hiện diện của thuỷ vân bởi một giải thuật biết trước.
+ Ảnh môi trường khi đã nhúng thuỷ vân phải sử dụng bình thường.
+ Kích thước của thuỷ vân từ vài bit đến vài nghìn bit.
Đối với kỹ thuật nhúng thuỷ vấn hướng nghiên cứu tập trung ở kỹ

thiuật tạo thuỷ vân để nó trong suốt và thuật toán nhúng đảm bảo tính bền
vững của thuỷ vân.
1.4. T huộc tính của các lược đồ giấu dữ liệu trong ảnh
Mỗi kỹ thuật giấu dữ liệu trong ảnh được đánh giá dựa trên một số
thỉuộc tính sau:
- Tính vô hình của dữ liệu giấu.
- Dung lượng dữ liệu giấu.
- Tính bảo mật của dữ liệu giấu.
- Tính chống phát hiện.
15
- Chất lượng của ảnh sau khi giấu dữ liệu.
- Tính bền vững.
- Tính đúng đắn.
1.4.1. Tính vô hình của dữ liệu giấu
Đối với các kỹ thuật giấu dữ liệu trong môi trường ảnh, tính vô hình
của dữ liệu giấu dựa trên đặc điểm của hệ thống thị giác con người. Dữ liệu
nhúng vào môi trường là không tri giác được nếu một người với thị giác bình
thường không phân biệt được sự khác nhau giữa ảnh gốc và ảnh đã mang tin.
Sự khác nhau thể hiện: chất lượng ảnh, dung lượng tệp ảnh. Trong khi
steganography yêu cầu tính vô hình của dữ liệu giấu ở một mức độ cao thì
watermark lại chỉ yêu cầu ở một cấp độ nhất định.
Để kiểm tra tính khác nhau giữa ảnh gốc và ảnh đã mang tin thường sử
dụng thí nghiệm kiểm tra mù. Lấy ngẫu nhiên một lượng lớn các ảnh có và
không có thông tin ẩn. Yêu cầu người được thí nghiệm xác định ảnh nào có
chứa thông tin ẩn. Nếu tỷ lệ trả lời đúng nhỏ hơn 50% thì kết luận hai loại
ảnh giống nhau.
1.4.2. Dung lượng dữ liệu giấu
Lượng dữ liệu giấu so với kích thước ảnh môi trường cũng là một vấn
đề cần quan tâm trong mỗi thuật toán giấu tin. Rõ ràng là có thể chỉ giấu một
bit thông tin vào ảnh mà không cần lo lắng về độ nhiễu của ảnh, nhưng như

vậy hiệu quả sẽ thấp.
Nếu như trong các ứng dụng watermark chỉ giấu một lượng thông tin
đủ nhỏ so với dữ liệu môi trường thì steganography vấn đề quan tâm hàng
đầu là đảm bảo truyền thông tin bí mật trên một dữ liệu môi trường công
khai. Việc truyền tin sẽ có lợi nếu như tỷ lệ giữa dung lượng dữ liệu giấu với
dung lượng dữ liệu môi trường càng lớn càng tốt.
16
Với mục đích tăng dung lượng giấu tin đã có nhiều công trình nghiên
cứu [14] sử dụng các công cụ lý thuyết để xây dựng thuật toán sau đó phân
tích khả năng giấu tin. Một số khác bằng thực nghiệm đề xuất phương pháp
giấu nhằm tăng dung lượng giấu tin cho một số ứng dụng cụ thể [16].
Tóm lại các thuật toán đều cố gắng đạt được mục đích làm thế nào để
giấu càng nhiều thông tin càng tốt nhưng nhiễu gây ra phải nằm trong mức
chấp nhận được, phù với các mô hình nhiễu.
1.4.3. Tính bảo mật của dữ liệu giấu
Tính bảo mật của thuật toán giấu dữ liệu thể hiện ở chỗ dữ liệu giấu
không thể lấy đầy đủ khi bị tấn công có chủ đích trên cơ sở có ảnh đã mang
tin và hiểu biết đầy đủ về thuật toán giấu, thuật toán tách dữ liệu nhưng
không biết khoá (bí mật). Đối với steganography đây là một yêu cầu quan
trọng các kỹ thuật giấu tin cần quan tâm đến.
1.4.4. Tính chống phát hiện
Ta nói dữ liệu giấu là chống phát hiện nếu kẻ tấn công có ảnh nguồn,
bằng một cách nào đó hắn có thể xác định được sự có mặt của dữ liệu đã giấu
trong bức ảnh nhưng không có nghĩa là lấy được đầy đủ các dữ liệu này.
Như vậy nghiên cứu về khả năng bị tấn công hoặc các phương pháp tấn
công có ý nghĩa rất quan trọng trong các kỹ thuật giấu tin. Các tác giả [13,
14] trên cơ sở nghiên cứu tấn công đã đưa ra nhiều giải pháp chống tấn công
hữu hiệu.
Tấn công được chia thành hai lĩnh vực sau:
+ Người tấn công tìm cách vô hiệu hóa hoặc hủy bỏ, làm sai lệch dữ

liệu giấu. Như vậy khi nhận dù có công cụ, khóa vẫn không tách dữ liệu
chính xác. Loại này không nguy hiểm lắm.
17
+ Người tấn công tìm cách lấy dữ liệu giấu trong môi trường đã mang
tin. Các kỹ thuật giấu thường quan tâm đến loại tấn công này vì các dữ liệu
cần giấu thường có nhu cầu bảo mật hoàn toàn.
1.4.5. Chất lượng ảnh sau khi giấu tin
Chất lượng ảnh sau khi giấu tin thể hiện ở độ sai lệch giữa ảnh gốc và
ảnh đã mang tin. Thông thường độ nhiễu của ảnh tỷ lệ thuận với dung lượng
dữ liệu giấu. Nếu ảnh bị nhiễu nhiều ảnh hưởng đến tính vô hình của thông
tin giấu. Các kỹ thuật đều nghiên cứu theo hướng làm thay đổi ít nhất các bit
trong ảnh môi trường hoặc chọn các bit đặc biệt để giảm độ nhiễu của ảnh.
1.4.6. Tính bền vững
Dữ liệu nhúng gọi là bền vững nếu sự hiện diện của nó được xác định
chắc chắn khi ảnh mang tin bị tác động bởi các phép biến đổi thông dụng
như: lọc gờ, lọc trung vị, nén mất mát thông tin, điều chỉnh tương phản, hiệu
chỉnh độ sáng tối, lấy mẫu, tô màu lại, tỷ lệ, quay, xén, in, sao chép, Tính
bền vững không bao gồm các tấn công có chủ định trên các thuật toán giấu,
tính bền vững chỉ chống lại các thao tác xử lý ảnh thông dụng.
Đối với giấu bí mật không quan tâm đến tính bền vững nhưng nhúng
thuỷ vân lại đặc biệt chú trọng đến đặc tính này.
1.4.7. Tính đúng của thuật toán
Thuật toán phải thể hiện được sự đúng đắn, cụ thể với dữ liệu vào cho
trước, thuật toán họat động sau một số hữu hạn bước sẽ dừng và cho kết quả
mong muốn. Dữ liệu giấu khi tách ra phải đầy đủ, chính xác.
Các tiêu chuẩn trên cạnh tranh lãn nhau, không thể cùng một lúc muốn
giấu dữ liệu lớn trong một bức ảnh mà lại yêu cầu chống phát hiện tuyệt đối
và bền vững. Muốn tăng dung lượng giấu thì ảnh hưởng đến chất lượng ảnh.
Sự xung đột này được mô tả trong hình sau:
r Đ Ạ H c c o ụ p c GIA HÀ NỘI Ị

' TCHiNGTÂMT‘,r;>:íf:> Hh. • HU v ị
Mo" V -L O / ¿ 0 3
18
Dung lượng
Muốn đảm bảo tính bền vững thì thông tin được giấu không thể quá
dài. Do vậy tuỳ theo tính chất của từng ứng dụng mà thoả hiệp hợp lý các
tiêu chuẩn đặt ra.
1.5. M ột số lĩnh vực ứng dụng giấu dữ liệu
1.5.1. Che giấu việc truyền thông bằng các ảnh
Một điệp viên muốn gửi một thông điệp ra bên ngoài, anh ta cần sử
dụng một kênh truyền thông hợp lệ để gửi. Giả sử kênh truyền thông này
đang bị theo dõi. Nếu gửi một thông điệp mã hoá sẽ làm tăng tính nghi ngờ
và có khả năng dẫn đến bị cắt truy cập tới hạ tầng truyền thông. Có thể sử
dụng giao thức truyền thông bí mật (steganography) để gửi thông điệp đi.
1.5.2. Bảo vệ bản quyền của các ảnh sô
Tác giả của một ảnh số muốn “ ký” vào bức ảnh để người khác không
thể giành được quyền tác giả. Chữ ký không thể nối thêm vào file ảnh, cũng
không thể đóng dấu rõ ràng trên bức ảnh vì như vậy chữ ký dễ dàng bị thay đổi
hoặc tẩy xoá. Chữ ký điện tử kiểu mã mật không áp dụng được vì người khác
cần xem bức ảnh và chúng phải được lưu hành đơn giản. Trong trường hợp
này nên sử dụng thuỷ vân có tính vô hình, bảo mật, bền vững giấu trong ảnh.
19
Giả sử tác giả có ảnh gốc I, sau khi giấu “thuỷ vân” vào được w và
cho lưu hành. Để chứng minh ảnh W ’ hay một phần của nó bị sao chép bất
hợp pháp từ w . Tác giả chỉ cần chỉ ra trong W ’ có “ thuỷ vân” của anh ta.
Do đặc tính bền vững của thuỷ vân nên khó có thể xoá được nó ra khỏi ảnh
sao chép, trong khi đó tác giả có thể đưa ra một ảnh không có “thuỷ vân” từ
ảnh w \ Vì vậy quyền sở hữu của anh ta được bảo vệ theo pháp luật.
1.5.3. Điểm chỉ số
“ Thuỷ vân” có thể dùng để xác định những người mua hợp pháp sản

phẩm kỹ thuật số. Các thông tin về chủ nhân hợp pháp được cấy trong dữ liệu
và được các thiết bị tự động phát hiện vào lúc cần thiết.
2 0
K ỹ t h u ậ t g iấ u d ữ liệ u t r o n g ả n h t ĩ n h
Như đã trình bày kỹ thuật giấu tin sẽ nhúng dữ liệu trực tiếp vào dữ
liệu ảnh, cụ thể là điểm ảnh. Do đó các ảnh biểu diễn dưới dạng điểm ảnh
cho phép tãng khả năng giấu tin. Ảnh Bitmap đối tượng lưu trữ là bản đồ
điểm ảnh, một số loại ảnh có cấu trúc kiểu Bitmap: BMP, IMG, PCX, TIFF,
TG A, GIF Định dạng BMP là cơ bản, các định dạng khác về lun trữ tốt
hơn và có thể chuyển được sang BMP hoặc ngược lại. Phần này chủ yếu trình
bày định dạng BMP.
Định dạng BMP
File ảnh dạng BMP được windows hiển thị trên bất kỳ thiết bị nào. Cấu
trúc file ảnh BMP gồm ba phần:
* BitmapHeader : gồm 54 byte chứa các thông số quan trọng.
* Palette color : định nghĩa các màu dùng trong ảnh có loại không
có bảng màu.
* BitmapData : Chứa giá trị màu của điểm ảnh.
• BitmapHeader:
Chương 2
2.1. Cấu trúc ảnh B M P
Bảng cấu trúc header của file ảnh dạng BMP
Vị trí
(byte)
Ký hiệu và kích thước
Giải thích
1-2
WORD Type;
Ký hiệu định dạng thường là "BM" hoặc
3-6

DWORD Size;
Kích thước ảnh tính bằng số byte.
7-10
DWORD Reserved;
Dự phòng, thường dặt bằng 0.
11-14
DWORD Offset;
Địa chỉ offset bắt đầu vùng dữ liệu.
15-18
DWORD headerSize;
Kích thước vùng thông tin, 40 byte.
21
19-22
DWORD Width; Độ rộng tính bằng số pixel.
23-26
DWORD Height;
Chiều cao tính bằng số pixel.
27-28
WORD Planes;
Số bảng màu, đặt bằng 1.
29-30
WORD BitsPerPixel;
Số bit trong 1 điểm ảnh.
31-34
DWORD Compression;
Kiểu nén.
35-38
DWORD Sizelmage;
Kích thước ảnh tính bằng số byte.
39-42

DWORD XPixelsPerMeter;
Độ phân giải ngang, tính pixel /meter
43-46
DWORD YPixelsPerMeter; Độ phân giải dọc, tính pixel /meter
47-50
DWORD ColorsUsed; Số màu được dùng trong ảnh loại ảnh
51-54
DWORD Colorslmpo;
Số màu quan trọng sử dụng trong ảnh.
+ B itsP erP ix el: số b it lư u trữ m ộ t đ iể m ản h.
= 1 : ảnh 2 m ức (trắng , đ en).
= 4: ản h 16 m àu.
= 8: ản h đ a cấ p x ám h o ặc ảnh 2 56 m àu.
= 16: ản h h i_ colo r.
= 24: ảnh tru e_c olo r.
+ C om pression: kiểu nén
= 0: không nén .
= 1: Nén runlength 8 bit/pixel.
= 2: N én runlength 4 bit/pixel.
+ ColorU sed: xác định số màu thực sự được dùn g trong ảnh nếu giá trị
này bằng 0 có nghĩa ảnh sử dụng tất cả các m àu tro ng b ản g m àu.
• P alette color: còn gọi là bảng m àu. N hữ ng ảnh có số bit lưu trữ m ột
điểm ảnh nhỏ hơn hoặc bằng 8 m ới có bảng m àu.
Cấu trúc mốt phần tử irons bảng màu:
T ypedef struct TagRG B
2 2
BY TE Blue; /* tỷ lệ m àu Blue*/
BY TE G reen; /* tỷ lệ m àu G reen*/
BY TE Red; /* tỷ lệ m àu Blue */
BY TE U nused / *không dùng đặt bằng 0*/

}
Bảng m àu là một m ảng có kiểu TagRG B
+ Ánh 2 bit/pixel hay còn gọi là ảnh đen trắng, bảng m àu có 2 phần tử.
Nếu pixel là điểm đen có giá trị m àu chỉ vào phần tử thứ nhất, ngược lại có
giá trị m àu chỉ vào phần tử thứ hai của bảng màu.
+ Ảnh 4 bit/pixel tối đa có 16 m àu, mỗi điểm ảnh chiếm 4 bit liên tiếp.
Bảng m àu là m ảng có 16 phần tử tính từ 0.
V í d u: Bảng m àu của ảnh 16 m àu:
Giá trị Pixel
Blue Green Red Unused
[0000]
84 252
84
0
[0001] 252 252 84 0
[0010]
84 84
252
0
[0011]
252 84 •252
0
[0100] 84
252
252 0
[0101] 252
252 252 0
[0110] 0 0 0 0
[0111]
168 0 0 0

[1000]
0
168
0 0
[1001]
168 168
0
0
[1010] 0
0
168 0
[1011] 168 0 168
0
[1100] 0
168
168 0
[1101]
168 168
168
0
[1110] 84 84 84 0
[1111] 252
84
84 0

×