Tải bản đầy đủ (.pdf) (68 trang)

Nghiên cứu thuật toán giấu tin mật trên miền không gian của ảnh bitmap (LV thạc sĩ)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.55 MB, 68 trang )

i

ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

HOÀNG XUÂN LONG

NGHIÊN CỨU THUẬT TOÁN GIẤU TIN MẬT
TRÊN MIỀN KHÔNG GIAN CỦA ẢNH BITMAP

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Số hóa bởi Trung tâm Học liệuTHÁI
– ĐHTN
NGUYÊN


- 2015


ii

LỜI CAM ĐOAN
Với mục đích nghiên cứu, tìm hiểu để nâng cao kiến thức và trình độ
chuyên môn để áp dụng trong các bài toán cụ thể trong tƣơng lai nên tôi đã
làm luận văn này một cách nghiêm túc và hoàn toàn trung thực. Nội dung
luận văn do tự tôi tìm hiểu và hoàn thành.
Trong luận văn, tôi có sử dụng tài liệu tham khảo của một số tác giả trong
và ngoài nƣớc để hoàn thành luận văn đƣợc nêu ở phần tài liệu tham khảo.
Tôi xin cam đoan và chịu trách nhiệm về nội dung, sự trung thực trong
luận văn tốt nghiệp Thạc sỹ của mình.


Thái Nguyên, tháng 6 năm 2015
Học viên

HOÀNG XUÂN LONG

Số hóa bởi Trung tâm Học liệu – ĐHTN




iii

LỜI CẢM ƠN
Những kiến thức căn bản trong luận văn này là kết quả của quá trình tự
nghiên cứu trong quá trình công tác và hai năm học Thạc sỹ (2012 - 2014) tại
Trƣờng Đại học Công nghệ thông tin và Truyền thông Thái Nguyên. Dƣới sự
giảng dạy, đào tạo và dìu dắt trực tiếp của các thầy cô trong trƣờng và Viện
Công nghệ thông tin Việt Nam.
Tôi xin bày tỏ lời cảm ơn chân thành tới các thầy cô trong Khoa Công
nghệ thông tin, Phòng Đào tạo, Phòng Công tác học sinh sinh viên, Phòng Đào
tạo sau đại học Trƣờng Đại học Công nghệ thông tin và Truyền thông Thái
Nguyên, đã tạo điều kiện thuận lợi cho tôi trong thời gian học tập tại trƣờng.
Tôi xin bày tỏ lòng biết ơn chân thành, lời cảm ơn sâu sắc nhất đối với
thầy giáo TS Hồ Văn Canh đã trực tiếp hƣớng dẫn, định hƣớng cho tôi giải
quyết các vấn đề trong luận văn.
Tôi cũng xin cảm ơn đến ngƣời thân, bạn bè và các bạn đồng môn lớp cao
học khóa 11, đã ủng hộ và giúp đỡ tôi trong quá trình làm luận văn tốt nghiệp.
Thái Nguyên, ngày 20 tháng 6 năm 2015
Học viên


Hoàng Xuân Long

Số hóa bởi Trung tâm Học liệu – ĐHTN




iv

N HĨA KHOA HỌC CỦA ĐỀ TÀI
Giấu tin là một lĩnh vực nghiên cứu rộng, môi trƣờng giấu tin đa dạng,
các phƣơng pháp giấu tin trong môi trƣờng ảnh chủ yếu tập trung nhiều vào
việc giấu tin trong các bit có trọng số thấp. Luận văn này đã tìm hiểu, phân
tích một số thuật toán giấu tin trong ảnh đen trắng, ảnh đa cấp xám và ảnh
mầu bitmap 24 bit.
Mặt khác, luận văn cũng nghiên cứu và đề xuất một phƣơng pháp mã
hóa thông tin sử dụng ma trận trên kích thƣớc 8x8 và tính chất nghịch đảo của
ma trận để sinh khóa mã và khóa giải mã. Phƣơng pháp này có ƣu điểm, cho
phép ngƣời nhận tin mật sử dụng tính chất ma trận nghịch đảo A-1 để mã hóa,
gửi tin cho trung tâm mà không cần phải biết ma trận A.
Luận văn đã xây dựng đƣợc chƣơng trình giấu tin mật trên miền không
gian ảnh bimap ứng dụng một kỹ thuật giấu tin mới.
Hướng nghiên cứu tiếp theo: Để hoàn thiện hơn nữa chƣơng trình giấu
tin mật kết hợp với nén mã hóa, cần phải nghiên cứu giấu tin trong các loại
ảnh khác nhƣ: JPEG, TIF, GIF,...Và trên các môi trƣờng đa phƣơng tiện khác.

Số hóa bởi Trung tâm Học liệu – ĐHTN





v

MỤC LỤC
LỜI CAM ĐOAN .............................................................................................. i
LỜI CẢM ƠN .................................................................................................. iii
NGH A KHOA HỌC CỦA ĐỀ TÀI ........................................................... iv
MỤC LỤC ......................................................................................................... v
DANH MỤC CHỮ CÁI VIẾT TẮT............................................................... vii
DANH MỤC CÁC BẢNG............................................................................. viii
DANH MỤC CÁC HÌNH VẼ ......................................................................... ix
LỜI NÓI ĐẦU .................................................................................................. 1
CHƢƠNG 1: NGHIÊN CỨU TỔNG QUAN VỀ L NH VỰC GIẤU TIN ..... 3
1.1. Tổng quan về giấu tin............................................................................ 3
1.1.1. Định nghĩa ....................................................................................... 3
1.1.2. Vài nét về lịch sử giấu tin................................................................ 3
1.1.3. Mục đích của giấu tin ...................................................................... 4
1.1.4. Mô hình kỹ thuật giấu thông tin cơ bản. ......................................... 5
1.1.5. Phân loại giấu tin. ............................................................................ 7
1.2. Giấu tin trong ảnh................................................................................ 10
1.3. Tổng quan ảnh BITMAP (BMP). ....................................................... 11
1.3.1. Giới thiệu ảnh BITMAP (BMP). .................................................. 11
1.3.2. Cấu trúc ảnh BITMAP (BMP). ..................................................... 12
CHƢƠNG 2: NGHIÊN CỨU, PHÂN TÍCH VÀ TÌM HIỂU MỘT SỐ THUẬT
TOÁN GIẤU TIN ............................................................................................ 17
2.1. Các kỹ thuật giấu tin. .......................................................................... 17
2.1.1. Kỹ thuật giấu tin LSB. .................................................................. 17
2.1.2. Kỹ thuật giấu tin theo khối bit....................................................... 19
2.1.3. Kỹ thuật giấu tin Wu-Lee. ............................................................. 20
2.1.4. Thuật toán Chen-Pan-Tseng.......................................................... 21

Số hóa bởi Trung tâm Học liệu – ĐHTN




vi

2.1.5. Kỹ thuật giấu tin SES. ................................................................... 24
2.2. Lý thuyết đại số và ứng dụng cải tiến kỹ thuật giấu tin LSB [2]: ....... 29
2.2.1. Lý thuyết ma trận tam giác: .......................................................... 29
2.2.2. Lý thuyết về trƣờng hữu hạn và không gian vector [6]. ............... 35
2.2.3. Ứng dụng lý thuyết trên vào giấu tin. ........................................... 42
CHƢƠNG 3: ỨNG DỤNG KỸ THUẬT GIẤU TIN MỚI XÂY DỰNG
CHƢƠNG TRÌNH DEMO GIẤU TIN TRONG ẢNH BITMAP 24BIT ...... 48
3.1. Xây dựng chƣơng trình demo. ............................................................ 48
3.1.1. Môi trƣờng thử nghiệm: ................................................................ 48
3.1.2. Tổ chức thực hiện chƣơng trình: ................................................... 48
3.1.3. Giao diện chƣơng trình: ................................................................ 49
3.2. Ƣu điểm & Nhƣợc điểm...................................................................... 52
3.2.1. Ƣu điểm ......................................................................................... 52
3.2.2. Nhƣợc điểm ................................................................................... 53
3.3. Lý thuyết độ trùng khớp. ..................................................................... 54
KẾT LUẬN ..................................................................................................... 57
TÀI LIỆU THAM KHẢO ............................................................................... 59

Số hóa bởi Trung tâm Học liệu – ĐHTN





vii

DANH MỤC CHỮ CÁI VIẾT TẮT

BMP

Ảnh Bitmap

LSB

Least significant bit

SES

Steganography Evading analyses

RS

Regular Singular

Số hóa bởi Trung tâm Học liệu – ĐHTN




viii

DANH MỤC CÁC BẢNG
Bảng 1.1 Chi tiết khối bytes tiêu đề tập tin BMP. .......................................................13
Bảng 1.2 dƣới đây miêu tả chi tiết khối bytes thông tin tập tin BMP. ................14

Bảng 2.1 Bộ mã hóa .................................................................................................................42
Bảng 2.2 Bảng chuyển đổi ký tự sang nhị phân. ..........................................................46

Số hóa bởi Trung tâm Học liệu – ĐHTN




ix

DANH MỤC CÁC HÌNH VẼ
Hình 1.1: Hai lĩnh vực chính của kỹ thuật giấu thông tin ........................................... 5
Hình 1.2: Lƣợc đồ chung cho quá trình giấu tin............................................................. 6
Hình 1.3: Lƣợc đồ chung cho quá trình giải mã ............................................................. 7
Hình 1.4: Phân loại các kỹ thuật giấu tin. ......................................................................... 9
Hình 2.1: Sơ đồ giấu tin SES. ..............................................................................................26
Hình 2.2: Sơ đồ tách tin SES ................................................................................................28
Hình 3.1: Giao diện giới thiệu..............................................................................................50
Hình 3.2: Chƣơng trình giấu tin ..........................................................................................51
Hình 3.3: Ảnh gốc chƣa giấu tin .........................................................................................52
Hình 3.4: Ảnh đã giấu tin .......................................................................................................52

Số hóa bởi Trung tâm Học liệu – ĐHTN




1

LỜI NÓI ĐẦU

Trong những năm qua, chúng ta chứng kiến sự tiến bộ mạnh mẽ của khoa
học - công nghệ nói chung và ngành Công nghệ thông tin nói riêng. Hƣởng lợi
từ những kết quả đó, không chỉ trong lĩnh vực dân sự, mà trong lĩnh vực An
ninh - Quốc phòng, cũng tận dụng tối đa những thành tựu của ngành Công nghệ
thông tin để phục vụ yêu cầu công tác. Cùng với sự phát triển mạnh mẽ của
ngành khoa học công nghệ thông tin, internet đã trở thành một nhu cầu, phƣơng
tiện không thể thiếu đối với mọi ngƣời, việc truyền tin qua mạng ngày càng lớn.
Tuy nhiên, với lƣợng thông tin đƣợc truyền qua mạng nhiều hơn thì nguy cơ dữ
liệu bị truy cập trái phép cũng tăng lên vì vậy vấn đề bảo đảm an toàn và bảo
mật thông tin cho dữ liệu truyền trên mạng là rất cần thiết.
Để đảm bảo an toàn và bí mật cho một thông điệp truyền đi ngƣời ta
thƣờng dùng phƣơng pháp truyền thống là mã hóa thông điệp theo một qui tắc
nào đó đã đƣợc thỏa thuận trƣớc giữa ngƣời gửi và ngƣời nhận. Tuy nhiên,
phƣơng thức này thƣờng gây sự chú ý của đối phƣơng về tầm quan trọng của
thông điệp. Thời gian gần đây đã xuất hiện một cách tiếp cận mới để truyền các
thông điệp bí mật, đó là giấu các thông tin quan trọng trong những bức ảnh.
Nhìn bề ngoài các bức ảnh có chứa thông tin cũng không có gì khác với các bức
ảnh khác nên hạn chế đƣợc tầm kiểm soát của đối phƣơng. Mặt khác, dù các
bức ảnh đó bị phát hiện ra là có chứa thông tin trong đó thì với các khóa có độ
bảo mật cao thì việc tìm đƣợc nội dung của thông tin đó cũng rất khó có thể
thực hiện đƣợc.
Xét theo khía cạnh tổng quát thì giấu thông tin cũng là một hệ mã mật
nhằm bảo đảm tính an toàn thông tin, nhƣng phƣơng pháp này ƣu điểm là ở chỗ
giảm đƣợc khả năng phát hiện đƣợc sự tồn tại của thông tin trong nguồn mang.
Không giống nhƣ mã hóa thông tin là chống sự truy cập và sửa chữa một cách
trái phép thông tin, mục tiêu của giấu thông tin là làm cho thông tin trộn lẫn với
Số hóa bởi Trung tâm Học liệu – ĐHTN





2

các điểm ảnh. Điều này sẽ đánh lừa đƣợc sự phát hiện của các tin tặc và do đó
làm giảm khả năng bị giải mã.
Xuất phát từ thực tiễn và yêu cầu công tác của ngành công an, một mặt
phải tìm hiểu phƣơng pháp phân tích những thông tin bí mật, phƣơng thức liên
lạc mà đối tƣợng che giấu. Mặt khác, cũng phải nghiên cứu phƣơng pháp bảo vệ
kênh liên lạc phục vụ công tác nghiệp vụ của lực lƣợng bí mật.
Vì vậy, tên đề tài đƣợc chọn là:

“Nghiên cứu thuật toán giấu tin mật trên miền không gian của ảnh bitmap.”
Trong luận văn này, dự kiến tập trung nghiên cứu và giải quyết những
vấn đề cụ thể sau:
Chương 1. Nghiên cứu tổng quan về lĩnh vực giấu tin.
Chương 2. Nghiên cứu, phân tích và tìm hiểu một số thuật toán giấu tin
trong ảnh tĩnh.
Chương 3. Ứng dụng kỹ thuật giấu tin mới, xây dựng chương trình demo
giấu tin trong ảnh bitmap 24bit.

Số hóa bởi Trung tâm Học liệu – ĐHTN




3

CHƢƠN

1: NGHIÊN CỨU TỔNG QUAN VỀ LĨNH VỰC

GIẤU TIN

1.1. Tổng quan về giấu tin.
1.1.1. Định nghĩa
Giấu thông tin là một kỹ thuật nhúng (giấu) một lƣợng thông tin số nào
đó vào trong một đối tƣợng dữ liệu số khác.
Kỹ thuật giấu thông tin nhằm mục đích đảm bảo an toàn vào bảo mật
thông tin rõ ràng ở hai khía cạnh. Một là bảo mật cho giữ liệu đƣợc đem giấu,
hai là bảo mật cho chính đối tƣợng đƣợc dùng để giấu tin. Hai khía cạnh khác
nhau này dẫn đến hai khuynh hƣớng kỹ thuật chủ yếu của giấu tin. Khuynh
hƣớng thứ nhất là giấu tin mật (steganography). Khuynh hƣớng này tập trung
vào các kỹ thuật giấu tin sao cho thông tin giấu đƣợc nhiều và quan trọng là
ngƣời khác khó phát hiện đƣợc một đối tƣợng có bị giấu thông tin bên trong hay
không. Khuynh hƣớng thứ hai là thủy vân số (watermarking). Khuynh hƣớng
thủy vân số đánh giấu vào đối tƣợng nhằm khẳng định bản quyền sở hữu hay
phát hiện xuyên tạc thông tin. Thủy vân số có miền ứng dụng lớn hơn nên đƣợc
quan tâm nghiên cứu nhiều hơn và thực tế đã có nhiều những kỹ thuật dành cho
khuynh hƣớng này.
1.1.2. Vài nét về lịch sử giấu tin
Từ steganography bắt nguồn từ Hi Lạp và đƣợc sử dụng cho tới ngày
nay, nó có nghĩa là tài liệu đƣợc phủ (covered writing). Các câu chuyện kể về
kỹ thuật giấu tin đƣợc truyền qua nhiều thế hệ. Có lẽ những ghi chép sớm nhất
về kỹ thuật giấu thông tin thuộc về sử gia Hi Lạp là Herodotus. Khi bạo chúa Hi
Lạp Histiaeus bị vua Darius bắt giữ ở Susa vào thế kỷ thứ năm trƣớc Công
nguyên, ông ta đã gửi một thông báo bí mật cho con rể của mình là Aristagoras
ở Miletus. Histiaeus đã cạo trọc đầu của một nô lệ tin cậy và xăm một thông báo
trên da đầu của ngƣời nô lệ ấy. Khi tóc của ngƣời nô lệ này mọc đủ dài ngƣời
nô lệ đƣợc gửi tới Miletus.
Số hóa bởi Trung tâm Học liệu – ĐHTN





4

Một câu chuyện khác về thời Hi Lạp cổ đại cũng do Herodotus ghi lại.
Môi trƣờng để ghi văn bản chính là các viên thuốc đƣợc bọc trong sáp ong.
Demeratus, một ngƣời Hi Lạp, cần thông báo cho Sparta rằng Xerxes định xâm
chiếm Hi Lạp. Để tránh bị phát hiện, anh ta đã bọc lại các viên thuốc bằng một
lớp sáp mới. Những viên thuốc đƣợc để ngõ và lọt qua mọi sự kiểm tra một
cách dễ dàng.
Mực không màu là phƣơng tiện hữu hiệu cho bảo mật thông tin trong một
thời gian dài. Ngƣời Romans cổ đã biết sử dụng những chất sẵn có nhƣ nƣớc
quả, nƣớc tiểu và sữa dê để viết các thông báo bí mật giữa những hàng văn tự
thông thƣờng. Khi bị hơ nóng, những thứ mực không nhìn thấy này trở nên sẫm
màu và có thể đọc dễ dàng. Mực không màu cũng đƣợc sử dụng rất gần đây,
nhƣ trong thời gian chiến tranh Thế giới thứ II.
tƣởng về che giấu thông tin đã có từ hàng ngàn năm về trƣớc nhƣng
kỹ thuật này đƣợc dùng chủ yếu trong quân đội và trong các cơ quan tình báo.
Mãi cho tới vài thập niên gần đây, giấu thông tin mới nhận đƣợc sự quan tâm
của các nhà nghiên cứu và các viện công nghệ thông tin với hàng loạt công trình
nghiên cứu giá trị. Cuộc cách mạng số hóa thông tin và sự phát triển nhanh
chóng của mạng truyền thông là nguyên nhân chính dẫn đến sự thay đổi này.
Những phiên bản sao chép hoàn hảo, các kỹ thuật thay thế, sửa đổi tinh vi, cộng
với sự lƣu thông phân phối trên mạng của các dữ liệu đa phƣơng tiện đã sinh ra
nhiều vấn đề nhức nhối về nạn ăn cắp bản quyền, phân phối bất hợp pháp,
xuyên tạc trái phép…
1.1.3. Mục đích của giấu tin
Giấu tin có hai mục đích:
- Bảo mật cho những dữ liệu đƣợc giấu

- Bảo đảm an toàn (bảo vệ bản quyền) cho chính các đối
tƣợng chứa dữ liệu giấu trong đó.

Số hóa bởi Trung tâm Học liệu – ĐHTN




5

Có thể thấy hai mục đích này hoàn toàn trái ngƣợc nhau và dần phát triển
thành hai lĩnh vực với những yêu cầu và tính chất khác nhau.

Giấu thông tin

Giấu tin bí mật

Thuỷ vân số

(Steganography)

(Watermarking)

Hình 1.1: Hai lĩnh vực chính của kỹ thuật giấu thông tin
Kỹ thuật giấu thông tin bí mật (Steganography): với mục đích đảm bảo an
toàn và bảo mật thông tin tập trung vào các kỹ thuật giấu tin để có thể giấu đƣợc
nhiều thông tin nhất. Thông tin mật đƣợc giấu kỹ trong một đối tƣợng khác sao
cho ngƣời khác không phát hiện đƣợc.
Kỹ thuật giấu thông tin theo kiểu đánh giấu (watermarking) để bảo vệ
bản quyền của đối tƣợng chứa thông tin tập trung đảm bảo một số các yêu cầu

nhƣ đảm bảo tính bền vững… đây là ứng dụng cơ bản nhất của kỹ thuật thuỷ
vân số.
1.1.4. Mô hình kỹ thuật giấu thông tin cơ bản.
Để thực hiện giấu tin cần xây dựng đƣợc các thủ tục giấu tin. Các thủ tục
này sẽ thực hiện nhúng thông tin cần giấu vào môi trƣờng giấu tin. Các thủ tục
giấu tin thƣờng đƣợc thực hiện với một khóa giống nhƣ các hệ mật mã để tăng
tính bảo mật. Sau khi giấu tin ta thu đƣợc đối tƣợng chứa thông tin giấu và có
thể phân phối đối tƣợng đó trên kênh thông tin. Để giải mã thông tin cần nhận
đƣợc đối tƣợng có chứa thông tin đã giấu, sử dụng thủ tục giải mã cùng với
khóa đã dùng trong quá trình giấu để lấy lại thông tin.
Số hóa bởi Trung tâm Học liệu – ĐHTN




6

Giấu thông tin vào phƣơng tiện chứa và tách lấy thông tin là hai quá
trình trái ngƣợc nhau và có thể mô tả qua sơ đồ khối của hệ thống nhƣ hình
1.2 trong đó:
- Thông tin cần giấu tuỳ theo mục đích của ngƣời sử dụng, nó có thể là
thông điệp (với các tin bí mật) hay các logo, hình ảnh bản quyền.
- Phƣơng tiện chứa: các file ảnh, text, audio… là môi trƣờng để nhúng tin
- Bộ nhúng thông tin: là những chƣơng trình thực hiện việc giấu tin
- Đầu ra: là các phƣơng tiện chứa đã có tin giấu trong đó

Thông tin
giấu
Phân
phối

Phƣơng tiện
chứa(audio, ảnh,
video)

Bộ nhúng
thông tin

Phƣơng tiện
chứa đã đƣợc
giấu tin

Khóa giấu tin

Hình 1.2: Lƣợc đồ chung cho quá trình giấu tin
Tách thông tin từ các phƣơng tiện chứa diễn ra theo quy trình ngƣợc lại
với đầu ra là các thông tin đã đƣợc giấu vào phƣơng tiện chứa. Phƣơng tiện
chứa sau khi tách lấy thông tin có thể đƣợc sử dụng, quản lý theo những yêu cầu
khác nhau.

Số hóa bởi Trung tâm Học liệu – ĐHTN




7

Khóa giấu tin

Phƣơng tiện chứa đã
đƣợc giấu tin


Bộ giải mã
thông tin

Phƣơng tiện chứa
(audio, ảnh,
video)

Thông tin giấu

Kiểm
định

Hình 1.3: Lƣợc đồ chung cho quá trình giải mã
Hình vẽ 1.3 chỉ ra các công việc giải mã thông tin đã giấu. Sau khi
nhận đƣợc đối tƣợng phƣơng tiện chứa có giấu thông tin, quá trình giải mã đƣợc
thực hiện thông qua một bộ giải mã tƣơng ứng với bộ nhúng thông tin cùng với
khoá của quá trình nhúng. Kết quả thu đƣợc gồm phƣơng tiện chứa gốc và
thông tin đã giấu. Bƣớc tiếp theo thông tin đã giấu sẽ đƣợc xử lý kiểm định so
sánh với thông tin ban đầu.
1.1.5. Phân loại giấu tin.
a. Phân loại các kỹ thuật giấu tin:
Do kỹ thuật giấu thông tin số mới đƣợc hình thành trong thời gian gần
đây nên xu hƣớng phát triển vẫn chƣa ổn định. Nhiều phƣơng pháp mới, theo
nhiều khía cạnh khác nhau đang và sẽ đƣợc đề xuất, bởi vậy một định nghĩa
chính xác, một sự đánh giá phân loại rõ ràng chƣa thể có đƣợc. Một số tác giả
đã đƣa ra các đánh giá phân loại và các định nghĩa, nhƣng không lâu sau lại có
các đánh giá phân loại và các định nghĩa khác đƣợc đề xuất.

Số hóa bởi Trung tâm Học liệu – ĐHTN





8

Dựa trên việc thống kê sắp xếp khoảng 100 công trình đã công bố trên
một số tạp chí, cùng với thông tin về tên và tóm tắt nội dung của khoảng 200
công trình công bố trên Internet, có thể chia lĩnh vực giấu dữ liệu ra làm
hai hƣớng lớn, đó là watermarking và steganography. Nếu nhƣ watermarking
quan tâm nhiều đến các ứng dụng giấu các mẩu tin ngắn nhƣng đòi hỏi độ bền
vững cao của thông tin cần giấu đối với các biến đổi thông thƣờng của tệp dữ
liệu môi trƣờng thì steganography lại quan tâm tới các ứng dụng che giấu các
bản tin với độ mật và dung lƣợng càng lớn càng tốt. Đối với từng hƣớng lớn
này, quá trình phân loại có thể tiếp tục theo các tiêu chí khác.
Ngoài ra chúng ta có thể phân loại theo môi trƣờng giấu thông tin:
+ Giấu thông tin trong ảnh.
+ Giấu thông tin trong audio.
+ Giấu thông tin trong video.
+ Giấu thông tin trong văn bản dạng text.
b. Phân loại theo cách thức tác động lên các phƣơng tiện:
Phƣơng pháp chèn dữ liệu: Phƣơng pháp này tìm các vị trí trong file dễ bị
bỏ qua và chèn dữ liệu cần giấu vào đó, cách giấu này không làm ảnh hƣởng gì
tới sự thể hiện các file dữ liệu ví dụ nhƣ đƣợc giấu sau các ký tự EOF.
Phƣơng pháp tạo các phƣơng tiện chứa: Từ các thông điệp cần chuyển sẽ
tạo ra các phƣơng tiện chứa để phục vụ cho việc truyền thông tin đó, từ phía
ngƣời nhận dựa trên các phƣơng tiện chứa này sẽ tái tạo lại các thông điệp.
c. Phân loại theo các mục đích sử dụng:
- Giấu thông tin bí mật: đây là ứng dụng phổ biến nhất từ trƣớc đến nay,
đối với giấu thông tin bí mật ngƣời ta quan tâm chủ yếu tới các mục tiêu:

+ Độ an toàn của giấu tin - khả năng không bị phát hiện của giấu tin.
+ Lƣợng thông tin tối đa có thể giấu trong một phƣơng tiện chứa
cụ thể mà vẫn có thể đảm bảo an toàn
+ Độ bí mật của thông tin trong trƣờng hợp giấu tin bị phát hiện
Số hóa bởi Trung tâm Học liệu – ĐHTN




9

- Giấu thông tin bí mật không quan tâm tới nhiều các yêu cầu bền vững
của phƣơng tiện chứa, đơn giản là bởi ngƣời ta có thể thực hiện việc gửi và
nhận nhiều lần một phƣơng tiện chứa đã đƣợc giấu tin.
- Giấu thông tin thuỷ vân: do yêu cầu bảo vệ bản quyền, xác thực… nên
giấu tin thuỷ vân có yêu cầu khác với giấu tin bí mật. Yêu cầu đầu tiên là các dấu
hiệu thuỷ vân đủ bền vững trƣớc các tấn công vô hình hay cố ý gỡ bỏ nó. Thêm
vào đó các dấu hiệu thuỷ vân phải có ảnh hƣởng tối thiểu (về mặt cảm nhận) đối
với các phƣơng tiện chứa. Nhƣ vậy các thông tin cần giấu càng nhỏ càng tốt.
Tuỳ theo các mục đích khác nhau nhƣ bảo vệ bản quyền, chống xuyên tạc
nội dung, nhận thực thông tin,… thuỷ vân cũng có các yêu cầu khác nhau.
Các kỹ thuật giấu tin mới đƣợc phát triển mạnh trong khỏang mƣời năm
trở lại đây nên việc phân loại các kỹ thuật còn chƣa hoàn toàn thống nhất. Sơ đồ
phân loại do F.Petitcolas đƣa ra năm 1999 đƣợc nhiều ngƣời chấp nhận.
Information hiding
Giấu thông tin
Watermarking
Thuỷ vân số

Steganography

Giấu tin mật

Robust Watermarking
Thuỷ vân bền vững
Visible Watermarking
Thuỷ vân hiển thị

Fragile Watermarking
Thuỷ vân dễ vỡ

Imperceptible Watermarking
Thuỷ vân ẩn

Hình 1.4: Phân loại các kỹ thuật giấu tin.
Theo sơ đồ trên đây, giấu tin đƣợc chia thành hai hƣớng chính là
giấu tin mật và thủy vân số. Giấu tin mật quan tâm chủ yếu đến lƣợng tin có thể
giấu, còn thủy vân số lại quan tâm chủ yếu đến tính bền vững của thông tin
giấu. Trong từng hƣớng chính lại chia ra các hƣớng nhỏ hơn, chẳng hạn với
Số hóa bởi Trung tâm Học liệu – ĐHTN




10

thủy vân số thì có thủy vân bền vững và thủy vân dễ vỡ. Thủy vân bền vững cần
bảo toàn đƣợc các thông tin thủy vân trƣớc các tấn công nhƣ dịch chuyển, cắt
xén, xoay đối với ảnh. Ngƣợc lại, thủy vân dễ vỡ cần phải dễ bị phá hủy khi gặp
các sự tấn công nói trên.
1.2. Giấu tin trong ảnh.

Hiện nay, giấu thông tin trong ảnh là một bộ phận chiếm tỷ lệ lớn nhất
trong các chƣơng trình ứng dụng, các phần mềm, hệ thống giấu tin trong đa
phƣơng tiện bởi lƣợng thông tin đƣợc trao đổi bằng ảnh rất lớn và hơn nữa giấu
thông tin trong ảnh cũng đóng vai trò hết sức quan trọng trong hầu hết các ứng
dụng bảo vệ an toàn thông tin nhƣ: nhận thực thông tin, xác định xuyên tạc
thông tin, bảo vệ bản quyền tác giả, điều khiển truy cập, giấu thông tin mật …
Chính vì thế mà vấn đề này đã nhận đƣợc sự quan tâm rất lớn của các cá nhân,
tổ chức, trƣờng đại học và cả viện nghiên cứu thế giới.
Thông tin sẽ đƣợc giấu cùng với dữ liệu ảnh nhƣng chất lƣợng ít thay đổi
và chẳng ai biết đƣợc đằng sau ảnh đó mang những thông tin có ý nghĩa. Và
ngày nay, khi ảnh số đã đƣợc sử dụng rất phổ biến, thì giấu thông tin trong ảnh
đã đem lại nhiều những ứng dụng quan trọng trên các lĩnh vực trong đời sống
xã hội. Ví dụ nhƣ đối với các nƣớc phát triển, chữ ký tay đã đƣợc số hóa và lƣu
trữ sử dụng nhƣ hồ sơ cá nhân của các dịch vụ ngân hàng và tài chính. Nó đƣợc
sử dụng để nhận thực trong các thẻ tín dụng của ngƣời tiêu dùng.
Hay trong một số những ứng dụng về nhận diện nhƣ thẻ chứng minh thƣ,
thẻ căn cƣớc, hộ chiếu… ngƣời ta có thể giấu thông tin trên các ảnh thẻ để xác
nhận thông tin thực.
Phần mềm Winword của Microsoft cũng cho phép ngƣời dùng lƣu chữ ký
trong các ảnh nhị phân rồi gắn vào vị trí nào đó trong file văn bản để đảm bảo
tính an toàn của thông tin. Tài liệu sau đó đƣợc truyền trực tiếp qua fax hoặc
lƣu truyền trên mạng. Theo đó, việc nhận thực chữ ký, xác nhận thông tin đã trở
thành một vấn đề cực kỳ quan trọng khi mà việc ăn cắp thông tin hay xuyên tạc
Số hóa bởi Trung tâm Học liệu – ĐHTN




11


thông tin bởi các tin tặc đang trở thành một vấn nạn đối với bất kỳ quốc gia nào,
tổ chức nào. Thêm vào đó, lại có rất nhiều loại thông tin quan trọng cần đƣợc
bảo mật nhƣ những thông tin về an ninh, thông tin về bảo hiểm hay các thông
tin về tài chính. Các thông tin này đƣợc số hóa và lƣu trữ trong hệ thống máy
tính hay trên mạng. Chúng rất dễ bị lấy cắp và bị thay đổi bởi các phần mềm
chuyên dụng. Việc nhận thực cũng nhƣ phát hiện thông tin xuyên tạc đã trở nên
vô cùng quan trọng, cấp thiết. Và một đặc điểm của giấu thông tin trong ảnh
nữa đó là đƣợc giấu một cách vô hình. Nó nhƣ cách truyền thông tin mật cho
nhau mà ngƣời khác không thể biết đƣợc, bởi sau khi giấu thông tin thì chất
lƣợng ảnh gần nhƣ không thay đổi đặc biệt đối với ảnh mầu hay ảnh xám.
1.3. Tổng quan ảnh BITMAP (BMP).
1.3.1. Giới thiệu ảnh BITMAP (BMP).
Ảnh BITMAP (BMP) đƣợc phát triển bởi Microsoft Corporation, đƣợc
lƣu trữ dƣới dạng độc lập thiết bị cho phép Windows hiển thị dữ liệu không phụ
thuộc vào khung chỉ định màu trên bất kỳ phần cứng nào.
Tên tệp mở rộng mặc định của một tệp ảnh Bitmap là BMP, nét vẽ đƣợc
thể hiện là các điểm ảnh. Qui ƣớc màu đen, trắng tƣơng ứng với các giá trị 0, 1.
Ảnh BMP đƣợc sử dụng trên Microsoft Windows và các ứng dụng chạy
trên Windows từ version 3.0 trở lên. BMP thuộc loại ảnh mảnh.
Các thuộc tính tiêu biểu của một tập tin ảnh BMP là: Số bit trên mỗi điểm
ảnh thƣờng đƣợc ký hiệu bởi n. Một ảnh BMP n bit có 2n màu. Giá trị n càng
lớn thì ảnh càng có nhiều màu và càng rõ nét hơn.
Giá trị tiêu biểu của n là 1 (ảnh đen trắng), 4 (ảnh 16 màu), 8 (ảnh 256
màu), 16 (ảnh 65536 màu) và 24 (ảnh 16 triệu màu). Ảnh BMP 24 - bit có chất
lƣợng hình ảnh trung thực nhất.
- Chiều cao của ảnh (height), cho bởi điểm ảnh.
- Chiều rộng của ảnh (width), cho bởi điểm ảnh.

Số hóa bởi Trung tâm Học liệu – ĐHTN





12

Đặc điểm nổi bật nhất của định dạng BMP là tập tin ảnh thƣờng không
đƣợc nén bằng bất kỳ thuật toán nào. Khi lƣu ảnh, các điểm ảnh đƣợc ghi trực
tiếp vào tập tin một điểm ảnh sẽ đƣợc mô tả bởi một hay nhiều byte tùy thuộc
vào giá trị n của ảnh.
Do đó, một hình ảnh lƣu dƣới dạng BMP thƣờng có kích cỡ rất lớn, gấp
nhiều lần so với các ảnh đƣợc nén (chẳng hạn GIF, JPEG hay PNG).
1.3.2. Cấu trúc ảnh BITMAP (BMP).
Cấu trúc một tệp ảnh BMP gồm có bốn phần:
- Bitmap File Header: Lƣu trữ thông tin tổng hợp về tệp ảnh BMP.
- Bitmap Information: Lƣu trữ thông tin chi tiết về ảnh bitmap.
- Color Palette: Lƣu trữ định nghĩa của màu đƣợc sử dụng cho bitmap(
riêng đối với BMP 24 bit không có Color Palette).
- Bitmap Data: Lƣu trữ từng điểm ảnh của hình ảnh thực tế.
a. Bitmap File Header:
Đây là khối bytes ở phần đầu tập tin, sử dụng để định danh tập tin.
Ứng dụng đọc khối bytes này để kiểm tra xem đó có đúng là tập tin BMP
không và có bị hƣ hỏng không.

Số hóa bởi Trung tâm Học liệu – ĐHTN




13


Bảng 1.1 Chi tiết khối bytes tiêu đề tập tin BMP.
Offset

Mục đích

Size

Magic number sử dụng để định nghĩa tập tin BMP:
0x42 0x4D (mã hexa của kí tự B và M). Các mục dƣới
đây có thể đƣợc dùng:
0000h

2 bytes

0002h

4 bytes

0006h

2 bytes

0008h

2 bytes

000Ah

4 bytes




BM - Windows 3.1x, 95, NT, ... etc



CI - OS/2 Color Icon



CP - OS/2 Color Pointer

Kích thƣớc của tập tin BMP theo byte.
Dành riêng; giá trị thực tế phụ thuộc vào ứng dụng tạo
ra hình ảnh.
Dành riêng; giá trị thực tế phụ thuộc vào ứng dụng tạo
ra hình ảnh.
Offset, địa chỉ bắt đầu các byte dữ liệu ảnh bitmap.

b. Bitmap Information:
Khối bytes này cho biết các thông tin chi tiết về hình ảnh sẽ đƣợc sử dụng
để hiển thị hình ảnh trên màn hình.

Số hóa bởi Trung tâm Học liệu – ĐHTN




14


Bảng 1.2 dƣới đây miêu tả chi tiết khối bytes thông tin tập tin BMP.
Mục đích

Offset

Size

Eh

4

Kích thƣớc của tiêu đề (40 bytes).

12h

4

Chiều rộng bitmap tính bằng pixel (Signed interger).

16h

4

Chiều cao bitmap tính bằng pixel (Signed interger).

1Ah

2

1Ch


2

1Eh

4

22h

4

26h

4

2Ah

4

2Eh

4

Số lƣợng các mặt phẳng màu sắc đƣợc sử dụng. Phải
đƣợc thiết lập bằng 1.
Số bit trên mỗi pixel, là độ sâu màu của hình ảnh. Giá trị
điển hình là 1, 4, 8, 16, 24 và 32.
Phƣơng pháp nén đƣợc sử dụng.
Kích thƣớc hình ảnh. Đây là kích thƣớc của dữ liệu
bitmap và không nên nhầm lẫn với kích thƣớc tập tin.

Độ phân giải theo chiều ngang của hình ảnh (Signed
interger).
Độ phân giải theo chiều dọc của hình ảnh (Signed
interger).
Số lƣợng màu trong bảng màu.
Số lƣợng các màu sắc quan trọng đƣợc sử dụng, hoặc 0

32h

4

khi màu sắc nào cũng đều là quan trọng, thƣờng bị bỏ
qua.

Số hóa bởi Trung tâm Học liệu – ĐHTN




15

c. Color Palette
Tiếp theo vùng Info là Color Palette của BMP, gồm nhiều bộ có kích
thƣớc bằng 4 byte xếp liền nhau theo cấu trúc Blue – Green - Red và một byte
dành riêng cho Itensity.
Kích thƣớc của vùng Palette màu = 4 * số màu của ảnh.
Bảng màu xuất hiện trong tập tin BMP sau tiêu đề BMP và tiêu đề DIB.
Vì vậy, offset là kích cỡ của tiêu đề BMP cộng với kích thƣớc của tiêu đề DIB.
Vì Palette màu của màn hình có cấu tạo theo thứ tự Red – Green - Blue
nên khi đọc Palette màu của ảnh BMP vào thì phải chuyển đổi cho phù hợp.

Số màu của ảnh đƣợc biết dựa trên số bit cho 1 pixel cụ thể là:
8 bits / pixel: ảnh 256 màu.
4 bits / pixel: ảnh 16 màu.
24 bits / pixel ảnh 24 bit màu (không có color palette).
Có tất cả 2 ^ 24 màu RGB khác nhau, nhƣng các loại Bitmap 1 bit (2 màu,
hoặc chuẩn Windows là trắng - đen), 4 bits (16 màu), 8 bits (256 màu) không thể
khai thác hết, nên chỉ liệt kê các màu đƣợc dùng trong tệp. Mỗi màu trong bảng
màu đƣợc mô tả bằng 4 bytes (BlueByte, GreenByte, RedByte và ReservByte).
Ví dụ:
Bảng màu loại 1 bit chuẩn Windows có 8 bytes: 0, 0, 0, 0, 255, 255, 255,
0 (4 bytes đầu là màu thứ 0, 4 bytes sau là màu thứ 1. Do chỉ có 0 và 1 nên mô
tả mỗi điểm ảnh chỉ cần dùng 1 bit).
Tƣơng tự nhƣ vậy, bảng màu của tệp 4 bits có 64 bytes, lần lƣợt từ màu
số 0 đến màu số 15, bảng màu của tệp 8 bits có 1024 bytes (từ 0 đến 255).
Chính vì các màu đƣợc liệt kê nhƣ vậy nên các màu trong tệp 1 bit, 4 bits,
8 bits đƣợc gọi là Indexed, còn các màu trong tệp 24 bits đƣợc gọi là True.
d. Bitmap Data
Phần Bitmap Data nằm ngay sau phần Color Palette của ảnh BMP. Đây là
phần chứa các giá trị màu của các điểm ảnh trong BMP.
Số hóa bởi Trung tâm Học liệu – ĐHTN




16

Dữ liệu ảnh đƣợc lƣu từng điểm cho đến hết hàng ngang (từ trái sang
phải), và từng hàng ngang cho đến hết ảnh (từ dƣới lên trên).
Mỗi byte trong vùng Bitmap Data biểu diễn 1 hoặc nhiều điểm ảnh tùy
theo số bits cho một pixel.

Đối với mỗi điểm ảnh loại màu Indexed, ta cần 1 bit, 4 bits hoặc 8 bits để
đặc trƣng cho điểm đang xét ứng với màu thứ mấy trong bảng màu.
Ví dụ: Giá trị 0111 (=7) trong loại BMP 4 bits cho biết điểm đó có màu 7
(màu xám theo chuẩn Windows). Riêng loại 24 bits thì không mô tả màu bằng
thứ tự trên bảng màu (nếu liệt kê hết bảng màu của nó thì đã tốn cả Gigabyte bộ
nhớ và đĩa) mà đƣợc liệt kê luôn giá trị RGB của 3 màu thành phần.
Ví dụ:
Trắng ={255, 255, 255}, Đen = {0, 0, 0}.
Nhƣ vậy, mỗi điểm ảnh loại 1 bit tốn 1/8 bytes (nói cách khác, 1 byte lƣu
đƣợc 8 điểm 1 bit), loại 4 bits tốn 1/2 byte, loại 8 bits tốn 1 byte và loại 24 bits
tốn 3 bytes.
Tuy nhiên, tính chung cả bức ảnh thì khối dữ liệu không hoàn toàn tỉ lệ
thuận nhƣ vậy mà thƣờng lớn hơn một chút.
Lý do chính ở chỗ ta ngầm quy ƣớc số bytes cần dùng cho 1 hàng ngang
phải là bội của 4. Nếu bạn có ảnh 1 x 1, 1 bit, thì cũng tốn 66 bytes nhƣ ảnh 32
x 1, 1 bit (54 cho header, 8 cho bảng màu, 4 cho 1 hàng tối thiểu).
Nếu thử xoay bức hình 32 x 1 (vừa đúng 4 bytes dữ liệu) thành 1 x 32, sự
lãng phí sẽ xuất hiện, lúc đó mỗi hàng sẽ lãng phí 31 bits, tổng cộng 32 lần nhƣ
thế (31*4 bytes = 124 bytes).

Số hóa bởi Trung tâm Học liệu – ĐHTN




×