Tải bản đầy đủ (.docx) (72 trang)

Luận văn thạc sĩ giấu tin thuận nghịch trên ảnh số sử dụng phương pháp dự đoán và dịch chuyển histogram

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.53 MB, 72 trang )

ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

-----------------------------

LÊ TRƯỜNG THÔNG

GIẤU TIN THUẬN NGHỊCH TRÊN ẢNH SỐ SỬ DỤNG
PHƯƠNG PHÁP DỰ ĐOÁN VÀ DỊCH CHUYỂN HISTOGRAM

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Thái Nguyên - 2015


i

LỜI CAM ĐOAN
Tôi xin cam đoan.
Những nội dung trong luận văn này là do tôi thực hiện dưới sự hướng
dẫn trực tiếp của thầy giáo, PGS.TS Phạm Văn Ất.
Mọi tham khảo dùng trong luận văn đều được trích dẫn rõ ràng tên tác
giả, tên cơng trình, thời gian, địa điểm công bố.
Mọi sao chép không hợp lệ, vi phạm qui chế đào tạo, hay gian trá tơi xin
chịu hồn tồn trách nhiệm.
HỌC VIÊN

Lê Trường Thông


ii



LỜI CẢM ƠN
Lời đầu tiên, em xin được bày tỏ sự kính trọng và lịng biết ơn sâu sắc đến
PGS.TS Phạm Văn Ất, một người thầy đã dạy em trong nhiều năm qua; đặc
biệt, qua thời gian làm luận văn, thầy luôn giảng giải cho em những kiến thức
khoa học theo bản chất của chúng; thầy đã tận tình hướng dẫn, chỉ bảo để em
có thể làm chủ được kiến thức trong nội dung luận văn của mình.
Em cũng xin gửi lời cảm ơn đến các thầy cô giáo giảng dạy cho Khoa
Công nghệ thông tin trường Đại học Công nghệ thông tin và truyền thông –
Đại học Thái Nguyên đã truyền đạt những kiến thức và giúp đỡ em trong suốt
quá trình học của mình.
Em cũng xin gửi lời cảm ơn tới Bộ phận đào tạo Sau đại học cũng như
Phịng đào tạo Trường Đại học Cơng nghệ thơng tin và truyền thông đã tạo
điều kiện thuận lợi cho em trong suốt thời gian của khóa học và trong thời gian
hoàn thành luận văn.
Xin được gửi lời cảm ơn đến lãnh đạo và đồng nghiệp của Phịng Khảo
thí và Đảm bảo chất lượng Trường Đại học Cơng đồn – đơn vị nơi tôi đang
công tác, đã tạo điều kiện, giúp đỡ tôi trong thời gian học tập cũng như làm
luận văn.
Không thể quên gửi lời cảm ơn đến một người anh là TS. Đỗ Văn Tuấn,
người đã đóng góp nhiều ý kiến quý báu cũng như chỉ cho tôi nhiều kiến thức,
đặc biệt là trong lúc tôi làm luận văn.
Cuối cùng, xin được gửi lời cảm ơn tới gia đình và bạn bè – những người
đã ủng hộ, động viên, giúp đỡ và tạo mọi điều kiện để tôi có được kết quả như
ngày hơm nay.
Hà Nội, tháng 12 năm 2015
HỌC VIÊN

Lê Trường Thông



iii

MỤC LỤC
Trang bìa phụ
Lời cam đoan
Lời cảm ơn
Mục lục
Danh mục thuật ngữ Anh – Việt
MỞ ĐẦU .....................................................................................................
CHƯƠNG 1. TỔNG QUAN ...........................................................................
1.1. Giấu tin ..................................................................................
1.1.1. Vài nét về lịch sử giấu tin ................................................................................
1.1.2. Khái niệm giấu tin ...........................................................................................
1.1.3. Phân loại các kỹ thuật giấu tin ........................................................................
1.1.4. Mơ hình kỹ thuật giấu tin ...............................................................................
1.1.5. Ứng dụng của kỹ thuật giấu tin ......................................................................

1.2. Ảnh số ....................................................................................
1.2.1. Khái niệm ảnh Bitmap ....................................................................................
1.2.2. Phân loại ảnh Bitmap ......................................................................................
1.2.3. Định dạng tệp ảnh Bitmap ..............................................................................
1.2.4. Chất lượng ảnh .............................................................................................
1.2.5. Một số đặc trưng ảnh số ..............................................................................

1.3. Môi trường giấu tin .............................................................
1.3.1. Giấu tin trong ảnh .........................................................................................
1.3.2. Giấu tin trong audio ......................................................................................
1.3.3. Giấu tin trong video ......................................................................................
1.3.4. Giấu tin trong văn bản ..................................................................................


1.4. Các hướng tiếp cận giấu tin trên ảnh ...................................
1.4.1. Tiếp cận miền không gian ảnh ......................................................................
1.4.2. Tiếp cận miền tần số ảnh ..............................................................................

1.5. Một số lược đồ giấu tin trên ảnh nhị phân .......................... - 15 -


iv

1.5.1. Kỹ thuật giấu tin Wu-Lee ..............................................................................
1.5.2. Kỹ thuật giấu tin CPT.....................................................................................

CHƯƠNG 2. PHƯƠNG PHÁP DỊCH CHUYỂN HISTOGRAM VÀ DỰ ĐOÁN ...
2.1. Sơ lược giấu tin thuận nghịch ..............................................
2.1.1. Giấu tin không thuận nghịch và giấu tin thuận nghịch .................................
2.1.2. Chút lịch sử giấu tin thuận nghịch ................................................................
2.1.3. Giấu tin và thủy vân ......................................................................................
2.1.4. Một số hướng tiếp cận giấu tin thuận nghịch ..............................................

2.2. Phương pháp histogram ......................................................
2.2.1. Một số khái niệm ..........................................................................................
2.2.2 Thuật toán giấu tin ........................................................................................
2.2.3. Lược đồ giấu tin ............................................................................................
2.2.4 Thuật tốn trích tin và khơi phục ảnh gốc .....................................................
2.2.5. Lược đồ trích tin và khơi phục ảnh gốc ........................................................
2.2.6. Ví dụ ..............................................................................................................

2.3. Phương pháp dự đốn .........................................................
2.3.1. Dự đốn tuyến tính ......................................................................................

2.3.2. Thuật tốn giấu tin .......................................................................................
2.3.3. Lược đồ giấu tin ............................................................................................
2.3.4. Thuật tốn trích tin và khơi phục ảnh gốc ...................................................
2.3.5. Lược đồ trích tin và khơi phục ảnh gốc .......................................................
2.3.6. Ví dụ ..............................................................................................................

CHƯƠNG 3. CÀI ĐẶT THỬ NGHIỆM ..........................................................
3.1. Bài toán thử nghiệm ............................................................
3.1.1. Tệp ảnh sử dụng để thử nghiệm ..................................................................
3.1.2. Bài toán giấu tin ...........................................................................................
3.1.3. Bài tốn trích tin và khơi phục ảnh gốc .......................................................

3.2. Chương trình thử nghiệm ....................................................
3.2.1. Mơi trường cài đặt .......................................................................................
3.2.2. Tham quan thư mục chứa tệp mã nguồn ....................................................
3.2.3. Một số đoạn mã nguồn quan trọng .............................................................


v

3.2.4. Hướng dẫn sử dụng chương trình............................................................

3.3. Khả năng giấu tin và chất lượng ảnh ....................................
3.3.1. Khả năng giấu tin .........................................................................................
3.3.2. Chất lượng ảnh chứa tin ...............................................................................

KẾT LUẬN VÀ KIẾN NGHỊ ..........................................................................
I. Tiếng Việt ................................................................................
II. Tiếng Anh................................................................................



vi

DANH MỤC THUẬT NGỮ ANH – VIỆT
Thuật ngữ Anh
Cover image / host/Original image
Extract
Frequency domain
Hide / embed
Hiding capacity
Histogram shifting
Index domain
Medical imange
Neighboring pixcel
Prediction technique
Quality
Reversible data hiding
Screte message / hidden data
Spatial domain
Stego-image / marked image
Embedding proceduce
Residual image
Residual value
Residual histogram
Extract and recovery proceduce
Experimental result
PSNR - Peak Signal to Noise Ratio


-1-


MỞ ĐẦU
Một trong những sự kiện trọng đại của những thập niên cuối thế kỷ 20,
đầu thế kỷ 21 là sự ra đời phát triển của mạng Internet. Thông tin đã trở thành
sẵn sàng trực tuyến, mọi người đều có thể kết nối vào Internet để tìm kiếm
thơng tin một cách dễ dàng thông qua nhà cung cấp dịch vụ Internet. Người
dùng có thể đọc các thơng tin mới nhất, tra cứu các thư viện số, tìm thơng tin
lĩnh vực mình quan tâm. Bên cạnh đó các nhà cung cấp sản phẩm cũng sẵn
sàng cung cấp dữ liệu của mình cho người dùng thông qua mạng.
Hiện nay, các thông tin quan trọng thường được lưu trữ và truyền tải
dưới dạng tệp dữ liệu số như: ảnh, âm thanh và video. Tuy nhiên việc phân
phối một cách phổ biến các tài nguyên trên mạng hiện nay với sự trợ giúp của
phần mềm, người dùng có thể dễ dàng tạo ra các bản sao có chất lượng ngang
bằng so với dữ liệu gốc. Bên cạnh đó, vấn nạn sao chép, tái phân phối bất hợp
pháp, làm giả dữ liệu số ngày một gia tăng. Do vậy, vấn đề bảo vệ dữ liệu số
nói chung và ảnh số nói riêng đang nhận được nhiều sự quan tâm của các nhà
nghiên cứu trong và ngoài nước. Một trong những mục tiêu nghiên cứu của an
tồn dữ liệu và bảo mật thơng tin là xây dựng quy trình và giải pháp bảo vệ các
tài liệu, ngăn chặn các hoạt động không hợp pháp. Giấu tin thuận nghịch hiện
đang được xem là một trong những giải pháp quan trọng trong việc bảo vệ
thông tin mật và tính tồn vẹn của dữ liệu số.
Dấu tin thuận nghịch là kỹ thuật giấu thông tin mật vào dữ liệu ảnh
trước khi ảnh được phân phối trên môi trường trao đổi khơng an tồn, việc giấu
thơng tin vào ảnh sẽ làm giảm chất lượng ảnh. Các thuật toán đề xuất đều có
mục tiêu khơng chỉ giấu được nhiều lượng thơng tin mà cịn giữ cho chất lượng
ảnh ít bị thay đổi nhất. Đây cũng là các tiêu chí để đánh giá một lược đồ giấu
tin tốt hay xấu.


-2-


Nội dung luận văn tập trung vào việc nghiên cứu một số kỹ thuật giấu
tin thuận nghịch và đối tượng được chọn làm môi trường dấu tin là ảnh số.
Cấu trúc của luận văn
Dựa vào mục tiêu đã xác định, nội dung của luận văn sẽ được trình bày
qua 3 chương như sau:
Chương 1: Tổng quan
Chương 2: Phương pháp dịch chuyển histogram và dự đoán
Chương 3: Cài đặt thử nghiệm
Do thời gian và trình độ cịn hạn chế nên luận văn khó tránh khỏi những
sai sót, kính mong nhận được sự đóng góp chỉ bảo của các thầy, cơ giáo và các
bạn đồng nghiệp.
Qua đây tôi xin cảm ơn thầy giáo, PGS.TS Phạm Văn Ất và các thầy, cô
giáo trong Trường Đại học Công nghệ thông tin và truyền thông – Đại học
Thái Ngun đã tận tình hướng dẫn tơi trong quá trình học tập cũng như trong
thời gian nghiên cứu hoàn thiện luận văn này.


-1-

CHƯƠNG 1. TỔNG QUAN
1.1. Giấu tin
1.1.1. Vài nét về lịch sử giấu tin
Các kỹ thuật giấu tin đã được đề xuất và sử dụng từ thời xa xưa, và sau
này đã được phát triển ứng dụng cho nhiều lĩnh vực. Từ Steganography bắt
nguồn từ Hi Lạp với ý nghĩa tài liệu được phủ (covered writing). Các câu
chuyện kể về kỹ thuật giấu thông tin được truyền qua nhiều thế hệ. Có lẽ
những ghi chếp sớm nhất về kỹ thuật giấu thông tin thuộc về sử gia Hi Lạp
Herodotus. Khi bạo chúa Herodotus bị vua Darius bắt ở Susa vào thế kỷ thứ V
trước công nguyên, ông ta đã gửi một bài báo bí mật cho con rể của mình là

Aristagoras ở Milesus. Để thực hiện điều này, Histiaeus đã cạo trọc đầu 1 nô lệ
tin cậy và xăm một thông báo trên da đầu người nơ lệ ấy. Khi tóc người nô lệ
đủ dài người nô lệ được gửi tới Milesus.
Một câu chuyện khác về thời Hi Lạp cổ đại cũng do Herodotus ghi lại.
Môi trường để ghi văn bản chính là cá viên thuốc được bọc trong sáp ong.
Demeratus, một người Hi Lạp, cần thông báo cho Sparta rằng Xarxes định xâm
chiếm Hi Lạp. Để tránh bị phát hiện, anh ta đã bóc viên thuốc này, sau đó bọc
lại cá viên thuốc này bằng một lớp sáp mới. Những viên thuốc được để ngỏ và
lọt qua mọi sự kiểm sốt một cách dễ dàng.
Mực khơng màu là phương tiện hữu hiệu cho bảo mật thông tin trong một
thời gian dài. Người Roman cổ đã biết sử dụng những chất sẵn có như nước
quả, nước tiểu và sữa để viết các thơng báo bí mật giữa những hàng văn tự
thơng thường. Khi bị hơ nóng, những thứ mực khơng nhìn thấy trở nên sẫm
màu và có thể đọc dễ dàng. Mực không màu cũng được sử dụng rất gần đây,
như trong thời gian chiến trang thứ II. Như vậy ý tưởng về che giấu thơng tin
đã có từ hàng nghìn năm về trước nhưng chủ yếu được áp dụng trong quân đội
và các cơ quan tình báo. Mãi cho tới vài thập niên gần đây, do sự phát


-2-

triển rộng rãi của internet, nhu cầu bảo mật thông tin cho cá nhân và các cơ sở
tư nhân và các giao dịch trên mạng máy tính ngày một trở thành bức thiết, giấu
thông tin mới nhận được sự quan tâm của các nhà nghiên cứu với hàng loạt
cơng trình có giá trị được áp dụng rộng rãi và cơng khai trong hoạt động sản
xuất, quản trị kinh doanh. Cuộc cách mạng số hóa thơng tin và sự phát triển
nhanh chóng của mạng truyền thơng là ngun nhân chính dẫn đến sự thay đổi
này. Gần đây, những phiên bản sao chép hoàn hảo, các kỹ thuật thay thế, sửa
đổi tinh vi, cộng với sự lưu thông phân phối trên diện rộng của các dữ liệu đa
phương tiện đã làm nảy sinh nhiều vấn đề nhức nhối về nạn ăn cắp bản quyền,

phân phối bất chấp hợp pháp, xuyên tạc trái phép càng đòi hỏi phải đẩy mạnh
hơn nữa việc nghiên cứu trong lĩnh vực này.
1.1.2. Khái niệm giấu tin
Giấu tin là một kỹ thuật giấu một lượng thông tin số nào đó vào một đối
tượng dữ liệu số khác.
Kỹ thuật giấu tin nhằm hai mục đích: một là bảo mật cho dữ liệu được
đem giấu, hai là bảo vệ cho chính đối tượng được giấu tin ở trong. Hai mục
đích khác nhau này dẫn đến hai kỹ thuật chủ yếu của giấu tin. Hướng thứ nhất
là giấu tin mật, nhằm tập trung vào các kỹ thuật giấu tin sao cho người khác
khó phát hiện được đối tượng có chứa thơng tin mật bên trong. Hướng thứ hai
là thủy vân số, hướng thủy vân số có miền ứng dụng lớn hơn nên được quan
tâm nghiên cứu nhiều hơn và thực tế đã có rất nhiều kỹ thuật đã được đề xuất.
1.1.3. Phân loại các kỹ thuật giấu tin
Có nhiều cách phân loại khác nhau dựa trên những tiêu chí khác nhau. Có
thể chia lĩnh vực giấu tin thành hai hướng chính, đó là thủy vân số và giấu tin
mật.
Giấu tin mật với mục đích bảo tồn và bảo mật thơng tin, tập trung vào
các kỹ thuật giấu tin, sao cho người khác khó phát hiện việc có tin được giấu.


-3-

Kỹ thuật giấu tin mật ln chú trọng đến tính che giấu, với tính che giấu, các
đối thủ khó có thể phát hiện được đối tượng có chứa tin mật bên trong hay
khơng; hơn nữa, nếu phát hiện có giấu tin thì việc giải mã thơng tin mật cũng
khó có thể thực hiện được. Ðồng thời, các kỹ thuật giấu tin mật cịn quan tâm
lượng tin có thể được giấu.
Phạm vi ứng dụng của thủy vân đa dạng hơn, tuỳ theo mục đích của hệ
thủy vân mà người ta lại chia thành các hướng nhỏ như: thủy vân dễ vỡ và thủy
vân bền vững. Thủy vân bền vững quan tâm nhiều đến việc nhúng những mẩu

tin đòi hỏi độ bền vững cao của thông tin được giấu trước các biến đổi thông
thường trên dữ liệu môi trường. Thủy vân dễ vỡ yêu cầu thông tin giấu sẽ bị sai
lệch nếu có bất kỳ sự thay đổi nào trên dữ liệu chứa. Như vậy, kỹ thuật giấu tin
có thể được phân loại như trong Hình 1.1.

Hình` 1.1. Phân loại kỹ thuật giấu tin
1.1.4. Mơ hình kỹ thuật giấu tin
Giống như các lược đồ mã hóa thơng tin, một kỹ thuật giấu tin gồm thuật
tốn nhúng tin và thuật tốn trích tin. Theo [5], sơ đồ của thuật toán nhúng tin
tổng quát có mơ hình như sau:


-4-

Hình 1.2. Mơ hình thuật tốn nhúng tin
Trong Hình 1.2, môi trường giấu tin là những dữ liệu dùng để chứa thông
tin mật, dữ liệu môi trường thường là những dữ liệu được dùng phổ biến trên
Internet như: tệp ảnh, tệp âm thanh, tệp video, tệp text…Thông tin cần giấu là
một lượng thơng tin mang ý nghĩa và mục đích nào đó tùy thuộc vào mục đích
và u cầu của người sử dụng (tin mật). Tin mật được nhúng vào trong môi
trường chứa thông tin nhờ một bộ nhúng thông tin. Trong q trình nhúng tin,
thuật tốn có thể sử dụng hệ thống khóa làm tăng tính an tồn cho hệ thống.
Sau khi nhúng tin mật vào dữ liệu môi trường ta nhận được dữ liệu mơi trường
có chứa tin. Dữ liệu này được truyền tải trên các môi trường truyền thơng khác
nhau.
Khi nhận được dữ liệu có chứa tin, người nhận thực hiện thuật tốn trích
tin tương ứng để trích rút tin mật từ dữ liệu mơi trường. Trong một số trường
hợp, người dùng có thể khơi phục lại dữ liệu môi trường từ dữ liệu chứa tin.
Theo , thuật tốn trích tin có mơ hình thực hiện như:



-5-

Hình 1.3. Mơ hình trích tin
Trong hình 1.3 đã chỉ ra các nhiệm vụ của q trình giải mã thơng tin đã
được giấu. Quá trình giải mã này phải được thực hiện thông qua một bộ giải
mã tương ứng với bộ nhúng thơng tin và kết hợp với khóa để giải mã tin. Khóa
để giải mã tin này có thể giống hay khác với khóa đã nhúng tin. Kết quả thu
được bao gồm môi trường gốc và thông tin đã được che giấu. Tùy theo các
trường hợp cụ thể, thông tin tách được ra có thể phải cần xử lý, kiểm định và
so sánh với thông tin đem giấu ban đầu. Thông qua dữ liệu được tách ra từ môi
trường chứa thơng tin giấu, người ta có thể biết được trong q trình truyền tải,
phân phát dữ liệu có bị xâm phạm, tấn công hay không.
Đối với các hệ thống giấu thơng tin mật này rất quan tâm đến tính an tồn
và bảo mật thơng tin của dữ liệu cần giấu. Hệ thống giấu tin mật có độ bảo mật
cao nếu có độ phức tạp của các thuật tốn thám mã khó có thể thực hiện được
trên máy tính. Tuy nhiên, cũng có các hệ thống chỉ quan tâm đến số lượng
thơng tin có thể được che giấu, hay quan tâm đến sự ảnh hưởng của thông tin
mật đến các môi trường chứa dữ liệu.
1.1.5. Ứng dụng của kỹ thuật giấu tin
Giấu tin mật: Thông tin được giấu trong những trường hợp này cần được
bảo mật trước các đối thủ. Việc giải mã để nhận được thông tin cũng


-6-

không cần dữ liệu môi trường gốc. Đối với các thuật tốn giấu tin mật chúng ta
khơng chú trọng đến việc bảo vệ thông tin mật trước sự tấn công của các đối
thủ mà thay vào đó các thuật tốn quan tâm đến tính ẩn và tính an tồn đối với
dữ liệu cần giấu. Do đó, các thuật tốn giấu tin có độ bảo mật cao sẽ được sử

dụng trong các ứng dụng giấu tin mật.
Bảo vệ bản quyền tác giả: Đây là ứng dụng cơ bản nhất của kỹ thuật
thủy vân số. Một thơng tin nào đó mang ý nghĩa bản quyền được sở hữu bởi tác
giả gọi là thủy vân, thông tin này sẽ được nhúng vào trong các sản phẩm
multimedia, và đó là minh chứng cho bản quyền của tác giả nhằm bảo vệ các
sản phầm chống lại các hành vi lấy cắp hoặc làm nhái. Yêu cầu kỹ thuật đối
với ứng dụng này là thủy vân phải tồn tại bền vững cùng với sản phẩm, khi
muốn bỏ thủy vân này mà không được phép của người chủ sở hữu thì chỉ cịn
cách là phá huỷ sản phẩm.
Xác thực thông tin: Một tập các thông tin sẽ được giấu trong dữ liệu
nguồn và thông tin sẽ được sử dụng để nhận biết xem dữ liệu nguồn có bị thay
đổi hay không. Với kiểu ứng dụng này các thủy vân nên được ẩn để tránh được
sự tò mò của đối phương, hơn nữa việc làm giả các thủy vân hợp lệ hay xuyên
tạc thông tin nguồn cũng cần được xem xét. Trong các ứng dụng thực tế, người
ta mong muốn tìm được vị trí bị xun tạc cũng như phân biệt được các thay
đổi. Yêu cầu chung đối với ứng dụng này là khả năng giấu thông tin cao và
thủy vân không cần bền vững.
1.2. Ảnh số
Như đã biết, ảnh số được lượng tử hóa từ ảnh liên tục (ảnh tự nhiên). Do
vậy, dữ liệu của ảnh số có sự tương quan cao. Nói cách khác, các điểm ảnh lân
cận (liền kề) thường có giá trị xấp xỉ nhau.


-7-

1.2.1. Khái niệm ảnh Bitmap
Ảnh Bitmap là định dạng ảnh do Microsoft đề xuất, có phần mở rộng là
BMP, loại ảnh này truyền tải, sử dụng rộng rãi trên máy tính, và các thiết bị
điện tử khác.
1.2.2. Phân loại ảnh Bitmap

Trên phương diện toán học, ảnh số được xem như là một ma trận nguyên
dương có m hàng và n cột, mỗi phần tử của ma trận đại diện cho một điểm ảnh.
Dựa theo màu sắc ta có thể chia ảnh số thành 3 dạng cơ bản như: ảnh nhị phân,
ảnh đa cấp xám và ảnh màu (true color).
-

Ảnh nhị phân là ảnh chỉ có hai màu, một màu đại diện cho màu nền và

màu còn lại cho đối tượng của ảnh. Nếu hai màu là đen và trắng thì gọi là ảnh
đen trắng. Như vậy, ảnh nhị phân được xem như một ma trận nhị phân.
-

Ảnh đa cấp xám là ảnh có thể nhận tối đa 256 mức sáng khác nhau

trong khoảng màu đen – màu trắng. Như vậy, ảnh đa cấp xám xem như là ma
trận không âm có giá trị tối đa 255.
-

Ảnh màu hay cịn gọi là ảnh true color, mỗi điểm ảnh được biểu diễn

bởi một số byte (thường 3 byte) đại diện cho 3 thành phần màu R, G và B. Như
vậy, ảnh màu có thể xem như 3 ma trận nguyên ứng với 3 thành phần màu của
các điểm ảnh.
Trong lĩnh vực giấu tin, mỗi dạng ảnh có những thuận lợi, khó khăn và
cách tiếp cận riêng. Tuy nhiên, một lược đồ giấu tin trên ảnh nhị phân ta có thể
dễ dàng áp dụng cho ảnh đa cấp xám hoặc ảnh màu thông qua tính chẵn lẻ của
giá trị điểm ảnh. Nhưng từ lược đồ giấu tin trên ảnh màu hoặc ảnh đa cấp xám
khó có thể áp dụng đối với ảnh nhị phân.
1.2.3. Định dạng tệp ảnh Bitmap
Ảnh Bitmap được lưu trữ dưới dạng nhị phân, một tệp định dạng bitmap

được chia thành các phần cơ bản như: phần tiêu đề file (BITMAP


-8-

HEADER), thông tin về ảnh (BITMAP INFOR), bảng màu (PALLETE
Table) và vùng dữ liệu ảnh (DATA). Và thứ tự các phần của tệp ảnh được lưu
trữ tuần tự trong bộ nhớ như trong hình Hình 1.5
BITMAP HEADER
BITMAP INFOR
PALLETE Table
DATA
Hình 1.5. Minh hoạ cấu trúc tệp ảnh bitmap
 Ý nghĩa các phần trong tệp ảnh bitmap
Bitmap Header: mô tả thông tin chung về File định dạng bitmap, độ dài
của phần này được cố định với mọi file ảnh bitmap.
Bảng 1.1. Cấu trúc và nội dung của Bitmap File Header
Byte#
1
2
3- 6
7-10
11 - 14

Bitmap Infor: mô tả thông tin về ảnh được lưu trữ, độ dài của phần này
cũng cố định.
Bảng 1.2. Cấu trúc và nội dung của Bitmap Info
Byte #
1–4
5–8




-9-

9–12
13–14
15–16
17–20
21–24
25–28
29–32
33–36

37–40
Pallete Table: chính là bảng màu của ảnh bitmap, độ dài của phần này
có thể bằng khơng (khơng có bảng màu) đối với ảnh đen trắng và ảnh màu có
số lượng màu lớn hơn 256 màu.
Bảng 1.3. Cấu trúc và nội dung của Color Palette
Byte#
1
2
3
4
5
6
7


8

9


-10-

Data: Thông tin của từng điểm ảnh, độ dài của phần này phụ thuộc kích
thước ảnh. Phần này lưu trữ dữ liệu ảnh theo hướng từ dưới lên trên và từ trái
qua phải.
Với ảnh 8 bit màu giá trị của mỗi điểm ảnh trong vùng Data là chỉ số của
màu trong bảng màu, chỉ số màu của điểm ảnh là một số nguyên có giá trị từ 0
đến 255.
Như đã trình bày ở trên, với ảnh có số lượng màu lớn hơn 256 màu thì giá
trị trong vùng Data chính là giá trị của các thành phần màu cơ bản, số lượng bit
dùng để biểu diễn giá trị cho từng thành phần màu có thể sẽ khác nhau phụ
thuộc vào chất lượng ảnh. Đối với ảnh 24 bit màu, mỗi thành phần màu được
lưu trữ bởi 8 bit và thứ tự lưu trữ là B, G, R.
1.2.4. Chất lượng ảnh
Như đã đề cập ở trên, chất lượng ảnh chứa tin là một trong những yếu tố
quan trọng trong giấu tin mật, đặc biệt là thủy vân số. Chất lượng ảnh chứa tin
có thể được đánh giá bằng hệ số PSNR (Peak Signal-to-Noise Ratio). Lược đồ
có hệ số PSNR càng lớn thì chất lượng ảnh chứa tin càng cao. Hệ số PSNR của
ảnh chứa tin I’ so với ảnh gốc I kích thước m x n được tính theo cơng thức:

trong đó, MAX là giá trị cực đại của điểm ảnh và MSE (Mean Square Error)
được xác định theo công thức:

Đối với ảnh màu, giá trị PSNR có thể chấp nhận được nếu thuộc khoảng
từ 30 dB đến 50 dB.



-11-

1.2.5. Một số đặc trưng ảnh số
Những đặc trưng của ảnh được trích chọn để sử dụng trong nhiều ứng
dụng như xử lý ảnh, nhận dạng ảnh,… Hầu hết các phương pháp trích chọn các
đặc trưng của ảnh tập trung vào: màu sắc, kết cấu, hình dạng.
a. Đặc trưng về màu sắc
Màu sắc là đặc tính hình ảnh được thể hiện nhiều nhất vì tính đơn giản
của việc trích thơng tin màu của ảnh đưa ra phân tích và đã có hiệu quả thơng
qua biểu đồ màu. Các biểu đồ màu miêu tả các điểm màu trên những vùng màu
của ảnh.
Không gian màu RGB được sử dụng rộng rãi trong việc miêu tả màu sắc
của ảnh. Nó gồm ba thành phần màu cơ bản là đỏ (Reb), lục (Green), lam
(Blue). Các màu khác được tạo ra bằng cách tổng hợp ba thành phần màu cơ
bản này. Tuy nhiên không gian màu RGB biến đổi không phù hợp với cảm
nhận của mắt con người.
b. Đặc trưng về hình dạng
Hình dạng của đối tượng trong ảnh cũng là một đặc trưng có thể được xét
đến. Đối tượng của ảnh thể hiện nội dung ảnh nhiều nhất. Ảnh được chụp hoặc
tranh được vẽ ln với mục đích mơ tả lại các đối tượng đó. Việc tách riêng
các đối tượng và hình dạng của chúng trong ảnh là rất khó. Khó hơn là so sánh
các đặc trưng đó thế nào.
c. Đặc trưng về kết cấu
Kết cấu bề mặt là phản ánh sự biểu diễn một mẫu về khơng gian có vài
thuộc tính đồng đều khơng thể có được từ sự biểu diễn bằng một màu đơn hoặc
một độ sáng trong vùng mà yêu cầu sự tương tác của nhiều màu, độ sáng khác
nhau. Để sử dụng kết cấu trong tìm kiếm ảnh, ta cần có các đặc tính kết cấu
của một đối tượng hoặc một vùng quan tâm đến trong ảnh cung cấp đặc tính để
tìm kiếm ảnh.



-12-

1.3. Môi trường giấu tin
1.3.1. Giấu tin trong ảnh
Hiện nay, giấu thông tin trong ảnh chiếm tỷ lệ lớn trong các chương trình
ứng dụng, các phần mềm, hệ thống giấu tin trong dữ liệu đa phương tiện bởi
lượng thông tin được trao đổi bằng hình ảnh là rất lớn. Hơn nữa, giấu thơng tin
trong ảnh cũng đóng vai trị hết sức quan trọng trong hầu hết các ứng dụng bảo
vệ an tồn thơng tin như: nhận thức thơng tin, xác định xuyên tạc thông tin,
bảo vệ bản quyền tác giả, điều khiển truy cập, giấu thơng tin mật… Vì thế vấn
đề này đã nhận được sự quan tâm rất lớn của các cá nhân, tổ chức, trường đại
học và viện nghiên cứu trong và ngồi nước.
Thơng tin sẽ được giấu cùng với dữ liệu ảnh nhưng chất lượng ảnh ít thay
đổi và mắt người không thể phát hiện được bên trong bức ảnh đó có chứa
thơng tin gì. Và ngày nay, khi ảnh số đã được sử dụng phổ biến thì giấu thơng
tin trong ảnh đã đem lại rất nhiều ứng dụng quan trọng trên nhiều lĩnh vực
trong đời sống xã hội. Ví dụ như đối với các nước phát triển chữ ký tay đã
được số hóa và được lưu trữ giống như hồ sơ cá nhân của các dịch vụ ngân
hàng và tài chính, nó được dùng để xác thực trong các thẻ tín dụng của người
tiêu dùng. Thêm vào đó, lại có rất nhiều loại thơng tin quan trọng cần được bảo
mật, chúng rất dễ bị lấy trộm và bị thay đổi bởi các phần mềm chuyên dụng.
Việc nhận thức cũng như phát hiện thông tin xuyên tạc đã trở nên vô cùng quan
trọng và cấp thiết. Một đặc điểm của giấu thơng tin trong ảnh đó là thơng tin
được giấu trong ảnh một cách vơ hình, bởi sau khi giấu thơng tin thì chất lượng
ảnh gần như không thay đổi, đặc biệt đối với ảnh màu hay ảnh đa mức xám.
1.3.2. Giấu tin trong audio
Giấu tin trong audio mang những đặc điểm riêng khác với giấu thông tin
trong các đối tượng đa phương tiện khác. Một những yêu cầu cơ bản của giấu



-13-

tin là đảm bảo tính chất ẩn của thơng tin được giấu đồng thời không làm ảnh
hưởng nhiều đến chất lượng của dữ liệu gốc. Để đảm bảo yêu cầu này, kỹ thuật
giấu thông tin trong audio phụ thuộc vào hệ thống thính giác của con người. Và
một vấn đề khó khăn ở đây là hệ thống thính giác của con người nghe được các
tín hiệu của các giải tần rộng và cơng suất lớn nên đã gây khó dễ đối với các
phương pháp giấu tin trong audio. Nhưng theo một số tài liệu, cơng trình
nghiên cứu đã cơng bố, hệ thống thính giác lại gặp những khó khăn trong việc
phát hiện sự thay đổi nhỏ về âm lượng, tần suất của tín hiệu audio. Điều này có
nghĩa là các âm thanh lớn, tần số cao có thể che giấu được các âm thanh nhỏ,
tần số thấp một cách dễ dàng. Và thơng tin này sẽ giúp ích cho việc chọn các
audio thích hợp cho việc giấu tin. Vấn đề này khó khăn thứ hai đối với giấu
thơng tin trong audio là kênh truyền tin. Kênh truyền hay băng thông chậm sẽ
làm ảnh hưởng đến chất lượng thông tin sau khi giấu.
1.3.3. Giấu tin trong video
Cũng giống như giấu thông tin trong ảnh hay audio, giấu tin trong video
cũng được quan tâm và được phát triển mạnh mẽ cho nhiều ứng dụng như
kiểm sốt sao chép thơng tin, nhận thực thông tin và bảo vệ bản quyền tác giả.
Với kỹ thuật giấu thơng tin trong video, các thuật tốn lợi dụng triệt để những
nhược điểm của hệ thống thị giác và thính giác của con người để thực hiện q
trình giấu tin.
1.3.4. Giấu tin trong văn bản
Trong việc trao đổi thơng tin qua hệ thống máy tính, văn bản chiếm một
tỷ lệ rất lớn so với các loại phương tiện chứa khác. Tuy vậy, giấu tin trong văn
bản lại chưa được quan tâm nghiên cứu nhiều. Các nghiên cứu về giấu tin
trong văn bản được chia theo hai hướng, thứ nhất văn bản được sử dụng để
giấu tin là những văn bản được chụp lại và lưu trên máy như một bức ảnh nhị
phân. Theo hướng này, các kỹ thuật giấu tin được thực hiện như kỹ thuật giấu



-14-

tin trong ảnh. Hướng thứ hai, phương tiện chứa sử dụng cho quá trình giấu tin
được lưu dưới dạng văn bản. Theo hướng này, các kỹ thuật giấu tin cũng tiến
hành như giấu tin trong ảnh bằng cách thay đổi một số ký tự tại một số vị trí
trên văn bản mà không làm ảnh hưởng nhiều đến nội dung văn bản gốc.
1.4. Các hướng tiếp cận giấu tin trên ảnh
1.4.1. Tiếp cận miền không gian ảnh
Miền không gian ảnh là miền dữ liệu ảnh gốc, tác động lên miền khơng
gian ảnh chính là tác động lên các điểm ảnh, thay đổi giá trị trực tiếp của điểm
ảnh. Đây là hướng tiếp cận tự nhiên bởi vì khi nói đến việc giấu tin trong ảnh
người ta thường nghĩ ngay đến việc thay đổi giá trị các điểm ảnh nguồn, một
phương pháp phổ biến của hướng tiếp cận này là phương pháp tác động đến bit
ít quan trọng của mỗi điểm ảnh.
Tuy nhiên, phương pháp này cũng có nhiều hạn chế, chẳng hạn như
khơng đảm bảo được tính bền vững của thông tin giấu đối với các thao tác biến
đổi như quay ảnh hoặc nén ảnh Jpeg. Điều này là dễ hiểu vì các thao tác nói
trên cũng loại bỏ hoặc làm sai lệch các bit ít quan trọng nhất của mỗi điểm ảnh.
1.4.2. Tiếp cận miền tần số ảnh
Hướng tiếp cận dựa trên miền khơng gian ảnh như đã trình bày ở trên là
cách tiến hành khảo sát tín hiệu và hệ thống rời rạc một cách trực tiếp trên
miền giá trị rời rạc của các điểm ảnh gọi là trên miền biến số độc lập tự nhiên.
Nhưng trong nhiều trường hợp, cách khảo sát trực tiếp này gặp phải những khó
khăn nhất định hoặc rất phức tạp và hiệu quả khơng cao.
Ngồi phương pháp khảo sát trực tiếp, có thể dùng phương pháp khảo sát
gián tiếp thông qua các kỹ thuật biến đổi. Các biến đổi này làm nhiệm vụ
chuyển miền biến số độc lập sang các miền khác và như vậy tín hiệu và hệ
thống rời rạc sẽ được biểu diễn trong các miền mới với các biến số mới.

Phương pháp biến đổi này cũng giống như phương pháp biến đổi trong phép


×