Tải bản đầy đủ (.pdf) (34 trang)

LUẬN VĂN: Nghiên cứu kỹ thuật giấu tin thuận nghịch trên miền dữ liệu ảnh cấp xám pot

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (859.38 KB, 34 trang )


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG……………

LUẬN VĂN

Nghiên cứu kỹ thuật giấu
tin thuận nghịch trên miền
dữ liệu ảnh cấp xám

1

MỤC LỤC

CHƢƠNG 1. TỔNG QUAN KĨ THUẬT GIẤU TIN 3
1.1 Vấn đề giấu tin 3
1.2 Mô hình kỹ thuật giấu thông tin cơ bản 3
1.2.1 Quá trình giấu tin 3
1.2.2 Quá trình giải mã 4
1.3 Phân loại giấu tin 4
1.3.1 Theo cách thức tác động lên các phƣơng tiện 5
1.3.2 Theo các mục đích sử dụng 5
1.4 Mục đích giấu tin 6
1.4.1 Kỹ thuật giấu thông tin bí mật (Steganography) 6
1.4.2 Kỹ thuật giấu thông tin theo kiểu đánh giấu (watermarking) 7
1.5 Môi trƣờng giấu tin 7
1.5.1 Giấu tin trong ảnh 7
1.5.2 Giấu tin trong audio 7
1.5.3 Giấu tin trong video 7
1.5.4 Giấu thông tin trong văn bản dạng text 8
CHƢƠNG 2. NGHIÊN CỨU CẤU TRÚC ẢNH BITMAP 9


2.1 Cấu trúc ảnh bitmap 9
2.1.1 BMP File Header 9
2.1.2 Bitmap Information (DIB header) 10
2.1.3. Bảng màu (Color Palette) 10
2.1.4. Dữ liệu ảnh 11
2.2 Ảnh xám 12
CHƢƠNG 3. NGHIÊN CỨU KỸ THUẬT GIẤU TIN THUẬN NGHỊCH 13
3.1 Kỹ thuật giấu tin dựa trên sự khác biệt 13
3.2 Ý tƣởng và thuật toán 13
3.2.1 Một số công thức và định nghĩa 13
3.2.2 Quá trình giấu thông tin 14
3.2.2 Quá trình tách thông tin và khôi phục ảnh gốc 16
CHƢƠNG 4. CÀI ĐẶT THỬ NGHIỆM 18
4.1 Môi trƣờng thử nghiệm 18

2

4.1.1. Tập dữ liệu thử nghiệm: 18
4.1.2. Đo độ đánh giá PSNR 19
4.1.3. Một số giao diện chƣơng trình demo 19
4.2 Các module cài đặt 26
4.2.1 Chức năng: Giấu thông tin vào trong ảnh. 26
4.2.2 Chức năng: Tách thông tin từ trong ảnh và khôi phục lại ảnh ban đầu. 26
4.2.3 Chức năng:Trích xuất phần dữ liệu của ảnh JBIG2. 26
4.2.4Chức năng: Khôi phục ảnh JBIG2 26
4.2.5 Chức năng: Đọc một tệp văn bản 26
4.2.6 Chức năng: Ghi một tệp văn bản 27
4.2.7 Chức năng: Đổi một chuỗi kí tự ra một chuỗi nhị phân 27
4.2.8 Chức năng: Đổi một chuỗi nhị phân ra một chuỗi kí tự 27
4.3 Thực nghiệm và đánh giá 27

4.3.1 Giấu trên 10 ảnh chuẩn 27
4.3.2 Giấu trên 20 ảnh bất kỳ 30
KẾT LUẬN 32
TÀI LIỆU THAM KHẢO 33


3

CHƢƠNG 1. TỔNG QUAN KĨ THUẬT GIẤU TIN
1.1 Vấn đề giấu tin
Từ trƣớc đến nay, nhiều phƣơng pháp bảo vệ thông tin đã đƣợc đƣa ra, trong đó
giải pháp dùng mật mã đƣợc ứng dụng rộng rãi nhất. Thông tin ban đầu đƣợc mã hoá,
sau đó sẽ đƣợc giải mã nhờ khoá của hệ mã. Đã có rất nhiều hệ mã phức tạp đƣợc sử
dụng nhƣ DES, RSA, NAPSACK , rất hiệu quả và phổ biến.
Một phƣơng pháp mới khác đã và đang đƣợc nghiên cứu và ứng dụng mạnh mẽ
ở nhiều nƣớc trên thế giới, đó là phƣơng pháp giấu tin (DataHiding). Giấu thông tin là
kỹ thuật nhúng (embedding) một lượng thông tin số nào đó vào trong một đối tượng dữ
liệu số khác. Một trong những yêu cầu cơ bản của giấu tin là đảm bảo tính chất ẩn của
thông tin đƣợc giấu đồng thời không làm ảnh hƣởng đến chất lƣợng của dữ liệu gốc.
Sự khác biệt chủ yếu giữa mã hoá thông tin và giấu thông tin là mã hoá làm cho
các thông tin hiện rõ là nó có đƣợc mã hoá hay không, còn với giấu thông tin thì ngƣời
ta sẽ khó biết đƣợc là có thông tin giấu bên trong.
1.2 Mô hình kỹ thuật giấu thông tin cơ bản
Giấu thông tin vào phƣơng tiện chứa và tách lấy thông tin là hai quá trình trái
ngƣợc nhau và có thể mô tả qua sơ đồ khối của hệ thống nhƣ sau
1.2.1 Quá trình giấu tin

Hình 1.1 - Lƣợc đồ chung cho quá trình giấu tin
Phƣơng tiện
chứa(audio,

ảnh, video)

Thông tin giấu

Phƣơng tiện
chứa đã đƣợc
giấu tin

Khóa

Bộ nhúng
thông tin

Phân
phối

4


- Thông tin cần giấu tuỳ theo mục đích của ngƣời sử dụng, nó có thể là thông
điệp (với các tin bí mật) hay các logo, hình ảnh bản quyền.
- Phƣơng tiện chứa: các file ảnh, text, audio… là môi trƣờng để giấu tin
- Bộ giấu thông tin: là những chƣơng trình thực hiện việc giấu tin
- Đầu ra: là các phƣơng tiện chứa đã có tin giấu trong đó
1.2.2 Quá trình giải mã
Tách thông tin từ các phƣơng tiện chứa đã đƣợc giấu tin diễn ra theo quy trình
ngƣợc lại với đầu ra là thông tin đã đƣợc giấu vào phƣơng tiện chứa. Phƣơng tiện chứa
sau khi tách lấy thông tin có thể đƣợc sử dụng, quản lý theo những yêu cầu khác nhau.
Hình 1.2 chỉ ra các công việc giải mã thông tin đã giấu. Sau khi nhận đƣợc đối tƣợng
phƣơng tiện chứa có giấu thông tin, quá trình giải mã đƣợc thực hiện thông qua một bộ

giải mã ứng với bộ giấu thông tin cùng với khoá của quá trình giấu. Kết quả thu đƣợc
gồm phƣơng tiện chứa gốc và thông tin đã giấu. Bƣớc tiếp theo thông tin đã giấu sẽ
đƣợc xử lý kiểm định so sánh với thông tin ban đầu.

Hình 1.2 - Lƣợc đồ cho quá trình giải mã
1.3 Phân loại giấu tin
Do kỹ thuật giấu thông tin số mới đƣợc hình thành trong thời gian gần đây nên
xu hƣớng phát triển chƣa ổn định. Nhiều phƣơng pháp mới, theo nhiều khía cạnh khác
nhau đang và chắc chắn sẽ đƣợc đề xuất, bởi vậy một định nghĩa chính xác, một sự
Phƣơng tiện
chứa(audio,
ảnh, video)

Thông tin giấu

Phƣơng tiện
chứa đã đƣợc
giấu tin

Khóa

Bộ nhúng
thông tin

Kiểm định


5

đánh giá phân loại rõ ràng chƣa thể có đƣợc. Sơ đồ phân loại trên hình 1.3 đƣợc

Fabien A. P. Petitcolas đề xuất năm 1999.

Hình 1.3 - Một cách phân loại các kỹ thuật giấu tin
Sơ đồ phân loại này nhƣ một bức tranh khái quát về ứng dụng và kỹ thuật giấu
thông tin. Dựa trên việc thống kê sắp xếp khoảng 100 công trình đã công bố trên một
số tạp chí, cùng với thông tin về tên và tóm tắt nội dung của khoảng 200 công trình đã
công bố trên Internet, có thể chia lĩnh vực giấu tin ra làm hai hƣớng lớn, đó là
watermarking và steganography.
1.3.1 Theo cách thức tác động lên các phương tiện
Phƣơng pháp chèn dữ liệu: Phƣơng pháp này tìm các vị trí trong file dễ bị bỏ
qua và chèn dữ liệu cần giấu vào đó, cách giấu này không làm ảnh hƣởng gì tới sự thể
hiện các file dữ liệu ví dụ nhƣ đƣợc giấu sau các ký tự EOF.
Phƣơng pháp tạo các phƣơng tiện chứa: Từ các thông điệp cần chuyển sẽ tạo ra
các phƣơng tiện chứa để phục vụ cho việc truyền thông tin đó, từ phía ngƣời nhận dựa
trên các phƣơng tiện chứa này sẽ tái tạo lại các thông điệp.
1.3.2 Theo các mục đích sử dụng
Giấu thông tin bí mật: đây là ứng dụng phổ biến nhất từ trƣớc đến nay, đối với
giấu thông tin bí mật ngƣời ta quan tâm chủ yếu tới các mục tiêu:
- Độ an toàn của giấu tin - khả năng không bị phát hiện của giấu tin.
Information hiding
Giấu thông tin
Watermarking
Thuỷ vân số
Visible Watermarking
Thuỷ vân hiển thị
Steganography
Giấu tin mật
Fragile Watermarking
Thuỷ vân dễ vỡ
Robust Watermarking

Thuỷ vân bền vững
Imperceptible Watermarking
Thuỷ vân ẩn

6

- Lƣợng thông tin tối đa có thể giấu trong một phƣơng tiện chứa cụ thể mà
vẫn có thể đảm bảo an toàn.
- Độ bí mật của thông tin trong trƣờng hợp giấu tin bị phát hiện.
Giấu thông tin bí mật không quan tâm tới nhiều các yêu cầu bền vững của
phƣơng tiện chứa, đơn giản là bởi ngƣời ta có thể thực hiện việc gửi và nhận nhiều lần
một phƣơng tiện chứa đã đƣợc giấu tin.
Giấu thông tin thuỷ vân: do yêu cầu bảo vệ bản quyền, xác thực… nên việc giấu
tin thuỷ vân có yêu cầu khác với giấu tin bí mật. Yêu cầu đầu tiên là các dấu hiệu thuỷ
vân đủ bền vững trƣớc các tấn công vô hình hay cố ý gỡ bỏ nó. Thêm vào đó các dấu
hiệu thuỷ vân phải có ảnh hƣởng tối thiểu (về mặt cảm nhận) đối với các phƣơng tiện
chứa. Nhƣ vậy các thông tin cần giấu càng nhỏ càng tốt.
Tuỳ theo các mục đích khác nhau thuỷ vân cũng có các yêu cầu khác nhau.
1.4 Mục đích giấu tin
Bảo mật thông tin bằng giấu tin có hai khía cạnh. Một là bảo mật cho dữ liệu
đem giấu (embedded data), chẳng hạn nhƣ giấu tin mật: thông tin mật đƣợc giấu kỹ
trong một đối tƣợng khác sao cho ngƣời khác không phát hiện đƣợc (steganography).
Hai là bảo mật chính đối tƣợng đƣợc dùng để giấu dữ liệu vào (host data),
chẳng hạn nhƣ ứng dụng bảo vệ bản quyền, phát hiện xuyên tạc thông tin
(watermarking)



Hình 1.4 - Hai lĩnh vực chính của kỹ thuật giấu thông tin.
1.4.1 Kỹ thuật giấu thông tin bí mật (Steganography)

Với mục đích đảm bảo tính an toàn và bảo mật thông tin tập trung vào các kỹ
thuật giấu tin để có thể giấu đƣợc nhiều thông tin nhất. Thông tin mật đƣợc giấu kỹ
trong một đối tƣợng khác sao cho ngƣời khác không phát hiện đƣợc.
Giấu thông tin
Giấu tin bí mật
(Steganography)
Thuỷ vân số
(Watermarking)

7

1.4.2 Kỹ thuật giấu thông tin theo kiểu đánh giấu (watermarking)
Mục đích là để bảo vệ bản quyền của đối tƣợng chứa thông tin thì lại tập trung
đảm bảo một số các yêu cầu nhƣ đảm bảo tính bền vững… đây là ứng dụng cơ bản
nhất của kỹ thuật thuỷ vân số.
1.5 Môi trƣờng giấu tin
1.5.1 Giấu tin trong ảnh
Giấu tin trong ảnh hiện đang rất đƣợc quan tâm. Nó đóng vai trò hết sức quan
trọng trong hầu hết các ứng dụng bảo vệ an toàn thông tin nhƣ: nhận thực thông tin,
xác định xuyên tạc thông tin, bảo vệ bản quyền tác giả…Thông tin sẽ đƣợc giấu cùng
với dữ liệu ảnh nhƣng chất lƣợng ảnh ít thay đổi và không ai biết đƣợc đằng sau ảnh
đó mang những thông tin có ý nghĩa. Ngày này, khi ảnh số đã đƣợc sử dụng rất phổ
biến thì giấu thông tin trong ảnh đã đem lại nhiều những ứng dụng quan trọng trên các
lĩnh vực trong đời sống xã hội.
Thông tin đƣợc giấu một cách vô hình, nó nhƣ là cách truyền thông tin mật cho
nhau mà ngƣời khác không biết đƣợc.
1.5.2 Giấu tin trong audio
Khác với kỹ thuật giấu thông tin trong ảnh: phụ thuộc vào hệ thống thị giác của
con ngƣời – HSV (Human Vision System), kỹ thuật giấu thông tin trong audio lại phụ
thuộc vào hệ thống thính giác HAS (Human Auditory System). Bởi vì tai con ngƣời rất

kém trong việc phát hiện sự khác biệt giữa các giải tần và công suất, có nghĩa là các
âm thanh to, cao tần có thể che giấu đi đƣợc các âm thanh nhỏ, thấp một cách dễ dàng.
Vấn đề khó khăn đối với giấu tin trong audio là kênh truyền tin, kênh truyền
hay băng thông chậm sẽ ảnh hƣởng đến chất lƣợng thông tin sau khi giấu. Giấu thông
tin trong audio đòi hỏi yêu cầu rất cao về tính đồng bộ và tính an toàn của thông tin.
Các phƣơng pháp giấu tin trong audio thƣờng lợi dụng những điểm yếu trong hệ thống
thính giác của con ngƣời.
1.5.3 Giấu tin trong video
Cũng giống nhƣ giấu thông tin trong ảnh hay trong audio, giấu tin trong video
cũng đƣợc quan tâm và đƣợc phát triển mạnh mẽ cho nhiều ứng dụng nhƣ điều khiển
truy cập thông tin, nhận thức thông tin, bản quyền tác giả…

8

Một phƣơng pháp giấu tin trong video đƣợc đƣa ra bởi Cox là phƣơng pháp
phân bố đều. Ý tƣởng cơ bản của phƣơng pháp là phân phối tin giấu dàn trải theo tần
số của dữ liệu gốc. Nhiều nhà nghiên cứu đã dùng những hàm cosin riêng và những hệ
số truyền sóng riêng để thực hiện việc giấu tin. Trong các thuật toán khởi nguồn,
thƣờng các kỹ thuật cho phép giấu ảnh vào trong video nhƣng thời gian gần đây các kỹ
thuật cho phép giấu cả âm thanh và hình ảnh vào video.
1.5.4 Giấu thông tin trong văn bản dạng text
Giấu thông tin trong văn bản dạng text thì khó thực hiện hơn do có ít thông tin
dƣ thừa, để làm đƣợc điều này ngƣời ta phải biết khéo léo khai thác các dƣ thừa tự
nhiên của ngôn ngữ. Một cách khác là tận dụng các định dạng văn bản (mã hoá thông
tin vào khoảng cách giữa các từ hay các dòng văn bản).
Kỹ thuật giấu tin đang đƣợc áp dụng cho nhiều loại đối tƣợng chứ không riêng
gì dữ liệu đa phƣơng tiện nhƣ ảnh, audio, video. Gần đây đã có một số nghiên cứu giấu
tin trong cơ sở dữ liệu quan hệ, các gói IP truyền trên mạng chắc chắn sau này còn tiếp
tục phát triển tiếp.


9

CHƢƠNG 2. NGHIÊN CỨU CẤU TRÚC ẢNH BITMAP
2.1 Cấu trúc ảnh bitmap
Một tập tin BMP điển hình thông thƣờng chứa những khối dữ liệu sau
Bảng 2.1 - Các khối dữ liệu trong một tập tin BMP
BMP File Header
Lƣu trữ thông tin tổng hợp về file BMP.
Bitmap Infomation
Lƣu trữ thông tin chi tiết về ảnh bitmap.
Color Palette
Lƣu trữ định nghĩa của màu đƣợc sử dụng cho bitmap
Bitmap Data
Lƣu trữ từng pixel của hình ảnh thực tế.
2.1.1 BMP File Header
Đây là khối bytes ở phần đầu tập tin, sử dụng để định danh tập tin. Ứng dụng
đọc khối bytes này để kiểm tra xem đó có đúng là tập tin BMP không và có bị hƣ hỏng
không.
Bảng 2.2 Chi tiết khối bytes tiêu đề tập tin BMP
Offset
Size
Mục đích
0000h
2 bytes
Magic number sử dụng để định nghĩa tập tin BMP: 0x42
0x4D (mã hexa của kí tự B và M). Các mục dƣới đây có
thể đƣợc dùng:
BM - Windows 3.1x, 95, NT, etc
CI - OS/2 Color Icon
CP - OS/2 Color Pointer

IC - OS/2 Icon
0002h
4 bytes
Kích thƣớc của tập tin BMP theo byte.
0006h
2 bytes
Dành riêng, giá trị thực tế phụ thuộc vào ứng dụng tạo ra
hình ảnh.
0008h
2 bytes
Dành riêng, giá trị thực tế phụ thuộc vào ứng dụng tạo ra
hình ảnh.
000Ah
4 bytes
Offset, địa chỉ bắt đầu các byte dữ liệu ảnh bitmap.

10

2.1.2 Bitmap Information (DIB header)
Khối bytes này nói cho ứng dụng biết các thông tin chi tiết về hình ảnh, sẽ đƣợc
sử dụng để hiển thị hình ảnh trên màn hình. Bảng 2.3 miêu tả chi tiết cấu trúc tiêu đề
DIB. Tất cả các giá trị đƣợc lƣu trữ nhƣ là unsigned interger, trừ khi lƣu ý một cách rõ
ràng.
Bảng 2.3 Chi tiết khối bytes thông tin tập tin BMP
Offset
Size
Mục đích
Eh
4
Kích thƣớc của tiêu đề (40 bytes)

12h
4
Chiều rộng bitmap tính bằng pixel (signed interger).
16h
4
Chiều cao bitmap tính bằng pixel (signed interger).
1Ah
2
Số lƣợng các mặt phẳng màu sắc đƣợc sử dụng. Phải đƣợc thiết
lập bằng 1.
1Ch
2
Số bit trên mỗi pixel, là độ sâu màu của hình ảnh. giá trị điển hình
là 1, 4, 8, 16, 24 và 32.
1Eh
4
Phƣơng pháp nén đƣợc sử dụng. Xem bảng tiếp theo để có danh
sách các giá trị có thể.
22h
4
Kích thƣớc hình ảnh. Đây là kích thƣớc của dữ liệu bitmap (xem
bên dƣới), và không nên nhầm lẫn với kích thƣớc tập tin.
26h
4
Độ phân giải theo chiều ngang của hình ảnh (signed interger)
2Ah
4
Độ phân giải theo chiều dọc của hình ảnh (signed interger)
2Eh
4

Số lƣợng màu trong bảng màu.
32h
4
Số lƣợng các màu sắc quan trọng đƣợc sử dụng, hoặc 0 khi màu
sắc nào cũng đều là quan trọng, thƣờng bị bỏ qua.
2.1.3. Bảng màu (Color Palette)
Bảng màu xuất hiện trong tập tin BMP trực tiếp sau tiêu đề BMP và tiêu đề
DIB. Vì vậy, offset là kích cỡ của tiêu đề BMP cộng với kích thƣớc của tiêu đề DIB.
Có tất cả
24
2
màu RGB khác nhau, nhƣng các loại Bitmap sau:
- 1bit (2 màu, hoặc chuẩn Windows là trắng-đen)
- 4 bits (16 màu)
- 8 bits (256 màu)

11

không thể khai thác hết, nên chỉ liệt kê các màu đƣợc dùng trong file. Mỗi màu trong
bảng màu đƣợc mô tả bằng 4 bytes. (BlueByte, GreenByte, RedByte, ReservByte).
Thí dụ: bảng màu loại 1 bit chuẩn Windows có 8 bytes: 0,0,0,0,255,255,255,0
(4 bytes đầu là màu thứ 0; 4 bytes sau là màu thứ 1. Do chỉ có 0 và 1 nên mô tả mỗi
điểm ảnh chỉ cần dùng 1 bit).
Tƣơng tự nhƣ vậy, bảng màu của file 4 bits có 64 bytes, lần lƣợt từ màu số 0
đến màu số 15, bảng màu của file 8 bits có 1024 bytes (từ 0 đến 255). Chính vì các
màu đƣợc liệt kê nhƣ vậy nên các màu trong file 1 bit, 4 bits, 8 bits đƣợc gọi là
Indexed, còn 24 bits – True.
2.1.4. Dữ liệu ảnh
Dữ liệu ảnh đƣợc lƣu từng điểm cho đến hết hàng ngang (từ trái sang phải), và
từng hàng ngang cho đến hết ảnh (từ dƣới lên trên).

Đối với mỗi điểm ảnh loại màu Indexed, ta cần 1, 4 hoặc 8 bits để đặc trƣng cho
điểm đang xét ứng với màu thứ mấy trong bảng màu.
Thí dụ:
Giá trị 0111 (=7) trong loại BMP 4 bits cho biết điểm đó có màu 7 (màu xám
theo “chuẩn” Windows). Riêng loại 24 bits, không mô tả màu bằng thứ tự trên bảng
màu (nếu liệt kê hết bảng màu của nó thì đã tốn cả Gigabyte bộ nhớ và đĩa), mà ngƣời
ta liệt kê luôn giá trị RGB của 3 màu thành phần.
Thí dụ:
Trắng ={255,255,255}, Đen = {0,0,0}.
Nhƣ vậy, mỗi điểm ảnh loại 1 bit tốn
81
bytes (nói cách khác, 1 byte lƣu đƣợc 8
điểm 1 bit), loại 4 bits -
21
byte, loại 8 bits - 1 byte và loại 24 bits - 3 bytes. Tuy
nhiên, tính chung cả bức ảnh thì khối data không hoàn toàn tỉ lệ thuận nhƣ vậy, mà
thƣờng hơi lớn hơn một chút. Lý do chính ở chỗ ngƣời ta ngầm quy ƣớc số bytes cần
dùng cho 1 hàng ngang phải là bội của 4.
Nếu bạn có ảnh 1x1, 1 bit, thì cũng tốn 66 bytes nhƣ ảnh 32x1, 1 bit (54 cho
header, 8 cho bảng màu, 4 cho 1 hàng tối thiểu). Và nếu bạn thử xoay bức hình 32x1
(vừa đúng 4 bytes dữ liệu) thành 1x32, sự lãng phí sẽ xuất hiện. Lúc đó, mỗi hàng sẽ
lãng phí 31 bits, tổng cộng 32 lần nhƣ thế
bytesbytes 124431


12

2.2 Ảnh xám
Đơn vị tế bào của ảnh số là pixel. Tùy theo mỗi định dạng là ảnh màu hay ảnh
xám mà từng pixel có thông số khác nhau. Đối với ảnh màu từng pixel sẽ mang thông

tin của ba màu cơ bản tạo ra bản màu khả kiến là:
Đỏ (R)
Xanh lá (G)
Xanh biển (B)
[Thomas 1892].
Trong mỗi pixel của ảnh màu, ba màu cơ bản R, G và B đƣợc bố trí sát nhau và
có cƣờng độ sáng khác nhau. Thông thƣờng, mổi màu cơ bản đƣợc biểu diễn bằng tám
bit tƣơng ứng 256 mức độ màu khác nhau. Nhƣ vậy mỗi pixel chúng ta sẽ có:
38
2
=
24
2
màu (khoảng 16.78 triệu màu).
Đối với ảnh xám, thông thƣờng mỗi pixel mang thông tin của 256 mức xám
(tƣơng ứng với tám bit) nhƣ vậy ảnh xám hoàn toàn có thể tái hiện đầy đủ cấu trúc của
một ảnh màu tƣơng ứng thông qua tám mặt phẳng bit theo độ xám.
Trong hầu hết quá trình xử lý ảnh, chúng ta chủ yếu chỉ quan tâm đến cấu trúc
của ảnh và bỏ qua ảnh hƣởng của yếu tố màu sắc. Do đó bƣớc chuyển từ ảnh màu
thành ảnh xám là một công đoạn phổ biến trong các quá trình xử lý ảnh vì nó làm tăng
tốc độ xử lý là giảm mức độ phức tạp của các thuật toán trên ảnh.




13

CHƢƠNG 3. NGHIÊN CỨU KỸ THUẬT GIẤU TIN
THUẬN NGHỊCH
Giấu tin thuận nghịch là kỹ thuật giấu thông điệp sau khi tách lấy thông điệp ta

có thể khôi phục lại xấp xỉ ảnh gốc ban đầu.
3.1 Kỹ thuật giấu tin dựa trên sự khác biệt
Kỹ thuật giấu tin thuận nghịch dựa trên Difference Expansion do Jun Tian đề
xuất năm 2002 [5].
3.2 Ý tƣởng và thuật toán
Kỹ thuật này nhúng thông điệp cần giấu vào sự khác biệt của cặp giá trị điểm ảnh.
3.2.1 Một số công thức và định nghĩa
a) Một số công thức:
Từ cặp giá trị điểm ảnh (x,y) của ảnh, ta tính giá trị trung bình l và sự khác biệt h theo
công thức:
2
yx
l
,
yxh
(1)
trong đó
.
là phép toán lấy phần nguyên.
Từ (1) ta biến đổi:
2
1h
lx
,
2
h
ly
(2)
Mà giá trị của điểm ảnh trong ảnh xám nằm trong [0,255], ta có:


255
2
1
0
h
l

255
2
0
h
l

 Công thức
)12),255(2min( llh
(3)
Công thức này đƣợc sử dụng để kiểm tra h sau khi thay đổi để tránh vấn đề tràn sau
khi nhúng vào ảnh.

14



LSB của h sẽ đƣợc chọn làm vùng để nhúng bit dữ liệu:
)(2.
2
hLSB
h
h


Với LSB (h) = 0 hoặc 1, để tránh vấn đề tràn, chúng ta chỉ nhúng vào những giá trị h
có thể thay đổi (changeable).
b) Một số định nghĩa:
Định nghĩa: Cho một cặp giá trị điểm ảnh xám (x,y) chúng ta nói h là có thể thay đổi
nếu h thỏa mãn điều kiện sau:
)12),255(2min(2.
2
llb
h

cho cả b=0 và 1.
Định nghĩa: Cho một cặp giá trị điểm ảnh xám (x,y) chúng ta nói h là có thể mở rộng
nếu h thỏa mãn điều kiện sau:
)12),255(2min(.2 llbh

cho cả b=0 và 1.
3.2.2 Quá trình giấu thông tin












Hình 3.1 - Lƣợc đồ quá trình giấu tin [5].

Digital
Image
Pairs of
Pixels
Integer Averages
Differences
Location
Map
Restoration
Information
Message
Modified
Differences
Watermarked
Image

15

Các bước thực hiện:
Bƣớc 1:
Chúng ta áp dụng công thức (1) cho mỗi cặp điểm ảnh.
Tiếp theo chúng ta phân loại h thành 5 loại EZ, NZ, EN, CNE và NC:
1. EZ: expandable zeros. Cho tất cả
1,0h
mà có thể mở rộng.
2. NZ: not expandable zeros. Cho tất cả
1,0h
mà không thể mở rộng.
3. EN: expandable nonzeros. Cho tất cả
1,0h

mà có thể mở rộng.
4. CNE: changeablable, but not expandable. Cho tất cả h
1,0h
mà có thể thay
đổi nhƣng không thể mở rộng.
5. NC: not changeable. Cho tất cả h
1,0h
mà không thể thay đổi.
Bƣớc 2:
Dựa vào 5 thành phần có đƣợc ở bƣớc 1 chúng ta sẽ tạo bản đồ định vị (location
map) những cặp mà có h thuộc EZ hoặc EN chúng ta sẽ thiết lập giá trị là 1, còn những
cặp mà có h thuộc NZ, CNE hoặc NC chúng ta sẽ thiết lập giá trị là 0. Bản đồ định vị
(bitmap 1bit) sẽ đƣợc nén xuống bởi thuật toán nén JBIG2 [8] hoặc mã đoạn dài.
Chuỗi bit sau khi nén sẽ đƣợc kí hiệu là L.
Chúng ta sẽ thu thập giá trị LSB gốc của h trong CNE tạo thành chuỗi bit C, với
h=1 hoặc -2 thì LSB sẽ không đƣợc thêm vào C.
Với bản đồ định vị L, giá trị LSB gốc C, và chuỗi bit thông điệp P chúng ta kết hợp
chúng thành chuỗi bit B:
PCLB

Tùy vào h mà chúng ta sẽ có những công thức nhúng bit b riêng:
- EZ hoặc EN:
bhh .2

- CNE:
b
h
h 2.
2


- NZ hoặc NC: không thay đổi giá trị của h.
Với b lần lƣợt là những bit thuộc chuỗi bit B.
Bƣớc 3:
Sau khi các bit b đã đƣợc nhúng hết vào trong h. Chúng ta áp dụng công thức
(2) để nhúng vào trong ảnh gốc.

16

3.2.2 Quá trình tách thông tin và khôi phục ảnh gốc










Hình 3.2 - Lƣợc đồ quá trình tách tin [5].
Các bước thực hiện:
Quá trình giải mã ngƣợc lại với quá trình giấu tin.
Bƣớc 1:
Áp dụng công thức (1) cho mỗi cặp giá trị điểm ảnh
Tiếp theo chúng ta chia h làm 2 phần C và NC:
1. C: changeable. Cho tất cả h có thể thay đổi
2. NC: not changeable. Cho tất cả h không thể thay đổi.
Tiếp theo chúng ta thu thập tất cả LSB của h trong C sẽ đƣợc chuỗi bit B. Từ B chúng
ta sẽ có L, C và P. Từ L chúng ta giải mã đƣợc bản đồ định vị (location map). Với bản
đồ định vị chúng ta sẽ khôi phục lại giá trị h ban đầu nhƣ sau:

- Nếu
Ch
và bản đồ định vị có giá trị là 1, khi đó
2
h
h

- Nếu
Ch
, bản đồ định vị có giá trị là 0 và
10 h
khi đó
1h

- Nếu
Ch
, bản đồ định vị có giá trị là 0 và
12 h
khi đó
2h

- Nếu
Ch
, bản đồ định vị có giá trị là 0 và
2h
hoặc
3h
khi đó
b
h

h 2.
2

- Nếu
NCh
, h không thay đổi.

Watermarked
Image
Pairs of
Pixels
Integer Averages
Differences
Location
Map
Restoration
Information
Message
Original
Image
Original
Differences

17

Bƣớc 2:
Sau khi tất cả h đã đƣợc khôi phục, chúng ta áp dụng công thức (2) để khôi phục
lại ảnh gốc.
Kết quả: ảnh gốc đƣợc khôi phục, và thu đƣợc chuỗi bít thông điệp giấu P.


Nhận xét kỹ thuật:
Kỹ thuật có khả năng giấu cao, trên 95% ảnh. Chất lƣợng ảnh sau khi giấu tin tốt.
Có khả năng khôi phục lại ảnh gốc có độ chính xác cao.


18

CHƢƠNG 4. CÀI ĐẶT THỬ NGHIỆM
4.1 Môi trƣờng thử nghiệm
4.1.1 Tập dữ liệu thử nghiệm
Tập dữ liệu thử nghiệm gồm 10 ảnh chuẩn kích thƣớc 512x512 [6] trong Hình
4.1 và 20 ảnh đƣợc chụp từ máy ảnh kỹ thuật số và đƣợc convert thành ảnh xám 8 bit
bởi phần mềm Adobe Photoshop CS2 với nhiều kích cỡ khác nhau Hình 4.2.

Hình 4.1 10 ảnh chuẩn

Hình 4.2 20 chụp bằng máy ảnh kỹ thuật số với nhiều kích cỡ

19

4.1.2 Đo độ đánh giá PSNR
Chất lƣợng ảnh sau khi tin giấu đƣợc đánh giá thông qua giá trị của tỷ số PSNR
(Peak Signal to Noise Ratio) tỷ số tín hiệu đỉnh trên nhiễu.
Nó đƣợc định nghĩa thông qua bình phƣơng trung bình lỗi MSE (mean squared
error) cho hai hình ảnh I va K có kích thƣớc
nm
:
1
0
1

0
2
,,
1
m
i
n
j
jiKjiI
mn
MSE

PSNR đƣợc định nghĩa:
MSE
MAX
MSE
MAX
PSNR
II
10
2
10
log.20log.10


Khi hai hình ảnh giống hệt nhau, MSE sẽ bằng 0 và PSNR đi đến vô hạn.
4.1.3 Một số giao diện chương trình demo
a) Giao diện chính của chương trình (hình 4.3)
Bao gồm các chức năng:
Giấu tin

- Giấu chuỗi kí tự: thực hiện giấu một chuỗi thông điệp do ngƣời dùng nhập vào.
- Giấu tệp văn bản: thực hiện giấu một tệp văn bản do ngƣời dùng chọn.
- Giấu theo tỷ lệ ảnh: thực hiện giấu với chuỗi bit ngẫu nhiên với kích thƣớc đƣợc
tính toán theo tỷ lệ % của ảnh (tỷ lệ do ngƣời dùng nhập).
Tách tin:
- Tách chuỗi kí tự: thực hiện tách một chuỗi thông điệp từ ảnh đã đƣợc giấu bởi chức
năng giấu chuỗi kí tự.
- Tách tệp văn bản: thực hiện tách một tệp văn bản từ ảnh đã đƣợc giấu bởi chức
năng giấu tệp văn bản.
PSNR:
- Tính toán PSNR.

20


Hình 4.3 Giao diện chính chƣơng trình
b) Giao diện chương trình BIP (Binarization Image Processor) hình 4.4

Hình 4.4 Giao diện chƣơng trình nén ảnh BIP (Binarization Image Processor) [7]

21

Các chức năng chính:
- Add File (s): tệp ảnh đầu vào quá trình nén
- Output type: lựa chọn định dạng ảnh kết quả
- Output directory: Chọn thƣ mục lƣu ảnh kết quả
- Binarize all: thực hiện quá trình xử lý ảnh
Cách chuyển đổi một định dạng ảnh bằng phần mềm BIP:
Bƣớc 1: Click vào Add File (s) hoặc Add Directory để chọn tệp ảnh cần xử lý.
Phần mềm sẽ xử lý tất cả những tệp có trong danh sách Images to process.

Bƣớc 2: Click vào Output type để chọn kiểu (TIFF/PDF/JBIG2/BMP) cho ảnh
kết quả.
Bƣớc 3: Click vào Output directory để chọn đƣờng dẫn tới thƣ mục lƣu ảnh kết
quả.
Bƣớc 4: Click vào nút Binarize all để xử lý tất cả ảnh có trong danh sách đầu vào
hoặc nút Binarize selected để xử lý những ảnh đƣợc chọn trong danh sách.
Các định dạng đầu ra của phần mềm BIP:
- TIFF
- PDF
- JBIG2
- BMP (Windows bitmap) 1-bpp
- GIF
- PNG
Các yêu cầu tối thiểu về hệ thống khi cài đặt:
- 128 MB RAM
- ~ 10 MB ổ đĩa trống
- Mode hiển thị 1024x768
- Bộ xử lý Celeron 800MHz
- Windows 98 (Windows XP/Vista)
Thông tin liên hệ:
- Thông tin chung:
- Đăng ký:
- Hỗ trợ khách hàng:



22

c)Giao diện quá trình giấu tin bất kỳ


Hình 4.5 Giao diện nhúng thông điệp

Hình 4.6 Chọn ảnh


23

Ô nhập dữ liệu:
- Ảnh nhúng: click vào nút bên cạnh chọn ảnh để giấu thông tin.
- Bản đồ: tên ảnh lƣu trữ bản đồ định vị, sẽ đƣợc nén lại chƣơng trình nén JBIG2 rồi
nhúng vào ảnh.
- Thông điệp: nhập vào thông điệp cần giấu.
- Ảnh kết quả: lƣu trữ ảnh kết quả sau khi giấu tin.
Nút bấm:
- Click vào nút để chọn ảnh.
- Giấu tin: thực hiện quá trình giấu tin.
- Thoát: thoát khỏi giao diện giấu thông tin.

Hình 4.7 Nhập bản đồ định vị nén
Khi thực hiện giấu tin, bản đồ định vị sẽ đƣợc tạo với tên trong ô dữ liệu bản đồ. Nén
bản đồ định vị trên bởi phần mềm nén BIP (Binarization Image Processor) với định
dạng tệp kết quả là jb2 (hình 4.4). Sau đó click vào nút chọn ảnh (hình 4.7) để chọn
bản đồ định vị đã nén. Sau đó click vào nút tiếp tục thể tiếp tục thực hiện quá trình
giấu tin. Kết quả đạt đƣợc thể hiện qua (hình 4.8)

Hình 4.8 Ảnh trƣớc và sau khi giấu tin

24

d) Giao diện quá trình giấu tệp văn bản:


Hình 4.9 Giao diện quá trình giấu tệp văn bản
Ô nhập dữ liệu:
- Ảnh nhúng: click vào nút bên cạnh chọn ảnh để giấu thông tin.
- Bản đồ định vị: tên ảnh lƣu trữ bản đồ định vị, sẽ đƣợc nén lại chƣơng trình nén
JBIG2 rồi nhúng vào ảnh.
- Tên tệp nhúng: click vào nút bên cạnh để chọn tệp văn bản cần giấu.
- Ảnh kết quả: lƣu trữ ảnh kết quả sau khi giấu.
Nút bấm:
- Giấu tin: thực hiện quá trình giấu tin.
- Thoát: thoát khỏi giao diện giấu thông tin.
Khi thực hiện giấu tin, bản đồ định vị sẽ đƣợc tạo với tên đƣợc nhập trong ô dữ liệu
bản đồ. Nén bản đồ định vị trên bởi phần mềm BIP (hình 4.4). Click vào nút chọn ảnh
để chọn bản đồ định vị đã nén. Sau đó click vào nút tiếp tục thể tiếp tục thực hiện quá
trình giấu tin.

×