Tải bản đầy đủ (.pdf) (79 trang)

Xây dựng các lược đồ thủy vân bền vững bằng cách kết hợp phép biến đổi DWT và SVD

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.82 MB, 79 trang )

i


ii

ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

NGUYỄN NAM PHƯƠNG

XÂY DỰNG CÁC LƯỢC ĐỒ THỦY VÂN BỀN VỮNG
BẰNG CÁCH KẾT HỢP PHÉP BIẾN ĐỔI DWT VÀ SVD

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

THÁI NGUYÊN – 2016


iii

LỜI CAM ĐOAN
Tôi xin cam đoan toàn bộ nội dung luận văn này là do tôi tự sưu tầm, biên
soạn và nghiên cứu.
Nội dung của luận văn này chưa từng được ai khác công bố hay xuất bản
dưới bất kỳ hình thức nào và cũng không được sao chép từ bất kỳ một công
trình nghiên cứu nào.
Toàn bộ mã nguồn chương trình hoàn toàn do tôi tự tay viết và chỉnh sửa
dưới sự hướng dẫn của thầy giáo hướng dẫn, kết quả thử nghiệm hoàn toàn do
tôi tìm hiểu và thực hiện.
Nếu sai tôi xin hoàn toàn chịu trách nhiệm.
Thái Nguyên, ngày 10 tháng 4 năm 2016


Học viên

Nguyễn Nam Phương


iv

LỜI CẢM ƠN
Tôi xin bày tỏ lòng biết ơn sâu sắc đến thầy giáo PGS.TS.Nguyễn Bá
Tường - Trường Học viện Kĩ thuật Quân sự là người đã trực tiếp hướng dẫn,
chỉ bảo tận tình và hết lòng giúp đỡ tôi trong suốt thời gian làm luận văn này.
Xin được cảm ơn các anh, chị và các bạn đồng nghiệp trong nhóm nghiên
cứu an toàn bảo mật thông tin do thầy Nguyễn Bá Tường hướng dẫn đã có
những góp ý quý báu trong quá trình nghiên cứu và trình bày luận văn.
Tôi cũng chân thành cảm ơn những người thân trong gia đình, bạn bè đã
động viên và tạo mọi điều kiện giúp tôi trong quá trình học tập, công tác cũng
như trong cuộc sống.
Cuối cùng tôi xin gửi lời chúc sức khỏe và thành công tới tất cả quý thầy
cô và gia đình cùng toàn thể các bạn.
Thái Nguyên, ngày 10 tháng 4 năm 2016
Học viên

Nguyễn Nam Phương


v

MỤC LỤC
LỜI CAM ĐOAN ............................................................................................. ii
LỜI CẢM ƠN .................................................................................................. iv

MỤC LỤC ......................................................................................................... v
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT ...................................... vi
DANH MỤC BẢNG ...................................................................................... viii
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ .......................................................... ix
LỜI MỞ ĐẦU ................................................................................................... 1
Chương 1. CÁC KHÁI NIỆM CƠ SỞ.............................................................. 3
1.1. Ảnh số .................................................................................................... 3
1.1.1.Khái niệm và phân loại ảnh số ......................................................... 3
1.1.2.Điểm ảnh .......................................................................................... 4
1.1.3.Màu và mô hình màu ....................................................................... 5
1.1.4.Histogram ......................................................................................... 9
1.1.5.Định dạng ảnh ................................................................................ 10
1.2. Các phép biến đổi ma trận.................................................................... 12
1.2.1.Biến đổi Cosine rời rạc DCT ......................................................... 12
1.2.2.Biến đổi Wavelet rời rạc DWT ...................................................... 15
1.2.3.Biến đổi SVD ................................................................................. 16
1.3. Giấu tin ................................................................................................. 18
1.3.1.Khái niệm giấu tin .......................................................................... 18
1.3.2.Giấu tin trên miền không gian ....................................................... 20
1.3.3.Giấu tin trên miền biến đổi ............................................................ 21
1.4. Thủy vân số .......................................................................................... 22
1.4.1.Khái niệm ....................................................................................... 22
1.4.2.Phân loại ......................................................................................... 22
1.4.3.Các yêu cầu đối với hệ thống thủy vân .......................................... 25
1.4.4.Mô hình thủy vân cơ bản ............................................................... 25
1.4.5.Tấn công thủy vân .......................................................................... 27
1.4.6.Đánh giá chất lượng thủy vân ........................................................ 27
1.4.7.Ứng dụng của thủy vân .................................................................. 29



vi

Chương 2. THỦY VÂN BỀN VỮNG DỰA TRÊN CÁC PHÉPBIẾN ĐỔI
DWT VÀ SVD ................................................................................................ 31
2.1. Giới thiệu chung ................................................................................... 31
2.2. Khai triển SVD..................................................................................... 31
2.2.1. Khái niệm về khai triển SVD ........................................................ 31
2.2.2. Một số tính chất của khai triển SVD............................................. 32
2.3. Thủy vân trên miền SVD .................................................................... 34
2.4. Phương pháp DMA [5]: Thủy vân kết hợp SVD và DWT ba mức ..... 37
2.4.1. Thuật toán chuyểnđổi sang dãy nhị phân...................................... 37
2.4.2. Thuật toán nhúng thủy vân............................................................ 37
2.4.3. Thuật toán trích thủy vân .............................................................. 39
2.4.4. Nhận xét và đánh giá..................................................................... 40
2.5. Phương pháp TDD [6]: Thủy vân sử dụng SVD và DWT hai mức. ... 41
2.5.1. Giới thiệu ...................................................................................... 41
2.5.2. Thuật toánnhúng thủy vân............................................................. 41
2.5.3. Thuật toán trích ............................................................................. 42
2.5.4. Nhận xét và đánh giá..................................................................... 43
Chương 3. THỰC NGHIỆM, PHÂN TÍCH VÀ SO SÁNHCÁC LƯỢC ĐỒ
THỦY VÂN .................................................................................................... 44
3.1. Các Độ đo xác định chất lượng và tính bền vững................................ 44
3.2 Giới thiệu chương trình ......................................................................... 44
3.3. Kết quả thử nghiệm .............................................................................. 49
3.3.1. Kết quả lược đồ DMA................................................................... 49
3.3.2. Kết quả lược đồ TDD so sánh lược đồ với DMA ......................... 51
KẾT LUẬN ..................................................................................................... 53
TÀI LIỆU THAM KHẢO ............................................................................... 54
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT


Chữ viết tắt

Diễn giải

Ý nghĩa


vii

SVD
QR
NMF

Singular Value Decomposition

Biến đổi SVD

QR Decomposition

Biến đổi QR

Non-negative Matrix Factorization Thừa số hóa ma trận không
âm

DCT

Discrete Cosine Transform

Biến đổi Cosine rời rạc


IDCT

Invert Discrete Cosine Transform

Biến đổi ngược DCT

DFT

Discrete Fourier Transform

Biến đổi Forier rời rạc

IDFT

Invert Discrete Fourier Transform

Biến đổi ngược DFT

DWT

Discrete Wavelet Transform

Biến đổi Wavelet rời rạc

IDWT

Invert Discrete Wavelet Transform Biến đổi ngược DWT

FT


Fourier Transfer

Biến đổi Fourier


viii

DANH MỤC BẢNG
Bảng 3.1: Kết quả thử nghiệm về chất lượng ảnh sau khi .............................. 49
nhúng thủy vân: ............................................................................................... 49
Bảng 3.2: Kết quả thử nghiệm tính bền vững của lược đồ thủy vân: ............. 49
Bảng 3.3: Kết quả thử nghiệm tính bền vững của lược đồ thủy vân .............. 50
sau khi ảnh thủy vân bị tấn công: .................................................................... 50
Bảng 3.4: So sánh chất lượng ảnh của lược đồ DMA và TDD. ..................... 51
Bảng 3.5: Bảng So sánh tính bền vững của lược đồ DMA và TDD............... 52
dựa trên độ đo hệ số tương quan r. ................................................................. 52


ix

DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
Hình 1.1: Biểu diễn các điểm ảnh trong ảnh số ................................................ 4
Hình 1.2: Tổ hợp màu Red-Green-Blue trong hệ màu RGB ............................ 6
Hình 1.3: Tổ hợp các màu trong mô hình màu CMYK .................................... 7
Hình 1.4: Mặt phẳng màu U-V tại giá trị Y = 0.5............................................. 8
Hình 1.5: Biểu đồ histogram của ảnh đa cấp xám Lena ................................... 9
Hình 1.6: Cấu trúc tệp ảnh bitmap .................................................................. 10
Hình 1.7: Sơ đồ quá trình giấu tin ................................................................... 19
Hình 1.8: Sơ đồ quá trình giải mã tin giấu ...................................................... 20
Hình 1.9: Phân loại các kỹ thuật thủy vân. ..................................................... 23

Hình 1.10: Mô hình hệ thống thủy vân cơ bản ............................................... 26
Hình 2.1: Một khối ảnh 8  8 của ảnh Baboon ................................................. 32
Hình 2.2: Kết quả phân tích SVD đối với ma trận A của ............................... 33
Hình 2.3: Sơ đồ nhúng thủy vân DMA ........................................................... 39
Hình 2.4: Sơ đồ nhúng thủy vân TDD ............................................................ 42
Hình 2.5: Sơ đồ Trích thủy vân ....................................................................... 43


1

LỜI MỞ ĐẦU
Ngày nay, cùng với sự phát triển mạnh mẽ của công nghệ thông tin và
truyền thông, mạng Internet đã trở thành một trong các phương tiện truyền tải,
chia sẻ thông tin, tài liệu một cách thuận tiện, hiệu quả. Thông tin luôn sẵn sàng
trực tuyến, mọi người đều có thể kết nối vào Internet để tìm kiếm một cách dễ
dàng các thông tin cần thiết. Bên cạnh đó, các công ty, các nhà cung cấp sản
phẩm có thể bán sản phẩm của mình thông qua mạng Internet cũng như sẵn
sàng cung cấp dữ liệu, thông tin về các sản phẩm, dịch vụ của mình cho người
dùng thông qua hệ thống mạng Internet một cách hiệu quả.
Với lượng thông tin được truyền qua mạng ngày càng nhiều thì vấn nạn
sao chép và sử dụng không hợp pháp dữ liệu số ngày một tăng. Tuy nhiên việc
quản lý và khai thác các thông tin này lại đôi khi nằm ngoài tầm kiểm soát của
các cá nhân, tổ chức do vấn nạn sao chép bất hợp pháp, vi phạm bản quyền
ngày một gia tăng. Từ đó cần thiết phải có các giải pháp chống sao chép để hạn
chế việc vi phạm bản quyền các sản phẩm dữ liệu số.
Một trong những giải pháp hữu hiệu để bảo vệ bản quyền là kỹ thuật thủy
vân số. Thủy vân số dựa trên kết quả nghiên cứu của nhiều lĩnh vực khác nhau
như: Mật mã học, kỹ thuật giấu tin, lý thuyết thống kê và xử lý tín hiệu số. Mục
đích của phương pháp này là nhúng một lượng thông tin có ích vào các sản
phẩm số (lượng thông tin này được gọi là thủy vân). Dựa trên mục đích sử dụng

các lược đồ thủy vân được chia thành hai nhóm chính gồm thủy vân bền vững
và thủy vân dễ vỡ. Thủy vân dễ vỡ là kỹ thuật nhúng thủy vân vào trong ảnh, khi
có bất kì sự can thiệp hay thay đổi nào tới ảnh gốc thì dấu thủy vân sẽ không còn
nguyên vẹn; kỹ thuật thủy vân này được ứng dụng trong bài toán xác thực tính
toàn vẹn dữ liệu số. Trong khi đó thủy vân bền vững được ứng dụng trong bài
toán bảo vệ bản quyền đối với các sản phẩm số.


2

Luận văn trình bày một số lược đồ thủy vân bền vững dựa trên các phép
biến đổi SVD, DWT ứng dụng trong việc bảo vệ bản quyền trên dữ liệu ảnh số.
Đây là hướng nghiên cứu mới trên thế giới, có ý nghĩa khoa học và ứng dụng thực
tiễn. Nội dung luận văn được tổ chức thành ba chương như sau:
Chương 1:Trình bày tổng quan về các kiến thức cơ bản về ảnh số, một
số phép biến đổi ma trận, khái niệm về giấu tin và thủy vân số.
Chương 2: Trình bày các kết quả nghiên cứu về thủy vân số dựa trên sự
kết phép biến đổi SVD và DWT đã được công bố và đề xuất hai lược đồ thủy
vân mới sử dụng kết hợp phếp biến đổi SVD và DWT.
Chương 3: Trình bày các phân tích,đánh giá và so sánh giữa các lược đồ
thủy vân đã trình bày trong chương 2. Đồng thời tác giả cũng đưa ra kết quả
chương trình thử nghiệm cho các lược đồ trên.


3

Chương 1. CÁC KHÁI NIỆM CƠ SỞ
Chương này trình bày các khái niệm cơ bản về ảnh số, ảnh nhị phân, ảnh
đa mức xám, ảnh mầu, điểm ảnh, mầu và mô hình mầu, các định dạng ảnh, các
phép biến đổi ma trận thường dùng trong xử lý ảnh, các khái niệm về giấu tin,

thủy vân số.
1.1. Ảnh số
1.1.1. Khái niệm và phân loại ảnh số
Ảnh số là tập hợp bao gồm hữu hạn các phần tử được gọi là điểm ảnh
(pixel), mỗi điểm ảnh được biểu diễn bởi một số hữu hạn các bit.
Trên phương diện toán học, ảnh số được xem như là một ma trận nguyên
dương gồm m hàng và n cột, mỗi phần tử của ma trận đại diện cho một điểm
ảnh. Dựa theo màu sắc ta có thể chia ảnh số thành 3 loại cơ bản: Ảnh nhị phân,
ảnh đa cấp xám và ảnh màu (true color).
Ảnh nhị phân
Ảnh nhị phân là ảnh chỉ có hai màu, một màu đại diện cho màu nền và
màu còn lại cho đối tượng của ảnh. Nếu hai màu là đen và trắng thì gọi là ảnh
đen trắng. Như vậy, ảnh nhị phân được xem như một ma trận nhị phân.
Ảnh đa mức xám
Ảnh đa cấp xám là ảnh có thể nhận tối đa 256 mức sáng khác nhau trong
khoảng màu đen - màu trắng. Như vậy, ảnh đa mức xám xem như là ma trận
không âm có giá trị tối đa là 255. Mỗi điểm ảnh trong ảnh đa cấp xám biểu diễn
cường độ sáng của ảnh tại điểm đó.
Ảnh màu
Ảnh màu hay còn gọi là ảnh true color, mỗi điểm ảnh được biểu diễn bởi
một số byte (thường là 3 byte) đại diện cho 3 thành phần màu và như vậy, ảnh
màu có thể xem như 3 ma trận nguyên ứng với 3 thành phần màu của các điểm


4

ảnh. Hệ màu RGB sẽ bao gồm 3 ma trận màu tương ứng với các giá trị Red,
Green và Blue. Đây là hệ màu được sử dụng phổ biến nhất.
Ngoài ra, ảnh cũng cũng có thể được phân thành hai loại: Ảnh có tần số
cao và ảnh có tần số thấp.

1.1.2. Điểm ảnh
Điểm ảnh (pixel, picture element) là một phần tử ảnh, đơn vị thông tin
nhỏ nhất trong một ảnh dạng raster. Ảnh số (digital image) là tập hợp hữu hạn
các điểm ảnh.Ảnh số có thể được biểu diễn dưới dạng một ma trận 2 chiều, mỗi
phần tử của ma trận tương ứng với một điểm ảnh.

Hình 1.1: Biểu diễn các điểm ảnh trong ảnh số
Hàng xóm của một điểm ảnh (Neighbors of a Pixel)
Một điểm ảnh p trong hệ tọa độ (x,y) có 4 hàng xóm bên cạnh theo chiều
dọc và chiều ngang với tọa độ như sau:
(x + 1, y) ; (x - 1, y) ; (x, y + 1) ; (x, y - 1).
Tập hợp bốn pixel có tọa độ như trên được gọi là 4-hàng xóm của p, ký
hiệu N4(p). Khoảng các từ bốn điểm này đến p có giá trị đúng bằng một đơn vị
khoảng cách. Trong trường hợp p nằm ở biên của ảnh, một số hàng xóm của p
sẽ nằm ở bên ngoài ảnh. Bốn điểm có tọa độ sau được gọi là “Hàng xóm chéo
– Diagonal Neighbors” của p, ký hiệu ND(p):
(x + 1, y + 1) ; (x + 1, y - 1) ; (x - 1, y + 1) ; (x - 1, y - 1)


5

ND(p) cùng với N4(p) được gọi là N8(p), tức là 8 hàng xóm của p. Tương
tự như trên thì N8(p) cũng sẽ có các điểm ở bên ngoài ảnh nếu p là một điểm
trên biên của ảnh.
Điểm ảnh liền kề (Adjacency)
Định nghĩa V là tập các giá trị cường độ sáng của ảnh. Tập V được dùng
để xác định các điểm ảnh liền kề. Ví dụ với ảnh nhị phân V = {0, 1}; ảnh đa
cấp xám thì V = {0, 1, 2 , …, 255}. Có ba kiểu liền kề:
a) 4-adjacency: Hai điểm ảnh p và q trong tập V được gọi là 4-adjacency
nếu q thuộc tập N4(p).

b) 8-adjacency: Hai điểm ảnh p và q trong tập V được gọi là 8-adjacency
nếu q thuộc tập N8(p).
c) m-adjacency: Hai điểm ảnh p và q trong tập V được gọi là 8adjacency nếu thỏa mãn một trong hai điều kiện sau:
- q thuộc tập N4(p).
- q thuộc tập ND(p) và tập N4(p) ∩ N4(q) = Ø.
1.1.3. Màu và mô hình màu
Một mô hình màu là một mô hình toán học trừu tượng mô tả cách các
màu sắc có thể được biểu diễn như là bộ dữ liệu số, thường là ba hoặc bốn giá
trị hoặc các thành phần màu sắc. Người ta chia ra thành nhiều mô hình màu
khác nhau tùy thuộc vào ứng dụng của từng lĩnh vực. Dưới đây là các mô hình
màu được dùng phổ biến nhất.
Mô hình RGB
Mô hình màu RGB sử dụng mô hình bổ sung trong đó ánh sáng đỏ, xanh
lá cây và xanh lam được tổ hợp với nhau theo nhiều phương thức khác nhau để
tạo thành các màu khác. Từ viết tắt RGB trong tiếng Anh có nghĩa là đỏ (red),
xanh lá cây (green) và xanh lam (blue), là ba màu gốc trong các mô hình ánh
sáng bổ sung.


6

Hình 1.2: Tổ hợp màu Red-Green-Blue trong hệ màu RGB
Cũng lưu ý rằng mô hình màu RGB tự bản thân nó không định nghĩa thế
nào là "đỏ", "xanh lá cây" và "xanh lam" một cách chính xác, vì thế với cùng
các giá trị như nhau của RGB có thể mô tả các màu tương đối khác nhau trên
các thiết bị khác nhau có cùng một mô hình màu.
Mô hình RGB sẽ làm việc tốt với các thiết bị phát quang sử dụng ánh
sáng trắng làm cơ sở. Vì vậymô hìnhRGB được sử dụng cho các màu thể hiện
trên màn hình máy tính cũng như các màu trong thiết kế Web được chiếu qua
các màn hình hay máy chiếu dùng ánh sáng.

Trong biểu diễn số trên máy tính, ảnh màu RGB có thể sử dụng số bit
màu là 16, 24, 32 hoặc 48. Ảnh có số bit càng cao thì càng biểu diễn chính xác
màu sắc của điểm ảnh.
Mô hình CMYK
Từ CMYK (hay YMCK) là một mô hình màu được sử dụng nhiều trong
in ấn. Mô hình màu này dựa trên cơ sở trộn các chất màu của các màu sau:
C=Cyan - màu xanh lơ
M=Magenta - màu cánh sen hay hồng sẫm
Y=Yellow - màu vàng
K=Key - màu đen (Ký hiệu là K vì màu Black đã dùng ký hiệu B trong
mô hình RGB).


7

Hình 1.3: Tổ hợp các màu trong mô hình màu CMYK
Nguyên lý làm việc của CMYK là trên cơ sở hấp thụ ánh sáng. Màu mà
chúng ta nhìn thấy là từ phần của ánh sáng không bị hấp thụ. Trong CMYK,
hồng sẫm cộng với vàng sẽ cho màu đỏ, cánh sen cộng với xanh lơ cho màu
xanh lam, xanh lơ cộng với vàng sinh ra màu xanh lá cây và tổ hợp của các màu
xanh lơ, cánh sen và vàng tạo ra màu đen.
Vì màu “đen” sinh ra bởi việc trộn các màu gốc loại trừ là không thực sự
giống như mực đen thật sự hay màu đen của vật đen tuyệt đối (là vật hấp thụ
toàn bộ ánh sáng), việc in ấn trên cơ sở bốn màu (đôi khi gọi là in các màu mặc
dù điều này không chính xác) phải sử dụng mực đen để bổ sung thêm vào với
các màu gốc loại trừ là các màu vàng, cánh sen và xanh lơ.
Việc sử dụng công nghệ in ấn bốn màu sinh ra kết quả in ấn cuối cùng
rất cao cấp với độ tương phản cao hơn. Tuy nhiên màu của vật thể mà người ta
nhìn thấy trên màn hình máy tính thông thường có sự sai khác chút ít với màu
của nó khi in ra vì các mô hình màu CMYK và RGB (sử dụng trong màn hình

máy tính) có các gam màu khác nhau. Mô hình màu RGB là mô hình dựa trên
cơ sở phát xạ ánh sáng trong khi mô hình CMYK làm việc theo cơ chế hấp thụ
ánh sáng.
Mô hình HSB
Mô hình màu HSB, còn gọi là mô hình màu HSV, là một mô hình
màudựa trên ba giá trị:


8

H: (Hue) Vùng màu
S: (Saturation) Độ bão hòa màu
B (hay V): (Bright hay Value) Độ sáng
Mô hình YUV
Mô hình YUV quy định một không gian màu được tạo bởi một độ sáng
và hai thành phần màu (chrominance). YUV được sử dụng trong hệ thống phát
sóng truyền hình theo chuẩn PAL, đây là chuẩn ở phần lớn các nước trên thế
giới.
Mô hình YUV giúp tạo ra màu đúng với nhận thức của con người hơn
chuẩn RGB(được dùng trong các thiết bị đồ hoạ máy tính) nhưng không chuẩn
bằng không gian màu HSV.

Hình 1.4: Mặt phẳng màu U-V tại giá trị Y = 0.5
Trong mô hình YUV, Y đại diện cho thành phần độ sáng, U và V là đại
diện cho các thành phần màu. Không gian màu YCbCr hay YPbPr, được sử
dụng trong các thiết bị phát hình, đều xuất phát từ mô hình màu YUV(Cb/Pb
và Cr/Pr là những phiên bản biến thể của U và V), và đôi khi bị gọi một cách
không chính xác là “YUV”. Không gian màu YIQ được dùng trong các hệ thống
truyền hình NTSC cũng liên quan đến YUV, tuy nhiên lại đơn giản hơn YUV
nhiều.



9

Các tín hiệu YUV đều xuất phát từ các nguồn RGB. Các giá trị trọng số
R, G và B được cộng lại với nhau để tạo ra một tín hiệu Y đơn để biểu diễn độ
sáng chung tại một điểm. Tín hiệu U sau đó được tạo ra bằng cách trừ Y khỏi
tín hiệu xanh lam (B của RGB) và được nhân với một tỉ lệ nhất định, còn V
được tính bằng cách trừ Y khỏi màu đỏ (R của RGB) và nhân tỉ lệ với một hệ
số khác.
Các công thức sau có thể dùng để tính toán Y, U và V từ R, G và B:

1.1.4. Histogram
Histogram là khái niệm cơ bản trong xử lý ảnh. Histogram là bảng thống
kê tần suất giá trị cường độ sáng của các điểm ảnh. Đối với ảnh màu, cường độ
sáng của một điểm ảnh được xác định theo công thức:
𝑌 = 0.299𝑅 + 0.587𝐺 + 0.114𝐵
trong đó 𝑅, 𝐺, 𝐵 𝑙à giá trị các thành phần màu và 𝑌 là cường độ sáng của
ảnh.

Hình 1.5: Biểu đồ histogram của ảnh đa cấp xám Lena


10

1.1.5. Định dạng ảnh
Ảnh bitmap
Trong đồ họa máy vi tính, BMP, còn được biết đến với tên tiếng Anh
khác là Windows bitmap, là một định dạng tập tin hình ảnh dạng raster khá phổ
biến. Các tập tin đồ họa lưu dưới dạng BMP thường có đuôi là .BMP hoặc .DIB

(Device Independent Bitmap).

Hình 1.6: Cấu trúc tệp ảnh bitmap
Các thuộc tính tiêu biểu của một tập tin ảnh BMPlà:
-

Số bit trên mỗi điểm ảnh (bit per pixel), thường được ký hiệu bởi n.

Một ảnh BMP n-bit có 2nmàu. Giá trị n càng lớn thì ảnh càng có nhiều màu, và
càng rõ nét hơn. Giá trị tiêu biểu của n là 1 (ảnh đen trắng), 4 (ảnh 16 màu), 8
(ảnh 256 màu), 16 (ảnh 65536 màu) và 24 (ảnh 16 triệu màu). Ảnh BMP 24bit có chất lượng hình ảnh trung thực nhất.
-

Chiều cao của ảnh (height), cho bởi điểm ảnh (pixel).

-

Chiều rộng của ảnh (width), cho bởi điểm ảnh.

Cấu trúc tập tin ảnh BMP bao gồm 4 phần:
Bitmap Header (14 bytes): giúp nhận dạng tập tin bitmap.


11

Bitmap Information (40 bytes): lưu một số thông tin chi tiết giúp hiển
thị ảnh.
Color Palette (4*x bytes), x là số màu của ảnh: định nghĩa các màu sẽ
được sử dụng trong ảnh.
Bitmap Data: lưu dữ liệu ảnh.

Đặc điểm nổi bật nhất của định dạng BMP là tập tin hình ảnh thường
không được nén bằng bất kỳ thuật toán nào. Khi lưu ảnh, các điểm ảnh được
ghi trực tiếp vào tập tin một điểm ảnh sẽ được mô tả bởi một hay nhiều byte
tùy thuộc vào giá trị n của ảnh. Do đó, một hình ảnh lưu dưới dạng BMP thường
có kích cỡ rất lớn, gấp nhiều lần so với các ảnh được nén (chẳng hạn GIF, JPEG
hay PNG).
Ảnh JPEG
Ảnh JPEG là một định dạng ảnh đã qua xử lý nén ảnh, thuật toán nén là
thuật toán JPEG(Joint Photographic Experts Group) - một trong những
phương pháp nén ảnh hiệu quả, có tỷ lệ nén ảnh tới vài chục lần. Tuy nhiên ảnh
sau khi giải nén sẽ khác với ảnh ban đầu. Chất lượng ảnh sẽ bị suy giảm sau
khi giải nén. Sự suy giảm này tăng dần theo hệ số nén. Tuy nhiên sự mất mát
thông tin này là có thể chấp nhận được và việc loại bỏ những thông tin không
cần thiết được dựa trên những nghiên cứu về hệ nhãn thị của mắt người.
Một số đặc điểm của ảnh JPEG là:
- Ảnh có dung lượng nhỏ, dùng phổ biến trên các thiết bị di động, các

trang web.
- Ảnh JPEG có thể hiển thị các hình ảnh với các màu chính xác (true-

colour), có thể lên đến 16 triệu màu.
- Ảnh sử dụng thuật toán nén JPEG sẽ bị mất thông tin so với ảnh gốc.

Do đó một số đường bao giữa các khối màu sẽ xuất hiện điểm mờ, và các vùng
sẽ mất đi sự rõ nét.


12

Các định dạng khác

Ngoài hai định dạng ảnh kể trên còn có rất nhiều định dạng ảnh khácphổ
biến được kể đến như:
- Ảnh raster: PNG, ICO, GIFF, TIFF,…
- Ảnh vector: AI, CorelDRAW, CGM, DXF, EVA, EMF, Gerber,

HVIF, IGES, PGML,…
- Ảnh RAW: CIFF, DNG, ORF.

1.2. Các phép biến đổi ma trận
Như chúng ta đã biết, ảnh số được lưu dưới dạng các ma trận điểm ảnh.
Do đó, các phép biến đổi ảnh số thực chất là các phép biến đổi trên các ma trận.
Trong mục này, ta xét các phép biến đổi ma trận được sử dụng nhiều trong xử
lý ảnh. Các phép biến đổi này thường trả về những nét đặc trưng nhất của ảnh,
qua đó có thể sử dụng các đặc trưng này để tiến hành xử lý ảnh.
1.2.1. Biến đổi Cosine rời rạc DCT
Biến đổi cosine rời rạc là một công cụ toán học xử lý các tín hiệu như ảnh
hay video. Nó sẽ chuyển đổi các tín hiệu từ miền không gian sang miền tần số
và biến đổi ngược lại từ miền tần số quay trở lại miền không gian mà không gây
tổn hao đến chất lượng. Lý do chọn biến đổi cosine cho xử lý ảnh số là biến đổi
cosine rời rạc yêu cầu ít sự phức tạp tính toán và tài nguyên hơn.
Phép biến đổi DCT 1-D
Với dữ liệu đầu vào là tậpngiá trị pt (giá trị điểm ảnh, mẫu âm thanh).
Phép biến đổi thuận DCT một chiều được xác định:
𝑛−1

(2𝑡 + 1)𝑓𝑛
2
𝐺𝑓 = √ 𝐶𝑓 ∑ 𝑃𝑡 cos [
]
𝑛

2𝑛
𝑡=0

trong đó:


13

1
𝐶𝑓 = √2
{1

𝑛ế𝑢 𝑓 = 0
𝑣ớ𝑖 𝑓 = 0,1, … , 𝑛 − 1
𝑛ế𝑢 𝑓 > 0

và Gflà tập n hệ số DCT tương ứng của đầu vào. Hệ số đầu tiên 𝐺0 được
gọi là phần tử DC (Direct Current) và các hệ số còn lại được gọi là phần tử AC
(Alternating current). Các hệ số này có thể bao gồm cả số âm và số dương.
Phép biến đổi IDCT biến đổi các hệ số DCT (DC và AC) từ miền tần số
về miền thời gian được xác định theo công thức:
𝑛−1

(2𝑡 + 1)𝑗𝜋
2
𝑃𝑡 = √ . ∑ 𝐶𝑗 𝐺𝑗 cos [
] 𝑣ớ𝑖𝑡 = 0,1, … , 𝑛 − 1
𝑛
2𝑛
𝑗=0


Một tính chất quan trọng của DCT là rất hữu ích trong bài toán nén dữ
liệu, với dữ liệu đầu vào có sự tương quan cao thì năng lượng của dữ liệu đầu
vào sẽ tập trung vào một số phần tử đầu tiên, đặc biệt là hệ số DC. Các phần tử
còn lại có giá trị nhỏ, thường xấp xỉ bằng 0.
Phép biến đổi DCT 2-D
Phép biến đổi DCT 1-D phù hợp với các mẫu dữ liệu âm thanh.Nhưng
không phù hợp ảnh, do dữ liệu ảnh có quan hệ trên không gian hai chiều (hàng,
cột). Tuy nhiên, đối với ảnh ta có thể áp dụng DCT 1-D hai lần: trên các hàng
và trên các cột. Do vậy ta gọi phép biến đổi này là DCT 2-D.
Phép biến đổi thuận DCT 2-D đối với m × n giá trị của p trên không
gian 2 chiều được xác định theo công thức:
𝐺𝑖,𝑗 =

𝑛−1 𝑚−1

(2𝑦 + 1)𝑗𝜋
(2𝑥 + 1)𝑖𝜋
𝐶𝑖 𝐶𝑗 ∑ ∑ 𝑃𝑥,𝑦 × 𝑐𝑜𝑠 (
) × 𝑐𝑜𝑠 (
)
2𝑚
2𝑛
√𝑚 × 𝑛
2

𝑥=0 𝑦=0

với 0 ≤ 𝑖 ≤ 𝑛 − 1; 0 ≤ 𝑗 ≤ 𝑚 − 1 và 𝐶𝑖 , 𝐶𝑗 được xác định:



14

1
𝐶𝑓 = √2
{1

𝑛ế𝑢𝑓 = 0
𝑣ớ𝑖𝑓 = 0,1, … , 𝑛 − 1
𝑛ế𝑢𝑓 > 0

Khi đó, hệ số đầu tiên G0,0 gọi là phần tử DC và các hệ số còn lại là AC.
Phép biến đổi IDCT 2-D tương ứng đối với m x n hệ số G về miền không
gian được tính theo công thức:
𝑃𝑥,𝑦 =

𝑛−1 𝑛−1

(2𝑥 + 1)𝑖𝜋
(2𝑦 + 1)𝑗𝜋
. ∑ ∑ 𝐶𝑖 𝐶𝑗 𝐺𝑖,𝑗 × 𝑐𝑜𝑠 (
) × 𝑐𝑜𝑠 (
)
2𝑚
2𝑛
√𝑚 × 𝑛
2

𝑖=0 𝑗=0


với 0 ≤ 𝑖 ≤ 𝑛 − 1; 0 ≤ 𝑗 ≤ 𝑚 − 1 và 𝐶𝑖 , 𝐶𝑗 được xác định:
1
𝐶𝑓 = √2
{1

𝑛ế𝑢𝑓 = 0
𝑣ớ𝑖𝑓 = 0,1, … , 𝑛 − 1
𝑛ế𝑢𝑓 > 0

Trong ứng dụng, dữ liệu ảnh được chia thành các khối 8 × 8, áp dụng
phép biến đổi DCT 2-D để nhận được khối hệ số DCT gồm 64 phần tử. Để tăng
tốc độ thực hiện, phép biến đổi DCT thường được tiếp cận theo phương pháp
ma trận.Ma trận Cosine rời rạc T cấp 8x8 được tính theo công thức:
1

𝑛ế𝑢 𝑖 = 0
√8
𝐶𝑖,𝑗 =
(𝑗 + 0.5)𝑖𝜋
1
cos [
] 𝑛ế𝑢 𝑖 > 0
8
{√8
Khi đó, phép biến đổi Cosine rời rạc hai chiều đối với khối điểm ảnhP
để nhận được khối hệ số DCT (G) theo công thức:
𝐺 = 𝑇 × 𝑃 × 𝑇′
và phép biến đổi ngược tương ứng:
𝑃 = 𝑇′ × 𝐺 × 𝑇



15

Kỹ thuật thuỷ vân sửdụng phép biến đổi DCT thường chia ảnh gốc thành
các khối,thực hiện phép biến đổi DCTvới từng khối ảnh gốc để được miền tần
số thấp, miền tần số giữa và miền tần số cao. Đa số kỹ thuật thuỷ vân ẩn bền
vững sẽ chọn miền tần số giữa của mỗi khối để nhúng bit thuỷ vân theo một hệ
số k nào đó gọi là hệ số tương quan giữa chất lượng ảnh sau khi nhúng thuỷvân
(tính ẩn của thuỷ vân) và độ bền vững của thuỷ vân.
Trong một vài năm gần đây, một số lược đồ thủy vân dựa trên phép biến
đổi DCT kết hợp với các giải thuật trí tuệ nhân tạo như: giải thuật di truyền,
giải thuật tối ưu bầy đàn, mạng neural,… đã được nhiều nhà khoa học quan tâm
nghiên cứu.
1.2.2. Biến đổi Wavelet rời rạc DWT
Việc tính toán các hệ số Wavelet tại tất cả các tỉ lệ là một công việchết sức
phức tạp. Nếu tính toán như vậy sẽ tạo ra một lượng dữ liệukhổng lồ. Để giảm
thiểu công việc tính toán người ta chỉ chọn ra một tậpnhỏ các giá trị tỉ lệ và các
vị trí để tiến hành tính toán. Hơn nữa nếu việctính toán được tiến hành tại các tỷ
lệ và các vị trí trên cơ sở luỹ thừa cơ số 2 thì kết quả thu được sẽ hiệu quả và
chính xác hơn rất nhiều. Quá trình chọn các tỷ lệ và các vị trí để tính toán như
trên tạo thành lưới nhị tố (dyadic). Một phân tích như trên hoàn toàn có thể thực
hiện được nhờbiến đổi Wavelet rời rạc (DWT). Do đó, việc tính toán biến đổi
DWT thực chất là sự rời rạc hoá biến đổi Wavelet liên tục (CWT); việc rời rạc
hoáđược thực hiện với sự lựa chọn các hệ số a và b như sau:
𝑎 = 2𝑚 , 𝑏 = 2𝑚 𝑛 , 𝑣ớ𝑖 𝑚, 𝑛 ∈ 𝑍
Biến đổi Wavelet được sử dụng rộng rãi trong các lĩnh vực xử lý tín hiệu
số, xử lý ảnh, nén ảnh, mã hóa tín hiệu,….


16


1.2.3. Biến đổi SVD
Định nghĩa
Mọi ma trận thực Y cấp m×n cho trước luôn luôn có thể phân tích thành
tích của 3 ma trận thực như sau:
𝑌 = 𝑈 × 𝐷 × 𝑉𝑇
Trong đó:

𝑈 là ma trận trực chuẩn cấp 𝑚 × 𝑚.
𝑉 là ma trận trực chuẩn cấp 𝑛 × 𝑛.
𝐷 là ma trận đường chéo cấp m×n có tính chất:
𝐷(1,1) ≥ 𝐷(2,2) ≥ . . . ≥ 𝐷(𝑠, 𝑠) ≥ 0, với 𝑠 = 𝑚𝑖𝑛(𝑚, 𝑛).
Tính chất
Phép biến đổi SVD (Singular Value Decomposition) cũng giống như
DCT, DWT đều là các phép biến đổi ma trận trực giao và có cùng một tính chất
quan trọng là tập trung năng lượng ảnh vào một số phần tử cố định của miền
biến đổi. Năng lượng ảnh tập trung vào phần tử 𝐷(1,1) trong phép biến đổi
SVD, phần tử này có tính ổn định cao, vì vậy có thể sử dụng chúng để xây dựng
các lược đồ thủy vân bền vững trước các phép tấn công.
Các ứng dụng
Một số ứng dụng sử dụng biến đổi SVD có thể chỉ ra như:
-

Nén ảnh (Image Compression)

-

Lập chỉ mục ngữ nghĩa tiềm ẩn (Latent semantic indexing - LSI)

Lập chỉ mục ngữ nghĩa tiềm ẩn (LSI) là một phương pháp lập chỉ mục

và tìm kiếm sử dụng một kỹ thuật phân tích ma trận SVD để xác định các mẫu
trong các mối quan hệ giữa các điều kiện và khái niệm có trong một bộ sưu tập
không có cấu trúc văn bản. LSI là dựa trên nguyên tắc rằng các từ được sử dụng
trong các bối cảnh tương tự có xu hướng có ý nghĩa tương tự. Một tính năng
quan trọng của LSI là khả năng trích xuất nội dung khái niệm của một nội dung


×