Tải bản đầy đủ (.pdf) (64 trang)

Nghiên cứu một số phương pháp thủy vân bền vững dựa trên các biến đổi ma trận SVD và QR

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.7 MB, 64 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
======= 

 =======

NGUYỄN NGỌC HƯNG

NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP THỦY
VÂN BỀN VỮNG DỰA TRÊN CÁC BIẾN ĐỔI MA
TRẬN SVD VÀ QR

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

Hà Nội – 2014


ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
======= 

 =======

NGUYỄN NGỌC HƯNG

NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP THỦY
VÂN BỀN VỮNG DỰA TRÊN CÁC BIẾN ĐỔI MA
TRẬN SVD VÀ QR
Ngành: Công nghệ thông tin


Chuyên ngành: Kỹ thuật phần mềm
Mã số: 60480103

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS Phạm Văn Ất

Hà Nội - 2014


Trang 1

LỜI CAM ĐOAN
Tôi xin cam đoan toàn bộ nội dung luận văn này là do tôi tự sưu tầm, biên soạn và
nghiên cứu.
Nội dung của luận văn này chưa từng được ai khác công bố hay xuất bản dưới bất
kỳ hình thức nào và cũng không được sao chép từ bất kỳ một công trình nghiên cứu nào.
Toàn bộ mã nguồn chương trình hoàn toàn do tôi tự tay viết và chỉnh sửa dưới sự
hướng dẫn của thầy giáo hướng dẫn, kết quả thử nghiệm hoàn toàn do tôi tìm hiểu và
thực hiện.
Nếu sai tôi xin hoàn toàn chịu trách nhiệm.
Hà Nội, ngày 24 tháng 10 năm 2014
Học viên

Nguyễn Ngọc Hưng


Trang 2

LỜI CẢM ƠN
Tôi xin bày tỏ lòng biết ơn sâu sắc đến thầy giáo PGS.TS Phạm Văn Ất – Khoa

Công nghệ thông tin, trường Đại học Giao thông vận tải Hà Nội là người đã trực tiếp
hướng dẫn, chỉ bảo tận tình và hết lòng giúp đỡ tôi trong suốt thời gian làm luận văn
này.
Xin được cảm ơn các anh, chị và các bạn đồng nghiệp trong nhóm nghiên cứu an
toàn bảo mật thông tin do thầy Phạm Văn Ất hướng dẫn đã có những góp ý quý báu
trong quá trình nghiên cứu và trình bày luận văn.
Xin được cảm ơn Ban lãnh đạo Viện Công nghệ thông tin – Viện Hàn lâm Khoa
học và Công nghệ Việt Nam, cùng toàn thể các anh, chị đồng nghiệp trong phòng Tin
học Viễn thông đã giúp đỡ, tạo điều kiện về thời gian, vật chất và tinh thần để tôi hoàn
thành khóa học của mình.
Tôi cũng chân thành cảm ơn những người thân trong gia đình, bạn bè đã động viên
và tạo mọi điều kiện giúp tôi trong quá trình học tập, công tác cũng như trong cuộc sống.
Cuối cùng tôi xin gửi lời chúc sức khỏe và thành công tới tất cả quý thầy cô và gia
đình cùng toàn thể các bạn.
Hà Nội, ngày 24 tháng 10 năm 2014
Học viên

Nguyễn Ngọc Hưng


Trang 3

MỤC LỤC
LỜI CAM ĐOAN .................................................................................................. 1
LỜI CẢM ƠN ........................................................................................................ 2
MỤC LỤC.............................................................................................................. 3
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT ......................................... 6
DANH MỤC CÁC BẢNG .................................................................................... 7
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ .............................................................. 8
MỞ ĐẦU ................................................................................................................ 9

CÁC KHÁI NIỆM CƠ SỞ .............................................................. 11
1.1. Ảnh số ........................................................................................................11
1.1.1. Khái niệm và phân loại ảnh số ......................................................... 11
1.1.2. Điểm ảnh .......................................................................................... 11
1.1.3. Màu và mô hình màu ........................................................................13
1.1.4. Histogram ......................................................................................... 15
1.1.5. Định dạng ảnh...................................................................................16
1.2. Các phép biến đổi ma trận .........................................................................18
1.2.1. Biến đổi Cosine rời rạc DCT ............................................................ 18
1.2.2. Biến đổi Wavelet rời rạc DWT ........................................................ 20
1.2.3. Biến đổi SVD ...................................................................................21
1.2.4. Biến đổi QR ...................................................................................... 22
1.3. Một số phân phối xác suất thường dùng ....................................................23
1.3.1. Phân phối chuẩn ...............................................................................23
1.3.2. Phân phối đều ...................................................................................24
1.3.3. Phân phối nhị thức ............................................................................24
1.4. Giấu tin.......................................................................................................25
1.4.1. Khái niệm giấu tin...............................................................................25
1.4.2. Giấu tin trên miền không gian ............................................................ 27
1.4.3. Giấu tin trên miền biến đổi .................................................................27
1.5. Thủy vân số ................................................................................................ 28
1.5.1. Khái niệm ......................................................................................... 28


Trang 4
1.5.2. Phân loại ........................................................................................... 28
1.5.3. Các yêu cầu đối với hệ thống thủy vân ............................................30
1.5.4. Mô hình thủy vân cơ bản ..................................................................30
1.5.5. Tấn công thủy vân ............................................................................31
1.5.6. Đánh giá chất lượng thủy vân .......................................................... 31

1.5.7. Ứng dụng của thủy vân ....................................................................33
MỘT SỐ LƯỢC ĐỒ THỦY VÂN DỰA TRÊN PHÉP BIẾN ĐỔI
SVD và QR ................................................................................................................... 35
2.1. Lược đồ thủy vân SVD-1 ...........................................................................35
2.1.1. Ý tưởng ............................................................................................... 35
2.1.2. Quá trình nhúng thủy vân ...................................................................36
2.1.3. Quá trình trích thủy vân ......................................................................38
2.1.4. Một số nhận xét về lược đồ SVD-1 ....................................................38
2.2. Lược đồ thủy vân SVD-n ...........................................................................38
2.2.1. Ý tưởng ............................................................................................... 38
2.2.2. Quá trình nhúng thủy vân ...................................................................39
2.2.3. Quá trình trích thủy vân ......................................................................39
2.2.4. Một số nhận xét về lược đồ SVD-n ....................................................40
2.3. Lược đồ QR-1 ............................................................................................ 40
2.3.1. Ý tưởng ............................................................................................... 40
2.3.2. Quá trình nhúng thủy vân ...................................................................41
2.3.3. Quá trình trích thủy vân ......................................................................41
2.3.4. Một số nhận xét về lược đồ QR-1 ....................................................... 42
2.4. Lược đồ QR-n ............................................................................................ 42
2.4.1. Ý tưởng ............................................................................................... 42
2.4.2. Quá trình nhúng thủy vân ...................................................................43
2.4.3. Quá trình trích thủy vân ......................................................................43
2.4.4. Một số nhận xét về lược đồ QR-n ....................................................... 43
MỘT SỐ NHẬN XÉT VỀ LƯỢC ĐỒ THỦY VÂN ĐỀ XUẤT VÀ
KẾT QUẢ THỬ NGHIỆM ......................................................................................... 45
3.1. Một số nhận xét.......................................................................................... 45
3.1.1. Tốc độ thực hiện .................................................................................45


Trang 5

3.1.2. Khả năng lựa chọn phần tử nhúng thủy vân .......................................45
3.1.3. Chất lượng ảnh sau khi nhúng thủy vân .............................................46
3.2. Kết quả thử nghiệm ....................................................................................47
3.2.1. Bộ ảnh thử nghiệm ..............................................................................47
3.2.2. So sánh tính bền vững của các lược đồ thủy vân ................................ 48
3.2.3. So sánh SVD-1 và QR-1 tại các vị trí nhúng thủy vân khác nhau .....50
KẾT LUẬN .......................................................................................................... 54
DANH MỤC CÁC CÔNG TRÌNH KHOA HỌC CỦA TÁC GIẢ CÓ LIÊN
QUAN ĐẾN LUẬN VĂN ............................................................................................ 55
TÀI LIỆU THAM KHẢO .................................................................................. 56
PHỤ LỤC ............................................................................................................. 58


Trang 6

DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT
Chữ viết tắt

Diễn giải

Ý nghĩa

Singular Value Decomposition

Biến đổi SVD

QR Decomposition

Biến đổi QR


NMF

Non-negative Matrix Factorization

Thừa số hóa ma trận không âm

DCT

Discrete Cosine Transform

Biến đổi Cosine rời rạc

IDCT

Invert Discrete Cosine Transform

Biến đổi ngược DCT

DFT

Discrete Fourier Transform

Biến đổi Forier rời rạc

IDFT

Invert Discrete Fourier Transform

Biến đổi ngược DFT


DWT

Discrete Wavelet Transform

Biến đổi Wavelet rời rạc

IDWT

Invert Discrete Wavelet Transform

Biến đổi ngược DWT

Fourier Transfer

Biến đổi Fourier

SVD
QR

FT


Trang 7

DANH MỤC CÁC BẢNG
Bảng 3.1. Chất lượng ảnh của các lược đồ thuỷ vân (dấu thủy vân là logo trường
Đại học Công nghệ) .......................................................................................................48
Bảng 3.2. Giá trị Err của các lược đồ thủy vân (dấu thủy vân là logo trường Đại
học Công nghệ) ..............................................................................................................50
Bảng 3.3. Giá trị Err theo lược đồ SVD-1 và QR-1 tại các vị trí nhúng khác nhau

(dấu thủy vân là logo trường Đại học Công nghệ) ........................................................ 52
Bảng 3.4. Giá trị Err của các lược đồ thủy vân (dấu thủy vân là log Viện Công
nghệ thông tin) ...............................................................................................................53


Trang 8

DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
Hình 1.1. Biểu diễn các điểm ảnh trong ảnh số ....................................................12
Hình 1.2. Tổ hợp màu Red-Green-Blue trong hệ màu RGB ................................ 13
Hình 1.3. Tổ hợp các màu trong mô hình màu CMYK ........................................14
Hình 1.4. Mặt phẳng màu U-V tại giá trị Y = 0.5.................................................15
Hình 1.5. Biểu đồ histogram của ảnh đa cấp xám Lena .......................................16
Hình 1.6. Cấu trúc tệp ảnh bitmap ........................................................................16
Hình 1.7. Hàm mật độ xác suất trong các trường hợp khác nhau ......................... 24
Hình 1.8. Sơ đồ quá trình giấu tin .........................................................................26
Hình 1.9. Sơ đồ quá trình giải mã tin giấu ............................................................ 26
Hình 1.10. Phân loại các kỹ thuật thủy vân. ......................................................... 29
Hình 1.11. Mô hình hệ thống thủy vân cơ bản ..................................................... 30
Hình 3.1.

Bộ ảnh thử nghiệm ............................................................................48

Hình 3.2.

Đồ thị biểu diễn giá trị của Err .......................................................... 53


Trang 9


MỞ ĐẦU
Ngày nay, cùng với sự phát triển mạnh mẽ của công nghệ thông tin và truyền thông,
mạng Internet đã trở thành một trong các phương tiện truyền tải, chia sẻ thông tin, tài
liệu một cách thuận tiện, hiệu quả. Thông tin luôn sẵn sàng trực tuyến, mọi người đều
có thể kết nối vào Internet để tìm kiếm một cách dễ dàng các thông tin cần thiết. Bên
cạnh đó, các công ty, các nhà cung cấp sản phẩm có thể bán sản phẩm của mình thông
qua mạng Internet cũng như sẵn sàng cung cấp dữ liệu, thông tin về các sản phẩm, dịch
vụ của mình cho người dùng thông qua hệ thống mạng Internet một cách hiệu quả.
Với lượng thông tin được truyền qua mạng ngày càng nhiều thì vấn nạn sao chép
và sử dụng không hợp pháp dữ liệu số ngày một tăng. Tuy nhiên việc quản lý và khai
thác các thông tin này lại đôi khi nằm ngoài tầm kiểm soát của các cá nhân, tổ chức do
vấn nạn sao chép bất hợp pháp, vi phạm bản quyền ngày một gia tăng. Từ đó cần thiết
phải có các giải pháp chống sao chép để hạn chế việc vi phạm bản quyền các sản phẩm
dữ liệu số.
Một trong những giải pháp hữu hiệu để bảo vệ bản quyền là kỹ thuật thủy vân số.
Thủy vân số dựa trên kết quả nghiên cứu của nhiều lĩnh vực khác nhau như: Mật mã
học, kỹ thuật giấu tin, lý thuyết thống kê và xử lý tín hiệu số. Mục đích của phương pháp
này là nhúng một lượng thông tin có ích vào các sản phẩm số (lượng thông tin này được
gọi là thủy vân). Dựa trên mục đích sử dụng các lược đồ thủy vân được chia thành hai
nhóm chính gồm thủy vân bền vững và thủy vân dễ vỡ. Thủy vân bền vững và thủy vân
dễ vỡ. Thủy vân dễ vỡ là kỹ thuật nhúng thủy vân vào trong ảnh, khi có bất kì sự can
thiệp hay thay đổi nào tới ảnh gốc thì dấu thủy vân sẽ không còn nguyên vẹn; kỹ thuật
thủy vân này được ứng dụng trong bài toán xác thực tính toàn vẹn dữ liệu số. Trong khi
đó thủy vân bền vững được ứng dụng trong bài toán bảo vệ bản quyền đối với các sản
phẩm số.
Luận văn trình bày một số lược đồ thủy vân bền vững dựa trên các phép biến đổi
SVD, QR ứng dụng trong việc bảo vệ bản quyền trên dữ liệu ảnh số. Đây là hướng
nghiên cứu mới trên thế giới, có ý nghĩa khoa học và ứng dụng thực tiễn. Nội dung luận
văn được tổ chức thành ba chương như sau:
Chương 1: CÁC KHÁI NIỆM CƠ SỞ

Chương 1 trình bày tổng quan về các kiến thức cơ bản về ảnh số, một số phép
biến đổi ma trận, khái niệm về giấu tin và thủy vân số.
Chương 2: MỘT SỐ LƯỢC ĐỒ THỦY VÂN DỰA TRÊN PHÉP BIẾN ĐỔI
SVD VÀ QR


Trang 10
Chương 2 trình bày các kết quả nghiên cứu về thủy vân số dựa trên các phép biến
đổi SVD và QR đã được công bố và đề xuất hai lược đồ thủy vân mới sử dụng biến đổi
QR.
Chương 3: MỘT SỐ NHẬN XÉT VỀ LƯỢC ĐỒ THỦY VÂN ĐỀ XUẤT
VÀ KẾT QUẢ THỬ NGHIỆM
Chương 3 trình bày các phân tích, đánh giá và so sánh giữa các lược đồ thủy vân
đã trình bày trong chương 2. Đồng thời tác giả cũng đưa ra kết quả chương trình thử
nghiệm cho các lược đồ trên.


Trang 11

CÁC KHÁI NIỆM CƠ SỞ
Tóm tắt: Chương này trình bày các khái niệm cơ bản về ảnh
số, các phép biến đổi ma trận thường dùng trong xử lý ảnh, các
khái niệm về giấu tin, thủy vân số.

1.1. Ảnh số
1.1.1. Khái niệm và phân loại ảnh số
Ảnh số là tập hợp bao gồm hữu hạn các phần tử được gọi là điểm ảnh (pixel), mỗi
điểm ảnh được biểu diễn bởi một số hữu hạn các bit.
Trên phương diện toán học, ảnh số được xem như là một ma trận nguyên dương
gồm m hàng và n cột, mỗi phần tử của ma trận đại diện cho một điểm ảnh. Dựa theo

màu sắc ta có thể chia ảnh số thành 3 loại cơ bản: Ảnh nhị phân, ảnh đa cấp xám và ảnh
màu (true color).
Ảnh nhị phân
Ảnh nhị phân là ảnh chỉ có hai màu, một màu đại diện cho màu nền và màu còn lại
cho đối tượng của ảnh. Nếu hai màu là đen và trắng thì gọi là ảnh đen trắng. Như vậy,
ảnh nhị phân được xem như một ma trận nhị phân.
Ảnh đa mức xám
Ảnh đa cấp xám là ảnh có thể nhận tối đa 256 mức sáng khác nhau trong khoảng
màu đen - màu trắng. Như vậy, ảnh đa mức xám xem như là ma trận không âm có giá
trị tối đa là 255. Mỗi điểm ảnh trong ảnh đa cấp xám biểu diễn cường độ sáng của ảnh
tại điểm đó.
Ảnh màu
Ảnh màu hay còn gọi là ảnh true color, mỗi điểm ảnh được biểu diễn bởi một số
byte (thường là 3 byte) đại diện cho 3 thành phần màu và như vậy, ảnh màu có thể xem
như 3 ma trận nguyên ứng với 3 thành phần màu của các điểm ảnh. Hệ màu RGB sẽ bao
gồm 3 ma trận màu tương ứng với các giá trị Red, Green và Blue. Đây là hệ màu được
sử dụng phổ biến nhất.
Ngoài ra, ảnh cũng cũng có thể được phân thành hai loại: Ảnh có tần số cao và ảnh
có tần số thấp.

1.1.2. Điểm ảnh
Điểm ảnh (pixel, picture element) là một phần tử ảnh, đơn vị thông tin nhỏ nhất
trong một ảnh dạng raster. Ảnh số (digital image) là tập hợp hữu hạn các điểm ảnh. Ảnh
số có thể được biểu diễn dưới dạng một ma trận 2 chiều, mỗi phần tử của ma trận tương
ứng với một điểm ảnh.


Trang 12

Hình 1.1. Biểu diễn các điểm ảnh trong ảnh số

Hàng xóm của một điểm ảnh (Neighbors of a Pixel)
Một điểm ảnh p trong hệ tọa độ (x,y) có 4 hàng xóm bên cạnh theo chiều dọc và
chiều ngang với tọa độ như sau:
(x + 1, y) ; (x - 1, y) ; (x, y + 1) ; (x, y - 1)
Tập hợp bốn pixel có tọa độ như trên được gọi là 4-hàng xóm của p, ký hiệu N4(p).
Khoảng các từ bốn điểm này đến p có giá trị đúng bằng một đơn vị khoảng cách. Trong
trường hợp p nằm ở biên của ảnh, một số hàng xóm của p sẽ nằm ở bên ngoài ảnh. Bốn
điểm có tọa độ sau được gọi là “Hàng xóm chéo – Diagonal Neighbors” của p, ký hiệu
ND(p):
(x + 1, y + 1) ; (x + 1, y - 1) ; (x - 1, y + 1) ; (x - 1, y - 1)
ND(p) cùng với N4(p) được gọi là N8(p), tức là 8 hàng xóm của p. Tương tự như
trên thì N8(p) cũng sẽ có các điểm ở bên ngoài ảnh nếu p là một điểm trên biên của ảnh.
Điểm ảnh liền kề (Adjacency)
Định nghĩa V là tập các giá trị cường độ sáng của ảnh. Tập V được dùng để xác
định các điểm ảnh liền kề. Ví dụ với ảnh nhị phân V = {0, 1}; ảnh đa cấp xám thì V =
{0, 1, 2 , …, 255}. Có ba kiểu liền kề:
a) 4-adjacency: Hai điểm ảnh p và q trong tập V được gọi là 4-adjacency nếu q
thuộc tập N4(p).
b) 8-adjacency: Hai điểm ảnh p và q trong tập V được gọi là 8-adjacency nếu q
thuộc tập N8(p).
c) m-adjacency: Hai điểm ảnh p và q trong tập V được gọi là 8-adjacency nếu thỏa
mãn một trong hai điều kiện sau:
- q thuộc tập N4(p)
- q thuộc tập ND(p) và tập N4(p) ∩ N4(q) = Ø


Trang 13

1.1.3. Màu và mô hình màu
Một mô hình màu là một mô hình toán học trừu tượng mô tả cách các màu sắc có

thể được biểu diễn như là bộ dữ liệu số, thường là ba hoặc bốn giá trị hoặc các thành
phần màu sắc. Người ta chia ra thành nhiều mô hình màu khác nhau tùy thuộc vào ứng
dụng của từng lĩnh vực. Dưới đây là các mô hình màu được dùng phổ biến nhất.
Mô hình RGB
Mô hình màu RGB sử dụng mô hình bổ sung trong đó ánh sáng đỏ, xanh lá cây và
xanh lam được tổ hợp với nhau theo nhiều phương thức khác nhau để tạo thành các màu
khác. Từ viết tắt RGB trong tiếng Anh có nghĩa là đỏ (red), xanh lá cây (green) và xanh
lam (blue), là ba màu gốc trong các mô hình ánh sáng bổ sung.

Hình 1.2. Tổ hợp màu Red-Green-Blue trong hệ màu RGB
Cũng lưu ý rằng mô hình màu RGB tự bản thân nó không định nghĩa thế nào là
"đỏ", "xanh lá cây" và "xanh lam" một cách chính xác, vì thế với cùng các giá trị như
nhau của RGB có thể mô tả các màu tương đối khác nhau trên các thiết bị khác nhau có
cùng một mô hình màu.
Mô hình RGB sẽ làm việc tốt với các thiết bị phát quang sử dụng ánh sáng trắng
làm cơ sở. Vì vậy mô hình RGB được sử dụng cho các màu thể hiện trên màn hình máy
tính cũng như các màu trong thiết kế Web được chiếu qua các màn hình hay máy chiếu
dùng ánh sáng.
Trong biểu diễn số trên máy tính, ảnh màu RGB có thể sử dụng số bit màu là 16,
24, 32 hoặc 48. Ảnh có số bit càng cao thì càng biểu diễn chính xác màu sắc của điểm
ảnh.
Mô hình CMYK
Từ CMYK (hay YMCK) là một mô hình màu được sử dụng nhiều trong in ấn. Mô
hình màu này dựa trên cơ sở trộn các chất màu của các màu sau:
C = Cyan - màu xanh lơ
M = Magenta - màu cánh sen hay hồng sẫm


Trang 14
Y = Yellow - màu vàng

K = Key - màu đen (Ký hiệu là K vì màu Black đã dùng ký hiệu B trong mô hình
RGB).

Hình 1.3. Tổ hợp các màu trong mô hình màu CMYK
Nguyên lý làm việc của CMYK là trên cơ sở hấp thụ ánh sáng. Màu mà chúng ta
nhìn thấy là từ phần của ánh sáng không bị hấp thụ. Trong CMYK, hồng sẫm cộng với
vàng sẽ cho màu đỏ, cánh sen cộng với xanh lơ cho màu xanh lam, xanh lơ cộng với
vàng sinh ra màu xanh lá cây và tổ hợp của các màu xanh lơ, cánh sen và vàng tạo ra
màu đen.
Vì màu “đen” sinh ra bởi việc trộn các màu gốc loại trừ là không thực sự giống
như mực đen thật sự hay màu đen của vật đen tuyệt đối (là vật hấp thụ toàn bộ ánh sáng),
việc in ấn trên cơ sở bốn màu (đôi khi gọi là in các màu mặc dù điều này không chính
xác) phải sử dụng mực đen để bổ sung thêm vào với các màu gốc loại trừ là các màu
vàng, cánh sen và xanh lơ.
Việc sử dụng công nghệ in ấn bốn màu sinh ra kết quả in ấn cuối cùng rất cao cấp
với độ tương phản cao hơn. Tuy nhiên màu của vật thể mà người ta nhìn thấy trên màn
hình máy tính thông thường có sự sai khác chút ít với màu của nó khi in ra vì các mô
hình màu CMYK và RGB (sử dụng trong màn hình máy tính) có các gam màu khác
nhau. Mô hình màu RGB là mô hình dựa trên cơ sở phát xạ ánh sáng trong khi mô hình
CMYK làm việc theo cơ chế hấp thụ ánh sáng.
Mô hình HSB
Mô hình màu HSB, còn gọi là mô hình màu HSV, là một mô hình màu dựa trên ba
giá trị:
H: (Hue) Vùng màu
S: (Saturation) Độ bão hòa màu
B (hay V): (Bright hay Value) Độ sáng


Trang 15
Mô hình YUV

Mô hình YUV quy định một không gian màu được tạo bởi một độ sáng và hai
thành phần màu (chrominance). YUV được sử dụng trong hệ thống phát sóng truyền
hình theo chuẩn PAL, đây là chuẩn ở phần lớn các nước trên thế giới.
Mô hình YUV giúp tạo ra màu đúng với nhận thức của con người hơn chuẩn RGB
(được dùng trong các thiết bị đồ hoạ máy tính) nhưng không chuẩn bằng không gian
màu HSV.

Hình 1.4. Mặt phẳng màu U-V tại giá trị Y = 0.5
Trong mô hình YUV, Y đại diện cho thành phần độ sáng, U và V là đại diện cho
các thành phần màu. Không gian màu YCbCr hay YPbPr, được sử dụng trong các thiết
bị phát hình, đều xuất phát từ mô hình màu YUV (Cb/Pb và Cr/Pr là những phiên bản
biến thể của U và V), và đôi khi bị gọi một cách không chính xác là “YUV”. Không gian
màu YIQ được dùng trong các hệ thống truyền hình NTSC cũng liên quan đến YUV,
tuy nhiên lại đơn giản hơn YUV nhiều.
Các tín hiệu YUV đều xuất phát từ các nguồn RGB. Các giá trị trọng số R, G và B
được cộng lại với nhau để tạo ra một tín hiệu Y đơn để biểu diễn độ sáng chung tại một
điểm. Tín hiệu U sau đó được tạo ra bằng cách trừ Y khỏi tín hiệu xanh lam (B của
RGB) và được nhân với một tỉ lệ nhất định, còn V được tính bằng cách trừ Y khỏi màu
đỏ (R của RGB) và nhân tỉ lệ với một hệ số khác.
Các công thức sau có thể dùng để tính toán Y, U và V từ R, G và B:

1.1.4. Histogram
Histogram là khái niệm cơ bản trong xử lý ảnh. Histogram là bảng thống kê tần
suất giá trị cường độ sáng của các điểm ảnh. Đối với ảnh màu, cường độ sáng của một
điểm ảnh được xác định theo công thức:


Trang 16
𝑌 = 0.299𝑅 + 0.587𝐺 + 0.114𝐵
trong đó 𝑅, 𝐺, 𝐵 là giá trị các thành phần màu và 𝑌 là cường độ sáng của ảnh.


Hình 1.5. Biểu đồ histogram của ảnh đa cấp xám Lena

1.1.5. Định dạng ảnh
Ảnh bitmap
Trong đồ họa máy vi tính, BMP, còn được biết đến với tên tiếng Anh khác là
Windows bitmap, là một định dạng tập tin hình ảnh dạng raster khá phổ biến. Các tập
tin đồ họa lưu dưới dạng BMP thường có đuôi là .BMP hoặc .DIB (Device Independent
Bitmap).

Hình 1.6. Cấu trúc tệp ảnh bitmap
Các thuộc tính tiêu biểu của một tập tin ảnh BMP là:
-

Số bit trên mỗi điểm ảnh (bit per pixel), thường được ký hiệu bởi n. Một
ảnh BMP n-bit có 2n màu. Giá trị n càng lớn thì ảnh càng có nhiều màu, và


Trang 17

-

càng rõ nét hơn. Giá trị tiêu biểu của n là 1 (ảnh đen trắng), 4 (ảnh 16 màu),
8 (ảnh 256 màu), 16 (ảnh 65536 màu) và 24 (ảnh 16 triệu màu). Ảnh BMP
24-bit có chất lượng hình ảnh trung thực nhất.
Chiều cao của ảnh (height), cho bởi điểm ảnh (pixel).
Chiều rộng của ảnh (width), cho bởi điểm ảnh.

Cấu trúc tập tin ảnh BMP bao gồm 4 phần:
Bitmap Header (14 bytes): giúp nhận dạng tập tin bitmap.

Bitmap Information (40 bytes): lưu một số thông tin chi tiết giúp hiển thị ảnh.
Color Palette (4*x bytes), x là số màu của ảnh: định nghĩa các màu sẽ được sử
dụng trong ảnh.
Bitmap Data: lưu dữ liệu ảnh.
Đặc điểm nổi bật nhất của định dạng BMP là tập tin hình ảnh thường không được
nén bằng bất kỳ thuật toán nào. Khi lưu ảnh, các điểm ảnh được ghi trực tiếp vào tập tin
một điểm ảnh sẽ được mô tả bởi một hay nhiều byte tùy thuộc vào giá trị n của ảnh. Do
đó, một hình ảnh lưu dưới dạng BMP thường có kích cỡ rất lớn, gấp nhiều lần so với
các ảnh được nén (chẳng hạn GIF, JPEG hay PNG).

Ảnh JPEG
Ảnh JPEG là một định dạng ảnh đã qua xử lý nén ảnh, thuật toán nén là thuật toán
JPEG(Joint Photographic Experts Group) - một trong những phương pháp nén ảnh hiệu
quả, có tỷ lệ nén ảnh tới vài chục lần. Tuy nhiên ảnh sau khi giải nén sẽ khác với ảnh
ban đầu. Chất lượng ảnh sẽ bị suy giảm sau khi giải nén. Sự suy giảm này tăng dần theo
hệ số nén. Tuy nhiên sự mất mát thông tin này là có thể chấp nhận được và việc loại bỏ
những thông tin không cần thiết được dựa trên những nghiên cứu về hệ nhãn thị của mắt
người.
Một số đặc điểm của ảnh JPEG là:
-

Ảnh có dung lượng nhỏ, dùng phổ biến trên các thiết bị di động, các trang
web.
Ảnh JPEG có thể hiển thị các hình ảnh với các màu chính xác (true-colour),
có thể lên đến 16 triệu màu.
Ảnh sử dụng thuật toán nén JPEG sẽ bị mất thông tin so với ảnh gốc. Do đó
một số đường bao giữa các khối màu sẽ xuất hiện điểm mờ, và các vùng sẽ
mất đi sự rõ nét.

Các định dạng khác

Ngoài hai định dạng ảnh kể trên còn có rất nhiều định dạng ảnh khác phổ biến
được kể đến như:


Trang 18
-

Ảnh raster: PNG, ICO, GIFF, TIFF,…
Ảnh vector: AI, CorelDRAW, CGM, DXF, EVA, EMF, Gerber, HVIF,
IGES, PGML,…
Ảnh RAW: CIFF, DNG, ORF

1.2. Các phép biến đổi ma trận
Như chúng ta đã biết, ảnh số được lưu dưới dạng các ma trận điểm ảnh. Do đó, các
phép biến đổi ảnh số thực chất là các phép biến đổi trên các ma trận. Trong mục này, ta
xét các phép biến đổi ma trận được sử dụng nhiều trong xử lý ảnh. Các phép biến đổi
này thường trả về những nét đặc trưng nhất của ảnh, qua đó có thể sử dụng các đặc trưng
này để tiến hành xử lý ảnh.

1.2.1. Biến đổi Cosine rời rạc DCT
Biến đổi cosine rời rạc là một công cụ toán học xử lý các tín hiệu như ảnh hay
video. Nó sẽ chuyển đổi các tín hiệu từ miền không gian sang miền tần số và biến đổi
ngược lại từ miền tần số quay trở lại miền không gian mà không gây tổn hao đến chất
lượng. Lý do chọn biến đổi cosine cho xử lý ảnh số là biến đổi cosine rời rạc yêu cầu ít
sự phức tạp tính toán và tài nguyên hơn.
Phép biến đổi DCT 1-D
Với dữ liệu đầu vào là tập n giá trị pt (giá trị điểm ảnh, mẫu âm thanh). Theo [12],
phép biến đổi thuận DCT một chiều được xác định:
𝑛−1


(2𝑡 + 1)𝑓𝑛
2
]
𝐺𝑓 = √ 𝐶𝑓 ∑ 𝑃𝑡 cos [
𝑛
2𝑛
𝑡=0

trong đó:
1
𝐶𝑓 = √2
{1

𝑛ế𝑢 𝑓 = 0
𝑣ớ𝑖 𝑓 = 0,1, … , 𝑛 − 1
𝑛ế𝑢 𝑓 > 0

và Gf là tập n hệ số DCT tương ứng của đầu vào. Hệ số đầu tiên 𝐺0 được gọi là
phần tử DC (Direct Current) và các hệ số còn lại được gọi là phần tử AC (Alternating
current). Các hệ số này có thể bao gồm cả số âm và số dương.
Phép biến đổi IDCT biến đổi các hệ số DCT (DC và AC) từ miền tần số về miền
thời gian được xác định theo công thức:
𝑛−1

(2𝑡 + 1)𝑗𝜋
2
] 𝑣ớ𝑖 𝑡 = 0,1, … , 𝑛 − 1
𝑃𝑡 = √ . ∑ 𝐶𝑗 𝐺𝑗 cos [
𝑛
2𝑛

𝑗=0


Trang 19
Một tính chất quan trọng của DCT là rất hữu ích trong bài toán nén dữ liệu, với
dữ liệu đầu vào có sự tương quan cao thì năng lượng của dữ liệu đầu vào sẽ tập trung
vào một số phần tử đầu tiên, đặc biệt là hệ số DC. Các phần tử còn lại có giá trị nhỏ,
thường xấp xỉ bằng 0.
Phép biến đổi DCT 2-D
Phép biến đổi DCT 1-D phù hợp với các mẫu dữ liệu âm thanh. Nhưng không
phù hợp ảnh, do dữ liệu ảnh có quan hệ trên không gian hai chiều (hàng, cột). Tuy nhiên,
đối với ảnh ta có thể áp dụng DCT 1-D hai lần: trên các hàng và trên các cột. Do vậy ta
gọi phép biến đổi này là DCT 2-D.
Theo [12], phép biến đổi thuận DCT 2-D đối với 𝑚 × 𝑛 giá trị của p trên không
gian 2 chiều được xác định theo công thức:
𝐺𝑖,𝑗 =

𝑛−1 𝑚−1

2
√𝑚 × 𝑛

𝐶𝑖 𝐶𝑗 ∑ ∑ 𝑃𝑥,𝑦 × 𝑐𝑜𝑠 (
𝑥=0 𝑦=0

(2𝑦 + 1)𝑗𝜋
(2𝑥 + 1)𝑖𝜋
) × 𝑐𝑜𝑠 (
)
2𝑚

2𝑛

với 0 ≤ 𝑖 ≤ 𝑛 − 1; 0 ≤ 𝑗 ≤ 𝑚 − 1 và 𝐶𝑖 , 𝐶𝑗 được xác định:
1
𝐶𝑓 = √2
{1

𝑛ế𝑢 𝑓 = 0
𝑣ớ𝑖 𝑓 = 0,1, … , 𝑛 − 1
𝑛ế𝑢 𝑓 > 0

Khi đó, hệ số đầu tiên G0,0 gọi là phần tử DC và các hệ số còn lại là AC.
Phép biến đổi IDCT 2-D tương ứng đối với m x n hệ số G về miền không gian
được tính theo công thức:
𝑃𝑥,𝑦 =

𝑛−1 𝑛−1

2
√𝑚 × 𝑛

. ∑ ∑ 𝐶𝑖 𝐶𝑗 𝐺𝑖,𝑗 × 𝑐𝑜𝑠 (
𝑖=0 𝑗=0

(2𝑥 + 1)𝑖𝜋
(2𝑦 + 1)𝑗𝜋
) × 𝑐𝑜𝑠 (
)
2𝑚
2𝑛


với 0 ≤ 𝑖 ≤ 𝑛 − 1; 0 ≤ 𝑗 ≤ 𝑚 − 1 và 𝐶𝑖 , 𝐶𝑗 được xác định:
1
𝐶𝑓 = √2
{1

𝑛ế𝑢 𝑓 = 0
𝑣ớ𝑖 𝑓 = 0,1, … , 𝑛 − 1
𝑛ế𝑢 𝑓 > 0

Trong ứng dụng, dữ liệu ảnh được chia thành các khối 8 × 8, áp dụng phép biến
đổi DCT 2-D để nhận được khối hệ số DCT gồm 64 phần tử. Để tăng tốc độ thực hiện,
phép biến đổi DCT thường được tiếp cận theo phương pháp ma trận. Theo [12], ma trận
Cosine rời rạc T cấp 8 × 8 được tính theo công thức:


Trang 20
1

𝐶𝑖,𝑗

𝑛ế𝑢 𝑖 = 0
√8
=
(𝑗 + 0.5)𝑖𝜋
1
] 𝑛ế𝑢 𝑖 > 0
cos [
8
{√ 8


Khi đó, phép biến đổi Cosine rời rạc hai chiều đối với khối điểm ảnh P để nhận
được khối hệ số DCT (G) theo công thức:
𝐺 = 𝑇 × 𝑃 × 𝑇′
và phép biến đổi ngược tương ứng:
𝑃 = 𝑇′ × 𝐺 × 𝑇
Kỹ thuật thuỷ vân sử dụng phép biến đổi DCT thường chia ảnh gốc thành các
khối, thực hiện phép biến đổi DCT với từng khối ảnh gốc để được miền tần số thấp,
miền tần số giữa và miền tần số cao. Đa số kỹ thuật thuỷ vân ẩn bền vững sẽ chọn miền
tần số giữa của mỗi khối để nhúng bit thuỷ vân theo một hệ số k nào đó gọi là hệ số
tương quan giữa chất lượng ảnh sau khi nhúng thuỷ vân (tính ẩn của thuỷ vân) và độ
bền vững của thuỷ vân.
Trong một vài năm gần đây, một số lược đồ thủy vân dựa trên phép biến đổi DCT
kết hợp với các giải thuật trí tuệ nhân tạo như: giải thuật di truyền, giải thuật tối ưu bầy
đàn, mạng neural,… đã được nhiều nhà khoa học quan tâm nghiên cứu.

1.2.2. Biến đổi Wavelet rời rạc DWT
Việc tính toán các hệ số Wavelet tại tất cả các tỉ lệ là một công việc hết sức phức
tạp. Nếu tính toán như vậy sẽ tạo ra một lượng dữ liệu khổng lồ. Để giảm thiểu công
việc tính toán người ta chỉ chọn ra một tập nhỏ các giá trị tỉ lệ và các vị trí để tiến hành
tính toán. Hơn nữa nếu việc tính toán được tiến hành tại các tỷ lệ và các vị trí trên cơ sở
luỹ thừa cơ số 2 thì kết quả thu được sẽ hiệu quả và chính xác hơn rất nhiều. Quá trình
chọn các tỷ lệ và các vị trí để tính toán như trên tạo thành lưới nhị tố (dyadic). Một phân
tích như trên hoàn toàn có thể thực hiện được nhờ biến đổi Wavelet rời rạc (DWT). Do
đó, việc tính toán biến đổi DWT thực chất là sự rời rạc hoá biến đổi Wavelet liên tục
(CWT); việc rời rạc hoá được thực hiện với sự lựa chọn các hệ số a và b như sau:
𝑎 = 2𝑚 , 𝑏 = 2𝑚 𝑛 , 𝑣ớ𝑖 𝑚, 𝑛 ∈ 𝑍
Biến đổi Wavelet được sử dụng rộng rãi trong các lĩnh vực xử lý tín hiệu số, xử lý
ảnh, nén ảnh, mã hóa tín hiệu,….



Trang 21

1.2.3. Biến đổi SVD
Định nghĩa
Mọi ma trận thực Y cấp m×n cho trước luôn luôn có thể phân tích thành tích của 3
ma trận thực như sau [13, trang 448]:
𝑌 = 𝑈 × 𝐷 × 𝑉𝑇
Trong đó:
𝑈 là ma trận trực chuẩn cấp 𝑚 × 𝑚.
𝑉 là ma trận trực chuẩn cấp 𝑛 × 𝑛.
𝐷 là ma trận đường chéo cấp m×n có tính chất:
𝐷(1,1) ≥ 𝐷(2,2) ≥ . . . ≥ 𝐷(𝑠, 𝑠) ≥ 0, với 𝑠 = 𝑚𝑖𝑛(𝑚, 𝑛).
Tính chất
Phép biến đổi SVD (Singular Value Decomposition) cũng giống như DCT, DWT
đều là các phép biến đổi ma trận trực giao và có cùng một tính chất quan trọng là tập
trung năng lượng ảnh vào một số phần tử cố định của miền biến đổi. Năng lượng ảnh
tập trung vào phần tử 𝐷(1,1) trong phép biến đổi SVD, phần tử này có tính ổn định cao,
vì vậy có thể sử dụng chúng để xây dựng các lược đồ thủy vân bền vững trước các phép
tấn công.
Các ứng dụng
Một số ứng dụng sử dụng biến đổi SVD có thể chỉ ra như:
-

Nén ảnh (Image Compression)

-

Lập chỉ mục ngữ nghĩa tiềm ẩn (Latent semantic indexing - LSI)


Lập chỉ mục ngữ nghĩa tiềm ẩn (LSI) là một phương pháp lập chỉ mục và tìm kiếm
sử dụng một kỹ thuật phân tích ma trận SVD để xác định các mẫu trong các mối quan
hệ giữa các điều kiện và khái niệm có trong một bộ sưu tập không có cấu trúc văn bản.
LSI là dựa trên nguyên tắc rằng các từ được sử dụng trong các bối cảnh tương tự có xu
hướng có ý nghĩa tương tự. Một tính năng quan trọng của LSI là khả năng trích xuất nội
dung khái niệm của một nội dung văn bản bằng cách thiết lập mối liên hệ giữa những
điều kiện xảy ra trong những hoàn cảnh tương tự [25]. LSI cũng là một ứng dụng thống
kê đa biến được phát triển bởi Jean-Paul [26] Benzécri trong đầu những năm 1970, vào
một bảng dự phòng được xây dựng từ tính từ trong các tài liệu.
Ưu điểm của phương pháp LSI sử dụng biến đổi SVD là có thể đối phó với vấn đề
đồng nghĩa, điều mà các phương pháp truyền thống không thực hiện được.
-

Kỹ thuật (Engineering)
Trong kỹ thuật nói chung, biến đổi SVD có khả năng áp dụng cho các lĩnh vực sau:


Trang 22




-

Hệ thống động lực tuyến tính (Linear Dynamical System)
Phân tích EOF analysis(of ocean topography and climate system)
Xử lý tín hiệu và nhận dạng mẫu (Signal processing and pattern recognition)
Dự báo thời tiết số (Numerical weather prediction, Lanczos methods)

Truyền thông (Comunications)

Ứng dụng phương pháp SVD trong truyền thông như:
 Mạng không dây (Wireless communications)
 Nén ảnh và video (Compression of videos and images)

-

Toán học và thống kê (Mathematics and Staticstics)
 Đại số tuyến tính (Numerical linear algebra)
 Xấp xỉ hạng ma trận (Low-rank matrix approximation)
 Giải phương trình tuyến tính thuần nhất (Solving Homogeneous linear
equations)
 Principal Component Analysis

1.2.4. Biến đổi QR
Định nghĩa
Mọi ma trận thực Y cấp 𝑚 × 𝑛 cho trước luôn luôn có thể phân tích thành tích của
2 ma trận thực như sau [8, trang 223]:
𝑌 =𝑄×𝑅
Trong đó:
𝑄 là ma trận trực chuẩn cấp 𝑚 × 𝑚.
𝑅 là ma trận tam giác trên cấp 𝑚 × 𝑛.

Tính chất
Phép biến đổi QR cũng giống như DCT, DWT là các phép biến đổi ma trận trực
giao và có cùng một tính chất quan trọng là tập trung năng lượng ảnh vào một số phần
tử cố định của miền biến đổi. Năng lượng ảnh tập trung vào hàng đầu của ma trận R
trong phép biến đổi QR. Các phần tử này có tính ổn định cao, vì vậy có thể sử dụng
chúng để xây dựng các lược đồ thủy vân bền vững trước các phép tấn công.

Các ứng dụng

Cũng giống như phép biến đổi SVD, phép biến đổi ma trận QR được xử dụng nhiều
trong kỹ thuật, xử lý tín hiệu, xử lý ảnh, xấp xỉ tuyến tính, …


Trang 23

1.3. Một số phân phối xác suất thường dùng
1.3.1. Phân phối chuẩn
Định nghĩa:
Người ta nói rằng biến ngẫu nhiên liên tục X tuân theo luật phân phối chuẩn với
các tham số a và b2 (b>0) nếu X có hàm mật độ  xác định bởi:
𝑓 (𝑥 ) =

1
𝑏√2𝜋

1 𝑥−𝑎 2
− (
.𝑒 2 𝑏 )

𝑣ớ𝑖 𝑚ọ𝑖 𝑥 ∈ 𝑅

Ký hiệu: 𝑋  𝑁(𝑎, 𝑏2)
Kỳ vọng của X:
+∞

𝜇 = 𝐸 (𝑋 ) = ∫

𝑥.


−∞

1
𝑏. √2𝜋

. 𝑒𝑥𝑝 (−

( 𝑥 − 𝑎 )2
) 𝑑𝑥
2𝑏2

+∞

𝑡2
=
. ∫ (𝑏𝑡 + 𝑎) . 𝑒𝑥𝑝 (− ) 𝑑𝑡
2
√2𝜋 −∞
+∞
+∞
𝑏
𝑡2
𝑎
𝑡2
=
. ∫ 𝑡. 𝑒𝑥𝑝 (− ) 𝑑𝑡 +
. ∫ 𝑒𝑥𝑝 (− ) 𝑑𝑡
2
2
√2𝜋 −∞

√2𝜋 −∞
1

=𝑎
Phương sai của X:
+∞

(𝑥 − 𝜇 )2
) 𝑑𝑥
𝜎 = 𝐷 (𝑋 ) =
. ∫ (𝑥 − 𝜇 . 𝑒𝑥𝑝 (−
2𝑏2
𝑏√2𝜋 −∞
+∞
𝑏2
𝑡2
2

(−
) 𝑑𝑡
=
.
𝑡 . 𝑒𝑥𝑝
2
√2𝜋 −∞
1

2

)2


= 𝑏2
Khi đó ta có thể viết 𝑋  𝑁(µ, 𝜎2)
Trường hợp đặc biết µ = 0 và 𝜎 = 1 ta có 𝑋  𝑁(0,1) được gọi là phân phối
chuẩn chuẩn hóa.


×