Tải bản đầy đủ (.pdf) (124 trang)

Kỹ thuật thủy vân và mật mã học trong xác thực, bảo vệ bản quyền dữ liệu đa phương tiện

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.35 MB, 124 trang )

i



LỜI CAM ĐOAN


Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Các số liệu, kết quả
nêu trong luận án là trung thực và chưa từng được ai công bố trong các công trình
nào khác.

Hà Nội, ngày tháng năm 2015
Tập thể hướng dẫn Nghiên cứu sinh



GS.TSKH. Lê Hùng Sơn PGS.TS. Phạm Văn Ất Đỗ Văn Tuấn










ii


LỜI CẢM ƠN



Luận án này được thực hiện tại Trường Đại học Bách khoa Hà Nội dưới sự
hướng dẫn của GS.TSKH. Lê Hùng Sơn và PGS.TS. Phạm Văn Ất. Nghiên cứu
sinh xin gửi lời cảm ơn sâu sắc đến các thầy về sự giúp đỡ, chỉ dẫn tận tình trong
quá trình nghiên cứu. Các thầy là tấm gương sáng cho tôi trong nghiên cứu chuyên
môn cũng như trong cuộc sống.
Nghiên cứu sinh xin gửi lời cảm ơn đến các thầy giáo, cô giáo ở Viện Toán ứng
dụng và Tin học; các thầy giáo, cô giáo ở Viện Đào tạo Sau đại học Trường Đại học
Bách khoa Hà Nội đã tạo điều kiện thuận lợi và giúp đỡ nghiên cứu sinh trong thời
gian học tập tại Trường.
Tôi cũng xin gửi lời cảm ơn tới lãnh đạo nhà trường, các đồng nghiệp tại Khoa
Công nghệ thông tin Trường Cao đẳng Thương mại và Du lịch Hà Nội đã tạo điều
kiện thuận lợi trong quá trình tôi vừa làm nghiên cứu sinh vừa công tác tại Trường.
Cuối cùng tác giả xin bày tỏ lòng biết ơn đến gia đình và bạn bè đã động viên,
giúp đỡ về tinh thần, thời gian để tác giả hoàn thành luận án.

Hà Nội, ngày tháng năm 2015
Nghiên cứu sinh



Đỗ Văn Tuấn

iii

MỤC LỤC

DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT 1
DANH MỤC CÁC BẢNG 2
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ 3

MỞ ĐẦU 4
CHƯƠNG 1. MỘT SỐ KIẾN THỨC CƠ SỞ 7
1.1. Khái niệm về giấu tin 7
1.1.1. Định nghĩa giấu tin 7
1.1.2. Mô hình giấu tin 8
1.1.3. Các tính chất của một lược đồ giấu tin 9
1.1.3.1. Khả năng nhúng tin 9
1.1.3.2. Tính che giấu 9
1.1.3.3. Tính bảo mật 10
1.1.4. Một số hướng tiếp cận của phương pháp giấu tin 10
1.2. Một số khái niệm về thủy vân trên dữ liệu đa phương tiện 11
1.2.1. Dữ liệu đa phương tiện 11
1.2.1.1. Ảnh số 11
1.2.1.2. Âm thanh 12
1.2.1.3. Video 12
1.2.2. Phân loại phương pháp thủy vân 13
1.2.2.1. Thủy vân bền vững 14
1.2.2.2. Thủy vân dễ vỡ 14
1.3. Một số phép biến đổi dữ liệu 15
1.3.1. Phép biến đổi cosine rời rạc 15
1.3.1.1. Phép biến đổi cosine rời rạc một chiều 15
1.3.1.2. Phép biến đổi cosine rời rạc hai chiều 16
1.3.2. Phép biến đổi wavelet rời rạc 17
1.4. Một số khái niệm trong mật mã 18
1.4.1. Số nguyên tố và thuật toán kiểm tra số nguyên tố 19
1.4.2. Ký hiệu Legendre 21
iv

1.4.3. Ký hiệu Jacobi 21
1.4.4. Định lý đồng dư Trung Hoa 21

1.4.5. Hệ mật mã Rabin 22
1.5. Một số phép toán trên ma trận nguyên 23
1.6. Kết luận chương 1 24
CHƯƠNG 2. GIẤU TIN VÀ HỆ MẬT MÃ RABIN CẢI TIẾN 25
2.1. Bảo mật dữ liệu bằng sự kết hợp giữa giấu tin và mật mã 25
2.2. Một số kết quả gần đây về các sơ đồ Rabin cải tiến 26
2.2.1. Sơ đồ Shimada 26
2.2.1.1. Thuật toán mã hóa 26
2.2.1.2. Thuật toán giải mã 27
2.2.2. Sơ đồ Chen-Tsu 28
2.3. Đề xuất một sơ đồ Rabin mới 28
2.3.1. Phương trình Rabin 29
2.3.2. Thuật toán mã hóa 31
2.3.3. Thuật toán giải mã 31
2.3.4. Xét ví dụ minh họa sơ đồ Rabin đề xuất 32
2.3.5. Chứng minh tính đúng đắn của sơ đồ Rabin đề xuất 34
2.3.6. Phân tích các sơ đồ cải tiến hệ mật mã Rabin 34
2.3.6.1. Độ phức tạp tính toán 35
2.3.6.2. Phạm vi ứng dụng 36
2.3.6.3. Thực nghiệm 36
2.4. Giấu tin trên ảnh nhị phân 37
2.4.1. Lược đồ giấu tin TCP 38
2.4.1.1. Thuật toán nhúng tin 38
2.4.1.2. Thuật toán trích tin 39
2.4.2. Lược đồ giấu tin CTL 39
2.4.2.1. Thuật toán nhúng tin 40
2.4.2.2. Thuật toán trích tin 40
2.4.2.3. Chính xác hóa lược đồ CTL 41
2.5. Đề xuất một lược đồ giấu tin mới trên ảnh nhị phân 42
v


2.5.1. Thuật toán nhúng dãy bít trên một khối điểm ảnh 42
2.5.2. Thuật toán trích dãy bít trên một khối điểm ảnh 43
2.5.3. Chứng minh tính đúng đắn của thuật toán nhúng dãy bít trên một khối
điểm ảnh 44
2.5.4. Lược đồ giấu tin trên ảnh nhị phân 45
2.5.5. Phân tích tính bảo mật của các lược đồ giấu tin trên ảnh nhị phân 46
2.5.6. So sánh chất lượng ảnh của các lược đồ giấu tin trên ảnh nhị phân 47
2.6. Đề xuất một lược đồ giấu tin mới trên ảnh chỉ số màu 48
2.6.1. Thuật toán nhúng tin 50
2.6.2. Thuật toán trích tin 51
2.6.3. Chứng minh tính đúng đắn của lược đồ đề xuất 52
2.6.4. So sánh chất lượng ảnh chứa tin của các lược đồ trên ảnh chỉ số màu 53
2.7. Kết luận chương 2 54
CHƯƠNG 3. THỦY VÂN THUẬN NGHỊCH 56
3.1. Sơ lược về thủy vân thuận nghịch 56
3.2. Một số kết quả gần đây về thủy vân thuận nghịch trên ảnh JPEG 57
3.2.1. Qui trình nén ảnh JPEG 57
3.2.2. Lược đồ nhúng tin thuận nghịch CLTT 60
3.2.2.1. Thuật toán nhúng tin 60
3.2.2.2. Thuật toán trích tin 62
3.2.2.3. Thuật toán khôi phục ảnh gốc 62
3.2.3. Lược đồ nhúng tin thuận nghịch LS 64
3.3. Đề xuất lược đồ thủy vân thuận nghịch mới trên ảnh JPEG 64
3.3.1. Thuật toán nhúng dấu thủy vân 64
3.3.2. Thuật toán trích dấu thủy vân và khôi phục ảnh gốc 65
3.3.3. Phân tích khả năng nhúng tin và chất lượng ảnh thủy vân 67
3.3.3.1. Phân tích khả năng nhúng tin 68
3.3.3.2. Phân tích sự thay đổi của khối DCT lượng tử 68
3.3.3.3. Phân tích chất lượng ảnh 69

3.3.3.4. Thực nghiệm 70
vi

3.4. Một số kết quả gần đây về thủy vân thuận nghịch dựa trên phép biến
đổi mở rộng hiệu đối với véc tơ điểm ảnh 73
3.4.1. Lược đồ Alattar 74
3.4.2. Lược đồ Mohammad 75
3.4.3. Lược đồ Lee 76
3.4.3.1. Thuật toán nhúng tin trên véc tơ  76
3.4.3.2. Thuật toán khôi phục 77
3.4.4. Lược đồ Khodaei 78
3.5. Đề xuất một lược đồ thủy vân thuận nghịch mới sử dụng phép biến đổi
mở rộng hiệu trên véc tơ điểm ảnh 79
3.5.1. Thuật toán nhúng tin và khôi phục véc tơ điểm ảnh bằng phương pháp
mở rộng hiệu 79
3.5.1.1. Thuật toán nhúng tin 79
3.5.1.2. Thuật toán khôi phục 80
3.5.1.3. Tính đúng đắn của thuật toán 80
3.5.2. Thuật toán nhúng tin và khôi phục bằng cách chèn bít thấp 80
3.5.2.1. Thuật toán nhúng tin 81
3.5.2.2. Thuật toán khôi phục 81
3.5.3. Thuật toán thủy vân trên ảnh 82
3.5.4. Thuật toán trích dấu thủy vân và khôi phục ảnh gốc 84
3.5.5. So sánh khả năng nhúng tin và chất lượng ảnh của các lược đồ sử dụng
phép biến đổi mở rộng hiệu 85
3.5.5.1. Khả năng nhúng tin 85
3.5.5.2. So sánh chất lượng ảnh 86
3.6. Đề xuất mô hình thủy vân thuận nghịch dễ vỡ khóa công khai dùng
trong xác thực tính toàn vẹn của ảnh số 86
3.6.1. Mô hình nhúng dấu thủy vân 87

3.6.2. Mô hình xác thực tính toàn vẹn 87
3.7. Đề xuất mô hình bảo mật và xác thực dữ liệu trên đường truyền 88
3.7.1. Mô hình nhúng tin mật và dấu thủy vân 89
3.7.2. Mô hình xác thực và trích tin mật 90
3.8. Kết luận chương 3 90
vii

CHƯƠNG 4. THỦY VÂN BỀN VỮNG KHÓA CÔNG KHAI SỬ DỤNG
KỸ THUẬT TRẢI PHỔ 92
4.1. Khái quát về thủy vân bền vững 92
4.2. Một số kết quả gần đây về thủy vân bền vững sử dụng kỹ thuật trải phổ
trên miền cosine rời rạc 93
4.2.1. Lược đồ thủy vân bền vững khóa bí mật Cox 94
4.2.2. Lược đồ thủy vân bền vững khóa bí mật Barni 95
4.2.3. Lược đồ thủy vân bền vững khóa công khai Munir 96
4.3. Đề xuất lược đồ thủy vân bền vững khóa công khai bằng phương pháp
trải phổ trên miền cosine rời rạc 96
4.3.1. Phân tích tính bền vững của lược đồ Munir 96
4.3.2. Phương pháp xây dựng khóa bí mật 97
4.3.3. Thuật toán thủy vân 98
4.3.4. Thuật toán kiểm tra dấu thủy vân 99
4.3.5. Đánh giá tính bền vững của các lược đồ thủy vân trên miền DCT 99
4.3.5.1. Độ đo tính bền vững 100
4.3.5.2. So sánh tính bền vững của lược đồ Munir và New2 101
4.3.5.3. Đánh giá tính bền vững của lược đồ đề xuất theo tham số  104
4.3.5.4. So sánh tính bền vững thông qua thực nghiệm 104
4.4. Đề xuất lược đồ thủy vân bền vững khóa công khai bằng phương pháp
trải phổ trên miền wavelet rời rạc 106
4.4.1. Thuật toán thủy vân 107
4.4.2. Thuật toán kiểm tra dấu thủy vân 107

4.5. Kết luận chương 4 108
KẾT LUẬN 109
TÀI LIỆU THAM KHẢO 111
DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ CỦA LUẬN ÁN 117
1


DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT

Ký hiệu/
chữ viết tắt
Ý nghĩa




Giá trị phần nguyên dưới của 




Giá trị phần nguyên trên của 

 chia hết cho 

 không chia hết cho 

Số phần tử (độ dài) của véc tơ 
AES
Advanced Encryption Standard (chuẩn mật mã nâng cao)

CLTT
Chang – Lin – Tseng – Tai
CTL
Chang – Tseng - Lin
DCT
Discrete Cosine Transform (biến đổi cosine rời rạc)
DE
Difference Expansion (mở rộng hiệu)
DES
Data Encryption Standard (chuẩn mật mã dữ liệu)
DWT
Discrete Wavelet Transform (biến đổi sóng nhỏ rời rạc)
IDCT
Inverse Discrete Cosine Transform (phép biến đổi DCT ngược)
IDWT
Inverse Discrete Wavelet Transform (biến đổi DWT ngược)
JPEG
Joint Photographic Experts Group (một định dạng ảnh nén)
LS
Lin - Shiu
MCU
Minimum Coded Unit (đơn vị mã tối thiểu)
NMF
Non-negative Matrix Factorization (khai triển ma trận không âm)
PSNR
Peak Signal-to-Noise Ratio (Tỉ số đỉnh tín hiệu trên nhiễu)
RSA
Rivest – Shamir – Adleman
SHA
Secure Hash Algorithm (hàm băm mật)

SVD
Singular Value Decomposition (phân tích giá trị đặc trưng)
TCP
Tseng – Chen - Pan

2

DANH MỤC CÁC BẢNG
Bảng 2.1. Độ phức tạp của thuật toán giải mã trong các sơ đồ Rabin cải tiến 36
Bảng 2.2. Thời gian thực hiện thuật toán giải mã trong các sơ đồ Rabin cải tiến 37
Bảng 2.3. Hệ số  giữa các ảnh chứa tin so với các ảnh gốc của 3 lược đồ giấu
tin trên ảnh nhị phân 48
Bảng 3.1. Kết quả tiền xử lý và nhúng tin trên khối DCT lượng tử ở Hình 3.4 của
lược đồ CLTT (k là không nhúng tin). 61
Bảng 3.2. Kết quả trích tin và khôi phục ảnh gốc của lược đồ CLTT (k là không
nhúng tin) 63
Bảng 3.3. Kết quả nhúng dãy bít dấu thủy vân trên khối DCT lượng tử ở Hình 3.4
của lược đồ đề xuất trên ảnh JPEG 65
Bảng 3.4. Kết quả trích dãy bít dấu thủy vân và khôi phục các dãy hệ số lượng tử
gốc của lược đồ đề xuất trên ảnh JPEG 66
Bảng 3.5. Kết quả khảo sát 9 đường chéo trên 10.000 khối DCT lượng tử theo lược
đồ CLTT 67
Bảng 3.6. Kết quả khảo sát 5 đường chéo trên 10.000 khối DCT lượng tử theo lược
đồ đề xuất trên ảnh JPEG. 67
Bảng 3.7. Khả năng nhúng tin trên bộ ảnh thử nghiệm của các lược đồ giấu tin
thuận nghịch trên ảnh JPEG 71
Bảng 3.8. Kết quả thực nghiệm chất lượng ảnh của các lược đồ thủy vân thuận
nghịch trên ảnh JPEG 72
Bảng 3.9. Khả năng nhúng tin của các lược đồ thủy vân thuận nghịch sử dụng phép
biến đổi mở rộng hiệu 85

Bảng 3.10. Hệ số PSNR của các lược đồ thủy vân thuận nghịch sử dụng phép biến
đổi mở rộng hiệu ứng với độ dài dấu thủy vân khác nhau 86
Bảng 4.1 Hệ số tương quan và PSNR của ảnh thủy vân ứng với các lược đồ thủy
vân bền vững trên miền DCT 105
Bảng 4.2. Hệ số tương quan của ảnh thủy vân sau khi bị tấn công của các lược đồ
thủy vân bền vững trên miền DCT 105

3

DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
Hình 1.1. Phân loại phương pháp giấu tin 7
Hình 1.2. Mô hình nhúng tin 8
Hình 1.3. Mô hình trích tin 8
Hình 1.4. Phân loại phương pháp thủy vân 13
Hình 1.5. Ma trận wavelet Haar cấp 8×8 18
Hình 1.6. Sơ đồ áp dụng wavelet hai chiều 18
Hình 2.1. Các ảnh nhị phân dùng để nhúng tin 47
Hình 2.2. Dữ liệu dùng để nhúng trên các ảnh nhị phân 47
Hình 2.3. Kết quả thực nghiệm chất lượng ảnh chứa tin có 8 màu của các lược đồ
giấu tin trên ảnh chỉ số màu 54
Hình 3.1. Sơ đồ nén ảnh JPEG chuẩn Baseline 58
Hình 3.2. Khối hệ số DCT 59
Hình 3.3. Bảng lượng tử của thành phần Y với tỷ lệ nén 15:1 trong PhotoShop 59
Hình 3.4. Một khối DCT lượng tử của ảnh Pepper 59
Hình 3.5. Các đường chéo của khối DCT lượng tử 60
Hình 3.6. Sơ đồ nhúng tin thuận nghịch của lược đồ LS 64
Hình 3.7. Sự thay đổi trên khối DCT lượng tử sau khi nhúng dãy bít dấu thủy vân
của lược đồ đề xuất trên ảnh JPEG và lược đồ CLTT 69
Hình 3.8. Bộ ảnh thử nghiệm các lược đồ nhúng tin trên ảnh JPEG 71
Hình 3.9. Bộ ảnh thử nghiệm các lược đồ thủy vân thuận nghịch sử dụng phép biến

đổi mở rộng hiệu 85
Hình 3.10. Quá trình tạo và nhúng dấu thủy vân của mô hình thủy vân thuận nghịch
dễ vỡ khóa công khai 87
Hình 3.11. Quá trình xác thực tính toàn vẹn của lược đồ thủy vân thuận nghịch dễ
vỡ khóa công khai 88
Hình 3.12. Quá trình nhúng tin mật và dấu thủy vân 89
Hình 3.13. Quá trình xác thực tính toàn vẹn và trích tin mật 90
Hình 4.1. Ảnh thực nghiệm tính bền vững của lược đồ thủy vân miền DCT 106
Hình 4.2. Sơ đồ áp dụng phép biến đổi wavelet hai mức. 106
4

MỞ ĐẦU

Trong những năm đầu của thế kỷ 21, với sự phát triển của mạng Internet đã giúp
cho quá trình phân phối các sản phẩm đa phương tiện (văn bản, ảnh, âm thanh,
video) giữa những nhà cung cấp với người dùng trở nên dễ dàng, nhanh chóng. Bên
cạnh đó, vấn nạn xuyên tạc thông tin, vi phạm bản quyền trên những sản phẩm đa
phương tiện cũng ngày một gia tăng. Do vậy, nhu cầu bảo mật, xác thực tính toàn
vẹn, bảo vệ quyền tác giả đối với sản phẩm đa phương tiện trên môi trường trao đổi
công khai ngày càng cấp thiết và đòi hỏi sự an toàn cao hơn.
Một trong những phương pháp hữu hiệu trong lĩnh vực an toàn thông tin là mật
mã học. Theo đó, người gửi sẽ biến đổi dữ liệu gốc (bản rõ) thành dữ liệu mã (bản
mã) dựa trên một sơ đồ mật mã nào đó đã được thỏa thuận giữa người gửi và người
nhận. Khi có bản mã, người nhận sử dụng khóa và thuật toán giải mã tương ứng để
khôi phục lại dữ liệu gốc. Do đó, phương pháp này phù hợp với bài toán bảo mật dữ
liệu trên đường truyền công khai, nhưng lại tỏ ra có hạn chế trong việc kiểm soát
nội dung sau khi giải mã. Bởi sau khi giải mã, người dùng có thể sử dụng các
chương trình, thiết bị để chỉnh sửa, làm nhái sản phẩm gốc và tái phân phối. Vì vậy,
có thể nói phương pháp mật mã không an toàn đối với dữ liệu sau khi giải mã.
Ngoài ra, việc trao đổi bản mã trên môi trường công khai cũng gây ra sự chú ý với

các đối thủ, những người muốn biết ý nghĩa bản mã một cách bất hợp pháp.
Bên cạnh phương pháp mật mã, gần đây trong lĩnh vực an toàn thông tin xuất
hiện một hướng nghiên cứu mới đó là giấu tin (information hiding hay data hiding).
Giấu tin là phương pháp nhúng thêm một lượng thông tin (dữ liệu nhúng) vào dữ
liệu đa phương tiện (sản phẩm đa phương tiện), để tránh sự theo dõi của đối thủ,
hoặc dùng để xác định tính chân thực hoặc bảo vệ quyền tác giả đối với các sản
phẩm đa phương tiện chứa tin. Theo [31], giấu tin có thể được chia thành hai nhóm
là giấu tin mật (steganography) và thủy vân số (digital watermarking).
Đối với giấu tin mật, dữ liệu nhúng là những thông điệp mật cần trao đổi giữa
người gửi và người nhận. Việc nhúng thông tin mật vào những dữ liệu được truyền
tải phổ biến trên Internet nhằm ngụy trang cho sự tồn tại của tin mật trước các đối
thủ. Trái với giấu tin mật, dữ liệu nhúng trong các lược đồ thủy vân số (thủy vân)
dùng để bảo vệ dữ liệu chứa tin. Việc nhúng thêm thông tin (dấu thủy vân) vào các
5

sản phẩm đa phương tiện có thể làm giảm chất lượng sản phẩm nhưng nó là dấu vết
để phát hiện sự thay đổi trái phép, hoặc chứng minh quyền sở hữu các sản phẩm
chứa dấu thủy vân.
Theo [65], các lược đồ thủy vân có thể được chia thành thủy vân dễ vỡ (fragile
watermarking) [28,43,48,55,57,61,63,65] và thủy vân bền vững (robust
watermarking) [22,25,30,34,37,53,62]. Đối với thủy vân dễ vỡ, dấu thủy vân cần
phải nhạy cảm (dễ vỡ) trước sự thay đổi trái phép trên dữ liệu chứa dấu thủy vân.
Do đó, các lược đồ thủy vân dễ vỡ thường được ứng dụng trong bài toán xác định
tính chân thực (tính toàn vẹn) của dữ liệu chứa dấu thủy vân. Trái với thủy vân dễ
vỡ, thủy vân bền vững yêu cầu dấu thủy vân phải tồn tại (bền vững) trước sự tấn
công nhằm loại bỏ dấu thủy vân. Vì vậy, thủy vân bền vững được dùng trong việc
chứng minh quyền sở hữu hay bảo vệ quyền tác giả (bảo vệ bản quyền).
Theo [9,41,50], nhiều ứng dụng trong y tế, quân sự và nghệ thuật, ngoài việc xác
định tính chân thực của ảnh chứa dấu thủy vân, thì việc khôi phục lại ảnh gốc từ ảnh
chứa dấu thủy vân là yêu cầu bắt buộc. Các lược đồ thủy vân có khả năng như vậy

được gọi là thủy vân thuận nghịch (reversible). Đây là một trong những hướng
nghiên cứu mới của lĩnh vực giấu tin nói chung và thủy vân nói riêng.
Để đảm bảo sự an toàn, dữ liệu nhúng có thể được mã hóa trước khi giấu vào các
sản phẩm đa phương tiện và được giải mã ở phía người trích tin. Ngoài việc được sử
dụng để mã hóa thông tin nhúng, các hệ mật mã khóa công khai còn được dùng để
trao đổi khóa bí mật của lược đồ giấu tin, hoặc kết hợp với lược đồ giấu tin để xây
dựng lược đồ thủy vân khóa công khai [65]. Đây là hướng nghiên cứu có nhiều tiềm
năng ứng dụng và đang nhận được sự quan tâm của cộng đồng nghiên cứu.
Chính vì vậy, tác giả chọn đề tài “Kỹ thuật thủy vân và mật mã học trong xác
thực, bảo vệ bản quyền dữ liệu đa phương tiện” để thực hiện luận án Tiến sĩ của
mình. Mục đích chính của luận án là đề xuất một số lược đồ thủy vân ứng dụng
trong xác thực tính toàn vẹn và bảo vệ quyền tác giả đối với các sản phẩm đa
phương tiện nói chung và sản phẩm ảnh số nói riêng.
Các kết quả nghiên cứu được trình bày trong bốn chương của luận án, ngoài phần
mở đầu và kết luận. Cụ thể như sau:
Chương 1 - Một số kiến thức cơ sở: Chương này trình bày một số kiến thức cơ
bản được sử dụng trong luận án. Ngoài các khái niệm về giấu tin và thủy vân,
6

chương này còn nhắc lại một số khái niệm trong mật mã học và định nghĩa các phép
toán làm việc trên ma trận.
Chương 2 - Giấu tin và hệ mật mã Rabin cải tiến: Nội dung chính của chương
này đề xuất một sơ đồ Rabin mới (đã được công bố trong công trình số 1). Ngoài
khả năng xác định bản rõ duy nhất, sơ đồ Rabin mới còn có tốc độ giải mã nhanh
hơn và phạm vi ứng dụng rộng hơn so với các sơ đồ cải tiến liên quan. Ngoài nội
dung trên, chương này còn đề xuất hai lược đồ giấu tin mới trên ảnh nhị phân và
ảnh chỉ số màu (đã được công bố trong các công trình số 2 và số 3). Các kết quả đề
xuất trong chương này được dùng để xây dựng mô hình bảo mật và xác thực dữ liệu
trên đường truyền ở Chương 3.
Chương 3 - Thủy vân thuận nghịch: Chương này đề xuất hai lược đồ thủy vân

thuận nghịch mới dựa trên đặc trưng ảnh nén JPEG và phép biến đổi mở rộng hiệu
trên véc tơ điểm ảnh (đã được công bố trong các công trình số 5 và số 6). Đây là hai
lược đồ thủy vân thuộc loại dễ vỡ nên có thể được sử dụng trong bài toán xác định
tính chân thực của các sản phẩm đa phương tiện. Ngoài ra, chương này còn đề xuất
hai mô hình: thủy vân thuận nghịch dễ vỡ khóa công khai dùng trong xác thực tính
toàn vẹn sản phẩm ảnh số; bảo mật và xác thực dữ liệu trên đường truyền.
Chương 4 - Thủy vân bền vững khóa công khai sử dụng kỹ thuật trải phổ:
Nội dung chính của chương này đề xuất hai lược đồ thủy vân bền vững khóa công
khai mới trên hai miền cosine rời rạc và wavelet rời rạc (đã được công bố trong
công trình số 4). Hai lược đồ này thuộc nhóm thủy vân bền vững nên có thể được sử
dụng để bảo vệ bản quyền sản phẩm ảnh số nói riêng và sản phẩm đa phương tiện
nói chung.
Các đề xuất mới trong luận án đều được chứng minh, phân tích lý thuyết và so
sánh trên nhiều thực nghiệm. Những kết quả chính của luận án đã được công bố
trong 06 công trình và đã được trình bày Xemina tại Bộ môn Toán Tin – Viện Toán
ứng dụng và Tin học, Trường Đại học Bách khoa Hà Nội.

7

CHƯƠNG 1. MỘT SỐ KIẾN THỨC CƠ SỞ
1.1. Khái niệm về giấu tin
Mục này trình bày một số khái niệm về giấu tin, phân loại phương pháp giấu tin
và các tính chất cơ bản của một lược đồ giấu tin.
1.1.1. Định nghĩa giấu tin
Giấu tin là phương pháp nhúng một đối tượng dữ liệu số  (dữ liệu nhúng) vào
sản phẩm đa phương tiện  (dữ liệu môi trường) để nhận được sản phẩm đa phương
tiện  (dữ liệu chứa tin) chứa . Dữ liệu nhúng có thể là thông điệp mật cần trao đổi
giữa người gửi và người nhận, hoặc là những thông tin được dùng để bảo vệ dữ liệu
chứa tin.
Dựa vào mục đích sử dụng, trong [31] chia các lược đồ giấu tin thành 2 loại như

hình sau:
Giấu tin
(Information hiding)
Giấu tin mật
(Steganography)
Thủy vân số
(Digital watermarking)

Hình 1.1. Phân loại phương pháp giấu tin.
Đối với giấu tin mật, dữ liệu nhúng là những thông điệp mật cần trao đổi giữa
người gửi và người nhận. Việc nhúng thông điệp mật vào những dữ liệu được
truyền tải phổ biến trên Internet như ảnh, âm thanh, video sẽ tránh được sự chú ý
của các đối thủ. Để đảm bảo sự an toàn, trong ứng dụng thường mã hóa thông điệp
mật trước khi nhúng vào dữ liệu đa phương tiện, và sử dụng các hệ mật mã khóa
công khai để trao đổi khóa bí mật của lược đồ giấu tin.
Trái với giấu tin mật, dữ liệu nhúng (dấu thủy vân) trong các lược đồ thủy vân số
(thủy vân) được dùng để bảo vệ dữ liệu chứa tin. Việc nhúng dấu thủy vân vào các
sản phẩm đa phương tiện sẽ làm giảm chất lượng sản phẩm nhưng nó là dấu vết để
8

xác định tính chân thực của sản phẩm, hoặc dùng để chứng minh quyền sở hữu sản
phẩm đa phương tiện chứa dấu thủy vân.
1.1.2. Mô hình giấu tin
Một lược đồ giấu tin gồm hai quá trình nhúng tin và trích tin. Quá trình nhúng tin
được thực hiện ở phía người gửi, thủ tục trích tin thực hiện bên phía người nhận.
Dựa vào các tài liệu [23,28,43,45,48,49,50,64] ta có thể mô hình hóa quá trình
nhúng tin như sau:
Dữ liệu môi trường
(Dữ liệu gốc)
Thuật toán nhúng tin

Dữ liệu chứa tin
Dữ liệu nhúng
Khóa

Hình 1.2. Mô hình nhúng tin.
Trên Hình 1.2, ngoài dữ liệu nhúng và dữ liệu môi trường, thuật toán nhúng tin
thường được trang bị các khóa nhằm nâng cao sự an toàn cho hệ thống. Vì trong
ứng dụng thường phải công khai nội dung lược đồ giấu tin. Do đó, việc sử dụng hệ
thống khóa trong phương pháp giấu tin sẽ chỉ cho phép những người dùng hợp lệ
(những người biết khóa) mới có khả năng trích tin. Sau khi nhúng tin, dữ liệu chứa
tin được trao đổi trên các kênh truyền công khai. Thủ tục trích tin ở phía người nhận
thực hiện như sau:
Dữ liệu gốc
Thuật toán trích tin
Dữ liệu chứa tin
Khóa
Dữ liệu nhúng

Hình 1.3. Mô hình trích tin.
9

Với những người dùng hợp lệ, ngoài việc trích được dữ liệu đã nhúng (dữ liệu
trích) một số lược đồ giấu tin còn có khả năng khôi phục lại dữ liệu gốc. Các lược
đồ có khả năng như vậy được gọi là giấu tin thuận nghịch (reversible data hiding).
1.1.3. Các tính chất của một lược đồ giấu tin
Theo [31], phương pháp giấu tin có một số tính chất cơ bản như: khả năng nhúng
tin, tính che giấu (tính ẩn) và tính bảo mật.
1.1.3.1. Khả năng nhúng tin
Khả năng nhúng tin của một lược đồ là số bít dữ liệu có thể nhúng được trên một
đơn vị dữ liệu môi trường. Lược đồ nào nhúng được nhiều dữ liệu hơn thì có khả

năng nhúng tin cao hơn và ngược lại. Khả năng nhúng tin là một trong những tính
chất quan trọng của phương pháp giấu tin.
1.1.3.2. Tính che giấu
Như luận án đã đề cập, giấu tin là phương pháp nhúng đối tượng  vào đối tượng
 để nhận được đối tượng . Khi nhúng  vào , các lược đồ giấu tin thường phải
biến đổi  theo một qui tắc nào đó để nhận được . Do vậy, giữa  và  thường có
một sự sai khác nhất định. Sự sai khác này có thể được phát hiện bằng các chương
trình, hoặc bằng hệ thống thị giác đối với dữ liệu dạng hình ảnh, hoặc bằng hệ thống
thính giác đối với dữ liệu âm thanh. Lược đồ có tính che giấu càng cao thì càng khó
phát hiện. Nói cách khác, sự sai khác giữa dữ liệu gốc và dữ liệu chứa tin càng ít thì
tính che giấu càng cao.
Theo [31], đối với dữ liệu hình ảnh, tính che giấu của phương pháp giấu tin có
thể được đánh giá thông qua chất lượng ảnh chứa tin so với ảnh gốc bằng hệ số
PSNR (Peak Signal-to-Noise Ratio). Lược đồ nào có giá trị PSNR càng lớn thì chất
lượng ảnh càng cao (tính che giấu càng cao). Hệ số PSNR giữa ảnh chứa tin  so
với ảnh gốc  kích thước   được tính theo công thức:








Trong đó, MAX là giá trị cực đại của điểm ảnh và sai số bình phương trung bình
MSE xác định như sau:
10











 









và giá trị PSNR tính theo đơn vị decibel (dB).
Đối với một lược đồ giấu tin, khả năng nhúng tin và tính che giấu có quan hệ mật
thiết với nhau. Đối với một lược đồ, khi tăng dữ liệu nhúng thì thường làm giảm
chất lượng ảnh chứa tin. Do vậy, tùy thuộc vào từng trường hợp, các lược đồ giấu
tin đưa ra những giải pháp khác nhau nhằm cân bằng hai tính chất này.
1.1.3.3. Tính bảo mật
Giống như các hệ mật mã, nội dung của lược đồ giấu tin thường được công khai
khi ứng dụng. Do đó, sự an toàn của phương pháp giấu tin phụ thuộc vào hệ thống
khóa dùng trong các thuật toán nhúng tin và trích tin. Khi đó, tính bảo mật của một
lược đồ giấu tin là độ khó của bài toán thám khóa. Lược đồ nào có số tổ hợp khóa
càng lớn thì tính bảo mật càng cao.
Ngoài hệ thống khóa của lược đồ giấu tin, dữ liệu nhúng có thể được mã hóa
bằng một sơ đồ mật mã nào đó trước khi nhúng vào dữ liệu đa phương tiện. Khi đó,

tính an toàn của hệ thống sẽ được nâng cao.
1.1.4. Một số hướng tiếp cận của phương pháp giấu tin
Giấu tin trên dữ liệu đa phương tiện có ba hướng tiếp cận chính là: miền quan sát
(miền không gian, miền thời gian) [4,12,13,19,23,47], miền biến đổi [8,22,30,37,51,
53,62] và miền dữ liệu nén [11,16,18,39].
Đối với miền quan sát, các lược đồ thường biến đổi trực tiếp trên các giá trị của
dữ liệu đa phương tiện theo một quy luật nào đó để nhúng dữ liệu. Đây là hướng
tiếp cận tự nhiên, bởi khi nói đến giấu tin người ta thường nghĩ ngay đến việc thay
đổi trực tiếp các giá trị của dữ liệu. Một phương pháp phổ biến của hướng tiếp cận
này là tác động lên những bít ít quan trọng (bít thấp) của dữ liệu [59]. Các lược đồ
giấu tin trên miền quan sát có ưu điểm là thực hiện nhanh và có thể lựa chọn những
vị trí dữ liệu phù hợp để biến đổi nhằm tăng tính che giấu. Tuy nhiên, dữ liệu nhúng
khó có thể bền vững trước các phép biến đổi thông dụng như: nén không bảo toàn
dữ liệu, nhiễu đường truyền, lọc, lấy lại mẫu (resample) Điều này là dễ hiểu vì các
11

biến đổi nói trên cũng loại bỏ hoặc làm sai lệch giá trị các bít ít quan trọng của dữ
liệu đa phương tiện.
Để nâng cao tính bền vững, các lược đồ giấu tin thường biến đổi dữ liệu đa
phương tiện từ miền quan sát sang một miền biểu diễn mới (miền biến đổi), và lựa
chọn những đặc trưng thích hợp để nhúng tin, sau đó dùng phép biến đổi ngược
tương ứng để chuyển dữ liệu từ miền biến đổi về miền quan sát. Một số phép biến
đổi thường được sử dụng trong các lược đồ thủy vân như: DCT (Discrete Cosine
Transform) [21], DWT (Discrete Wavelet Transform) [21], NMF (Non-negative
Matrix Factorization) [58], SVD (Singular Value Decomposition) [21] và phép biến
đổi QR [8]. Tuy các phép biến đổi này thực hiện theo cách thức khác nhau nhưng có
chung tính chất: năng lượng của dữ liệu đa phương tiện sau khi biến đổi thường tập
trung vào một số phần tử (vùng tập trung năng lượng) trên miền biến đổi. Do vậy,
nếu dữ liệu được nhúng vào vùng tập trung năng lượng thì tính bền vững sẽ được
cải thiện hơn.

Với mục đích giảm không gian lưu trữ và tăng tốc độ truyền tải, dữ liệu hình ảnh
và âm thanh thường được lưu trữ dưới dạng dữ liệu nén (miền dữ liệu nén). Do vậy
các lược đồ giấu tin trên miền dữ liệu này cần phải giải nén trước khi nhúng dữ liệu,
và thực hiện nén sau khi nhúng dữ liệu. Ngoài những chiến lược như miền quan sát
và miền biến đổi, các lược đồ giấu tin trên miền dữ liệu nén còn khai thác các tính
chất, đặc trưng của phép nén để tăng cường tính bền vững và cải thiện chất lượng
dữ liệu chứa tin. Theo [21], một số phép nén thường được sử dụng đối với dữ liệu
đa phương tiện như: cosine rời rạc, wavelet (sóng nhỏ) rời rạc, Run-length (độ dài
thay đổi), Huffman và mã hóa số học [1].
1.2. Một số khái niệm về thủy vân trên dữ liệu đa phương tiện
1.2.1. Dữ liệu đa phương tiện
Dữ liệu đa phương tiện là những dạng dữ liệu như: văn bản (text), ảnh số (image)
âm thanh (audio) và video. Khi nói đến dữ liệu đa phương tiện, người ta thường
quan tâm đến các tệp ảnh số, âm thanh và video.
1.2.1.1. Ảnh số
Trên phương diện toán học, ảnh số (ảnh tĩnh) được xem như các ma trận số
nguyên. Như vậy, ảnh hai màu (nhị phân) được xem như một ma trận nhị phân, ảnh
12

đa cấp xám ứng với một ma trận nguyên có giá trị thuộc [0, 255] và ảnh màu (true
color) được biểu diễn bởi 3 ma trận nguyên ứng với các thành phần màu .
Giá trị các điểm ảnh được lưu trữ theo hai hình thức bảo toàn hoặc không bảo
toàn (nén không bảo toàn). Đối với hình thức lưu trữ bảo toàn (không nén hoặc nén
bảo toàn), thì từ tệp dữ liệu ảnh ta có thể khôi phục chính xác ảnh gốc (ảnh trước
khi lưu trữ). Một số định dạng tệp ảnh lưu trữ theo hình thức bảo toàn như DIB,
BMP, TIFF và PCX. Trái với hình thức lưu trữ bảo toàn, ta chỉ khôi phục được ảnh
gần đúng so với ảnh gốc từ những tệp lưu trữ theo hình thức không bảo toàn. Lưu
trữ không bảo toàn thường sử dụng qui trình nén JPEG, qui trình này được trình bày
ở mục 3.2.1.
Như vậy, giấu tin trên ảnh thực chất là nhúng dãy bít vào ma trận số nguyên. Do

đó, một phương pháp thực hiện tốt trên ma trận nhị phân thì có thể phát triển và ứng
dụng trên ma trận nguyên có giá trị thuộc [0, 255]. Nói cách khác, một thuật toán
giấu tin tốt trên ảnh nhị phân thì thực hiện tốt trên ảnh đa cấp xám hoặc ảnh màu.
1.2.1.2. Âm thanh
Theo [21], âm thanh số (âm thanh) được lấy mẫu từ tín hiệu liên tục một chiều.
Như vậy, dữ liệu âm thanh (các mẫu âm thanh) là một dãy số nguyên và cũng được
lưu trữ theo hai hình thức bảo toàn hoặc không bảo toàn giống như ảnh số. Một số
chuẩn lưu trữ dữ liệu âm thanh thông dụng như: WAV, AIFF, WMA, MP3. Trong
đó, các định dạng WAV, AIFF, WMA lưu trữ theo hình thức bảo toàn. Chuẩn MP3
sử dụng phương pháp nén không bảo toàn dữ liệu.
Như vậy, giấu tin trên âm thanh thực chất là phương pháp nhúng một dãy bít vào
một dãy số. Do đó, các phương pháp giấu tin tốt trên ảnh số thì hoàn toàn có thể
phát triển và ứng dụng đối với dữ liệu âm thanh. Bởi, ta có thể dễ dàng chuyển một
dãy số thành ma trận và ngược lại.
1.2.1.3. Video
Video là sự kết hợp giữa âm thanh và ảnh động. Ảnh động là một dãy liên tiếp
nhiều ảnh tĩnh (các frame). Để mắt người không nhận biết được sự rời rạc giữa các
ảnh tĩnh, chuẩn video yêu cầu hiển thị tối thiểu 24 frame/s. Do đó, số lượng ảnh tĩnh
của tệp video là khá lớn. Vì vậy, các chuẩn video thường sử dụng nén không bảo
toàn để giảm không gian lưu trữ.
13

Theo [21], dữ liệu video có sự dư thừa trên hai miền không gian (spatial domain)
và thời gian (time domain). Sự dư thừa trên miền không gian thể hiện qua sự tương
tự về giá trị giữa các điểm ảnh của một frame. Trong khi, dư thừa trên miền thời
gian biểu hiện qua sự tương tự giữa các frame liên tiếp. Trong thực tế, sự sai khác
giữa hai frame liên tiếp là khá nhỏ. Nên sự dư thừa trên miền thời gian là khá lớn.
Với mỗi nhóm frame liên tiếp (Group Of Pictures - GOP), chuẩn MPEG xét 3
dạng frame, ký hiệu  và . Trong đó,  là frame đầu tiên của GOP;  là các
frame được suy luận từ   là những frame được suy luận từ  và . Theo chuẩn

MPEG [21], các frame dạng  được nén độc lập như ảnh JPEG, các frame dạng  và
 được nén theo phương pháp ước lượng chuyển động (motion estimation). Trong
khi chuẩn AVI coi các frame của GOP đều thuộc dạng frame  và nén như ảnh
JPEG. Do đó, các phương pháp giấu tin trên ảnh JPEG đều có thể phát triển và ứng
dụng trên dữ liệu video [30,31].
Như vậy, một phương pháp giấu tin nói chung và thủy vân nói riêng nếu thực
hiện tốt trên ảnh số thì hoàn toàn có thể phát triển, ứng dụng trên dữ liệu âm thanh
và video. Do đó, trong luận án tập trung nghiên cứu, đề xuất các phương pháp giấu
tin, thủy vân trên sản phẩm ảnh số.
1.2.2. Phân loại phương pháp thủy vân
Theo [65], các lược đồ thủy vân có thể được chia thành hai nhóm như hình sau:
Thủy vân
(Watermarking)
Thủy vân bền vững
(Robust watermarking)
Thủy vân dễ vỡ
(Fragile watermarking)

Hình 1.4. Phân loại phương pháp thủy vân.
Ngoài cách phân loại như trên, dựa vào việc dấu thủy vân hiển thị (hiện) hay
không hiển thị (ẩn) trên sản phẩm đa phương tiện, người ta còn chia các lược đồ
thành thủy vân hiện (visible watermarking) và thủy vân ẩn (invisible
watermarking). Trong luận án chỉ tập trung nghiên cứu các lược đồ thủy vân ẩn và
sử dụng cách phân loại như Hình 1.4.
14

1.2.2.1. Thủy vân bền vững
Thủy vân bền vững (robust watermarking) yêu cầu dấu thủy vân phải ít bị biến
đổi (bền vững) trước sự tấn công trên sản phẩm chứa dấu thủy vân, hoặc trong
trường hợp loại bỏ được dấu thủy vân thì sản phẩm sau khi bị tấn công cũng không

còn giá trị sử dụng. Do vậy, những lược đồ thủy vân bền vững thường được ứng
dụng trong bài toán bảo vệ bản quyền. Theo kết quả khảo sát trong [30,37,53], các
phép tấn công phổ biến nhằm loại bỏ dấu thủy vân đối với ảnh số là: nén JPEG,
thêm nhiễu, lọc, xoay, cắt xén, làm mờ, thay đổi kích thước, thay đổi cường độ
sáng, thay đổi độ tương phản.
Để xác định quyền sở hữu sản phẩm đa phương tiện chứa dấu thủy vân, thuật
toán xác định quyền tác giả thường đánh giá sự tương quan giữa dấu thủy vân gốc
(dấu thủy vân của tác giả) với dấu thủy vân trích được. Nếu sự tương quan này lớn
hơn ngưỡng cho trước thì kết luận sản phẩm chứa dấu thủy vân thuộc về tác giả có
dấu thủy vân gốc, nếu trái lại thì kết luận sản phẩm đó không thuộc về tác giả. Do
vậy, đối với loại thủy vân này, tính bền vững và tính che giấu được quan tâm hơn so
với các tính chất còn lại của phương pháp giấu tin.
1.2.2.2. Thủy vân dễ vỡ
Khác với thủy vân bền vững, thủy vân dễ vỡ (fragile watermarking) yêu cầu dấu
thủy vân phải nhạy cảm (dễ bị biến đổi) trước sự tấn công trên dữ liệu thủy vân. Do
vậy, thủy vân dễ vỡ thường được ứng dụng trong xác thực tính toàn vẹn của sản
phẩm đa phương tiện chứa dấu thủy vân trên các môi trường trao đổi không an toàn.
Để xác thực tính toàn vẹn của các sản phẩm chứa dấu thủy vân, thuật toán xác
thực thường so sánh sự sai khác giữa dấu thủy vân trích được () với dấu thủy vân
gốc (). Nếu có sự sai khác giữa  và  thì kết luận sản phẩm chứa dấu thủy vân
đã bị tấn công, nếu trái lại thì kết luận sản phẩm chưa bị tấn công (toàn vẹn). Ngoài
việc xác thực tính toàn vẹn, một số lược đồ thủy vân dễ vỡ còn có khả năng định vị
các vùng dữ liệu bị tấn công. Việc định vị được các vùng bị tấn công không những
giúp người dùng an tâm sử dụng những vùng dữ liệu còn lại (vùng chưa bị tấn
công) mà còn giúp ta có thể dự đoán được mục đích tấn công của đối thủ.
Theo [9,41,50], nhiều ứng dụng trong y tế, quân sự và nghệ thuật, sau khi đã xác
định được tính chân thực của ảnh thủy vân thì việc khôi phục lại ảnh gốc là yêu cầu
bắt buộc. Bởi, chỉ cần một sự khác biệt nhỏ giữa ảnh sử dụng so với ảnh gốc cũng
15


có thể dẫn đến những quyết định thiếu chính xác và gây ra những hệ lụy nghiêm
trọng. Các lược đồ thủy vân có khả năng như vậy thì được gọi là thủy vân thuận
nghịch (reversible watermarking).
1.3. Một số phép biến đổi dữ liệu
Mục này trình bày tóm tắt hai phép biến đổi thông dụng trong xử lý dữ liệu đa
phương tiện là cosine rời rạc và wavelet rời rạc. Ngoài việc dùng để nén dữ liệu, hai
phép biến đổi này còn được sử dụng trong các bài toán như: trích chọn đặc trưng,
phát hiện ảnh giả mạo và thủy vân.
1.3.1. Phép biến đổi cosine rời rạc
Phép biến đổi cosine rời rạc đã trở thành một công cụ chuẩn trong nén dữ liệu
hình ảnh và âm thanh. Giống như các phép biến đổi khác, phép biến đổi cosine rời
rạc gồm: biến đổi thuận (DCT) và biến đổi ngược (IDCT). Biến đổi thuận dùng để
chuyển dữ liệu từ miền quan sát sang miền tần số, biến đổi ngược chuyển dữ liệu từ
miền tần số về miền quan sát.
1.3.1.1. Phép biến đổi cosine rời rạc một chiều
Theo [21], biến đổi DCT một chiều ứng với dãy 



 ở miền quan
sát để nhận được dãy 



 trong miền tần số tính theo công thức:

















 





Trong đó,







 

 
Các giá trị 


được gọi là miền cosine rời rạc (miền DCT), hệ số đầu tiên 

được
gọi là phần tử DC (Direct Current), những hệ số còn lại được gọi là các phần tử AC
(Alternative Current).
Khi đó, biến đổi IDCT một chiều tương ứng thực hiện theo công thức:
















 




  
16


Theo [21], một trong những tính chất quan trọng của phép biến đổi DCT là sự tập
trung năng lượng, đặc biệt đối với những dữ liệu có sự tương quan cao như ảnh, âm
thanh và video. Trên miền DCT, năng lượng tập trung vào một số phần tử đầu tiên,
đặc biệt là phần tử DC. Các phần tử còn lại thường có giá trị nhỏ (tính theo giá trị
tuyệt đối), thường xấp xỉ bằng 0.
Ví dụ, với dãy  sau khi biến đổi
cosine rời rạc một chiều ta nhận được miền DCT tương ứng:

1.3.1.2. Phép biến đổi cosine rời rạc hai chiều
Phép biến đổi DCT một chiều chỉ phù hợp với kiểu dữ liệu âm thanh. Đối với dữ
liệu có quan hệ hai chiều (hàng và cột) như dữ liệu ảnh ta có thể áp dụng hai lần
biến đổi DCT một chiều: một lần theo hàng và một lần theo cột, do đó được gọi là
biến đổi DCT hai chiều.
Theo [21], phép biến đổi DCT hai chiều ứng với ma trận  cấp   ở miền
quan sát để nhận được ma trận  ở miền tần số tính theo công thức:

















 











 





với     và 



xác định theo công thức:








 

  
Khi đó, hệ số đầu tiên 

được gọi là phần tử DC và các hệ số còn lại là AC.
Phép biến đổi IDCT hai chiều ứng với   hệ số DCT của ma trận  về miền
quan sát tính theo công thức:
















 












 





với    .
Trong ứng dụng, phép biến đổi DCT hai chiều thường áp dụng trên các khối dữ
liệu    điểm ảnh để nhận được các khối DCT gồm 64 phần tử. Để nâng cao tốc
độ thực hiện, biến đổi DCT hai chiều thường được tiếp cận theo phương pháp ma
17

trận. Theo [21], ma trận cosine rời rạc  cấp   là ma trận trực chuẩn và được
tính theo công thức:


















 


 

với  và.
Khi đó, phép biến đổi DCT hai chiều theo cách tiếp cận ma trận được tính theo
công thức:
   


và biến đổi IDCT hai chiều:


 
Do  là ma trận trực chuẩn nên ma trận chuyển vị 

cũng chính là ma trận
nghịch đảo của . Do vậy, phép biến đổi (1.2) và (1.3) luôn bảo toàn phổ dữ liệu.
1.3.2. Phép biến đổi wavelet rời rạc
Giống như phép biến đổi DCT, phép biến đổi wavelet rời rạc (DWT) giữ vai trò
quan trọng trong lĩnh vực xử lý dữ liệu đa phương tiện và là chuẩn nén ảnh JPEG

2000. Khác với biến đổi DCT, năng lượng của ảnh trên miền DWT tập trung khá
đồng đều vào một số phần tử góc trên bên trái. Nhờ vậy, ta có thể áp dụng phép
biến đổi DWT nhiều lần (mức) cho một ảnh bằng cách thực hiện liên tiếp phép biến
đổi này trên các phần tử góc trên bên trái để đạt được độ tập trung năng lượng theo
yêu cầu của ứng dụng.
Trong các biến đổi wavelet rời rạc, phép biến đổi Haar [21] là một trong những
phép biến đổi thông dụng. Phép biến đổi này sử dụng cố định ma trận trực chuẩn 
(ma trận wavelet Haar) có kích thước  , với 

 Ví dụ ma trận wavelet
Haar cấp   như hình sau:
18




















































2
1
2
1
000000
00
2
1
2
1
0000
0000
2
1
2
1
00
000000
2
1
2
1
2
1
2
1
000000
00

2
1
2
1
0000
0000
2
1
2
1
00
000000
2
1
2
1
H

Hình 1.5. Ma trận wavelet Haar cấp 8×8.
Khi đó, phép biến đổi wavelet rời rạc Haar theo hàng đối với ảnh  là  và
theo cột là  

. Nếu lần lượt áp dụng theo hàng rồi tiếp tục theo cột thì được gọi
là wavelet hai chiều. Biến đổi wavelet Haar hai chiều tiếp cận theo phương pháp ma
trận được tính theo công thức:
  


Để tiện trình bày, ký hiệu sơ đồ áp dụng wavelet hai chiều như sau:
Ảnh A

Theo hàng
Theo cột
L LL LH
HL HHH

Hình 1.6. Sơ đồ áp dụng wavelet hai chiều.
Nếu gọi  là các hệ số sau khi áp dụng wavelet Haar hai chiều (các vùng LL,
LH, HL và HH), thì phép biến đổi wavelet Haar ngược (IDWT) từ  về ảnh  được
tính theo công thức:


  
Đối với phép biến đổi wavelet hai chiều, năng lượng tập trung khá đồng đều vào
các phần tử trong vùng LL, tiếp theo lần lượt là các vùng LH, HL và HH.
1.4. Một số khái niệm trong mật mã
Mục này trình bày lại một số khái niệm cần thiết trong lý thuyết mật mã. Các
khái niệm này được sử dụng trong Chương 2 và Chương 3.

×