Tải bản đầy đủ (.pdf) (73 trang)

Kỹ thuật thủy vân trong ứng dụng bảo vệ bản quyền

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.06 MB, 73 trang )

LỜI CẢM ƠN
Lời đầu tiên em xin chân thành cảm ơn sự hướng dẫn tận tình của cô
giáo Th.S Lưu Thị Bích Hương, khoa Công nghệ thông tin, trường Đại học sư
phạm Hà Nội 2.
Trong suốt thời gian thực hiện khóa luận, mặc dù rất bận rộn trong công
việc nhưng cô vẫn dành nhiều thời gian và tâm huyết trong việc hướng dẫn
em. Cô cung cấp cho em rất nhiều hiểu biết về một lĩnh vực mới khi em mới
bắt đầu bước vào thực hiện khóa luận.
Em cũng xin chân thành cảm ơn các thầy, cô giáo trong khoa Công nghệ
Thông tin, cũng như các thầy, cô giáo trong trường đã giảng dạy và giúp đỡ
em trong 4 năm học vừa qua. Chính các thầy, cô giáo đã xây dựng cho chúng
em những kiến thức nền tảng và kiến thức chuyên môn để em có thể hoàn
thành khóa luận tốt nghiệp và chuẩn bị cho những công việc của mình sau
này.
Cuối cùng em xin bày tỏ lòng biết ơn tới gia đình và bạn bè đã giúp đỡ
động viên em rất nhiều trong suốt quá trình học tập để em có thể thực hiện tốt
khóa luận này.
Tuy đã có những cố gắng nhất định nhưng do thời gian và trình độ có
hạn nên chắc chắn khóa luận này còn nhiều thiếu sót và hạn chế. Kính mong
nhận được sự góp ý của thầy, cô giáo và các bạn.

Hà Nội, tháng 05 năm 2013
Sinh viên

Phạm Thị Thanh Nhân


LỜI CAM ĐOAN
Tên em là: PHẠM THỊ THANH NHÂN
Sinh viên lớp: K35 – Tin học, khoa Công nghệ thông tin, trường Đại học
sư phạm Hà Nội 2.


Em xin cam đoan:
1. Đề tài “Kỹ thuật thủy vân trong ứng dụng bảo vệ bản quyền” là sự
nghiên cứu của riêng em, dưới sự hướng dẫn của cô giáo Th.S Lưu Thị Bích
Hương.
2. Khóa luận hoàn toàn không sao chép của tác giả nào khác.
Nếu sai em xin hoàn toàn chiu trách nhiệm.

Hà Nội, tháng 05 năm 2013
Người cam đoan

Phạm Thị Thanh Nhân


MỤC LỤC
LỜI CẢM ƠN
LỜI CAM ĐOAN
CÁC KÝ HIỆU VIẾT TẮT
DANH MỤC HÌNH VẼ
MỞ ĐẦU ....................................................................................................... 1
CHƯƠNG 1: CƠ SỞ LÝ THUYẾT ............................................................... 5
1.1. MÔ HÌNH THỊ GIÁC NGƯỜI................................................................ 5
1.1.1. Nhạy cảm về sự tương phản.......................................................... 5
1.1.2. Nhạy cảm về độ chói .................................................................... 6
1.1.3. Nhạy cảm về tần số ....................................................................... 6
1.1.4. Mặt nạ thị giác .............................................................................. 9
1.1.5. Kết luận ...................................................................................... 11
1.2. Các không gian màu .............................................................................. 11
1.2.1. Không gian RGB ........................................................................ 12
1.2.2. Không gian HSV ........................................................................ 13
1.2.3. Không gian CMY ....................................................................... 15

1.2.4. Không gian YCbCr ..................................................................... 15
1.3. CẤU TRÚC MỘT SỐ LOẠI ẢNH THÔNG DỤNG............................. 16
1.3.1. Biểu diễn ảnh trên máy tính ........................................................ 16
1.3.2. Cấu trúc một số định dạng ảnh thông dụng ................................. 18
CHƯƠNG 2: CÁC KỸ THUẬT THỦY VÂN ............................................. 22
2.1. TỔNG QUAN VỀ THỦY VÂN ............................................................ 22
2.1.1. Khái niệm thủy vân..................................................................... 22
2.1.2. Nguồn gốc thủy vân .................................................................... 23
2.1.3. Phân loại thủy vân ...................................................................... 25
2.1.4. Ứng dụng của thủy vân ............................................................... 27
2.2. MÔ HÌNH THỦY VÂN ........................................................................ 30


2.2.1. Quy trình thủy vân ...................................................................... 30
2.2.2. Các yêu cầu với thủy vân ............................................................ 33
2.2.3. Các khuynh hướng tiếp cận của kỹ thuật thủy vân ...................... 35
2.3. CÁC KỸ THUẬT THỦY VÂN ............................................................ 36
2.3.1. Kỹ thuật nhúng thủy vân theo miền không gian ảnh ................... 36
2.3.2. Các kỹ thuật nhúng thủy vân theo miền tần số ............................ 40
2.3.3. Kỹ thuật trải phổ trong truyền thông ........................................... 53
2.3.4. Kỹ thuật kiểm định thủy vân ....................................................... 55
CHƯƠNG 3: XÂY DỰNG CHƯƠNG TRÌNH ỨNG DỤNG ...................... 56
3.1. GIỚI THIỆU BÀI TOÁN ...................................................................... 56
3.2. PHƯƠNG PHÁP GIẢI QUYẾT ........................................................... 57
3.2.1. Thủy vân bằng chèn dữ liệu vào ảnh ........................................... 57
3.2.2. Cấu trúc ảnh Bitmap trước và sau khi chèn dữ liệu ..................... 57
3.2.3. Cấu trúc ảnh JPEG trước và sau khi chèn dữ liệu........................ 60
3.2.4. Giao diện ứng dụng minh hoạ ..................................................... 60
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN .................................................... 63
TÀI LIỆU THAM KHẢO ............................................................................ 65



CÁC KÝ HIỆU VIẾT TẮT
Ký hiệu

Viết đầy đủ

Ý nghĩa

BMP

Windows bitmap format

Ảnh bitmap

CMY

Cyan-Magenta-Yellow

Không gian màu CMY

DCT

Discrete Cosine Transform

Biến đổi Consine rời rạc

DFT

Discrete Fourier Transform


Biến đổi Fourier rời rạc

DWT

Discrete Wavelet Transform

Biến đổi sóng rời rạc

GIF

Graphics Interchange Format

Ảnh gif

HSL

Hue – Saturation – Lightness

Không gian màu HSL

HSV

Hue – Saturation – Value

Không gian màu HSV

HVS

Human Visual System


Hệ thống thị giác người

Just Noticeable Difference

Sự khác biệt nhỏ nhất có thể

JND

JPEG

phân biệt
Joint

Photographic

Expert Ảnh nén JPEG

Group

LSB

Least Significant Bit

Bit ít quan trọng nhất

MSE

Mean Square Error


Sai số bình phương trung bình

NC

Normalized Correlation

Hệ số tương quan chuẩn

PSNR

Peak Signal to Noise Ratio

Tỉ lệ của tín hiệu nhọn với nhiễu

RGB

Red – Green – Blue

Không gian màu RGB


DANH MỤC HÌNH VẼ
Hình 1.1 - Ngưỡng biến đổi nhỏ nhất mà con người cảm nhận được với các
độ chói I khác nhau ........................................................................................ 6
Hình 1.2 - Hàm nhạy cảm tương phản dựa trên mẫu của Mannos và Sakrison
....................................................................................................................... 7
Hình 1.3 - Sự cảm nhận ba màu của thị giác người....................................... 8
Hình 1.4 - Độ nhạy cảm của mắt người với các tần số thời gian khác nhau .... 9
Hình 1.5 - So sánh ảnh ban đầu và ảnh đó nhúng thủy vân .......................... 10
Hình 1.6 - Không gian màu RGB ................................................................ 12

Hình 1.7 - Không gian HSV ......................................................................... 14
Hình 1.8 - RGB và CMY.............................................................................. 15
Hình 2.1 - Một trong những thủy vân trên giấy đầu tiên ............................... 23
Hình 2.2 - Số lượng các paper về thủy vân số qua các năm .......................... 25
Hình 2.3 - Trước và sau khi nhúng thủy vân................................................. 27
Hình 2.4- Thủy vân của ảnh h 2.3 b .............................................................. 27
Hình 2.5 - Khó phân biệt ảnh nào là giả bằng mắt thường ............................ 28
Hình 2.6 - Minh họa một ảnh được nhúng thủy vân khác nhau ..................... 28
Hình 2.7 – Quy trình thủy vân ...................................................................... 30
Hình 2.8 - Phân chia 3 miền tần số ảnh của phép biến đổi DCT ................... 44
Hình 2.9 - Ảnh Lena, 256 màu ..................................................................... 44
Hình 2.10 - Năng lượng phân bố của ảnh ứng với biến đổi DCT ................. 45
Hình 2.11 - Quá trình nhúng thủy vân vào ảnh ............................................. 46
Hình 2.12 - Quá trình tách thủy vân ............................................................. 47
Hình 2.13 - Ảnh trước và sau nhúng bằng F4 ............................................... 50
Hình 2.14 - Sử dụng thuật toán F5 để nhúng thủy vân .................................. 50
Hình 2.15 – Tần số ảnh phân tích theo DWT................................................ 52
Hình 2.16 – Vấn đề thủy vân dưới góc nhìn của truyền thông ...................... 54
Hình 3.1 - Giao diện chính của chương trình ................................................ 61


Hình 3.2 - Quá trình nhúng thủy vân ........................................................... 61
Hình 3.3 - Quá trình tách thủy vân ............................................................... 62
Hình 3.4 - Ảnh trước và sau khi nhúng thủy vân .......................................... 62


MỞ ĐẦU
1. Lý do chọn đề tài
Thông tin liên lạc là nhu cầu thiết yếu không thể thiếu được của đời sống
xã hội. Xã hội càng hiện đại, nhu cầu thông tin càng tăng cả về số lượng lẫn

chất lượng. Những thành tựu của cuộc cách mạng khoa học và kỹ thuật thế kỷ
20 và những thập niên đầu của thế kỷ 21 này đã làm thay đổi sâu sắc cuộc
sống, giúp chúng ta ngày càng gần nhau hơn, mang lại cho nhau nhiều cơ hội
phát triển hơn nhưng đồng thời cũng phát sinh thêm nhiều thách thức mới.
Mạng Internet toàn cầu đã tạo ra những cơ cấu ảo, là nơi diễn ra quá trình trao
đổi thông tin trong mọi lĩnh vực, đã thúc đẩy khả năng sáng tạo, xử lý và
thưởng thức các dữ liệu đa phương tiện. Nhưng chính trong môi trường mở,
tiện nghi như thế lại xuất hiện những vấn nạn, những tiêu cực đang rất cần các
giải pháp hữu hiệu nhằm bảo đảm an toàn thông tin, chống lại nạn ăn cắp bản
quyền, giả mạo thông tin, truy cập thông tin trái phép... Việc tìm giải pháp
cho những vấn đề này không chỉ giúp ta hiểu thêm về công nghệ phức tạp
đang phát triển rất nhanh này mà còn tạo ra những cơ hội phát triển mới.
Bên cạnh đó, nhiệm vụ đảm bảo thông tin liên lạc cho quân đội trong
thời kỳ mới chiếm một vị trí hết sức quan trọng. Tuy hiện nay đã có nhiều
biện pháp giải quyết, nhưng chủ yếu vẫn dựa vào phương pháp mã mật thông
tin. Chính vì tính chất đặc thù của mã mật đã khiến bản tin rất dễ bị thám mã,
phá hoại. Cho nên, để nâng cao tính an toàn và bí mật, bản tin có thể được
đem giấu vào các đối tượng rất bình thường khác mà không gây ra bất kỳ sự
chú ý nào. Và như vậy, sẽ lợi dụng một cách hiệu quả các mạng truyền thông
thương mại sẵn có phục vụ cho nhiệm vụ quốc phòng, an ninh với tính tin
cậy, an toàn và bí mật cao.
Xuất phát từ yêu cầu của thực tế nhằm mục đích hướng tới một phần
nhiệm vụ trên, nên em chọn đề tài “Kỹ thuật thủy vân trong ứng dụng bảo vệ
bản quyền” để làm khóa luận.

1


2. Mục đích và nhiệm vụ nghiên cứu
Do yêu cầu bảo vệ bản quyền, chứng thực (đánh dấu, xác thực) nguồn

gốc hay chủ sở hữu của ảnh số nói riêng và các sản phẩm số nói chung nên
giấu tin thủy vân có yêu cầu khác với giấu tin bí mật. Với giấu tin thủy vân,
yêu cầu đầu tiên là các dấu hiệu thủy vân phải đủ bền vững trước những tấn
công vô tình hay gỡ bỏ. Thêm vào đó là các dấu hiệu thủy vân phải có ảnh
hưởng tối thiểu (về mặt cảm nhận) đối với các phương tiện chứa. Vậy thông
tin cần giấu càng nhỏ thì sẽ càng tốt. Khóa luận nghiên cứu thuật toán thủy
vân cho ảnh số với mục đích chính là:
+ Tìm hiểu các vấn đề liên quan đến thủy vân cho ảnh số.
+ Khảo sát đánh giá và đưa ra ứng dụng quan trọng của kỹ thuật thủy
vân trong ứng dụng bảo vệ bản quyền.
+ Các kết quả mô phỏng khẳng định tính đúng đắn và mạnh mẽ của thuật
toán.
3. Đối tượng và phạm vi nghiên cứu
+ Đối tượng nghiên cứu: Các kỹ thuật thủy vân.
+ Phạm vi nghiên cứu: Nghiên cứu một số kỹ thuật thủy vân cho các loại
ảnh khác nhau: bitmap, jpeg.
4. Ý nghĩa khoa học và thực tiễn của đề tài
Ý nghĩa khoa học: Lý thuyết thủy vân ra đời, phát triển và có cơ sở khoa
học vững chắc, nghiên cứu sẽ góp phần chứng minh thêm tính đúng đắn của
lý thuyết thủy vân. Hiện nay thủy vân là một lĩnh vực đang được các chuyên
gia nghiên cứu và phát triển.
Ý nghĩa thực tiễn: Chương trình thử nghiệm nếu thành công sẽ góp một
phần nhỏ trong việc bảo vệ bản quyền ảnh số nói riêng và các sản phẩm số
nói chung.

2


5. Phương pháp nghiên cứu
a. Phương pháp nghiên cứu lý luận

Nghiên cứu qua việc đọc sách, báo và các tài liệu liên quan nhằm xây
dựng cơ sở lý thuyết của đề tài và các biện pháp cần thiết để giải quyết các
vấn đề của đề tài.
b. Phương pháp chuyên gia
Tham khảo ý kiến của các chuyên gia để có thể thiết kế chương trình phù
hợp với yêu cầu thực tiễn. Nội dung xử lý nhanh đáp ứng được yêu cầu ngày
càng cao của người sử dụng.
c. Phương pháp thực nghiệm
Thông qua quan sát thực tế, yêu cầu của cơ sở, những lý luận được
nghiên cứu và kết quả đạt được qua những phương pháp trên.
6. Cấu trúc khóa luận
Ngoài phần mở đầu, kết luận và tài liệu tham khảo, khóa luận có những
nội dung sau:
Chương 1: Cơ sở lý thuyết – Chương này trình bày một số kiến thức cơ
sở nhằm mục đích phục vụ cho việc thủy vân trong ảnh được hiệu quả hơn,
như kiến thức về mô hình thị giác người, các mô hình màu và cấu trúc của
một số định dạng ảnh thông dụng.
Chương 2: Các kỹ thuật thủy vân – Trong chương này, khóa luận trình
bày tổng quan về thủy vân như khái niệm, nguồn gốc, phân loại cũng như ứng
dụng của thủy vân hiện nay, việc so sánh giữa Thủy vân và Giấu tin. Các kỹ
thuật thủy vân trong môi trường ảnh là nội dung chính sẽ được trình bày trong
khóa luận. Các kỹ thuật thủy vân được nghiên cứu nằm trong hai hướng tiếp
cận chính là tiếp cận theo miền không gian ảnh và tiếp cận theo miền tần số
ảnh. Trong mỗi phương pháp thủy vân, khóa luận sẽ nêu lên cơ sở kỹ thuật,
nội dung cũng như phân tích ưu nhược điểm của từng phương pháp.

3


Chương 3: Xây dựng chương trình ứng dụng - Từ những kiến thức lý

thuyết đã nghiên cứu, khóa luận đã vận dụng và cài đặt thử nghiệm chương
trình thủy vân cho ảnh, với đối tượng là ảnh bitmap và ảnh jpeg, sử dụng
phương pháp DCT.

4


CHƯƠNG 1: CƠ SỞ LÝ THUYẾT
1.1. MÔ HÌNH THỊ GIÁC NGƯỜI
Sự hiểu biết về đặc điểm của hệ thống thị giác người sẽ góp phần không
nhỏ trong việc cải tiến và nâng cấp các thuật toán về thủy vân.
Võng mạc của mắt chia tín hiệu nhận được thành các thành phần khác
nhau và mỗi thành phần kích thích não qua các kênh khác nhau. Để nhận biết
một ảnh, não người phải xử lý thông tin thu nhận được như vị trí không gian,
đường nét, màu sắc, độ chói, độ tương phản, tần số,… của ảnh. Ánh sáng
trắng hay dải sóng mà mắt người có thể cảm nhận được, khi đi qua lăng kính
được phân tách thành những luồng ánh sáng đơn sắc có phổ màu từ tím đến
đỏ, và dải bước sóng tương ứng từ 400-700 nm. Mắt người có thể nhận biết
và phân biệt khoảng 4000 màu, thực tế gặp khó chịu khi quan sát sự pha trộn
lộn xộn quá nhiều màu. Có ba thuộc tính chủ yếu của hệ thống màu:
- Sắc màu (Hue): dùng để phân biệt các màu với nhau.
- Độ bão hòa (Saturation): độ thuần màu hay khoảng cách của màu tới
điểm có cường độ cân bằng.
- Độ sáng (Lightness): cường độ sáng, chính là ánh sáng phản xạ nhận
được từ đối tượng. Đôi khi thuật ngữ độ sáng được thay thế bởi độ phát sáng
(Brightness), nó mô tả cường độ sáng do đối tượng tự phát ra.
Dưới đây là một số đặc tính của hệ thống thị giác người:
1.1.1. Nhạy cảm về sự tương phản
Mắt người nhạy cảm với sự có mặt của một tín hiệu trong một tín hiệu
khác. Đặc điểm này nói lên khả năng dù tìm một tín hiệu trong một tín hiệu

khác của mắt người, kết quả tốt nhất khi hai tín hiệu cùng một tần số, hướng
và vị trí.
Nhạy cảm về sự tương phản cũng chính là sự nhạy cảm về mật độ mô tả
tính thấy được của nhiễu trên ảnh gốc. Giả sử, mắt người đã quen với độ chói
Io của nền, mục đích là tìm lượng khác biệt nhỏ nhất I giữa điểm ở tâm và

5


các điểm xung quanh để mắt người có thể phân biệt được. Sự khác biệt này
thường được gọi là sự khác biệt nhỏ nhất có thể thấy được (Just Noticeable
Difference - JND). Minh họa như hình bên dưới:

JND

Hình 1.1 - Ngưỡng biến đổi nhỏ nhất mà con người cảm nhận được
với các độ chói I khác nhau
1.1.2. Nhạy cảm về độ chói
Giá trị ngưỡng để đủ tìm một nhiễu trên một nền sẽ nhận giá trị bất biến.
Đối với mắt người đó là một hàm không tuyến tính và phụ thuộc vào thuộc
tính của ảnh. Weber chỉ ra rằng, mắt người nhạy cảm với các mức cường độ
thấp và giảm nhanh với các mức cường độ cao. Thêm vào đó là sự phụ thuộc
vào cường độ của các vùng xung quanh của vùng đang được kiểm tra. Theo
đó, nếu cường độ của các vùng xung quanh tăng, sẽ kéo theo cường độ tương
đối trong vùng tối giảm.
1.1.3. Nhạy cảm về tần số
Không gian tần số cũng có ảnh hưởng đáng lưu ý đến sự nhạy cảm của
mắt người. Mắt người nhạy cảm với các sóng hình sin với các tần số khác
nhau. Sự nhạy cảm này chỉ phụ thuộc vào chức năng truyền sự điều biên của
mắt và không phụ thuộc vào dữ liệu ảnh. Mắt người rất nhạy cảm với các

nhiễu ở tần số thấp và không nhạy cảm với các nhiễu ở tần số cao. Mắt người
phản ứng không đồng nhất với các tần số khác nhau, một ví dụ đơn giản là
mắt người sẽ nhạy cảm hơn ở các vùng đối lập cao và các vùng góc cạnh.

6


Đối với hệ thống thị giác người, có ba dạng của sự đáp ứng tần số. Thứ
nhất là các tần số không gian (spatial frequencies), thứ hai là các tần số quang
phổ (spectral frequencies) và thứ ba là các tần số thời gian (temporal
frequencies).
Các tần số thời gian được nhận biết như là các mẫu kết cấu. Sự đáp ứng
tần số thời gian thường được mô tả bằng sự nhạy cảm với sự tương phản về
độ chói như là một hàm của tần số thời gian. Nó được gọi là hàm nhạy cảm
tương phản (contrast sensitivity function – CSF). Một ví dụ được mô tả trong
hình 1.2:

Hình 1.2 - Hàm nhạy cảm tương phản dựa trên mẫu của Mannos và Sakrison
Hình trên chỉ ra rằng mắt người nhạy cảm nhất với sự khác nhau về độ
chói ở dải tần số giữa và ít nhạy cảm với dải tần số cao hoặc thấp. Các mẫu
tần số không gian hai chiều được biểu diễn bởi hướng và độ lớn của chúng.
Các nghiên cứu đã chỉ ra rằng: mắt người không chỉ phụ thuộc vào tần số của
các mẫu khác nhau mà còn phụ thuộc vào hướng của chúng. Cụ thể, mắt

7


người nhạy cảm nhất với các đường, các cạnh ngang và dọc, và ít nhạy cảm
nhất với các đường, các cạnh có hướng 45 độ.
Các tần số quang phổ được mắt người nhận biết như là màu sắc. Mức cơ

bản nhất của hệ thống màu của hệ thống thị giác người gồm ba màu cơ bản:
Đỏ (Red), Xanh lá cây (Green) và Xanh da trời (Blue). Sự đáp ứng của mắt
người với ba màu trên được minh họa như hình 1.3:

Hình 1.3 - Sự cảm nhận ba màu của thị giác người
Từ hình ta thấy, mắt người kém nhạy cảm với kênh màu xanh da trời
(Blue channel) hơn hai kênh còn lại. Vì lý do này mà nhiều hệ thống thủy vân
số nhúng lượng thông tin nhiều nhất vào kênh màu xanh da trời.
Các tần số thời gian được nhận biết như là sự chuyển động. Hình 1.4 chỉ
ra một thí nghiệm đo sự đáp ứng của mắt người với nhiều tần số thời gian
khác nhau. Kết quả chỉ ra rằng độ nhạy cảm của mắt người giảm nhanh với
các tần số trên 30Hz. Điều này giải thích vì sao trong truyền hình, tỉ lệ khung
hình trên giây (frame/sec) không vượt quá mức 60.
8


Hình 1.4 - Độ nhạy cảm của mắt người với các tần số thời gian khác nhau
1.1.4. Mặt nạ thị giác
Ngữ cảnh ảnh hưởng đến nhận thức. Do vậy, mặc dù chúng ta có thể
nghe một âm thanh riêng biệt rất rõ ràng, nhưng lại không thể khi có một âm
thanh khỏe cùng tần số nhưng lớn hơn. Cũng vậy, một cấu trúc (texture) có
thể nhìn được rõ ràng khi nó đứng biệt lập, nhưng lại rất khó phát hiện khi
được nhúng vào một ảnh có cấu trúc cao. Người ta gọi đó là hiện tượng sự
hiện diện của một tín hiệu có thể ẩn hay che đi sự hiện diện của một tín hiệu
khác, hay “mặt nạ” – masking. Hình 1.5 dưới đây so sánh hai ảnh: ảnh ban
đầu và ảnh được nhúng thủy vân tần số thấp. Mặc dù thủy vân nhúng vào
phần bầu trời và phần núi là đồng nhất, chúng ta lại rất dễ nhận ra sự thay đổi
của phần bầu trời so với ảnh cũ, trong khi rất khó nhận ra sự thay đổi ở phần
núi.


9


a. Ảnh ban đầu

b. Ảnh sau khi nhúng thủy vân
Hình 1.5 - So sánh ảnh ban đầu và ảnh đó nhúng thủy vân
Mặt nạ thị giác là hiện tượng trực giác mà khung của ảnh bị che bởi ảnh.
Ảnh được coi là tín hiệu nền mà làm giảm khả năng nhìn thấy khung của ảnh.
Với một ảnh bị biến đổi bởi nhiễu cộng, chúng ta có thể thấy rằng nhiễu dễ
dàng nhìn thấy ở vùng bằng phẳng, không gồ ghề, hơn là các vùng góc cạnh,
có cấu trúc.

10


Có nhiều hiện tượng mặt nạ. Với hệ thống thị giác, có hai trường hợp cơ
bản là mặt nạ tần số và mặt nạ độ chói. Với mặt nạ tần số, sự hiện diện của
một tần số che đi sự nhận biết sự hiện diện của một tần số khác. Với mặt nạ
độ chói, độ chói địa phương che đi sự thay đổi tương phản.
1.1.5. Kết luận
Từ việc nghiên cứu hệ thống thị giác người, ta rút ra được một số điểm
lợi ích để thủy vân số cho ảnh:
- Tần số cao ít được thấy hơn các tần số thấp.
- Để việc nhúng thủy vân được tốt, sự biến đổi phải nằm trong ngưỡng
cho phép, nghĩa là nhỏ hơn ngưỡng JND (ngưỡng mà sự thay đổi nhỏ hơn
ngưỡng này hầu như không nhận biết được).
- Nhúng thủy vân vào các thành phần màu xanh da trời (Blue) sẽ khó bị
phát hiện hơn vào các thành phần màu khác.
1.2. Các không gian màu

Ảnh số được tạo nên bởi ma trận các điểm ảnh, mỗi điểm ảnh lại mang
một màu, màu này là sự hòa trộn của các màu cơ bản. Việc tìm hiểu về các
không gian màu sẽ hỗ trợ cho các kỹ thuật thủy vân số.
Không gian màu (color space) được đưa ra để định các màu hiển thị trên
máy tính bởi vì chúng làm đơn giản hóa các thao tác tính toán cần thiết cho
việc chuyển đổi màu sắc (color transformation). Không gian màu có thể được
thiết kế hoặc là dựa trên cơ sở của bộ phát sinh màu của phần cứng (hardware
color generation) (ví dụ như không gian RGB) hoặc là dựa trên sự cảm nhận
màu sắc của mắt (như không gian HSL). Với một ứng dụng, việc chọn không
gian màu nào để sử dụng tùy thuộc vào một số nhân tố sau: độ chính xác mà
các nhà thiết kế cần kiểm soát màu sắc (color control), và yêu cầu về sự tương
tác giữa các màu sắc và tốc độ các tính toán cho ứng dụng đó.

11


1.2.1. Không gian RGB
Không gian RGB mô tả màu sắc bằng ba thành phần: Đỏ (Red), Xanh lá
cây (Green), Xanh da trời (Blue). Không gian màu này được mô tả như hình
dưới:
G
Grayscale

1

Green
(0,1,0)

Cyan
(0,1,1)


Yellow
(1,1,0)

White
(1,1,1)

1
Black
(0,0,0)

1
Blue
(0,0,1)

Red
(1,0,0)

R

Magenta
(1,0,1)

B

Hình 1.6 - Không gian màu RGB
Mỗi màu trong không gian RGB được biểu diễn như một vector thông
qua ba vector cơ sở là Red, Green, Blue. Do đó, ứng với tổ hợp khác nhau của
ba màu này sẽ cho ta một màu mới. Ví dụ: màu vàng được tạo bởi tổ hợp hai
màu đỏ và xanh lá cây, màu trắng được tạo bởi tổ hợp ba màu,…

- Ưu điểm: Việc sử dụng không gian RGB có một số lợi ích:
 Không gian RGB là chuẩn công nghiệp cho các thao tác đồ họa máy
tính. Các thao tác màu sắc có thể được tính toán trên các không gian màu
khác nhưng cuối cùng cần phải chuyển về không gian RGB để có thể
hiển thị trên màn hình (do thiết kế của phần cứng dựa trên mô hình
RGB).
 Có thể chuyển đổi qua lại giữa không gian RGB với các không gian
màu khác như CMY, HSL, HSV, ...
 Các thao tác tính toán trên không gian RGB thường đơn giản hơn.

12


- Nhược điểm:
 Các giá trị RGB của một màu là khác nhau đối với các màn hình khác
nhau: Nghĩa là các giá trị RGB của màu trên màn hình màu này sẽ không
sinh ra đúng màu đó trên một màn hình khác.
 Sự mô tả các màu trong thế giới thực đối với không gian RGB còn
nhiều hạn chế bởi vì không gian RGB không hoàn toàn phù hợp với sự
cảm nhận màu sắc của con người. Hai điểm phân biệt trong không gian
RGB, với mắt người có thể hoặc không thể là thể hiện của hai màu khác
nhau. Chính vì điều này mà không gian RGB không thể ánh xạ trực tiếp
đến bất cứ chiều cảm nhận nào khác (như độ bão hòa - saturation, độ
sáng - lightness) ngoài hue (sắc độ).
1.2.2. Không gian HSV
Không gian RGB là màu mà mắt con người cảm nhận ánh sáng chứ
không phải màu mà mắt người cảm nhận màu sắc. Mặc dù không gian RGB
biểu diễn chính xác cái mà màn hình cần hiển thị cho mắt người, nhưng nó lại
không phải là mô hình tốt để người sử dụng biểu diễn một màu cụ thể khi họ
suy nghĩ. Ví dụ, sẽ rất khó cho người dùng khi họ muốn biết giá trị R, G, B để

biểu diễn màu tía. Không gian màu HSV ra đời cải thiện yếu điểm của mô
hình RGB, việc tạo ra một màu mới của nó dựa trên quy tắc pha màu của các
họa sĩ. Do vậy, không gian màu RGB gần với sự cảm nhận màu sắc của mắt
người hơn. Không gian màu HSV được minh họa như hình dưới:

13


Hình 1.7 - Không gian HSV
Trong đó:
 H (Hue): bước sóng gốc của ánh sáng, được biểu diễn bằng góc nằm
trong khoảng 0 - 360 độ.
 V (Value): cường độ hay độ chói của ánh sáng, có giá trị trong khoảng
[0,1].
 S (Saturation): độ tinh khiết của ánh sáng gốc, có giá trị trong khoảng
[0,1].
- Ưu điểm:
 Không gian HSV dễ dàng đáp ứng các màu sắc của các chương trình
đồ họa do được xây dựng dựa trên sự bắt chước luật trộn màu của người
họa sĩ.
 Do không cần sử dụng các phép biến đổi lượng giác khi muốn chuyển
sang không gian RGB nên không gian HSV có nhiều thuận lợi về mặt
tính toán hơn so với không gian HSL.
- Nhược điểm:
Cần có các phép hiệu chỉnh gamma.

14


1.2.3. Không gian CMY

Không gian màu CMY được xác định bởi ba màu cơ sở Cyan, Magenta
và Yellow dành cho máy in màu. Không gian màu CMY thuộc loại mô hình
trừ, trong khi RGB thuộc loại mô hình cộng. Nghĩa là với không gian màu
RGB, một màu được tạo ra bằng cách thêm vào màu đen (giá trị RGB là
0,0,0) một tổ hợp các màu cơ sở để tạo màu mới, ví dụ màu vàng (giá trị RGB
là 1,1,0). Trong khi với không gian màu CMY, một màu được tạo ra bằng
cách loại bỏ từ ánh sáng trắng. Hình bên dưới minh họa và so sánh giữa
không gian màu RGB và CMY.

R
M
W
B

C

C
B

Y

K
G

M

R

G


Y

Hình 1.8 - RGB và CMY
Công thức biến đổi màu từ RGB sang CMY:
C 
 
M  =
Y 
 

 1
R
 
 
 1 -  G 
 1
B
 
 

Ưu điểm nổi bật của không gian màu CMY đó là khả năng cho phép in
những ảnh màu với độ phân giải và chất lượng sắc nét hơn nhiều so với ảnh
màu dùng không gian màu RGB.
1.2.4. Không gian YCbCr
Không gian YCbCr xuất phát từ không gian màu YUV, một chuẩn
không gian màu để xây dựng chuẩn video số. Không gian YUV quy định một

15



không gian màu được tạo bởi độ sáng Y và hai thành phần màu. Cụ thể với
không gian YCbCr thì Cb là màu blue/yellow, và Cr là màu red/green.
Công thức chuyển đổi giữa không gian YCbCr và RGB:
Y 
 0.299 0.587 0.114   R 
 

 
 Cb  =  0.147 0.289 0.436   G 
 Cr 
 0.615 0.515 0.100   B 
 

 

Ưu điểm của không gian YCbCr là tín hiệu trong không gian này có thể
được xử lý để loại bớt một số thông tin. Do vậy, không gian màu này được sử
dụng phổ biến trong kỹ thuật nén, như nén ảnh JPEG hay nén video MPEG.
1.3. CẤU TRÚC MỘT SỐ LOẠI ẢNH THÔNG DỤNG
1.3.1. Biểu diễn ảnh trên máy tính
a. Khái niệm ảnh số
Ảnh trong thực tế là ảnh liên tục về không gian và về giá trị độ sáng.
Một ảnh có thể được định nghĩa là một hàm hai chiều f(x,y), trong đó x và y là
tọa độ trong không gian, và biên độ của hàm f tại bất kỳ cặp tọa độ (x, y) nào
được gọi là cường độ của ảnh tại điểm đó. Khái niệm cấp xám thường được
sử dụng để đề cập đến cường độ của ảnh đơn sắc. Ảnh màu được tạo thành từ
sự kết hợp của các ảnh 2D riêng biệt. Ví dụ, trong hệ thống màu RGB, một
ảnh màu là sự phối hợp của ba thành phần màu (đỏ, xanh lá cây, xanh da trời)
riêng biệt. Chính vì lý do này, rất nhiều kỹ năng áp dụng với ảnh đơn sắc
cũng có thể áp dụng với ảnh màu bằng cách xử lý ba thành phần ảnh riêng

biệt.
Chuyển đổi một ảnh thông thường sang dạng số yêu cầu tọa độ không
gian cũng như biên độ của ảnh đó phải được số hóa, nghĩa là các tín hiệu liên
tục được biến đổi thành các tín hiệu rời rạc thông qua quá trình lấy mẫu
(sampling – rời rạc hóa về không gian) và lượng tử hóa (quantization –
chuyển đổi tín hiệu tương tự dang tín hiệu số) các thành phần của ảnh mà về
nguyên tắc bằng mắt thường không thể phân biệt được hai điểm kề nhau. Do

16


đó, khi các giá trị x, y và biên độ của hàm f là xác định, mang giá trị rời rạc,
ta gọi một ảnh là ảnh số.
Sau quá trình lấy mẫu và lượng tử hóa, ta thu được một ma trận số thực
gồm M hàng và N cột. Một giá trị (x,y) của ma trận được gọi là một điểm ảnh
(pixel hay pel), mỗi điểm ảnh được xác định bởi tọa độ và màu. Như vậy, một
ảnh số là tập hợp nhiều điểm ảnh, ta nói ảnh gồm MxN điểm ảnh.
b. Các loại ảnh số
Căn cứ vào phương pháp xử lý dữ liệu trong hệ thống, người ta phân biệt
thành hai hệ thống: đồ họa vector (Geometry Based Graphic) và đồ họa điểm
(Sample Based Graphic). Ảnh biểu diễn trên máy tính vì vậy cũng được chia
thành hai loại: ảnh mành và ảnh vector.
 Ảnh mành
Ảnh mành được lưu trữ theo ma trận các điểm ảnh. Để tạo được ảnh
mành, người ta có thể dùng phần mềm vẽ trực tiếp từng điểm ảnh (như phần
mềm Paint) hoặc số hóa các ảnh thu từ các thiết bị quang học (như sử dụng
phần mềm Photoshop).
Đặc điểm của ảnh mành:
- Có thể dễ dàng thay đổi trực tiếp thuộc tính các điểm, thay đổi từng
phần và từng vùng ảnh.

- Dễ dàng sao chép các điểm ảnh từ hình này sang hình khác.
- Vì đơn vị biểu diễn là các điểm ảnh, nên ảnh mành cho phép thực hiện
các phép toán trên các bit của nó.
Các thành phần của ảnh mành:
- Tiêu đề đầu (Header): thông tin về ảnh, thường lưu cấu trúc của ảnh
dưới dạng nhị phân hay mã ASCII.
- Bảng màu (Pallette): Là mảng một chiều, chứa chỉ mục các màu của
ảnh. Mỗi điểm ảnh có lưu con trỏ đến chỉ mục trên bảng màu. Kích thước của

17


bảng màu được tính từ độ sâu điểm ảnh (pixel depth). Bảng màu có thể được
sắp xếp theo thứ tự gam màu hoặc theo độ chói.
- Dữ liệu (Data): nội dung của ảnh, nằm ngay sau phần bảng màu, chứa
giá trị màu của điểm ảnh.
- Tiêu đề cuối (Footer): chứa một số thông tin đặc biệt như tính tương
thích với các phiên bản cũ.
 Ảnh vector
Trong kỹ thuật đồ họa vector, người ta chỉ lưu trữ mô tả toán học của các
thành phần trong mô hình hình học cùng với các thuộc tính tương ứng của nó
mà không lưu lại toàn bộ các điểm ảnh.
Đặc điểm của ảnh vector:
- Không cho phép thay đổi thuộc tính của từng điểm ảnh riêng biệt trực
tiếp mà phải xử lý với từng thành phần hình học cơ sở.
- Cho phép quan sát ảnh ở nhiều góc độ khác nhau một cách dễ dàng
bằng cách thay đổi điểm nhìn và góc nhìn.
Các thành phần của ảnh vector:
- Tiêu đề đầu (Header): Lưu trữ cấu trúc của ảnh, kích thước tiêu đề phụ
thuộc loại dữ liệu lưu trữ.

- Dữ liệu (Data): Công thức toán học biểu diễn các thành phần đối tượng.
- Tiêu đề cuối (Footer): Lưu số lượng các đối tượng trong ảnh.
1.3.2. Cấu trúc một số định dạng ảnh thông dụng
a. Ảnh bitmap (BMP)
Ảnh bitmap (hay Windows bitmap) được phát triển bởi Microsoft
Corporation, được lưu trữ dưới dạng độc lập thiết bị cho phép Windows hiển
thị dữ liệu không phụ thuộc vào khung chỉ định màu trên bất kỳ phần cứng
nào. Các ảnh bitmap thường được lưu trữ với phần mở rộng phổ biến .bmp
(hoặc dạng ít gặp hơn là .dib – device independent bitmap).
Cấu trúc một ảnh bitmap gồm bốn phần:

18


×