Tải bản đầy đủ (.pdf) (53 trang)

nghiên cứu phương pháp định danh bản quyền tác giả trên dữ liệu ảnh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.45 MB, 53 trang )


























ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ


Lê Ngọc Việt



NGHIÊN CỨU PHƢƠNG PHÁP ĐỊNH DANH BẢN
QUYỀN TÁC GIẢ TRÊN DỮ LIỆU ẢNH






KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY

Ngành: Công nghệ thông tin












HÀ NỘI - 2010






























ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ


Lê Ngọc Việt



NGHIÊN CỨU PHƢƠNG PHÁP ĐỊNH DANH BẢN
QUYỀN TÁC GIẢ TRÊN DỮ LIỆU ẢNH






KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY

Ngành: Công nghệ thông tin

Cán bộ hƣớng dẫn: ThS. Nguyễn Thị Hậu












HÀ NỘI - 2010
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh



- i -
Lời cám ơn
Trước hết tôi xin gửi lời cám ơn đến toàn thể các thầy cô giáo trường Đại học công
nghệ Đại học Quốc gia Hà Nội đã giúp đỡ và chỉ bảo tôi trong suốt quá trình học tập ở
trường. Đặc biệt tôi xin gửi lời cám ơn sâu sắc đến cô Nguyễn Thị Hậu đã chỉ bảo hướng
dẫn tôi từ bước chọn đề tài, đến nghiên cứu và tạo điều kiện tốt nhất cho tôi trong quá
trình làm khóa luận.
Đồng thời tôi cũng xin cảm ơn những người bạn đã luôn bên cạnh, chia sẻ giúp đỡ
và động viên tôi trong suốt quá trình nghiên cứu và học tập.
Cuối cùng, tôi xin bày tỏ niềm biết ơn vô hạn tới bố mẹ, chị tôi, và những người
bạn thân luôn bên cạnh, động viên tôi trong suốt quá trình thực hiện khóa luận tốt nghiệp.
Hà Nội, 17/05/2010
Sinh viên: Lê Ngọc Việt












Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh


- ii -
Tóm tắt nội dung

Trong thời đại kỷ nguyên số, thông tin số được sử dụng rộng rãi trong môi trường
mở: tài nguyên được phân phối cho nhiều người sử dụng, thì nhu cầu được bảo vệ bản
quyền sở hữu trí tuệ các sản phẩm số đã trở thành một vấn đề quan trọng và được nhiều
cơ sở nghiên cứu quan tâm. Thủy vân số hay nhúng thủy vân được đánh giá mang lại
nhiều hứa hẹn trong ứng dụng bảo vệ bản quyền, phát hiện xuyên tạc, kiểm soát truy cập
đối với dữ liệu đa phương tiện.
Không giống như các hệ mật mã được sử dụng cho truyền thống và không ngăn
cấm được người dùng sử dụng trái phép những dữ liệu, các phương pháp thủy vân hứa
hẹn một giải pháp cho vấn đề bảo vệ bản quyền đối với sản phẩm số khi mà sản phẩm đó
được sử dụng trong môi trường mở và không cần đến việc mã hóa. Tạo thủy vân là một
phương pháp nhúng một lượng thông tin nào đó vào trong dữ liệu đa phương tiện cần
được bảo vệ sở hữu và không để lại ảnh hưởng đến chất lượng của sản phẩm. Thủy vân
phải tồn tại bền vững với sản phẩm số và không thể loại bỏ bằng bất kì những tấn công có
chủ đích hay không chủ đích nào trừ khi phá hủy sản phẩm.
Trong phạm vi khóa luận này, tôi xin đưa ra một số phương pháp thủy vân số mà
tôi nghiên cứu cho dữ liệu ảnh như BMP (bitmap), JPG (JPEG),…,và cách xử lý ảnh màu,
cách nén ảnh chuẩn JPEG… Và tôi cũng xây dựng được một ứng dụng cho việc xác định
bản quyền tác giả trên dữ liệu ảnh sử dụng phương pháp DCT đề cập trong khóa luận.
Đồng thời nội dụng khóa luận đề cập tới một số thử nghiệm đánh giá hiệu quả của ứng
dụng đã xây dựng được.
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh


- iii -
Mục lục
Lời cám ơn i
Tóm tắt nội dung ii
Bảng các kí hiệu và chữ viết tắt iv
Mục lục các hình vẽ v
Mở đầu 7

Chương 1: Giới thiệu về ẩn – giấu tin 8
1.1. Khái niệm về ẩn - giấu tin. 8
1.2. Phân loại kỹ thuật giấu tin: 8
1.3. Mô hình giấu tin cơ bản: 10
1.4. Tính chất của ẩn giấu tin trong ảnh. 12
Chương 2: Kỹ thuật thủy vân số 14
2.1. Khái niệm về thủy vân số. 14
2.2. Phân loại thủy vân số. 15
2.3. Mô hình thủy vân số: 16
2.4. Các khuynh hƣớng tiếp cận của kỹ thuât thủy vân số. 18
2.5. Một số ứng dụng 26
2.6. Yêu cầu về chất lƣợng ảnh của thủy vân số: 26
Chương 3: Phát triển ứng dụng. 28
3.1. Các chức năng chính: 28
3.2. Hƣớng giải quyết bài toán 28
3.3. Giới thiệu về các module: 34
3.4. Giao diện chƣơng trình 38
3.5. Môi trƣờng lập trình. 41
Chương 4: Thực nghiệm đánh giá 43
4.1. Cài đặt: 43
4.2. Chất lƣợng ảnh. 43
4.3. Độ bền vững của thông tin. 46
4.4. Một số hạn chế của hệ thống: 48
Kết luận 49
Các thuật ngữ tiếng anh 50
Tài liệu tham khảo 51
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh


- iv -


Bảng các kí hiệu và chữ viết tắt

Kí hiệu
Diễn giải
LSB
Least Significant Bit
DFT
Discrete Fourier Transform
IDFT
Inverse Discrete Fourier Transform
DCT
Discrete Cosine Transform
IDCT
Inverse Discrete Cosine Transform
DWT
Discrete Wavelet Transform
IDWT
Inverse Discrete Wavelet Transform



Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh


- v -
Mục lục các hình vẽ
Hình 1.1: Sơ đồ phân loại kỹ thuật giấu tin 8
Hình 1.2: Lược đồ chung cho quá trình giấu tin 11
Hình 1.3: Lược đồ chung cho quá trình giải mã 12

Hình 2.1: Ví dụ về thủy vân số 14
Hình 2.2: Sơ đồ phân loại các loại thủy vân số. 15
Hình 2.3: Mô hình thủy vân số 16
Hình 2.4: Mô hình nhúng thủy vân số 17
Hình 2.5: Mô hình tách thủy vân số 17
Hình 2.6 Sơ đồ phân chia 3 miền tần số của phép biến đổi DCT 22
Hình 2.7: ảnh jpeg 22
Hình 2.8 Sơ đồ miền tần số của ảnh 22
Hình 2.9: Mô hình DWT trên miền màu đỏ (Red) của khối ảnh RGB mxn 23
Hình 2.10: Mô hình IDWT của ảnh RGB 24
Hình 2.11: Mô hình nhúng thủy vân số trên miền DWT 25
Hình 3.1 Mô hình nhúng thủy vân trên miền DCT 29
Hình 3.2: Mô hình tách thủy vân. 30
Hình 3.3 Các bước của quá trình mã hóa biến đổi DCT đối với một khối 31
Hình 3.4: Ma trận lượng tử 32
Hính 3.5:Mô hính tương tác module thủy vân hiện 34
Hình 3.6:Mô hình tương tác module nhúng thủy vân ẩn 35
Hình 3.7: Mô hình tương tác module tách thủy vân ẩn 36
Hình 3.8: Giao diện chính của ứng dụng 37
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh


- vi -
Hình 3.9: Giao diện thủy vân hiện 38
Hình 3.10: Mô tả thành phần của .NET Framework 41
Hình 4.1: Ảnh gốc trước khi thủy vân hiện 42
Hình 4.2: Ảnh sau khi thủy vân 43

Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh



- 7 -
Mở đầu
Trong thời đại bùng nổ thông tin với sự phát triển nhanh chóng của khoa học kỹ
thuật trên nhiều lĩnh vực đặc biệt là trong lĩnh vực đa phương tiện (multimedia) hỗ trợ đắc
lực cho sự sản xuẩt, quản lý và phân phối các sản phẩm đa phương tiện như: hình ảnh, âm
thanh… và khiến chúng trở lên rất dễ dàng. Đặc biệt với sự phát triển mạnh mẽ của
Internet đã làm cho quá trình phân phối các sản phầm này trở nên rất nhanh chóng. Và
chính điều này đã đặt ra vấn đề là làm sao bảo vệ bản quyền sở hữu đối vơi các sản phẩm
đa phương tiện này.
Một trong những phương pháp được dùng rất sớm để bảo vệ quyền sở hữu đối với
các sản phẩm đa phương tiện là dùng phương pháp mã hóa. Các sản phẩm được mã hóa
và gửi cho người dùng. Người dùng chỉ đọc được các sẩn phẩm này khi mà nhận được
khóa để giải mã đi kèm. Phương pháp mã hóa này chỉ hiệu quả trong việc truyền dữ liệu
đa phương tiện nhưng không hiệu quả trong việc bảo vệ bản quyền sở hữu vì người dùng
sau khi giải mã thì sẽ nhân bản và phân phối lại sản phẩm đó.
Chính điểu đó mà chúng ta cần phải xây dựng một phương pháp tốt hơn để giải
quyết vấn đề này. Và thủy vân số là một trong những giải pháp được đưa ra để giải quyết
vấn đề về bản quyến sở hữu. Trong phạm vi khóa luận đã đi vào nghiên cứu các phương
pháp để giải quyết vấn đề đó. Mục tiêu của khóa luận là không chỉ nghiên cứu các
phương pháp xác thực bản quyền tác giả trên dữ liệu ảnh sử dụng thủy vân số mà còn xây
dựng một hệ thống thực nghiệm sử dụng một trong nhưng kỹ thuật thủy vân được nghiên
cứu trong khóa luận.
Ngoài phần Mở đầu và Kết luận, kết cấu của khóa luận bao gồm các chương sau:
 Chƣơng 1: Giới thiệu về ẩn giấu tin. Nêu ra các khái niệm cơ bản nhất về
ẩn giấu tin và ứng dụng trong thực tế.
 Chƣơng 2: Giới thiệu về thủy vân số. Nghiên cứu phân tích một số thuật
toán thủy vân số hiện nay đang được phổ biến. Tìm hiểu ưu nhược điểm của
từng thuật toán.
 Chƣơng 3: Hướng giải quyết và đề xuất mô hình bài toán. Miêu tả chi tiết

thuật toán sử dụng và môi trường phát triển ứng dụng
 Chƣơng 4: Kết quả thực nghiệm và đánh giá. Đưa ra kết quả đã làm được
và đánh giá kết quả.







Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh


- 8 -

Chƣơng 1: Giới thiệu về ẩn – giấu tin
1.1. Khái niệm về ẩn - giấu tin.
Hiện nay có rất nhiều cách định nghĩa khác nhau về ẩn giấu tin như:
 Theo tác giả Trịnh Nhật Tiến thì: Ẩn giấu tin (steganography) được hiểu là
nhúng mẩu tin mật vào một vật mang tin khác, sao cho khó phát hiện ra mẩu
tin đó, mặt khác nhận biết được vật mang tin đã được giấu một tin mật.
[1]

 Theo một số tác giả khác: Ẩn giấu tin là một kỹ thuật nhúng (giấu) một lượng
thông tin số nào đó vào trong một đối tượng dữ liệu số khác (giấu thông tin
chỉ mang tính quy ước không phải là một hành động cụ thể).
[2]

Như vậy. Ẩn giấu tin là một kỹ thuật nhúng các mẩu tin vào một đối tượng mang tin
sao cho khó có thể phát hiện ra tin mật đó.

1.2. Phân loại kỹ thuật giấu tin:
Phân loại theo khuynh hƣớng:

Hình 1.1: Sơ đồ phân loại kỹ thuật giấu tin
Trong kỹ thuật giấu tin nhằm mục đích an toàn và bảo mật thông tin ở hai
khía cạnh:
 Bảo mật dữ liệu đem giấu.
 Bảo mật cho chính đối tượng được dùng để giấu tin.
Từ hai khía cạnh trên dần dần hình thành hai khuynh hướng chủ yếu của giấu tin là:
1. Giấu tin (Steganography) là kỹ thuật nhúng tin mật vào môi trường giấu
tin.
Theo khuynh hướng này tập trung vào các kỹ thuật giấu tin sao cho thông tin giấu
được càng nhiều càng tốt và quan trọng là người khác khó phát hiện được một đối tượng
có bị giấu tin bên trong hay không bằng kỹ thuật thông thường.
Infomation
hiding
Giấu thông tin
Steganography
Giấu tin mật
Watermarking
Thuỷ vân số
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh


- 9 -
2. Thủy vân số (kỹ thuật đánh dấu số) là kỹ thuật nhúng dấu ấn số vào một tài
liệu hoặc sản phẩm, nhằm chứng thực nguồn gốc hay chủ sở hữu.
So sánh giữa giấu tin và thủy vân số
[1]
:


Giấu tin
Thủy vân số
- Mục đích là bảo vệ thông tin
được giấu.
- Giấu được càng nhiều thông
tin càng tốt, ứng dụng trong truyền
dữ liệu thông tin mật.
- Thông tin được giấu phải ẩn,
không cho người khác thấy được
bằng mắt thường.
- Chỉ tiêu quan trọng nhất là
dung lượng của tin được giấu.
- Mục đích là bảo vệ môi trường
giấu tin.
- Chỉ cần thông tin đủ để đặc
trưng cho bản quyền của chủ sở hữu.

- Thông tin giấu có thể ẩn (thủy
vân ẩn) hoặc hiện (thủy vân hiện).
- Chỉ tiêu quan trọng nhất là tính
bền vững của tin được giấu.

Phân loại theo môi trƣờng giấu tin:
a. Giấu tin trong Audio
Kỹ thuật giấu thông tin trong audio phụ thuộc vào hệ thống thính giác của con
người (HAS – Human Auditory System). HAS cảm nhận được tín hiệu ở dải tần rộng và
công suất thay đổi lớn, nhưng lại kém trong việc phát hiện sự khác biệt nhỏ giữa dải tần
và công suất. Điều này có nghĩa là các âm thanh to, cao tần có thể che giấu được các âm
thanh nhỏ thấp một cách dễ dàng. Kênh truyền tin cũng là một vấn đề. Kênh truyền hay

băng thông chậm sẽ ảnh hưởng đến chất lượng thông tin sau khi giấu. Giấu thông tin
trong audio yêu cầu rất cao về tính đồng bộ và tính an toàn của thông tin.
b. Giấu tin trong video
Giấu tin trong video cũng được quan tâm và được phát triển mạnh mẽ cho nhiều
ứng dụng như điều khiển truy cập thông tin, nhận thực thông tin và bảo vệ bản quyền tác
giả. Ta có thể lấy một ví dụ là hệ thống chương trình trả tiền xem theo video clip của các
thuật toán trước đây thường cho phép giấu ảnh vào trong video, nhưng gần đây kỹ thuật
cho phép giấu cả âm thanh và ảnh vào trong video.
c. Giấu tin trong ảnh
Giấu thông tin trong ảnh hiện nay chiếm tỷ lệ lớn nhất trong các chương trình ứng
dụng, các phần mềm, và hệ thống giấu tin trong đa phương tiện bởi lượng thông tin trao
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh


- 10 -
đổi được trao đổi bằng ảnh là rất lớn. Hơn nữa giấu thông tin trong ảnh cũng đóng vai trò
hết sức quan trọng đối với hầu hết các ứng dụng bảo vệ an toàn thông tin như: nhận thực
thông tin, xác định xuyên tạc thông tin, bảo vệ bản quyền tác giả, điều khiển truy cập,
giấu thông tin mật… Chính vì thế mà vấn đề này đã nhận được sự quan tâm rất lớn của
các cá nhân, tổ chức, trường đại học, và các viện nghiên cứu trên thế giới.
Thông tin sẽ được giấu cùng với dữ liệu ảnh nhưng chất lượng ảnh ít thay đổi và
chẳng ai biết được đằng sau ảnh đó mang những thông tin có ý nghĩa. Ngày nay, khi ảnh
số đã được sử dụng rất phổ biến, thì giấu thông tin trong ảnh đã đem lại rất nhiều những
lợi ích quan trọng trên nhiều lĩnh vực của đời sống xã hội.
Ví dụ như đối với các nước phát triển, chữ kí tay đã được số hoá và lưu trữ sử dụng
như là hồ sơ cá nhân của các dịch vụ ngân hàng và tài chính, nó được dùng để nhận thực
trong các thẻ tín dụng của người tiêu dùng. Phần mềm MS Word của MicroSoft cũng cho
phép người dùng lưu trữ chữ kí trong ảnh nhị phân rồi gắn vào vị trí nào đó trong file văn
bản để đảm bảo tính an toàn của thông tin. Tài liệu sau đó được truyền trực tiếp qua máy
fax hoặc lưu truyền trên mạng. Theo đó, việc nhận thực chữ kí, xác thực thông tin đã trở

thành một vấn đề cực kì quan trọng khi mà việc ăn cắp thông tin hay xuyên tạc thông tin
bởi các tin tặc đang trở thành một vấn nạn đối với bất kì quốc gia nào, tổ chức nào. Thêm
vào đó, lại có rất nhiều loại thông tin quan trọng cần được bảo mật như những thông tin
về an ninh, thông tin về bảo hiểm hay các thông tin về tài chính, các thông tin này được số
hoá và lưu trữ trong hệ thống máy tính hay trên mạng, chúng rất dễ bị lấy cắp và bị thay
đổi bởi các phần mềm chuyên dụng.
1.3. Mô hình giấu tin cơ bản:
Giấu thông tin vào phương tiện chứa và tách lấy thông tin là hai quá trình trái ngược
nhau.
a. Giấu thông tin vào phương tiện chứa
Qui trình giấu thông tin vào phương tiện chứa được mô tả qua sơ đồ khối hình 1.2
trong đó:
- Thông tin cần giấu tuỳ theo mục đích của người sử dụng, nó có thể là thông
điệp (với các tin bí mật) hay các logo, hình ảnh bản quyền.
- Phương tiện chứa: các file ảnh, text, audio… là môi trường để nhúng tin
- Bộ nhúng thông tin: là những chương trình thực hiện việc giấu tin
- Đầu ra: là các phương tiện chứa đã có tin giấu trong đó

Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh


- 11 -

Hình 1.2: Lược đồ chung cho quá trình giấu tin
[1][2][7]
b. Tách thông tin:
Tách thông tin từ các phương tiện chứa diễn ra theo quy trình ngược lại với đầu ra là
các thông tin đã được giấu vào phương tiện chứa. Phương tiện chứa sau khi tách lấy thông
tin có thể được sử dụng, quản lý theo những yêu cầu khác nhau.


Thông tin giấu
Môi trường
chứa(audio, ảnh,
video)
Môi trường chứa
đã được giấu tin
Khóa giấu tin
Bộ
nhúng
thông tin
Phân
phối
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh


- 12 -

Hình 1.3: Lược đồ chung cho quá trình giải mã
[1][2][7]
Hình vẽ 1.3 chỉ ra các công việc giải mã thông tin đã giấu. Sau khi nhận được đối
tượng phương tiện chứa có giấu thông tin, quá trình giải mã được thực hiện thông qua
một bộ giải mã tương ứng với bộ nhúng thông tin cùng với khoá của quá trình nhúng. Kết
quả thu được gồm phương tiện chứa gốc và thông tin đã giấu. Bước tiếp theo thông tin đã
giấu sẽ được xử lý kiểm định so sánh với thông tin ban đầu.
1.4. Tính chất của ẩn giấu tin trong ảnh.
Có nhiều phương pháp ẩn giấu tin trong ảnh đã được nghiêm cứu. Để đánh giá chất
lượng của một phương pháp ẩn giấu tin, người ta dựa vào một số chỉ tiêu sau:
[1][7]
a. Bảo đảm tính vô hình.
Ẩn giấu tin trong ảnh sẽ làm biến đổi ảnh mang tin.Tính vô hình thể hiện

mức độ biến đổi ảnh mang. Phương pháp nào ẩn giấu tin tốt, sẽ làm cho thông tin mật trở
nên vô hình trên ảnh mang, người dùng khó có thể nhận ra trong ảnh có ẩn chứa thông tin
mật.
Chú ý rằng với ẩn tin thì trong thực tế không phải khi nào cũng cố gắng để
đạt được tính vô hinh cao nhất, ví dụ trong truyền hình, người ta gắn hình ảnh mờ gọi là
thủy ấn để bảo vệ bản quyền bản tin.
b. Khả năng chống giả mạo
Mục đích của giấu tin là truyền đi thông tin mật. Nếu không thể do thám tin
mật, thì kẻ địch cũng cố tìm cách làm sai lệch tin mật, làm giả mạo tin mật để gây bất lợi
cho đối phương. Phương pháp giấu tin tốt phải đảm bảo tin mật không bị tấn công một
cách chủ động trên cơ sở những điều hiểu biết thuật toán nhúng tin và có ảnh mang
(nhưng không biết khóa giấu tin).
Môi trường chứa
(audio, ảnh, video)
Môi trường chứa đã được
giấu tin
Bộ giải
mã tin
Thông tin giấu
Kiểm
định
Khóa giấu tin
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh


- 13 -
Đối với ẩn tin thì khả năng chống giả mạo là yêu cầu vô cùng quan trọng, vì
có như vậy mới bảo vệ được bản quyền, minh chứng tính pháp lý của sản phẩm.
c. Dung lượng giấu:
Dung lượng giấu được tính bằng tỉ lệ của lượng thông tin cần giấu so với kích

thước ảnh mang tin. Các phương pháp đều cố gắng giấu được nhiều tin trong ảnh nhưng
vẫn giữ được bí mật. Tuy nhiên trong thực tế người ta luôn phải cân nhắc giữa dung
lượng và các tiêu chí khác như tính vô hình, tính bền vững.
d. Tính bền vững:
Sau khi ẩn giấu tin vào ảnh mang, bản thân ảnh mang có thể phải qua các
biến đổi khác nhau như lọc (tuyến tính, phi tuyến tính), thêm nhiễu, làm sắc nét, mờ nhạt,
quay, nén mất dữ liêu,… tính bền vững là thước đo sự nguyên vẹn của tin mật sau những
biến đổi như vậy.
e. Độ phức tạp tính toán:
Độ phức tạp của thuật toán ẩn giấu tin và giải tin (tách tin) cũng là một chỉ
tiêu quan trọng để đánh giá một phương pháp ẩn giấu tin trong ảnh. Chỉ tiêu này cho
chúng ta biết tài nguyên (thời gian và bộ nhớ) tốn bao nhiêu dùng cho một phương pháp
ẩn giấu tin.
Với chủ nhân ẩn giấu tin thi thời gian thực hiện phải nhanh, nhưng với kẻ
thám tin thi tách tin phải là bài toán khó. Ví dụ bài toán tách tin từ thủy ấn để đánh dấu
bản quyền cần phải là bài toán khó, thì mới chịu được sự tấn công của tin tặc nhằm phá
hủy thủy vân.











Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh



- 14 -
Chƣơng 2: Kỹ thuật thủy vân số
Phần này chúng ta sẽ tập trung vào tìm hiểu về các kỹ thuật liên quan đến thủy vân
số trên ảnh, phân loại các kỹ thuật thủy vân và giới thiệu một số kỹ thuật thủy vân.
2.1. Khái niệm về thủy vân số.
2.1.1 Khái niệm thủy vân số.
Thủy vân số (Digital Watermarking)
[1]
là kỹ thuật nhúng “dấu ấn số” (watermark –
tin giấu) vào một sản phẩm số (văn bản, ảnh, âm thanh, video), mà tin giấu này có thể
được phát hiện và tách ra sau đó, nhằm chứng thực (đánh dấu, xác thực) nguồn gốc hay
chủ sở hữu của sản phầm số này.
Một cách định nghĩa khác về thủy vân số:
Thủy vân số là kỹ thuật giấu thông tin theo kiểu đánh dấu (watermarking) để bảo vệ
bản quyền của đối tượng chứa tin tập trung đảm bảo một số yêu cầu như đảm bảo tính bền
vững,…
Một ví dụ của thủy vân số là một dấu hiệu (như chữ ký) trên một bức ảnh để chứng
thực nguồn gốc và chủ sở hữu của bức ảnh đó.

Hình 2.1: Ví dụ về thủy vân số
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh


- 15 -
2.1.2 Lịch sử hình thành.
Thuật ngữ thủy vân số được cộng đồng thế giới chấp nhận rộng rãi vào đầu thập
niên 1990. Khoảng năm 1995, sự quan tâm đến thủy vân bắt đầu phát triển nhanh. Năm
1996, hội thảo về che dấu thông tin lần đầu tiên đưa thủy vân vào phần trình bày nội dung
chính. Đến năm 1999, SPIE (Society of Photographic Instrumentation Engineers ) đã tổ

chức hội nghị đặc biệt về Bảo mật và thủy vân trên các nội dung đa phương tiện. Cũng
trong khoảng thời gian này, một số tổ chức đã quan tâm đến kĩ thuật watermarking với
những mức độ khác nhau. Chẳng hạn CPTWG (Content Protection Technical Working
Group ) thử nghiệm hệ thống thủy vân bảo vệ phim trên DVD. SDMI (Secure Digital
Music Initiative) sử dụng thủy vân trong việc bảo vệ các đoạn nhạc. Hai dự án được liên
minh Châu Âu ủng hộ. VIVA và Talisman đã thử nghiệm sử dụng thủy vân để theo dõi
phát sóng.
Vào cuối thập niên 1990, một số công ty đã đưa thủy vân vào thương trường, chẳng
hạn các nhà phân phối nhạc trên Internet sử dụng Liqid Audio áp dụng công nghệ của
Verance Corporation. Trong lĩnh vực thủy vân ảnh, Photoshop đã tính hợp một bộ nhúng
và bộ dò thủy vân tên là Digimarc.

2.2. Phân loại thủy vân số.


Hình 2.2: Sơ đồ phân loại các loại thủy vân số.
[6]
Có rất nhiều phương pháp để phân loại thủy vân số, dưới đây là một số phương pháp
phân loại phổ biến hiện nay:
Infomation
hiding
Giấu thông tin
Robust
watermarking
Thuỷ vân bền vững
Invisible
Watermarking
Thuỷ vân ẩn
Steganography
Giấu tin mật

Watermarking
Thuỷ vân số
Fragile
Watermarking
Thuỷ vân “dễ vỡ”
Visible
Watermarking
Thuỷ vân hiển
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh


- 16 -
Phân loại theo tính bền vững:
 Thủy vân bền vững (Robust watermarking): là các thủy vân nhúng theo
phương pháp rất khó phá hủy. Viêc tấn công thủy vân số trong trường hợp
này sẽ làm giảm chất lượng của thông tin. Nói cách khác thì nếu phá hủy thủy
vân thì đồng thời sẽ phá hủy đối tượng mang.
 Thủy vân dễ vỡ (Fragile watermarking): loại này nhằm đảm bảo tính toàn vẹn
cho nội dung thông tin nên bất kỳ sự thay đổi nào cũng có thể làm cho thủy
vân bị hỏng.
Phân loại theo khả năng cảm nhận
 Thủy vân ẩn (Invisible watermarking): là các thủy vân không thể nhìn thấy
được bằng mắt thường.
 Thủy vân hiện (Visible watermarking): là thủy vân có thể nhìn thấy được
bằng mắt thường.
Phân loại theo hƣớng tiếp cận:
 Theo miền không gian (Spatial domain): là kỹ thuật nhúng thủy vân trực tiếp
vào vùng không gian dữ liệu ảnh.
 Theo miền tần số (Frepuency domain): là kỹ thuật nhúng thủy vân vào vùng
biến đổi tần số của dữ liệu ảnh.

2.3. Mô hình thủy vân số:
Mô hình chính của thủy vân số:

Hình 2.3: Mô hình thủy vân số
 Tạo thủy vân số
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh


- 17 -
Thủy vân số phổ biến là dạng text hoặc dạng ảnh. Thủy vân có thể được biến đổi mã
hóa trước khi nhúng vào ảnh. Thủy vân bao gồm thông tin mật đã được mã hóa cùng với
khóa đã được mã hóa được nhúng vào ảnh mang và gửi cho người nhận.
 Nhúng thủy vân số

Hình 2.4: Mô hình nhúng thủy vân số
Sau khi tạo thủy vân xong, thủy vân được nhúng trực tiếp vào ảnh hay vào miền
biến đổi của ảnh tùy thuộc vào thuật toán mà chúng ta sử dụng.
 Tách thủy vân số:

Hình 2.5: Mô hình tách thủy vân số
Để tách thủy vân ta sử dụng khóa trong quá trình nhúng và ảnh đã nhúng thủy vân,
Việc tách thủy vân có quy trình ngược lại so với quy trình nhúng. Sau khi tách được thủy
Bộ tách thủy vân
số và giải mã
Thủy vân
Dữ liệu nhúng
Mã cá nhân
hoặc cộng khai
Quyết định
watermark

Bộ nhúng thủy
vân số

Thủy vân
Dữ liệu bao phủ
Mã cá nhân
hoặc cộng khai
Dữ liệu nhúng
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh


- 18 -
vân nếu thủy vân bị mã hóa thì chúng ta thực hiện giải mã để thu được thông điệp gốc.
Sau đó thông điệp sẽ được so sánh với thông điệp cũ để xác thực.
2.4. Các khuynh hƣớng tiếp cận của kỹ thuât thủy vân số.
Có rất nhiều hướng tiếp cận nhưng hiện nay có 2 phương pháp chính:
Hƣớng tiếp cận theo miền không gian ảnh:
Nhóm kĩ thuật này tập trung vào việc thay đổi trực tiếp lên không gian các điểm ảnh
và sử dụng các mô hình tri giác và phương pháp hình học. Tuy nhiên, các kĩ thuật này chỉ
đảm bảo được thuộc tính ẩn mà không có tính bền vững. Kĩ thuật này thường được sử
dụng trong các ứng dụng nhận thông tin, phát hiện xuyên tạc.
Hƣớng tiếp cận theo miền tần số:
Đây là nhóm kĩ thuật sử dụng một phương pháp biến đổi trực giao nào đó, chẳng
hạn Cosine rời rạc, hay Fourier… để chuyển miền không gian sang miền tần số theo kĩ
thuật trải phổ trong truyền thông. Đây là kĩ thuật phổ biến nhất vời nhiều thuật toán và
được hứa hẹn là một phương pháp tốt giải quyết vấn đề đảm bảo hai thuộc tính quan trọng
của thủy vân khi giấu.
Ngoài hai nhóm trên, gần đây đã xuất hiện những kỹ thuật dựa trên đặc thù của ảnh.
2.4.1 Kỹ thuật thủy vân số trên miền không gian:
Phương pháp phổ biến nhất cho kĩ thuật thủy vân số trên miền không gian ảnh. Kỹ

thuật này là thay thế các bit có trọng số thấp LSB (Least Significant Bit)
Khái niệm về bit có trọng số thấp LSB (Least Significant Bit): Bit LSB là bit có
ảnh hưởng ít nhất tới việc quyết định màu sắc của mỗi điểm ảnh. Vì vậy khi ta thay đổi
bit ít quan trọng của một điểm ảnh thì màu sắc của mỗi điểm ảnh mới sẽ tương đối gần
với điểm ảnh cũ. Ví dụ với mỗi ảnh 16 bit thì 15 bit là biểu diễn 3 màu RGB của điểm
ảnh còn bit cuối cùng không dùng đến thì ta sẽ tách bit này ra ở mỗi điểm ảnh để giấu
tin…
11010010
LSB = Bit trọng số thấp
MSB = Bit trọng số cao
MSB LSB

Phương pháp này chọn các bit ít quan trọng (ít quan trọng nhất để tạo nên màu của
điểm ảnh) và thay thế chúng bằng các bit thông tin cần giấu. Để khó bị phát hiện, thông
tin thường được nhúng vào những vùng mắt người kém nhạy cảm với màu sắc nhất.
Ví dụ về kỹ thuật thủy vân LSB:
Giả sử ta có giá trị của 4 điểm ảnh sẽ là:
00110011 10100010 11100010 0110111
Ta có dữ liệu nhúng là „0111‟ :
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh


- 19 -
Quá trình nhúng sẽ như sơ đồ sau :


0 1 1 1




0 0 1 1 0 0 1 0 1 0 1 0 0 0 1 1 1 1 1 0 0 0 1 1 0 1 1 0 1 1 1 1
Ƣu và nhƣợc điểm :
Ƣu điểm :
 Ưu điểm cơ bản của phương pháp LSB là giấu được nhiều thông tin :
Với ảnh 24bit/1 điểm ảnh, dùng một bit có trọng số thấp có thể giấu được
bit ẩn / 1 điểm ảnh = 1/ 8 bit ẩn / bit dữ liệu
Nếu dùng 2 bit trọng số thấp :
6 bit ẩn / 1 điểm ảnh = 1 / 4 bit ẩn / bit dữ liệu
 Một số ưu điểm khác của phương pháp này là đơn giản trong cài đặt, và phát
huy hiệu quả trong nhiều ứng dụng.
Nhƣợc điểm:
 Phương pháp LSB rất dễ bị tổn thương bởi một loạt các phép biến đổi ảnh dù
là phép biến đổi ảnh đơn giản nhất và thông dụng nhất.
 Nén ảnh mất dữ liệu (như JPEG) rất dễ dàng phá hủy tin mật. Nguyên nhân là
do phương pháp LSB khai thác tính chất ít nhạy cảm với các nhiễu bổ sung của
hệ thống thị giác con người, nhưng đây cũng chính là yếu tố phương pháp nén
ảnh mất dữ liệu sử dụng để giảm mức dữ liệu của một ảnh.
 Các phép biến đổi hình học như dịch, co giãn, hay xoay cũng dễ làm mất dữ
liệu, vì khi đó vị trí các bit giấu sẽ bị thay đổi. Các phép xử lý ảnh khác như là
mờ ảnh cũng sẽ làm mất tin được giấu. Do đó, phương pháp này được ứng
dụng nhiều trong giấu tin hơn thủy vân số.

2.4.2 Kỹ thuât thủy vân số trên miền tần số:
2.4.2.1 Biến đổi Fourier rời rạc
[2][7]
:
Năm 1807, Jean Babtiste Joseph Fourier (1768-1830) đưa ra kết quả nghiên
cứu của ông về sự truyền nhiệt và khuyếch tán. Ông khẳng định mọi tín hiệu tuần
hoàn đều có thể biểu diễn được nhờ một chuỗi các hàm sin. Ngày nay, lý thuyết
này được sử dụng rất nhiều trong toán học, khoa học và kỹ thuật.

Một tín hiệu sẽ được tổ hợp từ nhiều tín hiệu khác. Một ví dụ đơn giản là khi
ánh sáng trắng đi qua lăng kính, nó bị khuyếch tán thành nhiều thành phần tần số
khác nhau và tạo nên phổ màu. Biến đổi Fourier dùng để biểu diễn một tín hiệu qua
các tín hiệu khác đơn giản hơn.
Biến đổi Fourier rời rạc cho ảnh cỡ MxN được định nghĩa như sau :
 Công thức chuyển miền dữ liệu ảnh sang miền tần số :
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh


- 20 -







1
0
1
0
)(2
),(
*
1
),(
M
x
N
y

N
vy
M
ux
j
eyxX
NM
vuI

 Công thức chuyển miền tần số sang miền dữ liệu :







1
0
1
0
)(2
),(),(
M
u
N
v
N
vy
M

ux
j
evuIyxX

Với 0  x, u  M-1 và 0  y, v  N-1.
I(u,v) được gọi là các hệ số DFT
X(x,y) là một thành phần của ảnh (có thể là một thành phần màu như thành phần R,
G, B (red-green-blue) hoặc là giá trị điểm ảnh với ảnh đa cấp xám.
Kỹ thuật nhúng : Có hai phương pháp nhúng thủy vân trên miền DFT là nhúng trên
miền pha DFT và miền biên độ DFT.
Miền pha DFT : cho phép chúng ta nhúng thủy vân vào miền đáng chú ý của ảnh
để có tính biền vững cao, vì nếu bị tấn công thì ảnh sẽ bị giảm chất lượng nghiêm trọng.
Nhưng thủy vân trên miền pha thì không bền vững cho các phép tấn công tịnh tiến.
Miền biên độ DFT : nhúng thủy vân vào miền biên độ DFT bền vững với các phép
tấn công tịnh tiến và dịch chuyển nhưng biên độ DFT dễ bị nhiễu hơn pha DFT.
Ƣu nhƣợc điểm :
Ưu điểm :
- Ưu điểm của phương pháp này là nó bất biến cho các phép biến đổi hình học như
dịch chuyển hay xoay giúp cho thủy vân bền vững hơn trong các phép biến đổi hình học.
- Phép biến đổi DFT có các đặc tính mà giúp nó nhận dạng và phục hồi các ảnh đã
bị biến đổi các phép biến đổi hình học.
Nhược điểm :
- Phương pháp DFT khá phức tạp
- Việc tính toán trong DFT cũng rất phức tạp nếu kích thước không phải là lũy thừa
của 2.

2.4.2.2 Biến đổi Cosin rời rạc (DCT – Discrete Cosine Transform)
[2][3][7]

Biến đổi cosin rời rạc viết tắt là DCT - Discrete Cosine Transform được đưa ra bởi

Ahmed và các đồng nghiệp của ông vào năm 1974. Từ đó cho đến nay, nó được sử dụng
rất phổ biến trong nhiều các kỹ thuật xử lí ảnh số nói riêng và các kỹ thuật xử lí tín hiệu
số nói chung. Trong các kỹ thuật thuỷ vân ảnh dựa trên phép biến đổi dữ liệu ảnh sang
miền tần số thì phép biến đổi DCT cũng được sử dụng nhiều nhất. Lí do ở đây là phép
biến đổi DCT đã được dùng trong dạng chuẩn ảnh JPEG. Nếu áp dụng DCT thì cũng theo
chuẩn của JPEG và do đó sẽ tránh được mất thuỷ vân do phép nén JPEG.
Biến đổi Cosin rời rạc tổng quát là biến đổi trên khối hai chiều kích thước bất kỳ,
trong đó các khối 8x8 và 16x16 được sử dụng nhiều nhất. Dưới đây trình bày biến đổi
DCT với các khối 8x8. Ban đầu, ảnh kích thước MxN được chia thành MxN/64 khối ảnh
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh


- 21 -
và ta áp dụng biến đổi DCT trên từng khối ảnh này. Sau đó, thủy vân sẽ được nhúng trong
các hệ số DCT.
Biến đổi Cosine rời rạc:
Nguyên tắc chính của phương pháp mã hoá này là biến đổi tập các giá trị pixel của
ảnh trong miền không gian sang một tập các giá trị khác trong miền tần số sao cho các hệ
số trong tập giá trị mới này có tương quan giữa các điểm ảnh gần nhau nhỏ hơn.
Công thức biến đổi DCT thuận nghịch:
 Biến đổi DCT thuận:
(1)
 Biến đổi DCT nghịch:
(2)
Với và
Sau khi biến đổi các khối 8x8 qua biến đổi DCT ta sẽ có 64 hệ số DCT. Biến đổi
DCT sẽ giúp chúng ta phân chia các vùng tần số tần số cao, tần số giữa, và tần số thấp.
Các thành phần tần số thấp của ảnh rất dễ nhận biết về mặt trực giác và bất kỳ thay đổi
nào ở miền tần số này cũng ảnh hưởng đến chất lượng ảnh. Các thành phần tấn số cao thì
ít ảnh hưởng tới chất lượng ảnh. Nhưng nó không bền vững với các phép biến đổi nén ảnh

mất dữ liệu, nên cho vào miền này sẽ không bền vững. Do đó, thủy vân thường được
nhúng vào các thành phần có tần số giữa.









Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh


- 22 -
Thấp Giữa Cao


































































Hình 2.6 Sơ đồ phân chia 3 miền tần số của phép biến đổi DCT

Hình 2.7: ảnh jpeg Hình 2.8 Sơ đồ miền tần số của ảnh
Ƣu nhƣợc điểm
Ưu điểm:
- Các biến đổi DCT được sử dụng phổ biến trong các chuẩn nén, tiêu biểu là
JPEG. Do đó sau khi nén có thể tăng tính bền vững của thủy vân.
- Biến đổi DCT khá nhanh đặc biệt là nếu nó được sử dụng trong các ảnh
JPEG.
Nhƣợc điểm:

- Các hệ số DCT dễ bị thay đổi với các phép tấn công tịnh tiến và dịch
chuyển.

Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh


- 23 -
2.4.2.3 Biến đổi sóng rời rạc DWT (DWT – Discrete Wavelet Transform)
Biến đổi sóng rời rạc DWT là phép biến đổi mới nhất được áp dụng cho ảnh số. Ý
tưởng của DWT cho tín hiệu một chiều như sau: tín hiệu đưa chia than 2 phần: phần tần
số cao và phần tấn số thấp. Hầu hết năng lượng ảnh tập trung ở phần góc cạnh hoặc có kết
cấu và thuộc thành phần có tần số cao. Thành phần tần số thấp lại được chia thành hai
thành phần có tần số cao và thấp.
Ý tưởng cơ bản của phép biến đổi là khai triển hàm f(t) bất kỳ như một xếp chồng
của các sóng con (wavelets) hay các hàm cơ sở. Các hàm cơ sở này có được từ một sóng
nguyên mẫu gọi là sóng mẹ (mother wavelets) bằng cách lấy tỉ lệ và dịch. Trong thực tế
tính toán, biến đổi sóng con rời rạc thuận và nghịch (DWT và IDWT) thường được thực
hiện bằng phương trình:
[4][5]
DWT
f
(m,n)=

Trong đó, ψ(t) là hàm sóng mẹ. Điều kiện ψ(t) là một hàm thông dài đảm bảo sự tồn
tại của biến đổi con ngược. Thông thường, người ta chọn a
0
=2 và b
0
=1.
Ví dụ DWT trên ảnh RGB :


Hình 2.9: Mô hình DWT trên miền màu đỏ (Red) của khối ảnh RGB mxn
Ảnh cần thủy vân
tách

×