Tải bản đầy đủ (.docx) (103 trang)

nghiên cứu phương pháp định danh bản quyền tác giả trên dữ liệu ảnh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.14 MB, 103 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ
Lê Ngọc Việt
NGHIÊN CỨU PHƯƠNG PHÁP ĐỊNH DANH BẢN
QUYỀN TÁC GIẢ TRÊN DỮ LIỆU ẢNH
KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
Ngành: Công nghệ thông tin
HÀ NỘI - 2010
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ
Lê Ngọc Việt
NGHIÊN CỨU PHƢƠNG PHÁP ĐỊNH DANH BẢN
QUYỀN TÁC GIẢ TRÊN DỮ LIỆU ẢNH
KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
Ngành: Công nghệ thông tin
Cán bộ hƣớng dẫn: ThS. Nguyễn Thị Hậu
HÀ NỘI - 2010
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh
Lời cám ơn
Trước
hết tôi
xin gửi
lời cám
ơn đến
toàn thể
các
thầy cô
giáo
trường
Đại học
công


nghệ Đại học
Quốc gia Hà
Nội đã giúp đỡ
và chỉ bảo tôi
trong suốt quá
trình học tập ở
trường. Đặc
biệt tôi xin gửi
lời cám ơn sâu
sắc đến cô
Nguyễn Thị
Hậu đã chỉ bảo
hướng
dẫn tôi từ bước
chọn đề tài,
đến nghiên cứu
và tạo điều
kiện tốt nhất
cho tôi trong
quá
trình làm khóa
luận.
Đồng
thời tôi
cũng
xin cảm
ơn
những người bạn đã luôn bên cạnh, chia sẻ giúp đỡ
và động viên tôi trong suốt quá trình nghiên cứu và học tập.
Cuối cùng, tôi xin bày tỏ niềm biết ơn vô hạn tới bố mẹ, chị tôi, và

những người
bạn thân luôn bên cạnh, động viên tôi trong suốt quá trình thực hiện khóa
luận tốt nghiệp.
Hà Nội,
17/05/2010
Sinh viên: Lê
Ngọc Việt
-i-
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh
Tóm tắt nội
dung
Trong
thời đại
kỷ
nguyên
số,
thông
tin số
được sử
dụng
rộng rãi
trong
môi
trường
mở: tài nguyên
được phân phối
cho nhiều
người sử dụng,
thì nhu cầu
được bảo vệ

bản
quyền sở hữu
trí tuệ các sản
phẩm số đã trở
thành một vấn
đề quan trọng
và được nhiều
cơ sở nghiên
cứu quan tâm.
Thủy vân số
hay nhúng thủy
vân được đánh
giá mang lại
nhiều hứa hẹn
trong ứng dụng
bảo vệ bản
quyền, phát
hiện xuyên tạc,
kiểm soát truy
cập
đối với dữ liệu đa phương tiện.
Không giống như các hệ mật mã được sử dụng cho truyền thống và
không ngăn
cấm được người dùng sử dụng trái phép những dữ liệu, các phương pháp
thủy vân hứa
hẹn một giải pháp cho vấn đề bảo vệ bản quyền đối với sản phẩm số khi mà
sản phẩm đó
được sử dụng trong môi trường mở và không cần đến việc mã hóa. Tạo thủy
vân là một
phương pháp nhúng một lượng thông tin nào đó vào trong dữ liệu đa

phương tiện cần
được bảo vệ sở hữu và không để lại ảnh hưởng đến chất lượng của sản
phẩm. Thủy vân
phải tồn tại bền vững với sản phẩm số và không thể loại bỏ bằng bất kì
những tấn công có
chủ đích hay không chủ đích nào trừ khi phá hủy sản phẩm.
Trong phạm vi khóa luận này, tôi xin đưa ra một số phương pháp
thủy vân số mà
tôi nghiên cứu cho dữ liệu ảnh như BMP (bitmap), JPG (JPEG),…,và cách
xử lý ảnh màu,
cách nén ảnh chuẩn JPEG… Và tôi cũng xây dựng được một ứng dụng cho
việc xác định
bản quyền tác giả trên dữ liệu ảnh sử dụng phương pháp DCT đề cập trong
khóa luận.
Đồng thời nội dụng khóa luận đề cập tới một số thử nghiệm đánh giá hiệu
quả của ứng
dụng đã xây dựng được.
- ii -
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh
Mục lục
Lời cám
ơn




i
Tóm tắt nội
dung





ii
Bảng các kí
hiệu và chữ
viết
tắt



iv
Mục lục các
hình
vẽ




v
Mở
đầu


7
Chương 1: Giới thiệu về ẩn – giấu
tin 8
1
.
1

.
1
.
2
.
1
.
3
.
1
.
4
.
Khái niệm về ẩn - giấu
tin. 8
Phân loại kỹ thuật giấu
tin: 8
Mô hình giấu tin cơ
bản: 10
Tính chất của ẩn giấu tin trong
ảnh. 12
Chương 2: Kỹ thuật thủy vân
số 14
2
.
1
.
2
.
2

.
2
.
3
.
2
.
4
.
2
.
5
.
Khái niệm về thủy vân
số. 14
Phân loại thủy vân
số 15
Mô hình thủy vân
số: 16
Các khuynh hƣớng tiếp cận của kỹ thuât thủy vân
số 18
Một số ứng
dụng
26
2.6. Yêu cầu về chất lƣợng ảnh của thủy vân
số:


26
Chương 3:

Phát triển ứng
dụng.



28
3.1.
3.2.
3.3.
3.4.
3.5.
Các chức năng
chính:

28
Hƣớng giải quyết bài
toán

28
Giới thiệu về các
module:

34
Giao diện chƣơng
trình

38
Môi trƣờng lập
trình.


41
Chương 4:
Thực nghiệm
đánh
giá



43
4.1.
4.2.
4.3.
4.4.
Cài
đặt:



43
Chất lƣợng
ảnh.
43
Độ bền vững của thông
tin. 46
Một số hạn chế của hệ
thống: 48
Kết
luận
49
Các thuật ngữ tiếng

anh 5
0
Tài liệu tham
khảo
51
- iii -
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh
Bả
ng
các

hiệ
u

ch

viế
t
tắt
- iv -
Kí hiệu Diễn giải
LSB Least Significant Bit
DFT Discrete Fourier Transform
IDFT Inverse Discrete Fourier Transform
DCT Discrete Cosine Transform
IDCT Inverse Discrete Cosine Transform
DWT Discrete Wavelet Transform
IDWT Inverse Discrete Wavelet Transform
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh
Mục lục

các hình
vẽ
Hình 1.1: Sơ
đồ phân loại kỹ
thuật giấu
tin

8
Hình 1.2:
Lược đồ chung
cho quá trình
giấu
tin

11
Hình 1.3:
Lược đồ chung
cho quá trình
giải


12
Hình 2.1: Ví
dụ về thủy vân
số


14
Hình 2.2: Sơ
đồ phân loại

các loại thủy
vân
số.

15
Hình 2.3: Mô
hình thủy vân
số

16
Hình 2.4: Mô hình nhúng thủy vân
số 17
Hình 2.5: Mô hình tách thủy vân
số 17
Hình 2.6 Sơ đồ phân chia 3 miền tần số của phép biến đổi
DCT 22
Hình 2.7: ảnh
jpeg 22
Hình 2.8 Sơ đồ miền tần số của
ảnh 22
Hình 2.9: Mô hình DWT trên miền màu đỏ (Red) của khối ảnh RGB
mxn 23
Hình 2.10: Mô hình IDWT của ảnh
RGB 24
Hình 2.11: Mô hình nhúng thủy vân số trên miền
DWT 25
Hình 3.1 Mô hình nhúng thủy vân trên miền
DCT 29
Hình 3.2: Mô hình tách thủy
vân. 30

Hình 3.3 Các bước của quá trình mã hóa biến đổi DCT đối với một
khối 31
Hình 3.4: Ma trận lượng
tử 32
Hính 3.5:Mô hính tương tác module thủy vân
hiện 34
Hình 3.6:Mô hình tương tác module nhúng thủy vân
ẩn 35
Hình 3.7: Mô hình tương tác module tách thủy vân
ẩn 36
Hình 3.8: Giao diện chính của ứng
dụng 37
-v-
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh
Hình 3.9: Giao
diện thủy vân
hiện


38
Hình 3.10: Mô
tả thành phần
của .NET
Framework

41
Hình 4.1: Ảnh
gốc trước khi
thủy vân
hiện


42
Hình 4.2: Ảnh
sau khi thủy
vân


43
- vi -
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh
Mở đầu
Trong
thời đại
bùng nổ
thông tin
với sự
phát triển
nhanh
chóng
của khoa
học kỹ
thuật trên
nhiều lĩnh vực
đặc biệt là
trong lĩnh vực
đa phương tiện
(multimedia)
hỗ trợ đắc
lực cho sự sản
xuẩt, quản lý

và phân phối
các sản phẩm
đa phương tiện
như: hình ảnh,
âm
thanh… và
khiến chúng
trở lên rất dễ
dàng. Đặc biệt
với sự phát
triển mạnh mẽ
của
Internet đã làm
cho quá trình
phân phối các
sản phầm này
trở nên rất
nhanh chóng.

chính điều này
đã đặt ra vấn
đề là làm sao
bảo vệ bản
quyền sở hữu đối vơi các sản phẩm
đa phương tiện này.
Một trong những phương pháp được dùng rất sớm để bảo vệ quyền sở
hữu đối với
các sản phẩm đa phương tiện là dùng phương pháp mã hóa. Các sản phẩm
được mã hóa
và gửi cho người dùng. Người dùng chỉ đọc được các sẩn phẩm này khi mà

nhận được
khóa để giải mã đi kèm. Phương pháp mã hóa này chỉ hiệu quả trong việc
truyền dữ liệu
đa phương tiện nhưng không hiệu quả trong việc bảo vệ bản quyền sở hữu
vì người dùng
sau khi giải mã thì sẽ nhân bản và phân phối lại sản phẩm đó.
Chính điểu đó mà chúng ta cần phải xây dựng một phương pháp tốt
hơn để giải
quyết vấn đề này. Và thủy vân số là một trong những giải pháp được đưa ra
để giải quyết
vấn đề về bản quyến sở hữu. Trong phạm vi khóa luận đã đi vào nghiên cứu
các phương
pháp để giải quyết vấn đề đó. Mục tiêu của khóa luận là không chỉ nghiên
cứu các
phương pháp xác thực bản quyền tác giả trên dữ liệu ảnh sử dụng thủy vân
số mà còn xây
dựng một hệ thống thực nghiệm sử dụng một trong nhưng kỹ thuật thủy vân
được nghiên
cứu trong khóa luận.
Ngoài phần Mở đầu và Kết luận, kết cấu của khóa luận bao gồm các
chương sau:
• Chƣơng 1: Giới thiệu về ẩn giấu tin. Nêu ra các khái niệm cơ
bản nhất về
ẩn giấu tin và ứng dụng trong thực tế.
• Chƣơng 2: Giới thiệu về thủy vân số. Nghiên cứu phân tích
một số thuật
toán thủy vân số hiện nay đang được phổ biến. Tìm hiểu ưu
nhược điểm của
từng thuật toán.
• Chƣơng 3: Hướng giải quyết và đề xuất mô hình bài toán.

Miêu tả chi tiết
thuật toán sử dụng và môi trường phát triển ứng dụng

Chƣơng 4: Kết quả thực nghiệm và đánh giá. Đưa ra kết quả đã làm
được
và đánh giá kết quả.
-7-
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh
Chƣ
ơng
1:
Giới
thiệu
về ẩn

giấu
tin
1.1.
Khái
niệm về
ẩn -
giấu tin.
Hiện nay
có rất
nhiều
cách định
nghĩa
khác
nhau về
ẩn giấu

tin như:

Theo
tác
giả
Trịnh
Nhật
Tiến
thì:
Ẩn
giấu tin (steganography) được hiểu là
nhúng mẩu tin mật vào một vật mang tin khác, sao cho khó
phát hiện ra mẩu
tin đó, mặt khác nhận biết được vật mang tin đã được giấu một
tin mật.[1]
• Theo một số tác giả khác: Ẩn giấu tin là một kỹ thuật nhúng
(giấu) một lượng
thông tin số nào đó vào trong một đối tượng dữ liệu số khác
(giấu thông tin
chỉ mang tính quy ước không phải là một hành động cụ thể).[2]
Như vậy. Ẩn giấu tin là một kỹ thuật nhúng các mẩu tin vào một đối
tượng mang tin
sao cho khó có thể phát hiện ra tin mật đó.
1.2. Phân loại kỹ thuật giấu tin:
Phân loại theo khuynh hƣớng:
Infomation
hiding
Giấu thông tin
Steganography
Giấu tin mật

Watermarking
Thuỷ vân số
Hình 1.1: Sơ đồ phân loại kỹ thuật giấu tin
Trong kỹ thuật giấu tin nhằm mục đích an toàn và bảo mật
thông tin ở hai
khía cạnh:


Bảo mật dữ liệu đem giấu.
Bảo mật cho chính đối tượng được dùng để giấu tin.
Từ hai khía cạnh trên dần dần hình thành hai khuynh hướng chủ yếu
của giấu tin là:
1
.
Giấu tin (Steganography) là kỹ thuật nhúng tin mật vào môi trường
giấu
tin.
Theo khuynh hướng này tập trung vào các kỹ thuật giấu tin sao cho
thông tin giấu
được càng nhiều càng tốt và quan trọng là người khác khó phát hiện được
một đối tượng
có bị giấu tin bên trong hay không bằng kỹ thuật thông thường.
-8-
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh
2.
Thủy vân số (kỹ thuật
đánh dấu số) là kỹ thuật
nhúng dấu ấn số vào một
tài
liệu hoặc sản

phẩm, nhằm
chứng thực
nguồn gốc hay
chủ sở hữu.
So sánh
giữa giấu
tin và
thủy vân
số[1]:
Phân
loại theo
môi
trƣờng
giấu tin:
a.Giấu tin trong Audio
Kỹ thuật
giấu
thông tin
trong
audio
phụ thuộc vào hệ thống thính giác của con
người (HAS – Human Auditory System). HAS cảm nhận được tín hiệu ở
dải tần rộng và
công suất thay đổi lớn, nhưng lại kém trong việc phát hiện sự khác biệt nhỏ
giữa dải tần
và công suất. Điều này có nghĩa là các âm thanh to, cao tần có thể che giấu
được các âm
thanh nhỏ thấp một cách dễ dàng. Kênh truyền tin cũng là một vấn đề. Kênh
truyền hay
băng thông chậm sẽ ảnh hưởng đến chất lượng thông tin sau khi giấu. Giấu

thông tin
trong audio yêu cầu rất cao về tính đồng bộ và tính an toàn của thông tin.
b.
Giấu tin trong video
Giấu tin trong video cũng được quan tâm và được phát triển mạnh
mẽ cho nhiều
ứng dụng như điều khiển truy cập thông tin, nhận thực thông tin và bảo vệ
bản quyền tác
giả. Ta có thể lấy một ví dụ là hệ thống chương trình trả tiền xem theo
video clip của các
thuật toán trước đây thường cho phép giấu ảnh vào trong video, nhưng gần
đây kỹ thuật
cho phép giấu cả âm thanh và ảnh vào trong video.
c.Giấu tin trong ảnh
Giấu thông tin trong ảnh hiện nay chiếm tỷ lệ lớn nhất trong các
chương trình ứng
dụng, các phần mềm, và hệ thống giấu tin trong đa phương tiện bởi lượng
thông tin trao
-9-
Giấu tin Thủy vân số
- Mục đích là bảo vệ thông tin
được giấu.
- Giấu được càng nhiều thông
tin càng tốt, ứng dụng trong truyền
dữ liệu thông tin mật.
- Thông tin được giấu phải ẩn,
không cho người khác thấy được
bằng mắt thường.
- Chỉ tiêu quan trọng nhất là
dung lượng của tin được giấu.

- Mục đích là bảo vệ môi trường
giấu tin.
- Chỉ cần thông tin đủ để đặc
trưng cho bản quyền của chủ sở hữu.
- Thông tin giấu có thể ẩn (thủy
vân ẩn) hoặc hiện (thủy vân hiện).
- Chỉ tiêu quan trọng nhất là tính
bền vững của tin được giấu.
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh
đổi được trao
đổi bằng ảnh là
rất lớn. Hơn
nữa giấu thông
tin trong ảnh
cũng đóng vai
trò
hết sức quan
trọng đối với
hầu hết các
ứng dụng bảo
vệ an toàn
thông tin như:
nhận thực
thông tin, xác
định xuyên tạc
thông tin, bảo
vệ bản quyền
tác giả, điều
khiển truy cập,
giấu thông tin

mật… Chính vì
thế mà vấn đề
này đã nhận
được sự quan
tâm rất lớn của
các cá nhân, tổ
chức, trường
đại học, và các
viện nghiên
cứu trên thế
giới.
Thông
tin sẽ
được
giấu
cùng với
dữ liệu
ảnh
nhưng
chất
lượng
ảnh ít
thay đổi và
chẳng ai biết được đằng sau ảnh đó mang những thông tin có ý nghĩa. Ngày
nay, khi ảnh
số đã được sử dụng rất phổ biến, thì giấu thông tin trong ảnh đã đem lại rất
nhiều những
lợi ích quan trọng trên nhiều lĩnh vực của đời sống xã hội.
Ví dụ như đối với các nước phát triển, chữ kí tay đã được số hoá và
lưu trữ sử dụng

như là hồ sơ cá nhân của các dịch vụ ngân hàng và tài chính, nó được dùng
để nhận thực
trong các thẻ tín dụng của người tiêu dùng. Phần mềm MS Word của
MicroSoft cũng cho
phép người dùng lưu trữ chữ kí trong ảnh nhị phân rồi gắn vào vị trí nào đó
trong file văn
bản để đảm bảo tính an toàn của thông tin. Tài liệu sau đó được truyền trực
tiếp qua máy
fax hoặc lưu truyền trên mạng. Theo đó, việc nhận thực chữ kí, xác thực
thông tin đã trở
thành một vấn đề cực kì quan trọng khi mà việc ăn cắp thông tin hay xuyên
tạc thông tin
bởi các tin tặc đang trở thành một vấn nạn đối với bất kì quốc gia nào, tổ
chức nào. Thêm
vào đó, lại có rất nhiều loại thông tin quan trọng cần được bảo mật như
những thông tin
về an ninh, thông tin về bảo hiểm hay các thông tin về tài chính, các thông
tin này được số
hoá và lưu trữ trong hệ thống máy tính hay trên mạng, chúng rất dễ bị lấy
cắp và bị thay
đổi bởi các phần mềm chuyên dụng.
1.3. Mô hình giấu tin cơ bản:
Giấu thông tin vào phương tiện chứa và tách lấy thông tin là hai quá
trình trái ngược
nhau.
a. Giấu thông tin vào phương tiện chứa
Qui trình giấu thông tin vào phương tiện chứa được mô tả qua sơ đồ
khối hình 1.2
trong đó:
- Thông tin cần giấu tuỳ theo mục đích của người sử dụng, nó

có thể là thông
điệp (với các tin bí mật) hay các logo, hình ảnh bản quyền.
- Phương tiện chứa: các file ảnh, text, audio… là môi trường để
nhúng tin
- Bộ nhúng thông tin: là những chương trình thực hiện việc giấu
tin
- Đầu ra: là các phương tiện chứa đã có tin giấu trong đó
- 10 -
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh
Thông tin giấu
Phân
phối
Môi
trường
chứa(
audio,
ảnh,
video)
Bộ
nhún
g
thông
tin
Môi trường
chứa
đã được
giấu tin
Khóa giấu tin
Hình
1.2:

Lược
đồ
chung
cho
quá
trình
giấu
tin
[7]
b. Tách
thông
tin:
Tách
thông tin
từ các
phương
tiện chứa
diễn ra theo quy trình ngược lại với đầu ra là
các thông tin đã được giấu vào phương tiện chứa. Phương tiện chứa sau khi
tách lấy thông
tin có thể được sử dụng, quản lý theo những yêu cầu khác nhau.
- 11 -

×