Tải bản đầy đủ (.pdf) (27 trang)

Bảo vệ bản quyền cơ sở dữ liệu bằng thủy vân ảnh số

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (444.2 KB, 27 trang )

ĐẠI HỌC THÁI NGUYÊN
KHOA CÔNG NGHỆ THÔNG TIN

Phạm Thị Thu Hường

BẢO VỆ BẢN QUYỀN CƠ SỞ DỮ LIỆU
BẰNG THUỶ VÂN ẢNH SỐ
Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01

LUẬN VĂN THẠC SĨ CHUYÊN NGÀNH KHOA HỌC MÁY TÍNH

NGƯỜI HƯỚNG DẤN KHOA HỌC: TS BÙI THẾ HỒNG

Thái nguyên - 2010

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên




1
MỤC LỤC
Chương 1 TỔNG QUAN VỀ THUỶ VÂN CSDL QUAN HỆ .......................... 1
1.1 Một số khái niệm cơ bản .......................................................................... 4
1.1.1 Thuỷ vân là gì ? ................................................................................ 6
1.1.2 Thuỷ vân cơ sơ dữ liệu quan hệ là gì ? .............................................. 7
1.1.3 Sự cần thiết của các kỹ thuật thuỷ vân CSDL quan hệ ..................... 8
1.2 Các yêu cầu cơ bản của thuỷ vân trên cơ sở dữ liệu quan hệ .................. 10
1.2.1 Khả năng có thể phát hiện (Detectability) ....................................... 11
1.2.2 Tính bền vững (Robustness) ........................................................... 11


1.2.3 Cập nhật phần tăng thêm (Incremental Updatability) ...................... 12
1.2.4 Không dễ cảm nhận được (Imperceptibility) ................................... 12
1.2.5 Hệ thống mù ( Blind System).......................................................... 12
1.3 Những tấn công trên hệ thuỷ vân cơ sở dữ liệu quan hệ ......................... 13
1.3.1 Cập nhật thông thường .................................................................... 13
1.3.2 Tấn công có chủ đích ...................................................................... 13
1.4 Các ứng dụng chủ yếu của thuỷ vân cơ sở dữ liệu quan hệ .................... 15
1.4.1 Bảo vệ bản quyền hoặc chứng minh quyền sở hữu .......................... 15
1.4.2 Nhận thực thông tin (Authentication) .............................................. 15
1.5 Các kỹ thuật thủy vân cơ sở dữ liệu quan hệ .......................................... 16
Chương 2 THỦY VÂN SỬ DỤNG CÁC BIT LSB ......................................... 17
2.1 Chuẩn bị thuật toán ................................................................................ 17
2.1.1 Đặt vấn đề ....................................................................................... 17
2.1.2 Các bít ít ý nghĩa nhất ..................................................................... 18
2.1.3 Mã chứng thực thông điệp .............................................................. 19
2.2 Các thuật toán ........................................................................................ 19

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên




2
2.2.1 Mô hình thuỷ vân ............................................................................ 20
2.2.2 Thuật toán nhúng thuỷ vân.............................................................. 20
2.2.3 Thuật toán phát hiện thuỷ vân ......................................................... 24
2.2.4 Một số lưu ý.................................................................................... 26
2.2.5 Các quan hệ không có các khóa chính ............................................. 27
2.3 Phân tích đánh giá thuật toán ................................................................. 28
2.3.1 Xác suất nhị thức tích luỹ ............................................................... 28

2.3.2 Hàm ngưỡng ................................................................................... 29
Chương 3 THỦY VÂN SỬ DỤNG CÁC BIT Ý NGHĨA NHẤT .................... 31
4.1 Giới thiệu............................................................................................... 31
4.1.1 Mô hình thủy vân ............................................................................ 32
4.1.2 Xác định bài toán ............................................................................ 32
4.1.3 Lựa chọn các tập hợp con .............................................................. 33
4.2 Nhúng thủy vân .................................................................................... 34
4.2.1 Mã hoá bít đơn ................................................................................ 34
4.3 Phát hiện thủy vân ................................................................................ 37
Chương 4 CÀI ĐẶT THỬ NGHIỆM .............................................................. 39
Kết luận ........................................................................................................... 42
Tài liệu tham khảo ........................................................................................... 43

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên




1

Lời nói đầu
I. Lý do chọn đề tài
Bảo vệ bản quyền, nhận thực thông tin, nhận dạng các đặc trưng duy
nhất của dữ liệu quan hệ hiện đang là một nhu cầu cấp thiết và là thách thức
mới đối với các kỹ thuật thuỷ vân trên cơ sở dữ liệu quan hệ. Việc quản lý
bản quyền các dữ liệu quan hệ bằng thuỷ vân đã và đang trở thành một chủ đề
quan trọng trong các nghiên cứu về cơ sở dữ liệu. Thuỷ vân các dữ liệu quan
hệ có những thách thức kỹ thuật đáng kể và có các ứng dụng thực tế có ý
nghĩa xứng đáng được quan tâm thích đáng từ phía cộng đồng những người
nghiên cứu cơ sở dữ liệu.

Thực sự, qua nghiên cứu và thử nghiệm tôi thấy việc phát triển và cài
đặt các kỹ thuật thủy vân cơ sở dữ liệu rất phức tạp và rất khó để thỏa mãn
được những yêu cầu khắt khe của lĩnh vực bảo vệ bản quyền đối với loại dữ
liệu này. Những kết quả được trình bày trong báo cáo này là những tìm hiểu
và nghiên cứu bước đầu của tôi trong lĩnh vực mới này. Chắc chắn là trong
báo cáo này còn có nhiều khiếm khuyết. Tôi mong rằng sẽ nhận được những ý
kiến góp ý xác đáng giúp tôi có được kết quả tốt hơn.
Trong thời gian tới, tôi hy vọng sẽ có cơ hội tiếp tục thực hiện hướng
nghiên cứu mới này và có thể đạt được những kết quả sâu hơn và tốt hơn.
II. Mục đích nghiên cứu
 Tìm hiểu các kỹ thuật thuỷ vân bảo vệ bản quyền cơ sở dữ liệu quan hệ.
 Cài đặt thử nghiệm thủy vân trên cơ sở dữ liệu quan hệ dựa vào các bit
LSB và MSB.

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên




2

III. Nhiệm vụ nghiên cứu
Hiểu rõ cơ sở lý luận và toán học của các kỹ thuật giấu tin và các kỹ



thuật thuỷ vân.
Phát triển các chương trình cài đặt lược đồ thuỷ vân bảo vệ bản quyền




cơ sở dữ liệu quan hệ.
IV. Phạm vi nghiên cứu


Nghiên cứu, đánh giá các kỹ thuật thuỷ vân.



Các công cụ lập trình và phần mềm dùng để cài đặt các lược đồ nhúng

và giải thuỷ vân.
V. Phương pháp nghiên cứu


Sưu tầm tìm hiểu các tài liệu, các kết quả nghiên cứu về giấu tin và
thuỷ vân.



Đánh giá các kỹ thuật thuỷ vân đã biết



Cải tiến, mở rộng các kỹ thuật thuỷ vân đã biết nhằm mục đích thu
được kết quả tốt hơn.



Cài đặt thử nghiệm trên những cải tiến được đưa ra.


VI. Nội dung nghiên cứu và bố cục luận văn
Luận văn được chia thành bốn chương:
Chương 1: Tổng quan về thuỷ vân cơ sở dữ liệu quan hệ
1.1 Một số khái niệm cơ bản
1.2 Yêu cầu cơ bản của thuỷ vân cơ sở dữ liệu quan hệ
1.3 Những tấn công trên hệ thuỷ vân cơ sở dữ liệu quan hệ
1.4 Các ứng dụng chủ yếu của thuỷ vân cơ sở dữ liệu quan hệ
1.5 Các kỹ thuật thuỷ vân cơ sở dữ liệu quan hệ
Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên




3

Chương 2: Thuỷ vân sử dụng các bit LSB
2.1 Chuẩn bị thuật toán
2.2 Các thuật toán
2.3 Phân tích đánh giá thuật toán
Chương 3: Thuỷ vân sử dụng các bit MSB
3.1 Giới thiệu
3.2 Nhúng thuỷ vân
3.3 Phát hiện thuỷ vân
Chương 4: Cài đặt thử nghiệm

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên





4

Chương 1: TỔNG QUAN VỀ THUỶ VÂN CSDL QUAN HỆ
Tính năng an toàn và bảo mật thông tin của kỹ thuật giấu tin được thể
hiện ở hai khía cạnh. Một là bảo vệ cho dữ liệu đem giấu và hai là bảo vệ cho
chính đối tượng được sử dụng để giấu tin. Tương ứng với hai khía cạnh đó
chúng ta có hai khuynh hướng kỹ thuật rõ ràng đó là giấu tin mật
(Steganography) mà chúng ta đã tìm hiểu trong các chương trước) và thuỷ vân
số (Watermarking).
Trong kỹ thuật giấu tin mật, thông tin cần giấu được gọi là thông điệp
(Message) còn trong kỹ thuật thuỷ vân số thì được gọi là thuỷ vân
(Watermark). Thuỷ vân có thể là một chuỗi các kí tự, hay một hình ảnh, logo
nào đó.
Nói đến thuỷ vân số là nói đến kỹ thuật giấu tin nhắm đến những ứng
dụng bảo đảm an toàn dữ liệu cho đối tượng được sử dụng để giấu tin như:
bảo vệ bản quyền, chống xuyên tạc, nhận thực thông tin, điều khiển sao chép
v.v…Có thể thấy rõ là phần ứng dụng của thủy vân rất lớn, mỗi ứng dụng lại
có những yêu cầu riêng và tính chất riêng, do đó các kỹ thuật thuỷ vân cũng
có những tính năng khác biệt tương ứng:

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên




5

Watermarking
Thuỷ vân số


Robust
Copyright marking

Fragile
Watermarking

Thuỷ vân bền vững

Thuỷ vân “dễ vỡ”

ImperceptibleWatermar
king

Visible
Watermarking

Thuỷ vân ẩn

Thuỷ vân hiện

Hình 1. Phân loại các kỹ thuật thuỷ vân
Các kỹ thuật thuỷ vân trên Hình 1 được phân biệt nhau bởi những đặc
trưng, tính chất của từng kỹ thuật và ứng dụng những kỹ thuật đó. Thuỷ vân
“dễ vỡ” (Fragile) là kỹ thuật nhúng thuỷ vân vào trong ảnh sao cho khi phân
bố sản phẩm trong môi trường mở nếu có bất cứ một phép biến đổi nào làm
thay đổi đối tượng sản phẩm gốc thì thuỷ vân đã được giấu trong đối tượng sẽ
không còn nguyên vẹn như trước khi giấu nữa (dễ vỡ). Các kỹ thuật thuỷ vân
có tính chất này được sử dụng trong các ứng dụng nhận thực thông tin
(Authentication) và phát hiện xuyên tạc thông tin (Tamper detection).

Thuỷ vân bền vững lại được chia thành hai loại là thuỷ vân ẩn và thuỷ
vân hiển. Thuỷ vân hiển là loại thuỷ vân được hiện ngay trên sản phẩm và
người dùng có thể nhìn thấy được giống như các biểu tượng kênh chương
trình vô tuyến mà chúng ta thường thấy VTV3, CCTV, TV5…

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên




6

1.1 Một số khái niệm cơ bản
1.1.1 Thuỷ vân là gì ?
Từ “thuỷ vân” có xuất xứ từ kỹ thuật đánh dấu nước thời xưa. Đây là
kỹ thuật đánh dấu chìm một hình ảnh, một logo, hay một dữ liệu nào đó lên
trên giấy nhằm mục đích trang trí và phân biệt được xuất xứ của sản phẩm
giấy. Như vậy, thông tin cần giấu được gọi là thuỷ vân (Watermark).
Thuỷ vân có thể là một chuỗi các ký tự, hay một hình ảnh, logo nào đó.
Thuỷ vân mô tả thông tin có thể được dùng để chứng minh quyền sở hữu hoặc
chống xuyên tạc.
Có hai loại thuỷ vân, đó là : thuỷ vân bền vững và thuỷ dễ vỡ.
 Thuỷ vân bền vững (Robust watermark): là thuỷ vân tồn tại bền vững
cùng với dữ liệu, không dễ dàng bị phá huỷ trước những biến đổi, tấn công
lên dữ liệu. Các kỹ thuật này thường được dùng trong các ứng dụng bảo vệ
bản quyền, chứng minh quyền sở hữu.
 Thuỷ vân dễ vỡ (Fragile watermark): là thuỷ vân dễ bị biến đổi trước
những biến đổi hay tấn công lên dữ liệu. Các kỹ thuật này thường được
dùng trong các ứng dụng nhận thực thông tin, đảm bảo tính toàn vẹn dữ
liệu.

Các kỹ thuật thuỷ vân ngay từ khi mới ra đời đã nhận được sự quan tâm rất
lớn của các nhà khoa học. Các kỹ thuật thuỷ vân này đã được nghiên cứu và
áp dụng trong nhiều môi trường dữ liệu khác nhau như: dữ liệu đa phương
tiện (image, text, audio, video, . . .), hay các phẩm phần mềm, và gần đây là
những nghiên cứu trên môi trường cơ sở dữ liệu quan hệ. Trong các môi
trường dữ liệu đó thì dữ liệu đa phương tiện (đặc biệtt là image) được nghiên
cứu và áp dụng sớm nhất và là môi trường chiếm tỷ lệ chủ yếu. Tuy nhiên,
Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên




7

hiện nay người ta đang tập trung nghiên cứu các kỹ thuật thuỷ vân trên cơ sở
dữ liệu quan hệ bởi nhu cầu cấp thiết của người chủ cơ sở dữ liệu đó là muốn
bảo vệ chúng trước những tấn công bên ngoài, . . .
1.1.2 Thuỷ vân cơ sơ dữ liệu quan hệ là gì ?
Ngày nay, việc sử dụng các cơ sở dữ liệu trong các ứng dụng càng ngày
càng tăng lên đang tạo ra một nhu cầu tương tự đối với thủy vân cơ sở dữ liệu.
Internet hiện đang đưa đến một sức ép rất nặng nề cho những người bảo vệ dữ
liệu trong việc tạo ra các dịch vụ (thường được gọi là các dịch vụ web hoặc
các tiện ích điện tử) cho phép người sử dụng tìm kiếm và truy cập cơ sở dữ
liệu từ xa. Mặc dù xu hướng này là hữu ích cho người dùng cuối nhưng nó
cũng bộc lộ một mối nguy hiểm cho những nhà cung cấp dữ liệu trước những
kẻ trộm cắp dữ liệu. Do đó, những người cung cấp dữ liệu đòi hỏi phải có
công nghệ nhận dạng được những bản sao các cơ sở dữ liệu của họ bị đánh
cắp.
Cho dù có khá nhiều điều có thể học hỏi được từ các kết quả đã đạt
được về thủy vân dữ liệu đa phương tiện nhưng cho đến nay vẫn còn rất nhiều

thách thức kỹ thuật mới đối với lĩnh vực thủy vân các cơ sở dữ liệu quan hệ
bởi vì các dữ liệu quan hệ và các dữ liệu đa phương tiện khác nhau ở khá
nhiều khía cạnh quan trọng. Chẳng hạn như, các phần khác nhau của một đối
tượng đa phương tiện không thể cắt bỏ hoặc thay thế một cách tùy ý mà
không gây ra những thay đổi về cảm quan trong đối tượng. Ngược lại, việc
thêm, bớt và cập nhật các bộ của một bảng quan hệ lại là những phép toán
chuẩn trong cơ sở dữ liệu. Do những khác nhau này mà các kỹ thuật được
phát triển cho các dữ liệu đa phương tiện không thể được sử dụng trực tiếp để
thủy vân các quan hệ.

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên




data error !!! can't not
read....


data error !!! can't not
read....


data error !!! can't not
read....


data error !!! can't not
read....



data error !!! can't not
read....



data error !!! can't not
read....


data error !!! can't not
read....


data error !!! can't not
read....


data error !!! can't not
read....


data error !!! can't not
read....


data error !!! can't not
read....

data error !!! can't not

read....


data error !!! can't not
read....

data error !!! can't not
read....


data error !!! can't not
read....

data error !!! can't not
read....



×